董西成培訓(xùn)公開課:Hadoop與Spark大數(shù)據(jù)架構(gòu)專題(2017年4月 北京站)
時間:2017-04-22 08:00 至 2017-04-23 18:00
地點(diǎn):北京

- 參會報名
- 課程介紹
- 課程大綱
- 講師介紹
- 課程費(fèi)用
-
手機(jī)下單
首頁 > 商務(wù)會議 > IT互聯(lián)網(wǎng)會議 > 董西成培訓(xùn)公開課:Hadoop與Spark大數(shù)據(jù)架構(gòu)專題(2017年4月 北京站) 更新時間:2017-06-24T16:52:20
![]() |
![]() 董西成培訓(xùn)公開課:Hadoop與Spark大數(shù)據(jù)架構(gòu)專題(2017年4月 北京站) 已截止報名會議時間: 2017-04-22 08:00至 2017-04-23 18:00結(jié)束 會議地點(diǎn): 北京 詳細(xì)地址會前通知 周邊酒店預(yù)訂 主辦單位: 麥思博軟件技術(shù)有限公司
|
課程介紹
課程內(nèi)容 主辦方介紹

董西成培訓(xùn)公開課:Hadoop與Spark大數(shù)據(jù)架構(gòu)專題(2017年4月 北京站)宣傳圖
培訓(xùn)特色
當(dāng)下是大數(shù)據(jù)時代,為構(gòu)建大數(shù)據(jù)平臺,需要對分布式數(shù)據(jù)收集,大數(shù)據(jù)存儲,分布式計算,資源管理等系統(tǒng)有全面而又深入的理解。眾所周知,大數(shù)據(jù)源自于互聯(lián)網(wǎng)行業(yè),目前互聯(lián)網(wǎng)公司已有一套完善的大數(shù)據(jù)平臺建設(shè)方案,大部分選用開源的Hadoop和Spark兩大生態(tài)系統(tǒng),本課程正是以這兩套系統(tǒng)為主介紹大數(shù)據(jù)平臺及架構(gòu)的構(gòu)建策略及經(jīng)驗。
目標(biāo)收益
本課程將為大家全面而又深入的介紹大數(shù)據(jù)平臺的構(gòu)建流程,涉及分布式數(shù)據(jù)收集,大數(shù)據(jù)存儲,資源管理及分布式計算框架等。本課程重點(diǎn)以Hadoop和Spark兩大生態(tài)系統(tǒng)作為基準(zhǔn)進(jìn)行介紹,涉及Flume, HDFS, Hbase,YARN,MapReduce,Hive, Zookeeper, Spark,Storm,Spark Streaming等主流的大數(shù)據(jù)開源系統(tǒng)架構(gòu)及應(yīng)用經(jīng)驗。
?
培訓(xùn)對象:各類 IT/軟件企業(yè)和研發(fā)機(jī)構(gòu)的軟件架構(gòu)師、軟件設(shè)計師、程序員。對于懷有設(shè)計疑問和問題,需要梳理解答的團(tuán)隊和個人,效果最佳。
學(xué)員基礎(chǔ):了解Java語言、Linux系統(tǒng);
課程時長:2天
查看更多

麥思博(msup)有限公司發(fā)源美國西雅圖,2007年創(chuàng)辦,是一家面向技術(shù)型組織的培訓(xùn)咨詢機(jī)構(gòu),服務(wù)于技術(shù)團(tuán)隊的技能提升、軟件工程的實際應(yīng)用和產(chǎn)品品質(zhì)的創(chuàng)新與超越。強(qiáng)調(diào)人員、技術(shù)、流程和管理的有機(jī)結(jié)合,注重角色崗位的技能提升與職業(yè)發(fā)展,以及技術(shù)團(tuán)隊復(fù)合管理與協(xié)作。每年超過1000家企業(yè)續(xù)單參與msup旗下公開課、工作坊、案例研究、國際游學(xué)等培訓(xùn)項目。
課程大綱
主題 |
內(nèi)容 |
大數(shù)據(jù)架構(gòu)概述 |
1.1 大數(shù)據(jù)層級架構(gòu)及各層軟件設(shè)計要求,包括數(shù)據(jù)收集、存儲、計算框、應(yīng)用 |
數(shù)據(jù)收集系統(tǒng)Flume與Sqoop |
2. 使用flume和sqoop兩個系統(tǒng)將外部流式數(shù)據(jù)(比如網(wǎng)站日志,用戶行為數(shù)據(jù)等)、關(guān)系型數(shù)據(jù)庫(比如MySQL、Oracle等)中的數(shù)據(jù)導(dǎo)入Hadoop中進(jìn)行分析和挖掘 |
大數(shù)據(jù)存儲系統(tǒng)HDFS與HBase |
3.1與HDFS 1.0進(jìn)行對比介紹2.0原理、特性與基本架構(gòu)(快照、緩存、異構(gòu)存儲)。 |
集群資源管理與調(diào)度系統(tǒng) |
4. 介紹 YARN應(yīng)用場景、基本架構(gòu)與資源調(diào)度 |
Zookeeper部署及典型應(yīng)用 |
5. 介紹Zookeeper是什么,基本原理及在應(yīng)用 |
大數(shù)據(jù)計算平臺 |
介紹主流的三大類大數(shù)據(jù)計算框架,分別是批處理、交互式計算和流式計算框架,并選取當(dāng)下主流的開源實現(xiàn)進(jìn)行介紹。 |
數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)庫 |
7. Mahout與MLlib兩個主流的分布式數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)庫的實現(xiàn)以及應(yīng)用案例。 |
查看更多
講師介紹
課程費(fèi)用
課程費(fèi)用
課程費(fèi)用:5800元/人
查看更多
溫馨提示
酒店與住宿:
為防止極端情況下活動延期或取消,建議“異地客戶”與活動家客服確認(rèn)參會信息后,再安排出行與住宿。
退款規(guī)則:
活動各項資源需提前采購,購票后不支持退款,可以換人參加。
您可能還會關(guān)注
-
DAMS2025中國數(shù)據(jù)智能管理峰會(上海)
2025-09-12 上海
-
QCon上海2025|全球軟件開發(fā)大會
2025-10-23 上海
-
2025 全球機(jī)器學(xué)習(xí)技術(shù)大會(ML-Summit)·北京
2025-10-16 北京
-
2025中國互聯(lián)網(wǎng)大會
2025-07-23 北京