班級規(guī)模及環(huán)境--熱線:4008699035 手機:15921673576( 微信同號) |
每個班級的人數(shù)限3到5人,互動授課, 保障效果,小班授課。 |
上間和地點 |
上部份地點:【上海】同濟大學(滬西)/新城金郡商務樓(11號線白銀路站)【深圳分部】:電影大廈(地鐵一號線大劇院站)/深圳大學成教院【北京分部】:北京中山學院/福鑫大樓【南京分部】:金港大廈(和燕路)【武漢分部】:佳源大廈(高新二路)【成都分部】:領館區(qū)1號(中和大道)【沈陽分部】:沈陽理工大學/六宅臻品【鄭州分部】:鄭州大學/錦華大廈【石家莊分部】:河北科技大學/瑞景大廈 最近開間(周末班/連續(xù)班/晚班):2019年1月26日 |
實驗設備 |
◆小班教學,教學效果好 ☆注重質量☆邊講邊練 ☆合格學員免費推薦工作 ★實驗設備請點擊這兒查看★ |
質量保障 |
1、培訓過程中,如有部分內(nèi)容理解不透或消化不好,可免費在以后培訓班中重聽; 2、培訓結束后,授課老師留給學員聯(lián)系方式,保障培訓效果,免費提供課后技術支持。 3、培訓合格學員可享受免費推薦就業(yè)機會。☆合格學員免費頒發(fā)相關工程師等資格證書,提升職業(yè)資質。專注高端技術培訓15年,端海學員的能力得到大家的認同,受到用人單位的廣泛贊譽,端海的證書受到廣泛認可。 |
部份程大綱 |
|
- 目標收益
本課程將為大家全面而又深入的介紹Spark、Hadoop平臺的構建流程,涉及Spark、Hadoo系統(tǒng)基礎知識,概念及架構, Spark、Hadoo實戰(zhàn)技巧,Spark、Hadoo經(jīng)典案例等。
通過本課程實踐,幫助學員對Spark、Hadoo生態(tài)系統(tǒng)有一個清晰明了的認識;理解Spark、Hadoo系統(tǒng)適用的場景;掌握Spark、Hadoo等初中級應用開發(fā)技能;搭建穩(wěn)定可靠的Spar、Hadoo k集群,滿足生產(chǎn)環(huán)境的標準;了解和清楚大數(shù)據(jù)應用的幾個行業(yè)中的經(jīng)典案例,包括阿里巴巴,華為等。
- 培訓對象
- 各類 IT/軟件企業(yè)和研發(fā)機構的軟件架構師、軟件設計師、程序員。對于懷有設計疑問和問題,需要梳理解答的團隊和個人,效果最佳。
- 學員基礎
- 了解Linux系統(tǒng)及相關語言環(huán)境
- 課程大綱
- 主題 內(nèi)容
- ?
- Spark
生態(tài)介紹
- ? Mapreduce、storm和spark模型的比較和使用場景介紹
? Spark產(chǎn)生背景
? Spark(內(nèi)存計算框架)
? SparkSteaming(流式計算框架)
? Spark SQL(ad-hoc)
? Mllib(MachineLearning)
? GraphX(bagel將被代)
? DlinkDB介紹
? SparkR介紹
- Spark
安裝部署
- ? Spark安裝簡介
? Spark的源碼編譯
? Spark Standalone安裝
? Spark Standalone HA安裝
? Spark應用程序部署工具spark-submit
? Spark的高可用性部署
- ?
- Spark
運行架構和解析
- ? Spark的運行架構
? 基本術語
? 運行架構
? Spark on Standalone運行過程
? Spark on YARN 運行過程
? Spark運行實例解析
? Spark on Standalone實例解析
? Spark on YARN實例解析
- Spark
scala編程
- ? Scala基本語法
? Scala開發(fā)環(huán)境搭建
? Scala開發(fā)Spark應用程序
? 使用java編程
? 使用scala編程
? 使用python編程
- Spark
編程模型和解析
- ? Spark的編程模型
? Spark編程模型解析
? RDD的特點、操作、依賴關系
? Spark應用程序的配置
- ?
- Spark Streaming原理和實踐
- ? Spark Streaming與Strom的區(qū)別
? Kafka的部署
? Kafka與Spark Streaming的整合
? Spark Streaming原理
? Spark流式處理架構
? DStream的特點
? Dstream的操作和RDD的區(qū)別
? Spark Streaming的優(yōu)化
? Spark Streaming實例
? 文本實例
? 網(wǎng)絡數(shù)據(jù)處理
? Kafka+Spark Streaming實現(xiàn)日志的實時分析案例
- ?
- Spark
SQL原理和實踐
- ? Spark SQL原理
? Spark SQL的Catalyst優(yōu)化器
? Spark SQL內(nèi)核
? Spark SQL和Hive
? Spark SQL的實例和編程
? Spark SQL的實例操作demo
? Spark SQL的編程
? DataFrame架構和原理
? DataFrame支持的統(tǒng)計和數(shù)學函數(shù)介紹
? 從RDD創(chuàng)建DataFrame
? 從Hive表創(chuàng)建DataFrame
? 從數(shù)據(jù)源創(chuàng)建DataFrame
- ?
- Spark的數(shù)據(jù)源
- ? Spark與HDFS的整合
? HDFS RDD原理和實現(xiàn)
? Spark與Hbase的整合
? Spark與Cassendera整合
? Hbase RDD的分區(qū)讀取
? Hbase RDD的原理和實現(xiàn)
? Spark parallelism RDD的工作機制
- ?
- Spark 數(shù)據(jù)挖掘
- ? Mllib的介紹
? graphX核心原理
? table operator和graph operator區(qū)別
? vertices、edges和triplets介紹
? 構建一個graph
? SparkR原理
? SparkR實戰(zhàn)
- ?
- 典型項目
案例實戰(zhàn)
- ? 基于spark日志分析
? 個性化推薦系統(tǒng):帶你揭開其神秘面紗
? 在線投放引擎
? 揭開淘寶點擊推薦系統(tǒng)的神秘面紗
? 淘寶數(shù)據(jù)服務架構—實時計算平臺
- ?
- Spark的優(yōu)化
- ? 序列化優(yōu)化——Kryo
? Spark參數(shù)優(yōu)化實戰(zhàn)
? Spark 任務的均勻分布策略
? Partition key傾斜的解決方案
? Spark任務的監(jiān)控
? GC的優(yōu)化
? Spark Streaming吞吐量優(yōu)化
? Spark RDD使用內(nèi)存的優(yōu)化策略
? Spark在使用中的感想分享
|