
Python mrjob 操作 Hadoop培訓
Python是做數(shù)據(jù)分析好的語言。
大數(shù)據(jù)當然也離不開Hadoop,
Hadoop由JAVA寫成,
但Python也可以很好地操控它。
本課程介紹了Python中MRjob模塊,
通過該模塊,
可以讓開發(fā)者非常簡單的通過Python來使用Hadoop進行數(shù)據(jù)分析。
1 Python MRJob模塊的安裝
2 使用MRJob實現(xiàn)文本統(tǒng)計
3 重寫MRJob函數(shù)實現(xiàn)復雜數(shù)據(jù)處理
4 Hadoop——Python各模塊介紹
5 Python MRJob的運行方式
1
Python玩轉Hadoop之MRjob入門
1.PythonMRJob模塊的安裝
2.HadoopPython各模塊介紹
3.使用MRJob實現(xiàn)文本統(tǒng)計
4.PythonMRJob的運行方式
5.重寫MRJob函數(shù)實現(xiàn)復雜數(shù)據(jù)處理
1 使用 mrjob 實現(xiàn)詞組統(tǒng)計
2 實戰(zhàn)模擬 - 統(tǒng)計每部電影的熱度
3 實戰(zhàn)模擬 - 統(tǒng)計每部電影的觀看用戶列表
4 實戰(zhàn)模擬 - 統(tǒng)計每個用戶的觀影列表

請
登錄
后發(fā)表評論
新評論
全部
第1節(jié)
第2節(jié)
第3節(jié)
第4節(jié)
第5節(jié)
第6節(jié)
第7節(jié)
第8節(jié)
第9節(jié)
第10節(jié)
第11節(jié)
第12節(jié)
第13節(jié)
第14節(jié)
第15節(jié)
第16節(jié)
第17節(jié)
我的報告 / 所有報告