機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘課程
?
目標(biāo)收益
課程中的理論和經(jīng)驗(yàn)來自于對初級數(shù)據(jù)挖掘工程經(jīng)常遇問題的歸納、分析與總結(jié),有針對性的給出解決方法,課程將重現(xiàn)這些問題的經(jīng)典案例,通過實(shí)例講解,并對應(yīng)到學(xué)員的實(shí)際工作問題,使學(xué)員能夠把傳授的經(jīng)驗(yàn)和自己的問題結(jié)合起來,有效的啟發(fā)思路、激發(fā)興趣、提供解決問題需要的新思路新方法。
學(xué)員的收獲總結(jié)起來有3點(diǎn):
1:了解實(shí)際的事例結(jié)合說基本算法的各種變體,開闊思路
2:將一次培訓(xùn)深化為深入了解一個(gè)細(xì)分領(lǐng)域的一個(gè)渠道,之后可以接收到培訓(xùn)內(nèi)容中知識點(diǎn)對應(yīng)的業(yè)界最新更新。
3:加入“數(shù)據(jù)挖掘”職業(yè)圈,學(xué)員可以有一個(gè)加入職業(yè)社交圈的機(jī)會,和業(yè)內(nèi)人士相互交流,相互切磋。
培訓(xùn)對象
1:有一定的程序和數(shù)學(xué)基礎(chǔ),希望對于數(shù)據(jù)挖掘有個(gè)知識體系的梳理,同時(shí)深入了解在實(shí)際生產(chǎn)過程中數(shù)據(jù)挖掘的各種算法的應(yīng)用的,希望從初級走向中級的,數(shù)據(jù)增值產(chǎn)業(yè)的從業(yè)者。尤其是想做數(shù)據(jù)挖掘但是效果不顯著,希望在公司內(nèi)部得到更多重視的團(tuán)隊(duì),派出兩三人參加這個(gè)課程,效果尤佳。
2:對于數(shù)據(jù)挖掘,商業(yè)智能感興趣,希望從事類似的工作,但是又感到所謂“大數(shù)據(jù)”知識體系繁雜,無論是廣度還是深度都很難開始的“迷?!比耸?。
學(xué)員基礎(chǔ)
學(xué)員學(xué)習(xí)本課程應(yīng)具備下列基礎(chǔ)知識:
1) 知道統(tǒng)計(jì)學(xué)的一些基本概念:平均分布,正態(tài)分布,方差,置信區(qū)間;?
2) 知道數(shù)據(jù)結(jié)構(gòu)的一些基本概念:時(shí)間,空間復(fù)雜度;
3) 知道計(jì)算機(jī)體系結(jié)構(gòu)的一些基本概念:GPU,芯片,寄存器,內(nèi)存尋址,總線傳輸,內(nèi)網(wǎng)通信
課程大綱
?
主題 內(nèi)容
廣義線性分類的原理和應(yīng)用
內(nèi)容:logistic Regression和計(jì)算廣告學(xué) n1.二分類問題的例子n2.邏輯回歸的數(shù)學(xué)原理n3.傳統(tǒng)廣告,計(jì)算廣告,廣告實(shí)時(shí)交易平臺n4.數(shù)據(jù)預(yù)處理和維度提取n5.LR在計(jì)算廣告中的應(yīng)用n6.LR的效果測評,模型調(diào)優(yōu)n7.LR模型中理論與工程的折中n8.LR和他的小伙伴們:廣義線性模型n9.新情況,基于移動端的廣告實(shí)時(shí)交易平臺,LR的各種變體
決策樹,聚類和異常點(diǎn)檢測
內(nèi)容:決策樹和異常點(diǎn)檢測n1.決策樹的原理n2.各種決策樹的生成算法n3.決策樹在異常點(diǎn)檢測中的應(yīng)用n4.決策樹的剪枝n5.其它異常點(diǎn)檢測的應(yīng)用小技巧n6.聚類算法的原理n7.聚類算法的常見問題:初始點(diǎn)選擇,n8.聚類算法和決策樹在異常點(diǎn)檢測中的應(yīng)用n9.結(jié)合計(jì)算廣告,談兩個(gè)異常點(diǎn)檢測小例子
巨型圖挖掘
1.復(fù)雜網(wǎng)絡(luò)介紹n2.當(dāng)前巨型圖應(yīng)用場景n3.隨機(jī)圖,自然圖,n4.常用的圖計(jì)算框架(google的bagel,graphlab的graphx)n5.巨型圖上的算法實(shí)現(xiàn)原理n6.常用的基于圖的算法實(shí)現(xiàn)n7.隨機(jī)游走,pageRank基于圖的實(shí)現(xiàn)n8.svd介紹以及svd在圖框架的實(shí)現(xiàn)n9.圖挖掘與推薦系統(tǒng)(qzone的廣告系統(tǒng)廣點(diǎn)通,twitter的內(nèi)容推薦)
?
?
?
?
?
?
?
?
?