班級(jí)規(guī)模及環(huán)境--熱線:4008699035 手機(jī):15921673576( 微信同號(hào)) |
每期人數(shù)限3到5人。 |
上課時(shí)間和地點(diǎn) |
開課地址:【上海】同濟(jì)大學(xué)(滬西)/新城金郡商務(wù)樓(11號(hào)線白銀路站)【深圳分部】:電影大廈(地鐵一號(hào)線大劇院站) 【武漢分部】:佳源大廈【成都分部】:領(lǐng)館區(qū)1號(hào)【沈陽分部】:沈陽理工大學(xué)【鄭州分部】:錦華大廈【石家莊分部】:瑞景大廈【北京分部】:北京中山學(xué)院 【南京分部】:金港大廈
最新開班 (連續(xù)班 、周末班、晚班):2020年3月16日 |
實(shí)驗(yàn)設(shè)備 |
☆資深工程師授課
☆注重質(zhì)量
☆邊講邊練
☆合格學(xué)員免費(fèi)推薦工作
★實(shí)驗(yàn)設(shè)備請(qǐng)點(diǎn)擊這兒查看★ |
質(zhì)量保障 |
1、培訓(xùn)過程中,如有部分內(nèi)容理解不透或消化不好,可免費(fèi)在以后培訓(xùn)班中重聽;
2、培訓(xùn)結(jié)束后,授課老師留給學(xué)員聯(lián)系方式,保障培訓(xùn)效果,免費(fèi)提供課后技術(shù)支持。
3、培訓(xùn)合格學(xué)員可享受免費(fèi)推薦就業(yè)機(jī)會(huì)。 |
課程大綱 |
|
1什么是文本挖掘
2文本挖掘的基本流程和任務(wù)
3文本挖掘的基本思路
4語料數(shù)據(jù)化時(shí)需要考慮的工作
5Python常用IDE簡介
6Anaconda的安裝與配置
7Jupyter Notebook的基本操作
8NLTK的安裝與配置
9什么是語料庫
10準(zhǔn)備《射雕》語料庫
11分詞原理簡介
12結(jié)巴分詞的基本用法
13使用自定義詞典和搜狗細(xì)胞詞庫
14去除停用詞
15詞性標(biāo)注及其他
16詞頻統(tǒng)計(jì)
17詞云概述
18wordcloud包的安裝
19繪制詞云
20設(shè)置詞云背景模板
21修改詞云顏色
22詞袋模型
23詞袋模型的gensim實(shí)現(xiàn)
24用Pandas生成文檔詞條矩陣
25用sklearns生成文檔-詞條矩陣
26從詞袋模型到N-gram模型
27文本信息的分布式表示
28共現(xiàn)矩陣
29NNLM模型的突破
30word2vec一出,滿座皆驚
31關(guān)鍵詞提取的基本思路
32TF-IDF 算法
33TF-IDF算法的jieba實(shí)現(xiàn)
34TF-IDF算法的sklearn實(shí)現(xiàn)
35TF-IDF算法的gensim實(shí)現(xiàn)
36TextRank算法
37主題模型概述
38主題模型的sklearn實(shí)現(xiàn)
39主題模型的gensim實(shí)現(xiàn)
40基本概念
41詞條相似度:word2vec訓(xùn)練
42詞條相似度:word2vec應(yīng)用
43文檔相似度的詞袋模型實(shí)現(xiàn)
44doc2vec
45文檔聚類
46文本分類概述
47樸素貝葉斯算法
48算法的sklearn實(shí)現(xiàn)
49算法的NLTK實(shí)現(xiàn)
50情感分析概述
51情感分析的詞袋模型實(shí)現(xiàn)
52情感分析的分布式表達(dá)實(shí)現(xiàn)
53自動(dòng)摘要的基本原理
54自動(dòng)摘要的效果評(píng)價(jià)
55自動(dòng)摘要的python實(shí)現(xiàn)
56RNN的基本原理
57LSTM的基本原理
58Keras+TensorFlow組合的優(yōu)勢(shì)
59Keras+TensorFlow組合的安裝
60案例1:數(shù)據(jù)準(zhǔn)備
61案例1:模型擬合
62案例2:數(shù)據(jù)準(zhǔn)備
63案例2:模型擬合
|