醫(yī)療大數(shù)據(jù)智能分析云平臺培訓
課程介紹:
???
本課程將使用影像數(shù)據(jù)、臨床數(shù)據(jù)、檢測報告、數(shù)據(jù)集成層、云端服務器、應用層等數(shù)據(jù),詳細介紹使用特征值類型及特征值類型結(jié)合進行:一階統(tǒng)計量、形狀特征量、紋理特征量、高斯-拉普拉斯算子特征量、小波變換特征量、平方根濾波特征量、對數(shù)濾波特征量,重測信度分析、主成分分析、相關(guān)性分析、聚類分析等分析方法,進行全方面系統(tǒng)化講解;機器學習模型主要講解SVM Logistic regression? kNN Decision Tree? Random Forest? XGBoost 。
課程大綱
一、課程內(nèi)容:
大數(shù)據(jù)平臺整體框架
1、數(shù)據(jù)來源
影像數(shù)據(jù):包括DR、CT、MR、PET等;一 般為DICOM標準格式;結(jié)構(gòu)圖像和功能圖像;
臨床數(shù)據(jù):包括電子病例、體檢報告、隨訪 報告等;一般為非結(jié)構(gòu)化數(shù)據(jù);種類繁多,數(shù)據(jù)量大;?
檢測報告,包括病理檢測、分子檢測和遺傳 檢測;結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù);圖片和文字 報告;快速發(fā)展中?
2、數(shù)據(jù)集成層
根據(jù)客戶需求,實現(xiàn)對不同廠商的PACS/HIS/LIS/RIS/EMR的對接,或者使用Uploader上傳無接口數(shù)據(jù);實現(xiàn)高速、無損、安全、低費傳輸?
3、云端服務器
計算服務器,使用Docker/GPU等最新的大數(shù)據(jù)處理服務器;實現(xiàn)數(shù) 據(jù)檢索、分析和統(tǒng)計;使用云計算、機器學習、自然語義分析等大數(shù)據(jù)處理技術(shù)?
存儲服務器,根據(jù)客戶需求,定制公有云/私有云/混合云;結(jié)構(gòu)化數(shù)據(jù)使用MySQL,非結(jié)構(gòu) 話數(shù)據(jù)使用Hadoop/MongoDB;實現(xiàn)分布式存儲,彈性分配存儲空間?
4、應用層?
日報/月報/年報? 院內(nèi)醫(yī)療信息云檢索? 課題管理云平臺? 腦功能分析云平臺??
影像組學云平臺 腦梗/腦腫瘤智能分割? 胸片智能診斷
特征值類型
1、一階統(tǒng)計量?
? First Order Statistics,共19個,描述感興趣區(qū)內(nèi)的強度信息?
? 包括mean, standard deviation, variance, maximum, median, range, kurtosis 等?
2、形狀特征量
? Shape, 共13個,描述感興趣區(qū)的形狀和大小特征?
? 包括volume, surface area, compactness, 2D/3D maximum diameter, flatness等??
3、紋理特征量
? Texture, 共60個,描述感興趣區(qū)內(nèi)像素間關(guān)系,即圖像的紋理信息
? 包括28個Gray Level Co-occurrence Matrix (GLCM),16個Gray Level Size Zone Matrix (GLSZM),16個Gray Level Run Length Matrix (GLRLM)??
4、高斯-拉普拉斯算子特征量?
? Laplacian of Gaussian (LoG),共158個?
? 先用高斯函數(shù)對圖像進行平滑降噪,然后用拉普拉斯算子進行梯度運算,提取變換 后的圖像特征值
5、小波變換特征量
? Wavelet Transform, 共632個?
? 將圖像信號分解成一系列小波函數(shù)的疊加,主要用于圖像不同頻域信息的特征提取
6、平方根濾波特征量
? Square root filter, 共79個?
? 將圖像進行平方根濾波后計算其一階統(tǒng)計量和紋理特征量?
7、對數(shù)濾波特征量
? Logarithm filter, 共79個?
? 將圖像進行對數(shù)濾波后計算其一階統(tǒng)計量和紋理特征量
特征值分析:降低數(shù)據(jù)維度的方法
1、重測信度分析
? test-retest reliability?
? 用來測試特征值的穩(wěn)定性和一致性?
? 對同一組被試進行兩次測量,然后得到結(jié)果的相關(guān)系數(shù),相關(guān)程度高,
?
表示前后測量一致性高,穩(wěn)定性好?
2、主成分分析
? Principal Component Analysis (PCA) analysis?
? 通過正交變換,將可能存在的相關(guān)性變量轉(zhuǎn)換為線性不相關(guān)變量,
?
轉(zhuǎn)換后的這 組變量叫做主成分?
? 根據(jù)累計貢獻率的大小提取前幾個最大的主成分,既保留了原始的大部分信息,
?
又達到降維的目的?
3、相關(guān)性分析
? Correlation analysis?
? 對變量的相關(guān)性進行分析,從而衡量變量之間的相關(guān)程度
? 保留相關(guān)性較弱的變量?
4、聚類分析
? Clustering analysis?
? 將變量按照相似程度劃分類型,使得同類變量之間的相似性比其他的更強