国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

應(yīng)用機(jī)器學(xué)習(xí)模型的CT圖像自動(dòng)判讀技術(shù)研究

2020-12-14 04:03:48姜微
科技創(chuàng)新與應(yīng)用 2020年36期
關(guān)鍵詞:機(jī)器學(xué)習(xí)大數(shù)據(jù)人工智能

姜微

摘? 要:近年來(lái),應(yīng)用機(jī)器學(xué)習(xí)模型與技術(shù)的醫(yī)學(xué)影像分析方法開始得到應(yīng)用,其能夠用于輔助醫(yī)生決策或者解決臨床實(shí)踐中的棘手問(wèn)題,因而具有較大的研究與應(yīng)用價(jià)值。文章旨在研究如何針對(duì)醫(yī)學(xué)圖像中常見的CT圖像進(jìn)行智能的自動(dòng)判讀技術(shù),通過(guò)使用計(jì)算機(jī)技術(shù)提取出相關(guān)的特征,再依據(jù)提取的特征建立機(jī)器學(xué)習(xí)的模型進(jìn)行判斷,提高判斷精準(zhǔn)度,從而輔助醫(yī)生進(jìn)行更好的診斷。

關(guān)鍵詞:機(jī)器學(xué)習(xí);大數(shù)據(jù);CT圖像;輔助診斷;人工智能

中圖分類號(hào):TP391.41? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? ? ?文章編號(hào):2095-2945(2020)36-0015-02

Abstract: In recent years, machine learning models and technology has been applied in medical image analysis. It can be used to assist doctors in decision-making or solve difficult problems in clinical practice, so it has great research and application value. This paper aims to study how to carry out automatic intelligent interpretation technology for common CT images in medical images, extract relevant features by using computer technology, and then establish machine learning model for judgment according to the extracted features, so as to improve the accuracy of judgment, and assist doctors in better diagnosis.

Keywords: machine learning; big data; CT image; auxiliary diagnosis; artificial intelligence

醫(yī)學(xué)影像在醫(yī)學(xué)診斷中具有無(wú)可替代的重要作用,其包含了大量人眼無(wú)法識(shí)別的信息,對(duì)準(zhǔn)確識(shí)別相關(guān)疾病的具體情況,進(jìn)行準(zhǔn)確的醫(yī)學(xué)診斷乃至確定具體的醫(yī)療策略,都能夠提供比較客觀可信的依據(jù)。

近年來(lái),隨著圖像處理與人工智能技術(shù)的發(fā)展[1],應(yīng)用基于醫(yī)學(xué)影像大數(shù)據(jù)的分析方法來(lái)輔助醫(yī)生決策或者解決臨床實(shí)踐中的棘手問(wèn)題成為研究熱點(diǎn)[2]。傳統(tǒng)的CT影像判讀主要是依靠醫(yī)生的經(jīng)驗(yàn)判斷,不僅費(fèi)時(shí)且費(fèi)力。因此,研究一種智能分析識(shí)別CT圖像具體情況,并進(jìn)行智能分類判別的技術(shù)是十分必要的。

1 機(jī)器學(xué)習(xí)模型

機(jī)器學(xué)習(xí)(Machine Learning)[3]是計(jì)算機(jī)科學(xué)的一個(gè)重要分支,其總體目標(biāo)是,通過(guò)科學(xué)系統(tǒng)化的算法流程與模型,將目標(biāo)數(shù)據(jù)中的有用的特定模式發(fā)現(xiàn)出來(lái),并將之應(yīng)用于自動(dòng)化智能化的任務(wù)。具體來(lái)說(shuō),機(jī)器學(xué)習(xí)研究的主要內(nèi)容,是通過(guò)設(shè)計(jì)學(xué)習(xí)算法,以從數(shù)據(jù)中產(chǎn)生適用于解決具體任務(wù)的“模型”。以CT圖像判別為例,應(yīng)用機(jī)器學(xué)習(xí)的目的是用于對(duì)具體的圖像數(shù)據(jù)進(jìn)行智能的判斷,識(shí)別對(duì)應(yīng)的CT圖像是否存在異常,這個(gè)過(guò)程由最終的機(jī)器學(xué)習(xí)模型自動(dòng)確定。

在CT圖像數(shù)據(jù)的機(jī)器學(xué)習(xí)建模過(guò)程中,在對(duì)圖片特征提取后,本文可根據(jù)標(biāo)注樣本的類別,分類為陽(yáng)性和陰性,并采用多種分類方法進(jìn)行判別。具體的方法可運(yùn)用基于隨機(jī)森林(Random Forest)[4]的分類方法、基于樸素貝葉斯的分類方法等??墒紫炔捎秒S機(jī)森林算法對(duì)圖片的特征進(jìn)行訓(xùn)練,并使用不同的特征進(jìn)行多次訓(xùn)練,最后獲得多個(gè)相關(guān)性較強(qiáng)的特征,并使用10次交叉驗(yàn)證等方法來(lái)確定最終的模型?;跇闼刎惾~斯的分類過(guò)程也類似。

2 CT圖像分割

一般來(lái)說(shuō),應(yīng)用機(jī)器學(xué)習(xí)進(jìn)行CT圖像分割的方法,可以從目前比較成熟的方法中進(jìn)行借鑒。目前機(jī)器學(xué)習(xí)中的深度學(xué)習(xí)方法在分割中能夠達(dá)到較好的效果。本文選用基于全卷積神經(jīng)網(wǎng)絡(luò)(簡(jiǎn)稱FCN)框架的方法,特別地,可選擇具體的U-Net卷積神經(jīng)網(wǎng)絡(luò)方法進(jìn)行解決。

通常卷積神經(jīng)網(wǎng)絡(luò)(簡(jiǎn)稱CNN)在卷積層之后會(huì)連接若干個(gè)全連接層, 從而將卷積層產(chǎn)生的特征圖映射成固定長(zhǎng)度的特征向量,以便進(jìn)一步獲得分類結(jié)果。以AlexNet為代表的經(jīng)典CNN結(jié)構(gòu)適合于圖像級(jí)的分類和回歸任務(wù),因?yàn)樗鼈冏詈蠖计谕玫秸麄€(gè)輸入圖像的一個(gè)數(shù)值描述(概率)。

相比之下,全卷積神經(jīng)網(wǎng)絡(luò)對(duì)CT圖像進(jìn)行分類更有優(yōu)勢(shì),其能夠?qū)崿F(xiàn)比較自然的像素級(jí)的分類,由此實(shí)現(xiàn)圖像分割任務(wù)。與卷積神經(jīng)網(wǎng)絡(luò)不同,全卷積神經(jīng)網(wǎng)絡(luò)可接受任意尺寸的CT圖像作為輸入,并在最后一個(gè)卷積層采用反卷積層操作進(jìn)行上采樣, 對(duì)其圖像大小進(jìn)行恢復(fù),再在此基礎(chǔ)上對(duì)每個(gè)像素都進(jìn)行分類預(yù)測(cè), 也即實(shí)現(xiàn)逐像素的分類。

基于全卷積神經(jīng)網(wǎng)絡(luò)的算法較多,本文選擇U-Net方法。具體來(lái)說(shuō),U-Net共有23個(gè)卷積層,大致的模型結(jié)構(gòu)是,其包含多個(gè)2x2、3x3卷積層,多個(gè)max pooling層,同時(shí)包含擴(kuò)展路徑與收縮路徑,用于分別實(shí)現(xiàn)下采樣與上采樣,并通過(guò)剪裁等操作保持圖像邊緣。最后,模型包含一個(gè)1x1卷積層,從而用來(lái)將維度為64維的特征向量映射到某一個(gè)具體的類別判定標(biāo)簽。

3 分類判別方法

本文將選擇樸素貝葉斯算法與隨機(jī)森林算法,對(duì)提取了CT圖像特征的數(shù)據(jù)進(jìn)行分類模型的構(gòu)建。

樸素貝葉斯分類算法是一類具有廣泛應(yīng)用的成熟算法[5],其具體算法過(guò)程如下:

(1) 給定CT圖像數(shù)據(jù)集作為訓(xùn)練集,設(shè)其屬性有n個(gè)(記為B1,B2,…,Bn)。將每一個(gè)提取特征后的CT圖像數(shù)據(jù)樣本,表示為n維的向量,并將之記為Y=(y1,y2,…,yn)。在上式中,y1,y2,…,yn分別對(duì)應(yīng)為這n個(gè)屬性的具體取值。

(2)假定目標(biāo)的判別類別有m類,將其記為C1,C2,…,Cm,模型的目標(biāo)即為確定每個(gè)數(shù)據(jù)樣本所歸屬的類別(CT圖像對(duì)應(yīng)的診斷結(jié)果)。對(duì)于每個(gè)具體樣本Y來(lái)說(shuō),根據(jù)貝葉斯理論,可以通過(guò)條件概率與后驗(yàn)概率的轉(zhuǎn)換計(jì)算,求解得出在給定樣本Y情況下,其屬于某一個(gè)診斷類別Ck(1≤k≤m)的后驗(yàn)概率P(Ck|Y)。

(3) 在計(jì)算得出所有診斷類別的后驗(yàn)概率之后,貝葉斯分類法求出這些概率值的最大值所對(duì)應(yīng)的診斷類別Ci,并將之指定為樣本Y的預(yù)測(cè)類別,也即有下式成立:

隨機(jī)森林是一種組合分類器算法。利用Bootstarp算法初始化不同的CT圖像數(shù)據(jù)訓(xùn)練集,然后訓(xùn)練得到相應(yīng)的模型,將其組合在一起,最后得到隨機(jī)森林模型,通過(guò)投票等方法來(lái)進(jìn)行預(yù)測(cè)分類。

隨機(jī)森林是由決策樹集成,必須考慮決策樹的特點(diǎn),即準(zhǔn)確性,多樣性和決策樹的數(shù)量。主要參數(shù)包括森林樹木的數(shù)量即決策樹的數(shù)量,尋找最佳分割時(shí)需考慮特征數(shù)量和葉節(jié)點(diǎn)上的最小樣本數(shù)量等。

隨機(jī)森林訓(xùn)練生成多顆“隨機(jī)”的決策樹,本文在建模過(guò)程中,確定樹木數(shù)量的范圍為[100,500],通過(guò)使用包外樣本來(lái)估計(jì)泛化精度,研究不同樹木數(shù)量對(duì)隨機(jī)森林模型的影響。

在具體實(shí)現(xiàn)方面,可利用 Python 語(yǔ)言進(jìn)行開發(fā),結(jié)合開源的機(jī)器學(xué)習(xí)程序庫(kù) scikit-learn來(lái)構(gòu)建實(shí)現(xiàn)過(guò)程,對(duì)隨機(jī)森林模型中的決策樹個(gè)數(shù)、隨機(jī)特征個(gè)數(shù)、葉節(jié)點(diǎn)最小樣本數(shù)等進(jìn)行詳細(xì)的調(diào)試與設(shè)定。首先,針對(duì)隨機(jī)特征的個(gè)數(shù)確定問(wèn)題,可將隨機(jī)數(shù)據(jù)特征數(shù)目設(shè)置為n,嘗試多個(gè)n值,構(gòu)建多個(gè)備選模型,并比較其優(yōu)缺特性,選定符合要求的n值作為最終的設(shè)置值。進(jìn)一步地,通過(guò)固定模型中的其他參數(shù),以準(zhǔn)確率作為評(píng)判標(biāo)準(zhǔn)指標(biāo),對(duì)隨機(jī)特征的個(gè)數(shù)進(jìn)行交叉驗(yàn)證(本文選用10折交叉法),最后,對(duì)多個(gè)模型進(jìn)行初步評(píng)估,并逐步確定模型的各個(gè)參數(shù)。

4 算法流程

針對(duì)收集到的CT圖像數(shù)據(jù),根據(jù)其標(biāo)定的診斷類別結(jié)果,應(yīng)用機(jī)器學(xué)習(xí)模型與算法,進(jìn)行詳細(xì)研究,利用機(jī)器學(xué)習(xí)方法來(lái)構(gòu)建的面向CT圖像的智能診斷模型。

(1)利用統(tǒng)計(jì)分析對(duì)CT圖像數(shù)據(jù)進(jìn)行探索,發(fā)現(xiàn)樣本數(shù)據(jù)和圖像特征存在一定的相關(guān)性,同時(shí)研究圖像數(shù)據(jù)相對(duì)于診斷類別是否存在類別不平衡的問(wèn)題。

(2)基于end-to-end全卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)的U-Net算法模型實(shí)現(xiàn)像素級(jí)別的判別比較模型,并在此基礎(chǔ)上為特征提取做好準(zhǔn)備。

(3)在(2)所得結(jié)果的基礎(chǔ)上,進(jìn)行多角度的圖像特征提取,取得相關(guān)性較強(qiáng)的圖像特征作為新構(gòu)建的數(shù)據(jù)集的特征集。也即,通過(guò)以上大數(shù)據(jù)與人工智能的手段,通過(guò)自動(dòng)的方式,從CT圖像中提取具有較強(qiáng)語(yǔ)義的特征信息,無(wú)疑將會(huì)有助于臨床的專業(yè)醫(yī)生進(jìn)行更好的判斷,也有利于下一步的分類判別模型構(gòu)建。

(4)在經(jīng)過(guò)以上特征提取工作,以及其他的數(shù)據(jù)預(yù)處理之后,利用以上特征向量構(gòu)成的數(shù)據(jù)集,設(shè)計(jì)樸素貝葉斯、隨機(jī)森林模型,對(duì)數(shù)據(jù)進(jìn)行自動(dòng)的診斷分類預(yù)測(cè)。

(5)通過(guò)具體的訓(xùn)練實(shí)驗(yàn)進(jìn)行模型對(duì)比,并選取精確率、召回率和F1等多項(xiàng)評(píng)價(jià)指標(biāo),對(duì)所得結(jié)果模型的各方面性能進(jìn)行全面評(píng)估,用實(shí)際的CT圖像數(shù)據(jù)來(lái)驗(yàn)證其有效性,從而在一定程度上為自動(dòng)化、智能化的輔助臨床決策提供支持。

5 結(jié)束語(yǔ)

在本文中,我們針對(duì)醫(yī)療診斷實(shí)踐中常見的CT圖像判讀診斷問(wèn)題,對(duì)如何利用機(jī)器學(xué)習(xí)方法,對(duì)其實(shí)現(xiàn)自動(dòng)化、智能化診斷的具體技術(shù)路徑進(jìn)行了研究與探討。如果基于機(jī)器學(xué)習(xí)模型與技術(shù)的醫(yī)學(xué)影像分析方法能夠得到廣泛而有效的應(yīng)用,必將能夠有助于為醫(yī)生決策或者解決臨床實(shí)踐中的棘手問(wèn)題提供更多的實(shí)現(xiàn)路徑,因而具有較大的研究與應(yīng)用價(jià)值。

參考文獻(xiàn):

[1]Krizhevsky A, Sutskever I, Hinton G E. ImageNet Classification with Deep Convolutional Neural Networks[G]//Pereira F, Burges C J C, Bottou L, et al. Advances in Neural Information Processing Systems 25. Curran Associates, Inc., 2012: 1097-1105.

[2]張良均,王路,譚立云,等. Python 數(shù)據(jù)分析與挖掘?qū)崙?zhàn)[M].北京:機(jī)器工業(yè)出版社,2015:66.

[3]Goodfellow I, Bengio Y, Courville A, et al. Deep learning[M]. MIT press Cambridge, 2016,1.

[4]Cernadas E, Amorim D. Do we need hundreds of classifiers to solve real world classification problems?[J]. Journal of Machine Learning Research, 2014,15(1):3133-3181.

[5]郁磊.MATLAB智能算法30個(gè)案例分析(第2版)[M].北京:航空航天大學(xué)出版社, 2015.

猜你喜歡
機(jī)器學(xué)習(xí)大數(shù)據(jù)人工智能
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
人工智能與就業(yè)
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
前綴字母為特征在維吾爾語(yǔ)文本情感分類中的研究
基于支持向量機(jī)的金融數(shù)據(jù)分析研究
基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
科技視界(2016年20期)2016-09-29 10:53:22
下一幕,人工智能!
察哈| 新蔡县| 丰台区| 阜城县| 札达县| 德安县| 阳原县| 南陵县| 竹溪县| 瓦房店市| 湛江市| 景谷| 宜兰县| 五原县| 新巴尔虎左旗| 资阳市| 河池市| 江津市| 松滋市| 繁昌县| 宝山区| 淮滨县| 孟津县| 卓资县| 宣威市| 嵊泗县| 体育| 新干县| 乐亭县| 娄底市| 高碑店市| 阳东县| 五原县| 施秉县| 晋中市| 新郑市| 贵州省| 曲水县| 青神县| 南丹县| 乐业县|