国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

3D-CNN 在肺癌圖像識(shí)別中的應(yīng)用研究

2022-07-29 06:54李雅迪韓佳芳馬琳琳
關(guān)鍵詞:卷積預(yù)處理圖譜

李雅迪,韓佳芳,馬琳琳

(鄭州財(cái)稅金融職業(yè)學(xué)院 信息技術(shù)系,鄭州 450048)

0 引言

肺癌是目前嚴(yán)重危害人類(lèi)健康的惡性疾病之一,在全世界范圍內(nèi)肺癌的發(fā)病率和死亡率都在上升。雖然現(xiàn)有各種靶向治療方案,但晚期肺癌的預(yù)后很差,一旦確診,絕大多數(shù)的患者會(huì)在五年內(nèi)死亡,因此肺癌的早發(fā)現(xiàn)、早診斷、早治療在一定程度上能夠提高存活率?,F(xiàn)有的肺癌診斷主要是基于肺部計(jì)算機(jī)斷層掃描(Computed Tomography,CT)圖像的初期篩查,現(xiàn)有的計(jì)算機(jī)輔助診斷(Computer Aided Diagnosis,CAD)方法就是對(duì)肺部CT 圖像進(jìn)行預(yù)處理、分割、特征提取等過(guò)程。其中,預(yù)處理過(guò)程是將肺部可疑組織從復(fù)雜的解剖圖像中剝離出來(lái),該步驟操作復(fù)雜、工作量巨大。

隨著人工智能的快速發(fā)展,基于深度學(xué)習(xí)技術(shù)的卷積神經(jīng)網(wǎng)絡(luò)模型在圖像分類(lèi)領(lǐng)域取得了很大的進(jìn)展。將該技術(shù)應(yīng)用到醫(yī)療圖像的分類(lèi)識(shí)別中,可以簡(jiǎn)化圖像的預(yù)處理過(guò)程,提取到更豐富的特征信息,而且豐富的數(shù)據(jù)集和高性能的計(jì)算機(jī)軟硬件也使得深度學(xué)習(xí)的訓(xùn)練過(guò)程更加簡(jiǎn)便、高效。例如,Google 公司研發(fā)的乳腺癌智能檢測(cè)系統(tǒng),檢出率高達(dá)92%;Korbar 在2017 年設(shè)計(jì)了精確度高達(dá)93%的卷積神經(jīng)網(wǎng)絡(luò)系統(tǒng),通過(guò)對(duì)腸道染色體來(lái)識(shí)別帶有致癌隱患的腸道息肉等。由于本文采用的數(shù)據(jù)集是三維立體的肺部CT 掃描圖像,而目前的卷積神經(jīng)網(wǎng)絡(luò)模型多用于處理二維平面圖像,因此在對(duì)肺部CT 圖像分類(lèi)識(shí)別時(shí),需要將其切割成二維平面圖像,但在提取圖像特征信息時(shí)會(huì)丟失CT圖像切片之間的特征信息,對(duì)圖像的分類(lèi)識(shí)別造成影響。

針對(duì)以上問(wèn)題,本文以深度學(xué)習(xí)中卷積神經(jīng)網(wǎng)絡(luò)模型為基礎(chǔ),對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行調(diào)整,構(gòu)建了三維卷積神經(jīng)網(wǎng)絡(luò)(Three-dimensional Convolutional Neural Network,3D-CNN)模型,結(jié)合特定順序的輸入策略,并在公開(kāi)的Kaggle Data Science Bowl 2017 數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,本文提出的方法能夠?qū)υ紙D像進(jìn)行有效分類(lèi)識(shí)別,省略了傳統(tǒng)方法中復(fù)雜的圖像預(yù)處理過(guò)程,有較好的識(shí)別率。

1 本文研究方法

1.1 三維卷積神經(jīng)網(wǎng)絡(luò)模型

本文中構(gòu)建的3D-CNN 模型架構(gòu)如圖1 所示。圖1 中,首先對(duì)所有的肺部CT 圖像進(jìn)行簡(jiǎn)單的預(yù)處理,按照先正常人、后肺癌病人的CT 圖像的特定順序重新組織數(shù)據(jù)集,預(yù)處理后的肺部CT 圖像分別經(jīng)過(guò)卷積層層、池化層層、卷積層層、池化層層、卷積層層和池化層層來(lái)提取圖像的主要特征信息,全連接層將提取到的分布式特征信息進(jìn)行整合,判斷輸入圖像所屬類(lèi)別。

圖1 3D-CNN 架構(gòu)圖Fig.1 The structure of 3D-CNN

本文提出的端到端的三維卷積神經(jīng)網(wǎng)絡(luò)模型作為肺部CT 圖像的分類(lèi)模型,其層級(jí)結(jié)構(gòu)的具體設(shè)置如下:

(1)3D 卷積層。先設(shè)定好卷積核的尺寸、步長(zhǎng)、填充選項(xiàng)和卷積核的數(shù)量,然后與多個(gè)相鄰的圖像幀做加權(quán)求和的卷積計(jì)算,來(lái)提取目標(biāo)圖像特定區(qū)域的特征信息,不同的卷積核應(yīng)用在圖像的不同區(qū)域,來(lái)提取圖像的多種特征信息。第層的第個(gè)特征圖的(,,) 處的輸出,研究推導(dǎo)出的數(shù)學(xué)公式可寫(xiě)為:

(2)激活層。由于在卷積層中做加權(quán)求和的線性運(yùn)算,輸出的特征圖譜帶有明顯的線性特征,而線性特征的表現(xiàn)力不足以表達(dá)圖像的關(guān)鍵信息,需要通過(guò)激活函數(shù)添加非線性因素,將圖像特征保留并映射出來(lái)。激活函數(shù)主要有非線性、可微性、單調(diào)性和在原點(diǎn)處近似線性等特性,能夠使訓(xùn)練快速收斂,解決梯度彌散的問(wèn)題。本文中采用了修正線性單元(Rectified Linear Unit,)激活函數(shù),有單邊抑制特性,小于0 的值全部設(shè)為0,大于0 的值則直接輸出,數(shù)學(xué)公式具體如下:

(3)3D 池化層。池化層的功能是對(duì)上層激活層輸出的特征圖譜下采樣,通過(guò)該層將特征圖譜關(guān)鍵的特征像素標(biāo)注出來(lái),在一定程度上簡(jiǎn)化了參數(shù)的運(yùn)算過(guò)程、抑制了過(guò)擬合的現(xiàn)象,同時(shí)能夠提高模型的泛化能力。池化方法主要有均值池化(Mean Pooling)、最大池化(Max Pooling)、重疊池化(Overlapping Pooling)、均方池化(Pooling)、歸一化池化(Local Contrast Normalization)、隨機(jī)池化(Stochastic Pooling)、形變約束池化(Def-pooling)等等。

為了簡(jiǎn)化各層的計(jì)算過(guò)程,提取主要特征,本文選取了最大池化方法,取局部接受域中的最大值為該層輸出,推得的數(shù)學(xué)公式見(jiàn)式(3):

其中,為池化層的輸入;(,,)分別是高度、寬度和深度三個(gè)維度上的池化尺寸;(,,)為3 個(gè)維度上的采樣步長(zhǎng)值。

(4)全連接層。全連接層(Fully Connected layers,F(xiàn)C)通過(guò)對(duì)上層輸出的特征圖譜進(jìn)行卷積計(jì)算,將獲取到的分布式特征映射到樣本標(biāo)記空間,將這些分布式特征組裝成完整的“圖”,確定該特征圖譜所屬分類(lèi)。該層的優(yōu)點(diǎn)在于減少特征位置對(duì)分類(lèi)結(jié)果的影響,提高整個(gè)網(wǎng)絡(luò)模型的魯棒性。

(5)算法。由于條件的限制,數(shù)據(jù)集的種類(lèi)和質(zhì)量上存在不足之處,比如類(lèi)型單一、可用的數(shù)據(jù)量太少等,導(dǎo)致在模型訓(xùn)練的過(guò)程中出現(xiàn)分類(lèi)結(jié)果曲線與訓(xùn)練數(shù)據(jù)曲線重合的情況,即過(guò)擬合現(xiàn)象。本文采用算法,在模型訓(xùn)練的過(guò)程中先將輸入數(shù)據(jù)進(jìn)行正向地傳輸,并將一部分的神經(jīng)元以概率丟棄掉,其余神經(jīng)元以1的概率保留,再將該過(guò)程出現(xiàn)的誤差反向重傳回去。

通過(guò)函數(shù),實(shí)現(xiàn)以概率生成0 值,以概率1生成1 值,相應(yīng)的數(shù)學(xué)公式可表示為:

(6)函數(shù)。函數(shù)又稱(chēng)歸一化指數(shù)函數(shù),是將多分類(lèi)的結(jié)果以概率的形式呈現(xiàn),在邏輯回歸模型的基礎(chǔ)上解決類(lèi)別大于1 的分類(lèi)問(wèn)題。經(jīng)過(guò)函數(shù)的計(jì)算可得到圖像屬于某種分類(lèi)的概率值,該值可由如下公式計(jì)算求出:

其中,x為第個(gè)節(jié)點(diǎn)的輸出值,為輸出節(jié)點(diǎn)的個(gè)數(shù),即分類(lèi)的類(lèi)別數(shù)。

(7)交叉熵?fù)p失函數(shù)。采用的交叉熵?fù)p失函數(shù)(Cross Entropy Loss Function),通過(guò)計(jì)算真實(shí)概率分布與預(yù)測(cè)概率分布之間的損失值來(lái)評(píng)價(jià)卷積神經(jīng)網(wǎng)絡(luò)的性能優(yōu)劣,值越小,說(shuō)明模型的分類(lèi)識(shí)別效果越好。此時(shí)需用到的數(shù)學(xué)公式為:

1.2 特定順序輸入策略

本文采用了一種特定順序的輸入策略來(lái)指導(dǎo)模型的訓(xùn)練過(guò)程。將正常人的肺部CT 掃描圖像放在一起,后面拼接上肺癌高危患者的肺部CT 掃描圖像,形成一個(gè)整體的數(shù)據(jù)集,再將其輸入到3D-CNN模型中進(jìn)行訓(xùn)練。使用該策略能提高模型學(xué)習(xí)的速度和質(zhì)量,優(yōu)化卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練過(guò)程。

2 實(shí)驗(yàn)與分析

2.1 數(shù)據(jù)集

本文的數(shù)據(jù)來(lái)自由Kaggle 主辦的數(shù)據(jù)科學(xué)競(jìng)賽Data Science Bowl 2017 的數(shù)據(jù)集。該數(shù)據(jù)集是由1 397個(gè).docom 格式的肺部CT 掃描圖像組成,其中1 036個(gè)圖像為正常人的肺部圖像,361 個(gè)圖像為肺癌高危患者肺部圖像。先按照CT 圖像中圖像位置屬性對(duì)切片進(jìn)行排序,并實(shí)現(xiàn)三維渲染;將512×512 大小的圖片縮放為100×100,并對(duì)其進(jìn)行灰度化處理;最后,將三維CT 圖像合并成數(shù)量為20 的切片組合,得到100×100×20 的三維灰度圖像。這里以一個(gè)肺癌患者的CT 圖像預(yù)處理為例,單個(gè)切片的原始圖像和預(yù)處理后的圖像如圖2 所示。

圖2 單個(gè)切片的原始圖像和預(yù)處理圖像Fig.2 Raw and pre-processed images of a single slice

2.2 實(shí)驗(yàn)過(guò)程

首先,按照預(yù)定的輸入順序重新組織訓(xùn)練樣本,即將常規(guī)的肺部CT 掃描圖像放在一起,拼接上患癌的肺部CT 掃描圖像,形成一個(gè)整體的訓(xùn)練數(shù)據(jù)集,將其輸入到3D-CNN 模型中進(jìn)行訓(xùn)練。

該3D-CNN 模型在對(duì)重組后的數(shù)據(jù)集進(jìn)行訓(xùn)練后,就要對(duì)未知肺部CT 掃描圖像來(lái)做分類(lèi)識(shí)別。其中,第一層卷積層層32 個(gè)大小為5×5×5 不同的卷積核過(guò)濾,生成32 個(gè)大小為100×100×20 的特征圖譜,該層產(chǎn)生的變量總數(shù)為32×100×100×20;再將這32 個(gè)特征圖譜輸入進(jìn)第一層池化層層進(jìn)行最大池化操作,該層選用的池化步長(zhǎng)為2×2×2,輸出32 個(gè)大小為50×50×10 的特征圖像,產(chǎn)生的變量總數(shù)為32×50×50×10;第二層卷積層層采用64個(gè)大小為3×3×3 的不同的卷積核進(jìn)行填充,得到的64 個(gè)大小為50×50×10 特征圖譜,產(chǎn)生的變量總數(shù)為64×50×50×10;再進(jìn)行第二層池化層,層的參數(shù)設(shè)置參照層,由此得到64 個(gè)大小為25×25×5 的特征圖譜,而變量總數(shù)為64×25×25×5;最后將輸出的特征圖譜進(jìn)行第三層的卷積操作,第三層選擇128 個(gè)大小為3×3×3 的不同的卷積核,經(jīng)過(guò)該層后生成128 個(gè)大小為25×25×5 的特征圖譜,變量總數(shù)為128×25×25×5;再將此層生成的圖像輸入最后一層池化層中,其參數(shù)設(shè)置與、保持一致,輸出128 個(gè)大小為13×13×3 的特征圖譜,得到的變量總數(shù)為128×13×13×3=64 896。3D-CNN 數(shù)據(jù)處理過(guò)程如圖3 所示。

圖3 3D-CNN 數(shù)據(jù)處理過(guò)程Fig.3 3D-CNN data processing

2.3 實(shí)驗(yàn)對(duì)比分析

將932 個(gè)正常人的肺部CT 圖像數(shù)據(jù)和325 個(gè)肺癌高危患者的肺部CT 圖像數(shù)據(jù)混合,形成一個(gè)隨機(jī)順序的數(shù)據(jù)集,將其輸入進(jìn)該3D-CNN 模型中進(jìn)行訓(xùn)練,比較2 種方法的性能。根據(jù)分類(lèi)正確的樣本個(gè)數(shù)占所有樣本個(gè)數(shù)的比例來(lái)計(jì)算準(zhǔn)確率,并根據(jù)公式(9)計(jì)算損失值,實(shí)驗(yàn)結(jié)果分別見(jiàn)表1 和表2。由表1、表2 可知,采用特定順序輸入策略的3D-CNN 模型的分類(lèi)準(zhǔn)確率最高為76%,高于采用隨機(jī)順序輸入策略的3D-CNN 模型的最高準(zhǔn)確率(70%),說(shuō)明特定順序的輸入策略提升了模型的訓(xùn)練精度,從而有效提高肺癌圖像的分類(lèi)準(zhǔn)確率。

表1 3D-CNN 模型在特定順序輸入策略的結(jié)果Tab.1 Results of 3D-CNN model in specific order input strategy

表2 3D-CNN 模型在隨機(jī)順序輸入策略的結(jié)果Tab.2 Results of 3D-CNN model in random order input strategy

3 結(jié)束語(yǔ)

為解決傳統(tǒng)方法在肺癌CT 圖像分類(lèi)中的預(yù)處理過(guò)程復(fù)雜、工作量大的問(wèn)題,本文提出了基于3DCNN 的肺部CT 圖像分類(lèi)模型。該模型以卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),設(shè)計(jì)了3D 卷積層、激活層、3D 池化層以及全連接層等層級(jí)來(lái)獲取圖像的分類(lèi)特征,結(jié)合特定順序的輸入策略來(lái)優(yōu)化模型的訓(xùn)練過(guò)程,并與采用隨機(jī)順序輸入策略進(jìn)行了對(duì)比分析。結(jié)果表明,該模型對(duì)肺癌CT 圖像有良好的分類(lèi)特性,最高識(shí)別準(zhǔn)確率達(dá)到了76%,對(duì)于肺癌的早期診斷有一定的實(shí)用價(jià)值。但本文提出的3D-CNN模型在架構(gòu)設(shè)計(jì)和參數(shù)設(shè)置上仍有提升的空間,在未來(lái)的肺癌圖像識(shí)別工作中,將完善肺部CT 數(shù)據(jù)集、改善網(wǎng)絡(luò)結(jié)構(gòu)和優(yōu)化實(shí)驗(yàn)參數(shù)。

猜你喜歡
卷積預(yù)處理圖譜
基于全卷積神經(jīng)網(wǎng)絡(luò)的豬背膘厚快速準(zhǔn)確測(cè)定
非水溶劑預(yù)處理木質(zhì)纖維原料研究進(jìn)展
“植物界大熊貓”完整基因組圖譜首次發(fā)布
不同預(yù)處理對(duì)鐵皮石斛熱風(fēng)干燥特性及品質(zhì)的影響
精武門(mén)的武術(shù)圖譜與徐悲鴻
手術(shù)器械預(yù)處理在手術(shù)室的應(yīng)用
基于圖像處理與卷積神經(jīng)網(wǎng)絡(luò)的零件識(shí)別
污泥預(yù)處理-厭氧消化體系的能源經(jīng)濟(jì)性評(píng)價(jià)
基于深度卷積網(wǎng)絡(luò)與空洞卷積融合的人群計(jì)數(shù)
圖表
迁西县| 黄龙县| 合水县| 庆城县| 武宣县| 临海市| 津南区| 石屏县| 哈尔滨市| 白河县| 富裕县| 临海市| 东明县| 华蓥市| 荃湾区| 宁晋县| 河北区| 清水河县| 巴彦淖尔市| 通山县| 许昌市| 台前县| 页游| 通海县| 珠海市| 巨野县| 壶关县| 贞丰县| 南乐县| 盘山县| 邻水| 铜陵市| 霍州市| 佛坪县| 巴马| 肇东市| 台山市| 江门市| 古丈县| 蓬莱市| 封丘县|