增思濤,曹永春,林 強(qiáng),滿正行,鄧 濤,王 茸
(1.西北民族大學(xué) 中國(guó)民族語言文字信息技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,甘肅 蘭州 730030;2.西北民族大學(xué) 動(dòng)態(tài)流數(shù)據(jù)計(jì)算與應(yīng)用實(shí)驗(yàn)室,甘肅 蘭州 730030;3.甘肅省人民醫(yī)院 核醫(yī)學(xué)科,甘肅 蘭州 730020)
肺是氣體交換的主要場(chǎng)所,對(duì)維持人體生命健康起著至關(guān)重要的作用.受環(huán)境污染以及個(gè)人不良生活習(xí)慣的影響,肺部疾病多發(fā)、頻發(fā),主要包括肺血管病變及氣道病變.作為常見的肺血管病變,在我國(guó)肺栓塞(Pulmonary Embolism,PE)的死亡率位居第三位[1-2],它是一種由內(nèi)源性或外源性栓子阻塞肺動(dòng)脈主干及分支引起的肺部呼吸功能障礙的疾病.因此,PE的早期診斷對(duì)及時(shí)治療和康復(fù)起到十分重要的作用.
在臨床醫(yī)學(xué)中,肺部疾病的檢測(cè)主要是有創(chuàng)檢查和無創(chuàng)估測(cè)兩種手段.作為常見的有創(chuàng)檢查手段,肺動(dòng)脈造影是PE診斷的金標(biāo)準(zhǔn),但其操作復(fù)雜,同時(shí)存在引發(fā)并發(fā)癥及致死的風(fēng)險(xiǎn),因而不宜反復(fù)檢查,不適宜作為療效評(píng)價(jià)的常規(guī)方法.常見的無創(chuàng)估測(cè)方法主要包括計(jì)算機(jī)斷層掃描(Computed Tomography,CT)、正電子發(fā)射斷層成像術(shù)(Positron EmissionTomography,PET)、磁共振(Magnetic Resonance Imaging,MRI)及SPECT放射性核素肺灌注顯像.其中,CT具有快速及分辨率高的優(yōu)點(diǎn),但也存在輻射影響.當(dāng)前,PET在肺部疾病的臨床應(yīng)用主要用于惡性腫瘤的鑒別,同樣存在可能的輻射影響,不僅檢查費(fèi)用高,而且存在致癌風(fēng)險(xiǎn).SPECT放射性核素肺灌注顯像作為一種無創(chuàng)性的檢查方法,能夠依據(jù)肺血流受損的分布特點(diǎn)來診斷疾病和判斷病情嚴(yán)重程度,達(dá)到直接反映肺部整體病變的目的,具有對(duì)病灶區(qū)域敏感、易于觀察等優(yōu)點(diǎn),而且操作簡(jiǎn)便、輻射劑量較低,在PE的臨床檢查中得到廣泛應(yīng)用[3].由于傳統(tǒng)臨床診療應(yīng)用SPECT進(jìn)行PE診斷時(shí),需要醫(yī)生人工閱片,不僅效率較低,而且易受閱片醫(yī)生的臨床經(jīng)驗(yàn)、學(xué)識(shí)水平、工作狀態(tài)等主觀因素的影響,從而出現(xiàn)漏診和誤診的情況.
利用從歷史數(shù)據(jù)中提取出來的疾病特征,構(gòu)建基于機(jī)器學(xué)習(xí)特別是深度學(xué)習(xí)技術(shù)的計(jì)算機(jī)輔助診斷系統(tǒng)(Computer Aid Diagnosis,CAD),可實(shí)現(xiàn)疾病的輔助診斷,在有效提升診斷效率的同時(shí)大大減少了漏診、誤診現(xiàn)象的發(fā)生.深度學(xué)習(xí)技術(shù)在腦部疾病、乳腺癌和肺結(jié)核等領(lǐng)域的應(yīng)用[4-6]已經(jīng)有了廣泛的研究.在腦部疾病研究中,Sarraf等[7]分別針對(duì)sMRI和fMRI使用LeNet-5模型對(duì)阿爾茲海默癥樣本進(jìn)行訓(xùn)練,分別得到了98.84%和96.85%的檢測(cè)準(zhǔn)確率.在乳腺圖像識(shí)別方面,Carneiro等[8]使用卷積神經(jīng)網(wǎng)絡(luò)對(duì)乳房X光進(jìn)行分類研究,在檢測(cè)良惡性乳腺癌方面AUC超過0.9.在肺部圖像識(shí)別中,Shen等[9]使用多尺度卷積神經(jīng)網(wǎng)絡(luò)對(duì)肺結(jié)節(jié)CT圖像進(jìn)行訓(xùn)練,在檢測(cè)肺結(jié)節(jié)良惡性中分類準(zhǔn)確率達(dá)到86.8%.目前,研究人員利用深度學(xué)習(xí)技術(shù)在CT、X光和MRI圖像方面取得了一定的成績(jī).然而,在SPECT核醫(yī)學(xué)成像模態(tài)范疇下,基于深度學(xué)習(xí)的肺部疾病識(shí)別研究較少.
本文研究基于深度學(xué)習(xí)的SPECT肺灌注圖像分類識(shí)別,結(jié)合SPECT肺灌注圖像樣本數(shù)少、分辨率低、圖像數(shù)據(jù)變化范圍大等不同于一般圖像的特點(diǎn),首先進(jìn)行歸一化、數(shù)據(jù)擴(kuò)展等預(yù)處理,其次基于ResNet模型在圖像分類領(lǐng)域的突出表現(xiàn),在選用ResNet-50為分類模型的基礎(chǔ)上,引入遷移學(xué)習(xí)[10]和特征融合[11]方法有效提高了深度學(xué)習(xí)模型的分類效果.
核素肺灌注顯像通過靜脈注射放射性藥物,利用SPECT設(shè)備在病變組織與正常組織中探測(cè)到的放射量不同,從而使得圖像呈現(xiàn)差異性[12].本文所使用的數(shù)據(jù)均為2018年1月至12月在甘肅省人民醫(yī)院使用西門子SPECT-ECAM設(shè)備從SPECT肺灌注顯像中診斷各種生理疾病收集的數(shù)據(jù),采集矩陣為128×128,數(shù)據(jù)保存格式遵循醫(yī)學(xué)數(shù)字成像和通信協(xié)議(Digital Image and Communications in Medical,DICOM).
SPECT肺灌注數(shù)據(jù)由DICOM文件和對(duì)應(yīng)的診斷報(bào)告組成.原始數(shù)據(jù)集共包含340個(gè)DICOM文件,其中陰性150例,陽性190例.診斷報(bào)告是兩位核醫(yī)學(xué)科醫(yī)生在共同閱片的基礎(chǔ)下給出的診斷性建議結(jié)果.圖1為DICOM文件轉(zhuǎn)換后的陰性與陽性圖像.
圖1 肺灌注圖像
由圖1可以看出,在正常的(a)圖中,雙肺輪廓完整,雙肺肺尖及周邊稍顯減淡,其余部分分布均勻;在病變的(b)圖中,左肺中葉上段、左頂背段見楔形缺損,右肺中葉部分外側(cè)段、右肺中葉部分內(nèi)側(cè)段、右肺下葉部分前基底段見小楔形放射性缺損.
基于肺灌注圖像所呈現(xiàn)特征,本文結(jié)合診斷報(bào)告對(duì)原始圖像進(jìn)行標(biāo)注,陰性數(shù)據(jù)標(biāo)簽為0,陽性數(shù)據(jù)標(biāo)簽為1,并由三位核醫(yī)學(xué)專家對(duì)標(biāo)記結(jié)果進(jìn)行審核.
1.2.1 歸一化
SPECT肺灌注顯像數(shù)據(jù)最初存儲(chǔ)在DICOM文件中,文件中的每個(gè)分量值都是對(duì)預(yù)先注入患者體內(nèi)的放射性核素或同位素放射量(16位無符號(hào)整數(shù))的數(shù)字記錄,而不是像素值.SPECT肺灌注檢查產(chǎn)生的DICOM文件放射值不僅變化范圍大,而且存在明顯的個(gè)體差異.因此,需要在模型分類之前對(duì)放射值進(jìn)行變換處理.本文采用Min-Max標(biāo)準(zhǔn)化對(duì)DICOM文件做如下線性變換:
(1)
其中,xi表示圖像像素點(diǎn)值,max(x)和min(x)分別表示圖像像素的最大值與最小值.
1.2.2 數(shù)據(jù)擴(kuò)展
深度網(wǎng)絡(luò)模型對(duì)訓(xùn)練數(shù)據(jù)的量有較高的要求.因此,首先需要對(duì)已有數(shù)據(jù)做適度擴(kuò)充.考慮到原始數(shù)據(jù)集中可能存在的樣本不平衡,在數(shù)據(jù)擴(kuò)展時(shí)引入類間不等量擴(kuò)展.本文采用平移和旋轉(zhuǎn)兩種處理實(shí)現(xiàn)SPECT肺灌注數(shù)據(jù)的擴(kuò)展.此外,為了提升分類模型的可擴(kuò)展能力,數(shù)據(jù)擴(kuò)展階段相關(guān)參數(shù)的選擇以隨機(jī)方式確定.
平移:假如把(xI,yI)設(shè)置為輸入圖像內(nèi)的某個(gè)像素點(diǎn),賦予其適當(dāng)?shù)钠揭凭嚯xΔx、Δy,經(jīng)過上述操作后得到像素點(diǎn)的坐標(biāo)(xO,yO),得到平移計(jì)算公式(2):
(2)
旋轉(zhuǎn):假定(xI,yI)為輸入圖像中的像素點(diǎn),給定旋轉(zhuǎn)角度θ∈[θ1,θ2],其中θ1和θ2分別代表旋轉(zhuǎn)角度的下限和上限,其取值通過實(shí)驗(yàn)方式確定.圖像旋轉(zhuǎn)的計(jì)算公式(3):
(3)
如圖2(a)為肺灌注原圖,圖2(b)為平移后的效果圖,圖2(c)為旋轉(zhuǎn)后的效果圖.
圖2 平移旋轉(zhuǎn)效果圖
采用上述處理方法本文對(duì)原始數(shù)據(jù)集進(jìn)行了處理,最終獲得13 600張肺灌注圖像組成的擴(kuò)展數(shù)據(jù)集,其中陰性5 680張,陽性7 920張.在分類實(shí)驗(yàn)中本文以8∶2的比例來劃分訓(xùn)練集和測(cè)試集,具體劃分情況見表1.
表1 擴(kuò)展后數(shù)據(jù)情況
基于深度神經(jīng)網(wǎng)絡(luò)的圖像分類性能與網(wǎng)絡(luò)的深度存在重要的關(guān)系.隨著深度神經(jīng)網(wǎng)絡(luò)層數(shù)的不斷提升,會(huì)產(chǎn)生梯度消失和網(wǎng)絡(luò)性能退化現(xiàn)象[13],為了解決這一問題,HE等[14]提出了殘差網(wǎng)絡(luò)(Residual Networks,ResNet).
ResNet網(wǎng)絡(luò)主要有ResNet-18、ResNet-34、ResNet-50、ResNet-101和ResNet-152等不同深度的ResNet模型,其主要差別表現(xiàn)在卷積層數(shù)的不同.ResNet模型采用多個(gè)小卷積核進(jìn)行特征提取,在圖像分類領(lǐng)域取得了很好的效果.本文選用ResNet-50為SPECT肺灌注圖像分類器,并通過遷移學(xué)習(xí)和特征融合方法來提高圖像分類效果.
ResNet-50將深層網(wǎng)絡(luò)模型構(gòu)建為淺層網(wǎng)絡(luò)模型和自身映射的增加層,把訓(xùn)練好的淺層結(jié)構(gòu)與自身映射的増加層通過殘差單元連接在一起,通過shortcut將輸入跨層傳遞,然后與經(jīng)過卷積后的輸出相加,達(dá)到充分訓(xùn)練底層網(wǎng)絡(luò)的效果,殘差單元結(jié)構(gòu)如圖3所示.
圖3 殘差單元結(jié)構(gòu)示意圖
假定神經(jīng)網(wǎng)絡(luò)最初的輸入值是m,有一函數(shù)為H(m),該函數(shù)代表的意義是網(wǎng)絡(luò)堆疊層的最下一層的映射,針對(duì)普通的線性網(wǎng)絡(luò)結(jié)構(gòu),學(xué)習(xí)目標(biāo)所設(shè)立的函數(shù)F(m)是與上述底層映射的函數(shù)H(m)相同的,而面對(duì)殘差網(wǎng)絡(luò)結(jié)構(gòu),則有所不同,因?yàn)檫@種結(jié)構(gòu)是把m不直接輸送到底層,最終形成一個(gè)輸出結(jié)果,所以這里的F(m)就與H(m)有所區(qū)別,其具體等式為F(m)=H(m)-m,這種方式能夠使底層直接參與到學(xué)習(xí)殘差中,這種連接變更了一般的直連神經(jīng)網(wǎng)絡(luò)模型,特別是其中后一層的情況只能通過前一層的輸出,非間接地運(yùn)行恒等映射,最終很好地處理了網(wǎng)絡(luò)層數(shù)過多而導(dǎo)致的梯度消失、性能退化等棘手的難題,殘差單元定義如公式(4):
xl+1=f[xl+F(xl,wl)]
(4)
式中xl和xl+1分別為第l個(gè)殘差單元的輸入和輸出F(xl,wl)為待學(xué)習(xí)的殘差映射,w為卷積核,f為激活函數(shù),采用線性整流函數(shù)(Rectified Linear Unit,ReLU),其公式(5)為:
Relu(x)=max(0,x)
(5)
ResNet-50模型結(jié)構(gòu)如圖4所示,包含了49個(gè)卷積層和1個(gè)全連接層,有2個(gè)基本的Block,一個(gè)是ID Block,輸入和輸出的維度是一樣的,所以可以串聯(lián)多個(gè);另外一個(gè)基本Block是CONV Block,輸入和輸出的維度是不一樣的,所以不能連續(xù)串聯(lián),它的作用本是為了改變特征向量的維度.其中第2~5階段中ID Blcok×2代表兩個(gè)不改變維度的殘差塊,CONV Block代表的是添加維度的殘差塊,每個(gè)殘差塊包含3個(gè)卷積層.圖中CONV表示卷積操作,Batch Normal是批正則化處理,ReLu為激活函數(shù),MAX Pool和AVG Pool分別表示最大池化和平均池化,第2~5階段表示殘差塊.
圖4 ResNet-50模型
2.2.1 遷移學(xué)習(xí)(TL)
遷移學(xué)習(xí)是將在已有領(lǐng)域中學(xué)習(xí)到的知識(shí),應(yīng)用到新的相關(guān)領(lǐng)域中,從而提高在新領(lǐng)域中的表現(xiàn)效果[15].Yosinski等[16]通過大量實(shí)驗(yàn)對(duì)比發(fā)現(xiàn)基于特征遷移的卷積神經(jīng)網(wǎng)絡(luò)表現(xiàn)效果比隨機(jī)初始化權(quán)重的網(wǎng)絡(luò)效果好,可以大幅度提升網(wǎng)絡(luò)的泛化能力.
針對(duì)SPECT肺灌注數(shù)據(jù)量少和數(shù)據(jù)不平衡導(dǎo)致的過擬合問題,采用遷移學(xué)習(xí)方法來改善,處理過程如圖5所示.首先,將自然圖像數(shù)據(jù)集上學(xué)習(xí)到的特征作為先驗(yàn)知識(shí)遷移到ResNet-50網(wǎng)絡(luò)模型上.其次,由于SPECT肺灌注圖像與自然圖像數(shù)據(jù)有一定的差異,因此需要將預(yù)訓(xùn)練網(wǎng)絡(luò)在SPECT肺灌注圖像上進(jìn)行二次訓(xùn)練,使網(wǎng)絡(luò)針對(duì)SPECT肺灌注圖像自適應(yīng)調(diào)整參數(shù).最后,網(wǎng)絡(luò)模型的最后一層與具體數(shù)據(jù)集密切相關(guān),每一個(gè)輸出節(jié)點(diǎn)都對(duì)應(yīng)一個(gè)特定的類別.因此,基于本文數(shù)據(jù)集實(shí)現(xiàn)網(wǎng)絡(luò)層遷移后重新構(gòu)建分類層,實(shí)現(xiàn)SPECT肺灌注圖像的分類識(shí)別.
圖5 基于遷移學(xué)習(xí)的ResNet-50模型
2.2.2 特征融合(FF)
圖像識(shí)別研究中,為了充分利用圖像信息,常常采用特征融合方法.而在醫(yī)學(xué)圖像領(lǐng)域,淺層、深層特征同樣能夠?qū)崿F(xiàn)病灶識(shí)別,因此,本文基于ResNet-50采用特征融合方法進(jìn)行肺灌注圖像識(shí)別.
在深度學(xué)習(xí)網(wǎng)絡(luò)中,將網(wǎng)絡(luò)中的隱藏層進(jìn)行特征融合,從而達(dá)到網(wǎng)絡(luò)模型最優(yōu)的效果.對(duì)于空間特征融合算法,可以融合卷積層的輸出特征圖,將得到的結(jié)果傳送到下一層,融合函數(shù)公式(6):
(6)
ResNet-50模型是一個(gè)50層的深層神經(jīng)網(wǎng)絡(luò),在特征提取過程中,隨著卷積層數(shù)的增加,網(wǎng)絡(luò)會(huì)更加注重深層的總體特征信息,忽略細(xì)節(jié)特征信息,從而對(duì)模型識(shí)別精度產(chǎn)生影響.為了更好的實(shí)現(xiàn)對(duì)肺灌注圖像的識(shí)別,采取特征融合方法對(duì)ResNet-50進(jìn)行改進(jìn).ResNet-50模型第2階段輸出特征圖經(jīng)過10層卷積,第3階段輸出特征圖經(jīng)過22層卷積,分別將第2階段的輸出特征圖、第3階段的輸出特征圖與第5階段的輸出特征圖進(jìn)行融合,然后送入全連接層.經(jīng)過實(shí)驗(yàn)發(fā)現(xiàn),第3階段輸出特征圖和第5階段的輸出特征圖融合,對(duì)肺灌注圖像識(shí)別的準(zhǔn)確率明顯高于第2階段輸出特征圖和第5階段輸出特征圖的融合.因此,本文將第3階段和第5階段輸出特征圖融合方式對(duì)肺灌注圖像識(shí)別.ResNet-50模型的輸入尺寸為224×224,第3階段的輸出特征圖尺寸為28×28,第5階段的輸出特征圖為7×7,通過雙線性插值對(duì)第3階段輸出特征圖進(jìn)行池化操作,與第5階段的輸出特征圖進(jìn)行融合,經(jīng)過扁平層Flatten,最后使用2個(gè)全連接層和SoftMax激活函數(shù),模型結(jié)構(gòu)如圖6所示.
本實(shí)驗(yàn)的實(shí)驗(yàn)環(huán)境為Windows10操作系統(tǒng),所用GPU型號(hào)為GTX1080Ti,內(nèi)存為32G,選擇Pytorch深度學(xué)習(xí)框架進(jìn)行模型訓(xùn)練和測(cè)試,編程語言為Python3.7.基于擴(kuò)展后的SPECT肺灌注圖像數(shù)據(jù)進(jìn)行分類實(shí)驗(yàn),模型訓(xùn)練設(shè)置損失函數(shù)為交叉熵,優(yōu)化器為隨機(jī)梯度下降,激活函數(shù)為ReLu,學(xué)習(xí)率為0.001,最大迭代次數(shù)為40 000次.
在實(shí)驗(yàn)中,為了適應(yīng)ResNet-50模型輸入要求,對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行resize操作,將圖像拉伸至224×224,并利用Convert(RGB)函數(shù)將單通道圖像轉(zhuǎn)換為三通道,然后以8∶2的比例隨機(jī)分配訓(xùn)練集和測(cè)試集.
為比較本文提出的改進(jìn)方法在SPECT肺灌注圖像分類中的有效性,我們進(jìn)行了4組對(duì)比實(shí)驗(yàn).1)基于原始ResNet-50模型的SPECT肺灌注圖像分類;2)將遷移學(xué)習(xí)方法引入原始ResNet-50模型進(jìn)行SPECT肺灌注圖像分類(TL_ResNet-50);3)將ResNet-50模型中第3階段輸出特征與第5階段輸出特征進(jìn)行融合的SPECT肺灌注圖像分類(FF_ResNet-50);4)將遷移學(xué)習(xí)方法引入到FF_ResNet-50模型進(jìn)行SPECT肺灌注圖像分類(TL_FF_ResNet-50).通過比較分析以上四組實(shí)驗(yàn)的分類效果,進(jìn)一步驗(yàn)證本文在ResNet-50模型中引入遷移學(xué)習(xí)和特征融合方法的分類效果.
對(duì)上述四組實(shí)驗(yàn)的分類效果本文以分類準(zhǔn)確率(Accuracy)、ROC曲線下的面積(Area Under Curve,AUC)、靈敏度(Sensitivity)和特異度(Specificity)作為評(píng)價(jià)指標(biāo)進(jìn)行評(píng)價(jià)并比較.
準(zhǔn)確率是評(píng)估分類模型全局準(zhǔn)確程度的常用指標(biāo),其值表示分類準(zhǔn)確的樣本數(shù)占總樣本數(shù)的比例,一般準(zhǔn)確率越接近1則表示分類效果越好.計(jì)算公式(7):
(7)
其中,TP為陰性樣本的正確識(shí)別數(shù);FP為陰性樣本的錯(cuò)誤識(shí)別數(shù);FN為陽性樣本的錯(cuò)誤識(shí)別數(shù);TN為陽性樣本的正確識(shí)別數(shù).
為了更全面評(píng)估網(wǎng)絡(luò)的分類性能,本文繪制了受試者工作特征曲線(Receiver Operating Characteristics,ROC)并計(jì)算AUC值.ROC曲線的橫坐標(biāo)為假正例率(False Positive Rate,FPR),縱坐標(biāo)為真正例率(True Positive Rate,TPR),AUC值越接近1,網(wǎng)絡(luò)的診斷性能越好.
臨床輔助診斷中,僅靠分類準(zhǔn)確率難以準(zhǔn)確反映分類模型性能的強(qiáng)弱.為了客觀、準(zhǔn)確、全面地評(píng)估網(wǎng)絡(luò)的診斷性能以及考慮到對(duì)患者漏診、誤診后果的嚴(yán)重性,還需要靈敏度、特異度評(píng)判指標(biāo).
靈敏度又稱為真陽性率(TPR),即實(shí)際陽性樣本被正確判斷為陽性的比例,反映模型發(fā)現(xiàn)陽性的能力,靈敏度越高,則越不容易漏診,其計(jì)算公式(8)為:
(8)
特異度又稱真陰性率(1-FPR),即實(shí)際陰性被正確判斷為陰性的比例,反映模型發(fā)現(xiàn)陰性的能力,特異度越高,則越不容易誤診,其計(jì)算公式(9)為:
(9)
以上四組實(shí)驗(yàn)的訓(xùn)練過程中隨著訓(xùn)練批次的變化損失曲線如圖7所示,橫坐標(biāo)為網(wǎng)絡(luò)迭代次數(shù),縱坐標(biāo)為損失值.從圖7中看出,隨著迭代次數(shù)的增加,ResNet-50和FF_ResNet-50模型在迭代次數(shù)達(dá)到390 000次左右時(shí)趨于平穩(wěn)狀態(tài),在迭代次數(shù)達(dá)到25 000次時(shí),ResNet-50模型loss曲線仍有較高幅度的波動(dòng),而FF_ResNet-50模型在引入特征融合方法后,使得模型充分學(xué)習(xí)淺層信息和深層信息,可以明顯看到模型的波動(dòng)趨于平穩(wěn),說明特征融合使得網(wǎng)絡(luò)模型更快趨于穩(wěn)定.為了解決因數(shù)據(jù)量較少引起的模型易過擬合問題,TL_FF_ResNet-50模型和TL_ResNet-50模型引入遷移學(xué)習(xí)算法明顯加快了模型的收斂速度,TL_FF_ResNet-50模型在迭代次數(shù)達(dá)到14 000次時(shí)已經(jīng)趨于平穩(wěn)狀態(tài),TL_ResNet-50模型在迭代次數(shù)達(dá)到19 000次時(shí)趨于平穩(wěn)狀態(tài),相比原始ResNet-50模型的收斂速度提高了將近1倍.
圖7 訓(xùn)練集損失曲線
四種分類模型對(duì)應(yīng)ROC曲線如圖8所示,橫軸為FPR,縱軸為TPR,圖中虛線表示預(yù)測(cè)分界線,預(yù)測(cè)結(jié)果位于分界線之上,說明分類器性能高于隨機(jī)預(yù)測(cè);預(yù)測(cè)結(jié)果位于分界線之下,說明分類器性能較差.ResNet-50、TL_ResNet-50、FF_ResNet-50和TL_FF_ResNet-50網(wǎng)絡(luò)模型對(duì)應(yīng)的ROC曲線分別為圖8的(a)(b)(c)和(d).由圖8可見,四種模型的曲線都在預(yù)測(cè)分界線之上,AUC值都達(dá)到了0.85以上,說明均有一定的分類效果,其中,TL_FF_ResNet-50模型的AUC值達(dá)到了0.986,說明引入了遷移學(xué)習(xí)和特征融合后的ResNet-50模型在SPECT肺灌注圖像上的分類性能最好.
圖8 四種網(wǎng)絡(luò)模型對(duì)應(yīng)ROC曲線
四組實(shí)驗(yàn)在測(cè)試集上的四項(xiàng)分類指標(biāo)評(píng)價(jià)結(jié)果如表2所示.由表2可見,在SPECT肺灌注圖像的診斷中,原始ResNet-50模型在測(cè)試集上的準(zhǔn)確率、靈敏度和特異度均表現(xiàn)最差,相比ResNet-50,TL_ResNet-50模型由于引入遷移學(xué)習(xí)而改善了數(shù)據(jù)量不足所帶來的過擬合情況,在測(cè)試數(shù)據(jù)集上的分類準(zhǔn)確率、靈敏度和特異度分別提高了7.9%、8.4%和9.3%.相比ResNet-50模型,F(xiàn)F_ResNet-50模型由于融合了網(wǎng)絡(luò)淺層特征和深層特征分類準(zhǔn)確率、靈敏度和特異度也有較明顯的提升.靈敏度和特異度在臨床診斷中意義重大,靈敏度的提升意味著漏診率的下降,特異度的提升意味著誤診率的下降,低漏診率和低誤診率為病人的及時(shí)確診及后續(xù)治療爭(zhēng)取了寶貴時(shí)間.上述兩種網(wǎng)絡(luò)雖然取得了不錯(cuò)的效果,但還不能滿足臨床應(yīng)用的要求.TL_FF_ResNet-50模型在特征融合的基礎(chǔ)上同時(shí)引入遷移學(xué)習(xí),不僅有效提高了深度學(xué)習(xí)模型的分類準(zhǔn)確率,同時(shí)改善了數(shù)據(jù)量不足導(dǎo)致的過擬合現(xiàn)象,分類準(zhǔn)確率達(dá)到了95.5%,靈敏度和特異度分別達(dá)到了94.7%和96.7%,具有較低的漏診率和誤診率,取得了較為理想的結(jié)果,可以為臨床醫(yī)生提供更為精確的輔助診斷信息.
表2 實(shí)驗(yàn)結(jié)果
本文研究了基于ResNet深度模型的SPECT肺灌注功能成像分類方法.針對(duì)SPECT核醫(yī)學(xué)成像自身特征及醫(yī)學(xué)圖像數(shù)據(jù)量少、數(shù)據(jù)不平衡等問題所帶來的深度學(xué)習(xí)模型分類效果不理想及過擬合現(xiàn)象,通過數(shù)據(jù)歸一化、數(shù)據(jù)擴(kuò)展和遷移學(xué)習(xí)[10]方法進(jìn)行改善.為有效提高SPECT肺灌注圖像的分類效果,在ResNet-50深度模型中引入特征融合[11]方法實(shí)現(xiàn)對(duì)SPECT圖像淺層信息和深度信息的充分利用從而達(dá)到肺部疾病的識(shí)別.通過在一組真實(shí)SPECT肺灌注圖像上的比較實(shí)驗(yàn),驗(yàn)證了本文模型在SPECT肺灌注圖像分類方面的適用性和有效性.
為提高深度模型的泛化能力本文對(duì)肺灌注圖像數(shù)據(jù)做了一定的擴(kuò)展,但是擴(kuò)展后的數(shù)據(jù)相關(guān)性較大,并且數(shù)據(jù)不夠全面,在一定程度上影響識(shí)別效果.下一步研究一方面將擴(kuò)大真實(shí)數(shù)據(jù)集,對(duì)模型的結(jié)構(gòu)進(jìn)行改進(jìn)和優(yōu)化,以期訓(xùn)練出更具泛化能力的分類模型.另一方面針對(duì)單個(gè)病例8個(gè)體位的肺灌注圖像進(jìn)行三維建模,并進(jìn)行定量分析,在此基礎(chǔ)上根據(jù)肺灌注缺損程度研究多分類問題,以期進(jìn)一步判斷肺部疾病的嚴(yán)重程度.