劉亞偉,郭辰婧,趙繪萍
(吉林醫(yī)藥學(xué)院附屬醫(yī)院,吉林 吉林 132013)
隨著人們生活環(huán)境和生活方式的改變,慢性病取代傳染病,成為威脅人類健康的首要因素。腫瘤是最常見的慢性病之一,部分腫瘤早期的臨床癥狀較為隱蔽,其診斷率低,嚴(yán)重影響了患者的治療與康復(fù)。腫瘤的傳統(tǒng)影像學(xué)篩查主要依靠于其成像片的密度、增強(qiáng)模式、腫瘤邊緣規(guī)律等定性特征診斷。但是,人類對影像圖片的解讀存在主觀性,存在漏診誤診的風(fēng)險(xiǎn)。計(jì)算機(jī)輔助診斷(computer aided diagnosis,CAD)旨在通過計(jì)算機(jī)對病人的影像學(xué)檢查結(jié)果進(jìn)行分析并輔助醫(yī)生完成診斷,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)便是其中最具代表性、發(fā)展最為迅猛的一種算法,它能夠自動提取圖像特征,快速找尋圖像的定性特征,其獨(dú)特的優(yōu)越性體現(xiàn)在圖片識別、分類和計(jì)算領(lǐng)域。
20世紀(jì)60年代,生理學(xué)家Hubel和Wiesel在貓的視覺神經(jīng)系統(tǒng)中探索到視覺空間在視覺皮層中的組織原理,視覺皮層細(xì)胞從視網(wǎng)膜上獲取視覺信息,完成光電信息的轉(zhuǎn)換[1]。日本學(xué)者福島邦彥根據(jù)這一發(fā)現(xiàn),模擬了視覺皮層對視覺空間的組織提出了neocognitron模型,并由此開啟了CNN的研究[2]。后來世界各地的計(jì)算機(jī)專家紛紛對這一模型進(jìn)行改進(jìn)推廣,誕生了用于醫(yī)學(xué)影像監(jiān)測的平移不變?nèi)斯ど窠?jīng)網(wǎng)絡(luò)(SIANN)[3]。在20世紀(jì)90年代隨著以支持向量機(jī)為代表的核學(xué)習(xí)方法的興起,CNN的發(fā)展進(jìn)入到停滯期。直至2006年深度學(xué)習(xí)理論被提及后,CNN受到關(guān)注并逐漸被使用,并成為圖像識別領(lǐng)域中必不可缺的重要算法。
CNN是由可學(xué)習(xí)權(quán)重和偏置常量的神經(jīng)元組成的一種包含卷積計(jì)算和具有深度結(jié)構(gòu)的前饋控制神經(jīng)網(wǎng)絡(luò),特征提取層和特征映射層是其重要基本結(jié)構(gòu)。特征提取層通過神經(jīng)元進(jìn)行定位提取,映射層權(quán)值共享使模型簡潔;卷積層、池化層、線性整流層和全連接層是CNN整體組成[4],
卷積層利用卷積操作對輸入的圖像進(jìn)行處理,提取圖片的有效特征;池化層是為了對圖像進(jìn)行縮小,降低特征圖的數(shù)量;線性整流層使用的是線性整流激活函數(shù),對于輸入圖像中的每個(gè)正值,它返回相同的值和全連接層在輸出層使用softmax激活函數(shù),對處理好的圖像進(jìn)行分類處理,最后將分類結(jié)果輸出[5]。
深度學(xué)習(xí)概念于2006年提出。CNN的表征學(xué)習(xí)算法模型被廣泛地應(yīng)用于圖像識別、物體識別、行為認(rèn)知、姿態(tài)估計(jì)等方面[6]。而在醫(yī)學(xué)領(lǐng)域,更是被應(yīng)用在多種疾病的診斷和治療中。
乳腺癌已成為影響全球女性生命健康的高危因素,在女性惡性腫瘤發(fā)病率中居首位,死亡率高達(dá)42%左右,并且近年來患病率持續(xù)升高[7]。目前臨床早期確診通常需要依靠放射科醫(yī)生判斷乳腺鉬靶圖像,由MRI和CT作為補(bǔ)充,活體組織檢查是乳腺癌最終確診的金標(biāo)準(zhǔn)[8]。對乳腺腫塊病理標(biāo)志物的影像診斷研究仍在突破。由于自身個(gè)體及體內(nèi)腫塊形態(tài)和密度具有差異性,使乳腺腫塊與周圍其他腺體組織分界不清,是篩查診斷的主要阻礙。
使用CNN診斷乳腺癌是由Sahiner首次提出。利用CNN可以快速提取某一特定區(qū)域的特點(diǎn),并采用BP網(wǎng)絡(luò)分類,從而準(zhǔn)確定位乳腺腫塊[9]。荷蘭Kooi等采用和OxfordNet類似的結(jié)構(gòu)對獲得的4.5萬張標(biāo)簽圖像進(jìn)行訓(xùn)練,并且在網(wǎng)絡(luò)中添加了幾個(gè)手動提取的特征信息參數(shù)來檢測乳腺腫塊和鈣化,最終在驗(yàn)證集上的最佳AUC為90%。該方法結(jié)合深度學(xué)習(xí)模型和手動提取特征的優(yōu)點(diǎn),分類效果大大超過了傳統(tǒng)的計(jì)算機(jī)輔助診斷系統(tǒng)。
針對乳腺核磁共振圖像的特點(diǎn),李靜提出將傳統(tǒng)的CNN進(jìn)行升級,把傳統(tǒng)的二維CNN升級成三維CNN[10]。三維卷積是由多個(gè)連續(xù)的切片堆疊而成,利用該三維立體中三維過濾器,用來獲取相鄰層之間的空間信息和變化信息。結(jié)果顯示,與二維CNN相比,三維CNN能夠利用病灶不同切片之間的三維空間信息,分類結(jié)果有明顯提高(15%)。
肺癌是全球發(fā)病率和死亡率最高的癌癥。放射科醫(yī)生可進(jìn)行大規(guī)模低劑量螺旋CT篩查,根據(jù)肺部結(jié)節(jié)的生長狀況和密度等因素分析肺癌高發(fā)人群的患癌風(fēng)險(xiǎn),然后做出臨床干預(yù),患者死亡率降低了20%至43%[11]。醫(yī)學(xué)影像學(xué)和人工智能合作,有望通過區(qū)分良性和惡性結(jié)節(jié),在提高肺癌的早期發(fā)現(xiàn)和定性方面發(fā)揮重要作用。
肺結(jié)節(jié)診斷和定性需要依據(jù)肺部CT圖像。肺結(jié)節(jié)輔助檢查系統(tǒng)是基于多視角CNN構(gòu)建的。Seio等利用來自美國國家肺癌篩查試驗(yàn)計(jì)劃[12]的1萬多個(gè)病人的4萬多張CT圖像數(shù)據(jù),訓(xùn)練了一個(gè)基于三維CNN的網(wǎng)絡(luò)結(jié)構(gòu),研究人員隨后在測試集上獲得了高達(dá)94.4%的可信區(qū)間[13]。本實(shí)驗(yàn)的對比實(shí)驗(yàn)中,安排多名擁有多年臨床經(jīng)驗(yàn)的放射科診斷醫(yī)生對同一數(shù)據(jù)進(jìn)行肺癌患病風(fēng)險(xiǎn)評估。醫(yī)生在CT圖像之外同時(shí)還擁有病人的身份信息及臨床歷史信息的情況下,發(fā)現(xiàn)他們的表現(xiàn)均差于深度學(xué)習(xí)網(wǎng)絡(luò)算法。因此,通過大數(shù)據(jù)訓(xùn)練的人工智能模型在早期肺癌風(fēng)險(xiǎn)預(yù)測這一任務(wù)上表現(xiàn)出了優(yōu)于人類專家的性能。結(jié)果有力地證實(shí)了神經(jīng)網(wǎng)絡(luò)對肺癌預(yù)測的結(jié)果穩(wěn)健性。
膠質(zhì)瘤是顱腦中常見的惡性腫瘤之一,所占比重約45%,多好發(fā)于中樞神經(jīng)系統(tǒng)。腦膠質(zhì)瘤不僅會引起惡心、嘔吐、頭痛等癥狀,且及有可能引起精神異常、視力下降甚至失明等癥狀[14]。目前檢査腦膠質(zhì)瘤的影像手段主要有MRI和CT。MRI提供的圖像組織對比度高,對腫瘤的大小、位置判斷,術(shù)中圖像引導(dǎo)及后續(xù)治療具有重大意義,是診斷腦膠質(zhì)瘤的重要輔助手段之一。目前在腦膠質(zhì)瘤影像上的難題主要集中在腫瘤的精準(zhǔn)分割和分級上。
Zikic利用傳統(tǒng)的二維CNN結(jié)構(gòu),開發(fā)了一種通過將輸入的4種模態(tài)三維尺寸的MRI圖像信息轉(zhuǎn)化為二維尺寸的解釋性方法,實(shí)現(xiàn)了腫瘤的分割[15]。羅蔓將多模態(tài)的三維CNN特征提取技術(shù)與支持向量機(jī)中的自適應(yīng)加權(quán)混合核函數(shù)相結(jié)合,對MRI不同模態(tài)下產(chǎn)生的多余干擾信息去除,縮小原始特征,明顯區(qū)分同一病人在不同圖像層面的腫瘤大小,使MRI對腫瘤的分割精度有了明顯提升[16]。同時(shí)自適應(yīng)的加權(quán)混合核函數(shù)保證了模型的學(xué)習(xí)能力和泛化性能。此外,吳聰設(shè)計(jì)的三層卷積層的CNN模型在腦膠質(zhì)瘤的分級中也取得了良好的效果,分類的準(zhǔn)確性達(dá)到了83.79%[17]。
大部分CAD研究是在機(jī)器學(xué)習(xí)算法的基本結(jié)構(gòu)上完成的[18]。近些年來隨著深度學(xué)習(xí)算法的不斷發(fā)展,使得計(jì)算機(jī)能夠自動從海量的數(shù)據(jù)中學(xué)習(xí)獲得更深層次、更為抽象的特征,同時(shí)能夠有效排除人為因素的干擾,從而提高癌癥診斷的準(zhǔn)確性[19]。CNN是機(jī)器學(xué)習(xí)的一個(gè)子集,它可以從樣本圖像中自動學(xué)習(xí)特征表示,并且在特定任務(wù)的應(yīng)用中已經(jīng)顯示出與人類的表現(xiàn)相匹配甚至超過人類的表現(xiàn)。盡管需要大量的數(shù)據(jù)集進(jìn)行訓(xùn)練,深度學(xué)習(xí)已經(jīng)證明了對在腫瘤的成像模式中具有更大的普遍應(yīng)用性、減少誤差的發(fā)生,最終實(shí)現(xiàn)早期臨床干預(yù)和診斷效果的顯著改善。
總之,CNN在腫瘤影像學(xué)中的應(yīng)用研究中通過對超大數(shù)據(jù)集的運(yùn)用,對CT、MRI等影像圖像全局和局部特征的同時(shí)識別和提取,以及對不同時(shí)間點(diǎn)影像圖像的綜合分析,實(shí)現(xiàn)了人工智能預(yù)測腫瘤風(fēng)險(xiǎn)的現(xiàn)有最高精度,且被證明顯著優(yōu)于醫(yī)生表現(xiàn)[13,18,20]。公眾建立的開源CNN和醫(yī)療影像分析平臺NiftyNet[21],能夠共享網(wǎng)絡(luò)架構(gòu)和預(yù)訓(xùn)練模型,被越來越多的臨床實(shí)踐用于醫(yī)療影像分析和影像導(dǎo)向治療。目前提出的網(wǎng)絡(luò)結(jié)構(gòu)具有較強(qiáng)的延展性和靈活的適應(yīng)性,能夠被運(yùn)用至多種基于三維圖像的病理狀態(tài)分析任務(wù)中,在未來可預(yù)期成為病理分析的常規(guī)手段。
吉林醫(yī)藥學(xué)院學(xué)報(bào)2021年4期