張佳佳 樊鑫 秦珊珊 余飛
同濟(jì)大學(xué)附屬第十人民醫(yī)院核醫(yī)學(xué)科,上海 200072
人工智能最初在1956年由美國(guó)科學(xué)家在達(dá)特莫斯學(xué)會(huì)會(huì)議上提出,其聚焦于利用機(jī)器模擬人的部分思維活動(dòng)的研究。近年來(lái),人工智能在醫(yī)療保健領(lǐng)域取得了眾多研究成果,在腫瘤診斷中的應(yīng)用也得到了蓬勃發(fā)展。癌癥作為一種自我維持和適應(yīng)的過(guò)程,與其所處的微環(huán)境動(dòng)態(tài)相互作用,因此其診斷與治療極為復(fù)雜[1]?,F(xiàn)階段,癌癥的診斷多依賴于高分辨率醫(yī)學(xué)成像儀器和病理儀器設(shè)備等,由醫(yī)師對(duì)結(jié)果加以判斷,無(wú)法反映成像數(shù)據(jù)的分布。人工智能則可以對(duì)數(shù)以萬(wàn)計(jì)的圖像組成的數(shù)據(jù)集進(jìn)行學(xué)習(xí)及推理,可有效地解決這一問(wèn)題,使腫瘤診斷從主觀感知轉(zhuǎn)向客觀科學(xué);另外,人工智能不存在由視覺(jué)疲勞、經(jīng)驗(yàn)不足等主觀因素造成的漏診與誤診。隨著人們對(duì)自身健康關(guān)注度的提升,每天都會(huì)并行產(chǎn)生大量與腫瘤相關(guān)的醫(yī)療數(shù)據(jù),人工智能可以對(duì)海量的與腫瘤相關(guān)的數(shù)據(jù)進(jìn)行匯總分析,協(xié)助醫(yī)師高效地開(kāi)展工作。本文主要從以下幾個(gè)方面闡述目前人工智能用于腫瘤診斷的新進(jìn)展。
人工智能融合計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、腦神經(jīng)學(xué)和社會(huì)科學(xué)等多種學(xué)科,用于模擬、延伸和擴(kuò)展人類智能,以代替人類實(shí)現(xiàn)識(shí)別、認(rèn)知,分析和決策等多種功能。人工智能經(jīng)過(guò)推理期、知識(shí)期、機(jī)器學(xué)習(xí)期和深度學(xué)習(xí)期4個(gè)階段,以人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)、支持向量機(jī)(support vector machine,SVM)及卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)為代表。人工智能包括機(jī)器學(xué)習(xí),深度學(xué)習(xí)是機(jī)器學(xué)習(xí)方法的一個(gè)類別。機(jī)器學(xué)習(xí)由亞瑟·塞繆爾在1959年提出,用來(lái)描述人工智能的一個(gè)子領(lǐng)域[2],其包括所有允許計(jì)算機(jī)從數(shù)據(jù)中學(xué)習(xí)而不用經(jīng)過(guò)解釋性編程的方法,已經(jīng)被廣泛應(yīng)用于醫(yī)學(xué)圖像[3]。機(jī)器學(xué)習(xí)結(jié)合計(jì)算機(jī)模型和算法,模仿人體大腦中的生物神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)(ANN體系結(jié)構(gòu))[4],其具有3個(gè)不同的層:接收輸入數(shù)據(jù)的輸入層,產(chǎn)生數(shù)據(jù)處理結(jié)果的輸出層,以及提取數(shù)據(jù)模式的隱藏層。在機(jī)器學(xué)習(xí)中,深度學(xué)習(xí)提高了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)使用深度結(jié)構(gòu)時(shí)的性能,已成為最有前途的技術(shù)之一。深層ANN不同于單一隱含層,其具有大量的隱含層,這是網(wǎng)絡(luò)深度的特征[5]。在不同深度的ANN中,CNN已經(jīng)成為計(jì)算機(jī)視覺(jué)應(yīng)用中的熱門話題。在這類深層神經(jīng)網(wǎng)絡(luò)中,由于特征提取層和特征映射層的存在,多維輸入向量的圖像可直接輸入到網(wǎng)絡(luò),避免了特征提取和分類過(guò)程中復(fù)雜的數(shù)據(jù)重建這一難題,對(duì)大型圖像的處理表現(xiàn)出色。
圖像分割即根據(jù)圖像的灰度特征、紋理特征和頻域特征將圖像分成多個(gè)具有自身特性的區(qū)域,分割的準(zhǔn)確性對(duì)于醫(yī)師判斷疾病的真實(shí)狀況至關(guān)重要。近年來(lái),由于ANN存在大量的連接,使圖像中的噪聲和不均勻問(wèn)題得以解決,其在不同腫瘤圖像的分割中得到了廣泛應(yīng)用[6-10]。例如:Havaei等[11]提出了一種基于深度神經(jīng)網(wǎng)絡(luò)的腦腫瘤自動(dòng)分割方法,可以同時(shí)獲取MRI局部和全局特征,并采用兩階段訓(xùn)練解決腫瘤數(shù)據(jù)標(biāo)注不均衡這一問(wèn)題。然而,基于CNN的傳統(tǒng)分割方式需要大量的存儲(chǔ)空間且計(jì)算效率低下,因此,Shelhamer等[12]提出全卷積神經(jīng)網(wǎng)絡(luò)(fully convolutional networks,F(xiàn)CN)以改善這些問(wèn)題。尤為重要的是,F(xiàn)CN可通過(guò)實(shí)現(xiàn)圖像像素級(jí)別的分類克服一些語(yǔ)義級(jí)別中存在的圖像分割弊端。目前,F(xiàn)CN已應(yīng)用于頭頸癌[13]、肺癌[14]、結(jié)腸癌[15]等腫瘤圖像的分割,同時(shí),在FCN的基礎(chǔ)上涌現(xiàn)了大量圖像分割算法,如 U-Net、SegNet和 RefineNet等。Meng 等[16]提出了一種新的光噪聲抑制網(wǎng)絡(luò),無(wú)需預(yù)處理即可實(shí)現(xiàn)端到端的學(xué)習(xí)和后處理,克服了腫瘤圖像分割被解析成幾個(gè)階段的缺點(diǎn)。目前存在大量的圖像分割算法,但均未應(yīng)用于腫瘤圖像的分割,有待進(jìn)一步的嘗試與研究。
圖像特征提取源于計(jì)算機(jī)視覺(jué),指從圖像中挑選出可以最有效表達(dá)圖像內(nèi)容的低維矢量的過(guò)程,如對(duì)形狀特征、灰度直方圖、紋理結(jié)構(gòu)特征和空間關(guān)系等特征的提取,從而降低特征空間維數(shù),是醫(yī)師做出診斷的基礎(chǔ)。傳統(tǒng)的圖像提取方式為人工特征設(shè)計(jì)提取,由于不同醫(yī)學(xué)成像設(shè)備所得的圖像具有多形態(tài)、模糊性和異質(zhì)性等特征,單純依靠醫(yī)師的專業(yè)經(jīng)驗(yàn),缺乏統(tǒng)一的標(biāo)準(zhǔn),客觀性較差。基于深度學(xué)習(xí)的自動(dòng)特征學(xué)習(xí)是指運(yùn)用不同算法使計(jì)算機(jī)自動(dòng)學(xué)習(xí)圖像的特征,并對(duì)低層特征進(jìn)行組合,從而形成更加抽象的高層特征以實(shí)現(xiàn)更加全面地表達(dá)圖片特征的目標(biāo)。Wang等[17]提出了一種級(jí)聯(lián)的有絲分裂檢測(cè)方法用于乳腺癌的診斷,其結(jié)合了CNN模型和手工設(shè)計(jì)的特征(形態(tài)、顏色和紋理特征),與原有的單純手工特征設(shè)計(jì)提取相比,此方法準(zhǔn)確快速,并且需要更少的計(jì)算資源。深度學(xué)習(xí)可以使計(jì)算機(jī)直接從大量數(shù)據(jù)中學(xué)習(xí)特征表達(dá),通過(guò)一定的預(yù)處理和后期處理方法,準(zhǔn)確高效地檢測(cè)細(xì)胞。Ciresan 等[18]利用CNNs模型,使計(jì)算機(jī)自動(dòng)學(xué)習(xí)乳腺疾病的病理特征,首次證明即使沒(méi)有人工手動(dòng)設(shè)計(jì)特征,神經(jīng)網(wǎng)絡(luò)也能自動(dòng)全面地學(xué)習(xí),為病理圖片分析帶來(lái)了新的突破。此后,許多研究進(jìn)行了類似的嘗試,Xu等[19]研究了基于深度學(xué)習(xí)的自動(dòng)特征提取方法,并證明自動(dòng)特征學(xué)習(xí)優(yōu)于人工特征提取設(shè)計(jì)。
與圖像特征提取類似,圖像特征選擇也是降低特征空間維數(shù)的基本方法之一,其能夠從給定的特征中選出有效識(shí)別目標(biāo)的最小特征子集。距離相關(guān)算法、套索算法(least absolute shrinkage and selection operator,LASSO)和梯度提升決策樹(shù)算法等常單獨(dú)或聯(lián)合用于腫瘤圖像的特征選擇。Zhang等[20]利用LASSO算法進(jìn)行特征選擇,以非侵入性的方式實(shí)現(xiàn)了精原細(xì)胞瘤和非精原細(xì)胞瘤的鑒別診斷。Chen等[21]在紋理提取的基礎(chǔ)上,聯(lián)合使用距離相關(guān)算法、LASSO算法及梯度提升決策樹(shù)算法進(jìn)行特征選擇,并以線性判別分析和SVM算法建立模型,用于輔助術(shù)前腦膜瘤分級(jí)。
利用人工智能使計(jì)算機(jī)自主學(xué)習(xí)組織層面上的特征,可實(shí)現(xiàn)癌癥分期及術(shù)前診斷?,F(xiàn)有的癌癥分期方式存在由于人眼所存在的固有視覺(jué)差異而導(dǎo)致分期結(jié)果不一致的弊端,人工智能的出現(xiàn)能有效地克服這一弊端。目前,人工智能已在腦腫瘤、骨肉瘤及乳腺癌等多種腫瘤圖像中展開(kāi)了實(shí)踐,其中研究較多的為腦腫瘤圖像。Pan等[22]利用深度學(xué)習(xí)的自動(dòng)學(xué)習(xí)能力,首次將腦腫瘤MRI圖像直接輸入計(jì)算機(jī),并在多期MRI之間聯(lián)合操作,克服了其他分類方法需要額外設(shè)計(jì)和選擇特征集的缺點(diǎn),并且具有更好的分類性能。此外,這種方法實(shí)現(xiàn)了不同層次訓(xùn)練的內(nèi)核可視化,呈現(xiàn)了CNN獲得的一些自學(xué)習(xí)特征,打開(kāi)了算法“黑匣子”。Tian等[23]以MRI最優(yōu)紋理特征建立了SVM分類器,對(duì)膠質(zhì)瘤進(jìn)行分類與分級(jí),證明紋理特征對(duì)于非侵入性分級(jí)膠質(zhì)瘤的分類與分級(jí)比直方圖參數(shù)更有效,有助于不同等級(jí)的膠質(zhì)瘤患者的臨床決策。最近,Kutlu和Avci[24]利用CNN的特征提取能力、離散小波變換(discrete wavelet transform,DWT)的信號(hào)處理能力和長(zhǎng)短時(shí)記憶(long short-term memory networks,LSTM)的信號(hào)分類能力,提出了一種對(duì)腦腫瘤MRI圖像進(jìn)行分類的方法——CNN-DWTLSTM。與傳統(tǒng)的k近鄰算法以及SVM等分類算法相比,CNN-DWT-LSTM顯示了更強(qiáng)的分類能力,其對(duì)腦腫瘤進(jìn)行分類的準(zhǔn)確率可達(dá)98.6%。此外,人工智能也常用于術(shù)前輔助診斷,Huang等[25]從結(jié)直腸癌門靜脈期CT中提取放射影像學(xué)特征,利用LASSO算法實(shí)現(xiàn)數(shù)據(jù)降維、特征選擇和放射學(xué)特征構(gòu)建,并采用多變量 logistic回歸分析構(gòu)建預(yù)測(cè)模型,可減少結(jié)直腸癌術(shù)前對(duì)淋巴結(jié)的盲目清掃。
人工智能可對(duì)腫瘤患者新輔助放化療的效果進(jìn)行評(píng)估,以減少不必要的損害。Nie等[26]選取48例接受新輔助化放療的患者,利用其T1/T2成像、彌散加權(quán)MRI和動(dòng)態(tài)增強(qiáng)MRI檢查數(shù)據(jù),提取了103個(gè)影像特征,并采用單因素分析法評(píng)價(jià)各單項(xiàng)指標(biāo)預(yù)測(cè)病理完全反應(yīng)或良好反應(yīng)的能力。利用ANN方法建立模型,選擇最佳的預(yù)測(cè)集對(duì)不同的響應(yīng)組進(jìn)行分類,并利用受試者工作特征曲線計(jì)算預(yù)測(cè)性能,建立了比傳統(tǒng)成像指標(biāo)具有更高預(yù)測(cè)值的模型,實(shí)現(xiàn)了直腸癌新輔助放化療效果的定量化精準(zhǔn)評(píng)估。
人工智能還可用于預(yù)后的監(jiān)測(cè),并且已在多種腫瘤中實(shí)現(xiàn)臨床應(yīng)用。Song等[27]對(duì)非小細(xì)胞肺癌治療前圖像的強(qiáng)度、形狀和紋理特征進(jìn)行特征提取,并利用LASSO-Cox構(gòu)建反映靶向治療無(wú)進(jìn)展生存期的預(yù)測(cè)模型,實(shí)現(xiàn)對(duì)表皮生長(zhǎng)因子受體突變的晚期肺癌患者靶向治療無(wú)進(jìn)展生存期的個(gè)性化精準(zhǔn)預(yù)測(cè)。此外,Huang等[25]從結(jié)腸癌患者門靜脈期CT圖像中提取放射影像學(xué)特征,采用LASSO回歸模型進(jìn)行數(shù)據(jù)降維、特征選擇和放射影像學(xué)特征構(gòu)建。利用多變量logistic回歸分析建立預(yù)測(cè)模型,繪制K-M生存曲線,用于監(jiān)測(cè)結(jié)腸癌術(shù)后局部復(fù)發(fā)及遠(yuǎn)處轉(zhuǎn)移。Xu等[28]通過(guò)Cox比例風(fēng)險(xiǎn)模型結(jié)合正向特征選擇,提取鼻咽癌患者亞區(qū)放射組學(xué)特征,構(gòu)建預(yù)測(cè)預(yù)后的影像生物標(biāo)志物,結(jié)果表明分區(qū)域PET/CT影像學(xué)分析有助于預(yù)測(cè)鼻咽癌患者的無(wú)進(jìn)展生存期,同時(shí)也為傳統(tǒng)的預(yù)測(cè)因素提供了補(bǔ)充信息。
綜上所述,人工智能通過(guò)對(duì)大量數(shù)據(jù)集進(jìn)行訓(xùn)練學(xué)習(xí),能發(fā)現(xiàn)人眼無(wú)法分辨的細(xì)節(jié)和主觀因素難以總結(jié)的普適規(guī)律,減少醫(yī)師因主觀因素所致的診療誤差,使腫瘤診斷由人的主觀判斷轉(zhuǎn)為客觀判斷。此外,人工智能還可以以非侵入方式將病理信息融入人體的結(jié)構(gòu)和功能顯像中,進(jìn)一步提高腫瘤診斷的靈敏度及特異度。目前,一些癌癥中心已經(jīng)開(kāi)始使用它們協(xié)助工作,但人工智能仍存在算法缺陷、算法黑匣子和隱私安全等諸多問(wèn)題。隨著算法的優(yōu)化和硬件設(shè)備的革新,人工智能必將帶領(lǐng)我們進(jìn)入一個(gè)腫瘤學(xué)的新時(shí)代。
利益沖突本研究由署名作者按以下貢獻(xiàn)聲明獨(dú)立開(kāi)展,不涉及任何利益沖突。
作者貢獻(xiàn)聲明張佳佳負(fù)責(zé)論文的撰寫;樊鑫、秦珊珊負(fù)責(zé)論文的修改;余飛負(fù)責(zé)命題的提出及論文的審閱。
國(guó)際放射醫(yī)學(xué)核醫(yī)學(xué)雜志2020年1期