彭文靜,張紅梅
國家癌癥中心/國家腫瘤臨床醫(yī)學研究中心/中國醫(yī)學科學院北京協(xié)和醫(yī)學院腫瘤醫(yī)院影像診斷科,北京 100021
人工智能是指能夠模擬、延伸和擴展人類智能的一套計算機科學理論、方法、技術及應用系統(tǒng)[1],其概念于1956年被首次提出,現(xiàn)已對生產(chǎn)、生活及多個學科領域產(chǎn)生了深遠的影響。醫(yī)學影像,尤其是腫瘤影像,是人工智能在醫(yī)學領域的重要研究內(nèi)容。
機器學習是實現(xiàn)人工智能的核心方法,包括淺層學習、深度學習等多種算法。淺層學習主要學習人工選取的有限樣本的特定特征,可以解決大部分的分類、回歸問題,但效能易受樣本數(shù)據(jù)分布的影響,且對復雜問題的分析能力不足。深度學習無需人工標注,可以自主、多層學習圖像特征并進行綜合識別和推理,與淺層學習相比,可以實現(xiàn)對海量數(shù)據(jù)的深層挖掘,解決更為復雜的多分類問題。影像組學是對影像特征的定量反映[2],主要包括腫瘤的形態(tài)、大小和紋理等。通過機器學習算法挖掘組學特征的內(nèi)在含義,并尋找其與腫瘤診斷、治療間的關聯(lián),是腫瘤影像人工智能研究的重要命題。
近年來,惡性腫瘤的發(fā)病率逐年上升,同時,人們的健康意識逐步提高、多模態(tài)影像技術飛躍發(fā)展,導致醫(yī)學影像圖像數(shù)量呈指數(shù)級增長。基于深度學習的人工智能技術具有高敏感檢出、高維信息挖掘和高通量計算的能力,已在多種腫瘤的病灶檢出、病理分型、臨床分期、療效評價及生存預測等方面顯示出了巨大的潛能。本文選取了幾種具有代表性的腫瘤類型,就人工智能對該領域的研究現(xiàn)狀及進展進行綜述。
肺癌的發(fā)病率和病死率始終高居全球首位[3]。臨床對肺癌的診斷分兩個步驟:肺結節(jié)的檢出及結節(jié)良惡性的判定。
胸部低劑量計算機斷層掃描(low-dose computed tomography,LDCT)是肺結節(jié)檢出的有效手段,可以顯著降低肺癌患者的病死率[4-6],但其圖像層數(shù)多、信息量大,放射科醫(yī)師的閱片工作量和出錯率隨之增加。計算機輔助檢測(computer-aided detection,CAD)系統(tǒng)憑借人工定義的形態(tài)、密度和紋理等特征可以快速、自動地識別結節(jié),在肺小結節(jié)[7-8]及孤立性結節(jié)的檢出方面顯示出了巨大的優(yōu)勢。Zhao等[9]比較了LDCT計算機閱片與雙人閱片結果,表明CAD系統(tǒng)檢出肺結節(jié)的靈敏度為96.7%,遠高于雙人閱片的78.1%。但在識別貼血管結節(jié)、胸膜結節(jié)及磨玻璃密度結節(jié)等特殊類型結節(jié)時,CAD系統(tǒng)易受血管、部分容積效應和呼吸運動偽影的影響,結節(jié)檢出的假陽性率較高,成為肺癌CAD系統(tǒng)臨床實踐的主要挑戰(zhàn)。部分學者致力于降低肺結節(jié)檢出的假陽性率的研究,并取得了一定的進展,如Dou等[10]將可疑結節(jié)的空間特征納入深度學習模型,結果顯示,當假陽性率控制在8 FPs/scan時,CAD系統(tǒng)檢出肺結節(jié)的靈敏度高于90%。
臨床上肺結節(jié)的良惡性判斷多依賴醫(yī)師的臨床經(jīng)驗,主觀差異性大。國內(nèi)外學者在進行肺結節(jié)良惡性輔助診斷的研究中對掃描技術和算法進行了諸多探索。Suo等[11]基于動態(tài)增強CT(dynamic contrast-enhanced computed tomography,DCECT)分別提取結節(jié)邊緣和內(nèi)部的紋理特征進行良性和惡性結節(jié)的鑒別,得到曲線下面積(area under curve,AUC)為0.864。Gao等[12]將三維CT紋理特征納入分析,結果顯示,良惡性結節(jié)鑒別診斷的準確率較二維紋理特征有了進一步提高,最高達95.4%。另有部分學者嘗試采用多參數(shù)磁共振成像(MRI)[13]、正電子發(fā)射計算機斷層顯像(position emission tomography,PET)/CT[14]等圖像的組學特征進行良惡性鑒別,均得到了較好的效果。
隨著人工智能在肺癌中研究的深入,更多學者應用人工智能進行肺癌病理分型、侵襲性、淋巴結轉移及臨床分期等的探索。亟待解決的是,對肺部圖像數(shù)據(jù)庫聯(lián)盟(lung image database consortium,LIDC)等專業(yè)標注肺部圖像數(shù)據(jù)庫的完善,以減少因訓練標簽不平衡造成的結果偏倚,進一步提高泛化能力。
有效分割是人工智能輔助診斷腦膠質瘤的第一步,基于腦膠質瘤浸潤性生長的特性[15]和多種亞型的特點,手動和簡單的閾值分割效果并不理想。部分學者提出了腫瘤亞域分割的概念[16-17],將病灶分為腫瘤活躍區(qū)、壞死區(qū)和水腫區(qū)等,為腦腫瘤的更精確定位和異質性評價奠定了基礎。同時,多種新型深度學習分割算法也在腦腫瘤上不斷更新。Zhuge等[18]使用嵌套神經(jīng)網(wǎng)絡多尺度、多層次學習腫瘤的外觀表征,得到了較高的分割精度和效率。Cui等[19]開發(fā)了以腫瘤定位和內(nèi)分類網(wǎng)絡為基礎的級聯(lián)深度學習卷積神經(jīng)網(wǎng)絡(convolutional neural networks,CNN),在保證腫瘤分割效果的同時,進一步提高了分割的速度。
世界衛(wèi)生組織(WHO)將膠質瘤分為Ⅰ、Ⅱ級低級別膠質瘤(low-grade glioma,LGG)和Ⅲ、Ⅳ級高級別膠質瘤(high-grade glioma,HGG),不同的膠質瘤分級對應著不同的治療方案和預后。實施有創(chuàng)性檢查前,腦膠質瘤的分級依賴于影像學檢查,人眼對不同級別的膠質瘤鑒別能力有限,基于人工智能的腦膠質瘤輔助診斷研究成為熱點。面對較為復雜的腦膠質瘤分級,早期學者多嘗試采用不同的分類方法,多項研究顯示,支持向量機(support vector machine,SVM)在腦膠質瘤的分級診斷中具有較明顯的優(yōu)勢,這為后續(xù)的模型比較和算法優(yōu)化提供了條件[20-21]。Zhang等[22]在對25種機器學習分類方法及8種特征選擇方法進行比較研究后,同樣得出了SVM更優(yōu)的結論,該研究將術前多參數(shù)MRI直方圖和紋理特征進行進一步聯(lián)合,結果顯示,LGG與HGG兩分類的準確度達94.5%,Ⅰ~Ⅳ級四分類的準確度高達96.1%。
術后放療是腦膠質瘤手術切除后的必要補充,但不可避免的導致了周圍正常腦組織的放射性損傷,數(shù)據(jù)表明腦膠質瘤放射性損傷的比例可高達20%[23]。放射性腦損傷的常規(guī)CT及MRI圖像常表現(xiàn)為水腫、壞死,與復發(fā)性腦膠質瘤極易混淆,成為臨床診斷的難點。區(qū)分放射性腦損傷和復發(fā)性腦膠質瘤的金標準是手術病理活檢,但腦組織活檢風險大,臨床應用多受限制。腫瘤組織具有很強的異質性[24],與放射性損傷所致的炎性表現(xiàn)有所區(qū)別,可以通過紋理特征加以鑒別[25]。Tiwari等[26]采用MRI液體衰減反轉恢復(fluid attenuated inversion recovery,F(xiàn)LAIR)序列的紋理特征進行區(qū)分,準確度遠高于放射科醫(yī)師,充分表明組學特征鑒別放射性腦損傷和復發(fā)性腦膠質瘤的可行性。Lohmann等[27]采用動態(tài)增強MRI(dynamic contrast enhanced-magnetic resonance imaging,DCE-MRI)組學特征鑒別放射性腦損傷和復發(fā)性腦膠質瘤,也得到了較好的效果,診斷準確度為81%;18F-酪氨酸(18F-fluorethyl-L-tyrosin,18F-FET)PET圖像的準確度稍高,為83%,二者結合診斷準確度可進一步提高,達89%。
基于深度學習的人工智能技術在腦膠質瘤診斷中還有眾多進展。有研究利用CNN算法實現(xiàn)了組學特征對膠質瘤患者異檸檬酸脫氫1(isocitrate dehydrogenase 1,IDH1)突變、1p/19q染色體缺失狀態(tài)及O6-甲基鳥嘌呤-DNA-甲基轉移酶(O6-methylguanine-DNA methyltransferase,MGMT)啟動子甲基化狀態(tài)等的有效分類,分類準確度最高可達94%[28]。此類研究有望通過無創(chuàng)的方法顯示基因的表達情況,對敏感性靶向藥物的選擇和指導個體化治療具有特殊意義。
乳腺癌的發(fā)病率居女性惡性腫瘤首位[3]。乳腺X線攝影是乳腺癌的主要篩查手段,在臨床上使用廣泛。CAD系統(tǒng)在應用初期就對如何提高乳腺腫塊的檢出率進行了較多探索,并得到了較好的結果[29-30]。近年來,乳腺微鈣化受到了廣泛的關注。對于相當一部分無腫塊、無癥狀早期乳腺癌患者來說,X線微鈣化灶是其唯一影像學征象[31]。X線攝影對顯示鈣化灶雖有一定的優(yōu)勢,但微鈣化病灶小、特征不典型,肉眼鑒別困難,臨床上仍??陕┰\。Wang等[32]采用基于深度學習的人工智能技術對乳腺X線微鈣化灶進行評價,效果較好。這類研究對于部分早期乳腺癌患者的篩查有重要的意義。
乳腺癌的病灶表現(xiàn)復雜多樣,準確的定性多依賴于醫(yī)師的經(jīng)驗水平。Ribli等[33]通過構建一個基于快速CNN的CAD系統(tǒng)對乳腺X線圖像進行自主特征學習和分類,其鑒別乳腺良惡性病灶的準確度可達90%。Fujioka等[34]采用CNN模型結合超聲,得到超聲組學的分類準確度為92.5%,診斷價值較高。Ji等[35]基于DCE-MRI對機器學習模型進行單中心驗證,結果顯示,DCE-MRI鑒別病灶良惡性的AUC為0.89,進一步證實了人工智能診斷乳腺腫瘤的穩(wěn)定性和可靠性。
乳腺癌較高的異質性[36]導致了不同個體對治療反應的巨大差異,如何早期預判治療療效并及時施行干預措施是臨床研究的重點。一項針對晚期乳腺癌患者的研究表明,DCE-MRI紋理特征可以幫助預測乳腺癌新輔助化療的個體反應[37]。Chamming's等[38]研究發(fā)現(xiàn),T2加權成像(T2-weighted imaging,T2WI)圖像的峰度紋理值對非三陰性乳腺癌新輔助化療后病理完全緩解(pathologic complete response,pCR)有一定的預測效能。Huang等[39]探討PET/CT和MRI組學在乳腺癌表型和疾病預后中的價值,結果顯示,二者區(qū)分1年和2年無復發(fā)生存率的平均AUC值分別為0.75和0.68,與Park等[40]的研究結果一致。基于影像學特征的預測性生物學標志物的確定有助于乳腺癌個體化治療方案的完善,推動精準醫(yī)療。
復雜的背景、模糊的邊界及高度變化的形狀使肝臟的精準分割一直是一個具有挑戰(zhàn)性的工作。目前,肝臟CT圖像的自動分割取得了一定的進展[41-42]。其中,Lu等[42]采用三維CNN對肝臟CT圖像進行自主學習及分割優(yōu)化,最終實現(xiàn)了完全自動分割,基于該分割的肝臟體積評估也被證實準確有效。Vivanti等[43]采用人工智能算法同樣實現(xiàn)了腫瘤的自動檢測與分割,此外,該團隊還構建了一種肝臟腫瘤負荷量化的工具,從另一個角度實現(xiàn)了對新發(fā)小腫瘤的檢出。
肝臟腫瘤種類繁多,準確區(qū)分腫瘤組織的良惡性是診斷的首要任務。Kondo等[44]采用SVM建立超聲評價肝臟腫瘤的診斷模型,得到良性肝占位、肝癌及肝轉移瘤的診斷準確度分別為84.4%、87.7%及85.7%。肝轉移瘤是肝臟最常見的惡性腫瘤,學者多關注肝轉移瘤的原發(fā)灶研究。Ben-Cohen等[45]采用SVM對71例不同原發(fā)部位肝轉移瘤的患者進行肝臟CT平掃及增強圖像的特征提取和分類,得到一組最可能來源的原發(fā)腫瘤預測排序。經(jīng)病理證實,排序為第一位的可能原發(fā)灶,準確度為62%,排序在前三位的可能原發(fā)灶,累積準確度達99%。這項研究對指導難以明確原發(fā)灶的肝轉移瘤患者的腫瘤溯源具有重要的臨床意義。
肝癌的療效評價常遵從實體瘤療效評價標準(response evaluation criteria in solid tumors,RECIST),較多依賴腫瘤大小的縱向比較。Tuma[46]認為基于腫瘤大小的療效評估標準缺乏個體化,且評估效果滯后,在腫瘤治療反應發(fā)生之前,機體可能已經(jīng)具備反映治療療效好壞的異質性信息。Abajian等[47]在對肝癌經(jīng)導管動脈化療栓塞術(transcatheter arterial chemoembolization,TACE)治療的肝癌患者治療前與治療后1個月的MRI圖像分析后發(fā)現(xiàn),術前MRI圖像特征與較好的TACE療效密切相關,預測準確度為78%。更早的療效預測及預后評價有助于治療方案的優(yōu)化,避免不必要的藥物毒性作用及并發(fā)癥發(fā)生風險,使患者最大獲益。
人工智能在其他多種腫瘤影像領域還有眾多進展。Liu等[48]應用術前MRI組學聯(lián)合臨床特征建立局部近展期直腸癌新輔助放化療療效的預測模型,預測AUC值高達0.976。新輔助放化療后取得pCR的患者將受益于此,避免不必要的手術,進一步提高患者的生存質量。Huang等[49]建立并驗證了直腸癌淋巴結轉移的預測模型,將轉移淋巴結的檢出準確度較傳統(tǒng)閱片提高了14.8%。在腎臟和前列腺腫瘤的研究中,人工智能也顯示出了優(yōu)勢,Yan等[50]通過紋理特征構建機器學習模型鑒別血管平滑肌脂肪瘤、透明細胞癌和乳頭狀癌,得到準確度為90.7%~100%。有研究進一步對腎透明細胞癌進行分級研究,結果優(yōu)于常規(guī)CT圖像評價[51]。Xu等[52]基于T2WI及彌散加權成像(diffusionweighted imaging,DWI)雙參數(shù)圖像建立組學模型以鑒別前列腺癌與良性病灶,也得到了較理想的結果。此外,人工智能在胃癌、食管癌、膀胱癌、宮頸癌等多種腫瘤中還有諸多探索與應用,以人工智能技術為基礎的腫瘤影像研究尚需進一步深入與完善,以期更好的指導腫瘤診療實踐。
近年來,以深度學習為代表的人工智能技術已經(jīng)在多種腫瘤的病灶檢出、病理分型、臨床分期、療效評價及生存預測研究等方面顯示出了較為理想的診斷結果,但將其合理、高效地轉化為臨床應用,尚存在諸多問題,具體包括以下三個方面:①缺乏與深度學習算法相匹配的標準腫瘤影像大數(shù)據(jù)庫。目前,學者們多采用國外的有限開放數(shù)據(jù)集或單中心私人數(shù)據(jù)庫,存在數(shù)據(jù)基數(shù)小、圖像多樣性和代表性差、數(shù)據(jù)分布不平衡等弊端。機器學習算法可能使這些非標準數(shù)據(jù)集中的偏見累積和放大,影響模型的穩(wěn)定性、準確度和泛化能力。②目前的人工智能模型普遍缺乏多中心臨床試驗的驗證,同時還缺乏結合最新腫瘤診療指南、臨床場景尤其是復雜的腫瘤診療場景的實踐驗證。③相關的法律法規(guī)仍有待完善,包括人工智能影像診斷結果醫(yī)療責任問題、信息安全問題及影像科醫(yī)師人工智能應用技能的教育問題等。
綜上所述,人工智能在腫瘤影像中的研究已取得可喜的成果,其應用前景無限廣闊而又充滿挑戰(zhàn)。規(guī)范大數(shù)據(jù)標準、開展多中心研究與驗證是將人工智能由科研推向臨床的重要過程,需要醫(yī)、工交叉多學科的協(xié)作及共同努力。