閻慶虎,崔 嘉,王春雷,于德新
(1.山東大學(xué)臨床醫(yī)學(xué)院,山東 濟南 250012;2.山東省胸科醫(yī)院影像科,山東 濟南 250013;3.山東省濰坊市人民醫(yī)院急診科,山東 濰坊 261000;4.山東大學(xué)齊魯醫(yī)院放射科,山東 濟南 250012)
近年來,以深度學(xué)習(xí)為核心的人工智能技術(shù)取得了一系列重大突破,被廣泛應(yīng)用到各個領(lǐng)域,包括制造業(yè)、服務(wù)業(yè)等,如人臉識別及語音識別技術(shù)均采用人工智能技術(shù)。人工智能技術(shù)也逐步應(yīng)用到醫(yī)療領(lǐng)域中,包括醫(yī)學(xué)影像學(xué)(如CT),主要體現(xiàn)在使用以深度學(xué)習(xí)為代表的方法對影像大數(shù)據(jù)進行挖掘、搜索和提取相關(guān)信息,而影像組學(xué)則是此類工作模式的代表[1]?,F(xiàn)就人工智能的產(chǎn)生、發(fā)展及在肺部疾病診斷中的應(yīng)用現(xiàn)狀及前景等進行綜述。
從1956 年達特茅斯會議首次定義“人工智能”開始[2],人工智能研究經(jīng)歷了多次高潮和低谷。目前人工智能的研究熱潮主要源于結(jié)構(gòu)模擬方法方面的突破,由于解決了深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練問題,加上大數(shù)據(jù)高性能計算平臺(云計算、GPU 等)的支持,使人工智能的研究和應(yīng)用變成現(xiàn)實。
深度學(xué)習(xí)在實際應(yīng)用中的成功案例首推圖像識別,目前基于深度學(xué)習(xí)的圖像識別功能已超越了人類[3]。醫(yī)學(xué)影像的本質(zhì)主要是圖像識別,人工智能醫(yī)學(xué)影像的概念于20 世紀(jì)60 年代被提出[4],但直到今天以深度學(xué)習(xí)為代表的新一代人工智能結(jié)合的醫(yī)學(xué)影像的產(chǎn)生,才將其應(yīng)用于臨床實踐中。不同疾病有不同的影像表現(xiàn)特征,人工智能依靠醫(yī)學(xué)圖像識別技術(shù)辨別疾病的影像特征,挖掘人眼不能識別的信息,并進行提取,建立診斷和鑒別診斷模型,從而產(chǎn)生了影像組學(xué)。
影像組學(xué)是應(yīng)用高通量計算從體層圖像(MRI、CT、PET)中快速提取大量的量化影像特征,并轉(zhuǎn)換為可發(fā)掘的高保真數(shù)字化數(shù)據(jù)[5],通過影像的量化分析可解析影像所包含的各種病理生理學(xué)進程及其相互關(guān)系。目前,影像組學(xué)在醫(yī)學(xué)領(lǐng)域中實踐性應(yīng)用較多,包括乳腺癌的檢測、皮膚癌圖像的分析[6]、糖尿病視網(wǎng)膜病變檢測[7]、放療靶區(qū)勾畫及臟器三維重建等。人工智能技術(shù)在肺部疾病影像診斷中也有巨大的潛力和價值。
近幾年,肺部疾病的人工智能研究快速發(fā)展起來,較成熟的應(yīng)用是通過胸部X 線片診斷肺部疾病及早期肺癌的CT 篩查。其他肺部疾病的CT 診斷相關(guān)研究相對較少,且樣本量不大,結(jié)果的可靠性需進一步驗證。
2.1 人工智能在胸部X 線片中的應(yīng)用 目前,人工智能主要用于胸部X 線圖像的分割和骨骼抑制。對于復(fù)雜的胸部X 線圖像,研究人員需很長時間才能找到一組有助于提高計算機輔助診斷(computer-aided diagnosis,CAD)性能的功能。近年來,由于深度學(xué)習(xí)在不同圖像識別任務(wù)(如圖像分類和語義分割)中得到廣泛應(yīng)用,且深度學(xué)習(xí)技術(shù)和大型數(shù)據(jù)庫建設(shè)的快速進展,使其診斷水平已超越普通工作人員。
人工智能的價值在于幫助早期識別肺部病變,分析多重呼吸道感染的影像學(xué)特征,通過CAD 設(shè)計定義和測量疾病特征,并提出治療策略。如肺結(jié)核是全球第九大死因,是單一傳染源的主要死因(高于艾滋?。?,其影像特點復(fù)雜多變,一些研究根據(jù)病變的形狀、質(zhì)地和局部特征檢測肺結(jié)核。為了模擬放射科醫(yī)師對肺部疾病影像紋理特征的視覺診斷,有研究[8]使用紋理特征作為描述符,將圖像分類為結(jié)核和非結(jié)核,結(jié)果表明,利用圖像直方圖中的統(tǒng)計特征可檢出肺結(jié)核。另有研究[9]提出了一種基于分段肺區(qū)域紋理特征的肺結(jié)核指數(shù),并利用決策樹對正常和異常的胸部X 線片進行分類,準(zhǔn)確率達94.9%。最近,深度學(xué)習(xí)在結(jié)核病分類中的作用被證實是有效的。HWANG 等[10]提出了第一個基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)的結(jié)核病自動檢測系統(tǒng),采用一種轉(zhuǎn)移學(xué)習(xí)策略提高系統(tǒng)的性能,克服了神經(jīng)網(wǎng)絡(luò)訓(xùn)練困難的問題。LAKHANI 等[11]采用深度卷積神經(jīng)網(wǎng)絡(luò)的方法進一步提高了診斷準(zhǔn)確度(AUC 0.99)。在間質(zhì)性肺病檢測方面,早期文獻[12-15]使用CAD 系統(tǒng)通過紋理分析檢測胸部X 線片中的間質(zhì)性肺病。Kun Rossman 實驗室的CAD 系統(tǒng)將肺部劃分為多個ROI,并分析肺部的ROI 以確定是否異常[16]。隨著深度學(xué)習(xí)在肺部疾病檢測中的應(yīng)用,因沒有大型胸部X 線數(shù)據(jù)集,目前尚無X 線數(shù)據(jù)集檢測間質(zhì)性肺病的相關(guān)文獻,大多數(shù)文獻使用CT 數(shù)據(jù)集檢測間質(zhì)性肺病。除肺結(jié)節(jié)、肺結(jié)核和間質(zhì)性肺病外,深度學(xué)習(xí)通過胸部X 線片還可監(jiān)測到其他疾病,如心臟肥大、肺炎、肺水腫、肺氣腫等,但相關(guān)研究較少。如檢測心臟肥大常需分析心臟大小,并計算心胸比(cardiothoracic ratio,ctr)。CANDEMIR 等[17]以1d-ctr、2d-ctr 為特征,采用支持向量機對250 幅心臟擴張圖像和250 幅正常圖像進行分類,準(zhǔn)確率76.5%。而ISLAM 等[18]使用多個CNN 檢測心臟肥大,在560 個圖像樣本上對流量工程網(wǎng)絡(luò)進行了精確調(diào)整,并對100 個圖像進行驗證,得到了最大精度為93%。肺炎和肺水腫可通過提取紋理特征來分類,如PARVEEN 等[19]使用模糊C 均 值(fuzzy C-means,F(xiàn)CM)聚類算法檢測肺炎,流量工程網(wǎng)絡(luò)結(jié)果顯示胸部肺部呈黑色或深灰色,而肺炎因水腫和滲出導(dǎo)致病變區(qū)域密度增加,此方法有助于簡便準(zhǔn)確地判斷感染程度。KUMAR 等[20]使用機器學(xué)習(xí)算法對胸部X 線片進行紋理分析,利用函數(shù)濾波器和支持向量機(support vector machine,SVM)區(qū)分X 線胸片中正常結(jié)構(gòu)與肺水腫,獲得了0.96 的AUC,但并未驗證其他肺部疾病的診斷準(zhǔn)確性。ISLAM 等[18]使用CNN 檢測和定位肺水腫,效果較好。
2.2 人工智能在肺結(jié)節(jié)和肺癌CT 篩查及診斷中的價值 近年來,肺癌發(fā)病率逐漸上升,已成為世界范圍內(nèi)致死率最高的癌癥之一。CT 對肺部疾病的診斷具有較高的敏感性,圖像處理、模式識別等技術(shù)與CT 的深度融合,促進了影像組學(xué)的迅速發(fā)展。CT 容積掃描覆蓋全肺且無間隔,大量薄層圖像為獲取全部的特征提供了基礎(chǔ),也顯著提高了小結(jié)節(jié)的檢出率。
肺結(jié)節(jié)篩查的主要步驟是使用圖像分割算法對肺部掃描序列進行處理,生成肺部區(qū)域圖,然后根據(jù)肺部區(qū)域圖生成肺部圖像。利用肺部分割生成的肺部區(qū)域圖像和結(jié)節(jié)標(biāo)準(zhǔn)信息生成結(jié)節(jié)區(qū)域圖像,對基于CNN 的肺結(jié)節(jié)分割器進行訓(xùn)練,然后對圖像進行肺結(jié)節(jié)分割,得到疑似肺結(jié)節(jié)區(qū)域。找到疑似肺結(jié)節(jié)后,使用3D CNN 對肺結(jié)節(jié)進行分類,得到真正肺結(jié)節(jié)的位置和置信度。
肺結(jié)節(jié)檢測系統(tǒng)主要流程:①讀入CT 源圖像;②圖像預(yù)處理;③肺實質(zhì)分割;④ROI 分割;⑤ROI特征提??;⑥機器學(xué)習(xí);⑦模型訓(xùn)練;⑧分類器;⑨診斷結(jié)果等。其中基于圖像處理的肺結(jié)節(jié)實質(zhì)ROI 自動分割過程最重要,主要步驟:①通過最佳閾值分割算法分割;②中心連通區(qū)域分割;③背景濾噪;④軀干模板與OTSU 算法分割掩膜;⑤初步肺部區(qū)域分割;⑥肺實質(zhì)背景輪廓;⑦肺部實質(zhì)分割;⑧提取ROI。在獲取單幅肺實質(zhì)數(shù)據(jù)后,可發(fā)現(xiàn)大部分區(qū)域灰度值較低,而其他高灰度區(qū)域可能同時包含結(jié)節(jié)、血管、臟器邊緣等。因此,在ROI 提取時,應(yīng)盡可能將ROI 全面分割,計算實質(zhì)區(qū)域的局部最后閾值,從而得到二值圖像。之后對每個ROI 進行特征提取,從而進行模型訓(xùn)練,最后得出診斷結(jié)果。
人工智能提取出的影像組學(xué)特征對預(yù)測肺癌的組織學(xué)分型、基因表達和預(yù)后評價均有很高價值。在鑒別肺原位癌和浸潤性肺腺癌中,LEE 等[21]證明,紋理分析結(jié)合臨床和CT 特征,相比僅依靠臨床和CT 特征,區(qū)分能力顯著提高,AUC 從79.0%升至92.9%。另一項86 例實性與磨玻璃結(jié)節(jié)的研究[22]成功鑒別了非浸潤肺腺癌和浸潤性肺腺癌。WU 等[23]利用440 個影像組學(xué)特征對350 例肺腫瘤患者的CT 圖像進行預(yù)處理,觀察到53 個影像組學(xué)特征明顯與腫瘤組織學(xué)有關(guān),結(jié)合使用基于小波特征分析的腫瘤組織學(xué)亞型,可進行預(yù)測(AUC 為72%)。MALDONADO 等[24]研究出一種聚類分析軟件(金絲雀),利用無創(chuàng)的肺腺癌影像組學(xué)特征推測病理表征,發(fā)現(xiàn)肺結(jié)節(jié)有基因組異質(zhì)性,表現(xiàn)為結(jié)節(jié)物質(zhì)內(nèi)的細微差別,肉眼不易察覺,然而這種異質(zhì)性可利用影像組學(xué)提取的特征對其CT 圖像進行統(tǒng)計評估,提煉出相關(guān)特征建立數(shù)據(jù)模型,從而對肺腺癌進行診斷、預(yù)測。LIU 等[25]回顧性分析299 例外周肺腺癌,基于CT 的影像組學(xué)特征評估預(yù)測表皮生長因子受體(EGFR)突變情況;統(tǒng)計出11 個影像組學(xué)特征在EGFR 突變?nèi)汉蛷V泛基因群之間有顯著差異;發(fā)現(xiàn)5 個影像組學(xué)特征可預(yù)測突變的EGFR(AUC 為0.647);當(dāng)影像組學(xué)特征與臨床特征結(jié)合,其預(yù)測能力AUC 從0.667 提升至0.709(P>0.000 1)。有研究[26-27]分別對接受手術(shù)、放療或靶向治療的非小細胞肺癌患者建立了預(yù)測模型,每個模型都用來預(yù)測治療后反應(yīng)和存活率。COROLLER等[28]研究表明,影像組學(xué)數(shù)據(jù)可預(yù)測晚期非小細胞肺癌患者治療后的病理反應(yīng);從肺癌CT 圖像中提取的影像組學(xué)特征可區(qū)分腫瘤治療后是放射性纖維化還是局部復(fù)發(fā),從而評估發(fā)生遠處轉(zhuǎn)移的風(fēng)險。
肺部疾病復(fù)雜多樣,但人工智能具有圖像識別的優(yōu)勢,基于人工智能的各種準(zhǔn)確模型和訓(xùn)練將顯著提高其獲取和凝練信息的能力,可明顯提升肺部疾病的診斷準(zhǔn)確性。其發(fā)展前景:①顯著提升醫(yī)師的工作效率和診斷水平,促進臨床治療的發(fā)展;②從海量數(shù)據(jù)中提取信息,發(fā)現(xiàn)更多的規(guī)律;③打破醫(yī)師的經(jīng)驗壁壘,促進低級別醫(yī)師水平的提高;④在肺部其他疾病的診斷及鑒別等方面將獲得突破;⑤有助于影像組學(xué)的發(fā)展和進步。
人工智能在肺部疾病的影像診斷中雖具有良好的前景和發(fā)展?jié)摿Γ裁媾R一些問題:①各醫(yī)院的掃描參數(shù)不同,導(dǎo)致影像數(shù)據(jù)存在差異;②特征值的提取及模型的建立存在區(qū)域化,數(shù)據(jù)量有限,有待進一步加強;③多個機構(gòu)之間嘗試不同的算法進行更新,缺乏完善的理論支持,對其結(jié)果缺乏解釋;④在復(fù)雜圖像的識別上還存在缺陷;⑤大多數(shù)研究為影像圖像處理,對于影像科醫(yī)師臨床思維的模擬研究較少;⑥對于多發(fā)、多變和多部位的炎性病變,人工智能總體分析能力有限,靶區(qū)勾畫困難。應(yīng)規(guī)范影像數(shù)據(jù),完善法律制度,保證信息安全,明確責(zé)任歸屬,提高技術(shù)水平,并逐步與病歷系統(tǒng)融合。對于多征象性疾病可勾畫分析每個征象并建立數(shù)據(jù)模型,訓(xùn)練后匯總提取出該疾病的總特征;也可收集該病足夠量的影像數(shù)據(jù),利用深度學(xué)習(xí)處理海量數(shù)據(jù),從而直接提取所有特征。
總之,影像醫(yī)學(xué)在推動醫(yī)學(xué)進入數(shù)字化時代方面發(fā)揮著積極作用。隨著人工智能技術(shù)的深入發(fā)展,人工智能在醫(yī)學(xué)影像中的價值將更突出,在肺部疾病影像診斷中的應(yīng)用也將越來越廣泛。