高 晨,王世威,許茂盛
(1.浙江中醫(yī)藥大學第一臨床醫(yī)學院,浙江 杭州 310053;2.浙江中醫(yī)藥大學附屬第一醫(yī)院,浙江 杭州 310006)
肺癌是最常見的惡性腫瘤之一,據美國癌癥學會2020 年1 月公布的數(shù)據,肺癌發(fā)病率和死亡率均居惡性腫瘤首位[1],早期診斷與治療可有效提高患者生存率[2]。CT 是肺癌篩查和臨床診斷最常用的檢查方法,在肺癌早期檢出和隨訪治療中有非常重要的作用。隨著低劑量CT 肺篩查技術日益普及,檢出的肺結節(jié)越來越多[3],放射科醫(yī)師面臨工作量增加、人力補充不足、診斷要求提高等多方面挑戰(zhàn)。近年來,隨著計算機技術的發(fā)展與進步,人工智能技術引起了廣泛關注。運用人工智能技術幫助放射科醫(yī)師解決上述挑戰(zhàn)已成為趨勢。本文就人工智能技術簡介和肺癌影像的人工智能研究應用等綜述如下。
人工智能亦稱機器智能,指由人類制造的機器所表現(xiàn)出來的智能,通常指通過普通計算機程序手段實現(xiàn)的人類智能技術[4],以人工神經網絡、支持向量機及卷積神經網絡等為代表。人工智能是當前興起的革命性新技術,結合醫(yī)學影像,通過大樣本病例的回顧性機器學習訓練,從而達到診斷和預測疾病的目的[5]。人工智能在臨床實踐領域是對各種醫(yī)學圖像的診斷和預測分析,包括視網膜和皮膚病變的照片、病理顯微圖像和放射圖像等[6-9],可提高診斷速度、準確率和報告質量等方面的影像醫(yī)學綜合效能[9]。人工智能包括機器學習,深度學習作為機器學習中的先進技術,是當前肺癌影像研究最常用的方法(圖1)。深度學習由多個工作層組成,如視覺皮層,工作流程從初始層到最高層[10]。而人工智能運用的深度學習技術可使模型性能不斷提升,以更好匹配實際需要,目前在研究中得到了廣泛應用。
圖1 人工智能與機器學習、深度學習之間的范疇關系簡圖
影像組學主要通過高通量提取醫(yī)學圖像的特征,采用經過處理的特征建立模型來診斷和預測臨床疾?。?1-12],其流程主要包括圖像獲取、病灶勾畫、特征提取、特征選擇及機器建模(圖2)。深度學習模型是一個不斷學習提高的人工智能方法,與之相比,影像組學模型一經建立,參數(shù)不會自動修改,不具有自主學習能力。因此,影像組學不是單純的人工智能方法,而是綜合運用人工智能的部分技術與統(tǒng)計學分析,其對研究對象的樣本量要求不如機器學習和深度學習高。從近期文獻[13-16]報道看,其在影像醫(yī)學與核醫(yī)學中的研究應用較廣泛。
肺癌因其高發(fā)病率和死亡率一直是基礎和臨床研究的熱點。近年來,人工智能技術發(fā)展迅速,其對肺癌研究的內容十分廣泛,包括病因分析、各種診斷(如活檢優(yōu)選、組織病理學、基因分類等)、預后評估及治療方案優(yōu)選等[17-32],主要集中在肺部病灶的檢測(圖3)、診斷和預測,相關文獻報道見表1。
2.1 檢測 運用人工智能技術可提高肺癌的檢測效率,加強肺結節(jié)患者的管理[17-18]。SIM 等[18]的多中心研究表明,結合深度卷積神經網絡,放射科醫(yī)師對胸部X 線圖像的閱片敏感度從65.1%提高至70.3%,每張圖像假陽性從0.20 降至0.18。LIU 等[19]的研究采用卷積神經網絡建立深度學習模型,對12 754 例的CT 掃描圖像行全自動檢測,不論是不同大小及部位的實性結節(jié),還是亞實性結節(jié),全自動檢測模型的檢出敏感度均高于2 位放射科醫(yī)師,模型總陽性率為70.1%,高于2 位放射科醫(yī)師(39.4%和56.6%),但模型存在較高的假陽性(48.4%)。HAWKINS 等[20]的研究探討基線低劑量CT 圖像的影像組學分析檢出和預測肺結節(jié)后續(xù)癌變的能力,研究利用美國國家肺癌篩查試驗的數(shù)據檢出肺結節(jié),并通過隨機森林分類器獲取23 個穩(wěn)定的特征,建立的預測1 年和2年癌變的肺結節(jié)模型,準確率分別為80%和79%(AUC 分別為0.83 和0.75)。
圖2 影像組學工作流程
表1 肺癌影像人工智能研究報告摘錄
圖3 人工智能肺結節(jié)檢測工作流程
2.2 診斷 傳統(tǒng)影像學特征在鑒別肺癌的病理類型和基因突變方面雖有進展,但仍存在較大挑戰(zhàn)[21-22]。而借助影像組學和深度學習等人工智能方法,可提取肉眼無法辨識的圖像信息特征,在鑒別肺癌病理類型和基因突變方面具有較好的表現(xiàn)[23-24]。
WANG 等[21]回顧性分析了影像組學技術鑒別肺結節(jié)良惡性的預測能力,該研究在國際開放性數(shù)據庫——肺部影像數(shù)據庫聯(lián)盟與圖像數(shù)據資源計劃中獲取593 例肺部腫瘤患者的CT 圖像,定量分析提取150 個影像組學特征,經過數(shù)據處理并用支持向量機建模,最后得出實驗組和驗證組敏感度、特異度、準確率分別為82.5%、89.5%、86.0%和74.6%、78.9%、76.1%。CHAE 等[25]利用影像組學特征回顧性分析58例浸潤性肺腺癌(含微浸潤性腺癌7 例)和28 例浸潤前病變(不典型腺瘤樣增生4 例、原位腺癌24例),通過平均CT 值、CT 值標準差、質量、峰度和熵值建立的人工神經網絡模型,鑒別浸潤性與浸潤前病變的AUC 達0.981。GAO 等[26]的研究顯示,CT 平掃薄層圖像的影像組學紋理特征識別表現(xiàn)為磨玻璃結節(jié)樣浸潤性肺腺癌的AUC 為0.890,與增強掃描(AUC 為0.868)均有較高的價值,且兩者差異無統(tǒng)計學意義(P=0.1 897)。ROIS 等[27]利用影像組學技術鑒別生長因子受體(epidermal growth factor receptor,EGFR)陽性和陰性的病例,將影像組學特征(AUC為0.69)與EGFR 相關的臨床特征(AUC 為0.70)結合后,聯(lián)合模型AUC 達0.75,且利用影像組學技術可鑒別EGFR 陽性和KRAS 陽性的腫瘤患者(AUC為0.80)。
2.3 預測 人工智能技術不僅在肺癌的檢出和診斷中有較多的研究和應用,在預測肺癌患者預后生存期、放療及免疫治療反應等方面也有較大進展[28-29]。SONG 等[30]回顧性分析非小細胞肺癌(non small cell lung cancer,NSCLC)Ⅳ期患者EGFR 突變的肺癌CT影像組學特征(1 032 個),并建模預測該類患者接受EGFR-TKI 治療的無進展生存期,結果表明,與臨床病理特征模型相比,聯(lián)合影像組學的綜合模型可顯著提高臨床收益(P<0.000 1)。
HUANG 等[31]運用影像組學特征回顧性分析282例早期(ⅠA~ⅡB)NSCLC 患者的無病生存期(disease free survival,DFS),揭示影像組學特征與DFS 顯著相關,是獨立于臨床病理風險因素的重要預測指標,而列線圖預測DFS 的C 指數(shù)為0.72(95%CI 0.71~0.73),高于臨床病理風險因素C 指數(shù)0.69(95%CI 0.68~0.70)(P<0.000 1)。PYKA 等[32]回顧性分析45例NSCLC 患者立體定向放療資料,從中提取PET/CT圖像數(shù)據,研究立體定向放療與局部復發(fā)及生存期的相關性,結果顯示熵值和相關性在NSCLC 患者T1期(腫瘤直徑≤3 cm)和T2期(腫瘤直徑>3 cm)兩亞組中均與腫瘤局部復發(fā)有關系,AUC 分別為0.801和0.776,且在多元回歸分析中,熵值被認為是疾病相關存活率的獨立預測因素(HR=7.48,P=0.016)。
肺癌影像人工智能研究雖取得了一定成果,但其仍處在發(fā)展的初級階段。因此,需認識其研究應用的局限性和面臨的挑戰(zhàn):①樣本量問題[33-35],大部分研究基于單中心且例數(shù)較少,可能會導致研究結果偏倚。病例相對缺乏也導致大部分研究采用影像組學方法,而無法采用更智能化的深度學習或機器學習方法。因此,有必要建立多中心大樣本的數(shù)據庫,在此基礎上進行相關人工智能的肺癌研究,可獲得更客觀、科學的研究結果。②勾畫或標記問題[36],由于技術原因,很多情況下肺癌病灶無法實現(xiàn)自動勾畫或標記,而人工手動勾畫、半自動勾畫或標記會導致可重復性問題。由于目前尚無大樣本支持深度學習訓練自動勾畫或標記模型,自動勾畫或標記軟件尚未得到廣泛應用。隨著計算機技術的發(fā)展及多中心大樣本數(shù)據庫的建成,自動勾畫或標記技術將得到廣泛驗證。③模型的標準化與規(guī)范化問題,因處于發(fā)展初級階段,各種模型、軟件各具特色和專用性,缺乏標準,較難規(guī)范、統(tǒng)一,這將導致研究結果的可重復性和可比性問題。因此,需相關研究團隊盡早合作建立起統(tǒng)一標準的特征計算技術和方法,有利于影像組學特征的研究和深度學習、機器學習等的高質量模型構建,以便進一步實現(xiàn)目標疾病的高效、精準診斷和預測。
目前常用的肺癌影像人工智能研究方法是在機器學習技術上發(fā)展起來的深度學習,以及與之相關的影像組學方法。人工智能在腫瘤檢出、高效診斷和療效預測等方面均有較高價值,但其尚處于發(fā)展初期,存在樣本量不大、病灶勾畫與標記以手動或半自動為主,以及特征或模型計算方法缺乏標準和規(guī)范等局限,在肺癌影像中的研究有待進一步深入。