王華南,崔節(jié)偉,王 娟,梁志欣
1 解放軍總醫(yī)院第一醫(yī)學(xué)中心 呼吸內(nèi)科,北京 100853 ;2 聯(lián)勤保障部隊(duì)第九九〇醫(yī)院 呼吸內(nèi)科,河南信陽(yáng) 464000
肺癌是目前全球發(fā)病率和死亡率最高的惡性腫瘤,嚴(yán)重影響人類(lèi)身心健康。2018 年全球癌癥統(tǒng)計(jì)結(jié)果顯示,肺癌患者占惡性腫瘤總?cè)藬?shù)的11.6%,死亡人數(shù)占所有惡性腫瘤致死人數(shù)的18.4%[1]。診斷惡性腫瘤的金標(biāo)準(zhǔn)是病理診斷,傳統(tǒng)病理診斷需要病理醫(yī)師在顯微鏡下逐個(gè)分析病理切片,其診斷結(jié)果具有一定的主觀(guān)性,診斷準(zhǔn)確性與病理醫(yī)師的水平直接相關(guān);同時(shí)由于環(huán)境污染、人口老齡化等多種因素的影響,腫瘤患者日益增多,病理醫(yī)師的負(fù)擔(dān)越來(lái)越重,疲勞閱片現(xiàn)象經(jīng)常發(fā)生[2-3],導(dǎo)致一定的誤診和漏診。如何及時(shí)、高效、準(zhǔn)確地診斷肺癌,是關(guān)乎肺癌患者下一步治療及預(yù)后判斷的關(guān)鍵。近年來(lái),隨著人工智能和數(shù)字病理學(xué)的發(fā)展,醫(yī)學(xué)界越來(lái)越認(rèn)識(shí)到人工智能在輔助病理診斷中具有的重大臨床及科研價(jià)值。人工智能在肺癌病理診斷中的應(yīng)用已成為當(dāng)前研究熱點(diǎn)。本文主要對(duì)人工智能在肺癌病理診斷中的應(yīng)用進(jìn)展進(jìn)行綜述。
2016 年 “ 阿 爾 法 狗 (AlphaGo)”[4]以 4 :1 擊敗職業(yè)圍棋九段選手李世石(Lee Sedol),引起人們對(duì)人工智能(artificial intelligence,AI) 的廣泛關(guān)注。人工智能是研發(fā)用于模擬人類(lèi)大腦學(xué)習(xí)并延伸人類(lèi)能力的新型智能技術(shù)。人工智能的核心是機(jī)器學(xué)習(xí),而深度學(xué)習(xí)(deep learning,DL) 是機(jī)器學(xué)習(xí)的一個(gè)分支,深度學(xué)習(xí)技術(shù)目前被認(rèn)為是用于圖像分析的最先進(jìn)技術(shù)[5]。最常用的深度學(xué)習(xí)模型是卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN),CNN 從20 世紀(jì)90 年代開(kāi)始應(yīng)用于圖像分析,是一種特別適用于解決圖像分類(lèi)問(wèn)題的監(jiān)督學(xué)習(xí)算法。
近年來(lái)興起的數(shù)字病理學(xué)(digital pathology,DP),旨在用全切片掃描儀對(duì)病理切片進(jìn)行數(shù)字化處理,以及對(duì)這些數(shù)字化的全切片圖像進(jìn)行分析,其核心技術(shù)是全切片成像(whole slide imaging,WSI) 技術(shù)。FDA 在2017 年批準(zhǔn)飛利浦全切片掃描儀進(jìn)入市場(chǎng)用于病理切片的數(shù)字化,是邁向真正數(shù)字化病理道路的一個(gè)重大轉(zhuǎn)折點(diǎn)[6]。隨著大數(shù)據(jù)技術(shù)、數(shù)字病理學(xué)的發(fā)展,以深度學(xué)習(xí)技術(shù)為代表的人工智能,已成功應(yīng)用于病理圖像識(shí)別,以輔助醫(yī)學(xué)診斷,并表現(xiàn)出巨大的發(fā)展?jié)摿ΑH斯ぶ悄芎蛿?shù)字病理學(xué)的組合[7],稱(chēng)為人工智能病理診斷系統(tǒng),國(guó)內(nèi)有人將其稱(chēng)為 “病理狗”[8],它將改變病理診斷專(zhuān)家的工作方式,使廣大患者受益,成為 “病理學(xué)的第三次革命”[9]。在某些情況下,基于深度學(xué)習(xí)的人工智能在病理學(xué)圖像的識(shí)別方面已經(jīng)超過(guò)了經(jīng)驗(yàn)豐富的病理學(xué)家。人工智能病理診斷系統(tǒng)的應(yīng)用,已經(jīng)有了許多成功的案例。如Xu 等[10]開(kāi)發(fā)了一個(gè)深層卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural network,DCNN),對(duì)乳腺癌及大腸癌組織病理學(xué)圖像中的上皮和間質(zhì)區(qū)域進(jìn)行分割和分類(lèi)。Litjens 等[11]研究了組織病理學(xué)檢查的深度學(xué)習(xí)效果,并驗(yàn)證了其在前列腺癌識(shí)別和乳腺癌轉(zhuǎn)移檢測(cè)中的出色表現(xiàn)。Ertosun 和Rubin[12]提出了一種使用深度學(xué)習(xí)的自動(dòng)分級(jí)膠質(zhì)瘤系統(tǒng)。
病理診斷分為細(xì)胞病理診斷和組織病理診斷,人工智能病理診斷系統(tǒng)在肺癌的細(xì)胞病理及組織病理診斷中均有應(yīng)用。
2.1 人工智能細(xì)胞病理診斷系統(tǒng)在肺癌診斷中的應(yīng)用 細(xì)胞病理學(xué)是研究組織碎片、細(xì)胞群團(tuán)、單個(gè)細(xì)胞的形態(tài)和結(jié)構(gòu)以及細(xì)胞間比鄰關(guān)系并探討組織來(lái)源的一門(mén)科學(xué)。在肺癌診斷中,細(xì)胞病理學(xué)取材簡(jiǎn)便、快速,可用于肺癌的篩查或普查,在痰液、支氣管刷片及沖洗液中可以查找到肺部病變的癌前病變細(xì)胞或癌細(xì)胞,為肺癌的早期診斷和早期治療提供有力的依據(jù)。目前,已有人工智能細(xì)胞病理診斷系統(tǒng)應(yīng)用于肺癌分類(lèi)診斷的研究。
Teramoto 等[13]使用DCNN 開(kāi)發(fā)了微觀(guān)圖像中的肺癌細(xì)胞病理自動(dòng)分類(lèi)模型,這是一種主要的深度學(xué)習(xí)技術(shù)。用于分類(lèi)的DCNN 由三個(gè)卷積層、三個(gè)池化層和兩個(gè)全連接層組成。在進(jìn)行的評(píng)估實(shí)驗(yàn)中,研究者使用原始數(shù)據(jù)庫(kù)和圖形處理單元對(duì)DCNN 進(jìn)行了訓(xùn)練。他們首先將顯微圖像裁剪并重新采樣,獲得分辨率為256×256 像素的圖像,為了防止過(guò)度擬合,又通過(guò)旋轉(zhuǎn)、翻轉(zhuǎn)和過(guò)濾對(duì)收集的圖像進(jìn)行增強(qiáng),并利用三重交叉驗(yàn)證評(píng)估了其分類(lèi)準(zhǔn)確性。在獲得的結(jié)果中,腺癌、鱗狀細(xì)胞癌和小細(xì)胞癌的分類(lèi)診斷準(zhǔn)確率分別為89.0%、60.0% 和70.3%,總準(zhǔn)確率為71.1%,這與病理學(xué)家的診斷準(zhǔn)確率相當(dāng)。因此,他們的方法有助于輔助細(xì)胞學(xué)檢查在肺癌診斷中的應(yīng)用。另一項(xiàng)研究,Teramoto 等[14]開(kāi)發(fā)了一種使用生成對(duì)抗網(wǎng)絡(luò)(generative adversarial networks,GAN) 自動(dòng)生成細(xì)胞學(xué)圖像的方法,目標(biāo)是通過(guò)使用實(shí)際的和合成的細(xì)胞學(xué)圖像及生成對(duì)抗網(wǎng)絡(luò)來(lái)提高DCNN 的分類(lèi)準(zhǔn)確率。該研究從原始顯微圖像中分割出補(bǔ)丁圖像,并使用GAN 及漸進(jìn)生長(zhǎng)的GANs(PGGAN)生成高分辨率圖像,研究者用這些圖像預(yù)先訓(xùn)練一個(gè)DCNN,并利用訓(xùn)練過(guò)的DCNN 對(duì)良、惡性細(xì)胞的分類(lèi)性能進(jìn)行了評(píng)估。結(jié)果顯示,他們對(duì)肺細(xì)胞的總體分類(lèi)準(zhǔn)確率為85.3%,與之前未使用GAN 生成的圖像進(jìn)行預(yù)訓(xùn)練的研究相比,準(zhǔn)確率提高了約4.3%。這些結(jié)果證實(shí)他們提出的方法在僅獲得有限數(shù)據(jù)的情況下對(duì)于細(xì)胞學(xué)圖像的分類(lèi)是有效的。張纓等[15]在肺癌早期診斷立體定位儀的基礎(chǔ)上,研制了基于圖像處理和人工神經(jīng)網(wǎng)絡(luò)的肺癌早期細(xì)胞病理電腦診斷系統(tǒng)(lung cancer diagnosing system,LCDS)。該研究選取512 例經(jīng)皮肺穿刺標(biāo)本涂片,經(jīng)LCDS 檢測(cè)判定為肺癌者389例,判定為正常細(xì)胞者36 例,判定為核異型細(xì)胞者87 例,該系統(tǒng)與病理專(zhuān)家的細(xì)胞病理診斷結(jié)果相比,470 例符合,診斷總符合率達(dá)91.8%。接受手術(shù)治療的362 例中有307 例術(shù)后病理確診為肺癌,以術(shù)后組織病理診斷為標(biāo)準(zhǔn),LCDS 對(duì)肺癌檢測(cè)診斷的敏感度為94.79%(291/307),特異性為90.91%(50/55),診斷準(zhǔn)確率達(dá)94.20%(341/362)。
以上研究表明,人工智能細(xì)胞病理診斷系統(tǒng)可以對(duì)肺癌細(xì)胞進(jìn)行分類(lèi),且其診斷準(zhǔn)確率與病理學(xué)家的診斷準(zhǔn)確率相當(dāng),這將大大節(jié)約病理學(xué)家的時(shí)間,減輕病理醫(yī)師工作負(fù)擔(dān),有效提高肺癌細(xì)胞病理學(xué)診斷效率,使病理學(xué)家集中精力研究疑難病例。
2.2 人工智能組織病理診斷系統(tǒng)在肺癌診斷中的應(yīng)用 組織病理學(xué)檢查即活體組織檢查,簡(jiǎn)稱(chēng)活檢,是指用局部切取、鉗取、穿刺、搔刮和摘取等手術(shù)方法,從活體內(nèi)獲取病理組織進(jìn)行病理檢測(cè)的診斷方法。組織病理學(xué)檢查是目前廣為采用的診斷方法,對(duì)腫瘤良、惡性的鑒別具有重要價(jià)值。腺癌和鱗狀細(xì)胞癌是肺癌最常見(jiàn)的亞型,病理學(xué)切片的目測(cè)檢查是目前病理學(xué)家評(píng)估肺部腫瘤分期和亞型的主要方法之一,人工閱片效率低,易出現(xiàn)疲勞閱片現(xiàn)象,人工智能組織病理診斷系統(tǒng)的應(yīng)用,大大提升了肺癌的診斷效率。
在肺癌組織病理診斷中,已經(jīng)證明人工智能可以對(duì)肺癌亞型準(zhǔn)確分類(lèi),并能預(yù)測(cè)非小細(xì)胞肺癌 (non-small cell lung cancer,NSCLC) 患 者 的 生存預(yù)后。Yu 等[16]使用了來(lái)自癌癥基因組圖譜(the cancer genome atlas,TCGA) 的 2 186 張肺腺癌和鱗狀細(xì)胞癌患者的組織切片的全掃描圖像和來(lái)自斯坦福組織芯片(tissue microarray,TMA) 數(shù)據(jù)庫(kù)的294 張圖像進(jìn)行驗(yàn)證。他們使用圖像分析軟件提取了9 879 個(gè)用于預(yù)測(cè)結(jié)果的形態(tài)學(xué)圖像特征,用機(jī)器學(xué)習(xí)軟件評(píng)估了這些圖像,并開(kāi)發(fā)了可以識(shí)別腫瘤細(xì)胞的分類(lèi)器,以區(qū)分腺癌和鱗狀細(xì)胞癌,并預(yù)測(cè)生存期。結(jié)果顯示,分類(lèi)器能夠有效地區(qū)分惡性腫瘤和相鄰健康組織(AUC=0.81),并且能夠區(qū)分兩種不同類(lèi)型的非小細(xì)胞肺癌(AUC >0.75)。此外,它也能準(zhǔn)確預(yù)測(cè)Ⅰ期腺癌(log-rank 檢驗(yàn)P=0.002) 和鱗狀細(xì)胞 癌 (log-rank 檢驗(yàn) P=0.023) 患者的長(zhǎng)期生存。目前,傳統(tǒng)的病理方法尚無(wú)法確定哪些Ⅰ期NSCLC 患者在手術(shù)后可能復(fù)發(fā),而人工智能機(jī)器學(xué)習(xí)模型可以成功輔助預(yù)測(cè)。Luo 等[17]基于形態(tài)學(xué)特征開(kāi)發(fā)了一個(gè)統(tǒng)計(jì)模型來(lái)預(yù)測(cè)肺癌患者的生存,他們從癌癥基因組圖譜數(shù)據(jù)集中下載523 例肺腺癌和511 例鱗狀細(xì)胞癌患者的病理圖像,提取了943 個(gè)特征,運(yùn)用此模型進(jìn)行分析。預(yù)測(cè)模型是從訓(xùn)練集開(kāi)發(fā)的,并分別在獨(dú)立的肺腺癌和鱗狀細(xì)胞癌的測(cè)試集中進(jìn)行了驗(yàn)證。結(jié)果表明,基于數(shù)字病理成像的人工智能可以預(yù)測(cè)肺癌患者的預(yù)后。Coudray 等[18]對(duì)從癌癥基因組圖譜獲得的全部切片圖像訓(xùn)練出了一個(gè)深層卷積神經(jīng)網(wǎng)絡(luò),該網(wǎng)絡(luò)可以準(zhǔn)確和自動(dòng)地將肺組織病理圖像分類(lèi)為腺癌、鱗狀細(xì)胞癌和正常肺組織,其結(jié)果與病理學(xué)家的分析結(jié)果一致,平均AUC 為0.97。他們的模型在冷凍組織、甲醛固定石蠟包埋組織和活檢組織的獨(dú)立數(shù)據(jù)集上得到了驗(yàn)證。以上研究顯示,人工智能通過(guò)對(duì)數(shù)字病理組織切片的分析,可以幫助病理學(xué)家迅速判斷肺癌類(lèi)型,并預(yù)測(cè)患者的預(yù)后,顯著提高了肺癌的診斷效率,明顯減少了誤診及漏診,大幅減輕了病理工作者的工作負(fù)擔(dān)。
2.3 人工智能組織病理診斷系統(tǒng)在預(yù)測(cè)肺癌突變基因中的應(yīng)用 目前,用于疾病診斷的基因突變檢測(cè)較少。2015 年美國(guó)甲狀腺協(xié)會(huì)發(fā)布的關(guān)于甲狀腺結(jié)節(jié)分子譜在外科手術(shù)中應(yīng)用的聲明指出,BRAF-V600E 突變對(duì)于甲狀腺乳頭狀癌的診斷具有關(guān)鍵作用,術(shù)前細(xì)針穿刺細(xì)胞學(xué)標(biāo)本進(jìn)行基因診斷可用于甲狀腺結(jié)節(jié)良惡性的鑒別[19],有研究報(bào)道,BRAF-V600E 基因檢測(cè)判斷甲狀腺良惡性結(jié)節(jié)的敏感度和特異性分別為72.6% 和100%[20]。而對(duì)于包括肺癌的大多數(shù)癌癥,基因檢測(cè)目前大多仍限于疾病的靶向治療或預(yù)后判斷。
目前,已有針對(duì)肺癌特定基因突變的多種靶向藥物問(wèn)世,對(duì)于伴有基因突變的肺癌患者,可以使用具有針對(duì)性的靶向藥物對(duì)基因進(jìn)行阻斷,以控制腫瘤繼續(xù)增長(zhǎng)[21-22],因此基因突變檢測(cè)是目前肺癌常規(guī)且重要的治療及預(yù)后判斷方法之一。已有研究證明,人工智能可以幫助檢測(cè)肺癌突變基因。Coudray 等[18]推測(cè)某些基因突變會(huì)改變?nèi)衅瑘D像上肺癌腫瘤細(xì)胞的排布,因而他們對(duì)腺癌中最常見(jiàn)的10 個(gè)突變基因通過(guò)訓(xùn)練神經(jīng)網(wǎng)絡(luò)進(jìn)行了預(yù)測(cè),結(jié)果發(fā)現(xiàn)其中的6 個(gè)(STK11、EGFR、FAT1、SETBP1、KRAS、TP53) 可以通過(guò)病理圖像進(jìn)行預(yù)測(cè),其準(zhǔn)確率為73.3% ~ 85.6%。該發(fā)現(xiàn)表明深度學(xué)習(xí)模型可以幫助病理學(xué)家快速檢測(cè)肺癌突變基因。另外一項(xiàng)研究,王荃等[23]選取南京軍區(qū)總醫(yī)院病理科50 例肺腺癌病理切片,其中包含表皮生長(zhǎng)因子受體 (epidermal growth factor receptor,EGFR) 基因突變21 例和EGFR 基因未突變29 例,運(yùn)用條件生成對(duì)抗網(wǎng)絡(luò)(conditional generative adversarial networks,CGAN)[24]分割癌變上皮組織內(nèi)的細(xì)胞核,構(gòu)建有效的病理組學(xué)特征以描述肺部腫瘤,從而運(yùn)用支持向量機(jī)(support vector machine,SVM)[25]分類(lèi)器構(gòu)建EGFR 基因突變風(fēng)險(xiǎn)預(yù)測(cè)模型。實(shí)驗(yàn)結(jié)果表明,他們構(gòu)建的EGFR 基因突變風(fēng)險(xiǎn)預(yù)測(cè)模型的AUC 在測(cè)試集上可達(dá)72.4%,準(zhǔn)確率為70.8%,提示EGFR 基因突變與肺腺癌全掃描組織病理圖像中的組織形態(tài)學(xué)特征密切相關(guān),證明了從全掃描組織病理圖像中預(yù)測(cè)EGFR 基因突變的可行性。這些研究說(shuō)明,人工智能組織病理診斷系統(tǒng)有可能幫助病理學(xué)家快速檢測(cè)肺癌突變基因,便于指導(dǎo)患者盡早開(kāi)始靶向藥物治療,以提高治療效果,改善患者預(yù)后。
目前,指導(dǎo)肺癌靶向治療的基因檢測(cè)大多依賴(lài)于組織活檢標(biāo)本,相對(duì)于傳統(tǒng)組織病理學(xué),液體活檢是一類(lèi)新興的病理檢測(cè)技術(shù)。液體活檢以血液、尿液、痰液等液體樣本中的腫瘤循環(huán) 細(xì) 胞 (circulating tumor cell,CTC)、 腫 瘤 循 環(huán)DNA(circulating tumor DNA,ctDNA)、 微 小 RNA(microRNA,miRNA) 以 及 外 泌 體 (exosome) 等 為檢測(cè)目標(biāo),通過(guò)熒光原位雜交(fluorescence in situ hybridization,F(xiàn)ISH)、 二 代 測(cè) 序 (next generation sequencing,NGS) 等技術(shù)獲取腫瘤基因突變等相關(guān)信息,以指導(dǎo)臨床治療和預(yù)后判斷,液體活檢技術(shù)由于其無(wú)創(chuàng)、取材方便、操作風(fēng)險(xiǎn)低以及可避免局部取樣偏差從而獲取腫瘤組織的全面信息等優(yōu)勢(shì)成為當(dāng)前研究熱點(diǎn)。隨著人工智能的發(fā)展以及拉曼光譜等新興檢測(cè)技術(shù)的進(jìn)步,人工智能病理診斷系統(tǒng)在液體活檢中的應(yīng)用將會(huì)大大提高肺癌基因檢測(cè)的準(zhǔn)確率和效率。
人工智能病理診斷系統(tǒng)在肺癌中的應(yīng)用,不但提高了病理工作者的工作效率,且具有良好的穩(wěn)定性,能發(fā)現(xiàn)人肉眼鏡下不易察覺(jué)的細(xì)節(jié),有效降低了漏診率及誤診率。然而現(xiàn)階段人工智能病理診斷進(jìn)展大多還停留在實(shí)驗(yàn)室研究階段,未能真正進(jìn)入臨床,其局限性表現(xiàn)在:1) 數(shù)據(jù)質(zhì)量問(wèn)題。目前,標(biāo)本處理、切片染色及圖像標(biāo)注尚未形成標(biāo)準(zhǔn)化流程,用于人工智能訓(xùn)練的數(shù)據(jù)量不足,影響診斷的可靠性;2) 數(shù)據(jù)整合問(wèn)題。目前,人工智能模型的數(shù)據(jù)主要來(lái)源于病理切片,而沒(méi)有結(jié)合患者的癥狀、體征及其他檢查化驗(yàn)結(jié)果等信息,削弱了診斷的準(zhǔn)確性;3) 法律責(zé)任界定問(wèn)題。單獨(dú)應(yīng)用人工智能發(fā)生醫(yī)療錯(cuò)誤時(shí)責(zé)任的界定亟待相關(guān)法律法規(guī)的出臺(tái)。
目前,大多數(shù)人工智能在肺癌病理學(xué)方面的研究仍然集中在腫瘤的檢測(cè)和分級(jí)上。然而,隨著人工智能及數(shù)字病理技術(shù)的進(jìn)步,人工智能在肺癌病理診斷領(lǐng)域中的應(yīng)用,正逐步擴(kuò)展至與臨床特征密切結(jié)合的疾病嚴(yán)重程度評(píng)估和預(yù)后預(yù)測(cè)方面,同時(shí)在新興的液體活檢相關(guān)技術(shù)領(lǐng)域也具有巨大發(fā)展前景。隨著越來(lái)越多經(jīng)驗(yàn)豐富的病理學(xué)家們參與到人工智能的肺癌病理圖像標(biāo)注工作中,我們相信整合臨床數(shù)據(jù)、遺傳數(shù)據(jù)和形態(tài)數(shù)據(jù)的人工智能病理診斷系統(tǒng)在肺癌的精準(zhǔn)病理診斷中將發(fā)揮更大的作用。