劉秋蕊,趙宇
(四川大學(xué)華西醫(yī)院 耳鼻咽喉頭頸外科,四川 成都 610041)
喉癌是頭頸部最常見(jiàn)的惡性腫瘤之一。據(jù)統(tǒng)計(jì),全球每年約有18萬(wàn)人被診斷為喉癌,約9萬(wàn)人死亡[1]。近年來(lái),人工智能在醫(yī)療衛(wèi)生領(lǐng)域中的應(yīng)用不斷拓展,國(guó)內(nèi)外眾多學(xué)者逐漸聚焦于人工智能在喉癌早期篩查、診斷、治療、預(yù)后預(yù)測(cè)等領(lǐng)域中的應(yīng)用。本文就人工智能在喉癌診療領(lǐng)域中的應(yīng)用現(xiàn)狀進(jìn)行綜述,探索其未來(lái)發(fā)展的機(jī)遇與挑戰(zhàn)。
電子纖維喉鏡檢查普遍應(yīng)用于喉內(nèi)的視診和喉部疾病的診斷。電子纖維喉鏡下早期發(fā)現(xiàn)喉部癌前病變或喉癌有助于盡早干預(yù)治療,避免患者因延誤診斷而失去保留喉發(fā)聲和(或)通氣功能的機(jī)會(huì),有助于全面改善患者的生活質(zhì)量、生存率和預(yù)后。然而,并非所有臨床耳鼻咽喉科醫(yī)生都具備足夠的經(jīng)驗(yàn)和能力來(lái)準(zhǔn)確識(shí)別喉鏡圖像中的癌癥征象,即使近年來(lái)新興的喉鏡下窄帶成像技術(shù)(narrowband imaging technology,NBI)可幫助提高早癌診斷率[2],實(shí)際工作中仍存在誤診、漏診現(xiàn)象。
基于此,眾多研究團(tuán)隊(duì)嘗試將人工智能技術(shù)與內(nèi)鏡圖像診斷識(shí)別相結(jié)合。Ren等[3]學(xué)者基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)算法進(jìn)行喉部疾病篩查和診斷分類,將7 521例患者的19 433張圖像,隨機(jī)分為訓(xùn)練圖像集、驗(yàn)證圖像集及測(cè)試圖像集(以驗(yàn)證算法的泛化能力),另從測(cè)試數(shù)據(jù)集中隨機(jī)抽取500張圖像,由12位耳鼻咽喉科醫(yī)生組成的專家團(tuán)與人工智能模型進(jìn)行喉鏡圖片分類比賽。經(jīng)訓(xùn)練與測(cè)試,基于CNN的人工智能模型對(duì)喉部5種狀態(tài)(正常、小結(jié)、白斑、息肉、惡性腫瘤)分類的總體準(zhǔn)確率優(yōu)于耳鼻咽喉科醫(yī)生(94% vs 86%,P<0.001),尤其是在聲帶白斑(91% vs 65%,P<0.001)和惡性腫瘤(90% vs 54%,P<0.001)的鑒別分類方面。而CNN模型僅需22.7 s即可完成所有分類,比臨床醫(yī)生的分類效率高500倍。另一項(xiàng)研究也利用CNN構(gòu)建了喉癌診斷模型,其總體敏感性、特異性、準(zhǔn)確度分別為73.1%、92.2%和86.7%,受試者工作特征曲線的曲線下面積為0.922[4]。
人工智能技術(shù)有潛力成為喉癌診斷的良好工具,既能減輕內(nèi)鏡醫(yī)生的讀圖負(fù)擔(dān),又能高效、準(zhǔn)確地完成喉癌的篩查和診斷。此外,在缺乏NBI技術(shù)的基層醫(yī)院,應(yīng)用此類人工智能技術(shù)可在節(jié)約設(shè)備成本的同時(shí)提高患者的診斷率,有助于提升偏遠(yuǎn)和農(nóng)村地區(qū)的醫(yī)療質(zhì)量。
術(shù)前影像學(xué)檢查有助于評(píng)估喉癌的腫瘤體積、癌旁侵犯程度、頸部淋巴結(jié)良惡性鑒別等,錯(cuò)誤的評(píng)估可能導(dǎo)致切除不徹底而導(dǎo)致腫瘤復(fù)發(fā),或造成擴(kuò)大切除而增加不必要的手術(shù)并發(fā)癥和功能缺損。目前喉癌的主要影像學(xué)檢查方法包括CT、MRI、PET/CT、超聲等。
張惠柯[5]收集了經(jīng)組織病理學(xué)證實(shí)的115例喉癌患者的頸部增強(qiáng)CT軸位圖像(包括惡性淋巴結(jié)207枚和良性淋巴結(jié)359枚),納入淋巴結(jié)中心性壞死、球形、環(huán)形或薄壁強(qiáng)化、淋巴門消失及增大淋巴結(jié)短軸徑≥10 mm等指標(biāo),采用密集連接卷積網(wǎng)絡(luò)構(gòu)建了一種用于頸部淋巴結(jié)術(shù)前良惡性定性診斷的人工智能模型。經(jīng)訓(xùn)練和測(cè)試,該模型對(duì)頸部淋巴結(jié)良惡性定性診斷的準(zhǔn)確性、敏感度、特異性、陽(yáng)性預(yù)測(cè)值、陰性預(yù)測(cè)值分別為83.8%、76.3%、90.5%、87.9%、80.9%,曲線下面積為0.842,平均每個(gè)淋巴結(jié)的診斷時(shí)間為0.625s,與Ariji等[6]的研究結(jié)果一致。而Santin等[7]則開(kāi)發(fā)了一項(xiàng)基于深度學(xué)習(xí)的智能算法,用于檢測(cè)CT圖像中甲狀腺軟骨異常征象,后者是決定喉癌手術(shù)范圍、放療療效和預(yù)后分級(jí)的重要指標(biāo)之一。
遺憾的是,在實(shí)體腫瘤的人工智能輔助影像診斷方面,尚無(wú)研究構(gòu)建專門的喉癌實(shí)體腫瘤診斷模型,但已有不少團(tuán)隊(duì)將計(jì)算機(jī)輔助診斷(computer-aided diagnosis,CAD)應(yīng)用到食管癌[8]、乳腺癌[9]、前列腺癌[10]、肺癌[11]等的術(shù)前診斷中,未來(lái)喉癌領(lǐng)域的CAD值得期待。
盡管近年來(lái)放化療和分子治療逐漸受到重視和應(yīng)用,手術(shù)切除仍然是治療中、晚期喉癌的主要治療手段。在保留鄰近健康組織的同時(shí)最大限度地切除腫瘤可以同時(shí)滿足良好的生存率和更少的術(shù)后并發(fā)癥,因此,精確、快速的喉部病理學(xué)檢查至關(guān)重要。
Zhang等[12]采集了45例喉癌患者的新鮮無(wú)標(biāo)記手術(shù)組織標(biāo)本,對(duì)每個(gè)標(biāo)本分別進(jìn)行受激拉曼散射(stimulated raman scattering,SRS)顯微鏡成像和蘇木精-伊紅(hematoxylin-eosin,HE)染色成像(各80張),由3位專業(yè)喉部病理學(xué)專家閱讀SRS和HE隨機(jī)混合圖像。經(jīng)分析統(tǒng)計(jì),兩種圖像呈高度一致性。在此基礎(chǔ)上,該研究利用18 750個(gè)SRS視野構(gòu)建和訓(xùn)練了一種基于深度學(xué)習(xí)的剩余CNN模型。經(jīng)評(píng)估,此模型在對(duì)33個(gè)獨(dú)立手術(shù)標(biāo)本的分類測(cè)試中獲得較高的準(zhǔn)確度。類似的,Halicek等[13]采用高光譜成像技術(shù)采集293份新鮮手術(shù)無(wú)標(biāo)記組織樣本圖像,利用深度學(xué)習(xí)和機(jī)器學(xué)習(xí)成功構(gòu)建了高準(zhǔn)確度的頭頸腫瘤病理診斷模型。
值得注意的是,上述兩種人工智能病理診斷模型所依賴的成像技術(shù)均可以在新鮮的、未經(jīng)處理的手術(shù)標(biāo)本上自動(dòng)、準(zhǔn)確地診斷喉鱗狀細(xì)胞癌,無(wú)需固定、切片或染色,這極大地縮短了術(shù)中、術(shù)后等待病理結(jié)果的時(shí)間,有助于更快地進(jìn)行后續(xù)治療決策,提高患者生存質(zhì)量。
傳統(tǒng)的喉癌實(shí)體腫瘤切除手術(shù)主要分為部分喉切除術(shù),包括經(jīng)口激光顯微切除術(shù)(transoral laser microsurgery,TLM)和全喉切除術(shù)。由于喉部解剖結(jié)構(gòu)的特殊性(非線性通道、多竇道與皺襞),喉癌手術(shù)存在微創(chuàng)切除時(shí)暴露困難以致難以根治,或根治切除時(shí)損傷范圍廣的問(wèn)題。
2010年來(lái),經(jīng)口機(jī)器人手術(shù)(transoral robotic surgery,TORS)逐步被應(yīng)用在喉癌外科治療中。TORS是一種采用達(dá)芬奇外科手術(shù)系統(tǒng)的顯微外科手術(shù),由2個(gè)操作臂、1個(gè)內(nèi)鏡臂和1個(gè)中控臺(tái)組成。術(shù)者在中控臺(tái)手柄上進(jìn)行手術(shù)操作,中控臺(tái)內(nèi)智能算法以高達(dá)1 300 次/s的運(yùn)算通量實(shí)時(shí)處理術(shù)者在手柄上進(jìn)行的模擬操作矢量數(shù)據(jù),篩除混雜干擾,屏蔽術(shù)者生理手震等,將操作指令精確地傳輸?shù)讲僮鞅?,以完成人手難以達(dá)成的更高精度更高準(zhǔn)確度的手術(shù)操作,如精確的腫瘤安全邊控制、亞解剖單位的拉攏縫合等[14],使手術(shù)醫(yī)生在盡可能切除腫瘤的同時(shí)保留更多的喉部結(jié)構(gòu)。2020年,Hanna等[15]發(fā)布了一項(xiàng)早期喉癌患者不同術(shù)式的預(yù)后分析研究,此研究回顧性地納入了1 780例T1和T2期喉癌患者,其中186例患者接受了TORS,1 071例患者接受了TLM,523例患者接受了開(kāi)放性手術(shù)。其結(jié)果顯示,接受TORS的患者的腫瘤邊緣性質(zhì)、術(shù)后是否需要輔助治療及總體生存率與TLM和開(kāi)放性手術(shù)相比并無(wú)明顯差異,表明TORS是治療早期喉癌的可靠方案。More等[16]主導(dǎo)的一項(xiàng)臨床隨機(jī)對(duì)照實(shí)驗(yàn)則發(fā)現(xiàn),與接受傳統(tǒng)初級(jí)放化療治療的20例晚期口咽癌和聲門上型喉癌患者相比,接受TORS治療的20例患者在隨后的6個(gè)月和12個(gè)月隨訪中獲得了更優(yōu)的安德森吞咽困難量表評(píng)分,說(shuō)明經(jīng)TORS治療的患者,術(shù)后吞咽功能恢復(fù)更快、保留程度更高,這與陳偉等[17]的研究結(jié)論一致。以上研究均表明,TORS是治療喉癌的一種安全有效的方案,在提升患者生存結(jié)局的同時(shí)能提供更優(yōu)質(zhì)的生存質(zhì)量。
近年來(lái),腫瘤綜合治療已成為國(guó)內(nèi)外學(xué)者的共識(shí),基于患者個(gè)性特征的腫瘤預(yù)防和治療是未來(lái)腫瘤診療領(lǐng)域的發(fā)展趨勢(shì)[18]。
Howard等學(xué)者采集了美國(guó)國(guó)家癌癥數(shù)據(jù)庫(kù)(national cancer database,NCDB)中自2014年初至2016年末登記診斷為口腔、口咽、下咽或喉鱗狀細(xì)胞癌的共計(jì)32 987例患者信息,利用3種機(jī)器學(xué)習(xí)模型對(duì)每位患者進(jìn)行輔助治療模式推薦[19-21]。經(jīng)驗(yàn)證,實(shí)際治療方案與模型推薦治療方案相匹配的患者的總體生存率顯著高于非匹配患者,DeepSurv的HR為0.79(95%CI為0.72~0.85,P<0.001),RSF為0.90(95%CI為0.93~0.98,P=0.01),N-MTLR為0.83(95%CI為0.77~0.90,P<0.001),說(shuō)明3種機(jī)器學(xué)習(xí)模型所推薦的綜合輔助治療方案均可顯著提升患者預(yù)后。此外,3種機(jī)器學(xué)習(xí)模型均可準(zhǔn)確識(shí)別僅接受RT治療即可獲得良好預(yù)后的患者,且DeepSurv在老年和年輕患者中仍能提供可靠的預(yù)測(cè)[22]。Smith等[23]則利用NCDB中cT1-T3a的喉鱗癌患者數(shù)據(jù)開(kāi)發(fā)了一種基于機(jī)器學(xué)習(xí)的梯度提升算法,可識(shí)別cT1-3期中接受了初次非手術(shù)治療后仍需進(jìn)行挽救性全喉切除術(shù)的喉鱗癌患者,準(zhǔn)確度為76.0%(95%CI為 74.5%~77.5%),曲線下面積為0.762。
喉癌患者的預(yù)后受到復(fù)雜多樣的因素影響,目前對(duì)喉癌患者預(yù)后的分析多為各種回歸模型,但這些模型只能處理相對(duì)較少的變量,且對(duì)變量間交互作用的分析較為粗糙和有限。
2005年,Jones等[24]開(kāi)始嘗試將人工智能神經(jīng)網(wǎng)絡(luò)應(yīng)用于喉癌患者的預(yù)后預(yù)測(cè)。他們納入了1 327例喉鱗癌患者,篩選識(shí)別了年齡、性別、腫瘤部位、組織學(xué)等十余種獨(dú)立危險(xiǎn)因素,分別構(gòu)建了Kaplan-Meier生存分析模型、Cox比例風(fēng)險(xiǎn)模型和神經(jīng)網(wǎng)絡(luò)模型。經(jīng)對(duì)比,神經(jīng)網(wǎng)絡(luò)模型不僅能繪制準(zhǔn)確的生存曲線,其分析行為更為“多元”,對(duì)年齡和N分期曲線的差異更為敏感,且在各種分析環(huán)境下對(duì)各變量都有著更強(qiáng)的區(qū)分性能。2015年,來(lái)自德國(guó)萊比錫大學(xué)的計(jì)算機(jī)輔助外科創(chuàng)新中心的工程師與該校耳鼻咽喉頭頸外科的腫瘤專家著手開(kāi)發(fā)一種基于貝葉斯網(wǎng)絡(luò)的臨床決策支持系統(tǒng)(clinical decision support system,CDSS)。該團(tuán)隊(duì)旨在構(gòu)建一套高精度、個(gè)性化、可交互、多學(xué)科支持、臨床可讀的治療決策和預(yù)后預(yù)測(cè)系統(tǒng),使外科醫(yī)生通過(guò)CDSS設(shè)置單個(gè)患者數(shù)據(jù)后即可計(jì)算特定患者的治療模式和預(yù)后預(yù)測(cè)[25]。該團(tuán)隊(duì)于2019年發(fā)布了代表TNM分期子網(wǎng)絡(luò)(303個(gè)變量)的驗(yàn)證結(jié)果,模型準(zhǔn)確率達(dá)100%,并提出了標(biāo)準(zhǔn)化建模、廣泛模型的驗(yàn)證和交互等方面的研發(fā)建議。
隨著人工智能技術(shù)的蓬勃發(fā)展和多學(xué)科交叉合作,人工智能技術(shù)在喉癌診斷、治療決策和預(yù)后預(yù)測(cè)等領(lǐng)域都取得了良好的進(jìn)展。但目前投入應(yīng)用的人工智能技術(shù)仍存在較多不足,如圖像識(shí)別模型較多且雜、缺乏行業(yè)統(tǒng)一的標(biāo)準(zhǔn)與規(guī)范,機(jī)器人輔助手術(shù)的手術(shù)范圍、時(shí)長(zhǎng)、出血及修復(fù)等與傳統(tǒng)手術(shù)相比尚遜色良多,更有大部分技術(shù)尚缺乏臨床應(yīng)用場(chǎng)景驗(yàn)證,亦缺乏配套的國(guó)家法律法規(guī)和倫理規(guī)范,故人工智能在喉癌診療的實(shí)際應(yīng)用還有海量工作有待完成。未來(lái)各科研工作者需在研發(fā)技術(shù)的同時(shí)攜手建立行業(yè)規(guī)范,并著力推動(dòng)技術(shù)落地,使人工智能技術(shù)與喉癌診療的結(jié)合盡快邁入實(shí)際的臨床應(yīng)用,造福患者。