鐘來平,周知航,張志愿
200011上海,上海交通大學醫(yī)學院附屬第九人民醫(yī)院·口腔醫(yī)學院,上海市口腔醫(yī)學重點實驗室,國家口腔疾病臨床醫(yī)學研究中心,國家口腔醫(yī)學中心 口腔頜面頭頸腫瘤科
頭頸腫瘤在組織學、基因突變和代謝特征等方面均表現(xiàn)出復雜性和異構(gòu)性,如何依據(jù)頭頸腫瘤的組織學、放射學和生物學特點,作出準確診斷,對制定個性化治療方案,預測療效及預后至關(guān)重要[1]。隨著腫瘤檢測手段的不斷豐富,多組學概念應(yīng)運而生,它包括了基因組學、轉(zhuǎn)錄組學、蛋白質(zhì)組學、代謝組學、放射組學以及病理組學的整合,有利于深入了解腫瘤的發(fā)病機制和性質(zhì)判斷,但是多組學包含的海量數(shù)據(jù)分析,也是一種巨大挑戰(zhàn)。
為了解決這一難題,深度學習(deep learning,DL)逐漸成為了研究熱點。DL是人工智能(artifical intelligence, AI)的一種,衍生自傳統(tǒng)的機器學習(machine learning, ML)。與傳統(tǒng)的ML相比,DL免去了手動輸入原始數(shù)據(jù)的過程,通過直接學習原始輸入數(shù)據(jù)分析其與目標輸出的相關(guān)性,促進對大數(shù)據(jù)集的利用?;谟嬎銠C算法和計算病理學的改進,DL能夠用于良惡性腫瘤的識別、惡性腫瘤的分級和預后預測。在頭頸腫瘤領(lǐng)域,Lu等[2]首次將DL應(yīng)用于頭頸部病理圖像的分析;Ibragimov等[3]將DL應(yīng)用于頭頸部腫瘤的放射組學圖像分析。本文旨在概述DL在頭頸部腫瘤診治中的新進展及其臨床價值,包括早期診斷、腫瘤分期、輔助外科手術(shù)、預后分析等(圖1)。
圖1 多組學數(shù)據(jù)協(xié)同整合的示意圖
頭頸腫瘤發(fā)病的危險因素括吸煙、酗酒、局部刺激、咀嚼煙草、人乳頭瘤病毒(human papilloma virus,HPV)感染等。早期診斷是提高療效的關(guān)鍵之一。通過DL進行多組學分析,提高早期診斷率,有重要價值。放射組學能提供快速、低成本、無創(chuàng)的組織和器官特征,描述病變的形狀、密度和相互關(guān)系等。這些特征可以通過不同的成像方式獲取,如CT、MRI、PET等。由于醫(yī)學圖像中的某些灰度值或光譜差異,無法通過人類視覺進行評估,而DL則可以通過識別這些差異區(qū)分癌組織和正常組織。根據(jù)這一原理,DL有望結(jié)合頭頸部臨床檢查、影像學資料和病理學診斷進行數(shù)據(jù)訓練,對癌前病變和癌癥病變的評估。
在DL技術(shù)中,卷積神經(jīng)網(wǎng)絡(luò)(convolution neural network, CNN)在圖像檢測、腫瘤組織劃分、腫瘤細胞分類和計算機輔助診斷等方面具有明顯的優(yōu)勢。Halicek等[4]通過CNN訓練識別頭頸鱗狀細胞癌(head and neck squamous cell carcinoma,HNSCC)的高光譜圖像,包含91個光譜波段,范圍為450~900 nm,光譜采樣間隔為5 nm;其準確性、敏感性和特異性分別為81%、81%和80%。Ren等[5]使用一種屬于回歸模型的套索算法(least absolute shrinkage and selection operator,LASSO)從HNSCC的MRI中提取數(shù)據(jù),用于HNSCC患者的臨床分期。Mukherjee等[6]將CT數(shù)據(jù)的主成分分析(principal component analysis,PCA)和正則回歸分析,用來預測腫瘤分級、淋巴結(jié)包膜外侵犯、神經(jīng)浸潤、淋巴血管浸潤和HPV感染狀態(tài)。
基于共聚焦激光內(nèi)鏡檢查(confocal laser endomicroscopy,CLE)實時顯示體內(nèi)的上皮細胞特征,其成像也能用于早期診斷和預測預后。Thong等[7]首次報道了CLE在口腔鱗狀細胞癌(oral squamous cell carcinoma,OSCC)診斷中的應(yīng)用。隨后,Moore等[8]也應(yīng)用CLE檢測頭頸部癌前病變,對診斷口腔上皮發(fā)育不良的敏感性為85.7%,特異性為80.0%。Aubreville等[9]設(shè)計了一種基于CLE的DL系統(tǒng),可用于OSCC早期診斷。此外,除了影像組學的DL,蛋白質(zhì)組學也可應(yīng)用于OSCC的早期診斷,Ni等[10]從OSCC患者唾液中提取蛋白質(zhì),通過CNN篩選出與淋巴結(jié)轉(zhuǎn)移相關(guān)的生物標志物。
DL適用于數(shù)字病理學相關(guān)的圖像分析。在頭頸腫瘤的病理診斷中,由于需要評估細胞核異型性,像素級的識別可以將其歸類。在這個過程中,算法識別的特征圖片可以進行加權(quán)參數(shù)處理,將相似特征的聚類映射到同一輸出標簽下。
Lewis等[11]開發(fā)了一套自動量化HNSCC形態(tài)學特征的方法,并以此對p16陽性的侵襲性O(shè)SCC進行分類。該方法首先生成聚類細胞圖,對有絲分裂細胞的空間分布進行評價,使用隨機森林(random forest,RF)決策樹和支持向量機(support vector machine,SVM)對特征進行分類,準確率為87.5%。Aubreville等[9]設(shè)計的DL模型檢測可疑OSCC,整體圖像識別的曲線下面積達到0.96,準確率為88.3%(敏感性86.6%,特異性90%)。
Halicek等[12]設(shè)計的CNN通過高光譜圖像可以對手術(shù)切緣進行準確識別;作為一個端到端的DL網(wǎng)絡(luò),既可用于特征提取,可以作為分類器進行分類,通過訓練CNN,能夠以81%的準確性(敏感性84%,特異性77%)分辨OSCC的腫瘤和正常組織。Lei等[13]訓練CNN來自動提取具備有絲分裂特征的細胞,能確定所有有絲分裂細胞的位置。該方法在國際模式識別會議的有絲分裂檢測測試數(shù)據(jù)集上顯示了出乎意料的高準確性。
除有絲分裂外,細胞器的識別在病理組學中也十分重要。檢測細胞或細胞核的常用策略是將CNN分類器訓練為像素分類器,以檢測對象為中心的模塊在被監(jiān)控的條件下對CNN進行訓練。訓練過的CNN模型通常包含二分類器(Yes或No),應(yīng)用于全切片數(shù)字化圖像(whole slide imaging,WSI),檢測所有組織成分,并輸出概率圖,每個像素被轉(zhuǎn)移成一個可能的值。因此,原則上可以通過在生成的概率圖中找到一個局部最大值來定位目標對象,完成細胞核或有絲分裂檢測任務(wù),計數(shù)或提取WSI中的定量指標。該算法建立在將輸入圖像的軟件補丁映射到密度圖的基礎(chǔ)上,最終通過密度圖計算出原始圖像中的細胞數(shù)量。
DL在腫瘤微環(huán)境特征(tumor microenviroment characteristics,TMC)的分析中也扮演著重要的角色。TMC分析中最重要的步驟是在病理圖片中對不同類型的組織和細胞進行分類。在這個過程中,腫瘤細胞可以分為實質(zhì)細胞和間質(zhì)細胞。有研究[14]發(fā)現(xiàn)腫瘤與間質(zhì)比率可以作為總生存率和預后的組織學預測因子。
分辨任務(wù)比有絲分裂檢測更困難,因為薄壁組織可以在低放大率下分析,基質(zhì)(如淋巴細胞、巨噬細胞、成纖維細胞等)需要在高倍鏡下分析。在細胞核分辨方面,40倍放大率比20倍放大率表現(xiàn)更好。完全卷積網(wǎng)絡(luò)(fully convolutional networks,FCN)和UNet[15]可以接受任意尺寸的輸入圖像,并進行等比輸出,針對頭頸腫瘤的異質(zhì)性和復雜性,通過數(shù)據(jù)增強來分辨各種類型細胞。
DL在協(xié)助外科醫(yī)生制定手術(shù)計劃方面,可以發(fā)揮智慧外科的作用。外科醫(yī)生可以借助AI對人群和患者特定數(shù)據(jù)的分析,提高手術(shù)的準確性。DL通過收集世界各地外科醫(yī)生的大量手術(shù)視頻和電子病歷數(shù)據(jù),增強知識共享,生成根據(jù)結(jié)果評估的實踐和技術(shù)數(shù)據(jù)庫。視頻數(shù)據(jù)庫可以利用計算機視覺捕捉罕見病例或解剖,在術(shù)前、術(shù)中和術(shù)后護理階段收集和整合數(shù)據(jù)。這樣可以在設(shè)計和驗證為基礎(chǔ)的實踐中進行創(chuàng)新,提高手術(shù)質(zhì)量[16-18]。外科醫(yī)生作為DL技術(shù)優(yōu)化外科治療的受益者,有機會與數(shù)據(jù)科學家合作,獲取新的臨床數(shù)據(jù)或呈現(xiàn)形式,并憑借自己的醫(yī)學知識對這些數(shù)據(jù)進行深入的解釋。外科醫(yī)生具有寶貴的臨床經(jīng)驗和知識儲備,可以引導數(shù)據(jù)科學家和工程師用正確的數(shù)據(jù)回答相應(yīng)的問題。工程師可以為數(shù)據(jù)分析提供自動化的、計算性的解決方案。以技術(shù)為基礎(chǔ)的外科實踐傳播可以使每位外科醫(yī)生都有機會提高手術(shù)質(zhì)量。AI可以用來創(chuàng)造手術(shù)流程共識,提供諸如術(shù)中GPS式的指導以及類似的術(shù)中輔助決策性技術(shù)支持。為此,相關(guān)的算法必須具備透明度和可解釋性,AI才能對其進行預測和建議。如果開發(fā)和實施得當,AI有可能徹底改變外科手術(shù)的教學和實踐方式,為高質(zhì)量的外科治療提供標準化流程。
此外,幾家外科公司正與科技巨頭聯(lián)手開發(fā)基于DL技術(shù)的智能外科機器人。Accuray的射波刀等可編程機器人系統(tǒng),能夠根據(jù)一個預定義的治療計劃,用點源摧毀特定位置的腫瘤[19-20]。基于術(shù)前CT的三維重建,先后有兩款手術(shù)機器人分別用于關(guān)節(jié)置換和口腔種植[21-22],這類機器人確保了手術(shù)過程中預先計劃好的步驟精確執(zhí)行,從而避免偏差,提高療效。盡管如此,基于DL的手術(shù)機器人主要應(yīng)用于骨組織相關(guān)的外科手術(shù)中,距離全面應(yīng)用于外科領(lǐng)域尚有距離,其主要是人體組織,特別是軟組織的復雜性,阻礙了DL的準確識別,還需要深入研究。
近年來,越來越多的學者認為DL預測預后具有潛力,開發(fā)了許多預測模型及軟件,用于預測頭頸腫瘤的復發(fā)轉(zhuǎn)移及預后,例如PCA、RF、LASSO、In-house built Accurate tool、Z-Rad radiomics software、LIFEx等[4-6,11,23-32]。舉例來說,Tixier等[26]分析了45例局部晚期頭頸癌患者的放射組學和轉(zhuǎn)錄組學數(shù)據(jù),應(yīng)用模糊局部自適應(yīng)貝葉斯算法來評估放射組學特征和信號通路改變之間的關(guān)聯(lián),發(fā)現(xiàn)放射組學特征與細胞周期、DNA修復、細胞外基質(zhì)組織、免疫系統(tǒng)、代謝和信號轉(zhuǎn)導通路相關(guān)。Zhu等[31]將126例HNSCC患者的基因組學數(shù)據(jù)與CT影像數(shù)據(jù)進行整合,發(fā)現(xiàn)基因組特征與CT特征存在顯著相關(guān)性。
在DL出現(xiàn)前,多采用邏輯回歸分析、Cox分析等評價預后。基于DL的生存預測可以提高預測精度,有助于精準醫(yī)療。Tseng等[33]利用臨床變量和組織病理學特征構(gòu)建CNN來預測口腔腫瘤患者的生存,發(fā)現(xiàn)CNN模型在訓練精度和交叉驗證精度上均優(yōu)于Logistic回歸模型。Brennan等[34]使用聚類分析的方法分析HNSCC患者的基因組學和表觀遺傳學數(shù)據(jù),發(fā)現(xiàn)了CpG島甲基群。因此,將基因突變和分子標記物等新型預后因素,與傳統(tǒng)預后因素結(jié)合,構(gòu)建非線性DL網(wǎng)絡(luò),將有利于提高預測的準確性。
蛋白質(zhì)組學和轉(zhuǎn)錄組學也被用于研究頭頸腫瘤局部復發(fā)、淋巴轉(zhuǎn)移和遠處轉(zhuǎn)移。Onken等[35]使用聚類分析的方法在四個鱗狀細胞癌(squamous cell carcinoma,SCC)數(shù)據(jù)集上提取了預測口腔腫瘤遠處轉(zhuǎn)移的轉(zhuǎn)錄組特征。肺是鱗癌最常見的遠處轉(zhuǎn)移部位,原發(fā)性SCC也可發(fā)生在肺部。通過ML和蛋白質(zhì)組學數(shù)據(jù)分析,Bohnenberger等[36]發(fā)現(xiàn)肺轉(zhuǎn)移性HNSCC和原發(fā)性肺SCC蛋白特征具有重大差異。Carnielli等[37]利用組織形態(tài)學導向的蛋白質(zhì)組學分析腫瘤島和間質(zhì)中的蛋白表達,預測腫瘤復發(fā)和淋巴轉(zhuǎn)移。Kaddi等[38]通過6種不同的ML模型(KNN、SVM、naive Bayes、DT、AdaBoost和RF)分析蛋白質(zhì)組學和轉(zhuǎn)錄組數(shù)據(jù)。結(jié)果表明,基于轉(zhuǎn)錄組和蛋白質(zhì)組數(shù)據(jù)的預測模型比單獨使用轉(zhuǎn)錄組或蛋白質(zhì)組具有更好的預測效果。
AI高度依賴可靠的大數(shù)據(jù)庫,但頭頸腫瘤的大數(shù)據(jù)庫還不完善,病理切片數(shù)據(jù)庫尚未建立。除了配置數(shù)據(jù)庫所需的硬件外,還需要設(shè)置自動處理的圖像數(shù)據(jù)庫。當數(shù)據(jù)庫從臨床病例中獲取圖像時,還需要獲取圖像的屬性。隨著時間的推移,數(shù)據(jù)庫也會自行增長[39]。除了數(shù)據(jù)庫的大小,數(shù)據(jù)質(zhì)量篩選也是DL系統(tǒng)開發(fā)面臨的巨大問題,目前很少有DL系統(tǒng)投入到臨床應(yīng)用中。其主要原因是開發(fā)階段的DL系統(tǒng)缺乏對外部數(shù)據(jù)的嚴格評估,從而導致不符合實際的臨床應(yīng)用預期。
低質(zhì)量的圖像也是DL分析的一個問題。Chen等[40]提出了一個聯(lián)合框架,包括了一種名為通道融合遷移學習的新型遷移學習策略和一種名為SRFBN+的深度超分辨率框架,致力于生成以低分辨率為輸入的高分辨率片圖像。另外,病理學家的稀缺,也增加了數(shù)據(jù)清理和標記的難度,頭頸腫瘤的高異質(zhì)性使得許多罕見腫瘤需要準確標記。所以,需要建立一個統(tǒng)一的標準化多數(shù)據(jù)集的圖像輸入網(wǎng)絡(luò),減少樣本選擇和醫(yī)生診斷誤差造成的偏倚,減少DL訓練中影像學數(shù)據(jù)像素不足造成的識別偏倚[41]。
目前AI缺乏統(tǒng)一的創(chuàng)新評價標準。統(tǒng)一評價標準存在很多現(xiàn)實困難,需要在一些相對成熟的領(lǐng)域去完善。還涉及到一些數(shù)據(jù)管理領(lǐng)域,包括管理標準、患者隱私保護標準、知識產(chǎn)權(quán)保護標準等。數(shù)據(jù)管理標準的建立將允許訪問不同的匿名成像數(shù)據(jù)集。而數(shù)據(jù)技術(shù)標準化有助于克服一些技術(shù)障礙,例如使用不同的圖像歸一化或樣式轉(zhuǎn)換方法(如旋轉(zhuǎn)、剪切、縮放和基于圖像直方圖的修改)進行預處理。
CNN在圖像分析和處理方面功能強大。將WSI與DL算法結(jié)合用于腫瘤檢測、分類和預后預測,有助于病理學家進行臨床評估。CNN的主要成分是卷積層和池化層,它在處理目標檢測上有優(yōu)勢,也有一些缺點,包括訓練和檢測過程非常耗時,歸一化方法會丟失一些有區(qū)別的細節(jié)等。FCN適用于像素級的圖像分辨,它由卷積層和反卷積層組成,可以接受任意大小的輸入圖像,保留原始輸入信息;但FCN的缺點包括冗余信息,需要大量可靠的樣本。為了克服上述問題,人們提出了更多新的基于FCN或CNN的圖像分辨架構(gòu)(如UNet++、SegNet和ENet)。Pan等[42]提出了一種基于FCN架構(gòu)的DL模型,用于自動識別食管SCC的淋巴結(jié)轉(zhuǎn)移。與以往專注于病理和放射學圖像分析的孤立任務(wù)相比,該研究將獨立的DL模型集成到一個通用模型,大大提高了分析的效率和準確性。
隨著計算機技術(shù)的不斷進步以及臨床理論的逐步發(fā)展,我們相信在未來,DL技術(shù)能夠基于多組學分析,大大提高HNSCC的早期診斷靈敏度。此外,隨著代謝組學以及病理組學等與DL技術(shù)的不斷結(jié)合,未來有望依據(jù)大數(shù)據(jù)分析,對每位患者制定個性化的治療方案,提高局晚期患者的預后。針對手術(shù)治療,如果能夠建立算法透明,數(shù)據(jù)偏倚較小的手術(shù)視頻數(shù)據(jù)庫,有望實現(xiàn)全球范圍內(nèi)的手術(shù)計劃輔助設(shè)計,以及術(shù)中AI導航的智慧外科手術(shù),提高頭頸腫瘤外科醫(yī)生的手術(shù)水平,提高患者的生存質(zhì)量以及預后。