陳思騰, 鄭軍華
精準醫(yī)學時代的到來為臨床醫(yī)學的發(fā)展提供了更多先進的研究手段。精準醫(yī)學之所以在癌癥研究中舉足輕重,主要的原因就在于它可以根據個體腫瘤的特征,為患者匹配相應的治療并預測其治療效果。人工智能(artificial intelligence)作為計算機科學的一個分支,通過模擬人類智能的算法,使用以深度學習(deep learning)為代表的智能算法對醫(yī)學大數據資源進行挖掘、提取和擬合,以提高臨床診療的精準度和有效性,正逐步滲透到精準醫(yī)學的研究領域[1-3]。人工智能與醫(yī)學研究相結合是生物醫(yī)學領域研究的重點方向之一,尤其是腫瘤影像組學(radiomics)和病理組學(pathomics)的運用,恰好為臨床醫(yī)師的診療提供了更加精準的輔助手段[4-5]。近年來在腎癌的研究領域,人工智能得到了快速發(fā)展,并取得了豐碩的成果。作為異質性極高的惡性腫瘤,腎癌的病理類型多樣,患者的治療效果和臨床預后也存在著明顯的個體化差異。人工智能基于個體化醫(yī)學大數據的方法和技術恰好能為腎癌的個體化診療提供重要的支持。本文就人工智能近年來在腎癌診療中的研究和初步運用進行綜述,以期為廣大同行提供參考和新的啟發(fā)。
高通量測序是近年來高速發(fā)展的一項重要技術。以美國癌癥基因組圖譜計劃(the Cancer Genome Atlas,TCGA)為代表的多中心、大型癌癥基因組項目為腎癌基因組學、轉錄組學的研究奠定了重要基礎[6-7]。Wang等[8]利用TCGA數據庫中1 020例腎細胞癌患者和復旦大學上海癌癥中心129例腎癌患者的測序及定量聚合酶鏈式反應(polymerase chain reaction,PCR)數據,通過機器學習算法開發(fā)并驗證了基于44個關鍵基因的腎癌分類模型,精準識別腎癌亞型。通過機器學習算法開發(fā)的糖酵解相關腎癌基因標簽有望成為腎癌的有效生物標志物[9]。此外,基于多組學數據的人工智能分析也有助于鑒定出新的腎癌特異性表觀遺傳特征,為腎癌發(fā)生機制和治療靶點的進一步探索提供新的思路[10]。臨床上,1/3的腎癌患者發(fā)現時已經出現遠處轉移,1/4接受根治性腎切除術的腎癌患者也會出現復發(fā)轉移[11-12]。基于高通量測序數據,人工智能逐步被用于開發(fā)腎癌預后相關的臨床模型。氧化還原在腎臟腫瘤的發(fā)生、發(fā)展中起著至關重要的作用,有研究者利用機器學習的方法基于氧化還原相關長鏈非編碼RNA構建了腎透明細胞癌(clear cell renal cell carcinoma,ccRCC)生存預測模型,可有效預測ccRCC患者的臨床預后情況[13]。N6-腺苷酸甲基化(N6-methyladenosine,m6A)修飾是真核細胞中最重要的基因轉錄后修飾之一,目前已被證實與多種惡性腫瘤的發(fā)生、發(fā)展密切相關[14-15]。國內學者利用轉錄組測序數據和機器學習算法,基于7個m6A甲基化調控關鍵基因構建了ccRCC預后預測模型,可以準確地識別術后存在生存高危風險的腎癌患者。結合病理特征,該智能預測模型對腎癌患者術后1年、3年、5年的生存預測準確率可以達到85.2%、82.4%和78.3%[16]。此外,基于機器學習的多組學智能分析可有效預測腎乳頭狀細胞癌的分期,并為早期癌癥的篩查提供一種新的思路[17]。
臨床上超過一半的腎臟腫瘤為惡性病變,仍有25%~40%的腫瘤性質為良性,包括血管平滑肌、腎纖維瘤、囊腫等[18]。如何準確、快速地鑒別腎臟良、惡性腫瘤目前仍是臨床上面臨的一個重要問題。病理檢測一直是鑒別良、惡性腫瘤的金標準,但是病理活檢存在有創(chuàng)性、種植轉移風險等弊端。此外,對于微小腎臟腫瘤的病理活檢亦不易進行。影像學檢查作為臨床上最常見的無創(chuàng)性檢查,可輔助醫(yī)師實現對腫瘤病變的初步評估。但是目前這些檢查尚缺乏定量標準,且在腎癌的臨床診斷、治療和預后評估方面受限于影像學方法的局限性、腫瘤組織的影像表現及診斷醫(yī)師的經驗。影像組學的概念于2012年由荷蘭學者首次提出,其利用特征提取和人工智能技術,構建對醫(yī)學影像大數據進行定量分析和預測的有效方法。影像組學試圖對腫瘤宏觀影像特征與微觀基因、蛋白質和分子改變建立一種分析模型,通過修改網絡的結構可從數據中學習得到更具有針對性的特征,結合神經網絡算法的特點,形成基于深度學習網絡的影像組學算法[19]。相比于傳統(tǒng)病理化驗及熒光原位雜交等昂貴、費時的檢查,影像組學可以通過非侵入性的三維方式捕獲腫瘤內異質性,實現無創(chuàng)分子分型[20],并優(yōu)化術前治療策略[21],為腎癌的臨床診斷、療效評估和生存預測等提供便捷的指導。國外學者將計算機輔助檢查與人工智能相結合,構建了腎癌自動深度特征分類模型,利用CT影像可以對腎細胞癌和血管平滑肌瘤進行自動鑒別,準確率達到76%[22]。Feng等[23]采用支持向量機(support vector machine,SVM)聯合遞歸特征消除的方法評估CT圖像的定量紋理特征,構建了識別分類器,實現了對無可見脂性成分小血管平滑肌脂肪瘤與腎細胞癌的鑒別診斷,準確率最高可達93.9%。Erdim等[24]基于隨機森林算法對腎臟CT圖像進行紋理分析并構建腎臟良、惡性腫瘤分類器,其受試者工作特征曲線(receiver operating characteristic curve,ROC)的曲線下面積(area under curve,AUC)可達90.5%。此外,對小腎臟腫瘤CT圖像上的紋理特征進行機器學習對比分析后發(fā)現,平掃圖像上的影像組學特征可能優(yōu)于增強圖像,有望在提高小腎癌診斷準確性的同時降低患者檢查時所接受的CT輻射劑量[25]。腎細胞癌的病理類型多樣,包括ccRCC、腎乳頭狀細胞癌、腎嫌色細胞癌、腎嗜酸性細胞瘤等,且不同類型的腎細胞癌預后差異較大,使得臨床上對腎癌不同亞型病變的準確鑒別顯得格外重要。多項研究表明,腎臟皮質期影像紋理特征更有助于腎癌不同病理類型的分型診斷[26-28]。由于ccRCC預后較其他亞型的腎癌更差,所以非侵入性地鑒別ccRCC在臨床實踐中顯得更加重要[29]。Kocak等[27]利用卷積神經網絡(convolutional neural networks,CNN)在一個94例腎癌患者組成的隊列中構建了基于CT影像的ccRCC識別模型,對ccRCC的鑒別表現良好。Sun等[30]也構建了基于機器學習算法的診斷模型,并進行了10倍交叉驗證,證實了該模型從腎乳頭狀細胞癌和腎嫌色細胞癌中區(qū)分ccRCC的準確率達89.8%。然而,基于隨機森林算法的MRI影像組學模型對于ccRCC的診斷準確率僅為77.9%[31]。此外,Pedersen等[32]基于CNN構建了非侵入性CT成像模型,可高效地識別腎嗜酸性細胞瘤,準確率可達90.0%~93.3%。而基于SVM算法的監(jiān)督學習也可以實現對腎臟皮質期、髓質期與排泄期紋理的差異特征分析,指導臨床醫(yī)師更好地鑒別腎嫌色細胞癌和腎嗜酸性細胞瘤[33]。Fuhrman核分級系統(tǒng)是目前腎癌最常用的腫瘤分級方法,但是目前只能通過術后病理或穿刺病理活檢進行評估。此外,該方法需要觀察者同時評估細胞核大小、形狀和核仁特征,因此很大程度上受限于觀察者的經驗和觀察視野的選擇。人工智能結合CT影像的紋理分析可實現對不同Fuhrman分級的ccRCC的無創(chuàng)性鑒別,AUC可達82.6%~84.3%[34]。此外,Coy等[35]發(fā)現腎癌分級與CT影像的強化程度呈負相關,這可能是由于Fuhrman分級與腫瘤內微血管密度的相關性導致的,為影像組學的無創(chuàng)性分類診斷運用提供了一定的理論基礎。Shu等[36]則基于機器學習算法構建了影像組學模型來評估腎癌世界衛(wèi)生組織國際泌尿病理學會(International Society of Urological Pathology,ISUP)分級系統(tǒng),AUC可達到90.1%~97.6%,有望成為腎癌可靠的無創(chuàng)預后預測指標。此外,基于MRI圖像的機器學習模型識別腎癌ISUP級別的AUC僅為71%~74%[37],提示我們可能基于CT圖像的影像組學分析更有利于預測腎癌核分級。
傳統(tǒng)的病理學檢查是由病理醫(yī)師借助顯微鏡通過肉眼觀察組織或細胞形態(tài)上的改變,再根據自身經驗作出病理學的診斷,但往往都是定性或者半定量的診斷結果。更加精準、便捷的病理診斷有賴于“新型”病理學技術的開展。病理組學的概念是近幾年逐漸興起的新型深度學習模式。組織結構中的像差是癌癥診斷和腫瘤分級的重要指標。因此,異常表型特征的提取和組織學分類可以為計算機輔助病理學提供重要參考數據。2018年發(fā)表的一項腎癌案例研究[38],利用CNN分析蘇木精-伊紅染色法(hematoxylin-eosin staining,HE)染色的組織學切片,研發(fā)對腫瘤深度網絡分級模型和腫瘤結構的分類模型。訓練集中的樣本圖像分為正常、脂肪、血液、基質、低度粒狀腫瘤和高度透明細胞癌六類。該研究比較了深層網絡和淺層網絡的性能,實驗表明深層網絡優(yōu)于淺層網絡,腫瘤分級模型和腫瘤結構分類模型可應用于存活率的預測。目前已有多項研究報道了人工智能在腎癌核級分類中的運用,其中基于SVM算法的ccRCC核級分類系統(tǒng)結合了梯度變化和數學形態(tài)學,通過對腎臟顯微圖像進行整體的評估來預測腎癌的Fuhrman分級,準確率高于90%,為促進腎癌病理組學的研究提供了良好的思路[39]。Holdbrook等[40]開發(fā)的核級分類系統(tǒng)則聚焦于腎癌中核仁的病理形態(tài)表現,可準確區(qū)分高、低級別的腎細胞癌。病理圖像中的細胞核形態(tài)對于癌癥的診斷和預后預測起著非常重要的作用。國內學者基于HE染色病理圖像,創(chuàng)新性地運用機器學習的方法,開發(fā)并驗證了一種基于機器學習的ccRCC人工智能生存預測模型,識別術后高風險患者,為臨床醫(yī)師的術后輔助治療決策提供了有效的指導意見[41]。Cheng等[42]從病理圖像中提取腎癌細胞核的拓撲特征,構建了腎乳頭狀細胞癌預后預測模型,通過不同形態(tài)細胞的空間分布來探究潛在的預后生物標志物?;诓±韴D像的聯合組學研究也在腎癌中陸續(xù)開展,進一步地探究腫瘤形態(tài)學和基因組學特征之間的關系。國內學者對腎癌全切片病理圖像中提取的細胞形態(tài)學特征與基因組數據中提取的共表達特征基因進行關聯分析,利用病理組學和基因組學聯合的雙組學數據構建智能模型來預測ccRCC患者的生存預后,顯著地提高了現有模型的預后預測能力[43]。而基于交叉模態(tài)特征的整合框架則利用神經網絡從病理圖像中提取深度特征,并與功能基因組數據相結合,構建ccRCC預后模型,可以顯著區(qū)分高、低風險的腎癌患者,一致性指數高達0.808[44]?;跈C器學習的腎癌病理組學分析還有望進一步預測免疫反應、細胞外基質重建和細胞代謝等生物學功能,為組織病理學和蛋白質組學的整合分析提供了新的見解[45]。
盡管人工智能技術在腎癌的診療中已經得到大量的研究和初步的運用,但是現有的研究還存在以下幾點不足:(1)當前研究主要聚焦于腎癌的診斷以及簡單的臨床預后預測,針對腎癌靶向治療、腫瘤免疫治療等療效預測的影像組學和病理組學研究還未涉及;(2)目前所發(fā)表的腎癌影像組學研究更多涉及CT圖像,關于腎癌MRI影像組學分析則少有報道;(3)當前的報道多為單中心研究的結果,可能存在病例數量過少、數據偏倚等缺陷。靶向治療是治療晚期腎癌的主要方式。其中舒尼替尼作為晚期或者進展性腎癌患者的一線治療用藥,能夠顯著縮減腫瘤體積并改善患者預后。但晚期腎癌患者對舒尼替尼的客觀反應率只有40%左右,甚至后期還可能出現耐藥和疾病進展,給患者家庭和社會帶來沉重的負擔[46-47]。所以,關于腎癌靶向藥效評價的生物標志物以及患者的選擇性一直是該領域的研究重點。隨著研究的進一步深入,人工智能技術有望在腎癌靶向藥效評價方面開創(chuàng)一條新的道路。未來仍需開展大規(guī)模、多中心研究進一步驗證人工智能在腎癌診療領域中的應用價值。