華瑩奇
作者單位:200443 上海交通大學附屬第一人民醫(yī)院骨科
大數(shù)據(jù)對腫瘤臨床研究有非常重要的意義,骨腫瘤病理亞型眾多,且發(fā)病率均不高,因此導(dǎo)致單一醫(yī)療機構(gòu)的病例數(shù)據(jù)量比較少,目前國內(nèi)一些大型的骨腫瘤診治中心也建立了一定規(guī)模的數(shù)據(jù)庫,如積水潭醫(yī)院的骨腫瘤數(shù)據(jù)庫[1],然而全國范圍的骨腫瘤登記系統(tǒng)及大數(shù)據(jù)庫仍然是空缺。
本期刊出的柳昌全等[2]回顧性分析 1995 年至 2014 年,來自 SEER 數(shù)據(jù)庫 1910 例四肢骨肉瘤患者,通過單因素 Log-rank 分析和多因素 COX 分析,找出存在統(tǒng)計學差異的預(yù)后因素,使用相應(yīng)的預(yù)后因素構(gòu)建列線圖,進而對患者 1、3、5 年的總生存期 ( overall survival,OS ) 和癌癥特異性生存期 ( cancer-specific survival,CSS ) 進行預(yù)測。然后對列線圖進行內(nèi)外部驗證,并且通過使用 C 指數(shù)為量化指標來計算模型的準確性,從而達到開發(fā)預(yù)后列線圖來預(yù)測四肢骨肉瘤患者的生存率的目標。研究發(fā)現(xiàn)骨肉瘤確診年齡、分期、手術(shù)狀態(tài)、大小和病理類型與患者的 OS 和 CSS 顯著相關(guān),并基于這些預(yù)后指標,構(gòu)建了能夠較準確預(yù)測四肢骨腫瘤患者 OS 和 CSS 的列線圖,進而可以幫助臨床醫(yī)生較精確地預(yù)測單個四肢骨肉瘤患者的生存概率。根據(jù)模型得出的結(jié)果,醫(yī)生可以對患者進行分層,制訂特異性的治療計劃,達到提高治療效果和改善患者預(yù)后的目的。該項研究使用 SEER 數(shù)據(jù)庫骨腫瘤患者的相關(guān)數(shù)據(jù)建模預(yù)測患者的預(yù)后并具有較高的準確性,對于骨肉瘤的臨床評估有積極的作用。由于數(shù)據(jù)來源和建模方式的有限性,無法全面綜合的對骨肉瘤患者進行預(yù)后評估。
利用大數(shù)據(jù)庫,采用機器學習的方法進行多因素分析,在研究中展現(xiàn)了優(yōu)勢,在骨腫瘤領(lǐng)域近年來也得到了應(yīng)用。Song 等[3]從 SEER 數(shù)據(jù)庫中提取 PNETs 病例數(shù)據(jù),在機器學習之前進行了統(tǒng)計描述,多元生存分析和預(yù)處理。在 SEER 數(shù)據(jù)庫中,將具有最佳預(yù)測準確性的模型與 AJCC 分期系統(tǒng)進行比較。研究發(fā)現(xiàn)機器學習開發(fā)的模型在 PNET 的生存預(yù)測中表現(xiàn)良好,并且 DL 模型在 SEER 數(shù)據(jù)中比 AJCC 分期系統(tǒng)具有更好的準確性和特異性。Ryu 等[4]使用監(jiān)視,流行病學和最終結(jié)果( SEER ) 數(shù)據(jù)庫來開發(fā)和驗證深度生存神經(jīng)網(wǎng)絡(luò)機器學習 ( ML ) 算法,以預(yù)測脊柱盆腔軟骨肉瘤診斷后的生存率。結(jié)果證實人工神經(jīng)網(wǎng)絡(luò) ML 算法是分析人群水平數(shù)據(jù),并評估手術(shù)切除和放射治療在脊柱盆腔軟骨肉瘤中作用和結(jié)果的有效手段。
Mishra 等[5]則使用卷積神經(jīng)網(wǎng)絡(luò)進行骨肉瘤組織的病理學分析并發(fā)現(xiàn)使用神經(jīng)網(wǎng)絡(luò)可以使分類的平均準確率更高,達到 92%。研究將其體系結(jié)構(gòu)與三種現(xiàn)有的經(jīng)過驗證的 CNN 體 系結(jié)構(gòu)進行圖像分類:AlexNet,LeNet 和 VGGNet,還提供了一個管道來計算給定整個病理圖像中的壞死百分比。研究表明神經(jīng)網(wǎng)絡(luò)的使用可以確保骨肉瘤分類的高準確性和高效率。
在影像學領(lǐng)域,深度學習的應(yīng)用更加廣泛成熟。X 線片、CT、MRI、核醫(yī)學影像等深度學習自動識別模型已經(jīng)進入深度開發(fā)階段,其中部分模型已進入臨床試驗階段,而對于骨腫瘤來說,圖像分割技術(shù)也至關(guān)重要。Arunachalam 等[6]使用機器學習和深度學習模型從骨肉瘤的影像評估可行和壞死的腫瘤。這項研究,利用組織病理學數(shù)字化技術(shù)和自動化學習技 術(shù)來評估骨肉瘤中的生存性和壞死性腫瘤。項目組訓練了 13 種機器學習模型,并根據(jù)報告的準確性選擇了性能最高的模型,并開發(fā)了深度學習架構(gòu),在相同的數(shù)據(jù)集上對其進行了訓練,計算了接收者 - 操作者的特征,以區(qū)分腫瘤中的非腫瘤,然后有條件地區(qū)分出存活腫瘤中的壞死細胞,同時使用訓練有素的模型來確定從測試整個幻燈片圖像生成的圖像平鋪上的感興趣區(qū)域,分類輸出可視化為腫瘤預(yù)測圖,在影像中顯示了可行和壞死的腫瘤范圍。研究發(fā)現(xiàn)該模型表現(xiàn)出色,為從原始組織學圖像到腫瘤預(yù)測圖生成的完整腫瘤評估流程奠定了基礎(chǔ)。
Zhang 等[7]使用多個監(jiān)督殘留網(wǎng)絡(luò)對 CT 圖像中的骨肉瘤進行分割,結(jié)果表明,MSRN 的骰子相似度系數(shù) ( DSC ) 為 89.22%,靈敏度為 88.74%,F(xiàn)1 度量值為 0.9305,更為準確的骨肉瘤圖像分割可以幫助醫(yī)生制定合理的治療方案,從而提高治愈率。
可見,對比傳統(tǒng)的統(tǒng)計學方法,人工智能尤其是深度學習在疾病診斷預(yù)后方面具有獨特的優(yōu)勢,可以更高效、高準確率的進行多因素分析。依靠飛速發(fā)展的計算機算力,可以借助人工智能提高臨床診療的效率、準確率并對疾病有更深入的了解。對于骨腫瘤來說,建立詳細、高度信息化的專病數(shù)據(jù)庫非常重要,迫切希望能夠建立全國范圍的這樣的數(shù)據(jù)庫,從而為臨床提供更多有用的指導(dǎo)性信息。