楊虹 江海濤 邵國良
[摘要] 影像組學(xué)是通過計算機軟件從大量的影像圖像中提取定量特征,經(jīng)特征篩選和分析建模,從而實現(xiàn)對疾病進行診療的一種方法。自2012年影像組學(xué)概念的提出,越來越多的國內(nèi)外學(xué)者加入了影像組學(xué)的研究。目前,影像組學(xué)方法已經(jīng)涉及肺癌的的多方面研究,包括肺癌的診斷、分型和分期、基因表型預(yù)測、療效及預(yù)后評估。本文章對影像組學(xué)的研究內(nèi)容及其在肺癌中的應(yīng)用現(xiàn)狀與存在問題進行綜述,旨在提高對肺癌影像組學(xué)的認識。
[關(guān)鍵詞] 影像組學(xué);影像學(xué)特征;紋理分析;肺癌
[中圖分類號] R445;R730.44;R734.2? ? ? ? ?[文獻標識碼] A? ? ? ? ?[文章編號] 1673-9701(2019)20-0165-04
Application status and problems of radiomics in lung cancer
YANG Hong1,2? ?JIANG Haitao2? ?SHAO Guoliang1,2
1.The Second Clinical Medical College, Zhejiang University of Traditional Chinese Medicine, Hangzhou? ?310053, China; 2.Department of Radiology, Zhejiang Cancer Hospital, Hangzhou? ?310022, China
[Abstract] Radiomics is a method for extracting quantitative features from a large number of images through computer software, and realizing the diagnosis and treatment of diseases through feature screening and analysis modeling. Since the proposal of concept of radiomics in 2012, more and more scholars at home and abroad have joined the research of radiomics. Currently, radiomics methods have been involved in a variety of studies of lung cancer, including the diagnosis, classification and staging, gene phenotypic prediction, efficacy and prognosis assessment of lung cancer. This article reviews the research content of radiomics and its application status and existing problems in lung cancer, aiming to improve the understanding of lung cancer imaging omics.
[Key words] Radiomics; Imaging features; Texture analysis; Lung cancer
近年來,隨著影像設(shè)備和檢查技術(shù)的快速發(fā)展,影像診斷已成為疾病管理中不可缺少的環(huán)節(jié),在疾病的臨床診療中發(fā)揮著舉足輕重的作用。2011年,美國醫(yī)學(xué)界首次提出“精準醫(yī)學(xué)”[1]的概念,以個體化醫(yī)療為基礎(chǔ),通過基因組學(xué)、蛋白質(zhì)組學(xué)等技術(shù),為患者量身定制最佳治療方案,以達到治療效果最大化和副作用最小化的目的。在此基礎(chǔ)上,影像組學(xué)應(yīng)運而生。2012年Lambin等[2]首次提出了影像組學(xué)的概念,目的旨在通過影像組學(xué)方法定量全面的評價疾病的性質(zhì),實現(xiàn)疾病的個體化醫(yī)療。
肺癌是世界上發(fā)病率和死亡率最高的惡性腫瘤,如果在肺癌發(fā)展的前期做到早發(fā)現(xiàn)、早診斷、早治療,可使患者的病情得到控制,能夠有效的延長患者的生存時間。影像學(xué)檢查是目前臨床上肺癌早期篩查、診斷及療效評估的主要方法。因此,影像組學(xué)在肺癌中的應(yīng)用成為研究熱點。現(xiàn)階段,影像組學(xué)已經(jīng)對肺癌進行了初步探索,其中包括肺癌的診斷、治療選擇、療效及預(yù)后評估等方面。
1影像組學(xué)的研究內(nèi)容
1.1影像組學(xué)的概念
影像組學(xué)(Radiomics)指借助計算機軟件高通量地從CT(Computed tomography,CT)、MRI(Magnetic resonance imaging,MRI)、PET(Positron emission tomography,PET )等影像圖像中提取定量的影像學(xué)特征,經(jīng)特征篩選和分析建模,從而實現(xiàn)對疾病進行診療的一種方法[2]。與傳統(tǒng)的活檢提取腫瘤組織樣本相比,影像組學(xué)方法具有獨特的優(yōu)勢:①影像組學(xué)方法采取無創(chuàng)的影像學(xué)檢查手段,不需要對患者進行有創(chuàng)的組織活檢,在一定程度上可以減輕患者的痛苦;②影像組學(xué)方法可以反映腫瘤的整體特征,包括形態(tài)學(xué)特征、直方圖特征和紋理特征,而非局限于活檢所得的部分腫瘤組織樣本,可以更好的了解腫瘤本身;③影像學(xué)檢查是臨床上常規(guī)使用的檢查方法,其貫穿于臨床病例的診斷、治療及隨訪的全過程,可重復(fù)檢查。
1.2影像組學(xué)的操作流程
影像組學(xué)的流程主要包括數(shù)據(jù)采集、圖像分割、特征提取、特征選擇及模型構(gòu)建[3]和評價。數(shù)據(jù)采集包括患者的影像圖像、臨床信息、基因及病理信息。圖像分割即提取感興趣區(qū)域(region of interest,ROI)。通常,感興趣區(qū)域可以是腫瘤原發(fā)灶、轉(zhuǎn)移灶或特定的解剖結(jié)構(gòu)。多個連續(xù)層面的感興趣區(qū)域經(jīng)三維容積重組生成興趣容積(Volum e of interest,VOI)。ROI的分割方法有三種,包括手動分割、半自動分割和自動分割法,研究者可根據(jù)對精度及時間的需求進行選擇。目前,在非小細胞肺癌中半自動分割法最常用[4]。
特征提取是影像組學(xué)的核心步驟,其中常用的特征包括以下三大類:①形態(tài)學(xué)特征,即通過提取腫瘤的三維表面信息來描述腫瘤的幾何形狀,如表面積、體積、致密性和球面性等;②直方圖特征,即將病灶的三維數(shù)據(jù)轉(zhuǎn)換成單一的直方圖來表示每個體素的值,可計算均值、中位數(shù)、方差、偏度、峰度等;③紋理特征,即影像灰度在空間上的變化和重復(fù)?,F(xiàn)階段紋理分析方法多種多樣,其中基于統(tǒng)計紋理分析的灰度共生矩陣最為常用,該方法可以計算同質(zhì)度、對比度、非相似性、相關(guān)性、熵和能量等參數(shù)[5-8]。特征提取可產(chǎn)生數(shù)百個原始特征,并非所有的特征都具有統(tǒng)計學(xué)意義,這就需要研究者對這些特征進行選擇。目前,常用的特征選擇方法包括方差分析、秩和檢驗、相關(guān)性檢驗、主成分分析、LASSO方法等。
經(jīng)過上述一系列操作,研究者選擇性的剔除無用、冗余的特征,留下最具預(yù)測價值的關(guān)鍵特征構(gòu)建分類或回歸模型,并通過模型的內(nèi)部和外部驗證,評估模型是否具有預(yù)測性?,F(xiàn)階段常用的模型包括Logistic回歸、支持向量機(Support vector machine, SVM)、K-最鄰近、決策樹、隨機森林、樸素貝葉斯、神經(jīng)網(wǎng)絡(luò)等[9-10]。研究過程中依據(jù)研究目的不同選擇合適的模型。在模型評價方面,受試者工作特征(Receiver operating characteristic,ROC)曲線能較好的反映模型的靈敏度和特異度[11],ROC曲線下的面積(Area under the curve,AUC)越接近于1說明模型效能越好。
2 影像組學(xué)在肺癌中的應(yīng)用
2.1肺癌的診斷
據(jù)《2018全球癌癥報告》顯示,全球肺癌新發(fā)病例數(shù)210萬,占癌癥總發(fā)病率的11.6%,肺癌死亡病例數(shù)180萬,占癌癥總死亡率的18.4%,穩(wěn)居于癌癥發(fā)病率及死亡率的第一位[12]。相關(guān)研究表明,若能及早發(fā)現(xiàn)肺癌并積極治療,5年存活率可從14%上升至49%[13],存活率得到顯著提高。Choi W[14]等通過影像組學(xué)建立SVM-LASSO模型預(yù)測低劑量CT中肺結(jié)節(jié)的良惡性,并與美國放射學(xué)會(American College of Radiology,ACR)肺CT篩查報告和數(shù)據(jù)系統(tǒng)(Lung CT screening reporting and data system,Lung-RSDS)的準確率進行比較。相比之下,Lung-RADS的準確率為72.2%,而SVM-LASSO模型準確率達84.1%。Bray F等[12]對肺結(jié)節(jié)惡性程度進行預(yù)測,對于單個肺結(jié)節(jié),5類惡性程度的平均預(yù)測準確率為77.85%。上述研究展現(xiàn)了影像組學(xué)對肺結(jié)節(jié)良惡性預(yù)測的可行性,對早期肺癌診斷率的提高有一定的臨床價值。
2.2肺癌的分期和分型
相關(guān)研究表明,肺癌的術(shù)前分期及病理分型對臨床治療計劃的制定有重要意義,研究者從該方向入手,將影像組學(xué)應(yīng)用于肺癌的分期和分型。何蘭等[15]回顧性分析了657例非小細胞肺癌(Non-small cell lung cancer,NSCLC)患者的術(shù)前CT圖像,對肺癌臨床分期(早、晚期)進行預(yù)測,結(jié)果訓(xùn)練集AUC為0.787,驗證集AUC為0.777,表明影像組學(xué)對NSCLC患者的臨床分期具有較好的預(yù)測效能。Zhu X[16]等通過影像組學(xué)方法對肺癌組織學(xué)亞型進行預(yù)測,提取了5個最相關(guān)特征建立LASSO回歸模型,結(jié)果訓(xùn)練集AUC為0.905(靈敏度0.830,特異度0.929),驗證集AUC為0.893(靈敏度0.828,特異度0.929)。事實證明,影像組學(xué)可以通過提取定量的影像學(xué)特征,對肺癌組織學(xué)分型進行預(yù)測。Chen X等[17]通過影像組學(xué)方法對非小細胞肺癌患者腫瘤的分化程度進行預(yù)測,該研究回顧性分析了487例病理證實的NSCLC患者的術(shù)前CT圖像,共提取591個影像組學(xué)特征,采用最小冗余最大相關(guān)算法進行特征選擇并構(gòu)建Logistic回歸模型,結(jié)果顯示訓(xùn)練集AUC=0.763(靈敏度=0.750,特異度=0.665),驗證集AUC=0.782(靈敏度=0.608,特異度=0.752),表明影像組學(xué)特征可用于區(qū)分非小細胞肺癌的分化程度。
2.3肺癌的基因表型預(yù)測
腫瘤異質(zhì)性表現(xiàn)為影像學(xué)特征的不同,并與腫瘤的基因表達息息相關(guān),故影像學(xué)特征能夠反映腫瘤基因的表達模式。Zhou M等[18]通過影像組學(xué)方法與基因富集分析法結(jié)合,證實腫瘤影像學(xué)特征與腫瘤基因表達模式顯著相關(guān)。Li Y等[19]對比分析了不同CT掃描重建參數(shù)的影像組學(xué)特征對肺腺癌EGFR(Epithelial growth factor receptor,EGFR)突變狀態(tài)的預(yù)測價值,結(jié)果表明薄層光滑重建模型具有最佳預(yù)測性能,AUC為0.83。Zhou B等[20]對肺癌增強CT圖像的影像學(xué)特征與Ki-67增殖指數(shù)的相關(guān)性進行了初步研究,結(jié)果表明12個影像學(xué)特征與肺癌Ki-67表達狀態(tài)顯著相關(guān)。影像組學(xué)對肺癌基因表型的預(yù)測,有利于協(xié)助臨床醫(yī)師的診斷及治療方案的選擇。
2.4 肺癌的療效評估
肺癌的時間和空間異質(zhì)性導(dǎo)致其治療過程的復(fù)雜且治療效果難以預(yù)測,常需根據(jù)具體情況實時調(diào)整治療方案。目前,腫瘤療效評估往往依賴于影像學(xué)檢查。相比于傳統(tǒng)的影像學(xué)檢查,影像組學(xué)方法能夠更好地展現(xiàn)腫瘤的空間異質(zhì)性,有利于協(xié)助臨床醫(yī)師選擇最佳的治療方案并實時監(jiān)測其療效。Li Q等[21]和Zhou Z等[22]均使用影像組學(xué)方法對肺癌放療后的療效進行評估,結(jié)果表明該方法對肺癌放療療效評估有一定的臨床價值。Coroller TP等[23]對182例肺腺癌患者的CT圖像進行紋理分析,其中訓(xùn)練集98例,驗證集84例,結(jié)果表明有35個影像學(xué)特征與遠處轉(zhuǎn)移顯著相關(guān)。Lafata KJ等[24]對70例接受SBRT(Stereotactic body radiation therapy)治療的I期非小細胞肺癌患者治療前的CT圖像進行分析,從中提取43個定量影像學(xué)特征,單因素特征分析表明同質(zhì)性(P=0.022)和長程高灰階強調(diào)(P=0.048)這兩個特征與肺癌的放療后局部復(fù)發(fā)顯著相關(guān)。影像組學(xué)通過影像數(shù)據(jù)的定量分析,展現(xiàn)了腫瘤的整體特征,對腫瘤的療效評估具有重要意義。
2.5 肺癌的預(yù)后預(yù)測
Lee G等[25]和Bianconi HF等[26]對肺癌CT影像學(xué)特征和患者預(yù)后的相關(guān)性進行研究,結(jié)果均表明肺癌CT影像學(xué)特征可作為生物標志物對患者預(yù)后進行評估。Hosny A等[27]通過卷積神經(jīng)網(wǎng)絡(luò)對肺癌治療后2年生存期進行預(yù)測,結(jié)果顯示放療組AUC為0.70,手術(shù)組AUC為0.71,表明肺癌的影像組學(xué)特征與腫瘤預(yù)后顯著相關(guān)。Chaddad A等[28]探討了影像學(xué)特征對特定NSCLC亞型和TNM(Tumor node metastasis)不同階段患者的生存預(yù)測,結(jié)果分析發(fā)現(xiàn)大細胞型、N0、T2、TNM-I期肺癌其各自的影像學(xué)特征與患者生存時間顯著相關(guān),其AUC分別為75.73%、70.33%、70.28%、76.17%。研究表明,影像組學(xué)定量評估可以提供非侵入性的預(yù)后生物標志物,且較傳統(tǒng)影像學(xué)更能準確預(yù)測患者預(yù)后。
3影像組學(xué)的挑戰(zhàn)及展望
影像組學(xué)是一個極具發(fā)展?jié)摿Φ男骂I(lǐng)域,其提出極大的推動了精準醫(yī)療的發(fā)展。然而,作為一種新技術(shù),影像組學(xué)的研究應(yīng)用尚處于起步階段,仍存在一些問題需進一步解決。
3.1數(shù)據(jù)標準化
在圖像采集和重建時,不同設(shè)備的成像參數(shù)及重建算法不同,對后續(xù)特征計算及模型構(gòu)建造成嚴重影響。圖像的層厚影響噪聲水平及圖像清晰度,重建算法影響圖像的紋理特征[29]。因此,在圖像采集的過程中,如何選擇合適的技術(shù)參數(shù)及重建算法并將其標準化是關(guān)鍵問題。
3.2可重復(fù)性
在圖像分割方面,三種圖像分割方法的可重復(fù)性各不相同。手動分割方法的可重復(fù)性較低,且需耗費大量時間和人力,并易受操作者主觀因素的影響,但其優(yōu)點在于分割的精確度高。而自動分割方法雖可重復(fù)性高,操作起來省時方便,但精確度卻不及手動分割。半自動分割方法介于兩者之間,是現(xiàn)階段較為常用的分割方法[9]。如何在高重復(fù)性的情況下提升圖像分割精確度是影像組學(xué)未來的發(fā)展方向之一。
模型的可重復(fù)性即模型的穩(wěn)定性。研究者通過統(tǒng)計學(xué)習(xí)或機器學(xué)習(xí)的方法建立模型,其中數(shù)據(jù)過擬合和欠擬合都將直接影響模型的穩(wěn)定性,降低模型的泛化能力[30]。如何提高模型的穩(wěn)定性是影像組學(xué)后續(xù)努力的方向。
3.3樣本量
影像組學(xué)的本質(zhì)是通過計算機軟件從大量的影像圖像中提取定量的特征進行分析建模,故充足的樣本量是建立影像組學(xué)模型的前提?,F(xiàn)階段,仍有較大一部分影像組學(xué)研究是小樣本回顧性研究,而樣本數(shù)量不足往往會出現(xiàn)數(shù)據(jù)過擬合問題,同時降低了模型的準確率[9]。
3.4 多中心
目前,許多影像組學(xué)研究仍是單中心研究。研究者只收集了某醫(yī)療中心的患者資料構(gòu)建影像組學(xué)模型,且不同醫(yī)療中心的研究結(jié)果存在不同程度的差異,從而患者的人群普適性不高,阻礙了影像組學(xué)在臨床上的推廣。未來研究者需積極推廣大樣本量的多中心研究,以此建立重復(fù)性和準確性較高的模型,實現(xiàn)影像組學(xué)的臨床應(yīng)用[31]。
當今,深度機器學(xué)習(xí)和人工智能正如火如荼的開展,我們應(yīng)該妥善利用當下的流行趨勢,將其與影像組學(xué)完美結(jié)合,推動影像組學(xué)更深一步發(fā)展。相信隨著影像組學(xué)的不斷發(fā)展和創(chuàng)新,影像組學(xué)將會對疾病的診斷、個體化治療及預(yù)后乃至整個醫(yī)學(xué)的發(fā)展產(chǎn)生深遠的意義和巨大的變革。
[參考文獻]
[1] Listed N. Moving toward precision medicine[J]. Lancet,2011,378(9804):1678-1678.
[2] Lambin P,Riosvelazquez E,Leijenaar R,et al. Radiomics:Extracting more information from medical images using advanced feature analysis[J]. Eur J Cancer,2012,48(4):441-446.
[3] Gillies RJ,Kinahan PE,Hricak H. Radiomics:Images are more than pictures,they are data[J]. Radiology,2016, 278(2):563-577.
[4] 孫航,李宏,張亭亭,等. Radiomics方法研究應(yīng)用進展[J].腫瘤,2017,37(10):1092-1099.
[5] Lee J,Nishikawa RM, Reiser I, et al. Local curvature analysis for classifying breast tumors: Preliminary analysis in dedicated breast CT[J]. Med Phys,2015,42(9):5479-5789.
[6] Virmani J,Kumar V,Kalra N, et al. SVM-based characterization of liver cirrhosis by singular value decomposition of GLCM matrix[J]. International Journal of Artificial Intelligence & Soft Computing,2013,3(3):276-296.
[7] Kumar P,Anwar MI. Brain tumor and CAD through MRI by using wavelet transform and genetic algorithm[J]. J Inform Eng Appl,2014,4(4):52-60.
[8] 張娜,鄂林寧,吳山,等. CT紋理分析技術(shù)鑒別良惡性孤立性肺結(jié)節(jié)[J]. 中國醫(yī)學(xué)影像技術(shù),2018,34(8):1211-1215.