吳 琦,俞詠梅,周運(yùn)鋒,朱浩雨,謝紅灣
(皖南醫(yī)學(xué)院第一附屬醫(yī)院 弋磯山醫(yī)院 影像中心,安徽 蕪湖 241001)
目前,肺癌已成為世界上發(fā)病率和病死率最高的惡性腫瘤,腺癌是其最常見的病理類型[1]。由于部分肺腺癌患者確診時(shí)已為晚期以及肺腺癌易復(fù)發(fā)的特性,傳統(tǒng)治療手段并不一定能達(dá)到理想效果[2]。隨著精準(zhǔn)醫(yī)療的發(fā)展,人們發(fā)現(xiàn)表皮生長(zhǎng)因子受體(epidermal growth factor receptor,EGFR)是肺腺癌最常見的驅(qū)動(dòng)基因[3],酪氨酸激酶抑制劑(tyrosine kinase inhibitor,TKI)的成功應(yīng)用,開啟了晚期肺腺癌靶向治療的時(shí)代[4]。靶向藥物能有效提高基因敏感突變患者的生存率,改善生活質(zhì)量,但使用靶向藥物治療前,通常要進(jìn)行有創(chuàng)性基因檢測(cè)。大量研究發(fā)現(xiàn),影像組學(xué)通過定量分析圖像中的海量高維數(shù)據(jù),可以無創(chuàng)性地反映腫瘤內(nèi)部信息[5-6],從而預(yù)測(cè)腫瘤基因的表達(dá)[7]。本研究旨在探討基于CT平掃肺窗圖像的影像組學(xué)模型預(yù)測(cè)肺腺癌EGFR突變的可行性。
1.1 一般資料 回顧性分析2016年6月~2019年6月弋磯山醫(yī)院確診的156例有EGFR基因檢測(cè)結(jié)果的肺腺癌患者資料,其中EGFR突變型104例,男40例,女64例,平均年齡(62.68±12.65)歲;EGFR野生型52例,男38例,女14例,平均年齡(60.33±12.05)歲。所有病例隨機(jī)分為訓(xùn)練集和驗(yàn)證集,其中訓(xùn)練集共110例,EGFR突變型73例,野生型37例;驗(yàn)證集共46例,EGFR突變型31例,野生型15例。
納入標(biāo)準(zhǔn):①穿刺活檢或手術(shù)病理明確診斷為肺腺癌,且對(duì)病理組織行EGFR基因檢測(cè);②均行常規(guī)胸部CT平掃檢查,且圖像清晰;③入組前患者均未行任何抗腫瘤治療。排除標(biāo)準(zhǔn):病灶過小,無法提取完整的影像組學(xué)特征(即缺失值過多)。
1.2 CT掃描方法 采用Toshiba Aquilion16層螺旋CT行胸部平掃檢查,患者取仰臥位,雙手上舉,深吸氣后摒氣掃描,掃描范圍從胸廓入口至肺底。掃描參數(shù)為:管電壓120 kV,管電流250 mA,螺距5 mm,矩陣 512×512,層厚5mm,層間距5 mm,窗寬1 200 HU,窗位-600 HU。
1.3 圖像分割、圖像預(yù)處理及特征提取 由影像科A醫(yī)生(3年胸部影像診斷經(jīng)驗(yàn))將肺窗圖像導(dǎo)入ITK-SNAP處理軟件,沿病灶輪廓全層勾畫并融合成三維容積感興趣區(qū)(volume of interest,VOI),避開周圍血管、支氣管等(圖1)。 把所有原始圖像及含VOI的圖像導(dǎo)入AK(Analysis-Kinetics,version 3.2.0,GE healthcare)分析軟件進(jìn)行Z-score標(biāo)準(zhǔn)化,來降低不同特征之間的維度差異、灰度差異等。從標(biāo)準(zhǔn)化后的圖像中提取出6大類共396個(gè)特征,分別為直方圖特征、形態(tài)學(xué)特征、灰度共生矩陣特征、灰度游程長(zhǎng)度矩陣特征、灰度聯(lián)通大小矩陣特征及基于共生矩陣的紋理特征。
A.EGFR突變型肺腺癌CT平掃圖像;B.沿病灶邊緣全層勾畫VOI;C.融合成VOI;D.EGFR野生型肺腺癌CT平掃圖像;E.沿病灶輪廓全層勾畫VOI;F.融合成VOI。
按照上述方法,再隨機(jī)選取30例病例由A醫(yī)生和影像科B醫(yī)生(11年胸部影像診斷經(jīng)驗(yàn))分別重新勾畫VOI,得到相應(yīng)的影像組學(xué)特征,進(jìn)行觀察者間的重復(fù)性評(píng)估。
1.4 影像組學(xué)特征篩選及觀察者間重復(fù)性評(píng)估 使用R語言軟件(vesion 3.5.1)對(duì)提取的影像組學(xué)特征進(jìn)行篩選。先使用最大相關(guān)最小冗余(maximum relevant minimum reduandency,mRMR)算法對(duì)特征進(jìn)行排序,保留前15個(gè)影像組學(xué)特征。再采用最小絕對(duì)收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)算法及十折交叉驗(yàn)證對(duì)影像組學(xué)特征進(jìn)一步降維(圖2),獲得最佳影像組學(xué)特征,根據(jù)線性擬合方程構(gòu)建影像組學(xué)標(biāo)簽,計(jì)算影像組學(xué)得分。使用篩選后的影像組學(xué)特征構(gòu)建多因素logistic回歸模型。
A.LASSO降維示意圖;B.基于最低標(biāo)準(zhǔn)的十折交叉驗(yàn)證示意圖。保留B圖中垂直的黑色虛線定義的最優(yōu)值λ值對(duì)應(yīng)A圖中同位置的黑色虛線所選擇的11個(gè)特征。
通過計(jì)算組間相關(guān)系數(shù)(intraclass correlation coefficient,ICC)來評(píng)價(jià)觀察者之間的重復(fù)性。ICC>0.75為一致性很好。
2.1 觀察者間的重復(fù)性評(píng)估及特征篩選結(jié)果 A、B兩位醫(yī)生重復(fù)勾畫VOI得到的ICC為0.90(95%CI:0.76~0.96),>0.75,一致性較好。
提取的396個(gè)影像組學(xué)特征經(jīng)多重篩選后獲得11個(gè)最佳特征(表1),權(quán)重見表1、圖3。將最佳特征與對(duì)應(yīng)加權(quán)系數(shù)的乘積線性組合后獲得每位患者的影像組學(xué)標(biāo)簽。
表1 11個(gè)最佳影像組學(xué)特征
橫坐標(biāo)為特征所占權(quán)重,縱坐標(biāo)對(duì)應(yīng)不同影像組學(xué)特征,峰度、集群突出-全方向-補(bǔ)償4、集群陰影-45角度-補(bǔ)償7三者所占權(quán)重最大。
2.2 效能評(píng)估及驗(yàn)證 預(yù)測(cè)模型的ROC曲線見圖4,訓(xùn)練集AUC為0.83(95%CI:0.74~0.91),特異度、靈敏度分別為83.8%(31/37)、71.2%(52/73);驗(yàn)證集AUC為0.81(95%CI:0.66~0.96),特異度、靈敏度分別為73.3%(11/15)、87.1%(27/31),具有較好的預(yù)測(cè)效能。校準(zhǔn)曲線結(jié)果顯示,預(yù)測(cè)模型在訓(xùn)練集與驗(yàn)證集中紅色虛線與對(duì)角線基本保持一致,表明模型的預(yù)測(cè)值與觀測(cè)值之間具有較好的校準(zhǔn)度,一致性較好(圖5)。
A.訓(xùn)練集模型的AUC為0.83,預(yù)測(cè)效能較好;B.驗(yàn)證集模型的AUC為0.81,內(nèi)部驗(yàn)證效能較好。
A.訓(xùn)練集;B.驗(yàn)證集。紅色虛線與對(duì)角線基本保持一致,表明模型的預(yù)測(cè)值與觀測(cè)值之間具有較好的校準(zhǔn)度。
目前關(guān)于EGFR突變肺腺癌的治療研究已表明使用分子靶向治療后,EGFR敏感突變陽性患者較非突變患者呈現(xiàn)出明顯的生存優(yōu)勢(shì)[8-9],故確定肺腺癌患者EGFR基因是否突變是臨床采用靶向治療的首要前提。病理基因檢測(cè)是評(píng)估驅(qū)動(dòng)基因狀態(tài)的金標(biāo)準(zhǔn),但侵入性的活組織檢測(cè)費(fèi)用昂貴,有時(shí)取材過小,需重復(fù)進(jìn)行有創(chuàng)檢查,給患者增加負(fù)擔(dān)。
在精準(zhǔn)醫(yī)療背景下,影像組學(xué)成為近年來影像學(xué)研究的新熱點(diǎn)。既往大量研究表明[10-12],影像組學(xué)特征能夠反映腫瘤基因的表達(dá)模式。本研究獲得的11個(gè)影像組學(xué)特征,包括形態(tài)學(xué)特征、直方圖特征、紋理特征和灰度游程矩陣特征,對(duì)預(yù)測(cè)肺腺癌EGFR突變具有較好的效能。形態(tài)學(xué)特征主要反映病變的形狀與幾何特性等,EGFR突變型肺腺癌與野生型的生長(zhǎng)方式不同,突變型病變的緊致性高于野生型,即突變型肺腺癌形態(tài)更規(guī)則,而野生型更多表現(xiàn)出深分葉的特點(diǎn)[13-14],因此形態(tài)學(xué)特征有所不同。直方圖特征反映圖像中體素的分布,描述紋理的粗糙、規(guī)則性等;紋理特征和灰度游程矩陣特征描述的是灰度分布的均勻程度及紋理粗細(xì)復(fù)雜度等,以上特征主要反映病變的異質(zhì)性,可通過腫瘤的密度變化等影像征象體現(xiàn)出來。本研究結(jié)果顯示反映直方圖特征的峰度和紋理特征的集群突出物與集群陰影所占權(quán)重最大,對(duì)鑒別肺腺癌EGFR突變型與野生型具有重要的貢獻(xiàn)。峰度主要描述灰度分布的平坦度,集群突出物與集群陰影主要描述灰度分布的不對(duì)稱性。有文獻(xiàn)顯示EGFR突變型肺腺癌較野生型CT圖像的紋理溝紋淺、灰度整體分布較均勻[15];Lee等[16]報(bào)道EGFR突變型肺癌的磨玻璃密度影的體積百分比高于EGFR野生型。因此直方圖特征、紋理特征和灰度游程矩陣特征可以預(yù)測(cè)肺腺癌EGFR突變狀態(tài)。本研究通過分析影像組學(xué)特征,構(gòu)建影像組學(xué)模型,訓(xùn)練集AUC為0.83,說明影像組學(xué)模型能有效鑒別EGFR突變型與野生型肺腺癌;驗(yàn)證集AUC為0.81,進(jìn)一步驗(yàn)證了模型的效能。結(jié)果表明,影像組學(xué)與基因組學(xué)結(jié)合能夠有效預(yù)測(cè)肺腺癌EGFR基因突變,從而為臨床使用靶向藥物治療的決策提供新的輔助手段。
本研究存在一些局限性:①本研究是回顧性研究,樣本量較小,結(jié)果可能存在偏倚;②只探討了影像組學(xué)模型的預(yù)測(cè)效能,未來將加入臨床及影像資料進(jìn)行深入研究;③未進(jìn)行外部驗(yàn)證評(píng)估預(yù)測(cè)模型在新的臨床場(chǎng)景中的泛化能力。
綜上所述,基于CT平掃肺窗圖像的影像組學(xué)特征構(gòu)建的邏輯回歸模型能夠有效預(yù)測(cè)肺腺癌EGFR突變狀態(tài),指導(dǎo)臨床選擇靶向藥物治療,有利于個(gè)體化精準(zhǔn)醫(yī)學(xué)的實(shí)現(xiàn)。