甄濤 王羅羽 沈起鈞
肺癌為我國常見的惡性腫瘤之一,其中非小細胞肺癌(non-small cell lung cancer,NSCLC)約占所有肺癌的85%[1-2]。目前研究發(fā)現(xiàn)表皮生長因子受體(epidermal growth factor receptor,EGFR)基因是驅(qū)動NSCLC發(fā)病的最常見突變基因[3]。它是一種酪氨酸激酶受體,部分靶向藥物能有效抑制其活性,例如對于EGFR基因突變相關(guān)腫瘤,吉非替尼治療有效率高達80%以上[4]。因此在靶向治療前明確腫瘤的基因型至關(guān)重要,然而并不是所有病灶都適合通過活檢來獲得有代表性的組織學(xué)標(biāo)本。而且由于腫瘤的異質(zhì)性,穿刺組織標(biāo)本也不能完全反映病灶的表型和遺傳變異。雖然,體液檢測可以獲得血漿中的突變基因,但當(dāng)腫瘤較小,沒有足夠量的DNA脫落到循環(huán)血液中時,突變基因常會被遺漏[5]。目前一些國內(nèi)外研究顯示,基于胸部CT的影像組學(xué)對于EGFR基因突變狀態(tài)有一定的預(yù)測價值[5-8]。因此,筆者通過CT影像組學(xué)、圖像語義特征及臨床資料的列線圖對NSCLC EGFR基因突變狀態(tài)進行鑒別及預(yù)測,旨在為臨床診斷及治療提供更為便捷、有效的方法,現(xiàn)報道如下。
1.1 對象 回顧2019年1月至2020年8月杭州市第一人民醫(yī)院經(jīng)手術(shù)病理檢查證實為NSCLC患者235例。納入標(biāo)準(zhǔn):(1)術(shù)前有胸部CT檢查資料;(2)術(shù)后病理證實為NSCLC,且有EGFR基因檢查結(jié)果;(3)其他臨床資料齊全;(4)結(jié)節(jié)直徑≥0.5 cm。排除標(biāo)準(zhǔn):(1)術(shù)前接受過放化療及靶向治療;(2)既往有肺癌病史的復(fù)發(fā)患者;(3)圖像質(zhì)量不佳,影響病灶勾畫;(4)病灶貼近縱隔大血管,影響勾畫。排除無EGFR基因檢測結(jié)果52例,結(jié)節(jié)直徑<0.5 cm 5例,術(shù)前接受過治療3例,腫瘤復(fù)發(fā)5例,CT圖像質(zhì)量不佳9例,結(jié)節(jié)靠近縱隔大血管8例,最終納入153例,其中男48例,女105例,年齡 29~79(59.2±10.4)歲。收集患者的年齡、性別、吸煙史、肺癌相關(guān)腫瘤指標(biāo)等臨床資料。本研究經(jīng)本院醫(yī)學(xué)倫理委員會批準(zhǔn),所有患者均簽署知情同意書。
1.2 CT檢查方法 采用美國GE Lightspeed VCT 16排螺旋CT掃描儀進行胸部掃描,準(zhǔn)直器0.625 mm,F(xiàn)OV 350 mm ×350 mm,管電壓120 kV,管電流160 mAs,層厚1.25 mm。掃描圖像以DICOM格式導(dǎo)出。
1.3 相關(guān)圖像語義特征的定義 由2位具有5年以上呼吸系統(tǒng)影像診斷經(jīng)驗的放射科主治以上職稱醫(yī)生分別對所有結(jié)節(jié)進行分型,包括:(1)實性結(jié)節(jié);(2)純磨玻璃結(jié)節(jié);(3)部分實性結(jié)節(jié)。同時描述結(jié)節(jié)是否有以下征像:(1)空氣支氣管征;(2)胸膜牽拉;(3)血管聚集;(4)毛刺征。
1.4 圖像勾畫、特征提取及篩選 先由2位具有5年以上呼吸系統(tǒng)影像診斷經(jīng)驗的放射科主治以上職稱醫(yī)生使用軟件ITK-SNAP(Version 3.6)分別手動對術(shù)前胸部CT圖像上相應(yīng)病灶進行勾畫,沿著腫瘤邊緣逐層勾畫其感興趣區(qū)域(region of interest,ROI),盡量避免周圍正常組織勾畫其中,當(dāng)結(jié)節(jié)靠近胸膜時,要求勾畫距離胸膜超過1 mm,避免將胸膜勾畫其中,保存勾畫病灶的ROI。將勾畫完成的圖像導(dǎo)入美國GE Analysis Kit(AK)軟件進行特征提取,共提取396個特征。對2位醫(yī)生所提取的特征進行一致性分析,保留組內(nèi)相關(guān)系數(shù)(intraclass correlation coefficients,ICC)≥0.75的特征,使用最小冗余最大相關(guān)算法(minimum redundancy maximum relevance,mRMR)降低之前所保留特征集的冗余度,通過最小絕對緊縮與選擇算子(least absolute shrinkage and selection operator,LASSO)回歸對各個特征進行降維,得到差異有統(tǒng)計學(xué)意義的影像組學(xué)特征參數(shù),利用特征參數(shù)進行多因素二元logistic回歸分析建模,同時計算影像組學(xué)特征參數(shù)分?jǐn)?shù)(Rad-score)。在訓(xùn)練組中對每個潛在預(yù)測變量包括性別、年齡、吸煙史、肺癌相關(guān)腫瘤指標(biāo)[包括神經(jīng)元特異性烯醇化酶(NSE)、細胞角蛋白 19片段(YFRA21-1)、癌胚抗原(CEA)、糖類抗原 19-9(CA19-9)、CA125、CA242]、結(jié)節(jié)分型、空氣支氣管征、胸膜牽拉、血管聚集、毛刺征等進行單因素二元logistic回歸分析,篩選出P<0.1的特征,再對這些篩選出的特征進行多因素二元logistic回歸分析,最終篩選出獨立預(yù)測因子。
1.5 模型建立與驗證 用篩選出的獨立預(yù)測因子建立臨床-語義特征模型。之后將聯(lián)合篩選出的獨立預(yù)測因子和Rad-score構(gòu)建聯(lián)合模型,并制作列線圖。模型建立之后,使用Hosmer-Lemeshow檢驗分析擬合度。繪制ROC曲線,采用AUC評價各個模型對NSCLC基因突變狀態(tài)的預(yù)測效能。使用決策曲線評估各個模型的凈效益。
1.6 統(tǒng)計學(xué)處理 采用R Studio3.6.1統(tǒng)計軟件。正態(tài)分布的計量資料以表示,組間比較采用獨立樣本t檢驗;非正態(tài)分布的計量資料以 M(P25,P75)表示,組間比較采用秩和檢驗;計數(shù)資料組間比較采用χ2檢驗。采用ICC評價2位測量者的測量一致性及對腫瘤的語義特征的定義一致性,ICC≥0.75為一致性較好。訓(xùn)練組及驗證組構(gòu)建的Rad-score對EGFR基因狀態(tài)預(yù)測的比較采用Wilcoxon秩和檢驗。采用Hosmer-Lemeshow檢驗分析擬合度,P>0.05提示模型擬合較好。繪制決策曲線分析凈效益。采用Delong檢驗進行模型間AUC的比較。P<0.05為差異有統(tǒng)計學(xué)意義。
2.1 臨床特征選擇 根據(jù)7∶3的比例進行分層抽樣將153例患者隨機分成訓(xùn)練組108例和驗證組45例。根據(jù)EGFR基因檢測結(jié)果將所有患者分為突變組90例及野生組63例,兩組患者的臨床特征比較見表1。通過單因素logistic回歸共篩選出3個獨立預(yù)測因子,包括吸煙史、結(jié)節(jié)分型和血管聚集。對這些篩選出的獨立預(yù)測因子繼續(xù)采用多因素二元logistic回歸進行篩選,最終篩選出的獨立預(yù)測因子分別是吸煙史(OR=2.65,P=0.056)和結(jié)節(jié)分型(OR=1.74,P=0.034)。基于這兩個獨立預(yù)測因子建立臨床-語義特征模型。
表1 EGFR基因突變組及野生組臨床特征比較
2.2 一致性評價 2位測量者獲得的影像組學(xué)特征參數(shù)的ICC范圍為0.553~0.864,其中>0.75的特征355個,一致性較好。2位測量者對腫瘤語義特征定義的ICC為0.72~0.95,其中血管聚集的ICC為0.72,其余特征的ICC均>0.75。因此采用高年資醫(yī)生的勾畫及評閱數(shù)據(jù)進行特征選擇及建模。
2.3 影像組學(xué)特征篩選和模型建立 Hosmer-Lemeshow檢驗顯示在訓(xùn)練組和驗證組中各個臨床特征差異均無統(tǒng)計學(xué)意義(均P>0.05),見表2,表明擬合無偏差。通過mRMR算法降低ICC>0.75特征集的冗余度,保留了排名前20個特征,采用LASSO回歸進一步降維,共得到13個影像組學(xué)特征,包括Correlation_AllDirection_offset7_SD(CA_o7_SD)、GLCMEnergy_angle135_offset7(Ga135_o7)、GLCMEnergy_angle90_offset7(Ga90_o7)、Cluster Shade_angle45_offset7(CSa45_o7)、kurtosis、High-GreyLevelRunEmphasis_AllDirection_offset4_SD(HA_o4_SD)、GLCMEntropy_AllDirection_offset7_SD(GA o7 SD)、GLCMEntropy_AllDirection_offset4_SD(GA o4 SD)、Clus-terShade_AllDirection_offset1_SD(CA_o1_SD)、Haralick-Correlation_AllDirection_offset1_SD(HA_o1_SD)、GLCM Energy_angle90_offset4(Ga90_o4)、InverseDifferenceMoment_AllDirection_offset7_SD(IA_o7_SD)、Inertia_angle45_offset7(Ia45_o7)。各個特征的相關(guān)系數(shù)見圖1。將選定的13個特征按相關(guān)系數(shù)加權(quán)求和得到Rad-score,最終公式為:Rad-score=0.672*(CA_o7_SD)+-0.482*(Ga135_o7)+0.635*(Ga90_o7)+-0.271*(CSa45_o7)+-0.342*kurtosis+-0.162*(HA_o4_SD)+0.109*(GA o7 SD)+-0.159*(GA o4 SD)+0.141*(CA_o1_SD)+-0.497* (HA_o1_SD)+-0.981* (Ga90_o4)+-0.512*(IA_o7_SD)+0.642*(Ia45_o7)+0.078。基于 Rad-score建立影像組學(xué)特征模型。訓(xùn)練組與驗證組患者EGFR基因突變狀態(tài)預(yù)測Rad-score的比較,差異均有統(tǒng)計學(xué)意義(均P<0.05),見圖2。因此,Rad-score為獨立預(yù)測因子。
圖1 最優(yōu)影像組學(xué)特征組合及其相關(guān)系數(shù)
圖2 訓(xùn)練組與驗證組構(gòu)建的影像組學(xué)特征參數(shù)分?jǐn)?shù)對表皮生長因子受體(EGFR)基因狀態(tài)的預(yù)測比較
表2 訓(xùn)練組和驗證組臨床特征比較
將Rad-score、吸煙史、結(jié)節(jié)分型共3個特征作為EGFR基因突變的獨立預(yù)測因子進行聯(lián)合模型建立,并獲取聯(lián)合模型的列線圖見圖3。通過該列線圖可以實現(xiàn)NSCLC EGFR基因突變的個體化預(yù)測,計算得出的數(shù)值越高,患者基因突變的可能性越高。分別繪制3個模型的ROC曲線,見圖4。結(jié)果發(fā)現(xiàn),聯(lián)合模型的AUC在訓(xùn)練組及驗證組均為最高,明顯高于臨床-語義特征模型(Z=2.9441、2.1306,均 P<0.05)。影像組學(xué)特征模型的AUC高于臨床-語義特征模型,略低于聯(lián)合模型,差異無統(tǒng)計學(xué)意義(P>0.05)。決策曲線顯示,聯(lián)合模型較另外兩種模型有更好的凈效益,見表3、4及圖5。
圖3 基于訓(xùn)練組構(gòu)建聯(lián)合模型的列線圖
圖4 訓(xùn)練組和驗證組的各個模型的ROC曲線圖(a:訓(xùn)練組;b:驗證組)
圖5 3種模型的決策曲線圖
表3 訓(xùn)練組模型間的比較
本研究建立了一種用于預(yù)測NSCLC EGFR基因突變的臨床-影像組學(xué)聯(lián)合模型,結(jié)果發(fā)現(xiàn)聯(lián)合模型是預(yù)測NSCLC EGFR基因突變的最優(yōu)模型,并且通過構(gòu)建列線圖實現(xiàn)了模型可視化。本研究結(jié)果表明,該聯(lián)合模型構(gòu)建的列線圖可以作為預(yù)測NSCLC EGFR基因突變的臨床工具。該結(jié)果與Mei等[9]的研究成果一致,然而本研究聯(lián)合模型AUC要明顯高于文獻結(jié)果(0.77比0.664),因此本研究模型具有更高的診斷效能,更方便臨床的實際應(yīng)用。
表4 驗證組模型間的比較
大量流行病學(xué)研究表明,EGFR基因突變在亞洲人群、女性、非吸煙、腺癌的患者中發(fā)生率較高[10]。本研究結(jié)果與以往報道相符[11]。本研究還發(fā)現(xiàn)含有磨玻璃成分的腫瘤EGFR突變率63.2%(60/95)高于實性腫瘤51.7%(30/58),與以往多項研究結(jié)果[12-14]相符。有研究表明,腫瘤含磨玻璃成分比例越高,發(fā)生EGFR突變的概率越高,提示高比例的磨玻璃可以預(yù)測EGFR基因突變,這也表明結(jié)節(jié)分型是EGFR基因突變的重要預(yù)測因子[13,15]。因此,本研究經(jīng)過單因素及多因素二元logistic回歸分析后,得到一個由吸煙史及結(jié)節(jié)分型構(gòu)成的臨床-語義特征模型,模型的AUC在訓(xùn)練組及驗證組的分別為0.64和0.58,然而該模型的診斷效能較低,并沒有達到臨床診斷要求。
以往研究已經(jīng)證明了CT影像的形態(tài)學(xué)特征有預(yù)測腫瘤突變狀態(tài)的潛力[16-21]。Chen等[17]研究表明常規(guī)CT特征包括肺氣腫、原發(fā)腫瘤的分葉程度、淋巴結(jié)大小和狀態(tài)有助于預(yù)測晚期肺腺癌EGFR突變狀態(tài)。另外,有研究對CT形態(tài)和臨床特征進行Meta分析,證實有磨玻璃成分、空氣支氣管征、胸膜牽拉和血管集聚是NSCLC EGFR基因突變的危險因素[19]。因此本研究也同時納入了這些語義特征進行危險因素分析,結(jié)果發(fā)現(xiàn)除了磨玻璃成分,其他特征對預(yù)測結(jié)果沒有貢獻。這一結(jié)果表明,這些特征對NSCLC EGFR基因突變的預(yù)測結(jié)果不穩(wěn)定。顯然,這些研究只著眼于定性特征與NSCLC中EGFR突變的關(guān)系。這些定性特征基于觀察者的主觀判斷,觀察者之間存在差異,例如血管聚集這個特征,2位觀察者間的ICC只有0.72,而且這些特征不能對腫瘤異質(zhì)性進行量化。因此筆者便引入了影像組學(xué)這種對傳統(tǒng)影像進行量化的方法。
與傳統(tǒng)的影像學(xué)方法相比,影像組學(xué)的優(yōu)勢在于通過高通量提取圖像中的定量特征,發(fā)掘出更多信息,從而反映病變的內(nèi)在異質(zhì)性,目前已被廣泛應(yīng)用于疾病鑒別、預(yù)后評估、療效評估等多個方面。有較多研究顯示了影像組學(xué)對NSCLC基因表型有潛在預(yù)測價值。雖然這些研究的預(yù)測價值低于標(biāo)準(zhǔn)的分子生物學(xué),但是也顯示了較好的靈敏度和特異度[9,22]。以往的研究認為熵值(Entropy)和峰度值(kurtosis)是鑒別EGFR 突變狀態(tài)的兩個最重要的影像組學(xué)特征[5]。本研究發(fā)現(xiàn)除了熵值和峰度值,還有能量(Energy)、聚類陰影(Cluster Shade)灰度游程長度矩陣(GreyLevelRunEmphasis)、哈拉利克相關(guān)(HaralickCorrelation)等特征也對鑒別EGFR基因突變狀態(tài)有貢獻。另有研究表明,影像組學(xué)模型在鑒別EGFR基因突變狀態(tài)方面要優(yōu)于傳統(tǒng)影像學(xué)與臨床特征的聯(lián)合模型[7]。因此筆者通過納入以上這些特征計算出Rad-score,同時結(jié)合臨床特征建立聯(lián)合模型,使模型的預(yù)測效能有所提高。同時聯(lián)合模型也獲得了理想的靈敏度、特異度、準(zhǔn)確度、陽性預(yù)測值及陰性預(yù)測值,因此筆者認為基于胸部CT影像組學(xué)特征和圖像語義特征及臨床特征的聯(lián)合模型確有預(yù)測NSCLC是否發(fā)生EGFR基因突變的潛力。通過繪制列線圖實現(xiàn)了模型的可視化。列線圖是醫(yī)學(xué)中常用的預(yù)后評估工具,在腫瘤評估方面尤為突出。它可以通過整合各種預(yù)后及決策變量,實現(xiàn)對個體臨床事件的預(yù)測,滿足建立生物學(xué)和臨床綜合模型及對個性化醫(yī)療的需求。與傳統(tǒng)分期相比,它的數(shù)字界面能夠?qū)崿F(xiàn)快速計算,同時具有更高的準(zhǔn)確度,能更容易了解疾病的預(yù)后,以幫助臨床作出決策[23]。
本研究仍存在不足之處:本研究所提取的影像學(xué)數(shù)據(jù)都是手工半自動勾畫,工作量較大,隨著各種分割軟件的發(fā)展,自動分割精度的提高,不僅可以較大程度減少工作量,同時可以減少人工誤差。本研究樣本量較小,且來自于單一醫(yī)療機構(gòu),未來樣本量的擴大及多中心的合作,會使得該研究成果有更普遍的適用性。
綜上所述,本研究發(fā)現(xiàn)聯(lián)合臨床危險因素和影像組學(xué)特征的臨床-影像組學(xué)列線圖,可以作為NSCLC EGFR基因突變預(yù)測的臨床工具,輔助臨床做好治療決策,實現(xiàn)個體化精準(zhǔn)醫(yī)療。