陳小波 郭馨雨 于哲軒 許茂盛 周長玉
隨著胸部低劑量CT的廣泛篩查,肺結(jié)節(jié)的發(fā)現(xiàn)頻率也越來越高。如果能盡早地對(duì)結(jié)節(jié)作出診斷和治療,將極大地提高肺癌患者的生存質(zhì)量,同時(shí)避免不必要的侵入性檢查和手術(shù),因此早期區(qū)分肺結(jié)節(jié)良惡性具有潛在的重要臨床意義[1]。
影像組學(xué)作為一種獲取高通量影像圖像放射學(xué)特征的非侵入性方法,能夠反映腫瘤感興趣區(qū)的異質(zhì)性特征。近年來的研究表明,腫瘤周圍實(shí)質(zhì)在細(xì)胞遷移、炎癥反應(yīng)和血管形成方面具有重要的生物學(xué)特性,對(duì)于臨床評(píng)估病灶侵襲行為具有重要價(jià)值[2]。大多數(shù)研究主要關(guān)注于原發(fā)病灶的評(píng)估,忽略了瘤周微環(huán)境的細(xì)微變化。從已有的文獻(xiàn)報(bào)道來看,最佳瘤周放射學(xué)信號(hào)位于何處,以及這些特征如何與瘤內(nèi)特征相互作用仍不清楚[3]。目前聯(lián)合瘤內(nèi)和瘤周影像組學(xué)特征的研究方法主要有2種:常見的是將瘤內(nèi)和瘤周區(qū)域進(jìn)行整體分割而得到總區(qū)域,提取特征后進(jìn)行建模分析[4-5];Beig等[6]則對(duì)瘤內(nèi)和瘤周區(qū)域進(jìn)行單獨(dú)分割,再對(duì)各區(qū)域特征進(jìn)行聯(lián)立并完成建模分析。本研究將通過聯(lián)合瘤內(nèi)和瘤周影像組學(xué)特征對(duì)肺腺癌及肺良性結(jié)節(jié)進(jìn)行鑒別,并對(duì)2種方法進(jìn)行對(duì)比分析。
回顧性分析2017年1月至2019年12月在浙江中醫(yī)藥大學(xué)附屬第一醫(yī)院就診的肺結(jié)節(jié)患者臨床和影像資料。所有患者CT平掃圖像都由高年資肺部影像診斷醫(yī)師進(jìn)行分析和判斷,最后經(jīng)胸腔鏡、肺部穿刺或手術(shù)切除標(biāo)本病理檢查明確結(jié)節(jié)良惡性。納入標(biāo)準(zhǔn):①手術(shù)治療前1個(gè)月內(nèi)曾行薄層(0.75 mm或1.0 mm)胸部CT掃描;②病灶最大徑≤30 mm;③術(shù)前無化療、放療、靶向治療;④無肺部腫瘤病史。排除標(biāo)準(zhǔn):①圖像質(zhì)量不佳;②CT檢查前行肺腫瘤活檢、放療、化療或手術(shù)切除;③同一肺葉多個(gè)肺結(jié)節(jié)。
圖像采集采用東芝Aquilion ONE(Toshiba Medical Systems,Japan) 和 西 門 子Somatom sensation 64層CT掃描儀(Siemens Healthcare,Germany)。前者掃描參數(shù):管電壓120 kV,管電流200 mA,探測器準(zhǔn)直0.5 mm×64 mm,矩陣512×512,重建層厚1.0 mm,旋轉(zhuǎn)時(shí)間0.4 s,重建核為FC51。后者掃描參數(shù):管電壓120 kV,自動(dòng)管電流調(diào)制,探測器準(zhǔn)直0.6 mm×64 mm,矩陣512×512,重構(gòu)層厚0.75 mm,重建核為B31f。
3.1 圖像預(yù)處理與圖像分割
將DICOM格式的薄層軸位CT平掃圖像導(dǎo)入開源軟件ITK?SNAP V3.8.0(https://www.itksnap.org),設(shè)置肺窗(窗位:-600 HU;窗寬:1 300 HU),由2名分別具有3年和10年胸部CT影像診斷經(jīng)驗(yàn)的放射科醫(yī)師獨(dú)立完成三維容積感興趣區(qū)(VOI)的勾畫。勾畫過程中支氣管、大血管和胸膜以外的正常組織都被人工盡可能地排除在VOI之外。對(duì)于2名放射科醫(yī)師之間的差異情況,分割模式由1名具有28年肺部影像診斷經(jīng)驗(yàn)的放射科教授進(jìn)行評(píng)估。
在完成瘤內(nèi)感興趣區(qū)的分割后,需要進(jìn)行外擴(kuò)得到瘤周區(qū)域。根據(jù)較多文獻(xiàn)[3-6]的報(bào)道,聯(lián)合瘤內(nèi)及瘤周0~5 mm區(qū)域時(shí)模型的整體預(yù)測性能最佳,因此本研究的瘤周區(qū)域被定義為3 mm和5 mm。AK軟件(Analysis Kit;GE Healthcare,US)可以根據(jù)勾畫好的VOI來自動(dòng)分割瘤周區(qū)域,瘤內(nèi)及瘤周總區(qū)域,軟件內(nèi)置的邊緣識(shí)別算法可自動(dòng)識(shí)別胸膜邊緣,有效地防止縱隔區(qū)域被納入,保護(hù)結(jié)節(jié)組學(xué)特征不被縱隔衰減或改變。最終,依次整理得到瘤內(nèi)感興趣區(qū)[即腫瘤區(qū)(gross target volume,GTV)],瘤周感興趣區(qū)[即腫瘤周圍區(qū)(peritumoral volume,PTV);分別外擴(kuò)0~3 mm和3~5 mm,記為PTV3和PTV5],瘤內(nèi)和瘤周總區(qū)域(GPTV;即瘤內(nèi)至瘤周3 mm和5 mm,記為GPTV3和GPTV5),合計(jì)5個(gè)區(qū)域。
3.2 影像組學(xué)特征提取
將分割好的感興趣區(qū)再次導(dǎo)入ITK?SNAP軟件進(jìn)行核實(shí)與修正,無誤后利用開源工具Pyradiomics 3.0工具箱[7]對(duì)影像體素進(jìn)行1×1×1重采樣,隨后完成影像組學(xué)特征的計(jì)算和提取。包括一階統(tǒng)計(jì)特征、形狀特征,灰度區(qū)域大小矩陣(GLSZM)、灰度共生矩陣(GLCM)、灰度依賴矩陣(GLDM)等灰度特征等。另外,將小波、平方、對(duì)數(shù)、指數(shù)4種圖像濾波器分別應(yīng)用于原始圖像,得到相應(yīng)衍生圖像,并在5種不同類型圖像中完成所有類別影像組學(xué)特征提取。
3.3 影像組學(xué)特征篩選
首先,對(duì)所有影像組學(xué)特征進(jìn)行Z?score標(biāo)準(zhǔn)化處理,公式為Z=(x-μ)/σ,其中x為某組學(xué)特征的數(shù)值,μ代表所有患者相應(yīng)特征的平均值,σ代表相應(yīng)特征的標(biāo)準(zhǔn)差。對(duì)樣本按7∶3的比例隨機(jī)劃分為訓(xùn)練集和驗(yàn)證集。為避免特征數(shù)量過多而使模型過度擬合,需對(duì)特征進(jìn)行逐步篩選,具體方法如下。①單因素分析:鑒于組學(xué)特征均為連續(xù)型特征,因此采用獨(dú)立樣本t檢驗(yàn)進(jìn)行逐個(gè)分析,初步篩選出具有顯著差異的影像組學(xué)特征。②Boruta特征選擇算法:Boruta算法被用來進(jìn)一步篩選具有潛在預(yù)測性的組學(xué)特征,其核心思想是統(tǒng)計(jì)比較數(shù)據(jù)中真實(shí)特征與隨機(jī)加入的原始拷貝特征(也稱為影子變量)之間重要性的差異。重要性得分是基于隨機(jī)森林建模計(jì)算的,其中顯著重要于最佳影子變量的真實(shí)特征被定義為重要特征,重要性低于最差影子變量的特征則被剔除。通過不斷迭代最終篩選獲得具有潛在預(yù)測性的組學(xué)特征。
3.4 模型構(gòu)建與評(píng)價(jià)
基于最終篩選得到的影像組學(xué)特征建立多元logistic逐步回歸模型,以P<0.05為顯著性閾值,赤池信息準(zhǔn)則(Akaike information criterion,AIC)為特征篩選和模型迭代準(zhǔn)則,通過不斷迭代直至模型AIC值達(dá)到最優(yōu)時(shí)完成訓(xùn)練。對(duì)篩選得到的GTV、PTV3模型特征進(jìn)行聯(lián)立,并再次利用logistic逐步回歸建模得到Combined3模型。同理,聯(lián)立GTV、PTV3、PTV5特征建立Combined5模型。受試者工作特征(receiver operator characteristic,ROC)曲線下面積(AUC)、準(zhǔn)確度、靈敏度、特異度、陰性預(yù)測值、陽性預(yù)測值等指標(biāo)被用來評(píng)價(jià)模型效能。
采用Python 3.7.4軟件的“Pyradiomics”包完成影像組學(xué)的特征提取,“scipy.stats”包完成特征的單因素分析,滿足方差齊性采用Studentt檢驗(yàn),方差不齊采用校正t檢驗(yàn),P<0.05認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。采用R 3.6.1軟件完成數(shù)據(jù)處理與建模,“caTools”包用于分層隨機(jī)劃分?jǐn)?shù)據(jù)集,“Boruta”包用于建立Boruta特征選擇算法,“glmnet”包用于建立logistic模型,“ROCR”包繪制ROC曲線。DeLong檢驗(yàn)被用來評(píng)估不同模型之間的效能差異。
根據(jù)納入排除標(biāo)準(zhǔn),295例肺結(jié)節(jié)中腺癌161例,良性結(jié)節(jié)134例,其中包括炎性結(jié)節(jié)60例、肉芽腫38例、結(jié)核瘤15例、肺泡細(xì)胞瘤6例、錯(cuò)構(gòu)瘤6例、機(jī)化性肺炎5例、非典型腺瘤樣增生4例。腺癌平均最大徑(11.34±4.47)mm,良性結(jié)節(jié)平均最大徑(11.15±4.05)mm,兩者間比較,差異無統(tǒng)計(jì)學(xué)意義(P>0.05)。
利用AK軟件分別對(duì)5個(gè)區(qū)域(GTV、PTV3、PTV5、GPTV3和GPTV5)進(jìn)行特征提取,每個(gè)區(qū)域均得到1 037個(gè)影像組學(xué)特征。首先對(duì)特征進(jìn)行單因素分析完成特征的初步篩選,5個(gè)區(qū)域分別得到394、650、614、567和559個(gè)顯著特征;隨后Boruta特征選擇算法被用來進(jìn)一步降維,設(shè)置迭代次數(shù)為300,以0.01為顯著性閾值,分別得到45、69、61、45和36個(gè)具有潛在預(yù)測性的組學(xué)特征。圖1示例了GTV中的影像組學(xué)特征經(jīng)Boruta特征選擇算法篩選后的結(jié)果,即Boruta特征重要性箱線圖。
圖1 GTV的Boruta特征重要性箱線圖
對(duì)篩選得到的影像組學(xué)特征建立logistic逐步回歸模型,以訓(xùn)練集數(shù)據(jù)來訓(xùn)練模型參數(shù),以驗(yàn)證集數(shù)據(jù)進(jìn)行效能評(píng)估,分別得到GTV、PTV3、PTV5、GPTV3和GPTV5模型。對(duì)篩選得到的GTV、PTV模型特征進(jìn)行聯(lián)立,經(jīng)過logistic逐步回歸得到Combined模型。其中,Combined5模型AIC=143.27,在納入的9個(gè)特征中有4個(gè)特征源于GTV,3個(gè)特征源于PTV3,2個(gè)特征源于PTV5,所有特征間存在統(tǒng)計(jì)學(xué)差異,具體參數(shù)結(jié)果如表1所示。Combined3模型AIC=153.93,相比Combined5模型納入的特征少了2個(gè)源于PTV5的特征。圖2為組合模型的特征系數(shù)條形圖,從中可以看出,源于GTV的特征不僅數(shù)量居多,而且特征系數(shù)的數(shù)值也較大,源于最外周PTV5的特征數(shù)量最少,且特征系數(shù)數(shù)值也較小。
表1 基于瘤內(nèi)及瘤周特征聯(lián)合的Combined5模型參數(shù)表
圖2 Combined模型特征系數(shù)條形圖
5種 模 型,即GTV、PTV3、PTV5、GPTV3、GPTV5、Combined3和Combined5對(duì)肺結(jié)節(jié)良惡性的判別效能結(jié)果詳見表2。各個(gè)模型的ROC曲線分析結(jié)果(圖3)顯示,瘤內(nèi)、瘤周及瘤內(nèi)與瘤周聯(lián)合的模型對(duì)肺結(jié)節(jié)均具有良好的預(yù)測性,其AUC均大于0.83。其中,PTV模型(AUCPTV3=0.892,AUCPTV5=0.858)和GPTV模型(AUCGPTV3=0.859,AUCGPTV5=0.833)在驗(yàn)證集中的表現(xiàn)效能均低于GTV模型(AUCGTV=0.916)。而Combined模 型 (AUCCombined3=0.953,AUCCombined5=0.953)相比GTV、GPTV3和GPTV5模型,其在肺腺癌和良性結(jié)節(jié)的鑒別中表現(xiàn)出了更好的效能。
圖3 瘤內(nèi)及瘤周影像組學(xué)模型預(yù)測肺腺癌及良性結(jié)節(jié)的ROC曲線
表2 不同聯(lián)合方式的瘤內(nèi)及瘤周影像組學(xué)模型效能
上述模型的DeLong檢驗(yàn)結(jié)果見圖4,從中可以發(fā)現(xiàn),在驗(yàn)證集中,PTV5與2種Combined模型,GPTV3和GPTV5與2種Combined模型之間的差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。2種Combined模型與2種GPTV模型的詳細(xì)對(duì)比信息如表4所示。
表4 Combined模型與GPTV模型的對(duì)比與檢驗(yàn)
圖4 瘤內(nèi)及瘤周影像組學(xué)模型DeLong檢驗(yàn)顯著性熱圖
在CT圖像上,肺良惡性結(jié)節(jié)在大小、形態(tài)上都有部分重疊,在視覺評(píng)估的基礎(chǔ)上對(duì)其進(jìn)行鑒別具有一定的挑戰(zhàn)性。經(jīng)皮穿刺活檢是臨床上確定肺結(jié)節(jié)性質(zhì)的一種方法,可以提供相對(duì)準(zhǔn)確的病理信息。然而,經(jīng)皮穿刺活檢是一種侵入性手術(shù),可能會(huì)給患者帶來一些手術(shù)相關(guān)的并發(fā)癥,且有時(shí)活檢獲得的小塊組織不能代表整個(gè)病變的特征[8]。在這方面,影像組學(xué)作為一種定量化的無創(chuàng)手段已經(jīng)被廣泛證明可提供更多的紋理信息來準(zhǔn)確地評(píng)估病變的異質(zhì)性,已經(jīng)有文獻(xiàn)報(bào)道了影像組學(xué)方法在腫瘤分級(jí)[9]、肝細(xì)胞癌的微血管浸潤和預(yù)后評(píng)估[10]、浸潤性肺腺癌和浸潤前病變的區(qū)分能力[11]等方面的研究。在我們的研究中,GTV模型(AUCGTV=0.916)在肺腺癌與良性結(jié)節(jié)鑒別中有著良好的表現(xiàn)。
以往的研究主要集中于瘤內(nèi)的組學(xué)特征分析,然而單純瘤內(nèi)特征并不足以充分反映病灶的所有特征,例如炎性結(jié)節(jié)可以表現(xiàn)為典型的磨玻璃樣改變,經(jīng)過治療,病灶吸收后易被誤診為肺癌,而慢性炎癥反應(yīng)會(huì)促進(jìn)肺免疫抑制微環(huán)境形成。目前,人們?cè)絹碓秸J(rèn)識(shí)到微環(huán)境在腫瘤中包含的豐富生物學(xué)信息[12],在肺部結(jié)節(jié)的診斷方面同樣如此。良性腫瘤通常生長緩慢,對(duì)周圍正常組織主要產(chǎn)生擠壓等作用,例如肺細(xì)胞瘤可對(duì)周圍血管產(chǎn)生推移作用甚至造成出血、肺結(jié)核周圍可有衛(wèi)星灶、結(jié)核球可有毛刺和胸膜牽拉等。惡性腫瘤則通常具有更強(qiáng)的浸潤性,會(huì)破壞周圍實(shí)質(zhì)組織的正常結(jié)構(gòu),比如造成病灶周圍的小葉間隔水腫,病灶外圍的小血管、淋巴管、氣管周圍發(fā)生癌性或炎性浸潤以及阻塞后擴(kuò)張等表現(xiàn)。病灶周圍的微觀環(huán)境在影像上難以很好地體現(xiàn),而這種微環(huán)境的異質(zhì)性變化可以通過瘤周影像組學(xué)的方法很好地被挖掘。目前,基于瘤內(nèi)和瘤周放射學(xué)特征的研究方法在非小細(xì)胞肺癌的總體生存率和免疫治療反應(yīng)[13]、術(shù)后復(fù)發(fā)[14]等方面均有著良好的價(jià)值表現(xiàn)。在肺腺癌及良性結(jié)節(jié)的鑒別研究中,我們發(fā)現(xiàn)單純提取瘤周感興趣區(qū)的PTV模型(AUCPTV3=0.892,AUCPTV5=0.858)、瘤內(nèi)及瘤周總感興趣區(qū)的GPTV模型(AUCGPTV3=0.859,AUCGPTV5=0.833)在驗(yàn)證集中表現(xiàn)的效能均低于僅提取瘤內(nèi)感興趣區(qū)的GTV模型(AUCGTV=0.916),同時(shí),隨著外擴(kuò)距離的增加,模型效能會(huì)逐漸減弱。同樣地,也有研究[4,15]發(fā)現(xiàn),GPTV和GTV在肺腺癌與肉芽腫鑒別、肺腺癌淋巴結(jié)轉(zhuǎn)移預(yù)測的研究中無統(tǒng)計(jì)學(xué)差異。其可能的原因是研究所納入的肺結(jié)節(jié)體積比較小,惡性結(jié)節(jié)的瘤周微環(huán)境浸潤程度不明顯,導(dǎo)致瘤周區(qū)域的鑒別性能欠佳。同時(shí)隨著外擴(kuò)距離的增加,正常的肺紋理組織會(huì)被納入到感興趣區(qū)中,也會(huì)導(dǎo)致良惡性結(jié)節(jié)差異縮小。
除此之外,我們還對(duì)比研究了瘤內(nèi)和瘤周2種不同聯(lián)合方法構(gòu)建的模型,第一種是常見的將瘤內(nèi)和瘤周區(qū)域進(jìn)行整體分割后構(gòu)建GPTV模型,第二種是對(duì)瘤內(nèi)和瘤周區(qū)域單獨(dú)分割,經(jīng)特征篩選后再構(gòu)建Combined模型。2種方法在肺腺癌與良性結(jié)節(jié)的鑒別研究中,AUCCombined3為0.953,高于AUCGPTV3的0.859(P<0.05),AUCCombined5為0.953,高于AUCGPTV5的0.833(P<0.01)。參考Combined5模型保留的參數(shù)結(jié)果:納入的9個(gè)特征中有4個(gè)源于GTV,3個(gè)源于PTV3,2個(gè)源于PTV5,推測其可能的原因是各區(qū)域單獨(dú)勾畫再聯(lián)立的組合方法不僅可以保留瘤內(nèi)的豐富信息,而且瘤周的顯著特征也會(huì)被保留,同時(shí)模型會(huì)根據(jù)瘤內(nèi)和瘤周特征的重要性進(jìn)行加權(quán)組合,這也解釋了Combined模型(AUCCombined3=0.952, AUCCombined5=0.953)在驗(yàn)證集中效能高于GTV模型(AUCGTV=0.916)的原因。對(duì)于瘤內(nèi)及瘤周的整體分割,良性結(jié)節(jié)周圍的部分重要信息會(huì)因?yàn)楸桓竺娣e的正常組織所“均勻化”而削弱,使良惡性差異變小,因此GPTV模型(AUCGPTV3=0.859,AUCGPTV5=0.833)的驗(yàn)證效能低于GTV模型(AUCGTV=0.916)。相比之下,單獨(dú)分割瘤內(nèi)及瘤周感興趣區(qū),經(jīng)特征篩選后再合并的方法能夠更加全面真實(shí)地反映瘤內(nèi)和瘤周區(qū)域蘊(yùn)含的顯著特征。這與實(shí)際影像閱片過程中先看瘤內(nèi)密度或信號(hào)強(qiáng)度(GTV),再看邊緣形態(tài)(PTV),然后結(jié)合與周圍組織關(guān)系(更大的PTV)的“特征聯(lián)立”綜合分析過程相一致。
本研究存在一些局限性:第一,本研究為小樣本的回顧性研究。第二,本研究以肺腺癌為惡性結(jié)節(jié)代表,以炎性結(jié)節(jié)和肉芽腫為主要良性代表進(jìn)行了良惡性鑒別研究,這可能存在選擇偏倚,因?yàn)橐桩a(chǎn)生明顯微環(huán)境改變的炎性結(jié)節(jié)、肺細(xì)胞瘤等良性肺結(jié)節(jié)病種,可能會(huì)更容易與惡性肺結(jié)節(jié)進(jìn)行鑒別,今后仍需擴(kuò)大樣本將研究對(duì)象拓展到良惡性亞組以及多中心研究。第三,本研究僅采集了2種CT儀器的肺結(jié)節(jié)圖像,在未來的研究中,瘤內(nèi)及瘤周影像組學(xué)方法對(duì)不同型號(hào)CT掃描下肺結(jié)節(jié)鑒別診斷的影響仍需驗(yàn)證。
綜上所述,本研究通過影像組學(xué)方法和對(duì)比分析發(fā)現(xiàn),相比于GPTV整體分割的方法,瘤內(nèi)GTV及瘤周PTV單獨(dú)分割后再進(jìn)行特征聯(lián)立的方法在肺腺癌及良性結(jié)節(jié)鑒別中有著更好的效能表現(xiàn)。
中國醫(yī)學(xué)計(jì)算機(jī)成像雜志2021年4期