何俊林,路 青,徐 昕,胡曙東
1. 江蘇大學(xué)醫(yī)學(xué)院,鎮(zhèn)江 212013;2. 上海市金山區(qū)亭林醫(yī)院放射科,上海 201505;3. 上海交通大學(xué)醫(yī)學(xué)院附屬仁濟(jì)醫(yī)院放射科,上海200127;4.上海市皓樺科技股份有限公司,上海 200010;5.江南大學(xué)附屬醫(yī)院放射科,無錫 214062
近年來,甲狀腺癌(thyroid carcinoma,TC)的發(fā)病率呈明顯的上升趨勢(shì)[1]。甲狀腺乳頭狀癌(papillary thyroid carcinoma,PTC)是其中最常見的組織學(xué)類型,占TC的90%以上[2]。大多數(shù)PTC生長(zhǎng)緩慢且患者預(yù)后良好,治療后復(fù)發(fā)或死亡的病例占總數(shù)的1.4%~13.3%[3]。頸部淋巴結(jié)轉(zhuǎn)移(cervical lymph node metastasis,CLNM)被認(rèn)為是PTC 患者局部復(fù)發(fā)和總體生存率降低的重要因素[4]。研究[5-6]表明PTC 有較高的頸部淋巴結(jié)轉(zhuǎn)移率,為40%~70%。臨床上外科預(yù)防性頸部淋巴結(jié)清掃易導(dǎo)致感染、神經(jīng)損傷及甲狀旁腺功能減退等并發(fā)癥。因此,術(shù)前明確PTC 患者頸部淋巴結(jié)狀態(tài)對(duì)于指導(dǎo)治療和判斷預(yù)后有重要意義。然而,臨床醫(yī)師的主觀影像診斷對(duì)CLNM 的敏感度不高或差異較大,如超聲(ultrasound,US)的敏感度為63%[7],CT 的敏感度為62%[8], 磁共振成像(magnetic resonance imaging,MRI)敏感度為33%~95%[9-10]。由于正電子發(fā)射體層成像的空間分辨力低[11],小的轉(zhuǎn)移淋巴結(jié)難以被發(fā)現(xiàn)。雖然細(xì)針穿刺活檢是確認(rèn)淋巴結(jié)轉(zhuǎn)移最準(zhǔn)確的方法,但臨床上不可能對(duì)每個(gè)區(qū)域的淋巴結(jié)進(jìn)行穿刺,因此易發(fā)生漏診[12]。
影像組學(xué)通過計(jì)算機(jī)高通量抽取影像資料中的高維特征,量化分析這些特征與病變的相關(guān)性,并可通過機(jī)器學(xué)習(xí)建立預(yù)測(cè)模型,用于診斷和預(yù)測(cè)預(yù)后和療效[13],彌補(bǔ)了傳統(tǒng)影像診斷依靠人眼識(shí)別征象和經(jīng)驗(yàn)判斷的不足。而CT 圖像的甲狀腺病變影像組學(xué)分析,不但彌補(bǔ)了US 對(duì)甲狀腺病變顯示的諸多局限(如鈣化病灶顯示差、胸內(nèi)甲狀腺顯示困難、操作者依賴性強(qiáng)、圖像重復(fù)性差等),還可提供多個(gè)掃描期相的圖像,如平掃期、增強(qiáng)動(dòng)脈期和靜脈期。本研究探索PTC 多期CT 圖像的影像組學(xué)特征在預(yù)測(cè)CLNM 中的價(jià)值,以期為臨床診斷及治療提供參考。
選擇2017 年1 月—2020 年6 月在上海市金山區(qū)亭林醫(yī)院行甲狀腺外科治療的197 例PTC 患者,收集其臨床資料。納入標(biāo)準(zhǔn):①經(jīng)過甲狀腺全切除或次全切除,或者單側(cè)切除+頸部淋巴結(jié)清掃。②術(shù)后病理學(xué)檢查證實(shí)為PTC。③術(shù)前2 周內(nèi)在醫(yī)院行CT 掃描(平掃+動(dòng)脈期+靜脈期)。④術(shù)前未經(jīng)任何與PTC 相關(guān)的治療。⑤PTC為單發(fā)結(jié)節(jié),或多發(fā)結(jié)節(jié)中病理學(xué)檢查證實(shí)為單發(fā)PTC,其余結(jié)節(jié)為良性。排除標(biāo)準(zhǔn):①CT 圖像中的PTC長(zhǎng)徑<5 mm。②因人為因素或其他非病變本身原因造成的圖像模糊。③多發(fā)結(jié)節(jié)中,PTC 無法確定為唯一。④同時(shí)患有其他惡性腫瘤。研究獲得醫(yī)院倫理委員會(huì)批準(zhǔn)[倫理批號(hào)為倫研批第(2020-77)號(hào)]。所有患者均簽署知情同意書。
所有患者的甲狀腺CT 平掃及增強(qiáng)掃描均在BrightSpeed 16 排螺旋CT 機(jī)(GE,美國(guó))上完成。掃描時(shí)患者采用仰臥位,頸部盡量仰伸,兩肩盡量下垂。掃描范圍從咽部至鎖骨上緣。掃描參數(shù):管電壓120 kV、自動(dòng)管電流、螺距0.938、矩陣512×512、掃描層厚5 mm、層間距5 mm。首先進(jìn)行平掃,其次進(jìn)行動(dòng)脈期與靜脈期掃描,分別在注射對(duì)比劑后的25 s與50 s掃描。對(duì)比劑為碘海醇注射液(35 g/100 mL,揚(yáng)子江藥業(yè)集團(tuán)有限公司),經(jīng)高壓注射器肘部靜脈團(tuán)注,劑量1.5 mL/kg,注射速率3 mL/s。掃描結(jié)束后,所有圖像均進(jìn)行1.0 mm薄層重建,重建間距1.0 mm,采用標(biāo)準(zhǔn)重建算法(standard deviation,STD)進(jìn)行。
1.3.1 圖像處理 由1 名高年資頭頸部腫瘤診斷醫(yī)師(觀察者1)對(duì)197 例PTC 患者的3 期CT 圖像進(jìn)行觀察,剔除存在偽影干擾的圖像,篩選出512 幀CT 圖像(193幀平掃期、131 幀動(dòng)脈期、188 幀靜脈期),具有全部3 期CT 圖像的患者為124 例,其CT 圖像數(shù)占總數(shù)的72.6%。選取512 幀CT 圖像中顯示PTC 病灶最大長(zhǎng)徑的層面用于影像組學(xué)分析。再由觀察者1和另一名高年資頭頸部腫瘤診斷醫(yī)師(觀察者2)共同閱讀124例患者的372幀CT圖像,觀察PTC 的位置、大小、形態(tài)、鈣化情況、增強(qiáng)后邊界、甲狀腺包膜侵犯和周圍組織侵犯等征象(以下稱為影像征象)。
1.3.2 圖像提取 觀察者1 對(duì)選取的512 幀CT 圖像運(yùn)用ITK-SNAP 軟件(www. itksnap. org) 圈選感興趣區(qū)(region of interest,ROI)并分割提?。▓D1)。圈選時(shí)ROI 盡量覆蓋整個(gè)瘤體,避免周圍正常甲狀腺組織被納入,記錄病灶的位置并測(cè)量其最大長(zhǎng)徑。為了評(píng)估ROI圈選的可重復(fù)性,在圈選結(jié)束2 周后,隨機(jī)選擇20 幀已圈選過的CT 圖像,由2 位觀察者再次圈選。評(píng)價(jià)觀察者1 前后2 次圈選的ROI 及2 位觀察者分別圈選的ROI 是否具有一致性,評(píng)價(jià)標(biāo)準(zhǔn)為組內(nèi)相關(guān)系數(shù)(intra-class correlation coefficient,ICC)。
圖1 PTC的ROI圈選示意Fig1 Demonstration of segmentation to ROI of PTC
1.3.3 特征提取 使用Python 中開源的Pyradiomics 軟件包對(duì)512 幀CT 圖像中分割的病灶ROI(CT 數(shù)據(jù))進(jìn)行特征提取。每個(gè)ROI 提取107 個(gè)影像組學(xué)特征,由Pyradiomics 軟件包自動(dòng)計(jì)算得出[14],包括一階特征、基于形狀的特征和二階特征。一階特征為基于單一像素或體素的特征;基于形狀的特征主要為腫瘤的大小和形狀,包括最大3D 長(zhǎng)徑等;二階特征又稱紋理特征,主要包括灰度共生矩陣(gray level co-occurrence matrix,GLCM)、灰度游程矩陣(gray level run length matrix,GLRLM)、灰度大小區(qū)域矩陣(gray level size zone matrix,GLSZM)灰度相關(guān)矩陣(gray level dependence matrix,GLDM),以及鄰域灰度調(diào)差矩陣(neighboring gray tone difference matrix,NGTDM)等。
1.3.4 特征選擇 為避免模型的過擬合以及噪聲對(duì)模型表現(xiàn)的影響,采用Python 中SelectKBest 開源軟件對(duì)提取的107個(gè)影像組學(xué)特征進(jìn)行特征選擇,以獲取預(yù)測(cè)CLNM的最佳影像組學(xué)特征。SelectKBest法計(jì)算107個(gè)特征中表現(xiàn)最佳的k個(gè)特征,進(jìn)行分類構(gòu)建模型的受試者操作特征曲線(receiver operator characteristic curve,ROC curve)的曲線下面積(area under the curve,AUC)為評(píng)價(jià)標(biāo)準(zhǔn),最高AUC對(duì)應(yīng)的k個(gè)特征組合稱為top(k)。
1.3.5 分類模型參數(shù)選擇 使用Python 中開源的GridSearchCV 軟件,設(shè)置交叉驗(yàn)證值為5 折,對(duì)512 幀圖像的CT 數(shù)據(jù)進(jìn)行隨機(jī)劃分(訓(xùn)練集∶測(cè)試集=4∶1);根據(jù)有無CLNM,用提取的107 個(gè)影像組學(xué)特征為分類模型RandomForestClassifier 中幾個(gè)重要參數(shù)選擇最佳參數(shù)值。參數(shù)及其取值范圍設(shè)置為'max_depth':(10,20…100),'max_features':('sqrt' or "auto"),'min_samples_leaf ':(1,2…10),'n_estimators':(10,20…100)。結(jié)果發(fā)現(xiàn)參數(shù)為{'max_depth':60,'max_features':'sqrt','min_samples_leaf':8,'n_estimators':20}時(shí),模型在測(cè)試集上的AUC 最高,為0.683。這些參數(shù)及相應(yīng)的取值用于后續(xù)分類模型的構(gòu)建。
1.3.6 模型構(gòu)建 對(duì)124 例PTC 患者的平掃期、動(dòng)脈期和靜脈期的CT 數(shù)據(jù)分別按訓(xùn)練集∶測(cè)試集=9∶1 隨機(jī)劃分,使用最佳分類模型參數(shù){'max_depth':60,'max_features':'sqrt','min_samples_leaf ':8,'n_estimators':20}和SelectKBest 算法獲得的top(k),根據(jù)頸部淋巴結(jié)有無轉(zhuǎn)移構(gòu)建3 期的隨機(jī)森林(random forest,RF)分類模型,并進(jìn)行10 折交叉驗(yàn)證,獲取每期107 個(gè)模型的10 折ROC曲線及相應(yīng)模型的top(k)值。模型優(yōu)劣的評(píng)價(jià)指標(biāo)為10折ROC 曲線的平均AUC 和準(zhǔn)確度。
使用Python 中的開源軟件包進(jìn)行影像組學(xué)研究,采用SPSS 19.0 軟件進(jìn)行統(tǒng)計(jì)分析。符合正態(tài)分布的定量資料用±s表示,檢驗(yàn)方法為t檢驗(yàn);定性資料用頻數(shù)(百分率)表示,檢驗(yàn)方法為Pearsonχ2檢驗(yàn)或Fisher 精確檢驗(yàn)。所有的統(tǒng)計(jì)檢驗(yàn)均為雙側(cè)檢驗(yàn),P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。ICC>0.75表示ROI圈選有較好的可靠性[15]。
124 例PTC 患者中,年齡為21~79 歲,平均年齡為(50.3±13.4)歲。無CLNM 69 例,有CLNM 55 例,CLNM的發(fā)生率為44.4%。PTC的最大長(zhǎng)徑范圍為0.50~4.00 cm,平均最大長(zhǎng)徑為[(0.998±0.567)]cm。甲狀腺周圍侵犯(P=0.004)、甲狀腺包膜侵犯(P=0.025)以及年齡≥50 歲(P=0.044)的組間差異具有統(tǒng)計(jì)學(xué)意義(表1)。
表1 PTC患者的基線及臨床特征(N=124)Tab1 Baseline and clinical information of PTC patients(N=124)
平掃期、動(dòng)脈期和靜脈期的CT 圖像預(yù)測(cè)CLNM 的RF 分類模型中,最大平均AUC 對(duì)應(yīng)的10 折交叉驗(yàn)證的ROC 曲線分別見圖2。平掃期107 個(gè)模型中當(dāng)top(k)為56 時(shí),分類模型預(yù)測(cè)CLNM 的平均AUC 達(dá)到最大值(0.843),準(zhǔn)確度0.767;動(dòng)脈期107 個(gè)模型中當(dāng)top(k)為94 時(shí),分類模型預(yù)測(cè)CLNM 的平均AUC 達(dá)到了最大值(0.775),準(zhǔn)確度0.695;靜脈期107 個(gè)模型中當(dāng)top(k)為47 時(shí),分類模型預(yù)測(cè)CLNM 的平均AUC 達(dá)到了最大值(0.783),準(zhǔn)確度0.726(表2)。比較3 期的分類模型獲得的107 個(gè)平均AUC,平掃期圖像特征預(yù)測(cè)CLNM 獲得的AUC 明顯高于動(dòng)脈期(P=0.000)與靜脈期(P=0.000),而動(dòng)脈期與靜脈期間差異無統(tǒng)計(jì)學(xué)意義(圖3)。
圖2 PTC患者的平掃期(A)、動(dòng)脈期(B)、靜脈期(C)的RF分類模型中最大平均AUC的10折ROC曲線Fig 2 10-fold ROC curve of the maximum AUC in RF classification models of the pre-contrast phase(A),arterial phase(B)and venous phase(C)of patients with PTC
表2 PTC患者CT平掃期、動(dòng)脈期、靜脈期RF分類模型10折交叉驗(yàn)證的結(jié)果Tab 2 Results of 10-fold cross-validation of RF classification model in pre-contrast phase,arterial phase and venous phase of patients with PTC
在124 例患者平掃期、動(dòng)脈期和靜脈期3 個(gè)期相的影像組學(xué)特征中,預(yù)測(cè)性能最佳的前10 位特征見表3,表現(xiàn)最好的特征多數(shù)為紋理特征,分別屬于GLCM、GLRLM、GLSZM、GLDM、NGTDM等。
表3 PTC患者平掃期、動(dòng)脈期和靜脈期RF分類模型中預(yù)測(cè)性能最佳的10個(gè)影像組學(xué)特征(N=124)Tab 3 Top 10 radiomic features in RF classification model of pre-contrast,arterial and venous phase of PTC patients(N=124)
基于邏輯回歸(logistics regression,LR)算法的影像征象中的危險(xiǎn)因素(年齡≥50歲,甲狀腺周圍侵犯和甲狀腺包膜侵犯)建立模型的ROC 曲線,結(jié)果顯示AUC 為0.629,而平掃期影像組學(xué)特征LR 模型AUC 為0.718(P=0.011,圖4A);聯(lián)合平掃期影像組學(xué)特征、影像征象及臨床因素(≥50 歲)構(gòu)建的模型具有更好的預(yù)測(cè)能力(P=0.009,圖4B)。
圖4 PTC患者的影像組學(xué)特征、聯(lián)合特征與影像征象的預(yù)測(cè)價(jià)值比較的ROC曲線Fig 4 ROC curve for comparison of predictive value of imaging omics,associative features and imaging signs of PTC patients
臨床上對(duì)于PTC 患者的外科治療,是否必須行預(yù)防性頸部淋巴結(jié)清掃一直存在爭(zhēng)議[16]。頸部淋巴結(jié)的盲目清掃不僅增加了治療成本,也增加了術(shù)后感染及神經(jīng)損傷等風(fēng)險(xiǎn)?;趥鹘y(tǒng)診斷模式下的US、CT、MRI術(shù)前探查CLNM 的敏感性不高,無法滿足臨床上術(shù)前治療決策的需要。多項(xiàng)研究[17-18]表明,基于PTC 原發(fā)灶的影像組學(xué)特征可以預(yù)測(cè)CLNM。
研究PTC的CT影像組學(xué)特征對(duì)于CLNM 預(yù)測(cè)價(jià)值的文獻(xiàn)不多。Lu 等[17]用支持向量機(jī)算法研究了221 例PTC患者的CT平掃期和靜脈期的影像組學(xué)特征對(duì)于CLNM 的預(yù)測(cè),取得了較好的結(jié)果(AUC=0.759)。本研究基于RF算法研究了PTC 的CT 增強(qiáng)多期掃描,發(fā)現(xiàn)平掃期、動(dòng)脈期和靜脈期圖像的影像組學(xué)特征都可以預(yù)測(cè)CLNM;進(jìn)一步比較發(fā)現(xiàn),平掃期影像組學(xué)特征的預(yù)測(cè)性能明顯優(yōu)于動(dòng)脈期和靜脈期。
腫瘤的異質(zhì)性是惡性腫瘤的重要特征,直接影響腫瘤的生長(zhǎng)速度、侵襲能力、對(duì)藥物的敏感性以及預(yù)后[19]。腫瘤異質(zhì)性很難通過單一的方法進(jìn)行描述,但可通過影像組學(xué)紋理分析進(jìn)行量化研究[20]。圖像紋理分析通過定量提取肉眼無法識(shí)別的反映灰度值分布模式及變化規(guī)律的紋理特征,反映腫瘤內(nèi)潛在的異質(zhì)性[21]。紋理特征最常用來評(píng)價(jià)腫瘤的異質(zhì)性[22]。某些特定結(jié)構(gòu)的PTC 亞型易發(fā)生CLNM 是由腫瘤內(nèi)分子間異質(zhì)性或成分異質(zhì)性決定的,這些異質(zhì)性決定了腫瘤內(nèi)的灰度分布和構(gòu)成,這也解釋了雖然通過碘劑增強(qiáng)檢查增加了腫瘤在血流動(dòng)力學(xué)方面的差異,這些差異可能會(huì)影響腫瘤的分期或其他生物學(xué)行為如甲狀腺外侵犯等評(píng)價(jià),但同時(shí)也改變了腫瘤內(nèi)原有的紋理分布,進(jìn)而影響了模型預(yù)測(cè)CLNM 的能力。
為了保證數(shù)據(jù)的可比性,在模型構(gòu)建時(shí)只使用了含有全部3 期的124 位患者的CT 數(shù)據(jù)。但在選擇模型最佳參數(shù)時(shí),考慮到樣本數(shù)量較少,我們采用全部197例患者的512 幀圖像的CT 數(shù)據(jù)。應(yīng)用交叉驗(yàn)證法評(píng)估模型泛化能力最關(guān)鍵的因素是選擇劃分訓(xùn)練集和測(cè)試集的比例,K折交叉驗(yàn)證法可以使用數(shù)據(jù)集中的所有樣本進(jìn)行預(yù)測(cè),通過平均的評(píng)價(jià)指標(biāo)來降低奇異的訓(xùn)練集和測(cè)試集劃分方式對(duì)預(yù)測(cè)結(jié)果的影響。研究[23-24]表明,K 值的選取對(duì)最終結(jié)果也有一定的影響,K 值越大,評(píng)估的準(zhǔn)確性越高;而當(dāng)K 為5 或10 時(shí),評(píng)估在準(zhǔn)確性和計(jì)算復(fù)雜性下綜合性能最優(yōu)。因此,本研究在選擇最佳模型參數(shù)時(shí),采用了5 折交叉驗(yàn)證法,在構(gòu)建RF 分類模型時(shí)采用了10折交叉驗(yàn)證法。
我們還比較了影像組學(xué)特征與醫(yī)師主觀診斷的影像征象的預(yù)測(cè)價(jià)值,結(jié)果顯示平掃期影像組學(xué)特征優(yōu)于影像征象構(gòu)建的模型;聯(lián)合平掃期影像組學(xué)特征、影像征象以及臨床因素(≥50 歲)構(gòu)建的模型具有更好的預(yù)測(cè)能力。
本研究的局限性在于:①人工圈選的ROI 腫瘤區(qū)域不可避免會(huì)存在偏差。②樣本量較少,可能會(huì)引起模型的過擬合[25-26]。③單中心研究的所有樣本來自同一批次,缺少外部驗(yàn)證,模型泛化能力弱。④PTC 原發(fā)灶與CLNM 之間的映射關(guān)系只是基于統(tǒng)計(jì)學(xué)的假設(shè),并非明確的一一對(duì)應(yīng)關(guān)系。⑤直徑<5 mm 的腫瘤被排除,研究的樣本缺乏全面性。
上海交通大學(xué)學(xué)報(bào)(醫(yī)學(xué)版)2021年9期