楊椿雪,原夢,張金玲*,王天佐
作者單位:1.哈爾濱醫(yī)科大學(xué)附屬第二醫(yī)院CT室,哈爾濱 150000;2.哈爾濱醫(yī)科大學(xué)附屬第六醫(yī)院放射科,哈爾濱 150000
腦膜瘤是成年人最常見的顱內(nèi)腫瘤,約占顱內(nèi)原發(fā)性腫瘤的三分之一[1-2]。WHO 等級是腦膜瘤重要的預(yù)后因素,可影響治療策略的選擇[3]。低級別腦膜瘤(grade Ⅰ)預(yù)后良好,手術(shù)即可獲得良好的治療效果[4-6]。高級別腦膜瘤(grade Ⅱ、Ⅲ)侵襲性更高,預(yù)后也更差,五年復(fù)發(fā)率高達(dá)50%~90%[7]。如果在術(shù)前能夠以非侵入的方式預(yù)測腦膜瘤級別,就可以為治療方案制定和預(yù)后評估提供更多信息。MRI 是腦膜瘤評估的重要手段,然而主觀評價(jià)模式在術(shù)前預(yù)測腦膜瘤病理分級的能力方面存在爭議[8-9]。近年來,機(jī)器學(xué)習(xí)在影像診斷領(lǐng)域應(yīng)用日益廣泛,國內(nèi)外研究者在此方面已經(jīng)取得了不錯(cuò)的成果[10-12]。目前通過影像組學(xué)模型術(shù)前預(yù)測腦膜瘤病理等級的相關(guān)研究只使用軸位圖像,大多也未處理類別不平衡、特征可重復(fù)性差等問題。因此我們完善研究方法,嘗試用軸位和矢狀位T1WI增強(qiáng)圖像構(gòu)建模型,并測試其表現(xiàn)。
回顧性連續(xù)收集2017 年1 月至2020 年12 月,在哈爾濱醫(yī)科大學(xué)附屬第二醫(yī)院術(shù)前行MRI檢查腦膜瘤患者的MRI圖像(153例)。納入標(biāo)準(zhǔn):(1)病理明確診斷為腦膜瘤;(2)病理等級明確(2016版WHO中樞神經(jīng)系統(tǒng)腫瘤分類);(3)序列包含軸位和矢狀位增強(qiáng)T1WI。排除標(biāo)準(zhǔn):(1)圖像質(zhì)量不佳、存在偽影;(2) MRI檢查前接受過腦膜瘤手術(shù)或放療;(3)多發(fā)腦膜瘤。本研究經(jīng)哈爾濱醫(yī)科大學(xué)附屬第二醫(yī)院倫理委員會批準(zhǔn)(倫理審查批件號:KY2021-335),免除受試者知情同意。
采用GE Signa HDxt MRI以及GE Discovery MR750w 掃描儀進(jìn)行檢查。GE Signa HDxt 1.5 T MRI 掃描儀成像序列參數(shù):軸位T1WI 增強(qiáng)圖像(TR:26 ms,TE:2063 ms,F(xiàn)OV:512 mm×512 mm,層 厚:6 mm,矩陣:256×160)、矢狀位T1WI 增強(qiáng)圖像(TR:10 ms,TE:1729 ms,F(xiàn)OV:512 mm×512 mm,層 厚:6 mm,矩陣:288×160)。GE Discovery MR750w 3.0 T MRI 掃描儀成像序列參數(shù):軸位T1WI 增強(qiáng)圖像(TR:29 ms,TE:2242 ms,F(xiàn)OV:512 mm×512 mm,層 厚:6 mm,矩陣:288×288)、矢狀位T1WI 增強(qiáng)圖像(TR:23 ms,TE:1507 ms,F(xiàn)OV:512 mm×512 mm,層 厚:6 mm,矩陣:256×192)。掃描前自動勻場,使用機(jī)器配套高壓注射器,由肘靜脈團(tuán)注扎噴酸葡胺(Gd-DTPA),劑量為0.1 mmol/kg,注射速度為3.5 mL/s,隨后以相同速率注射20 mL生理鹽水沖刷。
研究流程見圖1。在圖像分割前,從PACS獲取圖像,使用N4 偏置場矯正消除低頻強(qiáng)度不均勻性。腫瘤分割流程見圖2。由兩名具備兩年以上神經(jīng)影像學(xué)經(jīng)驗(yàn)的影像醫(yī)生(A,B)獨(dú)立進(jìn)行圖像分割,軟件為ITK-SNAP (v3.8.0,http://www.itksnap.org/)。沿病灶邊緣勾畫感興趣區(qū),盡可能避開其他組織,拋棄頂部以及底部因容積效應(yīng)所致模糊層面。在勾畫完成一周后,由影像醫(yī)生A再次勾畫感興趣區(qū)。
圖1 研究流程圖。Fig.1 study flowchart.
圖2 腫瘤分割流程圖。Fig.2 tumor segmentation flowchart.
使用Python 的pyradiomics 庫(v3.0,https://pyradiomics.readthedocs.io/)提取影像組學(xué)特征,并對圖像進(jìn)行圖像標(biāo)準(zhǔn)化與重采樣(1 mm×1 mm×1 mm)。開啟的濾波器包括:local binary pattern、gradient、exponential、logarithm、square、squareroot、wavelet。每個(gè)序列可提取特征數(shù)為1688,軸位和矢狀位兩個(gè)序列共可提取3376個(gè)特征。提取的特征包括:648 個(gè)一階特征(firstorder)、28 個(gè)形狀特征、864 個(gè)灰度共生矩陣(gray level co-occurrence matrix,GLCM)、576 個(gè) 灰 度 游 程 矩 陣(gray level run length matrix,GLRLM)、576 個(gè)灰度區(qū)域大小矩陣、180 個(gè)鄰域灰度差矩陣(neighbourhood gray tone difference matrix,NGTDM)、504 個(gè)灰度相關(guān)矩陣(gray level dependence matrix,GLDM)。特征命名方式如下:濾波器_特征類型_特征名_序列。將數(shù)據(jù)以8∶2按原有高、低級別腦膜瘤比例隨機(jī)劃分為兩組,訓(xùn)練集105例,測試集27例。
使用訓(xùn)練集數(shù)據(jù)進(jìn)行特征可重復(fù)性評估。首先,計(jì)算影像醫(yī)生A、B獲得數(shù)據(jù)的觀察者間組內(nèi)相關(guān)系數(shù)(intra-class correlation coefficient,ICC)。之后,計(jì)算醫(yī)生A 兩次勾畫圖像獲得數(shù)據(jù)間的觀察者內(nèi)ICC。在醫(yī)生A 第二次提取的特征中,僅觀察者間ICC與觀察者內(nèi)ICC同時(shí)大于0.9被選用。
對訓(xùn)練集數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,標(biāo)準(zhǔn)化公式為z=(x-均數(shù))/標(biāo)準(zhǔn)差,再用訓(xùn)練集特征的均數(shù)與標(biāo)準(zhǔn)差對測試集數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。為消除類別不均衡的影響,我們對訓(xùn)練集數(shù)據(jù)采用少數(shù)類過采樣技術(shù)(synthetic minority over-sampling technique,SMOTE)。
使用Scikit-learn 庫(v0.24,https://scikit-learn.org/stable/)進(jìn)行特征篩選、建模、測試。首先,采用f_classif 進(jìn)行方差分析,保留P值小于0.05 的特征。之后利用SelectFromModel 計(jì)算各個(gè)特征的重要性,保留排名前30 的特征,再采用帶有5 折交叉驗(yàn)證的套索算法(least absolute shrinkage and selection operator,LASSO)選擇最優(yōu)的特征組合。最后,使用RBF核支持向量機(jī)算法構(gòu)建軸位、矢狀位、綜合模型,再進(jìn)行網(wǎng)格搜索(帶有5 折交叉驗(yàn)證)選擇最優(yōu)超參數(shù)。
根據(jù)訓(xùn)練集模型受試者工作特征曲線計(jì)算約登指數(shù),其最大值所對應(yīng)閾值即為最優(yōu)閾值。使用測試集數(shù)據(jù)檢驗(yàn)?zāi)P停ㄟ^曲線下面積(area under the curve,AUC)、敏感度、特異度、準(zhǔn)確度評估模型表現(xiàn),敏感度、特異度、準(zhǔn)確度為最優(yōu)閾值下分類結(jié)果計(jì)算獲得。
在153 例患者中,有21 例被排除,其中圖像質(zhì)量不佳、存在偽影者4例,MRI檢查前接受過腦膜瘤手術(shù)或放療者8 例,多發(fā)腦膜瘤者9 例。最終納入患者132 例(女93 例,男39 例,年齡18~84 歲,中位年齡56 歲),高級別腦膜瘤49 例(女26 例,男23 例,年齡22~84 歲,中位年齡55 歲),低級別腦膜瘤83 例(女67例,男16例,年齡18~69歲,中位年齡56歲)。
初步從感興趣區(qū)提取3376個(gè)特征,觀察者內(nèi)ICC和觀察者間ICC均大于0.9的特征有2534個(gè),1289個(gè)特征來自軸位圖像,1245 個(gè)來自矢狀位圖像。使用SMOTE 的綜合模型特征篩選過程如下:2534—方差分析—308—模型選擇—30—LASSO—21,最終獲得21個(gè)特征構(gòu)建模型,其類型及名稱見表1。
表1 應(yīng)用少數(shù)類過采樣技術(shù)構(gòu)建綜合模型的特征名稱Tab.1 Selected features of combined model with synthetic minority over-sampling technique
模型的腦膜瘤分級結(jié)果見表2。綜合模型的表現(xiàn)優(yōu)于單序列模型。在使用SMOTE 后,各個(gè)模型的AUC 均有提升,矢狀位、綜合模型在分類準(zhǔn)確度方面也有提升。在眾多模型中,使用SMOTE的綜合模型表現(xiàn)最為優(yōu)秀,在AUC 與準(zhǔn)確度方面均高于其他模型。使用SMOTE 的綜合模型最優(yōu)閾值為0.512,在閾值下測試分類準(zhǔn)確度為0.963,僅有一例高級別腦膜瘤被錯(cuò)誤分為低級別。
表2 模型的腦膜瘤分級結(jié)果Tab.2 The results of the models for meningiomas grading
腦膜瘤是成年人最常見的原發(fā)性顱內(nèi)腫瘤,高級別腦膜瘤預(yù)后差、易復(fù)發(fā),術(shù)前了解病理分級有助于臨床決策的制定,具有重要的意義[13]。MRI 是腦膜瘤非侵入評估的主要手段,然而常規(guī)序列仍然有一些局限,尤其是在術(shù)前預(yù)測腦膜瘤病理分級方面[14]。Kawahara等[15]研究表明,不清晰的腫瘤邊界和不均勻強(qiáng)化在高級別腦膜瘤出現(xiàn)的頻數(shù)更高,有助于預(yù)測腦膜瘤病理分級。但這些表現(xiàn)缺乏特異性,低級別腦膜瘤也可出現(xiàn)。在一項(xiàng)擁有更大樣本量(n=184)的研究中,Ke等[8]發(fā)現(xiàn)腫瘤位置、數(shù)量、大小、邊緣、強(qiáng)化等級、強(qiáng)化模式、硬膜尾長度、顱骨侵犯、靜脈竇形態(tài)、中線移位距離、瘤周水腫在高級別與低級別腦膜瘤間差異無統(tǒng)計(jì)學(xué)意義。盡管已有相關(guān)研究應(yīng)用彌散成像相關(guān)技術(shù)鑒別腦膜瘤病理分級,但是其效果存在一些爭議[16]。隨著技術(shù)的進(jìn)步,機(jī)器學(xué)習(xí)相關(guān)方法逐步應(yīng)用于影像學(xué),大量研究已經(jīng)證實(shí)機(jī)器學(xué)習(xí)在某些疾病診斷、鑒別方面優(yōu)于傳統(tǒng)的主觀診斷。Ugga等[17]的一項(xiàng)診斷性meta分析表明,影像組學(xué)在腦膜瘤病理分級方面表現(xiàn)出色,其AUC為0.88。
目前,機(jī)器學(xué)習(xí)技術(shù)在腫瘤影像鑒別的應(yīng)用主要可以分為兩類,一是影像組學(xué),二是卷積神經(jīng)網(wǎng)絡(luò)[18-19]。Banzato等[10]收集了117例腦膜瘤患者圖像,使用ADC圖像訓(xùn)練Inception v3卷積神經(jīng)網(wǎng)絡(luò)預(yù)測腦膜瘤病理分級,留一交叉驗(yàn)證分?jǐn)?shù)為0.94,樣本量的限制導(dǎo)致其并未拿出額外獨(dú)立數(shù)據(jù)測試模型表現(xiàn)。大部分醫(yī)學(xué)影像數(shù)據(jù)樣本量都相對較小,在一定程度上限制了卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用[20]。在樣本較小的情況下訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行疾病分類任務(wù)容易發(fā)生過擬合,導(dǎo)致泛化能力差[21]?;仡櫧谙嚓P(guān)研究,我們可以發(fā)現(xiàn)影像組學(xué)對樣本量需求更低,表現(xiàn)也十分優(yōu)秀[10,12,22-23]。因此,本研究選擇影像組學(xué)的方法構(gòu)建模型。
本研究共構(gòu)建6 個(gè)模型,其中使用SMOTE 的綜合模型表現(xiàn)最為優(yōu)秀,測試AUC及準(zhǔn)確度分別為0.982、0.963。Coroller 等[11]收集175 例腦膜瘤,先使用主成分分析,之后計(jì)算特征的方差和相關(guān)系數(shù)進(jìn)行特征篩選,最終得到的影像組學(xué)模型測試AUC為0.779。與其他相關(guān)研究比,其模型表現(xiàn)不佳,這可能是特征工程方面的問題所導(dǎo)致,主成分分析可能會損失部分特征的有用信息。在特征篩選前,本研究計(jì)算各個(gè)特征的重要性,選擇前30 個(gè)特征。這種方法既提高了計(jì)算效率,也避免保留過多特征導(dǎo)致模型表現(xiàn)不佳的可能。Chu等[24]收集98 例腦膜瘤(訓(xùn)練集70 例,測試集28 例),從軸位T1WI 增強(qiáng)圖像中提取影像組學(xué)特征,使用Logistic 回歸構(gòu)建模型,其測試AUC 和準(zhǔn)確度分別為0.948、0.929 (26/28)。盡管我們應(yīng)用了非線性的RBF核支持向量機(jī)算法,但未使用SMOTE 的軸位模型的AUC 和準(zhǔn)確度仍然低于Chu 等的模型。本研究的圖像并非來自同一臺機(jī)器,掃描參數(shù)存在差異,可能影響會模型的表現(xiàn)[8]。但在加入矢狀位特征與SMOTE后,模型表現(xiàn)有所提高。這可能是因?yàn)槭笭钗籘1WI 增強(qiáng)圖像含有與軸位T1WI 增強(qiáng)圖像不同的信息,兩者結(jié)合可以更好地呈現(xiàn)不同級別腦膜瘤的異質(zhì)性。此外,通過下采樣增加高級別腦膜瘤的樣本量,讓兩種級別樣本量更均衡。這兩項(xiàng)改進(jìn)在一定程度上提高了模型表現(xiàn)。
本研究仍然存在幾點(diǎn)不足:(1)由于grade Ⅱ、Ⅲ腦膜瘤發(fā)病率較低,所以將兩類合并為高級別腦膜瘤。(2)樣本量相對有限,結(jié)果仍需要更大規(guī)模的研究進(jìn)行驗(yàn)證。(3)本研究的圖像并非來自同一型號機(jī)器。(4)盡管增強(qiáng)使用對比劑都是Gd-DTPA,但來自不同公司。
綜上所述,本研究表明基于軸位和矢狀位T1WI增強(qiáng)圖像的影像組學(xué)模型可以在術(shù)前預(yù)測腦膜瘤病理分級,具備優(yōu)秀性能,有助于臨床決策的制訂,有一定的臨床價(jià)值。
作者利益沖突聲明:全體作者均聲明無利益沖突。