仲艷 王芬 張騰 沈杰 俞同福 袁梅
隨著CT 普及,越來越多的孤立性實性肺結節(jié)(solitary pulmonary solid nodule,SPSN)在篩查時被發(fā)現(xiàn)[1],其中肺癌最為常見[2]。近年來,隨 著對 隱球菌的認知及臨床診治水平的提高,肺隱球菌病發(fā)現(xiàn)率逐漸上升,其中表現(xiàn)為孤立性結節(jié)腫塊型肺隱球菌病引起越來越多的重視[3],因其可表現(xiàn)出諸多類似肺腺癌的CT 征象,如分葉、毛刺、胸膜牽拉、空泡等。肺隱球菌患者臨床癥狀缺乏特異性,血清隱球菌莢膜多糖抗原(cryptococcal capsular polysaccharide antigen,CrAg)檢測的敏感性不高,導致術前診斷困難[4]。如果該類結節(jié)被誤診為肺癌,患者可能會接受不必要的手術及過度醫(yī)療。因此,開發(fā)一種無創(chuàng)的、有效的方法在術前鑒別不確定的SPSN 至關重要。
影像組學作為近年來醫(yī)學影像領域的新興技術,應用高通量數據特征化運算法,量化捕獲病灶內部構造的空間異質性,在鑒別良惡性病變、預測腫瘤分級、生存期和治療反應等方面被廣泛研究[5-8]。本研究擬構建基于CT 高維定量信息的影像組學模型,并聯(lián)合臨床影像特征建立孤立性肺結節(jié)型的肺隱球菌和肺腺癌的鑒別診斷模型。
回顧性分析2015 年1 月~2021 年6 月在本院行胸部CT 患者的臨床影像資料。納入標準:(1)經皮肺穿刺活檢或手術切除,并經病理確診的肺隱球菌病和肺腺癌患者;(2)CT 表現(xiàn)為孤立性實性肺結節(jié)(直徑小于等于30 mm);(3)活檢或手術與術前最近一次CT 檢查間隔時間不超過2 周;(4)術前最近一次CT 層厚不超過1.5 mm。排除標準:(1)純磨玻璃或混雜磨玻璃結節(jié);(2)肺結節(jié)數量超過1 枚或原發(fā)結節(jié)周圍多發(fā)小結節(jié);(3)結節(jié)內存在明顯鈣化;(4)患者有惡性腫瘤病史。最終納入62 例肺隱球菌病和62 例肺腺癌患者(由于肺隱球菌病樣本量遠小于肺腺癌樣本量,連續(xù)隨機匹配了符合標準的62 例肺腺癌),并收集兩組的臨床特征(年齡、性別和吸煙情況)。
采用多排螺旋CT 薄層掃描(Siemens Somatom Definition 及Somatom Definition AS+),掃描參數如下:管電壓120 kV,管電流200/110 mAs,重組層間距1 mm,層厚1.5 mm。所有檢查均具縱隔窗(窗寬400 HU;窗位40 HU)和肺窗(窗寬1200 HU;窗位-600 HU),可通過適當調節(jié)窗寬、窗位進行特征評估。
所有CT 圖像以DICOM 格式導出保存,再導入內部圖像處理軟件(MultiLabel;ECNU,Shanghai,China)。隨機選取20 例患者,由兩位分別有3 年和10 年資歷的胸部影像診斷醫(yī)師獨立對病灶邊緣進行逐層勾畫獲得興趣體積(volume of interest,VOI),采用組內相關系數(intraclass correlation coefficient,ICC)對兩位診斷醫(yī)師提取的影像特征進行一致性分析,ICC 大于0.75 認為一致性很好。其余病灶由3 年資歷的胸部影像診斷醫(yī)師勾畫VOI,盡可能覆蓋整個病灶區(qū)域,同時避免病灶邊緣正常的肺部結構。由10 年資歷的胸部影像診斷醫(yī)師對VOI 進行校正。
將原始圖像及VOI 導入基于Python 的FeAture Explorer(FAE)平臺(程序代碼:http://github.com/salan668/FAE),共提取出479 個影像組學特征,包括形態(tài)特征、一階直方圖特征、紋理特征和基于小波變換的高階特征。首先對數據進行Z-score 標準化預處理。然后以7∶3 的比例拆分為訓練集和測試集。其中訓練集用于建立模型,測試集用于評估模型。采用皮爾森相似度(Pearson correlation coefficient,PCC)進行降維處理,最后通過方差分析(analysis of variance,ANOVA)選擇特征,使用邏輯回歸(logistic regression,LR)進行預測分類建模。
在不知道病理結果的情況下,分別由上述3年和10 年資歷的胸部影像診斷醫(yī)師對病灶影像學特征進行評估,并記錄以下病灶特征:直徑(病灶在最大軸位層面上的最長徑)、部位(左上葉、左下葉、右上葉、右中葉、右下葉)、分葉(圖1a)、毛刺(圖1b)、空泡(圖1c)、邊界、暈征和胸膜關系(圖1d)。當兩位醫(yī)師之間存在評估不一致時,由一名15 年資歷的胸部影像診斷醫(yī)師評判。
圖1 CT 軸位示4 例孤立性肺實性結節(jié)均為肺隱球菌病。a)~d)分別為分葉征、毛刺征、空泡征、胸膜牽拉征
所有數據均使用IBM SPSS 軟件(Version 25.0)進行分析。兩組之間連續(xù)變量的差異性用t 檢驗或Mann-Whitney U 檢驗進行分析,分類變量用卡方檢驗進行分析。二元Logistic 回歸用于多因素分析。使用MedCalc 軟件繪制受試者工作特征(receiver operating characteristic,ROC)曲 線,來 評估各模型的分類性能,以曲線下面積(area under the curve,AUC)作為評判標準。P<0.05 為具有統(tǒng)計學差異。
肺隱球菌病患者62 例,男37 例,女25 例,平均年齡51 歲;肺腺癌患者62 例,男37 例,女25例,平均年齡54 歲。兩組的臨床影像特征詳見表1,其中吸煙、分葉、邊界和暈征在兩組間具有統(tǒng)計學意義(P<0.05)。
表1 患者的臨床和影像特征
通過一致性檢驗、皮爾森相關系數法降維、方差分析和分類器篩選后,從479 個放射組學特征中,篩選出11 個對鑒別肺隱球菌病和肺腺癌最具有價值的特征,包括3 個一階直方圖特征(wavelet-HL_firstorder_Minimum、wavelet-HH_ firstorder_90Percentile、original_shape_Flatness),3 個灰度共生矩陣特征(wavelet-LH_glcm_Imc2、wavelet-HL_glcm_Imc2、wavelet-HH_glcm_Imc2),1 個灰度相關矩陣特征(wavelet-LL_gldm_DependenceEntropy)和4 個灰度區(qū)域大小矩陣特征(wavelet-LL_glszm_HighGrayLevelZoneEmphasis、original_glszm_SmallArea LowGrayLevelEmphasis、original_glszm_LowGrayLevel ZoneEmphasis、original_glszm_GrayLevelVariance)。
臨床影像特征中吸煙、分葉、邊界和暈征在兩組間具有統(tǒng)計學意義,進一步多因素分析,分葉、邊界和暈征是獨立危險因素(圖2),建立臨床影像特征的Logistic 回歸模型,AUC 值0.792(敏感度63.2%、特異度82.3%)。用篩選出來的11 個影像組學特征建立Logistic 回歸模型,AUC 值為0.953(敏感度88.9%、特異度90.3%)。將篩選出來的臨床影像特征和影像組學特征聯(lián)合構建Logistic 回歸模型,AUC 值0.971(敏感度92.6%、特異度93.5%)??梢娐?lián)合模型的診斷效能較高(表2、圖3)。
圖2 多因素分析顯示臨床影像特征中暈征、邊界和分葉是獨立因素,用來構建臨床影像特征模型
圖3 三種模型(臨床影像模型、影像組學模型、聯(lián)合模型)的ROC曲線
表2 三種模型(臨床影像模型、影像組學模型、聯(lián)合模型)的診斷效能
肺隱球菌病主要是通過呼吸道吸入隱球菌孢子后引起的的亞急性/慢性肺部真菌感染性疾病,主要發(fā)生于免疫功能受損者,也可見于免疫正常人群[9]。免疫 功能正常者多以結節(jié)或腫塊為主[10],易誤診為肺腺癌。本研究構建了表現(xiàn)為孤立性肺結節(jié)型的肺隱球菌病和肺腺癌的鑒別診斷模型,且取得了較高的診斷效能。
雖然有文獻[11]表明血清CrAg 是一種有效的診斷方法,但是臨床上還是有很多肺隱球菌病患者血清CrAg 呈陰性。Min 等[12]的研究表明,肺隱球菌病表現(xiàn)為孤立性病灶時患者血清CrAg 多呈陰性??梢?,對于表現(xiàn)為肺孤立性病灶的肺隱球菌病,血清CrAg 檢測有一定局限性。
既往有很多學者探討是否有特異的臨床因素或影像特征來鑒別肺隱球菌病和肺腺癌。Deng等[13]研究表明沒有特異性的臨床或影像特征來診斷肺隱球菌病。有研究表明吸煙是侵襲性真菌感染的危險因素[14],但其影響機制尚不完全清楚。本研究中單因素分析顯示吸煙在鑒別肺隱球菌和肺腺癌中具有統(tǒng)計學差異,但在多因素分析中吸煙不是獨立危險因素,可能與病例樣本量有關。Chen等[15]研究發(fā)現(xiàn)肺隱球菌病表現(xiàn)為孤立性肺結節(jié)時更易出現(xiàn)支氣管充氣征、衛(wèi)星灶和暈征。本研究顯示暈征、分葉和邊界清楚是鑒別肺隱球菌病和肺腺癌的獨立因素,分葉和邊界清楚更提示肺腺癌的診斷,而暈征更傾向于肺隱球菌病的診斷。由于腫瘤的生長張力較大,生長速度不均,病灶更傾向于呈分葉,而孤立性肺隱球菌病生長張力較小,生長速度相對均勻,出現(xiàn)分葉的可能較小。由于腫瘤細胞浸潤肺泡壁肺泡腔生長,邊界相對清楚,而肺隱球菌病由于炎性浸潤或肺泡出血,邊界相對欠清,目前未有研究表明分葉和邊界是肺隱球菌病和肺腺癌的鑒別因素。暈征組織學提示與肉芽腫性炎癥有關,高度提示肺隱球菌的診斷,與前述既往研究相符。但這三者構建的臨床影像特征模型的診斷效能不高(AUC 值為0.792)。
影像組學具有較好的客觀量化分析功能,近年來成為影像診斷的研究熱點[16,17]。本研究共提取出479 個影像組學特征,篩選出11 個對鑒別肺隱球菌病和肺腺癌最具有價值的影像組學特征,包括3 個一階特征和8 個灰度特征。小波變換可以對低頻分量提供良好的頻率分辨率,對高頻分量提供較高的時間分辨率[18],具有較高的模型貢獻度。但是影像組學特征和病灶復雜的病理生理之間的關系,目前還不確切[19]。通過Logistic 回歸建立影像組學特征模型(AUC 值為0.953),具有很高鑒別能力。
本研究將臨床影像特征和影像組學特征相結合構建聯(lián)合診斷模型,結果顯示聯(lián)合模型AUC(0.971)的診斷效能較高。聯(lián)合診斷模型的優(yōu)勢在于不僅融合病灶的形態(tài)學特征,還融合了病灶內部微觀結構異質性信息,對肺隱球菌病和肺腺癌的鑒別診斷提供了可靠的依據。
目前影像組學研究存在幾個方面的挑戰(zhàn):一方面,有許多機器學習方法用于建立基于影像組學特征的預測模型,最常見且通俗易懂的是Logistic回歸模型,還有隨機森林、支持向量機、交叉驗證、聚類分析、人工神經網絡等,研究結果的可重復性相對較差,有必要對影像組學研究方法進行專業(yè)對比和行業(yè)規(guī)范;另一方面,單一的影像組學特征在評估和預測方面存在一定局限性,尚需聯(lián)合基因、病理和影像等不同維度的信息,更全面地提供病變內部異質性,為臨床提供更重要的價值;此外,影像組學研究成果轉化需要高質量的大數據樣本。
本研究的局限性。首先,由于回顧性研究的特性,選擇偏倚在樣本選擇中不可避免。其次,單中心研究,樣本量相對較少。最后,對于VOI 的勾畫,本研究僅局限于病灶本身,僅提供病灶內的信息。有研究表明,病灶外也包含大量的生物學信息,有利于鑒別良惡性、預測治療反應和生存期[20,21],這需要未來提取病灶外區(qū)域的影像組學特征來進一步研究確認。
綜上所述,本研究通過篩選影像組學特征及臨床影像特征,建立一個鑒別孤立性肺結節(jié)型肺隱球菌病和肺腺癌的聯(lián)合診斷模型,該模型具有較高的準確性,有望未來輔助臨床醫(yī)師診斷和決策,避免誤診和不恰當的治療。