鄧文祎 謝飛揚(yáng) 毛麗 李秀麗 孫照勇 徐凱 朱亮 金征宇 李驍 薛華丹
1中國醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)學(xué)院 北京協(xié)和醫(yī)院放射科,北京 100730;2深睿醫(yī)療人工智能研究院,北京 100080;3南京大學(xué)醫(yī)學(xué)院附屬金陵醫(yī)院(東部戰(zhàn)區(qū)總醫(yī)院)放射診斷科,南京 210002
隨著影像檢查設(shè)備的不斷進(jìn)步和人們健康意識的不斷提升,胰腺囊性病變(pancreatic cystic lesions, PCLs)的檢出率逐年升高。研究顯示在磁共振膽胰管成像中,PCLs的檢出率高達(dá)49.1%[1]。PCLs存在惡變風(fēng)險(xiǎn)[2],但較低[3],而其手術(shù)并發(fā)癥的發(fā)生率高達(dá)30%[4],因此絕大多數(shù)患者選擇接受長期影像學(xué)隨訪。然而隨之而來的檢查費(fèi)用給患者帶來巨大的經(jīng)濟(jì)負(fù)擔(dān),因此制定準(zhǔn)確的病灶進(jìn)展預(yù)測策略,是PCLs臨床管理的關(guān)鍵點(diǎn)之一[5]。有研究探討了PCLs進(jìn)展的風(fēng)險(xiǎn)因素,但是未形成有效的預(yù)測模型[6-8]。機(jī)器學(xué)習(xí)通過輸入特征之間的高階交互建立模型,以預(yù)測目標(biāo)結(jié)果,廣泛應(yīng)用于疾病的診斷、鑒別診斷和預(yù)后預(yù)測研究[9-11]。本研究擬基于患者基線臨床及CT影像特征,建立無手術(shù)征象的隨訪PCLs進(jìn)展風(fēng)險(xiǎn)預(yù)測機(jī)器學(xué)習(xí)模型,以幫助臨床更高效地管理PCLs患者,合理分配醫(yī)療資源。
回顧性分析2014年7月至2022年12月間北京協(xié)和醫(yī)院放射科行腹部薄層增強(qiáng)CT掃描的177例患者、200個(gè)PCLs病灶的基線臨床和影像學(xué)資料。納入標(biāo)準(zhǔn):基線檢查時(shí)無歐洲PCLs研究小組指南規(guī)定的手術(shù)征象[12](病灶≥4 cm、壁結(jié)節(jié)或?qū)嵭猿煞?、主胰管擴(kuò)張≥10 mm、顯性黃疸、細(xì)胞學(xué)或病理檢查陽性)。排除標(biāo)準(zhǔn):(1)有胰腺實(shí)性占位、活動(dòng)性癌癥或胰腺癌家族史;(2)圖像質(zhì)量不佳;(3)病灶<5 mm。根據(jù)隨訪3年間PCLs病灶是否出現(xiàn)手術(shù)征象,將其分為進(jìn)展組和無進(jìn)展組。將200個(gè)病灶以3∶1的比例隨機(jī)分為訓(xùn)練集(150個(gè))和內(nèi)部測試集(50個(gè)),訓(xùn)練集進(jìn)展組病灶51個(gè),無進(jìn)展組病灶99個(gè);內(nèi)部測試集進(jìn)展組病灶17個(gè),無進(jìn)展組病灶33個(gè)?;仡櫺允占?011年10月至2020年5月間南京大學(xué)醫(yī)學(xué)院附屬金陵醫(yī)院放射科行腹部薄層增強(qiáng)CT掃描的14例患者、15個(gè)病灶作為外部測試集,其中進(jìn)展組病灶6個(gè),無進(jìn)展組病灶9個(gè)。本研究經(jīng)醫(yī)院倫理委員會(huì)批準(zhǔn)(批準(zhǔn)號:K23C2395),所有患者均簽署知情同意書。
患者基線檢查CT設(shè)備為西門子SOMATOM Definition Flash、SOMATOM Force、SOMATOM go.All和飛利浦IQon Spectral CT。掃描參數(shù):管電壓120 kVp,管電流采用自動(dòng)mA調(diào)節(jié)技術(shù),旋轉(zhuǎn)時(shí)間0.5 s,層厚1~3 mm,層間距1 mm,矩陣512×512。經(jīng)肘靜脈以3.0 ml/s的速率注射對比劑碘普羅胺(優(yōu)維顯,德國先靈公司)1.2 ml/kg。分別在注射對比劑后20、60、120 s行動(dòng)脈期、門靜脈期、延遲期掃描。掃描范圍從膈頂?shù)侥I臟下緣。
1.臨床資料:性別、年齡、血清總膽紅素水平、隱性黃疸、糖尿病史、胰腺炎史及血清CEA、CA19-9水平。
2.CT影像學(xué)資料:病灶位置、病灶大小、主胰管管徑、囊壁增厚(>2 mm)或強(qiáng)化、分隔、分隔增厚(>2 mm)或強(qiáng)化、病灶鈣化、胰腺萎縮。其中胰腺萎縮定義為胰頭厚度<2 cm、胰體厚度<2 cm或胰尾厚度<1 cm。
3.隨訪資料:以CT檢查當(dāng)天為隨訪開始時(shí)間,截止時(shí)間為影像學(xué)(增強(qiáng)CT或MRI)或?qū)嶒?yàn)室檢查結(jié)果提示PCLs病灶出現(xiàn)手術(shù)征象時(shí),或CT檢查后3年。記錄患者的病灶大小、主胰管管徑、病灶內(nèi)是否存在壁結(jié)節(jié)或?qū)嵭猿煞帧⒀蹇偰懠t素水平及細(xì)胞學(xué)或病理檢查結(jié)果。
由2名影像科醫(yī)師在對患者的臨床表現(xiàn)和病理信息不知情的情況下完成影像學(xué)評估。如測量結(jié)果不一致,則與1名高級別影像科醫(yī)師討論達(dá)成一致意見。納入兩名影像科醫(yī)師間測量一致性較好的特征建模,即連續(xù)變量組內(nèi)相關(guān)系數(shù)(intraclass correlation efficient, ICC)>0.75、分類變量Kappa>0.4的特征。其中連續(xù)變量特征采用Z分?jǐn)?shù)歸一化處理,分類變量特征采用獨(dú)熱編碼處理。
采用多種特征選擇方法、多種機(jī)器學(xué)習(xí)模型進(jìn)行組合,并基于10折交叉驗(yàn)證法篩選最優(yōu)機(jī)器學(xué)習(xí)模型。其中特征選擇方法包括基于F檢驗(yàn)的特征選擇算法和L1范數(shù)特征選擇算法;機(jī)器學(xué)習(xí)模型包括支持向量機(jī)(support vector machine, SVM)、線性判別分析、邏輯回歸、高斯樸素貝葉斯分類器、伯努利樸素貝葉斯分類器、K鄰域分類器和決策樹分類器。
在10折交叉驗(yàn)證集上繪制各模型的受試者工作特征曲線(receiver operating characteristic curve,ROC),計(jì)算曲線下面積(area under the curve, AUC),取AUC值最高的模型作為最優(yōu)模型,并在訓(xùn)練集上重新訓(xùn)練模型,作為最終的預(yù)測模型。在測試集上計(jì)算AUC值、靈敏度、特異度和準(zhǔn)確度,以評估模型的預(yù)測效能。使用置換重要性評估納入最優(yōu)模型特征的重要程度。建立最優(yōu)模型的校準(zhǔn)曲線,采用Hosmer-Lemeshow檢驗(yàn)評估模型的臨床適用性。
采用SPSS 20.0進(jìn)行統(tǒng)計(jì)學(xué)分析。正態(tài)分布的計(jì)量資料以±s表示,組間比較采用獨(dú)立樣本t檢驗(yàn);非正態(tài)分布計(jì)量資料以M(Q1、Q3)表示,組間比較采用Mann-Whitney檢驗(yàn);計(jì)數(shù)資料以個(gè)數(shù)(%)表示,組間比較采用χ2檢驗(yàn)或Fisher確切概率法。P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
兩名醫(yī)師重復(fù)測量影像特征的ICC值為0.857~0.948,Kappa值為0.438~0.793,代表中等至很強(qiáng)的一致性。
訓(xùn)練集及內(nèi)部測試集200個(gè)PCLs病灶和外部測試集15個(gè)PCLs病灶的基線臨床及影像學(xué)特征見表1。訓(xùn)練集和內(nèi)部測試集的進(jìn)展組與無進(jìn)展組在胰腺炎史、病灶大小、主胰管管徑、主胰管擴(kuò)張、囊壁增厚、分隔存在、分隔增厚間的差異及內(nèi)部測試集的兩組在性別、病灶鈣化和胰腺萎縮間的差異均有統(tǒng)計(jì)學(xué)意義(P值均<0.05)。外部測試集的進(jìn)展組與無進(jìn)展組的病灶大小和胰管擴(kuò)張差異亦有統(tǒng)計(jì)學(xué)意義(P值均<0.05)。
表1 訓(xùn)練集、內(nèi)部測試集、外部測試集進(jìn)展組和無進(jìn)展組胰腺囊性病變基線臨床及影像學(xué)特征比較
內(nèi)部測試集進(jìn)展組中位隨訪時(shí)間為10.57個(gè)月,17個(gè)病灶中,8個(gè)病灶≥4 cm,4個(gè)壁結(jié)節(jié)或?qū)嵭猿煞郑?個(gè)胰管擴(kuò)張≥10 mm,2個(gè)病灶所在患者顯性黃疸,4個(gè)細(xì)胞學(xué)或病理檢查陽性,出現(xiàn)病灶同時(shí)存在兩種及以上手術(shù)征象。外部測試集進(jìn)展組中位隨訪時(shí)間為0.48個(gè)月,6個(gè)病灶中,4個(gè)病灶≥4 cm,2個(gè)細(xì)胞學(xué)或病理檢查陽性。
應(yīng)用基于F檢驗(yàn)的特征選擇算法,從8項(xiàng)臨床特征及11項(xiàng)影像學(xué)特征中最終篩選出1項(xiàng)臨床特征(胰腺炎病史)和4項(xiàng)影像學(xué)特征(基線病灶大小、囊壁增厚、主胰管管徑和主胰管擴(kuò)張)進(jìn)入預(yù)測模型(圖1)。SVM、線性判別分析、邏輯回歸、高斯樸素貝葉斯分類器、伯努利樸素貝葉斯分類器、K鄰域分類器和決策樹分類器在交叉驗(yàn)證集上的AUC值分別為0.899、0.897、0.897、0.888、0.876、0.848和0.830,其中SVM模型的AUC值最高,故作為最優(yōu)模型進(jìn)一步評估。
在訓(xùn)練集、內(nèi)部及外部測試集上,SVM模型對PCLs進(jìn)展預(yù)測的ROC曲線見圖2,AUC值分別為0.910、0.909、0.944,靈敏度分別為84.3%、82.4%、100%,特異度分別為83.8%、72.7%、77.8%,準(zhǔn)確度分別為84.0%、76.0%、86.7%,提示模型預(yù)測結(jié)果準(zhǔn)確且模型可推廣性強(qiáng)。SVM模型在內(nèi)、外部測試集上的校準(zhǔn)曲線如圖3所示,曲線接近對角線。Hosmer-Lemeshow擬合優(yōu)度檢驗(yàn)顯示,內(nèi)部測試集P=0.636,外部測試集P=0.840,代表模型對測試集PCLs進(jìn)展真實(shí)情況的擬合較好。
圖2 SVM模型在訓(xùn)練集、交叉驗(yàn)證集、內(nèi)部及外部測試集上預(yù)測胰腺囊性病變進(jìn)展的ROC曲線
圖3 SVM模型在內(nèi)部(3A)和外部(3B)測試集上預(yù)測胰腺囊性病變進(jìn)展的校準(zhǔn)曲線
近年來,隨著PCLs檢出率的增加,隨訪患者數(shù)量增長,PCLs進(jìn)展危險(xiǎn)因素被廣泛關(guān)注。Pandey等[8]發(fā)現(xiàn)基線病灶較大的組更易發(fā)生美國放射學(xué)會(huì)偶發(fā)病變委員會(huì)白皮書中定義的病灶增大。Oyama等[6]發(fā)現(xiàn)基線病灶大和主胰管管徑寬與PCLs惡變相關(guān)。Tsai等[13]發(fā)現(xiàn)分隔和擴(kuò)張的胰管在進(jìn)展組(囊生長速度>1 mm/年)PCLs更多見。上述研究顯示通過宏觀影像特征進(jìn)行PCLs進(jìn)展風(fēng)險(xiǎn)分層的潛在價(jià)值。本研究篩選出基線病灶大小、囊壁增厚、主胰管管徑和主胰管擴(kuò)張4項(xiàng)影像特征納入模型,其中,基線病灶大小是置換重要性最高的特征,同前述研究結(jié)果一致,且福岡指南[14]、美國胃腸病學(xué)會(huì)指南[15]都推薦以基線病灶大小指導(dǎo)隨訪間隔。Vullierme等[16]發(fā)現(xiàn)包括囊壁增厚在內(nèi)的4個(gè)影像學(xué)特征與惡性胰腺黏液性囊腺瘤有關(guān)。本研究中主胰管擴(kuò)張和主胰管管徑對PCLs進(jìn)展風(fēng)險(xiǎn)的預(yù)測作用也與前述研究一致。此外,Procacci等[17]發(fā)現(xiàn)囊壁或分隔上的鈣化與胰腺黏液性囊性腫瘤惡性風(fēng)險(xiǎn)有關(guān)。Nakahodo等[18]發(fā)現(xiàn)局灶胰腺萎縮是高級別異型增生的危險(xiǎn)因素。本研究中,訓(xùn)練集和內(nèi)、外部測試集的進(jìn)展組病灶鈣化和胰腺萎縮均較無進(jìn)展組更多見,但僅在內(nèi)部測試集中差異有統(tǒng)計(jì)學(xué)意義。本研究還將指南[12,15]中與PCLs惡性相關(guān)的臨床危險(xiǎn)因素納入分析,最終篩選出胰腺炎史納入模型,與Ohtsuka等[19]的研究結(jié)果一致。值得注意的是,上述研究及本研究所選出的與PCLs進(jìn)展相關(guān)的特征均略有不同,原因可能在于不同研究對于進(jìn)展的定義不同。本研究旨在高效管理PCLs患者,使病灶穩(wěn)定的患者減少隨訪頻率,而進(jìn)展高風(fēng)險(xiǎn)患者應(yīng)密切隨訪以早期發(fā)現(xiàn)惡變并手術(shù),故將進(jìn)展定義為出現(xiàn)手術(shù)征象。此外,本研究設(shè)置了外部測試集,能夠更全面地評估預(yù)測模型的可推廣性,促進(jìn)模型在臨床上應(yīng)用。
本研究結(jié)果表明,基于PCLs病灶的基線臨床和CT影像特征的SVM模型,能夠在病灶進(jìn)展發(fā)生前相當(dāng)長的一段時(shí)間(內(nèi)部測試集進(jìn)展組中位隨訪時(shí)間10.57個(gè)月)預(yù)測進(jìn)展發(fā)生與否,且預(yù)測AUC值在內(nèi)、外部測試集上分別達(dá)0.909、0.944,校準(zhǔn)曲線顯示,模型的預(yù)測概率與實(shí)際PCLs進(jìn)展概率基本相當(dāng)。該模型納入的特征均是可解釋性強(qiáng)的臨床及宏觀影像特征,經(jīng)獨(dú)立的內(nèi)、外部測試集驗(yàn)證具有良好且穩(wěn)定的預(yù)測效能,能夠有效地幫助臨床更高效地管理PCLs患者,合理分配醫(yī)療資源。
本研究存在一定局限性。首先,本研究為回顧性研究,樣本量較小,有待后續(xù)納入來自多個(gè)中心的隨訪患者,以建立更加穩(wěn)定可推廣的模型。其次,本研究僅基于CT圖像建模。盡管MRI是指南推薦的PCLs隨訪影像檢查手段之一[12],但因其檢查時(shí)間長、對患者要求高(憋氣時(shí)間長、體內(nèi)不能有金屬植入物)、價(jià)格昂貴,在國內(nèi)應(yīng)用不及CT廣泛。多項(xiàng)研究顯示,初診PCLs更常見于CT檢查[20],且CT與MRI對惡性PCLs的診斷準(zhǔn)確度相當(dāng)[21]。綜上所述,本研究基于患者臨床及宏觀CT影像學(xué)特征建立PCLs進(jìn)展的預(yù)測模型,后續(xù)將進(jìn)一步結(jié)合影像組學(xué)及囊液生物標(biāo)志物建立綜合預(yù)測模型,為PCLs的隨訪策略提供更精準(zhǔn)的指導(dǎo)。
利益沖突所有作者聲明無利益沖突
作者貢獻(xiàn)聲明鄧文祎:研究操作、數(shù)據(jù)整理、統(tǒng)計(jì)學(xué)分析、論文撰寫;謝飛揚(yáng)、毛麗:研究操作、數(shù)據(jù)整理、統(tǒng)計(jì)學(xué)分析;孫照勇、徐凱:工作支持;李秀麗、朱亮、金征宇:研究指導(dǎo)、工作支持;李驍、薛華丹:研究設(shè)計(jì)、研究指導(dǎo)、論文修改、經(jīng)費(fèi)支持