陳麗華 ,劉愛連,郭 妍,李 昕,郭 丹,宋清偉,魏 強(qiáng)
(1.大連醫(yī)科大學(xué)附屬第一醫(yī)院,遼寧 大連 116011;2.通用電氣醫(yī)療集團(tuán),北京 100176)
前列腺癌(Prostatic carcinoma,PCa)是男性第二常見的腫瘤[1],也是男性癌癥死亡的主要原因,常合并前列腺增生(Benign prostatic hyperplasia,BPH),早發(fā)現(xiàn)、早診斷及鑒別診斷具有重要的臨床意義。目前,前列腺磁共振擴(kuò)散加權(quán)成像(Diffusion-weighted imaging,DWI)在臨床上有著較廣泛的應(yīng)用[2-4]。前列腺報(bào)告數(shù)據(jù)系統(tǒng)(PI-RADS V2)[5]作為一種質(zhì)量控制手段規(guī)范報(bào)告,可以減少醫(yī)師之間的診斷不一致性。PI-RADS 4 分為可疑PCa,評(píng)分較為復(fù)雜,臨床上誤診率較高[6-7]。傳統(tǒng)的基于醫(yī)師肉眼觀察的影像方法獲得的影像特征,與醫(yī)師的臨床經(jīng)驗(yàn)有很大關(guān)系,從而忽略了更多肉眼無法分辨的有價(jià)值的影像特征。影像組學(xué)是一種能夠?qū)⒂跋駭?shù)據(jù)轉(zhuǎn)化為具有高分辨率的可挖掘的定量參數(shù)的方法[8]。有研究顯示,MRI 影像組學(xué)對(duì)于PCa 的診斷與鑒別診斷有著重要價(jià)值[9],結(jié)合影像組學(xué)模型可以提高PI-RADS 的診斷效能[10]。
本研究旨在探討應(yīng)用影像組學(xué)提取、分析前列腺DWI 圖像的影像特征并結(jié)合諾模圖,用以鑒別PCa 與BPH 的應(yīng)用價(jià)值,同時(shí)探討其對(duì)于PIRADS 4 分的可疑PCa 病例診斷的可行性。
回顧性收集于我院接受前列腺3.0T MR 檢查的患者,納入標(biāo)準(zhǔn):①可配合MR 檢查,前列腺成像清晰;②MR 檢查后1 月內(nèi)進(jìn)行手術(shù)或穿刺,有病理結(jié)果證實(shí)。排除標(biāo)準(zhǔn):①M(fèi)R 檢查前曾接受活檢或相關(guān)治療者;②既往前列腺手術(shù)者;③MRI 偽影重,圖像質(zhì)量欠佳。以時(shí)間為節(jié)點(diǎn),按照PCa∶BPH樣本量=1∶1 的比例,收集PCa 130 例(2010 年7月—2017 年10 月),年齡50~90 歲,平均(72.26±8.29)歲;BPH 130 例(2010 年7 月—2016 年7 月),年齡51~87 歲,平均(69.13±8.24)歲。本研究經(jīng)倫理委員會(huì)同意,知情同意書舍棄。
設(shè)立隨機(jī)種子,將260 例數(shù)據(jù),即PCa 130 例與BPH 130 例均按照7∶3 的比例,隨機(jī)劃分為訓(xùn)練組和驗(yàn)證組(圖1)。
采用GE Signa HDXT 3.0T 磁共振掃描儀,8通道腹部線圈?;颊邫z查前禁食、禁水4 h,清潔腸道,排空尿液。對(duì)所有患者行MRI 常規(guī)T1WI、T2WI脂肪抑制掃描、對(duì)比動(dòng)態(tài)增強(qiáng)MRI(Dynamic contrast-enhanced,DCE-MRI)掃描及DWI 掃描。DWI掃描采用回波平面成像脈沖(Echo planar imaging,EPI)序列,DWI 掃描參數(shù):TR 3 575 ms,TE 87 ms,b值取0、1 000 s/mm2,層厚5 mm,層間距1 mm,F(xiàn)OV=30cm×30cm,矩陣128×128,NEX=8,掃描時(shí)間約139s。
圖1 PCa 與BPH 患者收集流程。Figure 1.The flow chart of PCa and BPH collection.
由2 名具有5 年MR 診斷經(jīng)驗(yàn)的影像醫(yī)生在PACS 系統(tǒng)上對(duì)所有入組病例進(jìn)行閱片,根據(jù)PIRADS V2 評(píng)分標(biāo)準(zhǔn),經(jīng)協(xié)商進(jìn)行1~5 分的評(píng)分,將評(píng)分為4 分的病例列為可疑病變組[5]。
分別構(gòu)建臨床模型、組學(xué)模型及聯(lián)合模型,流程見圖2。
1.4.1 臨床模型
圖2 臨床模型、組學(xué)模型、聯(lián)合模型構(gòu)建流程。Figure 2.The building process of clinical model,radiomic model and nomogram.
在訓(xùn)練組中,將傳統(tǒng)方式獲取得到的年齡、病灶位置、DWI 信號(hào)特點(diǎn)及總前列腺特異性抗原(Total prostate specific antigen,TPSA)值4 個(gè)因素分別經(jīng)過秩和檢驗(yàn)或t 檢驗(yàn),然后分別將有統(tǒng)計(jì)學(xué)意義的特征納入單因素邏輯回歸和多因素邏輯回歸分析,篩選有統(tǒng)計(jì)學(xué)意義的特征,建立臨床模型,并分別在訓(xùn)練組和驗(yàn)證組中繪制ROC 曲線,評(píng)估臨床模型的效能。
1.4.2 組學(xué)模型
①圖像分割:由2 名影像醫(yī)生于DWI 圖像上共同勾畫感興趣區(qū)(Region of interest,ROI),選取病灶顯示最大層面,為了避免勾畫病灶區(qū)域時(shí)受主觀因素影響,同時(shí)考慮到BPH 患者大多呈彌漫性分布,故本研究中沿前列腺邊緣勾畫出包含最大層面整個(gè)前列腺的ROI[11],勾畫的范圍兩人通過協(xié)商取得一致;對(duì)于DWI 信號(hào)未升高的病例,結(jié)合T2WI、DCE-MRI 圖像及穿刺結(jié)果確定病變層面(圖3)。②特征提?。航?jīng)Artificial Intelligence Kit 軟件(AK,通用電氣醫(yī)療,中國)自動(dòng)計(jì)算,得到基于前列腺輪廓的關(guān)于形態(tài)特征、DWI 信號(hào)值相關(guān)的一階直方圖特征以及基于灰度共生矩陣和步長矩陣等的紋理特征,共396 個(gè)。③特征降維:經(jīng)最小冗余最大相關(guān)(The minimum redundancy maximum relevance,MRMR)和LASSO(Least absolute shrinkage and selection operator)算法,選擇并保留在訓(xùn)練組中魯棒性最好且對(duì)模型貢獻(xiàn)率最高的特征。④模型構(gòu)建:基于上述保留的組學(xué)特征,在訓(xùn)練組樣本中,構(gòu)建多元邏輯回歸,經(jīng)十折交叉驗(yàn)證方法,得到最優(yōu)回歸模型,即組學(xué)模型。并分別在訓(xùn)練組和驗(yàn)證組中,繪制ROC 曲線,評(píng)估模型效能。
圖3 患者,男(圖3a~3c),75 歲,PCa,DWI 圖(圖3a)示右側(cè)外周帶明顯高信號(hào),在病灶最大層面沿前列腺邊緣勾畫ROI(圖3b);患者,男(圖3d~3f),88 歲,DWI 圖(圖3d)未見明顯高信號(hào),T2WI(圖3e)示左側(cè)外周帶不均勻低信號(hào),DCE-MRI(圖3f)見明顯強(qiáng)化,聯(lián) 合T2WI、DCE-MRI 確 定 病灶所在層面,在DWI 圖像上勾畫ROI(圖3g)。Figure 3.PCa,75 years old male (Figure 3a~3c),DWI image (Figure 3a) shows obviously high signal in the right peripheral zone,ROI was sketched along the edge of the whole prostate gland at the slice with the maximum diameter of the lesion (Figure 3b).PCa,88 years old male(Figure 3d~3f),there was no high signal on DWI image(Figure 3d),but,T2WI image(Figure 3e) shows mixed signal in the left peripheral zone,and enhanced obviously on DCE-MRI image(Figure 3f),then ROI was sketched at the same slice(Figure 3g).
1.4.3 聯(lián)合模型
聯(lián)合上述構(gòu)建的組學(xué)模型和臨床模型,采用逐步向后剔除的方法,構(gòu)建多元邏輯回歸的聯(lián)合模型,并繪制諾模圖,采用ROC 曲線、校準(zhǔn)曲線和決策曲線分別評(píng)估聯(lián)合模型在訓(xùn)練組和驗(yàn)證組的效能和臨床應(yīng)用價(jià)值。
將被醫(yī)生評(píng)估為PI-RADS 4 分的病變,代入到上述構(gòu)建的3 個(gè)模型中,分別驗(yàn)證并比較模型在可疑病變中的鑒別診斷效能。
所有統(tǒng)計(jì)分析工作均使用R 語言(版本3.3.2,http://www.rproject.org)完成。3 種模型之間的曲線下面積(AUC)比較采用DeLong 檢驗(yàn),P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
患者基本信息包括年齡、DWI 信號(hào)特點(diǎn)、TPSA水平及病灶位置,結(jié)果見表1。
根據(jù)PI-RADS V2 評(píng)分標(biāo)準(zhǔn),評(píng)分結(jié)果見表2,其中PI-RADS 4 分患者共63 例。
表1 患者基本信息
表2 PI-RADS 評(píng)分結(jié)果
如表2 所示,在PI-RADS 4 分的病例中,PCa患者30 例,BPH 患者33 例,所占比例相仿,陽性預(yù)測(cè)值不到50%,鑒別較困難。
基于常規(guī)臨床特征,構(gòu)建多元邏輯回歸模型,臨床模型的AUC 在訓(xùn)練組和驗(yàn)證組分別為0.88、0.82,敏感度分別為78.30%、74.42%,特異度分別為89.47%、80%,診斷準(zhǔn)確率分別為82.97%、76.92%,見圖4。
圖4 臨床模型、組學(xué)模型和聯(lián)合模型鑒別診斷BPH 和PCa 的ROC 曲線,其中圖4a 為用于評(píng)價(jià)該模型在訓(xùn)練組診斷效能的ROC 曲線,圖4b 為用于評(píng)價(jià)驗(yàn)證組的ROC 曲線。Figure 4.The ROC curves of clinical models,radiomics model and combined model distinguished BPH and PCa,Figure 4a and Figure 4b were ROC curves for training and testing dataset.
經(jīng)特征降維,篩選后得到的特征有12 個(gè)。組學(xué)模型的計(jì)算公式為:Radscore=1.635×uniformity+0.504×HaraEntroy +1.272 ×LowIntensitySmallAreaEmphasis +0.424×ClusterShade_angle45_offset4-0.423×stdDeviation+0.369×ClusterShade_angle135_offset7+0.081×sumEntropy-0.058×Range+0.016×ClusterProminence_angle45_offset7 -0.268 ×GLCMEntropy_AllDirection_offset4_SD-0.034×skewness+0.568。
組學(xué)模型的AUC 在訓(xùn)練組和驗(yàn)證組分別為0.91、0.90,敏感度分別為85.71%、74.36%,特異度分別為83.52%、87.18%,診斷準(zhǔn)確率分別為84.62%、80.77%,見圖4。
聯(lián)合模型的諾模圖見圖5 所示。
圖5 用于預(yù)測(cè)PCa 的諾模圖。注:①Radscore 即為組學(xué)評(píng)分,可經(jīng)上述計(jì)算公式計(jì)算得到;②DWI 結(jié)果為1 時(shí)表示信號(hào)有升高,0表示信號(hào)未升高;③TPSA 數(shù)值為≤4 ng/mL 時(shí),在圖中以0 表示,>4~10 ng/mL 時(shí),以1 表示,>10 ng/mL 時(shí),以2 表示。Figure 5.Radiomics nomogram for PCa prediction.Note:①Radscore was calculated by the Radiomics,which can be obtained by the above formula calculation;②DWI signal raised was denoted as 1,signal unraised was denoted as 0;③When the TPSA value range was ≤4 ng/mL,it was denoted as 0 in the figure;range >4~10 ng/mL,it was denoted as 1;>10 ng/mL,it was denoted as 2.
舉例說明,若1 名60 歲患者,經(jīng)TPSA 檢測(cè)其指標(biāo)范圍為>4~10 ng/mL,DWI 圖像經(jīng)放射科醫(yī)生診斷其前列腺病變部位信號(hào)未升高,最終代入諾模圖,60 歲對(duì)應(yīng)Points 分值為6 分;DWI 未升高即對(duì)應(yīng)為0,同理為0 分;TPSA 屬于1 類,則對(duì)應(yīng)Points 分值為1 分;其組學(xué)評(píng)分經(jīng)計(jì)算得到Radscore 數(shù)值為4,即對(duì)應(yīng)Points 分值為64 分。累計(jì)以上得分為6+0+1+64 分,對(duì)應(yīng)到諾模圖中的Total Points 標(biāo)尺中71分,因此其對(duì)應(yīng)惡性的可能為77.5%。該結(jié)果表明,當(dāng)DWI 圖像顯示結(jié)果可能為良性,TPSA 顯示為可疑病變時(shí),諾模圖可能會(huì)為臨床醫(yī)生診斷提供巨大的幫助。
經(jīng)驗(yàn)證,聯(lián)合模型即諾模圖的AUC 在訓(xùn)練組和驗(yàn)證組分別為0.95、0.92,敏感度分別為93.90%、83.33%,特異度分別為86%、88.89%,診斷準(zhǔn)確率分別為89.56%、85.90%(圖4),校準(zhǔn)性能和臨床應(yīng)用價(jià)值采用校準(zhǔn)曲線和決策曲線(圖6,7)。
在訓(xùn)練組中,聯(lián)合模型診斷效能大于組學(xué)模型(P<0.05)及臨床模型(P<0.05),組學(xué)模型與臨床模型的診斷效能間差異無統(tǒng)計(jì)學(xué)意義(P>0.05);在驗(yàn)證組中,聯(lián)合模型診斷效能大于臨床模型(P<0.05),其余間差異無統(tǒng)計(jì)學(xué)意義(P>0.05)。
圖6 中,橫坐標(biāo)為預(yù)測(cè)值,縱坐標(biāo)為實(shí)際值,對(duì)角虛線為完美的預(yù)測(cè)模型,而我們所得到的模型為其中細(xì)虛線,平均絕對(duì)誤差為0.017,均方誤差為0.000 4,判定系數(shù)R2值為0.679 8。其中R2表示模型與理想模型的擬合度,越接近1 表明擬合度越高,一般來講,R2>0.5 即表明回歸模型效果良好,結(jié)果表明本研究中諾模圖的擬合度較好。
圖7 中命名為“With Radscore”的紅色實(shí)線為聯(lián)合模型,即諾模圖,“Without Radscore”綠色實(shí)線為未融合影像組學(xué)特征之前的模型,即臨床模型。結(jié)果表明,當(dāng)閾值可能性高于0.01 時(shí),諾模圖的凈收益高于被識(shí)別為“全部惡性”或“全部良性”組的結(jié)果,并優(yōu)于臨床模型,且兩條曲線的分離度較好。
將63 例PI-RADS 4 分的可疑病變代入上述構(gòu)建的3 個(gè)模型中,可見臨床模型對(duì)于該類可疑病變,幾乎沒有診斷效能,AUC 僅為0.54,而組學(xué)模型的診斷效能顯著優(yōu)于臨床模型(P<0.05),AUC 為0.81,聯(lián)合模型的診斷效能低于組學(xué)模型(P<0.05),其AUC 為0.73,聯(lián)合模型和臨床模型的診斷效能間差異無統(tǒng)計(jì)學(xué)意義(P>0.05),ROC 曲線見圖8。
圖6 諾模圖的校準(zhǔn)曲線。圖6a:訓(xùn)練組;圖6b:驗(yàn)證組。Figure 6.Calibration curve of nomogram.Figure 6a:Training group;Figure 6b:Testing group.
圖7 諾模圖的決策曲線。Figure 7.Decision curve of nomogram.
圖8 3 個(gè)模型在PI-RADS 4 分的可疑前列腺病變中的鑒別診斷效能。Figure 8.The ROC curves of three models in PI-RADS 4 for differential diagnosis.
近年來,我國PCa 呈明顯持續(xù)增長趨勢(shì),正成為嚴(yán)重影響我國男性健康的泌尿系惡性腫瘤[12]。PCa自然病程長,個(gè)體間特性差異大,其預(yù)后及治療主要取決于早期診斷及分期。
MRI 因其具有較高的軟組織分辨率、多參數(shù)及多平面成像、無創(chuàng)等優(yōu)點(diǎn),成為目前臨床上前列腺檢查的首選方法。較常規(guī)MRI 序列,DWI 能在活體組織中評(píng)價(jià)水分子的微觀擴(kuò)散運(yùn)動(dòng),同時(shí)DWI 還提供了定量參數(shù),表觀擴(kuò)散系數(shù)(Apparentdiffusion coefficient,ADC)在PCa 的檢出、鑒別診斷及術(shù)前預(yù)測(cè)等方面都有應(yīng)用[13-15]。DWI 中b 值的選取對(duì)圖像及其定量參數(shù)的測(cè)量有較大影響[16],目前還沒有完全統(tǒng)一的b 值;另外,DWI 還會(huì)受到患者和檢查設(shè)備之間差異等因素的影響[17]。因此,單一的功能成像方法不能滿足診斷需求。
MRI 多序列成像為影像醫(yī)師提供多方面參考的同時(shí),也帶來了一些不便。臨床工作中,不同影像醫(yī)師采用不同序列進(jìn)行前列腺M(fèi)RI 影像報(bào)告,對(duì)同一病例可能給出不同的診斷結(jié)果,影響了影像醫(yī)師與臨床醫(yī)師之間的信息溝通。PI-ARDS 產(chǎn)生的目的是減少影像醫(yī)師之間對(duì)待同一病例診斷結(jié)果的多樣性,綜合分析T2WI、DWI 及DCE-MRI 序列,對(duì)來自多中心、多參數(shù)磁共振的圖像更容易達(dá)到診斷的共識(shí)[18]。但是,PI-RADS 是對(duì)傳統(tǒng)影像的觀察、人為分析,與影像醫(yī)師的經(jīng)驗(yàn)有很大關(guān)系。臨床工作中,對(duì)于PI-RADS 4 分的病例診斷仍較困難,本研究中,PI-RADS 4 分的病例共63 例,其中PCa 有30 例,陽性預(yù)測(cè)值僅為47.62%。因此,診斷PI-RADS 4 分中的PCa 病例受到研究者們的關(guān)注[6-7]。
近年來,隨著醫(yī)學(xué)影像成像技術(shù)以及信息分析技術(shù)的長足發(fā)展,高通量提取病灶的影像特征信息來進(jìn)行定量、分析、建模得以實(shí)現(xiàn),即影像組學(xué),影像組學(xué)是在已有的影像學(xué)資料的基礎(chǔ)上,應(yīng)用軟件進(jìn)行計(jì)算、分析,進(jìn)而為臨床診斷及治療提供更多的參考信息。自2012 年這一概念提出后,PCa 的影像組學(xué)研究受到了眾多學(xué)者的關(guān)注,從形態(tài)學(xué)、MR 圖像到基因方面均有研究[11,20-21]。
對(duì)于MR 圖像,大家的研究主要集中于T2WI、DWI 的ADC 圖和DCE-MRI[22-23]。Ginsburg 等[22]的研究中,從80 例PCa 患者中,通過分析T2WI 圖、ADC圖紋理特征及DCE-MRI 的動(dòng)力學(xué)等相關(guān)特征,得到11 個(gè)最為穩(wěn)定的組學(xué)特征,建立組學(xué)模型,能夠很好地鑒別發(fā)生于結(jié)合帶的PCa 和外周帶的PCa。本研究中,直接分析DWI 圖像的組學(xué)特征,經(jīng)特征降維、篩選后得到12 個(gè)特征,建立組學(xué)模型,并分別在訓(xùn)練組和驗(yàn)證組中繪制ROC 曲線,評(píng)估其效能,結(jié)果顯示該模型診斷效能良好,訓(xùn)練組和驗(yàn)證組中AUC 分別為0.91、0.90。除了組學(xué)模型,本研究還構(gòu)建了由年齡、病灶位置、DWI 信號(hào)特點(diǎn)、TPSA 值4個(gè)因素獲得的臨床模型,以及基于兩者的聯(lián)合模型,即諾模圖,分析顯示,聯(lián)合模型的診斷效能顯著優(yōu)于臨床模型及組學(xué)模型(P<0.05),在訓(xùn)練組和驗(yàn)證組中AUC 分別為0.95、0.92。
Chen 等[24]的研究中,通過分析T2WI 和DWI 的ADC 圖的組學(xué)特征,建立組學(xué)模型,其鑒別PCa 與非PCa 病變的診斷效能高于PI-RADS 的診斷效能,AUC 分別為0.999、0.867。Wang 等[25]鑒別PCa 與正常前列腺組織的研究中,建立了基于T2WI、DWI及DCE-MRI 的組學(xué)模型,與PI-RADS 比較,組學(xué)模型的診斷效能顯著優(yōu)于PI-RADS(P<0.001),PIRADS 結(jié)合組學(xué)模型后,診斷效能提高,AUC 為0.983。既往研究證明,對(duì)于PCa 的鑒別診斷,組學(xué)模型優(yōu)于傳統(tǒng)PI-RADS,同時(shí)也能改善PI-RADS 的診斷效能。相比現(xiàn)有的組學(xué)研究,本研究重點(diǎn)探討所構(gòu)建的臨床模型、組學(xué)模型及聯(lián)合模型對(duì)于診斷PIRADS 4 分這類臨床中較難鑒別的病例的可行性,結(jié)果顯示,組學(xué)模型的診斷效能優(yōu)于臨床模型(P<0.05),也優(yōu)于聯(lián)合常規(guī)臨床因素的聯(lián)合模型(P<0.05),考慮在該類可疑病變的診斷中,常規(guī)肉眼識(shí)別的DWI 信號(hào)特點(diǎn)以及TPSA、病灶位置、年齡等都沒有較好的診斷價(jià)值,組學(xué)模型則突顯了相應(yīng)的診斷優(yōu)勢(shì),且本研究中的組學(xué)模型構(gòu)建僅基于DWI 圖像,AUC 即可達(dá)0.81,有望通過聯(lián)合多參數(shù)MR 組學(xué)特征,對(duì)該類可疑病變進(jìn)行進(jìn)一步的研究。
本研究的不足之處在于對(duì)病灶的勾畫主要采用手動(dòng)勾畫的方式,雖然規(guī)避了勾畫病變本身可能引起偏倚的因素,選擇了全腺體的分割方式,但仍會(huì)受人為因素的影響,相信隨著人工智能技術(shù)的發(fā)展和軟件功能的提升,對(duì)于前列腺等小器官的分割可以做到完全自動(dòng);另一方面,在病灶分割部分,本研究選取病灶所在最大層面二維勾畫ROI,有待后續(xù)研究在ROI 的勾畫方式上進(jìn)一步提升,進(jìn)行多層面三維立體容積的勾畫;第三,病例中PI-RADS 4 分病例數(shù)較少,有待增加病例數(shù)進(jìn)一步驗(yàn)證。
綜上,基于前列腺DWI 圖像的諾模圖,能夠很好地鑒別PCa 與BPH,可以客觀、定量評(píng)估腫瘤的異質(zhì)性,有望成為一種非侵襲性且有效的診斷工具。對(duì)于PI-RADS 4 分病變,常規(guī)的臨床模型診斷效能遠(yuǎn)不如組學(xué)模型,有望進(jìn)一步擴(kuò)充樣本量,深入探究影像組學(xué)在臨床可疑病變中的鑒別診斷價(jià)值。