孫兆男,劉佳,崔應(yīng)譜,劉想,張曉東,王霄英,林志勇,張耀峰
近年來,因常規(guī)體檢及腹部不適就診的患者在行影像學(xué)檢查時,腎臟腫瘤的檢出率明顯增加[1]。腎部分切除術(shù)(partial nephrectomy,PN)及根治性腎切除術(shù)(radical nephrectomy,RN)是局限性腎腫瘤臨床干預(yù)的主要方案。因此與臨床決策相關(guān)的可切除性評估、術(shù)式選擇及圍手術(shù)期結(jié)局預(yù)測需要綜合腫瘤形態(tài)、位置、解剖關(guān)系等多種因素進行評估。長期以來,多種評分系統(tǒng)被相繼提出。在R.E.N.A.L評分[2]、PADUA評分[3]、CI評分[4]及DAP評分[5]評分系統(tǒng)中,均將腎腫瘤直徑或半徑作為是否可行PN的重要評分變量,直徑或半徑測量值越大,評分越高,腫瘤切除相關(guān)的復(fù)雜性也就越高。2014年發(fā)布的EAU指南[6]推薦,對于cT1a期和部分cT1b期腫瘤患者,可首選行PN,對于較大的及較復(fù)雜的中心性生長的腎腫瘤,則多采取RN。
泌尿系多期增強CT在顯示腎腫瘤及周圍解剖結(jié)構(gòu)有一定優(yōu)勢,是診斷、分期、評分的首選影像學(xué)檢查[7]。目前臨床實踐中,腎臟腫瘤徑線測量值可通過CT圖像直接獲得。影像醫(yī)生對腫瘤測量時先逐層閱圖尋找腫瘤最大層面,再通過多方向重組測量腫瘤的三維徑線,雖然是簡單的測量工作,仍需要投入一定的時間。且對于形態(tài)欠規(guī)則的腫瘤,醫(yī)生難以準確尋找最大層面的位置,由于選取測量層面的不同、測量誤差等導(dǎo)致醫(yī)生之間乃至同一醫(yī)生不同次測量間的一致性差。因此,亟需一種全自動的、準確性高及重復(fù)性高的腫瘤徑線測量方法,以減輕影像醫(yī)生測量腫瘤徑線的時間成本,提高書寫報告的效率。
計算機輔助診斷(computer-aided diagnosis,CAD)已被廣泛用于腫瘤的影像學(xué)評估。其中以U-Net[8]為代表的卷積神經(jīng)網(wǎng)絡(luò)在醫(yī)學(xué)圖像分割任務(wù)中表現(xiàn)良好。目前,多項研究證實利用深度學(xué)習(xí)在CT圖像上實現(xiàn)腎臟腫瘤分割結(jié)果較為準確[9-10]。本單位早期研究中,利用441名腎臟腫瘤患者的皮髓質(zhì)期CT圖像,基于兩個級聯(lián)的3DU-Net模型,實現(xiàn)腎臟區(qū)域的定位任務(wù)和腎臟腫瘤的精細分割任務(wù),已完成腎臟腫瘤分割模型的訓(xùn)練,在測試集中,分割腎臟、腎腫瘤、腎囊腫的平均Dice系數(shù)分別為0.973、0.844、0.536[11],整體分割的準確性較好,并可實現(xiàn)腎臟腫瘤短徑、中徑、長徑及腫瘤體積的自動測量。
本研究旨在驗證腎臟腫瘤分割模型對腎腫瘤徑線自動測量的準確性,探索測量結(jié)果自動植入報告的臨床可行性。
1.數(shù)據(jù)收集
此研究屬于回顧性研究,獲得本院倫理審查委員會同意[倫理批件號2019(169)]。從本院影像科信息系統(tǒng)及病案系統(tǒng)中回顧性收集2019年5月1日-2019年11月29日經(jīng)手術(shù)病理證實的腎腫瘤患者的影像圖像及結(jié)構(gòu)式報告進行分析。納入標準為:影像報告診斷為腎腫瘤的全部數(shù)據(jù)。排除標準為:a)未在影像檢查后1月內(nèi)于本院行腎根治性切除術(shù)、部分切除術(shù),無本院病理數(shù)據(jù)(n=116);b)病例資料不完整(n=10);c)CT圖像無皮髓質(zhì)期薄層圖像(n=2);d)結(jié)構(gòu)式報告信息不完整(n=15);e)掃描范圍未包括全部腎臟,圖像有偽影(n=1);f)既往腎臟相關(guān)手術(shù)史(n=4)。最終納入154例腎腫瘤患者的影像圖像及結(jié)構(gòu)式報告進行分析,男94例,女60例,年齡16~86歲,平均55±13歲。
2.CT掃描方案
皮髓質(zhì)期薄層圖像來源于本科四臺CT:GE Light Speed VCT、GE Discovery CT 750 HD、Philips ICT 256和Siemens Somatom Definition Flash CT。掃描方向為頭足位,掃描范圍從腎上腺到腎下級,管電壓120 kV,管電流自動毫安秒,螺距0.600~0.984,掃描層厚5 mm,矩陣512×512,重建層厚1 mm,層間距1 mm,對比機采用非離子型碘對比劑(320 mg I/mL),劑量為每公斤體重0.5 g碘或90 mL碘佛醇加20 mL生理鹽水沖管,注射流率3.0 mL/s。使用自動觸發(fā)掃描方式時,觸發(fā)點設(shè)置在胸12椎體水平腹主動脈處,觸發(fā)閾值設(shè)置為100 HU。在達到觸發(fā)閾值后延遲12 s開始掃描皮髓質(zhì)期。如果使用固定時間延遲掃描模式,則在注射對比劑后25~40 s進行皮髓質(zhì)期掃描。
3.獲取腎臟腫瘤三維徑線
①模型測量值:我科現(xiàn)已完成基于U-Net在皮髓質(zhì)期CT圖像上的腎臟腫瘤分割模型[10]。利用該模型自動分割本研究納入的全部數(shù)據(jù)(圖1a),并進一步利用最小體積包圍盒算法(圖1b),使模型自動輸出腎臟腫瘤的三維經(jīng)線,即長徑、中徑及短徑(圖1c)。
②醫(yī)生測量值:醫(yī)生測量值來源于本單位腎臟腫瘤結(jié)構(gòu)式報告。測量方法參考圖1d、e。結(jié)構(gòu)式報告中腎腫瘤的三維徑線為臨床常用的左右徑、前后徑、上下徑,進一步三組數(shù)據(jù)進行大小排序,轉(zhuǎn)換為相對應(yīng)的短徑、中徑、長徑,此徑線作為本研究的醫(yī)生測量值。
圖1 腎腫瘤徑線的測量方法示例。a~c為自動分割及測量,d~e為醫(yī)生測量。a)U-Net模型在皮髓質(zhì)期CT圖像上分割得到的腎腫瘤區(qū)域;b)最小體積包圍盒算法得到腎腫瘤的長徑、中徑、短徑;c)測量結(jié)果自動填寫到結(jié)構(gòu)式報告;d)醫(yī)生測量腎腫瘤左右徑、前后徑、上下徑;e)醫(yī)生填寫至結(jié)構(gòu)式報告。
③參考值:兩位影像醫(yī)生對本研究納入的全部數(shù)據(jù)進行腎腫瘤標注,標注方法與既往研究相同[11],標注效果可參考圖1a。采用最小體積包圍盒算法,計算此腎臟腫瘤標簽的三維徑線,即長徑、中徑及短徑,作為本研究腎臟腫瘤三維徑線的參考值。
4.模型自動分割及徑線測量的評價
①分割性能評價:Dice相似性系數(shù)(Dice similarity coefficient,DSC)[12]是用于評價兩個數(shù)據(jù)集相似性的參數(shù),目前最常用于分割圖像的相似性評估,計算公式見公式(1)。X代表模型自動分割腎臟腫瘤區(qū)域的體素數(shù)量,Y代表醫(yī)生標注的腎臟腫瘤區(qū)域的體素數(shù)量,X∩Y是以上二者間重疊部分的體素數(shù)量,DSC的取值區(qū)間為0~1,越接近1代表兩個數(shù)據(jù)集的相似度越好。本研究計算了模型自動分割的腎臟腫瘤區(qū)域與影像醫(yī)生標注的腎臟腫瘤區(qū)域的DSC,用于客觀評價腎臟腫瘤分割模型的分割性能。
(1)
②腎腫瘤徑線測量值的評價:對參考值、醫(yī)生測量值、模型測量值三組數(shù)據(jù)進行統(tǒng)計學(xué)分析,以探討模型自動測量替代醫(yī)生手工測量的臨床可行性。
5.統(tǒng)計方法
統(tǒng)計軟件為Medcalc 15.8和SPSS 22.0。采用Kolmogorov-Smirnov (K-S)檢驗所有參數(shù)的正態(tài)性。符合正態(tài)分布的計量資料采用平均值±標準差表示,不符合正態(tài)分布的計量資料采用中位數(shù)(四分位間距)表示。采用非參數(shù)檢驗的Wilcoxon檢驗比較不同測量方法所得徑線值,P<0.05代表差異具有統(tǒng)計學(xué)意義。采用Bland-Altman散點圖進行醫(yī)生測量參考值、模型測量值兩組數(shù)據(jù)的一致性評價,置信區(qū)間設(shè)置為95%。
1.患者資料
本研究入組的154例腎臟腫瘤患者的詳細臨床資料見表1。腫瘤完全位于腫瘤內(nèi)部17例,外凸<50%為52例,外凸≥50%為85例;腫瘤密度均勻41例,密度混雜113例;病理分型為透明細胞型腎細胞癌88例,乳頭狀腎細胞癌16例,嫌色細胞型腎細胞癌23例,腎嗜酸細胞腺瘤11例,乏脂肪型腎血管平滑肌脂肪瘤14例,其他少見病理類型的腎細胞癌2例;病理T分期為T1期99例,T2期6例,T3期26例,腎臟良性腫瘤23例。
表1 三種測量方法所測腎腫瘤徑線 (cm)
2.腎腫瘤分割結(jié)果
154個腎臟腫瘤病灶中,以腫瘤為單位的平均DSC值為0.91,DSC的分布盒型圖見圖2,有133(86%)個腫瘤分割DSC值在0.8以上,僅8(5%)個腫瘤分割DSC低于0.5。進一步按照腫瘤密度的均質(zhì)性進行分類,分為密度混雜(113/154)、密度均勻(41/154)兩組,圖2b展示了兩組腎腫瘤分割DSC值的分布盒形圖,可見密度混雜組的分割效果優(yōu)于密度均勻組。按照腎腫瘤相對于腎臟的外凸程度,將腫瘤分為三組,即外凸度≥50%(85/154)、<50%(52/154)及完全位于腎腫瘤內(nèi)部(17/154),可見腎腫瘤外凸程度越高,分割的準確性越好。圖3列舉了本研究腎腫瘤分割結(jié)果。
圖2 腎腫瘤分割DSC值的分布盒形圖。a)本研究所有腎腫瘤分割DSC值的分布盒形圖;b)按腫瘤均質(zhì)性分類,不同類別腎腫瘤分割DSC值的分布盒形圖比較;c)按腫瘤外凸程度,不同類別腎腫瘤分割DSC值的盒形圖比較。框表示中位數(shù)周圍的四分位范圍,延長線的長度為四分位間距的1.5倍。
圖3 CT皮髓質(zhì)期周圍圖像上腎腫瘤的自動分割結(jié)果。a、b為分割效果好的病例。c、d為分割效果差的病例。a)腎腫瘤最大徑為6.4cm,密度混雜,外凸度>50%,DSC值為0.97;b)腎腫瘤最大徑為4.1cm,密度均勻,完全位于腎實質(zhì)內(nèi),DSC值為0.96;c)腎腫瘤最大徑為1.7cm,密度混雜,完全位于腎輪廓內(nèi),DSC值為0,模型未分割出腎腫瘤;d)腎腫瘤最大徑為1.4cm,密度均勻,完全位于腎輪廓內(nèi),DSC值為0.04。
3.參考值、醫(yī)生測量值、模型測量值分析結(jié)果
將三種測量方法進行兩兩比較,得到的腎腫瘤徑線分析結(jié)果見表1。模型測量值與參考值相比,腎腫瘤短徑、中徑、長徑之間的差異無統(tǒng)計學(xué)意義(P>0.05)。腫瘤各徑線的醫(yī)生測量值均小于參考值,差異均具有統(tǒng)計學(xué)意義(P<0.05)。腫瘤各徑線的模型測量值大于醫(yī)生測量值,差異均具有統(tǒng)計學(xué)意義(P<0.05)。
4.醫(yī)生測量值與模型測量值的一致性分析
本單位訓(xùn)練腎腫瘤徑線測量模型的最終目的是替代醫(yī)生測量,因此進一步采用Bland-Altman散點圖分析醫(yī)生測量值與模型測量值的一致性。Bland-Altman分析結(jié)果顯示(圖4)兩種測量方法所得腎腫瘤的中徑、長徑的一致性較好,分別有4.5%(7/154)、3.2%(5/154)的數(shù)據(jù)位于95%置信區(qū)間之外,其中長徑的一致性最高。對于短徑,兩種測量方法的一致性欠佳,有5.8%(9/154)的數(shù)據(jù)位于95%置信區(qū)間之外。模型測量值和醫(yī)生測量值相比,腎腫瘤短徑差值為-1.02~1.47 cm,平均0.22 cm,腎腫瘤中徑差值為-1.2~2.2 cm,平均0.5 cm,腎腫瘤長徑差值為-1.1~2.7 cm,平均0.8 cm。
圖4 模型測量值和醫(yī)生測量值的腎腫瘤短徑、中徑、長徑結(jié)果的Bland-Altman散點圖。藍色實線代表兩種測量結(jié)果差值的平均數(shù),極上、極下兩條紅色虛線代表95%置信區(qū)間的上下限。a)腎腫瘤短徑平均值與差異值;b)腎腫瘤中徑平均值與差異值;c)腎腫瘤長徑平均值與差異值。
腎腫瘤的大小對于術(shù)式選擇及患者預(yù)后有重要意義,尤其是腫瘤最大徑,是決定是否可行PN的主要參數(shù)之一,也是腎腫瘤分期的主要標準,因此對于腫瘤大小的測量是影像報告的重要價值體現(xiàn),也是影像科醫(yī)生的常規(guī)任務(wù)。本研究探索了U-Net腎腫瘤分割模型對于腫瘤三維徑線測量的準確性,旨在為腎腫瘤大小測量提供準確、高效的衡量工具。研究結(jié)果證實,模型整體分割結(jié)果很好,且密度越不均勻、位置越外凸,分割的準確性越好。在分割結(jié)果很好的前提下,模型測量結(jié)果與參考值接近。其中,對于臨床最關(guān)注的腫瘤最大徑,即本研究的長徑,模型測量值比醫(yī)生測量值更接近于此研究定義的參考值,說明模型測量的徑線值有很高的準確性,更接近腫瘤大小的真實值。在模型測量值與醫(yī)生測量的一致性研究中,雖然模型測量值較醫(yī)生測量值偏大,但二者的總體一致性很好,加之測量結(jié)果更接近于真實值,進一步說明模型自動測量有望替代醫(yī)生手工測量,這也是目前人工智能(artificial intelligence,AI)輔助診斷軟件投入臨床實踐的主要切入點之一。
本單位訓(xùn)練的腎腫瘤分割模型[11]是本研究的基石,采用的是經(jīng)典的U-Net分割網(wǎng)絡(luò),模型訓(xùn)練過程及腎腫瘤檢出率的分析已報道,此文不再贅述,主要集中于腎腫瘤徑線測量的分析。最小體積包圍盒算法(minimum volume bounding box algorithm)可以得到包含目標圖像所有像素點的一個最小的范圍,并可計算出徑線、面積、體積等幾何參數(shù)。本研究納入分析腫瘤徑線為長徑、中徑、短徑,實際上還可以自動獲取腫瘤體積,這是目前臨床工作中醫(yī)生難以輕松實現(xiàn)的。另外,本研究的一個創(chuàng)新點是將徑線測量值對接到AI臨床落地平臺——結(jié)構(gòu)式報告中[14-15],醫(yī)生可參考分割結(jié)果決定是否接受徑線值,可實現(xiàn)臨床交互功能,優(yōu)化影像報告流程[16],具體臨床植入流程見圖5。
圖5 腎腫瘤分割模型臨床植入流程圖。
本研究存在不足之處,此項研究的醫(yī)生測量值是回顧性收集的本單位結(jié)構(gòu)式報告中儲存的左右徑、前后徑、上下徑,經(jīng)過大小排序后轉(zhuǎn)換為長徑、中徑、短徑,雖然不是完全對應(yīng)的,但基于上述最小體積包圍盒的原理以腫瘤大多為球形的形態(tài)特點,認為二者是存在可比性的,目前在很多其他腫瘤分割及測量的研究[17-22]中得到證實。其次,本研究樣本量較少,僅屬于方法可行性的探索研究,仍需多中心、大樣本研究驗證結(jié)果的可靠性。腎臟腫瘤病理類型多樣[13],但臨床可按密度分為囊性腎腫瘤和實性腎腫瘤,在囊性腎腫瘤中,發(fā)病率最高的是單純性腎囊腫,屬于肯定的良性病變,因此本單位研發(fā)腎腫瘤分割模型時,單純性腎囊腫和其他有惡性潛能的腎腫瘤作為兩個標簽輸入模型,模型的輸出結(jié)果也是兩種,考慮到臨床意義,本研究僅關(guān)注有惡性傾向的腎腫瘤,未分析單純性腎囊腫。另外由于本研究納入的病例是于本院行CT檢查診斷且行手術(shù)治療的腎腫瘤,使得研究缺少Bosniak Ⅱ類、Bosniak ⅡF類乃至部分Bosniak Ⅲ類[23]的腎囊腫,數(shù)據(jù)存在一定偏倚,由于此類腫瘤本身是傾向良性或性質(zhì)待定建議隨訪的,因此出于臨床意義考慮,認為偏倚尚可接受。最后,本研究為回顧性收集的數(shù)據(jù),缺少手術(shù)切除后腎腫瘤長徑、中徑、短徑測量值的金標準,既往研究證實CT圖像上腎臟體積測量值容易獲得且接近體內(nèi)真實值[24],關(guān)于徑線測量值與金標準的對比,未來可通過前瞻性研究進一步證實。
總之,基于U-Net的自動分割模型對腎臟腫瘤徑線測量結(jié)果是可靠的,且可通過腎腫瘤結(jié)構(gòu)式報告這一信息化載體,植入真實臨床工作場景中,優(yōu)化影像工作流程。