李 楨,洪文松,黃凱齡,葉柳青
(廣東省第二人民醫(yī)院放療科,廣州 510317)
高精度的調(diào)強(qiáng)放療是頭頸部腫瘤治療的重要手段之一,其危及器官數(shù)量眾多,勾畫復(fù)雜,限量嚴(yán)格,使得手動(dòng)勾畫危及器官成為一件耗時(shí)耗力的事情,因此有諸多自動(dòng)勾畫軟件被應(yīng)用于臨床以提高醫(yī)生的工作效率。這些軟件有基于圖譜庫(kù)算法的Smart Segmentation、MIMAtlas、ABAS和Raystation等,其通過(guò)匹配圖譜庫(kù)的模板進(jìn)行剛性或形變配準(zhǔn)得到自動(dòng)輪廓,用戶選擇不同的病例數(shù)建立不同的圖譜庫(kù)模板將影響自動(dòng)勾畫的時(shí)間和準(zhǔn)確性[1-2];其中基于概率圖譜庫(kù)算法的軟件SPICE的圖譜庫(kù)則不可修改,用戶只能調(diào)取并使用[3]。基于深度學(xué)習(xí)算法的軟件LinkingMed和Manteia等是對(duì)標(biāo)準(zhǔn)數(shù)據(jù)集進(jìn)行訓(xùn)練學(xué)習(xí),通過(guò)算法邏輯完成輪廓的勾畫[4-5],基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)算法的軟件是屬于其中的一種。目前有較多比較自動(dòng)勾畫軟件的研究,有基于圖譜庫(kù)算法的軟件在不同模板庫(kù)下的準(zhǔn)確性比較[1-2,6-8]及相互間的比較[3,9],自適應(yīng)剛性或形變配準(zhǔn)的自動(dòng)勾畫軟件與MIMAtlas自動(dòng)勾畫軟件間的比較[10-11],以及基于深度學(xué)習(xí)算法的自動(dòng)勾畫軟件和ABAS自動(dòng)勾畫軟件間的比較[12-13]等,但較少檢索到基于CNN算法和概率圖譜庫(kù)算法間自動(dòng)勾畫軟件結(jié)果的比較。因此本文主要分析比較基于這2種算法的LinkingMed軟件和SPICE軟件對(duì)頭頸部危及器官勾畫的準(zhǔn)確性,為自動(dòng)勾畫軟件的發(fā)展提供臨床參考依據(jù)。
選擇2019年10月至2020年4月在廣東省第二人民醫(yī)院接受放療的鼻咽癌(Ⅱ~Ⅲ期)患者31例,其中男性20例、女性11例。入組標(biāo)準(zhǔn):(1)CT掃描范圍包括整個(gè)頭頸部,以頭頂至鎖骨下2 cm為佳;(2)體表輪廓正常、規(guī)則;(3)口腔處理后不影響下頜骨結(jié)構(gòu)。排除標(biāo)準(zhǔn):(1)CT圖像中存在明顯偽影影響正常組織器官顯示;(2)頭頸部器官存在先天畸形;(3)原發(fā)疾病對(duì)正常器官解剖關(guān)系有明顯影響的。本研究獲得醫(yī)院倫理委員會(huì)批準(zhǔn)?;颊逤T掃描定位時(shí)行仰臥位,以頭頸熱塑體膜固定,掃描機(jī)器為西門子大孔徑螺旋CT(Somaton Sensation Open),掃描條件為管電壓120 kV、管電流120 mAs,掃描重建層厚為3 mm,層間距為3 mm。將掃描獲得的CT圖像數(shù)據(jù)傳送至Pinnacle39.10治療計(jì)劃系統(tǒng)。
SPICE是內(nèi)置在Pinnacle39.10治療計(jì)劃系統(tǒng)中的自動(dòng)勾畫軟件,勾畫流程如圖1所示。LinkingMed是北京連心醫(yī)療科技有限公司研發(fā)的自動(dòng)勾畫軟件(Version 3.1.10),勾畫流程如圖2所示。
圖1 SPICE自動(dòng)勾畫流程圖
圖2 LinkingMed自動(dòng)勾畫流程圖
為了確保手工勾畫的一致性,由1名有經(jīng)驗(yàn)的放療醫(yī)師在Pinnacle39.10治療計(jì)劃系統(tǒng)上手工勾畫危及器官,并經(jīng)過(guò)主任醫(yī)師逐層審核和修改。危及器官包括:眼球、晶體、視神經(jīng)、腦干、脊髓、腮腺和下頜骨。采用自動(dòng)勾畫模塊SPICE對(duì)以上危及器官進(jìn)行自動(dòng)勾畫,勾畫完畢即傳入軟件LinkingMed進(jìn)行自動(dòng)勾畫,最后進(jìn)行比較評(píng)估。SPICE與手工勾畫的差異值定義為SPICE組,LinkingMed與手工勾畫的差異值定義為L(zhǎng)inkingMed組。
以放療醫(yī)師手工勾畫危及器官的輪廓為金標(biāo)準(zhǔn),分別計(jì)算2種自動(dòng)勾畫結(jié)果的Dice相似性系數(shù)(Dice similarity coefficient,DSC)、Hausdorff距離(Hausdorff distance,HD)、包容性指數(shù)(inclusiveindex,IncI)和敏感性指數(shù)(sensitivity index,SI)[2]。
DSC用來(lái)評(píng)估2個(gè)輪廓間的相似程度,DSC值越大,2個(gè)輪廓相似度越高[12]。DSC計(jì)算公式如下:
式中,Vref為醫(yī)生手動(dòng)勾畫輪廓的集合;Vauto為自動(dòng)勾畫輪廓的集合。
假設(shè)有2組集合Xref={x1,x2…,xn}、Yauto={y1,y2…,yn},則Xref和Yauto之間的HD定義為
IncI即2個(gè)輪廓重疊部分與自動(dòng)勾畫體積的比值,計(jì)算公式如下:
SI即2個(gè)輪廓重疊部分與手動(dòng)勾畫體積的比值,計(jì)算公式如下:
建立Excel數(shù)據(jù)庫(kù),采用SPSS19.0軟件進(jìn)行數(shù)據(jù)分析,數(shù)據(jù)采用±s表示。2種自動(dòng)勾畫結(jié)果的DSC、HD、IncI和SI比較采用配對(duì)樣本t檢驗(yàn),以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
其中1例患者自動(dòng)勾畫與手動(dòng)勾畫結(jié)果如圖3所示,眼球、腦干、脊髓和下頜骨的自動(dòng)勾畫與手動(dòng)勾畫重合度較高,勾畫精度高,晶體、視神經(jīng)和腮腺的重合度一般。
圖3 自動(dòng)勾畫和手動(dòng)勾畫的輪廓示意圖
LinkingMed組除了左右視神經(jīng)外,其余危及器官的DSC均值都≥0.7。SPICE組除了左右晶體和左右視神經(jīng)外,其余危及器官的DSC均值也都>0.7。LinkingMed組的左右眼球、左右晶體、左右視神經(jīng)、左右腮腺、脊髓和下頜骨的DSC均值都大于SPICE組。除了右視神經(jīng)和左右腮腺,2組其他危及器官的DSC值差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。詳見(jiàn)表1。
表1 31例鼻咽癌患者2組自動(dòng)勾畫危及器官的DSC結(jié)果(±s)
表1 31例鼻咽癌患者2組自動(dòng)勾畫危及器官的DSC結(jié)果(±s)
?
LinkingMed組的左右眼球、左右晶體、左右視神經(jīng)、脊髓和下頜骨的HD均值小于SPICE組,腦干和左右腮腺的HD均值大于SPICE組。除了左晶體、右腮腺和下頜骨外,2組其他危及器官的HD值差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。詳見(jiàn)表2。
表2 31例鼻咽癌患者2組自動(dòng)勾畫危及器官的HD結(jié)果(±s)單位:mm
表2 31例鼻咽癌患者2組自動(dòng)勾畫危及器官的HD結(jié)果(±s)單位:mm
組別 左眼球 右眼球 左晶體 右晶體 左視神經(jīng) 右視神經(jīng) 腦干 脊髓 左腮腺 右腮腺 下頜骨LinkingMed組 2.41±0.63 2.45±0.39 2.29±0.7 2.14±0.79 5.21±2.56 6.48±4.23 6.90±2.04 4.08±1.31 12.21±3.83 12.92±10.15 4.53±1.00 SPICE組 3.47±0.88 3.32±0.77 2.38±0.49 2.88±1.23 9.14±5.04 10.16±5.03 5.69±1.45 7.59±6.52 9.98±3.70 12.46±9.73 4.91±1.19 t -10.88 -5.93 -0.58 -3.02 -3.61 -3.07 3.14 -3.03 2.24 0.50 -1.49 P 0.000 0.000 0.569 0.005 0.001 0.005 0.004 0.005 0.032 0.623 0.146
LinkingMed組中除了腦干和左腮腺外,其余危及器官的IncI均值都大于SPICE組。LinkingMed組所有危及器官的IncI均值都>0.7,左右眼球、左晶體、左右視神經(jīng)、脊髓、下頜骨的IncI均值都>0.8;SPICE組中除了左右晶體和左右視神經(jīng)外,其余危及器官的IncI均值都>0.7。除了左右眼球、腦干和右腮腺外,2組其他危及器官的IncI值差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。詳見(jiàn)表3。
表3 31例鼻咽癌患者2組自動(dòng)勾畫危及器官的Inc I結(jié)果(±s)
表3 31例鼻咽癌患者2組自動(dòng)勾畫危及器官的Inc I結(jié)果(±s)
組別 左眼球 右眼球 左晶體 右晶體 左視神經(jīng) 右視神經(jīng) 腦干 脊髓 左腮腺 右腮腺 下頜骨LinkingMed組 0.96±0.03 0.94±0.04 0.87±0.15 0.76±0.20 0.87±0.13 0.84±0.18 0.71±0.09 0.92±0.04 0.72±0.09 0.76±0.07 0.94±0.04 SPICE組 0.95±0.03 0.93±0.06 0.66±0.21 0.57±0.25 0.43±0.16 0.40±0.12 0.73±0.08 0.90±0.04 0.78±0.10 0.73±0.13 0.81±0.06 t-1.21 1.81 5.71 4.46 13.87 12.51 -1.32 2.69 -5.16 1.33 10.27 P 0.235 0.080 0.000 0.000 0.000 0.000 0.198 0.012 0.000 0.195 0.000
LinkingMed組中左右眼球、左右晶體、左視神經(jīng)、脊髓、左腮腺和下頜骨的SI均值都大于SPICE組。LinkingMed組除了左晶體和左右視神經(jīng)外,其余危及器官的SI均值也都>0.7;SPICE組除了左右晶體和左右視神經(jīng)外,其余的危及器官的SI均值都>0.7。除了左視神經(jīng)、右腮腺和下頜骨外,2組其他危及器官的SI差異均有統(tǒng)計(jì)學(xué)意義(P<0.05)。詳見(jiàn)表4。
表4 31例鼻咽癌患者2組自動(dòng)勾畫危及器官的SI結(jié)果(±s)
表4 31例鼻咽癌患者2組自動(dòng)勾畫危及器官的SI結(jié)果(±s)
組別 左眼球 右眼球 左晶體 右晶體 左視神經(jīng) 右視神經(jīng) 腦干 脊髓 左腮腺 右腮腺 下頜骨LinkingMed組 0.88±0.04 0.88±0.05 0.64±0.15 0.71±0.20 0.56±0.15 0.54±0.18 0.76±0.06 0.91±0.08 0.85±0.07 0.74±0.12 0.94±0.06 SPICE組 0.73±0.05 0.74±0.06 0.52±0.15 0.48±0.15 0.52±0.18 0.68±0.09 0.85±0.04 0.79±0.07 0.80±0.10 0.78±0.12 0.92±0.04 t 13.79 11.20 3.77 6.32 -1.38 -7.32 -8.00 10.66 3.54 -1.94 1.39 P 0.000 0.000 0.001 0.000 0.177 0.000 0.000 0.000 0.001 0.062 0.175
目前深度學(xué)習(xí)算法被廣泛地應(yīng)用于自動(dòng)勾畫軟件,與之前基于圖譜庫(kù)算法的勾畫軟件有一定的區(qū)別。國(guó)內(nèi)外都有對(duì)這2種不同算法的勾畫結(jié)果進(jìn)行比較的研究[12-13]。有研究表明[14],DSC>0.7,則2個(gè)結(jié)構(gòu)之間的相似度較好。本研究中2種勾畫軟件所勾畫的眼球和下頜骨的DSC均值都>0.8,與手動(dòng)勾畫基本重合,這是因?yàn)檫@3個(gè)結(jié)構(gòu)的密度分辨力高、解剖結(jié)構(gòu)和位置信息較固定、個(gè)體差異性小,因此LinkingMed和SPICE對(duì)此都有較好的勾畫效果,該結(jié)論與文獻(xiàn)[6,10,15]的結(jié)論一致。除了腦干外,LinkingMed組的DSC均值都大于SPICE組。腦干的位置相對(duì)固定、形態(tài)隨體位變化小但密度分辨力略低,因此基于形變配準(zhǔn)的SPICE對(duì)腦干的勾畫效果略好,與Van Dijk等[13]的研究相似,該研究中ABAS組的腦干DSC值略高于DL組(深度學(xué)習(xí)組)。本研究中LinkingMed組的脊髓DSC值大于SPICE組,但HD值小于SPICE組,這是由SPICE勾畫頭頸部脊髓時(shí),部分病例胸椎T5、T6附近的脊髓被勾畫到錐孔外導(dǎo)致的結(jié)果。不同患者間定位姿勢(shì)不同會(huì)導(dǎo)致該位置變化較大,使得SPICE在形變配準(zhǔn)時(shí)出現(xiàn)誤差。2種軟件對(duì)左右腮腺的勾畫結(jié)果差不多,DSC均值都>0.7,右腮腺的各項(xiàng)指標(biāo)和左腮腺的DSC值都沒(méi)有統(tǒng)計(jì)學(xué)差異(P>0.05),SPICE組左腮腺的HD值和IncI值略優(yōu)于LinkingMed組,SI值則略差,這些結(jié)果與國(guó)外學(xué)者[13,16]的研究一致。
LinkingMed組中左右晶體的DSC均值≥0.7,高于國(guó)內(nèi)部分研究[10,17-18]所得出的晶體DSC值,因?yàn)檫@些研究都是基于圖譜庫(kù)算法的,與本研究中的SPICE組的結(jié)果一致。這類算法主要通過(guò)匹配圖譜庫(kù)的模板進(jìn)行剛性或形變配準(zhǔn)得到自動(dòng)輪廓[12],因此患者的體位及解剖結(jié)構(gòu)的形態(tài)位置信息都會(huì)影響配準(zhǔn)的準(zhǔn)確性,而特殊不常見(jiàn)體位和體積小及薄的結(jié)構(gòu),配準(zhǔn)勾畫的準(zhǔn)確性就較差[13]。晶體的體積較小,只有2層CT圖像顯示,筆者在研究時(shí)發(fā)現(xiàn),SPICE形變配準(zhǔn)勾畫的晶體結(jié)構(gòu)常有一些多余的輪廓,使得晶體的勾畫差強(qiáng)人意,從IncI和SI 2個(gè)指標(biāo)也能體現(xiàn)出這個(gè)結(jié)果,SPICE組左右晶體的IncI均值分別為0.66和0.57,SI均值為0.52和0.48,表明自動(dòng)勾畫和手動(dòng)勾畫重合的部分約占自動(dòng)勾畫和手動(dòng)勾畫體積的一半。而通過(guò)對(duì)像素灰度值進(jìn)行運(yùn)算處理的CNN算法則對(duì)分割目標(biāo)的邊界適應(yīng)性較高,不會(huì)產(chǎn)生因形變配準(zhǔn)造成的輪廓誤差[16]。晶體的密度分辨力較高,因此LinkingMed對(duì)其有較好的分割,該結(jié)論與張富利等[12]的研究結(jié)果一致。LinkingMed和SPICE勾畫視神經(jīng)的結(jié)果都不滿意,DSC均值都<0.6。視神經(jīng)的體積小、走向變化大,使得SPICE勾畫視神經(jīng)和晶體的結(jié)果相似,與Isambert等[19]的結(jié)論一致。本研究中,LinkingMed對(duì)視神經(jīng)進(jìn)行自動(dòng)勾畫時(shí),缺失了連接眼球部分的小段視神經(jīng)和準(zhǔn)備進(jìn)入蝶鞍兩側(cè)的小段視神經(jīng),如圖3(a)所示,因此導(dǎo)致DSC偏低,這可能與該模型不夠優(yōu)化有關(guān),模型中訓(xùn)練集的樣本數(shù)量或各類函數(shù)權(quán)重等參數(shù)都將影響該模型的準(zhǔn)確性從而影響勾畫效果[4-5]。LinkingMed組左右視神經(jīng)的IncI均值分別為0.87和0.84,而SI值分別為0.56和0.54,表明LinkingMed勾畫的視神經(jīng)輪廓比手動(dòng)勾畫的小。LinkingMed組勾畫視神經(jīng)的DSC均值略優(yōu)于SPICE組,但HD值比SPICE組的小,標(biāo)準(zhǔn)差也小,表明LinkingMed勾畫視神經(jīng)與手動(dòng)勾畫的邊緣偏差較小,略優(yōu)于SPICE。
綜上所述,頭頸部危及器官的自動(dòng)勾畫中,LinkingMed勾畫的效果略優(yōu)于SPICE。對(duì)于體積較大、密度分辨力高、形態(tài)位置分布穩(wěn)定的結(jié)構(gòu),2種軟件的勾畫效果都較好,對(duì)于體積小、形態(tài)位置變化大的結(jié)構(gòu)如晶體、視神經(jīng),LinkingMed略優(yōu)于SPICE,考慮到臨床劑量評(píng)估的準(zhǔn)確性,應(yīng)當(dāng)在自動(dòng)勾畫的基礎(chǔ)上適當(dāng)進(jìn)行手工修改。在當(dāng)代高精度調(diào)強(qiáng)放療的背景下,本研究對(duì)不同的自動(dòng)勾畫軟件所勾畫危及器官對(duì)調(diào)強(qiáng)放療計(jì)劃的影響及臨床劑量的影響等方面未進(jìn)行更深入的比較和研究,因此后續(xù)將完善這方面的研究。另外,本研究中采用的SPICE是2014年P(guān)innacle39.10版本中的,而版本的更迭可能會(huì)對(duì)算法和勾畫效果產(chǎn)生一定的影響,LinkingMed的算法模型也在不斷的優(yōu)化改進(jìn)中,因此本研究的分析結(jié)果僅限于當(dāng)前使用的軟件和版本。