宋 威,趙 迪,鹿 紅,張碧云,馬 珺,于大海
江蘇省中醫(yī)院放療科,南京市,210029
放療計(jì)劃劑量學(xué)數(shù)據(jù)的自動(dòng)提取分析
【作者】宋 威,趙 迪,鹿 紅,張碧云,馬 珺,于大海
江蘇省中醫(yī)院放療科,南京市,210029
目的為了提高批量患者放療計(jì)劃劑量學(xué)數(shù)據(jù)提取和分析的效率及準(zhǔn)確性。方法利用Matlab提供的DICOM RT接口函數(shù)編寫程序解讀計(jì)劃輸出文件,按照SPSS軟件兼容的數(shù)據(jù)格式輸出數(shù)據(jù)至Excel文件,使用SPSS軟件導(dǎo)入數(shù)據(jù)文件進(jìn)行分析,并對(duì)14例胃癌患者,比較手動(dòng)和使用軟件自動(dòng)提取分析的速度和準(zhǔn)確性。結(jié)果軟件提取方法輸出的Excel文件數(shù)據(jù)格式符合SPSS軟件要求,PTV的90%~98%劑量區(qū)間體積誤差為-3.48E-5±3.01E-5,PTV的99%~106%劑量區(qū)間體積誤差-1.11E-3±7.68E-4,危及器官劑量體積誤差為-7.85E-5±9.91E-5。與手工提取分析相比,總耗時(shí)由5.3 h減少至0.19 h,錯(cuò)誤率由0.002減少至0。結(jié)論該文編寫的軟件實(shí)現(xiàn)了DICOM RT 文件劑量學(xué)數(shù)據(jù)的批量自動(dòng)提取,格式化輸出,快速分析,提高了基于大量患者放療劑量學(xué)數(shù)據(jù)分析的臨床研究的效率。
劑量體積直方圖;DICOM RT;Matlab;SPSS
伴隨計(jì)算機(jī)技術(shù)、放射物理學(xué)的快速發(fā)展,二十一世紀(jì)已進(jìn)入精確放療的時(shí)代,CRT、IMRT已成為目前的常規(guī)放療手段,IGRT、VMAT、螺旋斷層放療(Tomotherapy)等新技術(shù)不斷出現(xiàn),在進(jìn)一步提高靶區(qū)劑量的同時(shí),使得正常組織的劑量大幅度降低得到更好的保護(hù)[1-4]。由于精確放療技術(shù)的劑量準(zhǔn)確性要求,治療前需要根據(jù)醫(yī)師制定的治療目標(biāo),評(píng)價(jià)放射治療計(jì)劃能否達(dá)到預(yù)期的劑量分布,以判斷是否需要修改計(jì)劃。目前計(jì)劃評(píng)價(jià)的工具主要包括二維平面劑量分布圖和DVH圖(Dose Volume Histogram)[5]。DVH圖反映了劑量分布的統(tǒng)計(jì)學(xué)信息,可以提供靶區(qū)和正常組織的劑量體積參數(shù),并且進(jìn)一步用于計(jì)算CI、HI等評(píng)價(jià)參數(shù),確定計(jì)劃的優(yōu)劣[6]。在治療或科研中為了比較不同患者使用不同放療技術(shù)產(chǎn)生的劑量分布都需要充分參考DVH提供的劑量學(xué)信息。
目前主流的三維放射治療計(jì)劃系統(tǒng)包括Eclipse,Pinnacle都提供了可視化的DVH圖分析工具,可以人工交互式的提取DVH數(shù)據(jù)或者以DICOM RT(Digital Imaging and Communications in Medicine Radiotherapy)文件形式輸出,相對(duì)于人工提取數(shù)據(jù)方式的費(fèi)時(shí)費(fèi)力,通過計(jì)算機(jī)解讀數(shù)據(jù)文件的方式更加高效,國(guó)外研究報(bào)道了一些開發(fā)的解讀軟件HART ,Radonc等實(shí)現(xiàn)了DVH數(shù)據(jù)的解讀[7-8],但是對(duì)于多個(gè)患者數(shù)據(jù)文件批量解讀以及數(shù)據(jù)輸出格式兼容數(shù)據(jù)分析軟件方面還有待改進(jìn),因此本文將介紹一種改進(jìn)這些問題的方法。
DICOM是美國(guó)電氣制造商協(xié)會(huì)(National Electrical Manufactures Association,NEMA) 和 美國(guó)放射學(xué)會(huì)(American College of Radiology,ACR)聯(lián)合制定的醫(yī)學(xué)數(shù)字影像數(shù)據(jù)存儲(chǔ)與通訊協(xié)議,涉及數(shù)據(jù)的傳輸,存儲(chǔ),顯示,坐標(biāo)系約定和信息表達(dá)等方面,為不同醫(yī)療設(shè)備和醫(yī)療機(jī)構(gòu)間的信息共享傳輸提供了一個(gè)兼容的接口[9]。DICOM RT是對(duì)DICOM在放療領(lǐng)域的補(bǔ)充[10],包括放療計(jì)劃(RT Plan),放療圖像(RT Image),放療組織集(RT Structure set),放療劑量(RT Dose),放療記錄(RT Treatment Record)幾個(gè)對(duì)象,其中RT Structure set主要包含Structure set , ROI Contour等模塊,RT Dose主要包含RT Dose,RT DVH,Structure Set,ROI Contour等模塊。這些模塊保存了靶區(qū)勾畫中的組織集信息和放療計(jì)劃的劑量學(xué)數(shù)據(jù)。
DICOM文件以二進(jìn)制形式保存,解讀DICOM RT文件通常在VC++平臺(tái)上實(shí)現(xiàn),需要涉及到DICOM標(biāo)準(zhǔn)中實(shí)體關(guān)系模型(Entity-Relationship model)的分析,文件元信息解讀,數(shù)據(jù)元素提取,數(shù)據(jù)結(jié)構(gòu)定義,模塊信息和相關(guān)操作的封裝[11],獨(dú)立開發(fā)解讀程序是個(gè)復(fù)雜而費(fèi)時(shí)費(fèi)力的過程。Matlab作為一個(gè)強(qiáng)大的工程數(shù)學(xué)計(jì)算軟件,在數(shù)值分析、矩陣計(jì)算、數(shù)據(jù)可視化、系統(tǒng)建模仿真等方面有著廣泛的應(yīng)用,其包含了豐富的數(shù)學(xué)函數(shù)和程序接口[12-13],也提供了對(duì)解讀醫(yī)學(xué)DICOM文件的支持,dicominfo函數(shù)可以獲取DICOM文件的元信息,dicomread函數(shù)可以讀入DICOM圖像數(shù)據(jù),dicomwrite可以輸出圖像數(shù)據(jù)等[14],使用這些函數(shù)可以方便快速的實(shí)現(xiàn)DICOM文件信息的讀取、查看,具備良好的交互性。SPSS是醫(yī)學(xué)領(lǐng)域廣泛使用和熟知的統(tǒng)計(jì)數(shù)據(jù)分析軟件,操作簡(jiǎn)便功能強(qiáng)大,能夠讀取EXCEL格式的數(shù)據(jù)文件,因此本文考慮使用Matlab平臺(tái)批量解讀DICOM文件,以SPSS軟件兼容的數(shù)據(jù)排列方式輸出至Excel文件,導(dǎo)入SPSS軟件完成統(tǒng)計(jì)數(shù)據(jù)檢驗(yàn)。
選取14例胃癌患者,使用Eclipse 8.6計(jì)劃系統(tǒng)為每位患者制定兩種治療計(jì)劃,分別命名為P1和P2,所有患者使用相同的組織集模板,確保命名的一致性,以DICOM RT格式導(dǎo)出計(jì)劃文件。參數(shù)選擇包含structure set,Total plan dose;選擇絕對(duì)劑量單位Gy;劑量間隔為(dose bin width)0.01 Gy;DVH圖類型選擇微分(differential)或者積分(cumulative),體積單位為cm3。輸出后文件名自動(dòng)生成為RD.ID_ P1.dcm,RD.ID_P2.dcm,RS.ID.dcm。RD、RS、ID分別表示DICOM RT Dose文件,DICOM RT Structure set文件和患者的ID號(hào)(7位數(shù))。
算法流程如下:
dir(“患者DICOM RT文件夾路徑”),獲取DICOM RT文件名列表;
For(每個(gè)文件名列表中的文件名)
{逐段分析文件名,判斷該文件是RD或RS,P1或P2,以及獲取患者的ID號(hào); 將該文件的索引號(hào)存放到患者RD_P1,RD_P2,或RS文件索引號(hào)數(shù)組中,ID號(hào)存入號(hào)患者ID數(shù)組中。}
D2={};%初始化,用來將不同患者的數(shù)據(jù)保存至不同行
For(每個(gè)患者)
{ D1={};%初始化,用來將同一患者兩種計(jì)劃的數(shù)據(jù)保存至一行
V1={};%初始化,用來將同一患者兩種計(jì)劃的數(shù)據(jù)變量名保存至一行
For(每種計(jì)劃) %P1,P2
{讀取RT Dose, RT Structure set文件的元信息。
從RT Structure set Item提取ROInumber, ROIname;
建立ROInumber 和ROIname的映射組;
D0 ={};%初始化,用來將同一患者一種計(jì)劃的數(shù)據(jù)保存至一行
V0 ={};%初始化,用來將同一患者一種計(jì)劃的數(shù)據(jù)變量名保存至一行
For(每個(gè)組織的DVH曲線數(shù)據(jù))
{判斷是否需要輸出當(dāng)前組織的劑量數(shù)據(jù),否則跳過當(dāng)前循環(huán)。
判斷DVH圖類型是微分或積分型;
計(jì)算積分DVH圖劑量體積參數(shù)數(shù)組;
判斷當(dāng)前組織是靶區(qū)還是OAR;%兩者提取的數(shù)據(jù)不同:
按需要將該組織的ROIname,最大劑量,最小劑量,平均劑量,體積,Dv,Vd參數(shù),保存至D0數(shù)組中,變量名保存至V0;}
D1=[D1, D0];%每種計(jì)劃數(shù)據(jù)拼接并入一行V1=[V1, V0];%每種計(jì)劃數(shù)據(jù)變量名拼接并入一行}
D2=[D2; D1];%每個(gè)患者數(shù)據(jù)另起一行保存}
D2=[V1; D2];%添加變量名行
輸出D2至Excel文件。
需要指出的是①?gòu)挠?jì)劃系統(tǒng)輸出的DICOM RT文件命名規(guī)則必須保持一致,例如按前述的輸出格式,每個(gè)文件名字符串?dāng)?shù)組的前兩位為RD或RS,4至10位為ID號(hào),對(duì)于RD文件12至14位為計(jì)劃分組號(hào)。②RT Structure set文件中的StructureSetROISequence模塊中組織item排序與RT Dose文件中的DVHSequence模塊中組織item排序并不完全一致[15],如表1所示,原因在于組織集中的某一組織(Trachea)未勾畫因而其無劑量數(shù)據(jù)或者該組織的DVH數(shù)據(jù)未選擇輸出,忽視這一點(diǎn)會(huì)導(dǎo)致輸出劑量數(shù)據(jù)與組織對(duì)應(yīng)關(guān)系的錯(cuò)亂,而在兩個(gè)文件中對(duì)于某個(gè)組織的ROInumb er是唯一確定的,為了確定DVHSequence中某個(gè)item的DVH曲線對(duì)應(yīng)的組織名,必須首先確定其ROInumber,再?gòu)腟tructureSetROISequence中找到與此ROInumber對(duì)應(yīng)的ROIname即組織名。
表1 組織項(xiàng)排序比較Tab.1 Comparison of item sequence
Eclipse計(jì)劃系統(tǒng)輸出的DICOM RT dose 文件中的DVH數(shù)據(jù)形式如表2,0.01表示選擇的劑量間隔為0.01 Gy;對(duì)于輸出的積分DVH,下一個(gè)數(shù)據(jù)表示大于等于該劑量區(qū)間的絕對(duì)體積(cm3);對(duì)于輸出的微分DVH,為落在該劑量區(qū)間內(nèi)的絕對(duì)體積(cm3)。在計(jì)算積分形式的劑量體積參數(shù)時(shí),對(duì)于前者需要循環(huán)累加劑量間隔值,對(duì)于后者還需要反向累加微分體積。
表2 放療計(jì)劃系統(tǒng)輸出的DICOM RT dose文件中DVH數(shù)據(jù)存儲(chǔ)形式Tab.2 Storage format of DVH data in exported DICOM RT dose file from TPS
在CPU主頻為3.0 GHz,內(nèi)存為4 GB的PC上對(duì)14位患者劑量文件批量讀取后,提取劑量體積數(shù)據(jù)輸出至Excel文件中,每一行對(duì)應(yīng)一位患者的全部數(shù)據(jù),共14行數(shù)據(jù),對(duì)于任意一行,從左至右按順序依次是患者計(jì)劃1中PTV的數(shù)據(jù)1至最后一個(gè)數(shù)據(jù),計(jì)劃1中 OAR1的數(shù)據(jù)1至最后一個(gè)數(shù)據(jù),然后是OAR2直至最后一個(gè)OAR的所有數(shù)據(jù),接下來是計(jì)劃2中的相應(yīng)全部數(shù)據(jù),排列順序與計(jì)劃1相同。
軟件提取劑量體積數(shù)據(jù)準(zhǔn)確性驗(yàn)證,以人工拾取的劑量數(shù)據(jù)為準(zhǔn)確值,分別考察最大劑量,最小劑量,平均劑量,組織絕對(duì)體積;PTV的90%~98%處方劑量區(qū)間的體積平均誤差,PTV的99%~106%處方劑量區(qū)間的體積平均誤差,危及器官(Organ at Risk, OAR)的體積平均誤差,如表3所示。在處理時(shí)間方面,對(duì)于人工提取分析方法其包括在DVH上逐點(diǎn)拾取劑量數(shù)據(jù)的時(shí)間,將數(shù)據(jù)錄入Excel表格的時(shí)間,數(shù)據(jù)導(dǎo)入SPSS軟件分析的時(shí)間;對(duì)于軟件提取分析方法其包括從計(jì)劃系統(tǒng)導(dǎo)出DICOM RT文件的時(shí)間,軟件讀取文件自動(dòng)提取數(shù)據(jù)的時(shí)間,數(shù)據(jù)導(dǎo)SPSS軟件分析的時(shí)間??疾鞂?duì)14例患者1 120個(gè)劑量數(shù)據(jù)點(diǎn)批量提取分析的時(shí)間和輸入錯(cuò)誤率,結(jié)果如表4所示。
表3 劑量體積數(shù)據(jù)準(zhǔn)確性驗(yàn)證Tab.3 Accuracy validation of dose-volume data
表4 人工和軟件提取分析的結(jié)果比較Tab.4 Result comparison of extraction and analysis between manual operation and software
最大劑量,最小劑量,平均劑量,組織絕對(duì)體積參數(shù)記錄在DICOM RT文件中,因此軟件提取結(jié)果誤差為0。對(duì)于靶區(qū)和正常組織的劑量體積參數(shù)Vd(表示大于等于劑量d的組織體積),在用鼠標(biāo)拾取數(shù)據(jù)點(diǎn)時(shí),通常不能精確選定在期望的劑量坐標(biāo)處,因此為了保證準(zhǔn)確性,要求拾取劑量值與期望劑量值的偏差必須小于0.001 Gy。本文結(jié)果顯示PTV的90%~98%劑量區(qū)間的體積平均誤差要小于PTV的99%~106%劑量區(qū)間,危及器官(Organ at Risk, OAR)的平均劑量體積誤差最小,并與前者數(shù)量級(jí)相當(dāng),原因可能在于PTV的DVH曲線在99%~106%處方劑量區(qū)間的DVH曲線變化率大、降落快,而在PTV的90%~98%劑量區(qū)間和OAR的DVH曲線變化率相對(duì)較平緩,此外計(jì)劃系統(tǒng)上DVH曲線插值算法與本文軟件提取使用的插值算法也可能有所不同,而且如前述人工提取的劑量值與期望劑量值本身也有微小的偏差,這些因素的疊加最終導(dǎo)致了誤差的不同。此外軟件提取方法在速度上要明顯優(yōu)于人工提取方法,特別當(dāng)面對(duì)大量數(shù)據(jù)時(shí),人工提取錄入的錯(cuò)誤率也要高于軟件提取輸出方法,而且這一過程非??菰?,需要耗費(fèi)操作人員相當(dāng)大的精力,相比之下軟件程序經(jīng)過調(diào)試后理論上不會(huì)產(chǎn)生任何提取錯(cuò)誤。
全面準(zhǔn)確的報(bào)道劑量學(xué)數(shù)據(jù)是當(dāng)前循證醫(yī)學(xué)的迫切要求[16],目前主流的放射治療計(jì)劃制定方法和評(píng)估手段仍然是基于DVH圖的方式,大多數(shù)治療計(jì)劃系統(tǒng)雖然可以提供以DICOM RT或其他格式輸出的計(jì)劃劑量數(shù)據(jù)文件,但還需進(jìn)一步的人工交互才能獲取有用數(shù)據(jù),國(guó)外已有文獻(xiàn)報(bào)道了使用軟件編程提取DVH數(shù)據(jù)的方法,但沒有考慮到批量讀取患者數(shù)據(jù)和其后數(shù)據(jù)分析軟件的數(shù)據(jù)格式兼容性問題[7],或者使用R語言實(shí)現(xiàn)解讀,但要求使用者對(duì)R語言有一定的了解程度,因此不具有很好的擴(kuò)展性[8]。本文針對(duì)這些問題進(jìn)行了改進(jìn),利用通用的Matlab平臺(tái),實(shí)現(xiàn)了自動(dòng)提取批量患者的劑量學(xué)數(shù)據(jù),并直接按照SPSS軟件兼容的數(shù)據(jù)格式輸出數(shù)據(jù)至Excel表,大大減少了錄入數(shù)據(jù)標(biāo)題和調(diào)整數(shù)據(jù)位置需要的時(shí)間,也減少了在這一過程中人工錄入錯(cuò)誤發(fā)生的可能性,進(jìn)一步提高了劑量數(shù)據(jù)提取分析的自動(dòng)化程度。本文是基于Varian Eclipse系統(tǒng)輸出的DICOM RT文件進(jìn)行的研究,代碼經(jīng)過針對(duì)性的改進(jìn)后可以推廣到遵循其他協(xié)議的(例如AAPM、RTOG)和其他文件輸出命名方式的計(jì)劃系統(tǒng)??偟膩碚f本文提出劑量數(shù)據(jù)提取分析方法準(zhǔn)確、快速、具備很好的推廣性和臨床應(yīng)用價(jià)值,為基于大量患者劑量學(xué)數(shù)據(jù)分析的臨床研究提供了一種高效的工具。
[1] Santos JDL, Popple R, Agazaryan N, et al. Image guided radiation therapy (IGRT) Technologies for Radiation therapy localization and delivery[J]. Int J Radiat Oncol Biol Phy, 2013, 87(1): 33-45.
[2] Wolff D, Stieler FG. Volumetric modulated arc therapy (VMAT) vs. serial tomotherapy, step-and-shoot IMRT and 3D-conformal RT for treatment of prostate cancer [J]. Radiother Oncol, 2009, 93(2): 226-233.
[3] Mackie TR, Holmes T, Swerdloff S, et al. Tomotherapy: A new concept for the delivery of dynamic conformal radiotherapy[J]. Med Phys, 1993, 20(6):1709-1719.
[4] Fenwick JD, Tome WA, Soisson ET, et al. Tomotherapy and Other Innovative IMRT Delivery Systems[J]. Seminar Radiat Oncoly, 2006, 16(4):199-208.
[5] Jang S, Pyakuryal A, Myint K, et al. SU-GG-T-379: Dose volume histogram (DVH) analysis software for radiation therapy research[J]. Med Phys, 2008, 35(6): 2812.
[6] Ebert MA, Haworth A, Kearvell R, et al. Comparison of DVH data from multiple radiotherapy treatment planning systems[J]. Phys Med Biol, 2010, 55(11):337-346.
[7] Pyakuryal A, Myint WK, Gopalakrishnan M, et al. A computational tool for the efficient analysis of dose-volume histograms for radiation therapy treatment plans [J]. J Appl Clin Med Phys, 2010, 11(1): 137-157.
[8] Thompson RF. RadOnc: An R package for analysis of dose-volume histogram and three-dimensional structural data [J]. J Radiat Oncol Inform, 2014, 6(1): 98-110.
[9] Pianykh OS. Digital imaging and communications in medicine[M]. Berlin: Springer Berlin Heidelberg, 2010.
[10] Law MYY, Liu B. DICOM-RT and its utilization in radiation therapy[J]. Radiographics, 2009, 29(3):218-228.
[11] 王爽. DICOM結(jié)構(gòu)化報(bào)告和放射治療計(jì)劃研究[D]. 成都: 電子科技大學(xué), 2010.
[12] Spezi E, Deasy J. An open source DICOM RT/MATLAB based computational platform for radiotherapy research[J]. Radiother Oncol, 2003, 68(1): 106-115.
[13] Guo R, Wang W, Qi HR. Hyperspectral image unmixing using autoencoder cascade[A]// Hyperspectral Image and Signal Processing: Evolution in Remote Sensing (WHISPERS), 2015 7th Workshop [C]. IEEE, 2015. 1-4.
[14] Guo R, Qi HR. Facial feature parsing and landmark detection via low-rank matrix decomposition[C]//. IEEE ICZP, 2015:1-8.
[15] Zhao B. Beyond The dvh-spatial and biological radiotherapy treatment planning[D]. Detroit: Wayne State University, 2010.
[16] Souza WD, Zhang B, Feigenberg S, et al. SU-E-P-09: Compliance with evidence-based treatment planning dvh guidelines in an academic multi-site radiation oncology practice setting[J]. Med Phys, 2015, 42(6).3228.
Automatic Extraction and Analysis of Dosimetry Data in Radiotherapy Plans
【W(wǎng)riters】SONG Wei, ZHAO Di, LU Hong, ZHANG Biyun, MA Jun, YU Dahai
Radiotherapy Center, Jiangsu Province Hospital of TCM, Nanjing, 210029
Objective To improve the efficiency and accuracy of extraction and analysis of dosimetry data in radiotherapy plans for a batch of patients.MethodsWith the interface function provided in Matlab platform, a program was written to extract the dosimetry data exported from treatment planning system in DICOM RT format and exported the dosevolume data to an Excel file with the SPSS compatible format. This method was compared with manual operation for 14 gastric carcinoma patients to validate the efficiency and accuracy.ResultsThe output Excel data were compatible with SPSS in format, the dosimetry data error for PTV dose interval of 90%~98%, PTV dose interval of 99%~106% and all OARs were -3.48E-5±3.01E-5, -1.11E-3±7.68E-4, -7.85E-5±9.91E-5 respectively. Compared with manual operation, the time required was reduced from 5.3 h to 0.19 h and input error was reduced from 0.002 to 0.ConclusionThe automatic extraction of dosimetry data in DICOM RT format for batch patients, the SPSS compatible data exportation, quick analysis were achieved in this paper. The efficiency of clinical researches based on dosimetry data analysis of large number of patients will be improved with this method.
DVH, DICOM RT, Matlab, SPSS
TP311. 1
A
10.3969/j.issn.1671-7104.2016.04.019
1671-7104(2016)04-0301-04
2016-03-07
國(guó)家自然科學(xué)基金資助項(xiàng)目(81301971)
宋威,E-mail: swjacke@hotmail.com
于大海,主任醫(yī)師,E-mail: yudahaipumc@gmail.com