謝 凱,孫鴻飛,林 濤,高留剛,眭建鋒,倪昕曄
(南京醫(yī)科大學(xué)附屬常州第二人民醫(yī)院放療科,江蘇 常州 213003)
影像組學(xué)中特征提取研究進(jìn)展
謝 凱,孫鴻飛,林 濤,高留剛,眭建鋒,倪昕曄*
(南京醫(yī)科大學(xué)附屬常州第二人民醫(yī)院放療科,江蘇 常州 213003)
影像組學(xué)是從CT、MRI、PET等醫(yī)學(xué)影像的ROI提取大量影像特征,來描述腫瘤生物學(xué)特征和異質(zhì)性等信息的一種定量分析方法。隨著數(shù)據(jù)科學(xué)發(fā)展,影像組學(xué)的研究方法日益受到國內(nèi)外的重視。影像組學(xué)的特征提取是其中的重要步驟。本文對(duì)影像組學(xué)的特征提取進(jìn)行綜述。
影像組學(xué);異質(zhì)性;診斷;特征提取
隨著CT、PET、MRI設(shè)備及后處理、分析軟件等的發(fā)展,醫(yī)學(xué)影像學(xué)為臨床醫(yī)學(xué)提供了更為精準(zhǔn)的信息,并有望在分析腫瘤表型差異及內(nèi)涵特征方面取得進(jìn)展[1]。但長久以來,影像學(xué)家僅從中提取了定性和半定量的信息。目前活組織檢查是診斷腫瘤良惡性的金標(biāo)準(zhǔn)。由于腫瘤空間和時(shí)間的異質(zhì)性,活組織檢查不能全面評(píng)估腫瘤信息,且患者難以承受連續(xù)多次活檢。醫(yī)學(xué)影像可無創(chuàng)提供腫瘤形態(tài)學(xué)和部分功能的信息,并可借助圖像分析監(jiān)測疾病的發(fā)生、發(fā)展及對(duì)治療的反應(yīng)[2]。影像組學(xué)[3]認(rèn)為,通過對(duì)現(xiàn)有醫(yī)學(xué)影像進(jìn)行深入挖掘和分析,有望獲得基因組學(xué)或蛋白組學(xué)宏觀表達(dá)上的影像特征。影像學(xué)家可通過對(duì)醫(yī)學(xué)影像的量化分析,推斷出腫瘤的各種表型[4]。特征提取是影像組學(xué)的一個(gè)重要步驟,本文對(duì)其進(jìn)行綜述。
目前,常將放射影像的建設(shè)及應(yīng)用框架分為圖像的獲取及重建、圖像分割及ROI勾畫、特征的提取和量化、特征的選擇、預(yù)測模型及數(shù)據(jù)分析5部分。
影像組學(xué)的工作流程見圖1[5]。第一步是獲得高質(zhì)量和標(biāo)準(zhǔn)化的影像(MR、CT和PET等),用于診斷和評(píng)估。為獲得更理想的分析結(jié)果,選擇病例時(shí)應(yīng)避免過于異質(zhì)性,防止手術(shù)、放療、化療中不同ROI干擾影像組學(xué)特征分析結(jié)果。同時(shí)采集圖像時(shí)應(yīng)盡可能選用同個(gè)或同種掃描機(jī)器,并選擇合理的層厚、像素大小和管電壓等參數(shù)[6]。第二步是通過自動(dòng)、半自動(dòng)分割方法或由經(jīng)驗(yàn)豐富的放射腫瘤學(xué)家,從獲取的圖像中勾畫腫瘤實(shí)質(zhì),即ROI。目前常用的分割算法有圖形切割法、活動(dòng)輪廓法、區(qū)域生長法[7]和水平集法等。勾畫ROI時(shí)注意圖像是否需配準(zhǔn),同時(shí)ROI不應(yīng)過小,通常不能小于5 cm3。在手動(dòng)、半自動(dòng)、自動(dòng)勾畫及可用軟件中,應(yīng)針對(duì)精度、時(shí)間等綜合選擇。第三步是從ROI中提取影像組學(xué)特征,包括強(qiáng)度分布的描述、不同強(qiáng)度水平間的空間關(guān)系、紋理圖案的形狀和異質(zhì)性以及對(duì)腫瘤與周圍組織關(guān)系的描述。第四步是根據(jù)數(shù)據(jù)的可重復(fù)性、其他特征的相關(guān)性等,對(duì)影像特征進(jìn)行篩選,并分析選定特征與治療結(jié)果或基因表達(dá)的關(guān)系。最后,通過將影像組學(xué)特征納入治療結(jié)果的預(yù)測模型,并評(píng)估影像組學(xué)特征相對(duì)常用預(yù)測因子提供的附加信息,從而提供準(zhǔn)確的風(fēng)險(xiǎn)預(yù)測。
圖1 影像組學(xué)流程示意圖[5] A.圖像的獲取與重建; B.圖像分割及ROI勾畫; C.特征的提取和量化; D.特征的選擇; E.預(yù)測模型及數(shù)據(jù)分析
影像組學(xué)的核心步驟是提取高維特征數(shù)據(jù)用于定量分析ROI的屬性。基于統(tǒng)計(jì)劃分,常將影像組學(xué)特征分為兩大類,一類認(rèn)為紋理是二階特征[8],另一類認(rèn)為紋理包括一階、二階和高階特征,同時(shí)也包括基于模型和基于變換的紋理[9-10]。本文主要對(duì)后者進(jìn)行闡述。
2.1 形態(tài)特征及語義特征 針對(duì)給定的腫瘤,首先需初步了解其三維大小和形狀等,形態(tài)特征是通過計(jì)算ROI描述腫瘤特征,其中常用的有緊密度、三維直徑、球形不均勻度、球形度、表面積、體積,其中最大的三維直徑、表面積和體積可提供病變組織的尺寸信息。緊密度、球形不均勻度、球形度等表明與體積的比例,可描述球形、圓形或細(xì)長形狀的腫瘤。Vallières等[11]在影像組學(xué)特征計(jì)算中也考慮硬度和偏心率。
另外語義特征[8]在分析中也有廣泛應(yīng)用,是指在放射學(xué)中常用來描述ROI的相關(guān)詞匯,在計(jì)算機(jī)輔助下,放射學(xué)家也可定量分析病變組織。常用的語義特征有尺寸、形狀、位置、血管分布、毛刺和壞死等。
形態(tài)特征主要提供腫瘤的三維大小和形狀等相關(guān)信息,并不涉及腫瘤的異質(zhì)性。為獲得更多關(guān)于腫瘤異質(zhì)性的信息,紋理特征的應(yīng)用較廣泛。
2.2 紋理特征 紋理分析是指于一個(gè)圖像導(dǎo)出的特征,用各種數(shù)學(xué)方法提供圖像不同灰度級(jí)相對(duì)位置信息,從而量化腫瘤異質(zhì)性[12]。其計(jì)算方法可分為基于統(tǒng)計(jì)、基于模型和基于變換3類。其中基于統(tǒng)計(jì)方法最常用,用于描述圖像中灰度值的分布和關(guān)系,按照計(jì)算中涉及的體素?cái)?shù)目可分為一階(單體素)、二階(雙體素)、高階(三體素或更多)特征。
2.2.1 一階特征 一階特征也稱強(qiáng)度特征,與ROI內(nèi)的灰度級(jí)頻率分布有關(guān),依賴于單個(gè)體素值,而非相鄰交互的體素,可從體素強(qiáng)度直方圖中獲得,包括能量、熵、銳利度、最大值、均值、平均絕對(duì)偏差、中值、最小值、范圍、均方根、偏度、標(biāo)準(zhǔn)差、一致性、方差等,其中標(biāo)準(zhǔn)差、方差和平均絕對(duì)偏差用于測量直方圖密集程度,即灰度級(jí)與均值偏離程度的度量;方差、偏度和銳利度常用于中心測度,偏度可度量直方圖關(guān)于均值的不對(duì)稱程度,銳利度是直方圖銳度的度量;直方圖的一致性和熵可度量直方圖隨機(jī)性[13];熵可反映圖像中平均信息量的多少[14]。
一階特征反映強(qiáng)度直方圖的整體信息,但未考慮相鄰體素的相互影響,因此需更深入地提取特征,在實(shí)際應(yīng)用中基于空間灰度共生矩陣的二階特征有廣泛應(yīng)用。
2.2.2 二階特征 二階特征通過空間灰度共生矩陣(gray level co-occurence matrix, GLCM)、灰度游程步長矩陣(gray level run length matrix, GLRLM)等獲得。這些矩陣決定一個(gè)體素的強(qiáng)度i以某種關(guān)系通過另一個(gè)體素的強(qiáng)度j尋找自身的程度。
GLCM描述體素的兩兩排列,基于GLCM的二階統(tǒng)計(jì)包括熵(矩陣的隨機(jī)性)、能源/角二階矩(體素重復(fù)/規(guī)律和測量圖像的同質(zhì)性)、同質(zhì)性(共生矩陣的一致性)、不同度(測量矩陣中每個(gè)元素的不同程度)和相關(guān)度(灰度線性依賴的測量)。
GLRLM描述具有相同強(qiáng)度體素的排列[15]。游程是預(yù)先設(shè)定方向上具有相同灰度級(jí)別的連續(xù)體素長度。游程長度間的關(guān)系產(chǎn)生紋理。細(xì)紋理的游程較短,且灰度強(qiáng)度相似,而粗紋理的游程與之相反。GLRLM的定義參數(shù)包括短游程強(qiáng)調(diào)(short run emphasis, SRE;測量圖像中的短游程分布)、長游程強(qiáng)調(diào)(long run emphasis, LRE)、灰度非均勻性(gray level nonuniformity, GLNU;測量灰度值相似性)、游程長度的不均勻性(run length nonuniformity, RLNU;測量游程步長相似性)。
2.2.3 高階特征 利用鄰域灰度差矩陣計(jì)算高階統(tǒng)計(jì)量,研究3個(gè)或更多體素間的空間關(guān)系,并被認(rèn)為與人類的圖像經(jīng)驗(yàn)非常相似[16]。通常利用鄰域灰度差值矩陣(neighborhood gray-tone difference matrix, NGTDM)和灰度區(qū)域大小矩陣(gray-level size zone matrix, GLSZM)等計(jì)算。NGTDM描述的是每個(gè)體素與相鄰體素的不同,包括對(duì)比度(圖像的局部變化數(shù))、粗糙度(測量邊緣密度)和忙碌度(測量灰度值變化的空間速度)。GLSZM描述的是同質(zhì)性區(qū)域的特征,包括短區(qū)域強(qiáng)調(diào)和長區(qū)域強(qiáng)調(diào)等。
根據(jù)紋理特征對(duì)腫瘤的描述,通常認(rèn)為一階特征是在全局尺度上、基于GLCM和NGTDM的特征是在本地尺度上、基于GLRLM和GLSZM的特征是在局部尺度上反映腫瘤的異質(zhì)性[17]。
為說明不同階特征統(tǒng)計(jì)量之間的區(qū)別,圖2[10]顯示了4個(gè)不同四色矩陣圖像的模擬情況。基于一階統(tǒng)計(jì)量,因?yàn)槭鞘褂脝蝹€(gè)體素值計(jì)算,4種情況均會(huì)給出相同的特征?;贕LCM的二階統(tǒng)計(jì)量將在圖2A和圖2B間給出不同的特征,因?yàn)橛?jì)算考慮了體素在同一層面的相對(duì)分布。在X方向偏移一個(gè)體素(即偏移量),圖2B、2C和2D獲得的二階特征相同。高階統(tǒng)計(jì)量(如NGTDM)由于空間體素相對(duì)于另外體素的特殊分布,4種情況可能會(huì)得出不同的特征結(jié)果。
2.2.4 基于模型和基于變換的方法 基于模型的方法是使用復(fù)雜的數(shù)學(xué)模型如分形分析表示紋理。分形分析是一種模式或幾何識(shí)別的形式。分形維數(shù)是測量表面的不規(guī)則性或粗糙度;分形維數(shù)越大,紋理越粗糙。
基于變換的方法是使用如傅里葉、Gabor、小波變換和高斯濾波器的拉普拉斯變換(LoG)分析在頻率或尺度空間的紋理。傅里葉變換分析無空間定位的頻率內(nèi)容,因此不經(jīng)常使用;Gabor變換是引入高斯函數(shù)的傅里葉變換窗口,允許頻率和空間定位,但受單個(gè)濾波器分辨率的限制;小波特征經(jīng)小波分解計(jì)算獲得原始圖像的強(qiáng)度和紋理特征,將特征集中在腫瘤體積內(nèi)的不同頻率范圍[18];LoG特征從具有越來越粗糙紋理圖案的區(qū)域中提取。
2.3 影像組學(xué)特征分析的影響因素 影響影像組學(xué)特征分析的因素主要包括圖像采集、ROI勾畫、算法等[19]。
圖像采集因素包括CT圖像采集的金屬偽影[20]、噪音和擾動(dòng)、圖像重建算法等,PET圖像的光滑和量化、SUV的離散程序[21]等,MR圖像采集的算法協(xié)議、參數(shù)的魯棒性[22]等。在ROI勾畫中,手動(dòng)勾畫與自動(dòng)勾畫的比較[23]、圖像配準(zhǔn)和輪廓生成等均可能影響影像組學(xué)特征的計(jì)算。影像組學(xué)算法中,圖像的重新取樣、紋理矩陣中的方向性、算法公式中的特殊參數(shù)[24]以及不同集成軟件的選擇等,也會(huì)對(duì)特征計(jì)算有影響。
圖2 基于統(tǒng)計(jì)的紋理特征4種不同情況下的模擬[10] A.2×2四色矩陣圖像; B.10×10矩陣圖像; C.5×10矩陣圖像; D.2×10矩陣圖像
2.4 影像組學(xué)特征的使用與局限性 目前,在影像組學(xué)分析中,大量的臨床特征(主要包括性別、年齡、腫瘤階段、癥狀表現(xiàn)、腫瘤大小等)也會(huì)被進(jìn)行分析比較,此外,分析肺癌時(shí)還需考慮有無吸煙史[25]。
在上述特征中,由于計(jì)算和理解方便,GLCM計(jì)算的二階特征獲得廣泛應(yīng)用[26]。同時(shí),為更好地描述腫瘤及其性質(zhì),通常綜合上述特征提取數(shù)百個(gè)特征進(jìn)行篩選分析。而且針對(duì)不同的醫(yī)學(xué)影像(CT、MR、PET)手段,所使用的影像組學(xué)特征也有所不同。
影像組學(xué)特征分析在放療分析的應(yīng)用越來越廣泛,但仍面臨著諸多困難[19],主要有:①影像組學(xué)特征分析主要在回顧性研究設(shè)計(jì)中進(jìn)行,與實(shí)際臨床的預(yù)測性需要還存在一定差別[27];②通常提取的特征數(shù)量會(huì)大于所考慮的患者數(shù)量,而且數(shù)據(jù)間存在相關(guān)性,故常假陽性率過高[27],因此,有必要減少特征數(shù)量以避免過度擬合分析的風(fēng)險(xiǎn),通常一個(gè)特征對(duì)應(yīng)15個(gè)左右的案例,并構(gòu)建分類器或預(yù)測模型;③在分析的患者中,概括和驗(yàn)證統(tǒng)計(jì)學(xué)特征還需深入探討;既往研究[24]中患者多數(shù)源于同一機(jī)構(gòu),今后需更多機(jī)構(gòu)的合作,進(jìn)行交叉驗(yàn)證;④對(duì)于常用的影像組學(xué)特征的生物學(xué)解釋[28],如常用的二階特征GLCM等;⑤影像組學(xué)特征的可重復(fù)性、魯棒性等是否可靠,還需探討。
醫(yī)學(xué)影像未能提供更多關(guān)于腫瘤異質(zhì)性內(nèi)容,同時(shí)活體檢查由于腫瘤空間和時(shí)間上的基因異質(zhì)性,腫瘤的信息不能被全面評(píng)估。影像組學(xué)可高通量地從CT、PET、MRI中提取并分析大量高級(jí)定量影像特征,從而指導(dǎo)腫瘤的治療、預(yù)后以及療效[29],有廣闊的應(yīng)用前景。
總之,影像組學(xué)作為腫瘤生物信息來源的一種手段,可多方位提供腫瘤生物學(xué)特性,為腫瘤精準(zhǔn)治療提供幫助[30]。同時(shí),影像組學(xué)的特征提取也面臨一系列的機(jī)遇與挑戰(zhàn)。如何更好地通過影像組學(xué)特征提取與分析,需要繼續(xù)努力,提出更多的理論與方法。
[1] 蘇會(huì)芳,周國鋒,謝傳淼,等.放射組學(xué)的興起和研究進(jìn)展.中華醫(yī)學(xué)雜志,2015,95(7):553-556.
[2] 王敏,宋彬,黃子星,等.大數(shù)據(jù)時(shí)代的精準(zhǔn)影像醫(yī)學(xué):放射組學(xué).中國普外基礎(chǔ)與臨床雜志,2016,23(6):752-755.
[3] Kumar V, Gu Y, Basu S, et al. Radiomics: The process and the challenges. Magn Reson Imaging, 2012,30(9):1234-1248.
[4] 胡盼盼,王佳舟,胡偉剛,等.影像組學(xué)在精準(zhǔn)放療中的應(yīng)用.中華放射腫瘤學(xué)雜志,2017,26(1):103-106.
[5] Huynh E, Coroller T P, Narayan V, et al. CT-based radiomic analysis of stereotactic body radiation therapy patients with lung cancer. Radiother Oncol, 2016,120(2):258-266.
[6] Court LE, Fave X, Mackin D, et al. Computational resources for radiomics. Transl Cancer Res, 2016,5(4):340-348.
[7] Hojjatoleslami SA, Kittler J. Region growing: A new approach. IEEE T Image Process, 1998,7(7):1079-1100.
[8] Gillies RJ, Kinahan PE, Hricak H. Radiomics: Images are more than pictures, they are data. Radiology, 2016,278(2):563-577.
[9] Davnall F, Yip CS, Ljungqvist G, et al. Assessment of tumor heterogeneity: An emerging imaging tool for clinical practice? Insights Imaging, 2012,3(6):573-589.
[10] Chicklore S, Goh V, Siddique M, et al. Quantifying tumour heterogeneity in18F-FDG PET/CT imaging by texture analysis. Eur J Nucl Med Mol Imaging, 2013,40(1):133-140.
[11] Vallières M, Freeman CR, Skamene SR, et al. A radiomics model from joint FDG-PET and MRI texture features for the prediction of lung metastases in soft-tissue sarcomas of the extremities. Phys Med Biol, 2015,60(14):5471-5496.
[12] Castellano G, Bonilha L, Li LM, et al. Texture analysis of medical images. Clin Radiol, 2004,59(12):1061-1069.
[13] 王超.基于影像組學(xué)的乳腺癌病灶分割及預(yù)后分析.哈爾濱:哈爾濱理工大學(xué),2017:24-27.
[14] 汪俊.基于定量影像組學(xué)的肺結(jié)節(jié)良惡性預(yù)測.哈爾濱:哈爾濱理工大學(xué),2016:25-26.
[15] Loh HH, Leu JG, Luo RC. The analysis of natural textures using run length features. IEEE T Ind Electron, 1988,35(2):323-328.
[16] Srinivasan GN, Shobha G. Statistical texture analysis. Proceedings of World Academy of Science Engineering & Technolog, 2008,36:1264-1269.
[17] Tixier F, Le RC, Hatt M, et al. Intratumor heterogeneity characterized by textural features on baseline18F-FDG PET images predicts response to concomitant radiochemotherapy in esophageal cancer. J Nucl Med, 2011,52(3):369-378.
[18] Aerts HJ, Velazquez ER, Leijenaar RT, et al. Decoding tumour phenotype by noninvasive imaging using a quantitative radiomics approach. Nat Commun, 2014,5:4006-4013.
[19] Scalco E, Rizzo G.Texture analysis of medical images for radiotherapy applications. Brit J Radiol, 2016,90(1070):20160642.
[20] Leijenaar RT, Carvalho S, Hoebers FJ, et al. External validation of a prognostic CT-based radiomic signature in oropharyngeal squamous cell carcinoma. Acta Oncol, 2015,54(9):1423-1429.
[21] Leijenaar RTH, Nalbantov G, Carvalho S, et al. The effect of SUV discretization in quantitative FDG-PET Radiomics:The need for standardized methodology in tumor texture analysis. Sci Rep-UK, 2015,5:11075-11084.
[22] Song YS, Park CM, Lee SM, et al. Reproducibility of histogram and texture parameters derived from intravoxel incoherent motion diffusion-weighted MRI of FN13762 rat breast Carcinomas. Anticancer Res, 2014,34(5):2135-2144.
[23] Orlhac F, Soussan M, Maisonobe JA,et al. Tumor texture analysis in18F-FDG PET: Relationships between texture parameters, histogram indices, standardized uptake values, metabolic volumes, and total lesion glycolysis. J Nucl Med, 2014,55(3):414-422.
[24] Hatt M, Tixier F, Pierce L, et al. Characterization of PET/CT images using texture analysis: The past, the present any future?. Eur J Nucl Med Mol Imaging, 2016,44(1):1-15.
[25] Coroller TP, Grossmann P, Hou Y, et al. CT-based radiomic signature predicts distant metastasis in lung adenocarcinoma. Radiother Oncol, 2015,114(3):345-350.
[26] Panth KM, Leijenaar RTH, Carvalho S, et al. Is there a causal relationship between genetic changes and radiomics-based image features? An in vivo preclinical experiment with doxycycline inducible GADD34 tumor cells. Radiother Oncol, 2015,116(3):462-466.
[27] Yip SS, Aerts HJ. Applications and limitations of radiomics.Phys Med Biol, 2016,61(13):150-166.
[28] Alobaidli S, Mcquaid S, South C, et al. The role of texture analysis in imaging as an outcome predictor and potential tool in radiotherapy treatment planning.Brit J Radiol, 2014,87(1042):13.
[29] 蘇會(huì)芳,周國鋒,謝傳淼,等.放射組學(xué)的興起和研究進(jìn)展.中華醫(yī)學(xué)雜志, 2015,95(7):553-556.
[30] 賈田穎,余雯,傅小龍,等.影像組學(xué)在非小細(xì)胞肺癌精準(zhǔn)治療中的應(yīng)用進(jìn)展.中華放射醫(yī)學(xué)與防護(hù)雜志,2016,36(12):947-950.
Researchprogressesinfeatureextractionofradiomics
XIEKai,SUNHongfei,LINTao,GAOLiugang,SUIJianfeng,NIXinye*
(DepartmentofRadiationOncology,theSecondPeople'sHospitalofChangzhouAffiliatedtoNanjingMedicalUniversity,Changzhou213003,China)
Radiomics refers to the comprehensive quantification of information such as tumor biological feature and heterogeneity through assessing a large number of quantitative image features from ROI of CT, MRI and PET images. With the development of data science, radiomics has been paid more and more attention. Feature extraction is an important step of Radiomics. The processes in feature extraction of radiomics were reviewed in this paper.
Radiomics; Heterogeneity; Diagnosis; Feature extraction
R445
A
1003-3289(2017)12-1792-05
江蘇省自然科學(xué)基金(BK20151181)、常州市社會(huì)發(fā)展項(xiàng)目(CJ20160029)、常州市衛(wèi)生高層次人才資助項(xiàng)目(2016CZLJ004)。
謝凱(1990—),男,安徽安慶人,碩士,醫(yī)學(xué)物理師。研究方向:影像劑量學(xué)。E-mail: 229623265@qq.com
倪昕曄,南京醫(yī)科大學(xué)附屬常州第二人民醫(yī)院放療科,213003。E-mail: nxy2000@aliyun.com
2017-07-06
2017-11-03
10.13929/j.1003-3289.201707022