高歌, 馬帥, 王霄英
·影像信息學(xué)專題·
計算機輔助診斷在醫(yī)學(xué)影像診斷中的基本原理和應(yīng)用進展
高歌, 馬帥, 王霄英
計算機輔助診斷(CAD)技術(shù)可以自動提取圖像特征并應(yīng)用機器學(xué)習(xí)算法進行病變檢出和診斷,目前已廣泛應(yīng)用于多種疾病的多模態(tài)影像圖像的分析,從而提高醫(yī)學(xué)影像檢查的價值。本文對CAD基本原理及其在乳腺癌、肺結(jié)節(jié)、結(jié)腸息肉及前列腺癌診斷等領(lǐng)域的研究進展進行綜述。
診斷,計算機輔助; 多模態(tài)磁共振成像; 醫(yī)學(xué)圖像; 人工智能
隨著影像技術(shù)的快速發(fā)展,X線、CT、MRI以及超聲等影像技術(shù)已逐漸成為腫瘤檢出、分期及隨訪的重要手段。大量影像數(shù)據(jù)和功能成像數(shù)據(jù)分析在提高疾病診斷準確性的同時,增加了疾病診斷的復(fù)雜性和對醫(yī)師經(jīng)驗的依賴性。1966年Lodwick[1]提出利用計算機進行醫(yī)學(xué)影像數(shù)據(jù)分析,即計算機輔助診斷(computer-aided diagnosis,CAD)這一概念,但受技術(shù)水平的限制,此后十幾年對CAD的研究發(fā)展較慢。直到20世紀80~90年代,隨著計算機技術(shù)、數(shù)學(xué)算法及統(tǒng)計學(xué)的發(fā)展,CAD在醫(yī)學(xué)影像診斷領(lǐng)域獲得了快速發(fā)展,針對不同疾病的CAD研究大量涌現(xiàn)。根據(jù)輸出結(jié)果的不同,CAD分為兩種類別,包括計算機輔助檢出(computer-aided detection,CADe)和計算機輔助診斷(computer-aided diagnosis,CADx)[2]。本文將分別對CAD基本原理和主要應(yīng)用領(lǐng)域進行綜述。
理論上,CAD可以應(yīng)用于多種影像技術(shù)對疾病進行檢出和診斷,雖然不同CAD的數(shù)據(jù)模態(tài)和診斷效度存在很大差別,但CAD系統(tǒng)的工作流程基本相同,即數(shù)據(jù)預(yù)處理-圖像分割-樣本采集-特征提取-分類器-結(jié)果輸出。
1.數(shù)據(jù)預(yù)處理
大多數(shù)CAD系統(tǒng)需要對輸入數(shù)據(jù)進行預(yù)處理,包括矯正由于設(shè)備和/或檢查環(huán)境所致圖像灰度值的不均勻性、降低圖像噪聲和數(shù)據(jù)再抽樣等,其目的在于去除不同類型或不同來源數(shù)據(jù)間的差異。數(shù)據(jù)預(yù)處理并非CAD系統(tǒng)的必要組成結(jié)構(gòu),但若不對數(shù)據(jù)進行預(yù)處理,不同數(shù)據(jù)間的差異將會導(dǎo)致CAD系統(tǒng)的誤判。
2.圖像分割
將圖像分割為不同解剖區(qū)域,對圖像中特定目標特征識別和提取,決定了CAD系統(tǒng)對病灶檢出和識別的準確性。圖像分割方法包括人工分割和自動分割,由于人工分割較為耗時,且存在主觀性強、重復(fù)性差、不易實現(xiàn)三維分割等缺陷,因此自動分割技術(shù)是目前醫(yī)學(xué)影像圖像分析領(lǐng)域的研究熱點之一。目前,自動分割算法主要包括基于閾值選取的圖像分割方法、基于區(qū)域的圖像分割方法、基于邊緣檢測的分割方法以及基于特定理論的分割方法等。由于醫(yī)學(xué)圖像的復(fù)雜性和多樣性,上述算法的精度都有待提高,仍處于研究階段,實現(xiàn)真正臨床應(yīng)用的案例較少。
3.樣本采集
對需要CAD分析的區(qū)域進行識別和采樣,主要包括腫瘤疾病的可疑癌灶、乳腺微鈣化灶、結(jié)腸息肉等可疑異常區(qū)域。樣本采集要求CAD系統(tǒng)具有較高的敏感性,而對特異性要求較低。后續(xù)對所采集樣本的圖像特征提取和分析將提高CAD系統(tǒng)的特異性。
4.圖像特征提取
基本所有CAD系統(tǒng)均使用向量空間模型對采集樣本進一步分析,即對上一步采集的所有病灶的圖像特征進行提取和選擇。常用圖像特征包括圖像信號強度相關(guān)統(tǒng)計量、邊緣特征、紋理特征及分形維度等,反映圖像信號強度、病灶邊緣以及組織紋理等特征,反映血管或病灶灌注情況的動態(tài)增強成像的定量和半定量參數(shù)也是常用的圖像特征。圖像特征的提取和選擇是CAD分析中的關(guān)鍵步驟,直接影響CAD系統(tǒng)的診斷效能。提取圖像特征并非越多越好,與之相反,選擇性地利用高效參數(shù)可減少CAD系統(tǒng)的運行時間,提高病灶檢出和診斷效率。
5.分類器
CAD將提取的圖像特征用向量進行表示,即特征向量。CAD使用分類器對目標病灶的圖像特征向量進行分類,通過對機器學(xué)習(xí)算法的培訓(xùn)和測試對其分類,最終建立某種疾病的CAD系統(tǒng)。
近年來,隨著機器學(xué)習(xí)理論的發(fā)展,機器學(xué)習(xí)算法獲得了長足地進步。根據(jù)算法功能和形式的類似性,可以將機器學(xué)習(xí)算法分為回歸算法、基于實例的算法、正規(guī)化算法、決策樹學(xué)習(xí)、貝葉斯方法、基于核的算法、聚類算法、關(guān)聯(lián)規(guī)則學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、降低維度算法和集成算法。其中,人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)具有自學(xué)習(xí)、自適應(yīng)等特點,同時還具有并行處理、分布式存儲和容錯性等優(yōu)勢,是目前應(yīng)用較為廣泛的學(xué)習(xí)算法[3]。但是人工學(xué)習(xí)ANN網(wǎng)絡(luò)訓(xùn)練時間較長,同時可解釋性相對較差。支持向量機(support vector machine,SVM)和隨機森林(random forest,RF)技術(shù)被逐漸應(yīng)用于CAD研究,并獲得滿意結(jié)果,前者在解決小樣本、非線性和高維的機器學(xué)習(xí)問題中表現(xiàn)出優(yōu)勢[4],而后者無需對輸入變量進行過多處理,因此在處理大數(shù)據(jù)集時顯現(xiàn)出明顯優(yōu)勢[5]。
然而,上述學(xué)習(xí)方法均屬于淺層機器學(xué)習(xí)算法,雖然多數(shù)研究取得了較為滿意的研究結(jié)果,但是淺層學(xué)習(xí)方法由于用于分類器訓(xùn)練的樣本有限,使其對復(fù)雜分類問題的泛化能力受到限制。2006年Hinton等[6]在《Science》發(fā)表了一篇關(guān)于深度學(xué)習(xí)的研究,探索了深度學(xué)習(xí)算法在CAD系統(tǒng)的應(yīng)用,后續(xù)有研究團隊嘗試應(yīng)用深度學(xué)習(xí)來解決醫(yī)學(xué)圖像的分析問題。
CAD可應(yīng)用于多種影像技術(shù)的疾病診斷,主要集中在乳腺鉬靶檢查、胸部CT肺結(jié)節(jié)檢出及CT虛擬結(jié)腸內(nèi)鏡(CT colonography,CTC)息肉檢出等領(lǐng)域[7]。隨著計算機算法的不斷發(fā)展,前列腺多參數(shù)MR成像(multiparametric MRI,mpMRI)、乳腺MRI及肝臟CT等領(lǐng)域的CAD應(yīng)用正逐漸成為計算機醫(yī)學(xué)圖像分析的新研究熱點。
1.肺結(jié)節(jié)CAD
胸片影像分析是CAD最早應(yīng)用的領(lǐng)域[8]。然而,由于胸片上支氣管血管束、肋骨等正常解剖結(jié)構(gòu)的重疊,容易導(dǎo)致對早期肺癌病變和小結(jié)節(jié)灶等病變的漏診。隨著多排螺旋CT的發(fā)展,美國國家肺癌篩查試驗(national lung screening trial,NLST)等多項隨機對照研究證實:相對于胸片,對特定人群進行低劑量CT(low-dose CT,LDCT)肺癌篩查能夠顯著降低肺癌的死亡率[9]。然而胸部LDCT產(chǎn)生的大量影像數(shù)據(jù),增加了肺癌篩查的臨床工作量;同時,早期肺癌的檢出具有很強的經(jīng)驗依賴性,因此基于胸部LDCT的肺結(jié)節(jié)CAD成為近幾年研究的熱點。
由于部分實性結(jié)節(jié)和磨玻璃結(jié)節(jié)的CAD檢出仍然有技術(shù)難度[10],因此目前肺結(jié)節(jié)CAD主要用于實性肺結(jié)節(jié)的篩查檢出和診斷預(yù)測。提高肺結(jié)節(jié)檢出敏感性、降低假陽性率、結(jié)節(jié)類型診斷以及系統(tǒng)算法優(yōu)化是目前肺結(jié)節(jié)CAD研究的重點[7]。研究證實,聯(lián)合CAD系統(tǒng)可顯著提高肺結(jié)節(jié)檢測的敏感性,但伴隨而來的假陽性率增高成為該技術(shù)的難點。導(dǎo)致假陽性的原因主要包括肺部正常結(jié)構(gòu)(血管、支氣管等)和呼吸運動偽影等。近幾年,機器算法的改進明顯提高了肺結(jié)節(jié)CAD的效能,可在保持一定敏感性的前提下有效降低假陽性率[11]。除此之外,應(yīng)用機器學(xué)習(xí)算法對肺結(jié)節(jié)的紋理特征、邊緣特征和形態(tài)特征等參數(shù)進行分析,可建立肺結(jié)節(jié)預(yù)測模型。
2.乳腺癌CAD
基于鉬靶的乳腺癌篩查是目前CAD最廣泛的應(yīng)用領(lǐng)域,1998年,美國R2公司研發(fā)的乳腺鉬靶CAD系統(tǒng)是首個獲得FDA批準上市的CAD系統(tǒng)。目前已有多種CAD系統(tǒng)被應(yīng)用于乳腺癌鉬靶篩查,其效能已被幾個大型前瞻性研究所證實[12-13]。
乳腺CAD研究熱點主要集中在提高腫塊和鈣化灶的檢出準確性,而檢出效能主要受乳腺腺體類型和腫瘤組織學(xué)類型的影響[14-15]。乳腺CAD對微鈣化灶的檢出效能較好,敏感度約為86%~99%[15-16],而對腫塊的檢出率因受腺體密度的影響而相對較低,約83%~90%[17],有待進一步提高。
20世紀90年代初,隨著超聲和MR成像技術(shù)在乳腺癌檢出中的廣泛應(yīng)用,出現(xiàn)了超聲或MRI乳腺CAD。形態(tài)學(xué)分析是乳腺超聲CAD的關(guān)鍵依據(jù),包括形狀、分葉、左右徑/前后徑以及后方聲影等參數(shù)[18]。加拿大Medipattern公司研發(fā)的B-CAD是首個商用乳腺超聲CAD軟件。相對于乳腺鉬靶和超聲CAD,乳腺MR-CAD則依據(jù)增強掃描時病灶攝取對比劑的藥代動力學(xué)定量和半定量參數(shù)進行病灶的檢出和定性,而非單純的依賴形態(tài)學(xué)參數(shù)[19]。目前,2004年由Comfirma公司研發(fā)的Cadstream是首個商用的乳腺MR-CAD軟件。
3.CT結(jié)腸成像CAD
有證據(jù)顯示早期檢出并切除結(jié)腸息肉可有效降低結(jié)腸癌的發(fā)病率[20],而CT結(jié)腸成像又稱CT虛擬結(jié)腸鏡(CTC)檢查是檢出結(jié)腸息肉的首選無創(chuàng)性檢查手段[21]。但有研究顯示CTC對于結(jié)腸息肉的檢出效能欠佳[22],考慮可能原因是由于CTC大量的圖像數(shù)據(jù)降低了結(jié)腸息肉的檢出效能。應(yīng)用CAD系統(tǒng)可有效解決大量圖像數(shù)據(jù)對病灶檢出效能的影響,在減少CTC圖像分析時間的同時,提高結(jié)腸息肉檢出的敏感性。由于結(jié)腸息肉CAD檢出模型相對簡單,因此CTC-CAD發(fā)展迅速,已有多家公司研發(fā)出商用CTC-CAD軟件[23]。
CTC-CAD主要目的是減少診斷時間,同時提高對非典型形態(tài)或非好發(fā)部位病灶的檢出,從而提高CTC對結(jié)腸息肉和結(jié)腸癌的檢出效能。盡管目前已有商用CTC-CAD軟件研發(fā)成功,但軟件的臨床應(yīng)用及診斷效能仍有待大規(guī)模隨機臨床試驗的驗證,尤其是對CTC-CAD臨床角色的研究,使CAD在CTC應(yīng)用領(lǐng)域的效能得到最大的發(fā)揮。
4.前列腺mpMRI-CAD
相對于上述3種應(yīng)用領(lǐng)域,CAD在前列腺癌診斷領(lǐng)域的應(yīng)用起步較晚。1994年Snow等[24]首先將ANN應(yīng)用于前列腺癌CAD的研究,但主要基于臨床數(shù)據(jù),如年齡、直腸指診、血清前列腺特異性抗原(prostatic specific antigen,PSA)等指標進行預(yù)測,診斷效能欠佳,盡管后期整合入前列腺超聲數(shù)據(jù),CAD效能仍未有明顯提高。隨著MR成像技術(shù)的發(fā)展,mpMRI在前列腺癌診斷中的地位不斷提高[25-26],基于mpMRI的前列腺癌CAD系統(tǒng)大量涌現(xiàn),并獲得了較為滿意的研究結(jié)果。
目前,由于對前列腺臨床顯著癌的篩查和預(yù)后評估仍缺乏有效的解決方案,隨著機器算法的發(fā)展,CAD為上述問題的解決提供了新思路。建立基于mpMRI的前列腺CADe預(yù)測模型,提高mpMRI對前列腺臨床顯著癌的檢出效能,進而有效彌補前列腺癌傳統(tǒng)篩查手段——血清PSA特異度較低的問題;亦或是建立基于mpMRI和臨床數(shù)據(jù)的前列腺CADx系統(tǒng),對前列腺癌的侵襲性和預(yù)后進行預(yù)測和評估,建立前列腺癌預(yù)后預(yù)測模型,從而為前列腺癌臨床處理方案的制定提供依據(jù)。
總體而言,CAD目前還處于研究的初步臨床應(yīng)用階段,檢出和預(yù)測效能以及臨床應(yīng)用流程均有待進一步探索。CAD為諸多臨床問題的解決提供了新的思路和方向,是影像信息學(xué)發(fā)展的方向之一。CAD因其可精確定量、重復(fù)性好的優(yōu)勢,未來將可能被應(yīng)用于更多疾病的診斷,其針對數(shù)據(jù)大、問題簡單的情況,做出定量診斷、建立預(yù)測模型等有重要價值。
受到輸入?yún)?shù)質(zhì)量控制、圖像分割和機器學(xué)習(xí)算法以及訓(xùn)練和測試數(shù)據(jù)的選擇的限制,CAD對于醫(yī)學(xué)圖像分析的效能尚難達到有經(jīng)驗的診斷者的效能。CAD的發(fā)展仍需要工程研發(fā)人員和醫(yī)學(xué)工作者的多方面協(xié)作,優(yōu)化圖像處理、機器學(xué)習(xí)和醫(yī)學(xué)應(yīng)用效能研究。總之,CAD是一個跨學(xué)科的研究領(lǐng)域,積極推動CAD發(fā)展將會促進多領(lǐng)域多學(xué)科的發(fā)展。
[1] Lodwick GS.Computer-aided diagnosis in radiology:a research plan[J].Invest Radiol,1966,1(1):72-80.
[2] Giger ML,Chan HP,Boone J.Anniversary paper:history and status of CAD and quantitative image analysis: the role of medical physics and AAPM[J].Medi Phys,2008,35(12):5799-5820.
[3] 呂冬姣,張玨,王霄英,等.人工神經(jīng)網(wǎng)絡(luò)在前列腺癌診斷中的應(yīng)用[J].北京大學(xué)學(xué)報(醫(yī)學(xué)版),2009,41(4):469-473.
[4] Data Min,Knowl Disc,Burges CJC.A tutorial on support vector machines for pattern recognition[J].Data Min Knowl Disc,1998,2(2):121-167.
[5] Criminisi A,Shotton J,Konukoglu E.Decision forests:a unified framework for classification,regression,density estimation,manifold learning and semi-supervised learning[J].Foundations and Trends in Computer Graphics and Vision,2011,7(2-3):81-227.
[6] Hinton GE,Salakhutdinov RR.Reducing the dimensionality of data with neural networks[J].Science,2006,313(5786):504-507.
[7] van Ginneken B,Schaefer-Prokop CM,Prokop M.Computer-aided diagnosis:how to move from the laboratory to the clinic[J].Radiology,2011,261(3):719-732.
[8] Yerushalmy J.The statistical assessment of the variability in observer perception and description of roentgenographic pulmonary shadows[J].Radiol Clin North Am,1969,7(3):381-392.
[9] Pinsky PF,Church TR,Izmirlian G,et al.The national lung screening trial:results stratified by demographics,smoking history,and lung cancer histology[J].Cancer,2013,119(22):3976-3983.
[10] Lee N,Laine AF,Marquez G,et al.Potential of computer-aided diagnosis to improve CT lung cancer screening[J].IEEE,2009,2(1):136-146.
[11] Tan M,Deklerck R,Jansen B,et al.A novel computer-aided lung nodule detection system for CT images[J].Med Phys,2011,38(10):5630-5645.
[12] Dean JC,Ilvento CC.Improved cancer detection using computer-aided detection with diagnostic and screening mammography: prospective study of 104 cancers[J].AJR,2006,187(1):20-28.
[13] Noble M,Bruening W,Uhl S,et al.Computer-aided detection mammography for breast cancer screening:systematic review and meta-analysis[J].Arch Gynecol Obstetr,2009,279(6):881-890.
[14] Brem RF,Hoffmeister JW,Zisman G,et al.A computer-aided detection system for the evaluation of breast cancer by mammographic appearance and lesion size[J].AJR,2005,184(3):893-896.
[15] Birdwell RL,Ikeda DM,O'Shaughnessy KF,et al.Mammographic characteristics of 115 missed cancers later detected with screening mammography and the potential utility of computer-aided detection[J].Radiology,2001,219(1):192-202.
[16] Warren Burhenne LJ,Wood SA,D'Orsi CJ,et al.Potential contribution of computer-aided detection to the sensitivity of screening mammography[J].Radiology,2000,215(2):554-562.
[17] Wei J,Sahiner B,Hadjiiski LM,et al.Computer-aided detection of breast masses on full field digital mammograms[J].Med Phys,2005,32(9):2827-2838.
[18] Shen WC,Chang RF,Moon WK,et al.Breast ultrasound computer-aided diagnosis using BI-RADS features[J].Acad Radiol,2007,14(8):928-939.
[19] Kurz KD,Steinhaus D,Klar V,et al.Assessment of three different software systems in the evaluation of dynamic MRI of the breast[J].Eur J Radiol,2009,69(2):300-307.
[20] Winawer S,Fletcher R,Rex D,et al.Colorectal cancer screening and surveillance:clinical guidelines and rationale-Update based on new evidence[J].Gastroenterol,2003,124(2):544-560.
[21] Yee J,Akerkar GA,Hung RK,et al.Colorectal neoplasia:performance characteristics of CT colonography for detection in 300 patients[J].Radiology,2001,219(3):685-692.
[22] Rockey DC,Paulson E,Niedzwiecki D,et al.Analysis of air contrast barium enema,computed tomographic colonography,and colonoscopy: prospective comparison[J].Lancet (London,England),2005,365(9456):305-311.
[23] Regge D,Halligan S.CAD:how it works,how to use it,perfor-mance[J].Eur J Radiol,2013,82(8):1171-1176.
[24] Snow PB,Smith DS,Catalona WJ.Artificial neural networks in the diagnosis and prognosis of prostate cancer:a pilot study[J].J Urol,1994,152(5 Pt 2):1923-1926.
[25] Panebianco V,Barchetti F,Sciarra A,et al.Multiparametric magnetic resonance imaging vs standard care in men being evaluated for prostate cancer:a randomized study[J].Urol Oncol,2015,33(1):171-177.
[26] Futterer JJ,Briganti A,De Visschere P,et al.Can clinically significant prostate cancer be detected with multiparametric magne-tic resonance imaging? A systematic review of the literature[J].Eur Urol,2015,68(6):1045-1053.
100034 北京, 北京大學(xué)第一醫(yī)院醫(yī)學(xué)影像科
高歌(1988-),女,河南鄭州人,博士研究生,主要從事MRI新技術(shù)和影像信息學(xué)研究。
王霄英,E-mail;cjr.wangxiaoying@vip.163.com
R814.4; R445.2
A
1000-0313(2016)12-1127-03
10.13609/j.cnki.1000-0313.2016.12.004
2016-10-20
2016-10-08)