聶生東,魏傳令,張小兵
(上海理工大學 健康科學與工程學院,上海 200093)
目前,乳腺癌已超越肺癌,成為全球第一大癌癥,其發(fā)病率和死亡率在女性中均為首位[1]。從八十年代至今,乳腺癌發(fā)病率在中國持續(xù)快速上升,同時患病群體表現(xiàn)出年輕化的趨勢。乳腺癌嚴重危害女性健康,早診斷、早治療能夠提高乳腺癌患者生存率。動態(tài)對比增強磁共振成像
(dynamic contrast enhancement magnetic resonance imaging,DCE-MRI)可生成多序列、高分辨率影像,能夠清晰地分辨乳腺腺體、脂肪、病灶組織,對乳腺癌的診斷具有較高的準確性,可以為乳腺癌檢出、分子分型、預測和預后評估等提供參考依據(jù),因此在乳腺癌影像檢查方面得到了廣泛的應用[2]。
在DCE-MRI 檢查中,每病例總計生成圖片近千張,各序列示例見圖1。如此巨量的圖片只靠醫(yī)生的專業(yè)技術(shù)和主觀經(jīng)驗進行判斷,不僅速度慢,還容易產(chǎn)生誤診和漏診。因此,計算機輔助檢測(computer aided detection,CADe)系統(tǒng)正逐漸應用到乳腺癌檢測任務中,協(xié)助醫(yī)生進行快速診斷。乳腺癌的準確檢測是CADe 系統(tǒng)中至關(guān)重要的一步,不僅可以標記影像中的乳腺癌區(qū)域,有效減輕醫(yī)生的工作負擔,提升醫(yī)療服務質(zhì)量,還可以為后續(xù)的乳腺癌分子分型、預后評估等提供數(shù)據(jù)基礎(chǔ)。此外,CADe 系統(tǒng)還可以對經(jīng)驗不足的醫(yī)生起到提示參考的作用,在一定程度上能解決偏遠地區(qū)醫(yī)療資源匱乏的問題。
圖1 每病例包含的部分MRIFig.1 Part of MR images included in each case
為了高效準確的檢測乳腺癌,研究者們提出了許多檢測方法,基本流程如圖2 所示:首先對原始圖像進行預處理,分割出圖像中的乳腺區(qū)域;再利用傳統(tǒng)圖像處理方法或深度學習方法檢測出可疑的乳腺癌區(qū)域;最后得出檢測結(jié)果。傳統(tǒng)圖像處理及深度學習方法均取得了較好的效果,也有研究將兩者組合應用[3-4]。Rezaei[5]對所有乳腺成像方式的乳腺癌檢測分割、分類方法進行概括總結(jié),但是沒有詳細介紹MRI 計算機輔助檢測方法。Chan[2]綜述了基于人工智能的計算機輔助診斷(computer-aided diagnosis,CADx)系統(tǒng)在乳腺癌方面的最新成果,但是對乳腺MRI 方面的介紹主要集中在良惡性分類及乳腺分割等,依然沒有對乳腺癌檢測方法進行總結(jié)。因此,本文通過研讀大量相關(guān)文獻,總結(jié)了近年來國內(nèi)外基于MRI 的乳腺癌計算機輔助檢測方法,分別從傳統(tǒng)方法及深度學習方法兩個方面進行綜述;最后對乳腺癌檢測技術(shù)的現(xiàn)有問題和未來發(fā)展方向進行總結(jié)與展望,為正在探索乳腺癌檢測領(lǐng)域的研究者們提供一定的參考。
圖2 乳腺癌檢測流程Fig.2 Breast cancer detection process
在磁共振圖像中,乳腺癌常表現(xiàn)為類圓形、分葉狀或不規(guī)則形的區(qū)域,區(qū)域邊緣特點為光滑、不規(guī)則或星芒狀。在磁共振的不同序列中,乳腺癌區(qū)域的信號特點也不同:在T1WI 中多表現(xiàn)為等或低信號(圖像中相應區(qū)域灰度值較低),在T2WI 抑脂序列及動態(tài)增強序列中則表現(xiàn)為高信號(圖像中相應區(qū)域灰度值較高)。傳統(tǒng)乳腺癌檢測步驟如圖3 所示,通常包含圖像預處理、乳腺區(qū)域分割、可疑腫瘤區(qū)域提取、特征提取和分類判斷等部分。圖像預處理的目的是去除噪聲及偽影[6-7]、增強腫瘤特征以及標準化不同數(shù)據(jù)源圖像。乳腺區(qū)域分割的目的是提取乳腺區(qū)域,去除其他區(qū)域的組織、器官等,可以極大提升檢測結(jié)果的可靠性。傳統(tǒng)乳腺癌檢測方法應用于腫瘤區(qū)域、特征的提取和分類判斷等步驟,主要包括閾值法、活動輪廓模型、聚類法、概率圖模型以及其他機器學習方法等,接下來將逐步進行闡述。
圖3 傳統(tǒng)乳腺癌檢測方法流程Fig.3 Detection of breast cancer by traditional method
可疑腫瘤區(qū)域提取最常見方法是閾值法。閾值法主要通過比較腫瘤與背景像素灰度值的差異來提取目標區(qū)域,為了獲得更好的分割效果,后續(xù)常使用形態(tài)學處理或區(qū)域生長法優(yōu)化目標區(qū)域的邊緣[8]。早期的研究大多依賴于手動設置閾值大小及種子點位置,效率較低。因此,研究者開始尋求自動化閾值選取及種子點確定方法[9]。例如,大津法不受圖像亮度和對比度的影響,被廣泛應用到可疑腫瘤區(qū)域提取任務中[10]。由于腫瘤形狀通常呈類圓形,血管等組織呈線條形,通過判斷幾何特征來刪除線條形區(qū)域,可以減少部分假陽性[11]。需要注意的是,形態(tài)學算子半徑過大可能導致過分割。此外,基于數(shù)學形態(tài)學的分水嶺算法與自適應閾值法相結(jié)合可以有效抑制圖像過分割現(xiàn)象[12],但是該算法對噪聲點或者其他干擾因素非常敏感。閾值法的優(yōu)點是分割速度快,計算效率高,但這些方法僅考慮像素點的灰度特征,很少考慮空間特征。若腫瘤區(qū)域灰度級與其他組織差異性不大,常會出現(xiàn)錯分割的情況。因此,閾值法常與其他方法組合使用,以獲得更好的可疑腫瘤區(qū)域提取效果。
活動輪廓模型作為一種重要的圖像分割方法,也常被應用于乳腺癌檢測任務中。該方法通過最小化能量泛函,使圖像中的初始曲線逐步運動到目標對象的邊界,獲得可疑腫瘤區(qū)域輪廓[13]。相較于閾值法,該方法的優(yōu)勢是邊緣分割精度更高,還可以結(jié)合先驗知識,如形狀、灰度分布,方便的構(gòu)造合適的能量最小化框架,對后續(xù)的目標分析及識別有重要意義。水平集方法屬于幾何活動輪廓模型,可對3D 圖像進行分割,根據(jù)腫瘤體積變化在迭代過程中添加3D 形狀加權(quán)值,可以加快收斂速度,還能消除背景噪聲,使分割輪廓更接近實際腫瘤邊緣[14]。但是當圖像的模糊程度和噪聲密度較大時,該方法的特異性顯著降低。
聚類方法也可用于乳腺癌檢測任務中。與閾值法不同,基于聚類的方法更多的是針對每個像素與其相鄰像素的關(guān)系而運行的。在乳腺癌檢測任務中,常見的聚類方法有均值漂移[15]、K 均值聚類[16]、模糊C 均值聚類(fuzzy C-means,FCM)等。均值漂移和K 均值聚類方法計算開銷較大,不能快速地對整個MRI 序列進行檢測。模糊C 均值聚類檢測速度稍快,但是得到的結(jié)果常常包含多個假陽性區(qū)域。因此,Huang 等[17]基于FCM 的結(jié)果和形態(tài)學特征,利用Hessian 濾波器進一步從可疑區(qū)域中提取腫瘤組織,去除大部分假陽性區(qū)域。接下來Shokouhi 等[18]在此基礎(chǔ)上結(jié)合區(qū)域生長,獲得更準確的腫瘤區(qū)域。Sun 等[19]則提出了一種基于簡單線性迭代聚類和DBSCAN 聚類的半監(jiān)督乳腺腫瘤分割方法,對較大的腫瘤擁有較好的檢測效果,但是提取微小腫瘤的效果不佳。
此外,還有一些基于概率圖模型及其他方法的研究。如Gubern-Mérida 等[6]利用基于概率地圖集提供的空間信息對乳腺進行分割,再根據(jù)體素相對增強特征對病變進一步區(qū)分。Cetinel 等[20]使用馬爾可夫隨機場(Markov random field,MRF)來提高大津法的分割效果。此類方法計算過程復雜,且先驗知識的準確性對分割結(jié)果有著很大的影響。馮寶等[21]結(jié)合MRF 和活動輪廓模型方法,綜合考慮灰度區(qū)域、邊緣以及乳腺癌的空間聚類特性,在腫塊型和非腫塊型乳腺癌的檢測中均得到較好的結(jié)果。
為了去除假陽性區(qū)域,需要對候選區(qū)域的圖像特征進行提取和分類。理想的特征組合應該可以準確表現(xiàn)出腫瘤及非腫瘤區(qū)域之間的差異,特征維數(shù)盡可能少。在DCE-MRI 中,常見的圖像特征可分為四類:形態(tài)學特征、紋理特征、血流動力學特征和藥代動力學特征。其中,最為常用的是形態(tài)學特征和紋理特征,這兩種特征可以較好地表征出腫瘤的形狀、大小、灰度分布等特點,對腫瘤的良惡性判斷具有重大指導作用。動力學特征是DCE-MRI 專有的特征,表現(xiàn)的是圖像序列間的變化特性。血流動力學特征一般是從每個體素的時間-強度曲線中提取的最大增強(ME)、達峰時間(TP)、吸收率(UR)、清除率(WR)和曲線下面積等特征。因為腫瘤的血流動力學特征與正常腺體有很大不同,所以此類特征對腫瘤的分類效果最好。藥代動力學特征與血流動力學類似,更多體現(xiàn)的是造影劑在腫瘤血管中的變化過程,對腫瘤分類的效果也很出色。
雖然分類效果主要與特征的選擇和所用數(shù)據(jù)集的質(zhì)量有關(guān),但是也不能忽視分類器的選擇。常用的分類器有支持向量機、K-最近鄰、Adaboost、人工神經(jīng)網(wǎng)絡、貝葉斯算法、決策樹、隨機森林等。通常實驗中都會對這一系列分類器的效果進行對比,然后選擇最合適的分類器進行特征分類。目前沒有一種特定的分類器在所有數(shù)據(jù)集和特征組合中表現(xiàn)均為最佳。
對傳統(tǒng)乳腺癌檢測方法的總結(jié)如表1 所示。上述研究表明,傳統(tǒng)乳腺癌檢測方法側(cè)重點在于人工設計與乳腺癌最相關(guān)的特征,其優(yōu)勢是不需要大量數(shù)據(jù)進行訓練就能實現(xiàn)快速準確的檢測,結(jié)合臨床先驗知識,結(jié)果可解釋性強,運行過程明確??偨Y(jié)傳統(tǒng)乳腺癌檢測方法性能,如表2 所示。然而,傳統(tǒng)乳腺癌檢測方法還面臨一些難題:第一,在不同設備及醫(yī)學掃描參數(shù)下生成的圖像,其圖像特征也會有很大的變化,因此傳統(tǒng)檢測方法在不同數(shù)據(jù)庫之間會表現(xiàn)出很大差距,得到的結(jié)果也難以互相比較優(yōu)劣;第二,使用數(shù)據(jù)量過少,導致模型的魯棒性較差,泛化能力弱;第三,人工設計的特征對邊界清晰、與周圍組織灰度對比明顯的病灶具有很好的檢測效果,但是對邊界模糊不規(guī)則的病灶檢測效果較差,具有一定的局限性;第四,小體積腫瘤難以被檢測,主要原因是小體積腫瘤攜帶的信息較少,由此導致特征表達能力偏弱。因此,未來在研究DCE-MRI 的傳統(tǒng)乳腺癌檢測算法時,要權(quán)衡各部分方法的利弊,尋找更相關(guān)的特征組合,設計出檢測精度更高的方法。
表1 基于DCE-MRI 的傳統(tǒng)乳腺癌檢測方法優(yōu)缺點總結(jié)Tab.1 Advantages and disadvantages of traditional breast cancer detection methods based on DCE-MRI
表2 傳統(tǒng)乳腺癌檢測方法評價結(jié)果Tab.2 Evaluation results of traditional breast cancer detection methods
傳統(tǒng)檢測算法暫時無法滿足臨床需求。近年來,深度學習技術(shù)飛速發(fā)展,不僅在圖像分類任務中表現(xiàn)優(yōu)秀,在目標檢測和語義分割任務中也發(fā)揮出強大的性能。在基于深度學習的乳腺癌檢測領(lǐng)域,腫瘤檢測和分割幾乎融為了一體,是近年來研究的重點之一。與傳統(tǒng)方法不同,深度學習使用網(wǎng)絡模型對大量數(shù)據(jù)進行訓練,以實現(xiàn)自動提取腫瘤的特征,從而對腫瘤的位置及類別進行判斷,基本流程如圖4 所示:首先是數(shù)據(jù)預處理階段,包括對原始乳腺MRI 的預處理和相應腫瘤區(qū)域的標簽勾畫;然后將數(shù)據(jù)集劃分為訓練集、驗證集和測試集,劃分方法主要有留出法、K 折交叉驗證法等。接下來是模型的搭建及訓練階段,訓練集用來對模型進行訓練,驗證集用來調(diào)整超參數(shù)以及選擇更優(yōu)秀的模型,測試集則是用來測試選定的模型對新樣本的檢測能力,進而評估模型的泛化能力。根據(jù)檢測策略的不同,深度學習檢測方法可分為三種:基于候選區(qū)域的乳腺癌檢測、基于全卷積網(wǎng)絡的乳腺癌檢測、基于弱監(jiān)督學習的乳腺癌檢測。
圖4 基于深度學習的乳腺癌檢測流程Fig.4 Detection of breast cancer by deep learning
基于候選區(qū)域的乳腺癌檢測方法的步驟一般分為三步:首先,利用選擇性搜索、區(qū)域建議網(wǎng)絡(region proposal network,RPN)、ROI 池化層等方法從輸入圖像中預測乳腺腫瘤可能出現(xiàn)的位置,生成若干個候選區(qū)域;然后利用卷積神經(jīng)網(wǎng)絡從候選區(qū)域中提取特征;最后利用分類器對特征進行分類。典型代表為R-CNN 系列模型,在乳腺鉬靶圖像檢測任務中應用較多[22-23],在DCEMRI 中較為少見。該模型憑借卷積神經(jīng)網(wǎng)絡強大的分類能力對候選區(qū)域進行判斷,從而得出最符合目標的邊界框。Jiao 等[24]利用Faster R-CNN 對DCE-MRI 的單張圖片進行腫瘤檢測與分類,如圖5所示。該實驗檢測準確率較高,但不能滿足檢測實時性的需求。其原因是該模型在提取候選區(qū)域的過程中進行大量的重復迭代計算,導致檢測速度較慢。同時,候選區(qū)域通常比原圖像小得多,其尺寸也會限制感知區(qū)域的大小,導致模型只能提取到局部特征,降低了檢測性能。此外,算法每個階段需要分別進行訓練或者微調(diào),步驟繁瑣,不利于取得最優(yōu)解。
圖5 文獻[21]所用Faster R-CNN 網(wǎng)絡模型Fig.5 Faster R-CNN network model used in reference[21]
針對RCNN 普遍存在的缺乏實時性的問題,YOLO 系列模型[25]刪除了區(qū)域建議網(wǎng)絡,轉(zhuǎn)而采用預定義網(wǎng)格等形式將圖片進行區(qū)域劃分,然后輸入到網(wǎng)絡中。該方法檢測速度較RCNN 算法提升40 倍以上,在乳腺鉬靶圖像及MRI 中都有較好的表現(xiàn)。如Al-masni 等[26]利用基于Darknet 的YOLO網(wǎng)絡對600 張乳腺X 光片進行良惡性腫瘤位置檢測,在置信概率設置為0.2 的情況下得到的準確率為96.33%。然而,該模型難以對小體積腫瘤進行檢測,其原因是預定義網(wǎng)格代替候選區(qū)域生成的方法過于粗糙,導致前期網(wǎng)絡訓練時很難收斂,對小目標的檢測不敏感。馬偉等[27]針對乳腺MRI腫瘤區(qū)域相對較小、腫塊型和非腫塊型腫瘤之間形態(tài)學差異大的問題,提出了一套粗檢測細分割的二階段深度學習模型。首先運用YOLOv2 網(wǎng)絡進行粗檢測,得到可疑的腫瘤區(qū)域;然后對該區(qū)域運用SegNet 網(wǎng)絡進行精細分割,從而實現(xiàn)算法最優(yōu)的性能。與單一模型相比,這種利用不同網(wǎng)絡模型的多階段方法能夠更好地發(fā)掘影像中的信息,在檢測結(jié)果上表現(xiàn)得更加優(yōu)秀。為了增強小體積腫瘤檢測性能,Adachi 等[28]第一次將RetinaNet應用到乳腺癌檢測任務中,采用特征金字塔結(jié)構(gòu)以及Focal Loss 函數(shù)使模型在訓練時更關(guān)注難分類、面積小的腫瘤區(qū)域,極大地提高了檢測精度。接下來的研究中,Ayatollahi[29]將RetinaNet 應用到3D 乳腺MRI 序列上,在考慮了三維形態(tài)和動態(tài)信息后,靈敏度和準確率進一步提升。
全卷積網(wǎng)絡(fully convolutional network,FCN)是一種卷積神經(jīng)網(wǎng)絡,可以在無全連接層的情況下對圖像中的每個像素點進行分類及預測,實現(xiàn)對圖像的端到端分割[30]。然而,早期的全卷積網(wǎng)絡只是簡單地使用最后一個反卷積層將特征圖上采樣到輸入圖像的大小,損失大量形狀和位置信息,無法對腫瘤進行準確的檢測。U-net 是由全卷積網(wǎng)絡改進而來的一種編碼器-解碼器結(jié)構(gòu)的語義分割網(wǎng)絡[31],在醫(yī)學圖像分割領(lǐng)域取得了優(yōu)秀的成績,在樣本較少的情況下依然有較好的表現(xiàn),結(jié)構(gòu)如圖6 所示。從結(jié)構(gòu)上看,U-net 在全卷積網(wǎng)絡中添加了跳躍連接結(jié)構(gòu),利用拼接的方法將U 型網(wǎng)絡的上下文信息連接起來,保證最后的特征圖將底層語義信息和高層邊緣位置信息充分融合,因此分割精度較普通全卷積網(wǎng)絡更高。Zhang等[32]提出了一個掩膜引導的多階段學習框架,利用三個U-net 逐步檢測并分割乳腺腫瘤。實驗中將乳腺區(qū)域掩膜與對比后圖像、差分圖像融合成三通道圖像輸入到U-net 中,這種軟掩膜策略可以避免因乳腺分割不準確而引發(fā)的誤檢。此外,作者提出一種基于Dice 系數(shù)和靈敏度的損失函數(shù),使網(wǎng)絡高度關(guān)注腫瘤像素,較好地緩解了像素類別不平衡的問題。由于訓練U-net 模型非常費時費力,Lu 等[33]將遷移學習方法引入到訓練過程中,用預訓練乳腺圖像的分類網(wǎng)絡來初始化U-net 分割網(wǎng)絡,得到了更準確的乳腺病灶分割結(jié)果。遷移學習的應用為分割網(wǎng)絡參數(shù)初始化提供了便利,使其更容易聚焦于腫瘤區(qū)域,提高分割準確率。
圖6 U-net 模型結(jié)構(gòu)Fig.6 U-net model structure
隨著深度學習技術(shù)的發(fā)展,研究者們圍繞Unet 的改進做了大量的工作,包括對輸入數(shù)據(jù)的形式及數(shù)據(jù)流向的改進,如2D 圖像輸入改為3D 圖像、更多的跳躍連接路徑;對網(wǎng)絡結(jié)構(gòu)進行的改進,如注意力機制、殘差模塊、特征融合、空洞卷積層等;對損失函數(shù)進行的改進,如Dice 損失函數(shù)的改進等。在乳腺癌檢測任務中,研究者可沿著這些方向繼續(xù)進行深入的研究。此外,將Unet 與傳統(tǒng)圖像處理方法結(jié)合也是當前研究的熱門方向。
前述的深度學習算法都屬于監(jiān)督學習,極其依賴大型、精確標注的訓練數(shù)據(jù)庫,數(shù)據(jù)庫樣本越多,檢測效果越好。然而在醫(yī)學圖像領(lǐng)域,制作一個高質(zhì)量數(shù)據(jù)集是比較耗時費力的,需要消耗大量人工成本。為了克服數(shù)據(jù)標注成本過大的難題,研究者們開始嘗試基于弱監(jiān)督學習的乳腺癌檢測方法。此類方法的主要挑戰(zhàn)是如何將弱標簽(如圖像級標簽、邊界框標簽)與圖像中腫瘤區(qū)域的像素建立起相關(guān)的聯(lián)系。
基于弱監(jiān)督學習的檢測算法仍可以遵循從可疑區(qū)域提取到假陽性檢測的流程,Amit 等[34]采用一種無監(jiān)督的交叉顯著性檢測方法,結(jié)合乳腺的對稱性和腫瘤的非對稱性來識別圖像中的顯著性區(qū)域,能夠較好地檢測出成對器官中的腫瘤區(qū)域。然而該方法會產(chǎn)生大量假陽性區(qū)域,因此需要再將提取的區(qū)域輸入到卷積神經(jīng)網(wǎng)絡中進行分類,從而完成腫瘤的自動檢測定位,訓練過程中只需要圖像級標簽。
在深度學習分類網(wǎng)絡模型中,卷積層的輸出已經(jīng)包含了圖片中對分類影響最明顯特征的位置信息。因此,可以通過網(wǎng)絡中間層輸出的特征圖對腫瘤進行檢測。Zhou 等[4]首先搭建了一個基于DenseNet 的3D 乳腺癌分類網(wǎng)絡,然后利用類激活圖方法(class activation map,CAM)對網(wǎng)絡中間層的特征圖進行加權(quán)融合,得到乳腺腫瘤區(qū)域,表現(xiàn)出弱監(jiān)督學習方法在圖像中定位病變的可行性。由實驗結(jié)果可知,類激活圖方法只能檢測出乳腺癌的模糊位置,需要結(jié)合其他方法進一步約束乳腺癌區(qū)域的邊緣。Maicas 等[35]提出一種單類顯著性檢測器結(jié)構(gòu)來提取輸出特征圖的顯著性區(qū)域,該檢測器在對比實驗中效果優(yōu)于CAM 方法,其相對優(yōu)勢在于該檢測器也參與了反向傳播,能夠捕捉顯著性區(qū)域的細節(jié)。需要注意的是,該算法對損失函數(shù)的參數(shù)要求較高,需根據(jù)不同任務目標修改各部分的權(quán)重。Hwang 等[36]基于遷移學習的思想提出了自遷移學習CNN 框架,在分類網(wǎng)絡中添加定位器分支。損失函數(shù)為分類器與定位器損失函數(shù)的加權(quán)和,可以防止定位器得到較差的局部最優(yōu)解。該框架利用分類器分支的訓練來指導定位器分支,動態(tài)調(diào)整損失函數(shù)的權(quán)重將訓練重心逐步轉(zhuǎn)移到定位器分支,從而不需要任何位置信息及預訓練模型即可完成腫瘤的檢測。
綜上所述,基于深度學習的乳腺癌檢測方法利用卷積神經(jīng)網(wǎng)絡,對乳腺MRI 中的腫瘤與非腫瘤區(qū)域的特征進行自動分析和提取,既減輕了人工特征設計的負擔,又可以聯(lián)合圖像序列的上下文信息,得到更豐富的低層和高層語義特征。得益于計算機的性能提升,深度學習方法可以快速有效地檢測出惡性及良性乳腺腫瘤,較傳統(tǒng)方法具有更強大的魯棒性。部分算法性能對比如表3所示。然而,深度學習方法存在一些問題:第一,絕大多數(shù)研究者沒有對乳腺癌的具體類型進行區(qū)分,如腫塊型乳腺癌和非腫塊型乳腺癌,當前研究更多研究的是腫塊型乳腺癌。這兩種類型的乳腺癌在圖像中的分布形式、內(nèi)部強化等信號特點上有很大差別,非腫塊型乳腺癌需要參考功能性成像或增強掃描的強化特征才能進行準確判斷;第二,大部分算法都是基于數(shù)據(jù)驅(qū)動的,對于模型的修改僅限于各類網(wǎng)絡層的增刪組合,很少將領(lǐng)域知識結(jié)合到網(wǎng)絡中,這樣的網(wǎng)絡對訓練集的質(zhì)量和數(shù)量有更高的要求,更容易出現(xiàn)過擬合問題;第三,由于醫(yī)院設備、機器掃描參數(shù)存在較大差異,醫(yī)學圖像數(shù)據(jù)的共享是非常復雜且困難的,缺乏統(tǒng)一的標準,因此深度學習方法仍面臨小樣本數(shù)據(jù)的限制。
表3 基于深度學習的乳腺癌檢測方法評價結(jié)果Tab.3 Evaluation results of breast cancer detection methods based on deep learning
根據(jù)已有文獻可知,基于候選區(qū)域的乳腺癌檢測方法是最早應用于乳腺MRI 腫瘤檢測的深度學習方法,該方法更有針對性地對圖像局部進行精確分類,檢測靈敏度較高。缺點是候選框提取數(shù)量過多,檢測速度慢,同時假陽性率也較高。對此,研究者采用YOLO 等模型刪除或簡化候選框提取步驟,以獲得更快的檢測速度。然而,這些模型難以檢測體積較小的腫瘤,容易出現(xiàn)漏檢的情況,存在較大局限性。全卷積網(wǎng)絡的深度學習方法對圖片的全部區(qū)域同時進行檢測,對較小的腫瘤檢測效果更好,是目前研究最熱門的乳腺癌檢測方法,但該方法也存在對數(shù)據(jù)依賴性較大、計算效率低、模型可解釋性不強等缺點。弱監(jiān)督學習的乳腺癌檢測方法利用分類網(wǎng)絡中的卷積層已經(jīng)提取到腫瘤位置信息這一特點,為乳腺癌檢測任務提供了新的思路,極大減少了人工標注成本。但是如何設計有效的模型結(jié)構(gòu)成為了研究的難點,當前應用此類算法得到的檢測準確率較有監(jiān)督學習算法仍有較大差距,未來還需要進行更多的探索,進一步提升檢測性能。基于深度學習的乳腺癌檢測方法優(yōu)缺點總結(jié)如表4。
表4 深度學習乳腺癌檢測方法優(yōu)缺點總結(jié)Tab.4 Advantages and disadvantages of breast cancer detection methods based on deep learning
計算機輔助檢測是醫(yī)學圖像處理領(lǐng)域的研究熱點之一,在提高放射科醫(yī)生診斷效率、輔助醫(yī)生閱片等方面具有非常重要的意義。因此,本文從傳統(tǒng)圖像處理方法及深度學習技術(shù)兩方面綜述了近年來基于MRI 的乳腺癌計算機輔助檢測的相關(guān)研究??偟膩碚f,當前檢測流程每一部分的方法都有一定程度的優(yōu)化,檢測性能大幅提高,但仍處于探索階段。通過對現(xiàn)有MRI 乳腺癌檢測技術(shù)的歸納,提出以下觀點并進行展望。
乳腺癌計算機輔助檢測方法存在的問題:
a.高質(zhì)量數(shù)據(jù)集的緊缺仍是提升檢測性能的瓶頸。使用小樣本數(shù)據(jù)集導致傳統(tǒng)方法的泛化能力較差,難以進行臨床應用;缺乏大數(shù)量、高質(zhì)量的數(shù)據(jù)集及準確標注的標簽,數(shù)據(jù)集分布不平衡導致深度學習方法的性能難以發(fā)揮。此外,現(xiàn)有文獻的實驗方法缺少在多中心數(shù)據(jù)庫間的性能對比。大部分文獻只針對某一個數(shù)據(jù)庫進行實驗,且這些數(shù)據(jù)庫大部分為小型、非公開數(shù)據(jù)庫,這導致方法的有效性存疑。
b.特殊類型的腫瘤檢出率較低。微小腫瘤占圖像的區(qū)域較小,特征與血管等組織相似,噪聲較多,傳統(tǒng)方法無法提取有效信息,常會出現(xiàn)漏檢;深度學習方法雖采用多尺度特征等技術(shù)對小腫瘤進行檢測,精度依然與常見腫瘤的檢測精度有顯著差距。此外,非腫塊型乳腺癌通常需要結(jié)合多序列圖像進行檢測且臨床數(shù)據(jù)樣本較少,當前研究該類型腫瘤的工作較少。
隨著乳腺癌檢測技術(shù)越來越成熟,可根據(jù)以下方向進一步研究:
a.深度學習技術(shù)與傳統(tǒng)檢測方法相結(jié)合。深度學習方法高效準確,具有極強的自動尋找特征的能力,但不能很好地結(jié)合人們現(xiàn)有的知識,檢測過程比較抽象。而傳統(tǒng)檢測方法可解釋性強,運行過程明確,在邊緣檢測等特定場景下性能更佳。因此,二者組合應用更能發(fā)揮各自的優(yōu)勢,提高檢測性能。
b.多模態(tài)影像的應用。DCE-MRI 的多序列圖像和其他輔助信息可以從多層面提供腫瘤信息,而當前檢測方法大多數(shù)只針對一張圖片進行判斷,損失大量有用信息。因此,未來可以結(jié)合臨床診斷經(jīng)驗,利用多模態(tài)數(shù)據(jù)進行檢測。
c.為了克服數(shù)據(jù)標注成本過大的難題,未來的研究重點可在弱監(jiān)督目標檢測領(lǐng)域開展。弱監(jiān)督方法可以大大減少人工成本,充分利用醫(yī)院現(xiàn)存的大量粗糙數(shù)據(jù)庫。同時,未來可以在弱標注樣本的基礎(chǔ)上結(jié)合部分強標注的樣本聯(lián)合訓練。此外,自然圖像理解領(lǐng)域中存在大量性能優(yōu)秀的檢測方法,如生成式對抗網(wǎng)絡、Transformer 模型等,將其遷移到乳腺癌檢測任務中可能會有較好的表現(xiàn)。
綜上,當前基于MRI 的乳腺癌檢測方法準確率較高,但仍有進一步發(fā)展的空間。目前,基于深度學習的檢測方法是熱門研究方向,未來我們應繼續(xù)研究人工智能的其他方法在乳腺癌檢測方面的應用,在臨床實踐中證明其有效性,與放射科醫(yī)生相互配合,持續(xù)改進所用方法,進一步提高醫(yī)療診治水平,充分利用醫(yī)療資源。