徐一舫 卓一瑤 孫海洋 楊冠男
摘要:乳腺鉬靶X線圖像與多數(shù)醫(yī)學(xué)圖像相比,腫塊邊沿模糊、特征區(qū)域過小、良性腫塊與惡性腫塊構(gòu)成相似。為了解決傳統(tǒng)計(jì)算機(jī)輔助檢測(cè)乳腺腫塊技術(shù)效果差的問題,對(duì)基于深度學(xué)習(xí)的乳腺腫塊檢測(cè)模型進(jìn)行了研究,分析了R-CNN、SPPNet、Fast R-CNN、Faster R-CNN算法的原理。收集并增強(qiáng)了相關(guān)數(shù)據(jù)集。在Ubuntu系統(tǒng)下采用Tensorflow實(shí)現(xiàn)了四種算法。對(duì)比R-CNN系列算法的檢測(cè)精度與單張圖像檢測(cè)耗時(shí),驗(yàn)證了Faster R-CNN乳腺腫塊算法的檢測(cè)能力。研究結(jié)果表明,F(xiàn)aster R-CNN算法正確率為82.2%且單張圖像檢測(cè)耗時(shí)為57ms,具有良好的泛化能力與魯棒性,適用于醫(yī)學(xué)中有關(guān)乳腺腫塊的檢測(cè)任務(wù)。
關(guān)鍵詞:tensorflow;卷積神經(jīng)網(wǎng)絡(luò);深度學(xué)習(xí);乳腺腫塊;物體檢測(cè)
中圖分類號(hào): TP18? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)18-0217-04
1 背景
乳腺癌在全世界是女性發(fā)病率最高的惡性腫瘤之一,嚴(yán)重威脅著全球婦女的生命健康。據(jù)資料顯示,2012年,全球乳腺癌新發(fā)病例167.1萬(wàn)列,發(fā)病率為25.1%,并處于逐年上升的趨勢(shì)[1]。乳腺癌的早期發(fā)現(xiàn)和治療能有效挽救患者的生命。
目前,乳腺鉬靶X線攝影(mammography)是診斷乳腺癌最有效的首選方法。然而,醫(yī)生有可能會(huì)受乳腺鉬靶X線圖像上噪聲與對(duì)比度的干擾而解讀錯(cuò)誤,使一些疾病誤診,導(dǎo)致假陰性與假陽(yáng)性出現(xiàn)。據(jù)統(tǒng)計(jì),醫(yī)學(xué)影像的疾病誤診率可達(dá)到 10%~30%[2]。因此,為了降低誤診率出現(xiàn)了大量的計(jì)算機(jī)輔助檢測(cè)技術(shù)(CAD),并有一些投入臨床使用。之后,從物體分類到物體檢測(cè)的過渡,出現(xiàn)R-CNN[4]、SPPNet[5]、Fast R-CNN[6]、Faster R-CNN[7]等方法。相較于傳統(tǒng)的CAD,深度學(xué)習(xí)模型能夠提高檢測(cè)正確率,識(shí)別的網(wǎng)絡(luò)更復(fù)雜,通過GPU加速使得學(xué)習(xí)效率提高,所以,傳統(tǒng)的CAD正逐步被深度學(xué)習(xí)模型所取代[8]。
本研究采用深度學(xué)習(xí)中常用的Faster R-CNN方法來(lái)輔助醫(yī)生解決良性與惡性乳腺腫塊檢測(cè)的相關(guān)問題。訓(xùn)練集和測(cè)試集由International Workshop on Digital Mammography提供的DDSM (The Digital Database for Screening Mammography)[9]數(shù)據(jù)集組成,驗(yàn)證集由部分DDSM數(shù)據(jù)集與Royal Marsden Hospital提供的MIAS(Mammographic Image Analysis Society MiniMammographic Database)[10]數(shù)據(jù)集組成。最后通過對(duì)數(shù)據(jù)集的增強(qiáng)與模型的微調(diào)達(dá)到檢測(cè)的預(yù)期目標(biāo)。
2 Faster R-CNN的介紹
2.1 R-CNN原理簡(jiǎn)介
R-CNN(Regions with CNN features)中的CNN的是卷積神經(jīng)網(wǎng)絡(luò)(convolution natural network),受Hubel和Wiesel對(duì)貓視覺皮層電生理研究啟發(fā),Lecun等最早將CNN用于手寫數(shù)字識(shí)別應(yīng)用上[11]。CNN與普通神經(jīng)網(wǎng)絡(luò)的區(qū)別在于,CNN中包含由卷積層和池化層構(gòu)成的特征提取器,可以簡(jiǎn)化模型復(fù)雜度,再通過局部感受與權(quán)值共享可以降低模型訓(xùn)練速度。
R-CNN在CNN之上做了改進(jìn),可以分為四步:首先通過Selective Search搜尋可能存在物體的區(qū)域并提取出候選框,之后用CNN計(jì)算每個(gè)框的特征并提取出每個(gè)框的特征,提取出的特征使用SVM分類器[12]分類,分類后通過非極大值抑制修正輸出結(jié)果。R-CNN整體框架如圖1所示。
2.2 SPPNet與Fast R-CNN原理簡(jiǎn)介
SPPNet(Spatial Pyramid Pooling Convolutio-nal Network)基于傳統(tǒng)CNN結(jié)構(gòu)上,在SVM分類器之前加入了ROI池化層,使得網(wǎng)絡(luò)輸入圖像可為任意尺寸,輸出尺寸不變[5]。SPPNet只需要運(yùn)算一次,相較于R-CNN要對(duì)每個(gè)區(qū)域做卷積運(yùn)算,速度與mAP均超過R-CNN。
2.3 Faster R-CNN原理簡(jiǎn)介
Faster R-CNN在Fast R-CNN的基礎(chǔ)上用RPN(Region Proposal Network)網(wǎng)絡(luò)代替Selective Search,RPN網(wǎng)絡(luò)與卷積層共享網(wǎng)絡(luò)參數(shù),并通過end-to-end生成高質(zhì)量的候選框。生成的候選框最終送入卷積神經(jīng)網(wǎng)絡(luò)與ROI池化層進(jìn)行分類。Faster R-CNN整體框架如圖3所示。
訓(xùn)練時(shí),只需要訓(xùn)練RPN網(wǎng)絡(luò)與分類網(wǎng)絡(luò),通常的做法是在一個(gè)batch中,先訓(xùn)練一次RPN網(wǎng)絡(luò),再訓(xùn)練一次分類網(wǎng)絡(luò)。這使得速度與mAP均提高。
3 基于Faster R-CNN的乳腺腫塊檢測(cè)模型
3.1 數(shù)據(jù)集增強(qiáng)
DDSM數(shù)據(jù)集一共2620張圖像。MIAS數(shù)據(jù)集一共322張圖像,每幅圖像都是1024像素x 1024像素,良性中有2張圖像的腫塊是廣泛散布在整個(gè)圖像里,而不是集中在一個(gè)單一的地點(diǎn),不具有代表性,故去掉。其中關(guān)于腫塊嚴(yán)重程度包括3個(gè)類別:正常(Norm)、良性(Benign)、惡性(Malignant)。本研究只采用良性與惡性腫塊圖像。
訓(xùn)練集總體數(shù)量較少,本研究對(duì)樣本數(shù)據(jù)進(jìn)行增強(qiáng),加強(qiáng)訓(xùn)練模型的泛化能力。增強(qiáng)常采用的方式:平移、旋轉(zhuǎn)、反轉(zhuǎn)、裁剪、縮放、顏色變換、噪聲擾動(dòng)[13]。此處增強(qiáng)的方式為:先將原圖像基于特征區(qū)域隨機(jī)裁剪為768像素X 768像素的圖像,再加入高斯白噪聲、直方圖均衡化。共計(jì)10734張圖片。每類物體的分布如表1所示。
3.2 數(shù)據(jù)集的制作
本文將2.1節(jié)增強(qiáng)后的數(shù)據(jù)集打亂后,分為訓(xùn)練集6300張,測(cè)試集657張,驗(yàn)證集由未參與訓(xùn)練的20張?jiān)瓐D組成,再使用LabelImg對(duì)分別訓(xùn)練集、測(cè)試集、驗(yàn)證集進(jìn)行標(biāo)注,標(biāo)注界面如圖4所示。
3.3 實(shí)現(xiàn)環(huán)境和模型設(shè)置
本文的Faster R-CNN模型在Ubuntu操作系統(tǒng)下,基于Tensorflow深度學(xué)習(xí)框架與python3.5實(shí)現(xiàn),GPU為GeFore 930M。Faster R-CNN算法選用在ImageNet數(shù)據(jù)集上訓(xùn)練好的inception v2[14]預(yù)訓(xùn)練模型,進(jìn)過多次調(diào)參,最終選用rmsprop優(yōu)化器,初始learning rate設(shè)為0.001,并采用指數(shù)下降法更新learning rate,batch size設(shè)為10,迭代次數(shù)50000次,得到訓(xùn)練好的模型。
3.4 評(píng)估指標(biāo)的定義
腫塊良惡性是二分類問題,為了衡量模型表現(xiàn),本次試驗(yàn)中,計(jì)算了機(jī)器學(xué)習(xí)常用的評(píng)估指標(biāo)準(zhǔn)確率(Accuracy)。
4 實(shí)驗(yàn)
基于Faster R-CNN的乳腺腫塊輔助檢測(cè)結(jié)果如圖6與圖7所示,其中方框內(nèi)是檢測(cè)到的腫瘤,準(zhǔn)確率顯示在方框上。
5 結(jié)論
使用深度學(xué)習(xí)中R-CNN系列算法來(lái)進(jìn)行乳腺腫塊的輔助檢測(cè),可以檢測(cè)乳腺中的腫塊及腫塊嚴(yán)重程度,共3個(gè)類別。結(jié)果表明,基于Faster R-CNN的乳腺腫塊檢測(cè)模型能較好地完成輔助檢測(cè)的相關(guān)任務(wù),通過對(duì)比四種算法說明Faster R-CNN模型在判斷良惡性時(shí)可以達(dá)到82.2%的正確率與單張圖像檢測(cè)耗時(shí)57ms的效果。
影響乳腺腫塊圖像檢測(cè)的因素主要包括腫塊邊沿模糊、特征區(qū)域過小、良性腫塊與惡性腫塊構(gòu)成相似等。本研究能夠克服這些影響因素,但對(duì)于乳腺中出現(xiàn)多個(gè)腫塊或者腫塊廣泛散布與乳腺之中,模型不能完全識(shí)別到所有的腫塊的情況,接下來(lái)有待進(jìn)行進(jìn)一步的研究。
參考文獻(xiàn):
[1] 師金, 梁迪, 李道娟, 等. 全球女性乳腺癌流行情況研究[J]. 中國(guó)腫瘤, 2017, 26(9): 683-690.
[2] Zheng GY, Liu XB, Han GH. Survey on medical image computer aided detection and diagnosis systems[J]. Ruan Jian Xue Bao/Journal of Software, 2018, 29(5): 1471-1514.
[3] Krizhevsky A, Sutskever I, Hinton G E. Imagenet classification with deep convolutional neural networks[C]//Proceedings of the International Conference on Neural Information Processing Systems, 2012: 1097-1105.
[4] Ross Girshick, Jeff Donahue, Trevor Darrell, et al. Rich feature hierarchies for accurate object detection and semantic segmentation[C]//Proceedings of the IEEE Conference On Computer Vision and Pattern Recognition, 2014: 580-587.
[5] Kaiming He, Xiangyu Zhang, Shaoqing Ren, et al. Spatial.Pyramid Pooling in Deep Convolutional Networks for Visual Recognition[C]//IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE, 2015, 37(9): 1904-1916.
[6] Girshick R. Fast R-CNN[C]//Proceedings of the IEEE International Conference on Computer Vision, 2015: 1440-1448.
[7] Shaoqing Ren, Kaiming He, Ross Girshick, et al. Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks[C]//IEEE Transactions on Pattern Analysis & Machine Intelligence, 2016, 39(6): 1137-1149.
[8] 孫利雷, 徐勇. 基于深度學(xué)習(xí)的乳腺X射線影像分類方法研究[J]. 計(jì)算機(jī)工程與應(yīng)用, 2018, 54(21): 13-19.
[9] Bowyer K, Kopans D, Kegelmeyer W P, et al. The Digital Database for Screening Mammography[C]//In proceedings of the Third International Workshop on Digital Mammography, 1996.
[10] Suckling J. The Mammographic Image Analysis Society Digital Mammogram Database Exerpta Medica[C]//International Congress Series, 1994(1069): 375-378.
[11] Lecun Y, Boser B, Denker J S, et al. Backprogation applied to handwritten zip code recongnition[C]//Neural Computaion, 1989, 1(4): 541-551.
[12] Adankon M M, Cheriet M. Support vector machine[J]. Computer Science, 2002, 1(4): 1-28.
[13] Howard, Andrew G. Some Improvements on Deep Convolutional Neural Network Based Image Classification[C]//Computing Research Repository, 2013.
[14] Christian Szegedy, Vincent Vanhoucke, Sergey Ioffe, et al. Rethinking the Inception Architecture for Computer Vision[C]//The IEEE Conference on Computer Vision and Pattern Recognition, 2016: 2818-2826.
[15] Jiang B, Luo R, Mao J, et al. Acquisition of Localization Confidence for Accurate Object Detection[C]//European Conferenzce on Computer Vision, 2018: 816-832.
【通聯(lián)編輯:謝媛媛】