劉巧利 閆 航 賀鵬飛 楊信志 李彥杰
(1.煙臺大學光電信息科學技術(shù)學院 煙臺 264005)(2.鄭州大學產(chǎn)業(yè)技術(shù)研究院 鄭州 450000)
世界衛(wèi)生組織(WHO)國際癌癥研究機構(gòu)基于2012 年全球新發(fā)惡性腫瘤的數(shù)據(jù)公布:肺癌、乳腺癌、結(jié)直腸癌、前列腺癌以及胃癌是主要的惡性腫瘤,其中女性乳腺癌已成為全球女性中發(fā)病和死亡率均居首位的惡性腫瘤[1]。乳腺癌的早期發(fā)現(xiàn)對于合理有效的治療具有積極作用,臨床中乳腺癌醫(yī)學圖像根據(jù)不同成像原理分為彩超、X-ray、核磁共振等,而病理圖像對于良惡性細胞形態(tài)的信息更為豐富,是醫(yī)生最終確診乳腺癌的重要標準[2]。目前基于人工的病例圖像分類,病理醫(yī)生通常是通過研究和統(tǒng)計視角下細胞的形態(tài)和分布而進行判斷,診斷過程需要耗費很大的精力和時間,并且診斷結(jié)果容易受到病理醫(yī)生經(jīng)驗和知識水平等主觀因素的影響。借助基于深度學習的計算機輔助診斷,具有易學習、自動特征提取和魯棒性強的特點,能夠自動對病例圖像的良、惡性進行診斷并進行快速篩查,不僅能夠提高診斷效率,還能為醫(yī)生提供更加準確的結(jié)果,具有重要的應(yīng)用價值。
乳腺癌病理圖像是用顯微鏡成像技術(shù)對微觀的細胞和腺體成像,圖像之間病變細胞核細微的差異性和顏色分布的不均勻性都對病理圖像的自動診斷帶來很大的困難。國內(nèi)外很多學者對乳腺癌病理圖像的自動診斷進行了嘗試,并取得了一系列具有一定實用價值的研究成果,總體來說分為基于特征工程的機器學習方法和基于深度學習的方法。
1)基于特征工程的機器學習方法。傳統(tǒng)的乳腺癌病理圖像自動診斷的設(shè)計思路通常是人工選取特征加分類器的模式。Zhang 等[3]根據(jù)人工設(shè)計特征的方式提出了單類核主成分分析方法,在乳腺癌活檢數(shù)據(jù)集中的分類準確率為92%。George等[4]根據(jù)從細胞核中挑選的12個特征,采用多種機器學習方法如支持向量機(SVM)、概率神經(jīng)網(wǎng)絡(luò)(PPN)等,在92幅乳腺癌病理圖像中的分類準確率為76%~94%。Wang等[5]結(jié)合鏈式智能體遺傳算法和支持向量機算法對68 幅乳腺癌病理圖像的分類準確率為96.19%。Spanhol 等[2]采取局部二值模式(LBP)、局部相位量化(LPQ)等6 種特征提取方法并結(jié)合隨機森林、支持向量機(SVM)等分類器在其公開的數(shù)據(jù)集BreaKHis 的分類準確率達到80%~85%。上述研究方法分別在不同的數(shù)據(jù)集上進行的,算法的優(yōu)劣不能進行合理的對比。采用人工提取特征的傳統(tǒng)機器學習方法需要大量的專業(yè)知識,要從復(fù)雜的特征中挑選出具備高區(qū)分性的特征也十分困難,并且費時費力,一定程度上制約了傳統(tǒng)機器學習方法在乳腺癌病理圖像診斷中的應(yīng)用。
2)基于深度學習的方法。近年來深度學習在計算機視覺、自然語言處理等方面取得了大規(guī)模的應(yīng)用。深度學習能夠從海量數(shù)據(jù)中自動學習更具有區(qū)分性的特征,從而無需傳統(tǒng)機器學習方法中的人工提取特征過程,從而推動了深度學習在醫(yī)療圖像識別方面的應(yīng)用[6]。Spanhol 等[7]使用經(jīng)典的AlexNet網(wǎng)絡(luò),采用不同的融合策略分類,在BreaKHis 數(shù)據(jù)集[2]上的平均識別率達到了83.2%。Spanhol 等在文獻[8]中結(jié)合DeCAF 特征和AlexNet 網(wǎng)絡(luò),在數(shù)據(jù)集BreaKHis 的識別率進一步提升至83.6%。Yang 等[9]首先通過VGG-VD 網(wǎng)絡(luò)在ImageNet 數(shù)據(jù)集上預(yù)訓練得到Fisher Vector(FV)編碼,再利用支持向量機(SVM)對FV 編碼進行分類,在BreakHis 數(shù)據(jù)集上的準確率達85.3%。何雪英等[10]基于GoogLeNet 模型進行微調(diào)訓練,同樣在BreaKHis 數(shù)據(jù)集上的識別率達到了91%左右。Han 等[11]設(shè)計了一種結(jié)構(gòu)化的深度學習模型,并結(jié)合數(shù)據(jù)增強方式在BreakHis 數(shù)據(jù)集上的準確率為96%。然而癌癥的確診是嚴謹且至關(guān)重要的,要做到更好的臨床應(yīng)用,需要提取到乳腺癌病理圖像中更加細微的細胞核特征,進一步提升準確率,達到并超越病理圖像學家的水平。
基于以上問題,本文提出基于改進DenseNet網(wǎng)絡(luò)的乳腺癌診斷模型,在當前性能出色的DenseNet網(wǎng)絡(luò)基礎(chǔ)上改進網(wǎng)絡(luò)結(jié)構(gòu),結(jié)合數(shù)據(jù)增強與遷移學習策略,對數(shù)據(jù)增強后的訓練樣本進行特征提取,通過交叉驗證來優(yōu)化參數(shù)并進行微調(diào)學習。該方法對于不同倍數(shù)、不同腫瘤類型的圖像具有較強的魯棒性,較以往的研究成果取得了大幅度的提升。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)提供了一種端到端的學習模型,模型中的參數(shù)可以通過傳統(tǒng)的梯度下降方法進行訓練,經(jīng)過訓練的卷積神經(jīng)網(wǎng)絡(luò)能夠?qū)W習到圖像中的本質(zhì)特征,進一步完成對圖像特征的提取和分類[12]。卷積神經(jīng)網(wǎng)絡(luò)具有局部連接、權(quán)值共享的特點,其每一層的特征都由上一層的局部區(qū)域通過共享權(quán)值的卷積核激勵得到。如圖1 所示,卷積神經(jīng)網(wǎng)絡(luò)通常由輸入層、卷積層、池化層、全連接層和輸出層組成,輸入層一般為原始圖像的三維矩陣,經(jīng)過一系列的特征提取與池化操作,由低層特征到高層特征的逐步學習,在全連接層能夠得到具備高區(qū)分性的特征[13]。所以卷積神經(jīng)網(wǎng)絡(luò)相比于其它神經(jīng)網(wǎng)絡(luò)如循環(huán)神經(jīng)網(wǎng)絡(luò)更適用于圖像特征的提取。
圖1 卷積神經(jīng)網(wǎng)絡(luò)典型結(jié)構(gòu)
3.1.1 卷積層
圖2 為卷積層神經(jīng)網(wǎng)絡(luò)的核心部分,被稱之為過濾器或者內(nèi)核。病理圖像識別問題中,輸入通常為三維矩陣X ,本文設(shè)卷積神經(jīng)網(wǎng)絡(luò)第i 層的特征圖表示為Si(S0=X),則Si的產(chǎn)生過程可以描述為
其中,Wi表示第i 層卷積核的權(quán)重參數(shù),常用的尺寸有3*3 或5*5,深度與前一層特征的深度相同;bi為第i 層的偏置向量;符號?表示卷積核Wi與上一層特征圖Si-1進行卷積操作,得到的輸出與bi相加,最后通過非線性的激活函數(shù)f(x)得到第i 層的特征圖Si。
圖2 卷積層示意圖
3.1.2 池化層
池化層主要進行Pooling 操作,采用簡單的最大值或平均值運算,目的在于縮小矩陣的尺寸,來減少卷積運算的計算量,同時減少最后全連接層中的參數(shù)。Pooling 操作不但能夠加快計算速度也能夠有效防止過擬合問題,提升了卷積神經(jīng)網(wǎng)絡(luò)的性能[12]。常用的Pooling 操作主要有MaxPooling 和AveragePooling,MaxPooling 是求相鄰區(qū)域的最大值,而AveragePooling是求相鄰區(qū)域的平均值,本文模型中的池化層采用的是AveragePooling,感受野尺寸為2 2,滑動步長設(shè)為2。
3.1.3 激活函數(shù)
卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中每一卷積層的輸出通常會經(jīng)過激活函數(shù)的運算,激活函數(shù)的作用是給卷積神經(jīng)網(wǎng)絡(luò)帶來非線性因素,從而增強網(wǎng)絡(luò)的非線性表達能力。常用的激活函數(shù)有Sigmoid、Tanh和Relu。Sigmoid 函數(shù)能夠?qū)⑤斎胗成涞剑?,1)的范圍內(nèi),當輸入值的絕對值過大時就會出現(xiàn)導(dǎo)數(shù)很小的情況,導(dǎo)致訓練時候出現(xiàn)梯度消失,從而無法更新參數(shù);雙曲正切函數(shù)Tanh 的輸出區(qū)間是(-1,1)之間,整個函數(shù)以0 位中心,但是當輸入過大或過小時同樣會出現(xiàn)梯度消失現(xiàn)象,不利于權(quán)重更新;Relu函數(shù)當輸入為負時輸出為零,輸入為正時輸出與輸入成正比關(guān)系,很好地解決了梯度消失現(xiàn)象,是目前最常用得激活函數(shù),本文設(shè)計的卷積網(wǎng)絡(luò)模型除輸出層以外全部使用Relu激活函數(shù)。
DenseNet 是一種具有密集連接的卷積神經(jīng)網(wǎng)絡(luò),結(jié)合了模型ResNet[14]與Highway[15]的優(yōu)點,旨在解決深層網(wǎng)絡(luò)中的梯度消失問題,在2017 年由文獻[16]提出。DenseNet 網(wǎng)絡(luò)的思想是保證網(wǎng)絡(luò)中層與層之間最大程度信息的傳輸,從而直接將所有層連接起來。圖3 為一個Dense block 的結(jié)構(gòu)圖,Block 模塊是DenseNet 網(wǎng)絡(luò)的核心部分,主要特點是其中的各層網(wǎng)絡(luò)不僅與下一層連接,而且與后面的每一層都直接連接,每一層的輸入來自前面所有層的輸出[17]。梯度消失的主要原因就是輸入信息和梯度信息在深層網(wǎng)絡(luò)中傳遞而導(dǎo)致信息流變?nèi)?,而Dense block 設(shè)計中每一層都直接連接input 和loss,能夠促進信息的傳遞,因而減輕了梯度消失現(xiàn)象,并且網(wǎng)絡(luò)能夠更好地收斂。
圖3 Dense block結(jié)構(gòu)
傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)如AlexNet[18]、VGG[19]中,如果網(wǎng)絡(luò)有L層,那就有L個連接,而在DenseNet網(wǎng)絡(luò)中,第i 層所得到的特征圖是前面所有前向特征圖連接之后卷積的結(jié)果,如式(2)所示。
其中,H 表示該層的卷積操作,⊕表示特征圖之間的連接操作,這樣L層的網(wǎng)絡(luò)就會有L(L+1)/2 個連接。
圖4 為一個基本的DenseNet網(wǎng)絡(luò)結(jié)構(gòu)圖,該結(jié)構(gòu)圖包含了3 個Dense block,其中每個Dense block地3*3 卷積前面會包含一個1*1 卷積操作來減少feature map 的數(shù)量。為進一步壓縮空間,在相鄰兩個Dense block 之間也可以增加1*1 的卷積層,這樣的網(wǎng)絡(luò)又稱之為DenseNet-BC 網(wǎng)絡(luò),與同深度的DenseNet網(wǎng)絡(luò)相比大大減少了參數(shù),同時也降低了過擬合的風險。DenseNet 網(wǎng)絡(luò)中有兩個關(guān)鍵的參數(shù)需要注意,一是Block 內(nèi)每層卷積輸出的feature map 個數(shù)k,稱之為growth rate;二是Block 中卷積的層數(shù)l。這樣每個Dense block 的輸出通道數(shù)如式(3)所示。
其中,S0為單個Block 輸入的通道數(shù),Sout為Block輸出的通道數(shù)。
文獻[16]在ImageNet 物體識別任務(wù)中設(shè)計了四種典型的 DenseNet-BC 網(wǎng)絡(luò),分別為DenseNet-121(k=32)、DenseNet-169(k=32)、DenseNet-201(k=32)與DenseNet-161(k=48),并且在同精度下的參數(shù)量與計算量均為ResNet 網(wǎng)絡(luò)的一半。如表1 所示為該四種未經(jīng)改進的原生模型在乳腺癌病理圖像數(shù)據(jù)集BreaKHis 中各倍數(shù)圖像下的準確率,該準確率為同實驗環(huán)境下迭代過程中測試集的最優(yōu)結(jié)果。
圖4 DenseNet網(wǎng)絡(luò)結(jié)構(gòu)圖
表1 四種典型模型的良惡性診斷準確率
隨著DenseNet-BC 網(wǎng)絡(luò)參數(shù)的增加,對乳腺癌的良惡性診斷準確率并沒有相應(yīng)地提高,原因在于越復(fù)雜的網(wǎng)絡(luò)需要越多的樣本進行訓練,才能夠保證合適的參數(shù)更新,而BreaKHis 數(shù)據(jù)集的樣本有限,網(wǎng)絡(luò)模型不能較好地學習到乳腺癌病理圖像的本質(zhì)特征。因此本文選擇DenseNet-121(k=32)網(wǎng)絡(luò)作為基礎(chǔ)網(wǎng)絡(luò)進行改進,在較高準確率的同時該網(wǎng)絡(luò)的參數(shù)量遠遠少于其他三種網(wǎng)絡(luò)模型,能夠減少內(nèi)存空間和訓練時間,更好地滿足乳腺癌病理圖像實時診斷的需求。
本文基于DenseNet-121 網(wǎng)絡(luò)模型針對乳腺癌病理圖像數(shù)據(jù)集的應(yīng)用特點進行改進,主要改進策略有更改網(wǎng)絡(luò)尾部結(jié)構(gòu)、對BreaKHis 數(shù)據(jù)集進行增強處理和遷移學習。
3.3.1 DenseNet網(wǎng)絡(luò)結(jié)構(gòu)改進
DenseNet-121(k=32)模型即深度為121 且增長率為32 的DenseNet網(wǎng)絡(luò),它主要由四個Block 模塊組成,其中Block的1*1與3*3卷積核組合分別為6、12、24 和16 對。兩 個 相 鄰 的Block 之 間 通 過Translation Layer 連接,Translation Layer 包括一個1 1 的卷積層和2 2 的池化層,能夠進一步降低特征圖的尺寸。該網(wǎng)絡(luò)中每次卷積操作之后都進行Batch Normalization 操作,即對各隱藏層的輸入都進行了標準化,能夠緩解CNN 訓練中的梯度消失或爆炸現(xiàn)象,進一步加快模型的訓練速度。
本文在DenseNet-121 網(wǎng)絡(luò)基礎(chǔ)上保留了四個Block 模塊,并將尾部的全連接層神經(jīng)元個數(shù)改為64,同時加入一個Softmax 分類器。改進的網(wǎng)絡(luò)模型如圖5 所示,模型采取了端到端的方式進行網(wǎng)絡(luò)訓練,四個Block 模塊自動學習乳腺癌病理圖像從低層到高層的特征,再通過全連接層進行本質(zhì)特征的整合,最后通過Softmax分類器進行良惡性診斷。
圖5 改進網(wǎng)絡(luò)結(jié)構(gòu)的DenseNet模型
Softmax 分類器是logistic 回歸在多分類問題上的推廣,首先通過Softmax 激活函數(shù)將多個神經(jīng)元的輸出映射到(0,1)之間,將數(shù)值大小轉(zhuǎn)化為概率。假設(shè)輸入為數(shù)組X,Xi為數(shù)組X的第i個元素,Softmax激活函數(shù)的計算方式如式(4)所示。
其中,k表示數(shù)組X的元素個數(shù),本文模型中代表輸出層輸出的類別數(shù)。 f(x)函數(shù)對神經(jīng)網(wǎng)絡(luò)的輸出值進行歸一化操作,則所有元素經(jīng)過f(x)函數(shù)輸出的概率之和為1。Softmax 分類器采用取對數(shù)形式的交叉熵損失函數(shù),計算方式如式(5)所示。
式中,yi代表圖像的正確分類標簽,格式為one-hot編碼,這樣只有正確類別的概率值會被計算為損失值,其他值為零,最后通過隨機梯度下降算法來最小化損失函數(shù)。
3.3.2 數(shù)據(jù)增強
醫(yī)學圖像獲取的代價高,尤其是經(jīng)過病理學家標記好的數(shù)據(jù)集是比較稀缺的,這也是深度學習應(yīng)用于計算機輔助診斷的主要挑戰(zhàn)之一。為了更好地利用乳腺癌病理圖像數(shù)據(jù)集,本文對原數(shù)據(jù)集進行了數(shù)據(jù)增強,不但大幅度擴充了數(shù)據(jù)集,并且經(jīng)過不同方式的圖像變換來提升模型的魯棒性。
本文根據(jù)乳腺癌病理圖像特點采用仿射變換方法來進行數(shù)據(jù)增強,BreaKHis數(shù)據(jù)集中的細胞圖像具有平移不變形,因此將原圖像在0~60h范圍內(nèi)隨機旋轉(zhuǎn)、隨機水平偏移、隨機豎直偏移和隨機水平翻轉(zhuǎn),這些操作不但有助于提高模型魯棒性,還能夠?qū)?shù)據(jù)集大幅度擴充。另外,本文還將圖像RGB 通道的各值歸一化于0~1之間,以便加速運算并且模型能夠更好地收斂。
3.3.3 遷移學習
卷積神經(jīng)網(wǎng)絡(luò)的訓練需要大規(guī)模的樣本才能使參數(shù)收斂并且才能防止過擬合的風險,而在其他圖像數(shù)據(jù)集訓練好的參數(shù)同樣能夠反映病理圖像的最基本特征。本文采用遷移學習方式[20],通過在大規(guī)模圖像數(shù)據(jù)集ImageNet(包含120 萬張圖像)上進行預(yù)訓練,將得到的初始化權(quán)重參數(shù)遷移到BreakHis 數(shù)據(jù)集上進行由一般到特殊的微調(diào)訓練。本文模型采用ImageNet 數(shù)據(jù)集的權(quán)重參數(shù)初始化后,所有層都參與反向傳播從而進行參數(shù)更新,進一步學習乳腺癌病理圖像的本質(zhì)特征。
本文采用乳腺癌病理圖像公開數(shù)據(jù)集BreakHis[2],該數(shù)據(jù)集由來自82 名患者的9109 幅圖像組成,它包含2480 幅良性腫瘤和5429 幅惡性腫瘤。表2 是不同放大倍數(shù)的良、惡性腫瘤圖像的分布狀況,該數(shù)據(jù)集采用了4 種不同的放大倍數(shù),圖像大小為700*460像素。
該數(shù)據(jù)集還把良、惡性乳腺腫瘤分成了不同的類型,其中良性腫瘤有腺病、纖維腺瘤、葉狀腫瘤和管狀腺瘤四種類型,惡性腫瘤有導(dǎo)管腺癌、小葉癌、粘液癌和乳頭狀癌四種類型。不同類型的腫瘤有著不同的形態(tài),因而在進行乳腺癌病理圖像的診斷中需要模型有較強的魯棒性,BreakHis 數(shù)據(jù)集中惡性腫瘤的不同類型圖像如圖6所示。
表2 不同放大倍數(shù)的良、惡性腫瘤圖像分布
圖6 惡性腫瘤類型
許多學者在BreakHis 數(shù)據(jù)集中常采用圖像準確率作為評價標準,假設(shè)測試集中病理圖像總的數(shù)量為Nall,其中被正確分類的圖像數(shù)量為Nt,那么圖像識別的準確率為
本文所用的BreakHis 數(shù)據(jù)集良性與惡性圖像的數(shù)據(jù)分布差異不大,其中良、惡性樣本比例大約為1∶2,且每種放大倍數(shù)的測試樣本集在600 張左右,采用圖像準確率作為評價指標能夠從一定程度上反映模型學習能力的好壞。
4.3.1 實驗環(huán)境
本實驗平臺環(huán)境的CPU 型號為IntelCore i7-8750,內(nèi)存8GB,顯卡型號為NVIDIA 1060顯卡,顯存為6G。另外,本實驗采用基于Tensorflow 的Keras深度學習框架,模型主要采用GPU進行訓練,圖片輸入大小調(diào)整為224 224,從而單張圖片的訓練時間平均為0.002s。
4.3.2 訓練策略及過程
本文將乳腺癌病理圖像數(shù)據(jù)集BreakHis 按照7:3 的比例隨機分為訓練集與測試集,并且在四種不同放大倍數(shù)的數(shù)據(jù)集中分別訓練模型。其中訓練集用于模型參數(shù)學習,測試集用來評價模型的準確率和泛化能力,并且本文分別從正負樣本中按比例選擇測試集,避免測試樣本的極度不均衡情況。深度學習模型參數(shù)收斂過程中學習率的設(shè)置是至關(guān)重要的,學習率過高時訓練過程容易振蕩而難以收斂,而學習率過低則導(dǎo)致訓練過慢,該模型采用隨機梯度下降算法SGD來進行反向傳播過程,設(shè)置初始學習率為0.1,在訓練的過程中動態(tài)改變學習率。本文設(shè)置一個monitor監(jiān)視準確率,當連續(xù)5個epoch 的準確率不再提升時,學習率以lr=lr*0.1 的形式減少。模型每次迭代處理20 張病理圖像,分30 個epoch 運行,每個epoch 迭代400 次,一共迭代12000 次,四種不同放大倍數(shù)(40X、100X、200X 和400X)的迭代過程如圖6 所示。由圖6 可知模型參數(shù)通過遷移學習初始化后訓練初期測試集損失值比較發(fā)散,但是隨著迭代的進行,參數(shù)逐漸收斂直到20個epoch左右損失值達到穩(wěn)定。
圖7 微調(diào)網(wǎng)絡(luò)訓練過程圖
為了更好地評價本文訓練的乳腺癌病理圖像良、惡性診斷模型,選擇與本文應(yīng)用在同一數(shù)據(jù)集BreakHis 上的優(yōu)秀方法進行對比,依據(jù)圖像準確率作為指標的對比結(jié)果如表3 所示。表3 中文獻[7]采用AlexNet 網(wǎng)絡(luò)作為深度學習模型,準確率為采用多種融合策略組合下的最優(yōu)結(jié)果;文獻[8]同樣基于AlexNet 網(wǎng)絡(luò),進一步結(jié)合DeCAF 特征從而獲得了更加優(yōu)秀的結(jié)果;文獻[9]采用了VGG 網(wǎng)絡(luò)+SVM 分類算法。文獻[10]采用GoogLeNet 作為深度學習模型,通過遷移學習與數(shù)據(jù)增強提升了網(wǎng)絡(luò)的性能。文獻[11]利用GoogLeNet 作為基礎(chǔ)網(wǎng)絡(luò),通過結(jié)構(gòu)化的形式與類結(jié)構(gòu)的先驗知識來實現(xiàn)學習。由表3 可知本文方法的識別準確率遠遠高于其他方法的識別率,并且在對良、惡性共8 種類型的腫瘤識別中平均準確率高達99.20%,表明模型具有較好的魯棒性和泛化能力。
表3 不同放大倍數(shù)中各方法識別正確率的對比
本文還從不同改進策略下的模型在BreakHis數(shù)據(jù)集上進行對比,分別為原生DenseNet-121 模型、改進結(jié)構(gòu)的DenseNet-121 模型和改進結(jié)構(gòu)并且加遷移學習的模型,三種模型采用相同的數(shù)據(jù)增強算法進行訓練,模型的表現(xiàn)能力如表4 所示。由表4 結(jié)果可知,改進結(jié)構(gòu)的模型預(yù)測的結(jié)果要遠遠優(yōu)于原生的DenseNet模型,表明改進結(jié)構(gòu)的模型有著更好的高層特征整合能力,并且改進結(jié)構(gòu)的模型減少了全連接層的參數(shù),網(wǎng)絡(luò)在樣本較少的情況下更容易擬合。改進結(jié)構(gòu)的模型通過遷移學習初始化參數(shù)后,模型的性能進一步提升,表明遷移學習的初始化參數(shù)能夠使模型學習到圖像的基本特征,在此之上利用BreakHis數(shù)據(jù)集進行微調(diào)學習,能夠使網(wǎng)絡(luò)學習到乳腺癌病理圖像中更豐富的特征并且有效防止了過擬合風險。
表4 不同改進策略下的模型準確率對比
本文基于改進的DenseNet 網(wǎng)絡(luò)實現(xiàn)乳腺癌病理圖像的良、惡性診斷,一方面避免了傳統(tǒng)機器學習中復(fù)雜的人工挑選特征過程,節(jié)省了時間與人力代價。另一方面深度學習模型能夠統(tǒng)一學習不同類型的腫瘤特征,相比傳統(tǒng)方法減少了工作量,加快了乳腺癌診斷效率。改進的DenseNet-121 網(wǎng)絡(luò)結(jié)構(gòu)更適合處理乳腺癌病理圖像,結(jié)合數(shù)據(jù)增強與遷移學習方法,模型能夠得到有效的訓練,實驗結(jié)果證明本文方法具有較高的識別準確率,并且具有較強的魯棒性和泛化能力,為臨床下的計算機輔助乳腺癌診斷提供了高效解決方案。