国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于卷積神經(jīng)網(wǎng)絡(luò)的白細(xì)胞二分類(lèi)的研究

2022-06-23 09:18:06崔兆文
關(guān)鍵詞:適應(yīng)度白細(xì)胞卷積

崔兆文,王 武

(貴州大學(xué) 電氣工程學(xué)院,貴陽(yáng) 550025)

0 引言

人體外周血是人體的不可或缺的成分,血液細(xì)胞數(shù)量的檢測(cè)是評(píng)估健康狀況的一項(xiàng)重要的指標(biāo)。血液細(xì)胞基本分為3 種,分別是紅細(xì)胞(Red Blood Cell,RBC)、白細(xì)胞(White Blood Cell,WBC)和血小板。傳統(tǒng)的血細(xì)胞儀耗時(shí)較長(zhǎng),并且會(huì)破壞血液中血細(xì)胞的形態(tài),不便于醫(yī)生對(duì)血液細(xì)胞的形態(tài)進(jìn)一步觀(guān)察。

隨著計(jì)算機(jī)水平的不斷提高,機(jī)器學(xué)習(xí)與深度學(xué)習(xí)迎來(lái)了快速的發(fā)展,特別是在圖像處理領(lǐng)域得到了越來(lái)越廣泛的應(yīng)用。本文主要研究血液中白細(xì)胞二分類(lèi)的問(wèn)題,即血液中白細(xì)胞分為有粒白細(xì)胞(又稱(chēng)為粒細(xì)胞)和無(wú)粒白細(xì)胞。

趙曉晴等人的研究將血液細(xì)胞色彩空間從RGB 轉(zhuǎn)到HSV,從而在HSV 圖層進(jìn)行分析,同時(shí)利用基于距離的分水嶺算法對(duì)圖像進(jìn)行分割。賈洪飛利用HIS 色彩空間對(duì)白細(xì)胞進(jìn)行定位,同時(shí)利用深度學(xué)習(xí)網(wǎng)絡(luò)完成對(duì)白細(xì)胞進(jìn)一步的分類(lèi)。Bodzás 等人提出一種基于傳統(tǒng)數(shù)字圖像處理技術(shù)和機(jī)器學(xué)習(xí)算法的自動(dòng)識(shí)別急性淋巴細(xì)胞白血病的方法,引入三階段過(guò)濾算法獲取最佳分割結(jié)果,應(yīng)用機(jī)器學(xué)習(xí)分類(lèi)器、人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)完成分類(lèi)工作。Chen 等人將特征提取和深度學(xué)習(xí)與光子時(shí)間拉伸實(shí)現(xiàn)的高通量定量成像相結(jié)合,捕獲定量光學(xué)相位和強(qiáng)度圖像,并提取單個(gè)細(xì)胞的多種生物物理特征,這些生物物理測(cè)量形成一個(gè)多維特征空間,用于細(xì)胞分類(lèi)。

本文使用改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)對(duì)人體外周血白細(xì)胞進(jìn)行分類(lèi),并在卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上引入衰減因子,防止卷積神經(jīng)網(wǎng)絡(luò)出現(xiàn)過(guò)擬合的情況,再通過(guò)粒子群算法優(yōu)化衰減因子參數(shù)。數(shù)據(jù)集為Kaggle上2018 年發(fā)布的數(shù)據(jù)集。

1 理論與方法

改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)方法血液白細(xì)胞圖像的總體分布框圖如圖1 所示。由圖1 可知,首先設(shè)計(jì)初始的卷積神經(jīng)網(wǎng)絡(luò),然后導(dǎo)入通過(guò)預(yù)處理的外周血白細(xì)胞圖片的數(shù)據(jù)集。在原有卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上引入衰減因子,防止卷積神經(jīng)網(wǎng)絡(luò)出現(xiàn)過(guò)擬合的情況,同時(shí)利用粒子群算法對(duì)衰減因子的參數(shù)進(jìn)行優(yōu)化,找到最適合卷積神經(jīng)網(wǎng)絡(luò)的衰減因子的參數(shù)。每一次衰減因子參數(shù)的更新都需要重新運(yùn)行一次網(wǎng)絡(luò)。接下來(lái),本文擬介紹卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)結(jié)構(gòu)設(shè)計(jì)、圖像預(yù)處理、學(xué)習(xí)率衰減以及粒子群算法。

圖1 改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)方法血液白細(xì)胞圖像的總體分布框圖Fig.1 General distribution block diagram of blood leukocytes images by improved convolutional neural network method

1.1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)

本文研究基于卷積神經(jīng)網(wǎng)絡(luò)的人體外周血白細(xì)胞二分類(lèi)的方法。卷積神經(jīng)網(wǎng)絡(luò)是一類(lèi)含卷積計(jì)算的前饋神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)的代表算法之一,卷積神經(jīng)網(wǎng)絡(luò)具有表征學(xué)習(xí)的能力,能夠?qū)斎胄畔⑦M(jìn)行平移不變的分類(lèi)。

卷積神經(jīng)網(wǎng)絡(luò)一般由輸入層、卷積層、池化層、全連接層和輸出層組成。其中,卷積層是實(shí)現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)特征提取功能的核心,相當(dāng)于特征提取器。池化層能夠壓縮數(shù)據(jù)和減少提取出圖像中的特征,進(jìn)而壓縮圖片。全連接層的輸入是將卷積層和池化層提取的特征進(jìn)行加權(quán),將特征空間通過(guò)非線(xiàn)性變換映射到樣本標(biāo)記空間。

卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)如圖2 所示。研究中,建立初步卷積神經(jīng)網(wǎng)絡(luò)框架,卷積神經(jīng)網(wǎng)絡(luò)由1 個(gè)輸入層、6 個(gè)卷積層、2 個(gè)池化層、1 個(gè)全連接層以及1 個(gè)輸出層組成。本文卷積核的大小均為3?3,步長(zhǎng)均為1,采用“SMAE”方式,保證輸入圖片和輸出圖片大小一致。本文池化核大小為2?2,步長(zhǎng)為2,采取最大池化的方法。文中設(shè)計(jì)的卷積神經(jīng)網(wǎng)絡(luò),以二分類(lèi)為例,得到的每層信息見(jiàn)表1。由表1 可知,第一個(gè)卷積層的卷積核個(gè)數(shù)為32,第二個(gè)卷積層的卷積核個(gè)數(shù)為64,第三個(gè)卷積層的卷積核個(gè)數(shù)為128,第四個(gè)卷積層的卷積核個(gè)數(shù)為192,第五個(gè)卷積層的卷積核個(gè)數(shù)為128,全連接層神經(jīng)元個(gè)數(shù)為256,輸出層神經(jīng)元個(gè)數(shù)為2。

圖2 卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)圖Fig.2 Architecture of convolutional neural network

表1 二分類(lèi)卷積神經(jīng)網(wǎng)絡(luò)信息表Tab.1 Information table of binary convolutional neural network

本文選取的作為神經(jīng)元在卷積層與全連接層的激活函數(shù)的數(shù)學(xué)公式可寫(xiě)為:

其中,max 表示取0 和中的最大值。

本文選取的作為神經(jīng)元在輸出層的激活函數(shù),可使得輸出層神經(jīng)元輸出映射到(0,1)區(qū)間內(nèi),方便損失函數(shù)的建立。該激活函數(shù)的數(shù)學(xué)公式為:

其中,z表示輸出層第激活函數(shù)的輸入。

本文選取的作為卷積神經(jīng)網(wǎng)絡(luò)的損失函數(shù)的數(shù)學(xué)公式具體如下:

1.2 圖像預(yù)處理

數(shù)字圖像的采集是在復(fù)雜的環(huán)境中進(jìn)行的,在采集與傳輸?shù)倪^(guò)程中,難免會(huì)引入噪聲,為了能夠?qū)ρ簣D像做到更好的識(shí)別,即需對(duì)原始血液圖像進(jìn)行處理。所以首先需要進(jìn)行圖像濾波。圖像濾波的方式主要有2 種:線(xiàn)性濾波和非線(xiàn)性濾波。其中,線(xiàn)性濾波的方式、比如均值濾波,對(duì)高斯噪聲有較好的抑制作用,但是并不能較好地保護(hù)圖像的細(xì)節(jié)信息,導(dǎo)致圖片變得模糊。非線(xiàn)性濾波、比如中值濾波,能夠較好地保護(hù)圖像的細(xì)節(jié)信息,保持圖片的清晰度。本文選用的是中值濾波。

在中值濾波后,需要對(duì)圖片的尺寸進(jìn)行處理,原圖像是640?480?3 像素,本文將圖片壓縮成56?56?3 像素的圖片,方便計(jì)算機(jī)處理與識(shí)別。

1.3 學(xué)習(xí)率衰減

在卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的過(guò)程中,隨著訓(xùn)練的進(jìn)行、學(xué)習(xí)率將逐漸衰減,這樣有利于卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)模型的建立。在訓(xùn)練過(guò)程開(kāi)始時(shí),使用較大的學(xué)習(xí)率值,可以使結(jié)果快速收斂,隨著訓(xùn)練的進(jìn)行,逐步降低學(xué)習(xí)率和收斂的速度,有助于找到最優(yōu)結(jié)果。目前,比較常用的2 種學(xué)習(xí)率衰減方法:線(xiàn)性衰減和指數(shù)衰減。本文采用的是指數(shù)衰減的方式。指數(shù)衰減的數(shù)學(xué)定義的公式表述為:

其中,表示當(dāng)前學(xué)習(xí)率;_表示初始學(xué)習(xí)率;表示衰減指數(shù);表示當(dāng)前迭代次數(shù);_表示調(diào)整系數(shù);?」 表示對(duì)符號(hào)內(nèi)的數(shù)值向下取整。

利用這種衰減方式進(jìn)行學(xué)習(xí)率的更新,可以使得學(xué)習(xí)率的更新速度較慢,容易建立識(shí)別率較高的深度學(xué)習(xí)模型。

1.4 粒子群算法

粒子群算法(Particle Swarm Optimization,PSO),從隨機(jī)解出發(fā),并利用迭代尋找最優(yōu)解,通過(guò)適應(yīng)度來(lái)評(píng)定解的品質(zhì)。這種算法具有實(shí)現(xiàn)容易、精度高、收斂快等優(yōu)點(diǎn)。

在維空間中,設(shè)有個(gè)粒子,粒子的位置為x=(x,xx,…,x),將x代入適應(yīng)函數(shù)(x)可以求取函數(shù)值;粒子的速度為v=(v,v,v,…,v),粒子個(gè)體經(jīng)過(guò)的最佳位置:pbest=(p,p,p,…,p),種群所經(jīng)歷的最佳位置gbest=(,,,…,g),通常迭代中粒子的速度和位置應(yīng)該被限制,即在第(1 ≤≤)維的位置變化范圍限定 在 [,]內(nèi),速度變化范圍限定在[]內(nèi),粒子在第維的速度更新公式見(jiàn)如下:

由以上公式推知,粒子速度的更新與粒子先前的速度有關(guān),粒子當(dāng)前位置與粒子最佳位置的偏差以及粒子當(dāng)前位置與種群最佳位置的偏差有關(guān)。

粒子群算法優(yōu)化流程如圖3 所示。由圖3 可知,首先對(duì)粒子群進(jìn)行初始化,包括群體的規(guī)模大小、粒子的隨機(jī)位置以及粒子的初始速度。根據(jù)適應(yīng)度評(píng)價(jià)函數(shù),確定每個(gè)粒子的適應(yīng)度,每個(gè)粒子將其當(dāng)前適應(yīng)度與歷史最佳適應(yīng)度做比較,如果當(dāng)前適應(yīng)值比歷史最佳適應(yīng)值更高,更新當(dāng)前位置為粒子歷史最佳位置;同樣地,將粒子當(dāng)前位置與種群最佳位置進(jìn)行比較,如果當(dāng)前適應(yīng)度高,更新當(dāng)前位置為粒子歷史最佳位置。根據(jù)式(6)和式(7)更新粒子的速度與位置。繼續(xù)根據(jù)適應(yīng)度評(píng)價(jià)函數(shù)來(lái)判斷,確定更新后的參數(shù)。繼續(xù)反復(fù)進(jìn)行參數(shù)的更新,直到滿(mǎn)足條件或達(dá)到最大迭代次數(shù)。

圖3 粒子群算法優(yōu)化流程圖Fig.3 Flow chart of Particle Swarm Optimization algorithm

本文主要是使用粒子群算法對(duì)衰減因子中的_、和_參數(shù)進(jìn)行優(yōu)化。同時(shí),本文選取的粒子群優(yōu)化算法的適應(yīng)度函數(shù)可寫(xiě)為如下形式:

其中,()表示適應(yīng)度函數(shù);Loss()表示訓(xùn)練數(shù)據(jù)的損失函數(shù); Loss()表示測(cè)試數(shù)據(jù)的損失函數(shù);表示衰減因子(_,,_)三個(gè)參數(shù)的集合變量。

為了減少神經(jīng)網(wǎng)絡(luò)每次初始參數(shù)不一致帶來(lái)的偏差,取同一參數(shù)下3 次神經(jīng)網(wǎng)絡(luò)的損失函數(shù)的平均值作為某一粒子的適應(yīng)度函數(shù)。同時(shí),當(dāng)粒子參數(shù)一致時(shí),能夠直接獲取其適應(yīng)函數(shù),不需要進(jìn)行復(fù)雜的計(jì)算就能得到其適應(yīng)度函數(shù)。

2 實(shí)驗(yàn)數(shù)據(jù)與結(jié)果分析

圖像處理與分析實(shí)驗(yàn)的結(jié)果是基于Tensorflow的Kears 深度學(xué)習(xí)框架下進(jìn)行的,操作系統(tǒng)是Windows10,編程語(yǔ)言為Python,使用的編譯軟件是Pycharm 與Spyder。硬件配置的處理器為Intel(R)Core(TM)i5-9400F CPU,運(yùn)行內(nèi)存為16 G,顯卡型號(hào)為NVIDIA GeForce GTX 1650。

2.1 實(shí)驗(yàn)數(shù)據(jù)

數(shù)據(jù)集為Kaggle 上發(fā)布的數(shù)據(jù)集,數(shù)據(jù)集中原始圖片共計(jì)400 張,數(shù)據(jù)集發(fā)布者通過(guò)數(shù)據(jù)增強(qiáng)手段將400 張?jiān)紙D片拓展成12444 張圖片。在原始數(shù)據(jù)中,無(wú)粒白細(xì)胞圖片為54 張,有粒白細(xì)胞圖片為346 張,無(wú)粒白細(xì)胞與有粒白細(xì)胞數(shù)據(jù)相差較大,這是上文中提到的要改進(jìn)損失函數(shù)的原因。發(fā)布拓展后的圖片訓(xùn)練集與測(cè)試集,訓(xùn)練數(shù)據(jù)圖片9957 張,測(cè)試數(shù)據(jù)圖片2487 張。在訓(xùn)練集中,無(wú)粒白細(xì)胞圖片為4961 張,有粒白細(xì)胞圖片為4996 張;在測(cè)試集中,無(wú)粒白細(xì)胞圖片為1240 張,有粒白細(xì)胞圖片為1247 張。血液細(xì)胞的示意如圖5 所示。

圖4 血液細(xì)胞原始圖片F(xiàn)ig.4 Original picture of blood cells

圖5 不同模型下的損失函數(shù)和準(zhǔn)確度Fig.5 Loss function and accuracy under different models

2.2 模型對(duì)比

本文做了3 種網(wǎng)絡(luò)模型的對(duì)比實(shí)驗(yàn),分別是:本文提出的網(wǎng)絡(luò)、GoogLeNet 網(wǎng)絡(luò)和ResNet 網(wǎng)絡(luò)。實(shí)驗(yàn)對(duì)比結(jié)果如圖6 所示。由圖6 可知,本文的算法相較于GoogLeNet 網(wǎng)絡(luò)無(wú)論在損失、還是在準(zhǔn)確度上都有著較為明顯的提升,和ResNet 網(wǎng)絡(luò)在訓(xùn)練集的運(yùn)行效果上相差不大。在測(cè)試集上,本文提出的網(wǎng)絡(luò)優(yōu)于ResNet 網(wǎng)絡(luò)。結(jié)果說(shuō)明本文提出的網(wǎng)絡(luò)無(wú)論在訓(xùn)練集、還是測(cè)試集均有著較好的效果,即本文模型要優(yōu)于GoogLeNet 網(wǎng)絡(luò)和ResNet 網(wǎng)絡(luò)。

圖6 卷積神經(jīng)網(wǎng)絡(luò)模型混淆矩陣Fig.6 Convolutional neural network model confusion matrix

本文建立的模型混淆矩陣如圖7 所示。圖7中,‘A’表示無(wú)粒白細(xì)胞,‘B’表示有粒白細(xì)胞。由圖7 分析可知,(,)=1198 表示血液圖片中實(shí)際標(biāo)簽與預(yù)測(cè)標(biāo)簽均為無(wú)粒白細(xì)胞有1198 個(gè),識(shí)別正確;(,)=1201 表示血液圖片中實(shí)際標(biāo)簽與預(yù)測(cè)標(biāo)簽均為有粒白細(xì)胞有1201 個(gè),識(shí)別正確;(,)=42 表示實(shí)際標(biāo)簽為有粒白細(xì)胞、但識(shí)別標(biāo)簽為無(wú)粒白細(xì)胞有42 個(gè),識(shí)別錯(cuò)誤;(,)=46 表示實(shí)際標(biāo)簽為無(wú)粒白細(xì)胞、但識(shí)別標(biāo)簽為有粒白細(xì)胞有46 個(gè),識(shí)別錯(cuò)誤。卷積神經(jīng)網(wǎng)絡(luò)模型對(duì)無(wú)粒白細(xì)胞識(shí)別率為96.61%,對(duì)有粒白細(xì)胞識(shí)別率為96.56%,識(shí)別效果基本一致。

3 結(jié)束語(yǔ)

外周血白細(xì)胞檢測(cè)作為一項(xiàng)醫(yī)院的常規(guī)檢查,對(duì)于許多疾病的診療判斷有著重要的作用。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的神經(jīng)網(wǎng)絡(luò)對(duì)血液細(xì)胞有較好的識(shí)別效果。本文研究基于卷積神經(jīng)網(wǎng)絡(luò)框架完成血液白細(xì)胞二分類(lèi)算法的設(shè)計(jì),白細(xì)胞二分類(lèi)準(zhǔn)確度在96.46%,基本能夠滿(mǎn)足白細(xì)胞分類(lèi)識(shí)別的要求。能夠有效地減少相關(guān)醫(yī)師的工作量,提高工作質(zhì)量。但是眾所周知,通常對(duì)醫(yī)療圖像分類(lèi)的準(zhǔn)確率都有較高要求,繼續(xù)提高模型的準(zhǔn)確率是一個(gè)值得長(zhǎng)期研究的問(wèn)題。本文僅研究了外周血白細(xì)胞的二分類(lèi)卷積神經(jīng)網(wǎng)絡(luò)模型的搭建,對(duì)疾病的檢測(cè)有一定的幫助,未來(lái)可以探索外周血白細(xì)胞五分類(lèi),以及異常白細(xì)胞識(shí)別的研究。

猜你喜歡
適應(yīng)度白細(xì)胞卷積
改進(jìn)的自適應(yīng)復(fù)制、交叉和突變遺傳算法
白細(xì)胞
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
白細(xì)胞降到多少應(yīng)停止放療
人人健康(2017年19期)2017-10-20 14:38:31
基于空調(diào)導(dǎo)風(fēng)板成型工藝的Kriging模型適應(yīng)度研究
一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識(shí)別方法
雞住白細(xì)胞蟲(chóng)病防治體會(huì)
少數(shù)民族大學(xué)生文化適應(yīng)度調(diào)查
津南区| 石渠县| 海原县| 伊金霍洛旗| 锦州市| 甘孜县| 蛟河市| 宝鸡市| 菏泽市| 温泉县| 绥滨县| 玉山县| 通山县| 腾冲县| 务川| 左云县| 金山区| 嘉定区| 调兵山市| 淮北市| 泗水县| 新田县| 普宁市| 耒阳市| 沅江市| 金湖县| 外汇| 定远县| 临潭县| 浦县| 鄂托克旗| 江北区| 自贡市| 德惠市| 电白县| 博乐市| 郯城县| 平远县| 顺昌县| 临汾市| 五峰|