李作仁 王佳玉 安雨桐 祁欣
摘要:計(jì)算機(jī)視覺是一門研究如何使用機(jī)器來觀察、理解世界的科學(xué),尤其在這信息技術(shù)快速發(fā)展的時(shí)代,用計(jì)算機(jī)視覺技術(shù)對圖像信息進(jìn)行處理、分析顯得尤為重要。圖像分割是圖像分析、理解和識(shí)別的基礎(chǔ),分割效果直接決定了后續(xù)圖像分析和識(shí)別的性能。圖像識(shí)別是圖像處理領(lǐng)域的一部分,是在圖像分類基礎(chǔ)上進(jìn)一步對圖像分割、識(shí)別的研究。[1]目前,已產(chǎn)生了很多圖像分割算法,其中基于神經(jīng)網(wǎng)絡(luò)的圖像分割算法應(yīng)用最為廣泛。但由于傳統(tǒng)前饋神經(jīng)網(wǎng)絡(luò)在處理圖像分割時(shí)存在迭代次數(shù)多、易陷入局部最優(yōu)等問題,嚴(yán)重影響了其發(fā)展及應(yīng)用。而極限學(xué)習(xí)機(jī)是一種新的機(jī)器學(xué)習(xí)算法,由于其可調(diào)參數(shù)少,學(xué)習(xí)速度快以及良好的泛化性能等優(yōu)點(diǎn),正日漸受到眾多研究學(xué)者們的追捧。該文就以極限學(xué)習(xí)機(jī)的圖像分割算法為基礎(chǔ),在確定了最優(yōu)參數(shù)的基礎(chǔ)上,建立了基于ELM的圖像分割算法,并且通過仿真實(shí)驗(yàn)對算法的正確性和有效性進(jìn)行了驗(yàn)證,指出這種算法能夠更加快速地完成對圖像的分割,并且圖像分割孤立點(diǎn)少,邊緣明顯,同時(shí)該算法大大地縮短了樣本的訓(xùn)練時(shí)間。
關(guān)鍵詞:圖像識(shí)別;圖像分割;機(jī)器學(xué)習(xí);極限學(xué)習(xí)機(jī);前饋神經(jīng)網(wǎng)絡(luò);仿真測試
中圖分類號(hào):TP75 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)03-0207-03
1概述
我們擬基于極限學(xué)習(xí)機(jī)來研究圖像分割技術(shù)。研究實(shí)驗(yàn) 基于極限學(xué)習(xí)機(jī)的圖像分割算法在確定了最優(yōu)參數(shù)的基礎(chǔ)上,建立了基于ELM的圖像分割算法,最后仿真實(shí)驗(yàn)證明本文提出的算法能快速有效的分割圖像。
圖像分割是圖像處理與圖像分析領(lǐng)域中的關(guān)鍵環(huán)節(jié),其目的是將圖像中具有特征的部分內(nèi)容更加準(zhǔn)確的提取出來,以便展開更加深入的分析,使得對圖像的理解和描述能夠更加全面,在實(shí)踐中也取得了一個(gè)成果。本文基于極限學(xué)習(xí)法所提出的圖像分割算法所具有的優(yōu)勢更加突出,不僅能夠極大的提升學(xué)習(xí)的速度,同時(shí)還具有更好的泛化性,相關(guān)參數(shù)也能夠及時(shí)確定,對傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中的錯(cuò)誤信息和冗余信息等進(jìn)行優(yōu)化和改進(jìn),實(shí)驗(yàn)表明采用這種方法還能夠極大的縮減網(wǎng)絡(luò)訓(xùn)練的時(shí)間。
2 極限學(xué)習(xí)機(jī)
單隱藏層前饋神經(jīng)網(wǎng)絡(luò)(SLFN)在實(shí)際應(yīng)用中較為廣泛,所具有的優(yōu)勢也逐漸顯現(xiàn)出來,具體有如下兩點(diǎn):、
(1)在學(xué)習(xí)能力方面表現(xiàn)突出,非常接近于更加復(fù)雜的非線性函數(shù);
(2)能夠解決一些傳統(tǒng)參數(shù)方法不能有效解決的問題;
正是由于ELM具有結(jié)構(gòu)簡單、學(xué)習(xí)速度快、泛化能力強(qiáng)和良好的全局搜索能力等優(yōu)點(diǎn),使得國內(nèi)外越來越多的學(xué)者專家們對極限學(xué)習(xí)機(jī)進(jìn)行研究,促使極限學(xué)習(xí)機(jī)在工業(yè)、電子等眾多領(lǐng)域得到應(yīng)用。[5]
極限學(xué)習(xí)機(jī)作為一種前饋神經(jīng)網(wǎng)絡(luò)的新型學(xué)習(xí)算法,它具有學(xué)習(xí)時(shí)間短、算法簡單易于實(shí)現(xiàn)和良好的泛化性能等優(yōu)點(diǎn),現(xiàn)已經(jīng)被廣泛應(yīng)用于人工智能的函數(shù)擬合和分類等應(yīng)用領(lǐng)域。極限學(xué)習(xí)機(jī)算法如下所示:
假設(shè)存在N個(gè)學(xué)習(xí)樣本矩陣[(xi,yi)],ELM所對應(yīng)的目標(biāo)函數(shù)為[fxi],向量[xi=xi1,xi2,…,xinT∈Rn],向量[yi=yi1,yi2,…,yimT∈Rm],i在[1,N]區(qū)間內(nèi),同時(shí)設(shè)定網(wǎng)絡(luò)的L個(gè)單隱含層節(jié)點(diǎn)和隱含層節(jié)點(diǎn)激勵(lì)函數(shù)[g(xi)]是已給定的,那么有[βi,wi,bi],從而令SLFNs可以無限趨近于0誤差的情況下更傾向于這N個(gè)樣本,其數(shù)學(xué)公式如下:
3 極限學(xué)習(xí)機(jī)在圖像分割中的應(yīng)用
本文主要在血細(xì)胞圖像分割中應(yīng)用極限學(xué)習(xí)機(jī)的具體情況進(jìn)行論述,并通過相關(guān)實(shí)驗(yàn)進(jìn)行驗(yàn)證。首先對血細(xì)胞進(jìn)行提取,然后進(jìn)行利用極限學(xué)習(xí)機(jī)ELM算法進(jìn)行圖像分割,對圖像預(yù)處理提取圖像特征。最后matlab7.0對處理結(jié)果進(jìn)行仿真分析。實(shí)驗(yàn)的計(jì)算機(jī)的為Genuine Intel(R) CPU T1500 @1.86GH,內(nèi)存3GB;計(jì)算機(jī)系統(tǒng)為Microsoft windows XP Professional版本2002 ServicePack3操作系統(tǒng)。
血細(xì)胞圖片是由醫(yī)院相關(guān)專業(yè)人員對血液進(jìn)行Wright染色后,制成血液涂片,再使用顯微鏡進(jìn)行100x 10倍放大處理后,通過彩色攝像機(jī)進(jìn)行拍照而得到的顯微細(xì)胞圖像。[7]由于細(xì)胞圖片來源不同醫(yī)學(xué)圖庫,是由不同的人在不同的染色條件下通過不同的顯微鏡觀察獲取的,所以圖像庫里的血細(xì)胞顯微圖像含有各種條件下觀察到的不同質(zhì)量的細(xì)胞圖片,由這些細(xì)胞圖片進(jìn)行實(shí)驗(yàn)得到的結(jié)果非常具有代表性。
分割流程:
第一步,獲取待分割圖像,選擇一些特征相似,圖像清晰,待分割部分邊界明顯,可區(qū)分性比較強(qiáng),目標(biāo)區(qū)域完整的圖像準(zhǔn)備對其進(jìn)行分割。
第二步,圖像預(yù)處理,采用中值濾波法,直方圖均衡化等方法對圖像進(jìn)行去噪,增強(qiáng)圖像對比度等功能。
第三步,對圖像進(jìn)行特征提取,對圖像的顏色,紋理,形狀,空間關(guān)系等特征進(jìn)行提取。
第四步,利用ELM 進(jìn)行圖像分割,訓(xùn)練樣本集預(yù)測數(shù)據(jù),直至把所有的預(yù)測數(shù)據(jù)預(yù)測完畢。保存并將分類后得到的結(jié)果還原成圖像矩陣,得到分割后的圖像。[8]
圖像預(yù)處理:
圖像的預(yù)處理方面去噪采用的方法是中值濾波法,中值濾波在原理上是將數(shù)字圖像或者是數(shù)字序列中選擇一個(gè)點(diǎn),并將這個(gè)店作為鄰域各點(diǎn)值的中值,從而使周邊像素值能夠與真實(shí)值更加接近,進(jìn)而除去其中存在的孤立的噪聲點(diǎn),因而中值濾波這種方法在過濾圖像方面所形成的效果非常顯著。
圖像特征提?。?/p>
圖像特征提取是圖像識(shí)別過程中一項(xiàng)關(guān)鍵技術(shù),如今比較常見的圖像特征由色彩、形狀、力矩、紋理等。人體細(xì)胞由于種類繁多,需要對圖像展開相應(yīng)的處理,然而這一處理的過程也是對細(xì)胞信息進(jìn)行識(shí)別和篩選的過程,能夠?qū)⑵渲写罅康募?xì)胞信息整理出來,尤其是異性細(xì)胞,具體包括異性細(xì)胞的輪廓面積、輪廓周長、輪廓焦點(diǎn)和相關(guān)的色彩信息等。需要找到一種數(shù)據(jù)分析方法,用以提取有效細(xì)胞特征。
基于ELM進(jìn)行圖像分割:
獲取圖像特征后進(jìn)行對樣本的處理,首先要明確銀行層神經(jīng)的數(shù)量,隨后對輸入層和隱含層之間的連接權(quán)值ω以及隱含層神經(jīng)元的偏置b進(jìn)行確認(rèn),然后確定隱含層神經(jīng)元的激活函數(shù),這一激活函數(shù)是無限可微的函數(shù),然后通過列出隱含層輸出矩陣H進(jìn)行相關(guān)技術(shù),從而獲得模型泛化性能權(quán)值β。[10]
將輸出層權(quán)值篩選出來,添加進(jìn)訓(xùn)練樣本集,從而獲得新的訓(xùn)練樣本集,并據(jù)此對下組數(shù)據(jù)進(jìn)行預(yù)測,這一過程循環(huán)進(jìn)行直到所有預(yù)測數(shù)據(jù)全部完成,而后保存到相應(yīng)分類,將所獲得的結(jié)果代回到原來的圖像矩陣中,進(jìn)而獲得分割后的數(shù)字圖形。
4仿真實(shí)驗(yàn)及分析
(1)圖像對比結(jié)果
通過MATLAB實(shí)驗(yàn)來對其有效性與正確性實(shí)施驗(yàn)證,同時(shí)與三種算法進(jìn)行比對,即脈沖禍合神經(jīng)網(wǎng)絡(luò)算法、遺傳神經(jīng)網(wǎng)絡(luò)算法、BP神經(jīng)網(wǎng)絡(luò)算法的結(jié)果進(jìn)行比較,如圖2所示。在本實(shí)驗(yàn)中,激活函數(shù)為sig,通過線性相加的試驗(yàn)使隱形神經(jīng)元從10逐漸遞增,最后取60為最好。在上述實(shí)驗(yàn)中,算法運(yùn)行次數(shù)均為2000次,選取的結(jié)果為運(yùn)行2000次的平均值。在原圖的基礎(chǔ)上融入高斯白噪聲,并將其分為6×6的鄰域窗口,對于圖像邊緣地區(qū)通過邊界復(fù)制的方法來進(jìn)行填充。
從主觀的角度展開分析,極限學(xué)習(xí)機(jī)圖像分割算法能夠更好的規(guī)避噪音所產(chǎn)生的影響,從而使圖像的效果更為清晰,孤立點(diǎn)更少,邊緣處理更好,能夠使目標(biāo)區(qū)域的顯示更加清晰完整。
在進(jìn)行對比的過程中,圖中紅色區(qū)域?yàn)橛?xùn)練樣本,其訓(xùn)練樣本點(diǎn)的個(gè)數(shù)共計(jì)5500個(gè),并于其他三種算法進(jìn)行比較,其結(jié)果如表2所示。
如表2所示,樣本訓(xùn)練時(shí)間最長的為BP神經(jīng)網(wǎng)絡(luò),本文提出的分割算法則極大地縮短了樣本訓(xùn)練的時(shí)間,并且在抗噪性與精度方面表現(xiàn)更加突出。實(shí)驗(yàn)表明,本文所研究的算法能夠更好地完成圖像分割,從而使圖像顯示的更加清晰,對將來圖像分割的方法也是一種積極的探索。
5 總結(jié)
對細(xì)胞圖像分割,通常的方法都需要人工參與,需要手動(dòng)選擇目標(biāo)區(qū)域范圍或手動(dòng)選擇種子像素。而本文實(shí)現(xiàn)的是自動(dòng)細(xì)胞圖像分割,本章則是介紹如何進(jìn)行自動(dòng)分割,即自動(dòng)分割的步驟流程。
本文闡述的自動(dòng)細(xì)胞分割流程有:
1)血細(xì)胞細(xì)胞核自動(dòng)提取。
2)對細(xì)胞核核區(qū)進(jìn)行膨脹。
3)根據(jù)膨脹得到的區(qū)域?qū)?xì)胞圖像進(jìn)行正負(fù)樣本標(biāo)記。
4)從標(biāo)記的正負(fù)樣本區(qū)域通過一定的樣本選擇策略選取正負(fù)樣本。
5)利用選取的正負(fù)樣本訓(xùn)練多個(gè)ELM分類子模型,利用bagging集成策略對分類子模型進(jìn)行集成,得到ELM總分類模型。
6)利用訓(xùn)練得到的ELM總分類模型對細(xì)胞圖像進(jìn)行分類,獲得需要的分害結(jié)果。
參考文獻(xiàn):
[1] Vapnik V,Chervonenkis A. The Necessary and Sufficient Conditions for Consistency in the Empirical Risk Minimization Method [J]. Pattern Recognition and Image Analysis, 1991,1(3):283-305.
[2] Saurabh Agrawal, Nishchal K Verma, Prateek Tamrakar, et al. Content Based Color Image Classification using SVM[C].2011 Eighth International Conference on Information Technology: New Generations, 2011,202:1090-1094.
[3] Chapelle O, Haffner P, Vapnik V N. Support vector machines classification [J].IEEE Transactions on Neural Networks, for histogram-based image 1999,10 CS):1055-1064.
[4] Gale S,Vestheim S,Gravdahl J T, et al. RBF network pruning techniques for adaptive learning controllers[C]. 2013 9th Workshop on IEEE, 2013:246-251.
[5] Zhao Z, Chen Z, Chen Y, et al. A Class Incremental Extreme Learning Machine for Activity Recognition[J]. Cognitive Computation, 2014:1-9.
[6] Bueno-Crespo A, Garcia-Laencina P J, Sancho-Gomez J L. Neural architecture design based on extreme learning machine [J]. Neural Networks, 2013,48:1924 Sunday H, Silver D, Gagvani N, et al. Skeleton based shape matching and retrieval[C].Shape Modeling International, 2003,IEEE, 2003:130-139.
[7] Patterson A, Akinwande A I. Elementary framework for cold field emission: Incorporation of quantum-confinement effects[J]. Journal of Applied Physics, 2013,114(23):23-4303.
[8] Wang J, Li X, Lu L, et al. Parameter sensitivity analysis of crop growth models based on the extended Fourier Amplitude Sensitivity Test method [J]. Environmental Modelling & Software, 2013,48:171-182.
[9] Huang G B, Zhou H, Ding X, etal. Extreme learning machine for regression and multiclass classification[J].IEEE Transactions on Systems, Man, and Cybernetics-Part B: Cybernetics, 2012, 42(2):523-529.
[10] A. Sathya, S.Senthil, Anudevi Samuel. Segmentation of Breast MRI Using Effective Fuzzy C-Means Method Based On Support Vector Machine[C].2012 World Congress on Information and Communication Technologies, 2012 (2):67-72.