楊 旭,何鴻宇,李金鎖,廖 源,周同馳
(1.河南省工業(yè)物聯(lián)網(wǎng)應(yīng)用工程技術(shù)研究中心,河南 南陽 473005;2.河南工業(yè)職業(yè)技術(shù)學(xué)院,河南 南陽 473005;3.中原工學(xué)院,河南 鄭州 451191)
脈沖耦合神經(jīng)網(wǎng)絡(luò)(pulse coupled neural networks,PCNN)主要通過非線性方式將反饋通道、鏈接進(jìn)行耦合作為狀態(tài)信息,之后與學(xué)習(xí)的閾值比較,最終實(shí)現(xiàn)神經(jīng)元的激活和抑制。目前,基于該模型的應(yīng)用主要有圖像分割、去噪、增強(qiáng)、融合以及小目標(biāo)檢測等[1-7]。從理論上講,PCNN模型抑制噪聲的能力優(yōu)于其他分割方法,如k-means、FCM、GMM以及Otsu等。但PCNN模型參數(shù)眾多,除學(xué)習(xí)動(dòng)態(tài)閾值外,其他參數(shù)通常依據(jù)經(jīng)驗(yàn)或?qū)嶒?yàn)設(shè)置,同時(shí),對于不同類型的圖像,參數(shù)的普適性較差。
2002年,馬義德等[7]首次將香農(nóng)熵理論應(yīng)用到PCNN模型中。在分析與研究無耦合和耦合連接2種狀態(tài)數(shù)學(xué)模型的基礎(chǔ)上,鄧翔宇等[8]提出基于PCNN模型圖像分割參數(shù)自適應(yīng)設(shè)定方法。趙彥明[9]對參數(shù)自適應(yīng)設(shè)置及模型改進(jìn),在圖像檢索領(lǐng)域取得了良好效果。李瀚等[10]解決PCNN模型中多個(gè)參數(shù)需憑經(jīng)驗(yàn)設(shè)定的問題,改進(jìn)參數(shù)尋優(yōu)網(wǎng)格搜索算法。徐亮等[11]采用熵和能量作為適應(yīng)度函數(shù),通過PSO優(yōu)化PCNN模型參數(shù)。錢煒等[12]將PCNN中3個(gè)參數(shù)當(dāng)作粒子,采用圖像熵作為PSO優(yōu)化算法的適應(yīng)度函數(shù)。廖傳柱等[13]利用人工蜂群算法優(yōu)化PCNN模型的3個(gè)參數(shù),即輸出、連接系數(shù)和閾值參數(shù),該方法是一種改進(jìn)的自適應(yīng)PCNN模型,采用可視圖像和醫(yī)學(xué)圖像驗(yàn)證其優(yōu)越性。同樣,為解決多參數(shù)設(shè)定以及評價(jià)準(zhǔn)則單一的問題,張坤華等[14]采用單調(diào)遞增閾值搜索策略,采用自動(dòng)尋優(yōu)方式學(xué)習(xí)PCNN模型的時(shí)間衰減因子、連接系數(shù)以及迭代次數(shù),最終實(shí)現(xiàn)圖像的自適應(yīng)分割。
在以上方法的基礎(chǔ)上,針對脈沖耦合神經(jīng)網(wǎng)絡(luò)模型參數(shù)眾多的問題,本文采用粒子群算法(particle swarm optimization ,PSO)優(yōu)化學(xué)習(xí)PCNN模型的參數(shù),通過仿真實(shí)驗(yàn),比較分析了PSO優(yōu)化二參數(shù)(耦合系數(shù)、閾值)、三參數(shù)PCNN模型(耦合系數(shù)、時(shí)間衰減因子以及脈沖輸出乘積系數(shù))在圖像分割中的性能。
粒子群算法(PSO)、遺傳算法 (genetic algorithm,GA)、蟻群、模擬退火和蛙跳算法(SFLA)等是一族經(jīng)典的群體智能優(yōu)化算法[12,15-16],其中,PSO是一個(gè)發(fā)展較早、理論成熟的群體智能優(yōu)化算法。該優(yōu)化算法采用虛擬粒子方式,根據(jù)粒子位置、速度信息,通過適應(yīng)度函數(shù)逐步逼近目標(biāo)。因此,該算法有5個(gè)重要參數(shù),分別為自適應(yīng)函數(shù)、粒子坐標(biāo)、速度、種群大小、迭代次數(shù)或終止條件。適應(yīng)度函數(shù)是結(jié)合應(yīng)用和場景而制定的學(xué)習(xí)結(jié)果評價(jià)準(zhǔn)則,用來評價(jià)當(dāng)前粒子狀態(tài)的優(yōu)劣。依據(jù)評價(jià),篩選優(yōu)異的個(gè)體粒子和種群粒子,分別記作Pbest和Gbest,根據(jù)篩選的結(jié)果,重新制定粒子飛行的規(guī)則。當(dāng)?shù)K止時(shí),Gbest作為最佳解,用以表示獲得最佳結(jié)果時(shí)的模型參數(shù)。粒子位置和速度維度是由優(yōu)化學(xué)習(xí)模型參數(shù)的個(gè)數(shù)決定,粒子位置即為在解空間的求解,粒子的初始位置通常采用隨機(jī)化初始或其他算法的結(jié)果作為粒子的初始位置。粒子速度由解空間的大小等決定。種群大小和迭代次數(shù)依據(jù)求解問題的復(fù)雜度,根據(jù)經(jīng)驗(yàn)設(shè)置。迭代終止條件由設(shè)定次數(shù)或相鄰迭代適應(yīng)度值的差值決定。
對于PSO求解一個(gè)非凸優(yōu)化問題,通常情況下,假設(shè)參數(shù)z和v表示PSO優(yōu)化模型的2個(gè)重要參數(shù),其中,zi=(zi1,zi2,…,zid)表示某時(shí)刻粒子的位置,vi=(vi1,vi2,…,vid)表示某一時(shí)刻或迭代第i個(gè)粒子的速度,d為信息數(shù)據(jù)的維度。對于每個(gè)粒子,根據(jù)實(shí)際應(yīng)用需求的標(biāo)準(zhǔn),定義一個(gè)合適的適應(yīng)度函數(shù)(或目標(biāo)函數(shù)),評價(jià)每個(gè)虛擬粒子的優(yōu)劣。若某一粒子通過評價(jià)函數(shù),其適應(yīng)度值優(yōu)于其在前一時(shí)刻的適應(yīng)度值,則將當(dāng)前粒子作為最優(yōu)個(gè)體;否則,將該粒子在上一時(shí)刻或迭代的位置信息作為當(dāng)前粒子的位置信息(不考慮其在上一時(shí)刻的速度信息)。所有粒子經(jīng)適應(yīng)度函數(shù)評價(jià)后,選出最優(yōu)粒子,并將其作為該種群中最優(yōu)粒子,即當(dāng)前的全局最優(yōu)。在這里,采用pi=(pi1,pi2,…,pid)表示第i個(gè)粒子在某一時(shí)刻或迭代過程中搜索到的最優(yōu)位置;pg=(pg1,pg2,…,pgd)為種群搜索到的全局最優(yōu)位置。根據(jù)迭代、適應(yīng)度評價(jià)獲取的個(gè)體最優(yōu)和全局最優(yōu),第i個(gè)粒子的速度和位置可由式(1)更新,即獲取粒子在下時(shí)刻或迭代的速度和位置信息。
(1)
PCNN模型對圖像像素空間相鄰、灰度相似具有并行點(diǎn)火特性,該方法對圖像局部微小、間斷以及孤立噪聲的影響有彌補(bǔ)作用,這種現(xiàn)象符合人類大腦皮層視覺特點(diǎn)。因此,基于PCNN模型的研究在視覺圖像分割、織物疵點(diǎn)檢測、其他目標(biāo)檢測、圖像融合和圖像降噪等領(lǐng)域具有一定的研究價(jià)值。然而,傳統(tǒng)的PCNN模型參數(shù)較多,搭建的網(wǎng)絡(luò)比較復(fù)雜,同步優(yōu)化模型的參數(shù)成了一個(gè)較難解決的問題。通常情況,模型中大量的參數(shù)需要依據(jù)經(jīng)驗(yàn)或大量實(shí)驗(yàn)確定,該設(shè)置方法限制了PCNN模型在應(yīng)用領(lǐng)域的靈活性和效果。
本文在原模型的基礎(chǔ)上進(jìn)行了改進(jìn),降低了模型的參數(shù)數(shù)量,即為3個(gè)參數(shù)或2個(gè)參數(shù),能夠很好地滿足圖像信號處理的需要。簡化的PCNN數(shù)學(xué)模型為:
Fi,j(n)=Ii,j
(2)
(3)
Ui,j(n)=Fi,j(n)[1+βLi,j(n)]
(4)
(5)
Yi,j(n)=step(Ui,j(n)-Yi,j(n))=
(6)
F為PCNN模型的反饋通道,用于接受外部激勵(lì)輸入Ii,j;L為PCNN模型的鏈接通道,融入鄰域信息;Wk,l為對應(yīng)神經(jīng)元分配的鄰域鏈接權(quán),同時(shí)決定了鏈接通道的鄰域大小,鏈接關(guān)系如圖1所示。對于圖像數(shù)據(jù),激勵(lì)輸入Ii,j表示圖像在(i,j)位置的像素值。反饋通道F和鏈接通道L經(jīng)式(4)非線性組合構(gòu)成了PCNN模型的接受域。在式(4)中,系數(shù)β為鏈接通道L輸出的鏈接強(qiáng)度。反饋輸入Fi,j和鏈接輸入Li,j經(jīng)過非線性相乘,形成神經(jīng)元內(nèi)部狀態(tài)U。在脈沖發(fā)生階段,若內(nèi)部狀態(tài)U的值大于神經(jīng)元的閾值θi,j,神經(jīng)元被激發(fā),否則設(shè)置為0,如式(6)所示。在迭代過程中,閾值θi,j做非線性的a指數(shù)衰減。在發(fā)出脈沖后,除了θi,j與上一時(shí)刻有關(guān)外,還疊加了脈沖輸出和一個(gè)幅值系數(shù)Vθ的乘積。
圖1 PCNN神經(jīng)元之間的鏈接
對于PCNN模型,優(yōu)化算法如基于迭代的群體智能優(yōu)化學(xué)習(xí)模型的2參數(shù)(耦合權(quán)重β、閾值θ)或3參數(shù)(β、a、V),其中,θ、a、V的關(guān)系如式(5)所示。傳統(tǒng)PCNN模型在進(jìn)行圖像分割時(shí),分割圖像的評價(jià)標(biāo)準(zhǔn)一般采用信息熵、交叉熵和類間方差。對于PSO優(yōu)化二參數(shù)PCNN模型,學(xué)習(xí)耦合權(quán)重和閾值,而三參數(shù)學(xué)習(xí)耦合權(quán)重、時(shí)間衰減和幅值。通過PCNN模型構(gòu)建的閾值,該方法針對圖像的每個(gè)像素,分割門限是與圖像尺度一樣的閾值數(shù)值矩陣。
在I7,16 GB內(nèi)存的主機(jī)上,通過MATLAB2014a編程實(shí)現(xiàn)PSO優(yōu)化PCNN模型參數(shù),并將其應(yīng)用到圖像分割領(lǐng)域。對于PSO算法,采用線性遞減的慣性權(quán)重系數(shù)w,w0=0.9,wt=w0-(0.5t)/Iter,c1=c2=1.49,粒子數(shù)N為30,迭代次數(shù)Iter為20。在約束條件下,采用隨機(jī)初始化的方法分配粒子速度和位置。依據(jù)相關(guān)文獻(xiàn),PCNN模型的鏈接權(quán)重矩陣設(shè)置為W=[0.5 1 0.5;1 0 1;0.5 1 0.5][5]。調(diào)制部分的耦合系數(shù)β、脈沖產(chǎn)生部分的時(shí)間衰減系數(shù)α和幅度V作為粒子的三維位置信息。對于二參數(shù)PCNN模型,將時(shí)間衰減系數(shù)α和幅度V構(gòu)建的閾值θ作為一個(gè)優(yōu)化參數(shù),即θ取代α和V,直接優(yōu)化閾值。在這里,只分析與分割結(jié)果直接相關(guān)的參數(shù),對于耦合系數(shù),不作分析,它是由粒子群優(yōu)化算法在約束范圍內(nèi)根據(jù)更新機(jī)制學(xué)習(xí)得到。
在這里,做了2個(gè)實(shí)驗(yàn)。實(shí)驗(yàn)1通過細(xì)節(jié)、紋理豐富的“l(fā)ena”圖像和織物疵點(diǎn)圖像證驗(yàn)證PSO優(yōu)化PCNN模型的有效性;實(shí)驗(yàn)2采用“l(fā)ena”圖像,比較二參數(shù)PCNN、三參數(shù)PCNN與傳統(tǒng)的k-means和Otsu算法的分割結(jié)果。
采用紋理、細(xì)節(jié)較豐富的“l(fā)ena”圖像,比較不同方法的分割結(jié)果,驗(yàn)證智能優(yōu)化算法學(xué)習(xí)PCNN模型參數(shù)的有效性及優(yōu)勢。圖2a為原始圖像,圖2b為傳統(tǒng)的k-means二分類結(jié)果,圖2c為經(jīng)典的Otsu分割結(jié)果,圖2d為本文提出的PCNN模型的圖像分割結(jié)果。與k-means、Otsu算法相比,從視覺效果的角度看,采用PSO優(yōu)化學(xué)習(xí)PCNN模型在圖像分割應(yīng)用中獲得了相對較好的結(jié)果。Otsu算法是普遍認(rèn)為最優(yōu)圖像分割算法,本文分割結(jié)果在某些方面差于k-means分割結(jié)果,如實(shí)線框內(nèi)的人背部、頭發(fā)出現(xiàn)了錯(cuò)誤分割。在PSO+PCNN分割算法中,帽子、頭發(fā)和臉部五官輪廓基本完整,分割邊緣完整、清晰,紋理和細(xì)節(jié)相對較豐富,而對于k-means和Otsu算法的分割結(jié)果,帽子與背景存在部分黏連現(xiàn)象,如虛線方框。
圖2 “l(fā)ena”圖像的分割結(jié)果
對于織物疵點(diǎn)圖像,疵點(diǎn)種類有對色點(diǎn)、玷污、破洞和粗紗等,織物圖像紋理豐富,具有規(guī)則、周期性。在該實(shí)驗(yàn)中,根據(jù)相關(guān)文獻(xiàn)對分割結(jié)果的評價(jià)標(biāo)準(zhǔn)[6],選擇基于熵的目標(biāo)函數(shù)作為PSO的適應(yīng)度函數(shù),仍然采用PSO優(yōu)化三參數(shù)PCNN模型實(shí)現(xiàn)織物疵點(diǎn)檢測,并與Otsu方法作比較。結(jié)果如圖3和圖4所示。
圖3a和圖4a為光照不均勻、紋理豐富的原始織物疵點(diǎn)圖像,圖3b為Otsu分割結(jié)果,圖3c、圖3d和圖4c、圖4d為PSO優(yōu)化三參數(shù)PCNN模型在不同迭代次數(shù)下的分割結(jié)果。從圖3 和圖4可以看出,與其他方法相比,經(jīng)過迭代,PSO優(yōu)化PCNN模型獲得了相對較好的分割結(jié)果,能夠很好地抑制背景紋理信息。
采用“l(fā)ena”圖像分析、評價(jià)PSO優(yōu)化不同參數(shù)PCNN模型圖像分割結(jié)果。PSO優(yōu)化二參數(shù)、三參數(shù)PCNN模型采用相同的PSO適應(yīng)度函數(shù)評價(jià)標(biāo)準(zhǔn)(最大類間方差法)和隨機(jī)初始粒子群作為比較分析的基準(zhǔn)。
對于二參數(shù)PCNN模型的圖像分割算法,PSO優(yōu)化的模型參數(shù)為(β,θ),分別表示耦合系數(shù)和閾值??紤]到參數(shù)β的取值較小,而圖像的像素取值為[0,255],為避免優(yōu)化算法搜索空間過于不均衡,圖像歸一化處理,即灰度值轉(zhuǎn)化為[0,1]取值范圍,同時(shí)作為閾值的搜索空間約束。圖5給出了PSO優(yōu)化二參數(shù)PCNN模型的圖像分割結(jié)果和適應(yīng)度值曲線。在圖5中,經(jīng)過4次迭代達(dá)到了迭代終止的標(biāo)準(zhǔn),圖5a~圖5d分別表示第1、2、3、4次迭代分割的結(jié)果,圖5e給出了適應(yīng)度值曲線。對于分割結(jié)果圖5a~圖5d,隨著迭代次數(shù)的增加,分割輪廓的邊緣清晰,與背景黏連部分越來越少,如虛線方框帽頂部分。但是,背部和頭發(fā)的細(xì)節(jié)、紋理信息丟失,如實(shí)線方框區(qū)域。結(jié)合迭代次數(shù)與適應(yīng)度評價(jià)標(biāo)準(zhǔn),如圖5e所示,圖像分割的整體性能得到了提高。
圖5 PSO優(yōu)化二參數(shù)PCNN模型分割結(jié)果以及迭代次數(shù)與適應(yīng)度值的關(guān)系
對于三參數(shù)PCNN模型的圖像分割算法,PSO優(yōu)化的參數(shù)為(β,a,V),分別表示耦合系數(shù)β、時(shí)間衰減參數(shù)a和幅值V。時(shí)間衰減參數(shù)a和幅值V通過式(5)可求得閾值。
圖6給出了PSO優(yōu)化三參數(shù)PCNN模型的圖像分割結(jié)果和適應(yīng)度值曲線。在圖6中,通過隨機(jī)初始化粒子群,經(jīng)過5次迭代,分割結(jié)果如圖6a~圖6e所示,分別表示第1、2、3、4、5次迭代分割圖像,圖6f給出了適應(yīng)度值曲線。從圖6d、圖6e可以看出,隨著迭代次數(shù)的增加,圖像分割的輪廓變的清晰,保留的紋理、細(xì)節(jié)準(zhǔn)確,如標(biāo)記的方框區(qū)域。另外,從圖5d、圖6e視覺的角度可以看出,優(yōu)化模型不同參數(shù)直接影響分割的最終結(jié)果,主要表現(xiàn)在2個(gè)方面:對于二參數(shù)模型如圖5d的分割結(jié)果,獲得了準(zhǔn)確的部分邊緣和區(qū)域信息,如人的背部、下嘴唇以及圖像右下角區(qū)域,但是分割的輪廓、細(xì)節(jié)較差,如帽頂出現(xiàn)部分黏連;在圖6e中,三參數(shù)PCNN分割圖像獲得了較好的輪廓、紋理信息(如頭發(fā)等)。通過圖5和圖6的最終分割結(jié)果可以看出,單閾值圖像分割和像素閾值分割之間存在差異性,主要表現(xiàn)在輪廓、紋理和細(xì)節(jié)等方面。事實(shí)上,通過設(shè)置模型參數(shù),從理論角度可以看到,二參數(shù)PCNN模型與三參數(shù)模型之間有一個(gè)最大區(qū)別,即二參數(shù)PCNN模型學(xué)習(xí)的閾值是針對整幅圖像,而三參數(shù)PCNN模型通過學(xué)習(xí)衰減系數(shù)和幅度組建閾值是針對圖像的每個(gè)像素。
圖6 PSO優(yōu)化三參數(shù)PCNN模型分割結(jié)果以及適應(yīng)度值與迭代次數(shù)的關(guān)系
本文研究了群體智能優(yōu)化算法PSO學(xué)習(xí)不同參數(shù)個(gè)數(shù)的PCNN模型在圖像分割中的性能。采用不同類型的圖像,通過仿真驗(yàn)證,表明PSO優(yōu)化PCNN模型分割圖像的有效性及優(yōu)勢,之后,針對不同參數(shù)個(gè)數(shù)的PCNN模型,通過PSO優(yōu)化學(xué)習(xí)模型參數(shù),分析參數(shù)對圖像分割結(jié)果的影響。與二參數(shù)PCNN模型相比,三參數(shù)PCNN在圖像分割方面獲得了較好的輪廓和紋理信息,但是圖像的邊緣和部分細(xì)節(jié)信息稍差于二參數(shù)PCNN模型的分割結(jié)果。