張正 李青
摘要摘要:針對(duì)傳統(tǒng)脈沖耦合神經(jīng)網(wǎng)絡(luò)圖像分割需要人工多次調(diào)整網(wǎng)絡(luò)參數(shù)的問(wèn)題,提出根據(jù)圖像本身信息的自適應(yīng)參數(shù)設(shè)置方法。并對(duì)傳統(tǒng)脈沖耦合神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn),利用改進(jìn)的脈沖耦合神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像分割,并利用最大二維Tsallis熵準(zhǔn)則自適應(yīng)確定分割結(jié)果。仿真實(shí)驗(yàn)結(jié)果表明,該方法能獲得視覺(jué)效果較好的分割結(jié)果。
關(guān)鍵詞關(guān)鍵詞:圖像分割;脈沖耦合神經(jīng)網(wǎng)絡(luò);Tsallis熵
DOIDOI:10.11907/rjdk.1431003
中圖分類(lèi)號(hào):TP317.4
文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào)文章編號(hào):16727800(2015)004014803
0引言
圖像分割是圖像理解及圖像分析的基礎(chǔ)。圖像分割的目的是將圖像分成各具特性且互不相干的區(qū)域,并將其中感興趣的區(qū)域提取出來(lái)[12]。脈沖耦合神經(jīng)網(wǎng)絡(luò)(pulse coupled neural networks, PCNN)是一種不同于傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)的新型神經(jīng)網(wǎng)絡(luò),它源于生物學(xué),是根據(jù)貓、猴等動(dòng)物的大腦視覺(jué)皮層上的同步脈沖發(fā)放現(xiàn)象而提出的神經(jīng)元模型[3]。PCNN作為新一代神經(jīng)網(wǎng)絡(luò),已廣泛應(yīng)用于圖像分割、圖像去噪、邊緣檢測(cè)、圖像融合、特征提取等圖像處理[4]。特別是在圖像分割應(yīng)用中,PCNN能較好地分離目標(biāo)和背景部分的重疊[5],也能處理目標(biāo)內(nèi)部較小的灰度變化和空間不連貫等問(wèn)題,但是這些特性都依賴(lài)于PCNN模型中的參數(shù)設(shè)置,參數(shù)設(shè)置的合理性決定了PCNN模型分割性能的優(yōu)劣,且針對(duì)不同圖像需要選擇不同的參數(shù),這樣在很大程度上限制了PCNN的應(yīng)用。鑒于此,本文對(duì)PCNN模型進(jìn)行改進(jìn),利用圖像本身的信息自適應(yīng)設(shè)置改進(jìn)PCNN的參數(shù),利用改進(jìn)模型進(jìn)行圖像分割,并利用最大二維Tsallis熵準(zhǔn)則確定分割結(jié)果。
1PCNN模型
PCNN不同于傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò),它是由橫向脈沖耦合神經(jīng)元鏈接構(gòu)成的單層神經(jīng)網(wǎng)絡(luò),并且不需要任何訓(xùn)練。當(dāng)PCNN用于圖像處理時(shí),其神經(jīng)元個(gè)數(shù)與輸入圖像中像素點(diǎn)個(gè)數(shù)相等,神經(jīng)元與像素點(diǎn)一一對(duì)應(yīng)。
Johnson[6]提出了脈沖耦合神經(jīng)網(wǎng)絡(luò)模型,Lindblad[7]和Kinser在該模型的基礎(chǔ)上進(jìn)行了線性化和離散化處理,得到了傳統(tǒng)的PCNN模型,可描述成離散的子系統(tǒng)模型,用數(shù)學(xué)方程式(1)~(5)式來(lái)描述。
2改進(jìn)的PCNN模型圖像分割算法
2.1改進(jìn)PCNN模型及參數(shù)設(shè)置
傳統(tǒng)的PCNN模型利用了生物神經(jīng)元的激活特性及閾值指數(shù)衰減特性,盡管按照指數(shù)衰減的閾值變化規(guī)律,符合人眼對(duì)灰度響應(yīng)的非線性要求,但圖像分割的目的是區(qū)分目標(biāo)和背景,而不是視覺(jué)清晰。故沒(méi)有必要采用閾值指數(shù)衰減函數(shù)進(jìn)行圖像分割[8],本文對(duì)其作出相應(yīng)改進(jìn),采用線性衰減函數(shù)。式(6)~(10)為改進(jìn)PCNN模型。
改進(jìn)模型在原來(lái)的反饋輸入域中通過(guò)權(quán)重 M 連接鄰域神經(jīng)元,從而提升灰度值較低的神經(jīng)元的反饋輸入,且對(duì)于高灰度值的噪聲具有一定的抑制作用,耦合連接輸入域通過(guò)權(quán)重W連接鄰域神經(jīng)元。對(duì)于鄰域像素對(duì)中心像素的影響,除考慮其空間距離外,還應(yīng)考慮像素間的灰度差異,即鄰域像素空間距離越近、灰度差別越小,其權(quán)值應(yīng)越大,反之權(quán)值應(yīng)越小。連接強(qiáng)度β決定了PCNN的捕獲域,β值越大,同步脈沖發(fā)放的區(qū)域就越大,捕獲的神經(jīng)元的亮度范圍就越大。在傳統(tǒng)的基于PCNN的圖像融合中,所有神經(jīng)元的鏈接強(qiáng)度都取相同值。但在人眼視覺(jué)系統(tǒng)中,視覺(jué)對(duì)于特征明顯區(qū)域的反應(yīng)比特征不明顯的區(qū)域反應(yīng)強(qiáng)烈,不可能每個(gè)神經(jīng)元的鏈接強(qiáng)度都相同,因此PCNN中神經(jīng)元鏈接強(qiáng)度的取值與對(duì)應(yīng)像素的特征有一定的關(guān)系。標(biāo)準(zhǔn)差反映了圖像灰度局部的對(duì)比度變化程度,在標(biāo)準(zhǔn)差大的地方,圖像灰度變化較大,因此采用圖像的局部標(biāo)準(zhǔn)差作為β的取值。閾值線性衰減常數(shù)ΔT值過(guò)大,分割精度會(huì)變差,過(guò)小影響算法的執(zhí)行效率;為了保證點(diǎn)火后的像素點(diǎn)不再點(diǎn)火,VE取足夠大。
2.2最大二維Tsallis熵準(zhǔn)則
熵是圖像統(tǒng)計(jì)特性的一種表現(xiàn)形式,反映了圖像包含信息量的大小[9]。但熵所具有的擴(kuò)展性使得圖像分割過(guò)程時(shí)忽略了目標(biāo)和背景概率分布之間的相互關(guān)系,造成分割結(jié)果不準(zhǔn)確。Tsallis熵是熵的一種推廣形式,它引入?yún)?shù)q度量系統(tǒng)的不可擴(kuò)展性,能夠描述具有長(zhǎng)相關(guān)、長(zhǎng)時(shí)間記憶和分形結(jié)構(gòu)的物理過(guò)程,解決圖像區(qū)域間相關(guān)性而產(chǎn)生的不獨(dú)立部分的熵表示問(wèn)題。圖像分割的熵準(zhǔn)則就是借助熵對(duì)事物信息量的數(shù)理異同性測(cè)度能力,構(gòu)造不同的熵函數(shù)以幫助確定最優(yōu)圖像分割結(jié)果。Tsallis熵定義為:
Sq=1-∑ni=1(pi)qq-1(12)
其中,n是系統(tǒng)可能的狀態(tài)數(shù)目,實(shí)數(shù)q衡量系統(tǒng)的不可擴(kuò)展程度,一般情況下,q=0.8。
如果直接利用圖像直方圖求出Tsallis熵,雖然比熵好,但由于直方圖僅考慮灰度信息,所以圖像分割容易產(chǎn)生邊界斷裂、欠分割等缺陷。所以考慮二維直方圖不僅包含灰度信息,還包含空間信息,將Tsallis熵推廣到二維。傳統(tǒng)二維直方圖的橫縱坐標(biāo)分別采用像素的灰度級(jí)f(m, n )和鄰域平均灰度級(jí) g (m, n ),它反映了圖像中 (f(m, n ), g (m, n) )發(fā)生的聯(lián)合概率,未考慮灰度級(jí)的變化,故采用像素的灰度級(jí)f(m, n )和梯度| f(m, n )-g (m, n )|的形式構(gòu)建二維直方圖。得到圖像二維直方圖,表達(dá)式為:
2.3算法步驟
Step1:初始化改進(jìn)PCNN網(wǎng)絡(luò)。根據(jù)前文提到的參數(shù)自適應(yīng)設(shè)置方法,設(shè)置PCNN模型的初始化參數(shù),M、W用式(11)進(jìn)行初始化,β設(shè)置為圖像的局部標(biāo)準(zhǔn)差,ΔT為圖像的最大值減去最小均值除以迭代次數(shù)30。
Step2:將待分割圖像的灰度值Sij通過(guò)M進(jìn)行加權(quán)后作為外界刺激信號(hào)輸入到網(wǎng)絡(luò),連接輸入Lij(1)=0。Step3:計(jì)算神經(jīng)元的內(nèi)部行為Uij,神經(jīng)網(wǎng)絡(luò)每迭代一次根據(jù)式(8)對(duì)其進(jìn)行更新,將U和E進(jìn)行比較,判斷神經(jīng)元是否點(diǎn)火并更新Y,對(duì)輸出結(jié)果進(jìn)行累加并保存為Ysum,即當(dāng)神經(jīng)元點(diǎn)火后其在此后的迭代中均保持點(diǎn)火狀態(tài)。