周向陽, 羅雪梅, 王 霄
(貴州大學(xué) 電氣工程學(xué)院, 貴陽550025)
圖像分割是圖像分析、識(shí)別和理解的基礎(chǔ),其主要目的在于將感興趣的目標(biāo)從復(fù)雜背景中提取出來。 閾值分割法因其實(shí)現(xiàn)簡單且有效而成為圖像分割中最基本和應(yīng)用最廣泛的分割方法[1]。 最大類間方差法(Otsu)是閾值分割法中的經(jīng)典算法[2],利用背景和目標(biāo)的類間方差最大為準(zhǔn)則來確定閾值。但在實(shí)際應(yīng)用中,由于存在噪聲等干擾因素,灰度直方圖不一定有明顯的波峰和波谷,此時(shí)僅利用一維灰度直方圖來確定閾值難以獲得滿意的分割效果。二維Otsu 圖像分割算法[3],準(zhǔn)確性和抗噪聲能力得到提升;快速遞推法[4]的實(shí)現(xiàn)也使得算法的復(fù)雜度降低。 許多學(xué)者提出各種改進(jìn),如王坤等[5]根據(jù)鄰域像素點(diǎn)與中心像素點(diǎn)之間的距離對鄰域均值算法進(jìn)行加權(quán),并對噪聲點(diǎn)做了一定判斷,取得了較好效果;王寧等[6]通過模糊算法調(diào)整權(quán)值完成全局濾波,根據(jù)Otsu 準(zhǔn)則并結(jié)合截距直方圖求解最佳截距閾值來完成圖像分割;Q. Li 等[7]通過將二維直方圖中去噪重建,將像素點(diǎn)投影到對角線上生成灰度投影直方圖;李淼等[8]采用兩條通過閾值點(diǎn)與灰度級軸分別成一定角度的直線,對二維直方圖進(jìn)行區(qū)域分割,但忽略了許多有效的背景和目標(biāo)點(diǎn);錢衛(wèi)星等[9]在斜方窄帶劃分的基礎(chǔ)上,增加截距輔助軸,并依據(jù)斜分線與窄帶區(qū)的交點(diǎn)坐標(biāo)變化來劃分背景和目標(biāo)。 但是兩條直線之間的距離固定,噪聲和目標(biāo)背景像素區(qū)域難以正確劃分;Wang 等[10]針對鄰域均值易丟失邊緣和細(xì)節(jié)特征,引入導(dǎo)向?yàn)V波代替均值濾波,較好地保留了目標(biāo)的邊緣和細(xì)節(jié);楊陶等[11]引入Roberts 算子結(jié)合線性擬合法來確定目標(biāo)背景區(qū)域的雙界線,運(yùn)用二維Otsu 法對界線內(nèi)的區(qū)域進(jìn)行分割,對圖像的細(xì)節(jié)特征分割較好。
綜上分析研究,本文提出一種結(jié)合邊緣信息的二維直方圖灰度——非局部均值的算法。 引入非局部均值,改進(jìn)了傳統(tǒng)灰度——平均灰度二維直方圖。利用邊緣信息提出了一種新的噪聲和背景目標(biāo)區(qū)域劃分法。 通過狀態(tài)轉(zhuǎn)移算法與截距閾值法來求取圖像分割閾值。 實(shí)驗(yàn)表明,該算法應(yīng)用在圖像分割之中能獲得更好的效果。
傳統(tǒng)二維Otsu 法利用灰度值與其鄰域均值構(gòu)建二維直方圖[12]。設(shè)圖像尺寸為M × N,灰度等級為L,f(x, y) 為在圖像(x, y) 處的灰度值,則以(x,y) 為中心的k × k 鄰域內(nèi)灰度均值g(x, y) 為:
其中,0 <x + m <M,0 <y + n <N。 k 表示鄰域?qū)挾?,一般取奇?shù)。
設(shè)cij表示像素灰度值為i,其鄰域均值為j 時(shí)出現(xiàn)的頻次。 由此得到其二維聯(lián)合概率密度pij為:
其中,0 ≤i ≤L - 1,0 ≤j ≤L - 1。
假設(shè)將圖像分為背景和目標(biāo)的二元組閾值為(s, t),則可將二維直方圖劃分為如圖1 所示的A、B、C、D 四個(gè)矩形區(qū)域。
圖1 灰度-鄰域灰度均值二維直方圖Fig. 1 Gray- the average gray two-dimensional histogram
假設(shè)區(qū)域A 和C 分別對應(yīng)目標(biāo)和背景,區(qū)域B和D 則表示邊緣點(diǎn)和噪聲。 因此,可求得目標(biāo)和背景的概率w0,w1為:
忽略B、D 區(qū)域,此時(shí)相應(yīng)的目標(biāo)背景類內(nèi)均值矢量μ0,μ1為:
其中,μ0i、μ0j分別為目標(biāo)類的灰度值和鄰域灰度均值。 μ1i、μ1j分別為背景類的灰度值和鄰域灰度均值。
二維直方圖總體均值矢量為μt為:
其中,μti,μtj分別為總體灰度值和鄰域灰度均值。 定義目標(biāo)和背景的類間離散度矩陣Sb為:
當(dāng)式(8)最大值時(shí), 所對應(yīng)的(s?, t?) 即為分割閾值。
傳統(tǒng)灰度-平均灰度直方圖區(qū)域劃分中,通過忽略圖1 中區(qū)域B 和D,來減少噪聲點(diǎn)的干擾。 雖然在多數(shù)情況下,像素的灰度值與其鄰域灰度均值基本相近,但是A、C 部分仍可能存在大量噪點(diǎn),而B、D 部分也含有目標(biāo)和背景的有效部分,最終導(dǎo)致圖像分割效果較差。 此外,傳統(tǒng)灰度-平均灰度直方圖中部分目標(biāo)和背景的有效點(diǎn),存在因其灰度與鄰域均值有一定差距而被誤劃分為噪聲點(diǎn)。 因此,選擇一種能更充分地衡量像素點(diǎn)與其鄰域間關(guān)系以判斷噪聲點(diǎn)的方式也顯得十分必要。
非局部均值是通過衡量圖像鄰域塊的相似性構(gòu)造加權(quán)系數(shù),對圖像進(jìn)行加權(quán)平均處理[14],具有更好的空間相關(guān)性,有利于噪聲點(diǎn)的判斷。 其核心公式如下:
其中, v(j) 為原圖像矩陣,ū 為非局部均值矩陣,w(i, j)表示當(dāng)前像素i 的鄰域N(i)和它在Ω 搜索框內(nèi)的像素j 的鄰域N(j) 之間的權(quán)值系數(shù),通常該權(quán)值系數(shù)由高斯加權(quán)的歐式距離計(jì)算得到:
其中,a 為高斯核標(biāo)準(zhǔn)差,h 為控制權(quán)值衰減速度的參數(shù),z(i) 為權(quán)值歸一化參數(shù),將權(quán)值w(i, j)處理到區(qū)間[0 1] 之中。
相對于鄰域平均灰度均值,非局部均值不僅利用了各像素點(diǎn)與其鄰域像素的相關(guān)信息,而且充分考慮了各像素點(diǎn)搜索框內(nèi)像素塊之間的結(jié)構(gòu)相關(guān)信息。 本文利用非局部均值代替鄰域平均灰度均值構(gòu)造的圖像二維直方圖,有利于減少噪聲和目標(biāo)背景區(qū)域的錯(cuò)分。
絕大部分像素的灰度與其鄰域平均灰度接近,邊緣點(diǎn)的鄰域灰度值會(huì)在一定程度上高于或者低于邊緣點(diǎn)的灰度值,鄰域均值與其灰度值存在一定偏差。 噪聲點(diǎn)由外界干擾產(chǎn)生,其灰度值不能反映圖像在該點(diǎn)的真實(shí)灰度值,故其灰度值與鄰域均值會(huì)出現(xiàn)更大的偏差。 因此,可通過邊緣點(diǎn)界線,區(qū)分目標(biāo)背景區(qū)域和噪聲區(qū)域[11]。 噪聲和目標(biāo)背景區(qū)域的界線確定過程為:
(1)邊緣檢測。 利用Sobel 算子獲取圖像的邊緣點(diǎn)。
(2)坐標(biāo)獲取。 根據(jù)邊緣點(diǎn)對應(yīng)位置獲取在二維直方圖中的坐標(biāo)(x, y)。
(3)邊緣點(diǎn)分類。 依據(jù)主對角線分別將邊緣點(diǎn)(x, y) 劃分為上半?yún)^(qū)域S0和下半?yún)^(qū)域S1。 具體公式如下:
(4) 約束邊緣點(diǎn)的獲取。 分別計(jì)算二維直方圖上、下區(qū)域中,與主對角線距離最大的兩個(gè)邊緣點(diǎn)(x0,y0)、(x0, y0)。 邊緣點(diǎn)(x, y) 到主對角線距離公式為:
其中,A =1;B =- 1;C =0。 為了節(jié)省計(jì)算時(shí)間,并且使區(qū)域能更好的包含邊緣點(diǎn),將距離計(jì)算限制在邊緣灰度值的總均值fmed± ε 的區(qū)間內(nèi),即:
其中,n 為邊緣點(diǎn)的總個(gè)數(shù),ε 為調(diào)節(jié)因子。 當(dāng)距離一致時(shí),選擇灰度值與總均值fmed更靠近的邊緣點(diǎn)。
(5)邊界劃分。 分別將(4)中得到的兩個(gè)邊緣點(diǎn)與主對角線的端點(diǎn)連接,得到四邊形區(qū)域D,即為目標(biāo)背景區(qū)域,其它區(qū)域則為噪聲區(qū)域。
圖2 給出了本文區(qū)域劃分的效果圖。 圖2(a)為原始圖像,圖2(c)為區(qū)域劃分簡化模型。 圖2(b)為獲取圖像邊緣點(diǎn)后繪出的只含有邊緣點(diǎn)的二維直方圖,其中藍(lán)色表示邊緣點(diǎn)。 從分布情況可以看出,若通過曲線擬合形成界線,并不能很好地分離噪聲和目標(biāo)背景區(qū)域。 而本文方法所確定的界線,較好的包含了邊緣點(diǎn),能更好的分離噪聲和目標(biāo)背景區(qū)域。
圖2 本文區(qū)域劃分Fig. 2 Region division
若采用原始的窮舉搜尋法獲得閾值點(diǎn)(s?, t?),實(shí)時(shí)性較差。 本文依據(jù)二維直方圖區(qū)域斜分的閾值分割思想,如圖2(c),將分割線垂直主對角線,即:
其中,T 為截距閾值。 設(shè)圖2(c) D0為目標(biāo)區(qū)域,D1為背景區(qū)域,則對于二維直方圖中任意像素點(diǎn)(x, y) 有:
閾值T 只與灰度值和其鄰域均值的和有關(guān)。 將閾值獲取從二維(s?, t?)轉(zhuǎn)換成一維T =s?+ t?閾值,減少了大量的運(yùn)算時(shí)間。 結(jié)合文獻(xiàn)[15]的一維Otsu 法可推出如下:
p(i,j)表示二元組(i, j)發(fā)生的概率,則p(T1)為:
當(dāng)閾值為T 時(shí),目標(biāo)類D0和背景類D1的概率w0(T),w1(T) 分別為:
改進(jìn)二維Otsu 算法的實(shí)現(xiàn)流程如下:
(1)讀取圖像,獲取各像素點(diǎn)的非局部均值,建立灰度-非局部均值灰度二維直方圖。
(2)通過Sobel 算子提取圖像邊緣點(diǎn),建立邊緣點(diǎn)的二維直方圖。
(3) 通過邊緣點(diǎn)的二維直方圖確定邊緣點(diǎn)界線,劃分噪聲點(diǎn)與目標(biāo)背景點(diǎn)區(qū)域。
(4)對目標(biāo)背景點(diǎn)區(qū)域采用截距閾值分割,取使得類間方差最大時(shí)的閾值。
狀態(tài)轉(zhuǎn)移算法是由周曉君等[16]于2012 年提出的一種智能型隨機(jī)性全局優(yōu)化算法。 其基本思想是將優(yōu)化問題的一個(gè)解當(dāng)作一個(gè)狀態(tài),狀態(tài)轉(zhuǎn)移過程即解的產(chǎn)生和更新。 產(chǎn)生候選解的統(tǒng)一框架為:
其中,xk表示當(dāng)前狀態(tài),代表優(yōu)化問題的一個(gè)候選解;Ak和Bk為狀態(tài)轉(zhuǎn)移矩陣且為隨機(jī)矩陣;uk為控制變量,表示當(dāng)前狀態(tài)及歷史狀態(tài)的函數(shù);f(·)表示目標(biāo)函數(shù)。
狀態(tài)轉(zhuǎn)移算法的設(shè)計(jì)包括:狀態(tài)轉(zhuǎn)移算子的交替輪換調(diào)用策略、鄰域隨機(jī)采樣機(jī)制、基于“貪婪準(zhǔn)則”當(dāng)前最優(yōu)解的產(chǎn)生與更新。
狀態(tài)轉(zhuǎn)移算子的交替輪換調(diào)用策略有利于快速找到全局最優(yōu)解和避免陷入局部最優(yōu);鄰域隨機(jī)采樣機(jī)制可以避免窮舉鄰域內(nèi)的所有解, 縮短算法搜索的時(shí)間;“貪婪準(zhǔn)則”保證了算法的收斂。
本文利用狀態(tài)轉(zhuǎn)移算法的強(qiáng)大搜索能力,來提高圖像分割的閾值求取速度。 考慮到本文求解的是最大值問題,將類間方差式(25)作為狀態(tài)轉(zhuǎn)移算法的目標(biāo)函數(shù),具體過程如下:
(1) 設(shè)置當(dāng)前迭代次數(shù)k =1,隨機(jī)產(chǎn)生一組采樣大小為SE 的初始解,根據(jù)貪婪準(zhǔn)則取采集樣本中的最好解Bestk,旋轉(zhuǎn)因子α =αmax。
(2) 以當(dāng)前鄰域內(nèi)最好解Bestk為中心,利用伸縮變換產(chǎn)生SE 個(gè)樣本,并更新當(dāng)前采集樣本最好解Bestk。 如果當(dāng)前最好解Bestk有變動(dòng),則以同樣機(jī)制執(zhí)行一次平移變換并更新當(dāng)前最好解Bestk。
(3) 采用與步驟(2) 相同機(jī)制,分別利用旋轉(zhuǎn)變換、平移變換產(chǎn)生并更新當(dāng)前最好解Bestk。
(4) 迭代次數(shù)K =K + 1,每執(zhí)行一次迭代縮小一半旋轉(zhuǎn)算子搜索半徑即α =α/ 2。 若α <αmin,則置α =αmax,然后重返步驟(2) 直至滿足終止條件。
仿真實(shí)驗(yàn)在Matlab R2016a 環(huán)境下,Intel(R)i5 CPU @2.90GHz、4GB 內(nèi)存、Win10 系統(tǒng)的電腦上進(jìn)行的。 為了驗(yàn)證本文算法的效果, 選擇圖像cameraman 和菌落圖像colony 進(jìn)行分割研究,并將本文方法與目前經(jīng)典的改進(jìn)二維Otsu 方法:二維直方圖叉分法、斜分法進(jìn)行對比。
圖3 和圖4 中的(b)~(d)分別展示了叉分法,斜分法和本文方法的分割結(jié)果。 可以看出,在未加入噪聲的情況下,三種方法的分割結(jié)果還是有一些區(qū)別。 本文方法圖3(d)中,分割后的圖像雜點(diǎn)相比其它方法較少,圖4(d)中,本文方法分割的菌落區(qū)域較完整。 斜分法和叉分法雖然在一定程度上都優(yōu)化了分區(qū)問題,但是叉分法依然忽略了交叉直線外的有效點(diǎn),斜分法是兩條直線邊界,且窄帶區(qū)寬度固定,容易將一些灰度變化大的邊緣點(diǎn)劃分為噪聲點(diǎn)。而本文方法通過非局部均值,加入像素塊之間的關(guān)系,綜合考慮了像素點(diǎn)與其鄰域的關(guān)系,更準(zhǔn)確的保留有效點(diǎn)和判斷噪聲點(diǎn)。
圖3 Cameraman 的分割效果對比Fig. 3 Compares the segmentation effects of the Cameraman
圖4 colony 的分割效果對比Fig. 4 Compares the segmentation effects of the colony
在實(shí)驗(yàn)圖像中加入均值為0,方差為0.01 的高斯噪聲,如圖5 和圖6 中(a)所示。 其(b)、(c)、(d)分別表示叉分法、斜分法和本文方法的分割結(jié)果。 可以看出,三種方法都有一定的抗噪性,斜分法的分割效果比叉分法要好,因?yàn)樾狈址ǖ恼瓗^(qū)限制了一定的噪聲點(diǎn)。 但本文方法分割的圖像噪點(diǎn)數(shù)量最少,分割效果最好。
圖5 cameraman 加噪的分割效果對比Fig. 5 Compares the segmentation effects of the noised Cameraman
圖6 Colony 加噪的分割效果對比Fig. 6 Compares the segmentation effects of the noised colony
為了較客觀地評價(jià)抗噪性能,本文選取了峰值信噪比(RPSN)、結(jié)構(gòu)相似性度量(SSIM)、求取閾值所需時(shí)間3 個(gè)指標(biāo)對算法的性能進(jìn)行評價(jià)。
峰值信噪比[17]是基于對應(yīng)像素點(diǎn)間誤差的圖像質(zhì)量評價(jià)。 RPSN值越大,則說明分割的效果越好。 其計(jì)算公式如下:
其中,R 表示原圖像,I 表示分割后的圖像,M ×N 為圖像的大小。
三種方法分割后的RPSN值如表1 所示。 可以看出,本文方法的RPSN值均略高于其它兩種算法。 因?yàn)樾狈址ǖ恼瓗^(qū)寬度固定,且邊界為兩條直線,容易錯(cuò)分。 而本文方法結(jié)合了圖像邊緣信息,能自適應(yīng)的調(diào)整區(qū)域劃分,更好的減少噪聲干擾。
表1 三種方法的RPSN值比較Tab. 1 RPSN value comparison of the three methods
結(jié)構(gòu)相似性度量[18]是一種從亮度、對比度、結(jié)構(gòu)三方面度量圖像相似性的圖像質(zhì)量評價(jià)指標(biāo),SSIM 取值范圍[0, 1],值越大,表示圖像相似度越高,即分割效果越好。 SSIM 的計(jì)算公式如下:
其中,μR和μI分別表示原圖像和分割圖像的像素平均值,σR和σI分別表示原圖像和分割圖像像素的方差,σIR表示分割圖像和原圖像像素的協(xié)方差。c1、c2為避免除零的常數(shù)。
三種方法分割后的SSIM 值如表2 所示。 可以看出,雖然三種算法都受到了一定的噪聲影響,但是本文方法的SSIM 值最大,具有更好的抗噪性能。
表2 三種方法的SSIM 值比較Tab. 2 SSIM comparison of the three methods
求取閾值所需的時(shí)間關(guān)系著二維Otsu 法的效率問題,是評價(jià)算法優(yōu)劣的重要指標(biāo),所需時(shí)間越少,說明求取閾值的速度更快,算法的效率更高。
三種方法獲取閾值所需的時(shí)間如表3 所示。 本文提出的方法,相對于叉分法、斜分法的圖像的所需時(shí)間是最短的,說明本文提出的方法效率最高。 同時(shí),也可以看出,文獻(xiàn)[9]的斜分法的運(yùn)行時(shí)間比文獻(xiàn)[8]的叉分法要短。 因?yàn)槲墨I(xiàn)[9]的斜分法通過截距閾值實(shí)現(xiàn)了降維處理,節(jié)省了大量時(shí)間。 而本文方法,在通過截距閾值降維運(yùn)算的基礎(chǔ)上,還利用了狀態(tài)轉(zhuǎn)移算法的搜索能力,取得了更高的效率。
表3 三種方法獲取閾值所需時(shí)間比較Tab. 3 Comparison of the time required to obtain the threshold by the three methods
本文分析了傳統(tǒng)二維Otsu、叉分法和斜分法的不足,提出一種結(jié)合邊緣信息的二維Otsu 優(yōu)化算法。對于灰度-鄰域均值二維直方圖中,存在部分有效點(diǎn)的灰度值與其鄰域均值有一定差距而被誤分為噪聲點(diǎn)的不足,本文引入非局部均值代替鄰域均值,在充分考慮了像素點(diǎn)的空間關(guān)系,使得在二維直方圖中能更準(zhǔn)確的區(qū)分背景目標(biāo)點(diǎn)和噪聲點(diǎn)。 考慮到對邊緣點(diǎn)采用曲線擬合通常得不到較好的分界線,本文通過一定約束下的邊緣點(diǎn)與主對角線確定了噪聲與目標(biāo)背景類的界線。 結(jié)合邊緣信息的區(qū)域劃分法,能對于不同的圖像自適應(yīng)的、更有效的劃分圖像噪聲、目標(biāo)背景區(qū)域。 而截距閾值分割法將二維Otsu 轉(zhuǎn)化為一維Otsu,降低了算法復(fù)雜度,并結(jié)合狀態(tài)轉(zhuǎn)移算法實(shí)現(xiàn)了閾值的快速求解。 實(shí)驗(yàn)表明,相比叉分法和斜分法,本文方法能更有效更快速的分割圖像,且自適應(yīng)能力強(qiáng),抗噪性能好,具有一定的實(shí)用價(jià)值。