梁義濤,陳亞輝,李永鋒
(河南工業(yè)大學(xué)a.糧食信息處理與控制教育部重點實驗室;b.信息科學(xué)與工程學(xué)院,河南 鄭州 450001)
圖像分割是圖像處理中的一項基礎(chǔ)且關(guān)鍵的技術(shù)研究,也是自動目標識別的重要組成部分[1]。在眾多分割算法中,閾值分割法因其簡單有效,計算量小,性能較穩(wěn)定,成為了使用范圍較廣的方法之一[2],而且閾值分割法對于物體和背景有較強對比的圖像分割特別有效。在閾值分割法中,全局閾值分割技術(shù)具有自適應(yīng)分割的特點,并且容易實現(xiàn),得到廣泛的應(yīng)用[3]。經(jīng)典的全局閾值分割方法主要有最小誤差法[4]、各種熵類分割法[5-8]、最大相關(guān)性法[9]、Otsu 法[10]。Otsu 法通過最大化類間方差的方法來確定最優(yōu)的閾值,以實現(xiàn)對圖像的二值化分割[11],在具有明顯的雙峰灰度分布直方圖的圖像,可以取得令人滿意的效果[12]。但是當(dāng)圖像的噪聲多或者目標和背景相差很大時,Otsu 法則容易出現(xiàn)閾值“偏移”[13],并且Otsu 也沒有考慮像素的空間信息,因此噪聲的存在使得分割效果變差。于是劉健莊等人[14]提出了灰度圖像的二維Otsu 自動閾值分割算法,范九倫等人[15]提出三維Otsu 閾值分割算法。一維Otsu 算法的計算復(fù)雜度較低,但分割效果不盡人意。三維Otsu 算法的計算復(fù)雜度過大,因此往往難以在工程上大規(guī)模應(yīng)用[16]。與之相比,二維Otsu 算法的分割效果較好,而且其計算復(fù)雜度在可接受的范圍內(nèi)。
二維Otsu 考慮了像素點與其鄰域的空間信息,提升了算法的抗噪性能[17]。然而,該方法假設(shè)了邊界區(qū)域信息對于圖像分割的影響可以被忽略。這使得原始的二維Otsu法應(yīng)用在邊緣信息豐富的圖像時,分割效果差[18]。因此,后續(xù)的研究者提出了多種改進算法:梁義濤等人[19]在原始二維Otsu 分割法的基礎(chǔ)上,引入迭代的思想,在獲得整個灰度圖像的最大類間方差點后,對邊界噪聲區(qū)域進行迭代分割,以獲得一系列閾值點,用依次相連的折線閾值進行分割,該方法的優(yōu)點是用線閾值分割替代了傳統(tǒng)的點閾值,提高了分割的精度,不足之處則是存在區(qū)域錯分,而且人為根據(jù)經(jīng)驗給出迭代次數(shù),降低了算法的自適應(yīng)性;趙恒等人[20]為了得到正確的區(qū)域劃分結(jié)果,獲取圖像邊界點在二維直方圖的坐標,并用曲線擬合這些點,再用斜分法對目標與背景區(qū)域進行劃分,該方法在一定程度上糾正了錯分的邊界區(qū)域,但是對邊界、噪聲區(qū)域的劃分不夠精細,且計算量大;梁義濤等人[21]又在此構(gòu)想上提出二維Otsu 擬合線閾值圖像分割方法,將文獻中的折線擬合成曲線,以此曲線閾值進行圖像分割,并以小概率事件標準作為停止迭代的條件,也即邊界和噪聲區(qū)域像素點的總概率之和小于某一較小值。但該方法未充分利用二維直方圖的先驗信息,因此對圖像中邊界和噪聲區(qū)域的劃分效果不準確,且對于復(fù)雜的圖像擬合結(jié)果的精度不夠高。吳一全等人[22-23]給出了二維直方圖的區(qū)域斜分法以及快速算法,并將算法推廣到法線與灰度級軸成任意角,雖然有效提高了該方法的適用面,但是在工程實踐中,往往采用固定值[24]。且該方法存在明顯的錯誤分類,將部分目標噪聲歸于背景區(qū)域,將小部分背景噪聲歸于目標區(qū)域,使得圖像分割精度下降。
由此可見,現(xiàn)有算法普遍存在像素分類錯誤、自適應(yīng)能力不強的問題,這影響了圖像的分割精度,還導(dǎo)致了圖像邊界形狀的不準確、內(nèi)部像素分布不均勻等問題[25]。同時,這還會影響到隨后對圖像的進一步處理,包括分析、識別等,從而降低了處理效果[26]。因此本文提出一種基于二維Otsu 的Z 字折線閾值分割法,充分利用二維直方圖進一步的先驗知識,得到噪聲區(qū)域、邊界區(qū)域、背景區(qū)域,目標區(qū)域的進一步細化,確定背景噪聲、背景邊界、目標噪聲、目標邊界的分類,有效提高了二維Otsu 的分割能力,實現(xiàn)了高精度圖像分割。為了進一步提高本文方法的自適應(yīng)能力,有效確定圖像邊界與噪聲的分界線(也即圖4 中的L3 和L4 線段),本文采用小概率事件原則和二分法,可以根據(jù)不同場景調(diào)節(jié)參數(shù)來區(qū)分圖像邊界與噪聲。
對于一幅M×N 的圖像,像素點(x,y)的灰度值用f(x,y)表示,g(x,y)表示圖像上的K×K 鄰域平均灰度,其公式為:
其中,k 一般取奇數(shù),0<x<M,0<y<N。圖像灰度級為L,對應(yīng)的鄰域平均灰度級為L,以f(x,y)和g(x,y)組成C(i, j)數(shù)組來定義二維直方圖。直方圖上任意一點的聯(lián)合概率密度為Pij,其公式如下:
根據(jù)上式給出的定義,假設(shè)(t,s)為最佳閾值點,二維直方圖就被分成了四塊,在圖1(b)中,對角線上的區(qū)域I 和區(qū)域III 分別對應(yīng)目標和背景,其他兩塊則對應(yīng)邊界和噪聲。
圖1 二維直方圖及其區(qū)域劃分
圖2 二維Otsu 曲線閾值直方圖
在二維直方圖區(qū)域直分法中假設(shè)區(qū)域II 和IV 的像素概率值為0[27],這種假設(shè)忽略了邊界和噪聲的信息,造成了算法的自適應(yīng)性降低。對于需要進行高精度圖像分割的任務(wù)而言,忽略區(qū)域II 和IV 中的邊界和噪聲信息會顯著地降低分割的準確性。范九倫等人[28]提出了二維Otsu 曲線閾值分割法。該方法中選取點(t,s)為閾值,過該點作曲線r(i,j),將二維直方圖一分為二,背景和目標分別用C0(t,s)和C1(t,s)表示。在該算法中,如何選取曲線是一個關(guān)鍵問題。為了工程上容易實現(xiàn),這些方法在具體實現(xiàn)上往往將曲線轉(zhuǎn)為直線,且經(jīng)過閾值點(t,s)。在這種方法中,由于閾值點的存在,區(qū)域I 和III 中的像素點已經(jīng)明確分類,而區(qū)域II 和IV 有未被分類的像素點。因此,閾值曲線上的點必然分布在區(qū)域II 或IV 中,在不同的圖像中,區(qū)域II 和IV 像素的占比不同,最佳的線性閾值也就取決于此[29]。最佳線性閾值假設(shè)如圖3 所示,我們將這類最佳線性閾值分割方法稱為“展翼”線性閾值分割方法。
圖3 最佳線性閾值直方圖
然而,這種方法是非常耗時的。因此,吳一全等人[22]提出了二維直方圖區(qū)域斜分閾值分割法,該方法是上述“展翼”型線性閾值的一個特例。此方法采用與主對角線垂直的一條斜線g=-f+T (T 為閾值,0≤T≤2L)將二維直方圖分為目標與背景兩類,根據(jù)圖像灰度值與其鄰域平均灰度值之和的大小對圖像進行劃分,像素的分類方式為:
其中,fT(x,y)表示分割后的圖像。相比于傳統(tǒng)二維Otsu 算法,斜分法采用與主對角線垂直的斜線進行分割,覆蓋了較多的分割區(qū)域,提高了閾值分割的精度。但斜分法中也存在明顯的區(qū)域誤分,以0<T≤L-1 為例,結(jié)合圖4 二維直方圖區(qū)域斜分閾值分割法,具體錯誤分類的子區(qū)域為:(1)BN1 區(qū)域,該區(qū)域?qū)儆诒尘霸肼暤珔s被分成目標區(qū)域;(2)ON2 區(qū)域和ON3 區(qū)域,該區(qū)域?qū)儆谀繕嗽肼暤珔s被歸到背景區(qū)域。這些區(qū)域的錯誤分類勢必影響了圖像分割的精度。
圖4 傳統(tǒng)二維直方圖區(qū)域斜分
斜線g=-f+T 將二維直方圖分成了目標(I 類)和背景(III 類),它們的概率分別為ω0(T)和ω1(T):
其中,ω0(T)+ω1(T)=1。目標和背景對應(yīng)的均值矢量為U0和U1,其表達式分別為
二維直方圖上總的均值矢量為UT
易得,
定義類間的離差矩陣為SB
使用SB的跡作為類間離散度測度,有
“師傅型”教師的職業(yè)素養(yǎng)主要分為三個層面,即教師崗位應(yīng)具有的職業(yè)素養(yǎng)、培養(yǎng)學(xué)徒過程中應(yīng)具有的職業(yè)素養(yǎng)和從事專業(yè)領(lǐng)域崗位的職業(yè)素養(yǎng)。只有具備良好職業(yè)素養(yǎng)的師傅,才可以通過言傳身教和潛移默化促使學(xué)徒自我內(nèi)化職業(yè)道德、職業(yè)意識和職業(yè)行為習(xí)慣。
通過i+j=t+s,對圖像進行閾值分割,因此歸類方式就變?yōu)榱耍?/p>
這種方法我們稱之為二維Otsu 的直線閾值分割法。
本文主要目的是通過二維直方圖的先驗知識,實現(xiàn)高精準的圖像分割,準確地提取出需要的目標和背景。在給出傳統(tǒng)二維直方圖區(qū)域斜分閾值分割法的原理性描述之后,以此為基礎(chǔ),正確劃分二維直方圖的區(qū)域?qū)崿F(xiàn)高精細的圖像分割。本文通過折線的方式,將傳統(tǒng)二維直方圖區(qū)域斜分中錯分的三個子區(qū)域進行重新劃分,該折線呈傾斜的Z 字型,分為三段(圖3 中的AP 段、PQ 段、QD 段),本方法在解決傳統(tǒng)二維直方圖區(qū)域斜分方法錯分子區(qū)域的同時,充分利用了其優(yōu)勢,形成了一種更有效、更精準的圖像分割技術(shù)。通過在各種圖像上進行實驗,對所提出的方法進行了評估,證明了它與其他方法相比擁有更高的分割精度和更好的適用性。具體線段APQD 如圖5 所示。
圖5 二維Otsu 的Z 字折線閾值分割方法
圖6 算法流程圖
其中L3 和L4 的方程分別為:
其中,N 為L3 和L4 分別與坐標軸的截距。為了確定N 的大小,受文獻的啟發(fā),使用小概率事件原則作為標準(稱為設(shè)定概率值ε),通過計算L3 和L4 之外的像素占全部像素的比率是否小于ε,若小于則停止劃分確定N 的值,通過應(yīng)用小概率事件原則,本文算法可以在不同場景中選擇合適的值,有效地解決了算法普適性低的問題。理論上N 應(yīng)該從0 到L-1 進行遞增,則可以得到最優(yōu)解,但為了提高計算速度,本文選擇二分法對進行加速劃分[30],用以確定L3 和L4 的方程,同時二分法上下限也可根據(jù)具體實用場景進行調(diào)節(jié),進一步提高了本文算法的適用性。因此AP、PQ、QD 三段方程就可以確定:
圖7 輸入圖像
圖8 對Ⅱ、Ⅳ區(qū)域的像素進行標記
實驗硬件配置為AMD 銳龍55600H,RadeonGraphics @3.30GHz 16GB RAM 的PC 機,使用MATLAB R2018a 軟件進行實驗。本章從主觀視覺和客觀圖像質(zhì)量指標對算法進行評價,通過實驗,證明了本文方法的可行性,通過不同方法的比較,本文方法提高了分割的精度和普適性。實驗的算法包括原始二維Otsu 法,二維Otsu 區(qū)域斜分法,二維Otsu 折線閾值分割法及本文方法。
表1 圖像中未分類的像素占比
通常我們把發(fā)生概率在0.01~0.05 之間的事件稱為小概率事件。因此,我們選擇了0.01、0.02 和0.05 作為實驗參數(shù)ε,旨在展現(xiàn)本文算法的參數(shù)可調(diào)優(yōu)勢。此外,我們還加入了參數(shù)ε 為0.1 和0.2 的情況,以進一步評估本文算法的適應(yīng)性和魯棒性。通過實驗結(jié)果的對比分析,我們可以更全面地了解本文方法在不同參數(shù)設(shè)置下的表現(xiàn),為進一步優(yōu)化和推廣本方法提供有價值的參考。下表中統(tǒng)計了輸入圖像的運行時間,選取了5 次實驗的平均運行時間。
圖9 不同設(shè)定概率值的實驗結(jié)果
圖10 不同算法的實驗結(jié)果(從左到右為:(a)原始二維Otsu 法;(b)二維直方圖區(qū)域斜分閾值分割法;(c)二維Otsu 折線閾值分割法;(d)本文方法)
根據(jù)表2 的數(shù)據(jù),本文算法的運行時間受到參數(shù)值ε 的影響??芍?,隨著ε 值的增加,處理后圖像中的噪點數(shù)量也增加,從而影響了圖像的視覺效果。因此,本文算法在實際應(yīng)用中可以根據(jù)需求選擇不同的ε 值,體現(xiàn)出算法的自適應(yīng)性能。針對高精度圖像本文提出的算法分割具有明顯優(yōu)勢,既能提高圖像分割的準確性,同時又能縮短程序運行時間。
表2 不同設(shè)定概率值的影響比較
通過分割性能實驗,突出本文方法的優(yōu)勢,并給出實驗結(jié)果,實驗圖像依次為: 病毒、斑馬、狒狒、大街、道路和雪地。
在斑馬、大街、雪地、道路圖中都是屬于噪聲點較多的典型情況,二維Otsu 的折線閾值分割法和二維直方圖區(qū)域斜閾值分割法比原始二維Otsu 方法處理效果好很多,但分割細節(jié)不足。結(jié)果表明,我們的方法與其他包含較少噪聲和邊緣信息(例如病毒)的圖像分割方法類似。在斑馬圖中,我們的方法對斑馬條紋進行了準確的處理,而其他所有方法都存在嚴重的錯誤分類。從街道圖中可以看出,本文提出的算法展現(xiàn)出了其優(yōu)勢,原始的二維Otsu 法和二維Otsu 的折線閾值分割法對地面文本的分割效果都很差,二維直方圖區(qū)域斜分閾值分割法無法清晰地分割出地面上的文本。相比之下,本文提出的方法可以清楚地分割文本區(qū)域。對于雪地圖,我們的方法比其他方法表現(xiàn)更好。在雪影和人影方面,在處理雪地陰影和人體影子方面,本文方法更加細致,能夠更準確地區(qū)分出這些影響因素,從而得到更加精準的圖像分割結(jié)果。在道路上,其他三種方法無法精準分割路面,而本文的方法可以準確地分割出路面的分布。對于狒狒眼睛的分割,原始二維Otsu 法的分割結(jié)果是合理的。不過,本文對狒狒胡須的處理比其他四種方法更為精細。為了更清楚地看到細節(jié)的分割,我們放大了圖像的一部分,如圖11 所示。
圖11 部分所選圖片效果細節(jié)展示
圖像分割質(zhì)量的主觀方法在不同圖像分割效果中有不同的標準。因此客觀評價就顯得十分必要且有意義[31]。
本文中采用最大相關(guān)準則(MCC)作為分割效果的客觀評價指標[21]。該指標是Yen等人[32]基于最大熵準則提出,通過計算相關(guān)數(shù)總量和分割質(zhì)量之間的正相關(guān)關(guān)系來評估分割效果。在陳修橋等人[33]的推廣之下拓展到了二維。表3 為四種不同方法的分割效果評價,結(jié)果顯示本文算法在主觀和客觀評價指標方面都有較好的表現(xiàn)。
表3 不同方法分割效果的客觀評價
本文研究發(fā)現(xiàn),二維Otsu 分割法在實際應(yīng)用中存在著像素分類錯誤和適用性差的問題。針對這些問題,本文提出了二維Otsu 的Z 字折線閾值分割法。通過實驗證明邊界和噪聲區(qū)域不能全部忽略,否則會導(dǎo)致分割準確性大幅降低。為了解決這個問題,本文采用原始的二維Otsu 方法進行二維直方圖分割,當(dāng)邊界信息或噪聲區(qū)域所占比例可以被視為小概率事件時,可以適當(dāng)忽略這些區(qū)域,從而解決了經(jīng)典二維Otsu 算法假設(shè)前提不合理的問題。本文利用了二維直方圖分割中的先驗信息,改進了現(xiàn)有的二維直方圖區(qū)域斜分閾值分割算法,解決了明顯的錯誤分類問題。同時,本文充分考慮了邊界信息或噪聲區(qū)域?qū)τ诨叶葓D像分割的影響,通過修正像素分類錯誤的問題,有效提高了分割的精準度。通過實驗可以看出本文所推方法修正了二維直方圖區(qū)域斜分算法中的錯分區(qū)域后,對邊界信息豐富的圖像有著優(yōu)秀的分割效果。為解決適應(yīng)性差的問題,本文通過小概率事件參數(shù)的調(diào)節(jié),以及二分法的應(yīng)用,有效提高了算法的自適應(yīng)能力。本方法能使圖像分割精度更高,自適應(yīng)性更強,邊界形狀更準確,內(nèi)部像素分布更均勻。但在處理時間上要略長于原始二維Otsu 算法以及其他改進算法,使得本文方法在應(yīng)用場景上有限制性。