王栿棟
摘? 要:圖像邊緣是在圖像處理和圖像識別中經(jīng)常會用到的特征。很多場合下由于各種原因會使得原本應(yīng)該連續(xù)的邊緣出現(xiàn)局部斷點(diǎn),從而使原本的同一特征要素割裂。這會影響識別、判斷等后期處理。對此提出一種基于決策理論的圖像邊緣斷點(diǎn)修復(fù)算法。以斷點(diǎn)之間距離、斷點(diǎn)連線矢量、斷點(diǎn)周圍邊緣方向等為參考,提取特征向量。然后通過特征向量降維處理,最后設(shè)計(jì)一個(gè)非線性決策函數(shù)來判斷哪些斷口應(yīng)該恢復(fù)連接。實(shí)驗(yàn)證明該算法具有很好的斷口分類能力。
關(guān)鍵詞:圖像邊緣;斷點(diǎn);特征向量降維;非線性決策函數(shù)
中圖分類號:TP391.4? ? ? ?文獻(xiàn)標(biāo)志碼:A? ? ? ? ?文章編號:2095-2945(2020)11-0007-05
Abstract: Image edges are often used in image processing and recognition. For a variety of reasons, breakpoints appear on the edges in many cases. Subsequent processing such as recognition or judgment will be affected by these breakpoints. To repair breakpoints, we proposed one algorithm based on decision theory in this paper. We extract feature vector are extracted based on distance and vector between breakpoints and distribution of neighbour points. By reducing the dimensionality of feature, a nonlinear decision function is designed to determine which breakpoint pairs should be connected. Experiments prove that this algorithm can greatly improve the classification performance.
Keywords: image edges; breakpoint; reducing the dimensionality of feature; nonlinear decision function
1 概述
在數(shù)字圖像處理領(lǐng)域中,一幅灰度圖其最原始的信息就是每個(gè)像素對應(yīng)的位置和灰度值。一般情況下全圖像素?cái)?shù)量巨大,所含信息量龐雜。要從這些最原始的圖像中提取有用信息,就必須從中分割出有用的、感興趣的部分。圖像的邊緣線就是其中典型的一種。圖像的邊緣檢測是數(shù)字圖像處理中一項(xiàng)常見又基礎(chǔ)的任務(wù)。目前為止,已有Marr-Hildreth,Canny[1], Kirsch[2] Laplacian[3]等很多成熟的傳統(tǒng)邊緣檢測算子[4]。也有基于小波分析技術(shù)、神經(jīng)網(wǎng)絡(luò)、數(shù)學(xué)形態(tài)學(xué)等較新的邊緣檢測方法[5-7]。但面對實(shí)際情況復(fù)雜多變的圖像,各邊算子下的緣檢測提取結(jié)果都可能出現(xiàn)邊緣斷口情況。該文針對圖像邊緣檢測中原本不應(yīng)出現(xiàn)的斷口情況,探索了一種基于非線性決策函數(shù)的斷口修復(fù)方法。該算法將高維特征向量的分類決策問題降維為簡單的2維特征向量決策問題,使算法簡單高效。
在判斷哪些斷點(diǎn)應(yīng)該連接修復(fù)的問題上,目前經(jīng)常使用的基于形態(tài)學(xué)中膨脹算法簡單方便,但它僅僅根據(jù)斷口距離大小來確定是否重新連接[8,9]。而且膨脹操作會加粗原有的單像素邊緣,使其與原始輪廓邊緣產(chǎn)生誤差。文獻(xiàn)[10]采用了直接對單像素邊緣進(jìn)行分析的方法。但在判別斷口是否應(yīng)該修復(fù)連接的問題上,采用了按各個(gè)參數(shù)指標(biāo)的逐步排除的方法。如此就把確定斷口形狀的各特征要素機(jī)械地隔離開了。文獻(xiàn)[11]單獨(dú)提取了有關(guān)斷點(diǎn)的梯度,等照度線曲率等的初始特征。并將各特征指標(biāo)的線性和作為邊緣延伸依據(jù)。雖然上述各文獻(xiàn)考慮特征值數(shù)量不一,從決策角度來看,上述文獻(xiàn)中都只使用了簡單的線性判函數(shù)。當(dāng)面對比較復(fù)雜輪廓圖像時(shí),容易產(chǎn)生斷口的錯誤修復(fù)連接。而該文在綜合考慮確定斷口形狀的因素后,提取最能代表斷口形狀的幾何特征向量。然后設(shè)計(jì)一個(gè)合理的非線性決策函數(shù),用它來判別這些斷口點(diǎn)是否需要修復(fù)連接。實(shí)驗(yàn)證明其分類效果良好,具有重要的現(xiàn)實(shí)意義。
2 算法流程
在本算法之前,需對某一圖像進(jìn)行前期的預(yù)處理,這個(gè)過程主要采用一些經(jīng)典的圖像處理算法,如灰度變換、中值濾波、伽馬變換等來提高原始圖片對比度,目的是凸出圖像的邊緣輪廓[12]。然后通過Canny算子提取邊緣二值圖。這些具體過程不在該文展開。接著是本算法,它由以下幾部分組成。(1)斷點(diǎn)位置坐標(biāo)確定。這個(gè)環(huán)節(jié)主要是設(shè)法尋找邊緣圖像中的斷點(diǎn)所在的位置,是該文的基礎(chǔ)工作。(2)斷口鄰近邊緣點(diǎn)分析。要在斷點(diǎn)基礎(chǔ)上,再分析其周邊與它同一連通分支上點(diǎn)的分布情況,只有這樣才能綜合分析該斷口是否需要修復(fù)。這是該文的必要步驟。(3)斷口特征向量設(shè)計(jì)。為了便于計(jì)算機(jī)判斷處理,需要總結(jié)以上兩個(gè)步驟的基本信息,然后提取出合理的特征值向量。這是該文的重要部分。(4)決策規(guī)則制定。這部分工作提出了一個(gè)基于非線性決策函數(shù)的決策規(guī)則,用它來判定斷口該不該重新修復(fù)連接。這是該文的關(guān)鍵點(diǎn)。
由上述4大部分組成的修復(fù)流程見圖1所示。
3 算法原理
3.1 斷點(diǎn)位置坐標(biāo)確定
在數(shù)字圖像中,像素之間的位置關(guān)系有鄰接、連通、邊界等。本文中的處理對象是二值單像素圖像邊緣。判斷這些像素點(diǎn)是否為斷點(diǎn),要通過觀察它的八個(gè)鄰接點(diǎn)灰度狀況。這種鄰接狀態(tài)數(shù)量是有限的。然后采用一個(gè)3×3的空間濾波器作為檢測算子??臻g濾波器的系數(shù)采用二進(jìn)制位權(quán)值,其分布見圖2。設(shè)被考察像素點(diǎn)(圖中黑色像素點(diǎn))坐標(biāo)為(m,n),并定義如下斷點(diǎn)值q。其中f(gm+i,n+j)表示坐位置為
(m+i,n+j)像素點(diǎn)的灰度值,aij表示濾波器對應(yīng)權(quán)值。則被考察點(diǎn)能視為斷點(diǎn)的鄰接狀態(tài)只有16種。
與之對應(yīng)有16個(gè)不同的斷點(diǎn)值。除此外的其他情形在本文中均判定為非斷點(diǎn)。
3.2 斷口鄰近邊緣點(diǎn)分析
描述斷口特性,除了需要確定上述的斷點(diǎn)圖像坐標(biāo)位置外,還有一個(gè)很關(guān)鍵的信息就是與斷點(diǎn)直接相連的初級通路像素分布[13]。如圖3所示。這兩個(gè)信息基本確定了斷點(diǎn)所在的位置和斷點(diǎn)所屬邊緣局部形狀。為了確定這些周邊初級通路像素坐標(biāo)位置,本文采用局部領(lǐng)域限制與邊界追蹤法[14]。見圖4,在這幅被處理的邊緣圖像中,黑色像素是斷點(diǎn)。為了描述與這個(gè)斷點(diǎn)相連的周邊局部領(lǐng)域的初級通路像素分布情況。首先以這個(gè)斷點(diǎn)像素為基準(zhǔn),以一定像素量(此處為5個(gè)像素)為觀察領(lǐng)域半徑,然后在這個(gè)半徑領(lǐng)域內(nèi)進(jìn)行局部邊界追蹤,圖4所示的斜紋像素點(diǎn)便是追蹤結(jié)果,這是一條與斷點(diǎn)像素直接相連的局部初級通路像素。通過追蹤,記錄了這些像素的排序和坐標(biāo)值(此處假設(shè)斷點(diǎn)處為像素坐標(biāo)原點(diǎn))。
3.3 斷口特征向量設(shè)計(jì)
在以上述斷點(diǎn)的識別確定和斷點(diǎn)局部領(lǐng)域邊界追蹤的基礎(chǔ)上,分析什么樣的一雙斷點(diǎn)才有可能來自原本應(yīng)該連續(xù)的邊緣?并把它重修修復(fù)連接。見圖5。
(1)斷點(diǎn)之間的距離。設(shè)被考察的斷口由p1和p2兩個(gè)斷點(diǎn)組成。設(shè)這個(gè)兩個(gè)點(diǎn)的距離為d=。如果它們來自同一條邊緣上的斷點(diǎn),則合理的假設(shè)這兩個(gè)距離不能太遠(yuǎn)。設(shè)斷點(diǎn)的局部追蹤半徑為r,則斷點(diǎn)的相對距離設(shè)為m=d/r。只有當(dāng)m?燮1時(shí),即p1,p2這兩個(gè)斷點(diǎn)共處于圖5所示的公共追蹤范圍內(nèi)時(shí),才認(rèn)為這兩斷點(diǎn)來自同一邊緣上。
(2)兩斷點(diǎn)之間的向量。在圖5中,從p1到p2的單位向量描述了斷口連線的走向。它可以成為描述斷口形狀特性之一。
(3)局部追蹤綜合單位向量。為了描述與某斷點(diǎn)直接相連邊緣的形狀特點(diǎn),對斷點(diǎn)p1,p2分別進(jìn)行了3.2中所述的局部邊界追蹤。圖5中所示斜紋像素點(diǎn)就是兩斷點(diǎn)各自的局部追蹤得到的像素點(diǎn)。它們從對應(yīng)斷口點(diǎn)開始按序排列,決定了與該斷點(diǎn)直接相連的局部邊緣形狀。設(shè)p1,p2點(diǎn)到對應(yīng)追蹤點(diǎn)的單位向量分別是1,2…7和1,2…6。以與斷點(diǎn)距離大小為依據(jù)考慮權(quán)重an,bn,該距離越大權(quán)重越小。然后用式(2) 表示與p1,p2對應(yīng)的初級通路的綜合單位向量??梢?/p>
(2)
用它來描述與對應(yīng)斷點(diǎn)相連的局部邊緣形狀特點(diǎn)。
根據(jù)以上三條分析,為了描述、在方向上的一致性,定義下式:
(3)
為了描述與之間方向上的一致性,定義下式:
從以上的討論可知,采用向量[m,cki,ckj,cij]T作為斷口總體形狀特征向量是較為合理的[15]。
3.4 決策規(guī)則制定
斷口特征向量[m,cki,ckj,cij]T組成的特征空間是一個(gè)4維空間。如果設(shè)計(jì)一個(gè)4維特征空間中的設(shè)分類器,這個(gè)分類器將4維特征空間中的特征向量分成兩類。一類是應(yīng)該修復(fù)連接的斷口,一類是無需修復(fù)連接的斷口。此時(shí)兩者之間的決策面是一個(gè)多維的超平面或超曲面。所以如果直接從這4維特征向量出發(fā)分析決策面,會比較復(fù)雜抽象。如何更合理設(shè)計(jì)這個(gè)分類器?決策面要如何確定[16]?
為簡化上述問題,該文采用的是特征向量降維映射的辦法[17]。如果說由兩個(gè)斷點(diǎn)及周邊組成了一個(gè)可能斷口,那么描述這個(gè)斷口特性可以歸納為兩個(gè)大的方面。
(1)斷口方向一致度。也就是說如果這個(gè)斷口本該連續(xù)的,則cki,ckj,cij這三個(gè)用來描述斷口方向一致性的分量要得到保證。為此按式(5)定義一個(gè)斷口方向一致度s。它是一個(gè)關(guān)于[m,cki,ckj,cij]T的非線性函數(shù)。
上式中,將s的取值歸一化,它的取值范圍限制在0~1之間。s越大斷口方向越一致。期間還引入斷點(diǎn)的相對距離m,這是因?yàn)樵诳紤]斷口一致度時(shí),參看圖5。當(dāng)斷口很小,即m值很小時(shí),確定斷口方向一致度主要由cij確定。而當(dāng)斷口較大,即m值很大時(shí),則在確定斷口方向一致度時(shí)更多考慮Cki,Ckj的影響。
(2)斷點(diǎn)的相對距離m,這個(gè)指標(biāo)在3.3中已詳細(xì)提及。它主要描述斷口相對大小。
經(jīng)過以上分析,我們可以把原來描述斷口形狀特征的向量[m,cki,ckj,cij]T,映射為一個(gè)二維特征向量[m,s]T。對應(yīng)地,特征空間由4維降為2維。這非常有利于問題的簡化和處理。接下來相當(dāng)于把問題轉(zhuǎn)變?yōu)樵?維特征空間中設(shè)計(jì)一個(gè)分類器。對應(yīng)的決策面則呈現(xiàn)為一條2維平面上的曲線。
當(dāng)判斷一個(gè)斷口是否應(yīng)該重新修復(fù)連接的時(shí)候,一般來說當(dāng)m越大的時(shí)候,我們要求s越大。而當(dāng)m越小的時(shí)候,對s值要求越低,直到m=0,則不管s大小,它本身就已經(jīng)是一個(gè)連接點(diǎn)了。在2維特征向量[m,s]T基礎(chǔ)上,什么樣的2維曲線作為決策面才是合理的呢?實(shí)驗(yàn)證明,如果基于一般線性決策函數(shù)的分類決策,則分類結(jié)果出現(xiàn)很大的錯誤率。如圖6所示,這是一幅邊緣紋路較為復(fù)雜的圖像,其中只有一個(gè)期望被修復(fù)的斷口(小方框內(nèi)所示)得到了順利修復(fù)。三角框內(nèi)本應(yīng)該修復(fù)的斷口則沒有得到修復(fù)。其余圓形框內(nèi)的斷口都是錯誤修復(fù)連接。所以合理的2維斷口特征向量[m,s]T的決策面肯定不能是一條簡單的平面直線,它應(yīng)該是某一條更合理的平面曲線。從上述的分析可知s的理論取值區(qū)間為0~1。它與m是正相關(guān)的,但非正比關(guān)系。一個(gè)合理的設(shè)想為當(dāng)m?燮m1時(shí),此時(shí)斷口幾乎相連,可以對斷口作要求s?叟s1,直到m=0時(shí),對s值不作任何要求。而當(dāng)m?叟m2時(shí),斷口間距開始明顯,對斷口方向一致度s要求迅速上升為s?叟s2,直到m=1時(shí),必須滿足s?叟s0。從這個(gè)分析出發(fā),設(shè)計(jì)一個(gè)關(guān)于m,s的“S”型函s=,r0,r1待定。它在特征向量二維平面中的曲線形狀如圖7所示。其函數(shù)特性符合該文分析要求,以這條曲線為決策面,斷口的分類決策效果提升明顯。
取m1=0.2,m2=0.25,s1=0.4,s2=0.75,s0=0.98便可得到一個(gè)如式(6)所示的具體的“S”型函數(shù):
結(jié)合圖7和式(6)就可以直觀清晰地設(shè)計(jì)一個(gè)式(7)所示的決策規(guī)則。這是一個(gè)關(guān)于[m,s]T的非線性判別函數(shù)的決策規(guī)則。也是間接關(guān)于[m,cki,ckj,cij]T的非線性判別函數(shù)的決策規(guī)則。
如果當(dāng)被考察的斷點(diǎn)p1在觀察領(lǐng)域半徑r內(nèi)沒有找到對應(yīng)的斷點(diǎn),則采取r內(nèi)的距離p1最近的p2作為對應(yīng)點(diǎn),見圖8。然后以p1,p2考察斷口情形。此時(shí)p2點(diǎn)因?yàn)椴皇菙帱c(diǎn),以其為起點(diǎn)的初級通路不止一條。這時(shí)只要將與p2點(diǎn)相關(guān)的每條初級通路分別單獨(dú)考慮,然后通過上述方法單獨(dú)進(jìn)行決策。當(dāng)至少一條初級通路情形下p1,p2被決策為應(yīng)該修復(fù)斷口,就判定該斷口為應(yīng)該修復(fù)連接。
4 實(shí)驗(yàn)結(jié)果
采用上述斷點(diǎn)分類決策與修復(fù)方法后的實(shí)際效果見圖9所示,圖9(a)的斷口是最為普遍的情形。圖9(b)為斷口相對距離m與方向一致度s較小情形。它們都得到順利修復(fù)。而從圖9(c)與圖6的對比可以看到,在面對較為復(fù)雜的輪廓邊緣圖時(shí),采用本方法后,應(yīng)該修復(fù)連接的斷點(diǎn)都得到了順利的修復(fù)。同時(shí)沒有出現(xiàn)錯誤的斷口修復(fù)連接。
5 結(jié)束語
該文首先設(shè)計(jì)一個(gè)基于二進(jìn)制權(quán)值的濾波器,來識別所有斷點(diǎn)。然后分析并定義一個(gè)4維斷口特征向量。為使決策問題得到簡化,經(jīng)過映射把這4維特征向量降為2維特征向量。這使決策分類問題變得更加方便。當(dāng)面對較為復(fù)雜的邊緣圖像時(shí),如果基于一般線性規(guī)則設(shè)定一條直線作為決策面,發(fā)現(xiàn)分類效果較差,錯誤率也較高。而采用了該文設(shè)計(jì)的非線性決策算法后,在不明顯增加運(yùn)算復(fù)雜度的基礎(chǔ)上,斷口的分類準(zhǔn)確率得到了大大提高。
參考文獻(xiàn):
[1]王文豪,姜明新,趙文東.基于Canny算子改進(jìn)的邊緣檢測算法[J].中國科技論文,2017,12(8):910-915.
[2]張琳.基于Kirsch算子的圖像邊緣檢測[D].大慶:東北石油大學(xué),2015.
[3]Cheng Xiansheng. An Edge Detection new algorithm based on Laplacian Operator[C]//ICCSN,2011: 217-221.
[4]王敏杰,楊唐文,韓建達(dá),等.圖像邊緣檢測技術(shù)綜述[J].中南大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,42(1):811-816.
[5]李靚瑤.小波邊緣檢測在視覺圖像分析中的應(yīng)用研究[D].哈爾濱:哈爾濱理工大學(xué),2017:7-26.
[6]王錚,李興民.基于四元數(shù)和SOM神經(jīng)網(wǎng)絡(luò)的彩色圖像邊緣檢測[J].計(jì)算機(jī)應(yīng)用,2012,32(2):510-513.
[7]王芳,錢煒,李文超.基于數(shù)學(xué)形態(tài)學(xué)的圖像邊緣提取方法[J].機(jī)械工程與自動化,2015(1):46-48.
[8]賈迪,董娜,孟祥福,等.一種圖像的連續(xù)性邊緣提取方法[J].計(jì)算機(jī)工程與科學(xué),2014,37(2):384-389.
[9]蔣鑫.高光譜圖像融合中的邊緣修復(fù)研究[D].南京:南京理工大學(xué),2012.
[10]于廣婷,朱聰,李柏林,等.光學(xué)圖像中一種新的邊界斷點(diǎn)連接方法[J].計(jì)算機(jī)應(yīng)用研究,2014,31(4):1264-1266.
[11]徐毅,鄧廷權(quán).基于路徑形態(tài)學(xué)的圖像邊緣連接方法[J].計(jì)算機(jī)工程與應(yīng)用,2014,50(7):180-185.
[12]Rafael C. Gonzalez,Richard E. Woods. Digital Image Processing[M]. Englewood: Prentice Hall Press, 2007.
[13]耿素云,屈婉玲,張力昂.離散數(shù)學(xué)[M].北京:清華大學(xué)出版社,2018.
[14]胡晉山,康建榮,張琪,等.一種八鄰域圖像邊界追蹤改進(jìn)算法[J].測繪通報(bào),2018(12):21-25.
[15]王志瑞,閏彩良.圖像特征提取方法的綜述[J].吉首大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,32(5):43-47.
[16]邊肇祺,張學(xué)工.模式識別[M].北京:清華大學(xué)出版社,1999.
[17]李嬋娟.高維數(shù)據(jù)降維處理關(guān)鍵技術(shù)研究[D].成都:電子科技大學(xué),2017.