文/李陽娟
圖像識別主要是對文字、聲音和圖像等信息進(jìn)行處理和識別,主要應(yīng)用于文字識別、目標(biāo)的檢測與識別、生物醫(yī)學(xué)信號和圖像分析等方面。在圖像識別與理解的過程中,物體的形狀屬于高級信息,簡單的形狀可以組合成更復(fù)雜的圖形,檢測出簡單的幾何形狀,進(jìn)而識別出復(fù)雜圖像,在數(shù)字圖像中對簡單幾何形狀的識別意義重大 。該文利用MATLAB GUI設(shè)計(jì)一個(gè)簡單的形狀識別系統(tǒng),提取不同形狀的邊緣特征,檢測出簡單的幾何圖形,如圓、矩形、正方形等,可以實(shí)現(xiàn)一些簡單的工業(yè)檢測,如簡單的零件檢測等。相較于傳統(tǒng)的形狀檢測,該系統(tǒng)不需要人為檢測,極大地提高了生產(chǎn)效率。
形狀檢測系統(tǒng)載入圖像之后需要對圖像進(jìn)行預(yù)處理,消除圖像中的無關(guān)信息,簡化圖像數(shù)據(jù),增強(qiáng)圖像的特征,進(jìn)而增加圖像特征提取、分割和識別的可靠性。一般流程為灰度轉(zhuǎn)換,然后對灰度圖像進(jìn)行圖像平滑和提取邊緣,運(yùn)用形狀檢測算法,得到結(jié)果,結(jié)束程序。
圖像的灰度轉(zhuǎn)換是反應(yīng)灰度的輸入/輸出映射關(guān)系,增強(qiáng)圖像中感興趣的區(qū)域,抑制不感興趣的區(qū)域,達(dá)到增強(qiáng)圖像對比度的目的?;叶茸儞Q處理是一種基礎(chǔ)的圖像增強(qiáng)處理技術(shù),通過灰度變換可以使圖像對比度擴(kuò)展,圖像清晰,從而使圖像在視覺上得到改觀。灰度直方圖是一種簡單、有效的分析圖像處理方法,假定灰度直方圖的橫坐標(biāo)是灰度級r,表示灰度值為k的灰度級,縱坐標(biāo)是具有該灰度級的像素的概率p(rk),則
直方圖可以反映原圖灰度值的分布情況,而通過對直方圖形狀的修改可以增強(qiáng)圖像的對比度?;叶绒D(zhuǎn)換處理圖像如圖1所示。
在實(shí)際操作所獲得的圖像由于各種噪聲的干擾,使得圖像質(zhì)量變差,往往對圖像分析不利,需要進(jìn)行圖像平滑處理。圖像平滑是來消除或減少圖像中的噪聲,突出圖像的主干部分,改善圖像質(zhì)量,文中采用高斯噪聲領(lǐng)域平均法來去除噪聲。鄰域平均法計(jì)算速度快,圖像的噪聲衰減,但是會(huì)造成圖像的邊緣變得模糊。為了減少圖像模糊,可以采用閾值法來對圖像進(jìn)行平滑或選取半徑小的鄰域。MATLAB中提供imf iter函數(shù)用于實(shí)現(xiàn)圖像的平滑處理,處理結(jié)果如圖2所示。
邊緣檢測技術(shù)在數(shù)字圖像處理中非常重要,因?yàn)檫吘壥菆D像中所要提取的目標(biāo)和背景的分界線,只有提取了邊緣才能將背景和目標(biāo)區(qū)分開來。兩個(gè)具有不同灰度值的相鄰區(qū)域之間總存在邊緣,邊緣是灰度值不連續(xù)的結(jié)果。在數(shù)字圖像處理中常用一階導(dǎo)數(shù)和二階導(dǎo)數(shù)的幅值大小來判斷圖像中邊緣的位置。圖像邊緣是由于相鄰像素間的灰度值變化引起的,處在邊緣地帶的圖像變化比較激烈,梯度幅值較大。設(shè)計(jì)采用保留最清晰輪廓的Sobel算子進(jìn)行邊緣檢測,MATLAB中提供edge函數(shù)用于實(shí)現(xiàn)圖像的邊緣提取。結(jié)果如圖3所示。
圖1:灰度變換圖
在一副圖像中,除了目標(biāo)對象大小不同之外,也會(huì)出現(xiàn)不同形狀的物體,有圓形、方形、不規(guī)則圖形,如圖4。因此,可以根據(jù)工件的面積大小或者周長長度來對圖形進(jìn)行分類。該設(shè)計(jì)主要采用幾何參數(shù)法(如矩、面積、周長等)來判斷給出的的圖像是什么形狀。一般采用圓形度來衡量某圖形與圓形相似的程度,圓形度公式:
A是指目標(biāo)圖像的面積,P是指目標(biāo)圖像的周長,當(dāng)目標(biāo)圖像為圓形的時(shí)候,C等于1,當(dāng)目標(biāo)圖像為其他任意形狀的時(shí)候,C小于1。與圓形度類似,矩形度是用來描述圖形與矩形相似程度的量,公式:
A0是指目標(biāo)圖像的面積,AR是指包圍該圖像的最小矩形面積,R的大小反映物體與矩形的接近程度,矩形度的值限定在0到1之間。設(shè)計(jì)中先對各圖形邊緣進(jìn)行提取,然后根據(jù)各種形狀的面積計(jì)算公式來計(jì)算出各圖形的圓形度和矩形度。之后和預(yù)設(shè)的值逐個(gè)進(jìn)行比較,直到判斷出圖像是什么形狀。若為標(biāo)準(zhǔn)圖像,則圓形度與矩形度應(yīng)為1。實(shí)際測量時(shí)存在不穩(wěn)定因素,允許有5%的誤差。檢測結(jié)果如圖5。
圖2:平滑圖像圖
圖3:邊緣檢測圖
圖4:幾何圖形原始圖像
圖5:幾何參數(shù)法圖像檢測結(jié)果
圖6:圓形工件原始圖像
圖7:Hought變換檢測結(jié)果
在簡單幾何形狀的基礎(chǔ)上,再對實(shí)物圖進(jìn)行檢測,以常見的工業(yè)檢測圓形工件為例,如圖6。采用Hough變換檢測圓。Hough變換是利用點(diǎn)與線的對偶性將原始圖像空間的給定的曲線通過曲線表達(dá)形式變?yōu)閰?shù)空間的一個(gè)點(diǎn)。這樣就把原始圖像中給定曲線的檢測問題轉(zhuǎn)化為尋找參數(shù)空間中的峰值問題。對一直角坐標(biāo)系中的直線,其方程可以寫成ρ=x cos θ+y sin θ ,參數(shù)ρ和θ可以唯一確定一條直線,該變換將(x,y)平面內(nèi)的一條直線變換成了(ρ,θ)平面的一個(gè)點(diǎn)。從上面的Hough檢測直線可推廣檢測曲線,識別出圓形。首先建立三維累加數(shù)組,利用圓的方程為,通過Hough變換將圖像的空間對應(yīng)到參數(shù)空間設(shè)置角度θ的變化范圍和步長,半徑r的變換范圍和步長。利用公式x=a+r cos θ,y=b+r sin θ求出a和b的值,如果a和b的值在合理的范圍之類,則對該位置進(jìn)行累加。檢索完畢,尋找最大值,求出圓心坐標(biāo)與半徑,由此可檢測出圓的邊界,從而識別出圓形來。檢測結(jié)果為圖7。
該文設(shè)計(jì)了基于Matlab GUI的形狀檢測系統(tǒng),該系統(tǒng)具有良好的人機(jī)交互界面,能夠滿足基本簡單的幾何形狀檢測操作,在這基礎(chǔ)上,對于簡單的圓形工件檢測也具備良好效果。該設(shè)計(jì)主要是根據(jù)目標(biāo)圖像的形狀進(jìn)行分類識別,相比傳統(tǒng)檢測手段更高效便捷,可應(yīng)用于圖像自動(dòng)識別分類,圖像智能檢索等領(lǐng)域。