李旭茹
(山西農(nóng)業(yè)大學(xué)軟件學(xué)院,山西 太谷 030801)
圖像識(shí)別是指利用計(jì)算機(jī)技術(shù)對(duì)圖像進(jìn)行分析和理解,以識(shí)別各種目標(biāo)和對(duì)象[1]。隨著計(jì)算機(jī)的快速發(fā)展,圖像識(shí)別技術(shù)在現(xiàn)實(shí)生活中扮演著越來(lái)越重要的角色。在農(nóng)業(yè)中,為了給虛擬作物的研究提供依據(jù),可利用圖像識(shí)別技術(shù)分辨作物的類別、作物的生長(zhǎng)狀況、農(nóng)作物中病蟲(chóng)害的圖像診斷等[2],圖像識(shí)別技術(shù)還廣泛地應(yīng)用于煤倉(cāng)煤位監(jiān)測(cè)、變電站智能巡檢、故障遠(yuǎn)程監(jiān)測(cè)系統(tǒng)等[3-5]。
本文研究的車(chē)型識(shí)別是圖像識(shí)別的一支,是ETC系統(tǒng)重要的組成部分。目前常見(jiàn)的射頻識(shí)別(Radio Frequency Identification,RFID)電子標(biāo)簽是粘貼于車(chē)輛前擋風(fēng)玻璃上,該電子標(biāo)簽上有存儲(chǔ)設(shè)備,將用戶的信息,如:車(chē)牌號(hào)、人民幣余額、車(chē)輛所屬的類型等集中存儲(chǔ),讀寫(xiě)器接收標(biāo)簽內(nèi)存儲(chǔ)的信息是通過(guò)無(wú)線、不接觸的方式[6]。但在實(shí)際應(yīng)用中,有的車(chē)主將RFID電子標(biāo)簽中的信息私自變換,達(dá)到逃避繳費(fèi)的目的,這種情況加大了管控難度。為了解決此問(wèn)題,引入基于圖像的車(chē)型自動(dòng)識(shí)別系統(tǒng)非常迫切。
目前,深度學(xué)習(xí)技術(shù)蓬勃發(fā)展,對(duì)車(chē)型識(shí)別等方面的相關(guān)研究也發(fā)展起來(lái),但是深度學(xué)習(xí)需要有大量的訓(xùn)練樣本,實(shí)際操作中難以廣泛推廣和應(yīng)用[7-8]。本文將模糊理論應(yīng)用于車(chē)輛識(shí)別,這種模式簡(jiǎn)單方便、易于推廣和操作。具體過(guò)程為當(dāng)貼有電子標(biāo)簽的車(chē)輛經(jīng)過(guò)收費(fèi)站,系統(tǒng)將提取車(chē)輛的有效信息,并自動(dòng)比較提取的信息與電子標(biāo)簽存儲(chǔ)的信息,結(jié)果一致的,進(jìn)行自動(dòng)扣費(fèi)并起桿放行;對(duì)比結(jié)果不一致的,系統(tǒng)自動(dòng)進(jìn)行逃費(fèi)違法行為抓拍。將本文算法應(yīng)用于實(shí)際車(chē)型識(shí)別中,結(jié)果證實(shí)算法可行。
目前,國(guó)內(nèi)外對(duì)車(chē)型的模式識(shí)別還處于探索和發(fā)展階段,相關(guān)研究比較少,僅有的研究成果也是在模板匹配和神經(jīng)網(wǎng)絡(luò)下的車(chē)型模式識(shí)別,難以廣泛推廣和應(yīng)用。故而本文從實(shí)用性角度出發(fā),提出應(yīng)用模糊理論對(duì)車(chē)輛進(jìn)行識(shí)別,便于推廣和操作[9]。
在實(shí)際操作中,車(chē)輛在行進(jìn)中是運(yùn)動(dòng)的,運(yùn)用模糊理論的車(chē)型識(shí)別方法,通過(guò)外部安裝的圖像采集器拍攝兩個(gè)時(shí)刻同一位置的車(chē)輛側(cè)面照,然后將獲取的圖像信息存儲(chǔ)到存儲(chǔ)器,提取車(chē)輛輪廓和相關(guān)信息,再把數(shù)據(jù)傳輸?shù)阶R(shí)別模塊進(jìn)行模糊模式識(shí)別,流程如圖1所示。
圖1 車(chē)型識(shí)別流程圖
圖像預(yù)處理主要包括圖像灰度化、濾波、差影檢測(cè)。本文采用加權(quán)平均法,亦稱YUV方法進(jìn)行灰度圖像化,節(jié)省圖像處理所占用的存儲(chǔ)和時(shí)間。濾波采用了中值濾波技術(shù),可以更好地保留圖像中的細(xì)節(jié),同時(shí)消除圖像中的噪聲。下面重點(diǎn)介紹差影檢測(cè)。
要實(shí)現(xiàn)車(chē)型識(shí)別,首先能夠?qū)崿F(xiàn)對(duì)移動(dòng)對(duì)象的檢測(cè),目前常用方法是差影法。差影法又稱減影技術(shù),其核心就是將同一個(gè)目標(biāo)在不同時(shí)間獲取的圖像或者是同一個(gè)目標(biāo)在不同的波段獲取的圖像相減。在序列圖像中,假設(shè)多幀圖像之間的相關(guān)條件不發(fā)生變化,可通過(guò)逐像素做減法來(lái)檢測(cè)前后相鄰兩幀圖像之間是否存在差異。如果得到的結(jié)果差不為0,表示此處的像素發(fā)生了移動(dòng)。視頻連續(xù)的兩幀源圖像為f(t-1)(i,j)和f(t)(i,j),那么絕對(duì)差灰度圖像如式(1)所示:
得到絕對(duì)差灰度圖像后,需要選擇一個(gè)合適的閾值將前景物體(即目標(biāo)車(chē)輛)從背景物體中分割出來(lái),并以此閾值作為灰度閾值M,將目標(biāo)和背景區(qū)域進(jìn)行分割,獲得二值圖像。如式(2)所示:
閾值的選取直接影響分割效果的呈現(xiàn),最常用的是自適應(yīng)閾值法最大類間方差法,因該算法計(jì)算簡(jiǎn)單,不需要人為設(shè)定其他參數(shù),自適應(yīng)強(qiáng),成為使用最廣泛的圖像閾值選取法之一。
我國(guó)對(duì)汽車(chē)的分類有嚴(yán)格的標(biāo)準(zhǔn),根據(jù)最新的標(biāo)準(zhǔn),可以將汽車(chē)分為:轎車(chē)、客車(chē)、越野車(chē)、牽引車(chē)、載貨汽車(chē)、掛車(chē)[10]。這幾種車(chē)輛類型無(wú)論外觀和尺寸都有非常大的區(qū)別,但仍可以以像素為單位,將車(chē)輛外輪廓的頂部長(zhǎng)度(記為T(mén))與底部前后車(chē)輪間離的比值(記為B),還有車(chē)輛輪廓的頂部長(zhǎng)度與車(chē)輛頂部到地面間距(記為H)的比值建立模糊子集,加以區(qū)分以上幾種車(chē)輛,也就是利用T/B和H/B的值來(lái)區(qū)分。
首先,通過(guò)T/B的比值判斷,客車(chē)一般在1:1以上,載貨汽車(chē)、牽引車(chē)、掛車(chē)三種類型一般都在2:5 以下,轎車(chē)和越野車(chē)的介于其中。那么區(qū)分以上三類車(chē)型可以在最大隸屬原則下進(jìn)行第一次模糊模式識(shí)別;然后根據(jù)H/B 進(jìn)行第二次模糊模式識(shí)別區(qū)分轎車(chē)和越野車(chē),依然運(yùn)用最大隸屬原則。區(qū)分載貨汽車(chē)、牽引車(chē)、掛車(chē)的同樣適用上述方法。
具體方法為:首先把T與B的比值作為論域1,記N1=T/B,顯然0<N1<2,并建立3 個(gè)模糊子集,論域1 的模糊子集如表1所示。然后再把H與B的比值作為論域2,記N2=H/B,顯然0<N2<2,并建立5 個(gè)模糊子集,論域2的模糊子集如表2所示。
表1 論域1的模糊子集
表2 論域2的模糊子集
為6 種車(chē)型建立隸屬度函數(shù),公式見(jiàn)式(3)~(10)所示。
從圖像中獲得車(chē)頂部長(zhǎng)度T,底部前后輪間距離B,將二者的比值N1分別代入(3)、(4)、(5)中得到X1(N1),X2(N1),X3(N1),并比較大小,遵循最大隸屬度原則,車(chē)型就是隸屬度函數(shù)值最大的模糊子集。假使X2(N1)值最大,那么識(shí)別目標(biāo)為客車(chē)。如果X1(N1)值最大,再把H與B做比,將比值N2分別代入式(8)-(10)中,得Z1(N2),Z1(N2),Z1(N2)。根據(jù)最大隸屬度準(zhǔn)則,將上述三個(gè)值作比較,隸屬度函數(shù)值最大的即為車(chē)輛類型。如果X3(N1)值最大,則繼續(xù)把比值N2代入式(6),(7)中,得到Y(jié)1(N2),Y1(N2)值,比較大小,遵循最大隸屬度原則,隸屬度函數(shù)值最大的即為車(chē)輛類型。完整的車(chē)型識(shí)別過(guò)程如圖2所示。
圖2 車(chē)型識(shí)別
本文采用Matlab編程對(duì)圖像處理,選取轎車(chē)做實(shí)驗(yàn)驗(yàn)證。車(chē)輛經(jīng)過(guò)收費(fèi)站時(shí)是運(yùn)動(dòng)的狀態(tài),為了能夠捕捉經(jīng)過(guò)車(chē)輛的特征,可通過(guò)外部輔助拍攝設(shè)備拍攝同一位置兩個(gè)時(shí)刻的車(chē)輛側(cè)面照,以轎車(chē)為例拍攝照片,如圖3、圖4所示。
圖3 T0時(shí)刻車(chē)輛
圖4 T1時(shí)刻車(chē)輛
首先,對(duì)車(chē)輛進(jìn)行邊緣檢測(cè),可以得到車(chē)輛的輪廓信息,但在圖像中有一些不連續(xù)的線段,影響特征值的提取??刹扇¢]操作,光滑一些不連續(xù)的線段。閉操作之后得到的圖像如圖5所示。圖中的圖像邊緣是由單像素組成的細(xì)線,便于獲取目標(biāo)特征。本文要提取的特征是前文已引入的三個(gè)距離T、B、H的值。
圖5 閉操作后的圖像
特征值的提取要通過(guò)圖像的二維矩陣獲得,該矩陣中只有0、1 值,其中1 代表邊緣像素,0 代表非邊緣像素。
運(yùn)行程序,得到車(chē)輛的特征數(shù)據(jù)如下:T=167,B=314,H=131。
首先計(jì)算N1=T/B=167/314=0.532,將N1代入式(4)~(6)計(jì)算,可得:
可以看到,X3(N1)值最大,參照前圖車(chē)型分類,可得該車(chē)型屬于轎車(chē)、越野車(chē)子集。
為了進(jìn)一步確定車(chē)型,再計(jì)算N2=H/B=131/314=0.418,將N2代入(7)、(8)計(jì)算,可得:
Max(Y1(0.418),Y2(0.418))=Y1(0.418),即Y1(N2)值最大,最后可判斷該車(chē)為轎車(chē),實(shí)驗(yàn)結(jié)果與實(shí)際車(chē)型相符,識(shí)別正確。
最后,本文設(shè)計(jì)了一個(gè)GUI 界面,用來(lái)顯示最后的識(shí)別結(jié)果,如圖6所示。
圖6 識(shí)別結(jié)果的GUI界面
本文提出了一種基于模糊理論的車(chē)型識(shí)別技術(shù),并通過(guò)實(shí)驗(yàn)進(jìn)行驗(yàn)證。結(jié)果表明,該算法是可行的,可以實(shí)現(xiàn)車(chē)型的識(shí)別。但是該識(shí)別方案仍存在不足,比如在牽引車(chē)、半掛車(chē)等車(chē)型還未能實(shí)現(xiàn)完全識(shí)別。下一步將優(yōu)化算法,使識(shí)別的范圍進(jìn)一步擴(kuò)大,適用性更廣。