摘要:通過介紹基于機(jī)器學(xué)習(xí)的分類器的訓(xùn)練過程。首先對模式識別的相關(guān)知識進(jìn)行介紹,并對分類器的訓(xùn)練進(jìn)行具體的說明;然后給出了機(jī)器學(xué)習(xí)中最常用的支持向量機(jī)(SVM)方法和梯度方向直方圖特征描述的相關(guān)知識,重點(diǎn)講述了其原理和計算過程,建立了工程車輛樣本庫,采用梯度方向直方圖作為樣本特征,使用線性支持向量機(jī)的方法訓(xùn)練分類器,最后通過實(shí)驗證明了算法的正確性和可行性。
關(guān)鍵詞:梯度方向 支持向量 工程車輛 HOG特征
中圖分類號:TP391.1 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2016)06-0000-00
1 引言
一個完整的模式識別系統(tǒng)應(yīng)該包括從信息數(shù)據(jù)的采集、處理、分析到?jīng)Q策的整個過程[1]。而要使機(jī)器具有人的智能,相應(yīng)的必須具備人體所擁有的一些最基本的功能,比如視覺、觸覺;而且應(yīng)該具備大腦一樣的分析決策能力。就算一個簡單的人的動作讓機(jī)器來模仿也是相當(dāng)困難的。如圖1給出了一個完整的模式識別系統(tǒng)流程圖[2-3]。
從圖1中可以看出完整的模式識別所經(jīng)過的不同的模塊。傳感器相當(dāng)于人的感官,主要負(fù)責(zé)數(shù)據(jù)信息的采集;特征提取器所提取的特征具有以下性質(zhì):同一類別的不同樣本特征值非常接近、不同類別的樣本的特征值有很大差異、這些特征值對與類別不相關(guān)的變換具有不變性;而且特征提取相比分類器更加依賴問題所在的具體領(lǐng)域,所有相應(yīng)領(lǐng)域的知識能夠幫助尋找出更有效的特征 [4-5]。分類器是模式識別系統(tǒng)的核心模塊,相當(dāng)于這個系統(tǒng)的大腦,其作用是根據(jù)特征提取器得到的特征值來對一個被測樣本進(jìn)行分類標(biāo)記;同樣理想的分類器是不可能得到的,作為解決方案,往往采用確定一個可能類別的概率,根據(jù)概率分析結(jié)果;后處理是根據(jù)分類器給出的結(jié)果做出相應(yīng)的動作,是模式識別系統(tǒng)的輸出,也是模式識別最終的目的。
圖2給出了分類器訓(xùn)練的流程圖,所采用的是有監(jiān)督學(xué)習(xí)的方法。數(shù)據(jù)采集是對于訓(xùn)練樣本而言的,是有監(jiān)督學(xué)習(xí)的方法。特征的選擇需要根據(jù)特定領(lǐng)域的具體問題而定,選取具有明顯區(qū)分意義的和不易被噪聲干擾的特征。訓(xùn)練分類器,利用樣本的特征數(shù)據(jù)確定分類器的過程;分類器的訓(xùn)練是一個比較復(fù)雜的問題,起碼到目前為止沒有一個通用的方法可以完美的解決所遇到的所有問題,但采用基于樣本的分類器訓(xùn)練方法已得到人們的共識。
1 選擇訓(xùn)練樣本
訓(xùn)練樣本作為訓(xùn)練系統(tǒng)的輸入內(nèi)容,承載了所要識別對象的主要特征信息。機(jī)器學(xué)習(xí)就是去模仿人類的大腦的能力,通過對樣本知識的學(xué)習(xí)去辨別新的問題;然而現(xiàn)有的技術(shù)遠(yuǎn)遠(yuǎn)達(dá)不到人類的水平,學(xué)習(xí)的能力很難達(dá)到需要區(qū)分的高度。這樣選取的樣本對分類器的訓(xùn)練結(jié)果起到了決定性的作用。為彌補(bǔ)技術(shù)上的不足,通常采取選取與實(shí)際環(huán)境比較相近的樣本、加大樣本的數(shù)量等方法提高分類器的準(zhǔn)確率。用于訓(xùn)練車輛分類器的樣本必然使用包含所要識別車輛的圖片作為正圖像,而且圖像的尺寸不宜太大;所有樣本變換為同樣大小的尺寸。
2 訓(xùn)練分類器
分類器的訓(xùn)練是一個機(jī)器學(xué)習(xí)的過程,根據(jù)模式識別的知識可以了解具體的步驟:第一步是選取一定數(shù)量的樣本;第二步是提取樣本的特征信息,本算法采用的特征是梯度方向直方圖,用于對圖像進(jìn)行描述,提取樣本的信息就是計算樣本的梯度方向直方圖特性,得到的是一個多維的特征向量;第三步就是對特征信息進(jìn)行學(xué)習(xí)最后得到一個能用于檢測識別的分類器,為檢測的時候方便,在得到分類器之后將其轉(zhuǎn)換成能可以直接用于對圖像進(jìn)行檢測的檢測算子。如圖3所示是樣本分類器訓(xùn)練系統(tǒng)的流程圖。
計算出所有樣本的HOG特征,得到一組2916維度的特征向量;這一組向量作為線性SVM的輸入,其中正樣本的向量標(biāo)識為1,負(fù)樣本的向量標(biāo)識為0。訓(xùn)練的原理在SVM原理中有所介紹;其過程是根據(jù)確定的分類間隔和給出的樣本點(diǎn),不斷的對分類函數(shù)進(jìn)行修正,最后求解出分類函數(shù)的系數(shù)向量 ;由此得到分類器。分類器作為訓(xùn)練結(jié)果,包含的信息可能比較多,而不適合直接用于圖像中目標(biāo)的檢測;為檢測方便,將分類器轉(zhuǎn)換為檢測算子的形式,可以用于任何尺寸圖像的目標(biāo)檢測。
3 工程車輛的特征提取
算法選用梯度方向直方圖(HOG)作為樣本的特征信息。本文將樣本圖像劃分成均勻的小塊,每個小塊包含8×8的像素,求取每個像素點(diǎn)的邊緣(梯度信息);并以每個小塊為單位將邊緣映射到9個不同的方向塊中。每個方向塊的范圍為20度;8×8像素梯度方向投影到9個方向塊內(nèi),形成9維的特征向量作為細(xì)胞的值。投影是采用加權(quán)投票的方式,這個權(quán)值是根據(jù)該像素點(diǎn)的梯度幅度計算出來的。大塊(Block)表示相鄰的2×2cell。一個大塊(Block)中包含36(4×9)維的特征向量,其中相鄰大塊之間是相互重疊的,步長按照cell的大小行進(jìn)。以80×80像素的圖像為例,根據(jù)步長為8個像素,圖像包含9×9個大塊,轉(zhuǎn)化為HOG特征描述為一個2916(9×9×36)維的向量。
4 結(jié)語
本文主要介紹了基于機(jī)器學(xué)習(xí)的分類器的訓(xùn)練過程。首先對模式識別的相關(guān)知識進(jìn)行介紹,并對分類器的訓(xùn)練進(jìn)行具體的說明;然后給出了機(jī)器學(xué)習(xí)中最常用的支持向量機(jī)(SVM)方法和梯度方向直方圖特征描述的相關(guān)知識,重點(diǎn)講述了其原理和計算過程;在此基礎(chǔ)上介紹了本文算法的分類器訓(xùn)練過程。
參考文獻(xiàn)
[1] 李宏東,姚天翔 譯.Richard O.Duda,Peter E.Hart,David G..Stork,模式分類(第二版)[M].北京:機(jī)械工業(yè)出版社,2003.
[2] 劉麗,匡綱要.圖像紋理特征提取方法綜述[J].中國圖像圖形學(xué)報,2009(4):622-635.
[3] VAPNIK V. Statistical learning theory[M].New York:Wiley,1998,56-70.
[4] 曹翼.基于支持向量機(jī)理論的車輛監(jiān)控技術(shù)研究與應(yīng)用[D].上海:上海交通大學(xué),2010:30-32.
[5] 車志富.基于支持向量機(jī)的行人檢測[D].北京:北京交通大學(xué),2010:25-27.
收稿日期:2016-03-30
作者簡介:崔鵬宇(1982—),男,遼寧丹東人,碩士,講師,研究方向:計算機(jī)應(yīng)用、網(wǎng)絡(luò)安全、計算機(jī)控制方面的教學(xué)與科研工作。