張 玲,張 焱,陳路路
(中國電子科技集團(tuán)公司第五十四研究所,河北 石家莊 050081)
低照度圖像[1]與普通可見光圖像相比,具有信噪比低、亮度對比度小的特點,不利于目標(biāo)檢測識別,為實現(xiàn)目標(biāo)的及時、準(zhǔn)確識別,需發(fā)展高精度的目標(biāo)識別方法[2]。方向梯度直方圖(Histogram of Oriented Gradient,HOG)特征是用來進(jìn)行目標(biāo)識別的特征描述算法,通過計算和統(tǒng)計圖像局部區(qū)域的梯度方向直方圖來構(gòu)成特征。在圖像中,局部目標(biāo)的表象和形狀能夠被梯度或邊緣的方向密度分布很好地描述,計算一塊區(qū)域內(nèi)的所有像素處的梯度信息,即突變的方向和大小,然后對360°進(jìn)行劃分,得到多個bin,統(tǒng)計該區(qū)域內(nèi)的所有像素所在的bin,就得到了一個特征向量,這就是HOG特征,目前,基于HOG特征可實現(xiàn)行人檢測[3]和車目標(biāo)的檢測[4]。
基于圖像特征的目標(biāo)識別有多種模式識別方法,如統(tǒng)計模式識別方法,包括K最近鄰分類算法[5]、決策樹方法[6]、基于信息幾何的方法[7],人工智能方法,包括BP神經(jīng)網(wǎng)絡(luò)方法[8]、深度學(xué)習(xí)方法[9]、稀疏表示識別算法[10]和遺傳算法[11]等。然而,統(tǒng)計模式識別方法在樣本數(shù)量有限的情況下難以估計特征樣本的概率密度函數(shù),導(dǎo)致分類精度較低。為了改善分類精度,引入人工智能方法,但人工神經(jīng)網(wǎng)絡(luò)方法在處理小樣本和高維特征問題時,容易陷入局部最優(yōu),且計算復(fù)雜度明顯增加[12]。而基于統(tǒng)計學(xué)習(xí)理論的支持向量機(jī)方法[13]建立在結(jié)構(gòu)風(fēng)險最小化準(zhǔn)則基礎(chǔ)之上,具有較強(qiáng)的泛化能力,適用于小樣本訓(xùn)練的情況和高維特征的處理。
本文以HOG特征抽取和支持向量機(jī)技術(shù)[14]為基礎(chǔ),提出了一種傳感器圖像目標(biāo)分類識別方法。該方法通過抽取圖像特征、選擇核函數(shù)以及相關(guān)參數(shù),實現(xiàn)了低照度條件下基于圖像HOG特征的目標(biāo)分類識別。
傳感器目標(biāo)分類識別系統(tǒng)由目標(biāo)檢測、特征提取和分類識別等模塊組成。目標(biāo)檢測得到目標(biāo)數(shù)據(jù),進(jìn)而從中提取目標(biāo)特征,最后基于目標(biāo)特征進(jìn)行目標(biāo)的分類識別。
針對已檢測到的關(guān)鍵幀圖像數(shù)據(jù),經(jīng)過圖像的裁剪、縮放、灰度化以及Gamma歸一化等預(yù)處理后,完成HOG特征提取,然后構(gòu)建目標(biāo)分類器,利用分類器完成目標(biāo)的分類判別,目標(biāo)分類識別框架如圖1所示。
圖1 目標(biāo)分類識別框架Fig.1 The framework of target classification and recognition
本文選擇提取圖像的HOG特征,作為分類器的輸入。首先將彩色圖像轉(zhuǎn)換為灰度圖像,進(jìn)而完成圖像梯度分量的計算和梯度計算,通過cell劃分和block劃分生成圖像特征向量,主要包括:梯度計算、cell直方圖的計算和block特征的計算。
選擇水平梯度算子為[-1 0 1],豎直梯度算子為[1 0 -1]T。首先用[-1 0 1]梯度算子對原圖像做卷積運(yùn)算,得到x方向(水平方向,以向右為正方向)的梯度分量Gx(x,y),然后用[1 0 -1]T梯度算子對原圖像做卷積運(yùn)算,得到y(tǒng)方向(豎直方向,以向上為正方向)的梯度分量Gy(x,y)。然后再用以下公式計算像素點(x,y)處的梯度大小G(x,y)和方向角度α:
α=tan-1(Gy(x,y)/Gx(x,y))。
將圖像劃分為多個cell,每個cell是n像素×n像素,然后每2×2的cell構(gòu)成一個block,對每個cell中的每個像素的梯度按照方向統(tǒng)計直方圖,360°bin的劃分如下,這里進(jìn)行了9等分,分別得到落入[0,40),[40,80),[80,120),[120,160),[160,200),[200,240),[240,280),[280,320),[320,360)的梯度,然后把每個bin中梯度的范數(shù)相加,就得到了該bin的分量。這樣就得到了一個cell的特征,即一個9維的向量。
將block中cell的所有特征串聯(lián)起來,構(gòu)成該block的特征,然后歸一化,即把每個特征除以該特征向量的范數(shù),歸一化是為了消除光照的影響。這樣每個block是一個9×4=36維的向量。
最后,將所有的block的特征向量串聯(lián)起來就是最終的特征向量,即HOG特征。
目標(biāo)特征提取后,本文選擇SVM分類器進(jìn)行目標(biāo)的分類識別。SVM分類主要有3個步驟:核函數(shù)的選擇、二次規(guī)劃問題的求解和分類判別。
常用的非線性核函數(shù)K(x,xi)有二次函數(shù)、多項式函數(shù)、徑向基函數(shù)以及多層感知機(jī)函數(shù)等,其中徑向基函數(shù)(RBF)表達(dá)式如下:
(1)
式中,σ是核參數(shù)。
采用Sequential Minimal Optimization(SMO)算法[15]求解以下二次規(guī)劃問題,即求解拉格朗日乘子:
(2)
式中,αi,yi,i=1,2,…,n分別是拉格朗日乘子和數(shù)據(jù)分類標(biāo)簽;y∈{-1,1};n是樣本的個數(shù);C是懲罰因子。
根據(jù)以下函數(shù),做出分類判斷:
(3)
當(dāng)f(x)=1時,目標(biāo)屬于第一類;f(x)=-1時,目標(biāo)屬于第二類。
實驗中,抽取圖像的HOG特征,并采用SVM作為目標(biāo)分類器。訓(xùn)練樣本數(shù)和測試樣本數(shù)如表1所示。
表1 樣本數(shù)Tab.1 Sample number
將預(yù)處理后的圖像劃分為多個16像素×16像素的cell,計算每個cell的特征,即一個9維的向量,然后每2×2的cell構(gòu)成一個block,每個block是一個36維的向量,將所有的block的特征向量串聯(lián)起來,形成圖像的HOG特征,人、車目標(biāo)特征的不同隱含在HOG特征向量中,如圖2~圖5所示,進(jìn)而將通過對不同HOG特征向量的學(xué)習(xí)形成目標(biāo)分類器。
圖2 測試樣本-車Fig.2 Test sample:car
圖3 車的HOG特征Fig.3 HOG features of car
圖4 測試樣本-人Fig.4 Test sample:person
圖5 人的HOG特征Fig.5 HOG features of person
對拉格朗日乘子αi和閾值b賦初值,選擇懲罰因子和核參數(shù),輸入訓(xùn)練樣本的HOG特征,求解二次規(guī)劃問題(2),得到乘子αi和閾值b,通過不斷的迭代實驗及其結(jié)果,獲取懲罰因子和核參數(shù)的最優(yōu)組合,完成目標(biāo)二分類器,然后將測試樣本的HOG特征輸入分類器,測試結(jié)果如表2所示。
表2 測試結(jié)果Tab.2 Test results
實驗結(jié)果表明,不同目標(biāo)的HOG特征分布不同,且HOG+SVM算法可實現(xiàn)低照度圖像的精確分類,準(zhǔn)確率優(yōu)于95%,且懲罰因子值越高,分類精度越高。
由于HOG特征維度為8 100,當(dāng)采用BP神經(jīng)網(wǎng)絡(luò)方法[16]進(jìn)行測試時,訓(xùn)練速度緩慢,且神經(jīng)網(wǎng)絡(luò)參數(shù)占用內(nèi)存極高,不利于實現(xiàn)目標(biāo)分類識別實時性的要求,故采用SVM機(jī)器學(xué)習(xí)算法實現(xiàn)目標(biāo)分類具備優(yōu)越性。
傳感器圖像目標(biāo)自動分類識別克服了低照度條件下目標(biāo)分類精度低的問題,實現(xiàn)了對目標(biāo)分類識別統(tǒng)一性、穩(wěn)定性和實時性的要求。針對目標(biāo)分類問題,設(shè)計了一種基于HOG+SVM的目標(biāo)分類方法,其中,HOG算法通過對局部目標(biāo)的表象和形狀進(jìn)行梯度或邊緣方向密度分布的刻畫,捕捉不同目標(biāo)的特征點,對block特征向量的歸一化處理,消除了光照的影響,進(jìn)而HOG特征向量經(jīng)過SVM訓(xùn)練,完成核函數(shù)的選擇和拉格朗日乘子、閾值b、核參數(shù)、懲罰因子等相關(guān)參數(shù)的設(shè)定,實現(xiàn)了低照度圖像目標(biāo)的精確分類。