摘要:有效提取行人的特征是行人檢測技術(shù)的關(guān)鍵之一。梯度向量直方圖(Histogram of Oriented Gradients,HOG)特征能有效描述人體的大致輪廓且不易受到復雜背景的影響。探討了行人檢測中的HOG特征,重點研究了其中的三線性插值算法。三線性插值算法可以消除因區(qū)域混疊問題對行人特征造成的影響,對準確檢測行人非常重要。
關(guān)鍵詞:行人檢測;HOG 特征提??;三線性插值
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2012)31-7548-04
基于移動攝像機的運動行人檢測與跟蹤是城市交通環(huán)境下智能車輛輔助導航技術(shù)中的一項關(guān)鍵技術(shù),也是目前計算機應(yīng)用領(lǐng)域的研究熱點之一[1]。它能有效地輔助駕駛員及時地對外界環(huán)境做出反應(yīng),避免碰撞行人,對于保障現(xiàn)代城市道路交通安全具有重要的作用,具有十分廣闊的應(yīng)用前景[2]。若要在交通道路中準確地檢測出行人,必須采用一種魯棒性強的算法對行人特征進行描述。目前研究較多的是梯度方向直方圖(Histogram of Oriented Gradients,HOG)特征[3-5],該特征具有簡單可靠、學習精度高的特點,能精準、有效地表征行人[5]。本文重點介紹了HOG特征提取過程中的三線性插值方法的原理,指明了三線性插值算法在HOG特征提取中的重要性。
1 梯度方向直方圖特征
HOG是一種局域描述符,是針對圖像某個矩形區(qū)域中的梯度方向與強度的統(tǒng)計信息而定義的一種特征。如圖1所示,(a)-(c)是MIT行人庫中的部分行人圖像,(d)是99幅行人圖像梯度的平均效果,可以看出雖然原始圖像具有各種復雜的背景,行人本身的姿態(tài)也各不相同,但是圖像梯度的平均效果卻可以明顯反映出行人的大致輪廓。因此,利用圖像的梯度特征可以有效檢測出行人。