張莉
摘要:行人檢測(cè)在軌道交通、汽車(chē)輔助駕駛、電子警察等領(lǐng)域有廣泛的應(yīng)用。本文針對(duì)復(fù)雜和實(shí)時(shí)跟蹤處理的行人檢測(cè)場(chǎng)景,提出了采用MPL-Boost(MultiplePoseLearning- Boosting),并且引進(jìn)分段線性函數(shù)(Piece-wisefunction)作為MPL-Boost的弱分類(lèi)器,提高分類(lèi)器算法的分類(lèi)性能的高效行人檢測(cè)方法。針對(duì)行人檢測(cè)數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明,基于MPL特征和弱分類(lèi)器的分類(lèi)行人檢測(cè)方法具有較好的性能。
關(guān)鍵詞:行人檢測(cè); MPL-Boost; 分段線性函數(shù);Boosting算法
中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)26-0198-03
1 引言
近年來(lái)隨著智能信息技術(shù)的發(fā)展,對(duì)于行人檢測(cè)技術(shù)有更高的需求。比如:在軌道交通的視頻監(jiān)控系統(tǒng)中,利用視頻行人檢測(cè)可以實(shí)現(xiàn)客流分析、旅客異常行為分析等功能以方便運(yùn)營(yíng)和安保;在汽車(chē)輔助駕駛中,基于行人檢測(cè)可以實(shí)時(shí)提醒駕駛員行進(jìn)前方出現(xiàn)的行人,避免因?yàn)轳{駛員視線被遮擋或者注意力分散導(dǎo)致的危險(xiǎn)等;在基于視頻的電子警察系統(tǒng)中,利用行人檢測(cè)可以有效地避免因?yàn)樾腥说母蓴_導(dǎo)致的誤抓拍,大大減少垃圾照片的數(shù)量[1][2]。
行人檢測(cè)的方法主要分為兩類(lèi):一類(lèi)是首先基于背景建?;蛘邘畹姆椒ㄌ崛〕鲞\(yùn)動(dòng)的前景區(qū)域,然后利用輪廓的幾何參數(shù)對(duì)前景進(jìn)行分類(lèi)[3];另一類(lèi)是基于統(tǒng)計(jì)學(xué)習(xí)的方法,首先提前人體的外觀特征,然后利用分類(lèi)器進(jìn)行建模學(xué)習(xí)[4]。第一類(lèi)方法的缺陷在于對(duì)人體的描述過(guò)于簡(jiǎn)單,而且要求攝像機(jī)固定不動(dòng)。這樣會(huì)導(dǎo)致當(dāng)行人與其他運(yùn)動(dòng)物體發(fā)生遮擋時(shí)會(huì)導(dǎo)致漏報(bào),當(dāng)場(chǎng)景內(nèi)的其他運(yùn)動(dòng)目標(biāo)容易導(dǎo)致誤報(bào),以及當(dāng)攝像機(jī)運(yùn)動(dòng)(輔助駕駛)或場(chǎng)景內(nèi)關(guān)照干擾較多時(shí)(夜間車(chē)燈)系統(tǒng)完全失效。第二類(lèi)方法相對(duì)于第一類(lèi)方法的優(yōu)勢(shì)在于對(duì)人體的描述更加詳細(xì),并且基于數(shù)據(jù)驅(qū)動(dòng)的方式進(jìn)行統(tǒng)計(jì)學(xué)習(xí)得到的行人檢測(cè)器具有更好的區(qū)分性,可以減少第一類(lèi)方法所無(wú)法解決的誤報(bào)和失效等問(wèn)題。
在視頻行人檢測(cè)方面國(guó)內(nèi)外雖然已有很多的研究成果,但目前尚未有一個(gè)通用、精確、高性能和實(shí)時(shí)多目標(biāo)人體檢測(cè)算法。人體檢測(cè)的研究目前的難點(diǎn)主要在于:
1)人體的形狀不確定,尤其是在運(yùn)動(dòng)時(shí)等會(huì)有各種姿態(tài),觀察的視角不同時(shí),看到的人體形狀也會(huì)不同,這些原因造成人體類(lèi)內(nèi)模式的不固定。
2)人身上的衣服的多樣性,尤其在復(fù)雜的環(huán)境下,前景和背景的區(qū)分性不是很清晰。
3)遮擋情況,人體檢測(cè)要處理的數(shù)據(jù)很多是有遮擋的,尤其是在人比較密集的環(huán)境下,遮擋的情況比較嚴(yán)重,這種遮擋會(huì)影響檢測(cè)的性能。
4)光照變化,和其他視覺(jué)目標(biāo)檢測(cè)任務(wù)一樣,不同環(huán)境下光照不一樣,這種差異對(duì)人體的檢測(cè)會(huì)起到很大影響。
在本文中將采用分類(lèi)器MPL-Boost(MultiplePoseLearningBoosting),并且引進(jìn)分段線性函數(shù)(Piece-wisefunction)作為MPL-Boost的弱分類(lèi)器,提高分類(lèi)器算法的分類(lèi)性能。
2 基于多姿態(tài)學(xué)習(xí)的分類(lèi)器
2.1多姿態(tài)學(xué)習(xí)問(wèn)題
在人體檢測(cè)任務(wù)當(dāng)中,由于人體的形狀不確定,尤其是在運(yùn)動(dòng)時(shí)等會(huì)有各種姿態(tài),而且人在鏡頭的不同位置時(shí),看到的人體形狀也會(huì)不同。這些原因造成人體類(lèi)內(nèi)模式的不固定,類(lèi)內(nèi)的模式比較大,在基線系統(tǒng)中,人體檢測(cè)部分并沒(méi)有關(guān)注這個(gè)問(wèn)題,而是直接采用一個(gè)AdaBoost分類(lèi)器統(tǒng)一建模,將變化很大的人體看成是同一類(lèi),進(jìn)行分離器的訓(xùn)練,這樣會(huì)使得分類(lèi)性能不高。對(duì)于這種類(lèi)內(nèi)的變化,一種解決方式是通過(guò)人工將訓(xùn)練樣本分子類(lèi),姿態(tài)相近的分為一個(gè)類(lèi),針對(duì)每個(gè)類(lèi)別去訓(xùn)練出一個(gè)相應(yīng)的分類(lèi)器,但是這種方式需要人工劃分樣本,費(fèi)時(shí)費(fèi)力。
在本文中采用改進(jìn)的AdaBoost分類(lèi)器MPL-Boost,能夠在訓(xùn)練的時(shí)候同時(shí)訓(xùn)練出多個(gè)強(qiáng)分類(lèi)器,用這種多個(gè)分類(lèi)器同時(shí)建模的方式來(lái)刻畫(huà)類(lèi)內(nèi)的變化,而且在訓(xùn)練之前不需要對(duì)樣本分子類(lèi)別。
2.2梯度下降Boosting算法
基于梯度下降的Boosting算法,該算法是由Friedman[1]提出,能夠引入更多形式的損失函數(shù)來(lái)推廣Boosting算法。主要思想是在訓(xùn)練的時(shí)候利用梯度下降來(lái)優(yōu)化定義的損失函數(shù),從而在每一輪訓(xùn)練時(shí)能夠挑選出最優(yōu)的弱分類(lèi)器,使得在訓(xùn)練集上的損失代價(jià)最小。
在機(jī)器學(xué)習(xí)中二分類(lèi)監(jiān)督學(xué)習(xí)的一般過(guò)程,給定n個(gè)訓(xùn)練樣本和對(duì)應(yīng)的標(biāo)記,我們的目標(biāo)是學(xué)習(xí)一個(gè)分類(lèi)函數(shù),使得該函數(shù)不僅在訓(xùn)練數(shù)據(jù)上有好的分類(lèi)準(zhǔn)確性,且對(duì)訓(xùn)練數(shù)據(jù)集外的數(shù)據(jù)具有好的推廣性。Boosting是一種很成功的兩分類(lèi)的機(jī)器學(xué)習(xí)算法,在Boosting中,我們的目標(biāo)通常是訓(xùn)練如下形式的分類(lèi)器: