黃 珍,曹曉麗
(蘭州文理學(xué)院 電子信息工程學(xué)院,甘肅 蘭州 730000)
在人臉檢測(cè)中對(duì)Adaboost算法的應(yīng)用研究
黃 珍,曹曉麗
(蘭州文理學(xué)院 電子信息工程學(xué)院,甘肅 蘭州 730000)
由于在當(dāng)前使用的圖像檢測(cè)方法當(dāng)中最為流行的是Adaboost算法,這種檢測(cè)方法立足于統(tǒng)計(jì)模型.而當(dāng)前有部分人臉檢測(cè)方法當(dāng)中存在著比較嚴(yán)重的檢測(cè)速度慢與誤檢率特別高的問(wèn)題,本文則對(duì)基本的Adaboost算法原理進(jìn)行仔細(xì)解釋,而且將這一算法在開發(fā)OpenCV程序過(guò)程當(dāng)中進(jìn)行應(yīng)用,從而做到實(shí)現(xiàn)快速檢測(cè)、魯棒性與檢測(cè)率都比較高的人臉檢測(cè).
圖像檢測(cè)方法;Adaboost算法;統(tǒng)計(jì)模型;人臉檢測(cè)方法
通常來(lái)說(shuō),所謂的人臉檢測(cè)是將視頻序列或者是靜止圖像輸入之后憑借相應(yīng)的系統(tǒng)性策略或者組合將所有存在的人臉位置、姿態(tài)與大小進(jìn)行確定的過(guò)程.人臉檢測(cè)技術(shù)則是指識(shí)別人臉的系統(tǒng)、立足于內(nèi)容的圖像檢索、處理數(shù)字視頻、監(jiān)測(cè)視覺(jué)以及驗(yàn)證身份等方面存在著特別重要的應(yīng)用價(jià)值.可是受到特殊性與復(fù)雜性人臉自身的影響,而就導(dǎo)致在識(shí)別和檢測(cè)人臉的過(guò)程當(dāng)中受到背景、圖像質(zhì)量、表情、光照、尺寸、年齡、姿態(tài)等程度不同的影響.當(dāng)前研究的熱點(diǎn)之一則是識(shí)別和檢測(cè)人臉.
在人臉圖像當(dāng)中體現(xiàn)出特別豐富的特征信息,在這些特征信息當(dāng)中,比較典型的則是幾何特征與顏色特征,運(yùn)動(dòng)信息還存在于序列圖像的范疇當(dāng)中.如今對(duì)于人臉進(jìn)行檢測(cè)的技術(shù)則劃分為兩大類:立足于統(tǒng)計(jì)學(xué)習(xí)的方法與立足于知識(shí)的方法;將隱馬爾科夫模型與彈性圖匹配作為代表的立足于結(jié)構(gòu)特征的方法、混合局部特征與全局特征的方法以及將特征臉當(dāng)成代表的全局特征提取與匹配方法.往往如今動(dòng)態(tài)與單幅靜止的人臉圖像則是識(shí)別和檢測(cè)人臉實(shí)施處理的對(duì)象.
從本質(zhì)上來(lái)看,Adaboost算法這屬于迭代的方法,這種算法的主要思想則是將系列性的弱分類器級(jí)聯(lián)組合成為強(qiáng)分類器.實(shí)施這種算法的主要過(guò)程則是率先制定樣本集合,隨后循環(huán)操作所選定的樣本集合,而在所有的循環(huán)過(guò)程中應(yīng)該做出假設(shè),之后將該假設(shè)的錯(cuò)誤率進(jìn)行計(jì)算,按照這對(duì)所有樣本權(quán)重進(jìn)行改變從而逐漸進(jìn)入到下一個(gè)循環(huán)當(dāng)中.從具體的操作流程來(lái)看,首先是必須做到所有樣本有著相等的權(quán)重,以便把一弱分類器從該樣本分布當(dāng)中訓(xùn)練出來(lái);之后憑借對(duì)這個(gè)分類器的使用,以便將被它錯(cuò)誤分類的樣本點(diǎn)權(quán)重提高,而且對(duì)被正確分類的樣本權(quán)重降低,借助于這樣的分類則能夠突出錯(cuò)誤的樣本,而這樣就會(huì)有著新的樣本分布獲得.樣本在更新權(quán)重之后則被使用訓(xùn)練下一個(gè)分類器,根據(jù)這樣的道理類推,經(jīng)歷著T次的循環(huán),以便對(duì)T個(gè)弱分類器的獲得,根據(jù)一定權(quán)重憑借累加所有弱分類器,這樣就會(huì)有著理想的強(qiáng)分類器獲得.
按照相關(guān)的理論結(jié)果顯示:只要所有的弱分類器所具備的分類能力好于隨機(jī)猜測(cè),如果級(jí)聯(lián)弱分類器所具備的個(gè)數(shù)趨向于無(wú)窮個(gè)數(shù)的時(shí)候,那么就導(dǎo)致強(qiáng)分類器的錯(cuò)誤率逐步趨向于零.
1.1 Adaboost算法針對(duì)兩類問(wèn)題的訓(xùn)練過(guò)程
1.通過(guò)假定X來(lái)表示樣本空間,樣本類別的標(biāo)識(shí)集合為Y,可是這一問(wèn)題的屬于二類,以便假設(shè)Y={1,-1},那么這就分別表示相應(yīng)的正樣本與負(fù)樣本;
2.循環(huán)次數(shù)T;
3.循環(huán)fort=1,2,…,T.
一是按照分類Dt(i)訓(xùn)練相應(yīng)的分類器
二是從分類獲得結(jié)果:ht∈->R
三是獲得錯(cuò)誤率δt=∑tDt(i){Ht(i)-Y}AC
五是輸出結(jié)果:H(x)=sign(∑nht(x)).
4.Dj(i)則顯示出在第j次循環(huán)當(dāng)中樣本dt的權(quán)重,Dt(i)=1/N;
5.訓(xùn)練樣本集合S={(x1,y1),(x2,y2),…,(xn,yn)},xi∈X,yi∈{1,-1},i=1,2,3,4,…,N.
1.2 矩形特征
通過(guò)我們的研究就能夠了解到,在AdaBoost算法當(dāng)中所使用分類的依據(jù)則是矩形特征,而這就是憑借一種與Haar小波有著一定類似之處的方法來(lái)對(duì)于人臉特征形成;如果在矩形特征當(dāng)中顯得比較典型其組成部分往往是兩個(gè)到四個(gè)范圍之內(nèi)的矩形,以便能夠做到對(duì)角線、細(xì)線或者邊界等特征分別對(duì)應(yīng),那么在矩形特征所擁有的數(shù)值則是說(shuō)正規(guī)圖像上面的兩個(gè)或者是兩個(gè)以上的相同大小形狀的矩形內(nèi)部所有像素灰度值之和所存在的差值,往往這個(gè)差值就是通過(guò)灰色矩形內(nèi)部的像素值減去白色矩形內(nèi)的像素值.由于雙矩形特征、三矩形特征與四矩形特征這屬于檢測(cè)中所用到的三種人臉特征,而這特征也相對(duì)應(yīng)在圖1當(dāng)中的A、B、C、D.而通過(guò)圖1就能夠了解到,所謂的雙矩形特征就是指在圖1當(dāng)中相鄰兩個(gè)矩形內(nèi)部像素顏色之和的差值;三矩形特征則是指兩邊的兩個(gè)矩形將中間的矩形中矩形內(nèi)的像素顏色值減去所得到的數(shù)值;四矩形特征則是說(shuō)兩對(duì)角線上矩形內(nèi)部像素顏色的差值.
圖1 人臉矩形特征分析圖
在人臉特征進(jìn)行計(jì)算的過(guò)程當(dāng)中,通過(guò)對(duì)矩形特征的利用,這樣就能夠做到基于尺度不同將圖像特征快速計(jì)算,而算法也對(duì)于積分圖的概念進(jìn)行引用,而就能夠從圖2進(jìn)行體現(xiàn).
圖2 積分圖的概念
圖3 積分圖像
如果統(tǒng)計(jì)出圖像的積分圖,立足于常數(shù)時(shí)間通過(guò)積分圖就能夠計(jì)算在整個(gè)圖像當(dāng)中隨意一個(gè)尺寸內(nèi)的特征.而這就可以從圖3進(jìn)行顯示.
借助于以上所做的詳細(xì)分析,這樣就能夠讓我們了解到,在整個(gè)檢測(cè)階段當(dāng)中,貫穿始終的當(dāng)遍歷一次圖像,這樣就導(dǎo)致積分圖對(duì)隨意尺寸矩形積分圖特征比較方便計(jì)算.
1.3 級(jí)聯(lián)分類器的選定
為做到對(duì)檢測(cè)系統(tǒng)的速度的進(jìn)一步提高,而所使用的AdaBoost算法則選取的檢測(cè)方法則是屬于一種瀑布式級(jí)聯(lián)分類器,使用AdaBoost算法在所有層訓(xùn)練一直延續(xù)到獲得最小的誤檢率,當(dāng)所獲得的誤檢率的比目標(biāo)高,那么就會(huì)導(dǎo)致進(jìn)入到更新的一層當(dāng)中.不管是在那一層在進(jìn)行訓(xùn)練的過(guò)程當(dāng)中往往僅僅是針對(duì)通過(guò)上層分類器的樣本實(shí)施訓(xùn)練,這就存在著一定程度的類似之處與前文所提到的思想,把候選區(qū)域最大限度的縮小則是整個(gè)框架的目的.所擦用的瀑布式級(jí)聯(lián)分類器的檢測(cè)方式結(jié)構(gòu)則可以從圖4進(jìn)行顯示.
圖4 瀑布式級(jí)聯(lián)分類器實(shí)施檢測(cè)的流程圖
由于輸入級(jí)聯(lián)分類器則是屬于借助于這樣的級(jí)聯(lián)分類器來(lái)對(duì)每個(gè)待測(cè)的窗口與圖像子窗口實(shí)施檢測(cè),針對(duì)一個(gè)等待進(jìn)行檢測(cè)的圖像樣本,率先就應(yīng)該將這個(gè)樣本送入到第一層的分類器當(dāng)中,當(dāng)這一分類器所實(shí)施判斷這個(gè)圖像是屬于非人臉,那么則結(jié)束整個(gè)檢測(cè)過(guò)程;如果所實(shí)施判斷這個(gè)圖像是屬于人臉,這樣就會(huì)將其送入到下一層的分類器當(dāng)中實(shí)施繼續(xù)判斷.通過(guò)這樣舉措的實(shí)施,以便能夠做到讓很多明顯不是人臉的窗口在之前的幾層就能夠?qū)⑵渑袛酁榉侨四?,相?yīng)并不需要經(jīng)歷幾層分類器的檢驗(yàn),而充分考慮到實(shí)施人臉檢測(cè)的過(guò)程當(dāng)中絕大多數(shù)等待進(jìn)行檢測(cè)的圖像則是屬于非人臉,這樣的做法就使得分類器整體的檢測(cè)速度得到有效提升.
使用這一的級(jí)聯(lián)分類器框架這樣就導(dǎo)致相對(duì)來(lái)說(shuō)顯得比較復(fù)雜的操作僅僅只能立足于極少數(shù)像素實(shí)施,而所使用的瀑布式級(jí)聯(lián)分類器結(jié)構(gòu)方式可以對(duì)系統(tǒng)整體運(yùn)算量極大的減少.
在本文當(dāng)中必須要對(duì)于一個(gè)樣本集建立,借助于AdaBoost算法的有效利用來(lái)進(jìn)行訓(xùn)練就能夠獲得一個(gè)AdaBoost級(jí)聯(lián)分類器.在這一過(guò)程當(dāng)中能夠通過(guò)OpenCV自帶的Haartraining程序來(lái)實(shí)現(xiàn),還能夠通過(guò)OpenCV自帶的Haartraining程序訓(xùn)練樣本空間,在結(jié)束訓(xùn)練完畢,這樣就hi有著一個(gè)XML文件獲得,而這一文件則是分類器的組合.
2.1 Createsamples程序的主要命令行參數(shù)
-img
-num
-inv:如果指定顏色會(huì)會(huì)任意反色
-maxidev
-w
-h
2.2 Haartraining的主要命令行參數(shù)
-vec
-w
-maxfalsealarm
-nonsym:制定訓(xùn)練的目標(biāo)對(duì)象是否垂直對(duì)稱
-nneg
-data
通過(guò)加載整個(gè)圖片所獲得的檢測(cè)結(jié)果則可以從圖4進(jìn)行顯示,在這其中的a圖與b圖則都可以檢測(cè)出所有的人臉,而在c圖當(dāng)中進(jìn)行檢測(cè)的過(guò)程當(dāng)中漏檢了一張臉,這就顯示出通過(guò)Adaboost算法的應(yīng)用檢測(cè)人臉依然還是存在著一定程度的漏檢率,可是受到持續(xù)不斷的增加強(qiáng)分類器個(gè)數(shù),這樣就能夠極大的改善所存在的這種情況.
而在整個(gè)實(shí)驗(yàn)當(dāng)中所選取的訓(xùn)練樣集則是ORL人臉庫(kù),有著三十個(gè)人,每個(gè)人都是10幅,像素大小為112*92,整個(gè)圖像總共有三百幅.通過(guò)檢查結(jié)果來(lái)看,有著91%的最高識(shí)別率,漏檢率為7%,9%的誤識(shí)率,往往達(dá)到比較低水平的漏檢率.
通過(guò)對(duì)OpenCV圖像處理軟件和AdaBoost人臉檢測(cè)算法的結(jié)合模塊的有效利用,更進(jìn)一步的對(duì)擴(kuò)展的Haar特征選用,從而能夠做到對(duì)人臉檢測(cè)的實(shí)現(xiàn),還能夠?qū)z測(cè)結(jié)果列出,從而對(duì)人臉檢測(cè)實(shí)現(xiàn)均在可接受范圍內(nèi)的漏檢率、誤識(shí)率以及識(shí)別率.
〔1〕劉冉冉,馬慶功,鄭恩興.關(guān)于Adaboost算法在人臉檢測(cè)中應(yīng)用的研究[J].湖南工程學(xué)院學(xué)報(bào)(自然科學(xué)版),2013(01):38-41.
〔2〕王尋,趙懷勛,劉錫蔚.基于膚色及改進(jìn)的Adaboost算法的人臉檢測(cè)[J].電子科技,2013(09):18-21.
〔3〕孟子博,姜虹,陳婧,袁波,王立強(qiáng).基于特征剪裁的AdaBoost算法及在人臉檢測(cè)中的應(yīng)用[J].浙江大學(xué)學(xué)報(bào)(工學(xué)版),2013(05):906-911.
〔4〕高山武,周艷潔.AdaBoost算法在人臉檢測(cè)中的應(yīng)用[J].現(xiàn)代計(jì)算機(jī)(專業(yè)版),2011(16):20-23+ 35.
〔5〕丁知平.基于改進(jìn)的AdaBoost人臉檢測(cè)算法的研究[J].現(xiàn)代計(jì)算機(jī)(專業(yè)版),2013(22):9-13.
〔6〕張寧,李娜.基于Adaboost算法的人臉檢測(cè)技術(shù)的研究與實(shí)現(xiàn)[J].現(xiàn)代電子技術(shù),2011(14):4-6.
〔7〕馬麗,劉高原.基于改進(jìn)Adaboost算法的人臉檢測(cè)研究 [J].科學(xué)技術(shù)與工程,2012(27):6963-6966.
TP391.41
A
1673-260X(2014)03-0017-03