徐鎮(zhèn)輝, 謝淑麗
(漳州職業(yè)技術(shù)學院計算機工程系,福建 漳州 363000)
復雜背景條件下的人臉檢測是一項很有挑戰(zhàn)性的工作,目前人臉檢測多針對正面端正的人臉,由于多姿態(tài)人臉特征的多樣性,需要考慮和解決的問題很多,多姿態(tài)人臉檢測還存在很大困難.基于AdaBoost的方法能有效解決復雜的人臉檢測問題,檢測精度高,但時間代價大[1].膚色分割能較快確定人臉區(qū)域,但誤檢率高.眼睛定位可進一步確定候選人臉區(qū)域、估計人臉姿態(tài),常用于多姿態(tài)人臉檢測.因此,本文利用人臉多種特征信息,綜合膚色分割、眼睛定位和AdaBoost算法等多種方法,取長補短,實現(xiàn)一種針對復雜背景下平面內(nèi)旋轉(zhuǎn)人臉的多姿態(tài)人臉檢測方法.
(1)由于膚色特征相對穩(wěn)定,不易受姿態(tài)、表情變化的影響,且有別于多數(shù)背景顏色.在Anil K·Jain膚色模型基礎(chǔ)上,采用亮度分段的膚色分割方法,建立 YCbCr彩色空間的膚色模型[2,3].亮度在[80,220]范圍的像素點直接用膚色橢圓聚類方法判斷,亮度大于220的像素點用擴大1.1倍長短軸的膚色橢圓聚類方法判斷,排除大部分背景區(qū)域.
(2)為了增強膚色區(qū)域特征、抑制噪聲,用數(shù)學形態(tài)學濾波器除噪,然后根據(jù)人臉的大小、長寬比、填充率等幾何特征,確定候選人臉區(qū)域.由于平面旋轉(zhuǎn)人臉的長度、寬度可能增大,因此設(shè)定人臉的長寬比為[0.6,2],候選人臉區(qū)域的像素與其外接矩形的像素比 S/S'為[0.4,0.9].
特定變化點位置及對應臉部特征,確定眉眼區(qū)域的上下邊界[4].參照人臉“三庭五眼”的特征分布,水平灰度投影曲線第二個凸峰的寬度對應于平面內(nèi)旋轉(zhuǎn)人臉的雙眼間距1/5(x2-x1)或正面人臉眉眼到鼻翼下緣距離1/3(y2-y1),當?shù)诙狗遄畲蠛妥钚√荻戎迭c間的距離小于1/5(x2-x1)及1/3(y2-y1)時,可將第一、三凸峰的極值點對應位置作為平面旋轉(zhuǎn)人臉眉眼區(qū)域的上下邊界,否則取第一、二凸峰的極值點對應位置作為正面人臉眉眼區(qū)域的上下邊界[5].根據(jù)圖1定位出的候選人臉區(qū)域,形成的水平灰度投影曲線如圖2所示,分割得到的眉眼區(qū)域如圖3所示.
根據(jù)眼睛、眉毛等幾何特征,計算眉眼區(qū)域中各孤立塊的中心點坐標,其中,1),以及各孤立塊垂直方向上的位置關(guān)系,然后設(shè)定眼睛大小、同側(cè)眉眼的中心距、雙眼中心距離等取值范圍,并針對二值圖像中可能出現(xiàn)有眉、無眉、單眼等情況分類判斷[5].例如,設(shè)定眼睛大小20~100像素、雙眼中心距離20~80像素,當人臉側(cè)面旋轉(zhuǎn)導致二值圖像中某一只眼睛與背景相連時,可取眉眼區(qū)域內(nèi)中心點縱坐標最小的孤立塊作為單眼的中心點等.雙眼定位后,根據(jù)雙眼中心點連線的斜率,判斷平面內(nèi)人臉旋轉(zhuǎn)角度.眉眼區(qū)域中的眼睛定位結(jié)果如圖3所示,(b)(c)人臉旋轉(zhuǎn)角度分別為26.6°,- 36.4°(逆時針旋轉(zhuǎn)),(d)其中一只眼睛被頭發(fā)遮擋.
圖1 候選人臉區(qū)域
圖2 候選人臉區(qū)域及水平灰度投影曲線
圖3 眉眼區(qū)域中的眼睛定位
實驗證明,人臉平面旋轉(zhuǎn)角度越大,眼睛定位難度越大.當人臉旋轉(zhuǎn)角度范圍在45°~60°時,受到鼻子、嘴巴等其他臉部特征影響,大約有30%的眼睛難于準確定位.當人臉旋轉(zhuǎn)角度超過60°時,眼睛定位效果較不明顯.對無法定位眼睛的候選人臉旋轉(zhuǎn)60°后,再進行眼睛定位和角度判斷.
由于人體其他部位、類膚色背景等影響,候選人臉及眼睛定位結(jié)果中還存在部分誤檢人臉.因此,在眼睛定位基礎(chǔ)上,構(gòu)建AdaBoost級聯(lián)分類器,對候選人臉區(qū)域進一步檢測驗證.
Freund Y等提出了AdaBoost算法,利用大量分類能力一般的弱分類器,通過一定方法疊加(boost)起來,構(gòu)成一個分類能力很強的強分類器[6].AdaBoost算法分類器的生成和人臉檢測流程如圖4所示.
圖4 AdaBoost算法分類器的生成和人臉檢測流程
由于級聯(lián)分類器是由若干個強分類器串聯(lián)而成,所以它的檢測率和誤檢率將由各級強分類器共同決定.采用從簡單到復雜、逐級強化的分類器設(shè)計原則,即隨著分類器級數(shù)增長,組成強分類器的弱分類器個數(shù)將不斷增加,檢測要求也越來越嚴格,誤檢率會不斷下降,但漏檢率也會隨之上升.對每個級聯(lián)分類器的訓練目標是檢測率達到90%以上,每個級聯(lián)分類器由10個強分類器構(gòu)成,則各強分類器的檢測率要求達到99%,且誤檢率不超過50%.
根據(jù)不同的旋轉(zhuǎn)角度范圍,訓練不同的級聯(lián)分類器,多個級聯(lián)分類器組成了人臉檢測驗證系統(tǒng)[7,8].由于 AdaBoost分類器的檢測是在眼睛定位和人臉旋轉(zhuǎn)角度判斷基礎(chǔ)上進行,在[-90°,90°]范圍內(nèi)按照[-90°,-60°]、[-60°,-45°]、[-45°,- 15°]、[- 15°,15°]、[15°,45°]、[45°,60°]、[60°,90°]等角度范圍構(gòu)建7 個級聯(lián)分類器,對應于逆時針旋轉(zhuǎn)、正面、順時針旋轉(zhuǎn)人臉圖像的檢測,并著重訓練[-15°,15°]的正面人臉分類器及[15°,45°]、[45°,60°]、[60°,90°]順時針旋轉(zhuǎn)人臉分類器,另外三個逆時針旋轉(zhuǎn)人臉分類器可由順時針旋轉(zhuǎn)人臉分類器鏡像生成.
用MIT CBCL和部分ORL的人臉數(shù)據(jù)庫作為訓練樣本集,并選用典型的角度作為代表,如在訓練[15°,45°]角度范圍的分類器時,人臉樣本主要是取 15°,30°,45°左右的旋轉(zhuǎn)角度,每個角度范圍分類器分別使用2000~4000個人臉訓練樣本,并用圖像處理軟件進行角度變換及歸一化處理,而大約8000個非人臉訓練樣本在不同分類器訓練中交叉重復使用.
根據(jù)不同的旋轉(zhuǎn)角度,將眼睛定位后的候選人臉圖像用相應角度范圍的AdaBoost分類器進行驗證,對無法判定旋轉(zhuǎn)角度的人臉圖像,如誤檢的人臉圖像、眼睛定位的單眼情況等,用[-15°,15°]范圍的正面人臉分類器檢測驗證.綜合基于膚色分割、幾何特征的人臉定位,以及基于灰度、梯度和幾何特征的眼睛定位過程,設(shè)計平面旋轉(zhuǎn)人臉檢測流程如圖5所示,人臉檢測結(jié)果就是那些通過不同分類器的子窗口總和.
實驗測試圖像包括不同旋轉(zhuǎn)角度的MIT人臉庫中圖像、生活中數(shù)碼照片及互聯(lián)網(wǎng)上隨機收集的圖像,共有117幅圖像,包括173個人臉,其中平面內(nèi)旋轉(zhuǎn)人臉93個,這些人臉是出現(xiàn)在不同背景、不同光照條件下.將膚色分割、眼睛定位的人臉檢測初步結(jié)果,與再用AdaBoost級聯(lián)分類器驗證的最終檢測結(jié)果進行比較,檢測結(jié)果見表1,實驗中把只能定位出一只眼睛的候選人臉也作為初步檢測結(jié)果的一部分.經(jīng)過AdaBoost級聯(lián)分類器進一步檢測驗證,雖然檢測率受到一定影響,但是誤檢率明顯下降.
圖5 基于眼睛定位及AdaBoost算法的平面旋轉(zhuǎn)人臉檢測流程
表1 AdaBoost級聯(lián)分類器檢測驗證的前后結(jié)果比較
從最終檢測結(jié)果可以看出,[-90°,90°]范圍的大部分旋轉(zhuǎn)人臉能被正確檢測到,但還存在部分漏檢和誤檢情況.漏檢主要是人臉被嚴重遮擋、人臉圖像太小、佩戴眼鏡等情況影響人臉特征的提取及眼睛定位,無法準確定位眼睛或者只能定位出一只眼睛,由于這類候選人臉用[-15°,15°]角度范圍的AdaBoost分類器進行驗證,針對性不強;另外,人臉訓練樣本角度不全也導致有些旋轉(zhuǎn)人臉無法通過分類器驗證,從而影響檢測率.誤檢的主要原因包括類膚色復雜背景中存在與人臉極為相似的模式,訓練平面旋轉(zhuǎn)人臉分類器的矩形特征針對性不很強等.實驗中也發(fā)現(xiàn)一邊眉毛被誤判為眼睛的情況,基本不影響檢測結(jié)果.
本文針對復雜背景下平面內(nèi)旋轉(zhuǎn)人臉的檢測問題,提出了綜合利用膚色分割、眼睛定位和Ada-Boost算法分類器的多姿態(tài)人臉檢測方法.在眼睛定位和角度分析的基礎(chǔ)上,根據(jù)人臉不同的旋轉(zhuǎn)角度范圍,用逐漸復雜的級聯(lián)分類器結(jié)構(gòu),構(gòu)建不同角度范圍的AdaBoost級聯(lián)分類器,有利于縮小分類器的作用范圍,提高檢測速度和精度.實驗結(jié)果表明,該方法在保證檢測率同時,能有效地降低誤檢率,對復雜背景下的彩色正面人臉和平面內(nèi)旋轉(zhuǎn)人臉有比較好的檢測效果.下一步,將進一步挖掘人臉的特征,改進眼睛定位方法,并對訓練分類器的矩形特征進行改進和擴展,以提高旋轉(zhuǎn)人臉的檢測角度范圍和檢測率.
[1]張建明,汪大慶.基于Adaboost算法的多姿態(tài)人臉實時視頻檢測[J].計算工程與設(shè)計,2010,31(18):4065 -4067.
[2]徐艷,陳孝威.人臉檢測中的眼睛定位算法研究[J].計算機與信息技術(shù),2006,(6):24-28.
[3]Rein - Lien Hsu and Anil K.Jain.Face Detection in Color Image[J].IEEE Trans.Pattern Analysis and Machine Intelligence,2002,24(5).
[4]戴景文,劉丹,蘇劍波.基于投影峰的眼睛快速定位方法[J].模式識別與人工智能,2009.22(4):605-609.
[5]謝淑麗,徐鎮(zhèn)輝,陳鍛生.基于多特征融合的平面旋轉(zhuǎn)人臉的眼睛定位[J].漳州師范學院學報(自然科學版),2011,73(3):21-24.
[6]Freund Y.,Schapire R.E.Experiments with a New Boosting Algorithm[C].In:Proceedings of the 13th International Conference on Machine Learning,San Francisco,CA,1996:148 -156.
[7]Viola P,Jones M.Fast Multi-view Face Detection[C].In:Proceedings of the IEEE Conference on Computer and Pattern Recognition,2003.
[8]陳遠,陳鍛生.一種融合LBP紋理特征的多姿態(tài)人臉跟蹤方法[J].華僑大學學報(自然科學版),2010,31(3):282 -287.