陳云平
摘要: 利用數(shù)字圖像模式識別技術(shù)實現(xiàn)了人臉的自動檢測及特征定位。對數(shù)字圖像處理中的顏色模型、膚色建模的原理及在人臉識別中的應(yīng)用進行了概述,分析了人臉識別過程中存在的困難,展望了人臉識別技術(shù)的發(fā)展方向。
關(guān)鍵詞: 數(shù)字圖像; 顏色模型; 膚色建模; 人臉識別; 特征定位
中圖分類號:TP391文獻標(biāo)志碼:A文章編號:1006-8228(2012)05-37-02
The application of digital image recognition in face detection
Chen Yunping
(School of Computer Engineering,HuaiHai Institute of Technology, Jiangsu, Lianyungang 222005, China)
Abstract: Focusing on the introduction of color model, skin-color model theory application in face recognition, the article analyzes the difficulties in face recognition and look into the future development of face recognition technique. Meanwhile, the article achieves the goal of face automatic detection and feature location based on the digital image recognition technique.
Key words: digital image; color model; skin-color model; face recognition; feature location
0 引言
模式識別是利用計算機模仿人的識別能力,根據(jù)模式的特性,將其判定為某一模式類的技術(shù)。人臉識別檢測是指在圖像或視頻中鑒別人臉是否存在,若存在,確定人臉的位置及大小。人臉識別檢測在視頻監(jiān)控、數(shù)字視頻處理中被廣泛應(yīng)用。將數(shù)字圖像模式識別技術(shù)應(yīng)用到人臉的自動檢測中,運用算法尋優(yōu)閾值,目的在于提高人臉檢測的精度和效率。
1 圖像識別在人臉檢測中的應(yīng)用
目前,人臉檢測技術(shù)主要有三大類:①基于膚色的檢測方法。這種方法是利用環(huán)境和人臉膚色的顏色反差,將背景環(huán)境和人臉膚色區(qū)分開來。②基于形狀的檢測方法。通過人臉和五官的形狀信息,在數(shù)字圖像中用一些形狀模式與人臉進行匹配,從而進行人臉檢測。③基于統(tǒng)計理論的檢測方法。這種方法是利用機器學(xué)習(xí)和統(tǒng)計分析的方法找出非人臉樣本和人臉樣本各自的統(tǒng)計特征,再通過各自的特征構(gòu)建分類器完成人臉檢測。
1.1 人臉識別概述
人臉識別涉及計算機圖像處理、模式識別、統(tǒng)計學(xué)和人工智能等眾多學(xué)科,具有很高的研究價值。在一個完整的人臉識別系統(tǒng)中,人臉檢測和人臉識別是相對獨立的兩個技術(shù)環(huán)節(jié)。人臉檢測是在輸入圖像中確定人臉(如果存在)的位置、大小等信息[1]。人臉檢測系統(tǒng)的輸入信息可能不包含人臉的圖像,也可能包含人臉的圖像,輸出是關(guān)于圖像中是否存在人臉和人臉的大小、位置、表情等信息的參數(shù)。通過人臉檢測技術(shù),可以將人臉圖像從復(fù)雜的背景圖像中檢測出來,并對人臉圖像尺寸及位置進行標(biāo)準(zhǔn)化,從而得到標(biāo)準(zhǔn)的人臉圖像,為以后的計算機人臉識別處理提供相應(yīng)的數(shù)據(jù)。膚色特征是人臉的重要信息,它不依賴于面部的細(xì)節(jié)特征,對于旋轉(zhuǎn)、表情等變化情況都能適用,具有相對的穩(wěn)定性,因此它是人臉檢測中最常用的一種特征[2]。研究表明:盡管不同種族、不同年齡、不同性別的人的膚色看上去不同,但這種不同主要集中在亮度上。在去除亮度的色度空間里,不同人的膚色分布具有聚類性,可以根據(jù)這種聚類性將人臉從背景中分割出來[3]。所以,基于膚色的人臉檢測中最為關(guān)鍵的技術(shù)是建立膚色模型。
1.2 顏色空間
顏色模型是顏色在三維空間中的排列方式。當(dāng)前,圖像處理中常用的顏色模型有RGB顏色空間、NTSC顏色空間、HSV顏色空間及YCbCr顏色空間等。
1.2.1 RGB顏色空間
RGB顏色空間是彩色中最基本的顏色表示空間。它是通過紅(Red)、綠(Green)、藍(lán)(Blue)三種原色混合而產(chǎn)生其他顏色的。其中每種基色的亮度都由0-255表示。任何顏色都可以用紅、綠、藍(lán)3種基色來調(diào)制。由于R、G、B分量相關(guān)性太強, RGB顏色空間不容易直接建立膚色模型;并且亮度和顏色不相互獨立,R、G、B三個基色不僅代表顏色,還表示了亮度。而在基于膚色的人臉檢測中,為了把膚色區(qū)域同非膚色區(qū)域分離,需要使用適合不同膚色和不同光照條件的可靠膚色模型。所以,直接利用RGB空間聚類進行膚色分割不可能取得很好的效果。
1.2.2 NTSC顏色空間
NTSC顏色空間是一種用于電視圖像的顏色空間。它使用的是YIQ色彩坐標(biāo)系。其中Y是光亮度,用它表示灰度信息;I是色調(diào),Q是飽和度,它們都表示顏色信息。所以,NTSC顏色空間的主要優(yōu)點是區(qū)分灰度信息和顏色信息。
1.2.3 HSV顏色空間
HSV顏色空間是一種復(fù)合主觀感覺的色彩空間。H是指色調(diào)(彩)(hue)、S指色飽和度(saturation)、V指明度(value)。因此,在此顏色空間中,顏色的參數(shù)便是H、S、V三個分量組成的三元組。
在HSV顏色空間中,反映顏色特征的兩個屬性色調(diào)和飽和度與明度特征相互獨立,這對于建立膚色模型是有利的。建立膚色模型需要找到膚色的聚類性,這種聚類性主要體現(xiàn)在顏色的本質(zhì)特性上。在實際應(yīng)用中,膚色的情況會受到光照亮度的影響,而光照主要反映在亮度上。采用HSV顏色空間可以將亮度從顏色中分離出來,只使用反映顏色特征的色調(diào)和飽和度來進行聚類分析,所以可以取得較好的效果。
1.2.4 YCbCr顏色空間
YCbCr顏色空間又稱為YUV空間,它是數(shù)字圖像和視頻圖像中常用的色彩空間,主要用在數(shù)字電視系統(tǒng)中。其中Y代表亮度,Cb代表藍(lán)色,Cr代表紅色分量。在8位無符號整型數(shù)據(jù)的存儲空間中,YCbCr模型中的數(shù)據(jù)可以是雙精度類型,Y的范圍為16~235,Cb和Cr的取值范圍為16~240。
YCbCr顏色空間和HSV顏色空間有一個共同的特點是亮度和顏色的本質(zhì)特性是分離開的。本文選擇在YCbCr顏色空間中建立膚色模型的原因除此以外,還在于與HSV顏色空間比較而言,它的計算過程更加簡單。在將圖像從RGB顏色空間轉(zhuǎn)換到Y(jié)CbCr顏色空間的過程中,彩色分量Cb、Cr可以由三基色R、G、B經(jīng)過線性變換得到,轉(zhuǎn)換公式如(1-1)所示;并且在YCbCr顏色空間中,膚色有較高的聚集程度[4]。
Y=0.2990R+0.5870G+0.1140B
Cb=-0.1687R-0.3313G+0.5000B+128 (1-1)
Cr=0.5000R-0.4187G-0.0813B+128
1.3 建立膚色模型
不同種族、不同年齡、不同性別的人膚色是存在差異的,這個差異表現(xiàn)在亮度上。若消除亮度后,膚色就具有較高的聚類性。
在RGB顏色空間,為了除去光照影響,對人臉膚色要進行亮度歸一化。歸一化的顏色分量分別為r、g、b,如式(1-2)所示。
(1-2)
其中,r+g+b=1。由于這種歸一化只除去了R、G、B中的相對亮度成分R+G+B,而r、g、b仍存在亮度信息,因此此種方法用于膚色檢測效果不理想。
在YCbCr顏色空間,歸一化色度直方圖后,若膚色滿足二維高斯模型M=(m,c),其中,m為均值,m=E(x),x=(Cb,Cr)T,C為協(xié)方差矩陣,C=E[(x-m)(x-m)T]。利用這個膚色模型檢測任意一個像素為膚色的概率
(1-3)
經(jīng)過驗證,這個模型能很好地分辯出人臉和非人臉來。
1.4 亮度補償
因為光照會影響圖片的亮度,所以采用Gary World算法來對RGB圖像進行快速顏色補償:
(1-4)
式中,Cstd是標(biāo)準(zhǔn)亮度圖像R、G、B值;Cave是輸入圖像R、G、B的平均值;C是原圖像的像素值;Cnew是亮度補償后的像素值。
2 基于VC++在人臉檢測中的應(yīng)用技術(shù)難點
通過VC++已驗證數(shù)字圖像模式識別技術(shù)可以對人臉實現(xiàn)自動檢測。整個識別過程主要包括人臉相似度計算、人臉輪廓提取、人臉定位、臉內(nèi)輪廓提取、眼睛定位、鼻子定位及嘴定位等。
⑴ 膚色識別技術(shù)
大量研究表明膚色是一種有效的人臉檢測特征, 不同人種膚色的差別主要在于亮度信息而不是色度信息[5-6]。在膚色信息提取中,色度表技術(shù)應(yīng)用較廣泛。常用的色度表生成方法包括高斯模型和高斯混合模型等方法。然而由于其他非人臉膚色對象的存在和光照變化等影響,單獨利用膚色信息無法保證人臉檢測的準(zhǔn)確性和完整性, 一般需要與其他特征結(jié)合使用。
為了準(zhǔn)確進行人臉膚色識別,本文先將人臉圖像從RGB顏色空間映射到Y(jié)CbCr顏色空間,然后建立膚色模型并得到相似度矩陣,最后用相似度矩陣中的最大值對相似度矩陣歸一化。
⑵ 嘴部定位技術(shù)
嘴部定位通過膚色掩碼進行。由于嘴部存在較大的空洞,需要形態(tài)學(xué)閉運算填充,時間開銷大,因此,直接利用R、G、B三原色建立膚色掩碼。膚色掩碼的計算公式如(2-1)所示:
(2-1)
膚色掩碼加上嘴巴的位置約束就可以進行人臉嘴部定位。
3 結(jié)束語
人臉檢測是實時人臉識別和表情識別的基礎(chǔ),只有將人臉檢測準(zhǔn)確,表情識別和人臉識別才能實現(xiàn)。而其中特征提取與處理是人臉識別中的關(guān)鍵, 無論是人臉檢測定位、面部特征提取還是人臉確認(rèn)識別,每一步都需要大量可靠的人臉特征。在實際的人臉識別中,單獨使用任何一種已有的方法都不可能取得很好的識別效果。基于混合方法結(jié)合了兩種以上已有的方法,實現(xiàn)了信息的融合,從而形成更準(zhǔn)確和魯棒性強的人臉識別系統(tǒng)。所以,混合的數(shù)字圖像識別方法將是未來人臉識別研究領(lǐng)域的主要課題。
參考文獻:
[1] Zhiwei Ye, Zhaobao Zheng, Xin Yu. Automaticthreshold selection
based on ant colony optimization al2gorithm[C]. Proc of Int Conf on Neural Networks and Brain,2005:728~732
[2] 馮馳,王衢,杜云明.基于膚色和幾何特征的人臉檢測[J].信息技術(shù),
2007.8:84~87
[3] 徐從東,羅家融,肖炳甲.基于膚色信息馬氏距離圖的人臉檢測[J].計
算機工程,2007.37(12):196~198
[4] 呂東輝,王濱.YCbCr空間中一種基于貝葉斯判決的膚色檢測方法
[J].中國圖象圖形學(xué)報,2006.11(1):47~52
[5] F.Soulie,E.Viennet,B.Lanmy. Multi -Modular Neural Net -work
Architectures:Pattern Recognition Applications in OpticalCharacter Recognition and Human Face Recognition[J].Int'1J.Pattern Recognition and Artificial Intelligence,1993.7(4):721~755
[6] H.wu,Q.chen,M.Yaehida. Face Detection from Color Images
Using a Fuzzy Pattern Matching Method[C].In IEEE,Trans:Pattern Analysis and Machine Intelligence,1999.21(6):557~563