姚俊
(上海交通大學(xué)自動(dòng)化系,上海 200240)
基于視頻圖像的人臉檢測(cè)
姚俊
(上海交通大學(xué)自動(dòng)化系,上海 200240)
視頻圖像的人臉識(shí)別技術(shù)發(fā)展,促進(jìn)了數(shù)字視頻監(jiān)控等系統(tǒng)的廣泛應(yīng)用。本文對(duì)基于特征、模板、統(tǒng)計(jì)理論等視頻圖像的人臉檢測(cè)基本方法進(jìn)行了介紹,對(duì)人臉檢測(cè)系統(tǒng)的圖像采集、圖像處理、特征定位、人臉識(shí)別處理等設(shè)計(jì)進(jìn)行了闡述,對(duì)人臉檢測(cè)方法的改進(jìn)進(jìn)行了嘗試。
人臉檢測(cè) 視頻圖像 數(shù)字技術(shù)
信息技術(shù)數(shù)字化、智能化在安防監(jiān)控領(lǐng)域的發(fā)展,誕生了智能人臉識(shí)別技術(shù)人。人臉識(shí)別綜合了光電技術(shù)、網(wǎng)絡(luò)工程等技術(shù),它作為自動(dòng)人臉識(shí)別的關(guān)鍵環(huán)節(jié),在安全識(shí)別、刑偵、信息檢索等方面得到廣泛的應(yīng)用。
人臉圖像檢測(cè)既是人臉識(shí)別系統(tǒng)的主要組成部分,也是人臉信息處理中的一項(xiàng)關(guān)鍵技術(shù),在基于內(nèi)容的圖像檢索、視頻會(huì)議、可視電話、遠(yuǎn)程視頻監(jiān)控以及人機(jī)交互等方面都有著很重要的應(yīng)用價(jià)值。但在人臉視頻圖像中,由于人臉本身復(fù)雜的細(xì)節(jié)變化、人臉多姿態(tài)、各種遮擋、光照不均勻、以及復(fù)雜背景時(shí),人臉檢測(cè)和識(shí)別普遍存在計(jì)算量大、速度慢、魯棒性差的弱點(diǎn)。
人臉檢測(cè)作為人臉識(shí)別系統(tǒng)的一個(gè)組成部分,在實(shí)際中主要是在圖像中準(zhǔn)確標(biāo)定出各種復(fù)雜環(huán)境下的人臉的位置和大小,然后進(jìn)行統(tǒng)一人臉位置以及圖像信息的格式。
由于人臉圖像中包含的模式特征十分豐富,如直方圖、顏色、模板、結(jié)構(gòu)及Haar等特征。如果將其中有代表典型意義的有用的信息挑出來(lái),就可以利用這些信息,實(shí)現(xiàn)實(shí)現(xiàn)對(duì)人臉檢測(cè)。人臉檢測(cè)以及定位子系統(tǒng)的準(zhǔn)確性和性能將直接關(guān)系到整個(gè)人臉識(shí)別系統(tǒng)的可行性、實(shí)時(shí)性。
(1)迭代算法。本算法是自動(dòng)從多個(gè)弱分類(lèi)器的空間中挑選出若干個(gè)分類(lèi)器,構(gòu)成一個(gè)分類(lèi)能力很強(qiáng)的強(qiáng)分類(lèi)器。其改變數(shù)據(jù)分布,根據(jù)每次訓(xùn)練集中各個(gè)樣本的分類(lèi)是否正確以及上次的總體分類(lèi)的準(zhǔn)確率來(lái)確定每個(gè)樣本的權(quán)值。將修改過(guò)權(quán)值的新數(shù)據(jù)送給下層分類(lèi)器進(jìn)行訓(xùn)練,最后將每次訓(xùn)練得到的分類(lèi)器融合起來(lái),作為最后的決策分類(lèi)器。
(2)基于特征的方法。本方法是利用人臉的等先驗(yàn)知識(shí)導(dǎo)出的規(guī)則進(jìn)行人臉檢測(cè)。邊緣和形狀特征人臉及人臉器官具有典型的邊緣和形狀特征,如人臉輪廓、虹膜輪廓等都可以近似為常見(jiàn)的幾何單元。紋理特征人臉具有特定的紋理特征,紋理是在圖上表現(xiàn)為灰度或顏色分布的某種規(guī)律性,其在不同類(lèi)別的紋理中有其不同特點(diǎn)。顏色特征人臉的皮膚顏色是人臉表面最為顯著的特征。
(3)基于模板的方法。本方法是通過(guò)計(jì)算人臉模板和待檢測(cè)圖像之間的相關(guān)性來(lái)實(shí)現(xiàn)人臉檢測(cè)功能的。其通過(guò)使用人工定義的方法來(lái)給出人臉通用模板。對(duì)于待檢測(cè)的人臉圖像,分別計(jì)算眼睛、鼻子、嘴等特征同人臉模板的相關(guān)性,由相關(guān)性的大小來(lái)判斷是否存在人臉。通用模板匹配方法的優(yōu)點(diǎn)是算法簡(jiǎn)單,容易實(shí)現(xiàn),但是它也有自身缺點(diǎn),如模板的尺寸、大小、形狀不能進(jìn)行自適應(yīng)的變化,從而導(dǎo)致了這種方法適用范圍較窄。
其也可以通過(guò)設(shè)計(jì)一個(gè)可變模型,利用監(jiān)測(cè)圖像的邊緣、波峰和波谷值構(gòu)造能量函數(shù),當(dāng)能量函數(shù)取得最小值時(shí),此時(shí)所對(duì)應(yīng)的模型的參數(shù)即為人臉面部的幾何特征。這種方法存在的不足之處在于能量函數(shù)在優(yōu)化時(shí)十分復(fù)雜,消耗時(shí)間較長(zhǎng),并且能量函數(shù)中的各個(gè)加權(quán)系數(shù)都是靠經(jīng)驗(yàn)值確定的,在實(shí)際應(yīng)用中有一定的局限性。
(4)基于統(tǒng)計(jì)理論的方法。本方法是指利用統(tǒng)計(jì)分析與機(jī)器學(xué)習(xí)的方法分別尋找人臉與非人臉樣本特征,利用這些特征構(gòu)建分類(lèi)器,使用分類(lèi)進(jìn)行人臉檢測(cè)。它主要包括神經(jīng)網(wǎng)絡(luò)方法,支持向量機(jī)方法和隱馬爾可夫模型方法?;诮y(tǒng)計(jì)理論的方法是通過(guò)樣本學(xué)習(xí)而不是根據(jù)人們的直觀印象得到的表象規(guī)律,因此可以減小由于人眼觀測(cè)不完整和不精確帶來(lái)的錯(cuò)誤而不得不擴(kuò)大檢測(cè)的范圍,但是這種方法需要大量的統(tǒng)計(jì)特性,樣本訓(xùn)練費(fèi)時(shí)費(fèi)力。
人臉檢測(cè)之前,首先要采集影像視頻信息,并以指定的多媒體格式進(jìn)行存儲(chǔ)。人臉識(shí)別檢測(cè)系統(tǒng)的視頻圖像采集、存儲(chǔ)的處理:
(1)設(shè)計(jì)并生成基礎(chǔ)構(gòu)件,然后進(jìn)行連接?;A(chǔ)構(gòu)件包括圖像管理器、圖像捕獲管理器。
(2)枚舉系統(tǒng)中的視頻設(shè)備,循環(huán)查找可用的視頻設(shè)備,然后綁定到圖像捕獲管理器,將圖像捕獲管理器連接到圖像組件管理器中。
(3)系統(tǒng)枚舉可用的視頻圖像壓縮器,選擇對(duì)應(yīng)的壓縮器,連接到圖像管理器。
(4)捕獲各種環(huán)境下的人臉視頻影像,系統(tǒng)保存為指定視頻格式的文件。
本系統(tǒng)的目標(biāo)是從視頻影像背景中提取編號(hào)區(qū)域的影像信息,為了方便對(duì)視頻影像中的目標(biāo)進(jìn)行分類(lèi)和處理,從而獲得有效的人臉影像區(qū)域。由于檢測(cè)系統(tǒng)是基于運(yùn)動(dòng)影像的,因此只需用考慮運(yùn)動(dòng)變化中的影像像素信息。對(duì)于運(yùn)動(dòng)檢測(cè)的工作,主要的處理方法有:背景剪除法、時(shí)間差分法、光流分時(shí)法等方法。
人臉特征定位目的是排除非人臉區(qū)域。實(shí)時(shí)采集的人臉影像在某些環(huán)境下并不是出于正面的位置。在人臉特征定位系統(tǒng)中,通過(guò)對(duì)人臉的主要器官:眼、耳、鼻、口等部位進(jìn)行驗(yàn)證,旋轉(zhuǎn)人臉等多種技巧來(lái)確定人臉區(qū)域。在系統(tǒng)中,主要考慮到視頻監(jiān)控系統(tǒng)的環(huán)境布局等因素,參考了眼睛在幾何與灰度色彩方面特征來(lái)定位眼睛,據(jù)此來(lái)確認(rèn)最終的人臉區(qū)域,采取從局部到整體的策略。
人臉識(shí)別系統(tǒng)是整個(gè)系統(tǒng)的核心,在紛繁復(fù)雜的識(shí)別技術(shù)中,主要使用K-L的特征臉識(shí)別算法EigenFace??紤]到人臉特征的分類(lèi)情況,可以充分利用特征分類(lèi)的詳細(xì)信息,這樣可以改善識(shí)別的性能。在綜合了這兩種識(shí)別方法的基礎(chǔ)上,還要考慮到光照、攝像機(jī)方向?qū)ψR(shí)別結(jié)果的影響。由于大多數(shù)情況下,實(shí)時(shí)視頻監(jiān)控系統(tǒng)周?chē)沫h(huán)境、光照、方向都不是確定的,因此必須要消除光照等因素的影響,從而提高系統(tǒng)的識(shí)別效率和性能。
人臉的檢測(cè)方法盡管很多,并且一定的成效。為了盡量減小由外界環(huán)境和自身因素以及由算法本身缺陷造成的影響,提高檢測(cè)效率和精確性,人臉檢測(cè)的還有許多需要改進(jìn)。
不變矩理論是計(jì)算機(jī)視覺(jué)、模式識(shí)別、圖像處理的重要內(nèi)容,基于區(qū)域的不變矩理論最早是由Hu提出來(lái)的,在人臉檢測(cè)中主要應(yīng)用了Hu矩處理的旋轉(zhuǎn)、縮放、平移三不變的特性。此特性與Adaboost算法結(jié)合使用,彌補(bǔ)Adaboost在旋轉(zhuǎn)角度過(guò)大或者完全側(cè)面人間不能檢測(cè)的缺點(diǎn),實(shí)驗(yàn)結(jié)果證明這是可行的。
改進(jìn)方法,把RGB彩色空間轉(zhuǎn)換到Y(jié)CrCb空間:首先進(jìn)行光補(bǔ)償,將各個(gè)像素的R、G、B分別擴(kuò)展到最高的255。Y是亮度分量,Cb是藍(lán)色色度分量,Cr是紅色色度分量。轉(zhuǎn)換成YCbCr彩色空間具有將亮度和色度空間相分離的特點(diǎn),膚色聚類(lèi)效果也很好,而且該空間計(jì)算方法簡(jiǎn)單,速度快,易于實(shí)現(xiàn)。
將轉(zhuǎn)化后的Cb分量與Cr分量圖作差得到初級(jí)圖像,最后利用自動(dòng)閾值將灰度圖像處理成二值圖像。通過(guò)以上做法得到了人臉,但手,胳膊,頸部都顯示出來(lái)。再結(jié)合眼部特征進(jìn)行檢測(cè)確定是否存在人臉及其人臉的位置。結(jié)合膚色特征通過(guò)圖像差分方法提取清晰準(zhǔn)確的活動(dòng)區(qū)域,有效地解決了視頻中人臉檢測(cè)的問(wèn)題。
決策樹(shù)是數(shù)據(jù)挖掘中的一種分類(lèi)方法主要用于分類(lèi)和決策,根據(jù)FCM劃分的結(jié)果,構(gòu)建一個(gè)自頂而下的樹(shù)經(jīng)過(guò)若干次分類(lèi)劃分為原來(lái)混雜的樣本集,最終分裂為以一個(gè)個(gè)類(lèi)別純度高的子集。使樹(shù)的每一個(gè)節(jié)點(diǎn)表示一個(gè)屬性上的測(cè)試,每個(gè)分枝代表一個(gè)測(cè)試輸出,而每個(gè)樹(shù)葉節(jié)點(diǎn)表示一個(gè)類(lèi)或類(lèi)的分布,樹(shù)的最頂層節(jié)點(diǎn)是根節(jié)點(diǎn)。實(shí)驗(yàn)證明這種檢測(cè)方法提高了檢測(cè)的速度而且具有很好的檢測(cè)性能。
人臉檢測(cè)是一項(xiàng)在困難中不斷發(fā)展的技術(shù)。目前,人臉的檢測(cè)方法取得了許多成功,由于光照、遮擋等環(huán)境變化和人臉本身復(fù)雜性,檢測(cè)的精確度和魯棒性仍然存在缺點(diǎn)和不足,隨著模式識(shí)別技術(shù)的發(fā)展,相信肯定可以在可以預(yù)計(jì)的將來(lái),做到在圖片以及視頻中迅速準(zhǔn)確地定位到概定的目標(biāo)。
[1]熊平,徐敏.基于視頻的實(shí)時(shí)人臉識(shí)別的研究與實(shí)踐[D].長(zhǎng)沙:中南大學(xué),2010.
[2]馮東青,丁鍇.視頻中基于膚色模型的人臉檢測(cè)[J].計(jì)算機(jī)應(yīng)用與軟件,2010,27.
[3]張建明,汪大慶.基于視頻的實(shí)時(shí)人臉檢測(cè)研究[D].鎮(zhèn)江:江蘇大學(xué),2010.