国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于特征的人臉分類算法研究

2010-05-05 02:39李霞趙宇明
微型電腦應(yīng)用 2010年4期
關(guān)鍵詞:降維特征向量人臉

李霞,趙宇明

0 引言

人臉是人類最重要的生物特征之一,反映了很多重要的信息,在許多場合都需要進(jìn)行可靠的人臉特征分類。比如在一些實(shí)用的實(shí)時監(jiān)控系統(tǒng)中,人臉分類技術(shù)有助于從監(jiān)控錄像中找出符合某種指定特征的那些人,這在機(jī)場、海關(guān)、火車站、銀行、飯店等出入系統(tǒng)中有很大的需求。另外,在公安刑偵破案系統(tǒng)中,人臉分類技術(shù)可以幫助目擊者查詢目標(biāo)人像數(shù)據(jù)庫中是否存在嫌疑人員。此外,人臉分類技術(shù)在人機(jī)交互系統(tǒng)中也有重要作用,如依據(jù)屬性進(jìn)行人臉?biāo)阉?,以及個人相冊的管理等。

本文考慮基本正面的人臉,針對墨鏡和口罩兩個屬性,將人臉圖像分成4類:沒有佩戴任何飾物的人臉、帶有墨鏡的人臉、帶有墨鏡和口罩的人臉、帶有口罩的人臉。

一般的人臉分類系統(tǒng),可以大致分為以下幾個步驟:人臉檢測、特征提取、分類。本文的研究重點(diǎn)是各種不同的分類算法,在研究前人工作的基礎(chǔ)上,對一些現(xiàn)有的分類算法做了理論和方法上的探討,通過實(shí)驗(yàn)系統(tǒng)地分析了五種解決方案,包括PCA+LDA+Correlation方法,SVM方法,PCA+LDA+SVM 方法,SVM+Adaboost方法,以及PCA+LDA+SVM+Adaboost方法,并比較了這些方法的性能,分析了它們的不足。需要指出的是,本文在前3種方法中用到的是 Haar特征,在后兩種方法中則是將特征值進(jìn)行一系列處理,這將在1.4節(jié)中進(jìn)行詳細(xì)的介紹。實(shí)驗(yàn)結(jié)果表明,采用PCA+LDA方法降低特征維數(shù),可以大大減少分類速度,同時對分類器性能沒有明顯影響。另外,第4種方案的分類正確率達(dá)到了94.5%,滿足實(shí)際應(yīng)用的需求。

1 分類算法

在人臉領(lǐng)域應(yīng)用較多的分類算法有:主分量分析(PCA)、線性判別分析(LDA)、相關(guān)系數(shù)(Correlation)、支持向量機(jī)(SVM)、Adaboost算法等,在這里對各個方法進(jìn)行了深入的探討,并總結(jié)出五種典型的組合方案,在本節(jié)中分別介紹如下:

1.1 PCA+LDA+Correlation

主分量分析[1](PCA,Principal Component Analysis)是一種非常有效的降維方法,其主要思想是:將原數(shù)據(jù)空間投影到一個新的坐標(biāo)空間,在減少數(shù)據(jù)集維數(shù)的同時,保持?jǐn)?shù)據(jù)集對方差貢獻(xiàn)最大,從而能保留數(shù)據(jù)的最重要方面。假設(shè)訓(xùn)練樣本,用PCA方法將其降到m維(m<n)的步驟如下:計算樣本集合的協(xié)方差矩陣其中ц為均值向量;將Σ的特征值從大到小排列,取前m個特征值對應(yīng)的特征向量構(gòu)成變換矩陣;則樣本x的降維公式為。在很多模式識別方法中,PCA方法都被用來對高維樣本進(jìn)行壓縮降維,從而加快處理速度或降低問題復(fù)雜度。然而,PCA并沒有充分利用訓(xùn)練樣本中的類別信息,LDA則彌補(bǔ)了這個缺陷。

線性判別分析[2](LDA,Linear Discriminant Analysis)也是一種常用的降維方法,其目標(biāo)是降維后樣本的類間離散度和類內(nèi)離散度的比值最大,即各類樣本在特征空間中有最佳的可分離性。假設(shè)訓(xùn)練樣本,對于C類問題而言,構(gòu)成變換矩陣WLDA的向量最多只有C-1維,用LDA方法將x降到C-1維的步驟如下:計算樣本集合的類間離散度矩陣和類內(nèi)離散度矩陣;計算的廣義特征值和特征向量,將λi從大到小排序,取前C-1個特征值對應(yīng)的特征向量構(gòu)成變換矩陣在實(shí)際應(yīng)用中,LDA方法則存在類內(nèi)分散度矩陣總為奇異陣而使求解變得很困難等缺點(diǎn),因此本文先用 PCA進(jìn)行降維,然后用LDA來得到維數(shù)更低的最佳判別特征,最終的變換矩陣就是

相關(guān)系數(shù)(Correlation)是變量之間相關(guān)程度的指標(biāo),計算公式為,取值范圍為值越大,變量之間的線性相關(guān)程度越高。

1.2 SVM

支持向量機(jī)SVM[3],[4],[5](Support Vector Machine),是一種監(jiān)督式學(xué)習(xí)的方法,廣泛應(yīng)用于統(tǒng)計分類和回歸分析中。其主要思想可以概括為兩點(diǎn):(1)它是針對線性可分的情況進(jìn)行分析,對于線性不可分情況,通過非線性映射的方法,將低維輸入空間線性不可分的樣本轉(zhuǎn)化為高維空間,使其線性可分;(2)基于結(jié)構(gòu)風(fēng)險最小化理論之上,在特征空間中構(gòu)建最優(yōu)分割超平面,使得學(xué)習(xí)器得到全局最優(yōu)化,并且在整個樣本空間的期望風(fēng)險以某個概率滿足一定上界。

許多研究人員已經(jīng)開發(fā)出了SVM的工具箱,方便用戶使用,如libsvm,svmlight,stprtool等等。本文使用了臺灣大學(xué)林智仁博士等開發(fā)設(shè)計的libsvm軟件包。

1.3 PCA+LDA+SVM

對于大規(guī)模復(fù)雜問題,SVM訓(xùn)練時間過長,計算量很大,為此本文提出第三種方案,在進(jìn)行SVM訓(xùn)練之前,用PCA+LDA的方法降低特征向量的維數(shù),因此能大大減少SVM訓(xùn)練的負(fù)擔(dān)。實(shí)驗(yàn)表明,在分類前對特征向量進(jìn)行降維處理,起到了壓縮樣本,減少計算量的作用,而且不會明顯降低分類正確率。

1.4 SVM+Adaboost

依據(jù)文獻(xiàn)[6],本文提出第四種解決方案。這里特征提取的大致過程為:如表1所示,對于指定區(qū)域(上部或下部)的像素值,首先轉(zhuǎn)化成第2列中的一種類型,然后利用第3列中的一種方法進(jìn)行歸一化處理,最后選擇是否進(jìn)行直方圖處理,輸出最終的特征向量。下面進(jìn)行詳細(xì)的介紹。

表1 可選擇的特征類型

(1)區(qū)域:如果選擇整個人臉圖像中的像素,將會給分類器帶來時間和空間上的負(fù)擔(dān),并且有可能引入一些不易區(qū)分的像素點(diǎn)。為此,將人臉圖像分為上下兩部分,如圖1所示,分別用于墨鏡分類和口罩分類的處理。

圖1 區(qū)域選擇

(2)像素值類型:本文用到了不同的顏色空間和圖像導(dǎo)數(shù)值作為像素類型,因?yàn)閷τ谝恍傩远?,這些信息通常比標(biāo)準(zhǔn)的RGB值有更大的可區(qū)分度。表1列出了不同的選項(xiàng)。

(3)歸一化:歸一化處理可以消除光照的影響,在此,均值歸一化和能量歸一化作為選擇,其中μ和σ分別是指定區(qū)域內(nèi)所有特征向量x的均值和標(biāo)準(zhǔn)方差。

(4)直方圖:對一些屬性而言,在整個區(qū)域內(nèi)的直方圖信息可能比單個像素點(diǎn)的信息更加有用,因此可以考慮對圖像提取直方圖信息。

Boosting[7]算法是一種現(xiàn)代統(tǒng)計方法,理論上可以用來改進(jìn)任何學(xué)習(xí)算法的性能。Adaboost是一種自適應(yīng)的Boosting算法,其核心思想是將若干個弱分類器整合為一個強(qiáng)分類器,其中弱分類器指的是那些性能比隨機(jī)分類略好一點(diǎn)的分類器,本文選用SVM作為弱分類器。Adaboost算法本身是通過改變數(shù)據(jù)分布來實(shí)現(xiàn)的,它根據(jù)每次訓(xùn)練樣本的分類是否正確,以及上次的總體分類的正確率,來確定每個樣本的權(quán)值。將修改過權(quán)值的新數(shù)據(jù)送給下層分類器進(jìn)行訓(xùn)練,最后將每次訓(xùn)練得到的分類器整合起來,作為最終的決策分類器。使用Adaboost分類器可以排除一些不必要的訓(xùn)練數(shù)據(jù)特征,并將重點(diǎn)放在關(guān)鍵的訓(xùn)練數(shù)據(jù)上。

1.5 PCA+LDA+SVM+Adaboost

同樣的,考慮到SVM訓(xùn)練時間過長,占用內(nèi)存過大等問題,引進(jìn)最后一種方案,PCA+LDA+SVM+Adaboost。實(shí)驗(yàn)結(jié)果表明,特征向量經(jīng)過降維處理之后,可以大大的減少后期的訓(xùn)練時間,并且最后的分類正確率和第四種方法幾乎一樣。

2 實(shí)驗(yàn)

2.1 人臉庫

表2 樣本集大小匯總

本文用到的樣本來自于OMRON公司的人臉庫,其中訓(xùn)練樣本1919個,測試樣本1919個。針對墨鏡和口罩這兩個屬性,樣本分別屬于四個不同的類別,每個類別所含的樣本數(shù)如表2所示。

2.2 人臉樣本預(yù)處理過程

對于不同姿態(tài)的人臉圖片,需要一個預(yù)處理的過程,將這些人臉統(tǒng)一到標(biāo)準(zhǔn)大小和姿態(tài)條件下,在這里進(jìn)行了基于特征點(diǎn)的幾何標(biāo)準(zhǔn)化,即根據(jù)人臉的特征——左眼中心,右眼中心和嘴中心,經(jīng)過幾何變化,將人臉調(diào)整到規(guī)定尺度。在本文的實(shí)驗(yàn)中,最終得到的標(biāo)準(zhǔn)化人臉圖像分辨率為128*105。

2.3 五種分類方法的性能比較

對經(jīng)過標(biāo)準(zhǔn)化之后的人臉圖像進(jìn)行特征提取,然后用第1節(jié)中的5種不同的分類器進(jìn)行分類,得到的實(shí)驗(yàn)結(jié)果如表3所示。對比發(fā)現(xiàn),本文提出的第四種方案SVM+Adaboost擁有最低的錯分類率5.05%,能夠達(dá)到實(shí)際應(yīng)用的要求。通過PCA+LDA的方法對特征進(jìn)行降維處理能夠大大的減少執(zhí)行時間,并且節(jié)省了內(nèi)存空間。

表3 五種分類方法的性能比較

3 總結(jié)

根據(jù)不同的屬性對人臉圖像進(jìn)行分類,是一個應(yīng)用十分廣泛的實(shí)際問題,本文利用了OMRON公司的人臉庫,系統(tǒng)地比較了五種分類方法的性能。從實(shí)驗(yàn)結(jié)果可以看出,在分類之前先對樣本進(jìn)行壓縮降維,可以提高分類速度,而且正確率也不會有太大損失。依據(jù)文獻(xiàn)[6]提出的第四種方案的分類正確率達(dá)到了94.5%,但是在這種方法中SVM訓(xùn)練的時間耗費(fèi)很大,導(dǎo)致系統(tǒng)分類時間過長。相比之下,第五種方案分類正確率達(dá)到94%以上,由于對特征進(jìn)行了降維處理,總的執(zhí)行時間大大減少,僅為第四種方案的12%左右。對于大型數(shù)據(jù),應(yīng)用第五種方案“PCA+LDA+SVM+Adaboost”進(jìn)行人臉分類是可行的。

同時,本文的工作還有一些尚未解決的問題。目前考慮到的僅僅是正面姿態(tài)的人臉,對于非正面姿態(tài)的情況還需要進(jìn)一步的研究。并且本文只考慮了兩種屬性——墨鏡和口罩下的分類,如果增加其它屬性進(jìn)行分類,文中提到的方法尚不具備可擴(kuò)展性,這有待完善的。

[1]趙海霞,武建,“淺析主成分分析方法”[J],科技信息,2009(02).

[2]Zhao W,Chellappa R,Krishnaswamy A,“Discriminant Analysis of Principal Components for Face Recognition”,Proc.of the 3rd IEEE International Conference on Automatic Face and Gesture Recognition,Nara,Japan,pp.336-341,April 1998.

[3]Boser B E,Guyon I M,Vapnik V N.“A training algorithm for optimal margin classifier”,Proc.5th ACM Workshop on Computational Learning Theory,Pittsburgh,PA,pp.144-152,July 1992.

[4]董李燕,劉藝?yán)?,王曉峰,“基于人臉局部特征和SVM的表情識別”[J],合肥學(xué)院學(xué)報(自然科學(xué)版),2009,(01):24-27.

[5]Cortes C,Vapnik V.“Support vector networks”,Machine Learning,20:1-25,1995.

[6]Kumar N,Belhumeur P,Nayar S.“FaceTracer:A Search Engine for Large Collections of Images with Faces”,Proc.of European Conference on Computer Vision,2008.

[7]Seiffert C,Khoshgoftaar T M,Hulse J V,Napolitano A.“Resampling or Reweighting:A Comparison of Boosting Implementations”,2008 20th IEEE International Conference on Tools with Artificial Intelligence,2008.

猜你喜歡
降維特征向量人臉
二年制職教本科線性代數(shù)課程的幾何化教學(xué)設(shè)計——以特征值和特征向量為例
混動成為降維打擊的實(shí)力 東風(fēng)風(fēng)神皓極
克羅內(nèi)克積的特征向量
有特點(diǎn)的人臉
一起學(xué)畫人臉
降維打擊
三國漫——人臉解鎖
一類特殊矩陣特征向量的求法
EXCEL表格計算判斷矩陣近似特征向量在AHP法檢驗(yàn)上的應(yīng)用
一種改進(jìn)的稀疏保持投影算法在高光譜數(shù)據(jù)降維中的應(yīng)用
临安市| 杭锦后旗| 乳山市| 萝北县| 绥江县| 进贤县| 香格里拉县| 莱阳市| 平泉县| 蚌埠市| 和平区| 广安市| 策勒县| 聂拉木县| 新闻| 长白| 阿拉尔市| 宝鸡市| 大埔县| 衡南县| 嘉兴市| 沙河市| 江油市| 涞水县| 慈利县| 大名县| 都昌县| 宣威市| 巨鹿县| 巴东县| 手游| 紫金县| 高雄市| 利辛县| 台山市| 独山县| 印江| 武威市| 静宁县| 上林县| 西平县|