国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于非下采樣Contourlet變換的人臉表情識別算法研究

2015-05-30 10:48:04賈函龍王金芳黃利飛
關(guān)鍵詞:學(xué)習(xí)機(jī)子帶人臉

賈函龍 王金芳 黃利飛

摘 要:本文研究了非下采樣Contourlet變換在人臉表情識別中的應(yīng)用,并設(shè)計(jì)了相應(yīng)的算法流程。首先將人臉表情圖像分割為最能表征表情信息的眼睛和嘴巴兩個部分,然后利用非下采樣Contourlet變換對分割的局部圖像進(jìn)行特征提取,最后使用極限學(xué)習(xí)機(jī)進(jìn)行分類,并與BP神經(jīng)網(wǎng)絡(luò)進(jìn)行對照實(shí)驗(yàn)。研究結(jié)果顯示,表情分類平均準(zhǔn)確率可達(dá)86.57%,比BP神經(jīng)網(wǎng)絡(luò)的分類方法平均準(zhǔn)確率高出7.43%。而在執(zhí)行速度方法,極限學(xué)習(xí)機(jī)卻是BP神經(jīng)網(wǎng)絡(luò)的11.09倍,表明了本實(shí)驗(yàn)方案的高效性和可行性。

關(guān)鍵詞:人臉表情識別;非下采樣Contourlet變換;極限學(xué)習(xí)機(jī);BP神經(jīng)網(wǎng)絡(luò)

中圖分類號:TP391 文獻(xiàn)標(biāo)識號: A 文章編號:2095-2163(2015)05-

Facial Expression Recognition based on the Next Sampling Contourlet Transform Algorithm Research

Jia Hanlong1, Wang Jinfang2, Huang Lifei3

(1 Liaoning Mechatronics College, Liaoning Dandong, 118000, China;2 Yanshan University, Qinhuangdao, 066200, China;3Hangzhou ChouTou Tech Co. LTD, Hangzhou, 310000, China)

Abstract: This paper studies the next sampling Contourlet transform in the application of facial expression recognition, and the corresponding algorithm design process. The image segmentation of facial expression is divided into two parts covering the eyes and the mouth, which to the most extent can represent the expression information, and then uses the sampling Contourlet transform under the division of local image feature extraction, furtherly using extreme learning machine for classification, and makes the comparison with the BP neural network control experiment. The results showed that expression classification accuracy can reach 86.57% on average, than the BP neural network classification method of average accuracy higher than 7.43%. In the speed of execution method, the fact that extreme learning machine is 11.09 times that of the BP neural network shows the efficiency and feasibility of the experiment scheme.

Key words: Facial Expression Recognition; Next Sampling Contourlet Transform; Extreme Learning Machine; BP Neural Network

0引 言

人臉表情含有豐富的人體行為信息,可以直觀地反映一個人的心理狀態(tài)。隨著人機(jī)交互的研究日益得到關(guān)注,人臉表情識別已經(jīng)成為模式識別一個重要且具實(shí)效意義的研究分支。目前,應(yīng)用于表情識別的方法有基于gabor小波特征的方法[1],基于主動形狀模型(ASM)和主動外觀模型(AAM)的方法[2],基于流形的方法[3]等。

典型的人臉表情提取主要包括人臉表情的預(yù)處理,特征提取與選擇和人臉表情分類三個主要步驟。其中,表情特征的提取與選擇是人臉表情識別步驟中最具決定性的一步。如何將人臉表情預(yù)處理得到的高維數(shù)據(jù)進(jìn)行快速有效的降維,既是表情識別系統(tǒng)的核心,也是目前為止最難于有效解決的關(guān)鍵所在。Gabor小波可以提取多尺度、多方向的空間頻率特征,在人臉識別和表情識別的應(yīng)用技術(shù)中,已經(jīng)取得了一定的成果。Contourlet變換也是一種多尺度、多方向的變換,早在2002年,Martin Vetterli和M.N.Do就研究了該算法。該變換是基于小波多尺度分析的思想而開展的一種新的多尺度多方向分析方法研究。該變換不僅可以實(shí)現(xiàn)任意方向和尺度的分解,具有同小波變換一樣的優(yōu)勢,而且由于其在圖像輪廓特征和紋理信息方面的獨(dú)到的提取和描述,使其在圖像處理領(lǐng)域獲得了較為廣泛的應(yīng)用。然而,該變換在輪廓波采樣過程進(jìn)行了下采樣轉(zhuǎn)換,因此失去了平移不變性,導(dǎo)致在圖像的恢復(fù)變換時,會造成偽吉布斯失真。為此,A.L.Cunha等人研究了非下采樣Contourlet變換 ,其中由于取消了變換過程中的下采樣,從而實(shí)現(xiàn)了偽Gibbs失真的有效抑制。

鑒于Contourlet變換存在的明顯缺陷,A.L.Cunha等人提出了NSCT變換。該變換是由非下采樣金字塔分解 (Nonsubsampled Pyramid,NSP)和非下采樣方向性濾波器組(Nonsubsampled Directional Filter Banks,NSDFB)組成的。非下采樣金字塔分解通過一個雙通道的濾波器組,可將信號分解成一個多通和多個帶通部分。

1 表情圖像預(yù)處理

由于拍攝環(huán)境的復(fù)雜性以及人體自身的運(yùn)動,獲取的人臉表情信息或多或少會受到一些干擾。因此預(yù)先即需針對擬實(shí)現(xiàn)特征提取和特征選擇的圖片進(jìn)行人臉特征區(qū)域的定位,人臉區(qū)域的幾何歸一化以及直方圖均衡化,則將具有重要的基礎(chǔ)性意義的[4]。JAFEE人臉表情庫后預(yù)處理前后的圖像如圖1和圖2所示,每行分別對應(yīng)一個人的7種表情,分別為憤怒、厭惡、恐懼、高興、中性、悲傷和驚奇。

人臉特征區(qū)域的定位采用基準(zhǔn)特征結(jié)合仿射變換[5]的方法,該方法可以估計(jì)左右瞳孔的位置,然后依據(jù)左右瞳孔的坐標(biāo)來確定人臉的位置,從而實(shí)現(xiàn)對人臉特征區(qū)域的定位。幾何歸一化是指圖像經(jīng)過尺度變換,得到統(tǒng)一大小的校準(zhǔn)圖像,即具有相同的高和寬,這樣可以使圖像在后期特征提取和特征選擇階段上具有相同的特征維數(shù),由此簡化了實(shí)際運(yùn)算。直方圖均衡化可以消除部分光線和光照強(qiáng)度的影響,使圖像動態(tài)范圍增大,對比度更加擴(kuò)展,有助于提高識別率。

2 Contourlet變換與非下采樣Contourlet變換

Contourlet變換是一種新的圖像二維表示算法,其基本思想是首先使用一個類似小波的多尺度分解描述出輪廓段,然后將圖像數(shù)據(jù)拉普拉斯金字塔變換(Laplacian Pyramid,LP)和二維方向?yàn)V波器組(Directional Filter Bank,DFB)進(jìn)行多尺度、多方向的變換。LP變換的基礎(chǔ)是高斯金字塔,這是通過對原始圖像循環(huán)進(jìn)行高斯低通濾波和下采樣來完成的,下采樣的過程相當(dāng)于帶通濾波器,基于此就形成了從上到下有層次的金字塔樣式的圖像分解,LP變換的主要功能是將圖像分解為低頻系數(shù)子帶和高頻系數(shù)子帶。

從根本上說,圖像是由一個數(shù)值矩陣組成的。矩陣相鄰的像素點(diǎn)可以組成短小的線條,而多個線條的聚集就形成圖像的基本輪廓和紋理特性,因此引入DFB濾波器組的作用就是基于方向的角度對圖像進(jìn)行從粗分辨率到細(xì)分辨率的特征提取。DFB濾波器組首先將LP變換得到的高頻分量抽樣進(jìn)行多方向分解,然后通過將分布在同一方向的奇異點(diǎn),合成一個系數(shù),用類似于線段的基結(jié)構(gòu)表征圖像的邊緣細(xì)節(jié)等幾何特征,實(shí)現(xiàn)對圖像信息的稀疏逼近。

對低頻子帶重復(fù)上述LP和DFB分解過程即可實(shí)現(xiàn)圖像的多尺度多方向分解。LP分解的每一層將圖像分解為高頻部分和低頻部分,而DFB的優(yōu)點(diǎn)是對于高頻部分的表現(xiàn)更加優(yōu)秀,這也就是兩者疊加之后的Contourlet變換更具有優(yōu)異性的原因。但是由于該變換在LP變換的分解和重構(gòu)濾波器的過程中,帶寬均大于 。因此,對濾波后的圖像進(jìn)行縮減下采樣將會產(chǎn)生頻譜混疊。頻譜混疊相應(yīng)削弱了Contourlet變換的方向選擇性,因?yàn)橥环较虻男畔趲讉€不同的方向子帶中再次出現(xiàn)。同時,Contourlet變換的下采樣也使該算法失去了平移不變性。

如上所述,針對Contourlet變換的缺陷分析,A.L.Cunha等人隨即提出了NSCT變換。NSCT變換由兩步組成,先將圖像經(jīng)非下采樣金字塔分解濾波器分解為低頻圖像矩陣系數(shù)部分和高頻圖像矩陣系數(shù)部分,再由非下采樣方向性濾波器將高頻圖像矩陣系數(shù)部分分解為若干個子帶方向,如圖3所示。

在NSP分解過程中由于沒有下采樣環(huán)節(jié),則使得NSCT變換具備了平移不變性,這就增強(qiáng)了圖像特征信息的方向選擇性,并在多尺度多方向上更好地實(shí)現(xiàn)了紋理特征的描述。

因?yàn)樯鲜鰞蓚€步驟中已經(jīng)全部去除了濾波器組的下采樣因子,圖像的錯位也就不再出現(xiàn),這就是該變換滿足平移不變性的原因。運(yùn)用該變換進(jìn)行圖像的NSCT變換分解后,同Contourlet變換一樣,也會得到一個低頻子帶和若干個高頻子帶,而且隨著子帶層數(shù)的增加,細(xì)節(jié)就實(shí)現(xiàn)了逐級放大。

將JAFEE人臉表情庫中的一幅圖像進(jìn)行NSCT變換三層分解之后,變換分解結(jié)果則如圖4所示,仔細(xì)觀察圖像的細(xì)微之處,由此可知,低頻子帶的圖像系數(shù)矩陣主要描述了人臉五官的基本輪廓,對原始圖像進(jìn)行了低頻濾波之后,圖像變得模糊不清,而高頻子帶的圖像系數(shù)矩陣則主要描述了人臉五官的更細(xì)節(jié)的輪廓及紋理等信息。如第二層四個方向上的高頻子帶信息較為細(xì)膩地從不同方向描述了口、眼、鼻子的細(xì)節(jié)特征,驗(yàn)證了隨著子帶層數(shù)的增加,細(xì)節(jié)紋理等被逐漸放大的效果事實(shí);其他可如第三層高頻子帶信息則描述了更加細(xì)微的對光照等外部因素魯棒性強(qiáng)的細(xì)節(jié)特征。在采用支持向量機(jī)或者極限學(xué)習(xí)機(jī)進(jìn)行分類的時候,考慮該變換的平移不變性,分解次數(shù)太多會導(dǎo)致維數(shù)災(zāi)難。另外,也進(jìn)一步考慮到各層子帶所描述和包含的信息量,研究擇取三層NSCT變換分解,且設(shè)定各層方向數(shù)目為2,4,2的時候,較為理想。

3 非下采樣Contourlet變換表情識別

在人臉表情識別系統(tǒng)中,人臉的每個部位對表情識別的貢獻(xiàn)率是不同的。研究表明,眼睛和嘴唇部位,對人臉表情的識別,起著決定性的作用。因此,本算法將人臉表情分割成含有豐富表情的眼睛部位和嘴唇部位兩個區(qū)域開展研究。本文在人臉表情識別技術(shù)中使用了NSCT算法,先用該算法進(jìn)行人臉表情關(guān)鍵區(qū)域的特征選擇,其中,在人臉表情的非下采樣Contourlet特征融合之后,因?yàn)榫S數(shù)較大(如選取JAFFE人臉表情庫的210幅圖片,特征提取并融合后可達(dá)210*101025維),直接帶入分類器的話,會引發(fā)維數(shù)災(zāi)難,而且會顯著降低分類器的分類效率。為此,在把特征提取之后的數(shù)據(jù)引入分類器之前,應(yīng)先進(jìn)行數(shù)據(jù)壓縮,以避免維數(shù)災(zāi)難。本文引入PCA方法進(jìn)行維數(shù)約簡。然后調(diào)用主成分分析算法進(jìn)行特征提取,最后采用極限學(xué)習(xí)機(jī)(extreme learning machine,簡稱ELM)進(jìn)行表情分類,并與BP神經(jīng)網(wǎng)絡(luò)[6]分類算法進(jìn)行識別正確率和識別效率的對比。

在此,給出非下采樣Contourlet變換表情識別的原理實(shí)現(xiàn)框架,具體如圖5所示。

4 極限學(xué)習(xí)機(jī)

2004年,新加坡南洋理工大學(xué)的黃廣斌副教授研究極限學(xué)習(xí)機(jī)(Exteme Learning Machine,ELM)算法。這是一種簡單小巧、高效可靠的單隱層前饋神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,比如BP神經(jīng)網(wǎng)絡(luò),不僅容易產(chǎn)生局部最優(yōu)解,而且在訓(xùn)練時,還需要人為設(shè)置大量的訓(xùn)練參數(shù)。極限學(xué)習(xí)機(jī)則具有學(xué)習(xí)速度快且泛化性能好的優(yōu)點(diǎn),這是因?yàn)樵撍惴鞒毯啙嵲谥恍枰崆霸O(shè)置網(wǎng)絡(luò)的隱層節(jié)點(diǎn)數(shù)目,在算法運(yùn)行過程中將不再需要調(diào)整網(wǎng)絡(luò)的輸入權(quán)值和隱元的偏置大小,而且算法最終只會產(chǎn)生唯一的最優(yōu)解。因此,近年來,ELM已經(jīng)成為神經(jīng)網(wǎng)絡(luò)研究領(lǐng)域的一個研究熱點(diǎn),并成功應(yīng)用于手寫數(shù)字識別、人臉識別、時間序列預(yù)測等領(lǐng)域。以下介紹ELM算法的工作原理。

已知給定N個不同的樣本D={(xi ,yi)|xi Rn, yi Rn }, i=1,2,3,…,M。ELM算法是前饋神經(jīng)網(wǎng)絡(luò),主要用于訓(xùn)練單隱含層,這點(diǎn)與BP神經(jīng)網(wǎng)絡(luò)不同,BP神經(jīng)網(wǎng)絡(luò)可以手動設(shè)置隱含層數(shù)目。那么,該神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)模型可以表述為:

在式(3)中,行代表訓(xùn)練樣本所有隱結(jié)點(diǎn)的輸出。ELM算法是一種速度極快的單隱層前饋神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法。其算法設(shè)計(jì)原理可以分析總結(jié)為如下幾步:

第一步,通過隨機(jī)初始化的方式,對偏置 和權(quán)值 進(jìn)行隨機(jī)賦值。需要說明的是,這一步由于不需要調(diào)整網(wǎng)絡(luò)的輸入權(quán)值和隱元的偏置大小,就大大提高了ELM算法的運(yùn)行速度。

第二步,計(jì)算隱含層輸出矩陣H。利用公式(4),求得訓(xùn)練樣本所有隱節(jié)點(diǎn)的輸出,并將其計(jì)算成矩陣的形式。

第三步,近似求解權(quán)值 。利用公式 ,即可求得計(jì)算隱含層到輸出層的權(quán)值。

5實(shí)驗(yàn)結(jié)果

運(yùn)用非下采樣Contourle變換的方法,對人臉表情圖像進(jìn)行特征提取,并用PCA算法進(jìn)行特征選擇,最后以BP神經(jīng)網(wǎng)絡(luò)和極限學(xué)習(xí)機(jī)進(jìn)行分類。本章實(shí)驗(yàn)中所使用的數(shù)據(jù)庫是日本的JAFFE表情庫,該圖像庫由有10個女性的7種表情(生氣、厭惡、恐懼、高興、悲傷、驚訝和中性),共計(jì)213幅圖像組成。本算法選取每人每種表情3幅,七種表情共210幅表情圖像來進(jìn)行實(shí)驗(yàn)。將每幅人臉表情圖像經(jīng)過幾何歸一化、直方圖均衡化等預(yù)處理后,可以得到每幅像素點(diǎn)為130×130的統(tǒng)一大小的圖像。實(shí)驗(yàn)采用三層NSCT變換分解,且各層方向數(shù)目為2,4,2,并將“PKVA”作為默認(rèn)的濾波器。所以,每張人臉表情經(jīng)變換后可以得到7個子帶特征信息。為了做到與人無關(guān)的表情識別,在表情的分類環(huán)節(jié),引入BP神經(jīng)網(wǎng)絡(luò)和ELM算法進(jìn)行對照試驗(yàn),并且隨機(jī)選擇每類表情的25幅表情圖像作為訓(xùn)練集,其余5幅表情圖像作為測試集。實(shí)驗(yàn)中BP神經(jīng)網(wǎng)絡(luò)和ELM算法的激勵函數(shù)都是S型函數(shù)。實(shí)驗(yàn)重復(fù)10次以降低隨機(jī)性。

由表1可以看出,經(jīng)過非下采樣Contourle變換提取后,使用極限學(xué)習(xí)機(jī)的表情分類平均準(zhǔn)確率可達(dá)86.57%,比使用BP神經(jīng)網(wǎng)絡(luò)的分類方法平均準(zhǔn)確率高出7.43%。而在執(zhí)行時間方面,結(jié)果對比如表2所示,BP神經(jīng)算法執(zhí)行十次的平均時間為6.82s而,ELM算法僅為0.92s,因此可知,極限學(xué)習(xí)機(jī)的速度達(dá)到了BP神經(jīng)網(wǎng)絡(luò)的11.09倍,由這一結(jié)果已然明顯可見ELM算法的高速性和高效性。

本文還分析了各類表情識別的相關(guān)分布,如表3所示??梢钥吹剑诸愓_率最低的是恐懼和厭惡,各自只有76%和80%。在恐懼表情的分類中,表情大多被錯分為厭惡和憤怒,在厭惡表情的分類中,表情大多被錯分為憤怒和恐懼。因此證明了這四種表情在JAFFE庫上的表情單元的相近性,以致于無法使用NSCT變換提取出精確的表情特征。

在六種基本表情的實(shí)驗(yàn)分類結(jié)果中,可以通過繪制直方圖來更加簡明地進(jìn)行對比分析,如圖6所示。各類表情中分類正確率最高的憤怒、驚奇和高興,對應(yīng)達(dá)到了96%,96%和90%。相對來說,各種表情的識別率都已達(dá)到了較高范疇,這也在整體上表明了本算法在實(shí)現(xiàn)表情正確分類上的有效性。

本文所提方法比已有的研究方法在識別效果上提高了8%~12%,具體如表4所示,顯示了文獻(xiàn)報(bào)道中不同的方法在JAFFE表情數(shù)據(jù)庫中的識別率,可知本文所研究的方法的測試結(jié)果優(yōu)于文獻(xiàn)報(bào)道結(jié)果.進(jìn)一步表明了本算法的有效性。

6 結(jié)束語

本文研究將NSCT變換用于人臉表情的特征提取,并且使用極限學(xué)習(xí)機(jī)進(jìn)行分類,而后又將實(shí)驗(yàn)結(jié)果與BP神經(jīng)網(wǎng)絡(luò)算法進(jìn)行對比。詳細(xì)描述了實(shí)驗(yàn)結(jié)果中各類表情的識別率,通過各類表情識別率都比較高這一結(jié)果事實(shí),表明了本方法的有效性和高效性。

NSCT算法中,并沒有對NSCT各層分解方向數(shù)目做具體的探討;在表情分類時,ELM算法和BP神經(jīng)網(wǎng)絡(luò)各自的參數(shù)尋優(yōu)也并未是實(shí)現(xiàn)深化,因此對NSCT算法各層分解方向數(shù)目做具體的探討,并進(jìn)行深化的參數(shù)尋優(yōu),則有望進(jìn)一步提高人臉表情研究的識別效果。

參考文獻(xiàn):

[1] HUANG G, ZHOU H. Extreme learning machine for regression and multiclass cassification[J]. Systems,Man, and Cybernetics,PartB Cybernetics, IEEE Transactions on, 2012,42(2):513-529.

[2] ZUO Kunlong ,LIU Wenyao. Facial expression recognion using active appearance models[J ] . Journal of Optoelectronics ·La ser (光電子·激光) ,2004 ,15 (7) : 853-857.

[3] CHANG Ya, HU Changbo, TURK M.Probabilistic expression analysis on Manifolds[C]//Proc.of Conference on Computer Vision and Pattern Recognition, Washington D. C., USA: [s. n.], 2004.

[4]朱健翔, 蘇光大, 李迎春. 結(jié)合Gabor特征與Adaboost的人臉表情識別[J]. 光電子:激光, 2006, 17(8):993-998.

[5] Littlewort G, Bartlett M S, Fasel I, et al. Analysis of machine learning methods for real-time recognition of facial expressions from video[J]. Computer Vision & Pattern Recognition, 2004.

[6] 喬杉. 基于BP神經(jīng)網(wǎng)絡(luò)的人臉識別方法研究[D]. 武漢:中國地質(zhì)大學(xué), 2014.

猜你喜歡
學(xué)習(xí)機(jī)子帶人臉
一種基于奇偶判斷WPT的多音干擾抑制方法*
有特點(diǎn)的人臉
子帶編碼在圖像壓縮編碼中的應(yīng)用
電子制作(2019年22期)2020-01-14 03:16:24
極限學(xué)習(xí)機(jī)綜述
三國漫——人臉解鎖
動漫星空(2018年9期)2018-10-26 01:17:14
基于極限學(xué)習(xí)機(jī)參數(shù)遷移的域適應(yīng)算法
分層極限學(xué)習(xí)機(jī)在滾動軸承故障診斷中的應(yīng)用
基于虛擬孔徑擴(kuò)展的子帶信息融合寬帶DOA估計(jì)
馬面部與人臉相似度驚人
長得象人臉的十種動物
奇聞怪事(2014年5期)2014-05-13 21:43:01
奇台县| 博野县| 新建县| 阿拉善左旗| 万荣县| 历史| 长岛县| 循化| 仁寿县| 怀宁县| 临洮县| 托克托县| 汪清县| 栖霞市| 青河县| 吴江市| 朔州市| 肇州县| 克什克腾旗| 于都县| 侯马市| 庆城县| 福贡县| 渭南市| 绥江县| 黎平县| 东乡县| 祥云县| 漠河县| 宣威市| 东台市| 定安县| 深泽县| 内乡县| 嘉义县| 宜兴市| 宁陵县| 新乡市| 沾益县| 荣昌县| 德昌县|