国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

CLAHE融合低頻DCT系數(shù)重變換的人臉識(shí)別算法

2015-03-14 05:34江東林龍巖學(xué)院數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院福建龍巖364000
關(guān)鍵詞:人臉識(shí)別

江東林(龍巖學(xué)院 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,福建 龍巖,364000)

CLAHE融合低頻DCT系數(shù)重變換的人臉識(shí)別算法

江東林
(龍巖學(xué)院數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,福建龍巖,364000)

摘要:針對(duì)人臉識(shí)別中由于偽裝(如圍巾、太陽鏡和頭發(fā))或其他物體引起的面部遮擋而嚴(yán)重影響識(shí)別率的問題,提出了CLAHE融合低頻DCT系數(shù)重變換的人臉識(shí)別算法。首先將圖像劃分成多個(gè)互不重疊的局部小塊,使用受限直方圖均衡化對(duì)局部子塊進(jìn)行局部對(duì)比拉伸以實(shí)現(xiàn)去噪;然后,通過縮減適當(dāng)數(shù)目的低頻DCT系數(shù)來消除人臉圖像中的光照變化;最后,利用核主成分分析進(jìn)行特征提取,最近鄰分類器完成最終的人臉識(shí)別。在擴(kuò)展Yale B、FRGC V2.0及一個(gè)戶外人臉數(shù)據(jù)庫上的實(shí)驗(yàn)驗(yàn)證了所提算法的有效性及魯棒性。實(shí)驗(yàn)結(jié)果表明,相比幾種線性表示算法,本文算法在處理魯棒人臉識(shí)別時(shí)取得了更高的識(shí)別率。

關(guān)鍵詞:人臉識(shí)別;自適應(yīng)直方圖均衡化;低頻離散余弦變換;系數(shù)重變換

0 引言

人臉識(shí)別[1]是模式識(shí)別中最重要的研究領(lǐng)域之一,它已經(jīng)在執(zhí)法、安全、選民驗(yàn)證和建筑區(qū)、門、汽車或網(wǎng)絡(luò)訪問等行業(yè)發(fā)揮了非常重要的作用。在復(fù)雜背景下的人臉識(shí)別技術(shù)雖已提升了一個(gè)質(zhì)的飛躍[2],但其性能往往會(huì)因光照、表情、姿態(tài)、遮擋等條件的影響而大大降低[3],因此,為自動(dòng)人臉識(shí)別規(guī)范化這些變化是非常有必要的[4-5]。

針對(duì)局部區(qū)域代替全局特征引起特征提取識(shí)別率不高的問題,文獻(xiàn)[6]提出了基于魯棒主成分分析的人臉子空間重構(gòu)算法;文獻(xiàn)[7]提出基于低秩子空間恢復(fù)的聯(lián)合稀疏表示算法;文獻(xiàn)[8]提出稀疏表示的重構(gòu)算法;文獻(xiàn)[9]提出基于分類的協(xié)同表示,這類方法要求每個(gè)人有足夠多的樣本來形成探針圖像(即查詢?nèi)四槇D像),但實(shí)際的情況往往是臉部在受光照等影響,導(dǎo)致識(shí)別率低,因而這些方法在現(xiàn)實(shí)環(huán)境中并不總是可行的。也有學(xué)者首先將遮擋圖像劃分成子塊,在子塊中提取特征,然后基于每個(gè)成對(duì)塊的相似度執(zhí)行匹配過程,為了減小因遮擋塊造成的匹配誤差,通過訓(xùn)練產(chǎn)生不同的權(quán)重值分配給不同的塊,如文獻(xiàn)[10]提出了一種局部匹配的人臉識(shí)別算法,文獻(xiàn)[11]提出部分相似性算法;然而,訓(xùn)練過程通常是數(shù)據(jù)依賴的。文獻(xiàn)[12]提出了分塊PCA(BPCA)將圖像劃分成許多塊,使用PCA提取每個(gè)塊中的特征,2DPCA就是BPCA的一種特例。文獻(xiàn)[13]使用核函數(shù)可有效地計(jì)算高維特征空間的主成分。文獻(xiàn)[14]指出,線性判別分析(linear discriminant analysis,LDA)方法旨在尋找類特定線性投影,目的是最大化投影圖像類間散射矩陣與類內(nèi)散射矩陣的比率,但是它需要的訓(xùn)練時(shí)間比主成分分析(principal compo?nent Analysis,PCA)多,因?yàn)樗褂肞CA作為預(yù)處理步驟。在現(xiàn)有研究的基礎(chǔ)上,為了提高降低光照變化對(duì)人臉識(shí)別的影響,更好地解決魯棒人臉識(shí)別問題,提出了CLAHE融合低頻DCT系數(shù)重變換的人臉識(shí)別算法。

1 系統(tǒng)設(shè)計(jì)

本文算法的人臉識(shí)別系統(tǒng)如圖1所示,具體步驟如下:

(1)首先將原始圖像順序地分割成一系列連續(xù)均勻且不重疊的8×8的子塊,經(jīng)過CLAHE處理后,圖像灰度差別增大,對(duì)比度增強(qiáng),更多細(xì)節(jié)被分割出來,所含噪聲也相應(yīng)減少;

(2)對(duì)每個(gè)經(jīng)過CLAHE處理后的8×8的子塊進(jìn)行DCT,可相應(yīng)地得到8×8的系數(shù)矩陣,然后通過重新變換縮減低頻DCT系數(shù)消除光照變化的影響;

(3)得到規(guī)范化圖像(即自由光照變化)后,使用KPCA提取圖像特征;

(4)最后,最近鄰分類器完成最終的人臉識(shí)別。

圖1 本文所設(shè)計(jì)的系統(tǒng)架構(gòu)Fig.1 System framework

本文所設(shè)計(jì)的系統(tǒng)各部分詳細(xì)介紹如下。

1.1對(duì)比度受限自適應(yīng)直方圖均衡化

圖像的直方圖是指圖像內(nèi)的強(qiáng)度分布,直方圖均衡化均勻調(diào)整圖像的強(qiáng)度值,從而提高圖像的全局對(duì)比度,這是非常有用的預(yù)處理步驟,能夠給出增強(qiáng)的規(guī)范化圖像,但是圖像內(nèi)感興趣的特征需要局部加強(qiáng),所以要想規(guī)范化人臉圖像,應(yīng)該局部增強(qiáng)對(duì)比度。

于是,系統(tǒng)沒有使用傳統(tǒng)的直方圖均衡化,而是使用對(duì)比度受限自適應(yīng)直方圖均衡化(CLAHE)[15],受限直方圖均衡化在圖像的小范圍內(nèi)操作,稱為瓦片。該方法是對(duì)HE法的一種改進(jìn),結(jié)合了對(duì)比度受限和自適應(yīng)直方圖均衡化兩項(xiàng)技術(shù)的優(yōu)點(diǎn),在增強(qiáng)圖像對(duì)比度的同時(shí)能有效抑制噪聲干擾,更好地突出圖像細(xì)節(jié),而且實(shí)現(xiàn)過程不復(fù)雜。因此,系統(tǒng)設(shè)計(jì)采用CLAHE技術(shù)增強(qiáng)圖像的對(duì)比度。如圖2所示,將原始圖像分別經(jīng)過直方圖均衡化和對(duì)比度受限自適應(yīng)直方圖均衡化后的對(duì)比效果圖。

圖2 采用HE和CLAHE法的對(duì)比圖Fig.2 Images contrast of HE and CLAHE

1.2離散余弦變換

DCT中,用一系列的有限多個(gè)數(shù)據(jù)點(diǎn)來表示不同頻率下余弦函數(shù)震蕩總和,DCT有4個(gè)類型,分別是DCTⅠ、DCTⅡ、DCTⅢ和DCTⅣ,DCTⅡ大多數(shù)用在信號(hào)處理中,通常簡稱為DCT。2D MXN DCT定義如下:

其中u=0, 1, 2,…, M-1;v=0, 1, 2,…, N-1,被稱為頻域變換因子;C( u, v)為變換結(jié)果,也稱為DCT系數(shù)。α( u)、α( v)分別定義為:

相應(yīng)的2D離散余弦反變換(IDCT)由下式給出:

所設(shè)計(jì)的系統(tǒng)中,DCT應(yīng)用在完整的人臉圖像上,將其轉(zhuǎn)換為人臉圖像的頻率成分,由于低頻DCT與光照變化有關(guān),所以光照變化通過縮減低頻DCT系數(shù)來補(bǔ)償,縮減的DCT系數(shù)數(shù)目和因子由實(shí)驗(yàn)得到。圖3所示為不同數(shù)目的低頻DCT系數(shù)重新變換的DCT規(guī)范化結(jié)果。

圖3 不同重變換系數(shù)的對(duì)比圖Fig.3 Images contrast with different retransformed coefficients

1.3核主成分分析(KPCA)

主成分分析(PCA)技術(shù)的表示形式是基于圖像集的第二次序統(tǒng)計(jì),這個(gè)方法不能表示圖像集依賴的高階統(tǒng)計(jì),圖像的高階統(tǒng)計(jì)包括像素強(qiáng)度值的非線性關(guān)系,包含了識(shí)別的重要信息。本系統(tǒng)使用核主成分分析(KPCA)提取高階統(tǒng)計(jì),算法過程描述如下:

第一步是集中給定的n個(gè)樣本集xk,其中,xk=[ xk1, xk2, ..., xkn]T∈Rn。PCA旨在找到最大化方差的投影C,即從協(xié)方差矩陣中找到特征值,問題變成求解式(7)的特征值:

上式中,λ≥0是特征值,v∈Rn是特征向量。

核PCA中,輸入空間的每個(gè)向量都通過非線性映射函數(shù)?: Rn-Rf被投影到一個(gè)高維特征空間Rf中。因此,核PCA的特征值可以計(jì)算如下:

v?的所有λ≠0的解都位于?(x1), ...,?(xn)范圍內(nèi),存在系數(shù)αi如:

定義N×N核矩陣K,由

將式(7)乘以?( xj),代入式(8),得到:

該特征值問題的解可表示為更簡單的特征值問題:

特征空間的投影由下式執(zhí)行:

因此,不需要大量計(jì)算,使用核函數(shù)就能提取k個(gè)非線性主成分。

1.4最近鄰分類

特征提取完成后,本系統(tǒng)計(jì)算測試樣本特征與每個(gè)訓(xùn)練樣本特征之間的歐氏距離,然后利用最近鄰分類器完成最終的分類、識(shí)別。

2 實(shí)驗(yàn)結(jié)果與分析

公開數(shù)據(jù)庫擴(kuò)展Yale B、FRGC V2.0(人臉識(shí)別大挑戰(zhàn))[13]及一個(gè)戶外人臉數(shù)據(jù)庫[15]上進(jìn)行了大量的實(shí)驗(yàn)。使用擴(kuò)展Yale B數(shù)據(jù)庫測試本文算法對(duì)光照變化的魯棒性,F(xiàn)RGC數(shù)據(jù)庫中,為了仿真不同級(jí)別(從0%到50%)的連續(xù)遮擋,使用一個(gè)隨機(jī)位置的方塊代替有黑框的每個(gè)測試圖像,遮擋的位置隨機(jī)選擇。戶外人臉數(shù)據(jù)庫包含光照、表情、姿態(tài)變化以及不同遮擋源的面部圖像。

2.1規(guī)范化分析

擴(kuò)展的Yale B數(shù)據(jù)庫[3]包含38個(gè)對(duì)象在64種不同光照條件下的圖像,每個(gè)對(duì)象在不同光照條件下有5個(gè)子集,子集1包含每個(gè)人的7幅圖像,子集2、3、4和5分別包含每人12、12、14、19幅圖像,子集數(shù)目越大,光照變化就越明顯。實(shí)驗(yàn)將所有的圖像統(tǒng)一剪裁為64×64大小,如圖4所示為擴(kuò)展的Yale B人臉數(shù)據(jù)庫上剪裁后的人臉圖像示例。

圖4 擴(kuò)展的Yale B數(shù)據(jù)庫裁剪后人臉圖像示例Fig.4 Facial images after extended Yale B database cutting

實(shí)驗(yàn)中,子集1用于訓(xùn)練,因?yàn)樗咏谡婀庹眨蛹?、3、4、5用于測試,DCT系數(shù)數(shù)目設(shè)置為27KPCA的主成分?jǐn)?shù),設(shè)置為50,高斯核函數(shù)k(x, y)參數(shù)設(shè)置為γ=2(n-20) 2.5γ0,n=0, 1, ..., 20,其中γ0是訓(xùn)練集的標(biāo)準(zhǔn)差,除了對(duì)本文算法進(jìn)行測試外,還對(duì)3種技術(shù)進(jìn)行了實(shí)驗(yàn),分別為“不進(jìn)行任何光照規(guī)范化”、“僅使用直方圖均衡”、“使用重新調(diào)節(jié)低頻DCT系數(shù)與直方圖均衡化”,表1為幾種規(guī)范化技術(shù)在擴(kuò)展Yale B數(shù)據(jù)庫上的識(shí)別結(jié)果。

表1 不同光照規(guī)范化技術(shù)的識(shí)別率Tab.1 Recognition rate with different illumination technologies /%

從表1可以看出,沒有進(jìn)行任何規(guī)范化時(shí),對(duì)子集5的識(shí)別率為6.509 7%,這是非常低的,由此也能看出對(duì)這個(gè)測試集的識(shí)別實(shí)際上是很困難的。通過使用IN技術(shù),如直方圖均衡化,識(shí)別率提高至38.080 3%,這個(gè)識(shí)別率也是具有挑戰(zhàn)性的。通過使用有HE的重新變換低頻DCT系數(shù),識(shí)別率提高為94.763 2%,表明該方法有巨大的改善能力,通過使用所提的CLAHE結(jié)合DCT對(duì)光照規(guī)范化,子集5的識(shí)別率可高達(dá)98.160 9%,這個(gè)識(shí)別率已經(jīng)非常高了。

所提出的規(guī)范化技術(shù)對(duì)子集2和子集3給出了最佳的100.000 0%的識(shí)別率,對(duì)子集4的識(shí)別率為97.556 4%,通過使用CLAHE結(jié)合DCT,將子集5的識(shí)別率從6.509 7%提高至98.160 9%,這是顯著的改進(jìn),表明了本文算法的有效性。

2.2光照變化人臉識(shí)別

為了體現(xiàn)本文算法的優(yōu)越性,將本文算法的識(shí)別率與其他幾種較為先進(jìn)的算法進(jìn)行了對(duì)比,包括對(duì)數(shù)轉(zhuǎn)換[2]、伽馬射線強(qiáng)度校正[4]、同態(tài)過濾[8]、單尺度Retinex[7]、小波規(guī)范化[9]、小波去噪[10],各比較算法的參數(shù)設(shè)置分別參照各算法所在文獻(xiàn)。實(shí)驗(yàn)仍然以子集1作為訓(xùn)練集,剩下的子集2至5用于測試,識(shí)別結(jié)果如表2所示。

從表2可以看出,本文所提方法在識(shí)別非常困難的子集4、5上識(shí)別率仍然保持在97%、98%以上,而對(duì)數(shù)轉(zhuǎn)換、伽馬射線強(qiáng)度校正、同態(tài)過濾的識(shí)別率卻以降至50%以下,甚至低至31.615 0%,由此充分說明了本文算法的穩(wěn)定性及魯棒性。

表2 各算法在擴(kuò)展Yale B上的識(shí)別率比較Tab.2 Comparison of recognition rate of different algorithms on extended Yale B /%

2.3合成遮擋人臉識(shí)別

首先使用有合成遮擋的FRGC數(shù)據(jù)庫對(duì)本文算法進(jìn)行評(píng)估,F(xiàn)RGC Ver2.0人臉數(shù)據(jù)庫包括465人的4 000幅圖像,這些圖像包含有6類差異:臉部表情變化(無表情、微笑、生氣、尖叫)、不同的光照變化、遮蔽(太陽鏡和圍巾)。本文從原始FRGC Ver2.0數(shù)據(jù)庫選擇100個(gè)對(duì)象(50名男性和50名女性)用于實(shí)驗(yàn),所有圖像均裁剪成64×64大小。

將本文算法的識(shí)別率與對(duì)數(shù)轉(zhuǎn)換、伽馬射線強(qiáng)度校正、單尺度Retinex、小波規(guī)范化進(jìn)行了比較,如圖5所示為每個(gè)人不同訓(xùn)練數(shù)目下各個(gè)算法的識(shí)別率。

圖5 在FRGC數(shù)據(jù)庫上每個(gè)人不同訓(xùn)練圖像數(shù)目的識(shí)別率Fig.5 Recognition rate of different training image number of each person on FRGC database

綜合圖5中的4幅圖可以看出,不論K取何值,本文算法的識(shí)別率明顯高于其他各個(gè)算法。

2.4戶外人臉識(shí)別

實(shí)驗(yàn)選擇包含55個(gè)對(duì)象的一個(gè)圖像集,圖6所示為戶外人臉圖像示例,對(duì)于每個(gè)對(duì)象,分別選擇K=1, 3, 5, 8幅未遮擋的圖像作為訓(xùn)練集,有不同遮擋類型的110幅圖像用于測試,每個(gè)訓(xùn)練集與探針集均不相交。從每幅圖像的背景中裁剪出人臉區(qū)域,調(diào)整大小為64×64,識(shí)別結(jié)果如表3所示。

圖6 戶外人臉數(shù)據(jù)庫中的圖像示例Fig.6 Images example of outdoor face database

表3 戶外人臉圖像上的識(shí)別率Tab.3 Recognition rate of outdoor face images /%

從表3可以看出,由于戶外環(huán)境的整體復(fù)雜性,各比較方法的識(shí)別率都不太理想,但本文算法仍能獲得相對(duì)較好的識(shí)別率,由此可見其可靠性及強(qiáng)魯棒性。

2.5性能比較

僅識(shí)別率高于其他算法還不足以說明本文算法的優(yōu)越性,因此,實(shí)驗(yàn)記錄了各算法的運(yùn)行時(shí)間,包括訓(xùn)練總完成時(shí)間、測試一張圖像的時(shí)間,記錄結(jié)果如表4所示。

表4 各算法在擴(kuò)展Yale B上的運(yùn)行時(shí)間比較Tab.4 Comparison of runtime of each algorithm on extended Yale B /s

從表4可以看出,本文算法的訓(xùn)練總完成時(shí)間僅高于小波規(guī)范化0.013 2s,比其他幾種算法耗時(shí)都少很多,測試一張圖像所用時(shí)間僅有2.894 1s,明顯低于其他各個(gè)算法,由此體現(xiàn)了本文算法的優(yōu)越性。

3 結(jié)語

為了改善“惡劣”條件下人臉識(shí)別正確率,提高算法的魯棒性,本文提出了CLAHE融合低頻DCT系數(shù)重變換的人臉識(shí)別算法。在三大通用人臉數(shù)據(jù)庫上的實(shí)驗(yàn)結(jié)果表明,本文算法即便在識(shí)別非常困難的擴(kuò)展Yale B子集5也給出了高達(dá)98.160 9%的最佳識(shí)別率,充分表明了本文方法的有效性及優(yōu)越性。

參考文獻(xiàn)(References)

[1]蘇煜,山世光,陳熙霖,等.基于全局和局部特征集成的人臉識(shí)別[J].軟件學(xué)報(bào),2010,21(8):1849-1862.

[2]田玉敏,云艷娥,馬天駿.判別近鄰保持嵌入人臉識(shí)別[J].西安電子科技大學(xué)學(xué)報(bào),2011,38(3):24-28.

[3]李曉莉,達(dá)飛鵬.基于排除算法的快速三維人臉識(shí)別方法[J].自動(dòng)化學(xué)報(bào),2010,36(1):153-158.

[4]李曉莉,達(dá)飛鵬.基于側(cè)面輪廓線和剛性區(qū)域的3維人臉識(shí)別[J].中國圖象圖形學(xué)報(bào),2010,15(2):266-273.

[5]尹洪濤,付平,沙學(xué)軍.基于DCT和線性判別分析的人臉識(shí)別[J].電子學(xué)報(bào),2009,37(10):2211-2214.

[6]葛微,李桂菊,程宇奇,等.利用改進(jìn)的Retinex進(jìn)行人臉圖像光照處理[J].光學(xué)精密工程,2010,18(4):1011-1020.

[7]孫勁光,李揚(yáng),孟祥福,等.改進(jìn)的單尺度Retinex及其在人臉識(shí)別中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用研究,28(12):4790-4793.

[8]焦竹青,徐保國.基于同態(tài)濾波的彩色圖像光照補(bǔ)償方法[J].光電子·激光,2010,21(4):602-605.

[9]ZHANG T,F(xiàn)ANG B,YUAN Y,et al.Multiscale facial structure representation for face recognition under varying illumination [J].Pattern Recognition,2009,42(2):251-258.

[10]LI Y,MENG L,F(xiàn)ENG J.Lighting coefficients transfer based face illumination normalization[J].Pattern Recognition:Communi?cation in Computer and Information Science,2012,321:268-275.

[11]李建科,趙保軍,張輝,等.DCT和LBP特征融合的人臉識(shí)別[J].北京理工大學(xué)學(xué)報(bào),2010,30(11):1355-1359.

[12]VISHWAKARMA V P,PANDEY S,GUPTA M N.An illumination invariant accurate face recognition with down scaling of DCT coefficients[J].Journal of Computing and Information Technology,2010,18(1):53-67.

[13]盧桂馥,林忠,金忠.基于核化圖嵌入的最佳鑒別分析與人臉識(shí)別[J].軟件學(xué)報(bào),2011,22(7):1561-1570.

[14]鄒建法,王國胤,龔勛.基于增強(qiáng)Gabor特征和直接分步線性判別分析的人臉識(shí)別[J].模式識(shí)別與人工智能,2010 (4):477-482.

[15]TURGAY C,TARDI T.Automatic image equalization and contrast enhancement using Gaussian mixture modeling[J].IEEE Transactions on Image Processing,2012,21(1):145-156.

(責(zé)任編輯:范建鳳)

Face Recognition Algorithm Based on Fusion CLAHE and Low Frequency DCT Coefficients Retransformation

JIANG Donglin
(School of Mathematics and Computer Science,Longyan University,Longyan 364000,F(xiàn)ujian,China)

Abstract:Towards the problem that serious affect the recognition rate of face, such as disguise(e.g., scarves, sunglasses and hair)and facial shade by other objects, the face recognition algorithm based on fusion CLAHE and low frequency DCT coefficients transformation was proposed.Firstly, divided the image into several non-overlapping local patches, used the histogram equalization to do local contrast stretching on local sub-block and realized denoising.Secondly, with the appropriate number of low frequency DCT coefficients to eliminate the illumination change in face image.Finally, with kernel principal component analysis, to carry out feature extraction, and with the nearest neighbor classifier, completed the final face recognition.The effectiveness and robustness of the proposed algorithm were experimentally verified in extended Yale B, FRGC V2.0 and an outdoor face database.The experimental results showed the proposed algorithm achieved higher recognition rate when dealing with robust face recognition, compared with several kinds of linear algorithms.

Keywords:face recognition;adaptive histogram equalization;low frequency discrete cosine transform;coefficients retransform

作者簡介:江東林(1971—),男,講師,碩士,研究方向:虛擬現(xiàn)實(shí)技術(shù)、圖像處理技術(shù)。

收稿日期:2015-05-05

DOI:10.16389/j.cnki.cn42-1737/n.2015.04.012

中圖分類號(hào):TP391.41

文獻(xiàn)標(biāo)志碼:A

文章編號(hào):1673-0143(2015)04-0345-08

猜你喜歡
人臉識(shí)別
人臉識(shí)別 等
揭開人臉識(shí)別的神秘面紗
人臉識(shí)別技術(shù)的基本原理與應(yīng)用
人臉識(shí)別技術(shù)在高速公路打逃中的應(yīng)用探討
基于(2D)2PCA-LBP 的人臉識(shí)別方法的研究
淺談人臉識(shí)別技術(shù)
人臉識(shí)別在高校安全防范中的應(yīng)用
巡演完美收官 英飛拓引領(lǐng)人臉識(shí)別新潮流
人臉識(shí)別在Android平臺(tái)下的研究與實(shí)現(xiàn)
基于GPU的PCA人臉識(shí)別系統(tǒng)設(shè)計(jì)