朱 政
(安徽理工大大學(xué) 電氣與信息工程學(xué)院, 安徽 淮南 232000)
近年來,伴隨著信息化技術(shù)的發(fā)展,人臉識別成為了一個(gè)熱門話題,成為視頻圖像、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)以及生物識別等研究領(lǐng)域的重要課題之一。人臉識別技術(shù)在安全防務(wù)、信息鑒別、行為檢測等方面有著非常普遍的應(yīng)用。人臉識別的關(guān)鍵在于面部特征的提取,在這一關(guān)鍵步驟中,PCA(principal component analysis)主成分分析方法在當(dāng)前的科學(xué)研究中起到了很好的效果。經(jīng)過映射得到的全新正交特征在降低維數(shù)的同時(shí)將數(shù)據(jù)的損失降到了最低,有利于降低算法程序的計(jì)算開銷。
針對PCA方法受到特征值計(jì)算量大等因素的影響從而導(dǎo)致過擬合現(xiàn)象的出現(xiàn)。張穎等[1]提出小波變換與重構(gòu)PCA特征矩陣相結(jié)合的方法,最后通過VGG-16卷積神經(jīng)網(wǎng)絡(luò)分類。李嘉頔等[2]提出在利用PCA算子降維之前,先使用CS-LBP算子進(jìn)行初步的人臉特征提取。印勇等[3]提出SVD(奇異值分解)與分塊PCA算子相結(jié)合,在此基礎(chǔ)上進(jìn)行分類識別提高機(jī)器的識別率。趙鑫等[4]提出了改進(jìn)模塊的PCA并對傳統(tǒng)PCA的前3個(gè)最大主成分加上小于1的權(quán)重。王春夢等[5]提出使用PCA和Gabor變換相結(jié)合的方法,將原始圖像提取的Gabor特征與原圖像特征相結(jié)合成新的融合特征后再利用PCA算子進(jìn)行降維,在此基準(zhǔn)上取得了很好的效果。
本文通過改進(jìn)后的LBP特征提取算法與PCA相結(jié)合的方法,在ORL人臉庫上通過實(shí)驗(yàn),取得了最佳效果。
本文所采用的是包含400幅尺寸均為92 × 112的人臉灰度圖像。圖像預(yù)處理階段的第一步是對每幅圖像進(jìn)行直方圖均衡化處理。直方圖均衡化的本質(zhì)是調(diào)整圖像像素點(diǎn)的灰度級分布,使得圖像的直方圖在區(qū)間內(nèi)近似達(dá)到均勻分布從而避免出現(xiàn)顏色反差過大的問題,在保持圖像原有強(qiáng)度特征的同時(shí)避免了整體變亮或變暗。處理前后的直方圖以及圖像效果如圖1所示。
傳統(tǒng)的高斯濾波容易導(dǎo)致像素移位,均值濾波不能很好地保護(hù)圖像細(xì)節(jié)并且耗時(shí)較長。雙邊濾波可以更好地確保圖像邊緣的完整性,作為一種非線性濾波器,在去噪的同時(shí)還綜合考慮了圖像的空間域和值域信息。
通常,雙邊濾波的定義式為:
(1)
式中各參數(shù)定義:
(2)
(3)
(4)
I(i,j)=f(i,j)+n(i,j)
(5)
雙邊濾波原理為兩個(gè)函數(shù)的卷積,在濾除噪聲的同時(shí)增加了對像素值的考慮。由式(1)可知,在實(shí)驗(yàn)過程中,設(shè)置空間域sigma、值域sigma、濾波領(lǐng)域半徑3個(gè)參數(shù)的取值是關(guān)鍵。綜合考慮濾波處理后的面部信息和處理時(shí)間,選取濾波領(lǐng)域半徑為3,空間域sigma為75,值域sigma取值為3。
圖1 直方圖均衡化處理效果對比圖
LBP算子是一種局部紋理特征描述子,優(yōu)點(diǎn)在于圖像在處理前后本身的灰度值不會(huì)發(fā)生改變。該算子的基本原理是以某一個(gè)像素點(diǎn)為中心,由中心向周圍各方向擴(kuò)展為8鄰域。在計(jì)算時(shí)將中心點(diǎn)的灰度值作為閾值gc,分別與8鄰域像素點(diǎn)的灰度值進(jìn)行比較。若鄰域點(diǎn)數(shù)值大于閾值gc,則在該鄰域像素點(diǎn)位置記為數(shù)字1;反之,則記為0。將比較所得的8個(gè)數(shù)字按照順時(shí)針順序排列成為的二進(jìn)制數(shù)轉(zhuǎn)化為十進(jìn)制數(shù),所得的結(jié)果即為中心點(diǎn)的LBP特征。該算子的運(yùn)算原理圖如圖2所示。
圖2 LBP算子計(jì)算原理圖
LBP原理:
(6)
(7)
式中:(xc,yc)為中心像素點(diǎn),gi為中心鄰域像素點(diǎn)的灰度值。通過遍歷全圖的像素點(diǎn),最終即可得到整幅圖像的LBP特征。經(jīng)過LBP處理后的圖像前后對比圖如圖3所示,處理前后的直方圖如圖4所示。
(a)原始圖像 (b)處理后的圖像
(a)處理前直方圖 (b)處理后直方圖
傳統(tǒng)LBP算子原理簡單、計(jì)算速度快,但是計(jì)算中只考慮了相關(guān)8鄰域和中心閾值之間的關(guān)系,并未考慮到中心像素點(diǎn)以外的各鄰域相關(guān)性。針對這一局限性,本文提出了一種基于LBP算子改進(jìn)的MBLBP(Multi-Block Local Binary Pattern)多尺度區(qū)域局部二值模式算子。相較于傳統(tǒng)的LBP方法,MBLBP算子在提取特征時(shí)進(jìn)一步對每一個(gè)子空間進(jìn)行均勻分塊,分塊后原像素點(diǎn)的灰度值被其子空間區(qū)域的平均值所取代。經(jīng)過閾值比較和計(jì)算后,最終得到圖像的MBLBP特征。該特征完全由圖像的分塊尺度所決定。一般地,分塊尺度定義為S×S,該算子通常表示形式為MBs-LBP。MBLBP算子的計(jì)算原理圖如圖5所示。
圖5 MBLBP算子計(jì)算原理圖
PCA(Principal Component Analysis)方法是一種極小損失全局特征的降維方法。利用旋轉(zhuǎn)坐標(biāo)系進(jìn)行特征空間變換是PCA算法的本質(zhì),這種變換可以極大程度地保留原始數(shù)據(jù)信息,同時(shí)降低原始空間的維數(shù),在減少數(shù)據(jù)冗余的同時(shí)還能降低計(jì)算量。經(jīng)過映射得到的全新正交特征稱為主成分,這些正交特征在降低維數(shù)的同時(shí)將數(shù)據(jù)的損失降到了最低,有利于降低算法程序的計(jì)算開銷。
PCA算法的具體運(yùn)算過程:
(a)假設(shè)輸入一個(gè)均值化處理后的n的樣本數(shù)據(jù)矩陣;
(b)計(jì)算樣本矩陣的協(xié)方差矩陣:
式中:矩陣C為實(shí)對稱矩陣;
(c)求解特征值λi及對應(yīng)的特征向量ξi,并且滿足關(guān)系式
Cξi=λiξi(i=1,2,…,n);
(d)構(gòu)造出由前K個(gè)主成分所對應(yīng)特征向量組成的矩陣P;
(e)計(jì)算降維投影后的矩陣Y,即為經(jīng)過PCA處理后的數(shù)據(jù)矩陣:
Y=PX
降維處理后的前10張?zhí)卣魅四槇D像如圖6所示。
(a)Face1 (b)Face2 (c)Face3 (d)Face4 (e)Face5
(f)Face6 (g)Face7 (h)Face8 (i)Face9 (j)Face10
MBLBP算子可以很好地提取圖片特征,但特征維數(shù)過高,會(huì)使計(jì)算量增大,計(jì)算時(shí)間也隨之增加。針對這一問題,PCA可以通過實(shí)現(xiàn)高維數(shù)據(jù)的降維從而提高數(shù)據(jù)處理的運(yùn)算速度,實(shí)現(xiàn)步驟如圖7所示。
圖7 人臉識別流程框圖
實(shí)驗(yàn)仿真過程:
(1)統(tǒng)計(jì)每張經(jīng)過預(yù)處理后圖像的MBLBP直方圖特征,然后按次排列;
(2)利用PCA算法對第一步得到的直方圖特征進(jìn)行降維處理;
(3)求解歐式距離,選擇最近鄰分類器對人臉特征進(jìn)行分類并與數(shù)據(jù)集進(jìn)行比對,將人臉識別的正確率作為最終的輸出結(jié)果。
為了驗(yàn)證該算法的有效性,選用了誕生于英國劍橋Olivetti實(shí)驗(yàn)室的ORL人臉庫。該數(shù)據(jù)庫包含的400幅人臉灰度圖像分屬于不同的40個(gè)對象,每個(gè)對象包含姿勢、神態(tài)以及拍攝角度均有所差異的10幅圖像,每幅大小均為92×112。實(shí)驗(yàn)開始對所有圖像進(jìn)行直方圖均衡化和雙邊去噪的預(yù)處理步驟,同時(shí)在PCA降維前,對圖像進(jìn)行MBLBP特征提取,不同分塊尺度處理后的圖像如圖8所示。
選取的訓(xùn)練集為每個(gè)對象的前PH張人臉圖像,測試集為選取后的(10-PH)張圖像。根據(jù)圖8所展示的圖像紋理信息,選取的分塊尺度為3×3。通過改變PH的取值來比較PCA、LBP+PCA、MBLBP+PCA共3種不同算法的識別率,如圖9所示。3種算法的識別率在PH的取值從2到3時(shí)顯著提高并且隨著PH取值的增大,識別率均有提升。無論是在訓(xùn)練集數(shù)量較少還是較多的情況下,本文提出的方法相較于PCA與LBP+PCA方法都取得了最好的效果。
(a)原圖 (b)3×3 (c)9×9 (d)15×15
圖9 不同算法的識別率比較圖
結(jié)合改進(jìn)的LBP特征提取算子和主成分分析法的優(yōu)點(diǎn),通過兩道預(yù)處理步驟初步處理含噪灰度圖,在提取圖像特征時(shí)對鄰域像素點(diǎn)之間的相關(guān)性進(jìn)行了補(bǔ)充,同時(shí)極大程度地保留了圖像的細(xì)節(jié)信息與邊緣信息,通過PCA算法對提取后的特征空間數(shù)據(jù)進(jìn)行降維處理,避免因?yàn)榫S數(shù)過大造成過擬合。