劉吉安 江金滾
摘要:傳統(tǒng)基于LBP特征的人臉識別算法因為受到人臉位置的影響,識別效果差;基于此,該文提出了基于區(qū)域改進的LBP和KNN的人臉識別方法。首先將整張圖片劃分成若干個小區(qū)域,再對每個子區(qū)域內(nèi)各個位置的像素點都提取其LBP特征,接著,在每個子區(qū)域內(nèi)建立自己的LBP特征統(tǒng)計直方圖。然后,將所有直方圖按順序串聯(lián)起來,并對其進行歸一化,一張圖片便能通過一個歸一化直方圖來表示。最后,將最終的歸一化的直方圖作為人臉特征,并采用KNN算法完成人臉識別。實驗結(jié)果表明該劃分方法能夠有效地提升識別效果。
關(guān)鍵詞:人臉識別;人臉特征;LBP;KNN
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2016)13-0184-02
人臉識別,是基于人的臉部特征信息進行身份識別的一種生物識別技術(shù)。用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部分析、驗證等一系列相關(guān)技術(shù),通常也叫做人像識別、面部識別。相對于指紋等其他生物特征,人臉識別有其獨特的優(yōu)勢,應用前景廣泛。適用于公園、工廠、超市、住宅區(qū)、商業(yè)街等公眾活動和聚集場所的重要部位。目前在已經(jīng)有大量系統(tǒng)中應用到了人臉識別技術(shù),例如:出入管理系統(tǒng)、門禁考勤系統(tǒng)、監(jiān)控管理、安全防范、照片搜索、來訪登記、ATM機智能視頻報警系統(tǒng)、監(jiān)獄智能報警系統(tǒng)、RFID智能通關(guān)系統(tǒng)及公安罪犯追逃智能報警系統(tǒng)等都可以引入人臉識別技術(shù)。經(jīng)過四十多年的發(fā)展,人臉識別技術(shù)取得了巨大的進步。在信息檢索領域,可進行人物圖片的檢索;在安防系統(tǒng)中,可以達到實時監(jiān)測的優(yōu)良效果;在人工智能等其他領域,人臉識別的應用也有相當重要的意義。但是在進行人臉識別時,仍然有很多因素影響著識別效果。因此,人臉識別應用還有許多需要解決的關(guān)鍵問題。
本實驗針對人臉識別技術(shù)中的特征提取步驟進行了改進,提取特征前對圖像進行了區(qū)域分割,以消除人臉位置所帶來的影響。識別過程如下,首先對需要識別的圖片進行預處理,然后,提取人臉特征,與人臉數(shù)據(jù)庫中的信息進行比較,得到正確的人臉編號,識別完成。
1 基本的LBP特征
人臉特征代表如何對人臉建模,并確定使用何種檢測與識別算法。人臉特征在用于測量人臉之間的相似性中,是最為有效的。
目前,存在著多種從圖片中提取人臉特征的方法。其中局部二進制模式(LBP)特征是比較優(yōu)秀的一種。這種特征是Ojala在1996年提出的。使用LBP能夠描述數(shù)字圖像的紋理和形狀。
某一位置的LBP特征是由當前區(qū)域內(nèi)該位置周圍的像素以二進制的模式組成的,把所有獲取到的特征串聯(lián)起來,形成一個直方圖,并進行歸一化,則這個直方圖表示的就是當前的人臉。在人臉識別領域,LBP特征主要是計算當前位置八鄰域的二進制模式值。按照順時針的順序,從左上位置開始比較,對于大于中心像素的,設置為1,否則設置為0。這就獲得了一個八位的二進制數(shù),通常情況下,將其轉(zhuǎn)換為十進制數(shù)字,作為該位置的特征。
圖像之間通過測量它們直方圖之間的距離,來判斷它們的相似性。在實驗中,使用的是卡方距離。其中樣本集用S表示,測試集用M表示:
2 區(qū)域改進的LBP特征
由上述基本的LBP可知,該特征與位置信息關(guān)系緊密,直接對兩張圖片提取特征,進行識別分類的話,則會因為“位置沒有對準”而產(chǎn)生很大的誤差。故在本次實驗中,對直接提取進行改進,這里采用分塊的思想,來消除位置的影響。首先將一張完整的圖片劃分為N*N個子區(qū)域,再對每個子區(qū)域內(nèi)各個位置的像素點都提取其LBP特征,然后,在每個子區(qū)域內(nèi)建立自己的LBP特征統(tǒng)計直方圖。這樣,就可以用一個統(tǒng)計直方圖來進行描述一個子區(qū)域。最后,將所有直方圖按順序串聯(lián)起來,并對其進行歸一化,于是,一張圖片便能通過一個歸一化直方圖來表示。
例如:有一張200*200像素大小的圖片,取N為5,則該圖片就被劃分為25個子區(qū)域。在每個子區(qū)域內(nèi)的每個像素點,提取其LBP特征,然后,建立統(tǒng)計直方圖;這樣便得到了25個子區(qū)域,即25個統(tǒng)計直方圖,將它們串聯(lián)起來并歸一化后,就可以用這個歸一化直方圖來表示圖片了。之后,我們利用各種相似性度量函數(shù),判斷兩張圖片之間的相似性。
3 KNN算法
在模式識別領域中,K近鄰算法(KNN算法),是一種用于分類和回歸的算法。在分類中,KNN算法輸出的是分類的類別號。一個對象的分類是由其相鄰的多個對象“多數(shù)表決”確定的,這里我們將這多個對象稱之為“鄰居”。我們給這k個最近鄰居(k為正整數(shù),通常較?。┵x予不同權(quán)值,再把權(quán)值和最大的類別的編號,賦值給當前對象。若k = 1,則該對象的類別直接由最近的一個鄰居賦予。在本次研究中,經(jīng)過對不同k值的取值,最終取k等于5。
KNN是一種基于實例的學習,或者是局部近似和將所有計算推遲到分類之后的惰性學習。K近鄰算法是所有的機器學習算法中最簡單的之一。鄰居都取自一組已經(jīng)正確分類的對象。雖然沒要求明確的訓練步驟,但這也可以當成是此算法的一個訓練樣本集。
一般情況下,將歐氏距離作為距離度量,但是這是只適用于連續(xù)變量。通常情況下,如果運用一些特殊的距離來計算度量的話,K近鄰分類精度可顯著提高,在本次人臉識別研究中,使用卡方距離來度量,效果甚佳。
4 實驗及結(jié)論
本次實驗的樣本數(shù)據(jù)庫采用的是我們自己采集的大量照片,這些照片基本上是由雙飛燕的PK-910H這款攝像頭拍攝的。
樣本數(shù)據(jù)庫共有200張人臉照片,測試數(shù)據(jù)庫共有100張人臉照片,識別率的計算方法是,識別正確的照片數(shù)量除以測試數(shù)據(jù)庫的照片數(shù)量。
在本次實驗中,需要建立人臉數(shù)據(jù)庫,步驟如下:采集大量含有人臉的圖片,對這些圖片進行預處理,將圖片灰度化并分割區(qū)域,之后提取人臉特征,把相關(guān)信息存入到數(shù)據(jù)庫中。人臉識別階段的前期步驟與建立數(shù)據(jù)庫時相同,在提取特征之后,利用卡方距離以及KNN算法與數(shù)據(jù)庫中信息進行比較,最終得到其正確的分類,識別完成。
基礎的實驗之后,為了研究區(qū)域個數(shù)對實驗結(jié)果的影響,進而在劃分不同子區(qū)域個數(shù)時進行了實驗。
從實驗結(jié)果可以看出,對整張圖片劃分區(qū)域后,識別率有明顯的提升。另外,區(qū)域的劃分個數(shù)對識別率是有一定影響的,既不是越少越好,也不是越大越好。所以,實際應用中要對每個參數(shù)的不同取值都盡可能進行嘗試,以到達最優(yōu)效果。本項目中的數(shù)據(jù)庫而言,劃分成25個區(qū)域取得的效果是最佳的。
參考文獻:
[1] Ojala T, Pietikainen M, Harwood D. A comparative study of texture measures with classification based on feature distributions[J].Pattern Recognition, 1996(29).
[2] Altman N S. An introduction to kernel and nearest-neighbor nonparametric regression[J].The American Statistician , 1992,46(3): 175–185.
[3] 張翠平,蘇光大.人臉識別技術(shù)綜述[J].中國圖像圖形學報,2000,5(A):886-894.
[4] 江小輝.基于改進型 LBP 特征的人臉識別研究[D].金華:浙江師范大學,2009.
[5] 鄭瑾.基于人臉識別技術(shù)的模擬考勤系統(tǒng)的研究與設計[J].福建電腦,2010(8).
[6] 黃非非.基于LBP的人臉識別研究[D]. 重慶:重慶大學,2009.
[7] 陳健斌.圖像特征提取及其相似度的研究和實現(xiàn)[D]. 西安:西安電子科技大學,2012.