文/李旭輝
隨著計算機網(wǎng)絡的發(fā)展,人們通過互聯(lián)網(wǎng)進行電子交易活動,自由進出各個地方。同時,為了保證信息安全,有些信息只有通過身份認證才可以訪問。以鑰匙和密碼為代表的傳統(tǒng)身份認證技術容易被忘記和破解,而以指紋識別和面部識別為主的生物特征認證技術,具有不易被竊取和破解的優(yōu)點,受到了政府部門如海關和邊境部門的重視。在面部識別方面,LBP算法對輕微光照和面部遮擋的敏感度比較低,并且LBP旋轉不變算子可以減少人臉旋轉對識別結果的影響。但也存在一些缺點:首先人臉的明暗程度和人臉移動會影響識別結果。其次,測試設備的性能好壞對識別結果也會有影響?;谝陨先毕?,需要對人臉圖像進行光線補償、重定位、通過中值濾波的方式減少噪聲,提高識別準確度。
為保證測試結果的準確性,我們采集了40個人不同光照、表情和遮擋的照片各20張,這些照片即原始圖像。原始圖像需要進行預處理,其中包括光線補償、人臉重定位和中值濾波處理。
采集人臉圖像的時候,由于人臉移動的原因,會存在人臉模糊的現(xiàn)象。模糊人臉的處理可以借助視頻和圖像的打碼技術,即在一個區(qū)域內,分別使用一個隨機的像素值和其他區(qū)域的像素值來代替原來區(qū)域的像素值處理模糊人臉。
圖1:特征值提取
識別設備的優(yōu)劣程度是影響識別結果的重要因素之一,如果攝像頭的成本較低,圖像將會出現(xiàn)部分模糊,這些模糊的像素就是圖像的噪音,借助視頻和圖像的回復技術即中止濾波處理的方式圖像將會出現(xiàn)一定的噪音,該噪音所在的像素的灰度值與周圍像素的灰度值有很大的差異?;诖?,我們可以利用中值濾波的方法,將周圍的奇數(shù)個像素值進行排序,選擇中間的灰度值取代模糊像素的灰度值。
由于人臉所處的環(huán)境如背景還有頭發(fā)會對影響識別結果,因此可以對人臉背后的背景進行去除處理,只保留臉的輪廓和面貌。
人臉存在平移和旋轉造成了識別結果的誤判,通過對原始圖像的翻轉、平移、旋轉可以讓人臉的眼睛保持水平,眼部距離統(tǒng)一,從而達到重定位的要求。
測試圖像可以選用RGB模式的圖像,由于任何色系都可以用紅色,綠色和藍色混合而成,基于此,所選用的平面圖像可以使用基于位置坐標的二維函數(shù)來進表示,即:
其中f(x,y)是(x,y)點的顏色值,而fred(x,y),fgreen(x,y),fblue(x,y)分別是紅色,綠色和藍色的分量值。
由于光照對彩色圖像的識別結果具有影響,此外彩色圖像會降低識別的效率,提高算法的時間復雜度,因此需要將彩色圖像裝轉換成為灰度圖像,即:
LBP算法的思想是在3*3的窗口內,以中心像素的灰度值為閾值,將周圍像素的灰度值大小與中心像素的灰度值進行比較,周圍像素的灰度值大于中心像素,則為1,否則為0。3*3領域內的8個點經(jīng)過比較之后,將會產(chǎn)生一個二進制數(shù)。
圖1表示的是特征值提取的過程,其中中心像素的灰度值為6,周圍像素的灰度值分別是44,118,192,204,61,174,250,將周圍像素的灰度值與閾值作比較,得到了一個二進制數(shù)01111100.
圖3:特征值統(tǒng)計柱狀圖
傳統(tǒng)的特征值提取算法有兩大缺陷。首先,傳統(tǒng)算法的正方形鄰域點的LBP值對人臉的姿態(tài)變化敏感度很大。其次,正方形鄰域僅僅覆蓋了半徑之內的鄰域點,無法滿足不同尺寸和不同紋理的需要。Ojala對算法進行了一定的改進,首先將正方形鄰域改變?yōu)閳A形鄰域,同時將3*3的鄰域擴展到了任意的鄰域,達到了旋轉和灰度不變性的要求,從而擴大了鄰域的范圍,允許在圓形區(qū)域內有任意多的像素點。
為方便介紹改進的算法,首先定義一個參數(shù)s, 表示將中心像素的灰度值與周圍像素的灰度值做對比,如果周圍像素的灰度值大于中心像素,s為1,否則s為0,得到一個二進制數(shù),可以表示成為公式(1)
對像素按照不同的位置進行加權,賦予2P的當量值,從而得到與鄰域點相關的唯一LBP值:
其中p表示周圍像素的個數(shù),而gp和gc分別表示周圍像素的灰度值和中心像素的灰度值。
借助改進的特征值提取算法,可以從原始的圖像中得到經(jīng)過提取后的紋理圖,如圖2所示。
將圖像分為若干小區(qū)域,在每一個小區(qū)域內進行直方圖統(tǒng)計,再將直方圖連接在一起,特征值的統(tǒng)計柱狀圖,如圖3所示。
用訓練圖像和測試圖像的直方圖的的距離來作為圖像的相似度度量,項目采用的是距離度量是歐式距離,借助chi平方概率統(tǒng)計方法,可以有效地計算出相似度,最終得到平均值,即識別的準確率,實驗表明,相比較直方圖相交距離和對數(shù)似然統(tǒng)計法,chi平方概率統(tǒng)計法效果最好。圖4顯示圖像的相似度和距離。
原始的LBP算子可以達到灰度不變的要求,但是無法達到旋轉不變的要求。由于周圍的像素點圍繞中心像素點進行旋轉的過程中,LBP值會隨之發(fā)生變化,通過旋轉周圍像素點,取得一系列的LBP值,取最小的值作為LBP值,公式如下:
隨著領域點的個數(shù)增加,LBP值將會產(chǎn)生爆炸性的增長,這對數(shù)據(jù)的存取不利,會增加識別的時間,由于在實際圖像中,LBP最多會發(fā)生兩次0到1或1到0的跳變,通過對LBP的模式種類進行降維,檢驗是否等價的公式定義如下:
通過等價模式的改進,二進制種類將會減少并且不會丟失信息,達到了低時間復雜度和低空間復雜度的要求,有效地減少了識別時間。
圖4:圖像相似度和距離
將被測試的圖像歸入被訓練的圖像所在的類,其中該測試的圖像與被訓練的圖像之間的歐式距離是最小的,該分類器是局部二值模式的分類器。
雖然LBP算法對光照、移動和遮擋的敏感度較低,在人臉較少的前提下識別時間比較短。但是當人臉的數(shù)目變多時,計算多幅測試圖像和訓練圖像的LBP值的歐式距離將耗費大量的時間成本。其次,LBP算法識別人臉對面部表情變化的魯棒性較低,盡管LBP旋轉不變模式可以有效地在人臉移動的過程中比較準確地識別出人臉,但是選轉不變模式局限于人臉輪廓地移動,而當人臉的表情發(fā)生變化的時候,像素也會從一塊區(qū)域移動到鄰近的區(qū)域,導致識別效率的大大降低。通過圖片的中值濾波處理和重定位,可以有效減少以上缺點對識別準確度的影響。
表1
表2
(5)分別降維到不同的維數(shù)下得到識別的準確率,做出歸納分析,實驗結果如表1所示。
由表2可知,經(jīng)預處理之后的圖片經(jīng)LBP算法識別準確率有很大的提高。
經(jīng)過LBP化處理的圖像的維數(shù)是86*56,雖然相比原始圖像,LBP化處理后的圖像的維數(shù)減少了,但是圖像的處理還是較為困難。此外,由于人的面部是非線性的,像素值之間也存在互相影響。所以利用主成分分析法(PCA)將多個圖像特征向量降維成為互不干擾的向量。
PCA算法的原理簡述如下,圖像一共有86*56個像素,利用2*86*56的矩陣A進行表示。將訓練圖像進行歸一化,這里用圖像矩陣的每一行減去對應的均值。求出特訓練圖像的協(xié)方差矩陣和特征值:
本文通過對圖片進行預處理后利用LBP特征算法識別圖像,有效提高識別的準確度,彌補了LBP算法在噪聲和人臉移動方面的不足。
將圖像矩陣進行降維處理,取得最大的特征值對應的特征向量。
為保證實驗結果的真實性,實驗所用的人臉庫來自現(xiàn)場采集,總共包括40個人,每個人有20張不同表情、遮擋和光照的圖片,原始圖片的大小為565*256像素,經(jīng)過預處理和特征值提取后的圖像大小為86*56像素。識別分為以下六個步驟:
(1)采集人臉圖像。
(2)人臉圖像預處理。
(3)進行圖片的特征值提取。
(4)對經(jīng)過提取的圖像進行降維處理。