林 琳
(廈門海洋職業(yè)技術(shù)學院,福建 廈門 361000)
?
智能機器人視覺中的人臉識別研究
林 琳
(廈門海洋職業(yè)技術(shù)學院,福建 廈門 361000)
通過對智能機器人視覺中的人臉識別過程進行研究,提出了采用MB-LBP紋理特征結(jié)合徑向基函數(shù)作為核函數(shù)的SVM進行人臉識別,并在常見的Yale和ORL數(shù)據(jù)集上進行了多項對比實驗,實驗結(jié)果表明,算法能夠很好的完成智能機器人視覺的人臉識別。對于光照變化較大的人臉圖像,對于人類識別正確率有較大的提升,另外,通過減少迭代次數(shù)減少了人臉識別的時間復雜度。該算法對智能機器人視覺中應用人臉識別過程具有較強意義。
智能機器人; 機器視覺;MB-LBP特征;支持向量機;徑向基函數(shù)
機器人指的是一個由多自由度、多變量組成的復雜動力學系統(tǒng),機器人系統(tǒng)的發(fā)展離不開計算能力的顯著提高。隨著人們對機器人的不斷改造和發(fā)展,智能機器人的視覺控制也是一個比較重要的方向[1],在智能機器人進行常規(guī)仿人類活動中,人們希望機器人也擁有像人類一樣的視覺能力。再仿人類視覺的功能研究中,最常見的是人臉識別的能力,如果冰冷的機器人也具有較強的人臉識別能力,這將為機器人增加很多擴展的能力。
人臉識別(Face Recognition)[2]是目前生物與計算機智能學科的熱門交叉學科[3],對于機器人來說,人臉識別的計算速度是瓶頸,目前較為常見的人臉識別的分類器的效率較低,同時識別效果也不理想,這將制約機器人的視覺發(fā)展。
人臉識別屬于模式識別的一種,通常具有兩個階段,即特征提取和特征分類。人臉圖像處理的紋理特征中,較為常用的特征包括LBP紋理特征[4],Gabor紋理特征[5]等。提取完圖像的特征之后,利用人臉圖像的特征代替原始圖像,然后通過機器學習的分類算法進行分類,將不同的人臉分別分類到對應的類別中,完成人臉識別。常見的分類方法包括支持向量機(SVM)[6],人工神經(jīng)網(wǎng)絡(NN)[7],邏輯斯蒂回歸(LR)[8]等等,不同的機器學習方法都在各自的領域中取得了不錯的效果。
LBP局部二值模式是一種局部的紋理特征描述子,該描述子通過計算每個像素點與周圍相鄰像素點之間的關系為每個像素點生成一個描述子,該描述子可以表現(xiàn)出該像素點周圍的局部紋理特征。最簡單的LBP算子是通過計算周圍8個鄰域之間的差值,然后將差值二值化獲得局部LBP算子。在此基礎上,人們提出了MB-LBP即多塊化局部二值模式紋理[9],該紋理的計算方式不僅僅針對單個像素點了,而是針對每一塊區(qū)域進行二值模式的演化,通過像素塊的平均值代替原始像素塊,具有較強抗干擾能力。
圖1 MB-LBP紋理特征示意圖
如圖1所示,每個塊的像素均值可以計算出,此處以9個像素點劃分為塊。然后通過傳統(tǒng)的LBP算法得到二值模式,比中間值86小的位置為0,大的位置為1,按照順時針可以得到二值模式(0,1,0,1,0,1,0,0)2=84,該位置的紋理特征均值為84。
采用MB-LBP特征進行人臉識別的分類研究,由于人臉圖像受到光照影響較強烈,不同強度的光照往往會造成局部紋理特征的變化,所以可利用MB-LBP紋理改善現(xiàn)有特征的不足,在最后的分類實驗中,采用光照變化強烈的Yale人臉庫進行識別,識別結(jié)果表明,MB-LBP紋理的抗光照干擾性較強,適合作為人臉識別的主要特征。
智能機器人視覺的人臉識別方法另一個重點是特征的分類和識別過程。本文采用最新的分類器——支持向量機,進行人臉MB-LBP特征的分類和識別。
3.1 支持向量機SVM
支持向量機(SVM)由感知機發(fā)展而來,傳統(tǒng)的感知機[10]通過求解線性分類面來將待分類的數(shù)據(jù)分離開來。根據(jù)數(shù)據(jù)分布的情況不同,這樣的線性分類面較多,而支持向量機需要尋找到一個最優(yōu)的分類面,使得待分類的數(shù)據(jù)能夠得到最大的“間隔”條件下的分離。
設訓練集{xi,yi,i=1,2,3…n}表示一個數(shù)據(jù)集,該數(shù)據(jù)集中的數(shù)據(jù)x是需要分類的樣本數(shù)據(jù),而y表示的則是每個數(shù)據(jù)對應的標簽,也就是實際上該數(shù)據(jù)需要分類到哪一類中。SVM需要找到一個最優(yōu)的分類面w*x+b=0,使得樣本數(shù)據(jù)集x能夠盡可能大的分離開來。如圖所示,我們需要將兩個類別的數(shù)據(jù)盡可能分離開,也就是圖2中所示的“最優(yōu)分類面”。
圖2 支持向量機與最優(yōu)分類面
通過分析最優(yōu)分類面w*x+b=0,其中w為權(quán)值,x為支持向量,b為加性偏置。求最優(yōu)化的分類面,也就是求關于w和b的二次規(guī)劃問題:
(1)
s.t.yi(ωgxi+b)≥ 1,i= 1,2,…,n
(2)
通過求解上述二次規(guī)劃的優(yōu)化問題,通過拉格朗日乘子法及KKT條件可以解出最優(yōu)化的權(quán)值w及b,然后得到該樣本分類的最優(yōu)化結(jié)果。
實際上,幾乎所有的實際問題都不能遇到圖2這樣的線性可分的數(shù)據(jù)集x,而線性不可分的數(shù)據(jù)集不能僅僅使用線性分類面將其區(qū)分,SVM在此基礎上,加入了松弛變量,允許部分樣本可以被錯分,在這樣的情況下就可以采用SVM的方法求解非線性可分的數(shù)據(jù)集了。另外,如圖3所示,這樣的數(shù)據(jù)集并不能夠通過松弛變量解決,因為如果依照線性分類平面進行分類,那么錯分的樣本較多,導致最后的分類器性能較差。這時候,SVM采用核函數(shù)的概念,通過核函數(shù)將原本線性不可分的數(shù)據(jù)集,變化到高維空間上,通過高維空間映射將原始數(shù)據(jù)變?yōu)楦呔S空間上線性可分的數(shù)據(jù)集,這樣就可以很好的使用線性分類面進行分類了。
圖3 非線性數(shù)據(jù)集通過核函數(shù)變化為高維線性可分數(shù)據(jù)集
其中,φx表示核函數(shù),通過核函數(shù)變化,可以將SVM的二次優(yōu)化問題轉(zhuǎn)化為:
(3)
s.t.yi(ωgφ(xi)+b)≥ 1-ξi
(4)
ξi≥0,i= 1,2,3,…,n
(5)
其中,ξi表示松弛因子,φx表示核函數(shù),C表示懲罰系數(shù)。同樣,可以采用拉格朗日乘子法及KKT條件得到二次規(guī)劃的最優(yōu)化解,然后表示出非線性SVM的分類面:
(6)
其中,K(xi,xj)表示為核函數(shù),通過核函數(shù)思想,可以很容易的采用多個帶有核函數(shù)的SVM完成人臉識別的分類任務。
3.2 人臉識別中SVM的核函數(shù)選擇
到目前為止,并沒有理論研究表明,怎樣的核函數(shù)適合怎樣的分類數(shù)據(jù)。一般情況下,常見的做法采用暴力嘗試的方式,選擇不同的核函數(shù)測試自己的數(shù)據(jù)集,然后從中選出最好的核函數(shù)做SVM的分類工作。
常見的核函數(shù)包括以下4種核函數(shù):
(1)線性核函數(shù):
(7)
(2)多項式核函數(shù):
(8)
(3)徑向基函數(shù):
(9)
(4)sigmoid激勵函數(shù):
(10)
由于核函數(shù)分為局部性較強的核函數(shù),如多項式核函數(shù),以及全局性較強的核函數(shù),如徑向基函數(shù)。由于人臉識別過程中,既需要局部性較強的核函數(shù)去區(qū)分出單個人類的不同光照之間的局部情況,又需要完成全局所有人臉的識別分類工作。而式(9)表示的徑向基函數(shù)是采用高斯核的運算,將當前特征維度通過高斯核轉(zhuǎn)化到無窮維度,然后通過分類器對無窮維度的數(shù)據(jù)進行分類。由于人臉識別最大的障礙在于光照的影響,光照影響通常在特征的某個維度影響較大,而其他維度的影響卻微乎其微,采用徑向基函數(shù)將特征數(shù)據(jù)轉(zhuǎn)化到無窮維度上去,可以有效的減少光照的影響,所以本文采用徑向基函數(shù)(RBF)進行智能機器人視覺人臉識別過程中的分類核函數(shù),從后續(xù)的實驗結(jié)果可以看出,徑向基函數(shù)RBF能夠很好地完成人臉識別的過程。
人臉識別是一項較為復雜的非線性分類問題,首先需要較為合理的人臉特征代替原有圖像,用低維的特征代替高維的原始圖像達到了降維的目的,可以降低SVM識別過程中的時間復雜度。本文采用MB-LBP紋理特征,通過使用徑向基函數(shù)RBF的SVM進行人臉圖像的分類工作,完成智能機器人的人臉識別的功能。人臉識別流程如圖4所示。
圖4 人臉識別流程
5.1 數(shù)據(jù)集選擇
本文通過分別在ORL數(shù)據(jù)集和Yale數(shù)據(jù)集上進行人臉識別實驗。ORL數(shù)據(jù)集是劍橋大學維護的人臉數(shù)據(jù)集,該數(shù)據(jù)集包括40個人,每個人的10張人臉圖像的光照強度幾乎不變,只是人臉的拍攝角度發(fā)生了一定變化。與此相反,Yale大學維護的人臉數(shù)據(jù)集由48個人,每個人具有55張人臉圖像。該人臉圖像數(shù)據(jù)庫則是每張圖像光照發(fā)生了變化,而人臉拍攝角度幾乎不發(fā)生變化。如圖5可以看到,兩個數(shù)據(jù)庫部分人臉圖像的例子。
圖5 Yale數(shù)據(jù)集(左)與ORL數(shù)據(jù)集圖像(右)
ORL與Yale數(shù)據(jù)庫有各自的優(yōu)點,通過在這兩個數(shù)據(jù)庫上測試本文算法,具有較強的橫向比較意義。另外,本文算法還與傳統(tǒng)的LBP,一維MB-LBP紋理特征以及傳統(tǒng)采用徑向基函數(shù)的SVM縱向做了實驗比較。實驗環(huán)境在MatlabR2012a上進行。
為了橫向與縱向比較本文算法的實踐意義。首先,從ORL與Yale兩個數(shù)據(jù)庫中分別隨機挑選出30個人的數(shù)據(jù)集,每個人10個樣本圖像,將其中的7個人臉圖像作為訓練數(shù)據(jù)集,另外3個圖像作為測試數(shù)據(jù)集。所有樣本都歸一化到32*32的大小。
特征提?。横槍蓚€數(shù)據(jù)庫中的300個樣本,分別提取每個樣本的LBP和MB-LBP紋理特征用于橫向比較紋理特征對人臉識別結(jié)果的影響。其中MB級特征采取的塊大小為3*3,計算每3*3個塊大小的平均值作為計算LBP的周圍像素值。
SVM分類:分別采用多項式核函數(shù)、sigmoid激勵核函數(shù)和RBF徑向基函數(shù)作為核函數(shù)的SVM進行人臉識別,這樣一來可以橫向比較核函數(shù)對人臉識別的影響。
5.2 實驗結(jié)果與分析
依照上述實驗預處理與參數(shù)選擇分別進行了12組實驗,在ORL與Yale數(shù)據(jù)庫上分別進行了6組相同的實驗。即分別采用LBP特征和MB-LBP特征以及三種SVM核函數(shù)進行人臉識別的研究,一共有6組橫向?qū)Ρ葘嶒?,分別在兩個數(shù)據(jù)集中對這6種組合的識別情況和識別時間進行了實驗,實驗結(jié)果由表1和表2給出:
表1 各種算法在ORL數(shù)據(jù)上的識別率與時間
表2 各種算法在Yale數(shù)據(jù)上的識別率與時間
由表1,2的結(jié)果可以看出,對于光照變化較為強烈的Yale數(shù)據(jù)庫,本文采用的MB-LBP結(jié)合徑向基函數(shù)作為核函數(shù)的SVM能夠顯著提高識別率。而對于人類方向變化較多的ORL數(shù)據(jù)庫,本文采用的算法策略對識別率提升更弱一些。由于智能機器人的視覺范圍中采集到的人臉圖像較為復雜,但是最關鍵的還是光照對人臉圖像的影響對人臉識別率的影響,所以本文的研究對于光照變化強烈的人臉識別算法策略有較強的意義。另外,由于MB-LBP攜帶更少但是更有用的紋理特征信息,且徑向基函數(shù)將數(shù)據(jù)轉(zhuǎn)化到無窮維,從根本上減少了SVM收斂的迭代次數(shù),一定程度上減少了算法的時間復雜度。
智能機器人的視覺過程是一個非常有意義的研究方向,我們首要完成的任務是智能機器人的人臉檢測和人臉識別問題。本文采用MB-LBP紋理特征結(jié)合徑向基函數(shù)作為核函數(shù)的SVM算法策略進行人臉識別。對于人臉光照變化強烈的圖像可以提升不少識別率,且通過MB-LBP特征減少了迭代次數(shù),減少了算法的時間復雜度,對于智能機器人視覺的人臉識別具有重要意義。但是,本文算法對于人類方向變化的人臉圖像識別率提升不明顯,這一方向是今后的研究重點。
[1] 張宏基,葛媛媛.智能機器人視覺仿生技術(shù)研究綜述[J].價值工程,2013,(26).
[2] 汪淑賢,熊承義,高志榮,等.分塊最大相似性嵌入稀疏編碼的人臉識別[J].模式識別與人工智能,2014,(10).
[3] 單園園,王法勝,李緒成,等.改進AdaBoost與SVM快速人臉檢測[J].煙臺大學學報(自然科學與工程版),2015,(3).
[4] 李亮,舒寧,王凱,等.融合多特征的遙感影像變化檢測方法[J].測繪學報,2014,(9).
[5] 田天,陳剛.基于膚色和Gabor紋理的粒子濾波人臉跟蹤[J].計算機工程,2014,(7).
[6] 李武,胡冰,王明偉,等.基于主成分分析和支持向量機的太赫茲光譜冰片鑒別[J].光譜學與光譜分析,2014,(12).
[7] 李龍,魏靖,黎燦兵,等.基于人工神經(jīng)網(wǎng)絡的負荷模型預測[J].電工技術(shù)學報,2015,(8).
[8] 王立,張蓉,沙朝鋒,等.電子商務商品歸一化方法研究[J].計算機學報,2014,(2).
[9] 王小玉,張亞洲,陳德運,等.基于多塊局部二值模式特征和人眼定位的人臉檢測[J].儀器儀表學報,2014,(12).
[10] 楊戈,張威強,黃靜,等.一個感知機神經(jīng)網(wǎng)絡字符識別器的實現(xiàn)[J].電子技術(shù)應用,2015,(3).
[編校:張芙蓉]
Research of Face Recognition in the Vision of Intelligent Robot
LIN Lin
XiamenOceanVocationalCollege,XiamenFujian361012)
This article researches on the face recognition in intelligent robot's vision. It proposes using MB-LBP texture feature combined RBF kernel SVM for face recognition. Aim at validating the method, some compared experiments are done on Yale and ORL Face datasets. The results show that the method can be favorable for accomplishing the task of face recognition on intelligent robot. This method improves the accuracy of face recognition when the illumination of face changes a lot. Besides, it can reduce the time complexity by reducing the iterations of SVM. Above all, this method is of great significance in the procedure of face recognition in intelligent robot.
intelligent robot; computer vision; MB-LBP feature; SVM; RBF
2015-08-06
林琳(1976- ),女,黑龍江海倫人,講師,在讀博士研究生,研究方向為智能機器人、數(shù)控。
TP
A
1671-9654(2015)03-064-06