蔣琦,周剛
(四川大學(xué)錦江學(xué)院計(jì)算機(jī)學(xué)院,眉山 620860)
圖像識(shí)別與檢測(cè)是計(jì)算機(jī)視覺的重點(diǎn)研究領(lǐng)域,相關(guān)濾波器算法因其簡(jiǎn)單的實(shí)現(xiàn)方法和較優(yōu)秀的實(shí)現(xiàn)效果成為該領(lǐng)域的研究熱點(diǎn)[1]。相關(guān)濾波器是利用圖像中目標(biāo)之間的相關(guān)性進(jìn)行判別,其中相關(guān)性指的是圖像信號(hào)的相似性,相關(guān)濾波器利用一定數(shù)量的訓(xùn)練數(shù)據(jù)的相關(guān)性得到濾波模板,然后通過濾波模板判斷其他圖像中目標(biāo)與模板的相似程度[2]。因此,相關(guān)濾波器最重要的研究?jī)?nèi)容就是如何得到濾波模板。眾多研究人員提出了大量算法,并取得了不錯(cuò)的實(shí)驗(yàn)效果。文獻(xiàn)[3]提出了無約束最優(yōu)權(quán)衡綜合判別函數(shù)濾波器(unconstrained optimal trade-off synthetic discrimi?nant function,UOTSDF),通過平衡參數(shù)優(yōu)化一個(gè)判別函數(shù)來得到濾波器。文獻(xiàn)[4]提出了最優(yōu)權(quán)衡綜合判別函數(shù)濾波器(optimal trade-off synthetic discriminant function,OTSDF),這種濾波器在思想上與UOTSDF是一致的,不同之處在于有無約束條件。文獻(xiàn)[5]提出了平均合成精確濾波器(av?erage synthetic exact filter,ASEF),先求出單張圖像的弱濾波器,再集合多個(gè)弱濾波器求均值得到一個(gè)強(qiáng)濾波器;文獻(xiàn)[6]提出了最小輸出誤差平方和濾波器(minimum output sum of squared error,MOSSE),通過高斯函數(shù)產(chǎn)生峰值,最小化實(shí)際相關(guān)輸出與期望輸出誤差的平方和而得到濾波器。文獻(xiàn)[7]改變思路,將支持向量機(jī)[8](support vector machine,SVM)的思想引入相關(guān)濾波器,在最大化響應(yīng)峰值的同時(shí)最大化分類間隔,提出了最大間隔相關(guān)濾波器(maximum margin correlation filter,MMCF)。MMCF利用了SVM優(yōu)秀的分類泛化性能,兼顧大間隔原理和最小化樣本均方誤差,使這種相關(guān)濾波器相比傳統(tǒng)的相關(guān)濾波器在性能上獲得了較大提升。
但是,MMCF在結(jié)合SVM的同時(shí),并未考慮到SVM存在的問題。SVM在建立分類超平面時(shí)只利用了邊界上的樣本點(diǎn),忽略了樣本的整體結(jié)構(gòu)信息以及樣本之間的結(jié)構(gòu)聯(lián)系,因此所得的超平面并不一定符合樣本實(shí)際結(jié)構(gòu)信息,而MMCF也繼承了這個(gè)缺點(diǎn)。為了解決上述問題,本文提出兩種方法進(jìn)行改進(jìn),兩種算法都是充分利用樣本數(shù)據(jù)的結(jié)構(gòu)信息,提高所得訓(xùn)練模板的識(shí)別和檢測(cè)效果。
本節(jié)首先簡(jiǎn)要介紹SVM,再對(duì)相關(guān)濾波器和MMCF進(jìn)行簡(jiǎn)要闡述。
SVM是一種經(jīng)典的分類算法,在當(dāng)今計(jì)算機(jī)視覺領(lǐng)域仍然發(fā)揮著重要的作用[9]。SVM提取訓(xùn)練樣本的特征,在樣本特征空間尋找樣本點(diǎn)的最大間隔,通過建立分類超平面盡量分隔不同類別的樣本,以達(dá)到分類的目的。在實(shí)際訓(xùn)練中,SVM的求解其實(shí)是使該超平面與任一樣本之間的最小L-2范數(shù)距離最大化。設(shè)有一數(shù)據(jù)集為U=則SVM的定義如下:
其中,w是分類超平面法向量,b為偏置量,ξ為松弛變量,T表示轉(zhuǎn)置,C為懲罰系數(shù),y i為樣本標(biāo)簽,x i是輸入數(shù)據(jù)x i的向量形式。SVM在眾多的分類應(yīng)用中取得了不錯(cuò)的效果,但仍然存在一些問題,并沒有考慮樣本的結(jié)構(gòu)信息和內(nèi)在聯(lián)系。
相關(guān)濾波器利用模板與目標(biāo)的相關(guān)性進(jìn)行判別,其主要研究問題為求解出濾波模板w。傳統(tǒng)的相關(guān)濾波器可以被看作為優(yōu)化輸入圖像的理想期望相關(guān)輸出與訓(xùn)練圖像和模板的相關(guān)輸出之間的歐式距離[10]。相關(guān)濾波器定義為:
其中,?為互相關(guān)運(yùn)算,g i為期望相關(guān)輸出,不同的相關(guān)濾波器算法所構(gòu)建的g i并不相同。
大多數(shù)相關(guān)濾波器的改進(jìn)思路都集中于g i的構(gòu)建上,但改進(jìn)效果都有一定局限性。文獻(xiàn)[7]將SVM的思想引入相關(guān)濾波器,提出了MMCF,進(jìn)一步提升了相關(guān)濾波器的鑒別能力。MMCF的定義為:
其中,w既是分類超平面法向量,也是濾波模板,λ為平衡系數(shù),用于平衡支持向量部分和相關(guān)濾波部分的權(quán)重,c是一個(gè)與樣本有關(guān)的常量。MMCF利用SVM和相關(guān)濾波各自的優(yōu)點(diǎn),提升了相關(guān)濾波器的實(shí)驗(yàn)效果。但同時(shí)也繼承了SVM的缺點(diǎn),樣本的訓(xùn)練并不充分。
為了解決MMCF所存在的未利用樣本整體分布信息和樣本內(nèi)部聯(lián)系的問題,本文提出了兩種方法,分別是基于最小類內(nèi)方差和最小類局部保持方差的相關(guān)濾波器。
SVM在建立分類超平面時(shí)未考慮樣本整體信息,致使MMCF在訓(xùn)練時(shí)同樣存在這個(gè)問題。針對(duì)SVM這一問題,文獻(xiàn)[11]提出了將Fisher線性判別的思想與SVM結(jié)合起來,提出了最小類內(nèi)方差支持向量機(jī)(minimum class variance support vec?tor machine,MCVSVM)。設(shè)有一數(shù)據(jù)集為U={x i||i=1,…N}?Rd×N,且分別屬于兩類{A+,A-},則MCVSVM的定義如下:
其中,S w為類內(nèi)散度矩陣,其定義為:
其中,m A是A類樣本的均值。類內(nèi)散度矩陣用于描述異類樣本的整體分布情況。因此,在加入S w之后,SVM所計(jì)算的最大距離由歐式距離變更為馬氏距離。
受MCVSVM的啟發(fā),為了解決MMCF存在的問題,也可將類內(nèi)散度矩陣引入MMCF,提出了最小類內(nèi)方差相關(guān)濾波器(minimum class variance correlation filter,MCVCF),其定義如下:
其中,MCVCF將類內(nèi)散度矩陣加入到模型中,在訓(xùn)練時(shí)充分利用每一類樣本的整體分布信息,能得到更加魯棒的濾波器。
但模型(6)并不能夠直接進(jìn)行應(yīng)用,還需要進(jìn)行求解。且根據(jù)相關(guān)卷積定理[12],相關(guān)濾波器的相關(guān)運(yùn)算需通過傅里葉變換轉(zhuǎn)換到頻域中變換為相乘運(yùn)算,能極大提高運(yùn)算速度。因此,需先將模型(6)轉(zhuǎn)換到頻域中,再利用wolf對(duì)偶問題進(jìn)行求解。
將模型轉(zhuǎn)換到頻域,由于MCVCF由兩部分構(gòu)成,所以轉(zhuǎn)換過程可以分為兩個(gè)部分。首先對(duì)模型中的支持向量部分進(jìn)行傅里葉變換,內(nèi)積在變換過程中只是按1d的比例進(jìn)行了縮放,d是樣本數(shù)據(jù)的維度則該部分變換之后如下:
其 中,?是 頻 域 中 的w,b'=b×d,?=是頻域中A類的均值,?是頻域中的x,?表示共軛轉(zhuǎn)置。
相關(guān)濾波部分的轉(zhuǎn)換如下:
其中,是對(duì)角線元素為所有元素的對(duì)角矩陣,分別是x i、g i經(jīng)過傅里葉變換轉(zhuǎn)換到頻域的數(shù)據(jù)。另外忽略掉1d,因?yàn)樗且粋€(gè)常數(shù),對(duì)最終效果沒有影響。?可改寫為:
其中,1=[ 1…1]T,將式(9)代入式(8):
完成對(duì)兩個(gè)部分的傅里葉變換,合并成MCVCF的頻域形式:
可通過Lagrange對(duì)偶問題對(duì)式(11)進(jìn)行求解,首先構(gòu)造式(11)的Lagrange函數(shù):
其中,αi、βi是Lagrange乘子,再對(duì)式(12)求偏導(dǎo):
將式(13)的結(jié)果代入式(12),可得MCVCF的對(duì)偶問題:
其中,α=[α1,…,αN]T。得到式(14)后,使用SMO算法進(jìn)行求解,通過該算法求得Lagrange乘子向量α*,則可利用下式求解MCVCF在頻域中的濾波器向量?:
其中,Y是對(duì)角線元素為y i的對(duì)角矩陣。?是頻域中的濾波器向量,在實(shí)際應(yīng)用中,還需要將其通過傅里葉逆變換轉(zhuǎn)換到空間域,并根據(jù)樣本數(shù)據(jù)大小轉(zhuǎn)換為相同尺寸的濾波模板矩陣W*,便可利用W*與待測(cè)試圖像進(jìn)行互相關(guān)運(yùn)算以求出相關(guān)性。
在結(jié)合SVM的同時(shí),MMCF同樣未考慮到樣本內(nèi)部的結(jié)構(gòu)信息。針對(duì)SVM這一事實(shí),文獻(xiàn)[13]利用局部保持投影[14]的思想,提出了最小類局部保持方差支持向量機(jī)(minimum class locality preserving variance support vector machine,MCLPVSVM)。設(shè)有一數(shù)據(jù)集為U={x i|i=1,…,N}?Rd×N,則MCLPVSVM的 定 義如下:
其中,Z w是局部保持散度矩陣,用于描述數(shù)據(jù)內(nèi)部的結(jié)構(gòu)信息。設(shè)有K=1,2兩類樣本數(shù)據(jù),則Z w的定義如下:
其中,Z K是第K類數(shù)據(jù)的局部保持散度矩陣,其具體構(gòu)造如下:
其中,X K是第K類數(shù)據(jù)的矩陣形式,D K是一個(gè)對(duì)角矩陣,其元素的定義是是W K矩陣的元素,W K是鄰接圖權(quán)重矩陣,設(shè)x Ki、x K j是第K類樣本的數(shù)據(jù)點(diǎn),G是數(shù)據(jù)集U的鄰接圖,G用于表示數(shù)據(jù)局部流型結(jié)構(gòu),L=D-W是G的拉普拉斯矩陣。G共有N個(gè)節(jié)點(diǎn)(即數(shù)據(jù)點(diǎn)),如果節(jié)點(diǎn)i在節(jié)點(diǎn)j的k個(gè)最近鄰居中,則x Ki∈N K(x Kj),以高斯核的形式構(gòu)造權(quán)重矩陣W K,其元素的構(gòu)造形式如下:
其中,t是高斯核函數(shù)參數(shù)。
MCLPVSVM較好地解決了SVM未考慮樣本內(nèi)部結(jié)構(gòu)的問題,因此,可將局部保持散度矩陣引入MMCF,提出最小類局部保持方差相關(guān)濾波器(minimum class locality preserving variance correla?tion filter,MCLPVCF),其定義如下:
其中,Z w是局部保留散度矩陣,其定義與式(17)、(18)、(19)相同。
MCLPVCF的求解與MCVCF的求解過程基本一致,最終求解出的MCLPVCF的頻域?yàn)V波器向量是:
在實(shí)際應(yīng)用中,仍需要將轉(zhuǎn)換到空間域中,得到空間域?yàn)V波器W*。
為了驗(yàn)證所提算法的有效性和參數(shù)對(duì)模型的影響,本節(jié)將進(jìn)行仿真實(shí)驗(yàn),并在相同實(shí)驗(yàn)條件下與MOSSE、OTSDF、MMCF、最大間隔矢量相關(guān) 濾 波 器[15](maximum margin vector correlation fil?ter,MMVCF)、零混疊大間隔相關(guān)濾波器[16](zero-aliasing maximum margin correlation filter,ZAMMCF)進(jìn)行對(duì)比。所有實(shí)驗(yàn)都是基于Intel i5處理器、16 GB內(nèi)存、MATLAB R2020a的應(yīng)用環(huán)境。
為了討論參數(shù)對(duì)所提算法的影響,首先將進(jìn)行手寫數(shù)字識(shí)別的實(shí)驗(yàn)。本實(shí)驗(yàn)采用的是MINIST標(biāo)準(zhǔn)手寫體數(shù)字?jǐn)?shù)據(jù)集,這個(gè)數(shù)據(jù)集包含70000張手寫體數(shù)字。為了便于參數(shù)討論,從中隨機(jī)挑選1000張圖像進(jìn)行實(shí)驗(yàn),其中800張作訓(xùn)練集,200張作測(cè)試集。
MCVCF的參數(shù)主要有λ和C,表1給出了在不同的參數(shù)設(shè)置下MCVCF的識(shí)別率。從表1數(shù)據(jù)可以看出,λ和C的設(shè)置對(duì)識(shí)別率有一定的影響,總體來看,在λ=0.5和C=0.1左右識(shí)別率相對(duì)較高,在λ=0.7和C=1時(shí)識(shí)別率最高。
表1 不同參數(shù)下MCVCF的識(shí)別率(%)
MCLPVCF有k、λ、t和C四個(gè)參數(shù),參數(shù)討論相較復(fù)雜,C對(duì)實(shí)驗(yàn)結(jié)果的影響與MCVCF類似,因此本文只討論k、λ、t對(duì)MCLPVCF的影響。圖1給出了參數(shù)k、λ、t不同組合下的手寫數(shù)字識(shí)別的識(shí)別率。其中(a)是固定參數(shù)C=1、λ=0.6時(shí)的識(shí)別率,(b)是固定參數(shù)t=1、C=1時(shí)的識(shí)別率,(c)是固定參數(shù)k=30、C=1時(shí)的識(shí)別率??梢钥闯?,三個(gè)參數(shù)對(duì)MCLPVCF的實(shí)驗(yàn)結(jié)果有一定的影響,三個(gè)參數(shù)的共同點(diǎn)在于在數(shù)值偏小時(shí)識(shí)別率都較低,在增大到一定程度時(shí)識(shí)別率會(huì)趨于平穩(wěn)。
圖1 參數(shù)k、λ、t對(duì)MCLPVCF識(shí)別率的影響
為了進(jìn)一步驗(yàn)證所提算法的有效性,本部分將進(jìn)行人眼檢測(cè)實(shí)驗(yàn),并與其他相關(guān)濾波器算法作對(duì)比。此實(shí)驗(yàn)采用的是Yale人臉數(shù)據(jù)集,此數(shù)據(jù)集包含15類的165張人臉圖像。從中選擇一部分人工標(biāo)注剪切人眼作訓(xùn)練集,再?gòu)牧硪徊糠蛛S機(jī)選擇15張圖像作測(cè)試集。本實(shí)驗(yàn)MCVCF固定參數(shù)λ=0.6、C=1,MCLPVCF固定參數(shù)λ=0.6、C=1、k=5、t=1.5,MMCF、MMVCF和ZAMMCF固定參數(shù)λ=0.6、C=1,OTSDF固定參數(shù)λ=0.6。本實(shí)驗(yàn)的評(píng)價(jià)指標(biāo)是檢測(cè)準(zhǔn)確率,所有算法所檢測(cè)出的人眼標(biāo)注框與真實(shí)人眼標(biāo)注框重合率大于0.3時(shí)認(rèn)為檢測(cè)到了人眼,以檢測(cè)到的目標(biāo)數(shù)與總體圖像數(shù)的比值作為檢測(cè)準(zhǔn)確率。
如圖2是MCVCF和MCLPVCF的實(shí)驗(yàn)效果圖,其中黑色虛線框?yàn)镸CVCF標(biāo)注的人眼位置,紅色實(shí)線框?yàn)镸CLPVCF標(biāo)注的人眼位置。
圖2 MCVCF、MCLPVCF人眼檢測(cè)效果
表2給出了所提算法與其他相關(guān)濾波器算法的實(shí)驗(yàn)結(jié)果。能夠看出,MCVCF和MCLPVCF的檢測(cè)準(zhǔn)確率相較所比較的大部分相關(guān)濾波器算法有所提升。
表2 不同濾波器的檢測(cè)準(zhǔn)確率(%)
相關(guān)濾波器的另一個(gè)重要應(yīng)用領(lǐng)域就是目標(biāo)識(shí)別,因此本部分將進(jìn)行一個(gè)物體識(shí)別和一個(gè)人臉識(shí)別實(shí)驗(yàn)。具體實(shí)驗(yàn)方法為:采用一對(duì)多的策略,選擇其中一類圖像為正類,其他類為負(fù)類,經(jīng)過多次實(shí)驗(yàn)求得平均識(shí)別率和標(biāo)準(zhǔn)差。
物體識(shí)別實(shí)驗(yàn)采用的是COIL100物體數(shù)據(jù)集,這個(gè)數(shù)據(jù)集包含100類的7000張彩色圖像,所有圖像中的物體都進(jìn)行了校準(zhǔn)處理,并呈現(xiàn)出不同的角度。為了實(shí)驗(yàn)的方便,將數(shù)據(jù)集中所有的圖像縮小為60×60大小,隨機(jī)選擇每類的[20,25,30,35,40,45]張圖像作訓(xùn)練集,其他圖像作測(cè)試集,重復(fù)測(cè)試40次求得平均識(shí)別率。本實(shí)驗(yàn)中,MCVCF固定參數(shù)λ=0.6、C=1,MCLPVCF固定參數(shù)λ=0.6、C=1、t=0.5,在訓(xùn)練集圖像數(shù)目為20、30、35時(shí)k=3,其 余 情 況k=2,MMCF、MMVCF和ZAMMCF固定參數(shù)λ=0.6、C=1,OTSDF固定參數(shù)λ=0.6。
COIL100的實(shí)驗(yàn)結(jié)果如表3所示,所提兩種算法的平均識(shí)別率相比其他算法都要更高,尤其相比MMCF,MCVCF能提高0.9%~1.4%,而MCLPVCF則能提高1.5%~5.6%。
表3 不同濾波器在COIL100數(shù)據(jù)集上的平均識(shí)別率及標(biāo)準(zhǔn)差(%)
人臉識(shí)別實(shí)驗(yàn)采用的是AR人臉數(shù)據(jù)集,這個(gè)數(shù)據(jù)集包含120個(gè)人的3120張圖像。隨機(jī)選擇每類的[5,10,15,17,20]張圖像作訓(xùn)練集,其他圖像作測(cè)試集,充分測(cè)試40次求得平均識(shí)別率。MCVCF固定參數(shù)λ=0.6、C=1,MCLPVCF固定參數(shù)λ=0.6、C=1,訓(xùn)練集圖像個(gè)數(shù)為5時(shí)固定參數(shù)k=2,t=0.5,為10、15、17時(shí)k=3,t=1.5,為20時(shí)k=4,t=1,MMCF、MMVCF和ZAMMCF固定參數(shù)λ=0.6、C=1,OTSDF固定參數(shù)λ=0.6。
AR數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果如表4所示,可以看出,大部分情況下,所提兩種算法都取得了最優(yōu)和次優(yōu)的平均識(shí)別率,在訓(xùn)練集圖像數(shù)目增多的情況下,這種優(yōu)勢(shì)則更加明顯。
表4 不同濾波器在AR數(shù)據(jù)集上的平均識(shí)別率及標(biāo)準(zhǔn)差(%)
從上述所有實(shí)驗(yàn)可以看出,無論是目標(biāo)檢測(cè)還是目標(biāo)識(shí)別實(shí)驗(yàn),MCVCF和MCLPVCF所取得的實(shí)驗(yàn)結(jié)果都比其他濾波器尤其是MMCF要更優(yōu)秀,這說明在增加了對(duì)樣本總體結(jié)構(gòu)和內(nèi)部結(jié)構(gòu)信息的利用后,濾波器的構(gòu)建和訓(xùn)練得到了優(yōu)化,具體應(yīng)用效果得到了提升。
本文提出了兩種基于數(shù)據(jù)分布信息的相關(guān)濾波器算法,所提算法可用于解決傳統(tǒng)相關(guān)濾波器尤其是MMCF樣本訓(xùn)練不充分的問題。本文在詳細(xì)推導(dǎo)了算法模型和求解過程之后,進(jìn)行了參數(shù)影響實(shí)驗(yàn)、人眼檢測(cè)實(shí)驗(yàn)、物體和人臉識(shí)別實(shí)驗(yàn),從實(shí)驗(yàn)結(jié)果可以看出,所提算法的檢測(cè)準(zhǔn)確率和平均識(shí)別率均取得了最優(yōu),證明了所提兩種算法增加樣本結(jié)構(gòu)信息進(jìn)行訓(xùn)練的有效性。