劉麗紅+曾志高+彭程+楊凡穩(wěn)+周丹+姚慧丹
摘要:針對(duì)線性判別分析只能提取線性特征而不能描述非線性特征的缺點(diǎn),本文采用將核函數(shù)和Fisher判別分析方法的可分性結(jié)合起來的核Fisher判別分析的方法對(duì)視頻中的運(yùn)動(dòng)目標(biāo)進(jìn)行自動(dòng)分類,運(yùn)動(dòng)目標(biāo)包含人、汽車和寵物三類。該方法取得了較好的分類效果,且在查全率、查準(zhǔn)率和F1?-Measure獲得了滿意的性能。
關(guān)鍵詞:線性判別分析;特征提取;核Fisher判別分析;運(yùn)動(dòng)目標(biāo)分類;視頻
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A
Classification??of??Moving??Targets??in??Video??Based??on??the??Kernel??Fisher??Discriminant??Analysis.
Liu?Li?hong1,??Zeng?Zhi?gao1*,?Pen?Cheng2,?Yang?Fangwen1,?Zhou?Dan1,?Yao?Huidan1
2.?School?Of?energy?Power?And?Mechanical?Engineering,?Beijing,?102206)
Abstract:?In?order?to?overcome?the?shortage?of?linear?discriminant?analysis?which?can?only?extract?linear?features?and?can?not?describe?nonlinear?characteristics,?the?Kernel?Fisher?Discriminant?Analysis?algorithm,?which?combines?the?kernel?learning?and?the?separation?of?linear?discriminant?analysis,?is?adopted?to?automatically?classify?the?moving?objects?in?video,?and?in?this?paper,?the?objects?include?three?categories:?people,?cars?and?pets.?The?method?has?obtained?satisfying?performance?both?in?this?system?and?in?the?recall,?precision?and?F1-score.
Keywords:?linear?discriminant?analysis;?feature?extraction,;kernel?Fisher?discriminant?analysis;moving?object?classification,;video
1?引言
隨著社會(huì)的發(fā)展人們安防意識(shí)的逐步增強(qiáng),大量的視頻監(jiān)控被安裝到小區(qū)門口、寫字樓、商場(chǎng)、交通路口、車站、機(jī)場(chǎng)等公共場(chǎng)所。監(jiān)控視頻得到的海量視頻數(shù)據(jù)靠人為的傳統(tǒng)處理方式已經(jīng)不能滿足當(dāng)前社會(huì)的安全需求[1]。
因此,視頻監(jiān)控的智能化給計(jì)算機(jī)視覺在公共安全領(lǐng)域的應(yīng)用提供了廣闊的前景[2]。視頻監(jiān)控是對(duì)場(chǎng)景中的異常事件或人的異常行為進(jìn)行監(jiān)控[3]。運(yùn)動(dòng)目標(biāo)檢測(cè)和分類識(shí)別一直是機(jī)器視覺研究應(yīng)用及智能視頻監(jiān)控中的關(guān)鍵技術(shù),一直是研究的熱點(diǎn)之一,許多的分類算法被提
出[4]。文獻(xiàn)[2]中的分類方法要對(duì)目標(biāo)的實(shí)際高度
和寬度等參數(shù)進(jìn)行統(tǒng)計(jì),工作量非常大且不能對(duì)空中的目標(biāo)進(jìn)行識(shí)別分類。文獻(xiàn)[5]基于形狀特征的運(yùn)動(dòng)目標(biāo)分類方法采用的形狀特征受到前景檢測(cè)的影響,不能使用不同環(huán)境下的視頻監(jiān)控應(yīng)用。周維[6]提出的方法對(duì)前景和背景的區(qū)分能力比較強(qiáng),但識(shí)別率不是很顯著。郭玲[7]采用顏色直方圖對(duì)目標(biāo)進(jìn)行識(shí)別,背景對(duì)其影響比較大,識(shí)別效果不是很好。針對(duì)之前的方法識(shí)別率不高和操作復(fù)雜的問題,本文采用核Fisher判別分析(Kernel?Fisher?Discrimination?Analysis,KFDA)算法[8,9]對(duì)視頻監(jiān)控圖像中的車子、人以及寵物三類目標(biāo)進(jìn)行分類,且取得了較好的分類效果。
2?視頻中運(yùn)動(dòng)目標(biāo)的特征提取
對(duì)于大多數(shù)的實(shí)際數(shù)據(jù)一般的非線性方法不能很好地描述圖像中一些復(fù)雜的非線性變化[10]。核Fisher判別分析既具有核技巧的非線性描述能力,又繼承了Fisher線性判別分析的優(yōu)點(diǎn)[10]。本文采用核Fisher判別分析來做視頻監(jiān)控中運(yùn)動(dòng)目標(biāo)的分類。
核方法比普通的非線性方法更具有優(yōu)勢(shì),它可以借助核函數(shù),避免“維數(shù)災(zāi)難”,減少計(jì)算量,且需要對(duì)輸入的空間進(jìn)行任何直接的非線性映射。下面我們來介紹下核函數(shù)。
2.1?核函數(shù)
核函數(shù)就是把輸入樣本采用非線性變換將其映射到一個(gè)合適的特征空間中,然后應(yīng)用統(tǒng)計(jì)學(xué)等方法去解決問題。
一般核函數(shù)都是使用Mencer核實(shí)現(xiàn),本文采取的是多項(xiàng)式核函數(shù):
2.2?核Fisher判別準(zhǔn)則
KFDA算法簡(jiǎn)單的說就是將核技巧應(yīng)用到
Fisher線性鑒別分析中。KFDA算法的基本思想:首先將原始訓(xùn)練樣本通過一個(gè)非線性映射函數(shù)映射到一個(gè)高維的特征空間中,再在高維特征空間中進(jìn)行Fisher線性鑒別分析,這樣就隱含的實(shí)現(xiàn)了原輸入空間的非線性判別。之后只需要在高維特征空間中進(jìn)行Fisher線性鑒別分析,這樣相對(duì)于原始空間來說進(jìn)行的就是非線性鑒別分析。
KFDA算法的核學(xué)習(xí)方法的技巧就是通過原始空間的內(nèi)積核函數(shù)在進(jìn)行所有的運(yùn)算,并沒有涉及到具體的非線性映射[9]。KFDA算法能夠?qū)D像的非線性特征提取出來,這些非線性特征更有利于分類。
2.3?核Fisher算法實(shí)現(xiàn)步驟
基于核Fisher分類要首先實(shí)現(xiàn)兩類分類,返回最接近待測(cè)樣品的類別,然后用返回的類別和新的類別做兩類分類,又能夠得到比較接近的類別,最后得出未知樣品的類別。
① 首先創(chuàng)建一個(gè)核PCA分量將輸入空間映射到KPDA特征空間中,在KPCA空間中計(jì)算出類間散布矩陣和類內(nèi)散布矩陣。
④ 利用最優(yōu)鑒別向量對(duì)映射到空間中的訓(xùn)練樣本和測(cè)試樣本進(jìn)行投影,對(duì)投影后的對(duì)數(shù)據(jù)通過最近鄰法進(jìn)行分類。
3?實(shí)驗(yàn)結(jié)果
為了驗(yàn)證本文算法的優(yōu)越性,所以在相同的條件下運(yùn)用KFDA算法、PCA算法和PCA結(jié)合LDA的算法同時(shí)對(duì)視頻靜態(tài)背景中的三類目標(biāo)(人、汽車和寵物)進(jìn)行分類,并且對(duì)分類器的性能進(jìn)行了比較和分析。
實(shí)驗(yàn)環(huán)境:MATLAB?R2012a,Intel(R)?Pentium(R)?CPUG2030?3.00GHz.訓(xùn)練集中每類
包含10張圖片,測(cè)試集每類包含174張照片。
3.1?分類結(jié)果圖
基于KFDA算法的部分分類結(jié)果圖如下:
圖1?基于KFDA算法的部分分類效果圖
3.2?分類器性能評(píng)價(jià)標(biāo)準(zhǔn)
3.3?分類器性能分析
對(duì)PCA算法、PCA+LDA(PLA)算法和KFDA算法的分類結(jié)果進(jìn)行比較和分析。下面的表格是對(duì)實(shí)驗(yàn)結(jié)果的記錄和分析。
由表(1)可以計(jì)算出基于各個(gè)算法分類的查準(zhǔn)率P,查全率R,F(xiàn)-Measure?F,以及總的分類準(zhǔn)確率M,數(shù)據(jù)如下表:
表(2)查準(zhǔn)率P,查全率R,F(xiàn)1-score以及
總的分類準(zhǔn)確率的比較
為了更為直觀的表示數(shù)據(jù),我們采用圖表的方式對(duì)表(2)進(jìn)行描述,如下圖所示:
(A)?查準(zhǔn)率P????????(B)查全率R
(C)F1-Measure????(D)總的分類正確率
圖2?(A),(B),(C),(D)分別代表查準(zhǔn)率,
查全率,F(xiàn)1-Measureh和總的分類正確率;
從圖(D)中看出本文采取的KFDA算法在總的分類正確率是最高的,從單一的結(jié)果來看分類器的性能是不全面的,應(yīng)該從各個(gè)分類器對(duì)各個(gè)類別的分類性能去研究和分析。查準(zhǔn)率標(biāo)準(zhǔn)下的各個(gè)算法的分類性能比較:基于PCA算法和PCA+LDA算法的分類對(duì)人的分類性能比對(duì)車子和寵物的要稍高些,本文采取的基于KFDA算法則對(duì)各個(gè)類別的分類性能都不錯(cuò),且各個(gè)種類的性能均優(yōu)于前兩種算法。查全率標(biāo)準(zhǔn)下各個(gè)算法的分類性能比較:基于PCA算法的分類對(duì)車子的分類性能是最佳的,基于PCA+LDA算法的分類對(duì)寵物的分類最好,本文采取的KFDA算法對(duì)所有的類別的分類性能都比其他兩種算法要好?;赑CA算法和基于PCA+LDA算法對(duì)人的查準(zhǔn)率雖然最高,但是其查全率比較低,所以得到的F-Score則不是最高的。從(C)中我們可以看出PCA+LDA算法對(duì)車子的分類性能最好,對(duì)人的其次,最差的就是對(duì)寵物的分類。從綜合的F-Measure可以看出基于PCA+LDA算法的分類性能總體都要比基于PCA算法的分類性能要好,基于KFDA算法的分類性能則比基于PCA+LDA算法的性能高。
4?總?結(jié)
本文采用基于核的Fisher判別方法對(duì)監(jiān)控視頻中的運(yùn)動(dòng)目標(biāo)進(jìn)行分類,并與基于PCA和
PCA結(jié)合LDA的算法進(jìn)行了比較分析。結(jié)果表明
本文算法取得了很好的分類效果,并且各方面
性能指數(shù)要優(yōu)于其他兩種算法。但是仍然有兩
點(diǎn)問題,在分類的過程中我們會(huì)把受到的外部環(huán)境的影響和物體的角度等造成的非線性特征抽取出來了,且KFDA算法一樣的要面對(duì)小樣本問題。如何降低這些問題的影響是我們要進(jìn)一步研究的內(nèi)容。本文做的是靜態(tài)的目標(biāo)檢測(cè),下一步要研究的是將該算法應(yīng)用到動(dòng)態(tài)場(chǎng)景中。
參考文獻(xiàn):
[1] ?李占闖.?監(jiān)控視頻中的運(yùn)動(dòng)目標(biāo)分類算法研究[D].?西南大學(xué).?2010年.
[2] ?陳大海.?智能視頻監(jiān)控系統(tǒng)中目標(biāo)分類技術(shù)研究與應(yīng)用[D].廣西大學(xué).?2011年.
[3] ?張建軍,黃山,張洪斌,楊權(quán),汪勤.??基于視頻的運(yùn)動(dòng)目標(biāo)檢測(cè)與識(shí)別[J].??現(xiàn)代電子技術(shù).?2009,?08(295).
[4] ?王建平,劉偉,王金玲.一種視頻運(yùn)動(dòng)目標(biāo)的檢測(cè)與識(shí)別方法[J].?計(jì)算機(jī)技術(shù)與自動(dòng)化.2007,26(3):78-80.
[5] ?李崇輝.視頻監(jiān)控中運(yùn)動(dòng)目標(biāo)的分類方法研究[D].華南理工大學(xué).?2013年.
[6] ?周維.視頻監(jiān)控中運(yùn)動(dòng)目標(biāo)發(fā)現(xiàn)與跟蹤算法研究[D].中國(guó)科學(xué)技術(shù)大學(xué).2012年.
[7] ?郭玲.智能視頻監(jiān)控中運(yùn)動(dòng)目標(biāo)檢測(cè)的算法研究[D].華南理工大學(xué).2013年.
[8] ?Volker?Roth,?Volker?Steinghage.?Nonlinear?discriminant?analysis?using?kernel?functions?[A].?Proc?of?Neural?Information?Processing?Systems[C].?Denver,1995:568-574.
[9] ?Sebastian?Mika,?Gunnai?Ratsch,?Jason?Weston,?et?al.?Fisher?discriminant?analysis?with?kernel[A].IEEE?Workshop?on?Networks?for?Signal?Processing[C].Piscataway,1999:41-48.
[10] ?杜世強(qiáng);基于核Fisher判別的人臉識(shí)別方法研究[D].陜西師范大學(xué).?2007年.
[11] ?Volker?Roth,?Vokler?Steinhage.?Nolinear?discriminant?analysis?using?kernel?funtions[C].?In?S.A.Solla,T.K.Lene,?K.R.Muller,?ediotrs.?Advance?in?Neuar?Information?Processing?Systmes12.?Cambridge,MA:MTT?Press,?2000:?568-574.
[12] ?Ming-Hsuan?Yang,?Kernel?Eigenface?vs.?kernel?Fisher:?face?recongnition?using?kernel?methods.?Proceding?of?the?Fifth?IEEE?International?Conference?on?Autiomatic?Face?and?Guesture?Recongnition.?Washington?D.C,?2002:215-220.