席志紅,李永佳,段 煉
(1.哈爾濱工程大學信息與通信工程學院,黑龍江哈爾濱 150000;2.哈爾濱體育學院財務(wù)處,黑龍江哈爾濱 150000)
目標跟蹤[1]是計算機處理視頻鄰域的典型問題,主要是尋找指定目標在下一幀的位置,應(yīng)用的主要技術(shù)是圖像處理、模式識別等方法?,F(xiàn)在研究的跟蹤算法主要可分為兩個方向,分別是根據(jù)特征進行跟蹤和根據(jù)假設(shè)進行跟蹤。根據(jù)特征進行跟蹤的方法,是通過在不同圖像中檢測出目標的特定特征實現(xiàn)對目標的跟蹤,這樣特征的優(yōu)劣直接影物體效果?;谔卣鞯母櫡椒ㄓ嬎銖碗s程度低,能保持較好的實時性。Mean Shift算法[2]是基于特征跟蹤的典型代表。根據(jù)假設(shè)進行跟蹤的方法[3],首先分析跟蹤物體與背景環(huán)境的不同點,找到有用信息作為假設(shè)條件,然后根據(jù)這些假設(shè)對跟蹤建立模型,從而實現(xiàn)對目標的跟蹤。這種算法具有較高的準確性,但采樣數(shù)量大,實時性比根據(jù)特征進行跟蹤方法差。粒子濾波、卡爾曼濾波的跟蹤等都是根據(jù)假設(shè)進行跟蹤的經(jīng)典算法。
圖像的局部特征[4]也是目前計算機圖像處理的一個熱點,是許多方法的基礎(chǔ),對實現(xiàn)目標跟蹤有直接的影響,在尋找每個圖像間的對應(yīng)點和目標特征描述有著重要的作用。在視覺領(lǐng)域刊物和會議上都有特征描述論文發(fā)表。同時也被廣泛的應(yīng)用。在實際的三維圖像重建和場景恢復中,當建立每幅圖像之間點與點之間的對應(yīng)關(guān)系時,優(yōu)秀的局部圖像特征描述算子必不可少。在實現(xiàn)物體跟蹤算法中,目前比較流行的算法就是根據(jù)局部特征進行跟蹤,這是因為局部特征通常是利用物體局部形狀,這樣物體可以存在遮擋、復雜背景等情況下被識別。表示目標的局部特征有很多種,目標的輪廓特征最容易被感知,穩(wěn)定性相對其他特征是最好的,能夠直接描述物體的形狀。形狀上下文(Shape Context)一種基于邊界輪廓的表示方法,能夠很好的描述物體的形狀特征。
Shape Context[5]特征是由 Serge Belongie 于 2002年提出的一個形狀描述方法。依據(jù)以往的學術(shù)研究,Shape Context的形狀描述比基于邊界的形狀在理論上能夠?qū)崿F(xiàn)更精確的匹配,該方法能夠很好地表示圖像區(qū)域的內(nèi)部特征。并經(jīng)過大量測試,在僅有輪廓的匹配信息時,Shape Context仍然可以保證到很高的精確度。
首先,要獲得物體輪廓特征,利用輪廓上的一系列離散的點就可以表示整個目標輪廓,提取Shape Context特征。在提取離散點時,應(yīng)做到的是使這些提取點能準確反映出物體的輪廓信息,尤其是物體中形態(tài)發(fā)生變化部位的重要信息,并盡量做到提取點集的質(zhì)心與目標質(zhì)心能夠保持相同位置。在提取目標邊緣時,采用微分算子法,這種算法通過卷積完成,這是因為導數(shù)算子有使灰度變化突出的作用。將導數(shù)算子應(yīng)用的圖像中,就可以使圖像灰度變化較大的點處得到的數(shù)值較高,因此把這些導數(shù)值作為對應(yīng)點的邊界強度值,通過設(shè)置閾值的方法,提取邊界點集合。實驗證明,這種方法準確性較高。其次,就是要提取輪廓采樣點。利用均勻采樣的方法,將提取到的輪廓線上曲率最大的點確定為采樣的開始點。如果輪廓有不止一個曲率最大的像素點,則比較曲率最大的點的毗鄰點的曲率,比較毗鄰點曲率較大的點所對應(yīng)的曲率最大點作為起始點,如果毗鄰點的曲率也相同,則在比較毗鄰點,直到找出較大的相鄰像素點為止。找到起始點后,依次均勻抽樣。
Shape Context方法的理論基礎(chǔ)是:對任一圖像通過上文敘述方法得到的N個離散邊界點來說,其中任意一個點與其他的N-l個點之間都存在對應(yīng)關(guān)系,可以將這種對應(yīng)關(guān)系看成不同向量,這N-l個向量包含了有用的的邊界信息,由這N-1個向量就能表示物體的形狀特征,這可以看出,當N值越大時,表示目標信息越多,表示目標的形狀也就越準確。在提取到輪廓點后[6],利用坐標變換得到該點對應(yīng)的直方圖,對數(shù)極坐標直方圖能夠直觀反映基準點與其他點之間的空間位置關(guān)系,從而正確表示物體的特征。
對任一圖像,在提取目標邊緣點后,可以得到一組離散邊界點集,設(shè)點集為 Pi={p1,p2,…,pn},對任一個點pi,其余點與該點能構(gòu)成的向量組,這就能很好的反映該點在目標中的位置信息。
為更直觀反映Shape Context特征方法,引入一種常用的圓形的對數(shù)極坐標系,如圖1所示,圖1(a)為原圖,圖1(b)為特征提取結(jié)果圖。
圖1 Shape Context特征提取示意圖
如圖1所示,整個空間被分成12×5=60個區(qū)域,每個區(qū)域所占的大小按從外到里逐漸增強,這是因為對于某點,離其近的點比距離遠的點有更好的鑒別能力。而在同一個圓弧范圍內(nèi)的區(qū)域所占空間相同,這是因為相同距離的點對基準點的鑒別能力是相同。在本文算法中,對給定點pi,在以該點為原點所組成的極坐標系中,通過統(tǒng)計分布在每個區(qū)域中點個數(shù)來表示目標的邊界特征信息。根據(jù)利用不同的點,可依次計算得到每個點的直方圖,這樣物體的邊界特征就可以用n×60的矩陣表示。
通過上述介紹可知,對于給定點pi,其特征可以用以該點為中心的極坐標系的60個區(qū)域中落入每個區(qū)域中的像素點個數(shù)Qi(k)來表示,公式顯示如下
式(1)中,k=0,…,60,#操作符代表了落入第 k 個區(qū)域中的不同于點的所有其余點的個數(shù),通過這種方法能得到有60個分量的直方圖值,逐一計算所有的離散點,得到n個形狀直方圖。這樣所有物體的形狀信息我們都可以量化為一個n×60的矩陣。根據(jù)這些點的直方圖中分布在不同區(qū)域的點數(shù),就可以建立圖像的Shape Context直方圖。
對于原圖像上的點pi和需要匹配的圖像上的點qj,可以用 Cij=C(pi,qj)表示點 pi和 qj的 Shape Context直方圖的相似度,計算公式如式(2)所示。
其中,hi(k)和hj(k)表示在這兩個不同點的第k個標準化的直方圖。
經(jīng)典的Mean Shift[7]目標跟蹤算法采用的顏色直方圖作為搜索特征,通過不斷迭代使得算法趨向于目標的真實位置,從而實現(xiàn)目標的跟蹤。傳統(tǒng)的Mean Shift算法在跟蹤中優(yōu)勢明顯。這些優(yōu)勢[8]主要體現(xiàn)在計算量不大,基本上可以做到實時跟蹤。
假設(shè)給定d維空間Rd中的n個樣本點xi,i=1,2,…,n。在x點的Mean Shift向量的基本形式定義為
其中,Sh是一個高維球區(qū)域,半徑為h,滿足以下關(guān)系的y點的集合
K是落入Sh區(qū)域內(nèi)的所有樣本點的個數(shù)。
Mean Shift向量[9]表示被采樣點的平均偏移量,不斷向樣本分布最多的區(qū)域迭代,這也就是概率密度函數(shù)的梯度方向。一般來說,在Sh中,離x越近的樣本點,對x周圍的統(tǒng)計特征關(guān)聯(lián)行越大,所以將核函數(shù)的引入,并根據(jù)每個樣本點的位置不同賦予其不同的權(quán)值,經(jīng)擴展后的Mean Shift向量表示為
Mean Shift算法是一個不斷迭代直至達到最佳位置的過程,如果假設(shè)初始點為x,允許的誤差為ε,則Mean Shift算法按照以下步驟進行:第1步,計算mh(x);第 2步,把 mh(x)付給 x;第 3步,如果mh(x)-x <ε結(jié)束循環(huán),否則,繼續(xù)執(zhí)行第1步。
Mean Shift算法方法簡單、計算速度快,在現(xiàn)實得到廣泛應(yīng)用。但與此同時,Mean Shift算法也存在著一些缺點,這是由于直方圖特征[10]在目標顏色特征描述方面略顯單一,缺少空間信息,對目標變形和遮擋不能實現(xiàn)正確的跟蹤。盡管顏色特征是簡單可行的,但顏色特征不能很好地解決跟蹤中出現(xiàn)的遮擋問題,并且在復雜背景下跟蹤的效果也不理想。所以,在目標跟蹤領(lǐng)域,但考慮到其缺點,在本文算法中用 Shape Context特征替代顏色特征,來解決顏色特征缺陷的問題。
在跟蹤的起始幀中,通過人工選定方法來選取要跟蹤的目標,然后對所選取的目標提取輪廓點,對提取的輪廓點進行抽樣,將所得抽樣點按在極坐標分布區(qū)域不同分成m塊,分布在不同區(qū)塊的點進行Epanechnikov核函數(shù)加權(quán),構(gòu)成圖像的Shape Context直方圖,該直方圖模型就叫做目標模型,在后續(xù)幀的目標跟蹤圖像幀上可能包含目標的區(qū)域是候選區(qū)域。
為了直觀反映跟蹤算法,假設(shè)現(xiàn)有兩個歸一化的直方圖分別為ha={ha(1),ha(2),…,ha(n)}和hb={hb(1),hb(2),…,hb(n)},則它們之間的 Bhattacharyya距離ρ(ha,hb)計算公式如下
為使目標模型與候選模型的相似性最大,即使得Bhattacharyya系數(shù)ρ^(y)的值最大。由于前面部分的研究q^u已經(jīng)得出,對式子p^u(y0)進行泰勒展開,Bhattacharyya系數(shù)ρ(y)可以表示成
實驗中所用的硬件環(huán)境為CPU P(R)4 2.8 GHz,內(nèi)存4 GB,顯存512 MB。軟件開發(fā)環(huán)境為 Matlab 2010b,實驗數(shù)據(jù)為多組視頻序列。為驗證本文算法的穩(wěn)定性與魯棒性,本文從驗證平移、旋轉(zhuǎn)不變性、遮擋穩(wěn)定性和復雜場景穩(wěn)定性等3個方面進行論證,經(jīng)過實驗研究,都表明該算法的穩(wěn)定性,受篇幅限制,以下每方面只列舉出一種場景。
由于平移只是目標位置的平移,其特征并未改變,所以平移之前與之后的形狀上下文特征相同,Shape Context具有平移不變形。通過對輪廓上的點建立極坐標圖,統(tǒng)計周圍點落入極坐標圖的數(shù)量來建立Shape Context直方圖,所以旋轉(zhuǎn)之后,點的位置信息不變,所建立的直方圖也不變。不同形狀的目標Shape Context特征也不相同,對于顏色相似而形狀不同的目標能實現(xiàn)良好的跟蹤。為驗證本文提出跟蹤算法對旋轉(zhuǎn)和平移具有良好的魯棒性,提取了序列圖像中兩幅有顏色相似、形狀不同的兩個物體相互運動、物體角度變化的圖片,圖2中方框表示被跟蹤的物體,從圖中可以看到,該算法能實現(xiàn)良好的跟蹤。
圖2 驗證平移、旋轉(zhuǎn)不變性效果圖
雖然顏色特征是簡單可行的,但顏色特征不能很好地解決跟蹤中出現(xiàn)的遮擋問題,并且在復雜背景下跟蹤的效果也不理想,而Shape Context特征可以彌補這些不足。圖3是一組手遮擋臉的視頻序列,可以看到,當跟蹤人臉時,圖3(b)、圖3(c)圖有手遮擋時,仍能實現(xiàn)良好的跟蹤。雖然跟蹤出現(xiàn)較小的偏差,但是跟蹤沒有丟失。實驗表明,本算法具有較強的抗噪性。
圖3 驗證遮擋穩(wěn)定性效果圖
由于均值漂移算法根據(jù)加權(quán)的顏色直方圖對目標建立模型,算法容易受顏色相似但顏色空間分布不同的目標干擾。同時由于僅僅根據(jù)顏色信息對目標進行跟蹤,容易受背景顏色的干擾。圖4為跟蹤物體出現(xiàn)遮擋,且被遮擋物體與跟蹤物體顏色相似,基于空間色彩直方圖的方法不能實現(xiàn)很好的跟蹤。而從圖3中可以看出,基于Shape Context特征的Mean Shift目標跟蹤算法跟蹤效果很好,對遮擋具有良好的魯棒性。
圖4 驗證復雜場景穩(wěn)定性效果圖
傳統(tǒng)的全局特征在跟蹤中容易受到背景信息的干擾,并且不能很好的處理遮擋問題。本文詳細介紹了Shape Context特征,并且具體討論了在該的魯棒性和穩(wěn)定性。隨后,通過Shape Context特征對目標進行建模,在Mean Shift算法的框架下進行跟蹤,并在戶內(nèi)外多個視頻中對提出的算法進行了驗證,都能實現(xiàn)良好的跟蹤,充分說明本文算法具有良好的魯棒性,比基于顏色特征的跟蹤算法更能適應(yīng)復雜場景,為下一步研究提供了新的思路。
[1] Milan Sonka,Vaclav Hlavac,Roger Boyle.圖像處理、分析與機器視覺[M].3版.艾海舟,蘇延超,譯.北京:清華大學出版社,2011.
[2] 李弼程,邵美珍,黃潔.模式識別原理與應(yīng)用[M].西安:西安電子科技大學出版社,2008.
[3] 王輝.復雜場景下多攝像機運動目標連續(xù)跟蹤研究[D].北京:北京交通大學,2013.
[4] Belongie S,Malik J,Puzicha J.Shape matching and object recognition using shape contexts[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(4):509-522.
[5] 劉翔.基于視頻的運動目標檢測與跟蹤算法研究與應(yīng)用[D].武漢:武漢科技大學,2009.
[6] 曲明志.基于局部特征和粒子濾波的目標跟蹤算法研究[D].長春:吉林大學,2013.
[7] 朱勝利,朱善安,李旭超.快速運動目標的Mean Shift跟蹤算法[J].光電工程,2006,33(5):66 -70.
[8] 胡波,陳懇,徐建瑜,等.基于Kalman預測和Mean-Shift算法的視頻目標跟蹤[J].光電子·激光,2009,20(11):1517-1522.
[9] 朱英宏,李俊山,郭莉莎,等.基于 LBP的尺度不變特征的描述和匹配算法[J].計算機輔助設(shè)計與圖形學學報,2011,23(10):1758 -1763.
[10]高越,趙丹培,姜志國.復雜環(huán)境下的魯棒目標跟蹤方法[J].計算機輔助設(shè)計與圖形學學報,2010(5):817-822.