滕蓉
【摘要】研究了運(yùn)動(dòng)視頻圖像的非參數(shù)密度估計(jì)及目標(biāo)跟蹤方法,引出了Mean Shift算法理論。將Mean Shift算法應(yīng)用于跟蹤系統(tǒng)中,在運(yùn)動(dòng)目標(biāo)檢測(cè)的基礎(chǔ)上,利用特征空間中特征值的概率密度描述目標(biāo)模型與候選模型,并對(duì)目標(biāo)進(jìn)行定位。實(shí)驗(yàn)結(jié)果證明了基于Mean Shift算法的目標(biāo)跟蹤能準(zhǔn)確跟蹤目標(biāo),該算法可收斂到局部極值點(diǎn),具有良好的跟蹤效果。
引言
Mean Shift目標(biāo)跟蹤算法采用核概率密度來(lái)描述目標(biāo)的特征,基于Bhattacharyya系數(shù)用Mean Shift進(jìn)行迭代搜索,最終收斂的位置即為目標(biāo)中心。對(duì)于尺寸變化不大的目標(biāo),其跟蹤效果主要取決于用于計(jì)算Bhattacharyya系數(shù)的目標(biāo)模板以及候選目標(biāo)特征選取機(jī)制。目標(biāo)特征的選取原則是要能夠最大限度地描述目標(biāo)本身獨(dú)有的性質(zhì),它決定了Bhattacharyya系數(shù)對(duì)Mean Shift迭代的收斂速度和收斂位置。常用的方法有圖像(灰度或者彩色圖像)直方圖,也有一些國(guó)內(nèi)學(xué)者采用方向直方圖,還有結(jié)合目標(biāo)的其他特征,如目標(biāo)中心加權(quán)距離、目標(biāo)梯度圖像、標(biāo)準(zhǔn)差圖像等,在一定程度上增強(qiáng)了跟蹤的魯棒性。但是用這些方法得到的直方圖中,除了目標(biāo)本身的灰度以外,還包含了大量的背景成分,背景發(fā)生變化將會(huì)導(dǎo)致候選目標(biāo)區(qū)域和模板直方圖的最佳匹配位置與實(shí)際目標(biāo)中心有所偏差,對(duì)跟蹤快速運(yùn)動(dòng)的目標(biāo),系統(tǒng)將會(huì)變得不穩(wěn)定,最終導(dǎo)致目標(biāo)丟失。文獻(xiàn)提出采用背景加權(quán)的方法計(jì)算目標(biāo)模板與候選區(qū)域特征直方圖,試圖消除背景影響,但由于目標(biāo)窗中的部分背景在擴(kuò)大窗中可能并不存在,因此這種方法亦無(wú)法完全消除背景,實(shí)際的跟蹤效果并沒有顯著提高。
本文將Mean Shift算法用于目標(biāo)跟蹤中,首先要初始化被跟蹤目標(biāo)所在區(qū)域,采用運(yùn)動(dòng)目標(biāo)檢測(cè)出來(lái)的結(jié)果作為初始目標(biāo)。然后對(duì)目標(biāo)區(qū)域的所有像素點(diǎn)計(jì)算特征空間中每個(gè)特征值的概率。利用相似性函數(shù)度量初始幀目標(biāo)模型和當(dāng)前幀候選模型的相似性,在計(jì)算相似函數(shù)最大值時(shí)可得到目標(biāo)的運(yùn)動(dòng)方向,通過(guò)不斷的迭代計(jì)算,在當(dāng)前幀中,目標(biāo)會(huì)收斂到運(yùn)動(dòng)目標(biāo)的真實(shí)位置,從而實(shí)現(xiàn)跟蹤。并將其應(yīng)用到目標(biāo)跟蹤實(shí)驗(yàn)中,最后對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了分析。
一、Mean shift算法理論
在目標(biāo)跟蹤過(guò)程中,常將目標(biāo)的相關(guān)信息映射到特征空間中,特征值表示特征空間的隨機(jī)變量。對(duì)于參數(shù)估計(jì)來(lái)說(shuō),在特征值服從已知函數(shù)類型的概率密度函數(shù)條件下,通過(guò)目標(biāo)區(qū)域中觀測(cè)到的數(shù)據(jù)對(duì)密度函數(shù)相關(guān)的參數(shù)進(jìn)行估計(jì),然后得到整個(gè)空間的概率密度分布情況。在實(shí)際應(yīng)用中,數(shù)據(jù)模型往往是未知的,因此事先確定概率密度函數(shù)的表達(dá)式是不現(xiàn)實(shí)的,此時(shí)通常是采用非參數(shù)密度估計(jì)解決此類問(wèn)題。
非參數(shù)密度估計(jì)方法無(wú)需事先知道觀測(cè)數(shù)據(jù)的函數(shù)分布形式,只需要通過(guò)對(duì)觀測(cè)數(shù)據(jù)樣本的分析就可以進(jìn)行概率密度估計(jì)。非參數(shù)密度估計(jì)的方法通常有最近鄰域法、直方圖法以及核密度估計(jì)法等。其中,最近鄰域法比較容易受局部噪聲的干擾,很難準(zhǔn)確地對(duì)模型進(jìn)行估計(jì);直方圖法只適用于維數(shù)較低的數(shù)據(jù)分布,當(dāng)數(shù)據(jù)維數(shù)增高時(shí),直方圖將面臨維數(shù)災(zāi)難,且所需的存儲(chǔ)空間也將會(huì)隨維數(shù)的增加成指數(shù)增加;核密度方法可以很快產(chǎn)生漸進(jìn)無(wú)偏密度估計(jì),擁有比較不錯(cuò)的概率統(tǒng)計(jì)性質(zhì),它是目前最常被用到的非參數(shù)估計(jì)方法。
核密度估計(jì)方法的基本原理與直方圖方法類似,首先將采樣數(shù)據(jù)的值域分成幾個(gè)相等的區(qū)間(bin),根據(jù)數(shù)據(jù)值的大小,將數(shù)據(jù)分配到各個(gè)bin中,其中每個(gè)bin的概率值就是對(duì)應(yīng)的數(shù)據(jù)的個(gè)數(shù)與總體樣本數(shù)據(jù)個(gè)數(shù)的比率。核密度估計(jì)比直方圖法多一個(gè)用來(lái)進(jìn)行數(shù)據(jù)平滑的核函數(shù),核函數(shù)也叫做“窗函數(shù)”。常用的核函數(shù)有均勻核函數(shù)、三角核函數(shù)、Gauss核函數(shù)、Epanechikov核函數(shù)等,其共同特點(diǎn)是關(guān)于中信對(duì)稱,且是有限局部支撐的。
Mean Shift算法的本質(zhì)是變步長(zhǎng)梯度上升搜索峰值,其運(yùn)算過(guò)程就是在概率空間中求解概率密度機(jī)制,也就是通過(guò)迭代計(jì)算的方法將樣本點(diǎn)逐漸移動(dòng)到概率密度函數(shù)f(x)的局部極大值點(diǎn)。
關(guān)于Mean Shift算法的收斂性問(wèn)題,文志強(qiáng)等和李鄉(xiāng)儒等研究并證明了該算法是收斂的。
二、基于Mean shift算法的目標(biāo)跟蹤
將Mean Shift算法用于目標(biāo)跟蹤中,首先要初始化被跟蹤目標(biāo)所在區(qū)域,本節(jié)采用上一章中運(yùn)動(dòng)目標(biāo)檢測(cè)出來(lái)的結(jié)果作為初始目標(biāo),即一個(gè)包含運(yùn)動(dòng)目標(biāo)的最小外接矩形區(qū)域,該區(qū)域也是核函數(shù)作用的區(qū)域,區(qū)域的大小等于核函數(shù)的帶寬。然后對(duì)目標(biāo)區(qū)域的所有像素點(diǎn)計(jì)算特征空間中每個(gè)特征值的概率,即描述目標(biāo)模型。特征空間取穩(wěn)定性較強(qiáng)的顏色特征,若是RGB顏色模型則將顏色子空間R、G、B各分成k個(gè)相等的區(qū)間,共m個(gè),若是灰度模型則只需將灰度分成m個(gè)區(qū)間即可。區(qū)間對(duì)應(yīng)的值稱為特征值,所有的這些區(qū)間組成了特征空間。在以后的每幀圖像中,對(duì)目標(biāo)的候選區(qū)域內(nèi)同樣計(jì)算特征空間中的所有特征值的概率,即候選模型描述。然后利用相似性函數(shù)度量初始幀目標(biāo)模型和當(dāng)前幀候選模型的相似性,在計(jì)算相似函數(shù)最大值時(shí)可得到目標(biāo)運(yùn)動(dòng)的Mean Shift向量,也就是運(yùn)動(dòng)目標(biāo)的運(yùn)動(dòng)方向,通過(guò)不斷的迭代計(jì)算Mean Shift向量,在當(dāng)前幀中,最終目標(biāo)會(huì)收斂到運(yùn)動(dòng)目標(biāo)的真實(shí)位置,從而實(shí)現(xiàn)跟蹤。
實(shí)驗(yàn)結(jié)果與分析
實(shí)驗(yàn)基于SEED_DEC643開發(fā)平臺(tái),視頻口傳入的是ITU-RBT,656格式的圖像數(shù)據(jù)流經(jīng)公式轉(zhuǎn)化后得到RGB格式的圖像數(shù)據(jù),將RGB空間分成m=8×8×8=512個(gè)特征空間來(lái)描述目標(biāo)模型。
視頻場(chǎng)景為一個(gè)人走過(guò),運(yùn)動(dòng)過(guò)程中遇到樹,目標(biāo)被完全遮擋,短時(shí)間過(guò)后目標(biāo)又重新出現(xiàn)在視野內(nèi)。實(shí)驗(yàn)中,運(yùn)動(dòng)目標(biāo)模型的位置、大小等信息由運(yùn)動(dòng)檢測(cè)結(jié)果產(chǎn)生,為了避免背景因素過(guò)多的影響目標(biāo)區(qū)域而導(dǎo)致跟蹤過(guò)程失敗,在目標(biāo)區(qū)域的選擇方面,是在檢測(cè)出的包含運(yùn)動(dòng)目標(biāo)的最小外接矩形的基礎(chǔ)上按比例縮小,作為目標(biāo)跟蹤的初始區(qū)域,并對(duì)此區(qū)域進(jìn)行目標(biāo)描述??梢钥闯?,Mean Shift算法能夠準(zhǔn)確的跟蹤運(yùn)動(dòng)目標(biāo)。在跟蹤過(guò)程中,通過(guò)CCS中watch window工具對(duì)變量的實(shí)時(shí)觀察可以看出算法的迭代步驟一般在3次左右,算法收斂速度快,實(shí)時(shí)性好。
四、結(jié)論
本文研究了運(yùn)動(dòng)圖像的非參數(shù)密度估計(jì)和跟蹤方法,引出了Mean Shift算法理論,通過(guò)Mean Shift向量的迭代,使核函數(shù)的中心點(diǎn)快速的收斂到數(shù)據(jù)空間中樣本分布密度最大的位置。將Mean Shift算法應(yīng)用于跟蹤系統(tǒng)中,運(yùn)動(dòng)目標(biāo)模型是在運(yùn)動(dòng)目標(biāo)檢測(cè)結(jié)果的基礎(chǔ)上初始化的。首先利用特征空間中特征值的概率密度描述目標(biāo)模型與候選模型。通過(guò)跟蹤實(shí)驗(yàn)證明了基于Mean Shift算法的目標(biāo)跟蹤能夠準(zhǔn)確的跟蹤目標(biāo)。