張麗娟 李澤仁
摘 要 簡要介紹了視頻追蹤的簡單知識(shí),系統(tǒng)全面的介紹了視頻追蹤的幾種算法,包括基于自適應(yīng)顏色屬性的追蹤算法、基于壓縮感知理論的追蹤算法、基于概率連續(xù)異常值的追蹤算法。
關(guān)鍵詞 視頻追蹤;顏色屬性;壓縮感知;概率連續(xù)異常值
中圖分類號(hào) G2 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 2096-0360(2015)01-0037-02
視頻追蹤是近年來新興的一個(gè)研究方向,它融合了計(jì)算機(jī)視覺,模式識(shí)別等學(xué)科技術(shù),在安全監(jiān)控,視頻壓縮與檢索等方面有廣闊應(yīng)用前景。系統(tǒng)以圖像序列輸入,輸出則是圖像中目標(biāo)的各種屬性,如大小,位置等。其目的是為了判斷圖像序列中目標(biāo)的位置。影響視頻追蹤的原因有多個(gè),如光照不變、部分遮擋、變形等。追蹤算法通常分為生成式算法和判別式算法。
1 基于自適應(yīng)顏色屬性的追蹤算法
1.1 追蹤器
追蹤器是從單一圖像片段中學(xué)習(xí)一種核心的最小二乘目標(biāo)分類器,該追蹤器具有顯著速度的關(guān)鍵是這種追蹤器研究出的循環(huán)結(jié)構(gòu)似乎能夠從局部圖像片段中進(jìn)行周期性假設(shè),這里我們簡要介紹一下該算法。
這種分類器使用一種單一的灰度圖像片段進(jìn)行訓(xùn)練,圖像片段的大小是的,且分布在目標(biāo)對(duì)象的中心。這種追蹤器考慮所有的循環(huán)變化,,并將其作為分類器的訓(xùn)練樣本。這些樣本以一種高斯函數(shù)來進(jìn)行標(biāo)記,以便用來標(biāo)記。這種分類器通過成本函數(shù)最小化(1)進(jìn)行訓(xùn)練,如下式所示。
(1)
這里是通過核函數(shù)誘導(dǎo)得到的希爾伯特空間的映射,內(nèi)積定義為,常數(shù)是一個(gè)正則化參數(shù)。成本函數(shù)(1)是由最小得到的,這里的系數(shù)定義
如下:
(2)
這里是離散傅里葉變換。我們定義離散傅里葉變換:,這里是由核函數(shù)輸出得到的。等式(2)中若是平移不變的,也就是對(duì)于所有的,都有。
在新的一幀中,檢測步驟是通過對(duì)大小為的灰色圖像片段進(jìn)行第一次裁剪而執(zhí)行的。檢測的分?jǐn)?shù)是由計(jì)算得到的,這里的是樣本片段的傅里葉變換核輸出。這里表示目標(biāo)外觀的灰度圖像片段,并且是由多種幀獲得的。在新的一幀,目標(biāo)位置是通過尋找合適的變換以找到的最大分?jǐn)?shù)來估計(jì)的。這里的核輸出和能夠通過使用快速傅里葉變換有效地計(jì)算出來。
1.2 算法思想
最先進(jìn)的視覺追蹤器依靠亮度信息或使用簡單的顏色表示來對(duì)圖像進(jìn)行描述。與視覺追蹤相反的是,對(duì)象識(shí)別和檢測、復(fù)雜的顏色特性結(jié)合亮度顯示時(shí)能夠提供較好的性能。由于追蹤的復(fù)雜性,應(yīng)該高效的計(jì)算所需的顏色特性,擁有一定數(shù)量的光度不變性,同時(shí)保持高辨別力?;诖?,本節(jié)提出了該算法,該算法是在追蹤器的基礎(chǔ)上獲得的新算法,由于追蹤器對(duì)于多通道信號(hào)的處理結(jié)果是次優(yōu)的,從而為了解決這個(gè)問題,本文自適應(yīng)的更新樣本,采用多通道追蹤器進(jìn)行訓(xùn)練。高維物體的顏色屬性能夠?qū)е掠?jì)算量的增加,因此限制了該算法的應(yīng)用。
2 基于壓縮感知理論的追蹤算法
2.1 壓縮感知理論
2.1.1 隨機(jī)投影
設(shè)置一個(gè)隨機(jī)矩陣,該矩陣的行是從高維圖像空間到低維空間的單位長度的投影數(shù)據(jù),符號(hào)表示為
(3)
隨機(jī)矩陣中n< 2.1.2 隨機(jī)測量矩陣 滿足限制等距特性的一種典型的測量矩陣是隨機(jī)高斯矩陣,下面的,當(dāng)這個(gè)矩陣是稠密的,并且是很大的情況下,該矩陣的存儲(chǔ)和計(jì)算量仍然是很大的。在本小節(jié)中,使用了一個(gè)非常稀疏隨機(jī)測量矩陣,其定義如下: (4) Achlioptas[2]證明了這種類型的矩陣在時(shí)滿足Johnson-Lindenstranss引理。這種矩陣只需要一種統(tǒng)一的隨機(jī)生成器,便很容易的計(jì)算出來。更重要的是,當(dāng)時(shí),這種矩陣是非常稀疏的,因?yàn)檫@時(shí)可以避免計(jì)算量的2/3。另外, Liet al.[3]指出,這種矩陣是近似正態(tài)分布的。在本小節(jié)中,我們?cè)O(shè)置,從而得到一個(gè)非常稀疏的隨機(jī)矩陣。 2.2 算法思想 在壓縮領(lǐng)域,本文介紹了一個(gè)有效的基于多尺度特征空間的特征提取的方法來構(gòu)造外觀模型,同時(shí)將正負(fù)樣本通過尺度變換,對(duì)樣本量進(jìn)行擴(kuò)充;再對(duì)擴(kuò)充的樣本進(jìn)行壓縮,然后將這個(gè)多尺度的樣本空間的樣本通過稀疏矩陣投影到低維空間中。構(gòu)造的外觀模型用來生成基于特征提取的目標(biāo),它也是判別式的。 3 基于概率連續(xù)異常值的追蹤算法 3.1 基于概率連續(xù)異常值的追蹤框架 視頻追蹤被看作一種隱馬爾可夫模型的貝葉斯推理任務(wù)。給定一系列觀測樣本, 直到第幀的位置,其目的是遞歸地估計(jì)隱藏的狀態(tài)變量,,這里代表兩種連續(xù)狀態(tài)間的運(yùn)動(dòng)模型,表示觀測模型,該觀測模型能夠估測屬于目標(biāo)類型的觀測圖像片段的可能性。類似于增量視覺追蹤方法 [4],我們使用仿射變換的6個(gè)參數(shù)來表示運(yùn)動(dòng)模型。狀態(tài)變換通過無規(guī)則運(yùn)動(dòng)表述,也就是說,,這里是一個(gè)對(duì)角協(xié)方差矩陣。 3.1.1 觀測模型 假設(shè)兩個(gè)連續(xù)幀之間指標(biāo)向量變化非常小,我們建立一個(gè)基于自由異常值最小二乘法的似然函數(shù)。對(duì)于每一個(gè)對(duì)應(yīng)于預(yù)測狀態(tài)的觀測圖像矢量來說,我們通過最小二乘算法來解決下面的方程式,方程式如下 (5) 這里表示狀態(tài)下第位置樣本,是幀指標(biāo),代表按元素排列的乘法算子。是第幀位置上基于概率連續(xù)異常值算法得到的指標(biāo)向量。在最理想的得到之后,觀測的可能性可以通過下式測量得到
(6)
這里在本文中被設(shè)為0.1。
3.1.2 在線更新
在該算法中,指標(biāo)向量的零元件能夠識(shí)別異常值,獲得每一幀最佳狀態(tài)后,提取相應(yīng)的觀測向量,推斷指標(biāo)向量。然后,通過取代平均向量的相應(yīng)部分異常值來恢復(fù)觀測向量
(7)
這里表示恢復(fù)樣本,代表按元素排列的乘法算子。這個(gè)恢復(fù)樣本能夠累積,還可被用來更新通過增量主成分分析方法獲得所需的追蹤器。此外,推斷出的指標(biāo)向量已儲(chǔ)存,然后用于下一幀。
3.2 算法思想
本小節(jié)采用一種新穎的概率連續(xù)異常值方法來描述出現(xiàn)在線性表示模型中的連續(xù)異常值。在該算法中,噪聲觀測模型要么可以用小高斯噪聲的主成分分析子空間來表示,或者可以被看作在一個(gè)統(tǒng)一值之前的一個(gè)任意值,在這個(gè)噪聲觀測模型里,空間之前的一致性充分利用的是一種二元馬爾可夫隨機(jī)領(lǐng)域模型。然而,本文中能夠推導(dǎo)出概率連續(xù)異常值模型的目標(biāo)函數(shù),其解決方案是能夠通過自由異常值的最小二乘法和標(biāo)準(zhǔn)最大流、最小裁剪方法反復(fù)迭代獲得。最后,本文設(shè)計(jì)一個(gè)有效的觀測似然函數(shù)和一種視頻追蹤的樣本更新方法。無論從定量分析還是定性分析,該算法都能顯示比其他算法在精確度和速度方面的優(yōu)越性。
4 小結(jié)
本文重點(diǎn)介紹了基于自適應(yīng)顏色屬性的追蹤算法、基于壓縮感知理論的追蹤算法和基于概率連續(xù)異常值的追蹤算法。由于影響視頻追蹤的原因復(fù)雜性,應(yīng)該根據(jù)不同的原因選擇不同的算法。在系統(tǒng)設(shè)計(jì)中,應(yīng)該根據(jù)具體的精度要求,計(jì)算復(fù)雜度要求和實(shí)時(shí)性要求等采用不同的追蹤算法。多種算法的聯(lián)合使用可以有效地克服單一算法的局限性,因此應(yīng)該著重于該方向的研究工作,使追蹤算法更具有精確度、實(shí)時(shí)性和魯棒性。
參考文獻(xiàn)
[1]范春宇.視頻跟蹤技術(shù)研究[D].西安電子科技大學(xué),2007.
[2]Achlioptas, D.: Database-friendly random projections: Johnson-Lindenstrauss with binary coins. J. Comput. Syst. Sci 66(2003)671-687.
[3]Li, P., Hastie, T., Church, K.: Very sparse random projections. In KDD(2006)287-296.
[4]D. Ross, J. Lim, R.-S. Lin and M.-H. Yang. Incremental learning for robust visual tracking. International Journal of Computer Vision,77(1-3):125-141.