劉凱倫+宋濤
摘要:運動目標跟蹤目前已經(jīng)成為計算機視覺領域的重要研究課題之一。目標跟蹤的性能受到眾多因素的影響,有研究表明,選取合適的目標表示模型作為特征進行跟蹤可以大幅度提升跟蹤效果?,F(xiàn)有的很多特征或計算復雜,或者需要大量的數(shù)據(jù)進行訓練,或缺乏對目標外觀變化的魯棒性,并不能取得很好的效果。針對這一問題,文章提出了一種使用圖像感知哈希作為匹配特征的生成方法進行目標跟蹤。圖像感知哈希原本是用于尋找相似圖片的圖片匹配的方法,具有對尺度變化、光照變化不敏感,計算容易等優(yōu)點。將感知哈希用于目標跟蹤,可以減少計算量,并在檢測到目標后,結合有效的運動模型更新策略,解決目標跟蹤中出現(xiàn)的偏移、遮擋等問題,達到快速、準確的跟蹤效果。
關鍵詞:運動目標跟蹤;生成方法;圖像感知哈希;OPENCV
中圖分類號:TP392 文獻標識碼:A 文章編號:1009-3044(2016)14-0179-03
隨著計算機信息技術的發(fā)展,計算機視覺已經(jīng)成為研究熱點之一,運動目標跟蹤更是計算機視覺領域的熱門課題。如今運動目標跟蹤技術已經(jīng)廣泛用于監(jiān)控、交通、軍事、醫(yī)療的等領域。視頻是一幀一幀連續(xù)播放的圖像序列,目標跟蹤是指從視頻的某一幀開始,通過目標檢測方法找到到運動目標或者人工指定跟蹤目標,在之后的連續(xù)圖像序列中持續(xù)對目標進行識別和跟蹤。
目標跟蹤方法通常分為判別方法和生成方法兩種。判別方法把跟蹤看成一個二分類的問題:以目標物體作為正樣本,背景作為負樣本,通過訓練分類器可以把目標從背景中分離出來,從而實現(xiàn)對目標的跟蹤。目前很多判別方法提出,其中STRUCK是判別方法中最杰出的[2],但是此方法需要大量的計算,速度較慢,并不能滿足實時跟蹤的需求。生成方法首先學習外觀模型來表示目標,然后在搜索區(qū)域的候選模型中選擇出與目標模型誤差最小的一個作為跟蹤結果。生成方法最早可以追溯到Lucas和Kanade提出的基于原始圖像的整體模板法,即LK方法。僅僅使用原始圖像作為模板,不能很好地提取目標外觀特征,適應目標外觀變化,且需要的計算量較大。Hager和Belhumeur 等人改進了LK方法,對原始圖像進行降維,使用對光照不敏感的低維特征作為目標外觀的表示。在此基礎上,Black和Jepson又提出了使用一定的學習策略進行模型更新,從而更好的處理目標外觀的變化。此時生成跟蹤方法的框架已經(jīng)形成。隨后很多模型的不同特征被用于跟蹤。如Comaniciu人等結合顏色直方圖和數(shù)學上的均值偏移方法,提出了meanshift方法。Collins 拓展了可自適應尺度變換的改進方法camshift。為了更好的處理遮擋和提升實時性能,局部稀疏表示(PCA、稀疏編碼等)和多種特征的聯(lián)合表示也被用于目標跟蹤。[1][2]
跟蹤的過程中會出現(xiàn)眾多的干擾因素影響跟蹤的性能,如尺度變換,光照變化,偏移,遮擋等問題。處理這些因素的關鍵在于構造有效且魯棒的外觀表示模型。文獻[1]證明了模型表示的選擇對于跟蹤性能的影響最大。于是近些年來,跟蹤問題更多的焦點集中在尋找有效的表示模型上。本文提出了一個有效的生成方法,使用圖像感知哈希作為模型表示進行跟蹤,
具有尺度不變性和運算速度快的優(yōu)點,并且引入了模型更新策略,從而解決了目標跟蹤中出現(xiàn)的偏移、遮擋問題。
1圖像感知哈希
感知哈希是指將具有相同感知內容的多媒體信息映射為一段數(shù)字摘要,用來對媒體信息進行比對。圖像感知哈希則是對數(shù)字圖像的感知信息進行摘要。傳統(tǒng)的哈希技術僅僅簡單地把圖片看作一個二進制文件進行處理,而沒有考慮到圖像上的感知信息。隨著網(wǎng)絡上有損壓縮格式的使用,傳統(tǒng)的哈希算法如MD5、SHA1等方式不再適用于圖片的匹配,于是提出了圖像感知哈希技術,利用的圖片的感知特征作為摘要信息來進行圖像的識別和認證[4]。
在MD5、SHA1這樣的加密哈希方法中,得到的哈希值僅僅是一段固定長度的二進制數(shù)字,和其本身的內容沒有關系。單向性和抗碰撞性要求它對輸入的二進制數(shù)據(jù)的比特變化敏感,也就是說,即使輸入數(shù)據(jù)一位的比特變化,也會導致輸出哈希值的明顯的隨機變化。
對于數(shù)字圖像而言,圖像數(shù)據(jù)格式的變化,普通的圖像潤飾或者加工操作,圖像通信的信道噪聲等在劇烈改變圖像二進制數(shù)據(jù)的同時,一般都只會影響圖像呈現(xiàn)信息的質量,而不會改變其內容。因此大部分感知哈希算法都具有共同的基本特性:圖像可以放大縮小,可以有不同的方向、角度,甚至可以有細微的顏色差別,其哈希值都應該保持不變或者在一個指定的閾值內變化。而以上的特性也正好適用于目標跟蹤中用來匹配目標。
2提出的算法
近些年來,已經(jīng)有很多不同的圖像感知哈希算法提出[5]。其中包含很多復雜的甚至可以加密的方法,但是經(jīng)測試,即使將很簡單的感知哈希算法作為特征使用到跟蹤中,也能起到很好的效果。
2.1模型表示
本文中采取的感知哈希作為跟蹤目標的模型表示,計算方法如下:
1)將原圖像轉化為灰度圖,灰度圖就可以很好的保存圖像輪廓和細節(jié),減少計算量,提高速度。
2)縮小圖像尺寸,把原大小轉化為8*8的方形圖像??s小尺寸可以大幅度減少圖像的高頻信息,保留低頻信息。低頻信息反映了圖像的整體框架,具有對放大、縮小、平移、模糊的不變性,這也是圖像哈??梢宰鳛槟繕烁櫰ヅ涮卣鞯年P鍵原因。
3)計算所有像素灰度的平均值,用于和每個像素比較。
4)將所有的像素值與平均值進行對比,大于等于平均值記為1,小于平均值記為0。
5)把這64個2進制位由在原圖像從左到右從上到下的順序排列,形成哈希值。
以Lena圖為例,計算圖像感知哈希的步驟如圖1所示:
2.2 運動模型和觀察模型
跟蹤算法使用圖像感知哈希作為模型特征,以兩個哈希值之間的漢明距離作為評判相似度的標準(觀察模型)。漢明距離表示哈希值中對應位置二進制位不同的個數(shù),漢明距離越大,說明圖像越不相似,反之則越相似。
漢明距離的計算:d(x,y)=∑x[i]⊕y[i],如下所示。
由[1]我們得知,在選取合適特征情況下,即便是用很簡單的跟蹤框架也能夠實現(xiàn)很好的跟蹤效果。本系統(tǒng)在第一幀使用人工標注的方法圈定要跟蹤的目標,之后的每一幀使用滑動窗口作為運動模型搜尋目標:在當前目標2*2的范圍內尋找目標,使用漢明距離作為觀察模型來從候選的模型中選取最接近目標的一個。如圖2。
2.3偏移問題
在模型更新的過程中,由于誤差積累,會導致跟蹤結果偏移。對于此問題,本算法采取使用第一幀和上一幀的權重共同跟蹤的方法,第t幀的模型M(t)=αM(0)+(1-α)M(t-1),其中α表示第一幀中目標模型所占的權重。隨著時間變化,第一幀的權重應逐漸減小。本方法中取α=1/(1+t)。
2.4 遮擋問題
當模型被遮擋時,如果繼續(xù)更新,會導致更新到覆蓋物更新到了錯誤的模型。所以本方法中的模型更新針對遮擋也提出了解決方法。d(h)表示漢明距離,當0 2.5算法流程 1)在視頻的某一幀使用鼠標拖拽圈定要跟蹤的目標,作為模型T,大小為p*q,左上角像素的位置為(m,n)。 2)計算選中窗口區(qū)域的感知哈希值H(T)。 3)下一幀F(xiàn)中使用在當前位置的2*2大小的窗口中滑動,計算每個大小為p*q的子窗口Fi,j的哈希值H(Fi,j)。i,j為子窗口Fi,j 左上角的像素在F圖中的坐標,稱為參考點。i,j的取值范圍:m-p/2 4)比較搜索窗口和模型窗口的哈希值的漢明距離D(H(T),H(Fi,j)),選取所有子窗口中漢明距離最小的子窗口作為跟蹤結果。 5)根據(jù)提出的模型更新機制決定是否將跟蹤結果Fi,j作為下一幀的跟蹤模型T,重復步驟2到步驟5。 3 基于Opencv的系統(tǒng)實現(xiàn)及仿真實驗 Opencv是一個開源的數(shù)字圖像處理和計算機視覺的函數(shù)庫,實現(xiàn)了圖形圖像處理和計算機視覺方面的很多通用算法,方便開發(fā)人員將注意力集中于算法的實現(xiàn)而不需要自己寫一些底層操作代碼,避免造成時間和精力上的浪費。 Opencv提供了數(shù)組、序列、矩陣、樹等基本結構,也包含了差分方程求解、傅里葉分析、積分運算、特殊函數(shù)等眾多高級數(shù)學計算函數(shù),以及各種圖像處理操作和目標跟蹤、攝像機校準、三維重建等高級視覺函數(shù)。本設計中的基本功能如讀取視頻,鼠標選取操作,縮放圖像,彩色圖像轉化為灰度圖像等基本功能都由opencv提供的函數(shù)實現(xiàn)。 本設計基于windows10+visual studio 2013+opencv2.4.11環(huán)境,實現(xiàn)了在固定的背景的情況下進行穩(wěn)健的目標跟蹤,具有尺度不變性和光照不變性,達到不需要預先訓練的每秒30幀以上的實時跟蹤效果。圖3為程序在第82、269、550、736幀跟蹤到的結果。 4 結論 實驗結果表明,在目標跟蹤中引入圖像匹配中的感知哈希方法作為跟蹤特征,有較快的運行速度、準確度和魯棒性,可以作為一種良好的特征用于目標跟蹤。雖然與Object Tracking Benchmark[2]中排名靠前的算法相比,本設計仍然有差距,但是提出了一種將圖像感知哈希引入跟蹤的概念。近些年來還不斷有新的感知哈希算法提出,不乏兼具尺度不變性,旋轉不變性等良好特性的感知哈希算法,試想將這些方法用于運動目標跟蹤,會具有更好的跟蹤效果,可作為目標跟蹤發(fā)展的下一步研究方向。 參考文獻: [1] N Wang, J Shi, DY Yeung, J Jia. Understanding and Diagnosing Visual Tracking Systems[C].International Journal of Computer Vision, 2015. [2] Wu Y, Lim J, Yang M H. Object Tracking Benchmark[J]. Pattern Analysis & Machine Intelligence IEEE Transactions on, 2015. [3] 徐光柱,雷幫軍.實用性目標檢測與跟蹤算法原理及應用[M].北京,國防工業(yè)出版社, 2015. [4] Schneider M, Shih-Fu Chang. A Robust Content based Digital Dignature for Image Authentication[C]. Proc of IEEE International Conference on Image Processing, Lausanne, 1996. [5] 張慧. 圖像感知哈希測評基準及算法研究[D].哈爾濱工業(yè)大學, 2009. [6] Adrian Kaehler, Dr. Gary Rost Bradski. Learning OpenCV [M].New York:oreilly, 2008.