袁靜 殷亞萍
(1 防災科技學院災害信息工程系河北廊坊065201)
(2 河北省胸科醫(yī)院信息處河北石家莊050041)
視頻分析是計算機視覺的熱點研究領域之一,其任務是協(xié)助人們分析視頻場景中發(fā)生了哪些事情以及事情的發(fā)生程度。視頻分析技術的應用領域非常廣泛,目前主要涉及的應用領域包括智能交通、智能安防、視頻檢索等等。在視頻分析中通常情況下都會存在鏡頭的切換,切換鏡頭會帶來運動場和顏色信息的變化,這對視頻分析造成了很大的影響,所以在視頻分析之前往往需要將視頻的鏡頭切換,進行檢測并進行分類,所涉及的數(shù)據(jù)是采集的鋼結(jié)構在燃燒實驗下變形運動的視頻數(shù)據(jù)。在對該數(shù)據(jù)進行分析的時候,由于存在了鏡頭方向的變化,則需要首先提取不同鏡頭方向的視頻內(nèi)容,然后再做視頻分析。
目前鏡頭分類的方法主要有以下幾類:①基于灰度的鏡頭分割方法:直接灰度差方法[1],通過計算總的幀差,當幀差大于某一設定閾值,則存在鏡頭突變;判定存在鏡頭突變,對之前的方法進行了改進,該方法只計算幀灰度差大于某一閾值;提出先用3X 3 平滑濾波,然后再計算幀差;②基于邊緣的鏡頭分割方法[2]:通過計算每幀圖像的邊緣的數(shù)量進行幀差比較,該方法適用于穩(wěn)健運動的視頻,但是計算復雜;③基于彩色直方圖的分割方法[3]:X 檢驗直方圖差法; 直方圖最小幀差法;平均彩色法;④MPEG 視頻的鏡頭分割方法:利用DCT 系數(shù)的相關性和預測矢量的統(tǒng)計特性進行鏡頭分類;利用方差和預測的統(tǒng)計特性進行鏡頭分割;利用運動預測的統(tǒng)計特性進行鏡頭分類;利用了DC 幀差進行鏡頭分割;利用了DC 系數(shù)的統(tǒng)計檢測進行鏡頭分類[4];⑤基于統(tǒng)計的鏡頭分割:用k- means 算法進行鏡頭分割;用C- 聚類進行鏡頭分割;樹形分類器的自適應鏡頭分割等[5]。
鏡頭分割方法:首先將圖像進行去噪處理,以減少噪聲的干擾,傳統(tǒng)的方法是高斯平滑處理算法;再次計算幀間差值,并進行歸一化處理得Fv;若Fv 高于某個閾值Tm,則繼續(xù)其光流信息,當該值高于某個閾值Th 時,則判定該幀為鏡頭邊界。鏡頭分割框架如圖1 所示。
圖1 鏡頭分割框架
直方圖幀差法原理如下:設h1,h2分別為相鄰兩幀圖像的灰度直方圖;計算h1與h2之間的差值,并進行歸一化處理。其數(shù)學模型描述如下,其中2N 為圖像中像素的數(shù)量。
光流是圖像運動的一種表達方式,可以看作是空間物體表面的亮度隨著運動變化在視覺傳感器的成像平面上的表達。光流的研究是利用圖像序列中的像素強度數(shù)據(jù)的時域變化和相關性來確定各自像素位置的“運動”[6],即研究圖像灰度在時間上的變化與景象中物體結(jié)構及其運動的關系,如圖2 所示,其基本假設是體素和圖像像素守恒,即假設一個物體的顏色在前后兩幀沒有巨大而明顯的變化?;谶@個思路,可以得到圖像約束方程。
圖2 光流的幾何模型
假設物體在時刻t 時位于(x,y)點,在t+△t 時刻位于點,則可以得到下式:
可得:
進一步得出結(jié)論:
假定u,v 在局部鄰域內(nèi)是不變的,則其計算模型如圖3 所示[8]。
圖3 光流的計算模型
圖3 中的方程可以描述為
此時,在求式(7)中的解,轉(zhuǎn)化為下列優(yōu)化問題:
由于其為超定方程,所以采用的最小二乘的方法求其優(yōu)化解。
進一步求得最優(yōu)解為:
其中:
其中從公式4.10 中可以看出當像素點在邊緣點和相同物體內(nèi)的時候,由于該式存在值0 特征值,所以其光流信息丟失。而當像素點是屬于較強的紋理區(qū)時,其變化顯示物體或人在向某一方向運動。
實驗數(shù)據(jù)來自項目的采集數(shù)據(jù),時間:2 h,幀率:12 幀/s,鏡頭切換6 次,準確鏡頭分割為6 次。實驗過程由3 步組成:首先將視頻進行高斯去噪,然后計算其直方圖幀間差,當幀間差高于某個閾值時,計算其光流信息,統(tǒng)計每幀圖像中歸一化的光流運動信息。
提出的基于光流計算和直方圖幀間方差的鏡頭分割方法,借助了鏡頭變化中的運動信息和灰度信息的劇烈變化,實驗結(jié)果證明,該方法能夠有效的濾除直接由光流法或幀間方差法進行鏡頭分割而產(chǎn)生的虛假分割邊界,適用于弱運動的視頻場景,但閾值的選擇和圖像特性有關,自適應的閾值選擇和降低時間復雜度是下一步工作的重點。
[1]M JSwain,D H Ballard.Color indexing[J].Int J Comput Vis,1993,26(4):461- 470.
[2]MRNaphade.R Mehrotra.A M Ferm an et a1.A High- performance Shot boundary Detection Algorithm Using Multiple Cues[C].In:Proc of Int Conf on Image Processing,1998(1):884- 887.
[3]Zhang H,Kankanhalli A,Smoliar S W.Automatic partitioning of fullmotion video[J].Multimedia System,1999(1):10- 28.
[4]BL Yeo,B Liu.A unified approach to tempo ral segmentation of motion JPEG and MPEG compressed video[C].In:Proc 2 Int ConfMultimedia Computing and Systems,1995:81- 83.
[5]B Gunsel,A M ferm an,A M Tekalp.Video Indexing Through Integration of Syntactic and Semantic Features[C].In:Proc of W orkshop on Applications of Computer Vision,Sarasota,F(xiàn)L,1996:90- 95.
[6]F Arm an.A Hsu.M Y Chiu.Feature management for large video databases[C].In:Proc IS&T/SPIE Cont Storage and Retrieval for Image and Video Databases I,1993;SPIE 1908:2- 12.
[7]H J Zhang.Video parsing using compressed data[C].In:Proc SPIE Symp Electronic Imaging Science and technology:Image and Video Proc essing II,1994:142- 149.
[8]陳震.圖像序列光流計算技術及應用[M].電子工業(yè)出版社,2012.