關曉惠,周志敏
(浙江水利水電專科學校,浙江 杭州 310018)
運動目標檢測是指從視頻流中實時提取目標,一般是確定目標的所在的區(qū)域和顏色特征.它是視頻監(jiān)控的核心部分,是目標跟蹤、目標分類和行為理解的基礎.
圖1 視頻監(jiān)控流程
近年來,關于視頻監(jiān)控環(huán)境下的目標檢測和跟蹤方法,很多研究人員已經提出很多方法,但大部分算法僅適用于靜態(tài)背景情況,或室內監(jiān)控環(huán)境情況下的目標檢測.對于比較復雜的背景監(jiān)控情況下的目標檢測仍具有很大的挑戰(zhàn)性.
主要是因為復雜背景監(jiān)控環(huán)境比較復雜,主要表現(xiàn)為:
(1)光線變化比較大,早上和晚上、陰天和晴天,光線都存在很大的差異.
(2)背景中物體的運動,比如搖擺的樹葉、天空云的漂移、飄動的旗幟以及下雨、下雪等.
(3)前景與背景的轉化,即某個物體由運動轉為靜止或由靜止轉為運動(如汽車的停止或運動)而導致前景物體融入到背景中,或背景物體轉化為前景.
另外,由于復雜背景環(huán)境下的視頻監(jiān)控對實時性和準確性要求比較高,基于光流計算[1]的目標檢測方法復雜度比較高,難以適應視覺監(jiān)控的實時處理要求,而幀間運動分析[2]結果的精度不高,難以獲得目標區(qū)域的精確描述.而背景減方法是利用當前圖像與背景模型的差分來檢測出運動區(qū)域的一種技術.雖然背景減方法對光照條件、運動背景以及噪聲比較敏感,由于其運算速度快,并能獲得對運動目標區(qū)域的完整描述,能滿足檢測的實時性要求,因此背景減方法是目前監(jiān)控環(huán)境下目標檢測最常用的一種方法.
本文使用背景減方法,構建一種適應復雜背景情況下的目標檢測算法.首先利用W4[3]提出的背景建模方法對背景進行建模,然后根據背景運動情況下,像素與它領域之間的相關性對實行運動目標的檢測,消除由于背景運動所造成的錯誤檢測.算法還采用一種自適應的背景更新方法,在背景發(fā)生一定情況下自動對背景模板進行更新,消除了由于監(jiān)控環(huán)境整體光線發(fā)生變化和背景前景轉化所引起的錯誤檢測,提高運動目標檢測的可靠性和適應性.
基于背景減的目標檢測是首先利用已有的若干幀視頻圖像進行背景建模,背景模型是對視頻圖像中背景的一種統(tǒng)計描述,然后確定當前幀中不能用背景模型描述的那些像素為候選目標像素,從而將目標對象所在的區(qū)域從背景中分割出來.
在運動情況下,背景中每個像素的顏色分布往往呈現(xiàn)多模態(tài)[4].W4利用最小、最大灰度以及最大的時間差分為視頻中的每一個像素進行統(tǒng)計信息建模,該方法不需要預先存儲一組無前景的視頻流作為背景建模的參考樣本,背景模型可以直接從含有前景的視頻流中獲得[3].本文利用W4的背景建模方法從輸入視頻流中建立初始化的背景模型.
W4將每個象素的背景模型描述為一個三元組,形式化表示如下:
式中 :|Vz(x)-λ(x)|<2 ×δ(x),δ(x),λ(x)分別為x位置處的中間值和方差.這個條件使得無須事先獲得一組無運動物體的背景幀作為背景模型的參考幀.
在已獲得背景模型的情況下,對當前幀中的每一個像素進行處理,以確定其前景或背景的屬性.
式中:dμ表示最大幀間象素差;k為一常數(shù)參數(shù),表示檢測結果的靈敏度,k越大,表示檢測的靈敏度越低,即部分運動目標檢測不出來,k越小,表示靈敏度越高,這樣會使一些非前景象素被檢測為前景.當背景為完全靜止時,得到的檢測效果比較好,當背景由于樹葉的搖動等原因引起運動時,就會出現(xiàn)很大的噪音.
在進行目標檢測時,如果背景發(fā)生了運動,那么這些區(qū)域會被作為前景檢測出來,即該區(qū)域的像素與背景模型中對應點的匹配度很小,但它與其周圍鄰域某點的背景模型的匹配度比較大,這種情況,我們仍認為該點為背景像素.我們利用背景像素的這種相關性將目標檢測公式改進為:
因此,用公式(3)進行目標檢測時,消除了那些因背景運動所造成的錯誤檢測像素.
由于自然環(huán)境下的背景并不是固定不變的,因此在進行目標檢測時,背景模型應該能夠隨著背景的變化進行實時更新.當背景的變化是由于光線的變化引起時,如果仍然用舊的背景模型進行檢測,則會出現(xiàn)大量的噪聲.背景的變化是由于背景和前景的相互轉化引起時,檢測結果中就會出現(xiàn)不正確的靜止前景物體.
如果在最近的N幀中,一個位置一直被檢測為運動物體,并且沒有發(fā)生變化,說明該位置的前景物體融入到背景中,或者背景中的物體已經轉化為前景,這時需要更新背景模型.如果某個位置前后幀發(fā)生變化的象素個數(shù),達到一定的比例說明整體光線發(fā)生了變化.
采用如下幾個參數(shù):
(1)b(x,t)表示最近N幀中,x位置被判定為背景的次數(shù):
(2)m(x,t)表示最近N幀中,灰度值發(fā)生變化的次數(shù):
(3)n(t)表示當前幀中,被檢測為目標的像素總數(shù)
當下面條件滿足時,背景模型進行自動更新,提高目標檢測的可靠性和自適應性:
背景更新方法采用最近的N幀視頻圖像作為背景建模的參考樣本.
實驗中,在室外室內分別拍攝了一組具有復雜背景的視頻序列作為測試樣本,其中背景中有顯示屏的閃動、風扇的轉動、樹枝的晃動等運動物體,還有一組光線發(fā)生顯著變化的視頻.這些視頻圖像的大小為352×288,圖像為灰度格式,見圖2.本文的算法分別在這些視頻上進行了驗證,在一般的PC機上,本文的算法達到了20fps的處理速度.
圖2給出了部分視頻圖像的檢測結果.左邊是原視頻圖像,左邊是用文中算法檢測出來的結果.
運動目標的檢測是視頻監(jiān)控的低層階段,它涉及到計算機視覺、模式識別、人工智能等領域知識,具有很大的挑戰(zhàn)性.本文根據運動背景像素間的相關性,提出一種復雜背景下的運動目標檢測方法,消除了由于背景運動所引起的錯誤檢測,文中還采用一種自適應更新背景模型,消除由于光線變化和背景前景轉化所引起的錯誤檢測.實驗證明,該方法對背景中有運動物體、環(huán)境光線變化、以及背景與前景轉化等復雜背景下的目標檢測具有較好的處理能力和處理效果.
圖2 運動目標檢測結果
[1]JBARRON.D FLEET.S BEAUCHEMIN.Performance of optical flow techniques[J].International Journal of Computer Vision,1994,12(1):42-77.
[2]CANDERSON,P BURT,G CAN DER WAL.Change detection and tracking using pyramid transformation techniques[J].Proc.SPIE-Intelligent Robots and Computer Vision,1985,579:72-78.
[3]IHARITAOGLU,D HARWOOD,L.DAVIS.W4:Real time surveillance of people and their activities[J].IEEE Trans.Pattern Anal.Mach.Intell,2000,22(8):809-830.
[4]CHRIS STAUFFER,ERIC GRIMSON.Learning patterns of activity using real-time tracking[J].IEEE Transactions on Pattern Recognition and Machine Intelligence(PAMI),2000,22(8):747-757.