華 江,張聲俊
(湖北理工學(xué)院 機電工程學(xué)院,湖北 黃石 435003)
基于像素直方圖建立靜態(tài)背景模型的方法
華 江,張聲俊
(湖北理工學(xué)院 機電工程學(xué)院,湖北 黃石 435003)
運動目標檢測是目標跟蹤、目標分類、目標行為理解等高級應(yīng)用的基礎(chǔ),而背景模型是否正確可靠是目標檢測成敗的關(guān)鍵。目前常用的建立背景模型的方法是時間平均圖像法。針對平均圖像法運算量過大和對噪聲敏感不足,提出了一種基于像素直方圖建立背景模型的方法。通過建立每個像素點在一段時間內(nèi)的統(tǒng)計直方圖,選擇出現(xiàn)頻率高的像素作為該點的背景像素,從而建立背景模型。經(jīng)過實驗驗證,基于像素直方圖的方法與傳統(tǒng)的時間平均圖像法相比,建立背景模型速度更快,需要內(nèi)存空間少,抗干擾能力強,在實驗中能夠快速準確地建立背景模型。
運動目標檢測;直方圖;靜態(tài)背景模型
運動目標檢測是各種后續(xù)高級應(yīng)用如目標跟蹤、目標分類、目標行為理解等的基礎(chǔ),是視頻序列圖像處理的關(guān)鍵環(huán)節(jié)[1]。運動目標提取質(zhì)量的好壞直接關(guān)系到分析和識別結(jié)果的準確與否[2]。目前,運動目標檢測方法主要有幀間差分法、背景減除法、光流計算法等。由于光流法及運動能量法運算復(fù)雜,若沒有特定的硬件支持一般很難滿足實時處理的要求。幀間差分法直接比較視頻序列中連續(xù)2幀或3幀圖像中對應(yīng)像素點在灰度值上的差異,然后通過設(shè)定閥值來提取序列圖像中的運動區(qū)域。由于相鄰幀的時間間隔較短,目標重疊部分不容易檢測出來,只能檢測出目標的一部分或出現(xiàn)較大比例的空洞。背景減除法是利用當前圖像與背景圖像的差分來檢測出運動區(qū)域的一種技術(shù),它往往是應(yīng)用靜態(tài)相機檢測運動目標的第1個環(huán)節(jié)[3],任何相對于背景模型的變化將被認為是運動目標,它一般能夠提供最完全的特征數(shù)據(jù),在實際中得到廣泛應(yīng)用。
背景減除法的關(guān)鍵是背景模型的建立,許多學(xué)者對此進行了研究,并取得了較多成果。如Neves J等[4]將訓(xùn)練圖像某點的灰度中值作為該點的背景像素灰度值,取得了較好的效果,但若背景像素出現(xiàn)的概率小于50%,該方法將失效[5]。一些學(xué)者則假定像素值服從某種分布模型,如高斯分布,通過一段時間的訓(xùn)練獲得其參數(shù)并不斷更新其分布參數(shù),就可以得到較好的背景更新方法,如Satpathy A等[6]將每個像素灰度值看作是多個高斯模型的加權(quán)混合,同時采用EM(Expectation Maximization)算法獲得各高斯模型參數(shù),由于核密度函數(shù)由參數(shù)法確定,因而在不同的環(huán)境下,很難有通用的已知參數(shù)模型。
一般來說,復(fù)雜的算法經(jīng)常會有較好的結(jié)果,但同時也會相應(yīng)地犧牲速度和內(nèi)存。目前常用的最簡單的背景模型是時間平均圖像法。
時間平均圖像法以當前某段圖像序列的平均值作為參考模型圖像,即產(chǎn)生一個除運動區(qū)域以外與當前靜態(tài)場景相似背景圖像,公式描述如下:
(1)
式(1)中,N為重建的圖像序列幀數(shù);B為重建的背景圖像;k為起始運算幀號;fk+N-1為第k+n幀圖像,背景圖像中每個像素點的值為該像素N幀圖像灰度的累加平均。
由于時間平均圖像法只是簡單地將多幀圖像相加后求其平均圖像,如果運動目標與背景灰度值相差較大,為建立可靠的背景模型,需要較多幀的圖像,同時該方法對噪聲較為敏感。
本文提出一種基于像素直方圖建立靜態(tài)背景模型的方法,其基本思路是考察視頻前N幅圖像,統(tǒng)計每一像素每一顏色分量的灰度分布,將每一像素每一顏色分量進行正規(guī)化處理(將灰度變換到指定的灰度范圍),并建立對應(yīng)的直方圖。由于對某一個像素來說,在一段序列圖像中,背景出現(xiàn)的時間最長,前景因為是運動的,出現(xiàn)的時間比較短,所以選直方圖中最高的灰度作為背景,將其變換到0~255級,作為背景在該位置該顏色分量上的灰度值。算法流程圖如圖1所示。
算法步驟:
1)為圖像每一個像素的3個顏色分量建立一個空的直方圖,直方圖的灰度等級為0~(M-1)級。
2)讀取一幅圖像,對圖像中每一像素位置的每一顏色分量(R,G,B),應(yīng)用式(2)將其灰度值轉(zhuǎn)換到0~(M-1)級。
(2)
式(2)中[]表示向下取整。
3)在對應(yīng)的直方圖中對上述變換后的灰度值進行統(tǒng)計。
4)重復(fù)步驟(2)~(3),直至對全部訓(xùn)練圖像進行處理。
5)選取直方圖中最大值所對應(yīng)的灰度值,將其轉(zhuǎn)換到0~255級。
(3)
將轉(zhuǎn)換后的灰度值作為背景模型在該像素位置所相應(yīng)顏色分量的灰度值。
盡管基于感知的顏色模型(CIE、HVC和HSV)更適合于圖像的表達和分析[7],但本文選用RGB顏色模型,原因是本文使用的視頻為AVI格式,其內(nèi)部顏色數(shù)據(jù)是基于RBG空間的,這樣可以省去顏色空間的轉(zhuǎn)換工作。而對于原始視頻數(shù)據(jù)是YCrCb格式的,可以直接使用YCrCb顏色模型。
在本文的算法中,M值的選擇直接關(guān)系到算法的效率及背景模型的質(zhì)量。
在序列圖像中,背景與目標的顏色通常是不同的,表現(xiàn)為在3個顏色分量上灰度不一樣。考察某一序列圖像在某一像素上灰度分布,通常由背景灰度、目標灰度、隨機噪聲灰度構(gòu)成。某一序列圖像上某一像素藍、綠、紅顏色分量的分布如圖2所示。
由圖2可見,3個顏色分量上直方圖明顯分為比較集中的兩簇直方柱和少量孤立分布的短直方柱,分別對應(yīng)背景顏色灰度、目標顏色灰度和噪聲顏色灰度,因而,可以選擇背景所對應(yīng)的顏色灰度作為背景模型在該像素對應(yīng)顏色分量的灰度值。
但是,如果為圖像中每一個像素儲存3個255級的灰度直方圖,內(nèi)存的消耗是比較大的,觀察圖2可知,由于受到光照等環(huán)境因素和攝像機自身因素的影響,目標和背景的灰度分布并不集中在某一灰度值上,而是分布在一定的灰度范圍內(nèi)。直方圖中的峰值,代表與其他灰度值相比,它所對應(yīng)的灰度值出現(xiàn)的概率最高。但同時也看到峰值周圍的直方柱與峰值相比略小,表明其對應(yīng)的灰度值出現(xiàn)的概率也很高。如果此時選擇峰值對應(yīng)的灰度值作為背景模型在該像素對應(yīng)分量的灰度值,將忽略次高直方柱對應(yīng)的灰度值對背景模型的貢獻。
以上問題,可以通過適當降低灰度級數(shù)M來解決,將0~255灰度級變換到0~(M-1)級,再次建立灰度等級直方圖。某序列圖像中某一像素各顏色分量灰度直方圖如圖3所示。
觀察圖3發(fā)現(xiàn),直方圖中,背景和目標部分仍然分明,而原直方圖中,一定范圍內(nèi)的直方柱被合并,峰值大大提高,與其周圍的直方柱相比,差距更加明顯,將峰值重新變換到0~255區(qū)域,并作為背景模型在該像素對應(yīng)分量的灰度值。這樣處理的結(jié)果使儲存直方圖的內(nèi)存為原來的M/255,同時,由于原直方圖中在峰值附近一定范圍內(nèi)的直方柱被合并,因而考慮到更多次高峰值所對應(yīng)的灰度值對背景的貢獻。
由以上分析可知,M值越小,其內(nèi)存要求越少,而M值的減小,必然會減小背景模型的顏色分辨率。
對于一幅8位3通道彩色圖像,可表現(xiàn)的顏色為2563=16 581 375種,本算法生成的背景模型為M3種,為原來的(M/255)3,因此顏色分辨率會大大降低。但在實際應(yīng)用中,彩色圖像往往會被轉(zhuǎn)化為灰度圖像處理,即有效灰度級只有256級,因而過高的顏色分辨率是不必要的。為了使得背景模型有能力表現(xiàn)0~255級的灰度背景,顏色分量上能表現(xiàn)的最小的灰度應(yīng)為3(在0~255灰度等級下),因為在3個顏色分量中,當某一分量為3,而其余2個分量為0時,轉(zhuǎn)化到灰度圖像后,其灰度值正好為1,即可以表現(xiàn)單位灰度級。根據(jù)式(3),只要滿足以下條件,即當M大于64時,生成的背景模型有能力表現(xiàn)256個灰度等級的顏色。
M>64.75。
由于在實際應(yīng)用中,建立背景模型的目的,常常是為了分離背景與目標,對于它能夠表現(xiàn)出多少顏色并不十分關(guān)心,因此M值的選擇可以在保證一定的背景表現(xiàn)能力的情況下,繼續(xù)降低,即小于64,具體取值以在直方圖中足以分離背景和目標為準。
下面以一段長度為801幀的視頻圖像為材料,應(yīng)用本文提出的背景模型建立方法建立背景模型,并分割目標與背景,同時與普通圖像時間平均法進行對比。該實例程序用Visual C++編制。原視頻圖像如圖4所示。
實驗視頻中,一個身著暗黑色衣服的目標人物在靜態(tài)場景中來回走動。選擇前50幀作為背景模型的訓(xùn)練圖像,并取M值為26,采用本文算法及時間平均圖像法得到的背景模型如圖5所示。
由圖5可見,在時間平均圖像法得到的模型中,人行走的區(qū)域稍暗,甚至明顯可見人物運動的痕跡,這是由于人物在視頻中顏色偏暗,其RGB 3個顏色分量都較低,平均后使得各個顏色分量灰度值小于背景應(yīng)有的顏色分量。而本文算法所建立的背景模型,由于算法對灰度值的選擇性,排除了運動目標與噪聲對背景模型的影響,沒有出現(xiàn)前者出現(xiàn)的問題,更能反映出真實的背景。
下面在已建立的背景模型基礎(chǔ)上,使用差分圖像法分割目標與背景。
差分圖像由以下檢測規(guī)則計算得到:
1)先將背景圖像與第k幀圖像轉(zhuǎn)換成灰度圖像,應(yīng)用以下轉(zhuǎn)換公式(4)得到分別代表轉(zhuǎn)換后的第k幀灰度圖像與背景灰度圖像。
(4)
2)計算變化區(qū)域與背景的差分圖像,規(guī)則如下:
(5)
式(5)中T為檢測的閥值,可以根據(jù)具體參數(shù)情況,通過多次的實驗分析取得最優(yōu)值,以盡量分割出完整的運動目標。在這里得出T=15,得到的差分圖像如圖6所示。
上節(jié)步驟2中得到的差分圖像,往往帶有大量噪聲,為去除這些噪聲可以使用形態(tài)學(xué)處理方法減少或消除這些干擾,在這里,使用開運算對差分圖像進行處理。2種算法形態(tài)學(xué)處理后的分割結(jié)果如圖7所示。
由圖6可見,在T=15時,2種算法都能夠較完整地分割出運動目標,其中本文算法得到的差分圖像較為理想,雖然也存在不少噪聲,但經(jīng)形態(tài)學(xué)處理后,噪聲幾乎被完全消除,實現(xiàn)了目標與背景的分離,如圖7(b)所示。而平均法背景得到的背景圖像殘留有明顯的運動痕跡,這些痕跡被錯誤地標識為運動目標,即使對其進行形態(tài)學(xué)處理,也難以消除這些偽目標,如圖7(a)所示。為解決這一問題,可以增加背景模型訓(xùn)練的圖像數(shù)量,但這需要更多的訓(xùn)練時間和內(nèi)存空間。另一個方法是增大閥值T,但這同時可能會將一部分運動目標標識為背景圖像,使得目標出現(xiàn)“腐蝕”或“孔洞”,破壞了目標的完整性,從而對目標定位的準確度產(chǎn)生影響。由此可見,本文算法相對于傳統(tǒng)的時間平均圖像法優(yōu)勢明顯。
由實驗結(jié)果可以看出,本文提出的背景模型的建立方法與傳統(tǒng)的時間平均圖像法相比在內(nèi)存消耗、處理時間、抗干擾能力等方面有很大的優(yōu)勢,同時能為后續(xù)背景與目標的分割奠定良好的基礎(chǔ)。傳統(tǒng)的建立背景模型的方法是時間平均圖像法,該方法用多幀圖像的平均像素值作為背景在該位置的像素值,其需要訓(xùn)練圖像多,建立速度慢。
使用平均圖像法和本文方法對20段視頻圖像進行背景建模實驗。平均圖像法和基于像素直方圖建立背景模型方法的比較結(jié)果見表1。
由實驗結(jié)果可知,本文算法訓(xùn)練速度快,需要的訓(xùn)練圖像少,與平均圖像法相比具有明顯優(yōu)勢。
表1 平均圖像法和基于像素直方圖建立背景模型方法的比較
運動目標檢測一直是圖像處理的熱點,其中背景模型的建立是運動目標檢測的基礎(chǔ)和關(guān)鍵,而傳統(tǒng)平均背景法建立模型訓(xùn)練時間較長,需要的訓(xùn)練圖像多。本文針對平均背景法存在的這2項不足,提出一種基于像素直方圖的背景模型建立方法。實驗表明,與平均背景法相比,該方法需要的訓(xùn)練圖像幀數(shù)更少,建立模型速度更快,抗干擾能力強,具有一定的實際應(yīng)用價值。
[1] 常奇峰.基于VC++的數(shù)字圖像處理軟件開發(fā)[D].南京:南京航空航天大學(xué),2010.
[2] 趙鳳怡.基于VC++的數(shù)字圖像處理系統(tǒng)的設(shè)計[J].通訊世界,2015(9):198.
[3] Alvar M,Sanchez Alvaro,Arranz Alvaro.Fast background subtraction using static and dynamic gates[J].Artificial Intelligence Review,2014,41(1):113-128.
[4] Neves J,Narducci F,Barra S,et al.Biometric recognition in surveillance scenarios: a survey[J].Artificial Intelligence Review,2016,46(4):1-27.
[5] Lingam RA,Kumar KS.Statistically tuned Gaussian background subtraction technique for UAV videos[J].Sadhana,2014,39(4):785-808.
[6] Satpathy A,Jiang X,Eng HL.Human detection by quadratic classification on subspace of extended histogram of gradients[J].IEEE Transactions on Image Processing A Publication of the IEEE Signal Processing Society,2014,23(1):287-297.
[7] Boroujeni HS,Charkari NM.Robust moving shadow detection with hierarchical mixture of MLP experts[J].Signal Image and Video Processing,2014,8(7):1291-1305.
A Method to Establish Static Background ModelBased on Pixel Histogram
HuaJiang,ZhangShengjun
(School of Mechanical and Electronic Engineering,Hubei Polytechnic University,Huangshi Hubei 435003)
Moving object detection is the basis of the advanced application such as target tracking,target classification,target behavior understanding,and the accuracy of background model is the key to target testing.Nowadays the method of building background model is time average images method.This paper proposed a method based on pixel histogram to build background model to solve such problems as excessive computation and lack of sensitivity to noise.By establishing a statistical histogram for each pixel over a period of time,selecting a high frequency pixel as the background pixel of this point can create a background model.The experiments results showed that the pixel-based histogram method was faster and less memory space requiring and stronger anti-jamming capability compared with the traditional time average images method,which can set up a quick and accurate background model in experiments.
moving object detection;histogram;static background model
2016-10-10
華江,助教,碩士。
10.3969/j.issn.2095-4565.2017.06.008
TP391
A
2095-4565(2017)06-0031-06
(責任編輯吳鴻霞)