史東承, 李雪燕, 石小丁
(1.長(zhǎng)春工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院, 吉林 長(zhǎng)春 130012;2.吉林省長(zhǎng)春市高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)管理委員會(huì), 吉林 長(zhǎng)春 130012)
?
ViBe背景減除步態(tài)檢測(cè)
史東承1,李雪燕1,石小丁2
(1.長(zhǎng)春工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院, 吉林 長(zhǎng)春130012;2.吉林省長(zhǎng)春市高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)管理委員會(huì), 吉林 長(zhǎng)春130012)
摘要:在步態(tài)檢測(cè)過程中,ViBe算法利用單幀進(jìn)行像素建模以及背景突然變化的處理。與混合高斯模型進(jìn)行了對(duì)比分析,結(jié)果表明,該ViBe算法在建模、識(shí)別率等方面具有優(yōu)勢(shì)。
關(guān)鍵詞:步態(tài)檢測(cè); 背景消除; 背景建模;ViBe; 混合高斯模型
0引言
步態(tài)檢測(cè)是從視頻序列中提取出人體輪廓,是步態(tài)識(shí)別過程的第一步,也是至關(guān)重要的一步,步態(tài)特征的提取及識(shí)別與步態(tài)檢測(cè)息息相關(guān)。從國(guó)內(nèi)外的文獻(xiàn)來看,步態(tài)檢測(cè)的算法包括光流法、背景減除法以及幀間差分法。
背景減除法是目前檢測(cè)中最常用的方法,它利用含有運(yùn)動(dòng)目標(biāo)的當(dāng)前圖像減除背景圖像得到運(yùn)動(dòng)區(qū)域的輪廓。背景減除法最重要的是建立合適的背景模型,中值濾波法、均值濾波法以及混合高斯模型是背景減除法常用的建模方法[1-2],前兩者適合背景不變或者緩慢變化的場(chǎng)景,自動(dòng)更新效果不好,后者通過多個(gè)高斯分布混合模型對(duì)像素進(jìn)行建模,在背景發(fā)生變化時(shí)能夠取得良好的結(jié)果,但其依賴于概率密度函數(shù)或統(tǒng)計(jì)學(xué),這就要求我們對(duì)數(shù)學(xué)知識(shí)有非常好的掌握。文中提出一種不依賴概率密度函數(shù)基于像素建模的算法,即ViBe算法[3]。該算法簡(jiǎn)單,可以有效地完成人體輪廓的提取,并且提取的結(jié)果比較理想。
1ViBe算法描述
在實(shí)時(shí)應(yīng)用中,要想取得理想的結(jié)果,背景減除方法要處理好3個(gè)問題:
1)背景建模;
2)模型初始化;
3)模型隨時(shí)更新。
大多數(shù)論文描述了背景建模和更新機(jī)制,只有少數(shù)討論了初始化,而當(dāng)期望獲得快速響應(yīng)時(shí),初始化是至關(guān)重要的。另外,省略模型初始化過程會(huì)使得模型和更新機(jī)制之間缺少連貫性。
1.1像素模型和分類過程
ViBe算法是基于像素的模型,該方法為每個(gè)像素點(diǎn)存儲(chǔ)了一個(gè)樣本集,像素點(diǎn)過去的像素值和其鄰居點(diǎn)的像素值就是樣本集中采樣值,然后通過比較每一個(gè)新的像素值和樣本集相似的程度來判斷是否屬于背景點(diǎn)。
ViBe背景建模如圖1所示。
圖1 ViBe背景建模
為每個(gè)像素點(diǎn)建立一個(gè)背景模型,此背景模型包含N個(gè)樣本
(1)
式中:p(x)----x處的像素值;
M(x)----x處的背景建模值;
N----樣本集大小。
然后比較像素p(x)與背景模型M(x)的相似度,如果不相似,分類為前景,否則為背景。數(shù)學(xué)上相似度可表示為:
(2)
式中:SR(p(x))----x處以R為半徑;
p(x)----中心的球體;
U----球體與背景模型的交集。
當(dāng)給定的閾值Umin大于U時(shí),待分類像素p(x)與背景模型不相似;否則為相似。
1.2單幀初始化背景模型
文獻(xiàn)[4-6]中很多主流的方法都需要多幀初始化模型,但是人們更希望從比傳統(tǒng)背景減除算法初始化序列需要的更短序列中獲得前景。針對(duì)這種情況,文中提出了一種新的方法,背景模型可以僅從單幀中獲得。在應(yīng)對(duì)突發(fā)光照變化時(shí)這種方法很簡(jiǎn)單,丟棄現(xiàn)有的背景模型,并且瞬時(shí)初始化一個(gè)新的模型。
由于單幀中無法體現(xiàn)時(shí)間信息,假設(shè)鄰居點(diǎn)像素有相似的時(shí)空分布,用每個(gè)鄰居點(diǎn)的值填充像素模型。準(zhǔn)確來說,我們是用第一幀中隨機(jī)選取的鄰居點(diǎn)的值進(jìn)行填充。需要鄰域的大小可以選擇,以使得它大到足以包括不同樣本的足夠數(shù)量,同時(shí)牢記在不同的位置值之間的統(tǒng)計(jì)相關(guān)性隨鄰域的尺寸變大而減小。
形式上,我們假設(shè)t=0時(shí)為第一幀,NG(x)為像素x的鄰居點(diǎn)。因此
(3)
式中:y----隨機(jī)選擇的鄰居點(diǎn)。
這種策略很好,但是也存在一些問題,就是會(huì)出現(xiàn)“鬼影”[7],即運(yùn)動(dòng)物體在第一幀時(shí)是以運(yùn)動(dòng)形式存在的,而在后續(xù)檢測(cè)中卻不運(yùn)動(dòng)了。這是由于在背景抽樣過程中,把運(yùn)動(dòng)目標(biāo)作為抽樣得到的初始化結(jié)果,這種錯(cuò)誤的初始化結(jié)果出現(xiàn)了“鬼影”。為了消除“鬼影”,提出了以下更新方案。
1.3背景模型更新策略型
背景模型能夠適應(yīng)比如光照的變化,背景物體的變更等背景的變化,這就是背景模型的更新。
嚴(yán)格意義上來說,時(shí)間信息對(duì)于比較模糊的背景是沒有作用的。但是背景減除是一個(gè)時(shí)空過程,為了優(yōu)化這個(gè)方法,我們可以假設(shè)該相鄰點(diǎn)像素的時(shí)間分布與該像素點(diǎn)是相似的。根據(jù)這個(gè)假設(shè),為了能夠把隱藏在前景當(dāng)中的背景像素更新到背景模型中,最好的方法就是在采用保守更新策略的基礎(chǔ)上同時(shí)擴(kuò)展空間信息。文中提供了一種利用空間信息的簡(jiǎn)單而有效的方法,這使得我們能夠克服大多數(shù)純保守更新方案的缺點(diǎn)。
更新策略包含3個(gè)重要部分:
1)無記憶更新策略,背景像素模型中樣本的平滑生命周期得以保證;
2)隨機(jī)時(shí)間二次采樣,擴(kuò)展時(shí)間窗口的背景像素模型;
3)空間上傳播背景像素樣本機(jī)制,空間連續(xù)性得以保證。
為使“百條禁令”落地生根,宿州公司不斷創(chuàng)新管理的方法和手段,強(qiáng)約束、硬考核,聚力“兩個(gè)融合”,深化“三個(gè)結(jié)合”,努力塑造安全型員工,打造安全型企業(yè),形成安全管理新常態(tài)。新措施帶來新成效,“百條禁令”頒布實(shí)施以來,該公司共下發(fā)通報(bào)20期,考核約8萬余元,有效遏制了現(xiàn)場(chǎng)違章,2013年-2015年,該公司呈現(xiàn)了不安全事件逐年下降的良好態(tài)勢(shì),為該公司順利完成五星級(jí)三連冠、全國(guó)安全文化示范企業(yè)等年度安全目標(biāo)任務(wù)提供了堅(jiān)實(shí)的保障
2更新策略
2.1無記憶更新策略
采用先進(jìn)先出的策略更新模型是很多基于樣本方法經(jīng)常使用的方法[8-9]。為了合理處理背景場(chǎng)景各種事件,文獻(xiàn)[5]提出了包含大量樣本的像素模型,但是這對(duì)于高幀率視頻來說是不適用的。文中提出了一種指數(shù)單調(diào)衰減剩余樣本周期的方法,這種方法為了提高估計(jì)的時(shí)間相關(guān)性,允許像素模型中仍然保留一些較早的樣本。最終使得模型中不會(huì)包含前景值,是這種方法和保守更新策略相結(jié)合的結(jié)果。
這種方法簡(jiǎn)單而有效:在均勻概率密度函數(shù)前提下,不是死板的把最早的樣本從樣本中移除,而是隨機(jī)地選擇舍棄的樣本,然后移除的樣本被新值代替。這種隨機(jī)策略不能算是真正意義上的保守更新策略,因?yàn)樗c原來的思想相矛盾。原來的思想是最先替換的應(yīng)該是越早出現(xiàn)的像素樣本,并且更新過程的穩(wěn)定性對(duì)于保守更新策略來說是至關(guān)重要的。實(shí)際上,一種不確定性的背景減除算法在保守更新策略中出現(xiàn),模型不會(huì)隨著時(shí)間產(chǎn)生偏離在保守更新策略中得以保證。盡管這樣,不同時(shí)間的同一序列在此背景減除算法下的處理結(jié)果也可能產(chǎn)生細(xì)微的差別。
從數(shù)學(xué)上來說,假設(shè)時(shí)間是連續(xù)的,一個(gè)樣本值在時(shí)刻t不被更新的概率是(N-1)/N,那么樣本值在dt時(shí)間之后仍然保留的概率是
(4)
也可寫作
(5)
這個(gè)表達(dá)式表明模型中的這個(gè)樣本值被替換與否和時(shí)間t無關(guān)。這種性能被稱作無記憶性能,對(duì)指數(shù)密度是可用的,在背景減除領(lǐng)域有顯著、獨(dú)特的性能。它完全可以讓我們定義一個(gè)時(shí)間段的歷史像素樣本,從某種程度上來說,允許更新機(jī)制適應(yīng)任意的幀速。
2.2時(shí)間二次采樣
采取隨機(jī)時(shí)間二次采樣可以進(jìn)一步擴(kuò)展時(shí)間窗口大小,這個(gè)時(shí)間窗口是由固定大小像素模型覆蓋的。其思想是在很多實(shí)際情況中,每一新幀的每個(gè)背景像素模型沒有必要全部更新,通過讓背景更新不頻繁,背景樣本的預(yù)期壽命可以人為的延長(zhǎng)。但是固定的二次采樣間隔在周期或偽周期背景運(yùn)動(dòng)存在時(shí),可能會(huì)阻止背景模型正確的適應(yīng)這些運(yùn)動(dòng)。當(dāng)該點(diǎn)像素值已經(jīng)屬于背景時(shí),隨機(jī)過程決定這個(gè)值是否隨像素模型相應(yīng)地更新,所以采用隨機(jī)的二次采樣策略成為當(dāng)務(wù)之急。實(shí)際上,當(dāng)該像素值已經(jīng)屬于背景時(shí),隨機(jī)過程決定這個(gè)值是否用于更新相應(yīng)的像素模型。
2.3背景樣本傳播空間一致性
由于使用了保守更新方案,當(dāng)務(wù)之急就是解決如何把前景當(dāng)中隱藏的背景像素模型進(jìn)行更新。W4的算法[10]是現(xiàn)在流行的方法,該方法通過計(jì)算該像素連續(xù)被檢測(cè)為前景的次數(shù)來確定是否更新為背景點(diǎn)。即要想將一個(gè)像素點(diǎn)更新為背景,就要使得該像素點(diǎn)連續(xù)N次檢測(cè)為前景。背景像素模型中永遠(yuǎn)不會(huì)存在前景的像素值,這是保守更新策略的優(yōu)勢(shì),為了方便,在前景像素融入背景模型過程中,這些方法起到了一定的延緩作用。此外,由于這些方法取決于二元判決,從一個(gè)夾雜真實(shí)前景物體的背景模型中恢復(fù)出來需要時(shí)間,因此,提出了不同的方法。
鄰域像素模型可以把一個(gè)新的背景樣本更新進(jìn)來,因?yàn)猷従狱c(diǎn)背景像素?fù)碛邢嗤臅r(shí)空分布。根據(jù)這個(gè)策略,在背景樣本更新時(shí),被前景遮擋的背景模型也會(huì)隨著更新,依賴抽樣的背景模型中出現(xiàn)空間信息的擴(kuò)散是可以的。背景模型因此能夠適應(yīng)不斷變化的照明和背景變化(添加或移除背景物體),同時(shí)依靠嚴(yán)格保守的更新方案。更精確來說,考慮像素x的4或8鄰域的空間鄰域,即NG(x),并且假設(shè)它已經(jīng)決定更新樣本集M(x)。然后根據(jù)統(tǒng)一的規(guī)則,隨機(jī)選擇v(x)值從鄰居點(diǎn)一個(gè)像素更新樣本集M(y∈NG(x))。
3步態(tài)描述及實(shí)驗(yàn)
3.1步態(tài)描述
流程圖如圖2所示。
圖2 流程圖
3.2試驗(yàn)及分析
實(shí)驗(yàn)中,選取室外的場(chǎng)景拍攝了一段步態(tài)視頻,并用OpenCV進(jìn)行了仿真,參數(shù)設(shè)置如下:選取半徑R=20,每個(gè)像素的樣本模型個(gè)數(shù)N=20,隨機(jī)時(shí)間二次采樣因數(shù)φ=16,這樣每一個(gè)背景像素值被選擇更新,其像素模型的幾率為1/16。從圖2可知,當(dāng)Umin=2或Umin=3時(shí),PCC達(dá)到最高。但是實(shí)驗(yàn)中發(fā)現(xiàn),由于Umin很小的一個(gè)增大就會(huì)增加計(jì)算的復(fù)雜程度,最后確定在穩(wěn)定背景場(chǎng)景下設(shè)置Umin=1,即可取得良好的實(shí)驗(yàn)結(jié)果。實(shí)驗(yàn)中,在每個(gè)像素的8鄰域連接處隨機(jī)選擇樣本的方法可以取得令人滿意的640*480分辨率的圖像。
文中采用正確分類比例(PCC)對(duì)實(shí)驗(yàn)進(jìn)行性能分析,公式如下:
(6)
式中:TP----正確分類為前景像素的個(gè)數(shù);
TN----正確分類為背景的像素個(gè)數(shù);
FP----被錯(cuò)誤分類為前景像素的背景像素個(gè)數(shù);
FN----錯(cuò)誤分類為背景像素的前景像素個(gè)數(shù)。
Umin在1~20范圍時(shí)的PCC值如圖3所示。
圖3 Umin在1~20范圍時(shí)的PCC值
同時(shí),文中把ViBe背景減除算法與混合高斯過程進(jìn)行對(duì)比,步態(tài)檢測(cè)結(jié)果顯示ViBe算法比混合高斯取得的效果好很多。對(duì)比效果如圖4所示。
這兩種算法正確率情況比較見表1。
表1 正確率比較 %
4結(jié)語
針對(duì)傳統(tǒng)建模算法存在的問題,提出一種基于ViBe算法的步態(tài)檢測(cè)。該算法實(shí)現(xiàn)簡(jiǎn)單,檢測(cè)速度快,和混合高斯模型相比有一定的優(yōu)勢(shì)。但是此算法檢測(cè)過程中會(huì)出現(xiàn)“鬼影”,雖然“鬼影”會(huì)隨之慢慢的消失,但是“鬼影”在一定時(shí)間內(nèi)對(duì)步態(tài)檢測(cè)還是有影響的。因此,要想獲得更好的步態(tài)檢測(cè)結(jié)果,如何有效的去除“鬼影”是接下來需要解決的至關(guān)重要的問題。
參考文獻(xiàn):
[1]DRMagee.Trackingmultiplevehicleusingforeground,backgroundandmotionmodel[J].ImageandVisionComputing,2004,22(2):143-155.
[2]王亮,胡衛(wèi)明,譚鐵牛.基于步態(tài)的身份識(shí)別[J].計(jì)算機(jī)學(xué)報(bào),2003,26(3):353-360.
[3]OBarnich,MVanDroogenbroeck.ViBe:Apowerfulrandomtechniquetoestimatethebackgroundinvideosequences[C]//Proc.Int.Conf.Acoust.,SpeechSignalProcess.,2009:945-948.
[4]KKim,TChalidabhongse,DHarwood,etal.Real-timeforeground-backgroundsegmentationusingcodebookmodel[J].RealTimeImaging,2005:172-185.
[5]HWang,DSuter.Aconsensus-basedmethodfortracking:Modellingbackgroundscenarioandforegroundappearance[J].PatternRecognition,2007:1091-1105.
[6]AElgammal,DHarwood,LDavis.Non-parametricmodelforbackgroundsubtraction[C]//Proceedingsofthe6thEuropeanConferenceonComputerVision-PartII,2000:751-767.
[7]RCucchiara,MPiccardi,APrati.Detectingmovingobjects,ghosts,andshadowsinvideostreams[J].IEEETransactiononPatternAnalysisandMachineIntelligence,2003:1337-1342.
[8]CCChiu,MYKu,LWLiang.Arobustobjectsegmentationsystemusingaprobability-basedbackgroundextractionalgorithm[J].IEEETransactionsonCircuitsandSystemsforVideoTechnology,2010:518-528.
[9]BWhite,MShah.Automaticallytuningbackgroundsubtractionparametersusingparticleswarmoptimization[C]//IEEEInternationalConferenceonMultimediaandExpo,Beijing:[s.n.],2007:1826-1829.
[10]HaritaogluDHarwood,LDavis.W4:Real-timesurveillanceofpeopleandtheiractivities[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2000,22(8):809-830.
GaitdetectionbasedonViBebackgroundsubtraction
SHIDongcheng1,LIXueyan1,SHIXiaoding2
(1.SchoolofComputerScienceandEngineering,ChangchunUniversityofTechnology,Changchun130012,China;2.TheCommitteeofManagement,ChangchunNationalHi-TechIndustrialDevelopmentZone,Changchun130012,China)
Abstract:Duringtheprocessofgaittesting,ViBealgorithmisusedtoestablishthesingle-framepixelmodel,anddealthesuddenchangesinbackground.ItiscomparedwiththeGaussianmixturemodelandtheresultsshowthattheVibealgorithmissuperiorinmodelingandrecognitionrate.
Keywords:gaitdetection;backgroundsubtraction;backgroundmodeling;ViBe(VisualBackgroundExtractor);Gaussianmixturemodel.
收稿日期:2015-11-10
基金項(xiàng)目:吉林省教育廳基金資助項(xiàng)目(吉教科合字[2016]第 349號(hào))
作者簡(jiǎn)介:史東承(1960-),男,漢族,吉林長(zhǎng)春人,長(zhǎng)春工業(yè)大學(xué)教授,碩士,主要從事圖像處理方向研究,E-mail:dcshi@ccut.edu.cn.
DOI:10.15923/j.cnki.cn22-1382/t.2016.3.07
中圖分類號(hào):TP391
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1674-1374(2016)03-0241-05