司莉莉,郭春生
(杭州電子科技大學(xué) 通信工程學(xué)院,浙江 杭州 310018)
基于線性稀疏模型和iHMM的群體異常事件檢測
司莉莉,郭春生
(杭州電子科技大學(xué) 通信工程學(xué)院,浙江 杭州 310018)
在群體異常檢測中,人群特征感知主要提取個體的群體特性。提出了基于群特征的稀疏線性模型和無限隱馬爾可夫(SLM-iHMM)方法檢測人群異常事件。該方法通過統(tǒng)計模型整合空間和時間因素,基于SLM提取空間線索,從而在空間域中建立用于群特征提取的統(tǒng)計模型。時間線索在iHMM中被明確地編碼,用于分析來自空間域的時間多尺度特征。關(guān)于UMN數(shù)據(jù)集的實驗驗證了該方法的可行性和有效性。
稀疏線性模型;空時因素;群體異常檢測
群體場景中的視頻異常事件檢測成為智能監(jiān)控領(lǐng)域的一個熱點方向。視頻異常事件發(fā)生的區(qū)域比較復(fù)雜,可能發(fā)生在時域、空域或空時域。目前,視頻異常事件檢測算法主要基于機器學(xué)習(xí),該方法首先從原始視頻圖像中提取出樣本事件的特征,通過特征學(xué)習(xí)建模獲得正常樣本的特征規(guī)律。檢測時,從測試視頻數(shù)據(jù)流中提取出樣本事件的特征,使用訓(xùn)練好的模型進行估計,如果不符合正常樣本事件的特征規(guī)律,則被看作異常事件。
對于群體異常事件的場景,章東平等[1]采用粒子視頻流獲得特征點運動軌跡,通過最長共同子序列聚類粒子軌跡,得到運動的主流方向,自動識別人群行為;Wang等[2]針對光流計算量大和空時梯度需要包含輪廓信息的缺陷,將光流和空時梯度相結(jié)合,提出將KLT(Kanade Lucas Tomasi)角點作為特征來描述運動特征。國外,基于空時特征提取的一些異常檢測方法也應(yīng)運而生。Kuettel等[3]提出了一種新的相關(guān)狄利克雷過程隱馬爾可夫模型(Dependent Dirichlet Process-Hidden Markov Model,DDP-HMM),它基于iHMM和LDA(Latent Dirichlet Allocation)模型,在復(fù)雜的動態(tài)場景中自動學(xué)習(xí)時空相關(guān)性。其它的異常檢測方法通過分析時空環(huán)境和時空紋理來提取圖像特征,文獻[4]提出一種基于對視頻立方體內(nèi)的時空視頻體積配置分析的無監(jiān)督統(tǒng)計學(xué)習(xí)框架。通過稀疏編碼來學(xué)習(xí)全局和局部活動模式,再從正常行為學(xué)習(xí)的構(gòu)圖模式字典中,稀疏重建成本標準被設(shè)計為檢測在全局和本地視頻中發(fā)生的異常。
群體特征是每個個體群體特征的集合,即群體特征是群體中所有個體的一致性表現(xiàn),群體中的個體既表現(xiàn)出一致的社會性,又具有相異的隨機性。由于群體特征的復(fù)雜性,本文提出一種基于稀疏線性模型[5](Sparse Linear Model, SLM)和無限狀態(tài)馬爾科夫模型[6](infinite Hidden Markov Model,iHMM)的空時模型——SLM-iHMM,分別在空間和時間上描述特征。假設(shè)群體特征服從一定先驗分布,建立每個個體群體性和隨機性的統(tǒng)計表征模型,以協(xié)調(diào)群體中個體的群體性與隨機性,從而有效增強群體特征抽取的適應(yīng)性,提高異常檢測準確率。
1.1 基于SLM-iHMM的群體異常檢測算法
本節(jié)將詳細介紹所提出的模型。首先,提取底層光流特征,該特征顯示較弱的時空特性。為了提高空時特征描述能力,在本文中引入時空SLM-iHMM。在空間域中,假設(shè)低級特征作為輸入以及需要的組特征作為SLM的輸出,在時域中,用iHMM捕獲稀疏向量的時間特性關(guān)系。該方法的流程如圖1所示。
圖1 SLM-iHMM算法流程
1.2 特征選擇與稀疏學(xué)習(xí)
首先闡述圖像特征選擇與稀疏學(xué)習(xí)之間的關(guān)系。通常能用很多屬性描述一個西瓜,例如色澤、根蒂、敲聲、紋理、觸感等,但是有經(jīng)驗的人往往只需觀察根蒂與敲聲就知道是否是好瓜。換言之,對一個學(xué)習(xí)任務(wù)而言,給定屬性值,其中一些屬性可能非常關(guān)鍵、有用,另一些則可能無用。在視頻圖像處理領(lǐng)域,將這些屬性稱為相關(guān)特征,無用屬性稱為無關(guān)特征。從給定的特征集合中選擇出相關(guān)特征子集的過程,稱為特征選擇。
特征選擇是一個重要的數(shù)據(jù)預(yù)處理過程,是機器學(xué)習(xí)中研究最早的分支之一,早期研究主要是按特征子集“生成與搜索—評價”過程來進行。在現(xiàn)實機器學(xué)習(xí)任務(wù)中,獲得數(shù)據(jù)之后通常先進行特征選擇,此后再訓(xùn)練學(xué)習(xí)器。進行特征選擇有兩個重要原因:維數(shù)災(zāi)難問題和特征選擇性[7]。在稀疏學(xué)習(xí)中,目標函數(shù)被一組基函數(shù)表示,這種表示具有兩種約束:稀疏性與統(tǒng)計獨立性。稀疏性約束使目標函數(shù)能被盡量少的基函數(shù)進行線性表示,而統(tǒng)計獨立性約束能夠使稀疏編碼的冗余盡量減小。
1.3 底層特征表示
要進行群體異常檢測,首先要提取圖像的底層特征進行預(yù)處理。為了提高檢測效率,本文將檢測范圍縮小,只關(guān)注人群的全局活動,對個體的局部特征不予考慮。對于已錄制的視頻,連續(xù)抽取視頻幀的光流特征。光流向量保留8個方向與2個尺度的運動信息,對于每一視頻幀,選取10×10的像素單元抽取其位移信息。
1.4 基于線性稀疏模型的空間特征
在一個SLM模型中,假設(shè)y作為數(shù)據(jù)的輸入,一般情況下,y是高維且冗余度較高的原始圖像信號,X是給定的過完備的用正常視頻特征訓(xùn)練的字典,u即是所求的稀疏向量。該項不僅具有稀疏性,而且還具有空間特性。假設(shè)視頻光流特征y∈Rm為SLM模型的輸入數(shù)據(jù),則稀疏線性模型可以表示為:
(1)
其中編碼字典為X∈Rm×n,編碼噪聲為ε~N(0,σ2I),y服從高斯分布,即P(y|u)=N(y|Xu,σ2I)。由于圖像特征在空間和時間域中的不規(guī)則分布,難以直接提取群體特征,本文假設(shè)u為每個個體的群體特征部分。自然圖像的群體特征呈現(xiàn)超高斯(或稀疏)形式表征,本文假設(shè)空間群體特征u服從超高斯分布,其形式如下:
(2)
其中,ti(ui)為限制超高斯勢能函數(shù)。
(3)
(4)
采用雙環(huán)算法求解目標優(yōu)化函數(shù)。雙環(huán)算法主要分為內(nèi)環(huán)過程和外環(huán)過程兩部分求解。對于內(nèi)環(huán)過程,根據(jù)迭代最小二乘算法(IRLS)求解;對于外環(huán)過程,重新估計u。內(nèi)環(huán)過程和外環(huán)過程不斷進行迭代,直到外環(huán)收斂,得到稀疏向量uMAP。
1.5 基于iHMM的時間特征提取
2002年,Beal等提出了無限狀態(tài)隱馬爾可夫模型iHMM,iHMM不再需要人為指定狀態(tài)數(shù)目,而是讓數(shù)據(jù)自己說話,根據(jù)數(shù)據(jù)的自身特性智能地挑選最優(yōu)的狀態(tài)數(shù)目。群體異常事件的發(fā)生域是復(fù)雜的,它可能發(fā)生在時域、空域或空時域,通過iHMM對空間域的主題提取時間特征,增強時空特征的描述能力。
本文利用iHMM在時間上的多尺度特性來提取圖像特征的時間關(guān)系。首先將訓(xùn)練視頻段的稀疏向量u={u1,...uM}作為iHMM的輸入,訓(xùn)練得到具有時空特性的模型狀態(tài)轉(zhuǎn)移概率矩陣π和狀態(tài)觀測矩陣φ。本文選用訓(xùn)練視頻序列的平均對數(shù)似然函數(shù)作為每個圖像的新特征,該表達式可以表示為:
(5)
異常檢測時,將測試視頻段的稀疏向量作為已訓(xùn)練iHMM的輸入,計算得到每一幀的對數(shù)似然函數(shù)f=logp(ut|π,φ),然后將f和L作差,若差值大于設(shè)好的閾值,判斷該幀為異常幀。
實驗選取的視頻數(shù)據(jù)來自UMN公開數(shù)據(jù)集,包括室內(nèi)外的3個不同場景。正常行為主要包括駐足、交談、散步等,異常行為為群體性逃跑事件。對于每一個視頻場景,抽取前150正常幀作為訓(xùn)練視頻集,用于訓(xùn)練SLM-iHMM模型。同時,將整個視頻場景作為測試視頻集。三個場景中的異常幀分別是:93、128、180幀。實驗證明,每個場景分別檢出87、119和170幀。3個場景的平均AUC(AreaunderCurve)及與其它算法比較的ROC(接收者操作特征,ReceiverOperatingCharacteristic)如圖2所示。
圖2 三種算法的ROC圖
從表1數(shù)據(jù)可以看到,本文算法與其它相關(guān)檢測算法相比,具有更優(yōu)秀的檢測性能[3-4]。
本文提出基于稀疏線性模型和iHMM模型的空時模型群體異常檢測算法,在空間域,基于稀疏線性模型建立個體特征與群體特征的超高斯先驗統(tǒng)計表征;在時間域,基于iHMM對稀疏向量提取時間關(guān)系,完善了群體特征空間和時間因素的整合。大量實驗仿真結(jié)果驗證了算法的可行性和有效性。
[1] 章東平, 童超, 蘆亞飛. 基于粒子視頻的高密度人群主流運動檢測[J].電子技術(shù)應(yīng)用, 2012, 38(4):123-125.
[2] S WANG, Z MIAO. Anomaly detection in crowd scene[C]. 2010 IEEE 10th International Conference on Signal Processing (ICSP), 2010: 1220-1223.
[3] KUETTEL D,et al.What's going on? discovering spatio-temporal dependencies in dynamic scenes[C].IEEE Conference on Computer Vision and Pattern Recognition,2010:1220-1223.
[4] LI N, et al.Spatio-temporal context analysis within video volumes for anomalous-event detection and localization[J]. Neurocomputing, 2015.
[5] M W SEEGER, H NICKISCH. Large scale Bayesian inference and experimental design for sparse linear models[J]. SIAM Journal on Imaging Sciences, 2011, 4(1):166-199.
[6] 朱明.視頻異常事件檢測研究[D].杭州:杭州電子科技大學(xué),2010.
[7] 周志華.機器學(xué)習(xí)[M].北京:清華大學(xué)出版社,2016.
[8] 王晶.稀疏貝葉斯學(xué)習(xí)理論及應(yīng)用研究[D].西安:西安電子科技大學(xué),2012.
(責(zé)任編輯:黃 健)
國家自然科學(xué)基金項目(61372157)
司莉莉(1991-),女,江蘇連云港人,杭州電子科技大學(xué)通信工程學(xué)院碩士研究生,研究方向為信號與信息處理。
10.11907/rjdk.162548
TP306
A
1672-7800(2017)003-0001-02