王燕妮++李軍+田思敏
摘 要: 針對傳統(tǒng)智能視頻監(jiān)控系統(tǒng)不能及時準確地發(fā)現(xiàn)危險或者發(fā)現(xiàn)危險不能及時報警的問題,提出一種基于模糊迭代自組織數(shù)據(jù)分析聚類結合直方圖熵值算法的異常行為智能檢測方法。該方法通過模糊迭代自組織數(shù)據(jù)分析聚類方法獲取視頻關鍵幀,根據(jù)分類結果采用直方圖熵值法對異常行為進行判斷。實驗結果表明,所提算法可以對具有復雜背景的監(jiān)控區(qū)域有效地實現(xiàn)人體的檢測,并且能準確地識別出人體異常的動態(tài)行為,有效地減少了住宅小區(qū)和養(yǎng)老院的安全隱患。
關鍵詞: 迭代自組織分析聚類; 關鍵幀; 直方圖熵值; 異常行為
中圖分類號: TN911.23?34 文獻標識碼: A 文章編號: 1004?373X(2017)12?0120?04
Abstract: Since the traditional intelligent video surveillance system can′t discover the danger accurately and send the alarm timely, an abnormal behavior intelligent detection method combining fuzzy iterative self?organizing data analysis (ISODATA) clustering algorithm with histogram entropy method is proposed. The key frame of video is acquired with fuzzy ISODATA clustering method. According to the classification result, the histogram entropy method is adopted to judge the abnormal behavior. The experimental results show that the proposed algorithm can detect the human body in the monitoring area with complex background effectively, identify the abnormal dynamic behavior of the human body accurately, and reduce the safe hidden trouble in residential district and nursing home effectively.
Keywords: ISODATA clustering; key frame; histogram entropy; abnormal behavior
住宅小區(qū)和養(yǎng)老院是人口比較密集的區(qū)域,那么保證區(qū)域的安全性就很重要?,F(xiàn)階段智能視頻目標識別算法大多采用SVM[1]或者隱馬爾科夫模型[2]算法,兩種算法可以達到一般實時性要求,但很多情況下還是出現(xiàn)遺漏或者誤撿,使得識別準確率不高,不能及時阻止危險行為的發(fā)生或者發(fā)生危險行為不能及時地提醒相關人員。因此,本文提出一種新的智能視頻監(jiān)控[3]系統(tǒng),可對異常行為進行實時監(jiān)控并及時報警,有效地降低誤檢和漏檢概率,減少大量的人力,保障社會秩序的穩(wěn)定。
目前許多研究使用基于統(tǒng)計學習算法對人體運動行為進行分類,需要對大量樣本標注,且需建立復雜的操作模型。Ballan等定義一種新的局部描述子[4],用圖像梯度和光流分別進行建模來表示區(qū)域興趣點的人體外觀和動態(tài)信息,用半徑聚類方法來生成視覺碼本,使用投票統(tǒng)計方法來分類人體行為。文獻[5]提出一個新的時空背景的興趣點分布特征對人體行為分類。文獻[6]研究如何從少數(shù)的視頻幀中分類人體的行為,并取得很好的分類效果。文獻[7]利用人體行為的關鍵姿態(tài)建立HMM模型,訓練動態(tài)信息。本文分析基于視頻人體行為的特點,從當前需要解決的影響人體行為識別發(fā)展的幾個關鍵技術出發(fā),提出一種基于模糊ISODATA聚類[8]結合直方圖熵值的異常行為檢測算法。
1 人體目標提取和分類
1.1 混合高斯模型的運動目標提取
背景減除法首先是分析采集到的視頻圖像在時間軸上的關系序列,利用視頻圖像的關系序列分析場景的變化模式,從而建立監(jiān)控場景的數(shù)字模型,最后通過當前輸入的視頻圖像與場景背景的數(shù)字模型的對比,結合實踐差分運算、二值化運算和形態(tài)學處理方法,采用閾值化技術實現(xiàn)運動目標的提取。
室外場景的背景構建受天氣狀況、監(jiān)控環(huán)境光照亮度和攝像機的自身運動影響會發(fā)生相應的變化,因此本文采用混合高斯分布模型[9]對視頻進行目標檢測。其不僅具有很好的抗噪性,而且對動態(tài)場景有很好的適應性?;旌细咚鼓P偷倪\算框圖如圖1所示。
1.2 關鍵幀提取和分類
使用傳統(tǒng)的視頻采集方法難以解決視頻數(shù)量成幾何級數(shù)增長對視頻分析和理解造成極大困難問題,因此需要尋求有效的視頻采集方法將有用的視頻數(shù)量從海量的視頻中查詢出來,其中基于關鍵幀[10]的視頻分析方法是非常有效的途徑之一。
為了提高基于視頻的人體行為分類效率,本節(jié)采用ISODATA聚類方法提取視頻中的關鍵幀。
視頻關鍵幀的數(shù)目需要根據(jù)內(nèi)容的變化程度來確定,通常內(nèi)容變化較大的視頻需要的關鍵幀數(shù)也較多。相對簡單的人體行為可以通過視頻序列中的幾個關鍵幀實現(xiàn)人體行為的分類與識別。人體輪廓信息的最小矩形高寬比會隨著時間周期性變化,因此,在一個周期內(nèi),高寬比函數(shù)的極值點對應的幀可近似看作為關鍵幀。對于躺下、摔倒等非周期的人體行為,因為運動姿態(tài)本身原因或者噪音干擾,使相鄰的數(shù)幀內(nèi)出現(xiàn)多個小的極值,為了獲得更準確的關鍵幀,需要利用有效的聚類算法進行處理。
根據(jù)人體目標二值圖像計算輪廓高寬比如下:
式中:H(t)為人體外接矩形的高度;W(t)為人體外接矩形的寬度;R為高度與寬度的比值。人體行為的高寬比與關鍵幀關系具體如圖2所示。本文中主要針對周期性較強的人體行為提取關鍵幀,因此可以利用人體行為高寬比以及相應的不變矩[11]作為特征,通過聚類方法獲取視頻關鍵幀。為了獲取人體行為視頻的關鍵幀,采用ISODATA聚類算法。因為ISODATA算法屬于無監(jiān)督分類算法[12],是K均值算法[13]的一種改進,不需要先驗知識,由迭代運算來確定聚類中心。
普通ISODATA聚類方法的初始聚類中心大多數(shù)都是任意選取的,使聚類結果具有很大的偶然性和聚類時間的不確定性。通過事先設定若干迭代參數(shù),再隨機選擇或設定初始聚類中心和聚類數(shù),用相似度準則[14]實現(xiàn)自動 “分裂”及“合并”,達到預期的聚類效果。因此,本文采用模糊ISODATA聚類方法,因其能夠自動確定聚類數(shù)目和初始聚類中心,避免了初始聚類中心選擇的隨機性和盲目性。
1.3 模糊ISODATA聚類算法一般步驟
1.4 關鍵幀提取實驗結果
采用模糊ISODATA聚類方法來獲取視頻的關鍵幀,其中實驗中的兩種行為的關鍵幀數(shù)量見表1。
2 異常行為檢測分析
本文采用直方圖熵值來作為人體不同行為的判別總特征,完成異常行為的分析[15?16]。直方圖發(fā)生扭轉、平移時不會改變行為特征的基本特性,比較好地反映出人體運動變化[17?18]。本文將行人的運動方向作為行為特征,將直方圖按照分類好的特征的取值范圍劃分為固定個數(shù)、大小相同的區(qū)間,再將提取到的個體行為特征投影到與之對應的直方圖區(qū)間中。根據(jù)文獻[19]原理,人體行為發(fā)生異常時,人體運動方向變化、運動幅度差別較大,可推出其所對應的直方圖的分布很均勻;相反,人體正常行走時,行人在一定時間內(nèi)運動方向大致類似、運動幅度差別不大,其直方圖特征會集中分布到某個區(qū)間上,因此根據(jù)兩者的直方圖特征可迅速直觀地判斷出人體的異常行為。直方圖模型為:
3 實驗結果及分析
文中對摔倒和奔跑兩種異常行為進行檢測。一個異常行為持續(xù)的時間一般為1~2 s,對人體運動視頻進行ISODATA聚類,分別獲取兩種行為的關鍵幀數(shù)。實驗數(shù)據(jù)見表1。視頻幀率為25 f/s,分辨率為320×240。針對三種異常行為做了大量測試,包括正常行為以及異常行為的幾種常見情況。
(1) 為了更加直觀清晰地觀察正常和異常情況下所提取的直方圖特征熵值的區(qū)別,繪制出不同行為的特征直方圖,如圖3所示。
圖3(a)~圖3(c)為一個場景內(nèi)正常行走、摔倒和奔跑的三種行為,圖3(d)~圖3(f)為對應場景圖像中提取出來的特征直方圖。圖3(a)中行人正常行走,速度和方向在一定時間內(nèi)變化不大,相對應的特征直方圖分布就集中在一個區(qū)域。圖3(b)和圖3(c)是發(fā)生異常行為,因為人體的速度和方向都會發(fā)生不同程度的變化,且雜亂無章,所以導致特征直方圖在各個區(qū)間上的分布相對比較的均勻。由實驗可知,本文所述方法提取出的特征直方圖能夠在不同場景、不同光照的視頻中明顯區(qū)分出正常和異常行為。
(2) 為了更加清晰地觀察正常和異常情況下提取的直方圖熵值變化,繪制了一段視頻中直方圖熵值變化曲線,如圖4所示。
圖4為一段視頻的直方圖熵值變化曲線,該視頻共690幀,第618幀之后發(fā)生異常事件。其中,黑色表示檢測的結果是正常行為,紅色表示檢測的結果是異常行為。從圖4可看出,隨著行為從正常到異常發(fā)生變化,人體行為越來越不規(guī)則,熵值呈上漲之勢。在600幀后,人體離開攝像頭,基于模糊聚類方法的直方圖熵值識別法,能夠準確地識別出異常行為發(fā)生的時間。
(3) 為了反映閾值T的變化對識別效果的影響,對不同閾值下的識別結果做了比較,如表2所示。
表2 異常行為識別效果
表2為隨著熵值閾值T取值的變化,基于模糊ISODATA的異常行為識別算法的檢測結果。表2中,p代表識別出異常行為的概率,e表示正常行為誤撿為異常行為的概率。由表2可知,正確識別率隨著閾值T的增加,先提升后下降,當T取值0.8時識別率最高,為97.86%。而誤撿率隨著閾值T的不斷增加卻變得越來越小,直至降為0。
(4) 為了比較本文方法和SVM[11]算法繪制出AUC異常行為 曲線圖如圖5所示。圖5為本文算法和SVM算法對異常行為識別效果的AUC(Area Under roc Curve)曲線圖,可以看出,SVM算法的識別效果較低,AUC為0.87。而本文算法之別率較高,AUC接近1。因此,基于模糊ISODATA聚類的直方圖熵值識別算法的效率比SVM更高。
4 結 語
針對經(jīng)典智能視頻人體異常行為識別算法識別率不高和算法局限性,提出一種模糊ISODATA結合HOG熵值算法的人體異常行為識別方法。通過多次實際實驗,有效地解決了非線性運動的誤跟和丟跟現(xiàn)象,對拍攝場景目標發(fā)生異常行為有較高的識別率,滿足實時性要求。
參考文獻
[1] TAX D M J, DUIN R P W. Data domain description by support vectors [C]// Proceedings of 1999 European Symposium on Artificial Neural Networks. Brussels: [s.n.], 1999: 251?256.
[2] 朱旭東,劉志鏡.基于主題隱馬爾科夫模型的人體異常行為識別[J].計算機科學,2012,39(3):251?255.
[3] MOON H M, CHAE S H, MOON D, et al. Intelligent video surveillance system using two?factor human information [J]. Telecommunication systems, 2013, 52(4): 2249?2257.
[4] BALLAN L, BERTINI M, BIMBO A D, et al. Effective codebooks for human action representation and classification in unconstrained videos [J]. IEEE transactions on multimedia, 2012, 14(4): 1234?1245.
[5] WU X, XU D, DUAN L, et al. Action recognition using context and appearance distribution features [C]// Proceedings of 2011 IEEE Conference on Computer Vision and Pattern Recognition. Rhode Island: IEEE, 2011: 489?496.
[6] SCHINDLER K, VAN GOOL L. Action snippets: how many frames does human action recognition require [C]// Proceedings of 2008 IEEE Conference on Computer Vision and Pattern Recognition. Anchorage: IEEE, 2008: 1?8.
[7] FENG X L, PERONA P. Human action recognition by sequence of move let code?words [C]// Proceedings of 2002 IEEE International Symposium on 3D Data Processing Visualization and Transmission. Padova: IEEE, 2002: 717?721.
[8] RAVI T V, GOWDA K C. An ISODATA clustering procedure for symbolic objects using a distributed genetic algorithm [J]. Pattern recognition letters, 1999, 20(7): 659?666
[9] 黃鑫娟,周潔敏,劉伯揚.自適應混合高斯背景模型的運動目標檢測方法[J].計算機應用,2010,30(1):71?74.
[10] 瞿中,高騰飛,張慶慶.一種改進的視頻關鍵幀提取算法研究[J].計算機科學,2012,39(8):300?303.
[11] 傅明,易昂,唐賢瑛,等.一種基于不變距和PNN分類網(wǎng)絡的圖形識別方法[J].交通科學與工程,2003,19(1):11?14.
[12] 李全棟,陳樹越,張微.一種改進的無監(jiān)督聚類的關鍵幀提取算法[J].應用光學,2010,31(5):741?744.
[13] 任江濤,施瀟瀟,孫婧昊,等.一種改進的基于特征賦權的K均值聚類算法[J].計算機科學,2006,33(7):186?187.
[14] 高山,祖辰,張道強.一種基于約束的中垂面相似度準則[J].計算機研究與發(fā)展,2012,49(11):2283?2288.
[15] 徐火希.基于改進Mean Shift的運動目標跟蹤算法[J].兵器裝備工程學報,2016,37(2):127?130.
[16] 寧倩慧,張艷兵,劉莉,等.擴展卡爾曼濾波的目標跟蹤優(yōu)化算法[J].探測與控制學報,2016,38(1):90?94.
[17] 程遠,李亞聰.基于相關和卡爾曼濾波的組合跟蹤算法[J].探測與控制學報,2014,36(6):63?66.
[18] 郝平.基于機器視覺的快速動態(tài)檢測研究與應用[J].兵器裝備工程學報,2016,37(2):131?134.
[19] 周潔.智能視頻監(jiān)控中人群異常行為的檢測與分析[D].寧波大學,2015.