文|朱杰王晶杜婉音張輝柴變芳吳樹芳
基于對象識別的智能化監(jiān)所監(jiān)控方法
文|朱杰1王晶1杜婉音1張輝2柴變芳2吳樹芳3,4
監(jiān)獄是關(guān)押和改造犯罪人員的場所,對在押犯人行為的監(jiān)控是保障監(jiān)獄安全必不可少的管理手段。我國各地的監(jiān)獄一般都建立了模擬閉路電視監(jiān)控系統(tǒng)來監(jiān)控犯人的行為。由于模擬閉路電視監(jiān)控系統(tǒng)的錄像只能簡單的記錄下場景信息,并不能夠?qū)σ曨l進行實時的分析。由此可見,發(fā)現(xiàn)突發(fā)事件只能依靠值班獄警的注意力,除此之外,如果物體移動速度較快且光線不夠充足,單純的依靠人眼的判斷無法準確迅速的判斷出移動物體的身份。本文依賴于圖像處理領(lǐng)域的對象識別技術(shù)來捕獲對象信息,并且根據(jù)提取的特征來判斷對象身份。文中提出的利用智能化的圖像視頻分析技術(shù)來解決視頻監(jiān)控的問題的方法,對監(jiān)獄安全有著比較大的現(xiàn)實意義。
信息社會環(huán)境下,大力推進監(jiān)獄信息化建設,不僅是一項實現(xiàn)科技強警、科技興監(jiān)的戰(zhàn)略偉大工程,而且也是促進監(jiān)獄依法、規(guī)范、公正、文明執(zhí)法的重要保障。如何在不增加警力的情況下,提高對于監(jiān)所的監(jiān)控管理的能效率已成為迫切要求。傳統(tǒng)的視頻監(jiān)控系統(tǒng)并不能夠?qū)σ曨l進行實時的分析。依靠人工監(jiān)控的方式就更難于及時發(fā)現(xiàn)并解決問題。
智能視頻監(jiān)控技術(shù)的出現(xiàn),實現(xiàn)了監(jiān)控方式由被動到主動的轉(zhuǎn)變,能夠?qū)崿F(xiàn)全天候不間斷地對視頻進行檢測,自動發(fā)現(xiàn)監(jiān)控畫面中的異常情況,從而能夠更加有效地協(xié)助工作人員處理危機,并最大限度地降低誤報和漏報現(xiàn)象,能夠滿足監(jiān)獄安防系統(tǒng)對于安全的要求。
本文提出了一種基于顯著性圖的對象識別分類方法,首先算法要自適應的學習監(jiān)所內(nèi)干警和犯人的衣著、外形等特征。然后,提出一種能夠?qū)τ诠饩€明暗比較魯棒的顯著性圖構(gòu)造方法。接下來要自適應的學習出各種行為動作的安全性。最后把顯著性圖提取出的對象區(qū)域與自適應學到的各種行為動作做比對并進行安全性檢測。
張俊芳在分析智能視頻監(jiān)控技術(shù)的基礎(chǔ)上,探討了其在監(jiān)獄中的具體應用。尹向兵,提出在監(jiān)獄實際情況和視頻圖像識別技術(shù)的基礎(chǔ)上,利用神經(jīng)網(wǎng)絡分類器和智能終端而實現(xiàn)的基于BP神經(jīng)網(wǎng)絡的視頻圖像識別方法。張蕾程智能苴控系統(tǒng)主要是通過采用圈像處理、模式識別和計算機視覺技術(shù),采取在監(jiān)控系統(tǒng)中增加視頻分析模塊的方式。再輔助計算機強大的數(shù)據(jù)處理能力過濾掉視頻畫面無用的或干擾信息.自動識別不同物體,實現(xiàn)了集中控制和集中管理。張棉好提出雙模式高斯混合模型,即分開建構(gòu)開、關(guān)燈環(huán)境的背景高斯混臺模式,并由檢測感應式照明設施的開、關(guān)燈切換高斯模式。結(jié)果表明雙模式可較好地對近紅外線視頻圖像中人體目標進行檢測。
3.1特征提取
圖像的特征分為三種即底層特征、中級特征和高級特征。為了獲取對象區(qū)域,我們首先要提取圖像的底層特征即像素級特征。為了區(qū)分對象身份,我們需要首先進行有監(jiān)督的訓練,我們在視頻中截取1000幅干警的圖像,然后再截取1000幅犯人的圖像,用以指導以后的特征選取。由于干警的衣著體貌特征等與犯人不同,我們可以判斷出每種像素顏色對應的像素的重要性??梢岳没バ畔⒒蛘逿F-IDF來進行計算。
3.2構(gòu)造顯著性圖
文中我們改進了由Goferman等人提出的算法,我們對圖像進行了預處理,首先判斷了對象的身份,即提取圖像中各種關(guān)鍵顏色的比率。比如:我們通過之前特征提取部分的有監(jiān)督學習得到了警服的主要顏色和犯人服裝的顏色。如果發(fā)現(xiàn)圖像中某種顏色的比率變化比較明顯,證明當前圖像中的對象是有著響應的身份。其次,我們用對圖像中像素進行加權(quán)。用顏色的重要性進行加權(quán),此方法可以有效的提高顯著性圖的效果。為了解決圖像中光線不足的問題,我們引入了Color Name (CN)和HUE兩種顏色。
3.3動作的自適應學習
在3.1中我們提到,我們提取1000幅干警的圖像和1000幅犯人的圖像,并且圖像中包括各種正常的和所有非正常的動作,并配以時間標簽。比如:開車的動作,在白天是允許的,但是夜間是不允許的。稀疏編碼有非常強的去噪能力,我們可以利用稀疏編碼去掉眼鏡等裝飾物,更清晰的反應對象的真實情況。
3.3動作識別
基于視覺的人體動作識別要解決的主要問題是通過計算機對傳感器(攝像機)采集的原始圖像或圖像序列數(shù)據(jù)進行處理和分析,學習并理解其中人的動作和行為。一般在運動檢測、特征提取的基礎(chǔ)之上,通過分析獲得人體運動模式,建立視頻內(nèi)容和動作類型描述之間的映射關(guān)系,以使計算機能夠“看”視頻或“理解”視頻。本文中我們主要討論的是人體的靜態(tài)特征。