仵 博,馮延蓬,孟憲軍,江建舉,何國坤
(深圳職業(yè)技術(shù)學(xué)院 教育技術(shù)與信息中心,廣東 深圳 518055)
在安防領(lǐng)域,信息孤島問題突出.在一座城市,有公安部門安裝的攝像監(jiān)控設(shè)備,也有各個(gè)單位安裝的攝像監(jiān)控設(shè)備.這些設(shè)備或系統(tǒng)產(chǎn)生的監(jiān)控?cái)?shù)據(jù)難于實(shí)現(xiàn)互聯(lián)互通,造成信息孤島現(xiàn)象,“只見樹木,不見森林”.近年來,以云計(jì)算和物聯(lián)網(wǎng)為核心的智慧城市建設(shè)提出大安防概念[1],試圖將這些孤立的視頻信息集成在一起,從而實(shí)現(xiàn)聯(lián)網(wǎng)和共享.然而,視頻信息數(shù)據(jù)量巨大,造成通信帶寬的巨大消耗.
在安防視頻監(jiān)控領(lǐng)域,隨著高清監(jiān)控時(shí)代的到來,產(chǎn)生了越來越多的海量視頻數(shù)據(jù),是一種典型的大數(shù)據(jù).如何以較小的通信代價(jià)實(shí)現(xiàn)安防大數(shù)據(jù)的互聯(lián)互通,并具有較高的擴(kuò)展彈性和易于實(shí)施的特點(diǎn),是目前安防大數(shù)據(jù)的挑戰(zhàn)難題.針對這一挑戰(zhàn)難題,本文提出一種基于大數(shù)據(jù)的分布式云計(jì)算模型.
安防大數(shù)據(jù)具有2個(gè)明顯的特點(diǎn):1)數(shù)據(jù)規(guī)模海量化;2)數(shù)據(jù)類型非結(jié)構(gòu)化.?dāng)?shù)據(jù)規(guī)模海量化造成數(shù)據(jù)傳輸和存儲(chǔ)的困難,數(shù)據(jù)類型非結(jié)構(gòu)化為數(shù)據(jù)利用帶來了極大的挑戰(zhàn),為了解決這些難題需要大數(shù)據(jù).IDC將大數(shù)據(jù)視為一個(gè)融合的體系:具備大規(guī)模的體量(Volumes)、多樣化的種類(Variety)的數(shù)據(jù)集以及對這種數(shù)據(jù)集進(jìn)行高速(Velocity)采集、處理與分析以提取價(jià)值(Value)的技術(shù)架構(gòu)與技術(shù)過程[2].
Hadoop技術(shù)正是在此背景下誕生,歷經(jīng)數(shù)年的積累,Hadoop已成長為一個(gè)強(qiáng)大的生態(tài)系統(tǒng),成為IT領(lǐng)域廣泛采用的大數(shù)據(jù)模型框架.Hadoop主要由分布式文件系統(tǒng)(HDFS)、并行計(jì)算架構(gòu)(MapReduce)和分布式數(shù)據(jù)庫(HBase)組成.其中,HDFS是針對大規(guī)模數(shù)據(jù)的高容錯(cuò)性和高吞吐的分布式文件系統(tǒng),它可以構(gòu)建從幾臺(tái)到幾千臺(tái)由常規(guī)服務(wù)器組成的集群中,并提供高聚合輸入輸出的文件讀寫訪問.HBase是一個(gè)分布式的、按列存儲(chǔ)的、多維表結(jié)構(gòu)的實(shí)時(shí)分布式數(shù)據(jù)庫,它可以提供大數(shù)據(jù)量架構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)高速讀寫操作,為高速在線數(shù)據(jù)服務(wù)而設(shè)計(jì).MapReduce適用于大數(shù)據(jù)量處理的分布式框架,是為離線數(shù)據(jù)分析而設(shè)計(jì),利用數(shù)據(jù)的并行性進(jìn)行分布運(yùn)算,而后匯總結(jié)果的計(jì)算框架[3].
大數(shù)據(jù)已在安防領(lǐng)域初步取得成功的應(yīng)用,例如紐約市警察局與微軟合作推出了基于大數(shù)據(jù)的犯罪預(yù)防與反恐技術(shù):領(lǐng)域感知系統(tǒng)(Domain Awareness System,簡稱DAS).該系統(tǒng)能快速混合與分析從約三千臺(tái)閉路攝像機(jī)、9·11呼叫記錄、車牌識(shí)別器、輻射傳感器以及歷史犯罪記錄中獲取的實(shí)時(shí)數(shù)據(jù).目前紐約市警察局已能追蹤機(jī)動(dòng)車,并確定此車在過去幾天甚至幾個(gè)星期的所到之處;還能快速訪問犯罪嫌疑人的逮捕記錄以及所有特定案件的9·11呼叫記錄,將犯罪記錄以時(shí)間先后順序按地理空間技術(shù)映射出來,以揭示犯罪模式[3].
雖然大數(shù)據(jù)在 DAS中得到成功應(yīng)用,但是DAS的范圍還很有限.首先,存在信息孤島現(xiàn)象,各個(gè)單位和小區(qū)獨(dú)立的攝像系統(tǒng)還有充分利用,造成感知出現(xiàn)死角.其次,集中式的計(jì)算和存儲(chǔ)造成通信成本高、難于管理.為此,本文提出一種基于大數(shù)據(jù)的分布式云計(jì)算模型,其示意模型如圖1所示.
在基于大數(shù)據(jù)的分布式云計(jì)算模型中,域結(jié)點(diǎn)是一個(gè)全局結(jié)點(diǎn),負(fù)責(zé)任務(wù)的派發(fā)和信息的整合.子域結(jié)點(diǎn)為局部結(jié)點(diǎn),負(fù)責(zé)從域結(jié)點(diǎn)接收任務(wù).終端結(jié)點(diǎn)即為具體的攝像頭,負(fù)責(zé)實(shí)時(shí)傳送信息.以某城市為例,假如該城市欲將某高校納入其安防大數(shù)據(jù)范圍,而該高校又有三個(gè)校區(qū).則域結(jié)點(diǎn)為該城市安防大數(shù)據(jù)的控制中心,第一層子域結(jié)點(diǎn)為該高校的主控中心,該高校三個(gè)校區(qū)的控制中心都為第二層子域結(jié)點(diǎn),每個(gè)校區(qū)的監(jiān)控設(shè)備為終端結(jié)點(diǎn).基于大數(shù)據(jù)的分布式云計(jì)算模型具有以下優(yōu)勢:
1)擴(kuò)展彈性高.域結(jié)點(diǎn)與子域結(jié)點(diǎn)之間只需光纖連接起來,就可以實(shí)現(xiàn)對監(jiān)控范圍擴(kuò)展.
2)通信帶寬低.由于子域結(jié)點(diǎn)具有自己的計(jì)算和存儲(chǔ)能力,根據(jù)域結(jié)點(diǎn)的任務(wù)指令,子域結(jié)點(diǎn)只需將計(jì)算后的視頻信息片段發(fā)送到域結(jié)點(diǎn),從而降低通信帶寬.
3)易于實(shí)施.域結(jié)點(diǎn)與子域結(jié)點(diǎn)連接后,只需在子域結(jié)點(diǎn)處安裝相應(yīng)的軟件系統(tǒng),即可實(shí)現(xiàn)互聯(lián)互通,子域結(jié)點(diǎn)的現(xiàn)有系統(tǒng)結(jié)構(gòu)無需改變,避免重復(fù)建設(shè),節(jié)省建設(shè)成本.
圖1 基于大數(shù)據(jù)的分布式云計(jì)算模型
域(子域)結(jié)點(diǎn)的系統(tǒng)架構(gòu)采用Hadoop技術(shù)[5],由安防信息決策系統(tǒng)、分布式數(shù)據(jù)處理系統(tǒng)(MapReduce)、海量數(shù)據(jù)分布式存儲(chǔ)系統(tǒng)和分布式數(shù)據(jù)處理結(jié)點(diǎn)組成,如圖2所示.域(子域)結(jié)點(diǎn)系統(tǒng)的功能主要包括[6]:
1)統(tǒng)一指揮布控.對接入系統(tǒng)分布式網(wǎng)絡(luò)的視頻數(shù)據(jù)監(jiān)控節(jié)點(diǎn)分層次集中統(tǒng)一管理.每個(gè)管理子節(jié)點(diǎn)都能夠有效監(jiān)控其管轄下的所有監(jiān)控視頻以進(jìn)行分析處理預(yù)警,并能夠?qū)⑾嚓P(guān)處理后的特征信息反饋到上一級(jí)節(jié)點(diǎn)進(jìn)行匯總,避免監(jiān)控?cái)?shù)據(jù)孤島現(xiàn)象.同時(shí)也能接受主節(jié)點(diǎn)下發(fā)的監(jiān)控指令,對視頻內(nèi)容進(jìn)行在線處理,以識(shí)別出指令特征所描述的人物及場景進(jìn)行預(yù)警并上報(bào).
2)物體追蹤.根據(jù)物體的運(yùn)動(dòng)情況,自動(dòng)發(fā)送相應(yīng)控制指令,控制攝像頭自動(dòng)跟蹤物體.如果物體超出該攝像機(jī)監(jiān)控范圍,能自動(dòng)通知物體所在區(qū)域其它攝像頭繼續(xù)進(jìn)行追蹤.
3)人的面相、步態(tài)等識(shí)別.自動(dòng)對人臉和人的步態(tài)特征進(jìn)行識(shí)別,可以用來幫助識(shí)別和驗(yàn)證是否為指定人物的身份.
4)車輛識(shí)別.識(shí)別車輛的形狀、顏色、車牌號(hào)碼等特征,可用于監(jiān)控指定車輛的追蹤.
圖2 基于云計(jì)算的大數(shù)據(jù)安防監(jiān)控系統(tǒng)架構(gòu)
5)非法滯留的判別.對人或物體在敏感區(qū)域停留的時(shí)間超過了預(yù)定義的時(shí)間長度時(shí)產(chǎn)生報(bào)警.
6)治安事件的監(jiān)測.指定范圍內(nèi)人的行為特征是否符合某一個(gè)性行為模式,用以實(shí)時(shí)監(jiān)控預(yù)警治安事件.
本文為解決安防領(lǐng)域中的信息孤島問題,提出一種分布式云計(jì)算模型,該模型具有擴(kuò)展彈性高、通信帶寬低和易于實(shí)施等特點(diǎn).應(yīng)用是大數(shù)據(jù)的生命和價(jià)值所在,解決信息孤島問題是大數(shù)據(jù)應(yīng)用的前提.在安防大數(shù)據(jù)領(lǐng)域,有眾多應(yīng)用可以開發(fā),例如犯罪嫌疑人跟蹤、犯罪和群體事件預(yù)防、老人小孩失蹤尋找、車輛跟蹤以及交通堵塞疏導(dǎo)等等.這些應(yīng)用都與人們?nèi)粘I詈桶踩芮邢嚓P(guān),安防大數(shù)據(jù)為解決這些問題提供了一種有效手段.但是,安防大數(shù)據(jù)的基礎(chǔ)應(yīng)用理論尚需進(jìn)一步的創(chuàng)新研究,特別是需在模式識(shí)別[7,8]、數(shù)據(jù)挖掘[9-11]、機(jī)器學(xué)習(xí)[12-15]和智能決策[15-18]等關(guān)鍵技術(shù)瓶頸上取得突破.只有這些根本性的問題得到解決,安防大數(shù)據(jù)才能真正得到應(yīng)用.
[1] 楊金才.物聯(lián)網(wǎng)成就大安防[J].中國公共安全(綜合版),2012,3:30-31.
[2] 周林.中國互聯(lián)網(wǎng)市場洞見:互聯(lián)網(wǎng)大數(shù)據(jù)技術(shù)創(chuàng)新研究[EB/OL].(2012-05-24)[2013-10-11].http://www.idc.com/getdoc.jsp?containerId=CH1749312 U.
[3] 成靜靜.基于Hadoop的分布式云計(jì)算/云存儲(chǔ)方案的研究與設(shè)計(jì)[J].?dāng)?shù)據(jù)通信,2005,5:14-18.
[4] 鐘鑫,逯永超.國外警方研究利用“大數(shù)據(jù)”預(yù)防打擊犯罪[EB/OL].(2013-04-09)[2013-10-11].http://211.103.209.164/news/show.aspx?showid=4248.
[5] Durut M. Clustering Algorithms distributed over a Cloud Computing Platform[D].Paris : TELECOM ParisTech, 2012:83-117.
[6] 建新.智能視頻監(jiān)控技術(shù)的演變對比及主要優(yōu)勢[J].金卡工程,2006,4:69-71.
[7] Lee D D, Seung H S. Learning the parts of objects by non-negative matrix factorization[J].Nature, 1999,401:788-791.
[8] Tenenbaum J B, Silva V D, Langford J C. A global geometric framework for nonlinear dimensionality reduction[J].Science, 2000,290(5500):2319-2323.
[9] 孟憲軍.互聯(lián)網(wǎng)文本聚類與檢索技術(shù)研究[D].哈爾濱: 哈爾濱工業(yè)大學(xué),2009:80-120.
[10] Evans J A, Foster J G. Metaknowledge[J].Science,2011,331(6018):721-725.
[11] Frey B J, Dueck D. Clustering by passing messages between data points[J].Science, 2007,315(5814):972-976.
[12] Frommberger L, Wolter D. Structural knowledge transfer by spatial abstraction for reinforcement learning agents[J].Adaptive Behavior, 2010,18(6):531-539.
[13] Subramanian K, Isbell C, Thomaz A. Learning options through human interaction[C]//Beal J, Knox W B.Proceedings of 2011 IJCAI Workshop on Agents Learning Interactively from Human Teachers. Palo Alto:AAAI Press, 2011:39-45.
[14] 仵博.動(dòng)態(tài)不確定環(huán)境下的智能體序貫決策方法及應(yīng)用研究[D].長沙:中南大學(xué),2013:60-75.
[15] Bishop C M. Pattern recognition and machine learning[M].New York:Springer, 2006:55-60.
[16] 馮延蓬,仵博,鄭紅燕,孟憲軍.WSN中一種目標(biāo)追蹤在線節(jié)點(diǎn)調(diào)度算法[J].計(jì)算機(jī)工程,2012,38(11):96-99.
[17] Wu F, Zilberstein S, Chen X P. Online planning for multi-agent systems with bounded communication[J].Artificial Intelligence, 2011,175(2):441-790.
[18] 仵博,吳敏,佘錦華.基于點(diǎn)的POMDPs在線值迭代算法[J].軟件學(xué)報(bào),2013,24(1):25-36.