源乘
信息科技的蓬勃發(fā)展催生了圖像監(jiān)控(又稱為“攝像機(jī)”)的普及化?;诎踩婪兜目剂?,如今各式各樣的攝像機(jī)出現(xiàn)在大街小巷之中,甚至走進(jìn)了居民住宅的私密空間。據(jù)上海市公安局交通警察總隊(duì)的統(tǒng)計(jì)數(shù)據(jù),截至2017年6月,本市公安機(jī)關(guān)用于監(jiān)控的攝像機(jī)已達(dá)到1.4萬(wàn)余個(gè)??梢哉f(shuō),我們已經(jīng)被攝像機(jī)包圍!
但是,目前監(jiān)控?cái)z像機(jī)的主要用途是“實(shí)時(shí)監(jiān)控”,便于使用者在事后查找錄像、鎖定證據(jù)、追尋線索。而在警戒、分析、預(yù)判等方面的功能卻尚不夠完善。面對(duì)數(shù)量如此龐大的攝像機(jī)以及海量的視頻,如果我們?nèi)匀谎赜谩叭肆ΡO(jiān)控、人工查詢”,結(jié)果只會(huì)效率低下。因此,如果能將“視頻圖像”轉(zhuǎn)換成計(jì)算機(jī)能夠識(shí)別的信息數(shù)據(jù)并前置于攝像機(jī)之中,由計(jì)算機(jī)代替使用者去實(shí)施查找、警戒、分析、預(yù)判,那么所有問(wèn)題將迎刃而解!在這樣的大背景下,“視頻智能分析”,“后端智能”,乃至“前端智能”的感知型攝像機(jī)逐步走進(jìn) 了人們的視野,被使用到我們的生活與工作之中。
視頻智能分析(Video Analyzing)
所謂“視頻智能分析”,是指依托計(jì)算機(jī)從視頻圖像中通過(guò)特定的程序運(yùn)算和分析模型,提取視頻圖像中有價(jià)值的內(nèi)容信息、運(yùn)動(dòng)信息等數(shù)據(jù)信息的一項(xiàng)科學(xué)技術(shù)方法。簡(jiǎn)而言之,就是通過(guò)計(jì)算機(jī)代替使用者去監(jiān)控、查詢、分析、警戒視頻圖像。對(duì)計(jì)算機(jī)而言,攝像機(jī)記錄的視頻圖像僅僅是一個(gè)包含每一幀、每一個(gè)像素點(diǎn)的灰度值或者彩色值的數(shù)列。“視頻智能分析”實(shí)現(xiàn)了計(jì)算機(jī)對(duì)于視頻圖像的“理解”。使用者確定的目標(biāo)信息包含在那些像素點(diǎn)的值所組成的平面圖像序列之中,需要計(jì)算機(jī)從“整體”上進(jìn)行“理解”才能獲取,才能明白視頻圖像中所呈現(xiàn)的內(nèi)容或者發(fā)生的事情。
目前,該項(xiàng)技術(shù)應(yīng)用的目的在于自動(dòng)地提取視頻圖像源(主要是攝像機(jī)或者視頻錄像設(shè)備)中的關(guān)鍵信息或者特征信息,并根據(jù)使用者的要求進(jìn)行智能化分析,再通過(guò)設(shè)置一定的條件和規(guī)則對(duì)其進(jìn)行高效判斷。
如果我們將“視頻圖像源”比喻為“人類的眼睛”,那么就可以把“視頻智能分析技術(shù)”看做是“人類的大腦”。它負(fù)責(zé)代替人腦對(duì)視頻圖像畫(huà)面中的海量數(shù)據(jù)進(jìn)行高效分析,為人們提供有價(jià)值的關(guān)鍵信息。當(dāng)前,視頻智能分析的功能主要包含“畫(huà)中畫(huà)、運(yùn)動(dòng)檢測(cè)、目標(biāo)跟蹤、動(dòng)態(tài)人臉識(shí)別”四個(gè)方面。
畫(huà)中畫(huà)(Picture-in-Picture)
作為一種視頻內(nèi)容的呈現(xiàn)方式,“畫(huà)中畫(huà)”是指在一部視頻全屏播放的同時(shí),于畫(huà)面的小面積區(qū)域上同時(shí)播放另一部視頻,被廣泛用于視頻錄像、監(jiān)控設(shè)備。目前,各國(guó)警方在審訊室中多采用此項(xiàng)技術(shù)。比如,我國(guó)在執(zhí)法辦案場(chǎng)所設(shè)置的訊(詢)問(wèn)室基本配備了具備畫(huà)中畫(huà)功能的攝像機(jī)。公安部GB/T 28181-2011《安全防范視頻監(jiān)控聯(lián)網(wǎng)系統(tǒng)信息傳輸、交換、控制技術(shù)要求》更是對(duì)攝像機(jī)畫(huà)中畫(huà)功能作出了測(cè)試要求。在具備畫(huà)中畫(huà)功能的多臺(tái)攝像機(jī)的覆蓋下,畫(huà)面通過(guò)線路傳輸運(yùn)送至指揮室中的支持多路高清視頻接入的計(jì)算機(jī)。使用計(jì)算機(jī)的警察看到的主畫(huà)面反映的是“訊問(wèn)場(chǎng)所的全景”,小畫(huà)面則反映的是“被訊(詢)問(wèn)人的特寫(xiě)正面中景或者辦案人員的特寫(xiě)”。(如圖所示)同時(shí)監(jiān)控畫(huà)面能全程反映被訊(詢)問(wèn)人的體態(tài)、表情,并顯示同步錄像時(shí)間。這樣的設(shè)置方便警察更清晰地看到辦案區(qū)人員的小動(dòng)作、微表情。
目前,“畫(huà)中畫(huà)”技術(shù)已經(jīng)可以實(shí)現(xiàn)二畫(huà)面、三畫(huà)面、四畫(huà)面的任意合成,畫(huà)中畫(huà)的大小畫(huà)面均可切換,小畫(huà)面的大小及位置亦可任意調(diào)整。
運(yùn)動(dòng)檢測(cè)(Motion Detection)
“運(yùn)動(dòng)檢測(cè)”是指把視頻圖像中變化的區(qū)域與背景圖像精確分離出來(lái),即正確分割出運(yùn)動(dòng)目標(biāo)的區(qū)域或者輪廓,確認(rèn)和檢測(cè)出運(yùn)動(dòng)物體的存在。目前,我國(guó)在運(yùn)動(dòng)檢測(cè)智能分析方面做得較為完善的企業(yè)不多。以杭州??低晹?shù)字技術(shù)股份有限公司(以下簡(jiǎn)稱:??低暎槔鹤鳛槲覈?guó)知名的視音頻編碼解碼卡的生產(chǎn)商,??低曉跀?shù)字信號(hào)處理器上能夠完成MPEG4/H264的實(shí)時(shí)編碼,并通過(guò)SDK的接口,提供有效的運(yùn)動(dòng)檢測(cè)分析功能。在這方面,上海市公安局交通警察總隊(duì)已經(jīng)開(kāi)啟了先行先試的探索。自2017年9月下旬起,上海市公安局交通警察總隊(duì)在寶林路近牡丹江路路段安裝了一套專門用于抓拍“不按規(guī)定使用燈光”違法行為的新型智能電子警察。截至2017年10月10日,市公安局交通警察總隊(duì)已經(jīng)累計(jì)查處了“不按規(guī)定使用燈光”違法行為67起,收效明顯。
目標(biāo)跟蹤(Object Tracking)
“目標(biāo)跟蹤”,俗稱“盯梢”,是指通過(guò)對(duì)攝像機(jī)采集到的圖像序列進(jìn)行計(jì)算分析,計(jì)算出目標(biāo)在每一幀圖像上的二維位置坐標(biāo),并根據(jù)不同的特征值,將圖像序列中、不同幀中同一運(yùn)動(dòng)目標(biāo)關(guān)聯(lián)起來(lái),獲得各個(gè)運(yùn)動(dòng)目標(biāo)完整的運(yùn)動(dòng)軌跡。這就好比目前刑事偵查中非常流行的圖偵(即“視頻圖像偵查”)。通過(guò)計(jì)算機(jī),對(duì)攝像機(jī)獲取的視頻監(jiān)控圖像資料進(jìn)行分析、研判,從而固定犯罪證據(jù)、發(fā)現(xiàn)和確定犯罪嫌疑人、提供偵查線索或者方向。以美國(guó)著名系列電影《生化危機(jī)》中的人工智能“紅皇后(Red Queen)”為例。作為蜂巢內(nèi)部的頂尖人工智能系統(tǒng),“紅皇后”就是依托攝像機(jī)捕捉下各種目標(biāo)特征信息,從而獲得各個(gè)運(yùn)動(dòng)目標(biāo)完整的運(yùn)動(dòng)軌跡,達(dá)到實(shí)時(shí)跟蹤、實(shí)時(shí)監(jiān)控、實(shí)時(shí)捕捉、實(shí)時(shí)聚焦。
動(dòng)態(tài)人臉識(shí)別(Dynamic Face Recognition)
通常來(lái)說(shuō),“動(dòng)態(tài)人臉識(shí)別技術(shù)”,是指利用人臉的特征信息,將“目標(biāo)人員的面部圖像”與“數(shù)據(jù)庫(kù)中的人臉面部特征”進(jìn)行比較與分析后,從而做出身份識(shí)別的專門性科學(xué)技術(shù)。該項(xiàng)科學(xué)技術(shù)將應(yīng)用于安全檢查、刑事偵查、智能門禁、戶籍調(diào)查、治安巡邏、出入境管理等諸多領(lǐng)域。
然而,在人群中對(duì)移動(dòng)的人臉進(jìn)行識(shí)別存在著客觀實(shí)現(xiàn)的難點(diǎn)。首先,人的正臉有一個(gè)比例叫做“三庭五眼”,這個(gè)詞很正確地概括了人臉部的比例。人的側(cè)臉則會(huì)出現(xiàn)兩個(gè)正方形。“第一個(gè)正方形”是指眼尾至耳朵前端的距離等于眼睛至嘴角的距離、眼尾至耳朵前端的距離,也等于耳后至腦后的距離;“第二個(gè)正方形”是指眼尾至耳后的距離等于眼睛至下顎的距離。盡管每個(gè)人的正臉和側(cè)臉完全相同的可能性較低,但是不同個(gè)體之間的人臉結(jié)構(gòu)可能存在相仿性。這些相仿性無(wú)疑將增加人臉圖像識(shí)別與區(qū)分的難度。其次,目前高清攝像機(jī)能夠在目標(biāo)靜態(tài)的情況下清晰地捕捉到使用者通過(guò)程序算法指定的人臉,但是攝像機(jī)在人群中細(xì)分差異并找到目標(biāo)對(duì)象卻受到拍攝角度、明暗光線、人臉部位變化、遮臉物、個(gè)體的刻意偽裝等多方面因素的制約。綜上所述,動(dòng)態(tài)人臉識(shí)別需要攻克的技術(shù)難點(diǎn)還有很多。endprint
當(dāng)前,為了攻克動(dòng)態(tài)人臉識(shí)別技術(shù),世界各國(guó)已經(jīng)開(kāi)展了專門的技術(shù)研究與公關(guān)。比如:根據(jù)上?!爸腔酃病苯ㄔO(shè)的要求,上海市公安局正在研發(fā)“智能圖像識(shí)別系統(tǒng)”,建設(shè)人臉基礎(chǔ)信息的中間庫(kù)(又稱為“人臉特征庫(kù)”),將“人臉基礎(chǔ)數(shù)據(jù)”同步至計(jì)算機(jī)系統(tǒng)之中,同時(shí)研發(fā)“安全調(diào)用的接口”,與計(jì)算機(jī)系統(tǒng)進(jìn)行數(shù)據(jù)信息對(duì)接。據(jù)悉,俄羅斯莫斯科也在嘗試在公共區(qū)域的監(jiān)控?cái)z像頭中引入動(dòng)態(tài)人臉識(shí)別技術(shù)。2017年年初,莫斯科會(huì)同俄羅斯本土公司Tech.Lab Ltd進(jìn)行了為期六個(gè)月的測(cè)試,結(jié)果裝備了動(dòng)態(tài)人臉識(shí)別技術(shù)的監(jiān)控?cái)z像機(jī),發(fā)現(xiàn)了俄羅斯聯(lián)邦政府六名重要的犯罪嫌疑人。該家俄羅斯公司的動(dòng)態(tài)人臉識(shí)別技術(shù)已經(jīng)獲得了美國(guó)商務(wù)部和華盛頓大學(xué)的官方認(rèn)可,在測(cè)試階段的識(shí)別準(zhǔn)確率已經(jīng)高達(dá)70%。
后端智能(Intelligent Back)
早期,受限于前端芯片的運(yùn)算性能,“智能視頻分析技術(shù)”幾乎均在后端進(jìn)行有效運(yùn)作。一般來(lái)說(shuō),后端智能的實(shí)現(xiàn)方式是由高清攝像機(jī)采集視頻圖像信號(hào),由后臺(tái)進(jìn)行物理存儲(chǔ),再通過(guò)后端智能服務(wù)器進(jìn)行運(yùn)算分析,最終將運(yùn)算分析結(jié)果返送至存儲(chǔ)設(shè)備之中。此種部署方案的最大頑疾就是“帶寬受到制約”。后端的運(yùn)算分析需要大量占用帶寬的傳遞數(shù)據(jù),從而令后端運(yùn)算分析出現(xiàn)時(shí)間上的延遲,甚至造成了數(shù)據(jù)信息的丟失,阻滯和影響運(yùn)算分析的結(jié)果。另一方面,后端智能的運(yùn)算分析設(shè)備的動(dòng)用量、存儲(chǔ)量極大,成本相當(dāng)高。
當(dāng)然,后端智能模式也有優(yōu)勢(shì)。一方面,后端智能模式對(duì)于排除故障大有裨益。另一方面,后端智能模式可以節(jié)省大量的“模擬攝像機(jī)轉(zhuǎn)數(shù)字?jǐn)z像機(jī)”的成本投入,只需對(duì)服務(wù)器進(jìn)行智能化升級(jí)即可。
當(dāng)前,市場(chǎng)上具備智能分析能力的攝像機(jī),一般只能提供一些基礎(chǔ)智能功能,比如越界偵測(cè)、區(qū)域入侵偵測(cè)、場(chǎng)景變更偵測(cè)、進(jìn)入?yún)^(qū)域偵測(cè)、離開(kāi)區(qū)域偵測(cè)、人員聚集偵測(cè)、停車偵測(cè)、區(qū)域防范等。以上海市公安局交通警察總隊(duì)啟用“電子警察抓拍違法行為短信及時(shí)告知平臺(tái)”為例。目前,市交通警察總隊(duì)主要通過(guò)特寫(xiě)攝像機(jī)、全景攝像機(jī)、環(huán)境攝像機(jī)等攝像機(jī)抓拍違法行為,在后端計(jì)算機(jī)中設(shè)置相應(yīng)的程序算法,將“違法停車、違法變道、違規(guī)使用公交專用車道行駛、超速、闖禁令、闖紅燈”等違法行為納入實(shí)時(shí)監(jiān)管狀態(tài)。據(jù)市交通警察總隊(duì)統(tǒng)計(jì),自2016年8月1日至2017年8月1日一年的時(shí)間內(nèi),電子警察抓拍違法行為短信及時(shí)告知平臺(tái)累積發(fā)送違法及時(shí)告知短信23萬(wàn)余條。(如圖一所示)
然而,上述攝像機(jī)輸出的信息比較簡(jiǎn)單!雖然具備警告、識(shí)別描述畫(huà)面中的內(nèi)容等智能功能,然而這畢竟是后端智能,且需通過(guò)人工操作,還無(wú)法達(dá)到真正的“前端智能”的效果。
智能分析前置化(Front Intelligent Analyzing)
如上所述,后端智能的運(yùn)作模式是前端攝像機(jī)采集視頻圖像信號(hào),后端由智能分析服務(wù)器進(jìn)行分析并提取視頻中有價(jià)值的目標(biāo)信息,最后生成使用者想要的結(jié)構(gòu)化數(shù)據(jù)信息。可是,受性能限制,當(dāng)前主流的服務(wù)器一臺(tái)只能同時(shí)分析六路至八路的高清視頻。若要實(shí)現(xiàn)2000路的智能分析,至少需動(dòng)用250臺(tái)服務(wù)器。面對(duì)智慧城市幾千路到幾十萬(wàn)路不等的監(jiān)控點(diǎn)規(guī)模,成本之高不容忽視!因此,智能分析算法移至前端的想法應(yīng)運(yùn)而生。前端智能的價(jià)值在于預(yù)防和事中控制環(huán)節(jié),將智能處理、分析、研判融入到攝像機(jī)之中。
誠(chéng)如蘇州科達(dá)科技股份有限公司市場(chǎng)總監(jiān)劉志強(qiáng)所言,“智能前移可以讓前端攝像機(jī)具備直接的分析能力,其成本又可控,無(wú)疑將推動(dòng)智能分析在智慧城市建設(shè)中的規(guī)?;瘧?yīng)用。”將智能前移,在攝像機(jī)中就可以完成目標(biāo)識(shí)別、特征描述以及圖片抓拍工作,這樣后端就節(jié)省了大量的智能分析服務(wù)器。可以說(shuō),智能前置的攝像機(jī)是智能分析經(jīng)濟(jì)性和規(guī)模化部署的基礎(chǔ)。只有前端實(shí)現(xiàn)智能,才能形成規(guī)?;闹悄軕?yīng)用。這將深刻影響到整個(gè)安防行業(yè)的發(fā)展格局,為安全防范迎來(lái)更長(zhǎng)足的進(jìn)步和更寬廣的市場(chǎng)空間。
感知型前端攝像機(jī)(Front Intelligent Cameras)
在智能攝像機(jī)領(lǐng)域,早期智能攝像機(jī)產(chǎn)品是替代紅外對(duì)射等設(shè)備來(lái)使用的,現(xiàn)階段僅適用于禁止人們闖入和走動(dòng)的應(yīng)用場(chǎng)景,只是告警信號(hào)而已,但這種告警誤報(bào)率很大,在警戒區(qū)內(nèi),動(dòng)物的闖入、巡更人員的走動(dòng)以及燈光的變化,都可能引起報(bào)警,因?yàn)樗鼘?duì)闖入的物體無(wú)法識(shí)別。而感知型攝像機(jī)能夠“識(shí)別”視頻中的內(nèi)容;可以“思考”視頻中發(fā)生了什么事情;最終把視頻中的內(nèi)容和有異常的事件,用語(yǔ)言、圖片等方式“描述”出來(lái)。根據(jù)監(jiān)控場(chǎng)景和需要識(shí)別的內(nèi)容,感知型攝像機(jī)主要包括三個(gè)系列:1.特征分析攝像機(jī);2.車輛卡口攝像機(jī);3.人員卡口攝像機(jī)。(如表一所示)
具備感知功能的前端攝像機(jī)可以在收集海量特征信息的基礎(chǔ)上,直接執(zhí)行復(fù)雜智能算法,將圖像信息與目標(biāo)的特征、內(nèi)容、警戒信息進(jìn)行比對(duì),生成語(yǔ)義描述,從而在智慧城市、智能交通、智慧執(zhí)法等諸多領(lǐng)域發(fā)揮巨大的作用。以2017年廈門的金磚會(huì)議安防為例。1500余臺(tái)具備前端智能的感知型攝像機(jī)分布在廈門各個(gè)檢查站、安檢大棚、酒店、城際卡口等重要場(chǎng)所,實(shí)行安檢監(jiān)控,實(shí)時(shí)對(duì)違停、黑名單比對(duì)進(jìn)行分析處理,真正達(dá)成了會(huì)議安全區(qū)域監(jiān)控的全覆蓋。
毫無(wú)疑問(wèn),如果將攝像機(jī)比作是“鷹眼”,那么具備感知功能的前端攝像機(jī)就是“會(huì)思考的鷹眼”!
編輯:黃靈 yeshzhwu@foxmail.comendprint