朱萍 馬韻潔
摘要:針對城市海量的卡口數(shù)據(jù),從中能快速有效地檢測出套牌嫌疑車,該文提出一種基于大數(shù)據(jù)技術(shù)快速分析套牌車方法,通過引入管理節(jié)點和多臺數(shù)據(jù)節(jié)點資源協(xié)同并行處理海量數(shù)據(jù)下的套牌車檢測問題,進(jìn)一步提高檢測速度和準(zhǔn)確率。
關(guān)鍵詞:車牌識別;套牌車;大數(shù)據(jù)
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2015)34-0020-01
1 概述
隨著社會的發(fā)展,人民生活水平的提高,道路上的機(jī)動車也越來越多。截至2014年底,我國汽車保有量新增1707萬輛,目前全國機(jī)動車保有量達(dá)2.64億輛,其中汽車1.54億輛,因此,套牌機(jī)動車的數(shù)量也隨著增高。由于套牌機(jī)動車發(fā)現(xiàn)難度大、檢測難度高,有許多套牌機(jī)動車使用多年并沒有被發(fā)現(xiàn), 嚴(yán)重地影響了道路交通安全秩序,如隨意闖紅燈、超速、跨越雙實線、亂停亂放,給廣大人民群眾的安全出行帶來隱患,也為肇事逃逸案件的偵破增加了難度。
為解決套牌車問題,本文具體介紹了基于視頻圖像處理技術(shù)實現(xiàn)套牌車的識別,主要從視頻和圖像中識別出車牌信息,并結(jié)合城市卡口的位置和時間信息,從而判斷是否為套牌車輛。
2 技術(shù)實現(xiàn)方法
通過前端卡口攝像機(jī)識別的車牌號、位置信息,利用“時間差”判定,檢測出涉嫌套牌車輛的方法[1],即基于同一輛車在不可能時間內(nèi)出現(xiàn)在兩個地點的原理,分析各監(jiān)控點的車牌信息,實現(xiàn)套牌車的自動檢測及報警。
2.1卡口監(jiān)控點的選取[2]
只有選取合適的監(jiān)控點,才能最大程度減少套牌車漏分析,因此選取監(jiān)控點應(yīng)符合最少監(jiān)控點、最大車流量的原則,一般優(yōu)先選取以下監(jiān)控點:
1) 城市主干道路,尤其是繁華地段;2)大型停車場、車站、火車站等繁忙路段和交叉口。
2.2 實現(xiàn)原理
利用城市卡口攝像機(jī),對抓拍的圖像進(jìn)行分析,識別出車牌號及車牌顏色,結(jié)合城市卡口的位置信息以及經(jīng)過卡口的時間信息,判斷套牌機(jī)動車, 同時還可以實現(xiàn)套牌車實時軌跡、歷史軌跡,為布控提供依據(jù)。具體實現(xiàn)原理如下:
1) 在大數(shù)據(jù)平臺上建立索引,由于不同車牌顏色有可能為同一車牌,防止誤判,因此以車牌號及車牌顏色為基準(zhǔn)建立索引, 并存儲經(jīng)過卡口的時間、卡口的位置等信息;
2) 預(yù)設(shè)城市各卡口之間的最短時間,設(shè)置時間矩陣,監(jiān)控范圍內(nèi)經(jīng)過任意兩卡口所需的最短時間為卡口間的距離與這兩個卡口之間道路最高時速之商[3],將其作為套牌車時間閾值;
3) 通過城市卡口攝像機(jī)獲取經(jīng)過各卡口攝像機(jī)的車牌號、車牌顏色、經(jīng)過時間、卡口號等信息,通過城市網(wǎng)絡(luò)將相關(guān)信息傳輸?shù)酱髷?shù)據(jù)平臺上;
4) 將實時抓拍的車牌號及車牌顏色與索引表中的車牌號及車牌顏色比對分析;
5) 若比對分析結(jié)果有歷史信息,則需存儲時間、卡口的位置等信息即可,并與存儲中前一個歷史車牌號經(jīng)過卡口的時間進(jìn)行比對分析,判斷兩次過車的時間差是否小于兩個卡口間的時間閾值,若是,則為套牌車;若否,就記錄為歷史數(shù)據(jù);
6) 若比對分析結(jié)果無歷史過車記錄,在索引中將實時過車記錄保存為歷史過車記錄。
2.3 大數(shù)據(jù)平臺
由于以上布控方式要求處理海量的數(shù)據(jù),處理的效率要足夠高、數(shù)據(jù)要足夠準(zhǔn)確,因此,本文提出基于大數(shù)據(jù)技術(shù)快速分析套牌車方案。
基于開源的分布式計算架構(gòu) Hadoop,搭建大數(shù)據(jù)平臺,構(gòu)建1臺管理節(jié)點和多臺數(shù)據(jù)節(jié)點(根據(jù)城市實際卡口的數(shù)據(jù)量確定具體數(shù)量),其中1臺管理節(jié)點用于構(gòu)建索引和管理數(shù)據(jù)節(jié)點,多臺數(shù)據(jù)節(jié)點用于存儲車輛信息以及并行計算分析套牌車情況。
1) HDFS技術(shù)
Hadoop 提供了分布式文件系統(tǒng)HDFS,用于存儲車牌號、車牌顏色、經(jīng)過卡口的時間、卡口位置信息等,為分布式計算提供數(shù)據(jù)支撐。
2) MapReduce技術(shù)
MapReduce技術(shù)是并行計算模型,包括Map和Reduce兩個函數(shù),可以進(jìn)行海量數(shù)據(jù)分割、任務(wù)分解與結(jié)果匯總,從而完成海量數(shù)據(jù)的并行處理,同時還可通過增加計算節(jié)點,使之在集群上并行執(zhí)行,實現(xiàn)系統(tǒng)的可擴(kuò)展性[4]。
MapReduce算法的核心由兩部分構(gòu)成,分別為Map算法和Reduce算法。其工作原理是先分后合的數(shù)據(jù)處理方式。Map算法即“分解”,將HDFS中存儲的海量數(shù)據(jù)(車牌號、車牌顏色等信息)分割成若干部分,分給多臺硬件計算資源上并行處理(從HDFS中尋找從前端卡口抓拍的車牌號信息);Reduce算法即“合并”,把各臺處理器處理后的結(jié)果進(jìn)行匯總。若沒有相關(guān)的信息記錄則在存儲中將實時過車記錄保存為歷史過車記錄;若有相關(guān)信息的記錄,則與前一條過車的歷史記錄進(jìn)行比較分析,判斷是否是套牌車。
3 結(jié)論
針對城市卡口海量數(shù)據(jù)的處理,采用傳統(tǒng)的算法,會存在處理速度慢和計算瓶頸問題,提出了基于大數(shù)據(jù)技術(shù)快速分析套牌車方法,并結(jié)合車牌顏色識別,提高系統(tǒng)的反應(yīng)速度、提高了識別的速度和準(zhǔn)確率,使得系統(tǒng)性能更優(yōu),更加有利于對套牌嫌疑車輛的實時檢測和識別。
參考文獻(xiàn):
[1] 盧曉春,周欣,蔣欣榮.一種基于車輛牌照識別和網(wǎng)格化監(jiān)控的套牌車檢測方法:中國,200910058943.9[P].2009-09-23.
[2] 盧曉春,周欣,蔣欣榮.基于網(wǎng)格化監(jiān)控的套牌車檢測系統(tǒng)[J].計算機(jī)應(yīng)用,2009(10).
[3] 林圣拿,張俊軒,胡佳妮.高效實時的車輛套牌嫌疑分析方法及其裝置:中國,201110300956.x[P].2012—05—O2.
[4] 覃雄派.大數(shù)據(jù)分析_RDBMS與MapReduce的競爭與共生[J].軟件學(xué)報,2012,23(1):32-45.