陳志康(上海市公安局交通警察總隊, 上海 200070)
公安交通管理“大數(shù)據(jù)”的應(yīng)用與研究
陳志康
(上海市公安局交通警察總隊, 上海 200070)
社會經(jīng)濟的不斷發(fā)展,機動車保有量和駕駛員數(shù)量不斷攀升,給公安交警的日常管理帶來了巨大的壓力。如何運用“大數(shù)據(jù)”的理念、技術(shù)、思維和方法,將其與日常交通管理工作有效結(jié)合,進(jìn)一步提升公安交通管理工作的效能,已成為各級領(lǐng)導(dǎo)、技術(shù)人員需要認(rèn)真思考的問題。近年來,上海市公安局交警總隊陸續(xù)開發(fā)建設(shè)了一大批信息化項目,為本市公安交通管理的指揮調(diào)度、輔助決策等提供了有力的技術(shù)支撐,其中一些圍繞數(shù)據(jù)深層次應(yīng)用的探索和實踐已成為“大數(shù)據(jù)”應(yīng)用的雛形,但還需在業(yè)務(wù)需求、技術(shù)應(yīng)用、管理機制等方面不斷加以深入研究。
“大數(shù)據(jù)”;公安機關(guān);交通管理;應(yīng)用研究
DOI:10.13643/j.cnki.issn1008-5750.2015.01.001
“大數(shù)據(jù)”概念的誕生和大數(shù)據(jù)技術(shù)的應(yīng)用,是信息化發(fā)展的產(chǎn)物,它已經(jīng)對包括公安交通管理在內(nèi)的各個技術(shù)、管理領(lǐng)域的拓展產(chǎn)生了重大影響,并將會帶來深刻的變革。但是目前,無論是公眾還是IT業(yè)界對其定義仍未統(tǒng)一。
我們認(rèn)為,“大數(shù)據(jù)”不只是指海量的信息,更強調(diào)的是對信息的篩選、處理。
近年來,在市委、市府及市公安局領(lǐng)導(dǎo)的重視關(guān)心下,交警總隊為2006年的“六國峰會”、2008年的“北京奧運會”、2010年的“上海世博會”和2014年的“上海亞信峰會”等舉世矚目的重大活動陸續(xù)開發(fā)建設(shè)了一大批信息化項目,為本市公安交通管理的指揮調(diào)度、輔助決策等提供了有力的技術(shù)支撐。在此過程中,圍繞數(shù)據(jù)的深層次應(yīng)用開展了一些探索和實踐,部分已成為“大數(shù)據(jù)”應(yīng)用的雛形。其主要有:
(一)數(shù)據(jù)集成與關(guān)聯(lián)分析
面對上海這個特大型城市的道路交通,交警總隊采集、共享的各類數(shù)據(jù)資源種類較多、體量也日益龐大,但同時也存在分散、異構(gòu)等特點,給數(shù)據(jù)的進(jìn)一步應(yīng)用帶來了障礙。2009年,交警總隊在建設(shè)“交通指揮調(diào)度、事故應(yīng)急處理智能化系統(tǒng)”時,就提出并實施了數(shù)據(jù)的集成應(yīng)用。我們對五大核心數(shù)據(jù)庫(業(yè)務(wù)數(shù)據(jù)庫、全國資源數(shù)據(jù)庫、GIS數(shù)據(jù)庫、道口查控數(shù)據(jù)庫和快速路車牌數(shù)據(jù)庫)的數(shù)據(jù)進(jìn)行了梳理、整合,并建立了面向應(yīng)用的數(shù)據(jù)倉庫。在此基礎(chǔ)上,我們還探索使用了BI(商業(yè)智能工具)、內(nèi)存數(shù)據(jù)庫、ES等數(shù)據(jù)關(guān)聯(lián)分析技術(shù)對其中的數(shù)據(jù)進(jìn)行加工,按業(yè)務(wù)需要,在機動車、駕駛證、違法和事故等約18TB的數(shù)據(jù)體量中生成各類固定業(yè)務(wù)報表和自定義報表,供分析研判。
根據(jù)本市市境陸路道口治安防控、交通管理的業(yè)務(wù)需求,自2006年起,我們在“上海公安道口機動車、駕駛?cè)瞬榭叵到y(tǒng)”建成并投入實戰(zhàn)應(yīng)用后,不斷跟蹤業(yè)務(wù)部門的需求,陸續(xù)將各類違法未處理、未年檢、無“世博”通行證及其他有關(guān)車輛等30余類嫌疑機動車信息納入實時關(guān)聯(lián)比對、報警的信息庫,為道口執(zhí)勤民警精確打擊違法犯罪提供了支撐。
(二)數(shù)據(jù)深度挖掘與預(yù)測研究
對海量數(shù)據(jù)進(jìn)行挖掘,分析、提煉出有價值的信息,一直是交警總隊在常態(tài)交通管理中努力和不斷嘗試并力求達(dá)到的分析動態(tài)化、管理精細(xì)化的目標(biāo)。
在交通事故預(yù)警方面,我們通過對370余萬條交通事故的地點、人員、車輛等信息分析,每年發(fā)布市、區(qū)兩級事故易發(fā)或死亡人數(shù)較多的“黑點”,由總隊定期督促屬地交警支(大)隊限期整改。針對一段時間內(nèi)本市欺詐性交通事故(俗稱“碰瓷”)高發(fā)的情況,我們建立并不斷補充完善了事故“碰瓷”嫌疑人員和車輛黑名單,通過提前預(yù)警、發(fā)案比對等方式累計鎖定相關(guān)嫌疑人415人,取得了很好的成效。
在交通狀況評價方面,我們以道路擁堵程度、交通事故數(shù)量為主要評價要素,創(chuàng)新性地將各區(qū)(縣)地面道路和快速路的整體交通情況以“指數(shù)”的形式分色展現(xiàn),供業(yè)務(wù)部門和支(大)隊參考。為掌握全市快速路交通流結(jié)構(gòu)和集散規(guī)律,我們利用分布在中環(huán)及中環(huán)以內(nèi)快速路上約300個斷面構(gòu)成的車牌識別系統(tǒng)實時采集流量數(shù)據(jù),開展了集散性O(shè)D分析的探索,即將全市快速路網(wǎng)劃分成20個“小區(qū)”,通過數(shù)學(xué)建模和車輛信息的跟蹤,展現(xiàn)各“小區(qū)”間交通流轉(zhuǎn)移的時空分布特征,為擁堵成因分析、排堵預(yù)案制定等提供參考。
在道口安保方面,我們通過對歷史數(shù)據(jù)的分類統(tǒng)計、比較,研究制定了重大活動安保工作的道口查控方案。2010年上海世博會舉辦前夕,時任市委書記的俞正聲同志在G15沈海高速公路朱橋檢查站現(xiàn)場,對“車駕查控系統(tǒng)”的技術(shù)架構(gòu)、實時運作以及海量數(shù)據(jù)的采集、分析及應(yīng)用狀況進(jìn)行了詳細(xì)調(diào)研,當(dāng)即要求我們研發(fā)“世博道口通行證管理及不停車安檢系統(tǒng)”。上海世博會期間,該系統(tǒng)累計實時關(guān)聯(lián)10多個數(shù)據(jù)庫,核發(fā)297.7萬余張通行證,不僅將進(jìn)滬車輛安全審核檢查關(guān)口前移,還通過利用“車駕查控系統(tǒng)”的實時比對功能,既做到了“持證”車輛的快速通行,又實現(xiàn)了“逢疑必查”的目標(biāo)。世博期間,系統(tǒng)比對命中有關(guān)車輛1.5萬余輛次,有效提升了民警的工作效率和打擊精確度,同時也對預(yù)防和緩解全市各道口因安檢引發(fā)的大面積擁堵問題起到了積極作用,減少了道口現(xiàn)場安檢壓力及對交通的影響,得到了各級領(lǐng)導(dǎo)和社會的一致肯定。
在為“大公安”服務(wù)方面,我們嘗試定期將網(wǎng)上追逃人員信息與本市機動車檔案進(jìn)行關(guān)聯(lián)比對,篩選出在逃人員可能駕駛的機動車信息,累計抓獲在逃人員329名,探索出了“先由人查車、再由車查人”的信息提煉新方法,取得了很好的實戰(zhàn)效果。
(三)數(shù)據(jù)可視化
隨著各類統(tǒng)計、分析數(shù)據(jù)的不斷增多,各級領(lǐng)導(dǎo)、基層民警都希望通過直接的“可視化”界面展示各類數(shù)據(jù)和信息。
2009年,我們構(gòu)建了基于GIS地圖的應(yīng)用平臺,并將采集或共享的實時路況、“110”交通類報警事件、視頻監(jiān)控、快速路入口匝道控制、停車場泊位等信息在電子地圖上進(jìn)行分層次展現(xiàn),這些實時、動態(tài)的信息可按需隨時調(diào)閱。
2010年上海世博會期間,根據(jù)安保工作的需要,我們制作了兩張專題圖?!斑M(jìn)滬陸路道口流量專題圖”實時展示當(dāng)日全市進(jìn)滬道口的機動車流量、“持進(jìn)滬通行證”機動車流量、5分鐘進(jìn)滬流量等信息和道口排隊區(qū)、安檢區(qū)的視頻監(jiān)控信息。此外,通過對各道口歷史流量的數(shù)據(jù)統(tǒng)計,提供流量預(yù)警信息?!笆啦﹫@區(qū)管控區(qū)周邊道路流量專題圖”除整合了全市快速路、高速公路、地面主干道路的實時路況和快速路匝道開閉狀態(tài)等信息外,實時展示當(dāng)日進(jìn)出世博管控區(qū)的機動車流量、5分鐘流量等。兩張圖的應(yīng)用,為市公安局“二指”坐鎮(zhèn)指揮的領(lǐng)導(dǎo)以及民警實時掌握交通流量、科學(xué)指揮、調(diào)配警力等提供了依據(jù),受到了充分肯定。
(四)參與“交通指數(shù)”的研究
經(jīng)過多年的建設(shè),上海已經(jīng)完成市區(qū)重要道路的交通流信息的采集,并實現(xiàn)以紅、黃、綠三種顏色代表路況的信息發(fā)布。為使交通參與者全面、客觀地了解本市道路交通的實時通行狀態(tài),向其提供了量化的擁堵指標(biāo)。2009年,交警總隊在數(shù)據(jù)應(yīng)用上的視野不再僅著眼于自身,而是跨出一步,會同市政府相關(guān)部門,將手中的靜態(tài)數(shù)據(jù)和市政府相關(guān)部門可共享的動態(tài)數(shù)據(jù)關(guān)聯(lián)起來。繼參與了榮獲上海市科技進(jìn)步一等獎的“上海世博智能交通系統(tǒng)關(guān)鍵技術(shù)及應(yīng)用”項目研發(fā)之后,2011年起,交警總隊積極配合上海市城鄉(xiāng)建設(shè)和交通發(fā)展研究院(原上海市交通信息中心)研究“道路交通指數(shù)”。通過對大量采集的各類交通實時數(shù)據(jù)、歷史數(shù)據(jù)進(jìn)行統(tǒng)計、分析、比較,最終用“道路交通指數(shù)”這一數(shù)值方式來量化描述道路交通運行狀態(tài),同時結(jié)合GIS地圖加以分色、分塊展現(xiàn),并通過網(wǎng)站、微博、手機APP等向公眾實時發(fā)布,力爭做到既能客觀地評價交通擁堵狀況,又能方便出行者的理解與記憶。
目前,“大數(shù)據(jù)”的應(yīng)用處于發(fā)展初期,在我國更是剛剛起步。通過多年的實踐和積極探索,交警總隊“大數(shù)據(jù)”的應(yīng)用成效明顯,但我們感到,與當(dāng)今國內(nèi)外成功的“大數(shù)據(jù)”應(yīng)用相比,我們還存在差距,主要表現(xiàn)在:
(一)在理念和思維上仍存在差距
隨著互聯(lián)網(wǎng)、云計算、移動互聯(lián)等相關(guān)智能技術(shù)的飛速發(fā)展,可以預(yù)見,“大數(shù)據(jù)”在公安交通管理方面的應(yīng)用也將愈加廣泛。但與其“4V”(即Volume大量、Velocity高速、Variety多樣、Veracity真實性)特點相比,未來“大數(shù)據(jù)”的應(yīng)用與發(fā)展絕不是簡單依賴數(shù)據(jù)采集量的擴大,也不僅僅是服務(wù)器性能、數(shù)據(jù)的簡單擴容或累加,而是對于其中蘊含的理念、思維的轉(zhuǎn)變和突破。與“小數(shù)據(jù)”時代相比,“大數(shù)據(jù)”時代的轉(zhuǎn)變是多方面的。例如,傳統(tǒng)統(tǒng)計方法追求精確,但“大數(shù)據(jù)”只預(yù)測宏觀趨勢;傳統(tǒng)的統(tǒng)計、研究關(guān)注因果關(guān)系,而“大數(shù)據(jù)”更強調(diào)數(shù)據(jù)之間的關(guān)聯(lián)等。
(二)在技術(shù)和手段上仍較為匱乏
就我們目前擁有的各類交通管理數(shù)據(jù)而言,其體量并不能稱之為“大數(shù)據(jù)”。如果要同各警種的數(shù)據(jù)相關(guān)聯(lián),與市政府相關(guān)部門的數(shù)據(jù)相融合,將數(shù)據(jù)的應(yīng)用轉(zhuǎn)化為生產(chǎn)力,其所面臨的困境還十分明顯,這也直接反映了我們在技術(shù)和手段上的匱乏。
2009年,我們便已利用“數(shù)據(jù)倉庫”技術(shù)等當(dāng)時較為成熟和先進(jìn)的技術(shù)開展交通管理核心數(shù)據(jù)的深度挖掘,力求為業(yè)務(wù)部門提供更豐富、有效的統(tǒng)計數(shù)據(jù),但受限于傳統(tǒng)關(guān)系型數(shù)據(jù)庫的架構(gòu),無論在計算效率還是結(jié)果表現(xiàn)上均無法得到“質(zhì)”的突破。此外,我們對于海量視頻的快速檢索、車輛照片關(guān)鍵特征的提取等方面仍缺少高效的手段,使得對于這類非結(jié)構(gòu)化數(shù)據(jù)的應(yīng)用、管理仍處于初級階段,對其中蘊含的有深層次應(yīng)用價值的信息無法加以進(jìn)一步挖掘。
“大數(shù)據(jù)”的處理流程一般可概括為四個步驟,即“采集、預(yù)處理、統(tǒng)計分析、數(shù)據(jù)挖掘”。其中,“預(yù)處理”是當(dāng)前傳統(tǒng)數(shù)據(jù)處理中被忽視或被弱化的部分,除了受限于主流的關(guān)系型數(shù)據(jù)庫(如Oracle)、集中式存儲等架構(gòu)外,還與缺少將非結(jié)構(gòu)化數(shù)據(jù)(例如視頻、圖片、文本、聲音等)向結(jié)構(gòu)化數(shù)據(jù)(即可以用二維表結(jié)構(gòu)來表達(dá)的行數(shù)據(jù),例如存儲在數(shù)據(jù)庫中的記錄)轉(zhuǎn)換的有效技術(shù)手段有著重要關(guān)系。所以,現(xiàn)有的統(tǒng)計分析、數(shù)據(jù)挖掘等絕大多數(shù)針對的是結(jié)構(gòu)化數(shù)據(jù)(目前僅占所有數(shù)據(jù)量的10%至20%,其余均為非結(jié)構(gòu)化數(shù)據(jù)),難以真正體現(xiàn)“大數(shù)據(jù)”多樣性的特點。
(一)研究和建立“公安交通管理大數(shù)據(jù)應(yīng)用平臺”
結(jié)合市公安局“十三五”信息化建設(shè)規(guī)劃,研究和建立“公安交通管理大數(shù)據(jù)應(yīng)用平臺”。不斷學(xué)習(xí)研究Hadoop、虛擬化等新技術(shù),構(gòu)建全新的數(shù)據(jù)存儲、處理技術(shù)架構(gòu),不但要使數(shù)據(jù)的存儲容量更大、運算速度更快、展現(xiàn)形式更豐富,更要突破同類數(shù)據(jù)的局限,從看似毫不相干的數(shù)據(jù)之間發(fā)現(xiàn)關(guān)聯(lián)性,真正體現(xiàn)“大數(shù)據(jù)”的精髓。
(二)滿足數(shù)據(jù)采集的需求,提升管理水平
“大數(shù)據(jù)”應(yīng)用的核心是數(shù)據(jù)挖掘,為公安交通管理中遇到的難點問題提供原因分析依據(jù),但其基礎(chǔ)卻是所采集數(shù)據(jù)的質(zhì)量和種類。因此,一是要不斷提高各類交通管理相關(guān)基礎(chǔ)信息的采集質(zhì)量,為后續(xù)數(shù)據(jù)處理奠定堅實的基礎(chǔ)。二是要積極建立與市交通委員會、市保監(jiān)會等社會相關(guān)部門的數(shù)據(jù)共享機制,擴充與機動車、駕駛?cè)?、特定行業(yè)管理、道路等相關(guān)的數(shù)據(jù)類型。三是依托高校、科研院所等專業(yè)力量進(jìn)行深入研究,力爭突破圖片、視頻等海量非結(jié)構(gòu)化數(shù)據(jù)的管理難題,運用有效的數(shù)據(jù)模型和架構(gòu),實現(xiàn)類似結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)一描述、查詢和處理。四是積極會同市公安局相關(guān)部門,在數(shù)據(jù)層面加強與市公安局“警綜平臺”“情報綜合研判實戰(zhàn)平臺”“視頻監(jiān)控平臺”“治安卡口信息綜合管理平臺”等的對接,為公安交通信息研判分析提供支撐。
(三)抓住重點,突破四個階段的核心技術(shù)應(yīng)用“瓶頸”
我們要選擇合適的軟件、工具,真正將數(shù)據(jù)轉(zhuǎn)化為信息,并提煉出有價值的信息。在數(shù)據(jù)采集方面,重點解決高并發(fā)數(shù)的訪問、操作問題,使服務(wù)器、數(shù)據(jù)庫負(fù)載均衡并分片處理。在預(yù)處理階段,重點做好“生產(chǎn)庫”向“資源庫”的轉(zhuǎn)移和數(shù)據(jù)清洗等工作,滿足后續(xù)數(shù)據(jù)處理的實時計算需求。在統(tǒng)計分析階段,要在了解業(yè)務(wù)需求的基礎(chǔ)上,著重在不同數(shù)據(jù)的“關(guān)聯(lián)性”上下工夫,找到規(guī)律。在數(shù)據(jù)挖掘階段,要力爭實現(xiàn)數(shù)據(jù)從“事后統(tǒng)計”到“事前預(yù)測”的突破。
(四)以管理為中心、應(yīng)用為導(dǎo)向,建立配套的專業(yè)隊伍和管理機制
“大數(shù)據(jù)”的決策不能僅憑經(jīng)驗,而真正要“拿數(shù)據(jù)說話”,從深層次看,還需要建立科學(xué)的、與之相適應(yīng)的管理機制。同時,“大數(shù)據(jù)”的研究、建設(shè)、運行、維護(hù)、應(yīng)用等每個環(huán)節(jié)都需要由會技術(shù)、善管理、懂業(yè)務(wù)的復(fù)合型專業(yè)人員來承擔(dān)。
“大數(shù)據(jù)”時代才剛拉開序幕,目前,其許多技術(shù)瓶頸尚未取得突破,數(shù)據(jù)共享絕非易事,數(shù)據(jù)安全、共享和隱私保護(hù)等方面缺乏法律保護(hù),配套的管理和運作機制尚未形成。但是,“大數(shù)據(jù)”作為生產(chǎn)力,隨著其不斷發(fā)展、應(yīng)用,必將對公安交通管理工作產(chǎn)生深遠(yuǎn)的影響,有力地推動各項業(yè)務(wù)工作向更高的層次發(fā)展。
The Application of and Research into “the Huge Data” in Traffic Management
Chen Zhikang
(Traffic Police General Brigade of Shanghai Municipal Public Security Bureau, Shanghai 200070,China)
With social and economic development, the number of vehicles and drivers is soaring,which exerts great pressure on traffic police in their routine management. The notion, technique,mentality and methodology of how to make use of the huge amount of data, how to combine the data with routine traffic control and how to improve the effectiveness of traffic management have become problems that administrators should take into consideration. In recent years, the Traffic Administrative Department of Shanghai Municipal Public Security Bureau has successively developed a large number of informationized projects, which technically support command, decision making and so on in traffic management. Some of them which explore the further application have become the framework of the application of huge data, but further study is still needed in professional demands, technical application,management mechanism and so on.
Big Data; Police Agency; Traffic Management; Study on Application
D631.1
B
1008-5750(2015)01-0005-(05)
2014-11-20 責(zé)任編輯:陳 匯
陳志康(1963—),男,上海市公安局交通警察總隊黨委書記、總隊長,高級工程師,本刊編委。