◆莊海燕
國外公共安全數(shù)據(jù)分析狀況及其對我國的啟示
◆莊海燕
(鐵道警察學院 河南 450052)
數(shù)據(jù)時代背景下,公眾對大數(shù)據(jù)的爭論中,經(jīng)常被公民討論、被學者研究的內(nèi)容是隱私和自由問題,關于大數(shù)據(jù)工具如何為國家安全做貢獻的文章則較少。這里我們通過數(shù)據(jù)分析功能和使用方式分析,評估它對公共安全安全決策的影響,對公共安全起到的關鍵作用及如何利用公共安全數(shù)據(jù)分析為我國公共安全提供助力提出建議。
公共安全;數(shù)據(jù)分析;大數(shù)據(jù);數(shù)據(jù)分析人才
數(shù)據(jù)是現(xiàn)代社會的一個決定性特征。從亞馬遜、淘寶、天貓、當當?shù)纫幌盗芯W(wǎng)絡購物平臺到利用支付寶、微信等提供功能支付街邊小吃費用,人類與機器設備每日互動創(chuàng)造的數(shù)據(jù)量多達2.5兆字節(jié)。而隨著數(shù)據(jù)變得越來越重要并容易獲得,利用特定分析方法或算法分析數(shù)據(jù),透過數(shù)據(jù)理解世界的誘惑不斷增長,國家公共安全尤其如此。
現(xiàn)代社會中,大數(shù)據(jù)對任何一個國家來說都是一個“大問題”。各國間諜機構長期以來一直依靠多個數(shù)據(jù)源制作情報報告。在過去的10-20年中,各國情報機構和國家安全機構通過開發(fā)專門的數(shù)據(jù)分析模塊、研究和開發(fā)相應項目,對包括社交媒體、論壇等互聯(lián)網(wǎng)數(shù)據(jù)進行在線數(shù)據(jù)進行分析,并且在分析的過程中已經(jīng)將大數(shù)據(jù)相關工作制度化,從而大數(shù)據(jù)在國家安全報告和學術研究中業(yè)已成為常見主題。
大數(shù)據(jù)及數(shù)據(jù)分析技術可以在許多相關方面提高情報組織的調(diào)查能力,例如犯罪與恐怖戰(zhàn)爭、網(wǎng)絡攻擊防御、公共安全分析、災難與大規(guī)模事件管理以及預測功能等方面。根據(jù)HSRC在《國家安全與執(zhí)法大數(shù)據(jù)和數(shù)據(jù)分析市場——2017-2022》的調(diào)查報告中分析:預測國家安全和執(zhí)法大數(shù)據(jù)及數(shù)據(jù)分析行業(yè)的收入將在2015-2022年復合年增長率達到17.5%,到2022年將達到110億美元。由于世界正在變得更加數(shù)字化和互聯(lián)化,美國國土安全部、國防部、公共安全組織和情報機構使用大數(shù)據(jù)和數(shù)據(jù)分析的情況正在上升。同時,報告預計亞太和歐洲國家安全和執(zhí)法市場的大數(shù)據(jù)和數(shù)據(jù)分析將快速增長,年復合增長率將逼近20%,其中,中國和西歐市場在這方面的增長率會更加突出。
公共安全數(shù)據(jù)分析的目標簡單明晰:識別威脅行為。
我們正在捕獲和收集比以往更多的數(shù)據(jù),所以與過去相比,現(xiàn)在我們擁有的數(shù)據(jù)比以前更多。SAS的安全和防御專家格蘭特.伍德沃德說道:“在過去的兩年里,我們創(chuàng)造了比人類歷史更多的數(shù)據(jù)?!被诖耍绹陌踩矫娴拇髷?shù)據(jù)分析也曾給出警告:如果聯(lián)邦機構不接受并借助大數(shù)據(jù)分析,則聯(lián)邦機構可能面臨巨大威脅,甚至可能會面臨發(fā)現(xiàn)不了威脅存在的情況。面臨這種形式,數(shù)據(jù)分析提供了提高公共安全性的機會。
數(shù)據(jù)分析能夠為識別威脅行為提供決策支持,但也并不意味著直覺和經(jīng)驗這樣的人為因素變得無關緊要。由于現(xiàn)在收集的數(shù)據(jù)更多是非結構化的,如論壇的帖子、新型文本、手機數(shù)據(jù)(全天都在生成數(shù)據(jù))等,這些數(shù)據(jù)并不適合具有字段、行和頁面的數(shù)據(jù)庫存儲和處理,必須依靠人的思維、方法和技術轉變?nèi)ヌ幚砗陀行Ю谩?/p>
從IT時代進入DT時代的過程中,各種科學技術不斷飛速發(fā)展促進了公共安全數(shù)據(jù)分析的發(fā)展。首先是智能手機、可穿戴設備和其他智能連接設備(汽車,機器,物聯(lián)網(wǎng)等)的使用不斷增加,這些設備將繼續(xù)創(chuàng)造大量信息,公共安全部門和組織可以利用其優(yōu)勢進行數(shù)據(jù)分析相關活動。其次,隨著數(shù)據(jù)收、存儲、分析和可視化方面的技術進步,使得能夠更加方便組織、智能化操作這些新生成的數(shù)據(jù)用于支持實時決策,而且公共安全機構也在增加對數(shù)據(jù)分析和可視化功能的投資,政府機構采用云技術,數(shù)據(jù)存儲的成本持續(xù)下降,這些使數(shù)據(jù)分析的使用更加容易,加速了大數(shù)據(jù)和數(shù)據(jù)分析的實施。最后,隨著越來越多的數(shù)據(jù)感知和數(shù)據(jù)專家--HLS數(shù)據(jù)科學家的出現(xiàn),以及目前一些先進的攻擊技術(如網(wǎng)絡戰(zhàn)、加密通信、網(wǎng)絡犯罪、化學戰(zhàn)劑和GPS干擾)和恐怖組織(如ISIS和一些國家支持的恐怖組織)等21世紀的罪犯,對公共安全機構和組織形成了巨大挑戰(zhàn),而大數(shù)據(jù)和數(shù)據(jù)分析是處理這一新現(xiàn)實的首選方法之一。
目前,恐怖主義、自然災害、有組織犯罪、大規(guī)模殺傷性武器擴散和網(wǎng)絡犯罪等這些威脅不斷改變著各國處理國家安全問題的方式。國家級安全和公共安全所受到的直接威脅不斷上升,并演變?yōu)楦訌碗s交錯的沖突,這迫使公共安全機構和組織不得不采用更先進的技術處理并提高威脅感知能力及響應速度。
各國公共安全部門為了執(zhí)法,加強了對公民活動的監(jiān)督,如美國、俄羅斯、土耳其等國家在增加對大數(shù)據(jù)收集和情報收集的投資,借此實現(xiàn)大量人員的內(nèi)部安全。盡管公民自由受到威脅,但面臨內(nèi)部恐怖威脅的國家,國家相關機構和組織的預算被認為會增加。
根據(jù)對國外大數(shù)據(jù)分析發(fā)展研究,數(shù)據(jù)分析對國家安全和公共安全決策支持大致以下幾種方式。
異常檢測主要識別不符合預期行為或模式、事件或相應觀察結果。異常檢測可用于自動評估在線活動是否可疑。
可利用關聯(lián)挖掘算法發(fā)現(xiàn)隱藏在大型數(shù)據(jù)集中的一些有趣的關系和模式。這些關系和模式通常是由于人員、組織、位置等實體頻繁出現(xiàn)在多份文件中。
大數(shù)據(jù)工具對國家安全和公共安全主要貢獻是情報處理領域??衫梅诸愃惴▽?shù)據(jù)集合中的對象分類或者分配給已經(jīng)分好的目標類別,典型的應用是將分類模型用于判別截獲電話呼叫屬于零風險還是高風險可疑活動的一部分。
聚類是指基于相似性的概念將對象或數(shù)據(jù)點分組在一起。這類功能適合大量不同社交媒體數(shù)據(jù)的篩選、組織、生成摘要,幫助識別社交媒體用戶在社會網(wǎng)絡中類型(意見領袖,機器人等)。
關聯(lián)分析用于發(fā)現(xiàn)和評估對象與數(shù)據(jù)點之間的關系,其最著名的應用之一是在社交網(wǎng)絡中分析識別恐怖分子或犯罪網(wǎng)絡中的關鍵節(jié)點。
機器學習是可以獨立地適應和學習他們所處理的數(shù)據(jù)一組特殊的算法。典型的應用包括識別釣魚攻擊、檢測網(wǎng)絡入侵、識別人臉并分析人群。機器學習算法具備自動學習能力,其與大數(shù)據(jù)結合促進了情報分析。
國外在公共安全數(shù)據(jù)分析方面的應用領先于我國。如美國NIST2015年發(fā)布了基于位置服務的路線圖,2016年發(fā)布了“公共安全分析研發(fā)路線圖(link is external)”。NIST的公共安全分析研發(fā)路線圖評估了軟件、網(wǎng)絡和設備技術,這些技術可以加強未來20年的公共安全響應,通信和運營。而在路線圖中數(shù)據(jù)分析被定義為將數(shù)據(jù)轉化為洞察力以做出更好決策的科學。再如美國Felony Lane Gang專案中數(shù)據(jù)分析起到了關鍵的作用,而執(zhí)法機構認識到這一點后,為更進一步發(fā)揮數(shù)據(jù)分析提供決策支持的功能,已經(jīng)開始吸引更多技術人員參與到公共安全的數(shù)據(jù)分析當中,如2017年美國統(tǒng)計協(xié)會針對大學學生,在亞特蘭大這樣的城市收集關于911中心呼叫類型的數(shù)據(jù)和響應細節(jié),開展了2017年警察數(shù)據(jù)挑戰(zhàn)賽;美國警察基金會組織了“公開仇恨犯罪數(shù)據(jù)挑戰(zhàn)賽”。
作為任何國家、任何城市、任何地區(qū)的重要功能,公共安全不僅僅影響到?jīng)Q策者和應急人員,還與城市的每一個居民息息相關。充分借鑒國外公共安全數(shù)據(jù)分析經(jīng)驗,吸取其可以適于本土應用的最佳實踐,才能在加強我國公共安全方面減少投入成本,提高效率,提供較大助力。
公共安全數(shù)據(jù)分析包括存儲和通信設備、數(shù)據(jù)倉庫和數(shù)據(jù)管理分析和可視化應用程序、計算、SQL和NoSQL及專業(yè)的服務等方面,國外在相關技術領域內(nèi)的硬件、軟件及服務相對實力較強,這從技術市場運營為主領先的公司即能看出。存儲和數(shù)據(jù)倉庫方面的Teradata、甲骨文、微軟、戴爾、思科系統(tǒng)及Hadoop系統(tǒng),計算方面的Amazon Web Services、Google Compute Engine,數(shù)據(jù)查詢方面的SQL和NoSQL – SAP、Redis Labs、MongoDB,數(shù)據(jù)分析方面的Palantir Intelligence、Splunk、IBM Watson Analytics、HP Enterpris、SAS、日立數(shù)據(jù)系統(tǒng)、BAE Systems、Actian及Raytheon,在數(shù)據(jù)可視化方面的Tableau、TIBCO、QlikView、MicroStrategy,專業(yè)服務方面的埃森哲、普華永道和德勤等大公司。
比較可知,借鑒以上公司的技術與經(jīng)驗,具備數(shù)據(jù)分析方面自主創(chuàng)新技術和產(chǎn)品,才能真正保護我國的公共安全。
在最好的情況下,分析技術可以使人解放甚至可以幫助人類去做他們最擅長的事情:思考、提出問題并做出判斷。然而,機器和算法去掉了人類相互作用的大部分環(huán)境,事實證明,只有當人類分析師向系統(tǒng)提供反饋時,由機器學習算法驅動的大數(shù)據(jù)應用程序才會表現(xiàn)更好。尤其在一些重要的國家安全和公共安全的見解(如關于外國領導人意圖的信息)方面,人類仍然具備最明確的理解能力。
所以,大數(shù)據(jù)無法取代人類作為公共安全的中心角色,只有與人為判斷相結合時,大數(shù)據(jù)與數(shù)據(jù)分析才最有用。只有積極培養(yǎng)公共安全數(shù)據(jù)分析人才,才能使得數(shù)據(jù)分析為我所用,保護好公共安全。
[1]梅林,王鈞.物聯(lián)網(wǎng)技術及其在公安信息化中的應用[J].廣東公安科技,2015.
[2]丁波濤.大數(shù)據(jù)條件下的城市公共安全應對機制[J].上海城市管理,2015.
[3]李明.大數(shù)據(jù)技術與公共安全信息共享能力[J].電子政務,2014.
[4]周芳檢,何振.大數(shù)據(jù)時代城市公共安全應急管理面臨的挑戰(zhàn)與應對[J].云南民族大學學報(哲學社會科學版),2018.
[5]http://e.huawei.com/cn/publications/cn/ict_insights/201512291139/forum/201512311523.
[6]https://homelandsecurityresearch.com/reports/global-public-safety-homeland-security-markets-industry-technologies/.
2017年河南省高等教育教學改革研究與實踐項目:網(wǎng)絡安全與執(zhí)法專業(yè)實踐教學課程體系與教學內(nèi)容整體優(yōu)化研究與實踐(項目編號:2017SJGLX521)。