夏桂珍 李劍鋒
摘 要 近年來,全球信息化快速發(fā)展,恐怖分子利用網(wǎng)絡信息技術加快了恐怖主義網(wǎng)絡化、全球化,傳統(tǒng)的技術手段在偵獲恐怖主義方面已顯不足,迫切需要引進大數(shù)據(jù)技術,創(chuàng)新反恐怖主義的方法手段。本文分析了恐怖主義的新特征、大數(shù)據(jù)的4個特點及其在反恐怖主義方面的優(yōu)勢,并展望了社會計算、深度學習和預測分析等大數(shù)據(jù)技術未來在反恐怖主義行動中的應用前景。
關鍵詞 恐怖主義 大數(shù)據(jù) 社會計算 深度學習 預測分析
作者簡介:夏桂珍,武警政治學院刑偵技術實驗室,副教授;李劍鋒,武警政治學院政工信息化教研室,講師。
中圖分類號:D815 文獻標識碼:A DOI:10.19387/j.cnki.1009-0592.2016.11.213
自美國“9·11”事件以來,全球信息化快速發(fā)展,恐怖分子充分認識到網(wǎng)絡信息技術的優(yōu)勢并加以利用,加快了恐怖主義活動全球化趨勢,使恐怖主義暴力活動的影響蔓延到全球每一個角落,恐怖主義的特征也隨之發(fā)生了變化。大數(shù)據(jù)時代的到來,為及時洞悉恐怖主義動向,遏制恐怖主義發(fā)展提供了新的手段和方法。利用社會計算、深度學習和預測分析等大數(shù)據(jù)技術,對恐怖主義進行分析和研究,通過解構恐怖主義組織,及時發(fā)現(xiàn)恐怖組織成員體系、結(jié)構特征與行動目標,從而有效遏制恐怖活動的發(fā)生,廣泛打擊恐怖主義組織。
一、當前恐怖主義的特征
互聯(lián)網(wǎng)和信息技術的迅猛發(fā)展,給恐怖分子實施恐怖活動提供了新的途徑,他們借助網(wǎng)絡組織實施恐怖活動,宣傳恐怖主義思想,在組織結(jié)構和行為方式上與傳統(tǒng)的恐怖主義發(fā)生了很大變化,其利用互聯(lián)網(wǎng)混淆視聽,制造社會恐慌的能力,已發(fā)展到極至。當前,恐怖主義呈現(xiàn)出以下幾個新特征:
(一)恐怖組織結(jié)構網(wǎng)絡化
傳統(tǒng)恐怖主義的組織結(jié)構屬于垂直等級式的,其內(nèi)部高度集中,等級森嚴,有統(tǒng)一的領導和明確的政治目標,恐怖活動的組織和實施受到物理距離和國界等限制,而互聯(lián)網(wǎng)時代,恐怖組織借助網(wǎng)絡編織出一張動態(tài)的、隨意的、松散的、多中心的網(wǎng),其恐怖主義思想各成體系,不再需要嚴格的垂直等級制結(jié)構的指揮、控制鏈來協(xié)調(diào)計劃和行動。獨狼式、恐怖小組等小規(guī)模的恐怖襲擊運作模式和組織機構的網(wǎng)絡化,使得恐怖活動更加難以監(jiān)控、反恐情報更加難以獲取。以往情報部門只要通過監(jiān)視主要恐怖頭目,就可以實現(xiàn)對大部分的恐怖活動進行監(jiān)控的方式已收效甚微。
(二)恐怖活動形式多樣化
網(wǎng)絡信息化時代,恐怖分子除了在現(xiàn)實生活中頻繁的策劃實施投毒、爆炸、砍殺等影響較為嚴重的恐怖活動外,更是充分利用網(wǎng)絡的便利性和隱蔽性,進行各種形式的網(wǎng)絡恐怖活動。一方面,他們利用網(wǎng)絡平臺進行恐怖主義宣傳,散播恐怖言論和恐怖視頻,制造恐怖輿論,引起群眾恐慌。另一方面,恐怖分子大力招募網(wǎng)絡黑客,培訓網(wǎng)絡信息技術,對我黨政軍網(wǎng)絡系統(tǒng)進行攻擊,嚴重威脅我網(wǎng)絡系統(tǒng)的安全。
(三)恐怖活動手段隱秘性
互聯(lián)網(wǎng)時代,網(wǎng)絡行為更多的是一種匿名活動,恐怖分子借助互聯(lián)網(wǎng),混雜在數(shù)量巨大的普通網(wǎng)民中,僅通過密碼和特殊的口令在網(wǎng)絡上互相聯(lián)絡,在全球各地大肆發(fā)展恐怖活動組織,策劃恐怖活動,甚至利用網(wǎng)絡來相互傳授實施恐怖活動的技能(如制作爆炸物等)?;ヂ?lián)網(wǎng)上信息量巨大,再加上恐怖分子所采取的各種反偵察技術、加密技術,使得反恐任務更加艱巨,極短的時間內(nèi)很難辨認恐怖分子身份和偵獲恐怖活動行徑。即使能夠攔截到所有的信息,但要在海量的信息中提取有用信息,及時做出分析判斷也是非常困難的,這超出了大數(shù)據(jù)技術出現(xiàn)之前我們對數(shù)據(jù)的處理能力??植澜M織正是充分利用了網(wǎng)民多,信息量大等網(wǎng)絡特性,將自己的身份和恐怖活動信息淹沒于茫茫信息海洋中,使自身的恐怖活動更加隱秘。
二、大數(shù)據(jù)的特點及其技術優(yōu)勢
面對恐怖主義出現(xiàn)的新特征,傳統(tǒng)技術手段的弊端已顯現(xiàn),其已無法迅速掌握恐怖主義相關信息,無法徹底解構恐怖組織,無法預測并遏制恐怖活動的發(fā)生,無法有效制止恐怖活動的發(fā)生。隨著我們邁入大數(shù)據(jù)時代,大數(shù)據(jù)技術不斷成熟完善,這些問題將迎刃而解。大數(shù)據(jù)(Big data ),或稱海量數(shù)據(jù)、巨量數(shù)據(jù)、大資料,指的是數(shù)據(jù)量規(guī)模巨大,無法通過人工或常規(guī)軟件工具,在可承受的時間范圍內(nèi)達到捕捉、管理、處理、并整理成為人類所能解讀的信息 。對反恐怖主義來說,大數(shù)據(jù)也是一把不可多得的利刃。大數(shù)據(jù)主要有以下幾個特點:
(一)數(shù)據(jù)量大(Volume)
數(shù)據(jù)量大是大數(shù)據(jù)的一個重要特點。大數(shù)據(jù)的起始計量單位至少是PB(1PB=1024TB)、EB(1EB=1024PB)或ZB(1ZB=10 24EB)。大數(shù)據(jù)條件下,各種智能終端、移動設備和網(wǎng)絡設備等每時每刻都有大量數(shù)據(jù)產(chǎn)生,數(shù)量級別已經(jīng)發(fā)展至PB級別,乃至ZB級別,統(tǒng)計數(shù)據(jù)量呈千倍級別上升。
(二)類型繁多(Variety)
近年來,全球數(shù)據(jù)不僅在數(shù)量上飛速增長,在數(shù)據(jù)類型方面也在朝多樣化發(fā)展。除了結(jié)構化數(shù)據(jù)外,各種非結(jié)構化數(shù)據(jù)(包括由視頻、音頻、圖片、郵件、GPS和傳感器等產(chǎn)生的數(shù)據(jù)),每年都以60%速度快速增長,未來非結(jié)構化數(shù)據(jù)將占數(shù)據(jù)總量的80%以上 ,日益增長的數(shù)據(jù)變化對數(shù)據(jù)的處理能力提出了更高的要求。
(三)產(chǎn)生價值(Value)
數(shù)據(jù)價值大密度低,是大數(shù)據(jù)的又一個特點。對于反恐怖主義而言,利用大數(shù)據(jù)技術,從龐大的數(shù)據(jù)中發(fā)現(xiàn)稀疏而有高價值的恐怖主義信息和恐怖活動規(guī)律,為反恐怖主義預測和決策提供相關支持,從而制止恐怖活動,瓦解恐怖組織,實現(xiàn)這些數(shù)據(jù)的最大價值。
(四)追求高效(Velocity)
相對于傳統(tǒng)數(shù)據(jù)挖掘而言,大數(shù)據(jù)最顯著的特征是追求高效率。傳統(tǒng)的技術架構已無法適應大數(shù)據(jù)的處理,基于云計算的Hadoop等大數(shù)據(jù)框架,利用集群的威力、高速的運算及存儲,實現(xiàn)了一個分布式的運行系統(tǒng),以提供高傳輸率來訪問數(shù)據(jù),適應了大數(shù)據(jù)的應用程序。此外,社會計算、深度學習、預測分析、語義引擎、數(shù)據(jù)挖掘、可視化分析等技術的發(fā)展,使人們更易于從海量的數(shù)據(jù)中提取有用信息,進行深度解析,及時提供有價值的數(shù)據(jù),這與反恐怖主義情報收集的目標是一致的。
三、大數(shù)據(jù)技術在反恐怖主義中的應用展望
隨著恐怖主義特點的變化,反恐怖主義情報的獲取方式也將發(fā)生相應變化,對恐怖主義數(shù)據(jù)和信息的分析提升到了前所未有的高度,這種分析是更深層的信息挖掘。大數(shù)據(jù)時代,對數(shù)據(jù)的處理理念發(fā)生了變化:要全體不要樣本,要效率不要絕對精確,要相關不要因果 。這種變化恰好能滿足反恐怖主義情報獲取的需要。在新理念引領下,發(fā)展起來的大數(shù)據(jù)技術將有力支持反恐怖主義情報的獲取。
(一)社會計算
大數(shù)據(jù)時代的社會計算是一種數(shù)據(jù)密集型科學研究范式 。利用社會計算,加強社會網(wǎng)絡分析,對恐怖分子的社區(qū)結(jié)構進行分析,探尋其規(guī)模、組織結(jié)構、成員構成和行為特征等,將有效解構恐怖組織,確定恐怖分子之間的關系。通過發(fā)現(xiàn)恐怖分子在網(wǎng)上的活動痕跡開始,逐步挖掘出整個恐怖組織,并通過追蹤通信聯(lián)系、查控物資及資金的流動,實現(xiàn)對恐怖組織中所有成員活動進行監(jiān)控而獲得信息,從而有效打擊恐怖活動,摧毀恐怖組織。
(二)深度學習
深度學習 也是大數(shù)據(jù)分析的核心技術之一,它模仿人腦的機制來解釋數(shù)據(jù),通過組合底層特征形成更加抽象的高層表示屬性類別或特征,以發(fā)現(xiàn)數(shù)據(jù)的分布特征表示,傳統(tǒng)的機器學習研究通常都是較為簡單或淺層的模型,依賴于數(shù)據(jù)的表達,取得的學習效果一般。大數(shù)據(jù)的出現(xiàn)提供了更加復雜的模型,使之能更有效地表征數(shù)據(jù)、解釋數(shù)據(jù)。在國內(nèi),百度公司利用深度學習技術,在語音識別、OCR識別、人臉識別、圖像檢索等應用上也取得了長足進步。
深度學習技術的進步對反恐怖主義有著重要的意義,結(jié)合圖像識別技術,將已知恐怖分子圖像與海量的視頻資料對比,在茫茫人海中及時發(fā)現(xiàn)恐怖分子行蹤。與云計算技術緊密結(jié)合,有望做到實時發(fā)現(xiàn)、密切跟蹤、及時報警;對于語音和文本識別,也將能更好地理解自然語言的語義,對反恐怖主義工作也將提供很大的輔助作用。
(三)預測分析
大數(shù)據(jù)的核心就是預測。大數(shù)據(jù)背景下,人們通過把數(shù)學算法運用到海量的數(shù)據(jù)上來預測事情發(fā)生的可能性。相關關系在小數(shù)據(jù)世界中有一定作用,但在大數(shù)據(jù)的背景下,相關關系的作用更為突出。通過應用相關關系,我們可以更便捷、更清楚、更有效地分析并預測事物的發(fā)生。運用相關關系,我們不需要通過揭示其內(nèi)部的運作機制來分析現(xiàn)象,而是通過識別有用的關聯(lián)物,來對現(xiàn)象進行分析。相關關系沒有絕對,只有可能性。利用這一特征,來分析與恐怖活動相關的所有信息。通過找到一個恐怖活動的良好關聯(lián)物,相關關系可以幫助我們捕捉現(xiàn)在和預測未來;通過分析梳理與恐怖活動一起發(fā)生的事件,密切關注這些相關事件的發(fā)生,就可以預測恐怖活動的發(fā)生。這有助于我們在不能直接知悉恐怖活動何時何地發(fā)生的情況下,通過捕捉可能和恐怖活動一起發(fā)生的事情,來幫助我們預測恐怖活動發(fā)生的可能性,甚至獲取恐怖分子實施恐怖活動的具體計劃,以便我們能及時阻止恐怖活動的發(fā)生。雖然相關關系無法預知未來,只能預測可能發(fā)生的事情,但這對于反恐怖主義,遏制恐怖活動發(fā)生來說,這已經(jīng)非常有用了。
四、結(jié)語
大數(shù)據(jù)時代的到來給我們帶來了機遇和挑戰(zhàn),大數(shù)據(jù)技術的發(fā)展將有力推動反恐怖主義方法手段的創(chuàng)新。本文從分析新時期恐怖主義的特征入手,闡明了傳統(tǒng)的技術手段已經(jīng)無法滿足反恐怖主義的需要,而大數(shù)據(jù)技術的發(fā)展,將對反恐主義提供有力支撐,最后對社會計算、深度學習和預測分析等大數(shù)據(jù)技術未來在反恐怖主義行動中的應用進行了展望,這些大數(shù)據(jù)技術將輔助我們遏制恐怖主義發(fā)展勢頭,發(fā)現(xiàn)恐怖分子活動行蹤,有效阻止恐怖活動發(fā)生。
注釋:
http://zh.wikipedia.org/wiki/%E5%A4%A7%E6%95%B8%E6%93%9A - cite_ref-1 White, Tom. Hadoop: The Definitive Guide. OReilly Media. 2012-05-10. 3.ISBN 978-1- 44 93-3877-0.
Vance, Ashley. Start-Up Goes After Big Data With Hadoop Helper. New York Times Blog. 2010-04-22.
孟小峰、李勇、祝建華.社會計算:大數(shù)據(jù)時代的機遇與挑戰(zhàn).計算機研究與發(fā)展.2013,50(12).2488-2491.
[英]維克托·邁爾·舍恩伯格、肯尼思·庫克耶.大數(shù)據(jù)時代.浙江人民出版社.2012.12.
Hey T.Tansley S.Tolle K.The fourth paradigm:Data-intensive scientific discovery.Red mond.Washington:Microsoft Research.2009.[2013-06-04].
百度百科 http://wapbaike.baidu.com/view/9964678.htm?adapt=1&fr= aladdin&bd_sou rce_light=1701851.