国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向態(tài)勢感知的國家安全事件圖譜構(gòu)建研究

2021-11-25 09:31:44王施運李白楊
情報學報 2021年11期
關(guān)鍵詞:安全事件態(tài)勢圖譜

李 綱,王施運,毛 進,李白楊

(1.武漢大學信息資源研究中心,武漢 430072;2.武漢大學信息管理學院,武漢 430072)

1 引言

當前,我國國家安全形勢日益嚴峻,國際安全與國內(nèi)安全、傳統(tǒng)領(lǐng)域安全與非傳統(tǒng)領(lǐng)域安全問題頻繁發(fā)生,嚴重威脅著國家發(fā)展和社會穩(wěn)定[1]。近年來,黨和國家高度重視國家安全問題。2014年4月15日,習近平總書記在主持召開中央國家安全委員會第一次會議時首次提出總體國家安全觀的戰(zhàn)略思想,統(tǒng)籌維護國家政治、經(jīng)濟、軍事、科技、文化、生態(tài)等各方面的安全,給國家安全管理提出了新的要求[2]。

國家安全事件的突發(fā)性、事件演化過程的復雜性和不確定性、影響結(jié)果的威脅性和深遠性,要求決策者必須在極短的時間內(nèi)對其做出快速判斷和處置。傳統(tǒng)的“預測-應對”型管理方案,較多依賴于經(jīng)驗決策和專家咨詢等形式,難以適應高度非常規(guī)、復雜化的國家安全事件的應急管理需求。因此,面向國家安全事件的應急管理,需要實現(xiàn)實時、全面的態(tài)勢感知,構(gòu)建更有針對性的“情景-應對”型管理模式[3]。國家安全事件態(tài)勢感知的核心是從事件相關(guān)的信息內(nèi)容中挖掘有價值的態(tài)勢要素,通過分析形成對當前態(tài)勢的總體描述,使各利益相關(guān)者加深對當前情景的理解,輔助生成處置決策。在態(tài)勢感知基礎上,再結(jié)合歷史數(shù)據(jù)實現(xiàn)態(tài)勢推演和預測,為國家安全事件風險預警提供服務。然而,國家安全事件相關(guān)數(shù)據(jù)主要以半結(jié)構(gòu)化和非結(jié)構(gòu)化的形式廣泛分散存在,表現(xiàn)出典型的大數(shù)據(jù)“4V”(volume,variety,value,velocity)特征及交織性、超維性和協(xié)同性等新型特征[4],給國家安全事件信息管理帶來極大的挑戰(zhàn)。面向國家安全事件的應急管理,如何從海量、多源、異構(gòu)且動態(tài)變化的國家安全事件大數(shù)據(jù)中,深度挖掘出細粒度的知識單元和知識之間的關(guān)聯(lián),構(gòu)建國家安全事件的全景描述,實現(xiàn)國家安全事件的態(tài)勢感知,成為國家安全事件信息管理中亟待解決的關(guān)鍵問題。

語義網(wǎng)技術(shù)的發(fā)展,為上述問題的解決提供了新的思路。知識圖譜(knowledge graph)是基于語義網(wǎng)技術(shù)發(fā)展起來的一種新興知識組織方式[5],通過實體表示細粒度的知識,并揭示實體之間的知識關(guān)聯(lián)。哈爾濱工業(yè)大學的劉挺教授團隊進一步提出事理圖譜,利用謂詞短語來表示事件,并通過有向邊表示事件之間的順承和因果關(guān)系,從動態(tài)角度揭示事件之間的演化邏輯[6]。針對國家安全事件大數(shù)據(jù)的復雜特征,需要借助知識圖譜和事理圖譜技術(shù),從多層次、多角度出發(fā),實現(xiàn)國家安全事件信息的相互關(guān)聯(lián)以及知識的深度揭示,采用知識挖掘技術(shù)實現(xiàn)國家安全事件態(tài)勢的全面感知與分析,為國家安全事件的管理決策提供服務。

因此,本文面向國家安全事件的態(tài)勢感知,從信息組織的角度出發(fā),基于知識圖譜和事理圖譜模型構(gòu)建了國家安全事件圖譜知識表示模型,描述和揭示了事件、實體及其相互關(guān)系,并提出了一套國家安全事件圖譜的構(gòu)建方法,以實現(xiàn)國家安全事件大數(shù)據(jù)的序化組織。在此基礎上,探究基于國家安全事件圖譜的態(tài)勢狀態(tài)提取方法,借助數(shù)據(jù)分析模型實現(xiàn)國家安全事件的態(tài)勢感知,為國家安全事件的處置決策提供情報服務,為構(gòu)建“情報靈、判斷準、反應快”的國家安全管理體系提供有效的信息與知識保障,從而實現(xiàn)國家安全管理能力的綜合提升。

2 相關(guān)研究

2.1 面向國家安全的知識庫建設

當前,國家安全領(lǐng)域的信息組織主要依賴于知識庫建設。一些國家針對具體的國家安全領(lǐng)域構(gòu)建了相應的數(shù)據(jù)庫和知識庫。例如,英國IHS Jane’s集團下的國家風險安全與軍事能力評估情報中心針對全球250個國家和地區(qū)軍事能力和安全環(huán)境進行了關(guān)鍵分析,形成了國家風險與安全評估模塊、安全資訊模塊等核心數(shù)據(jù)庫,為用戶的重要安全決策提供支持。

目前,國內(nèi)尚沒有公開的面向國家安全事件的大型數(shù)據(jù)庫。但已有許多學者面向突發(fā)事件開展了本體知識庫的構(gòu)建研究。這類知識庫主要分為描述靜態(tài)概念的本體知識模型和描述動態(tài)事件的本體知識模型。早期的研究多關(guān)注基于靜態(tài)概念的本體知識模型構(gòu)建,例如,王能干等[1]構(gòu)建了突發(fā)事件應急服務本體模型;楊月華等[7]通過對突發(fā)事件領(lǐng)域的知識信息進行收集,構(gòu)建了包含事件、級別、階段、應對和資源這五類概念,及其相互關(guān)系的突發(fā)事件領(lǐng)域本體模型。這類基于概念的本體模型旨在揭示突發(fā)事件領(lǐng)域涉及的相關(guān)概念及概念間的上下位關(guān)系和同義關(guān)系,而不關(guān)注事物之間的動態(tài)變化過程,難以滿足工業(yè)界基于事件邏輯關(guān)系進行推理的知識需求。因此,事件本體應運而生[8]。事件本體作為一種以事件為核心的知識表示方法,是從事件及其關(guān)系的角度對事件的發(fā)展演變過程進行描述。朱文躍等[9]提出了基于事件本體的突發(fā)事件領(lǐng)域知識建模方法,構(gòu)建了包含上層事件類、下層事件類以及事件實例的本體結(jié)構(gòu),可用于描述突發(fā)事件中事件類、事件要素以及事件之間的層次和非層次關(guān)系。馬雷雷等[10]以自然災害事件要素為核心,構(gòu)建了自然災害事件領(lǐng)域本體模型,包含自然災害事件中的時空、動作、對象及事件之間的語義關(guān)系結(jié)構(gòu)。還有些學者針對具體的自然災害事件,構(gòu)建了相應的事件本體,如臺風災害領(lǐng)域本體模型[11]、洪澇災害事件信息模型[12]等。

2.2 面向國家安全事件的知識圖譜構(gòu)建方法

知識圖譜最初是谷歌公司于2012年提出的,初衷是為了改進其搜索引擎的性能[13]。隨著知識圖譜技術(shù)不斷發(fā)展和完善,逐漸被應用到各個領(lǐng)域和行業(yè)中。目前,尚沒有關(guān)于直接應用于國家安全事件信息管理的研究,但有部分學者針對突發(fā)事件的知識圖譜構(gòu)建方法進行了探究。杜志強等[14]提出了自上而下和自下而上相結(jié)合的自然災害應急知識圖譜構(gòu)建方法。圍繞自然災害事件、災害應急任務、災害數(shù)據(jù)以及模型方法四個要素,自上而下構(gòu)建知識圖譜的模式層;然后,通過數(shù)據(jù)獲取、知識抽取、融合、存儲等方法,從實際數(shù)據(jù)中獲取實體間的關(guān)聯(lián)關(guān)系,自下而上構(gòu)建數(shù)據(jù)層。李澤荃等[15]探究了基于知識圖譜的災害場景信息融合技術(shù),以臺風“山竹”為例,構(gòu)建了知識圖譜案例。陶坤旺等[16]對知識圖譜在應急減災領(lǐng)域的應用流程進行了總結(jié),構(gòu)建了九寨溝地震應急知識圖譜。李攀成[17]對知識圖譜構(gòu)建技術(shù)中的知識融合技術(shù)進行研究,實現(xiàn)了公共安全領(lǐng)域中文知識圖譜的構(gòu)建系統(tǒng),主要包括數(shù)據(jù)獲取、知識抽取、知識存儲和知識融合等模塊。這些研究為本文面向國家安全事件的圖譜構(gòu)建提供了參考。

2.3 安全場景下的態(tài)勢感知研究現(xiàn)狀

態(tài)勢感知的定義最早由Endsley[18]明確提出,是指“基于一定的時空條件,實現(xiàn)對環(huán)境要素的察覺、理解和對未來發(fā)展趨勢的預測”。在此定義基礎上,1995年,Endsley[19]將態(tài)勢感知引入人的決策制定過程,提出態(tài)勢感知模型。態(tài)勢感知被劃分為三個階段:態(tài)勢察覺(perception)、態(tài)勢理解(comprehension)和態(tài)勢預測(projection),為態(tài)勢感知的應用奠定了理論基礎。態(tài)勢感知在涉及安全的相關(guān)領(lǐng)域中研究最多,主要包括戰(zhàn)爭、網(wǎng)絡安全、突發(fā)事件等場景,尚缺少直接關(guān)于國家安全事件態(tài)勢感知的相關(guān)研究。

在戰(zhàn)場指揮系統(tǒng)中,態(tài)勢感知是指對戰(zhàn)場復雜環(huán)境形勢的分析評估和預測[20]。崔令飛等[21]從時空大數(shù)據(jù)平臺構(gòu)建、時空大數(shù)據(jù)來源拓展和平臺的優(yōu)化利用等三個層次,探究了利用時空信息資源圖支撐一體化聯(lián)合作戰(zhàn)戰(zhàn)場態(tài)勢感知的可行性。楊霄等[22]提出了將物聯(lián)網(wǎng)技術(shù)應用于戰(zhàn)場綜合態(tài)勢感知領(lǐng)域的系統(tǒng)建設思路和方法,有助于我國軍隊高效快速地掌握戰(zhàn)場局勢。

網(wǎng)絡安全態(tài)勢感知是近年來關(guān)注度較高的一個相關(guān)領(lǐng)域。1999年,Bass[23]首次提出在網(wǎng)絡空間中實現(xiàn)態(tài)勢感知的構(gòu)想,由此開始了態(tài)勢感知系統(tǒng)在網(wǎng)絡空間的發(fā)展應用。網(wǎng)絡安全領(lǐng)域的研究內(nèi)容,按其態(tài)勢感知功能可分為網(wǎng)絡安全態(tài)勢要素的提取、網(wǎng)絡安全態(tài)勢的評估和網(wǎng)絡安全態(tài)勢的預測[24]。在此功能基礎上,國內(nèi)外相關(guān)企業(yè)研發(fā)了一系列的網(wǎng)絡安全態(tài)勢感知系統(tǒng)。國外以FireEye、Mandiant、MITRE、RSA、Lastline等網(wǎng)絡安全公司為代表,國內(nèi)以360公司、亞信科技、安恒科技、綠盟科技等公司為代表,都推出了網(wǎng)絡安全態(tài)勢感知系統(tǒng)[25],為網(wǎng)絡安全的實時監(jiān)控和風險評估提供了強有力的支撐。

突發(fā)事件方面,一些學者開始關(guān)注利用社交媒體進行突發(fā)事件領(lǐng)域的態(tài)勢感知研究。在突發(fā)事件場景下,社交媒體中涉及大量的受災地區(qū)損失信息、逃生路線、安全信息、失蹤資源[26]、地理信息[27]、捐助信息和警告信息等與突發(fā)事件態(tài)勢相關(guān)的數(shù)據(jù)[28],能夠為突發(fā)事件中事件的災害消解、受害人支持等應急響應工作提供實時、精確的信息支撐[26]。曾大軍等[3]提出了一套整合社會傳感網(wǎng)絡的突發(fā)事件大數(shù)據(jù)應用解決方案,為社交媒體在突發(fā)事件態(tài)勢感知中的應用場景提供理論指導。Power等[29]利用Twitter的數(shù)據(jù)構(gòu)建了ESA(emergency situ‐ation awareness)系統(tǒng)。Salfinger等[30]提出將社會傳感器中的危機信息整合進入態(tài)勢感知系統(tǒng)的框架,并提出了系統(tǒng)功能的評估指標體系,對目前已有的九種基于社會傳感器的危機管理態(tài)勢感知系統(tǒng)進行了功能性評估,為后續(xù)面向危機管理的態(tài)勢感知系統(tǒng)研究提供了理論框架。目前已有研究者將社交媒體應用到突發(fā)事件的態(tài)勢感知中,為態(tài)勢信息的全面感知和監(jiān)控提供數(shù)據(jù)支撐。但是,社交媒體信息的海量、多源、異構(gòu)等特征,又會給突發(fā)事件的信息組織帶來極大的挑戰(zhàn)。而面向更為重要和復雜的國家安全事件,需要更進一步探究新的信息組織方式。

3 國家安全事件大數(shù)據(jù)的組織與應用架構(gòu)

本文所述國家安全事件是在總體國家安全觀視角下的事件總稱,不局限于國土安全和軍事安全,而是拓展到了經(jīng)濟安全、文化安全、社會安全、科技安全、網(wǎng)絡安全、生態(tài)安全等各個領(lǐng)域。

3.1 國家安全事件大數(shù)據(jù)的特征

在傳統(tǒng)的“預測-應對”型應急管理模式中,信息需要通過部門間的層層上報的方式為決策提供服務。人際傳播和線下傳播是傳統(tǒng)應急管理過程中重要信息的主要收集方式。但是,政府安全管理部門對于數(shù)據(jù)的管理并未實現(xiàn)真正的共享[31],縱向的科層制工作結(jié)構(gòu)和橫向的部門劃分使得數(shù)據(jù)資源難以統(tǒng)一整合和有效管理。此外,傳統(tǒng)的業(yè)務工作流程無法實現(xiàn)數(shù)據(jù)的實時共享。這就導致面對國家安全數(shù)據(jù)資源之“大”,政府管理部門對其利用率卻很“小”的問題,數(shù)據(jù)資源的開發(fā)利用嚴重不足,國家安全大數(shù)據(jù)的價值密度極低,難以滿足應急決策的需求。

隨著互聯(lián)網(wǎng)和移動網(wǎng)絡的快速發(fā)展,新聞媒體網(wǎng)站以及微博、微信、博客、在線論壇等社交媒體的普及,極大地拓展了社會大眾的信息溝通和實時交互能力,激發(fā)了大眾參與國家安全事務的熱情。Web社會媒體這種即時性高、社交性強的信息傳播方式,已被視作一種有效的社會傳感器[3,32]。來自互聯(lián)網(wǎng)渠道的國家安全事件大數(shù)據(jù)能夠在重特大突發(fā)事件中發(fā)揮重要作用。當災害發(fā)生時,來自全國各地描述災情的信息在各種社交媒體平臺上迅速傳播,為政府安全管理者提供全面、實時的態(tài)勢要素信息。此外,這些由公眾的日常感觀所產(chǎn)生的信息相對于傳統(tǒng)物理傳感器得到的信息,往往更為直觀易懂,便于分析,能夠在短時間內(nèi)得到較為可靠的態(tài)勢信息[3]。

因此,近年來國家安全事件相關(guān)信息的傳播形成了以人際交流等為主的傳統(tǒng)信息傳播渠道和以物聯(lián)網(wǎng)、社交媒體、新聞媒體網(wǎng)站、政府網(wǎng)站等為主的互聯(lián)網(wǎng)渠道共融的特點。但是,海量的信息廣泛分散在物理環(huán)境、人類社會和信息空間中,信息載體各異、傳播渠道分散、數(shù)據(jù)類型復雜等特征導致不同來源的信息組成的國家安全大數(shù)據(jù)呈現(xiàn)出無序、多維等特點,難以有效融合,給國家安全事件態(tài)勢感知的精準性和態(tài)勢分析的有效性帶來了巨大挑戰(zhàn)。

3.2 基于事件圖譜的國家安全事件大數(shù)據(jù)組織與應用架構(gòu)

面向國家安全事件的態(tài)勢感知需求,需要實現(xiàn)國家安全多源數(shù)據(jù)的綜合集成與語義融合。因此,本文提出一種融合實體關(guān)系圖和事理演化邏輯圖的國家安全事件圖譜,以實現(xiàn)對知識的細粒度、深層次組織。本文所述的國家安全事件圖譜主要具有以下特征:①由模式層(知識表示模型)和數(shù)據(jù)層構(gòu)成。其中,模式層提供了對事件、實體、屬性及其關(guān)聯(lián)關(guān)系的語義描述架構(gòu),能夠指導國家安全事件相關(guān)數(shù)據(jù)的采集和挑選,實現(xiàn)多源異構(gòu)數(shù)據(jù)的語義融合。②事件圖譜的知識表示主要包含兩層邏輯結(jié)構(gòu),即事件層和實體層。其中,事件層重點關(guān)注事件的時空演變狀態(tài)和事件的邏輯演化規(guī)律。態(tài)勢感知要求在時間維上對事件整個生命周期下的狀態(tài)進行持續(xù)感知,在空間維上對事件相關(guān)的整個態(tài)勢空間進行監(jiān)測,不僅包括現(xiàn)實物理世界中的各種對象,也包括虛擬網(wǎng)絡空間中的各種對象集合。由于國家安全事件的特性,需要重點關(guān)注事件屬性隨時空的演變情況。此外,國家安全事件的復雜性使得其發(fā)展難以通過個人經(jīng)驗簡單預測,因此,需要整合從領(lǐng)域知識庫以及歷史案例庫中抽象出的事件之間的邏輯演化關(guān)系,對事件發(fā)展態(tài)勢進行推演,為風險預警提供服務。實體層涉及事件相關(guān)實體,需要重點關(guān)注主體之間的關(guān)聯(lián)關(guān)系和主體的職能匹配。國家安全事件往往涉及大量關(guān)系復雜的利益主體,需要理清各主體的需求-能力匹配關(guān)系和合作關(guān)系等,為資源配置提供服務。

基于事件圖譜,本文提出國家安全事件大數(shù)據(jù)組織和應用架構(gòu),如圖1所示。該系統(tǒng)架構(gòu)的基本思想:將國家安全事件圖譜應用于實現(xiàn)國家安全事件大數(shù)據(jù)的集成與組織,為態(tài)勢感知提供數(shù)據(jù)支撐,實現(xiàn)國家安全事件大數(shù)據(jù)的“數(shù)據(jù)-知識-服務”轉(zhuǎn)化路徑。首先,基于專家經(jīng)驗和歷史數(shù)據(jù)構(gòu)建一個國家安全事件圖譜原型,基于模式層的指導,利用分布式數(shù)據(jù)探針[4]從物理世界、人類社會和信息空間中采集各種態(tài)勢相關(guān)信息,通過數(shù)據(jù)處理構(gòu)建國家安全事件圖譜的數(shù)據(jù)層,完成國家安全事件大數(shù)據(jù)從數(shù)據(jù)到知識的轉(zhuǎn)化。然后,基于國家安全事件圖譜的數(shù)據(jù)結(jié)構(gòu),利用智能化的分析方法構(gòu)建數(shù)據(jù)分析模型,實現(xiàn)對態(tài)勢情景的察覺和理解功能。在此基礎上,利用當前態(tài)勢信息和歷史信息實現(xiàn)態(tài)勢推演和預測功能,以識別事件發(fā)展過程中的未知風險。面向公眾、組織機構(gòu)和決策者等不同主體的態(tài)勢感知需求,提供直觀、精準而全面的情報服務,完成國家安全事件大數(shù)據(jù)從知識到服務的轉(zhuǎn)化。

圖1 國家安全事件大數(shù)據(jù)的組織與應用架構(gòu)

4 國家安全事件圖譜的構(gòu)建方法

本文所述的國家安全事件圖譜是由模式層和數(shù)據(jù)層構(gòu)成的。模式層是事件圖譜的知識表示模型,負責提供語法規(guī)約,而數(shù)據(jù)層則是由具體事件、實體實例及其關(guān)系等數(shù)據(jù)組成,從國家安全事件信息內(nèi)容中解析得來。國家安全事件圖譜的構(gòu)建主要解決兩個問題:知識表示模型的構(gòu)建和數(shù)據(jù)層的自動構(gòu)建。

4.1 國家安全事件圖譜知識表示模型構(gòu)建

為了詳細闡述如何構(gòu)建事件圖譜表示模型,本文給出了具體實現(xiàn)思路,如圖2所示。首先,給出國家安全事件圖譜的基本定義,設計圖譜的整體邏輯結(jié)構(gòu);其次,在此基礎上深度解析知識單元之間的邏輯關(guān)系,構(gòu)建國家安全事件的統(tǒng)一知識表示模型;最后,對于初步構(gòu)建好的圖譜表示模型進行優(yōu)化,探究其補全和更新機制,構(gòu)建完整國家安全事件圖譜。

圖2 事件圖譜知識表示模型構(gòu)建思路

4.1.1 事件圖譜整體邏輯結(jié)構(gòu)

國家安全事件圖譜整體結(jié)構(gòu)包含兩大部分:模式層和數(shù)據(jù)層(如圖3所示)。圖譜整體結(jié)構(gòu)的描述模型為NSEM={NSEs,Es,Ps,Rs,Is}。其中,NSEs表示國家安全事件類集合;Es表示國家安全事件相關(guān)實體類集合;Ps表示國家安全事件相關(guān)屬性類集合;Rs表示關(guān)系集合;Is表示實例集合。相關(guān)概念定義如下。

圖3 國家安全事件圖譜整體結(jié)構(gòu)

定義1國家安全事件NSE(national security event)。參考前人的研究[10],本文將國家安全事件定義為一個四元組,表示為NSE=(A,O,T,L),其中,A表示與國家安全事件相關(guān)的一系列動作集合;O表示與國家安全事件相關(guān)的對象,包括參與的主體、客體以及相關(guān)的對象事物;T和L分別表示事件發(fā)生的具體時間和空間。

定義2國家安全事件圖譜中的類。事件類NS‐Es表示與某一個國家安全原子事件NSE相關(guān)的所有子事件的集合,繼承事件基類NSE。定義為NSEs=(nse1,nse2,nse3,…,nsen);實體類Es表示與原子事件NSE相關(guān)的所有實體集合。在國家安全事件中,一般包括事件涉及的相關(guān)者、物資等。定義為Es=(e1,e2,e3,…,en);屬性類Ps表示所有屬性的集合,包括實體的屬性以及事件的屬性,定義為Ps=(p1,p2,p3,…,pn)。

定義3國家安全事件圖譜中的關(guān)系Rs。Rs是指與某一個國家安全原子事件NSE相關(guān)的事件、實體和屬性之間的關(guān)系集合。理論上來說,包括事件與事件之間、實體與實體之間、事件與屬性之間、實體與屬性之間、事件與實體之間的關(guān)系。定義為Rs=(r1,r2,r3,…,rn)。

定義4國家安全事件圖譜NSEG(national secu‐rity event graph)。國家安全事件圖譜可表示為一個有向標簽圖,NSEG=(N,L)。其中,N表示國家安全事件圖譜中的頂點,包括實體、事件以及屬性值;L表示國家安全事件圖譜中的邊,L定義為(n1,n2,label),表示兩個頂點n1和n2之間具有l(wèi)abel關(guān)系。此外,針對事件之間的演化關(guān)系,還需要進一步標注事件的轉(zhuǎn)移概率。

4.1.2 事件圖譜知識表示邏輯

在圖譜整體邏輯結(jié)構(gòu)基礎上,進一步細化知識單元,研究其內(nèi)在邏輯關(guān)聯(lián),形成國家安全事件的知識表示模型。本文融合事理圖譜和知識圖譜,形成既能刻畫事件演化邏輯關(guān)系,又能描述事件和實體之間相關(guān)關(guān)系的國家安全事件圖譜知識表示模型(圖4)。國家安全事件圖譜對于國家安全事件的知識表示主要包含兩層邏輯:一層是通過實體關(guān)系圖揭示事件所關(guān)聯(lián)的各類實體及其關(guān)系,實現(xiàn)事件、實體、屬性的統(tǒng)一知識表示;另一層是借助事理圖譜描述事件的動態(tài)演化過程,賦予事件與實體之間關(guān)系的動態(tài)屬性特征。利用這兩層邏輯的表示,形成國家安全事件圖譜的統(tǒng)一知識表示模型。

圖4 國家安全事件圖譜知識表示模型

首先,剖析國家安全事件的主要事件類型,研究事件腳本的描述方法,分析不同類型事件之間的動靜態(tài)關(guān)系類型,研究基于有向圖的事理演化邏輯圖描述方法。本文參考突發(fā)事件的發(fā)展演變過程,將國家安全事件的生命周期劃分為事件發(fā)生期、演化期和恢復期,結(jié)合應急管理過程,將國家安全事件進行分類,主要分為國家安全事件發(fā)生類、處置類、影響類和恢復類。各個事件類衍生出許多子事件,事件之間存在順承、因果、上下位等關(guān)系。每個事件類繼承國家安全事件基類,即包含對應的時間、空間、對象和動作要素。除此之外,不同的事件類型可能還含有不同的屬性要素。在此基礎上,研究事件涉及實體的關(guān)系圖譜描述方法。借助利益相關(guān)者分析、工作流分析等手段研究國家安全事件中涉及的人、組織機構(gòu)、資源等實體類型,定義每類實體的關(guān)鍵屬性。

本文結(jié)合2019新冠肺炎疫情事件,參考《抗擊新冠肺炎疫情的中國行動》白皮書[33]和《中華人民共和國傳染病防治法》[34],構(gòu)建了一個融合后的新冠疫情事件圖譜案例(圖5)。為了便于圖譜的可視化,使用事件核心詞表示事件節(jié)點,實線主要用于描述事件與事件和實體與實體之間的相關(guān)關(guān)系,虛線主要用于描述事件與實體以及事件與屬性之間的相關(guān)關(guān)系。在百度資訊中按照對應關(guān)鍵詞進行檢索,得到相關(guān)的新聞信息,補全事件的屬性信息。由于人工構(gòu)建圖譜的精力有限,僅對部分事件進行了實例信息的補全,且沒有基于完整事件信息進行轉(zhuǎn)移概率計算。

從圖5可以看到新冠疫情發(fā)生、發(fā)展過程中的部分事件演化關(guān)系。例如,由于新冠肺炎的發(fā)現(xiàn),湖北省中西醫(yī)結(jié)合醫(yī)院向武漢市江漢區(qū)疾控中心報告不明原因肺炎病例,隨后,國家衛(wèi)生健康委派出專家組開展現(xiàn)場調(diào)查,并成立疫情應對處置領(lǐng)導小組展開防控工作部署;隨著調(diào)查的進行,專家組發(fā)現(xiàn)了明確的人傳人現(xiàn)象,因此,中央決定對疫情嚴重地區(qū)實行隔離/封鎖;封鎖之后,新增病例數(shù)慢慢下降。借助事件圖譜,可以幫助人們更清楚地理清事件之間的發(fā)展演化關(guān)系。

圖5 2019新冠肺炎疫情事件圖譜案例(部分)

4.1.3 圖譜表示模型補全和更新機制

國家安全事件圖譜表示模型的初步構(gòu)建采用專家構(gòu)建法,基于專家的經(jīng)驗知識,分析國家安全事件的主要類和類之間的關(guān)系,形成圖譜原型。但是,針對具體的國家安全事件,其事件類、實體類和屬性類存在較大的差異,專家構(gòu)建法所構(gòu)建的類目并不完善,因此,需要進一步對表示模型進行補全和更新。本文借鑒文獻[35]中的方法,提出基于數(shù)據(jù)的圖譜表示模型補全和更新機制(圖6)。首先,通過數(shù)據(jù)映射,自上而下地實現(xiàn)國家安全事件信息內(nèi)容中知識單元的語義關(guān)聯(lián),構(gòu)建國家安全事件圖譜數(shù)據(jù)層。在此基礎上,從具體實例數(shù)據(jù)出發(fā),結(jié)合數(shù)據(jù)屬性特征,自下而上地對事件、實體、屬性及其關(guān)聯(lián)關(guān)系進行模式歸納,進一步通過語義數(shù)據(jù)映射模型將之補充到國家安全事件圖譜表示模型中,通過不斷迭代的方式完善國家安全事件圖譜表示模型。

圖6 國家安全事件圖譜更新機制

4.2 國家安全事件圖譜自動構(gòu)建的關(guān)鍵方法

本文提出的事件圖譜自動構(gòu)建方法主要是從國家安全事件相關(guān)信息內(nèi)容中自動抽取事件、實體實例及其對應關(guān)系,在此基礎上實現(xiàn)知識的融合,構(gòu)建包含完整態(tài)勢要素的統(tǒng)一事件圖譜。圖7展示了事件圖譜的自動構(gòu)建流程,重點關(guān)注事件圖譜構(gòu)建過程中的知識抽取、知識融合以及知識補全和更新技術(shù)。

圖7 國家安全事件圖譜構(gòu)建流程圖

4.2.1 數(shù)據(jù)采集與知識抽取

國家安全事件圖譜構(gòu)建的關(guān)鍵是在事件圖譜表示模型的語義指導下,從國家安全事件相關(guān)信息中抽取表示模型中的各知識元素,實現(xiàn)表示模型的具象化。首先,采用關(guān)鍵詞匹配、余弦相似性計算等方法建立事件與信息條目的關(guān)聯(lián)模型,在大數(shù)據(jù)環(huán)境中部署分布式數(shù)據(jù)探針,結(jié)合人機交互的方式,不斷補充和確定可靠數(shù)據(jù)源,從中篩選出跟國家安全事件相關(guān)的信息,完成數(shù)據(jù)采集。國家安全事件的大數(shù)據(jù)環(huán)境主要包括物聯(lián)網(wǎng)感知到的物理環(huán)境中多模態(tài)數(shù)據(jù),權(quán)威新聞媒體網(wǎng)站,微博、微信等社交媒體網(wǎng)站,政府官方網(wǎng)站公布數(shù)據(jù),政府部門間交互性業(yè)務數(shù)據(jù),以及百度百科、維基百科等開源知識庫中的知識資源等。

然后,對采集到的國家安全事件信息進行知識抽取。針對政府、企業(yè)等的結(jié)構(gòu)化數(shù)據(jù)以及HT‐ML、XML格式的半結(jié)構(gòu)化數(shù)據(jù)(如百度百科的信息框),借助語義數(shù)據(jù)映射模型,將數(shù)據(jù)庫模式語法、XML模式語法向事件圖譜表示模型進行映射,實現(xiàn)結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)的知識抽取。針對新聞網(wǎng)站、社交媒體等包含的非結(jié)構(gòu)化數(shù)據(jù),綜合運用事件抽取[36]、事件關(guān)系識別[37-38]、實體抽取、實體關(guān)系識別[13]等技術(shù),利用序列標注、深度學習、協(xié)同訓練等統(tǒng)計模型,從非結(jié)構(gòu)化數(shù)據(jù)中抽取事件、實體、屬性及其關(guān)系。非結(jié)構(gòu)化數(shù)據(jù)的知識抽取的關(guān)鍵在于高質(zhì)量的訓練語料庫。目前,已有一些針對突發(fā)事件的少量標注語料庫,如上海大學語義智能實驗室構(gòu)建的中文突發(fā)事件語料庫CEC(Chinese Emergency Corpus)[39],從互聯(lián)網(wǎng)上收集了五類突發(fā)事件(包括地震、火災、交通事故、食物中毒等)相關(guān)的新聞報道作為原始語料,對文本預處理后進行了事件標注,標注元素主要包括Event(突發(fā)事件,用句子表示)、Denoter(觸發(fā)詞)、Time(時間)、Location(地點)、Participant(參與者)和Object(對象)。但是目前還沒有針對國家安全事件的通用語料庫。因此,在實際應用過程中,可結(jié)合突發(fā)事件相關(guān)的語料庫對事件的組成要素抽取模型進行訓練。對于沒有標注語料的事件類型,可采用依存句法分析和模式匹配的方法從中抽取候選集合,或應用遠程監(jiān)督的方法將已有知識庫對應到非結(jié)構(gòu)化數(shù)據(jù)中,生成大量訓練數(shù)據(jù)。此外,針對特定的領(lǐng)域,還可自建語料庫。

4.2.2 知識融合

主要分為數(shù)據(jù)層、事件層和實體層三個層面進行知識融合。首先,采用數(shù)據(jù)映射技術(shù)建立所抽取的事件、實體與表示模型中的事件類和實體類之間的映射關(guān)系,實現(xiàn)數(shù)據(jù)到模式層的語義融合,建立知識之間的語義關(guān)聯(lián),進而將多源數(shù)據(jù)集成一個統(tǒng)一的知識庫。其次,不同數(shù)據(jù)源中的知識元素可能指代現(xiàn)實世界中的同一存在。因此,在數(shù)據(jù)映射的基礎上,需要進一步應用事件對齊、事件泛化[40]技術(shù)。例如,對事件進行向量表示,將事件元素組中各個元素短語的詞嵌入(通過GloVe[41]等預訓練模型得到的d維向量)拼接成一個向量,作為整個事件表示[42],在向量表示的基礎上借助相似度計算方法,構(gòu)建事件層面的融合規(guī)則和算法,實現(xiàn)事件實例的消歧和統(tǒng)一表示。最后,針對事件相關(guān)實體,借助實體對齊[43]和實體鏈接[44]技術(shù),結(jié)合上下文信息和word2vec[45]、BERT[46]等語義表示工具,設計實體層面的融合規(guī)則和算法,將不同數(shù)據(jù)源中關(guān)于同一實體的不同表達歸并為一個具有全局唯一標識的實體對象,從而實現(xiàn)實體實例的融合。通過三個層面的有效融合,能夠?qū)崿F(xiàn)知識的統(tǒng)一表示。

4.2.3 知識補全與更新

隨著事物的發(fā)展變化,事件相關(guān)的信息內(nèi)容會不斷迭代更新。因此,需要對事件圖譜進行知識補全與更新。根據(jù)國家安全事件圖譜的整體結(jié)構(gòu),其更新包括模式層的更新與數(shù)據(jù)層的更新。對于模式層,采用基于數(shù)據(jù)的補全和更新機制;而數(shù)據(jù)層的補全和更新則需要依據(jù)事件的演變規(guī)律,迭代更新事件、實體、屬性實例信息。一方面,可將抽取到的實體與已有的高質(zhì)量知識庫進行映射,補全實體描述信息;另一方面,事件與實體之間的關(guān)聯(lián)是通過論元角色實現(xiàn)的,從宏觀角度考慮,不同事件、不同信息內(nèi)容都會帶來不同的論元角色關(guān)系,事件圖譜表示模型無法一一列舉齊全,因此,需要借助基于圖的推理、鏈接預測、不一致檢測、路徑計算等知識計算方法進一步挖掘數(shù)據(jù)中包含的隱性知識,對數(shù)據(jù)層中的隱含知識進行更新和補全。此外,從動態(tài)角度考慮,事件的發(fā)展演變又會帶來論元角色關(guān)系的動態(tài)變化,需要進一步探究融合時空特征的動態(tài)挖掘模型,實時更新補全事件圖譜。

5 基于事件圖譜的國家安全事件態(tài)勢感知實現(xiàn)路徑

本文將國家安全事件態(tài)勢感知視為一套態(tài)勢分析系統(tǒng),從系統(tǒng)構(gòu)建角度提出基于事件圖譜實現(xiàn)國家安全事件態(tài)勢感知的路徑,如圖8所示。首先,需要對不同利益相關(guān)者的態(tài)勢需求進行分析,構(gòu)建多維度態(tài)勢描述框架,完成需求建模;其次,運用信息構(gòu)建的分析方法將態(tài)勢描述框架模型轉(zhuǎn)化為層次性的多維度態(tài)勢描述系統(tǒng)功能,每一態(tài)勢描述維度對應一項系統(tǒng)功能,通過定義相應的數(shù)據(jù)分析任務實現(xiàn)系統(tǒng)功能;最后,需要探究基于事件圖譜的態(tài)勢維度狀態(tài)提取方法,為系統(tǒng)功能的實現(xiàn)提供信息支撐。

圖8 基于事件圖譜的國家安全事件態(tài)勢感知實現(xiàn)路徑

5.1 多維度態(tài)勢描述體系構(gòu)建

國家安全事件的管理過程涉及多階段、多業(yè)務和多主體,不同的主體在決策任務中承擔的工作各不相同,涉及的態(tài)勢信息需求也不完全一致。因此,在構(gòu)建多維度態(tài)勢描述體系時,首先,需要對國家安全事件態(tài)勢感知的服務對象、業(yè)務要求和階段過程進行分析,明確態(tài)勢感知所面向的主體維度、業(yè)務維度和階段特征;其次,對國家安全事件不同決策主體、不同業(yè)務模塊、不同階段過程的態(tài)勢感知目標進行分析,針對每一個目標,分析其態(tài)勢需求的特征、類型和內(nèi)容等,識別具體的態(tài)勢感知要素。例如,公眾的主要需求是狀態(tài)信息,包括事件類型、時間、地點、影響等;組織機構(gòu)不僅需要事件狀態(tài)信息,還需要對應狀態(tài)下的處置信息,包括處理流程以及所需的資源等,并且針對災害發(fā)生的不同階段,可能需要不同主體之間的協(xié)作交互;決策者則是需要把握全局,基于當前的態(tài)勢狀態(tài),做出應急處置決策,包括對相關(guān)部門的工作部署和資源調(diào)度等,此外,還需要考慮事件的發(fā)展趨勢,以及對未知風險進行預警。

面向不同過程、不同主體識別出的態(tài)勢感知要素可能存在著重復性和不一致性,需要進一步對識別出的態(tài)勢感知要素進行分析和整合,消除不一致和沖突,抽象出態(tài)勢感知的要素模型;在此基礎上,建立態(tài)勢感知維度與態(tài)勢感知要素之間的關(guān)聯(lián)關(guān)系,形成一套通用的多維度態(tài)勢描述框架。進一步地,從微觀和宏觀層面探究各主體、各工作流程之間的協(xié)作、交流方式,分析其信息交流機制,從而確定各態(tài)勢要素之間的關(guān)聯(lián)、轉(zhuǎn)化機制,建立完整態(tài)勢的描述體系。

5.2 態(tài)勢分析方法

由于國家安全事件的不同階段、不同主體對態(tài)勢信息的需求各異,因此,國家安全事件的態(tài)勢分析需要綜合考慮多個維度。根據(jù)態(tài)勢感知模型,將系統(tǒng)功能劃分為三個維度:察覺、理解和預測。察覺層主要是采用圖挖掘技術(shù)和語義匹配的方法,從事件圖譜中找到與當前事件態(tài)勢相關(guān)的所有節(jié)點及其屬性要素;理解層則是針對察覺到的態(tài)勢要素信息,采用統(tǒng)計分析模型和規(guī)則匹配的方法,形成對當前態(tài)勢的理解,包括態(tài)勢層級研判(如災害等級的判定)以及異常點發(fā)現(xiàn)(如輿情轉(zhuǎn)折點等),形成對當前態(tài)勢的總體描述,并基于歷史經(jīng)驗規(guī)則,輔助生成對應態(tài)勢下的應急處置預案,重點包括所需的處置措施,如救援、醫(yī)療救治等,以及相應的資源數(shù)量;而預測層是基于表示學習、相似度計算、圖挖掘、關(guān)聯(lián)推理等技術(shù),從事件圖譜中找到與當前事件相似的歷史事件,結(jié)合事件圖譜中的演化規(guī)律,利用神經(jīng)網(wǎng)絡、邏輯規(guī)則和時間序列預測方法構(gòu)建態(tài)勢預測模型,并運用系統(tǒng)動力學進行情景推演和模擬仿真[47],對事件的可能演變趨勢進行預測,識別事件發(fā)展過程中的未知風險。然后,將態(tài)勢分析的結(jié)果通過功能子系統(tǒng)呈現(xiàn)給不同用戶,主要包括態(tài)勢信息的可視化、精準查詢檢索以及面向不同決策主體的輔助預案生成等服務。

5.3 態(tài)勢要素提取方法

國家安全事件態(tài)勢涉及的相關(guān)要素錯綜復雜,單個態(tài)勢維度亦可能涉及事件的多項要素、多項實體等。如何準確、全面地提取態(tài)勢要素是進行態(tài)勢感知的基礎。然而,國家安全大數(shù)據(jù)的多源異構(gòu)、動態(tài)變化等特征給態(tài)勢要素的提取帶來了很大的困難。傳統(tǒng)的基于安全指標體系的態(tài)勢要素提取方法沒有考慮要素之間的關(guān)聯(lián)性,將給數(shù)據(jù)融合帶來一定的挑戰(zhàn)[24]。因此,本文提出基于事件圖譜細粒度知識關(guān)聯(lián)的態(tài)勢維度狀態(tài)提取方法。首先,針對從各來源獲得的國家安全事件信息內(nèi)容,通過事件圖譜表示模型的指導,利用表示模型中包含的事件類、實體類、屬性及其相互關(guān)系,應用機器學習和深度學習算法,構(gòu)建分類、聚類、聚合、序列標注等模型,從相關(guān)信息內(nèi)容中抽取事件、事件要素及實體,并識別出事件、實體及屬性之間的關(guān)聯(lián)關(guān)系,實現(xiàn)不同來源、不同模態(tài)信息的語義融合。其次,借助事件對齊、事件泛化、實體對齊、實體鏈接等技術(shù)實現(xiàn)事件層面和實體層面的融合。最后,通過規(guī)則推理,對態(tài)勢要素信息進行不一致檢測,消除錯誤信息,并從圖譜中推理出新的知識關(guān)聯(lián),挖掘隱性關(guān)聯(lián),補充態(tài)勢要素狀態(tài)。

6 事件圖譜在國家安全場景應用的問題與挑戰(zhàn)

盡管現(xiàn)有的圖譜構(gòu)建技術(shù)已較為成熟,但是事件圖譜在國家安全場景下的應用仍存在一些問題和挑戰(zhàn)。

(1)事件圖譜自動化構(gòu)建困難。由于國家安全事件涉及的事件類型繁多,且不同事件類型涉及的信息差異較大,因此,在事件圖譜的模式層構(gòu)建中仍需要大量專家知識的參與。此外,在數(shù)據(jù)層的構(gòu)建方面,雖然已有研究采用機器學習等自動化的方法實現(xiàn)了圖譜的構(gòu)建過程,但是其精度和可靠性均有待進一步提升。同時,國家安全事件圖譜的自動構(gòu)建依賴于高質(zhì)量的事件標注語料,而目前與國家安全事件相關(guān)的標注語料極少,并且不同國家安全事件的組成要素各異,因此,未來研究還需在國家安全事件通用語料庫構(gòu)建上做出努力。

(2)海量、多源信息集成的挑戰(zhàn)。一方面,互聯(lián)網(wǎng)時代,信息呈現(xiàn)爆炸式增長。當國家安全事件發(fā)生時,互聯(lián)網(wǎng)上與事件相關(guān)的信息實時產(chǎn)生,海量的信息將給數(shù)據(jù)的存儲、查詢帶來挑戰(zhàn),也對事件圖譜的構(gòu)建造成困難。這方面,需要加強分布式存儲、并行計算等高新技術(shù),在事件圖譜的構(gòu)建和存儲中的應用。另一方面,國家安全事件的信息來源廣泛,不同來源的信息可能存在重復和不一致的問題,目前在實體對齊、事件同指消解等方面的方法仍有待改進。

(3)態(tài)勢感知應用系統(tǒng)的實現(xiàn)復雜性。首先,國家安全事件涉及的主體眾多,對各主體的態(tài)勢需求調(diào)研難以大規(guī)模展開,因此,難以實現(xiàn)全面的系統(tǒng)功能。其次,態(tài)勢分析系統(tǒng)的不同維度對數(shù)據(jù)和分析方法的需求各異。針對不同層次的系統(tǒng)功能,如何找到合理、有效的解決方法仍有待深入探究。例如,針對察覺層,如何從泛濫的態(tài)勢信息中快速篩選出全面、可靠的狀態(tài)信息;針對理解層,如何選取合適的分析方法對事件的狀態(tài)進行理解;針對預測層,許多國家安全事件的演化往往都是非常規(guī)的,難以根據(jù)歷史案例進行經(jīng)驗推理,因此,如何從歷史數(shù)據(jù)中找到相關(guān)信息,并結(jié)合場景狀態(tài)挖掘出事件的時空演變規(guī)律、內(nèi)在機理等。這些問題均需要結(jié)合實際的應用需求進行拓展和深化。

7 結(jié)語

本文面向國家安全事件的態(tài)勢感知需求,從信息組織視角,提出融合事理圖譜和實體關(guān)系圖的國家安全事件圖譜表示模型,并以2019新冠肺炎疫情事件為例,人工構(gòu)建了一個事件圖譜案例,揭示了部分子事件的演化過程。在此基礎上,本文探究了一套事件圖譜的自動化構(gòu)建流程,以實現(xiàn)具體國家安全事件的圖譜實例化過程。最后,基于國家安全事件圖譜的信息支撐,結(jié)合數(shù)據(jù)分析技術(shù)提出了實現(xiàn)態(tài)勢感知的方法路徑,并對實際應用過程中的問題與挑戰(zhàn)進行了總結(jié)。

借助本文所提出的國家安全事件圖譜表示模型,能夠?qū)崿F(xiàn)事件、實體及其相互關(guān)系的序化組織和深度揭示,豐富了情報學中信息組織的理論和方法體系。此外,本文對事件圖譜構(gòu)建方法和技術(shù)的探究能夠為國家安全信息管理提供實踐參考,有效提升國家安全信息組織的水平。進一步地,事件圖譜的構(gòu)建能夠服務于國家安全事件態(tài)勢的全面監(jiān)控與感知。本文探究了基于事件圖譜實現(xiàn)多維態(tài)勢感知的方法,能夠滿足不同主體的情報需求,以實現(xiàn)國家安全管理能力的綜合提升。

但是,本文對國家安全事件圖譜的探討側(cè)重于理論和方法層面上的分析,未來需要進一步綜合運用各種技術(shù)實現(xiàn)面向具體國家安全事件的圖譜原型,利用數(shù)據(jù)分析方法實現(xiàn)態(tài)勢分析系統(tǒng)功能,在實踐過程中對具體實效進行總結(jié)和驗證。

猜你喜歡
安全事件態(tài)勢圖譜
繪一張成長圖譜
2019年12月與11月相比汽車產(chǎn)銷延續(xù)了增長態(tài)勢
汽車與安全(2020年1期)2020-05-14 13:27:19
匯市延續(xù)小幅震蕩態(tài)勢
中國外匯(2019年19期)2019-11-26 00:57:36
我國天然氣供需呈現(xiàn)緊平衡態(tài)勢
補腎強身片UPLC指紋圖譜
中成藥(2017年3期)2017-05-17 06:09:01
主動對接你思維的知識圖譜
食品安全事件的價格沖擊效應
縣鄉(xiāng)一體化探索呈加速態(tài)勢
公交車公共安全事件調(diào)查
南風窗(2014年16期)2014-05-30 08:13:46
2013卡巴斯基三大安全事件
响水县| 崇阳县| 乐业县| 晴隆县| 龙口市| 仁怀市| 历史| 宜川县| 汤原县| 南川市| 黄大仙区| 乐平市| 沈丘县| 大邑县| 卓尼县| 福泉市| 西吉县| 稻城县| 自治县| 汤原县| 会理县| 郎溪县| 苏尼特左旗| 普兰店市| 汉阴县| 丰城市| 柯坪县| 嘉定区| 车险| 广州市| 莱州市| 景谷| 延寿县| 垦利县| 渝中区| 房产| 甘谷县| 和田县| 喜德县| 青田县| 东丽区|