李星宇 劉志勤 王慶鳳 孟思齊
我國災(zāi)害種類多、分布地域廣、發(fā)生頻率高,容易造成嚴重的經(jīng)濟損失和人員傷亡。近年來,自然災(zāi)害、事故災(zāi)難、公共衛(wèi)生等突發(fā)事件頻發(fā)態(tài)勢加劇,如2015年天津?;繁ā?020年新冠肺炎疫情、2021年青海瑪多7.4級地震等,對各級政府、企事業(yè)單位應(yīng)急處置能力提出了嚴峻考驗。
2009年,國務(wù)院應(yīng)急管理辦公室印發(fā)《突發(fā)事件應(yīng)急演練指南》[1],指出“應(yīng)急演練的目的是檢驗預(yù)案、完善準備、鍛煉隊伍、磨合機制、科普宣教”。鑒于應(yīng)急演練的重要性和必要性,桌面演練得到了越來越多的運用與重視,作為桌面演練的計算機支持部分——應(yīng)急桌面演練系統(tǒng),應(yīng)用范圍也越發(fā)廣泛。例如,在政務(wù)方面,國家級和省級政府應(yīng)急管理培訓(xùn)基地已普遍開展靜態(tài)桌面演練等培訓(xùn)[2];在民航方面,朱新平[3]等根據(jù)機場應(yīng)急設(shè)計了基于虛擬現(xiàn)實的機場消防救援虛擬演練平臺;在鐵路方面,陳志洲[4]等將車輛、工務(wù)、電務(wù)等納入仿真培訓(xùn)實作流程中,設(shè)計了高速鐵路應(yīng)急聯(lián)合演練仿真培訓(xùn)系統(tǒng);在地震方面,侯躍偉[5]等結(jié)合現(xiàn)代都市和地震特點,設(shè)計了城市地震應(yīng)急綜合演練系統(tǒng)。
桌面演練的特點是“紙上談兵”,通過演練系統(tǒng)“沙盤”,考查應(yīng)急指揮人員面對突發(fā)事件時的決策處置能力。演練過程中,參演人員提出措施與標準措施之間的相似度越高,代表職能職責(zé)掌握情況越好,應(yīng)急處置能力越強。目前,應(yīng)急桌面演練系統(tǒng)已經(jīng)有很多設(shè)計方案,但充分使用自然語言處理工具,驗證參演人員決策的正確性及效率結(jié)果的系統(tǒng)較少,難以實現(xiàn)簡單、科學(xué)的態(tài)勢推演[6]。基于此,本文提出一種基于自然語言處理的應(yīng)急桌面演練系統(tǒng)設(shè)計,在有向無環(huán)圖演練方案基礎(chǔ)上,采取“情景-問題-回答”模式,以關(guān)鍵詞、關(guān)鍵句匹配為重點,使用Jaccard系數(shù)、Doc2Vec深度學(xué)習(xí)模型等方法,計算參演人員提出措施和標準措施的文本相似度,為過程評估和分支推理提供依據(jù),著力提高演練真實性和人員參與度。
系統(tǒng)整體設(shè)計方案如圖1所示,主要包括信息處理模塊、方案設(shè)計模塊、管理調(diào)度模塊、演練評估模塊4個部分。
圖1 應(yīng)急桌面演練系統(tǒng)整體設(shè)計方案
其中,信息處理模塊負責(zé)存儲突發(fā)事件信息,并對事件信息進行結(jié)構(gòu)化處理、關(guān)聯(lián)性分析等操作;方案設(shè)計模塊負責(zé)根據(jù)演練需求和應(yīng)急預(yù)案,設(shè)計包含演練主題、人員分工、演練流程等內(nèi)容的應(yīng)急桌面演練方案;管理調(diào)度模塊負責(zé)與參演人員開展信息交互,并結(jié)合參演人員評估情況,對事件走向和演練進程進行管理和調(diào)度;演練評估模塊負責(zé)對參演人員的表現(xiàn)情況進行評估,得到參演人員提出措施和標準措施的相似度。
突發(fā)事件具備兩個基礎(chǔ)屬性,分別為事情發(fā)生情況和事件處理情況。其中,事件發(fā)生情況是指突發(fā)事件從發(fā)生到結(jié)束這一過程衍變情況,包括事件類型(地震、火災(zāi)、暴雨等)、發(fā)生條件(汛期、停電、地殼運動等)、次生災(zāi)害(暴雨引發(fā)滑坡、停電引發(fā)火災(zāi)等)等信息;事件處理情況是指相關(guān)部門對事件采取的應(yīng)急措施及對應(yīng)結(jié)果,包括涉及部門(公安、交通、消防等)、處理措施(針對疫情關(guān)閉娛樂場所、針對停電開展設(shè)備搶修等)、處理結(jié)果(花費時間、人力成本等)等信息。
依據(jù)現(xiàn)有案例,對突發(fā)事件衍變流程進行梳理,是一項重要基礎(chǔ)工作,能為突發(fā)事件關(guān)聯(lián)分析和桌面演練方案設(shè)計提供參考和依據(jù)。應(yīng)急處置相關(guān)部門通常會對突發(fā)事件處置情況進行歸納總結(jié)并形成應(yīng)急處理報告,例如揚州市環(huán)境監(jiān)察支隊《揚州潤揚長江大橋北引橋交通事故丁酮泄漏事故處置終報》[7],包含發(fā)生時間(2018年3月19日)、地點(揚州潤揚長江大橋北引橋)、發(fā)生事件(水質(zhì)污染)、參與部門(公安、消防、環(huán)保及地方政府)、處置措施(筑壩攔截污染)等信息。又如,國務(wù)院災(zāi)害調(diào)查組2022年1月對外發(fā)布的《河南鄭州“7·20”特大暴雨災(zāi)害調(diào)查報告》,包含災(zāi)害情況及主要特點、災(zāi)害應(yīng)對處置、主要教訓(xùn)、改進措施建議等。
但是,由于各地、各部門單位的應(yīng)急處置報告,在內(nèi)容上、形式上、結(jié)構(gòu)上復(fù)雜多樣,缺乏統(tǒng)一標準,對事件關(guān)聯(lián)性分析和風(fēng)險熵分析造成較大的困難。為此,本文采取構(gòu)建事件鏈、完善節(jié)點信息的方式,實現(xiàn)對事件信息的結(jié)構(gòu)化處理。
2.2.1 構(gòu)建事件鏈
一個突發(fā)事件,可將整體流程視為“1+N+1”的事件鏈。其中,開頭節(jié)點“1”代表源頭事件,即導(dǎo)致整個事件的起始事件,通常能反映整個事件主題;“N”代表事件鏈中1個或多個的過程事件;最后節(jié)點“1”代表結(jié)束事件,即整個突發(fā)事件應(yīng)急處置完畢。
事件鏈中每個突發(fā)事件視作一個節(jié)點,事件節(jié)點之間、事件節(jié)點和處置措施之間相互連接,形成一個有向流程圖。如圖2所示,一個簡化后的模擬事件鏈——D市春運期間火車站暴恐分子傷人事件鏈,起始節(jié)點為“出現(xiàn)暴恐分子”,過程節(jié)點為“群眾恐慌”、“人員受傷”,結(jié)束節(jié)點為“歹徒被制服”。
圖2 D市春運期間火車站暴恐分子傷人事件鏈
2.2.2 完善節(jié)點信息
為滿足事件鏈設(shè)計需求,使用Python語言分別設(shè)計突發(fā)事件類(Incident)及處置措施類(Treatment)。其中,突發(fā)事件類(Incident)包含事件名稱、狀態(tài)標志、事件種類等基礎(chǔ)屬性,并設(shè)置2個指針,分別指向前置條件事件、后置次生事件,即指向當前事件在整個流程中,發(fā)生所需的前置必要條件,以及后續(xù)引發(fā)的二次災(zāi)害事件;處置措施類(Treatment)代表事件處理情況,指針incident_current指向當前處理的突發(fā)事件,并包含采取措施、措施結(jié)果、部門單位等基礎(chǔ)信息。
(1)Class Incident: //突發(fā)事件類
self.incident_name; //事件名稱,例如“2021年青海瑪多7.4級地震”。
self.incident_flag; //狀態(tài)標志,包含起始start、過程process、結(jié)束end 3種狀態(tài)。
self.incident_type; //事件種類,包含地震、暴風(fēng)、強降雨等種類。
self.incident_info=[ ]; //災(zāi)情描述,包含發(fā)生時間、發(fā)生地點等基本屬性。
self.node_list=[front_node,next_node];//節(jié)點指針,分別指向前置條件事件、后置次生事件。
(2)Class Treatment: //處置措施類
self.incident_current; //當前處理的突發(fā)事件,例如當前措施針對“?;髽I(yè)毒氣泄露”。
self.measures[ ]; //采取措施集合,例如“人員轉(zhuǎn)移、物資輸送、交通管制”等。
self.measures_result[ ]; //處置結(jié)果集合,即每項措施對應(yīng)的好或壞結(jié)果。
self.related_department[ ]; //涉及部門單位。
通過構(gòu)建事件鏈、完善節(jié)點信息等操作,得到處置案例中的事件鏈,就可以根據(jù)事件鏈組成情況、節(jié)點信息等,從事故類型、引發(fā)原因、工作舉措等方面進行分析,如圖3所示,得到某類事件的推測鏈。
圖3 根據(jù)案例事件鏈構(gòu)建某類事件的推測鏈
事件推測鏈為應(yīng)急演練方案設(shè)計提供了良好支撐:一是建立各類突發(fā)事件的相互關(guān)聯(lián),得出研究事件演化規(guī)律。如地震后易發(fā)生余震、滑坡、電力通訊中斷等后續(xù)事件,城市地區(qū)易發(fā)生交通事故、市政施工事故、居民社區(qū)火災(zāi)等事件;二是便于預(yù)測事件的后續(xù)事件種類和風(fēng)險熵。通過研究同一源頭事件、不同處理措施導(dǎo)致的不同事件鏈,以及同一事件、不同處理措施導(dǎo)致的不同處理結(jié)果和二次事件,分析某項應(yīng)急措施的重要性,預(yù)測某一事件的后續(xù)事件種類及風(fēng)險熵。例如A地區(qū)遇到300ml暴雨時存在90%可能性發(fā)生山體滑坡事件,但提前做好泄洪準備后風(fēng)險降低至30%。
制定桌面演練方案,首先要明確演練主題,即演練是針對地震、海嘯,還是火災(zāi)等主題。確定演練主題后再進一步完善發(fā)生時間、發(fā)生地點、災(zāi)害級別等細節(jié)內(nèi)容。例如,相同的發(fā)生場景——森林,夏季易發(fā)生洪澇災(zāi)害,秋季易出現(xiàn)森林火災(zāi);相似的事件——生活必需品市場穩(wěn)定突發(fā)事件,地震、泥石流等局部性地質(zhì)類災(zāi)害,要重點做好方便食品、瓶裝飲用水、防寒衣被等市場供應(yīng),群體性疾病、動物疫情等易擴散公共衛(wèi)生事件,要重點做好衛(wèi)生清潔用品、防護用品等市場供應(yīng)。
確定演練主題后,需結(jié)合應(yīng)急演練預(yù)案,確定參演部門、部門分組、職責(zé)分工等。以《D市應(yīng)對大面積停電事件應(yīng)急演練方案》為例,參與部門包含發(fā)改委、經(jīng)信局、公安局等15個部門單位;分組包括電力恢復(fù)組、社會穩(wěn)定組、綜合保障組等5個小組。
同時,由于參與部門的職責(zé)有所不同,設(shè)計人員分工時需要結(jié)合應(yīng)急預(yù)案、部門職責(zé)等,制定某類突發(fā)事件的標準措施。例如,水庫出現(xiàn)險情時,水庫管理單位應(yīng)“立即在第一時間通知下游影響范圍內(nèi)的單位和群眾,并迅速處置險情,同時向上級主管部門和同級防汛抗旱指揮部報告出險部位、險情種類、搶護方案、處置情況等,以便有關(guān)部門進一步采取相應(yīng)措施”。
受地理環(huán)境、時間節(jié)點、災(zāi)害強度等因素影響,同一種類的突發(fā)事件,以不同方式進行應(yīng)急處置,后續(xù)事件流程和災(zāi)害情況將有所不同。例如,上述的水庫出現(xiàn)險情事件,若輿論引導(dǎo)不及時,容易造成哄搶防汛物資行為;若群眾轉(zhuǎn)移不及時,容易出現(xiàn)人員失蹤、傷亡,乃至后續(xù)防疫等事件。
為模擬更加真實的場景,在結(jié)合事件推測鏈基礎(chǔ)上,采取有向無環(huán)圖方式構(gòu)建演練方案,圖中部分關(guān)鍵節(jié)點有多個后續(xù)節(jié)點,演練進行到該節(jié)點時,可通過評估參演人員表現(xiàn)情況,決定后續(xù)事件走向,從而實現(xiàn)分支推理。如圖4汛期強降雨演練事件流程所示,汛期暴雨作為起點事件,演練流程允許多條路線、多個結(jié)束狀態(tài)。
圖4 汛期強降雨演練事件流程
管理調(diào)度模塊負責(zé)與參演人員開展信息交互,并結(jié)合參演人員表現(xiàn)情況,對事件走向和演練進程進行管理和調(diào)度。桌面演練中,采取“情景問答”模式,通過音頻、圖像、文字、投影等多種方式,向參演人員傳達當前模擬突發(fā)事件的各項信息,參演人員需結(jié)合職能職責(zé),針對情景下的突發(fā)事件,及時提出應(yīng)急處理舉措。系統(tǒng)根據(jù)評估結(jié)果以及演練方案,生成當前節(jié)點事件下一步可能發(fā)生的事件種類、事件發(fā)生熵及事件相關(guān)信息。后臺管理人員再結(jié)合系統(tǒng)推演情況,調(diào)度事件流程并推送參演人員?!把菥殹u估→推送→再演練”過程將一直循環(huán),直至演練結(jié)束。
文本相似度計算一直是自然語言處理(NLP)領(lǐng)域的熱點,在文本分類、搜索引擎、推薦系統(tǒng)、論文鑒定、機器翻譯、自動應(yīng)答、命名實體識別、拼寫糾錯等領(lǐng)域有著廣泛應(yīng)用。
目前,關(guān)于文本相似度計算方法主要有4類,分別是基于字符串、統(tǒng)計、知識庫和深度學(xué)習(xí)[8]。
基于字符串,是直接對文本A和文本B進行比對,包括編輯距離LD、最長公共子序列LCS、N-Gram模型和Jaccard系數(shù)等。以Jaccard系數(shù)為例,計算文本A、B相交部分在A、B相并部分中的占比,得到文本A、B的Jaccard系數(shù)。
基于統(tǒng)計,是將文本轉(zhuǎn)換成為空間向量, 通過計算向量間距離,得到文本間的相似度。包括向量空間模型VSM、主題模型Topic Model等。以TF-IDF算法(常用于百度、google等搜索引擎進行網(wǎng)頁檢索)為例,通過大量文本統(tǒng)計,為每個詞匯賦予一定權(quán)重(權(quán)重為詞頻TF和逆文本頻率IDF的乘積),作為相似度評估依據(jù)。
基于知識庫,是運用語義結(jié)構(gòu)和知識庫,對文本之間的概念信息和層次關(guān)系進行相似度計算。例如,通過構(gòu)建語義框架,將文本分解為主語、謂語、賓語等,再按詞性將詞語分為時間、地點、人物、動作等,對比各個位置得到相似度。
基于深度學(xué)習(xí),是使用深度學(xué)習(xí)模型,通過無監(jiān)督學(xué)習(xí)或監(jiān)督學(xué)習(xí),將文本輸入模型后得到向量A與B,計算向量A與向量B相似度,得到語義文本相似度。常用的深度學(xué)習(xí)模型有Word2Vec、FastText、GPT、BERT 等。
參演人員提出措施RM(Reply_Measures)和標準措施SM(Standard_Measures)的文本相似度,能夠充分反映職能職責(zé)掌握情況和突發(fā)事件應(yīng)急處置能力。由于RM多表現(xiàn)為中小型文本,且在語言表述上方式多樣,統(tǒng)計方法和知識庫方法難以適用。為滿足演練需求,采用“關(guān)鍵字+關(guān)鍵句”的匹配方式和“字符匹配+深度學(xué)習(xí)模型”的計算方法,以滿足以下幾點要求:降低語序、歧義、錯別字、近義詞等因素對相似度判定造成的影響;SM中的關(guān)鍵部分(關(guān)鍵舉措),能在RM中找到并高亮,便于直觀反映參演人員處置要點;相似度評估具有可重復(fù)性,演練結(jié)果可用于后續(xù)其他演練。
5.3.1 文本預(yù)處理
評估相似度前,對RM進行文本預(yù)處理,包括:剔除無用詞,將RM中“了、啊、哈”等不具備實際意義的詞匯剔除;更正錯別詞,將文本中常見的錯誤詞語進行檢測和自動更正,例如“沙袋等防汛屋子”→“沙袋等防汛物資” ;替換近義詞,將文本中非標準詞語替換為標準說法,例如“疫苗打針”→“疫苗接種”;文本切句,以“!。;;”等符號作為切割標志,將RM切割為句子集合RM_SL(Sentence_List) ;文本分詞,使用jieba工具,將RM切割為詞語集合RM_WL(Word_list)。
5.3.2 關(guān)鍵詞匹配
關(guān)鍵詞是指處理措施、參與部門等方面,能精準反映應(yīng)急措施正確做法的核心詞匯。例如,疫情防控事件中的“人員隔離”、“疫苗接種”,抗震救災(zāi)中的“應(yīng)急救援物資”、“受傷人員轉(zhuǎn)移”等。
設(shè)計突發(fā)事件時,每個事件節(jié)點的標準措施均對應(yīng)一個關(guān)鍵詞集合CWL(Core_Word_List)。關(guān)鍵詞集合CWL由m項詞語組成,演練過程中CWL中的關(guān)鍵詞在RM_WL中出現(xiàn)n項,n項占m項的比例視為關(guān)鍵詞評估得分——Sim_Word。
為精準檢索關(guān)鍵詞出現(xiàn)情況,采取滑窗匹配的方式。如圖5所示,將關(guān)鍵詞集合CWL中的關(guān)鍵詞,按照1個詞語組成的關(guān)鍵詞(如“健康通”、“值班”)和多個詞語組成的關(guān)鍵詞(如“統(tǒng)計群眾災(zāi)情”、“加強天氣預(yù)報監(jiān)測”),在RM_WL中進行逐項匹配。每出現(xiàn)一項,則標記詞語位置并高亮,若首次出現(xiàn)則計數(shù)器n加一。此項過程一直循環(huán),直至滑窗掃描結(jié)束,最終得到出現(xiàn)在RM中的關(guān)鍵詞集合CWL_Exist和沒有出現(xiàn)的關(guān)鍵詞集合CWL_NotExist,便于過程評估和后續(xù)查漏補缺。
圖5 關(guān)鍵詞滑窗匹配
5.3.3 關(guān)鍵句匹配
關(guān)鍵句是設(shè)計事件處置措施時,根據(jù)角色職能職責(zé)、事件模擬場景等設(shè)計的標準措施,例如,“增派警力對重點區(qū)域加強治安巡邏防控,安排交警對停電路口進行人工疏導(dǎo),確保交通秩序正常”。
關(guān)鍵句集合CSL(Core_Sentence_List)和提出措施集合RM_SL,可視為A個和B個句子組成的集合,每個句子表達不同的處置舉措。若關(guān)鍵句集合CSL中的句Ai和RM_SL中的句子Bi相似度較高,則認為Ai和Bi互為相似句。如圖6所示,A1和B1互為相似句,相似度為85%,A2與B3、B4互為相似句,相似度分別為92%、65%。
圖6 關(guān)鍵句逐項匹配
關(guān)鍵句Ai在RM_SL中可能沒有相似句Bi,也可能存在1個或多個相似句。匹配過程中,將Ai的每個相似句標記并高亮,相似度最高的為句Bi,其與Ai的相似度Sim(Ai,Bi)將參與關(guān)鍵句匹配計算。通過累計求和,并除以CSL集合中關(guān)鍵句的個數(shù)A,得到關(guān)鍵句評估得分——Sim_CS。
為提高識別精準度,直觀反映文字上的相似部分和語義上的相似部分,關(guān)鍵句匹配采取Jaccard系數(shù)和Doc2vec模型雙結(jié)合的方式,用于計算相似度Sim(Ai,Bi)。其中,Jaccard系數(shù)一般是計算句Ai和Bi交集占并集的比重,本文考慮到文字表述等因素影響,將Jaccard系數(shù)改為計算Ai和Bi交集占Ai的比重。計算方法如下:
Doc2Vec模型是Mikolov和Le[9]對Word2Vec改進后得到的深度學(xué)習(xí)模型,具有較好的特征提取和語義識別性能,常用于機器翻譯、文本相似度等領(lǐng)域。本文采用gensim庫構(gòu)建Doc2Vec模型, 將Ai和Bi向量化,得到向量相似度Dov2Vec(Ai,Bi)。
根據(jù) Jaccard(Ai,Bi)和 Dov2Vec(Ai,Bi)計算結(jié)果,按照“兩項求和取最高”原則,確定關(guān)鍵句集合CSL在提出措施集合RM_SL中對應(yīng)的相似句。
5.3.4 綜合評估
通過對關(guān)鍵詞和關(guān)鍵句的評估,得到關(guān)鍵詞評估得分Sim_Word和關(guān)鍵句評估得分Sim_CS??紤]到每個節(jié)點事件關(guān)鍵句、關(guān)鍵詞存在一定差別(如不同事件中關(guān)鍵句和關(guān)鍵詞個數(shù)的差別),在確保最終評估得分位于0-100%區(qū)間前提下,可對關(guān)鍵句和關(guān)鍵詞評估占比的權(quán)重進行動態(tài)調(diào)整,并按照加權(quán)求和得到綜合評估分數(shù)Sim_Node。根據(jù)評估結(jié)果(Sim_Node),系統(tǒng)可開展態(tài)勢推演,后臺人員也可根據(jù)評估結(jié)果、推演情況,以及關(guān)鍵字、關(guān)鍵句高亮情況,調(diào)度演練過程、演后歸納總結(jié)等。
為驗證系統(tǒng)設(shè)計可行性,本文以《大面積停電事件應(yīng)急預(yù)案》為基礎(chǔ),以大面積停電事件作為主題開展實驗,使用Unity3D引擎設(shè)計應(yīng)急桌面演練系統(tǒng)。共設(shè)計公共交通堵塞、化工企業(yè)毒氣泄露、部分地區(qū)通訊中斷等20余項事件,居民小區(qū)火災(zāi)、暴雨災(zāi)害事件場景如圖7所示。
圖7 居民小區(qū)火災(zāi)、暴雨天氣事件場景示意
文本相似度評估樣例如表1所示,在處理城市交通信號停電事件時,參演人員提出了以下4點工作舉措:市運管處及時通知客運班線,避開擁堵路段;安排交警到被堵地點維護交通秩序,引導(dǎo)車輛通行;加強交通運行監(jiān)測,及時發(fā)布路網(wǎng)運行信息;組織力量及時清理路障。整體看,該舉措在交通疏導(dǎo)方面回答較好,但遺漏了電力搶修、信號恢復(fù)方面內(nèi)容,故評估得分相對較低,后續(xù)事件流程也將衍變?yōu)榻煌ㄐ盘栭L期失效引發(fā)的“城市交通事故”和“火車站旅客滯留事件”。
表1 城市交通信號停電事件評估情況
與傳統(tǒng)的應(yīng)急桌面演練系統(tǒng)相比,加入自然語言處理技術(shù)后的系統(tǒng)在演練流程和評估模式上取得較大改善。一方面,參演人員過程表現(xiàn)情況得到實時體現(xiàn),演練表現(xiàn)情況的好壞將影響流程進度,更加貼近真實應(yīng)急響應(yīng)的過程;另一方面,以往對參演人員評估主要是專家組、評估組的人工評估,存在較強的主觀性,采取“關(guān)鍵詞+關(guān)鍵句”匹配方式,能夠更加客觀地找到不足之處,便于查缺補漏。
但相應(yīng)的,系統(tǒng)在具體實現(xiàn)上增加了工作量。例如,設(shè)計事件流程時,需充分考慮各項措施的重要性和各項突發(fā)事件的關(guān)聯(lián)性,確保多流程路線、多結(jié)束狀態(tài)的演練方案合理可行,這就需要大量的實際案例和豐富的工作經(jīng)驗。同時,在演練報告自動生成、演練方案拖拽式生成、演練方案統(tǒng)一設(shè)計平臺和共享平臺等方面,應(yīng)急桌面演練系統(tǒng)還有許多待挖掘的空間。