国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于知識圖譜的結(jié)構(gòu)化應急數(shù)據(jù)展現(xiàn)研究

2019-08-12 03:43黃征張雪超劉長弘
現(xiàn)代計算機 2019年19期
關(guān)鍵詞:圖譜實體救援

黃征,張雪超,劉長弘

(1.解放軍31682 部隊,蘭州730020;2.國防大學聯(lián)合勤務學院,北京100858)

0 引言

所謂“知識”,是人腦對外部信息總結(jié)、提煉、概括后的抽象性表述。近代以來,隨著科學技術(shù)研究的飛速發(fā)展,各學科領域的研究成果呈爆炸性增長,學科分類和研究領域越來越細化,文藝復興時代的“通才”越來越鮮見,想對某一研究領域有一個全景式認識越來越困難。知識圖譜(Mapping Knowledge Domain)應運而生,最初目的是對科技文獻進行可視化描述,以圖形化建模的方式來直觀表達知識和知識間的關(guān)系。圖譜中的節(jié)點表示知識的實體,圖譜中的線段表示實體間關(guān)系,節(jié)點和線段構(gòu)成的拓撲結(jié)構(gòu)圖直觀描述了某一領域的知識資源及其實體,顯示了知識以及它們之間的相互聯(lián)系。隨著信息技術(shù)和計算機技術(shù)的發(fā)展,人們發(fā)現(xiàn)知識圖譜在地理認知、知識表達、數(shù)據(jù)挖掘、信息展現(xiàn)等方面有獨特的價值,特別是挖掘和表達復雜數(shù)據(jù)的規(guī)律性認識方面有獨到的優(yōu)勢。

近年來,隨著各級對突發(fā)事件應急處置的高度重視,應急管理部門積累了大量業(yè)務數(shù)據(jù),由于這些數(shù)據(jù)通常運行在特定信息系統(tǒng)上,需要在專有環(huán)境下使用和展現(xiàn)。當出現(xiàn)突發(fā)事件時,一方面大量信息和數(shù)據(jù)短時間內(nèi)匯聚于應急指揮機關(guān),有時通信信道都為之阻斷;另一方面各級指揮員又常常困擾于真實有效信息過少,可用信息被垃圾數(shù)據(jù)所淹沒的現(xiàn)象屢見不鮮,特別是用于輔助決策的綜合信息嚴重不足[1],信息與決策之間存在著的巨大鴻溝。基于知識圖譜對應急數(shù)據(jù)進行組織是解決這個難題的可行途徑。

1 知識圖譜用于應急數(shù)據(jù)的價值

1.1 搜索信息將更準確

當發(fā)生突發(fā)事件時,指揮員和聯(lián)合指揮機構(gòu)需要迅速掌握事件情勢,及時定位突發(fā)事件發(fā)生區(qū)域,劃分影響地區(qū),指定疏散地域,定下處置決心,制定處置方案,各應急部門根據(jù)指揮機構(gòu)命令,啟動緊急情況下交通、衛(wèi)生、消防、工程應急救援預案和各類保障計劃方案,在這些決策和計劃的制定過程中,借助基于知識圖譜標準化數(shù)據(jù)組織形式,態(tài)勢圖系統(tǒng)能夠?qū)⒖臻g數(shù)據(jù)與非空間數(shù)據(jù)進行有效集成,對不同來源、不同格式的應急數(shù)據(jù)統(tǒng)一管理,并以圖層的形式存儲,方便進行復雜查詢。應急數(shù)據(jù)能夠以各種圖、表的形式直觀展示,快速生成應急決策方案專題圖,在分秒必爭的突發(fā)事件應急處置中將發(fā)揮重要作用。

1.2 查詢理解將更智能

構(gòu)建應急知識圖譜之后,以突發(fā)事件中應急部門的任務、目標、行動等特征賦予關(guān)鍵字(實體或任務)字符串新的屬性,當選中需要展現(xiàn)的實體后,搜索引擎會以實體在特定時空、資源以及人力等條件下實現(xiàn)特定目標為過程,查詢涉及到的實體及屬性,集合任務行動所需要的數(shù)據(jù),保證了用戶搜索獲得信息的連續(xù)性。以災后群眾疏散方案為例,目前應急方案可能只提出未來可能的疏散地位置、空間容量,而不可能給出疏散距離、疏散路徑,就是給出了疏散路徑,由于無法確定事件發(fā)生時的道路真實情況,可能造成受災群眾撤退過程中道路擁擠等。借助應急知識圖譜,在態(tài)勢圖系統(tǒng)中搜索疏散線路時,應急知識圖譜可將事發(fā)地域的地理空間數(shù)據(jù)進行分級,明確出受災區(qū)、影響區(qū),聚合這些區(qū)域內(nèi)道路交通路況信息,將以專題圖形式展現(xiàn),直觀給出災區(qū)道路通行能力,為指揮員和聯(lián)合指揮機構(gòu)定下處置決心提供及時、準確的參考。

1.3 信息展示將更全面

知識圖譜能夠比較全面地描繪實體以及實體之間的關(guān)系,各級應急部門可以通過應急知識圖譜全方位了解所需的業(yè)務知識。從突發(fā)事件應急處置的實踐看,各級決策者不僅關(guān)心數(shù)據(jù)所包含的基本信息,更關(guān)心這些數(shù)據(jù)背后蘊含的擴展信息甚至是規(guī)律性信息。指揮人員在定下決心時,思維首先會集中一些表面的基本信息上,進而需要了解擴展信息以全面掌握任務情況,最終在規(guī)律性信息指導下做出決策。知識圖譜的構(gòu)建符合指揮員思考和認知順序,與傳統(tǒng)的文本方式進行業(yè)務信息分析模式相比,可以進行更加有效的數(shù)據(jù)挖掘,智能化選擇出指揮員關(guān)心的實體,自動關(guān)聯(lián)其屬性(或能力),并以圖示方式進行展示,大大提高了分析的精確度和時效性,決策將更科學、更準確。

1.4 信息數(shù)據(jù)將更規(guī)范

要想構(gòu)建關(guān)鍵緊密、數(shù)據(jù)交鏈的應急知識圖譜,就必涉及對所有相關(guān)的實體及其關(guān)系進行規(guī)劃化描述,對行業(yè)領域內(nèi)的知識節(jié)點進行全面清晰梳理,對知識節(jié)點之間關(guān)系(邊)進行準確概括,這就要求提高應急信息的標準化程度,各應急信息系統(tǒng)要在一個統(tǒng)一規(guī)范的集成框架內(nèi)提供數(shù)據(jù),應急裝備也要進行規(guī)范化管理[2],倒逼各應急部門規(guī)范內(nèi)部信息交互和對外信息服務;與此同時,應急知識圖譜中龐大的實體庫也為應急信息系統(tǒng)提供了統(tǒng)一的、全面的數(shù)據(jù)模型,為應急理論研究、數(shù)據(jù)開發(fā)、模擬仿真等提供了可用的集成標準。

2 應急知識圖譜的數(shù)據(jù)構(gòu)成模式

圍繞突發(fā)事件會有多方面的描述信息,這些信息以什么樣的順序和樣式展現(xiàn)出來,影響到對突發(fā)事件應急處置的效率。應急數(shù)據(jù)組織最根本的是將分散存在于各應急部門的信息有序化[3],從這個過程中獲取有價值的信息,進而發(fā)現(xiàn)規(guī)律。以地震災害后救援為例,首先要了解的是震情基本信息,如地震中心定位信息、震級強度、涉及區(qū)域、房屋受損情況、被困人員情況、水電供應等;在此基礎上,需要進一步掌握擴展信息,如專業(yè)應急救援人員數(shù)質(zhì)量、應急資源需求信息、災區(qū)交通道路信息、可供應的應急物資及儲備量等[4];進而可能需要知道的是規(guī)律信息,如震區(qū)場地質(zhì)水文情況、氣象條件,從歷史上看,這些條件對當前救援會有什么影響,救援物資、資金調(diào)撥數(shù)量和最低投入規(guī)模,進出災區(qū)道路受損情況對救援車輛通行能力影響多大,等等。

圖1 基于知識圖譜的應急物資供應的實體結(jié)構(gòu)圖

如圖1 所示,在地震災害發(fā)生后,指揮員和指揮機關(guān)除了要了解震情基本信息外,就物資供應這一任務而言,迫切想要掌握的是:震區(qū)當前需求物資種類是什么;是否可以劃分出具體需求地點,需求量如何預計多少,需求物資的是否能給出優(yōu)先級排序;當前儲備的應急救援物資有什么(及數(shù)量),儲備在哪里;如果不能滿足需求,應如何籌措,如何運輸?shù)綖膮^(qū);事發(fā)地域周邊有多少可以使用的車輛,運輸車輛的裝載量為多大;車輛維修、加油站等保障能力有多強;震區(qū)中心位置在哪里,影響區(qū)域有多大,周邊氣象水文對交通道路的影響有多大,等等。很明顯,這些知識涉及民政、交通、運輸、衛(wèi)生、電力、水利、物流等多個行業(yè)部門,任何一家都只能提供部分信息。

知識圖譜以一種更符合人的認識習慣或思維方式的形式對知識和知識間關(guān)系進行重新編排、建模。依然以地震災害為例說明,從地震信息作為一級實體,從這里出發(fā),在領域知識專家的幫助下確定能夠說明震情實體的概念網(wǎng)絡導航樹,樹上的每一個節(jié)點就是該實體的子實體或?qū)傩?,如在震情實體導航樹上,可以分解出救災資源子實體、交通運輸子實體、醫(yī)療衛(wèi)生子實體,等等。針對每一個實體再向下分解出多個層次結(jié)構(gòu)的子實體或?qū)傩?,每一個子實體就是一個關(guān)鍵字,這些關(guān)鍵字在和應急系統(tǒng)信息中可以作為搜索的條件,映射得到的就是邏輯上相對獨立的信息包,將這些信息包以適應的形式封裝后可供應急指揮信息系統(tǒng)調(diào)用。

這樣一種從上到下的層次化細分知識體系,體現(xiàn)了知識到數(shù)據(jù)層的有向映射,是將數(shù)據(jù)中蘊含的基本信息、擴展信息乃至隱含性信息,以規(guī)律性的圖示展現(xiàn)了出來,而這種能夠直觀表達信息之間關(guān)系的圖,更利于指揮員認識和決策。結(jié)合地理信息系統(tǒng)進行圖層疊加、分級顯示、對比分析,形成面向不同對象的系列專題圖[5],為依附于地圖上的多種格式的應急數(shù)據(jù)存儲、調(diào)用及處理提供了途徑,將極大提高應急救援指揮的正確性、現(xiàn)實性和實用性。

3 應急知識圖譜的信息搜索模型

由于目前信息系統(tǒng)中絕大部分數(shù)據(jù)通常以結(jié)構(gòu)化方式存儲于關(guān)系數(shù)據(jù)庫中,本文重點分析基于結(jié)構(gòu)化數(shù)據(jù)的應急知識圖譜構(gòu)建和查詢處理過程。對于其他半結(jié)構(gòu)化數(shù)據(jù),乃至非結(jié)構(gòu)化數(shù)據(jù)的可視化顯示,更多屬于大數(shù)據(jù)可視化的范疇,由于篇幅關(guān)系,這里不做深入討論。

利用關(guān)系數(shù)據(jù)庫中數(shù)據(jù)構(gòu)建知識圖譜的過程,實際上是關(guān)系數(shù)據(jù)庫中“關(guān)系”與知識圖譜的“實體”建立某種映射的過程。實體是對領域知識的概念化描述,包含一系列屬性和關(guān)系。例如,應急消防救援力量實體應當包含:單位名稱、人員數(shù)量、特種車輛、攜帶裝備、救援能力等屬性,救援裝備實體應包含裝備類別、裝備數(shù)量、戰(zhàn)技性能等屬性。實體關(guān)系描述了不同概念和實體的分類,以及繼承、并列等關(guān)系。由于關(guān)系數(shù)據(jù)庫中大多數(shù)據(jù)構(gòu)造完整,可較好地對應知識圖譜中的實體屬性、詞性特征等要素,在深入了解結(jié)構(gòu)化數(shù)據(jù)的基本結(jié)構(gòu),特別是庫表結(jié)構(gòu)、表間關(guān)聯(lián)、列名關(guān)系基礎上,通過D2R 語言(Relation Database to RDF)可以把結(jié)構(gòu)化數(shù)據(jù)中的表格與知識圖譜中的概念或?qū)嶓w相關(guān)聯(lián),這樣就把關(guān)系數(shù)據(jù)庫的表、列與知識圖譜的概念實體及實體屬性建立了對應,便于形成應急數(shù)據(jù)知識圖譜。

若數(shù)據(jù)庫D 中有表A 記為TA,以該表建立概念節(jié)點CA,表TA中的記錄TAj建立實體EAj,則可以假設實體EAj包含表TA定義的列。

如果在關(guān)系數(shù)據(jù)庫中定義的約束關(guān)系,例如,表TA的列RA是表TB中列RB的外鍵:

關(guān)系R(A,B)記為表TB中記錄TBj實體EBj間的關(guān)系:

在現(xiàn)實情況中,實體間的關(guān)系可能是較好識別的顯性關(guān)系,但大量的自然言語下的關(guān)系可能并不好識別,需求從隱性表達中挖掘出實體關(guān)系。不過,由于應急數(shù)據(jù)運用場景單一且確定,所涉及的專業(yè)可提前預知,預案數(shù)量有限,查詢條件可控,應急知識圖譜的建立,不需要像基于互聯(lián)網(wǎng)的知識檢索那樣面對復雜多變的語義環(huán)境。經(jīng)過對比與分析,筆者認為,采用以詞性特征為基礎的關(guān)系識別方法,就可以滿足映射需求。通過深入分析各部門應急預案內(nèi)容,提煉常見分詞及問題,人工預先設定關(guān)鍵詞典,基本可以涵蓋應急知識圖譜查詢的條件,這樣就能夠較好地把利用關(guān)系數(shù)據(jù)庫表間關(guān)系,建立實體關(guān)系。用戶提出的自然語言查詢條件經(jīng)過表述歸一、語義解析、詞典匹配后形成標準的檢索條件,對關(guān)系數(shù)據(jù)庫進行檢索,反饋的知識將更能體現(xiàn)指揮員最關(guān)心的問題。

以概念R(C)標記表數(shù)據(jù)庫D 中表TA與表TB之間的多對多關(guān)系,并在表TC中體現(xiàn),則實體EAi到實體EBj之間的關(guān)系:

把知識檢索定義為屬性值(V)、關(guān)系(R)、實體(E)和概念(C)等幾類要素,分析建立關(guān)鍵詞庫,表1 給出了知識檢索條件與關(guān)系數(shù)據(jù)庫SQL 查房的對應關(guān)系。

例如,查詢“震中50 公里內(nèi)可用的應急救援衛(wèi)勤力量有哪些”?可將查詢條件中的要素值“地域范圍、醫(yī)療、部署、單位”等要素值與查詢條件相對應:<地域范圍,V>、<應急醫(yī)療,C>、<單位,E>、<部署,R>,得到查詢語句為:Q(‘地域范圍=50 公里’).IN(‘部署’).AND(Q(‘單位’).OUT(‘應急醫(yī)療’))。執(zhí)行這條查詢即可得到周邊50 公里的應急醫(yī)療實體。

表1 關(guān)系數(shù)據(jù)庫要素與知識圖譜查詢條件轉(zhuǎn)換表

當然,上述查詢語句的匹配適用于簡單的自然語言查詢,如果需要處理復雜語義的查詢,就涉及人工智能和機器學習,這里不做深入研究。

4 應急知識圖譜的構(gòu)建步驟

在突發(fā)事件應急聯(lián)動處置中,所有信息、數(shù)據(jù)都應當圍繞某一特定的任務來組織,這些信息數(shù)據(jù)中,既有基本信息、擴展信息,也有蘊含的規(guī)律性知識,這些信息可能是來自于多數(shù)據(jù)庫之間的關(guān)聯(lián)查詢、擴展查詢,也可能是跨行業(yè)部門的統(tǒng)計查詢或任務查詢,需要綜合考慮突發(fā)事件應急處置需要、指揮員思維習慣和應急數(shù)據(jù)缺陷等,滿足多種信息展現(xiàn)需求。

4.1 構(gòu)建實體庫

通過對任務內(nèi)容進行理論抽象,結(jié)合底層數(shù)據(jù)的分析,提煉出相關(guān)的實體。例如,根據(jù)突發(fā)事件發(fā)生地位置,定位事件地點,以該點為中心,根據(jù)事件類別、危害等級、影響范圍等參數(shù),結(jié)合各專業(yè)基礎數(shù)據(jù)圖層,包括可用的應急救援力量圖層、醫(yī)療衛(wèi)生力量圖層、疏散地點容量圖層等,根據(jù)震級大小啟動不同等級的應急預案,依據(jù)方案中明確的處置要求,確定可以參與應急救援的救援力量、儲備物資、交通管制,以及相應的救護力量編組、物資提供、裝備調(diào)撥、交通調(diào)度、道路疏導,等等。

實體庫是后續(xù)建設應急知識圖譜的基礎,在構(gòu)建實體庫的過程中要做好規(guī)約性工作,包括數(shù)據(jù)融合集成工具的選擇、各類格式數(shù)據(jù)的統(tǒng)一規(guī)范等,遵循統(tǒng)一的標準和規(guī)范不僅有助于信息數(shù)據(jù)的準確性,更利于數(shù)據(jù)查詢、信息展示、知識總結(jié)等方面的信息運用。

4.2 構(gòu)建知識節(jié)點導航網(wǎng)

對于提煉出的知識,按照關(guān)聯(lián)度大小或者是人們的認知順序,根據(jù)與該知識節(jié)點有關(guān)聯(lián)度的其他主題任務組織成一副網(wǎng)絡的節(jié)點圖,查詢指令從這個節(jié)點出發(fā)按照特定的路徑流轉(zhuǎn),每到一個節(jié)點就會顯示相應的內(nèi)容,這就對終端用戶的擴展查詢提供了支持。

以地震災害后建筑物損毀統(tǒng)計這個業(yè)務概念為例,震后救援中首先需要準確了解建筑物的抗震性能,如果能夠及時知道建設物結(jié)構(gòu)分類(磚木結(jié)構(gòu)建筑、磚混結(jié)構(gòu)建筑、鋼筋混凝土結(jié)構(gòu)建筑、鋼結(jié)構(gòu)建筑)、耐久年限(一級100 年以上、二級50-100 年、三級25-50年、四級15 年以下),等等,并在地圖上進行標識,對于確定指揮中心研究確定救援重點將大有幫助。根據(jù)震中位置及地震強度,以震感影響范圍確定災情分級救援半徑,構(gòu)建震情影響區(qū)域,再根據(jù)周邊應急力量部署,得出可參與應急救援力量的距離、能力等知識,為指揮員快速定下救援決心提供科學的數(shù)據(jù)支持。如果根據(jù)計算,依靠本級應急力量明顯不足時,可及時向上級要求增援,力爭在最短時間內(nèi),得到適時、適量、適地的救援保障。

圖2 基于知識圖譜的應急數(shù)據(jù)組織模型示例

4.3 明確節(jié)點間的關(guān)聯(lián)信息

節(jié)點間關(guān)聯(lián)關(guān)系有時不僅僅是數(shù)據(jù)之間的語義關(guān)系,如包含關(guān)系、空間關(guān)系、時間關(guān)系、邏輯關(guān)系,更多的可能是業(yè)務邏輯關(guān)系,如工作流程、信息流轉(zhuǎn)、業(yè)務協(xié)作等。所以在定義節(jié)點間的關(guān)聯(lián)度時要綜合考慮語義關(guān)系、業(yè)務邏輯、節(jié)點顆粒度等,以提高信息的可用性。在對數(shù)據(jù)進行處理時,如果存在E-R 關(guān)系則利用E-R 關(guān)系定制,對于不存在關(guān)聯(lián)關(guān)系但是現(xiàn)實語義和業(yè)務邏輯中存在的,可以進行數(shù)據(jù)提取和配置。

4.4 形成知識節(jié)點的應急數(shù)據(jù)段

將應急預案內(nèi)容、應急數(shù)據(jù)查詢分解規(guī)范后,映射為知識圖譜查詢要素庫,當用戶查詢時,結(jié)合上述要素庫中的語言分詞算法,將查詢語句分割成要素和要素值,得到知識化的、便于理解、易于圖示的信息。

建立知識節(jié)點到數(shù)據(jù)層的映射,也可以按照邏輯概念進行細分,直到與底層數(shù)據(jù)建立關(guān)聯(lián),形成層次關(guān)聯(lián)樹,對每個節(jié)點的查詢顯示內(nèi)容進行定制封裝。對于結(jié)構(gòu)化的數(shù)據(jù)可以通過對特定表進行組合查詢、更新等數(shù)據(jù)庫操作,把特定資源實體封裝為信息包;對于非結(jié)構(gòu)化數(shù)據(jù)類型主要是通過封裝調(diào)用。所有的信息封裝,對外提供標準的接口,供輸入特定的查詢條件,將主題任務轉(zhuǎn)化為查詢的實例。

4.5 數(shù)據(jù)顯示及調(diào)用

以主題任務為單元進行發(fā)布,形成信息調(diào)用服務,以方便其他業(yè)務應用的信息查詢和調(diào)用。數(shù)據(jù)提供者通過WSDL 文件將信息組合封裝成接口標準的服務,并在元服務器上發(fā)布這些服務的接口特征。用戶在需要某項主題任務信息時首先向服務注冊中心提交申請,查找特定的數(shù)據(jù)服務,如果注冊中心查找到所需的服務,就會返回查詢后的結(jié)果,服務使用者就可以根據(jù)返回的結(jié)果進行調(diào)用。

5 結(jié)語

本文簡要分析了知識圖譜用于應急數(shù)據(jù)的價值,研究了應急知識圖譜的數(shù)據(jù)構(gòu)成模式,構(gòu)建了應急知識圖譜的信息搜索模型,提出了應急數(shù)據(jù)知識圖譜的構(gòu)建步驟,對于突發(fā)事件應急處置決策將提供有力的支持。

猜你喜歡
圖譜實體救援
基于圖對比注意力網(wǎng)絡的知識圖譜補全
緊急救援
3D打印大救援
實體書店步入復興期?
圖表
2017實體經(jīng)濟領軍者
兩會進行時:緊扣實體經(jīng)濟“釘釘子”
振興實體經(jīng)濟地方如何“釘釘子”
主動對接你思維的知識圖譜
救援行動
玉屏| 邹城市| 新丰县| 包头市| 新密市| 淮阳县| 石首市| 左权县| 旬邑县| 雷州市| 仙居县| 子洲县| 萍乡市| 岑巩县| 长治市| 福安市| 晴隆县| 武山县| 蚌埠市| 东阳市| 宜黄县| 新建县| 汶上县| 夏津县| 安化县| 阜南县| 溧水县| 石嘴山市| 云林县| 漾濞| 屏东市| 修武县| 通化县| 麦盖提县| 新密市| 陇南市| 兴安县| 文安县| 林口县| 广州市| 甘泉县|