路 威 趙麗君
1陸軍工程大學通信工程學院,江蘇 南京,210001
2 32142部隊,河北 保定,071000
兵要是指作戰(zhàn)中利用戰(zhàn)場環(huán)境或地理環(huán)境的“要點”[1]。兵要信息(military topology information)是記錄和描述戰(zhàn)場環(huán)境中客觀存在的,與軍事活動緊密相關的自然地理、人文地理和基礎設施等要素實體,并分析評價其對軍事行動影響的一種地理環(huán)境研究成果[2,3]。
兵要信息是對傳統(tǒng)兵要地志的拓展和延續(xù),其不是單純的地理志書,而更強調(diào)實體和待評價內(nèi)容的數(shù)字化、標準化和信息化,并采用信息論、數(shù)據(jù)結(jié)構、大數(shù)據(jù)、人工智能等先進的數(shù)據(jù)管理與信息挖掘手段,智能化分析實體在地理空間中的時空分布、邏輯關聯(lián)和作戰(zhàn)影響,進而給出輔助決策依據(jù)。兵要信息也區(qū)別于地理空間信息(傳統(tǒng)地圖的拓展),兵要信息更強調(diào)各要素實體的綜合聯(lián)系和對軍事行動的影響,它的產(chǎn)生是在地理空間信息的基礎上進行數(shù)據(jù)挖掘、要素度量、環(huán)境分析和行動決策,進而形成與軍事行動相關聯(lián)的地理環(huán)境研究成果。因此,地理空間信息是兵要信息的基礎信息資源,而兵要信息是綜合分析地理信息和軍事行動后產(chǎn)生的一種評價成果。
不論是兵要地志、地理空間信息,還是兵要信息,都是對地理環(huán)境系統(tǒng)的記錄和描述,雖然兵要信息的產(chǎn)生運用了知識綜合、抽象和概括的過程,但其在形式上仍然是地理要素對軍事行動影響的一種客觀評價,而非抽象和綜合的兵要知識表達。如果要將人工智能、大數(shù)據(jù)等技術引入到兵要信息生產(chǎn)和分析領域,則需要構建兵要知識圖譜。
本文旨在以知識圖譜的概念和理論為基礎,根據(jù)兵要信息的要求和特點,提出兵要知識圖譜(military topology knowledge graph,MTKG)的構建方法,目的是構建融合語義關系和時空關系的兵要信息智能引擎,服務兵要信息智能分析,最終為智能化的兵要信息系統(tǒng)建設提供技術支撐。本文首先討論了兵要知識圖譜的內(nèi)涵與特點;然后分析了兵要知識圖譜的構建方法和關鍵技術;最后闡述了兵要知識圖譜的應用領域與方向。
知識圖譜[4]是人工智能領域的一個重要分支,其來源于智能化的圖書情報和信息處理技術,最初的研究是為了解決圖書情報(主要是文本類)的邏輯關聯(lián)分析和可視化問題,即將圖書文獻中隱含的信息,通過特征提取、模式識別、信息關聯(lián)、信息處理與分析和可視化等手段顯示出來,為研究者確定自己的研究領域在科學研究中所處的位置[5]。知識圖譜本質(zhì)上是具備有向結(jié)構圖的網(wǎng)狀知識庫,其中的節(jié)點代表實體或者概念,是由具有各種屬性的實體通過信息關聯(lián)組合而成,而圖的邊代表實體與概念之間的各種語義關系。
近年來,人工智能的熱潮帶動了知識圖譜研究的迅猛發(fā)展,并被應用于不同的學科領域,學者們依據(jù)本領域的特點分別提出了不同類型的知識圖譜,其中與兵要知識圖譜較為相近的概念是基于地理信息的地理知識圖譜[6]和基于軍事情報的軍事知識圖譜[7],這兩種知識圖譜都針對文本類信息,采用網(wǎng)絡結(jié)構圖的概念,通過圖形方式表達知識,即將知識圖譜作為開放語義網(wǎng)的子集,通過實體抽取、邏輯關系抽取和圖譜存儲等實現(xiàn)圖譜構建。兵要信息與地理信息和軍事情報有所不同,兵要信息以地理空間信息為基礎,融合影像、視頻、地圖數(shù)據(jù)、地理數(shù)據(jù)和軍事情報等多元信息,通過圖像解譯、圖形分析、情報挖掘等技術提取要素實體及其關聯(lián),并用多維數(shù)據(jù)動態(tài)可視化技術展現(xiàn)作戰(zhàn)環(huán)境中各要素的形態(tài)結(jié)構與空時變化規(guī)律。因此,在數(shù)據(jù)類型上,兵要信息已經(jīng)超出了地理信息和情報信息表達的范圍,兵要知識圖譜也不是前兩種知識圖譜的簡單概念搬移。
兵要知識圖譜首先是對兵要知識的圖形化表達方式,在這一點上,兵要知識圖譜類似于地理知識圖譜和軍事知識圖譜;但兵要知識圖譜不僅是一種圖形表達方式,它還是一種可定量分析和挖掘知識的網(wǎng)絡結(jié)構,可依據(jù)實體間的關聯(lián)和邏輯計算分析環(huán)境對軍事行動的影響,并進一步挖掘輔助決策信息;此外,兵要知識圖譜還是一種時空分析方法,具備對地圖或地理空間信息的時空分布表現(xiàn)能力,并通過建立時空模型定性和定量地認識地理現(xiàn)象在戰(zhàn)場環(huán)境中的分布和對軍事行動的影響。
如圖1所示,兵要知識圖譜的核心是建立與地理空間信息時空關聯(lián)的知識圖形表達,將兵要實體以及它們之間的聯(lián)系以地理坐標和時間坐標之外的另一種空間圖形分布表現(xiàn)在圖上,并在此基礎上形成兵要信息網(wǎng)狀知識庫,然后通過有向結(jié)構圖的圖與邊模型組成知識語義模型,實現(xiàn)兵要知識的信息檢索、專家知識抽取、邏輯關系分析等功能,從而具備對戰(zhàn)場環(huán)境及其對軍事行動的影響進行大規(guī)模實時關聯(lián)和因果分析的能力。
圖1 兵要知識圖譜概念圖Fig.1 Concept Map of Military Topology Knowledge Graph
兵要知識圖譜是科學知識圖譜在兵要信息領域的拓展,是表述地圖、影像等實體空間分布的空間信息圖,也是表述信息挖掘和知識推理的圖形化知識結(jié)構圖,其通過知識圖譜形象化地描述兵要信息的概念、實體、屬性及其時空關聯(lián),進而形成空間和網(wǎng)狀相結(jié)合的知識結(jié)構。
兵要知識圖譜根本特征表現(xiàn)為一種“時空兵要信息結(jié)合型”的知識圖譜,其需要針對戰(zhàn)場環(huán)境信息、作戰(zhàn)行動特點和兵要信息的自身特點,對多源信息進行綜合和關聯(lián),進而獲得具備時空關聯(lián)的兵要知識譜系圖。
1)兵要知識圖譜同時具備“具象信息圖”和“抽象知識圖”[8,9]的雙重能力。兵要知識來源于地理空間信息,描述了戰(zhàn)場環(huán)境中地理要素的空間分布,是未經(jīng)概念抽象、邏輯推理、構模分析的原始時空信息表達模型;另一方面,兵要知識又是知識推理和關聯(lián)分析后獲取的、表示某種認知和理解的軍事行動知識。
2)兵要知識圖譜描述的關系包括時空關系、語義關系和互作用關系。兵要知識圖譜在網(wǎng)絡結(jié)構圖形層面主要描述的關系是實體之間的語義關系;在地理空間信息的時間關聯(lián)層面主要描述的地理要素隨時間的邏輯變化關系;在地理空間信息的空間關聯(lián)層面主要描述的地理要素在空間上的分布關系。另外,戰(zhàn)場環(huán)境和軍事行動是一個動態(tài)系統(tǒng),圖譜中還需要表示運動、變化、過程、相互作用等關系,而如何構建地理信息時空關系、邏輯關聯(lián)及各種實體相互關系的映射,是兵要知識圖譜構建的核心關鍵問題。
3)兵要知識圖譜具備可計算性。兵要知識圖譜需要通過人工構建類似于神經(jīng)網(wǎng)絡的多源信息的網(wǎng)絡化、圖形化表達結(jié)構圖,并具備圖計算的特點,因此它是可計算的,并且能夠與其他的形式化表達方式相互轉(zhuǎn)換,人們可以通過計算和推理從中獲取更多可用于行動決策的新的知識。
4)兵要知識圖譜需要描述地理空間和作戰(zhàn)實體的知識實體模型和推力模型。實體模型主要指地理空間信息中關于地理空間要素的地理定義、地理分析、空間分布等反映地理實體外部特征和聯(lián)系的表達模型,屬于客觀知識。推理模型是指描述地理空間要素的空時演變要素、對作戰(zhàn)行動的影響預測等需要深度挖掘的內(nèi)容,屬于對數(shù)據(jù)挖掘型算法要求較高的知識推理。此外,兵要知識圖譜應該能夠全面描述、存儲和表示地理空間實體的相關知識,并建立知識之間的邏輯關聯(lián)。
兵要知識可采用資源描述框架(resource description framework,RDF)[10]表示為三元組形式,即謂詞(Predicate),賓語形成由“點-邊”組成的大規(guī)模有向圖。其中,主體是地理空間要素和作戰(zhàn)實體,謂詞表示地理空間要素和作戰(zhàn)實體進行知識推理或信息挖掘的方法或技術,賓語是進過推理后形成的具有屬性或資源描述的知識。標準RDF三元組不易表達時空信息,將會影響兵要知識的時空構建效果。為此,需要在RDF模型中增加時空描述方法,例如時間關系謂詞、空間類型陳述、時空關系謂詞等,以構建適于時空索引和查詢的增強型RDF三元組。
圖2表示了兵要知識圖譜的構建過程,不同的信息來源對應了不同的數(shù)據(jù)類型,再通過時空關聯(lián)、知識抽取、實體分析、知識推理等技術形成兵要知識圖譜。
圖2 兵要知識圖譜構建流程Fig.2 Construction Process of Military Topology Knowledge Graph
兵要知識蘊含了大量的地理空間信息和邏輯關聯(lián)信息,需要構建一個存儲知識圖譜的框架,以提高知識圖譜的使用效率。
圖3是兵要知識存儲架構圖。兵要知識圖譜中的地理空間信息包含地圖、影像和多媒體等信息,通常單一的服務器無法滿足其存儲需求,可采用分布式協(xié)同存儲提高存儲容量。分布式協(xié)同存儲采用先邏輯結(jié)構后物理分塊的模式,首先建立基于關系表和圖結(jié)構的增強型RDF數(shù)據(jù)模型,再通過數(shù)據(jù)和信息存儲指向?qū)Y(jié)構化的數(shù)據(jù)分塊,提高系統(tǒng)數(shù)據(jù)結(jié)構的存儲、調(diào)用和轉(zhuǎn)發(fā)效率。
圖3 兵要知識圖譜的存儲架構Fig.3 Storage Architecture of Military Topology Knowledge Graph
兵要知識的抽取分為兵要實體抽取、邏輯拓撲關系抽取、時間關聯(lián)抽取和語義屬性關系抽?。?1]。兵要實體抽取主要是從結(jié)構化和半結(jié)構化數(shù)據(jù)中構建實體詞典、知識規(guī)則或知識特征,抽取出符合某一類的實體。實體抽取的知識規(guī)則較為確定,因而其抽取準確率較高,亦可以在實際工程中應用。
關系抽取則需要從非結(jié)構化數(shù)據(jù)中挖掘知識,實體的信息大多隱含于數(shù)據(jù)中,知識規(guī)則形式多樣,知識特征不明顯,并且需要考慮各種邏輯關聯(lián)因素,因此,其實體抽取難度較大,下面重點討論拓撲關系抽取過程。
拓撲關系抽取主要完成地理空間分布到計算機模型描述與表達關系的轉(zhuǎn)換過程,需要建立空間分布關系到計算機描述語言的映射關聯(lián)[12-13]。如圖4所示,兵要信息中不同的地物要素有不同的對照關系。
圖4 拓撲關系Fig.4 Relationship of Topological Distribution
例如鐵軌和道路之間有“跨越”和“穿過”動作,并且“跨越”動作存在上下的方位關系;河流和村莊之間有“穿過”和“繞行”動作等??梢岳玫乩硇畔⑾到y(tǒng)中的點、線、面分布關系的計算方法,分析得到兵要實體的拓撲關系與類別。
例如,道路、河流等實體定義為線狀要素,村莊、湖泊、城市等定義為面狀要素,重要目標和獨立地物定義為點狀要素,再通過語言描述各要素的空間分布關系。
時間結(jié)構關系主要用于描述兵要信息隨時間的變化特征。時間結(jié)構關系主要描述人文地理變化和自然地理的屬性變化。人文地理變化主要包括國家、政治、宗教等實體隨時間發(fā)展變化關系,如描述國家政治局勢的變化,需要包含“時間-國家-地緣-事件-人員”之間的關系,組成“增強型”的RDF模型。自然地理的屬性變化主要包括地理實體、空間位置隨時間的變化關系,如描述國家(城市)名稱的變化,則需要包括“國家(城市)-地理位置-時間”之間的關系,組成計算機可識別的語言描述模型。
語義屬性關系包括邏輯關聯(lián)關系、等同關系、同類關系、互斥關系等。邏輯關聯(lián)關系主要描述概念或?qū)嶓w間的實例關系,例如“海洋”與“太平洋”之間的關系;同等關系用來描述同級別兵要實體之間的等價關系,如“沖繩最大的空軍基地”與“嘉手納空軍基地”;互斥關系用來描述概念相反的同級兵要實體,如“軍事目標”與“民用設施”;相似關系用來描述概念相近的同級兵要實體,如“資本主義國家”與“發(fā)達國家”。
除了上述內(nèi)容外,兵要實體分析也是建立兵要知識圖譜不可缺少的部分。兵要實體分析主要包括實體關聯(lián)、實體關系消歧和實體對齊3部分[14-15]。實體關聯(lián)建立兵要實體之間的相關性聯(lián)系。實體對齊也被稱作實體匹配,是指對于多源異構的兵要信息中的各個實體,挖掘和分析出同一實體。實體消歧是專門用于解決同名實體產(chǎn)生歧義問題的情況,針對實際的兵要信息中某個實體名稱對應于多個命名實體對象的問題,完成同個實體名稱在不同場景中不同意義的統(tǒng)一。
兵要知識圖譜是實現(xiàn)兵要信息智能化檢索、決策和分析的重要基礎,按照應用場景不同,兵要知識圖譜可分為人工輔助和全智能決策的應用。人工輔助應用主要通過兵要知識圖譜建立智能化信息檢索、專家問答系統(tǒng)、知識挖掘與輔助決策等更好地輔助人員對作戰(zhàn)環(huán)境的認知;全智能決策的兵要信息認知,主要使決策系統(tǒng)具備智能化認知和機器學習能力,可在海量兵要信息中挖掘和推理作戰(zhàn)行動關聯(lián)因素。
人工輔助的兵要知識專家問答模式在交互形式上更接近人類的交流習慣,基于兵要知識圖譜的智能問答系統(tǒng)可以建立虛擬戰(zhàn)場地理環(huán)境和兵要信息的智能檢索引擎[16],能夠適應作戰(zhàn)決策中快速、準確、啟發(fā)式獲取兵要知識的需求。由于兵要知識圖譜具有網(wǎng)絡圖形化、可計算化、關聯(lián)化的特征,兵要知識圖譜相比純文本資料、結(jié)構化數(shù)據(jù)庫等,具有更豐富的信息表達、更精確的知識推理和更高效的檢索方式等優(yōu)勢,基于兵要知識圖譜的專家問答服務將是兵要知識圖譜的一個重要應用方向。
以兵要知識圖譜為基礎,可以建設兵要信息大數(shù)據(jù)和智能決策平臺,可利用模式識別、模式聚類、圖計算、神經(jīng)網(wǎng)絡、類腦算法等先進的人工智能方法,實現(xiàn)兵要實體的關聯(lián)分析、軍事行動影響分析等功能[17];并且依據(jù)“增強型”RDF模型,實現(xiàn)時空離散分布的目標、時間和環(huán)境的關聯(lián)分析,增強信息處理能力。兵要知識圖譜還能進一步加深機器學習在兵要信息中的應用,使決策系統(tǒng)具備環(huán)境認知能力。
未來,人工智能技術將進一步應用于各種武器裝備,兵要知識圖譜技術可以使作戰(zhàn)機器人等智能武器具備對作戰(zhàn)環(huán)境的動態(tài)感知能力,為武器平臺提供相關知識庫的支撐。兵要知識圖譜可為作戰(zhàn)機器人等智能平臺提供兵要信息服務,為武器平臺的路徑規(guī)劃和打擊評估提供豐富的知識推理,使其具備更智能的戰(zhàn)場環(huán)境信息理解能力。
兵要知識圖譜是智能化兵要系統(tǒng)的基礎工程,其構建技術主要以人工智能、數(shù)據(jù)挖掘、機器學習、信息檢索等多學科交叉技術為支撐,是兵要信息智能化服務發(fā)展的新趨勢。本文重點分析了兵要知識圖譜的概念和內(nèi)涵,并設計了兵要知識圖譜的基本架構,總結(jié)分析了兵要知識圖譜的關鍵技術,并結(jié)合兵要知識圖譜的特點分析了未來的應用場景。
兵要知識圖譜作為兵要信息智能化分析的核心技術,具有重要的理論研究和實際應用價值。隨著人工智能在軍事應用中的逐漸深入,兵要知識圖譜在地理空間信息智能關聯(lián)、隱含知識發(fā)現(xiàn)、決策深度問答、智能專家問答系統(tǒng)等作戰(zhàn)運用中,必將發(fā)揮越來越重要的作用。