周育偉,楊朝紅,王宏宇
(陸軍裝甲兵學院信息通信系,北京 100072)
智能化浪潮洶涌而來,加速著人類社會的進步和發(fā)展,智能化技術(shù)是改變世界的顛覆性技術(shù)之一。世界各軍事強國在軍事領(lǐng)域?qū)θ斯ぶ悄艿膽枚冀o予了大力的支持。同時,戰(zhàn)場信息獲取從匱乏轉(zhuǎn)向過載甚至“爆炸”,使指揮員在面臨海量信息的時候無法快速決策,忽略一些重要的信息,如何將信息優(yōu)勢轉(zhuǎn)化為決策優(yōu)勢是一個關(guān)鍵問題。
知識是對信息的抽象和組織,因此相對于信息,知識能更好的指導人的決策和行動,可以將信息優(yōu)勢轉(zhuǎn)為認知優(yōu)勢,進而轉(zhuǎn)換為決策優(yōu)勢,輔助指揮員進行決策,由于軍事領(lǐng)域的特殊性,面向軍事領(lǐng)域知識圖譜的構(gòu)建,前期一般采用自頂向下的方式構(gòu)建知識圖譜,這就需要對本體層進行研究和構(gòu)建。
本文基于本體的概念和構(gòu)建方法,探討目前軍事領(lǐng)域本體構(gòu)建的現(xiàn)狀,歸納已有的軍事領(lǐng)域本體,構(gòu)建一個涵蓋多維度、多層次的軍事領(lǐng)域本體。
本體這一概念最早源于哲學領(lǐng)域,意為“對世界上客觀事物的系統(tǒng)描述,即存在論”,后來隨著人工智能的發(fā)展,1998 年被德國學者Stude 引入到了人工智能領(lǐng)域,并賦予了新的概念“本體是共享概念模型的形式化規(guī)范說明”。這個定義包含了四層含義:
⑴共享(Share):本體中所蘊含的知識是為大多數(shù)人認可的,其表達的是共性的知識。
⑵概念化(Conceptualization):本體所表述的知識是客觀的現(xiàn)實世界的一個抽象概念模型。
⑶明確性(Explicit):指本體中全部的術(shù)語、屬性及公理在使用前都必須有明確的定義。
⑷ 形式化(Formal):指本體可以被計算機所理解,具有機器可讀性。
可以說本體是對某一個領(lǐng)域進行描述的術(shù)語集合,是從世界存在的客觀事物抽象出來的概念模型,這個模型包含了概念和概念之間的關(guān)系和屬性以及對它們的約束、公理等,本體就相當于是知識圖譜的骨骼,實體則是對知識圖譜按照本體骨架進行填充的血肉。
將本體定義為六元組:
其中,C 表示概念集,A表示各個概念的屬性集,R 表示關(guān)系,A表示各個關(guān)系的屬性集,H 表示概念層次,用來說明概念集的層次劃分。例如,H(C1,C2)表示C1是C2 的子概念,X 表示公理集,用來約束概念與概念之間的關(guān)系或是概念與關(guān)系的屬性值。
常用的本體構(gòu)建方法包括以下幾種方法:七步法、METHONTOLOGY 法、KACTUS工程法、SENSUS法、骨架法、TOVE 法、IDEF-5 法,其中七步法較其他幾種方法更為成熟。
對于軍事領(lǐng)域本體構(gòu)建,有很多學者進行了研究。雷玉霞等人提出了軍事領(lǐng)域知識本體的設(shè)計思想,給出了一些用于知識庫中知識的語義一致性、完備性和精確性的公理。程英迅對軍事訓練領(lǐng)域的數(shù)據(jù)進行研究,提出了軍事訓練定義的六元組結(jié)構(gòu),構(gòu)建了軍事訓練本體,開發(fā)了分布式數(shù)據(jù)庫搜索引擎。彭明輝基于搜狗的軍事新聞報道語料對軍事領(lǐng)域情感本體進行了構(gòu)建,基于該本體構(gòu)建了軍事領(lǐng)域情感傾向性分析平臺。蔣維等人提出了建立本體的5 個步驟,實現(xiàn)了本體建立過程部分功能自動完成,但是未進行本體的檢驗和更新。楊建池等人構(gòu)建了用于作戰(zhàn)仿真的軍事領(lǐng)域核心本體。鐘誠等人對軍事倉儲領(lǐng)域本體進行了構(gòu)建,并結(jié)合骨架法提出了一種優(yōu)化的領(lǐng)域本體構(gòu)建流程。李坤等人將軍事領(lǐng)域本體劃分為5 類二級本體,并對每類二級本體進行了具體的劃分,設(shè)計了類的屬性,但是并未給出類間的關(guān)系,添加了本體實例,完成了軍事領(lǐng)域本體庫的存儲。陳立峰等人分析了軍事通信領(lǐng)域本體的特點,給出了軍事通信領(lǐng)域構(gòu)建的方法。鄒燁翰對軍事條令條例的本體進行研究,針對美軍《任務清單》進行本體構(gòu)建。雷瑛等人對多源軍事數(shù)據(jù)進行分析將軍事數(shù)據(jù)本體劃分為機構(gòu)、人員、裝備、物資、環(huán)境、設(shè)施和理論法規(guī)7 類二級本體。劉煜澄對包括萬國兵器網(wǎng)、關(guān)系性能數(shù)據(jù)庫存儲的兵器數(shù)據(jù)進行分析構(gòu)建了兵器本體。張清輝等人構(gòu)建了軍事信息服務本體,并驗證了所構(gòu)建本體模型的有效性。
當前本體構(gòu)建的工具有Protégé、WebOneto、KAON、WebODE等工具。其中,Protégé具有支持中文語言,通過圖形化界面進行構(gòu)建,支持推理及軟件的擴展,操作簡單等多種優(yōu)勢,成為構(gòu)建本體的第一選擇。七步法目前成熟度較高,而且七步法是基于本體構(gòu)建工具Protégé 進行本體構(gòu)建的方法,故借鑒七步法提出一種軍事領(lǐng)域本體構(gòu)建的方法并使用Protégé 工具對軍事領(lǐng)域本體進行構(gòu)建。圖1 展示了結(jié)合七步法的軍事領(lǐng)域本體構(gòu)建的流程。
圖1 軍事領(lǐng)域本體構(gòu)建流程
⑴明確軍事領(lǐng)域本體的領(lǐng)域和范圍
明確軍事本體對應的邊界、業(yè)務功能域、用途、描述的信息內(nèi)容、使用和維護本體的對象。
⑵收集軍事概念和數(shù)據(jù)資源
在構(gòu)建軍事本體前,依據(jù)軍語、各類戰(zhàn)備工程數(shù)據(jù)庫標注、軍事報文、交換文件、戰(zhàn)場情報等,收集環(huán)境作戰(zhàn)數(shù)據(jù)。
⑶現(xiàn)有本體可重用性構(gòu)建
對現(xiàn)有本體進行分析和完善,提高可重用性??芍赜帽倔w具有重要的意義,一方面可對現(xiàn)有本體進行拓展,減少很多不必要的研發(fā)工作,提高本體構(gòu)建的效率。另一方面,可以為現(xiàn)有本體提供經(jīng)驗性的指導以及設(shè)計上的啟發(fā)和幫助。
⑷本體的分析表達
對于不可重用的現(xiàn)有本體,需要對收集到的軍語、標注、標準進行數(shù)據(jù)分析,提取核心概念、概念屬性以及概念間的關(guān)系。
⑸構(gòu)建本體
首先,采用自頂向下的方法定義類和類的繼承關(guān)系,即從軍事領(lǐng)域最基本的概念開始,逐層細化。例如從條令條例的概念開始,細化為共同條令、外軍作戰(zhàn)條令、專業(yè)條例等。然后,類定義完之后需要對類的屬性以及類之間的關(guān)系進行定義,比如定義作戰(zhàn)編隊和戰(zhàn)區(qū)之間的所屬關(guān)系等。最后,基于軍事業(yè)務規(guī)則,對類的屬性進行限制,包括屬性的類型,屬性的定義域和值域。如對一個連隊的人數(shù)進行約束,不能超過軍事知識的范圍,符合軍事領(lǐng)域知識的規(guī)范。
⑹本體整合和實例化
對軍事本體進行整合,采用一致性規(guī)約化方法對來自不同兵種、不同業(yè)務領(lǐng)域的軍事本體進行重定義和語義化處理,以免影響數(shù)據(jù)共享和融合,確認本體后可抽取數(shù)據(jù)進行實例化。
⑺本體評估和修正
經(jīng)過明確領(lǐng)域,搜集概念等步驟,可以初步構(gòu)建一個本體。但構(gòu)建本體并非是一蹴而就的任務,在構(gòu)建的過程中會受到構(gòu)建者自身認知的限制,因此可能會存在一定的差錯和冗余,因此需要對本體進行評估和修正。一方面可以經(jīng)過調(diào)研和請教領(lǐng)域內(nèi)的專家進行探討,記錄評價意見,從本體的一致性、明確性、可擴展性等方面進行綜合評價,另一方面可以使用Protégé內(nèi)自帶的推理機進行本體的一致性檢驗。軍事領(lǐng)域本體的構(gòu)建隨著業(yè)務需求變化而擴展迭代更新,以保證滿足軍事業(yè)務需求,與時俱進,實現(xiàn)高性能,高可用。
通過總結(jié)、歸納已有軍事領(lǐng)域本體,以及對裝備手冊等數(shù)據(jù)來源進行分析,并咨詢領(lǐng)域?qū)<遥苍O(shè)置四級本體樹。一級本體包含武器裝備、戰(zhàn)場環(huán)境、軍用物資、人物、條令條例、設(shè)施和組織機構(gòu)共7大類,二至四級本體是對上一級本體的具體劃分。
以武器裝備為例,考慮到作戰(zhàn)中可能涉及的各類裝備,按照領(lǐng)域用途將武器裝備本體分為遙感裝置、保密裝備、電子對抗裝備、軍械裝備、偵察觀測裝備、陸軍裝備、海軍裝備、空軍裝備、工程裝備、防化裝備、指揮通信裝備、彈藥導彈、多棲裝備和保障裝備共14 個二級本體。以偵察觀測裝備為例,下設(shè)指揮鏡、方向盤、望遠鏡、步兵潛望鏡、測距機、炮兵聲測系統(tǒng)、炮兵測地系統(tǒng)、炮兵鏡、炮兵防空兵夜視設(shè)備、經(jīng)緯儀、輕武器夜視設(shè)備、雷達等14 個三級本體,雷達本體下設(shè)機械掃描雷達和電掃描雷達2個四級本體。
在對軍事領(lǐng)域本體的概念進行定義之后,需要對本體的關(guān)系和屬性進行定義。在Protégé軟件中,關(guān)系為對象屬性(Object Property)即表示本體類與類之間的關(guān)系,屬性為數(shù)據(jù)屬性(Data Property)即表示本體類所具有的性質(zhì),一條事實可以用三元組(定義域,對象/數(shù)據(jù)屬性,值域)進行表示,對于對象屬性來講,值域是一個本體概念,對于數(shù)據(jù)屬性而言,值域是一個定義好的數(shù)據(jù)類型。例如三元組(轟炸機,搭載,導彈)表示了本體概念“轟炸機”作為定義域,“搭載”作為關(guān)系,“導彈”作為值域的一條事實“轟炸機搭載了導彈”,這樣“轟炸機”類的實體和“導彈”類的實體就可以擁有“搭載”這個關(guān)系。軍事領(lǐng)域本體設(shè)置以下五類關(guān)系:
作戰(zhàn)關(guān)系 主要用來描述作戰(zhàn)過程中的行動關(guān)系。包括:支援、協(xié)同、指揮、干擾、保障等關(guān)系。
人員關(guān)系 主要用來描述人員與人員、組織、裝備和物資的關(guān)系。包括:上級、下級、平級、配備、隸屬、任職、管理、維修、研發(fā)等關(guān)系。
裝備關(guān)系 主要用來描述裝備作戰(zhàn)單元和組織機構(gòu)等之間的關(guān)系。包括:編配、配屬、搭載、生產(chǎn)、使用、消耗、部件等關(guān)系。
位置關(guān)系 主要用來表示方位的關(guān)系。包括:東、西、南、北、東西等關(guān)系。
其他關(guān)系 主要是一些共性的關(guān)系,如:組成、屬于、包含等通用的關(guān)系。
數(shù)據(jù)屬性的類型設(shè)計主要用來約束屬性值的數(shù)據(jù)類型,在定義屬性類型時需要對屬性名、屬性值和屬性的數(shù)據(jù)類型進行定義,數(shù)據(jù)屬性將本體類與數(shù)據(jù)類型進行關(guān)聯(lián),Protégé 中提供了多種數(shù)據(jù)類型。以導彈類本體為例,其主要屬性定義如表1所示。
表1 導彈類屬性類型設(shè)計(部分)
考慮到個體的主觀意識影響,并且本體構(gòu)建是一個隨著構(gòu)建者認知不斷加深而重復修正的一個過程,在本體構(gòu)建的過程中會產(chǎn)生一定的概念、關(guān)系、屬性和公理等方面的沖突或冗余,故而需要對已經(jīng)構(gòu)建好的本體進行一致性、準確性和可滿足性等方面的檢測。構(gòu)建本體的過程中參照《軍語》等專業(yè)術(shù)語概念進行構(gòu)建,將有歧義的本體概念降到最低,同時邀請領(lǐng)域?qū)<疫M行點評修改,提高本體構(gòu)建的準確性,構(gòu)建好的本體保存為OWL格式的文件,然后使用Protégé軟件中自帶的Pellet 推理機進行本體的一致性檢測。Protégé 軟件內(nèi)置的Pellet 推理機是一種基于Tableau算法的描述邏輯推理機,Pellet推理機可以根據(jù)本體結(jié)構(gòu)生成斷言概念結(jié)構(gòu),確定本體元素與元素之間是否存在相互否定的關(guān)系,從而實現(xiàn)描述邏輯一致性檢驗的目的。構(gòu)建好軍事領(lǐng)域本體后就可以根據(jù)本體進行實體抽取、關(guān)系抽取、屬性抽取等任務完成軍事領(lǐng)域知識圖譜的構(gòu)建,為智能問答、輔助決策等下游任務提供基礎(chǔ)。
本文對軍事領(lǐng)域已有本體進行了歸納總結(jié),借鑒七步法提出了軍事領(lǐng)域本體構(gòu)建的流程,復用已有的軍事領(lǐng)域本體,對包括裝備手冊在內(nèi)的數(shù)據(jù)進行分析總結(jié),使用Protégé 構(gòu)建了一個涵蓋范圍廣、多層次的軍事領(lǐng)域本體,為下一步基于軍事領(lǐng)域知識圖譜的構(gòu)建做鋪墊。但是考慮到軍事領(lǐng)域本體構(gòu)建的質(zhì)量要求高,因此構(gòu)建的全過程都是依靠人工的,因而構(gòu)建過程緩慢,之后會對半自動以及自動構(gòu)建本體展開研究和探討。