彭 超,董獻洲,徐 浩,樂 劍
(中國人民解放軍軍事科學院,北京 100091)
作戰(zhàn)仿真為研究作戰(zhàn)任務、作戰(zhàn)過程、作戰(zhàn)活動、裝備效能、體系能力等復雜作戰(zhàn)問題提供有效的手段與方法,是作戰(zhàn)研究與仿真技術的緊密結合,以實物、虛擬或構造等仿真資源的有效聚合來對實際或設想的作戰(zhàn)情況進行動態(tài)模擬與驗證。同時,隨著計算機技術的迅猛發(fā)展,作戰(zhàn)仿真逐漸具備虛擬化、組件化、服務化、智能化等新特征。
由于作戰(zhàn)問題的多樣性、復雜性和綜合性,作戰(zhàn)仿真知識涉及多領域、多專業(yè)、多層次、多軍兵種。目前,作戰(zhàn)仿真的知識表達異構、共性理解困難、重用復用不足等問題越來越突出,制約著作戰(zhàn)仿真應用的開發(fā)、活動的實施、效能的發(fā)揮。提供可共享、可理解、可計算的作戰(zhàn)仿真知識模型能夠提高作戰(zhàn)仿真的實施效率和應用效能。
針對缺少整體性、結構性、關聯(lián)性的作戰(zhàn)仿真知識描述這一現(xiàn)狀,本文結合本體工程和作戰(zhàn)仿真知識特點,分析作戰(zhàn)仿真本體的必要性,提出相應的構建原則與流程,為構建可用、易用、好用的作戰(zhàn)仿真知識模型提供原則、方法和技術等方面的規(guī)范性指導。
本體已經成為語義網、信息檢索、人工智能、信息系統(tǒng)、知識工程、知識圖譜等研究領域的關注核心之一。
引用最高的本體定義是Gruber在1993年提出的,認為“本體是概念化的詳細規(guī)格說明”。Kendall和McGuinness將本體定義為“本體是詳細描述特定領域或關注區(qū)的術語、概念、命名,概念與概念、概念與實例、實例與實例之間的關系,以及區(qū)分概念、明確定義與關系的語句”。一般來說,本體具備四個特點:一是概念化,抽象出客觀存在的一些術語概念、實例并經過處理而得到相應本體;二是明確性,概念及概念之間的關系是明確定義的;三是形式性,采用形式化語義并可被計算機識別;四是共享性,所構建的本體是領域內專家、相關研究人員的共識,支持共享使用。
作為知識共享的基礎,本體需要經過精心的設計,其建模具有結構上和邏輯上的復雜性,需要規(guī)范的本體建模方法指導本體整體開發(fā),形成便于交流的、無歧義的本體。盡管本體建模方法一直受到研究人員的關注,但是在過去十年沒有特別大的改進。
Sure-Vetter等人提出一種被廣泛采用的本體構建方法,包括可行性分析、啟動、細化、評估、應用與改進等五個階段,能夠支持開發(fā)和維護基于本體的知識管理系統(tǒng)。NeOn項目關注本體和非本體資源的重用、合并、重建以及團隊協(xié)作,通過九個場景的綜合方法來建立網絡化本體。Abdelghany等人基于敏捷原則與實踐提出本體開發(fā)的敏捷方法,使得本體開發(fā)活動可以契合到Scrum敏捷方法的階段中。
盡管采用全人工方式構建的本體具有較高的質量,但是需要較大的人力成本和較長的構建周期。因此,以深度學習為核心的(半)自動化本體構建(也稱為本體學習)越來越受到工業(yè)界與學術界的重視。Gillani Andleeb認為本體學習是一個新本體或復用本體的自動化或半自動化構建過程,并且利用最少的人力。在本體學習中,存在六個層次:術語、同義詞、概念、概念層次、關系和規(guī)則。Al-Aswadi等人將本體學習方法分為兩大類:一是基于語言學的方法,包括模式抽取、詞性標注與句子解析、句法結構分析與依賴結構分析;二是深度學習方法,包括基于統(tǒng)計的方法和基于邏輯的方法。然而,(半)自動化本體構建更適用于知識復雜度較低的領域。由于作戰(zhàn)仿真領域知識的復雜特性,更多需要人工方式。
本體描述語言提供形式化顯示描述本體建模原語,提供高效率推理機制,可作為本體從自然語言到形式邏輯轉換的工具。目前,使用較為廣泛的描述語言是網絡本體語言(Web Ontology Language,OWL),以描述邏輯(Description Logic,DL)為基礎,采用資源描述框架(Resources Description Framework,RDF)和擴展標記語言(Extensible Markup Language,XML)作為語法規(guī)則。借鑒Perez等人的本體分類法,OWL的基本構造塊包括類、屬性、個體、公理,由于采用描述邏輯作為邏輯基礎,具備嚴格的語法、形式的語義和良好的可計算性。但是,OWL難以表達基于事實的推理關系。為此,語義網規(guī)則語言(Semantic Web Rule Language,SWRL)作為彌補這一方面的不足被提出,充分結合本體描述語言和規(guī)則標記語言各自的優(yōu)勢,可作為OWL的規(guī)則方面的補充。
本體在生物醫(yī)藥、金融、工程、法律、文化遺產等不同領域有著重要應用。下面重點介紹下本體在軍事領域上的應用。
Darr等人構建了作戰(zhàn)方案(Course of Action, COA)計劃本體,用于提供擴展框架建模與軍種條例一致的COA計劃。該本體包括一個核心本體,定義共性的COA計劃概念(活動、階段、結果、性能度量和效能度量等),以及多個領域相關本體,支持表示特別類型計劃(如維穩(wěn)計劃、反暴動計劃、信息作戰(zhàn)計劃等)。Nguyen等人為軍事消息系統(tǒng)開發(fā)了本體集合,用于標注和訂閱消息,提供靈活的定位與查詢功能,解耦信息發(fā)送方與接收方。李亢等人提出了一種半自動化的裝備領域本體的構建方法,通過人工方式構建頂層領域本體和基于自動化方式構建一般領域本體。朱杰和張宏軍針對仿真想定知識描述缺少統(tǒng)一規(guī)范,建立空間知識領域本體及其格式化描述規(guī)范,以及通過該模型在合同戰(zhàn)斗仿真平臺的應用驗證構建本體的有效性。
同時,目前知識圖譜技術與軍事領域相結合的研究工作大多將本體構建作為初始步驟,為后續(xù)知識圖譜的構建工作提供概念或知識體系。例如,吳云超等人在構建面向仿真推演的領域知識圖譜的過程中,基于軍事專家經驗建立相應領域知識模型,主要包括作戰(zhàn)規(guī)則、歷史知識、目標部署、裝備性能、作戰(zhàn)條令、作戰(zhàn)環(huán)境和多分辨率模型等方面的概念、實體、屬性和關系。
總之,目前對于作戰(zhàn)仿真本體構建的整體性、指導性研究尚不充分。
構建專有的作戰(zhàn)仿真本體能夠充分利用本體的顯式化、規(guī)范化和形式化等優(yōu)點。以面向聯(lián)合作戰(zhàn)的作戰(zhàn)仿真為例,可能涉及陸、海、空、天、電、網等諸多軍種,飛機、雷達、衛(wèi)星、艦艇、導彈等諸多裝備模型,分布式作戰(zhàn)、多域戰(zhàn)、馬賽克等諸多作戰(zhàn)概念,陸上、海上、空中、網絡進攻與防御等諸多作戰(zhàn)樣式。因此,這些不同維度、不同層面、不同角度的作戰(zhàn)仿真知識如果能夠按照結構化、形式化、關聯(lián)化方式進行語義表示,能夠為作戰(zhàn)仿真相關人員提供顯式的、一致的、關聯(lián)的、易用的作戰(zhàn)仿真知識,從而提高作戰(zhàn)仿真的整體效率和綜合效能。下面從不同角度來闡述作戰(zhàn)仿真本體的必要性。
作戰(zhàn)仿真具有極強的專業(yè)性與特殊性,不同的作戰(zhàn)仿真實驗通常面向特定問題,依賴于不同的理解與描述,從而具有不同的知識框架。基于本體的作戰(zhàn)仿真知識模型具有清晰的知識結構框架和規(guī)范化描述,可用于形成知識的縱向層級和橫向聯(lián)系,有助于作戰(zhàn)仿真知識的顯示描述,從而支撐相關知識的有效使用和深入挖掘。
在作戰(zhàn)仿真的應用開發(fā)、活動開展、結果分析等過程中,其知識多存在于相關人員的經驗中,或隱含在程序、模型和流程中,難以理解、驗證、維護。基于本體的作戰(zhàn)仿真知識模型將知識和經驗轉化為統(tǒng)一的形式化定義,確保作戰(zhàn)仿真全流程的知識傳遞、精確性的共享理解,實現(xiàn)人與機器、機器與機器、人與人之間的共識。
作為知識生成的活動,作戰(zhàn)仿真是知識密集型任務,包括作戰(zhàn)仿真應用的構建、模型的開發(fā)、活動的實施,目前這些任務仍缺少頂層知識牽引?;诒倔w的作戰(zhàn)仿真知識模型將提供統(tǒng)一的知識體系、描述與約束,可作為諸多下游應用開發(fā)的一致性知識規(guī)范,易于不同應用之間、不同模型之間的信息交互。
隨著人工智能技術的發(fā)展,在仿真模型的開發(fā)、仿真系統(tǒng)的研制、仿真實驗的設計、仿真活動的開展等方面越來越具有智能化特征?;诒倔w的作戰(zhàn)仿真知識模型形成了作戰(zhàn)仿真領域知識的形式化表示基礎,使得充分利用本體的語義表達、邏輯推理等能力成為可能。進一步結合自然語言處理技術,將極大優(yōu)化作戰(zhàn)仿真資源的構建、查詢與使用。
本體構建是針對某一領域、某一目的建立可計算的語義模型的知識加工任務,其構建活動立足于某一領域,面向特定需求,解決特定問題。因此,作戰(zhàn)仿真本體的構建具有自身特點。
Gruber提出了具有較大影響力的構建原則,主要包括:1) 清晰性原則,概念的表達應該清晰、完整、客觀、明確、無歧義;2) 一致性原則,概念術語與本體推理保持一致,不應推理出不一致的事實或概念;3) 最大單調可擴展性原則,新增本體中的術語,不會修改本體原有內容;4) 最小編碼偏好原則,可以采用合適的本體知識表示方法,但相關概念描述不要依賴具體的表示方式;5) 最小本體約定原則,本體約定只要能夠滿足特定需求即可。
結合作戰(zhàn)仿真知識特點,我們對以上的五項原則進行擴展:
1) 模塊化原則。作戰(zhàn)仿真是對作戰(zhàn)問題、作戰(zhàn)活動、武器裝備等多個層面的抽象或模擬,涉及多領域、多樣化知識,需要建立合適的本體模塊,提高本體模塊的內聚度,減少本體模塊之間的耦合度,并且不同的本體模塊應由不同領域專家構建從而提高精確度和可用性。
2) 簡單性原則。保持作戰(zhàn)仿真本體中概念及其關系的簡單性和有效性。概念及其關系越復雜,構建過程越容易出錯,后續(xù)應用也將需要更多資源。
3) 形式化原則。采用語法結構良好的形式化知識表示語言,支持語法與語義檢查。
4) 可擴展原則。為適應認識的深入、技術的發(fā)展而導致的知識更新與演化,作戰(zhàn)仿真本體應該易于擴展,高效集成新的知識。
5) 可重用原則。作戰(zhàn)仿真本體應該作為公共知識資源,易于理解,可被相關人員和系統(tǒng)所重用,避免重復“造輪子”。
作戰(zhàn)仿真通過運行環(huán)境、仿真模型、仿真數據等作戰(zhàn)仿真資源的聚合以及仿真活動的實施來模擬作戰(zhàn)任務、作戰(zhàn)活動、作戰(zhàn)行動、作戰(zhàn)效果等不同的方面。開展具體的作戰(zhàn)仿真需要面向特定目的或需求設計與開發(fā)相應的仿真資源、組織與實施適合的作戰(zhàn)仿真活動。本文結合本體工程和人工智能技術設計作戰(zhàn)仿真本體構建流程。如圖1所示,構建流程主要包括作戰(zhàn)仿真本體需求分析、作戰(zhàn)仿真本體設計開發(fā)和作戰(zhàn)仿真本體評估驗證三個階段。
圖1 作戰(zhàn)仿真本體迭代構建流程
首先,第一階段將生成作戰(zhàn)仿真本體需求分析文檔,作為后續(xù)兩個階段的指導性、規(guī)范性資料,根據作戰(zhàn)仿真本體的設計、開發(fā)、評估和驗證等過程中遇到的問題與新的思考優(yōu)化需求。其次,第二階段將開展具體的作戰(zhàn)仿真本體設計開發(fā),生成(初步的)作戰(zhàn)仿真本體,這一階段可以利用以自然語言處理、信息抽取等為代表的人工智能技術來實現(xiàn)自動化或半自動化構建。然后,第三階段將結合需求分析文檔對前一階段生成的作戰(zhàn)仿真本體進行評估驗證,生成相應的報告,同時當確認本體能夠滿足整體需求后進行發(fā)布。最后,盡管圖中未明確表示,作戰(zhàn)仿真本體構建循環(huán)將根據其使用效果來迭代,實現(xiàn)面向具體應用的適應優(yōu)化。
如圖2所示,該階段對作戰(zhàn)仿真本體進行需求分析,主要包括五個步驟:確定本體目標、確定本體使用、確定必要信息、確定使用人員和確定能力問題,生成需求分析文檔以此來牽引指導本體設計開發(fā)。
圖2 作戰(zhàn)仿真本體需求分析流程
1)確定本體目標
該步驟將明確作戰(zhàn)仿真本體的預期目標,要達成什么樣的效果,并以自然語言、形式化語言等方式明確、無歧義地進行精煉表達。作戰(zhàn)仿真本體是將本體引入作戰(zhàn)仿真的結果,是對作戰(zhàn)仿真知識的本體化,重點是解決作戰(zhàn)仿真知識能夠被各領域、各層次、各專業(yè)的利益相關者所理解,提升作戰(zhàn)仿真知識的復用重用水平。作戰(zhàn)仿真本體的核心目標是提供一種形式化、語義級方法使得作戰(zhàn)仿真知識對于人和機器都是可讀的、可理解的,支持領域知識的體系化、結構化、關聯(lián)化。
2)確定本體使用
該步驟將明確作戰(zhàn)仿真本體的使用目的與范圍,使用本體完成哪些具體任務,以及可能的使用方式。作戰(zhàn)仿真本體的使用主要包括六個層面:一是對各類作戰(zhàn)仿真知識進行結構的、層次的、規(guī)范的、關聯(lián)的概念化描述,實現(xiàn)作戰(zhàn)仿真知識的規(guī)范管理;二是以人和機器都可理解的方式集成與發(fā)布作戰(zhàn)仿真知識,滿足人與人之間、不同仿真應用之間、人與仿真應用之間的作戰(zhàn)仿真知識共享需求;三是采用機器可理解的關聯(lián)方式對作戰(zhàn)仿真知識進行形式化建模,使作戰(zhàn)仿真知識能深入挖掘,輔助作戰(zhàn)仿真各個階段的開展與實施;四是用于不同仿真應用之間自主互操作,適合于人與人之間關于作戰(zhàn)仿真的共性理解,作為人與人、人與仿真應用之間交流的語義基礎;五是適用于關于特定作戰(zhàn)仿真知識的形式化推理;六是支持以自動或半自動方式創(chuàng)建與處理作戰(zhàn)仿真任務。
3)確定必要信息
該步驟將明確作戰(zhàn)仿真本體必須具備哪些信息,以及這些信息的表現(xiàn)形式。為充分實現(xiàn)作戰(zhàn)仿真知識的共性理解與重用復用,按照不同維度闡述必要信息:一是仿真對象方面,需要包括作戰(zhàn)概念、作戰(zhàn)體系、作戰(zhàn)樣式、戰(zhàn)術戰(zhàn)法、作戰(zhàn)行動、武器裝備等多類對象相關知識;二是仿真層次方面,需要包括工程層、交戰(zhàn)層、任務層、戰(zhàn)役層、戰(zhàn)略層等多個層次相關知識;三是仿真應用方面,需要包括人在回路、人不在回路、實物/半實物、并行或分布式、仿真推演等多種仿真應用相關知識;四是仿真資源方面,需要包括運行環(huán)境、仿真模型、仿真數據等多類資源相關知識。
4)確定使用人員
該步驟將明確作戰(zhàn)仿真本體涉及的相關使用人員,及其在本體的構建、使用、優(yōu)化等方面的作用。作戰(zhàn)仿真是通過作戰(zhàn)仿真應用及其運行的作戰(zhàn)仿真模型與數據來開展和實施。這導致作戰(zhàn)仿真本體涉及軍事需求人員、仿真想定設計者、仿真應用設計者和仿真模型設計者等諸多利益相關者。因而,作戰(zhàn)仿真本體的設計與開發(fā)需要充分考慮不同人員的能力特性,使得構建的作戰(zhàn)仿真本體能夠符合使用需求。
5)確定能力問題
該步驟將根據形成的本體目標、本體使用、必要信息和使用人員等描述,以問句方式提出關鍵的能力問題并給出回答示例,作為本體設計開發(fā)、評估驗證的問題牽引。利用作戰(zhàn)仿真本體,能夠回答諸如“What、Who、When、Where、Why、How、How much(5W2H)”等形式的問題。
如圖3所示,在需求分析的基礎上,該階段對作戰(zhàn)仿真本體進行設計開發(fā),主要包括三個步驟:定義知識體系、獲取相關知識和形成本體描述,并生成待評估驗證的作戰(zhàn)仿真本體。
圖3 作戰(zhàn)仿真本體設計開發(fā)流程
1)定義知識體系
該步驟將對作戰(zhàn)仿真所涉及的概念及其關系進行定義,提取概念、元素等關鍵詞匯,利用結構框架等理論,對知識體系進行結構化描述,并采用自然語言初步描述本體相關的概念和屬性,為構建本體、形式化描述知識模型提供堅實的基礎。
2)獲取相關知識
該步驟將基于作戰(zhàn)仿真知識體系,采用以機器為主、人工為輔的方式獲取相關知識。知識來源主要表現(xiàn)為三種形式:結構化數據、半結構化數據和非結構化數據。關于結構化數據和半結構化數據只需要定義好具體轉換或映射規(guī)則就可以實現(xiàn)相關知識的獲取。而對于非結構化數據的知識提取,可以采用基于人工智能的信息抽取技術。實際上,通用領域的信息抽取技術已經比較成熟,但是面向作戰(zhàn)仿真領域會遇到諸如數據樣本量少、分布不均勻、標準不統(tǒng)一等問題。當前,基于BERT的領域適配和任務適配在解決以上問題具有較好的應用效果。BERT作為一種代表性預訓練語言模型,能夠通過自監(jiān)督學習將大量非標注的文本充分利用,并對其中的語言知識編碼,實現(xiàn)從海量數據中有效、高效地獲得作戰(zhàn)仿真知識。BERT的應用主要包括兩個階段:第一階段利用通用語言模型任務,采用自監(jiān)督學習方法,選擇特征抽取其來學習訓練模型;第二階段針對具體的監(jiān)督學習任務,采取特征集成或者微調(Fine-tuning)創(chuàng)建適合不同問題的模型。
3)形成本體描述
該步驟將對已收集到的相關知識進行整理,最終按照一定的概念模型,利用建模工具對知識進行形式化顯式表示。完成這一階段將會形成初始的、待評估驗證的作戰(zhàn)仿真本體。
如圖4所示,該階段對生成的作戰(zhàn)仿真本體進行整體能力的評估驗證,檢驗構建的本體是否滿足需求,主要包括兩個步驟:定義指標體系和評估驗證本體。
圖4 作戰(zhàn)仿真本體評估驗證流程
1)定義指標體系
該步驟將建立具體明確的指標體系,用于定性或定量評估本體實現(xiàn)與本體目標的符合程度。指標體系建立的主要依據有:本體構建的基本原則、本體需求分析文檔,以及專家經驗。根據作戰(zhàn)仿真知識特點,評價指標可能包括本體的完整性、正確性、清晰性、可理解性、使用性、一致性、有效性等多個方面。為形成整體評價,可以采用德爾菲專家調研法,對指標集進行多輪篩選,經過專家篩選與分析建立層次化指標體系,并根據不同指標對綜合效能影響程度確定具體的指標權重。
2)評估驗證本體
該步驟對作戰(zhàn)仿真本體進行綜合評價驗證,判斷是否達到相關要求。主要包括兩個方面:一是指標評估,依據構建的指標體系,在語法、語義、內容等多個層面進行綜合評估;二是能力評估,構建測試用例檢驗本體是否能夠回答具體的能力問題。如果符合要求,就將該本體提交給使用者;否則,需要重新優(yōu)化。
作戰(zhàn)仿真本體參考示例主要包括仿真對象、仿真想定、仿真應用、仿真模型、仿真數據5大類,其構成與關系如圖5所示。
圖5 作戰(zhàn)仿真本體參考示例
1)仿真對象
仿真對象主要包括能夠模擬或仿真的武器裝備、戰(zhàn)場環(huán)境、人工設施、指揮控制等作戰(zhàn)相關要素,用于表示作戰(zhàn)空間內的可實體化的實驗對象。仿真對象具有對象名稱、對象描述等屬性,明確仿真應用、仿真模型所仿真或模擬的范疇界限,以及提供特定的仿真數據。
2)仿真想定
仿真想定是在軍事想定的基礎上,結合具體的實驗設計、仿真環(huán)境和實驗目的,開發(fā)出來的腳本,提供作戰(zhàn)仿真所需要的數據參數和行動序列。仿真想定具有想定名稱、想定目的、仿真層級、起止時間、兵力部署等屬性,具有仿真執(zhí)行所需要的想定數據。
3)仿真應用
仿真應用指支撐作戰(zhàn)仿真的軟件類系統(tǒng),具有仿真某些特定作戰(zhàn)對象的能力。仿真應用具有應用名稱、應用描述、應用性質、使用范圍、典型案例等屬性值,其核心構成包含仿真模型與仿真數據,支撐著仿真想定的實施執(zhí)行。
4)仿真模型
仿真模型是對作戰(zhàn)靜態(tài)屬性與動態(tài)過程的抽象和描述,能夠反映軍事系統(tǒng)或現(xiàn)象的基本特征,支持以定量分析的方法研究軍事活動中的規(guī)律。仿真模型具有基本信息、配置信息、交互信息、關聯(lián)信息、適用信息等屬性,按照模擬的仿真對象可分為武器裝備、戰(zhàn)場環(huán)境、人工設施、指揮控制等模型種類。
5)仿真數據
仿真數據主要包括仿真基礎數據、仿真初始數據、仿真運行數據、仿真結果數據、仿真分析數據等。其中,仿真基礎數據是支撐仿真應用、仿真模型運行的最基礎數據,如地理信息、作戰(zhàn)規(guī)則等;仿真初始數據是開展仿真活動的相關數據,如作戰(zhàn)背景、兵力部署、作戰(zhàn)方案等;仿真運行數據是作戰(zhàn)仿真過程中模型動態(tài)生成的中間數據;仿真結果數據是仿真結束后形成的態(tài)勢、戰(zhàn)果、戰(zhàn)損等數據;仿真分析數據是對作戰(zhàn)仿真評估分析后形成的數據。
作戰(zhàn)仿真具有多領域、多需求、多層級、多樣式等特征,缺少對作戰(zhàn)仿真的共性理解,將遲滯仿真應用的開發(fā)、仿真實驗的開展、仿真成果的利用,難以有效支撐基于仿真的武器裝備、作戰(zhàn)體系、戰(zhàn)術戰(zhàn)法等方面的驗證與優(yōu)化。因此,本文結合本體技術和作戰(zhàn)仿真知識特點,研究分析了作戰(zhàn)仿真本體的必要性,提出了具體的構建原則和構建流程,為作戰(zhàn)仿真知識的本體化提供了可行途徑。
下一步工作將構建一個具體的作戰(zhàn)仿真本體,用于支撐兩方面應用:一是支持作戰(zhàn)仿真知識的規(guī)范管理、共性理解、關聯(lián)顯示、深入挖掘,為從事作戰(zhàn)仿真的相關人員與系統(tǒng)提供可理解、可計算的知識模型;二是支持重用復用仿真資源、快速構建仿真應用、高效生成仿真想定等仿真活動,滿足作戰(zhàn)仿真的多樣性、敏捷性、適應性等要求。