常曉飛,蔣鄧懷,姬曉闖,符文星
(1.西北工業(yè)大學(xué)無(wú)人系統(tǒng)技術(shù)研究院,西安 710072;2.西北工業(yè)大學(xué)航天學(xué)院,西安 710072)
無(wú)人系統(tǒng)由單個(gè)無(wú)人平臺(tái)或多個(gè)無(wú)人平臺(tái)構(gòu)成,具備機(jī)械化、信息化和智能化等特征,能夠自主或通過(guò)遠(yuǎn)程操控完成指定任務(wù)。典型對(duì)象包括無(wú)人飛行器、無(wú)人車(chē)輛、無(wú)人艦船、無(wú)人潛航器等[1]。隨著信息技術(shù)、控制技術(shù)、人工智能技術(shù)的快速發(fā)展,無(wú)人系統(tǒng)在控制方式上朝著智能自主化方向發(fā)展;在作戰(zhàn)規(guī)模上朝著集群化方向發(fā)展;在應(yīng)用范圍上向陸地、海洋、太空多域進(jìn)行拓展[2]。目前,無(wú)人系統(tǒng)已經(jīng)逐步擴(kuò)展到工業(yè)生產(chǎn)、社會(huì)治理、戰(zhàn)場(chǎng)空間等領(lǐng)域,極大地改變了軍事作戰(zhàn)樣式與社會(huì)生產(chǎn)生活方式[3]。
仿真技術(shù)作為系統(tǒng)研制的重要手段,能夠在可控的實(shí)驗(yàn)環(huán)境下開(kāi)展可重復(fù)的試驗(yàn)驗(yàn)證,驗(yàn)證系統(tǒng)關(guān)鍵技術(shù)、考核關(guān)鍵技術(shù)指標(biāo)、評(píng)估系統(tǒng)作戰(zhàn)能力[4]。因此,仿真與評(píng)估在無(wú)人系統(tǒng)的研制中依然發(fā)揮著重要作用,在美軍在最新的《無(wú)人系統(tǒng)綜合路線圖(2017—2042)》中,將“用于自主系統(tǒng)的測(cè)試、評(píng)估、校核和驗(yàn)證(TEVV)新方法”作為未來(lái)的發(fā)展方向之一,將“自主性建模和仿真”作為涉及的關(guān)鍵技術(shù)之一[5]。但隨著無(wú)人作戰(zhàn)系統(tǒng)朝著集群化和智能化方向發(fā)展,參戰(zhàn)規(guī)模愈加龐大、任務(wù)平臺(tái)愈加智能、戰(zhàn)場(chǎng)環(huán)境愈加復(fù)雜、戰(zhàn)場(chǎng)任務(wù)愈加多變、研制進(jìn)度愈加緊湊,使得傳統(tǒng)的試驗(yàn)方法和試驗(yàn)手段難以滿足復(fù)雜條件下智能無(wú)人集群作戰(zhàn)的仿真驗(yàn)證評(píng)估需求。
無(wú)人系統(tǒng)作戰(zhàn)是目前各個(gè)國(guó)家所推崇的作戰(zhàn)思想與方式。區(qū)別于傳統(tǒng)作戰(zhàn)模式,一方面,無(wú)人作戰(zhàn)系統(tǒng)表現(xiàn)為集群化,通過(guò)將傳統(tǒng)單個(gè)完備作戰(zhàn)平臺(tái)所具備的各項(xiàng)功能,如偵察監(jiān)視、電子干擾、打擊與評(píng)估等能力分散到大量低成本、功能單一的作戰(zhàn)平臺(tái)中,通過(guò)大量異構(gòu)跨域的個(gè)體來(lái)實(shí)現(xiàn)原本復(fù)雜的系統(tǒng)功能,甚至具備遠(yuǎn)超單一平臺(tái)的作戰(zhàn)能力。另一方面,無(wú)人作戰(zhàn)系統(tǒng)表現(xiàn)為智能化,無(wú)須借助作戰(zhàn)人員的指令導(dǎo)引,以高度智能為前提,實(shí)現(xiàn)人機(jī)協(xié)同、智能集群的作戰(zhàn)方式,自主完成對(duì)戰(zhàn)場(chǎng)復(fù)雜態(tài)勢(shì)的統(tǒng)一認(rèn)知、作戰(zhàn)決策的分析計(jì)算以及作戰(zhàn)任務(wù)的協(xié)調(diào)分配。
無(wú)人系統(tǒng)集群化和智能化的發(fā)展趨勢(shì)對(duì)仿真評(píng)估技術(shù)提出了新的挑戰(zhàn)。一方面,與傳統(tǒng)作戰(zhàn)系統(tǒng)相比,無(wú)人集群系統(tǒng)的仿真節(jié)點(diǎn)逐漸增多,各仿真對(duì)象之間呈現(xiàn)異構(gòu)性,這就給系統(tǒng)建模方法與模型間的接口問(wèn)題提出了新的挑戰(zhàn),且仿真人員需要對(duì)集群系統(tǒng)內(nèi)部的網(wǎng)絡(luò)管理進(jìn)行建模仿真。另一方面,在智能自主系統(tǒng)的仿真中,由于復(fù)雜作戰(zhàn)環(huán)境下的對(duì)抗數(shù)據(jù)稀缺問(wèn)題,對(duì)智能算法的數(shù)據(jù)提取方法提出了新的要求,作戰(zhàn)平臺(tái)的智能化對(duì)于仿真模型的建立、系統(tǒng)仿真的條件與試驗(yàn)環(huán)境也提出了全新的要求。
無(wú)人集群最初是由無(wú)人機(jī)發(fā)展來(lái)的,在智能技術(shù)以及自組網(wǎng)技術(shù)的飛速發(fā)展后,美國(guó) DOD等將“無(wú)人機(jī)集群”擴(kuò)展為“無(wú)人集群”,使得該概念能夠涵蓋海、陸、空、天等各個(gè)領(lǐng)域[6],并逐步向跨域的混合集群方向發(fā)展。
由于無(wú)人集群系統(tǒng)通常是由異構(gòu)跨域平臺(tái)組成的集群網(wǎng)絡(luò),其仿真時(shí)面臨集群系統(tǒng)的建模、異構(gòu)仿真系統(tǒng)接入、復(fù)雜仿真網(wǎng)絡(luò)管理等諸多問(wèn)題。
3.2.1 集群系統(tǒng)的建模
無(wú)人集群系統(tǒng)作為一種由大量實(shí)體組成的分布式網(wǎng)絡(luò)系統(tǒng),其仿真模型不僅包含了描述無(wú)人平臺(tái)單體行為的運(yùn)動(dòng)模型、傳感器模型、制導(dǎo)控制模型等,同時(shí)還包含了大量描述集群群體行為的網(wǎng)絡(luò)模型、通信模型、避撞規(guī)則模型[6]。
集群行為的最初建模工作是由生物學(xué)家完成的。生物數(shù)學(xué)家 Parr 于1927年在解釋魚(yú)群的內(nèi)聚性現(xiàn)象時(shí)最先提出了群體中個(gè)體間的相互作用由引力、斥力引起的建模思想。
目前,隨著建模仿真技術(shù)的不斷發(fā)展,集群系統(tǒng)的建模已經(jīng)逐漸成熟,出現(xiàn)了較多的建模方法,主要有動(dòng)力學(xué)建模、蟻群優(yōu)化算法、蜂群算法與狼群算法等智能算法。動(dòng)力學(xué)建模屬于自上而下的方法,通過(guò)分析系統(tǒng)架構(gòu)建立微分方程,進(jìn)而模擬、解釋和預(yù)測(cè)系統(tǒng)在不同情況的變化行為與趨勢(shì)。目前,主要有拉格朗日法、歐拉法、仿真法與基于 A/R 作用的集群行為建模方法。近年來(lái),主要使用的 SWARM 平臺(tái)[7]就是基于仿真法的思想,建立一系列獨(dú)立個(gè)體,通過(guò)獨(dú)立個(gè)體之間進(jìn)行交互,考察和研究系統(tǒng)的行為和演化規(guī)律。
蟻群優(yōu)化算法(Ant Colony Optimization, ACO)是由Dorigo 等在20 世紀(jì)90年代提出來(lái)的[8]。目前,基于ACO 而建立的一系列模型主要都是采用信息激素變化實(shí)現(xiàn)問(wèn)題空間的演化求解問(wèn)題的。Wan 等[9]針對(duì)基本蟻群算法在機(jī)器人路徑規(guī)劃中存在的搜索低、時(shí)間長(zhǎng)等問(wèn)題,對(duì)其進(jìn)行改進(jìn),實(shí)現(xiàn)了更高效率的機(jī)器人最優(yōu)路徑搜索。吳鵬等[10]針對(duì)傳統(tǒng)的無(wú)人艇路徑規(guī)劃算法存在的問(wèn)題,提出一種結(jié)合了勢(shì)場(chǎng)蟻群算法與人工勢(shì)場(chǎng)法的組合策略。
狼群算法最早由Yang[11]提出,算法基于狼群群體智能、模擬狼群捕食行為及其獵物分配方式,抽象出游走、召喚、圍攻3 種智能行為以及“勝者為王”的頭狼產(chǎn)生規(guī)則和“強(qiáng)者生存”的狼群更新機(jī)制。吳虎勝等[12]基于狼群游走、召喚、圍攻3 種行為提出了狼群算法(Wolf Pack Algorithm,WPA),頭狼通過(guò)勝者為王機(jī)制產(chǎn)生,種族更新通過(guò)優(yōu)勝劣汰實(shí)現(xiàn),并用馬爾科夫鏈理論驗(yàn)證了其收斂性良好。Chen 等[13]利用改進(jìn)的狼群算法,計(jì)算了旋翼無(wú)人機(jī)在真假三維空間內(nèi)部的復(fù)雜三維空間中的準(zhǔn)最優(yōu)軌跡。
蜂群算法由Karaboga[14]于2005年提出,基本思想是啟發(fā)于蜂群通過(guò)個(gè)體分工和信息交流,相互協(xié)作完成采蜜任務(wù)。趙曉林等[15]為提高多無(wú)人機(jī)動(dòng)態(tài)偵察分配效率與實(shí)時(shí)動(dòng)態(tài)偵察的要求,利用改進(jìn)的人工蜂群算法對(duì)其建立的動(dòng)態(tài)偵察資源模型求解。王海泉等[16]針對(duì)避障環(huán)境下的機(jī)器人的最優(yōu)路徑規(guī)劃問(wèn)題,提出一種基于改進(jìn)蜂群算法的3 次Bezier 曲線優(yōu)化的路徑規(guī)劃方法。
目前,各國(guó)對(duì)于集群系統(tǒng)的建模方法已經(jīng)逐漸成熟且趨向于智能化,出現(xiàn)較多以個(gè)體研究為基礎(chǔ),之后再擴(kuò)展到個(gè)體間的智能算法。近年來(lái),群集智能的出現(xiàn)極大地促進(jìn)了集群系統(tǒng)的建模仿真,但仍未進(jìn)入成熟的階段。由于其數(shù)學(xué)基礎(chǔ)理論薄弱,且實(shí)際應(yīng)用于無(wú)人作戰(zhàn)系統(tǒng)的算法類(lèi)型不多,現(xiàn)在仍有許多問(wèn)題需要進(jìn)一步分析與討論。
3.2.2 異構(gòu)系統(tǒng)的模型接口
隨著現(xiàn)代戰(zhàn)爭(zhēng)從集中式向分布式發(fā)展,傳統(tǒng)的單一全功能平臺(tái)將逐漸被多個(gè)單功能平臺(tái)所取代,使得無(wú)人集群中的平臺(tái)對(duì)象功能、研制廠家、模型接口均存在較大差異。因此,異構(gòu)模型接口的標(biāo)準(zhǔn)化問(wèn)題已經(jīng)成為困擾集群異構(gòu)仿真的重要問(wèn)題。經(jīng)過(guò)多年的發(fā)展,異構(gòu)模型接口的標(biāo)準(zhǔn)化問(wèn)題已經(jīng)有了基于高層體系結(jié)構(gòu)(High Level Architecture, HLA)、統(tǒng)一建模語(yǔ)言與標(biāo)準(zhǔn)接口(Functional Mockup Interface,F(xiàn)MI)的3 種解決模式。
HLA 的多領(lǐng)域建模仿真方法通過(guò)運(yùn)行支撐軟件(Run Time Infrastructure, RTI)提供通用的、相對(duì)獨(dú)立的支撐服務(wù)程序,將仿真應(yīng)用同底層的支撐環(huán)境分開(kāi),從而使各部分可以相對(duì)獨(dú)立地進(jìn)行開(kāi)發(fā)。它克服了基于接口的方法開(kāi)放性差、無(wú)統(tǒng)一標(biāo)準(zhǔn)、難以擴(kuò)充等缺點(diǎn)[17]。目前,基于HLA的建模仿真方法可以從對(duì)非 HLA 仿真系統(tǒng)的HLA 兼容性改造、中間件技術(shù)和擴(kuò)展聯(lián)邦成員架構(gòu)3 方面入手。盛德號(hào)等[18]對(duì)非HLA 系統(tǒng)的兼容性改造進(jìn)行了研究,提出了開(kāi)發(fā)仿真對(duì)象模型(Simulation Object Model, SOM)、開(kāi)發(fā)HLA 軟件接口和使聯(lián)邦成員獨(dú)立于聯(lián)邦成員對(duì)象模型(Federate Object Model,F(xiàn)OM)等方法。中間件技術(shù)通過(guò)通用的仿真系統(tǒng)框架中間件屏蔽了仿真應(yīng)用層與仿真平臺(tái)的實(shí)現(xiàn)細(xì)節(jié),使仿真應(yīng)用層的仿真模型組件能夠在異構(gòu)的仿真平臺(tái)上運(yùn)行,提高了仿真系統(tǒng)的重用性和互操作性。例如SIMplicity、SimBulider、KD-SmartSim 等[19]。龔建興等[20]提出可擴(kuò)展聯(lián)邦成員運(yùn)行框架是可擴(kuò)展聯(lián)邦成員架構(gòu)的核心部件,且通過(guò)實(shí)例構(gòu)建可擴(kuò)展的聯(lián)邦成員架構(gòu),從而使聯(lián)邦成員能夠適應(yīng)不同的聯(lián)邦。
基于統(tǒng)一建模語(yǔ)言的多領(lǐng)域建模方法具有與領(lǐng)域無(wú)關(guān)的通用模型描述能力,對(duì)于任何確定了的領(lǐng)域,由于采用相同的模型描述形式,都可以實(shí)現(xiàn)統(tǒng)一的建模。Modelica 作為一種統(tǒng)一建模語(yǔ)言,目前得到廣泛使用,其采用數(shù)學(xué)方程描述不同領(lǐng)域的物理規(guī)律,可以為任何能夠用微分方程或代數(shù)方程描述的問(wèn)題進(jìn)行建模和仿真[21]。目前,較為成熟的是基于Modelica 語(yǔ)言的仿真工具Dymola 和MathModelica。張慧靜[22]利用Dymola軟件建立了包含電源、動(dòng)力學(xué)和控制等分系統(tǒng)的衛(wèi)星系統(tǒng)多領(lǐng)域仿真模型。華中科技大學(xué)[23]基于Modelica 語(yǔ)言建立了MWorks 平臺(tái),并由實(shí)現(xiàn)了在MWorks 上與外部工具,如MATLAB/Simulink模型進(jìn)行集成。
Daimler AG 公司為解決異構(gòu)模型標(biāo)準(zhǔn)化問(wèn)題提出了FMI 標(biāo)準(zhǔn)[24],該標(biāo)準(zhǔn)可以在不同建模仿真軟件中設(shè)計(jì)出具有統(tǒng)一的模型格式和數(shù)據(jù)存儲(chǔ)方式的模型,且一個(gè)建模仿真軟件設(shè)計(jì)出的模型可以在其他建模仿真軟件上使用而不需要進(jìn)行任何的更改。陸冠華等[25]針對(duì)飛行器設(shè)計(jì)領(lǐng)域的異構(gòu)模型問(wèn)題,提出采用FMI 構(gòu)建多源異構(gòu)模型的通用通信接口,從功能模型單元(Functional Mockup Unit,F(xiàn)MU)模型封裝與聯(lián)合仿真兩方面,給出了一種一體化仿真平臺(tái)解決方案。徐東[26]針對(duì)應(yīng)用傳統(tǒng)分析方法對(duì)于異構(gòu)模型仿真出現(xiàn)的分析結(jié)果不準(zhǔn)確問(wèn)題,提出一種基于FMI 協(xié)議的跨領(lǐng)域多學(xué)科仿真系統(tǒng)建模分析方法,此方法相比于傳統(tǒng)方法,可以得到更為準(zhǔn)確的分析結(jié)果。
隨著多域聯(lián)合作戰(zhàn)概念的不斷深入,異構(gòu)模型接口問(wèn)題逐漸成為建模仿真過(guò)程中的一大難題,以上提出的3 種方法由于其具備標(biāo)準(zhǔn)性、開(kāi)放性、可擴(kuò)充性以及支持分布式仿真等特點(diǎn),已經(jīng)在各國(guó)得到了充分的應(yīng)用。
3.2.3 集群體系的仿真管理
隨著仿真節(jié)點(diǎn)的逐漸增多,仿真系統(tǒng)也變得愈加復(fù)雜,這就使得仿真人員在仿真過(guò)程中對(duì)復(fù)雜系統(tǒng)的管理提出了新的要求,本節(jié)從對(duì)復(fù)雜集群仿真系統(tǒng)的時(shí)間管理、任務(wù)調(diào)度以及自組網(wǎng)網(wǎng)絡(luò)仿真3 方面展開(kāi)論述。
對(duì)仿真系統(tǒng)的時(shí)間管理問(wèn)題,在本質(zhì)上就是要始終確保將消息按順序發(fā)送,確保仿真執(zhí)行的正確性與可重復(fù)性[27]。對(duì)于時(shí)間管理機(jī)制,連續(xù)系統(tǒng)最主要采用 HLA 保守時(shí)間管理協(xié)議,離散系統(tǒng)最主要采用的是保守時(shí)間推進(jìn)機(jī)制與樂(lè)觀時(shí)間推進(jìn)機(jī)制[28-29],與在此基礎(chǔ)上發(fā)展的受約束的樂(lè)觀策略、混合策略和自適應(yīng)策略等。這幾種管理策略目前均在特定領(lǐng)域得到較好的實(shí)際應(yīng)用。張翔等[30]針對(duì)含有DIS、TENA、HLA 的兩種及兩種以上的多體系結(jié)構(gòu)仿真系統(tǒng)的結(jié)構(gòu)特點(diǎn),對(duì)實(shí)時(shí)仿真與非實(shí)時(shí)仿真分別設(shè)計(jì)了時(shí)間管理方案。Huang 等[31]提出一種為智能時(shí)間管理的代理接口,可以用來(lái)統(tǒng)一 HLA 規(guī)范中時(shí)間步進(jìn)、事件驅(qū)動(dòng)和樂(lè)觀時(shí)間推進(jìn)的時(shí)間管理服務(wù)。
對(duì)仿真系統(tǒng)的任務(wù)調(diào)度問(wèn)題,實(shí)質(zhì)上就是按照一定的規(guī)律將多個(gè)仿真任務(wù)映射至仿真節(jié)點(diǎn)上,重新排列任務(wù)的執(zhí)行順序,以符合任務(wù)間的相互依賴關(guān)系,并獲得最小調(diào)度長(zhǎng)度[32]。針對(duì)無(wú)人機(jī)分布式仿真系統(tǒng),目前主要采用功能分布式調(diào)度方式。該調(diào)度方式將命令與數(shù)據(jù)調(diào)度分開(kāi),指令采用集中式調(diào)度,數(shù)據(jù)則采用分布式調(diào)度方式。吳文波[33]針對(duì)多核集群實(shí)時(shí)仿真系統(tǒng)的任務(wù)調(diào)度問(wèn)題,在遺傳算法和模擬退火算法的基礎(chǔ)上提出模擬退火算法以解決多核集群系統(tǒng)的網(wǎng)絡(luò)流問(wèn)題。Muthsamy 等[34]為滿足多個(gè)服務(wù)質(zhì)量指標(biāo),提出一種基于蜂群覓食優(yōu)化的任務(wù)調(diào)度方法,可以獲得可用虛擬機(jī)的最有任務(wù)調(diào)度。
對(duì)于自組網(wǎng)網(wǎng)絡(luò)仿真問(wèn)題,就是要保證在無(wú)人集群系統(tǒng)協(xié)同作戰(zhàn)時(shí),多個(gè)個(gè)體之間要時(shí)刻保持互聯(lián)通信。自組網(wǎng)技術(shù)無(wú)須固定基礎(chǔ)設(shè)施,網(wǎng)絡(luò)的運(yùn)行完全由節(jié)點(diǎn)自身實(shí)現(xiàn),能夠滿足無(wú)人集群系統(tǒng)的作戰(zhàn)特點(diǎn)與要求。杜曉博[35]針對(duì)由艦船、飛機(jī)等平臺(tái)在海上形成的大規(guī)模軍用自組織網(wǎng)絡(luò),提出了一種聯(lián)合仿真方法,設(shè)計(jì)了基于連通度的分層分簇路由算法,解決了其路由仿真工作面臨的高計(jì)算復(fù)雜度和時(shí)間復(fù)雜度問(wèn)題,并通過(guò)仿真驗(yàn)證了該方法的可行性。Deng 等[36]針對(duì)傳統(tǒng)自組網(wǎng)路由協(xié)議存在局限性的問(wèn)題,提出一種改進(jìn)的CA-DSR 協(xié)議。該協(xié)議綜合考慮利用編碼機(jī)會(huì)、尋找最短路徑和靈活地避免長(zhǎng)路徑時(shí)延等因素作為路由選擇準(zhǔn)則。
對(duì)于集群體系的仿真管理問(wèn)題是當(dāng)下的一個(gè)研究熱點(diǎn),從本節(jié)可以看出,目前各國(guó)研究學(xué)者對(duì)此已經(jīng)提出一些相對(duì)成熟的理論,但仍有許多亟待解決的問(wèn)題。例如,如何更好地實(shí)現(xiàn)仿真系統(tǒng)負(fù)載均衡與跨平臺(tái)仿真,以及對(duì)于時(shí)間推進(jìn)機(jī)制算法中如何保證系統(tǒng)不會(huì)有過(guò)多的開(kāi)銷(xiāo)與運(yùn)行成本等。開(kāi)展集群體系的仿真問(wèn)題研究對(duì)于提高仿真的實(shí)時(shí)性、可信性、可用性等具有重要意義。
對(duì)無(wú)人系統(tǒng)而言,智能是指具備自動(dòng)地獲取和應(yīng)用知識(shí)的能力、思維與推理的能力、問(wèn)題求解的能力和自動(dòng)學(xué)習(xí)的能力[37]。而根據(jù)美軍2017版《無(wú)人系統(tǒng)路線圖》中提到的內(nèi)容,自主是指一個(gè)實(shí)體根據(jù)對(duì)世界、自身和情況的了解和理解,自主地開(kāi)發(fā)和選擇不同的行動(dòng)方案以實(shí)現(xiàn)目標(biāo)的能力[38]。自主性和智能性是智能無(wú)人系統(tǒng)最重要的兩個(gè)特征,智能自主系統(tǒng)是一個(gè)具有高等級(jí)智能性的自主系統(tǒng)。
未來(lái)戰(zhàn)爭(zhēng)將向著深度信息化、智能無(wú)人化、網(wǎng)絡(luò)體系化的方向發(fā)展,智能無(wú)人系統(tǒng)將成為未來(lái)戰(zhàn)場(chǎng)的重要角色。智能自主系統(tǒng)的建模與仿真技術(shù)將以大數(shù)據(jù)資源、高性能計(jì)算能力、智能算法為基礎(chǔ),將新一代信息通信技術(shù)及各類(lèi)應(yīng)用領(lǐng)域?qū)I(yè)技術(shù)深度融合,以提升仿真系統(tǒng)的整體智能化水平[39]。
4.2.1 智能自主系統(tǒng)建模
無(wú)人作戰(zhàn)系統(tǒng)具有智能性、自主性,它是由多個(gè)智能個(gè)體組成的具有協(xié)同作戰(zhàn)能力的復(fù)雜武器裝備系統(tǒng),對(duì)于智能仿真技術(shù)提出了全新的要求。隨著建模仿真技術(shù)的不斷發(fā)展,對(duì)于智能自主系統(tǒng)有很多的建模方法[40],下面主要對(duì)基于Agent、大數(shù)據(jù)智能與深度學(xué)習(xí)的建模方法進(jìn)行介紹。
基于 Agent 的建模仿真方法為作戰(zhàn)模擬仿真提供了一種新方法。它是對(duì)復(fù)雜系統(tǒng)中基本元素及基本元素間相互作用的建模和仿真,將復(fù)雜系統(tǒng)中的微觀行為和宏觀涌現(xiàn)現(xiàn)象有機(jī)地結(jié)合,是一種自頂向下分析、自底向上綜合的建模方式[41]。目前的熱點(diǎn)課題主要是 Agent 的理論模型、多Agent 系統(tǒng)(Multi-Agent System,MAS)及其開(kāi)發(fā)應(yīng)用。意大利熱那亞大學(xué)Bruzzone 等[42]構(gòu)建了一種基于Agent 驅(qū)動(dòng)的異構(gòu)仿真環(huán)境。該環(huán)境包括UUV、水下潛艇平臺(tái)、水面無(wú)人船和GPS 衛(wèi)星等仿真作戰(zhàn)實(shí)體,實(shí)現(xiàn)對(duì)系統(tǒng)結(jié)構(gòu)、管理過(guò)程和人為因素的綜合分析。日本東海大學(xué) Watanabe[43]設(shè)計(jì)了一個(gè)通用化的 MAS 仿真支撐環(huán)境以及半實(shí)物仿真平臺(tái),可滿足UUV 系統(tǒng)的水聲傳感器、推進(jìn)器、能源以及 CCD 相機(jī)測(cè)試工作。哈爾濱工程大學(xué)Liu 等[44]在BDI-Agent 模型的基礎(chǔ)上,借鑒神經(jīng)生理結(jié)構(gòu)模型,提出了包含感知區(qū)、反射區(qū)和慎思區(qū)的AUV 心智模型,并通過(guò)多AUV編隊(duì)穿越未知雷區(qū)的仿真試驗(yàn)驗(yàn)證了心智模型的有效性。
由于智能自主系統(tǒng)機(jī)理具有高度的復(fù)雜性,往往難以得到解析解,而需要大量實(shí)驗(yàn)與數(shù)據(jù)對(duì)其內(nèi)部機(jī)理進(jìn)行模擬與仿真?;诖髷?shù)據(jù)智能的建模方法是利用海量觀測(cè)與應(yīng)用數(shù)據(jù)實(shí)現(xiàn)對(duì)不明確機(jī)理的智能系統(tǒng)進(jìn)行有效仿真建模的一類(lèi)方法。王曉曄等[45]基于數(shù)據(jù)聚類(lèi)分析與利用神經(jīng)網(wǎng)絡(luò)進(jìn)行權(quán)重的修正,提出了一種改進(jìn)的K 最近鄰分類(lèi)算法。同時(shí),對(duì)于指數(shù)式增長(zhǎng)的可用數(shù)據(jù),可以采用基于深度學(xué)習(xí)的仿真建模方法,但深度學(xué)習(xí)高度依賴于數(shù)據(jù)的樣本容量和標(biāo)記精度,國(guó)內(nèi)外學(xué)者在此基礎(chǔ)上,結(jié)合強(qiáng)化學(xué)習(xí),提出深度強(qiáng)化學(xué)習(xí)理論。Liu 等[46]基于此方法,設(shè)計(jì)出戰(zhàn)役級(jí)智能體訓(xùn)練系統(tǒng)。該系統(tǒng)提供分布式持續(xù)學(xué)習(xí)、大規(guī)模訓(xùn)練和計(jì)算存儲(chǔ)資源等能力,為研究人機(jī)混合協(xié)作及群體智能涌現(xiàn)提供技術(shù)平臺(tái)。
綜上所述,隨著人工智能技術(shù)的不斷發(fā)展,仿真人員對(duì)于智能自主系統(tǒng)的建模方法正在向以機(jī)器學(xué)習(xí)為算法基礎(chǔ)的智能化、數(shù)字化建模理論與方法發(fā)展,這些算法理論的出現(xiàn)可以有效提高智能自主仿真系統(tǒng)的可靠性。但是由于復(fù)雜作戰(zhàn)系統(tǒng)數(shù)據(jù)的稀缺以及戰(zhàn)場(chǎng)的不確定性,對(duì)機(jī)器學(xué)習(xí)算法提出較大的挑戰(zhàn),并且如何選擇與優(yōu)化機(jī)器學(xué)習(xí)算法以得到期望的模型也是仿真人員需要解決的一個(gè)重要問(wèn)題。
4.2.2 智能自主算法仿真研究
AI 是未來(lái)無(wú)人系統(tǒng)提高智能自主性的關(guān)鍵技術(shù)。無(wú)人系統(tǒng)的智能化主要體現(xiàn)在自主規(guī)劃路徑的能力、執(zhí)行任務(wù)的自主決策能力和與系統(tǒng)內(nèi)部的自主協(xié)作能力[47]。為了更加快速有效地實(shí)現(xiàn)上述3 種能力,不同的研究人員提出了不同的實(shí)現(xiàn)方式。
路徑的自主規(guī)劃能力是無(wú)人系統(tǒng)的第一個(gè)智能化趨勢(shì)。目前的路徑規(guī)劃算法主要分為兩類(lèi)。一類(lèi)是人為設(shè)置,例如A*算法、人工勢(shì)場(chǎng)法、細(xì)胞分解法等。宋雪倩等[48]提出利用 Dubins 曲線找到有效節(jié)點(diǎn),結(jié)合A*啟發(fā)式搜索的思想,分別為每架無(wú)人機(jī)離線構(gòu)建由 Dubins 曲線組成的最短避障路徑。另一類(lèi)是系統(tǒng)個(gè)體根據(jù)自身所處的環(huán)境信息,實(shí)時(shí)規(guī)劃路徑的智能反應(yīng)算法,例如遺傳算法、蜂群算法、粒子群優(yōu)化算法等。關(guān)震宇等[49]提出一種基于路徑的無(wú)人機(jī)的避障規(guī)劃算法,采用遺傳算法,結(jié)合無(wú)人機(jī)的飛行性能和最小轉(zhuǎn)彎半徑得到一種在已知障礙空間位置前提下的無(wú)人機(jī)路徑規(guī)劃方法。Xie 等[50]提出了布谷鳥(niǎo)算法在無(wú)人機(jī)探索三維環(huán)境尤其是戰(zhàn)場(chǎng)環(huán)境中的應(yīng)用,并且在解決三維空中路徑規(guī)劃問(wèn)題中對(duì)布谷鳥(niǎo)算法進(jìn)行優(yōu)化。
對(duì)于任務(wù)的理解與決策能力是無(wú)人系統(tǒng)的第二個(gè)智能趨勢(shì)。當(dāng)面對(duì)復(fù)雜的任務(wù)時(shí),無(wú)人系統(tǒng)不需要人為對(duì)其進(jìn)行分配任務(wù)或做出決定,而是自主完成任務(wù),是無(wú)人系統(tǒng)自主控制的關(guān)鍵技術(shù)和智能程度的體現(xiàn)。任佳等[51]針對(duì)不確定環(huán)境下的任務(wù)決策問(wèn)題,提出了基于的參數(shù)自適應(yīng)推理算法實(shí)現(xiàn)在小樣本觀測(cè)下的動(dòng)態(tài)任務(wù)決策,并著重討論了專(zhuān)家認(rèn)知程度不確定對(duì)該自適應(yīng)推理算法的影響。趙振宇等[52]以 FRPNs 結(jié)構(gòu)實(shí)現(xiàn)規(guī)則推理,按照規(guī)則分析系統(tǒng)的推理過(guò)程,建立一種基于模糊推理Petri 網(wǎng)的無(wú)人機(jī)智能決策方法,提高了無(wú)人機(jī)在動(dòng)態(tài)不確定環(huán)境下的自主控制級(jí)別。孫楚等[53]設(shè)計(jì)了基于連續(xù)動(dòng)作控制變量的無(wú)人機(jī)機(jī)動(dòng)決策方法,采用共用隱層的NRBF 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)分別逼近效用值與動(dòng)作控制變量,提出了基于相對(duì)熵距離的神經(jīng)網(wǎng)絡(luò)隱層節(jié)點(diǎn)自適應(yīng)構(gòu)建方法。
無(wú)人系統(tǒng)內(nèi)部可以由許多相同的和不同的個(gè)體組成,他們應(yīng)該有能力進(jìn)行自主合作、消除沖突,通過(guò)相互配合、協(xié)作的作戰(zhàn)方式執(zhí)行任務(wù),具有同時(shí)攻擊多個(gè)敵方目標(biāo)和能提高殺傷概率的優(yōu)點(diǎn)。陳俠等[54]針對(duì)多無(wú)人機(jī)協(xié)同打擊的攻防博弈問(wèn)題,建立了多無(wú)人機(jī)協(xié)同打擊任務(wù)的攻防博弈模型,給出了h人有限策略靜態(tài)博弈模型與純策略納什均衡的求解方法。馬國(guó)欣等[55]為實(shí)現(xiàn)多導(dǎo)彈協(xié)同攻擊同一目標(biāo),提出一種法對(duì)于無(wú)角度約束和有角度約束的情況均適用時(shí)間協(xié)同分布式導(dǎo)引律設(shè)計(jì)方法。Yao 等[56]為解決多無(wú)人機(jī)在對(duì)抗環(huán)境下的風(fēng)險(xiǎn)問(wèn)題,提出一種協(xié)同攻擊任務(wù)分配算法,此算法可降低無(wú)人機(jī)群在后期的環(huán)境風(fēng)險(xiǎn)問(wèn)題,且較遺傳算法有更好的求解結(jié)果。
智能無(wú)人系統(tǒng)總體上還處于發(fā)展初期階段,智能化是無(wú)人系統(tǒng)的重要發(fā)展方向。如何提高無(wú)人系統(tǒng)的智能自主水平是當(dāng)下的研究重點(diǎn)[57]。從目前研究結(jié)果可以看出,智能算法的應(yīng)用有助于解決復(fù)雜系統(tǒng)的建模問(wèn)題,并且將人工智能技術(shù)以及網(wǎng)絡(luò)技術(shù)等引入到仿真系統(tǒng),以此形成智能自主仿真系統(tǒng)是未來(lái)智能無(wú)人系統(tǒng)的研究重點(diǎn)。
4.2.3 智能自主仿真系統(tǒng)
自20 世紀(jì)初,美國(guó)作為無(wú)人作戰(zhàn)系統(tǒng)建設(shè)領(lǐng)先國(guó)家就開(kāi)始開(kāi)展無(wú)人作戰(zhàn)裝備智能化轉(zhuǎn)型。隨著人工智能技術(shù)與戰(zhàn)爭(zhēng)形態(tài)的不斷發(fā)展,各國(guó)已將作戰(zhàn)智能認(rèn)知技術(shù)作為關(guān)鍵顛覆性領(lǐng)域,并對(duì)其未來(lái)發(fā)展做出長(zhǎng)期規(guī)劃。
2007年,美國(guó)國(guó)防預(yù)先研究計(jì)劃局(DARPA)受到“深藍(lán)”計(jì)算機(jī)在國(guó)際象棋比賽中戰(zhàn)勝世界冠軍加里·卡斯帕羅夫的啟發(fā),提出了一套“深綠”計(jì)劃。深綠由“指揮員助手”人機(jī)接口系統(tǒng)、“閃電戰(zhàn)”仿真系統(tǒng)和“水晶球”控制系統(tǒng)組成。DARPA利用動(dòng)態(tài)數(shù)據(jù)驅(qū)動(dòng)應(yīng)用系統(tǒng)的基本思想,將仿真和實(shí)驗(yàn)/試驗(yàn)有機(jī)結(jié)合,使仿真可以在執(zhí)行過(guò)程中動(dòng)態(tài)地從實(shí)際系統(tǒng)接收數(shù)據(jù)并做出響應(yīng)[58]。
2016年6月,美國(guó)辛辛那提大學(xué)開(kāi)發(fā)的Alpha AI 人工智能與美國(guó)空軍上校吉恩·李通過(guò)空戰(zhàn)模擬器對(duì)戰(zhàn),Alpha AI 大獲全勝。在模擬空戰(zhàn)中,應(yīng)用厄內(nèi)斯特在辛辛那提大學(xué)開(kāi)發(fā)出的名為“模糊遺傳樹(shù)”的算法,實(shí)現(xiàn)了“動(dòng)作及簡(jiǎn)單戰(zhàn)術(shù)行為”,憑借有著快于人類(lèi)200 余倍的反應(yīng)與計(jì)算速度,最終在虛擬的模擬飛行對(duì)戰(zhàn)中完勝對(duì)手[59]。
2019年5月,DARPA 發(fā)布空戰(zhàn)演進(jìn)(Air Combat Evolution, ACE)項(xiàng)目,項(xiàng)目通過(guò)空中格斗的自動(dòng)化和智能化來(lái)增強(qiáng)飛行員對(duì)戰(zhàn)斗自主性的信任。ACE 采用自下而上的方式開(kāi)發(fā)戰(zhàn)斗自主性的性能及對(duì)自主能力的信任。如同訓(xùn)練飛行員一樣,ACE 通過(guò)將空中格斗算法應(yīng)用到難度和真實(shí)感不斷增強(qiáng)的任務(wù)中來(lái)訓(xùn)練算法[60]。該項(xiàng)目將自動(dòng)空中格斗的戰(zhàn)術(shù)應(yīng)用到更復(fù)雜的、異構(gòu)的、多飛機(jī)的戰(zhàn)役級(jí)模擬場(chǎng)景,為未來(lái)實(shí)時(shí)、戰(zhàn)役級(jí)的馬賽克戰(zhàn)試驗(yàn)奠定基礎(chǔ)。
圣塔菲研究所于1994年提出并開(kāi)發(fā)的Swarm平臺(tái),提供了實(shí)現(xiàn)建立基于Agent 仿真模型的、可共享的基本對(duì)象類(lèi)庫(kù)以及運(yùn)行基于Agent 的仿真模型的控制引擎或虛擬機(jī)[61]。澳大利亞ADFA開(kāi)發(fā)了RABBLE[62],采用MAS 結(jié)構(gòu),增加了學(xué)習(xí)機(jī)制,使仿真群體行為利于決策。澳大利亞的AOD 開(kāi)發(fā)的SWARM 和Battle Model[63],可對(duì)空戰(zhàn)中的飛行員、戰(zhàn)斗機(jī)管理者、傳感器管理者、空戰(zhàn)防御指揮官以及地勤人員進(jìn)行Agent 建模。
此外,由于國(guó)內(nèi)對(duì)智能自主系統(tǒng)的研究起步較晚,相比于美國(guó)還有很大的差距。目前,各個(gè)高校與研究所之間聯(lián)合協(xié)作也取得了一些成果。由北京理工大學(xué)人機(jī)交互課題組開(kāi)發(fā)的BitMod系統(tǒng),采用面向?qū)ο蟮哪K化設(shè)計(jì),可以完成自主模型的可視化創(chuàng)建及屬性編輯等功能。由國(guó)防科學(xué)技術(shù)大學(xué)建立的JCass 系統(tǒng)[64],是一個(gè)針對(duì)復(fù)雜系統(tǒng)的、采用基于Agent 的建模與仿真方法的分布式仿真平臺(tái),能夠滿足復(fù)雜系統(tǒng)和網(wǎng)絡(luò)Cluster 環(huán)境特點(diǎn)的要求,且方便用戶的使用。
在目前軍事需求與技術(shù)進(jìn)步的推動(dòng)下,無(wú)人作戰(zhàn)系統(tǒng)的仿真研究工作處于快速發(fā)展的階段。本文從集群系統(tǒng)仿真與智能自主系統(tǒng)仿真入手,分析其目前研究工作的主要難點(diǎn),并對(duì)其近年的發(fā)展概況進(jìn)行總結(jié)。
隨著建模仿真技術(shù)的不斷發(fā)展,無(wú)人作戰(zhàn)系統(tǒng)的仿真會(huì)對(duì)無(wú)人作戰(zhàn)系統(tǒng)的發(fā)展產(chǎn)生極大的推動(dòng)作用,是研究無(wú)人系統(tǒng)作戰(zhàn)不可或缺的支撐手段與重要工具。根據(jù)查找相關(guān)文獻(xiàn),以及作者自身在研究過(guò)程中的總結(jié),下面簡(jiǎn)要介紹未來(lái)可能的發(fā)展方向以及難點(diǎn)。
(1)多域作戰(zhàn)仿真理論需要進(jìn)一步發(fā)展。對(duì)于多域作戰(zhàn)這樣的新興概念,需要建立一種與其形態(tài)相適應(yīng)的指揮控制理論——多域多環(huán)嵌套理論,構(gòu)建多域作戰(zhàn)指揮基本模式,指導(dǎo)跨域作戰(zhàn)指揮控制系統(tǒng)建設(shè)[65]。并且多域作戰(zhàn)空間的情報(bào)數(shù)據(jù)存在異構(gòu)分散、碎片化、不連續(xù)和非結(jié)構(gòu)化等問(wèn)題,特別是網(wǎng)絡(luò)、電磁和太空目標(biāo)的跨域信息融合尚處于空白階段。未來(lái)對(duì)于多域作戰(zhàn)仿真,需要對(duì)這些認(rèn)知領(lǐng)域也進(jìn)行建模,以盡可能還原作戰(zhàn)場(chǎng)景。
(2)轉(zhuǎn)變對(duì)復(fù)雜無(wú)人作戰(zhàn)系統(tǒng)的評(píng)估理念。面對(duì)無(wú)人作戰(zhàn)這樣的復(fù)雜系統(tǒng),傳統(tǒng)的評(píng)估方法難以反映系統(tǒng)的自適應(yīng)性、整體性、不確定性等特點(diǎn),另外,傳統(tǒng)方法的指標(biāo)選擇存在較強(qiáng)的主觀性與片面性,這樣會(huì)導(dǎo)致評(píng)估結(jié)果的不準(zhǔn)確與不合理。目前,隨著軍事大數(shù)據(jù)與深度學(xué)習(xí)等方法的出現(xiàn),需要轉(zhuǎn)變對(duì)體系能力評(píng)估理念的理解,引入新的體系建模理論和效能評(píng)估方法。應(yīng)大力發(fā)展以數(shù)據(jù)驅(qū)動(dòng)為機(jī)理的評(píng)估方法,將“指標(biāo)樹(shù)”轉(zhuǎn)化為“指標(biāo)網(wǎng)”,探索體系能力微觀與宏觀之間的聯(lián)系。
(3)開(kāi)展智能自主系統(tǒng)仿真試驗(yàn)鑒定技術(shù)。隨著以深度學(xué)習(xí)為代表的機(jī)器學(xué)習(xí)研究的興起,使得人工智能、大數(shù)據(jù)與智能自主系統(tǒng)建模仿真之間的深度融合有了進(jìn)一步的發(fā)展。對(duì)于智能自主系統(tǒng)仿真,我國(guó)需利用各類(lèi)新型仿真技術(shù)手段開(kāi)展對(duì)于關(guān)鍵性技術(shù)的試驗(yàn)評(píng)估。通過(guò)集成各類(lèi)仿真技術(shù),開(kāi)展連續(xù)自主性仿真試驗(yàn),實(shí)現(xiàn)大樣本并行仿真多種想定場(chǎng)景和測(cè)試無(wú)人自主系統(tǒng)的作戰(zhàn)效能。
(4)進(jìn)一步重視LVC 技術(shù)在軍事訓(xùn)練領(lǐng)域的作用。LVC 技術(shù)通過(guò)將實(shí)裝、仿真器、虛擬數(shù)字系統(tǒng)整合在一起,構(gòu)建更加逼真和復(fù)雜的訓(xùn)練和復(fù)雜任務(wù)環(huán)境,能夠更好地解決多系統(tǒng)融合仿真的難題,以及更好地模擬未來(lái)戰(zhàn)爭(zhēng),應(yīng)對(duì)未來(lái)多域聯(lián)合作戰(zhàn)的挑戰(zhàn)。世界各國(guó)將LVC 體系對(duì)抗仿真系統(tǒng)應(yīng)用于軍事演習(xí),拓展了軍事訓(xùn)練的手段方法,且極大地提升了戰(zhàn)役戰(zhàn)術(shù)聯(lián)合訓(xùn)練水平。但目前LVC 集成帶來(lái)的互操作和安全問(wèn)題限制了各國(guó)充分利用其實(shí)現(xiàn)聯(lián)合訓(xùn)練的潛力,未來(lái)需要需進(jìn)一步重視基于LVC 的仿真與訓(xùn)練,提出解決現(xiàn)有問(wèn)題的通用架構(gòu)與方法。