高 飛
(北京西三環(huán)中路19號(hào) 北京 100841)
現(xiàn)代艦船的指控系統(tǒng)具有戰(zhàn)場信息一體化、戰(zhàn)場作戰(zhàn)節(jié)奏快、戰(zhàn)場更加非線性等特點(diǎn),其作戰(zhàn)指揮復(fù)雜,難度大,是一個(gè)復(fù)雜的大系統(tǒng),智能體(Agent)是分布式人工智能研究的一個(gè)重要分支,其目標(biāo)是將復(fù)雜的大系統(tǒng)分解成彼此相互通信、協(xié)調(diào)、易于管理的小系統(tǒng)[1]。此外Agent還具有適應(yīng)性、自主性、靈活性、協(xié)作性的特點(diǎn)。將多Agent(MAS)技術(shù)引入指控系統(tǒng),可以大大提高指揮系統(tǒng)的整體效能,為指控決策系統(tǒng)的改進(jìn)提供有效的途徑。
MAS是由多個(gè)可執(zhí)行網(wǎng)絡(luò)計(jì)算的Agent組成的集合。每個(gè)Agent被認(rèn)為是一個(gè)物理的或抽象的實(shí)體[2~3]。在網(wǎng)絡(luò)中,每個(gè) Agent都是自治的,能作用于環(huán)境和自身,能對(duì)環(huán)境的變化做出反應(yīng),并能與其它Agent通信、交互,彼此協(xié)同工作,完成共同任務(wù)。MAS具有的自治性、分布性、協(xié)調(diào)性等特點(diǎn),并具有自組織能力、自學(xué)習(xí)能力和推理能力,有利于構(gòu)建具有較強(qiáng)的魯棒性和可靠性的協(xié)同指揮控制系統(tǒng)。智能體間的通信、合作、互解、協(xié)調(diào)、調(diào)度、管理及控制,可以很好地體現(xiàn)指控系統(tǒng)對(duì)體系結(jié)構(gòu)、功能及行為特征的技術(shù)要求。其結(jié)構(gòu)如圖1所示。
圖1 Agent與MAS結(jié)構(gòu)圖
在智能體的劃分中,粒度的選擇是第一步,粒度過大和過小都會(huì)造成問題。粒度小,系統(tǒng)中Agent數(shù)目太多,其組織與控制復(fù)雜度就會(huì)增加,通信負(fù)載重,運(yùn)行效率低;粒度大,系統(tǒng)不僅靈活性差,而且降低了系統(tǒng)的并行性。粒度選擇適當(dāng),系統(tǒng)結(jié)構(gòu)簡單,管理和控制容易,靈活性和適應(yīng)性也增強(qiáng)。
智能體劃分過程基本分為6個(gè)階段[4~5],在邏輯上形成一條流水線:1)抓住目標(biāo),將最初的系統(tǒng)定義轉(zhuǎn)化為結(jié)構(gòu)化、層次化的系統(tǒng)目標(biāo)。2)應(yīng)用用例,根據(jù)最初的系統(tǒng)說明創(chuàng)建用例圖和順序圖。用例圖表示了系統(tǒng)中不同角色之間的邏輯交互路徑。順序圖用來確定系統(tǒng)中角色之間必須傳遞的最小數(shù)量的消息。3)提煉角色,建立負(fù)責(zé)完成第一步中定義的目標(biāo)的角色。通常每個(gè)目標(biāo)分別由一個(gè)角色來完成,但是一些相關(guān)的目標(biāo)也可能映射到同一個(gè)角色。和角色一起建立一個(gè)任務(wù)集合,定義角色如何來實(shí)現(xiàn)目標(biāo)。任務(wù)定義為狀態(tài)圖。4)建立主體類[6],在主體類圖中把角色映射到主體類。5)用協(xié)作圖和活動(dòng)圖表示主體間的交互。6)利用活動(dòng)圖和狀態(tài)圖表示主體內(nèi)部的處理過程。
基于以上的分析,按照艦船指控系統(tǒng)體系結(jié)構(gòu),其智能體可劃分為三類:管理類Agent、通信服務(wù) Agent、業(yè)務(wù)類 Agent[7~8]。每一類還有細(xì)分類別,其細(xì)分方法如圖2所示。
圖2 艦船指控系統(tǒng)Agent劃分方法
·界面Agent:負(fù)責(zé)提供界面友好的人機(jī)交互系統(tǒng)。當(dāng)用戶需要獲取決策生成方案時(shí),能夠主動(dòng)提供服務(wù),友好地顯示給用戶。
·用戶Agent:用于記錄軟件登錄時(shí)的用戶信息。
·權(quán)限控制Agent:根據(jù)用戶登錄軟件時(shí)的身份控制對(duì)數(shù)據(jù)訪問的存取權(quán)限。
·綜合管理Agent:是系統(tǒng)的核心,負(fù)責(zé)管理調(diào)度其他Agent主體的行為,負(fù)責(zé)啟動(dòng)或掛起某個(gè)Agent的工作過程,并在規(guī)則庫中保存多個(gè)Agent個(gè)體之間可能的協(xié)作方式。
·信息接收Agent:負(fù)責(zé)接收上級(jí)、友鄰、警戒雷達(dá)、搜索雷達(dá)等發(fā)送的信息。
·信息預(yù)處理Agent:主要完成數(shù)據(jù)抽取功能。由于戰(zhàn)術(shù)指揮系統(tǒng)中情報(bào)數(shù)據(jù)量大,且這些數(shù)據(jù)中可能含有虛警信息、錯(cuò)誤數(shù)據(jù)、噪聲等,因此需要進(jìn)行去偽存真,等對(duì)經(jīng)過信息預(yù)處理的數(shù)據(jù)進(jìn)行信息融合處理。
·信息融合Agent:結(jié)合傳感器特性、地理位置信息等對(duì)經(jīng)過信息預(yù)處理的數(shù)據(jù)進(jìn)行信息融合處理。
·態(tài)勢(shì)處理Agent:自動(dòng)感知外部環(huán)境變化,實(shí)時(shí)顯示戰(zhàn)場統(tǒng)一態(tài)勢(shì),為指揮員決策提供參考。
·威脅估計(jì)Agent:負(fù)責(zé)戰(zhàn)術(shù)指揮控制系統(tǒng)中目標(biāo)威脅估計(jì)判斷,自動(dòng)感知外部環(huán)境的變化,根據(jù)相應(yīng)的模型算法調(diào)整目標(biāo)威脅度。
·目標(biāo)分配Agent:負(fù)責(zé)根據(jù)保衛(wèi)目標(biāo)、空情數(shù)據(jù)、陣地配置信息等,結(jié)合登陸席位信息調(diào)用相應(yīng)知識(shí)庫、數(shù)據(jù)庫、推理機(jī),自動(dòng)生成目標(biāo)分配方案。
·數(shù)據(jù)分發(fā)Agent:負(fù)責(zé)對(duì)信息融合處理之后的數(shù)據(jù)按照一定的規(guī)則進(jìn)行推理,并向相應(yīng)節(jié)點(diǎn)分發(fā)數(shù)據(jù)。
·通信服務(wù)Agent:通信服務(wù)Agent負(fù)責(zé)處理各類Agent通信信息,為系統(tǒng)中的Agent提供和外界交互的統(tǒng)一接口以及交換信息和知識(shí)的途徑。
基于MAS技術(shù)的指控系統(tǒng),整個(gè)作戰(zhàn)過程是連續(xù)的、動(dòng)態(tài)實(shí)時(shí)變化的,各模塊之間相互協(xié)調(diào)共同完成指揮決策任務(wù)?;贛AS的指控系統(tǒng)可以根據(jù)不同指揮員的特點(diǎn)產(chǎn)生具有個(gè)性化的目標(biāo)分配方案,綜合管理Agent根據(jù)協(xié)商策略、原則等形成最終的指揮決策建議,輔助指揮員進(jìn)行正確指揮。工作流程如下:
1)系統(tǒng)運(yùn)行初始化時(shí),各類Agent都向綜合管理Agent進(jìn)行注冊(cè),將自己的有關(guān)信息(名字、地址、能力等)向綜合管理 Agent登記[9]。
2)信息接收Agent實(shí)時(shí)接收各類目標(biāo)信息,由信息預(yù)處理Agent根據(jù)規(guī)則(如距離、速度等判據(jù))對(duì)數(shù)據(jù)進(jìn)行初步的處理,信息融合Agent對(duì)于處理之后的信息作融合處理,形成最終的戰(zhàn)場情報(bào)信息。
3)態(tài)勢(shì)處理Agent根據(jù)信息融合Agent處理之后的信息,結(jié)合陣地配置Agent產(chǎn)生的陣地配置信息、保衛(wèi)目標(biāo)、敵軍信息等實(shí)時(shí)并動(dòng)態(tài)地顯示戰(zhàn)場綜合態(tài)勢(shì)信息,根據(jù)自身的知識(shí)庫、約束等去推理判斷,推斷出敵軍的主攻方向。
4)威脅估計(jì)Agent自動(dòng)感知戰(zhàn)場的態(tài)勢(shì)變化(目標(biāo)信息、配置信息),結(jié)合指揮員的偏好、具體指控原則進(jìn)行推理與自學(xué)習(xí),給出目標(biāo)威脅度信息。
5)目標(biāo)分配Agent利用威脅估計(jì)Agent產(chǎn)生的威脅度信息、態(tài)勢(shì)處理Agent產(chǎn)生的戰(zhàn)場綜合態(tài)勢(shì)信息結(jié)合具體指揮員的指揮偏好,按照指控中目標(biāo)分配原則等進(jìn)行推理,產(chǎn)生分配方案。在每次的決策過程中都對(duì)指揮員的指揮偏好進(jìn)行自學(xué)習(xí)。如果存在兩個(gè)指揮員,同時(shí)存在的兩個(gè)目標(biāo)分配Agent將根據(jù)他們的不同用戶身份按照指揮作戰(zhàn)中的約束與規(guī)則進(jìn)行協(xié)商決策。
通常,一個(gè)作戰(zhàn)任務(wù)可由如下多元組描述:
Task=<ID,Agents,subtasks,supertasks,arriv?al_time,starttime,endtime,quality,duration,cost,utility,condition>。
其中,ID是作戰(zhàn)任務(wù)的序號(hào),它是唯一的編碼;Agents是任務(wù)涉及到的智體,subtasks是子結(jié)點(diǎn)任務(wù);supertasks是戰(zhàn)術(shù)總?cè)蝿?wù);arrival_time是任務(wù)到達(dá)的時(shí)間;starttime是任務(wù)的最早開始時(shí)間;end?time是任務(wù)的最遲完成時(shí)間;quality任務(wù)涉及的數(shù)量;duration是任務(wù)涉及的周期和階段;cost是任務(wù)涉及的成本;utility是任務(wù)涉及的效用;condition是任務(wù)完成的約束條件。
描述智能體集合和具有的領(lǐng)域知識(shí)如下:
假定編隊(duì)多指揮Agent系統(tǒng)中有作戰(zhàn)智能體集合A={a1,a2,…,an},ai表示第i個(gè)指揮或協(xié)同智能體。
Ki={Ki1,Ki2,…,Kim}表示第i個(gè)資源智能體在某一方面所具有的能力(如探測性、打擊等)。
KA=∪i=1…nKi表示所有資源智能體具有的能力。
當(dāng)有任務(wù)T需要完成時(shí),解決它需要用到的能力為KT={KT1,KT2,…,KTs}時(shí),有分解過程:
1)當(dāng)KT∈Ki且 ai∈A時(shí),任務(wù)T能被單一的指揮Agent解決,而不需要分解。
2)當(dāng) KT∈KA但對(duì)于所有的 ai∈A,不能得到KT∈Ki,則任務(wù)T必須分解,需要協(xié)同,或滿足如下條件時(shí)必須協(xié)同交由協(xié)同控制Agent進(jìn)行協(xié)同。
(1)1個(gè)Agent無法完成任務(wù),必須協(xié)同作業(yè)合作完成,如時(shí)間、資源等約束無法獨(dú)立完成。
(2)1個(gè)Agent能完成任務(wù)但耗費(fèi)高,效用低,有其它Agent協(xié)同能減低成本提高效用。
3)當(dāng)需協(xié)作時(shí),則將協(xié)作任務(wù)交由協(xié)同控制Agent根據(jù)任務(wù)所缺能力來尋求最佳協(xié)同作戰(zhàn)單元。
4)與協(xié)同單元進(jìn)行交互協(xié)商,友鄰?fù)鈪f(xié)同后并根據(jù)一定的完成任務(wù)的約束評(píng)價(jià)協(xié)同效益,制定協(xié)作計(jì)劃。否則將協(xié)作需求經(jīng)指揮Agent報(bào)告上級(jí),由上級(jí)調(diào)整計(jì)劃或?qū)嵭忻顝?qiáng)制執(zhí)行。
5)實(shí)時(shí)監(jiān)控任務(wù)的執(zhí)行,檢測任務(wù)協(xié)同執(zhí)行中是否有火力、頻譜等沖突的出現(xiàn),并提供消解策略。
任務(wù)分解和協(xié)同計(jì)劃完成后進(jìn)行任務(wù)分配與執(zhí)行,明確任務(wù)之間的約束關(guān)系,以表的方式存儲(chǔ)在系統(tǒng)數(shù)據(jù)庫中,進(jìn)行指揮決策過程的學(xué)習(xí),并實(shí)時(shí)根據(jù)戰(zhàn)場態(tài)勢(shì)和作戰(zhàn)命令實(shí)時(shí)進(jìn)行任務(wù)調(diào)整。
結(jié)合艦船指揮控制結(jié)構(gòu)和MAS系統(tǒng)特性[10~11],為適應(yīng)現(xiàn)代海戰(zhàn)場態(tài)勢(shì)的多變性,及時(shí)應(yīng)對(duì)各種變化,給出基于多Agent的指控系統(tǒng)結(jié)構(gòu)如圖3所示,其主要模塊功能如下。
圖3 基于多Agent的指控系統(tǒng)結(jié)構(gòu)
1)通信模塊通信模塊主要是負(fù)責(zé)CA與外部的通信聯(lián)絡(luò),如指揮命令的上傳下達(dá)、同級(jí)協(xié)同、戰(zhàn)場信息共享等;
2)感知模塊主要感知戰(zhàn)場環(huán)境的變化;人機(jī)接口負(fù)責(zé)作戰(zhàn)決心和新作戰(zhàn)計(jì)劃,情報(bào)等信息的錄入和人干預(yù)作戰(zhàn)過程,并將以上結(jié)果傳給信息處理模塊和規(guī)劃決策模塊。
3)信息處理模塊信息處理模塊接收來自感知模塊及通信模塊傳來的信息,包括語音指揮信號(hào)、戰(zhàn)場態(tài)勢(shì)等其他戰(zhàn)場信息,然后將其進(jìn)行融合、分類處理,使用時(shí)空對(duì)準(zhǔn)、航跡互聯(lián)、證據(jù)理論等傳統(tǒng)融合算法和現(xiàn)代神經(jīng)網(wǎng)絡(luò)、模糊理論、支持向量機(jī)、聚類分析等現(xiàn)代信息處理方法,得出各類信息的屬性。如果是一般的信息就送到態(tài)勢(shì)評(píng)估模塊,如果是特殊的信息,如戰(zhàn)場情況發(fā)生劇變,有戰(zhàn)機(jī)可乘,需要馬上采取突擊行動(dòng),則將信息送往緊急反應(yīng)模塊。
4)態(tài)勢(shì)評(píng)估模塊態(tài)勢(shì)評(píng)估模塊接收從信息處理模塊傳來的信息,并接合知識(shí)庫中的世界模型,主要是外部敵我Agent及作戰(zhàn)海情氣象等情況,如對(duì)方的作戰(zhàn)特點(diǎn),作戰(zhàn)地區(qū)的地理特點(diǎn)等,然后根據(jù)這些戰(zhàn)場信息進(jìn)行海情、任務(wù)、敵我情況判斷分析,并將結(jié)果送入規(guī)劃決策模塊。
5)應(yīng)急反應(yīng)模塊應(yīng)急有兩種情況:一種是必須馬上采取行動(dòng),即使推理也是采取知識(shí)庫中的簡單經(jīng)驗(yàn)知識(shí);另外一種情況指雖然是緊急情況,但還不至于要立即采取作戰(zhàn)行動(dòng),只是要修改原有作戰(zhàn)決策,如上級(jí)派來支援部隊(duì),或是下級(jí)接收到作戰(zhàn)任務(wù)后的上報(bào)計(jì)劃,則應(yīng)融合這些情況而重新進(jìn)行部署和決策。當(dāng)然更多的情況是兩種情形并行處理,一方面采取行動(dòng),另一方面重新規(guī)劃。
6)知識(shí)庫知識(shí)庫是進(jìn)行推理的知識(shí)來源,它包括對(duì)世界的認(rèn)識(shí)模型,即作戰(zhàn)地理氣候環(huán)境、作戰(zhàn)對(duì)手情況等,還包括戰(zhàn)術(shù)規(guī)則庫和經(jīng)驗(yàn)知識(shí)庫;戰(zhàn)術(shù)規(guī)則用來進(jìn)行戰(zhàn)術(shù)推理,而經(jīng)驗(yàn)知識(shí)用于處理緊急戰(zhàn)場情況。同時(shí)知識(shí)庫還隨作戰(zhàn)次數(shù)、經(jīng)驗(yàn)的增加而不斷更新[12]。
7)規(guī)劃決策模塊決策模塊是指揮Agent的核心,它根據(jù)態(tài)勢(shì)評(píng)估結(jié)果并結(jié)合知識(shí)庫中的戰(zhàn)術(shù)規(guī)則進(jìn)行作戰(zhàn)規(guī)劃,生成作戰(zhàn)決策,產(chǎn)生作戰(zhàn)行動(dòng)。在作戰(zhàn)過程中時(shí)常保持對(duì)作戰(zhàn)行動(dòng)的跟蹤,看決策是否有效。如果情況發(fā)生變化,則立即重新進(jìn)行決策。另外,決策模塊還接收由應(yīng)急模塊傳來的信息,如下級(jí)指揮員的決策計(jì)劃等,決策模塊會(huì)融合這些信息重新決策。每一次決策情況又可傳入學(xué)習(xí)模塊,以更新知識(shí)庫。
整個(gè)指揮Agent可以適應(yīng)不同級(jí)別指揮結(jié)構(gòu),如編隊(duì)級(jí)、單艦級(jí)甚至部門級(jí),下級(jí)嚴(yán)格服從上級(jí)命令。對(duì)于專門針對(duì)指揮控制部門,不影響傳感器武器系統(tǒng)的只需更改知識(shí)庫,以適應(yīng)不同級(jí)別任務(wù)。根據(jù)任務(wù)需求,可使系統(tǒng)降功能或以不同方式重組重構(gòu),適應(yīng)不同需要的情況下提高系統(tǒng)靈活性。防空、協(xié)同突擊、協(xié)同護(hù)航、協(xié)同保障等任務(wù)涉及的兵力編成、所需知識(shí)、所使用的傳感器和武器等資源不同,對(duì)此只需更新知識(shí)庫,便可靈活性地以不同的資源進(jìn)行面向任務(wù)的資源重組。
根據(jù)指控控制系統(tǒng)的需求,將多Agent技術(shù)引入指控控制系統(tǒng)。通過多Agent技術(shù)在指控控制系統(tǒng)中的應(yīng)用,使戰(zhàn)術(shù)級(jí)指揮控制系統(tǒng)指揮決策智能化,改變以往指揮系統(tǒng)的串行工作模式,為以后的指揮系統(tǒng)總體設(shè)計(jì)開辟出一條新思路,大大提高系統(tǒng)設(shè)計(jì)的效率和質(zhì)量,對(duì)提高我國陸軍防空指控系統(tǒng)的性能、功能起到極為重要的作用。應(yīng)用多智能體技術(shù)構(gòu)建智能艦船指揮控制系統(tǒng)為提高協(xié)同作戰(zhàn)能力提供有效的技術(shù)途徑。研究結(jié)合作戰(zhàn)過程和編隊(duì)作戰(zhàn)樣式中的戰(zhàn)術(shù)規(guī)則來設(shè)計(jì)艦艇編隊(duì)指控系統(tǒng),并考慮在低通信量和無通信情況下的自協(xié)同作戰(zhàn)、沖突情況下的沖突檢測和消解策略,將能更好地適應(yīng)未來復(fù)雜電磁環(huán)境下的網(wǎng)絡(luò)化戰(zhàn)爭。
參考文獻(xiàn)
[1]Xu J H,Zhang W,Shi C Y.A Structure-oriented Method for Agent Organization Formation[C]//Proc of Conference on Intelligence Information Processing.PSEI,2000.
[2]Michael Wooldridge.多Agent系統(tǒng)引論[M].北京:電子工業(yè)出版社,2003.
[3]張路青,許宏泉,詹廣平.人工智能在信息化戰(zhàn)場的應(yīng)用探析[J].艦船電子工程,2009,29(6):13-16.
[4]Wooldridge M.Jennings Nicholas Cooperative Problem Solving[J].Journal of Logic and Computation,1999,9(4):563-592.
[5]李曉寧,于洪敏,張華才.面向群體作戰(zhàn)的多Agent合作策略[J].武器裝備自動(dòng)化,2007,26(6):1-2.
[6]張航義.基于Agent的CGF行為建模技術(shù)研究[J].計(jì)算機(jī)仿真,2003,20(8):79-81.
[7]孫志勇.多Agent系統(tǒng)體系結(jié)構(gòu)及建模方法研究[D].合肥:合肥工業(yè)大學(xué),2004.
[8]Otto Shehory. Architectural Properties of Multi-Agent Systems,Technical Report CMU-RI-TR-98-28[C]//Carnegie Mellon Software Engineering Institute,December 1998.
[9]程飛.潛艇指控系統(tǒng)人機(jī)交互技術(shù)發(fā)展分析[J].火力與指揮控制,2013,38(5):5-9
[10]舒谷生,蔣偉進(jìn).基于Agent的可視化交互界面及應(yīng)用研究[J].湖南城市學(xué)院學(xué)報(bào)(自然科學(xué)版),2004,13(2):69-73
[11]程飛,高貴朋.潛艇指控系統(tǒng)智能化應(yīng)用研究[J].火力與指揮控制,2014,39(5):1-5.
[12]劉強(qiáng),薛惠鋒.基于Multi-Agent的智能指控系統(tǒng)建模[J].火力與指揮控制,2008,33(6):91-93,97.