摘 要:針對(duì)作戰(zhàn)系統(tǒng)的智能化設(shè)計(jì)問題,提出了基于Agent的人工智能技術(shù)概念框架和應(yīng)用方法。首先,闡述了Agent概念,討論了在作戰(zhàn)系統(tǒng)中研究Agent的重要意義。然后,介紹了基于Agent的人工智能研究框架,列舉了Agent在作戰(zhàn)系統(tǒng)中的多種應(yīng)用方式。最后,分析了Agent技術(shù)發(fā)展趨勢(shì)及其作戰(zhàn)應(yīng)用可能面臨的風(fēng)險(xiǎn)與挑戰(zhàn)。
關(guān)鍵詞:人工智能;Agent;作戰(zhàn)系統(tǒng);研究框架;大語言模型
中圖分類號(hào):E91;TP18 文獻(xiàn)標(biāo)志碼:A DOI:10.3969/j.issn.1673-3819.2024.06.002
Artificial intelligence empowered combat systems from the perspective of Agent
LIU Wei, XIE Haibin, CHEN Shaofei
(College of Intelligence Science and Technology, National University of Defense Technology, Changsha 410073, China)
Abstract:Aiming at the intelligent design of combat systems, we propose a conceptual framework and application methods of Agent based on artificial intelligence technology. First, we analyze the concept of Agent and discuss the important significance of studying Agent in the combat system. Then, we introduce the research framework of artificial intelligence based on Agent, and multiple application methods of Agent in combat systems. Finally, we analyze the development trends of Agent technology and the risks and challenges that its combat applications may face.
Key words:artificial intelligence; Agent; combat system; research framework; large language model
收稿日期:2024-07-17修回日期:2024-09-28
*基金項(xiàng)目: 國家自然科學(xué)基金項(xiàng)目(61722313,62376280)
作者簡介:劉 偉(1979—),女,博士,副教授,研究方向?yàn)槿斯ぶ悄堋?/p>
謝海斌(1977—),男,博士,教授。
作戰(zhàn)系統(tǒng)是指為實(shí)現(xiàn)特定作戰(zhàn)目標(biāo)而設(shè)計(jì)的技術(shù)系統(tǒng)和組織結(jié)構(gòu)的總和,包括情報(bào)采集、目標(biāo)識(shí)別、威脅判斷、任務(wù)規(guī)劃和戰(zhàn)術(shù)執(zhí)行等功能模塊?,F(xiàn)代戰(zhàn)爭(zhēng)具有作戰(zhàn)要素復(fù)雜、多域交叉融合、一體化聯(lián)合作戰(zhàn)的特點(diǎn),要求部隊(duì)具備高度適應(yīng)性和快速反應(yīng)能力,武器裝備應(yīng)具有強(qiáng)機(jī)動(dòng)性和協(xié)作性特點(diǎn),作戰(zhàn)系統(tǒng)整體亟待智能化升級(jí)。人工智能技術(shù)可增強(qiáng)作戰(zhàn)系統(tǒng)的態(tài)勢(shì)感知能力[1]、指揮控制能力[2]、決策效率[3]以及軍事行動(dòng)的精準(zhǔn)度和快速響應(yīng)能力,但是如何在統(tǒng)一框架下進(jìn)行作戰(zhàn)系統(tǒng)的一體化智能設(shè)計(jì)和升級(jí)改造仍是一個(gè)待研究的重要課題。
本文提出了基于Agent的作戰(zhàn)系統(tǒng)人工智能技術(shù)框架和應(yīng)用方法,通過將多域、多維作戰(zhàn)空間的實(shí)體要素納入統(tǒng)一的研究框架,探討了Agent在作戰(zhàn)系統(tǒng)中的應(yīng)用方式,從而為作戰(zhàn)系統(tǒng)賦予自主性、反應(yīng)性和適應(yīng)性等關(guān)鍵特性,增強(qiáng)作戰(zhàn)系統(tǒng)自主能力,促進(jìn)多Agent協(xié)作,提高復(fù)雜環(huán)境適應(yīng)能力。
1 Agent概念與內(nèi)涵
1.1 Agent基本概念
一般認(rèn)為,Agent是能夠通過傳感器感知環(huán)境,并且通過執(zhí)行器對(duì)環(huán)境產(chǎn)生影響的任何事物[4]。Agent概念具有強(qiáng)包容性,能夠?qū)⑺袑?duì)環(huán)境進(jìn)行感知和施加影響的個(gè)體包容到統(tǒng)一的框架下研究,無論是生命體還是人造物。作戰(zhàn)系統(tǒng)涉及多樣化的平臺(tái)和要素,如人類戰(zhàn)士、無人作戰(zhàn)裝備、智能軟件等,它們都可以被囊括到Agent范疇內(nèi)進(jìn)行設(shè)計(jì)和分析。
多Agent系統(tǒng)由多個(gè)Agent組成,通過交互來解決超出個(gè)體能力或知識(shí)范圍的問題?,F(xiàn)代戰(zhàn)爭(zhēng)涉及多域作戰(zhàn),需要多兵種協(xié)同、有人與無人協(xié)同、實(shí)體與虛擬空間作戰(zhàn)能力相結(jié)合。多Agent系統(tǒng)為研究解決作戰(zhàn)行動(dòng)中的分布式問題提供了概念框架,可基于Agent交互實(shí)現(xiàn)分布異構(gòu)實(shí)體間的有效組織、通信和協(xié)作。
1.2 研究Agent的意義
在作戰(zhàn)系統(tǒng)中,研究Agent的意義主要體現(xiàn)在以下方面。
1)利用Agent的自主性和智能性,提高作戰(zhàn)決策質(zhì)量和行動(dòng)速度?;贏gent統(tǒng)一設(shè)計(jì)作戰(zhàn)系統(tǒng),可使各功能模塊間具有良好的兼容性和可擴(kuò)展性,提升高強(qiáng)度對(duì)抗環(huán)境下的情報(bào)分析、態(tài)勢(shì)感知、規(guī)劃決策和行動(dòng)執(zhí)行能力。
2)Agent內(nèi)部處理機(jī)制具有多樣性,可為作戰(zhàn)功能模塊提供技術(shù)選擇的靈活性。Agent強(qiáng)調(diào)智能的外在表現(xiàn),可根據(jù)任務(wù)環(huán)境屬性選擇適合的人工智能技術(shù),不局限于仿人理性思維或仿神經(jīng)系統(tǒng)信息處理。
3)通過不斷學(xué)習(xí)和適應(yīng),Agent能夠更好地應(yīng)對(duì)復(fù)雜戰(zhàn)場(chǎng)環(huán)境。Agent不斷感知環(huán)境并對(duì)環(huán)境施加作用,根據(jù)交互體驗(yàn)修正內(nèi)建環(huán)境模型,改善感知與行動(dòng)之間的映射關(guān)系。Agent憑借學(xué)習(xí)與進(jìn)化能力,可打破其預(yù)設(shè)的能力界限,適應(yīng)動(dòng)態(tài)、不確定的開放環(huán)境。
2 基于Agent的建模方法研究現(xiàn)狀
基于Agent的建模是目前解決作戰(zhàn)復(fù)雜適應(yīng)系統(tǒng)建模仿真最有效的方法之一。作戰(zhàn)Agent是各類作戰(zhàn)實(shí)體(層次、粒度可能不同)在仿真系統(tǒng)中的映射,也是基于Agent建模仿真的核心要素。Agent體系結(jié)構(gòu)是從規(guī)約到實(shí)現(xiàn)這一中間步驟的表示,涉及系統(tǒng)結(jié)構(gòu)選擇和框架設(shè)計(jì)、模塊分解與關(guān)系確定以及感知與行動(dòng)機(jī)制建模等多個(gè)方面[5]。
隨著基于Agent的建模方法在實(shí)際建模仿真中的應(yīng)用,面向Agent的軟件工程概念應(yīng)運(yùn)而生,先后提出了基于知識(shí)工程的方法、基于對(duì)象技術(shù)的方法、基于角色和組織模型的方法等面向Agent的軟件工程方法學(xué)[6-7]。但是,在實(shí)際應(yīng)用中發(fā)現(xiàn),計(jì)算機(jī)仿真工程技術(shù)人員建立的仿真模型與軍事人員建立的軍事概念模型之間往往存在不一致性,需要經(jīng)過反復(fù)的迭代修正,才能滿足軍事需求。因此,研究人員提出了用軍事概念模型直接驅(qū)動(dòng)多Agent作戰(zhàn)仿真模型的建模方法,在保證仿真可信性的前提下,提高工程開發(fā)效率[8]。
研究戰(zhàn)爭(zhēng)這類復(fù)雜系統(tǒng)對(duì)于動(dòng)態(tài)環(huán)境的適應(yīng)性,需要借助基于多Agent建模仿真方法?;诙郃gent作戰(zhàn)建模仿真是利用Agent對(duì)作戰(zhàn)復(fù)雜系統(tǒng)中各個(gè)實(shí)體構(gòu)建模型,通過對(duì)作戰(zhàn)Agent個(gè)體及相互之間(包括與作戰(zhàn)環(huán)境)的行為刻畫,描述作戰(zhàn)復(fù)雜系統(tǒng)的宏觀行為。相對(duì)于傳統(tǒng)面向過程和面向?qū)ο蟮姆抡婕夹g(shù),基于多Agent仿真方法對(duì)復(fù)雜系統(tǒng)的行為具有更強(qiáng)的建模與仿真能力、更高的抽象性和表達(dá)能力、更強(qiáng)的仿真動(dòng)態(tài)性和靈活性,實(shí)現(xiàn)了微觀行為和宏觀行為的有機(jī)結(jié)合,是研究作戰(zhàn)復(fù)雜系統(tǒng)的重要手段[9]。
在多Agent仿真中,人們重視Agent適應(yīng)性對(duì)作戰(zhàn)仿真過程及其結(jié)果的影響,取得了豐碩的研究成果。如王步云等梳理了遺傳算法、強(qiáng)化學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等方法在實(shí)現(xiàn)作戰(zhàn)Agent適應(yīng)性方面的成果[10];石鼎等從均衡決策的角度提出強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)的多Agent協(xié)同作戰(zhàn)仿真算法[11]。但是現(xiàn)有的研究往往只實(shí)現(xiàn)某一方Agent的適應(yīng)性,作為對(duì)抗中的另一方仍然采用固定規(guī)則的決策模式。在仿真中如何實(shí)現(xiàn)紅藍(lán)雙方的同時(shí)學(xué)習(xí)、學(xué)習(xí)過程是否能夠收斂、對(duì)作戰(zhàn)仿真結(jié)果有何影響,都是有待深入研究的問題。由于作戰(zhàn)任務(wù)更加復(fù)雜,作戰(zhàn)系統(tǒng)組成更加多樣,有必要研究構(gòu)建能夠涵蓋多種作戰(zhàn)實(shí)體類型、適應(yīng)復(fù)雜多變環(huán)境的新型作戰(zhàn)體系。
3 基于Agent的作戰(zhàn)系統(tǒng)智能化研究框架
基于Agent概念,可涵蓋人工智能主要分支建立統(tǒng)一研究框架(圖1)。單體Agent智能涉及感知智能、認(rèn)知智能和行動(dòng)智能。感知智能為Agent提供數(shù)據(jù)獲取能力,是認(rèn)知智能的基礎(chǔ)。認(rèn)知智能使用感知數(shù)據(jù)進(jìn)行分析和決策,是行動(dòng)智能的前提。行動(dòng)智能實(shí)施認(rèn)知智能做出的決策,將思考轉(zhuǎn)化為行動(dòng)。群體智能是由多個(gè)簡單個(gè)體間通過協(xié)作表現(xiàn)出的智能行為,可與上述三種智能相結(jié)合,提高系統(tǒng)的整體效能。混合智能整合不同的智能類型,以實(shí)現(xiàn)復(fù)雜任務(wù)并適應(yīng)多變環(huán)境。該研究框架有望為作戰(zhàn)系統(tǒng)的一體化智能設(shè)計(jì)提供新范式。
3.1 感知智能
感知智能是指機(jī)器通過傳感器對(duì)所處環(huán)境進(jìn)行信息獲取,經(jīng)信息處理和理解建立環(huán)境模型來表達(dá)所處環(huán)境信息的能力。感知數(shù)據(jù)處理是情報(bào)分析和態(tài)勢(shì)感知的關(guān)鍵組成部分。圖像情報(bào)分析中,對(duì)物體目標(biāo)的識(shí)別、地形圖像的拼接以及人物目標(biāo)的檢測(cè)是目標(biāo)信息獲取、數(shù)據(jù)融合、目標(biāo)關(guān)聯(lián)、態(tài)勢(shì)感知、目標(biāo)引導(dǎo)等高層次情報(bào)分析的基礎(chǔ)。電子戰(zhàn)和情報(bào)收集中,語音識(shí)別技術(shù)可自動(dòng)解析截獲的通信內(nèi)容,處理
多變性
信號(hào)和噪聲干擾,適應(yīng)不同通信環(huán)境并解析通信內(nèi)容和意圖,為決策提供支持,還可以依托文本處理技術(shù)產(chǎn)生準(zhǔn)確、規(guī)范的文本處理產(chǎn)品,為情報(bào)分析提供技術(shù)支持。
3.2 認(rèn)知智能
認(rèn)知智能是基于感知信息及已有的經(jīng)驗(yàn)和知識(shí)進(jìn)行判斷、推理、學(xué)習(xí)、規(guī)劃并形成決策,類似于人類的分析、思考、理解和判斷等能力。在作戰(zhàn)系統(tǒng)中,知識(shí)庫和推理的結(jié)合為分析復(fù)雜數(shù)據(jù)提供了有力工具,可提高決策質(zhì)量、速度和適應(yīng)性。問題求解可用于輔助作戰(zhàn)決策、戰(zhàn)場(chǎng)模擬、戰(zhàn)略規(guī)劃以及無人系統(tǒng)的任務(wù)分配和路徑規(guī)劃。智能規(guī)劃與決策是無人機(jī)、無人車等自主系統(tǒng)以及模擬仿真、作戰(zhàn)任務(wù)規(guī)劃等軟件系統(tǒng)的核心技術(shù)。機(jī)器學(xué)習(xí)通過提升數(shù)據(jù)分析效率,增強(qiáng)威脅評(píng)估能力,優(yōu)化戰(zhàn)場(chǎng)態(tài)勢(shì)感知以及改進(jìn)作戰(zhàn)策略,提高作戰(zhàn)效率、預(yù)警能力和決策精準(zhǔn)度。
3.3 行動(dòng)智能
行動(dòng)智能是機(jī)器將決策轉(zhuǎn)化為實(shí)際行動(dòng)的能力,包括智能控制和機(jī)器人運(yùn)動(dòng)控制等。行動(dòng)智能的實(shí)現(xiàn)依賴于多種控制理論技術(shù)的綜合應(yīng)用,利用人工智能技術(shù)提升自主性,在各種環(huán)境中進(jìn)行智能響應(yīng)和操作。在作戰(zhàn)系統(tǒng)中,智能控制利用先進(jìn)的計(jì)算方法來優(yōu)化和自動(dòng)化武器系統(tǒng)的操作,使其能夠在復(fù)雜環(huán)境中執(zhí)行偵察、監(jiān)視、目標(biāo)定位和打擊任務(wù)。運(yùn)動(dòng)控制技術(shù)集感知、決策和行動(dòng)于一體,包括單體運(yùn)動(dòng)控制和群體運(yùn)動(dòng)控制,主要應(yīng)用于機(jī)器人和無人系統(tǒng)。
3.4 群體智能
群體智能體現(xiàn)在通過群體協(xié)作,聚合數(shù)量眾多的單體智能,實(shí)現(xiàn)復(fù)雜的智能行為。多Agent有助于克服單Agent的局限性,實(shí)現(xiàn)多流程并行處理,提高系統(tǒng)運(yùn)行可靠性。在作戰(zhàn)仿真中,多Agent系統(tǒng)可用于模擬多方力量的交互和協(xié)作,以及網(wǎng)絡(luò)中心戰(zhàn)等應(yīng)用場(chǎng)景,幫助指揮員理解和預(yù)測(cè)可能的行動(dòng)結(jié)果,還可以通過將軍事對(duì)抗轉(zhuǎn)化為博弈問題,利用人工智能技術(shù)解決意圖判斷、威脅評(píng)估與指揮控制等問題,提高決策水平。
3.5 混合智能
混合智能是以生物智能和機(jī)器智能的深度融合為目標(biāo),通過連接通道,建立兼具生物的環(huán)境感知、記憶、推理、學(xué)習(xí)能力,以及機(jī)器的信息整合、搜索、計(jì)算能力的高性能智能形態(tài)。在作戰(zhàn)系統(tǒng)中,人機(jī)交互技術(shù)的發(fā)展使得人能夠自然、高效地與機(jī)器交流和協(xié)作,增強(qiáng)人機(jī)互動(dòng)效率和效果。目前,無人系統(tǒng)在復(fù)雜動(dòng)態(tài)環(huán)境下完全自主運(yùn)行仍存在很大挑戰(zhàn),要遵循“平臺(tái)無人、系統(tǒng)有人”的特點(diǎn),通過人與無人系統(tǒng)之間的智能交互和協(xié)同控制,實(shí)現(xiàn)人在回路的環(huán)境感知、態(tài)勢(shì)判斷、任務(wù)規(guī)劃、決策、行動(dòng)等能力[12]。
4 Agent在作戰(zhàn)系統(tǒng)中的應(yīng)用方式
Agent的常見應(yīng)用模式包括:反思,Agent通過交互學(xué)習(xí)和反思來優(yōu)化決策;工具使用,Agent通過調(diào)用多種工具來完成任務(wù),這些工具可以是軟件應(yīng)用程序、算法、硬件設(shè)備或其他能幫助Agent實(shí)現(xiàn)其目標(biāo)的資源;規(guī)劃,Agent規(guī)劃出一系列行動(dòng)步驟來達(dá)到目標(biāo);多Agent協(xié)作,涉及多Agent之間的交互與協(xié)同。本文以此為基礎(chǔ),結(jié)合作戰(zhàn)任務(wù)需求,構(gòu)建基于反思的單體Agent、基于規(guī)劃的作戰(zhàn)任務(wù)規(guī)劃Agent、基于仿真的平行推演Agent以及基于協(xié)作的多Agent系統(tǒng)等。
4.1 基于反思的單體Agent
現(xiàn)代戰(zhàn)場(chǎng)上,戰(zhàn)爭(zhēng)“迷霧”是由于大量信息無法得到快速處理和理解造成的。Agent技術(shù)
可
高效處理海量數(shù)據(jù),實(shí)現(xiàn)精準(zhǔn)態(tài)勢(shì)認(rèn)知,為決策和行動(dòng)提供依據(jù)。
以態(tài)勢(shì)認(rèn)知為例,單體Agent內(nèi)部包含配置、記憶、認(rèn)知和行動(dòng)等基本模塊。配置模塊定義Agent的基本特征和屬性,如身份、角色、能力等。記憶模塊負(fù)責(zé)存儲(chǔ)Agent的歷史信息和經(jīng)驗(yàn),包括過去的狀態(tài)、行為和環(huán)境反饋。認(rèn)知模塊中,Agent根據(jù)其目標(biāo)、當(dāng)前狀態(tài)以及環(huán)境信息,形成綜合認(rèn)知結(jié)果。行動(dòng)模塊基于實(shí)時(shí)態(tài)勢(shì)和預(yù)測(cè)分析,提供作戰(zhàn)建議和優(yōu)化策略。此外,Agent還可能包含通信、多傳感器融合、效果評(píng)估等組件,以提高其在復(fù)雜環(huán)境中的有效性和適應(yīng)性。
反思和自省對(duì)提升Agent性能具有關(guān)鍵作用。Agent對(duì)既往行為進(jìn)行反思,從錯(cuò)誤中學(xué)習(xí),完善認(rèn)知過程,可提高結(jié)果質(zhì)量。反思過程中,系統(tǒng)評(píng)估當(dāng)前的行為產(chǎn)出,比較當(dāng)前輸出與期望結(jié)果的差距,識(shí)別其中的問題或不足之處。在自省過程中,基于反思識(shí)別的問題,調(diào)整其態(tài)勢(shì)認(rèn)知過程或行為策略,必要時(shí)發(fā)展全新的策略或方法。
Agent
通過不斷自我評(píng)估和調(diào)整,使系統(tǒng)能夠?qū)W習(xí)并改進(jìn)認(rèn)知過程,更有效應(yīng)對(duì)復(fù)雜問題。
4.2 基于規(guī)劃的作戰(zhàn)任務(wù)規(guī)劃Agent與基于仿真的平行推演Agent
將Agent應(yīng)用于作戰(zhàn)任務(wù)規(guī)劃與仿真,可對(duì)戰(zhàn)場(chǎng)環(huán)境中的作戰(zhàn)實(shí)體進(jìn)行精確描述,為實(shí)際作戰(zhàn)提供理論依據(jù)和策略支持。圖2為基于Agent的作戰(zhàn)任務(wù)規(guī)劃與平行推演框架。
作戰(zhàn)任務(wù)規(guī)劃Agent通過智能傳感器網(wǎng)絡(luò)獲取多模態(tài)感知信息,在內(nèi)部規(guī)劃系統(tǒng)中根據(jù)給定的作戰(zhàn)目標(biāo)分解復(fù)雜任務(wù),制定具體作戰(zhàn)計(jì)劃,基于作戰(zhàn)決策給集群作戰(zhàn)單元下達(dá)作戰(zhàn)指令。智能傳感器網(wǎng)絡(luò)由大量傳感器節(jié)點(diǎn)組成,單個(gè)節(jié)點(diǎn)具有環(huán)境信息采集和數(shù)據(jù)處理功能,可在調(diào)度下進(jìn)行主動(dòng)環(huán)境感知和通信。作戰(zhàn)任務(wù)規(guī)劃Agent專注于制定計(jì)劃和提供決策支持,利用規(guī)劃能力確定最佳行動(dòng)方案。集群作戰(zhàn)單元通過協(xié)作共同完成任務(wù),為規(guī)劃系統(tǒng)提供行動(dòng)反饋。
平行推演Agent側(cè)重于模擬不同的未來情景來優(yōu)化決策,通過創(chuàng)建可能的未來情境來測(cè)試計(jì)劃的有效性,幫助決策者理解潛在的結(jié)果和風(fēng)險(xiǎn)。平行推演Agent接收并處理實(shí)時(shí)數(shù)據(jù),動(dòng)態(tài)生成仿真實(shí)體,并根據(jù)實(shí)時(shí)數(shù)據(jù)進(jìn)行修正,以適應(yīng)環(huán)境變化。通過對(duì)作戰(zhàn)計(jì)劃的分析預(yù)測(cè),提供對(duì)未來發(fā)展的深入見解,為決策提供支持。
4.3 基于協(xié)作的多Agent系統(tǒng)
針對(duì)聯(lián)合作戰(zhàn)等復(fù)雜任務(wù),情報(bào)分析Agent、態(tài)勢(shì)感知Agent、作戰(zhàn)任務(wù)規(guī)劃Agent、平行推演Agent以及戰(zhàn)略支援Agent等組成了多Agent系統(tǒng)。多Agent系統(tǒng)具有以下優(yōu)勢(shì):1)數(shù)量優(yōu)勢(shì),每個(gè)Agent從事特定工作,結(jié)合多個(gè)Agent的技能優(yōu)勢(shì)和領(lǐng)域知識(shí),可提高系統(tǒng)效率和通用性;2)質(zhì)量優(yōu)勢(shì),多個(gè)Agent對(duì)同一問題可能產(chǎn)生不同觀點(diǎn),Agent通過通信并結(jié)合自身知識(shí)不斷更新觀點(diǎn),可有效減少虛假信息,提高結(jié)果可靠性[13]。
交互是多Agent協(xié)同工作的關(guān)鍵,常見的交互方式有合作、競(jìng)爭(zhēng)、協(xié)商、自組織和反饋等。不同Agent可通過角色分配和協(xié)調(diào)實(shí)現(xiàn)復(fù)雜任務(wù)的有效分工和執(zhí)行。例如,CAMEL探索了溝通式Agent,提出“角色扮演”的社會(huì)型多Agent框架[14]。通過觀察其他Agent的行為和結(jié)果,Agent學(xué)習(xí)新的策略和行為模式,提高自身性能。負(fù)向反饋可用來抑制某些不希望出現(xiàn)的行為,促進(jìn)系統(tǒng)穩(wěn)定運(yùn)行。系統(tǒng)還可以根據(jù)任務(wù)需求和環(huán)境變化,動(dòng)態(tài)調(diào)整Agent之間的關(guān)系和組織結(jié)構(gòu)[15]。
戰(zhàn)場(chǎng)環(huán)境中,通信可能受干擾,計(jì)算資源受限,存在對(duì)抗攻擊風(fēng)險(xiǎn),實(shí)時(shí)性要求高,對(duì)多Agent系統(tǒng)設(shè)計(jì)提出了高要求[16]。研究者開發(fā)了多種分布式?jīng)Q策算法,如分布式馬爾可夫決策過程、多Agent強(qiáng)化學(xué)習(xí)等,以實(shí)現(xiàn)通信受限環(huán)境下的協(xié)同作戰(zhàn)。通過自組織網(wǎng)絡(luò)技術(shù),多Agent系統(tǒng)可在通信不穩(wěn)定或中斷時(shí),自動(dòng)調(diào)整通信結(jié)構(gòu),保持系統(tǒng)整體功能。設(shè)計(jì)冗余系統(tǒng)和自愈算法可提高系統(tǒng)的抗毀傷能力和自我修復(fù)能力。
4.4 基于Agent的作戰(zhàn)系統(tǒng)應(yīng)用舉例
假定戰(zhàn)場(chǎng)地形復(fù)雜、
天氣多變,我方作戰(zhàn)任務(wù)是奪取敵方城市中心的指揮中心,同時(shí)保護(hù)我方關(guān)鍵基礎(chǔ)設(shè)施,并最小化行動(dòng)對(duì)平民及城市設(shè)施的影響。我方裝備了最新的人工智能驅(qū)動(dòng)的作戰(zhàn)系統(tǒng),包括無人作戰(zhàn)飛機(jī)、精確制導(dǎo)武器以及高度自動(dòng)化的指揮和控制系統(tǒng)。敵方擁有一定數(shù)量的傳統(tǒng)武裝力量,包括步兵、坦克、火炮等,主要依賴傳統(tǒng)戰(zhàn)術(shù)執(zhí)行防御任務(wù)。
作戰(zhàn)過程包括五個(gè)階段。在初始階段,偵察Agent部署裝備有光學(xué)、紅外、雷達(dá)等多種傳感器的無人機(jī)進(jìn)行全天候偵察,通過數(shù)據(jù)融合技術(shù)實(shí)現(xiàn)對(duì)敵方部署的實(shí)時(shí)監(jiān)控。情報(bào)分析Agent利用深度學(xué)習(xí)算法分析收集到的大量數(shù)據(jù),快速識(shí)別敵方布防漏洞,自動(dòng)生成攻擊建議。在計(jì)劃階段,任務(wù)規(guī)劃Agent基于情報(bào)分析結(jié)果,利用優(yōu)化算法評(píng)估不同攻擊路徑和戰(zhàn)術(shù)的成功率,自動(dòng)生成多套作戰(zhàn)方案供指揮官選擇。作戰(zhàn)仿真Agent通過高精度戰(zhàn)場(chǎng)仿真模型,模擬不同作戰(zhàn)方案的執(zhí)行效果,預(yù)測(cè)戰(zhàn)場(chǎng)變量和潛在風(fēng)險(xiǎn)。在執(zhí)行階段,武器控制Agent指揮無人機(jī)群和精確制導(dǎo)武器,實(shí)施精準(zhǔn)打擊,同時(shí)監(jiān)控打擊效果,動(dòng)態(tài)調(diào)整攻擊策略。戰(zhàn)斗執(zhí)行Agent在無人機(jī)的支援下,迅速機(jī)動(dòng)我方精銳部隊(duì),利用精確火力摧毀敵方重要目標(biāo)。在調(diào)整階段,情報(bào)分析Agent與任務(wù)規(guī)劃Agent持續(xù)監(jiān)控戰(zhàn)場(chǎng)態(tài)勢(shì),根據(jù)實(shí)時(shí)情報(bào)調(diào)整作戰(zhàn)計(jì)劃,必要時(shí)改變攻擊目標(biāo)或增援。在結(jié)束階段,所有Agent協(xié)同作戰(zhàn),確保完全控制敵方指揮中心,同時(shí)保護(hù)我方重要設(shè)施和平民安全。通信管理Agent采用加密通信技術(shù),確保作戰(zhàn)過程中的通信安全和信息傳輸?shù)目煽啃浴?/p>
在作戰(zhàn)系統(tǒng)內(nèi)部,對(duì)各Agent進(jìn)行統(tǒng)一的結(jié)構(gòu)設(shè)計(jì),為每個(gè)Agent設(shè)計(jì)標(biāo)準(zhǔn)化的輸入/輸出接口,確保它們能夠以統(tǒng)一的方式接收和發(fā)送信息。Agent內(nèi)包括配置、記憶、認(rèn)知和行動(dòng)等模塊,根據(jù)不同功能允許內(nèi)部處理機(jī)制的多樣性。制定統(tǒng)一的數(shù)據(jù)格式和協(xié)議,確保在不同Agent之間交換信息的一致性,減少解析上的誤差和延遲。所有Agent都遵循同一套行動(dòng)協(xié)議,規(guī)定在特定情況下的行動(dòng)策略和響應(yīng)方式,從而保證各Agent的行為一致和可預(yù)測(cè)??紤]系統(tǒng)對(duì)可靠性和實(shí)時(shí)性的高要求,設(shè)計(jì)具有魯棒性的通信結(jié)構(gòu),確保在任何Agent失效時(shí),系統(tǒng)仍能保持運(yùn)行。
5 基于Agent的作戰(zhàn)系統(tǒng)智能化發(fā)展趨勢(shì)
隨著大模型和Agent技術(shù)的進(jìn)步,Agent系統(tǒng)呈現(xiàn)出更復(fù)雜、更智能、更協(xié)作的發(fā)展趨勢(shì)。Agent有望融合大模型的認(rèn)知能力、具身智能的行動(dòng)能力和群體智能的協(xié)作能力,在作戰(zhàn)系統(tǒng)效能提升中發(fā)揮更大作用。
5.1 與大模型相結(jié)合提升作戰(zhàn)Agent的自主性
大模型在語言理解、決策制定及泛化能力等方面展現(xiàn)出巨大潛力,為Agent突破帶來了契機(jī)[17]。一方面,大模型龐大的訓(xùn)練集包含了大量人類行為數(shù)據(jù),為模擬類人交互奠定了基礎(chǔ);另一方面,大模型涌現(xiàn)出上下文學(xué)習(xí)、推理、思維鏈等類人思考能力,可作為Agent的“大腦”,實(shí)現(xiàn)復(fù)雜問題拆解。Agent允許用戶進(jìn)行復(fù)雜的交互和任務(wù)協(xié)調(diào),根據(jù)給定目標(biāo)自動(dòng)創(chuàng)建合適的提示詞,更好地激發(fā)大模型的推理能力。
如圖3所示,基于大模型的Agent 包括規(guī)劃、記憶與工具調(diào)用等模塊[18]。規(guī)劃模塊負(fù)責(zé)將復(fù)雜目標(biāo)拆解為可執(zhí)行的子任務(wù),并動(dòng)態(tài)調(diào)整執(zhí)行策略,以靈活應(yīng)對(duì)不確定性。任務(wù)分解過程基于思維鏈實(shí)現(xiàn),通過明確展示解決問題的邏輯步驟,增強(qiáng)大模型的透明度和可解釋性。工具調(diào)用模塊使Agent能夠利用外部工具來執(zhí)行具體任務(wù),如數(shù)據(jù)庫查詢、科學(xué)計(jì)算、圖像處理等。工具作為使用者能力的擴(kuò)展,可在專業(yè)性、事實(shí)性、可解釋性等方面提供幫助。記憶模塊在多輪對(duì)話中保持上下文,維護(hù)Agent的世界知識(shí)和既有經(jīng)驗(yàn)。
將大模型與Agent相結(jié)合,可提高作戰(zhàn)系統(tǒng)的自主水平和決策速度。大語言模型在情報(bào)分析、作戰(zhàn)規(guī)劃、輔助決策等方面展現(xiàn)出應(yīng)用潛力[19]。2023年4月,美海軍陸戰(zhàn)隊(duì)測(cè)試了“赫爾墨斯”(Hermes)大語言模型在戰(zhàn)役級(jí)作戰(zhàn)規(guī)劃方面的能力。5月,美陸軍在機(jī)密網(wǎng)部署生成式人工智能系統(tǒng)“多諾萬”(Donovan),用于快速情報(bào)分析和決策支持。7月,美空軍在“全球信息優(yōu)勢(shì)”實(shí)驗(yàn)中測(cè)試了5種生成式大模型,以提高獲取和處理作戰(zhàn)信息的速度。2023年7月,淵亭科技發(fā)布國內(nèi)首個(gè)軍事領(lǐng)域大模型“天機(jī)·軍事”,融合知識(shí)圖譜、強(qiáng)化學(xué)習(xí)、運(yùn)籌優(yōu)化等技術(shù),服務(wù)于作戰(zhàn)指揮、無人集群協(xié)同、策略仿真等應(yīng)用場(chǎng)景。
基于大語言模型的Agent可用來模擬歷史戰(zhàn)爭(zhēng)和未來沖突場(chǎng)景,幫助分析和預(yù)測(cè)戰(zhàn)爭(zhēng)的各種可能性。例如,Hua等提出基于大語言模型的多Agent系統(tǒng)WarAgent,模擬了多次歷史國際沖突[20]。盡管大模型無法完全再現(xiàn)人類行為的復(fù)雜性,但其展現(xiàn)了在復(fù)雜情境重現(xiàn)、動(dòng)態(tài)假設(shè)場(chǎng)景模擬、外交政策決策計(jì)算等方面的潛力。
5.2 與虛實(shí)環(huán)境交互學(xué)習(xí)的作戰(zhàn)Agent實(shí)現(xiàn)自主進(jìn)化
近年來,元宇宙概念下的眾多新技術(shù),包括增強(qiáng)現(xiàn)實(shí)(Augmented Reality,AR)、虛擬現(xiàn)實(shí)(Virtual Reality,VR)、頭顯、3D建模及人工智能虛擬環(huán)境,在軍事領(lǐng)域得到廣泛應(yīng)用[21]。Agent可作為元宇宙中的智能助手,通過模擬實(shí)驗(yàn)對(duì)軍事行動(dòng)和武器裝備性能進(jìn)行預(yù)測(cè)、優(yōu)化和評(píng)估,或作為虛擬世界的參與者,與人類進(jìn)行交互和協(xié)作。
在沙盒模型等虛擬環(huán)境中的自由探索,為Agent學(xué)習(xí)提供了足夠的交互數(shù)據(jù)和試錯(cuò)機(jī)會(huì)。AutoGPT、MetaGPT、CAMEL、GPT Engineer等應(yīng)用實(shí)例展現(xiàn)出了令人矚目的多樣性和強(qiáng)大性能。只需要提供要扮演的角色、描述和目標(biāo),AutoGPT就能利用GPT-4和搜索等工具,自主分解任務(wù)、執(zhí)行操作并完成任務(wù)。2023年5月,英偉達(dá)AI Agent Voyager接入GPT-4,通過自主編寫代碼,完全獨(dú)霸了《我的世界》,在游戲中進(jìn)行全場(chǎng)景的終身學(xué)習(xí)。商湯、清華等共同提出了通才AI Agent GITM[22],能夠通過自主學(xué)習(xí)完成任務(wù),表現(xiàn)優(yōu)異。
Agent也展現(xiàn)了在物理世界中進(jìn)行多模態(tài)理解和學(xué)習(xí)的能力[23]。針對(duì)具身智能的研究關(guān)注Agent在物理世界中有效操作的能力,以及與人類在共享空間中的安全交互,主要方法是從演示或反饋中學(xué)習(xí),讓Agent在使用工具方面具備泛化能力。通過持續(xù)學(xué)習(xí)和強(qiáng)化學(xué)習(xí),Agent在與環(huán)境交互中自我迭代和升級(jí),自主規(guī)劃任務(wù)、開發(fā)代碼、調(diào)動(dòng)工具、優(yōu)化路徑,從而實(shí)現(xiàn)目標(biāo)。未來,Agent可能會(huì)自給自足地制造工具,從而提高其自主性和獨(dú)立性。
5.3 作戰(zhàn)Agent實(shí)際應(yīng)用面臨嚴(yán)格的風(fēng)險(xiǎn)評(píng)估
作戰(zhàn)Agent應(yīng)用于自主決策和人機(jī)協(xié)作等方面,這可能引發(fā)安全、倫理及法律問題,包括如何確保Agent的行為符合人類價(jià)值觀,如何避免其被誤用甚至濫用,如何防止泄密和保證數(shù)據(jù)安全。Agent應(yīng)用風(fēng)險(xiǎn)包括:1)本體性風(fēng)險(xiǎn),即Agent可能超出人類的控制范圍;2)能動(dòng)性風(fēng)險(xiǎn),即Agent可能在沒有人類指令的情況下采取行動(dòng);3)意外性風(fēng)險(xiǎn),即系統(tǒng)故障可能導(dǎo)致的意外傷害。
Agent技術(shù)成熟度仍有待提高。通常Agent只能在特定領(lǐng)域內(nèi)有效工作,對(duì)難以表征或遷移的角色,需要通過針對(duì)性地模型微調(diào)來提高性能。面對(duì)可能的對(duì)抗性攻擊,Agent設(shè)計(jì)需要足夠魯棒,以防微小變化導(dǎo)致可靠性問題。作戰(zhàn)Agent需要具有非常強(qiáng)的適應(yīng)性和可解釋性,以通過嚴(yán)格的測(cè)試和監(jiān)管。目前,Agent性能評(píng)估缺乏統(tǒng)一標(biāo)準(zhǔn),不同Agent系統(tǒng)間難以比較優(yōu)劣?;谏鲜鲈?,Agent在作戰(zhàn)系統(tǒng)中的大多數(shù)應(yīng)用將增強(qiáng)而非取代人類的作用。
6 結(jié)束語
隨著戰(zhàn)爭(zhēng)的復(fù)雜性、對(duì)抗性和實(shí)時(shí)性加劇,預(yù)期Agent技術(shù)將在作戰(zhàn)系統(tǒng)優(yōu)化中發(fā)揮關(guān)鍵作用。通過將Agent技術(shù)集成到作戰(zhàn)系統(tǒng)的各個(gè)環(huán)節(jié),可實(shí)現(xiàn)快速目標(biāo)識(shí)別、威脅評(píng)估和戰(zhàn)術(shù)執(zhí)行,使軍事行動(dòng)更加高效和準(zhǔn)確。隨著大語言模型的發(fā)展,Agent在理解和生成自然語言方面的能力不斷提升,人機(jī)協(xié)同將更加自然高效。但是,Agent在作戰(zhàn)系統(tǒng)中的應(yīng)用仍面臨諸多困難和挑戰(zhàn)。面對(duì)資源受限的開放環(huán)境,Agent的數(shù)據(jù)分析和推理是不充分的。需要引入先驗(yàn)知識(shí)并使用驗(yàn)證工具,彌補(bǔ)數(shù)據(jù)統(tǒng)計(jì)分析的不足。同時(shí),需要在技術(shù)、道德、法律等方面對(duì)Agent系統(tǒng)進(jìn)行協(xié)調(diào)和管控,以保證其在軍事領(lǐng)域的應(yīng)用安全、可靠、合法、有效。
參考文獻(xiàn):
[1] 孫怡峰,廖樹范,吳疆,等.基于大模型的態(tài)勢(shì)認(rèn)知智能體[J].指揮控制與仿真,2024,46(2):1-7.
SUN Y F, LIAO S F, WU J, et al. Research on situation awareness Agent based on large models[J]. Command Control & Simulation, 2024, 46(2): 1-7.
[2] 李耀宇,金帥,馬滿好,等.無人空戰(zhàn)指控建模仿真方法研究[J].指揮控制與仿真,2024,46(1):85-92.
LI Y Y, JIN S, MA M H, et al. Unmanned air combat oriented command and control simulation evaluation research[J]. Command Control &Simulation, 2024, 46(1): 85-92.
[3] 許霄,李東,郭圣明,等. 面向聯(lián)合作戰(zhàn)兵棋推演的智能決策建??蚣埽跩]. 指揮與控制學(xué)報(bào), 2023, 9(4): 449-456.
XU X, LI D, GUO S M, et al. An intelligent decision-making modeling architecture for joint operation-oriented wargaming[J]. Journal of Command and Control, 2023, 9(4): 449-456.
[4] 斯圖爾特·羅素, 皮特·諾威格. 人工智能——一種現(xiàn)代的方法[M].3版. 殷建平, 祝恩, 劉越, 等譯. 北京: 清華大學(xué)出版社, 2013.
RUSSELL S, NORVIG P. Artificial intelligence: a modern approach[M]. 3rd ed. Beijing: Tsinghua University Press, 2013.
[5] 劉永紅, 薛青, 曹波偉, 等. 基于指令機(jī)制的作戰(zhàn)Agent體系結(jié)構(gòu)研究[J]. 計(jì)算機(jī)仿真, 2011(z1): 120-123.
LIU Y H, XUE Q, CAO B W, et al. Research on the architecture of combat agents based on command mechanism[J]. Computer Simulation, 2011(z1): 120-123.
[6] CERNUZZI L, ZAMBONELLI F. Improving comparative analysis for the evaluation of AOSE methodologies[J]. International Journal of Agent-oriented Software Engineering, 201l, 4(4): 331-352.
[7] DAM H K, WNIKOFF M. Towards a next-generation AOSE methodology[J]. Science of Computer Programming, 2013, 78(6): 684-694.
[8] 蒲瑋,李雄. 基于Agent行動(dòng)圖的作戰(zhàn)建模方法[J]. 系統(tǒng)工程與電子技術(shù), 2017, 39(4): 795-805.
PU W, LI X. Research on warfare modeling method based on Agent action diagrams[J]. Journal of Systems Engineering and Electronics, 2017, 39(4): 795-805.
[9] 胡曉峰, 司光亞. 戰(zhàn)爭(zhēng)復(fù)雜系統(tǒng)建模與仿真[M]. 北京: 國防大學(xué)出版社, 2006: 3.
HU X F, SI G Y. Modeling and simulation of complex warfare systems[M]. Beijing: National Defense University Press, 2006: 3.
[10]王步云,劉聚. 作戰(zhàn)Agent的學(xué)習(xí)算法研究進(jìn)展與發(fā)展趨勢(shì)[J]. 兵工自動(dòng)化, 2023, 42(9): 74-78,96.
WANG B Y, LIU J. Research progress and development trend on learning algorithm of combat Agent[J]. Ordnance Industry Automation, 2023, 42(9): 74-78,96.
[11]石鼎, 燕雪峰, 宮麗娜, 等. 強(qiáng)化學(xué)習(xí)驅(qū)動(dòng)的海戰(zhàn)場(chǎng)多智能體協(xié)同作戰(zhàn)仿真算法[J]. 系統(tǒng)仿真學(xué)報(bào), 2023, 35(4): 786-796.
SHI D, YAN X F, GONG L, et al. Multi-agent cooperative combat simulation in naval battlefield with reinforcement learning[J]. Journal of System Simulation, 2023, 35(4): 786-796.
[12]牛軼峰, 王菖, 冷新宇, 等. 自主無人系統(tǒng)及應(yīng)用中的問題[M]. 北京: 科學(xué)出版社, 2024.
NIU Y F, WANG C, LENG X Y, et al. Issues in autonomous unmanned systems and applications[M]. Beijing: Science Press, 2024.
[13]張奇,桂韜,鄭銳,等. 大規(guī)模語言模型——從理論到實(shí)踐[M]. 北京: 電子工業(yè)出版社, 2024.
ZHANG Q, GUI T, ZHENG R, et al. Large-scale language models: from theory to practice[M]. Beijing: Publishing House of Electronics Industry, 2024.
[14]Guohao Li, Hasan Abed Al Kader Hammoud, Hani Itani, et al. Camel: communicative agents for "mind" exploration of large scale language model society[J]. 2023, arXiv preprint arXiv: 2303.17760.
[15]Zijun L, Yanzhe Z, Peng L, et al. Dynamic LLM-Agent network: an llm-agent collaboration framework with Agent team optimization[J]. 2023, arXiv preprint arXiv: 2310.02170.
[16]張堃,華帥,袁斌林,等. 基于Multi-Agent的無人機(jī)集群體系自主作戰(zhàn)系統(tǒng)設(shè)計(jì)[J]. 系統(tǒng)工程與電子技術(shù), 2024, 46(4): 1 273-1 286.
ZHANG K, HUA S, YUAN B L, et al. Design of autonomous combat system of unmanned cluster system based on Multi-Agent[J]. Systems Engineering and Electronics, 2024, 46(4): 1 273-1 286.
[17]Masterman T, et al. The landscape of emerging AI Agent architectures for reasoning, planning, and tool calling: a survey[EB/OL]. 2024. arXiv: 2404.11584.
[18]Xi Z, Chen W, Guo X, et al. The rise and potential of large language model based agents: A survey[EB/OL]. 2023, arXiv preprint arXiv: 2309.07864.
[19]王立盟. 2023年國外軍事人工智能領(lǐng)域科技發(fā)展綜述[J]. 戰(zhàn)術(shù)導(dǎo)彈技術(shù), 2024 (2): 17-26.
WANG L M. An overview of science and technology development of foreign artificial intelligence in the military in 2023[J]. Tactical Missile Technology, 2024 (2): 17-26.
[20]Hua W, Fan L, Li L, et al. lP17pj3ZJHSfgpnOjM006Q==War and peace (warAgent): large language model-based multi-agent simulation of world wars[EB/OL]. 2023, arXiv preprint arXiv: 2311.17227.
[21]張昭,郭玉杰,趙曉寧,等. 軍事元宇宙芻議與展望[J]. 系統(tǒng)仿真學(xué)報(bào), 2023, 35(7): 1 421-1 437.
ZHANG Z, GUO Y J, ZHAO X M, et al. Military metaverse: key technologies, potential applications and future directions[J]. Journal of System Simulation, 2023, 35(7): 1 421-1 437.
[22]Zhu X, Chen Y, Tian H, et al. Ghost in the minecraft: generally capable agents for open-world environments via large language models with text-based knowledge and memory[EB/OL]. 2023, arXiv preprint arXiv: 2305.17144.
[23]Durante Z, Huang Q, Wake N, et al. Agent AI: surveying the horizons of multimodal interaction[EB/OL]. 2024, arXiv preprint arXiv: 2401.03568.
(責(zé)任編輯:李楠)