沈 震 劉雅婷 董西松 白天翔 胡 斌 熊 剛 王飛躍
在信息化戰(zhàn)場和人工智能迅猛發(fā)展的時代背景下,全世界各發(fā)達國家掀起了新時期軍事理論與應用研究的潮流.在我國2015國防白皮書《中國的軍事戰(zhàn)略》的指引下,我軍加快推進國防信息化建設,從而提高我軍打贏未來信息化戰(zhàn)爭的能力.無人機(Unmanned Aerial Vehicle,UAV)是一種不要駕駛員進行手動操作,完全在電子設備的監(jiān)控下執(zhí)行任務的飛行器,由于其機動靈活、零人員傷亡風險、價格相對低廉等優(yōu)點在現(xiàn)代戰(zhàn)爭中可以發(fā)揮極其重要的作用,被廣泛應用于軍事電子偵察、電子對抗、全天候預警、遠距離攻擊、軍事地形航拍測繪等任務.
2017年,所謂的StratoEnergetics公司發(fā)布了一個關(guān)于蜂群無人機搜索、鎖定并擊殺個人的視頻,在網(wǎng)絡上引起軒然大波.視頻中,政府使用微型無人機,利用人臉識別技術(shù)搜索并鎖定受害人,然后快速飛向受害人,在其來不及躲避時利用其攜帶的3g炸藥擊中受害人面部完成擊殺.由于無人機的小型化、廉價、靈活,現(xiàn)有防空系統(tǒng)根本無力對其防御,如圖1所示.在網(wǎng)絡上引起了激烈討論.雖然實際上這只是由一家不存在公司對其虛構(gòu)的“產(chǎn)品”發(fā)布的一個概念性視頻,其初衷是為了讓人們意識到自主武器的可怕之處以警醒世人,仍然不禁讓人懷疑這是否就是未來戰(zhàn)爭的發(fā)展方向,也讓人們得以一瞥未來以無人機集群為主宰的戰(zhàn)爭.
對無人機的研究可追溯至第一次世界大戰(zhàn)時期,在20世紀末期形成了3股發(fā)展浪潮,其應用領域逐漸涵蓋師級戰(zhàn)術(shù)系統(tǒng)、旅團級戰(zhàn)術(shù)指揮、高空長航時監(jiān)測偵查等.典型裝備包括美國的“捕食者”、“全球鷹”,以色列的“蒼鷺”,法國的“鷹”,以及我國的“翼龍”、“翔龍”、“利劍”等.2015年,美國的X47-B型隱形無人機完成航母起飛、著艦及空中加油測試,將無人機單體性能提升到新的高度.然而,從無人機的發(fā)展趨勢看,無人機是在逐漸降低成本提高飛行效率的基礎上向適應復雜環(huán)境的方向發(fā)展,因而如何通過多無人機協(xié)同使其具有更高的智能性和更強的功能性是未來的主要研究方向,也是我國無人機技術(shù)彎道超車的機遇.
無人機集群作戰(zhàn)是指具備自主能力的多架無人機通過多機組網(wǎng)、編隊飛行、協(xié)同配合對目標或區(qū)域?qū)嵤┧阉?、偵察、打擊、干擾、戰(zhàn)術(shù)壓制等作戰(zhàn)任務[1].多無人機集群相互配合工作的模式按照其構(gòu)成一般可分為兩類,一類為多無人機搭載不同偵查與作戰(zhàn)設備實現(xiàn)相互配合,另一類為數(shù)量眾多的同構(gòu)廉價無人機組成蜂群配合其他戰(zhàn)術(shù)裝備進行作戰(zhàn).
經(jīng)過多年的發(fā)展,無人機集群的作戰(zhàn)樣式愈加豐富,包括大范圍目標搜索與探測、對目標的實時跟蹤與全天候監(jiān)控、干擾壓制敵方防空系統(tǒng)、誘騙敵方雷達并實施電子戰(zhàn)、對軍事目標實施飽和打擊、集群突防、消耗敵方高價值防控資源掩護其他作戰(zhàn)單位、對抗敵軍無人系統(tǒng)等.無人機集群協(xié)同作戰(zhàn)甚至可以使世界上最先進的防御系統(tǒng)失效,如2012年P(guān)ham的研究[2]展示,約10架左右無人機組成集群攻擊就可以有無人機避開攔截,突破美軍驅(qū)逐艦的“宙斯盾”防御系統(tǒng).2011年,美國MIT研制了山鶉無人機,并于2014年投入實驗,該無人機由凱夫拉合成纖維和碳纖維通過3D打印制造,質(zhì)量極輕、體積小,可由F-16戰(zhàn)機搭載多達30架進行戰(zhàn)場投放,對敵方防空系統(tǒng)執(zhí)行干擾欺騙.2015年,美國海軍公布LOCUST項目,該項目使用“郊狼”無人機進行集群式發(fā)射,可以從艦艇或戰(zhàn)機上通過發(fā)射管發(fā)射,在發(fā)射后形成集群對敵方進行火力壓制.該型無人機不依賴GPS,基于慣性導航以及光電或紅外傳感器即可實現(xiàn)導航,具有去中心化、自主化、自治化的特點;同年,美國五角大樓展示了“蟬”式微型無人機,該無人機構(gòu)造簡單,僅由10個通用部件組成,無引擎,其機體約為手機大小,設計用于集群化對敵探測及電磁干擾任務.2015年下半年,美國DARPA發(fā)布其“小精靈”Gremlins項目,該項目設想使用C-130運輸機等于防區(qū)外投射無人機蜂群,在對敵實施偵察或電子戰(zhàn)任務后回收幸存的無人機,該設想類似于一種空中無人機航母.該項目旨在探索采用傳統(tǒng)飛機為載體,在拒止環(huán)境中替代隱形攻擊機來突破敵軍防御系統(tǒng),以顯著降低在對抗環(huán)境中的作戰(zhàn)成本,如圖2所示.由此可見無人機集群作戰(zhàn)已成為美國海陸空三軍的重點發(fā)展方向,各部逐漸加大對無人機系統(tǒng)的開發(fā)與應用力度,將在未來戰(zhàn)場中發(fā)揮重要作用.
我國國土幅員遼闊,邊境海防線長,周邊國際形勢復雜,亟需發(fā)展無人機補充我國的軍事航空力量.我國的無人機技術(shù)發(fā)展迅速,但與先進國家相比,尤其是美國,仍存在較大差距.國內(nèi)的無人機系統(tǒng)載重不大,難以滿足電子對抗、預警、偵察等大型任務的系統(tǒng)要求,平臺技術(shù)難以滿足高隱身、高機動力的作戰(zhàn)需求,且在發(fā)動機、空氣動力、材料結(jié)構(gòu)、高精度導航方面的基礎相對薄弱.作為應對,我國應大力發(fā)展多無人機集群項目,利用群體智能抵消個體差距,形成我軍特色的無人機體系.然而,如何高效指揮與控制無人機集群,提升無人機集群的信息化、網(wǎng)絡化、智能化程度,研發(fā)符合未來無人機集群對抗模型的新理念、新方法與新體系仍是我軍的重要任務與使命.
中科院自動化研究所王飛躍研究員于2004年提出ACP平行系統(tǒng)方法,為解決復雜系統(tǒng)管理與控制問題提出了新的解決思路,并于2012年提出平行軍事體系,隨后對其進一步完善,相繼展開對平行指揮[3]、平行情報[4]、平行武器[5]、平行坦克[6]、平行航母[7]的研究.近來,可以機構(gòu)與企業(yè)不斷推進工業(yè)4.0、物聯(lián)網(wǎng)、數(shù)字雙胞胎、云機器人等概念的研究與應用,通過收集目標的實體信息建立數(shù)字模型,并進行預測和改進,進而提高工業(yè)生產(chǎn)效率.然而這些只是實現(xiàn)虛實互動平行的一種特殊手段,僅停留在ACP平行系統(tǒng)的初級階段.因此,本文提出一種基于ACP的平行多無人機系統(tǒng),明確給出其數(shù)字四胞胎結(jié)構(gòu),以及其工作流程.本文介紹了平行感知、平行學習、平行網(wǎng)絡、平行區(qū)塊鏈等技術(shù)對于平行多無人機系統(tǒng)的支撐,并探討了其對于提升無人機集群在未來戰(zhàn)場中的協(xié)同偵查、協(xié)同突防和集群對抗能力的潛在價值.
2013年,美國發(fā)布了《Unmanned systems integrated roadmap:FY2013-2038》發(fā)展路線圖[8],指出無人機應具有自主完成任務、自主獲取環(huán)境信息等功能.2014年,美國空軍發(fā)布了《Vision and Enabling Concepts,2013–2038》遙控飛機發(fā)展路線圖[9],制定了美國空軍無人機發(fā)展戰(zhàn)略的頂層規(guī)劃,包括增強無人機與有人駕駛戰(zhàn)機之間的編隊協(xié)同能力,自主規(guī)避危險等行為.2016年,美國空軍發(fā)布《Small Unmanned Aircraft Systems(SUAS)Flight Plan:2016-2036》[10],針對小型無人機系統(tǒng)的關(guān)鍵系統(tǒng)屬性、作戰(zhàn)應用、后勤保證和人員培訓等提出系統(tǒng)性安排,其規(guī)劃的主要戰(zhàn)術(shù)應用領域包括“蜂群”、“編組”、“忠誠僚機”和“誘餌”,并提出作為空中炸彈、集群攻擊、彈藥群襲、廣域搜索等作戰(zhàn)方式[11].由此看出,集群化與智能化將是未來無人機的重點發(fā)展方向,主要涉及無人機多源信息融合技術(shù)、導航與路徑規(guī)劃技術(shù)、組網(wǎng)與多機協(xié)同技術(shù)等.
無人機多元信息融合面臨的問題可歸結(jié)為數(shù)據(jù)問題、方法問題和模型問題.其數(shù)據(jù)來源包括GPS、慣性導航裝置、光流相機、機器視覺、SLAM 及其他傳感裝置.信息融合方法主要過程包括針對傳感數(shù)據(jù)進行預處理,并針對傳感誤差進行補償處理,同時為其進行時間配準與空間配準.國內(nèi)外針對融合算法如何提高估計精度、優(yōu)化更新率、增強魯棒性等問題進行了大量研究,如今加權(quán)平均、卡爾曼濾波、D-S證據(jù)合成方法等方法已普遍應用,其他方法如機器學習、模糊推理、以及非線性卡爾曼濾波方法則進一步提高了狀態(tài)估計的容錯率與穩(wěn)定性.
無人機的導航與路徑規(guī)劃技術(shù)是指在飛行器性能指標和環(huán)境約束下,尋找并跟隨從出發(fā)點到目標點的最優(yōu)或次優(yōu)軌跡,并避開障礙物,是無人機任務規(guī)劃的核心技術(shù)之一.而針對多無人機的導航與路徑規(guī)劃技術(shù),則需要在確保復雜環(huán)境中多無人機編隊能夠安全、快速到達指定任務區(qū)域,同時形成編隊以減小被敵方雷達捕捉的面積,需要設計滿足環(huán)境約束與編隊約束的最優(yōu)編隊軌跡.近年來,國內(nèi)外對于多無人機路徑規(guī)劃的研究熱度不斷增長,蟻群算法[12]、遺傳算法[13]、粒子群算法[14]和狼群算法等智能算法被成功用于解決部分多無人機航跡規(guī)劃問題.A*算法、人工勢場法等傳統(tǒng)路徑規(guī)劃方法也被改良并適用于多無人機航跡規(guī)劃問題,并且強化學習等基于深度學習的方法也被引入以解決多無人機避障問題.
無人機的組網(wǎng)與多機協(xié)同技術(shù)是無人機管理和組織的核心,已成為無人機研究的一個熱點問題.無人機高速移動中易造成鏈路中斷,使傳統(tǒng)的移動自組網(wǎng)或車組網(wǎng)協(xié)議難以直接應用.文獻[15]將軍用無人機的組網(wǎng)技術(shù)需求總結(jié)為路由開銷小、通訊性能良好、具有一定的魯棒性、安全性和自組織能力.對于無人機組網(wǎng)技術(shù)的研究,國內(nèi)外大多數(shù)研究人員將注意力集中在MAC協(xié)議與路由算法設計[16?18].而對于編隊隊形設計、編隊重構(gòu)及避障的研究,主要以Learder-Follower模式為主體進行變化,并著重于研究仿生編隊[19?20]拓撲,也有學者通過最優(yōu)控制方法或微分博弈方法[21?24]研究編隊控制的最優(yōu)控制策略問題.
雖然對于多無人機集群的研究已取得一系列進展,但可以看出,對于多無人機集群的研究仍缺乏一個統(tǒng)一理論指導,難以應對復雜感知約束和復雜通信環(huán)境下的多無人機協(xié)同編隊作戰(zhàn)需求.因此,我們需要將ACP平行系統(tǒng)方法引入多無人機集群,納入到平行軍事體系,通過虛實結(jié)合的方式驅(qū)動多無人機集群研究、管理與控制.
王飛躍研究員于2004年提出了復雜系統(tǒng)“不可知”與“不可分”問題[25],并以此為基礎提出針對復雜系統(tǒng)管理與控制的解決辦法[26],即基于ACP的平行系統(tǒng)方法,后文中簡稱ACP方法.該方法的核心思想在于面對復雜的難以進行實驗,或難以進行可重復性實驗的問題,可以通過構(gòu)建與實際系統(tǒng)相對應的人工虛擬系統(tǒng),通過虛擬系統(tǒng)與實際系統(tǒng)的互動,從而以一種可計算、可實驗、可比較的方式求解所面臨的復雜問題.該方法可以將知識、數(shù)據(jù)、仿真、決策以及參與人員的心理融為一體,是混合智能時代的重要基礎理論.目前,ACP方法在復雜系統(tǒng)的研究領域已取得一系列研究成果,在智能交通[27]、自動駕駛、智慧城市、現(xiàn)代化農(nóng)業(yè)生產(chǎn)、企業(yè)管理[28]等方面得到應用,并延伸拓展至其他領域,形成平行學習[29]、平行視覺[30]、平行機器[31]等研究領域.
ACP方法的框架如圖3所示.系統(tǒng)由實際物理系統(tǒng)與軟件定義的人工系統(tǒng)構(gòu)成,通過二者虛實互動相互作用,可以實現(xiàn)對系統(tǒng)的管理與控制、對方案的實驗與評估、對人員的學習與培訓3個主要功能.具體而言,系統(tǒng)分為3個階段運作,A為人工系統(tǒng)(Artificial Systems,A),C為計算實驗(Computational Experiments,C),P為平行執(zhí)行(Parallel Execution,P).其中,第1個階段在于構(gòu)建與物理系統(tǒng)相對應的虛擬系統(tǒng),一般為構(gòu)建軟件定義的系統(tǒng);第2個階段為使用前述所得虛擬系統(tǒng)進行計算實驗,在其中對解決方案進行測試、評估、優(yōu)化的滾動迭代過程;第3個階段將所得方案在物理系統(tǒng)與虛擬系統(tǒng)中平行執(zhí)行,二者不斷交互運行數(shù)據(jù)以調(diào)整解決方案,通過這樣的虛實互動方式引導物理系統(tǒng)完成任務.
其中,所謂人工系統(tǒng)可視為傳統(tǒng)數(shù)學解析方法的擴展,一般由數(shù)學模型或仿真工具構(gòu)建;所謂計算實驗可視為數(shù)據(jù)驅(qū)動的沙盤推演,融合機器學習、知識自動化、數(shù)據(jù)驅(qū)動動態(tài)系統(tǒng)等方法;所謂平行執(zhí)行是自適應控制思想的推廣,在虛擬與實際聯(lián)合空間中形成閉環(huán)反饋.通過三者有機結(jié)合,可以將復雜系統(tǒng)所面臨的不確定、多樣性、復雜性(UDC)問題轉(zhuǎn)化為靈捷、聚焦、收斂(AFC)的解決方案[32].
無人機在戰(zhàn)場上的應用,特別是多無人機協(xié)同或無人機蜂群,是一個典型的在復雜環(huán)境中的復雜問題,其復雜性既來自于戰(zhàn)場環(huán)境的復雜性,也來自于多無人機執(zhí)行任務時所帶來的諸多復雜問題.因而我們將ACP方法引入軍用無人機,形成平行無人機以及進一步的平行機群系統(tǒng),以期獲得靈捷、聚焦、收斂的AFC解決方案,以取得在未來戰(zhàn)場中的主動權(quán).
平行無人機是ACP方法與無人機領域相結(jié)合的應用與推廣,實現(xiàn)從無人機數(shù)字化、信息化到智能化的跨越式發(fā)展,其思路可追溯至1990年,王飛躍針對電網(wǎng)系統(tǒng)提出的“影子系統(tǒng)”嵌入式仿真方法[33].2012年,NASA基于其對于工業(yè)信息時代武器裝備的管理與維護的需求提出了數(shù)字雙胞胎(Digital Twins)[34]的概念,建立數(shù)字化模型并基于實際狀態(tài)信息對裝備的狀況進行評估,以即時做出反應.近年來,這一思路被工業(yè)界的西門子等公司采納,作為其工業(yè)4.0時代的推動技術(shù).無獨有偶,Mathworks公司推動的基于模型的設計(Model Based Design)[35]、Kuffner提出的云機器人(Cloud Robotics)[36]以及其他諸如物聯(lián)網(wǎng)(IoT)等技術(shù)手段也都體現(xiàn)了類似的思路.然而,理論上而言,這些方法只是實現(xiàn)虛實互動平行系統(tǒng)的特殊手段,而且僅停留在建立人工系統(tǒng)的初級階段,而真正意義上的平行無人機應當為構(gòu)建實際無人機的“描述”、“預測”、“引導”對應體,形成完整的數(shù)字四胞胎結(jié)構(gòu),如圖4所示.平行無人機的數(shù)字四胞胎體系包括物理無人機、描述無人機、預測無人機、引導無人機4部分,其中后3部分共同構(gòu)成軟件定義的無人機系統(tǒng).物理無人機與軟件定義的無人機在實踐中平行互動,其中物理無人機將自身輸入、輸出和狀態(tài)不斷發(fā)送給軟件定義的無人機,3部分不斷學習、滾動優(yōu)化,將輸出傳遞給物理無人機,以此調(diào)整其控制參數(shù).
“描述無人機”負責學習實際無人機的行為特征,構(gòu)建相對應的虛擬無人機系統(tǒng),包括無人機本身及其工作的動態(tài)環(huán)境.其構(gòu)建過程使用了知識自動化獲取無人機基本物理模型,同時運用機器學習方法依據(jù)真實運行數(shù)據(jù)修正模型.總體而言,描述無人機實現(xiàn)了從物理無人機到虛擬無人機的映射過程,為無人機與環(huán)境的行為模擬奠定基礎.
“預測無人機”利用計算實驗對描述無人機系統(tǒng)進行模擬實驗,以實現(xiàn)兩個主要功能.首先,通過對描述無人機及其所處虛擬環(huán)境進行類似沙盤推演仿真,測試現(xiàn)有解決方案的性能并檢測異常情景;其次,使用機器學習方法對當前解決方案進行優(yōu)化求解,或舍棄當前解決方案并利用知識自動化工具獲取其他解決方案并繼續(xù)測試.
“引導無人機”在預測無人機的演算基礎上,利用無人機在實際環(huán)境中運行與虛擬模擬實驗中所表現(xiàn)出來的差異引導描述無人機修正模型,并引導預測無人機進一步優(yōu)化解決方案.為了轉(zhuǎn)移本地繁重的計算任務,引導無人機將解決方案抽象給實際無人機的控制系統(tǒng),將大規(guī)模決策優(yōu)化任務在遠程維護,根據(jù)不同的戰(zhàn)場環(huán)境制定有效的戰(zhàn)術(shù)策略,引導實際無人機做出最優(yōu)的攻防動作.
總而言之,平行無人機的數(shù)字四胞胎體系,可以通過虛實互動,使每部在滾動優(yōu)化中不斷優(yōu)化,從而實現(xiàn)戰(zhàn)場復雜環(huán)境中的策略優(yōu)化與控制執(zhí)行.
基于平行智能理論和ACP方法的平行多無人機系統(tǒng),是一個物理和虛擬交互的智能聯(lián)網(wǎng)系統(tǒng),其基本框架如圖5所示,在其中集成多智能體建模、專家系統(tǒng)、虛擬增強現(xiàn)實(Vitual Augmented Reality,VAR)交互手段,將指揮人員、有經(jīng)驗的無人機駕駛員、無人機研發(fā)與設計人員及制造單位統(tǒng)一在同一個框架內(nèi).該系統(tǒng)在遠程超級計算平臺上建立數(shù)字化的無人機集群,貫穿整個武器裝備的生命周期,包括立項、設計、研制、試驗、評審、生產(chǎn)、采購、服役、保障、報廢等[37],在戰(zhàn)時則擴展戰(zhàn)斗準備、戰(zhàn)術(shù)部署、戰(zhàn)斗調(diào)度、任務執(zhí)行、毀傷評估等環(huán)節(jié)[5].
概括而言,平行無人機的基本框架由實際無人機集群與軟件定義的虛擬無人機集群所支撐,通過二者平行互動實現(xiàn)管理與控制、演練與評估、學習與培訓3個重要操作模式.其中,對大規(guī)模的無人機集群以及所處復雜戰(zhàn)場環(huán)境的描述與建模體現(xiàn)了多無人機系統(tǒng)的描述智能(Descriptive Intelligence);基于虛擬模型實現(xiàn)無人機集群編隊、重組、分散避障、協(xié)同打擊、掩護突防等任務展開具備可控性、可觀性、可重復性的計算實驗,分析并優(yōu)化無人機集群的性能表現(xiàn),這對應于無人機集群的預測智能(Predictive Intelligence).通過實際無人機集群與虛擬無人機集群間的平行執(zhí)行,通過虛擬無人機集群模擬出優(yōu)化的編隊運動策略或協(xié)同打擊策略,引導實際無人機沿著該方案運行,使各無人機達到期望狀態(tài),提高編隊的穩(wěn)定性、執(zhí)行任務的同步性以及遇到緊急狀況時的機動能力,從而以一種科學計算的方式達到對無人機集群管理與控制的目的,這對應于無人機集群的引導智能(Prescriptive Intelligence).
以上3個智能便是平行多無人機基本框架為無人機集群賦予的智能化含義.
如上文所述,平行多無人機系統(tǒng)的數(shù)字四胞胎結(jié)構(gòu)通過描述、預測、引導三階段滾動優(yōu)化為無人機集群賦予了靈捷性、聚焦性和收斂性.本節(jié)對以上三階段進行更詳細的概述,從而描繪出平行多機系統(tǒng)的工作流程.
對于描述多無人機集群這樣一個復雜系統(tǒng),傳統(tǒng)的在多無人機協(xié)同控制、無人機編隊或無人機博弈的數(shù)學模型和仿真方法難以取得很好的效果.例如,由于軍用無人機集群往往分工明確,需攜帶不同偵查、打擊或干擾設備,存在很強的異構(gòu)性,難以進行統(tǒng)一數(shù)學建模.此外,為了保證系統(tǒng)在苛刻通信條件下能順利完成作戰(zhàn),多無人機系統(tǒng)一般不能使用集中式控制,而改為分布式控制,這也為無人機編隊整體行為的建模增加了進一步的挑戰(zhàn).
因而,針對多無人機的描述過程,可采用人工系統(tǒng)的方法進行建模.具體而言,強調(diào)綜合與合成在行為產(chǎn)生中的作用,考慮到復雜系統(tǒng)的不可分與不可知性,通過多智能體建模元件組成系統(tǒng),以整體的角度構(gòu)造復雜行為模式.其次,將人工系統(tǒng)融入硬件在環(huán)(HITL)、軟件在環(huán)(SITL)的仿真過程,通過涌現(xiàn)方法進行觀測、總結(jié)、了解、分析和理解復雜系統(tǒng)行為.
在此過程中,多智能體的最小單元并不是某無人機,而是組成無人機的重要功能部件,包括飛行控制器、傳感器、執(zhí)行機構(gòu)、作戰(zhàn)設備等有機組合.在無人機系統(tǒng)測試與運行的過程中,由于參數(shù)漂移、未建模動態(tài)因素或者傳感誤差的影響,對無人機系統(tǒng)的描述可能出現(xiàn)偏差.這時我們需要利用產(chǎn)生的大量數(shù)據(jù),包括傳感數(shù)據(jù)、狀態(tài)觀測、通信數(shù)據(jù)、環(huán)境信息等,基于此進行機器學習過程,進一步完善和優(yōu)化描述各智能體行為的模塊.這種系統(tǒng)自我進化學習的過程,體現(xiàn)了描述無人機數(shù)據(jù)驅(qū)動[38]的本質(zhì).
除了對無人機進行建模,還需對環(huán)境以及敵我雙方武器裝備,以及敵我雙方作戰(zhàn)人員進行一定精度上的智能體建模.現(xiàn)階段,無人機或無人機集群仍很少用于單獨執(zhí)行全天候監(jiān)視或目標搜索等任務,往往需要其他裝備配合,或作為廉價消耗品配合其他武器裝備作戰(zhàn).因而,在對其運行環(huán)境進行描述的過程中有必要對其他戰(zhàn)術(shù)參與單位進行建模,從而形成更完備的虛擬戰(zhàn)場環(huán)境.由此,平行無人機集群被納入平行軍事[39?40]大系統(tǒng),與平行指揮與控制系統(tǒng)[3]、平行武器裝備保障系統(tǒng)[5]、平行自主防御系統(tǒng)系統(tǒng)[41]相結(jié)合.
對于預測多無人機集群在復雜環(huán)境中的行為與未來狀態(tài),通常使用前述所得描述無人機集群,利用計算實驗方法進行“加速試驗”、“加壓測試”、“極限測試”、“突發(fā)測試”等,對其解決方案、決策策略、控制方法進行預測和分析,并對其通常狀況下的性能指標以及異常情況下的魯棒性進行評估,從而優(yōu)化系統(tǒng)參數(shù)或調(diào)整解決方案.
對于無人機集群的“加速試驗”主要體現(xiàn)在針對作戰(zhàn)任務,如協(xié)同打擊、協(xié)作突圍等情景中,基于一定的初始條件與隨機性,通過快速演算不斷測試某種作戰(zhàn)策略,從而得到對于該條件下作戰(zhàn)結(jié)果的可能性分布,反饋給作戰(zhàn)指揮系統(tǒng).另一種主要應用場景在于使用遺傳算法,通過不斷快速計算得到一種優(yōu)化的解決方案.
另一種預測方法為使用最優(yōu)控制方法或微分博弈.多無人機決策可以建模成一類動態(tài)博弈問題,微分博弈則是對這類問題的一宗快速求解方法.簡言之,微分博弈方法利用微分方程組刻畫各自最優(yōu)目標,緊密結(jié)合現(xiàn)代控制理論和博弈論,求解一類雙方或多方的最優(yōu)控制問題.1954年,R.Isaacs[42]開啟了對于微分博弈的研究,最初是重組了動態(tài)規(guī)劃方法并應用于最優(yōu)控制問題.隨后,Berkowitz等在其中引入微積分和變分方法,正式拉開微分博弈的序幕.Ho等[43]則在1965年展開了微分博弈在追逃問題中研究,其中微分博弈問題的數(shù)學描述可以簡單概括為:
其中,J為回報函數(shù),x為狀態(tài)向量,u和v為分段連續(xù)的策略或控制向量,受到允許控制的約束.系統(tǒng)的求解目標在于尋找鞍點(u0,v0)滿足條件:
所得u0,v0即為最優(yōu)純策略,J(u0,v0)為博弈的值.對于無人機集群的“加壓測試”、“極限測試”和“突發(fā)測試”則是用于對已有解決方案進行穩(wěn)定性與魯棒性驗證,評估情報失誤、通訊不暢、單位故障等在戰(zhàn)場中可能的突發(fā)狀況對于達成作戰(zhàn)目標的不利影響.
所謂對平行機群的引導過程,即在解決方案的執(zhí)行過程中,引導或控制各種資源情況下使系統(tǒng)能夠達到期望的狀態(tài).可視為一種在控制系統(tǒng)中對個狀態(tài)鎮(zhèn)定的過程,也是實現(xiàn)滾動優(yōu)化的大閉環(huán)系統(tǒng)控制的關(guān)鍵一步.
由于建模的不完備性,描述無人機勢必會與實際無人機產(chǎn)生一定的模型偏差,此偏差反映在預測過程中即為得到對運動狀態(tài)與運動結(jié)果的有偏估計,從而導致戰(zhàn)術(shù)判斷與戰(zhàn)術(shù)決策的錯誤.如果此誤差累積,則會對系統(tǒng)的作戰(zhàn)結(jié)果產(chǎn)生難以估量的影響,因而我們需要像控制理論中一樣對虛實系統(tǒng)進行引導,對虛擬系統(tǒng)進行參數(shù)修正,以使其更好地反映實際系統(tǒng),同時使實際系統(tǒng)采取一定的保守策略,避免放大執(zhí)行誤差,最終使得虛實多無人機系統(tǒng)自我更新、平行優(yōu)化.
在平行多無人機系統(tǒng)的引導過程中,人工智能方法,如啟發(fā)式搜索、遺傳算法、機器學習方法在其中扮演重要角色.整個引導過程可視為對一個存在隨機性、有約束的多目標優(yōu)化問題求解的過程.由于問題的規(guī)模性,往往難以有效通過解析方法直接求取最優(yōu)解,所以我們訴諸人工智能方法尋求一種次優(yōu)解或者可行解,并輔以大量計算實驗以驗證其有效性和魯棒性.為加速迭代優(yōu)化流程,并行計算[44]、云計算[45]方法在其中起到重要作用.在復雜戰(zhàn)場環(huán)境中,我們往往只能依賴于這種可行解,從而確保戰(zhàn)術(shù)指揮具有連續(xù)一致性.
綜上3步,平行機群的系統(tǒng)流程在平行機器人基本流程上發(fā)展而來,擁有實際、虛擬系統(tǒng)兩個主要循環(huán),并通過平行執(zhí)行形成整個系統(tǒng)的閉環(huán)控制.
如圖6所示,平行多無人機系統(tǒng)包括實際系統(tǒng)、軟件定義的系統(tǒng)以及知識服務系統(tǒng).知識服務系統(tǒng)伴隨無人機研發(fā)、設計、生成制造全過程,在數(shù)據(jù)庫中維護對應無人機的數(shù)字模型,用于快速生成計算實驗場景.戰(zhàn)場環(huán)境情報由平行軍事系統(tǒng)提供,既包括無人機實時傳感數(shù)據(jù),又包括平行情報系統(tǒng)傳入的信息.通過在虛擬環(huán)境中進行描述、預測、引導滾動優(yōu)化,得到該任務的優(yōu)化可行解,并將行為策略以及控制算法下載到實際無人機中.由此,在實際無人機中執(zhí)行觀測、狀態(tài)估計、問題建模、預測、規(guī)劃、底層控制、觀測的循環(huán),控制無人機完成既定任務;在虛擬無人機系統(tǒng)中執(zhí)行狀態(tài)估計、描述、計算實驗預測、引導、執(zhí)行的循環(huán),其中內(nèi)循環(huán)描述、計算試驗預測、引導共同完成決策與控制參數(shù)調(diào)優(yōu).可以看出,整個虛實系統(tǒng)與知識系統(tǒng)緊密結(jié)合,接受其數(shù)據(jù)服務以及計算服務等.
指揮人員與飛行員也在整個過程中起到重要作用.其中指揮人員扮演監(jiān)督者與決策者的角色,盡管人工智能已經(jīng)能夠在一定程度上感知戰(zhàn)場形式并做出戰(zhàn)術(shù)決策,但將戰(zhàn)爭決策全權(quán)交與計算機系統(tǒng)仍不可能,而且也不是一種負責任的方式.因而,指揮人員必須被納入系統(tǒng)循環(huán)中,基于描述、預測、引導的結(jié)論制定作戰(zhàn)計劃,并通過系統(tǒng)的可視化展示模塊對執(zhí)行過程進行監(jiān)督.飛行員則負責應急處理以及示教工作.
如圖6所示,虛實系統(tǒng)之間每個環(huán)節(jié)均有大量的數(shù)據(jù)流入流出,其過程由平行系統(tǒng)的幾個關(guān)鍵技術(shù)所驅(qū)動,這也是平行系統(tǒng)與自適應控制或模型預測控制的區(qū)別所在.
《孫子謀攻篇》說到“知己知彼,百戰(zhàn)不殆;不知彼而知己,一勝一負;不知彼,不知己,每戰(zhàn)必殆”,凸顯出獲取情報以及自身狀態(tài)對于軍事對抗的重要性,前者是無人機集群的強項,而后者則是無人機集群面臨的主要技術(shù)挑戰(zhàn)之一.
軍事無人機的感知技術(shù)多樣,包括從小微型傳感器到大規(guī)模偵查裝備,涉及可見光、紅外、綜合孔徑雷達(SAR)、多光譜、敵/我識別器等[46],需要解決包括偵查數(shù)據(jù)快速處理、數(shù)據(jù)質(zhì)量評估、多源信息融合等關(guān)鍵問題.由于實際戰(zhàn)場環(huán)境的復雜性,傳統(tǒng)的數(shù)據(jù)處理方式,如手動設計的信號特征由于模型規(guī)模的限制,難以覆蓋復雜環(huán)境對應的特征空間.而近年來興起的深度學習方法依賴大量標定樣本,能夠覆蓋更大的特征空間,但是其需要大量樣本累積,特別是其標定階段依賴大量人力物力.因而,為了建立可以有效應對復雜環(huán)境中的多機協(xié)同感知模型,需要建立規(guī)模足夠大且具有足夠多樣性的數(shù)據(jù)集,所以我們可以訴諸于平行感知方法.
平行感知旨在通過建立人工場景,模擬和替代復雜環(huán)境中的真實場景,利用虛擬傳感方法渲染生成宏大、多樣的人工數(shù)據(jù)集,從而為機器學習方法提供數(shù)據(jù)支撐.如圖6所示,實際系統(tǒng)與虛擬系統(tǒng)的狀態(tài)估計過程均由平行感知驅(qū)動.而平行協(xié)同感知則是多個無人機相互協(xié)同對自身以及其他無人機狀態(tài)估計的支撐技術(shù).以平行視覺[47]為例,通過構(gòu)建色彩逼真的人工場景,模擬實際場景中可能出現(xiàn)的環(huán)境條件,并且自動得到精確的標注信息.結(jié)合大規(guī)模的人工場景數(shù)據(jù)集和適當規(guī)模的實際場景數(shù)據(jù)集,能夠訓練出更有效的機器學習和視覺計算模型.利用人工場景,能夠進行各種計算實驗,全面評價視覺算法在復雜環(huán)境下的有效性,或者優(yōu)化設置模型的自由參數(shù).如果將視覺模型在實際場景與人工場景中平行執(zhí)行,使模型訓練和評估在線化、長期化,則能夠持續(xù)優(yōu)化視覺系統(tǒng),提高其在復雜環(huán)境下的運行效果.2017年,王坤峰等人建立了Parallel Eye數(shù)據(jù)集[48],如圖7所示,通過實驗驗證了平行視覺方法對于產(chǎn)生海量有標注學習樣本的可行性,及其對于一定程度上提升現(xiàn)有計算機視覺模型的有效性.
長久以來,對于無人機、機器人或武器裝備的控制往往仍停留在簡單控制方法,如PID、線性反饋、線性二次型控制等.然而隨著人們對于自主武器的需求日漸迫切,簡單控制方法往往難以滿足復雜戰(zhàn)場環(huán)境中智能決策的需要.近年來,隨著機器學習取得了長足發(fā)展,特別是深度強化學習在機器人控制、圍棋、游戲、交通等諸多領域中得到成功應用,一些機器學習方法開始應用于無人機或地面無人車的控制.然而,機器學習仍然受到兩方面限制,使得其難以在復雜系統(tǒng)中真正得到應用.首先,機器人在狀態(tài)與行為空間的探索受到諸多限制,使其難以創(chuàng)造一些數(shù)據(jù)驅(qū)動算法所需的大數(shù)據(jù);其次,對于如何在復雜系統(tǒng)中應用機器學習方法仍缺少理論指引.
對于解決第一個問題,大多數(shù)強化學習研究中將探索空間從實際空間轉(zhuǎn)移到仿真空間,并在仿真空間通過大量試錯學習或模仿學習等方法得到控制策略,最終遷移到實際機器人上.如Pfeiffer等[49]使用Stage/ROS環(huán)境,利用MoveIt路徑規(guī)劃器作為專家數(shù)進行模仿學習.Long等[50]在Stage環(huán)境中中通過TRPO強化學習方法訓練基于雷達的多車輛的分布式避障策略,并展示了其方法對于100輛車輛會車避讓情景的有效性.文獻[51]則在ROS/Gazebo環(huán)境中通過監(jiān)督學習得到基于雷達的避障策略.然而以上策略仍存在現(xiàn)實偏差(Reality-Gap)問題,雖然在遷移過程中必須經(jīng)過領域適應(Domain Adaptation)處理,仍難以保證虛擬與現(xiàn)實的無偏性或一致性.
為解決以上問題,文獻[52]提出了平行學習理論框架.概括而言,平行學習理論使用預測學習解決如何隨時間發(fā)展對數(shù)據(jù)進行探索;使用集成學習解決如何在空間分布上對數(shù)據(jù)進行探索;使用指示學習解決如何探索數(shù)據(jù)生成的方向.文章通過基于小樣本數(shù)據(jù)學習的無人車停車問題展示了其有效性.
在多無人機協(xié)同作戰(zhàn)的過程中,網(wǎng)絡通信是支撐其編隊、數(shù)據(jù)互傳、遠程操控的支撐技術(shù).穩(wěn)定的網(wǎng)絡通信是在復雜環(huán)境中作業(yè)時,無人機與無人機、無人機與地面站之間的互聯(lián)互通的保證.雖然平行無人機系統(tǒng)在實際無人機本地也保留一套控制循環(huán),可以在通信質(zhì)量較差、甚至失去通信能力的情況下按照已下載控制策略與算法繼續(xù)執(zhí)行任務,但同時也失去了虛實互動能力,從而失去了由虛實互動帶來的智能性與適應性.因而平行無人機系統(tǒng)仍需要盡可能穩(wěn)定可靠的通信環(huán)境.
無人機集群的網(wǎng)絡架構(gòu)中,對于網(wǎng)絡服務的要求逐漸改變,具體體現(xiàn)在數(shù)據(jù)由單薄變換為豐富,使用要求由靜態(tài)變化為動態(tài),連接由固定轉(zhuǎn)變?yōu)橐苿?甚至基站都需要成為移動基站.此外,由于無人機集群在戰(zhàn)場中的定位主要為消耗品,用以提供戰(zhàn)場支援、掩護、突防等任務,因而其網(wǎng)絡設備也應保持成本低廉、工藝簡單、裝備調(diào)試容易的特點[15].考慮到網(wǎng)絡侵入已作為反無人機的主要手段之一,我們還需要無人機網(wǎng)絡具有一定的保密性和安全性.由此,我們需要平行網(wǎng)絡技術(shù)作為平行多無人機系統(tǒng)的技術(shù)支撐.
目前,網(wǎng)絡通信業(yè)界的注意力集中在如何從傳統(tǒng)以太網(wǎng)軟件定義的網(wǎng)絡(SDN)以及網(wǎng)絡功能虛擬化(NFV)的方向發(fā)展,這可以理解為平行網(wǎng)絡的一種特殊手段.文獻[53]提出了平行網(wǎng)絡的概念,其架構(gòu)[54]如圖8所示.平行網(wǎng)絡由人工網(wǎng)絡、計算實驗和平行執(zhí)行3部分組成,通過人工網(wǎng)絡與實際網(wǎng)絡平行互動實現(xiàn)對網(wǎng)絡設備的自動化配置,從而提高網(wǎng)絡資源實時調(diào)度,提高網(wǎng)絡的速度、安全性和穩(wěn)定性,可以有效應對多無人機網(wǎng)絡系統(tǒng)難管理、易變化、難預測的特性.
區(qū)塊鏈技術(shù)起源于2008年,作為新興數(shù)字加密貨幣比特幣的底層支撐技術(shù),并隨著比特幣的熱潮引起眾多專家學者的興趣,成為近年來金融科技與互聯(lián)網(wǎng)領域的熱點問題[55].區(qū)塊鏈的根本特征是去中心化,采用P2P對等網(wǎng)絡,通過分布式共識機制實現(xiàn)相互協(xié)調(diào)協(xié)作[56].
區(qū)塊鏈技術(shù)的去中心化特征,使其對于多無人機集群系統(tǒng)具有重要應用價值.首先,多無人機集群,特別是微小型無人機蜂群,因其成本及載荷等問題,往往作為戰(zhàn)爭消耗品使用且自身不具備維護大量數(shù)據(jù)的能力.因此,使用區(qū)塊鏈技術(shù),可實現(xiàn)偵查情報的分布式儲存,提升因為損毀、失聯(lián)造成的偵測數(shù)據(jù)缺失等問題.其次,使用電子戰(zhàn)欺騙手段已成為反無人機集群的重要技術(shù)之一,因而需要使用區(qū)塊鏈技術(shù)采用分布式共識機制及時識別并驅(qū)逐編隊中的惡意無人機,保持編隊可靠性和穩(wěn)定性.
然而,區(qū)塊鏈相關(guān)理論研究仍處于起步階段,對于共識算法、網(wǎng)絡結(jié)構(gòu)、激勵機制問題等核心要素尚處于探索階段.因此,文獻[57]提出平行區(qū)塊鏈技術(shù),為區(qū)塊鏈技術(shù)提供一套可計算、可實現(xiàn)與可比較的描述、預測、引導決策方法.形成的物聯(lián)區(qū)塊鏈技術(shù)(Blockchains of Things)可以以安全可信的方式監(jiān)控實際無人機及其設備的整個生命周期.
情報偵查、戰(zhàn)場監(jiān)視和地形測繪是目前軍用無人機的主要作戰(zhàn)方式之一.無人機可以通過飛抵敵軍目標上空進行偵查,將目標實時的圖像等信息傳送回指揮部,用于制定作戰(zhàn)計劃.無人機集群可以通過多架無人機相互配合,實現(xiàn)單無人機偵查所不具備的能力或大幅度提升偵查效果.具體表現(xiàn)為,多無人機可同時偵查的范圍更廣,傳感數(shù)據(jù)類型更豐富,可同時捕獲大量目標,對關(guān)鍵區(qū)域或關(guān)鍵目標實行不間斷全天候監(jiān)視,可以施行對目標多角度監(jiān)控,避免出現(xiàn)遮擋導致丟失以及對于單架無人機故障表現(xiàn)出一定的魯棒性[46].傳統(tǒng)無人機協(xié)同控制管理方法難以應對編隊中無人機數(shù)量上升造成的計算規(guī)模呈指數(shù)增長的問題,難以滿足多維協(xié)同動態(tài)規(guī)劃的需求,因而通過引入平行機群,將計算資源轉(zhuǎn)移至云端,實現(xiàn)海量偵查數(shù)據(jù)在云端處理,以及對多機協(xié)同偵查在線任務分配與航跡規(guī)劃問題.
無人機以其成本低廉,零人員傷亡風險的特點非常適于危險條件下執(zhí)行任務.無人機集群在攻擊敵軍重點目標時往往受到殲擊機、地空導彈和高射火炮組成的三層防御體系,特別是面臨突然探測到敵方搜索雷達的威脅時,需要采取應對策略以保證整個團隊的安全性[58],或?qū)崿F(xiàn)最小犧牲的前提下確保完成任務.在協(xié)同突防過程中,涉及多無人機協(xié)同航跡規(guī)劃、協(xié)同目標搜索以及協(xié)同電子戰(zhàn)干擾等技術(shù).協(xié)同突防過程中,需要無人機集群進行機動靈活的隊形變換[59]、執(zhí)行主動式或被動式電子干擾,誘騙敵方雷達形成視野盲區(qū),同時釋放低價值干擾物吸引敵方高價值防空火力,進而實現(xiàn)編隊突防.協(xié)同突防中的軌跡規(guī)劃不僅需要考慮三維空間,還要考慮時間維度,即多無人機能夠在同一規(guī)定時間到達指定地點形成編隊[60].目前集群突防技術(shù)主要依賴預先編程的航跡規(guī)劃以規(guī)避已知的敵方雷達,難以適應動態(tài)變換的戰(zhàn)場形勢,對于因為突發(fā)狀況引起的需要隊形拆分、重建、保持、切換的需求也束手無策.平行機群通過海量計算針對突發(fā)場景進行評估,可以依據(jù)偵測信息預估敵方防空雷達分布,制定導航策略,也可以在突然探測到敵方雷達威脅時即時調(diào)整控制策略,以動態(tài)靈活的方式調(diào)整編隊隊形與作戰(zhàn)方式.
電子戰(zhàn)是指利用電磁能或定向控制電子頻譜攻擊敵方,包括電子攻擊、電子防護和電子支援3種作戰(zhàn)方式,其中電子戰(zhàn)攻擊一般使用電磁能、定向能或反輻射武器攻擊敵方設備或裝備,以削弱或壓制敵方雷達、防空導彈或使用一次性干擾物等對自身進行防護,而電子支援作戰(zhàn)則通過搜索、捕獲、定位敵方雷達的輻射源從而制定作戰(zhàn)行動[61].無人機機體一般較小,載荷能力受限,其火力毀傷能力相較于傳統(tǒng)戰(zhàn)術(shù)武器較弱.但其往往可以作為重要的電子戰(zhàn)裝備,與傳統(tǒng)火力配合,實施電子戰(zhàn).無人機電子戰(zhàn)主要面臨感知與定位、振蕩同步、敵我識別的挑戰(zhàn),平行機群系統(tǒng)可以引入多源情報輔助其進行戰(zhàn)場定位,并基于協(xié)同控制調(diào)節(jié)天線同步,以及基于平行區(qū)塊鏈技術(shù)進行敵我識別.
針對無人機蜂群的防御已成為各國棘手的問題,特別是反恐作戰(zhàn)中,由于無人機的廉價、簡易,僅使用很少的火力就能造成很大恐慌,使得許多傳統(tǒng)防空作戰(zhàn)方式對其束手無策.目前反無人機武器包括激光武器,彈幕武器,無線電槍等[62],由于缺乏對操作人員的統(tǒng)籌管理,其響應速度往往遠低于敵方無人機集群,因而處于被動應對的地位[63].使用平行多無人機系統(tǒng)可以依據(jù)戰(zhàn)場形勢預估敵方無人機的攻擊策略,提前制定應對方案并機動調(diào)整.多無人機平行系統(tǒng)還可以通過其與平行軍事體系的緊密聯(lián)系,通過平行情報系統(tǒng)預先對敵攻擊目標進行預測,將作戰(zhàn)評估結(jié)果及時反饋給平行指揮系統(tǒng)或調(diào)度其他自主裝備.
在眾多反無人機技術(shù)中,以無人機集群對入侵的無人機集群進行攔截被認為是最有效的[64].無人機集群對抗涉及大規(guī)模無人機管理、自主編隊飛行、集群感知與態(tài)勢共享等技術(shù)[65].針對無人機集群對抗的研究現(xiàn)在仍處于起步階段,往往運用博弈論[66]、微分博弈[67]或無人機級別的多智能體建模方法基于對于無人機的簡化、抽象數(shù)學模型針對特定作戰(zhàn)問題求解,缺乏實用性與靈活性.因而我們需要使用平行機群系統(tǒng),通過對敵我無人機集群及戰(zhàn)場環(huán)境進行數(shù)據(jù)驅(qū)動的描述,通過計算實驗預測對抗效果并依此優(yōu)化調(diào)整策略,最終以平行執(zhí)行方式引導我方無人機集群以機動靈活優(yōu)化的方式取得對敵方無人機的優(yōu)勢.
平行機群是基于平行理論的ACP方法在多架無人機組成的新一代無人機集群管理與控制系統(tǒng).本文介紹了平行多無人機系統(tǒng)的理論基礎及其數(shù)字四胞胎結(jié)構(gòu),討論了其以描述、預測、引導三步為核心的滾動優(yōu)化流程,指出了平行機群系統(tǒng)的多項支撐技術(shù),并展望了系統(tǒng)在未來戰(zhàn)場中的應用前景.在不同戰(zhàn)場場景中,平行機群有效成為一個整體,將戰(zhàn)場環(huán)境的多元偵察信息上傳到云端,由云端根據(jù)計算結(jié)果調(diào)整作戰(zhàn)策略并引導戰(zhàn)事發(fā)展,極大提升了平行機群系統(tǒng)的管理與控制能力.通過融入平行軍事體系,使多無人機集群系統(tǒng)更加智能,能夠極大延伸我軍的作戰(zhàn)體系,將在我國國防建設進程中發(fā)揮重要作用.