何佳洲,胡劍秋,張 煌
(江蘇自動化研究所,江蘇 連云港 222061)
CARACaS由NASA(National Aeronautics and Space Administration)噴氣推進實驗室JPL(Jet Propulsion Lab)在20世紀90年代研制,總體框架和核心構(gòu)件到2003/04年陸續(xù)成型,主要用途是實現(xiàn)火星探測車“漫游者”MER(Mars Exploration Rover)等的自主控制。
到2006年,CARACaS陸續(xù)被美國海軍研究辦公室ONR(Office of Naval Research)、國防高級研究計劃局DARPA(Defense Advanced Projects Research Agency)、國防戰(zhàn)略能力部長辦公室OSDSCO(Office of the Secretary of Defense Strategic Capabilities Office)、國家海洋和大氣局NOAA(National Oceanic and Atmospheric Administration)、陸軍坦克自動推進研究發(fā)展與工程中心TARDEC(US Army Tank Automotive Research Development and Engineering Center)等選中,用于為無人系統(tǒng)提供自主控制服務的骨干框架,迄今已廣泛運用于美軍諸多水面無人船USVs、水下無人潛航器UUVs和地面無人車UGVs(Unmanned Surface、Underwater and Ground Vehicles)試驗、演習、科學考察和執(zhí)行專項任務。
歷經(jīng)多年,距離達成無人化目標仍有相當差距,或許正因如此,CARACaS作為美軍自主無人系統(tǒng)的一項重要支撐技術(shù),其關(guān)鍵組件一直在不斷擴充、驗證。
不同于傳統(tǒng)海軍艦艇研制“鐵三角(速度、有效載荷和耐久性)”原則,本質(zhì)上,USV發(fā)展受制于“控制三角”原則,即伴隨任務和/或環(huán)境的復雜性、自主性和有保障的通信。由此可見,自主性是無人系統(tǒng)的一項最基本、最關(guān)鍵的能力。實現(xiàn)無人系統(tǒng)自主能力的重要性也就不言而喻。
本文將著重對該框架涉及的幾項核心技術(shù)和應用進行分析梳理,希望能找到其中的一些共識。作者認為,本文討論的CARACaS和其他無人自主技術(shù)一樣,在逐漸走向?qū)嵱没^程中,碰到的技術(shù)難點是相通的,可相互借鑒。
CARACaS作為一種緊湊型自主智能體集成框架,組成框圖如圖1所示,包括五部分:三種引擎(行為引擎、動態(tài)規(guī)劃引擎、感知引擎)、一類世界模型和一組執(zhí)行器。
圖1 CARACaS系統(tǒng)框圖[5]
圖1中,框架的中心部分是行為引擎,嵌入在一種穩(wěn)健、實時、可配置的機器人軟件架構(gòu)R4SA(Robust,Real-Time, Reconfigurable Robotics Software Architecture)應用層中,該架構(gòu)由JPL開發(fā),支持自主式或命令式機器人系統(tǒng)快速原型式集成,也可理解為一種模塊化、可配置和可擴展的實時嵌入式系統(tǒng)。行為引擎采用沖突仲裁機制,為系統(tǒng)提供實時行為組合和協(xié)調(diào)控制;動態(tài)規(guī)劃引擎基于攜載式連續(xù)活動調(diào)度規(guī)劃執(zhí)行和重規(guī)劃組件CASPER(Continuous Activity Scheduling Planning Execution and Replanning),通過迭代修復策略,實現(xiàn)目標任務的規(guī)劃/重規(guī)劃;感知引擎則需要根據(jù)無人平臺具體使命任務和攜載的傳感器特性進行針對性設計,如JPL為海上無人艇基本型態(tài)勢感知提供一個標準化配置,由一套廣角錘頭型立體攝像系統(tǒng)和一套iPUMA(Integrated Precision Underwater Mapping)聲吶(一種寬幅前視聲吶)系統(tǒng)(實現(xiàn)水下危險物檢測/避碰)組成;世界模型為無人平臺狀態(tài)信息、無人平臺和其他協(xié)同智能體的任務目標和計劃等提供公共訪問入口,同時為導航和科學數(shù)據(jù)獲取提供在線環(huán)境感知圖;執(zhí)行器對應無人平臺的相關(guān)載荷,由方向舵和油門等組成。
CARACaS主要通過核心組件R4SA實現(xiàn)框架中所有子系統(tǒng)之間的同步和基于行為引擎的調(diào)度處理。R4SA采用低耦合性、高一致和可測試等設計原則,支持快速原型開發(fā),總體上設計成一種基于系統(tǒng)控制的三層架構(gòu),包括:設備驅(qū)動層,由動力控制和模擬-數(shù)字變換硬件接口組成;設備層,采用與具體硬件無關(guān)的通用接口描述,由攝像機、IMU、動力反饋等傳感器和執(zhí)行器組成;應用層,由所有高層控制命令、界面和導航等與行為和應用相關(guān)控制組成。軟件架構(gòu)如圖2所示。
圖2中,系統(tǒng)部分理解為某類確定無人平臺系統(tǒng)為實時完成相應的特定目標,所必需的基本功能,由以下構(gòu)件(不限于)組成:命令處理器(處理來自圖形用戶接口和命令字典的指令)、遙測顯示和數(shù)據(jù)日志、連續(xù)序列化調(diào)度、配置處理器、系統(tǒng)處理器(實現(xiàn)線程之間的協(xié)調(diào)和同步)等。
圖2 R4SA架構(gòu)[6]
設備驅(qū)動層,通過ISA或PCI總線為相關(guān)硬件提供底層軟件的接口;設備層,通過組合機器人的特定算法和設備驅(qū)動層與具體硬件之間的接口,為應用層提供更加通用的抽象層;應用層,通過設備層,為單個無人平臺或無人平臺之間提供特定或公共的高層功能。
在行為引擎中,總體上采用JPL開發(fā)的多機器人行星前哨控制結(jié)構(gòu)CAMPOUT(Control Architecture for Multi-robot Planetary Outposts),如圖3所示,CAMPOUT首先體現(xiàn)了行為表示、行為構(gòu)成、群組行為的團隊協(xié)同以及相互之間的交互等;進一步基于某種目標,將某個行為描述為感知(傳感器輸入)到一個或一組活動的映射。
圖3 CAMPOUT行為分層架構(gòu)[7]
采用連續(xù)序列編碼構(gòu)造法構(gòu)建行為,以強實時方式運行在R4SA的應用層,允許開發(fā)人員通過動態(tài)激活或禁止設置行為狀態(tài),控制行為執(zhí)行。激活或禁止通過仲裁實現(xiàn),具體有包容、投票和區(qū)間規(guī)劃等仲裁機制。比如:在危險規(guī)避/航路點規(guī)劃任務中(如圖4所示),依據(jù)感知引擎提供的目標和環(huán)境信息,一方面采取包容仲裁處理方式,通過感知引擎激活危險規(guī)避行為,控制方向舵和油門,抑制前往航路點的過度駕駛行為,實現(xiàn)危險規(guī)避;另一方面,無人平臺也要意識到必須前往下一個航路點,因此,需同時規(guī)劃相應安全航路。
圖4 導航行為仲裁[6]
對于海上環(huán)境中無人艇自主航行應用,需遵守國際海上避碰規(guī)則COLREGS(International Regulations for Preventing Collisions at Sea)。如圖5和6所示。圖7給出了USV遭遇交叉態(tài)勢時,依據(jù)COLREGS規(guī)則的一個行為快照,該情況下,USV必須為從右舷航行過來的船舶讓路,然后從其后面通過。各種行為的運動方向采用不同顏色進行編碼(其中:紫色區(qū)域表示轉(zhuǎn)舵將違反COLREGS規(guī)則,紅色區(qū)域表示會導致碰撞,綠色表示安全航行區(qū)域,黃色表示安全到碰撞的緩沖區(qū))。
圖5 各種COLREGS態(tài)勢中機動類型[9]
圖6 同一態(tài)勢中COLREGS規(guī)則不同應用情況[9]
圖7 交叉態(tài)勢USV行為快照[6]
動態(tài)規(guī)劃引擎CASPER架構(gòu)如圖8所示。給定目標任務和自主航行器當前狀態(tài)作為輸入,CASPER將在遵守資源約束和活動規(guī)則前提下,生成一個活動計劃,盡可能滿足更多的目標任務需要。
圖8 CASPER高層組織架構(gòu)圖[6]
CASPER采用規(guī)劃器ASPEN(Automated Scheduling and Planning Environment)建模語言ML(Modeling Language)實現(xiàn)自主航行器描述編碼,包括資源和狀態(tài)信息,以及適用的任務和操作規(guī)則。采用迭代修復算法實現(xiàn)計劃動態(tài)更新,同時對沖突計劃(比如:資源過渡訂閱等)進行分類,通過執(zhí)行一個或多個計劃修訂逐一消解沖突。 CASPER采用承諾性最好的局部啟發(fā)式迭代修復方法,實現(xiàn)計劃的生成和更新。
1)活動數(shù)據(jù)庫ADB(Activity Database)
活動是CASPER中心數(shù)據(jù)結(jié)構(gòu),可描述為計劃/調(diào)度中某個具體的動作或步驟。任何一個活動都有唯一的起始、終止和持續(xù)時間。計劃/調(diào)度中所有的活動都是ADB的元素。ADB管理當前計劃/調(diào)度中所有活動的狀態(tài),也通過集成為其他類別實體提供接口服務。
2)時間約束網(wǎng)絡TCN(Temporal Constraint Network)
TCN是一種用來表示活動間時間約束的圖數(shù)據(jù)結(jié)構(gòu)。時間約束描述了一個活動和其他活動和/或調(diào)度范圍間的時間關(guān)系,并對活動集實施排序。TCN實現(xiàn)了一個簡單時間問題(Simple Temporal Problem)并將其描述為一個約束集,即在ADB中的活動相互間所有約束,都必須在某個給定的時間內(nèi)得到滿足。在TCN中,活動用時間點對表示,這里每個時間點對應活動起止時間,TCN圖中的邊表示時間點之間的時間距離約束。
3)資源時間表
資源時間表用來推斷活動對物理資源的使用情況。任意時刻,如果資源累積使用量超過其容量,則會檢測到容量沖突。資源時間表模型包括兩種類型:消耗性資源(如燃料)和非消耗性資源的時間表。后一類資源使用時通常不會產(chǎn)生明顯消耗,而僅僅是被“留用”一段時間(如:某樣設備)。
4)狀態(tài)時間表
狀態(tài)時間表表示任何屬性或狀態(tài)都隨時間變化。每個狀態(tài)可以有幾個可能取值,但某時刻一個狀態(tài)只能取一個值。活動可以更改或使用狀態(tài),例如,“啟動引擎”活動會將引擎的狀態(tài)設置為“激活”,而“移動”活動也會要求引擎處在“激活”狀態(tài)。當活動隨時間設置/運轉(zhuǎn)時,狀態(tài)時間表值將會不斷更新,并可能出現(xiàn)不一致或沖突。此時,狀態(tài)時間表子類將負責不斷檢測那些非法引入的變換序列。
5)參數(shù)約束網(wǎng)絡PCN(Parameter Constraint Network)
每個活動都有許多由用戶定義或由系統(tǒng)計算生成的參數(shù),如開始、結(jié)束和持續(xù)時間,所用資源,更改/占用的狀態(tài)等。在CASPER中,可以在同一活動內(nèi)的參數(shù)之間或在不同活動定義的參數(shù)之間,創(chuàng)建依賴關(guān)系。依賴關(guān)系對應參數(shù)值的約束,這些依賴關(guān)系通過PCN表示和維護,以確保參數(shù)之間在任何給定時間都滿足相應的依賴關(guān)系。
6)規(guī)劃和調(diào)度算法
規(guī)劃/調(diào)度系統(tǒng)采用搜索算法搜索有效的接近最優(yōu)的計劃/調(diào)度。ASPEN框架支持多種調(diào)度算法:構(gòu)造性算法和基于修復的算法等,前者以增量方式構(gòu)造有效的調(diào)度;后者使用隨機或貪婪技術(shù)生成一個可能有效、也可能無效的完整的計劃,然后通過迭代分析,啟發(fā)式消除或修復計劃中的沖突,直到形成有效的計劃。
原理上,CASPER接收到高層的目標并生成一個計劃,接著增量式派送執(zhí)行計劃,然后監(jiān)控計劃的進程,同時隨時處理計劃執(zhí)行過程出現(xiàn)的問題。計劃就是一系列的活動,既要滿足運行的約束,也要實現(xiàn)高層的目標。CASPER中的約束可表示為:可列舉狀態(tài)觀測量(如:攝像機開機和關(guān)機狀態(tài))、可耗盡/可更新(如:燃料)或不可耗盡/不可更新(如:20W功率)資源約束、動態(tài)標定的時間約束(如:在觀測之前,校準一個相機需要20~30 s時間)等。
沖突的實質(zhì)一定是存在特定方式違反了計劃約束,包括參數(shù)約束、時間約束或者資源約束。每種沖突類型對應一組修復方法。
在迭代修復過程中,在用戶給定的時限內(nèi),迭代修復算法每次選擇一個沖突進行處理,直到?jīng)]有沖突或者超出了用戶給定的處理時限為止。預先給定的沖突修復方法包括:活動的移動、刪除、細化或抽象;為某項活動增加一個示例或進行預留;取消預留;打開時間約束;斷開時間約束;更改某個參數(shù)值等。
迭代修復算法首先選擇一個待修復的沖突,然后選擇一種修復方法。比如:當移動某個活動時,算法必須為該活動重新選擇一個起始時間。在修復某個沖突時,可能引起另外一個沖突,因此,整個沖突消解過程,通常需要很多步驟。
圖9給出了一個修復示例。板卡RAM是一類可耗盡資源,深色陰影部分表示RAM內(nèi)存出現(xiàn)了超額訂閱沖突。沖突之前使用資源的科學活動稱為貢獻者,移動或刪除一個貢獻者可以修復沖突;另一種可能是通過創(chuàng)建下鏈活動,實現(xiàn)資源補充,修復沖突。
圖9 資源耗盡沖突修復示例[10]
傳統(tǒng)上,研究規(guī)劃和調(diào)度主要集中在處理批量計劃制訂問題上。這種方法,在處理一個規(guī)劃問題時,把時間劃分為多個規(guī)劃區(qū),每個規(guī)劃區(qū)持續(xù)一段時間。每次計劃執(zhí)行周期,當時間接近當前規(guī)劃區(qū)終點時,規(guī)劃器預測當前計劃執(zhí)行結(jié)束時的系統(tǒng)狀態(tài)(參見圖10),并根據(jù)新規(guī)劃區(qū)預期狀態(tài),調(diào)用新規(guī)劃區(qū)的新目標;然后規(guī)劃器為新規(guī)劃區(qū)生成一個新計劃。
圖10 傳統(tǒng)的批處理“計劃-執(zhí)行”周期[10]
這種方法有許多缺點。在此類面向批處理的模式中,規(guī)劃通常是一個離線過程,事先需要大量的計算工作,因此在規(guī)劃器調(diào)用和生成新計劃之間有很大的延遲。如果出現(xiàn)規(guī)劃失敗等負面事件,則到新規(guī)劃生成整個響應時間可能非常長。此時,被控系統(tǒng)必須在沒有規(guī)劃器指導的情況下,以適當方式運行。
如果發(fā)生正面事件,比如活動提前結(jié)束,響應時間可能會很長。如果機會短暫,系統(tǒng)必須能夠在沒有新計劃情形下利用這些機會,這是因為生成新計劃將產(chǎn)生延遲。
特別是,由于批處理規(guī)劃器非常耗時,它必須在當前計劃結(jié)束之前就啟動,這就使得預測當前計劃執(zhí)行完成時刻的系統(tǒng)狀態(tài)成為難題。如果預測錯誤,則規(guī)劃在后續(xù)執(zhí)行過程中會變得更困難。
為了使動態(tài)規(guī)劃處理獲得更高級別的響應能力,CASPER采用了連續(xù)規(guī)劃方法。與其考慮批處理過程,規(guī)劃器需要獲得目標和初始狀態(tài),不如考慮為規(guī)劃器設計當前目標集、計劃、當前狀態(tài)以及預估未來狀態(tài)的模型。由此,可在任意時刻,通過對目標、當前狀態(tài)或計劃區(qū)的增量更新(以比批量計劃小得多的時間增量)更新計劃的當前狀態(tài),完成規(guī)劃流程化處理。
由于更新可能碰到意外事件,也可能只是隨時間向前推進,此時,規(guī)劃器只需根據(jù)最新信息維護一個滿意一致的計劃。由于事情很少完全按照預期進行,規(guī)劃器隨時準備修改計劃。從規(guī)劃器視角看,每個周期中都可能會發(fā)生以下情況:
1) 在計劃中發(fā)布目標和初始狀態(tài)更改;
2) 變更效應(包括沖突識別)通過當前計劃預估傳遞;
3) 調(diào)用計劃修復算法,消除沖突并使計劃符合當前的狀態(tài)和目標;
4) 執(zhí)行計劃中最緊迫的任務。
圖11描述了這種規(guī)劃方法。在每一步中,規(guī)劃器都會根據(jù)當前規(guī)劃區(qū)分舊計劃、新規(guī)劃區(qū)中目標變化(Δ目標)、狀態(tài)變化(Δ狀態(tài))和規(guī)劃區(qū)的擴展,通過增量重規(guī)劃尋找更有效的計劃。
圖11 連續(xù)增量式計劃擴展規(guī)劃法[10]
這里關(guān)鍵的假設是,如果Δ目標和Δ狀態(tài)很小,則使計劃與狀態(tài)和目標一致所需的計劃變化(Δ計劃)也會很小。
當然,不能保證上述假設總是正確。事實上,如果領域目標高度交互,則目標組合中某個小改變可能會迫使計劃發(fā)生重大變化。即使這樣,使用不同抽象級別可有助于保持這種增量屬性。通常,較低抽象級別需要大量的計劃更改,可以表示為更高抽象級別單一更改,例如,與單個觀測相關(guān)聯(lián)的一組移動操作活動,可等價于執(zhí)行單個移動操作。
感知引擎的主要目標是生成可作為安全導航的基礎態(tài)勢圖,因此可以使用達成此目標的任何傳感器套件。比如:ASV(Autonomous Surface Vehicle)通常在海面上航行,ASV的危險來源來自海面上或與船舶吃水深度相比較淺的任何東西;而對AUV(Autonomous Underwater Vehicle)而言,感知引擎通常有一個前視聲吶系統(tǒng),有許多商用系統(tǒng)已經(jīng)在水下機器人上安裝和測試過,AUV和ASV不同之處在于,AUV在3D環(huán)境中移動,其環(huán)境同時受到海底和陸地情況的限制。
感知引擎經(jīng)適應性修改,方可應用于相應場合。在MER上,JPL開發(fā)了增長型自主搜集勘測科學系統(tǒng)AEGIS(Autonomous Exploration for Gathering Increased Science System),采用MER車載傳感器在長距離行駛過程中科學標記感興趣的目標,然后采用基于目標位置的車載自主方法序列進行分析探究。這里AEGIS只是車載自主科學調(diào)查系統(tǒng)OASIS(Onboard Autonomous Science Investigation System)大型框架中的一部分,OASIS是一組模式識別算法套件,為車載自主系統(tǒng)設計,用于支持與飛行器和衛(wèi)星聯(lián)合實現(xiàn)科學探索。
關(guān)于感知引擎,AUV和ASV采用的是完全不同的方案,有關(guān)ASV感知系統(tǒng)技術(shù)的發(fā)展和應用將在后面詳細給出。
人類基于有限感知構(gòu)建周邊世界的心智模型,然后基于這一內(nèi)在模型進行決策和行動。系統(tǒng)動力學之父弗雷斯特將心智模型描述為:人類大腦中所承載的周圍世界的形象只是一個模型,在大腦中,沒有人能夠想象整個世界、政府和國家,因此,只能選擇一些概念和關(guān)系,用它們來表示真實的系統(tǒng)。
由此,在設計無人自主航行器的控制系統(tǒng)時,自然就想通過構(gòu)建類似人類“心智模型”的所謂“世界模型”,來描述智能體將要面對的未知世界。采用分層范式,典型的世界模型包含:
1) 一類智能體操作運行環(huán)境的先驗描述(比如:環(huán)境地圖等);
2) 感知信息(比如:智能體開始位置以及基于該位置行進的情況,當前智能體所在的位置等);
3) 完成此項任務所必需的任何其他知識(比如:所有必需的檢測裝置等)。
在分層范式中,存在兩類難題:封閉世界假設(Closed World Assumption)和框架問題(Frame Problem)。
封閉世界假設要求世界模型中包含自主智能體需要知道的一切,這就隱含沒有任何“意外”,如此高的要求,需要程序設計人員必須考慮所有情況。與封閉世界假設相反的是開放世界假設(Open World Assumption),當智能體在開放世界活動時,封閉世界假設將不再適用。由于分層范式整體上是一種不可改變的結(jié)構(gòu),因此當規(guī)劃問題采用分層范式時,程序員需要處理每一種可能的情形,由此形成的世界模型將異常龐大。程序中包含的事實(或公理),必須依據(jù)每次分層分類執(zhí)行,實際應用中通常導致不可計算。
這種用可計算方式描述真實世界就是通常意義的框架問題??蚣軉栴}由麥卡錫在1969年提出,即“僅具備有限信息處理能力的機器人(或其他人工智能設備)無法應對復雜現(xiàn)實世界中可能出現(xiàn)的所有問題?!薄翱蚣堋笔墙鉀Q某個問題時的“基礎支撐與行為邊界”。機器人、人工智能以及廣義層面的計算機,只要在限定的框架內(nèi),比如國際象棋等規(guī)則嚴密有限框架內(nèi),他們就能表現(xiàn)出人類無可比擬的能力。
框架問題不僅限于人工智能或機器人。我們?nèi)祟?比如一個汽車司機,遇到一些緊急情況,會突然腦中一片空白,釀成各種形式的車禍?,F(xiàn)代社會充斥著復雜且規(guī)模巨大的問題,比如對股市、戰(zhàn)場上的指揮控制、開發(fā)新藥等,變量至少成百上千,甚至幾萬、數(shù)十萬。由此可見,對于“基于規(guī)則的人工智能”來說,框架問題應該說是致命的。盡管如此,針對ASV應用的特定場景,我們?nèi)匀豢梢酝ㄟ^限定范圍,構(gòu)建所謂的“世界模型”,在一定程度上解決實際問題。
這幾年隨著無人技術(shù)蓬勃發(fā)展,JPL適時采取了政府免費使用、商業(yè)應用購買許可的方法,加速了CARACaS技術(shù)在軍用無人領域的應用。
空間集成系統(tǒng)公司SIS(Spatial Integrated Systems)作為美國下一代數(shù)字化3D數(shù)據(jù)獲取和處理技術(shù)開發(fā)和集成,提供成套解決方案的領軍公司,在其無人系統(tǒng)業(yè)務上,通過購買許可與JPL在CARACaS技術(shù)應用方面開展合作,全面驗證了面向無人系統(tǒng)的自主導航以及全天候(白天、夜間)避障避碰能力。
2014年8月在弗吉尼亞州的詹姆士河,在CNO主導下完成了最大規(guī)模的一次自主蜂群示范驗證,重點針對護送高價值目標和圍捕海上可疑目標兩項任務進行驗證;2016年10月在切薩皮克灣(Chesapeake bay)開展了港口巡邏防御示范驗證。隨后又開展了兩次演示,驗證了通過艦到岸的自主聯(lián)結(jié)器向陸戰(zhàn)隊提供后勤保障能力,以及在后續(xù)海軍陸戰(zhàn)隊演習中,采用了多架USV、UUV和UAV協(xié)同完成河流水文測量和火力打擊任務。
在這些事件中,CARACaS展示了適應多種無人系統(tǒng)戰(zhàn)術(shù)任務的能力,包括水雷戰(zhàn)、部隊保護、高動態(tài)環(huán)境下ISR、非對稱威脅快速響應、響應對手高速入侵高價值目標時的階段性協(xié)同保護,以及緩解傳感器和無人平臺功能退化時的動態(tài)行為。
受到公開資料限制,下面重點對2016年的港口巡邏防御(蜂群Ⅱ自主化)驗證進行分析。
2016年的蜂群Ⅱ自主化方案驗證中強調(diào)了構(gòu)件組合,表1描述了CARACaS功能構(gòu)件一種配置。豎直分層從上至下隱含相互間的依賴關(guān)系。每個子項經(jīng)組合形成中間件,提供公共模塊庫,支持從其他構(gòu)件或分系統(tǒng)接收并提供共享數(shù)據(jù),最重要的是通過采用DDS(Data Distribution Service)標準實現(xiàn)內(nèi)部進程間通信IPC(Inter-Process Communication),同時采用同步和異步消息選擇、在線數(shù)據(jù)一致控制、鍵控消息和內(nèi)置過濾等策略,支撐CARACaS世界模型的實現(xiàn)。
表1 CARACaS軟件框架[3]
在CARACaS系統(tǒng)中,所有智能體的運行方式均采用全分布式,即不存在某個特定的智能體進行集中式處理。在海上應用中,無人艇之間通過共享世界模型和隱式協(xié)調(diào)實現(xiàn)協(xié)同。圖12描述了系統(tǒng)的主要軟件模塊和功能數(shù)據(jù)流,自主規(guī)劃和控制元素駐留在任務執(zhí)行程序和行為引擎中。
圖12 系統(tǒng)的功能架構(gòu)和信息流[3,14]
任務執(zhí)行程序,根據(jù)當前世界模型的狀態(tài)確定需要完成什么任務(識別任務),同時權(quán)衡所有智能體及其當前和未來的任務,確定由哪個智能體處理哪項任務(完成任務分配),并且負責管理每個自主智能體執(zhí)行任務行為的時間表。因此,所有智能體均需要為自己和其他智能體作規(guī)劃,但只執(zhí)行給自己規(guī)劃的內(nèi)容。在海上遭遇通信難題無法精確通信時,該模型能根據(jù)當前數(shù)據(jù)共享的退化程度,適應性調(diào)整團隊任務分配。
行為引擎負責如何成功完成每項任務,通過CARACaS命令和數(shù)據(jù)處理接口激活行為,頂層行為在任務分配后由任務執(zhí)行程序激活。行為在本質(zhì)上是分層級的,比如:核查行為首先可能會調(diào)用攔截行為,后者又可能會調(diào)用航路點行為。因此,命令和數(shù)據(jù)處理接口支持嵌入行為間任意調(diào)用。當然,行為引擎必須確保所有傳遞命令均通過反射性危險回避層檢測,以確保艇體安全。
蜂群Ⅱ港口演習的目的是展示自主協(xié)同無人艇完成港口場景的巡邏任務。一組無人艇艇群,每個均具有完整的能力,安裝GPS和一定探測距離的本地傳感器,可完成某指定區(qū)域的巡邏任務。如圖13所示,任何外來船只(用觸點表示)進入該區(qū)域,必須采取跟蹤、核查,若判斷其為可疑船舶,在巡邏區(qū)域內(nèi)應當對其實施尾隨監(jiān)視。這里核查操作需要相應USV安裝攝像機和船舶識別軟件,對觸點圖像進行辨識,判斷入侵船舶的屬性和類型;如果被認定為“可疑”船舶,則必須進行尾隨處置;如果不是,則船只被認定為“中立”,保持適當跟蹤即可。必須確保所有船舶均被檢測和跟蹤,并且所有可疑的船舶由專門USV尾隨監(jiān)視。
圖13 蜂群Ⅱ港口巡邏場景[3,14]
為了實現(xiàn)蜂群Ⅱ港口巡邏任務,自主無人艇共涉及四種典型行為:
1)巡邏(Patrol):協(xié)同監(jiān)控某個指定的區(qū)域;
2)跟蹤(Track):始終保持區(qū)域內(nèi)外來船舶至少在一艘USV雷達探測范圍內(nèi),并形成穩(wěn)定軌跡;
3)核查(Inspect):分派一艘攜帶類似攝像機設備的USV對不明船舶進行分類和識別;
4)尾隨(Trail):分派一艘USV密切追蹤和監(jiān)視已進行分類的可疑船舶。
在切薩皮克灣進行海上驗證,測試USV蜂群在真實任務環(huán)境中實施港口巡邏的有效性,共計進行為期一個月涉及12個不同難度的水上場景(包括入侵船舶的不同數(shù)量、部署、速度、接近和機動方式等)測試。選擇其中20個航次交給領域?qū)<覉F隊分析,在這些航次中,四艘無人艇共計完成38小時的自主運行。
驗證結(jié)果表明:大多數(shù)自主方法包括任務識別、多智能體任務分配、協(xié)同行為執(zhí)行、運動規(guī)劃以及危險規(guī)避等可行且有效,同時體現(xiàn)了在應對通信難題時的魯棒性。
盡管如此,評測顯示驗證結(jié)果對融合態(tài)勢感知圖像的高度依賴性以及感知噪聲對整體系統(tǒng)性能的不利影響。絕大部分影響行為的異常都與感知相關(guān),比如:航跡ID的改變、航跡丟失等與雷達性能相關(guān)。圖14描述了某個誤檢目標點導致一個正處在尾隨狀態(tài)的USV,為了保證航行態(tài)勢安全而被迫改變航向。
圖14 一個誤檢測目標點暫時中斷尾隨[3,14]
可見,對USV無人自主系統(tǒng),主要困難還是傳感器探測誤差,特別是當任務場景的構(gòu)建對傳感器誤檢測點和不匹配航跡高度敏感時,困難表現(xiàn)得更加突出。
通過對當前水面無人艇自主導航的主要感知模塊比較分析,初步得出以下結(jié)論。
1)雷達感知距離最遠,但受限于機械掃描速率。常見的商用海上X波段雷達也難以處理近距離回波(<100 m),雖然該限制部分可以通過采用更精細化的信號處理方案來克服;Ka波段雷達提供了較好的折中方案,探測范圍為30 m~3 km,但單純使用雷達很難解決船舶類型識別問題。
2)激光雷達雖然具有較合理的感知距離和距離分辨率,但與雷達一樣,受限于機械掃描速率。在實際應用中,有效射程也受限于較低的角度分辨率和船體搖擺,導致較小目標(如船只)在“稍遠”(大于數(shù)十米)時就只能返回少量的激光點云。
3)360度單目視覺雖然有較好的角分辨率,且無須機械掃描,但受當前視覺算法在不同光照條件下對各種類型障礙物可靠檢測能力的限制,特別是單目視覺距離分辨率相對較差,只能通過視覺上或慣性感應,在感知圖像中找到參考地平線。
4)立體視覺具有出色的角度分辨率,且無須額外的機械穩(wěn)定平臺,同時能可靠地感知和檢測水面上的物體。但受相機基線和圖像分辨率約束,主要不足仍是相機視場角和距離分辨率。
可見,單獨依靠一類感知模塊,難以實現(xiàn)無人艇自主的感知和導航,針對不同任務和場景,組合采用上述不同感知模塊,是解決無人艇自主航行的必然選擇。
鑒于商用的雷達感知技術(shù)相對比較成熟,激光雷達在無人艇上的應用尚有很多技術(shù)難點需要攻克,如探測距離太近和受海況影響返回的點云過于稀疏、質(zhì)量也難以令人滿意,有研究者認為,受海浪影響當距離大于20 m時,激光雷達相對就不再有效。鑒于CARACaS團隊更多精力放在視覺感知方面,因此,下面重點對這方面的工作進行分析。
美國海軍使用水面自主視覺分析和跟蹤系統(tǒng)SAVAnT(Surface Autonomous Visual Analysis and Tracking)來實現(xiàn)水面目標分析與跟蹤,SAVAnT系統(tǒng)實現(xiàn)了中遠程探測及跟蹤其他船只,并確定船只是否具有對抗性,SAVAnT接收來自全向攝像頭的圖像,識別圖像中感興趣的目標,估算目標存在的概率,包括無人艇傳感器范圍之外的目標。
SAVAnT系統(tǒng)的組件和數(shù)據(jù)流如圖15所示,圖像服務器捕獲原始相機圖像和INS(Inertial Navigation System)姿態(tài)數(shù)據(jù),并生成“穩(wěn)定”圖像。觸點服務器檢測“穩(wěn)定”圖像中感興趣的目標(觸點),并計算每個目標的絕對方位。通過目標級跟蹤和變化檢測OTCD(Object-level Tracking and Change Detection)服務實現(xiàn)對一系列來自真實目標和假目標的觸點方位進行分類,通過隱形三角測量定位目標位置(緯度/經(jīng)度),維護一個跟蹤目標數(shù)據(jù)庫,并在新目標出現(xiàn)或已知目標消失時進行報警。
圖15 SAVAnT系統(tǒng)的系統(tǒng)組件和數(shù)據(jù)流[16]
由于復雜多變的照明條件、視角的變換、可能遮擋等,不同的觸點范圍和海況的變化,從圖像中檢測特定類型的物體十分困難。
SAVAnT系統(tǒng)針對上述不利條件,在進行觸點檢測前通過圖像服務器進行了一系列的預處理。對于光照條件差的情況,實施增加曝光時間處理;對于由海浪帶來的視角變換,使用慣導姿態(tài)信息保持圖像“穩(wěn)定”,穩(wěn)定的圖像將被裁剪成以地平線為中心的垂直條帶,重點處理水面上感興趣的區(qū)域,從而減少計算時間;然后分別使用天空和水面中采樣到的局部像素平均值對圖像強度進行歸一化處理。
觸點檢測過程必須足夠靈敏,以便以相對較低的誤報率從輸入中提取所有真實目標。SAVAnT使用了兩種自定義算法,專門用于檢測場景中感興趣特定類型目標的觸點。
OTCD算法處理觸點服務器中被識別的所有觸點,以生成ASV任務所需的態(tài)勢感知。該功能采用生成和維護目標列表的形式,確認目標存在,估計目標位置。
OTCD操作在“物體層面”而不是圖像領域,主要是考慮已獲取的目標可能不在當前圖像中,在“物體層面”處理觸點還可以避免對來自不同相機的圖像進行記錄和拼接處理。OTCD通過跟蹤巡邏區(qū)域內(nèi)所有目標來實現(xiàn)觸點數(shù)據(jù)庫建立,包括位置估計、位置估計的協(xié)方差以及目標是否存在的概率。
這套“物體層面”上觸點跟蹤方式,初步解決了多目標的跟蹤問題,但SAVAnT的跟蹤任務與傳統(tǒng)的多目標問題,特別是與錨泊區(qū)艦隊防護AFP(Anchored Fleet Protection)任務之間有重要區(qū)別。
JPL在設計SAVAnT系統(tǒng)時選用了一個特殊的移動傳感器,它關(guān)注目標在長時間尺度上的身份,覆蓋目標區(qū)域為完全超出傳感器感知范圍更大時間的區(qū)間。傳統(tǒng)的跟蹤場景要么使用固定的傳感器,要么在移動時使用短時間尺度的傳感器,無論哪種方式,它們主要負責檢測即時可見的觸點,相比而言,SAVAnT允許目標“離開”和“回來”,在“回來”后仍然作為“離開”前的同一目標進行跟蹤,為應對這一挑戰(zhàn),SAVAnT為每個目標創(chuàng)新發(fā)明了一個“存在概率”以及管理這一概率的方法。
在錘頭立體系統(tǒng)中,立體攝像機的布置體現(xiàn)了分辨率、視場和構(gòu)型等因素的工程折中。由于單個立體對很難實現(xiàn)有效導航和遠距離探測所需的大視場和小角度分辨率;而多個立體對可以提供所需的視場和角度分辨率。但問題是當多個立體對以傳統(tǒng)方式安裝在單獨的固定裝置上時,會變得笨重且難以集成。采用的折中方法是:在同一固定裝置上安裝兩個立體對;攝像機共享一個公共基線,其中一對攝像機面向左側(cè),另一對攝像機面向右側(cè)。這種排列提供了良好的分辨率和視場,并采用一種緊湊構(gòu)型,代價是沒有理想的幾何立體測距。最終配置是:兩組安裝在公共夾具上的攝像機,具有1米基線和100度組合視野。采用攝像機分辨率為1280×960像素單色電荷耦合器件(CCD),單組視場約為60°,如圖16所示。
圖16 錘頭立體視覺構(gòu)型圖[15]
在多變的海上環(huán)境,獲得水面物體的高質(zhì)量圖像一直都是一項挑戰(zhàn),低太陽角和水面鏡面反射等環(huán)境因素作用,可能會使相機內(nèi)置的自動曝光控制失效,船只高加速度也可能導致圖像產(chǎn)生運動模糊。因此,錘頭系統(tǒng)中曝光控制算法,需要通過自適應控制增益和快門速度來消除這些不利因素的影響。
錘頭系統(tǒng)處理流程為:1)圖像處理。①立體測距,即通過左右立體對,生成密集測距圖像;②查找平面,找到水平基準面同時計算出穩(wěn)定的相機位姿。2)映射。①投影,將距離數(shù)據(jù)投影到以船舶為中心的二維柵格地圖上;②過濾,在地圖上,完成空間和時間過濾;③分類,計算每個地圖單元上的危險概率。3)跟蹤。①檢測:在二維柵格地圖中檢測離散目標(觸點);②分類:為每個觸點指定類型;③跟蹤:觸點融合后形成軌跡,并估計目標的速度和航向。
立體視覺系統(tǒng)生成兩類輸出:一類基于網(wǎng)格的危險圖,適用于靜態(tài)導航;另一類離散觸點列表,適用于動態(tài)導航。某些目標(如船舶)可能同時出現(xiàn)在這兩類視圖中。其中,分類器使用有監(jiān)督學習算法和手工標注的訓練數(shù)據(jù)離線生成。
分類算法在應用于海洋環(huán)境時會出現(xiàn)兩方面難題。1)錘頭上攝像頭布置方式降低了有效分辨率。在錘頭上,虛擬校正攝像機相對于真實攝像機旋轉(zhuǎn),導致校正圖像的分辨率不均勻。具體而言,校正后的圖像在前進方向(相對于船)上壓縮,并在側(cè)面拉伸。由于這種前向壓縮特別麻煩,因為它減小了對象的外觀尺寸,從而減小了有效的檢測范圍。因此,為了在不犧牲側(cè)面視野的情況下在前進方向上保持足夠高的分辨率,校正后的圖像必須比原始圖像放大約20%。2)必須對距離數(shù)據(jù)進行噪聲過濾。立體相關(guān)器包括許多內(nèi)部檢查,但是一些錯誤的對應關(guān)系不可避免地引入視差圖像。在許多應用中,可以使用簡單的后處理技術(shù)來消除這些錯誤,分割視差圖像并刪除具有少量像素或子區(qū)域非常小的部分。然而,在海洋環(huán)境中,這種方法導致去除水面和感興趣的物體(通常較小)。為此,我們用一個簡單的多尺度濾波器來增強標準后處理技術(shù):立體測距在多尺度(降采樣圖像)上獨立執(zhí)行,并去除不一致的結(jié)果。這種方法可以為水面圖像生成更好的信噪比,且總計算量只需要略微增加(由于立體相關(guān)計算量與圖像大小的立方體成正比,因此圖像大小減半可使計算量降至原來的1/8)。
采用多尺度過濾器能形成一個相對干凈的以船本體為中心的地圖,支持危險檢測。地圖使用慣導與GPS組合信息進行地理注冊,靜態(tài)危險物在數(shù)字海圖上標記。用誤差橢圓的大小表示立體測距信息中的不確定性,由于目標邊界上存在模糊混合測距像素,在校準深度方向上的相對距離比在交叉軌跡方向上的相對距離更大。在跟蹤階段,柵格地圖被用于檢測、分類和跟蹤離散目標,如船舶、航道標記和浮標。錘頭系統(tǒng)的輸出是一組觸點,表示為目標的位置、速度和類型。
在海上機器人領域,無人艇迫切需要更高效地自動檢測、跟蹤和分類船舶和其他水上危險物的模型,為此,2020年JPL開發(fā)出了一種先進的接觸檢測和分析系統(tǒng)CDAS (Contact Detection and Analysis System),用于處理攝像機圖像(包括可見光和紅外光譜),實現(xiàn)360°的海上態(tài)勢感知。
根據(jù)JPL自2006年以來的水上感知系統(tǒng)構(gòu)建經(jīng)驗,實現(xiàn)穩(wěn)健的海面目標感知任務需要關(guān)注以下具有挑戰(zhàn)性的情景:低能見度天氣條件、嚴重雜波的沿海和河流環(huán)境、高海況、高速的船舶本體和觸點運動以及半淹沒危險等。針對這些復雜場景,CDAS軟件通過對JPL自主設計的360°攝像頭模塊和立體視覺攝像頭模塊的輸入數(shù)據(jù)進行融合處理,以實現(xiàn)穩(wěn)健的觸點檢測,如圖17所示。值得一提的是,CDAS系統(tǒng)中使用了先進的立體視覺處理技術(shù),包括相機自校準、獨立安裝的相機之間的實時立體處理等,可實現(xiàn)遠距離的海面目標檢測和測距,并通過機器學習算法對環(huán)境中的目標進行分類,這項基于攝像頭的感知技術(shù)具有革新性。
圖17 第一、二代感知系統(tǒng)
CDAS在完成檢測任務后,還必須對圖像中觸點進行跟蹤,以估算觸點處目標的速度,便于后續(xù)目標運動估計,并對船舶目標類型進行分類,如圖18所示。
圖18 海面目標檢測與分類結(jié)果
海面目標的識別結(jié)果用水平矩形框標出,目標類別有貨船、游艇、軍用小艇、浮標等。針對海面多種易混淆目標,CDAS中檢測模型對海面上多種目標進行了詳細地標注和訓練。
CDAS系統(tǒng)通過對海面進行全方位的感知,生成基于網(wǎng)格的危險感知地圖以及離散型觸點目標列表,列表信息包括目標的批號、位置和速度等。
CARACaS框架通過CDAS系統(tǒng)高效地識別并分類船舶,從而便于JPL行為規(guī)劃引擎給出的行為序列符合國際海事COLREGS規(guī)則。此外,CDAS系統(tǒng)還支持諸如自動目標識別ATR(Automated Target Recognition)和情報、監(jiān)視和偵察等任務操作。
JPL一直在不斷升級其立體感知系統(tǒng),從最早的第一代360度單目攝像系統(tǒng),已經(jīng)逐步發(fā)展到第六代USV交叉立體處理系統(tǒng)。
其中:第一代由360度單目攝像+前視立體攝像+光電EO(Electro-Optical)構(gòu)成,第二代由360度高清攝像+高分辨率前視立體攝像+EO構(gòu)成,第三代系統(tǒng)由360度高清攝像+高分辨率前視立體攝像+EO/紅外IR(Infra-Red)構(gòu)成,如圖19。
圖19 第三代帶IR夜視功能感知系統(tǒng)
第四代感知系統(tǒng)是一種機械式松耦合立體光電/紅外系統(tǒng)MUSE(Mechanically Uncoupled Stereo EO/IR),如圖20所示。解決方案是采用遠距離立體攝像系統(tǒng),實現(xiàn)無雷達觸點檢測:1)通過利用艦艇自身的立體基線,實現(xiàn)遠距離觸點的檢測;2)由于只需要被動感知,具備根據(jù)任務改變游戲規(guī)則能力;3)裝艦適用性,僅僅需要放置一個攝像機;4)能夠通過測量海岸線實現(xiàn)無GPS導航。面臨的挑戰(zhàn)有:缺乏剛性立體安裝桿,長基線安裝桿結(jié)構(gòu)容易變形,每幀圖像均需要校準;校準采用手工處理非常困難。JPL創(chuàng)新工作:僅僅采用作戰(zhàn)圖像就能實現(xiàn)高保真自動校準;高分辨率寬基線立體圖像的快速立體處理;多攝像域3D結(jié)構(gòu)新型學習算法。
圖20 立體攝像機無雷達觸點檢測
2017年5月,MUSE被安裝在海上獵人(Sea Hunter)進行測試,采用GPS和AIS提供海上目標真值,分別進行了大基線和超大基線試驗驗證,雖然取得預期成效,但仍面臨諸多挑戰(zhàn)難題:在大基線方面,由于安裝桿過重帶來的安裝問題和視點變形等問題,完全剛性的安裝桿(?1 m)幾乎不可行;在高分辨率圖像方面,需要非常寬幅的圖像才能“看到”觸點目標,需要較小的角分辨率才能實現(xiàn)較好的距離估計,此類大處理帶寬和低更新率在高速平臺上幾乎是不可實現(xiàn);在視場方面,要求寬覆蓋,需要看到USV前方的所有觸點,才能實現(xiàn)有效的態(tài)勢感知。
第五代感知系統(tǒng)是一類多USV立體交叉系統(tǒng)CUS (Cross-USV Stereo),如圖21所示。解決方案采用多個USV實現(xiàn)遠距離目標三角定位:1)根據(jù)兩艘艦艇分開形成的基線,檢測遠距離目標觸點;2)同樣由于是被動感知,具備根據(jù)任務改變游戲規(guī)則能力;3)兩艘艦船同時獲得目標觸點;4)根據(jù)兩艘USV之間的距離,以及到觸點的角度解三角形。可能的挑戰(zhàn):需要同步相隔100多米的圖像;找到不同視場中相同觸點;建立精確觸點指向角;多個USVs相繼獲得觸點位置。JPL創(chuàng)新工作:采用觸點檢測(單目CDAS)定位遠距離觸點;圖像同時獲取;多平臺角度精確確定。
圖21 多USV三角定位[18]
JPL在陸地上采用162 m基線(相機間隔)進行測試。在陸地上,采集從幾百米到10 km的10個圖像目標(觸點)進行驗證,表明定位誤差是距離的函數(shù)。在162 m基線情形下,1個像素的觀測誤差約為距離3.5%(即350 m,對于10 km);給定方向和像素誤差時,10 km目標觀測速度誤差情況如圖22所示。
圖22 給定方向和像素誤差時(10 km),速度誤差與觀測點數(shù)關(guān)系[18]
第六代感知系統(tǒng)一體化垂直被動光電測距系統(tǒng)VIPER(Vertical Integrated Passive EO Ranger),如圖23。針對當前感知系統(tǒng)存在的設備重(>45 kg)、功率高(>500 W)、價格貴(7萬美元)等問題,設計方案采用立體垂直化解決方案,由低功耗處理器和被動廉價的EO相機集成構(gòu)成,實現(xiàn)觸點距離估計。面臨的挑戰(zhàn)有:廉價攝像機(小于500美元)采用漸進掃描方式,在運動平臺上可能會退化;信用卡大小的處理器無法采用標準處理架構(gòu),需要軟件進行適應性修改。JPL創(chuàng)新:紅外和可見光相機在運動平臺采用漸進掃描方式可行性已完成驗證;已完成在Tegra X1處理器卡進行MUSE優(yōu)化編碼測試。VIPER優(yōu)勢:連續(xù)功率35 W(峰值功率小于50 W)、重量(小于4.5 kg)、等價或優(yōu)于HammerHead(更新率2 Hz)性能、價格約1萬美元/單元。
圖23 VIPER概念設計圖[18]
表2列出了JPL實驗室,在推動水上被動感知測距技術(shù)情況小結(jié)。
表2 水上被動感知測距情況小結(jié)
以上分析集中在視覺信息處理層面,這應該是無人系統(tǒng)在特殊應用場景中取代人的一項重要的能力提升,所有綜合處理也都側(cè)重于視頻特征。如何采用數(shù)據(jù)融合技術(shù)構(gòu)建完整的感知態(tài)勢圖,可參見瓦格納聯(lián)合公司(D. H. Wagner Associated)相關(guān)研究工作。該公司在SIS、先進研究實驗室ARL(Advanced Research Laboratory)等協(xié)助下,基于數(shù)據(jù)融合數(shù)學模型方面的優(yōu)勢,成功研制了以異構(gòu)無人航行器UVs(Unmanned Vehicles)平臺協(xié)同為應用對象、以分散式自主數(shù)據(jù)融合服務DADFS(Decentralized and Autonomous Data Fusion Service)處理為核心的融合航跡云和數(shù)據(jù)融合引擎,如圖24所示,其中的核心算法已經(jīng)通過4個實際無人平臺的真實數(shù)據(jù)和50個無人航行器的模擬數(shù)據(jù)測試驗證。DADFS算法的主要特點包括:1)采用“燃燒干柴(Burns Down the Haystack)”技術(shù)顯著減少環(huán)境雜波;2)為與操作員關(guān)注、具有較高利害關(guān)系的航跡和目標進行報警;3)改善航跡一致性;4)改善目標分類和身份識別效果(精度和潛伏期);5)潛伏期和延遲的最小化,提升抗中斷能力;6)在通信網(wǎng)絡出現(xiàn)中斷、間隙和低帶寬情形下保持高效處理;7)輕量化軟硬件。
圖24中,JDBS即JHU/APL(Johns Hopkins University Applied Physics Laboratory)分布式黑板系統(tǒng),由JHU/APL提供。
圖24 DADFS融合航跡云及其數(shù)據(jù)融合引擎[22]
CARACaS自主技術(shù)發(fā)展得益于空間集成系統(tǒng)SIS卓有成效的集成開發(fā)工作,前面已經(jīng)提到SIS組織開展的系列化演示驗證,該公司在無人系統(tǒng)方面擁有的核心技術(shù)能力,包括全自主智能控制、便攜式可伸縮系統(tǒng)(適裝任何船舶)、任務行為開發(fā)和剪裁(適應不同傳感器載荷和作戰(zhàn)任務)、群體行動協(xié)同、遵守海上規(guī)則和航道約束、持續(xù)海上存在、最小化通信鏈路依賴、最小化人類監(jiān)管需求、海上性能可驗證性等,聲稱其端到端解決方案能為政府和商業(yè)用戶提供非同一般的價值。下面是SIS開發(fā)的幾個典型系統(tǒng)。
SIS公司基于CARACaS技術(shù)研發(fā)了一套自主系統(tǒng)SAS(SIS Autonomous Systems)作為所有自主航行器基礎軟件。SAS提供一個智能化、面向目標的航行器控制系統(tǒng),能使任何航行器變成智能機器人。SAS采用全模塊化架構(gòu),很容易通過改造,適配任意航行器底層自主控制。圖25~26給出SAS在無人艇上應用示例。
圖25 無人艇自主航行中并行行為組合[2]
圖25中采用速度避障法,涉及具體的并行行為組合有:向目標點前進;躲避危險;服從國際海事COLREGS規(guī)則。
圖26中USV執(zhí)行巡邏可能涉及的串行行為組合有:1)USV保持常規(guī)“巡邏”行為,直到檢測到感興趣觸點COI(contact of interest);2)中斷“巡邏”行為,發(fā)起對COI“攔截”行為;3)中斷“攔截”行為,發(fā)起“尾隨/跟隨”行為。
圖26 USV巡邏過程中串行行為組合[2]
針對無人艇海上自主組網(wǎng)通信中存在環(huán)境和干擾的不確定性,SIS公司開發(fā)了一種異步數(shù)據(jù)可靠傳輸系統(tǒng)RADS(Reliable Asynchronous Data Delivery System),RADS基于DDS標準,依據(jù)帶寬可用情況差異,可為任意數(shù)量的自主航行器提供一個高可靠通信傳輸服務,系統(tǒng)允許多個客戶端通過一個RADS服務器實現(xiàn)互聯(lián),可在任何通信層構(gòu)建系統(tǒng)間的數(shù)據(jù)同步。RADS通過劃分不同帶寬等級,優(yōu)先保證重要的、緊迫性高的數(shù)據(jù)傳輸,然后根據(jù)可用帶寬空間,盡可能實現(xiàn)其他數(shù)據(jù)的同步傳輸。
SIS公司針對當前面臨的與多個機器人系統(tǒng)交互難題,開發(fā)了多智能體指揮控制MAC2(Multi-Agent Command & Control),為用戶提供可行解決方案。 當前,指揮控制系統(tǒng)在某一時刻僅能為某一平臺提供輸入,無法實現(xiàn)與SIS最新開發(fā)自主控制系統(tǒng)的最優(yōu)交互。為了解決這一難題,MAC2通過平臺優(yōu)化,支持在最短時間內(nèi)提供最有效解決方案,實現(xiàn)多智能體執(zhí)行復雜任務時的協(xié)同控制。同時,MAC2為操作手提供一個直觀的、易于理解的人機界面,通過快速瀏覽實現(xiàn)多平臺態(tài)勢感知。
SIS研發(fā)了平板式MAC2,即手持式自主航行器操作臺HAVOC(Handheld Autonomous Vehicle Operator Console)提供對自主無人艇的移動指揮。平板式MAC2 使得瞭望員和指揮員可以身處關(guān)鍵環(huán)節(jié),實現(xiàn)“運動中指揮”,由于在此類情形下,讓指揮員固定在某個地方幾乎是不現(xiàn)實的,也太過受限。為此,經(jīng)過廣泛的咨詢以及艦隊用戶通過實際演示驗證中的試用,SIS開發(fā)了此類平板式控制系統(tǒng)。
自2006年開始,SIS作為全球無人技術(shù)集成應用領域的業(yè)界領袖,一直致力于研發(fā)無人自主系統(tǒng)解決方案。他們開發(fā)的多智能體機器人團隊SMART(Multi Agent Robotic Teams)自主系統(tǒng)(Autonomy System)是一個基于行為、面向目標的智能航行器控制系統(tǒng),能將任意平臺轉(zhuǎn)換成智能機器人。近10多年來,SIS共計為美國政府完成了15次軍事相關(guān)的演示驗證,涉及13個不同任務領域,其中安裝SMART的無人航行器共計運行超過6000小時。迄今為止,SMART已經(jīng)共計集成到15種不同類型航行器上,超過50艘無人艦艇(UUVs、UGVs和UAVs)。2020年夏天,SIS公司在美海岸警衛(wèi)隊USCG(US Coast Guard)的資助下,采用7 m金鋼無人攔截艇,驗證無人自主技術(shù)在遙遠太平洋上(試驗地點設在夏威夷瓦胡島南30海里的20平方海里開放水域)改善海上態(tài)勢感知能力可行性。
2021年1月,美國最大的國防造船商亨廷頓英格爾工業(yè)公司HII(Huntington Ingalls Industries)宣布收購SIS公司無人系統(tǒng)業(yè)務(同時SIS大約有50名員工加入HII),預計交易將在2021年底完成。
收購主要原因可能來自兩方面:1)作為收購的基礎,SIS是自主技術(shù)領域的領導者,擁有一支才華橫溢的團隊,能在多域協(xié)同自治和感知方面提供無與倫比的能力。近期SIS團隊正與一家英國公司合作,在一艘大型水面艦艇上測試自主系統(tǒng),后續(xù)也將提供美國海軍試驗測試。這項工作與HII未來業(yè)務非常接近。2)無人領域巨大發(fā)展空間和面臨后續(xù)競爭壓力。HII公司在2020年9月獲得了海軍大型水面無人艇LUSVs(Large Unmanned Surface Vehicles)合同(同期Lockheed Martin、Bollinger Shipyards Lockport LLC、Marinette Marine、Gibbs & Cox、Austal USA LLC五家公司也獲得類似合同),美海軍設想中的LUSV約60~90 m長以及滿載排水1 000~2 000 t,大小類似小型護衛(wèi)艦。根據(jù)國防部咨詢委員會海軍事物特別專家提交的報告:美軍一直在不斷調(diào)整其造艦計劃。依據(jù)未來分布式艦隊架構(gòu),2020年12月,為特朗普繼任者提供的建議計劃是:382~446艘有人艦、119~166艘LUSVs和中型無人水面艦MUSVs(Medium Unmanned Surface Vehicles)、24~76艘超大型水下無人潛航器XLUUVs (Extra-large Unmanned Undersea Vehicles);拜登上臺后,2021年6月提交國會造艦建議計劃更新為:321~372艘有人艦、59~89艘LUSVs和MUSVs、24~76艘XLUUVs,規(guī)模減小很多。盡管造艦計劃具體數(shù)據(jù)波動較大,但總體上看,未來美海軍減少有人艦艇、增加無人艦艇,構(gòu)建更加少人或無人分布式艦隊的決心是確定無疑的。
美軍認為無人自主系統(tǒng)存在的兩方面優(yōu)勢:分布式和機動性。1)無人自主系統(tǒng)的使用將有助于實施“分布式艦隊”概念,確保在擁擠戰(zhàn)場上各類武器和傳感器的運用更加平衡;2)無人自主系統(tǒng)使用,可以通過優(yōu)化戰(zhàn)略縱深,提高作戰(zhàn)部隊“機動性”,因此,可顯著提升部隊的速度和敏捷性,同時,能讓相對固定交戰(zhàn)對手增加挑戰(zhàn)性。
為了加強美海軍對海洋的控制,又進一步提出了“分布式殺傷(Distributed Lethality)”的概念,并認為當務之急是提升水面部隊殺傷力,特別是在進攻性武器和水面行動群SAGs(Surface Action Groups)作戰(zhàn)概念方面,為指揮官提供更多的選擇。其中,為了增強戰(zhàn)術(shù)層面的殺傷力,核心是廣泛使用戰(zhàn)術(shù)自主無人水面艦艇TUASV(Tactical Autonomous Unmanned Surface Vessel),顛覆當前海軍固有海上拒止方式,使有人建制部隊遠離有爭議水域,迫使對手在更大防御范圍分配關(guān)鍵和有限資源。
無人系統(tǒng)形成作戰(zhàn)能力的前提依然是無人艇本體。為了滿足無人自主技術(shù)應用需求,船體結(jié)構(gòu)工程必須遵循以下基本框架:能感知環(huán)境和自身的健康狀況;能做出智能決策,優(yōu)化機械配置和傳感器使用;能避開其他船舶和障礙物;具備執(zhí)行指定任務能力。
1)美萊多斯(Leidos)公司海上獵人
2017年,萊多斯被指定為美中等排水量無人艇MDUSV(Medium Displacement Unmanned Surface Vessel)研制商,2021年4月,完成向海軍提交了第一艘這種最先進自主無人艇,命名為“海鷹號”(Seahawk);吸收海上獵人經(jīng)驗和教訓,滿載排水145 t(14 000加侖柴油),采用雙柴油引擎;成本約2300萬美元,對標濱海戰(zhàn)斗艦LCS(Littoral Combat Ship)的4.8億美元。在ONR和DARPA聯(lián)合推動下,借助海上獵人平臺(如圖27所示)完成了一系列載荷試驗,包括獵雷包和一種新型低成本翼傘風箏“桅桿”,即海軍牽引式空中升降系統(tǒng)TALONS(Towed Airborne Lift of Naval Systems),TALONS能將68 kg的通信和情報、監(jiān)視、偵察ISR(Intelligence, Surveillance and Reconnaissance)載荷,送到150~450 m的空中,比現(xiàn)有艦船的桅桿高出許多倍,大大擴展了USV的通信和ISR范圍。
圖27 中型無人水面船海鷹號(前)和海上獵人前往太平洋艦隊參加無人系統(tǒng)作戰(zhàn)21演習[31]
2)洛克希德馬丁UxS
洛克希德馬丁公司認為,UxS將借助低成本、大容量和高持久的UAVs、USVs、和UUVs,必將成為未來宙斯盾作戰(zhàn)系統(tǒng)對抗抵近威脅的關(guān)鍵助推器。洛馬可以利用現(xiàn)有的商業(yè)和軍事組件,重組并快速建造USV,通過補充自主武器系統(tǒng)AWS(Autonomous Weapons System)來輔助提高巡驅(qū)艦CRUDES(Cruiser-Destroyer)的殺傷力/生存能力。借助現(xiàn)有平臺翻新選項,采用LCS船體類型形成USV作戰(zhàn)概念。該系統(tǒng)主要特征:速度20~30 n mile/h、射程600~3 000 n mile、有效載荷56 245 kg、5級海況下生存、平均成本300~1 500萬美元。
3)國防部長辦公室UxS
創(chuàng)建自主無人系統(tǒng)套件,通過對現(xiàn)有水面平臺進行集成,構(gòu)建“幽靈艦隊(Ghost Fleet)”,讓艦隊擁有系列化自主能力選項。認為低端有幾個可能選項:MDUSV、Mk6巡邏艇、LCS等。國防部擬通過增加快速原型和演示,探索完善作戰(zhàn)概念。海軍部領導層承認,未來保持海上優(yōu)勢將取決于加快作戰(zhàn)速度,通過技術(shù)創(chuàng)新,抵消對手不斷增長的能力。2021年7月,兩艘幽靈艦隊霸王艦“游牧民”和“游騎兵”完成了從墨西哥灣到加利福尼亞母港航行,幾乎全程無人操作(只在進出港時切換到有人模式);在開放水域切換到無人模式,指揮控制和監(jiān)控均來自岸上或有人艦船的無人操作中心。船上只有少量的船員,對自主性和自動化操作實施監(jiān)視。
對于無人系統(tǒng),美軍預計在2035年具備初始作戰(zhàn)能力,針對TUASV,則必須確保在帶寬受限、連通性和電磁退化等條件下展現(xiàn)兼容性和互操作性,包括:具備在規(guī)定海洋環(huán)境中操作能力;可根據(jù)操作環(huán)境的變化進行調(diào)整;敏捷應對對手的碰撞和武器;自主等級可擴充。一致認為自主無人系統(tǒng)指揮控制是提升互操作能力、主控單元和TUASV行動執(zhí)行能力的核心。除了前面討論的CARACaS系統(tǒng),以下幾個系統(tǒng)也得到美國防部和海軍不同程度的關(guān)注,但它們更加側(cè)重于遠程指揮控制。
1)海上戰(zhàn)術(shù)系統(tǒng)公司TASKER
海上戰(zhàn)術(shù)系統(tǒng)MARTAC(Maritime Tactical Systems)公司開發(fā)了一種名為TASKER的體系化指控系統(tǒng),能同時充當多個USV的指控模塊。TASKER工作站是一種點擊式軟件系統(tǒng),支持操作員在半自主模式和手動模式間切換控制,系統(tǒng)由移動指揮中心MCC(Mobile Command Center)和船舶控制系統(tǒng)VCS(Vessel Control System)組成,可與自主無人系統(tǒng)通信。
2)L3哈里斯公司控制系統(tǒng)
L3哈里斯(L3 Harris)ASV無人海上系統(tǒng)采用ASView服務器系統(tǒng),通過統(tǒng)一操控界面,連接有人和無人系統(tǒng)。系統(tǒng)運用服務器/客戶端架構(gòu),實現(xiàn)對導航、傳感器控制數(shù)據(jù)、視頻饋送和負載信息等配置控制和無縫連接。系統(tǒng)支持遠程、自動、任務、自主和外掛等多種控制模式,可在運行期間與自主需求等級相適應。
3)共用控制系統(tǒng)CCS(Common Control System)
由海軍部長助理及打擊規(guī)劃和執(zhí)行系統(tǒng)項目辦公室開發(fā)的CCS,是一種具有通用框架、用戶界面和構(gòu)件化的軟件體系結(jié)構(gòu),可集成各類無人系統(tǒng)。CCS提供美國海軍無人航行器的硬件和軟件,可跨多個不同系統(tǒng)工作,支持通過CCS實現(xiàn)空中、地面、水下和陸地跨領域協(xié)同;支持海軍空中無人系統(tǒng)(UxS)提供共用的航行器管理、空中任務規(guī)劃和行動管理服務;支持來自傳感器有效載荷、支援平臺和基礎設施服務信息的處理、利用和分發(fā)。
需要特別說明的是,美海軍之所以首先發(fā)展海上獵人中型無人艇,除了從作戰(zhàn)需求方面,重點考慮與主要對手的柴油動力常規(guī)潛艇對抗應用外,另一項重要原因就是成本。根據(jù)美國會預算辦公室分析,考慮結(jié)構(gòu)相似性原則,“海上獵人”主要是為了替換“復仇級”(Avenger Class)反水雷艦MCM-1(Mine Countermeasures Ship),后者在整個生命周期中人員占該總成本的38%,對比巡洋艦人員成本占29%;同時,燃料成本占整個生命周期成本占比要小很多,驅(qū)護艦約8~11%,掃雷艦只有1%。
蘭德公司報告認為,ONR采用三種互補的技術(shù)發(fā)展海軍USVs的導航和任務自主性:1)利用空間和海軍作戰(zhàn)系統(tǒng)司令部SPAWAR(Space and Naval Warfare Systems Command)的公共地理空間導航工具箱COGENT(Common Geospatial Navigational Toolkit)和海軍空中系統(tǒng)司令部(Naval Air Systems Command)的戰(zhàn)術(shù)控制系統(tǒng)TCS(Tactical Control System),實現(xiàn)航路點導航和靜態(tài)物體避碰;2)引入JPL漫游者火星車的自主無人系統(tǒng)技術(shù),提升無人艇對環(huán)境的主動響應能力;3)與JHU/APL合作,他們在UAVs和UGVs方面的應用基礎技術(shù)積累,能確保USVs在更復雜環(huán)境中的快速響應性。
無人技術(shù)發(fā)展的初心,是為了代替人類完成所謂“3D”工作即枯燥(Dull)、骯臟(Dirty)、危險(Dangerous)類的任務,這是由于從事此類任務人類操作員,通常會因長時間乏味作業(yè)體力負擔過重而發(fā)生海上事故,或者因任務性質(zhì)隨時可能直接面臨被傷害、被抓捕,甚至死亡威脅等較高風險。
本文討論的主題更多側(cè)重于軍事領域USVs的應用,在此類行動中,無人單元之間、無人單元與人類之間的通信非常容易受到攻擊,常見的無線傳輸方式,如:藍牙、WIFI、無線電、紅外等,在受控環(huán)境中能很好地工作,但在軍用環(huán)境,當受到阻塞、欺騙、劫持、篡改和其他電子戰(zhàn)攻擊時,將會變得異常脆弱。即使沒有外部惡意攻擊,很多通信在軍用場合也并不總是可靠的(傳輸可能中斷和斷續(xù)性,水下系統(tǒng)的不確定性)。可見,對于無人系統(tǒng),有關(guān)通信和導航是首先需要解決的難題。
在協(xié)調(diào)和指揮控制模型方面,核心應該是處理無人系統(tǒng)與人類的協(xié)同問題。當前,美軍鼓吹所謂第三次抵消,一個重要的觀點就是,未來戰(zhàn)爭的勝利將屬于能夠最佳地利用自主性和人-機集成的國家。未來贏得灰色地帶沖突(定義為有限戰(zhàn)爭、強制任務和威懾,重要特征就是愈來愈被創(chuàng)新技術(shù)所主導)將越發(fā)關(guān)鍵,灰色地帶戰(zhàn)爭將更多地依賴于遠程控制的鍵盤操作而不是槍炮瞄準,來改變對手的行為。
多年來,美海軍一直在使用小型USVs和UUVs,需要通過有人艦船投放,本質(zhì)上它們還是作為有人艦船能力擴展。自2016年美國國會發(fā)布355艦計劃,甚至到2019年上半年,美國國會在大型無人艦UVs建造計劃上一直是含糊其辭。直到2020年9月,才在下一步造艦計劃中,明確應包括大型UVs,由此,美海軍未來轉(zhuǎn)型最可能的兵力結(jié)構(gòu),將會是由少量大型艦(比如:擁有大型甲板航母、巡洋艦、驅(qū)逐艦、大型兩棲艦和大型補給艦),加上占比較多的小型艦(護衛(wèi)艦、輕型巡洋艦、小型兩棲艦、小型補給艦,可能包括小型航母),以及第三種水面艦(大小類似輕型巡洋艦或大型巡邏艇)載有少量船員(采用有/無人可選)和大型UUVs等構(gòu)成的分布式艦隊。
所謂“知己知彼,百戰(zhàn)不殆”。就無人艦而言,現(xiàn)階段美軍特別重視其在開放水域的自主或遠程控制的航行能力。動輒30天自主航行測試,或者180天持久傳感器感知和探測能力測試,或者15 000 n mile的持久海上監(jiān)視活動。可見,未來很長一段時間,自主遠航都將是美軍開展無人艦驗證的一項最基本能力。