張融愷,閆 鑌
(1. 智能博弈與決策實驗室,北京 100091;2. 信息工程大學信息系統(tǒng)工程學院,鄭州 450001)
無人集群是面向未來的熱點研究領域,其具有低成本、低傷亡、高密度、高容錯的特點,智能化無人集群更凸顯了分布式分攤風險(100-1>0)和協(xié)同式聚合能效(1+1>2)的優(yōu)勢,成為各國科技角力的核心科研領域[1]。各軍事強國紛紛開展了分布式、小規(guī)模的集群作戰(zhàn)平臺研究[2],著眼未來戰(zhàn)爭,發(fā)展智能化、協(xié)同化的無人作戰(zhàn)系統(tǒng)[3]。目前無人系統(tǒng)已基本實現(xiàn)多無人機控制能力[4],美國開展了多項無人項目,包括“小精靈”“郊狼”“山鶉”[5],歐盟提出壓制防空無人機蜂群領域合作[6]。無人集群具備數(shù)量多、密集高、規(guī)模化的優(yōu)勢[7],國內(nèi)也已完成3051 架次的多無人機的同時控制[8]。
多無人機進一步發(fā)展為無人集群,需要從數(shù)量優(yōu)勢向智能化、協(xié)同化的質量優(yōu)勢逐步演進。全球人工智能和機器人峰會構想無人集群具有5S需求[9],包括集群化、智能化、小型化、安全性、敏捷性。美國規(guī)劃2025 年無人集群將實現(xiàn)高度自組織控制并具有戰(zhàn)場認知能力[10]。目前無人集群的智能協(xié)同能力仍處于起步階段,研究場景多為靜態(tài)及可控的任務,控制主要依賴預組織和預定義的程序,而未來無人集群需要面向動態(tài)復雜的高不確定性環(huán)境[11]。要實現(xiàn)無人集群智能協(xié)同能力的提升,腦驅智能啟發(fā)算法作為無人系統(tǒng)的大腦,是無人機集群感知、協(xié)同、控制能力的重要來源。
模仿生物群體智能是當下無人集群的主要方案,借鑒自然生物群落如蟻群、蜂群、狼群的集群行為,運用簡單的內(nèi)部規(guī)則條件控制整體行動,促進早期無人系統(tǒng)控制獲得一定的自主能力。然而在面向復雜動態(tài)環(huán)境時,生物群體涌現(xiàn)的集群智能具有一定局限性,例如生物群體啟發(fā)的無人集群組成要素相對單一,各模塊間交互方式較為固定,智能形式呈現(xiàn)初級的自下而上模式。仿生集群方案可能面臨發(fā)展受限的問題在整體遷移性和適用性方面有待提升,難以實現(xiàn)在復雜多任務場景中的有效應用。
隨著腦科學及神經(jīng)科學在近幾十年的快速發(fā)展[12],腦啟發(fā)算法為無人集群智能演化提供了另一種仿生思路。大腦作為自然界公認的高級智能系統(tǒng),借鑒類腦智能的感知、決策、規(guī)劃能力成為多領域研究的發(fā)展趨勢。類腦智能是指受腦機制和人類認知過程啟發(fā),基于計算建模通過軟硬件結合實現(xiàn)的機器智能[13]。人造系統(tǒng)經(jīng)過了漫長的迭代升級,然而目前沒有一種通用智能系統(tǒng)能達到人腦的智力水平[12]。因此大量研究均面向人腦的多維感知能力、環(huán)境適應能力、自主學習能力,以促進人造智能系統(tǒng)在相關領域能力的突破。目前類腦研究主要包括兩個方面,模擬大腦神經(jīng)元模型的類腦芯片,以及智能感知的類腦機器人。類腦智能在無人系統(tǒng)領域已開展了初步的探索,包括多維復雜態(tài)勢信息感知、分布式任務的方案優(yōu)化、無人機故障排查、無人系統(tǒng)實時路徑規(guī)劃等[13]。歐盟啟動的腦計劃研究中部署了人腦模型的高級計算架構,通過模仿人腦的工作模式啟發(fā)未來的計算機及機器人開發(fā)。類腦模型的SOAR(State,Operator,and Result,狀態(tài)、操作者和結果)架構[14]也廣泛應用于計算科學、機器人控制、智能感知等領域。此外,腦模型在硬件領域啟發(fā)了類腦芯片的研發(fā)和應用,未來的高性能計算架構將獲得類腦的低功耗和高并行能力[15]。目前廣泛研究的人工神經(jīng)網(wǎng)絡也參考大腦的功能結構,全連接網(wǎng)絡層借鑒了神經(jīng)元的連接模式,卷積神經(jīng)網(wǎng)絡模仿視覺系統(tǒng)的感受野,長短時記憶網(wǎng)絡的優(yōu)異性能受到記憶機制啟發(fā),脈沖神經(jīng)網(wǎng)絡融入了神經(jīng)元的激活和抑制特性。腦系統(tǒng)作為通用智能的參考模板,科研人員希望能夠充分學習其出色的知識遷移能力和自組織能力[16]。
現(xiàn)有無人集群的類腦研究處于起步階段,人工神經(jīng)網(wǎng)絡應用成為當下主流的仿腦模式,集群的腦啟發(fā)形式仍以應用人工神經(jīng)網(wǎng)絡為標志,這與現(xiàn)有計算設備的硬件與軟件約束有關。然而,人工網(wǎng)絡的仿腦原理與腦啟發(fā)的類腦機制不同,其在硬件構成和功能實現(xiàn)上與真實大腦仍有差異。研究人員逐漸重視真實大腦與無人集群的關系,借鑒大腦模型構建無人系統(tǒng),在類腦的宏觀層面上開展了無人集群的交叉研究。Zhao等[17]受到腦機制的啟發(fā),研究模仿人腦記憶通路的無人集群決策模塊,構建個體知識庫以實現(xiàn)熟悉場景的快速洞察。無人系統(tǒng)模仿人腦路徑規(guī)劃能力,在復雜環(huán)境中動態(tài)規(guī)劃最優(yōu)路徑。魏瑞軒等[18]的研究中,運用高密度無人集群解決碰撞問題,構建丘腦-基底核-額葉皮層的類腦通路,協(xié)助無人集群獲得“條件反射”的實時快速調(diào)整方案。
類腦與無人系統(tǒng)的混合智能組合模式,一方面借鑒了人腦的智能決策能力,另一方面充分發(fā)揮了無人系統(tǒng)在危險惡劣環(huán)境中的執(zhí)行能力,人機結合能夠相互取長補短,為無人系統(tǒng)賦人腦智能將有效融合二者優(yōu)勢。研究人員已在多種無人系統(tǒng)中探索類腦方法[19],在多種無人集群的現(xiàn)實任務中獲得效能增益。強化學習是借鑒人與環(huán)境的交互模式[20],通過模仿人類在環(huán)境中獲得收益或懲罰的反饋通路 ,優(yōu)化無人機間的通信策略[21],訓練無人系統(tǒng)與想定環(huán)境實時交互以獲得性能的快速迭代優(yōu)化,通過自學習過程實現(xiàn)自動的增量知識獲取。此外,類腦的智能無人集群應進一步拓展應用領域,集群模型框架不應約束無人機的運行空間,系統(tǒng)應面向體系和框架的構建,從而打破空域壁壘實現(xiàn)跨域協(xié)同。無人集群智能的類腦啟發(fā)路線仍處于初步探索階段,腦科學的快速發(fā)展也發(fā)掘出多種創(chuàng)新的認知理論。無人集群與類腦集合是人腦智能的復刻、拓展、延伸,多層次的腦機制模仿和運用為無人系統(tǒng)提供了廣闊的融合發(fā)展空間。
本文對無人集群系統(tǒng)提出了多角度的探索思路,從端、邊、云三個角度討論了腦機制與無人系統(tǒng)的結合方式,為類腦和無人集群的混合智能構建了具體方案。首先,對單體無人機的構成要素進行分析,參考神經(jīng)元和腦功能結構提出通用異構的無人機設計思路。其次,借鑒腦機制的神經(jīng)通路模型,將高效、低功耗優(yōu)勢應用于無人集群的拓撲和鏈路方案。此外,基于人腦雙向、多循環(huán)的視覺加工機制,構建無人系統(tǒng)從感知到?jīng)Q策的環(huán)形信息交互體系。綜合上述類腦無人集群的基礎架構,模仿人腦的自修復、自組織、自適應、自學習等高級認知功能,進一步提升無人集群的長期穩(wěn)定和自我進化能力。最后,面向現(xiàn)階段的無人集群和類腦研究基礎,展望后續(xù)類腦無人智能集群的探索方向。
個體無人機模仿大腦神經(jīng)元的基本結構,探索單體無人機在節(jié)點層面的設計方法。個體無人機是無人集群的基本實體單位,承擔觀察、通信、決策等細分任務。人腦的基本單元結構是神經(jīng)元,在處理復雜事項時也可將腦功能區(qū)作為細分模塊。無人機的層次化劃分與大腦分層結構具有共通性。本文從神經(jīng)元和腦功能區(qū)兩個類腦尺度進行分析,討論腦啟發(fā)的未來個體無人機結構。
平臺通用、載荷異構的個體無人機形態(tài)具有低成本、高復用的優(yōu)勢,有利于提升無人集群整體構建的共融協(xié)同能力。平臺通用提升了無人機間的溝通效率,并節(jié)約了開發(fā)多平臺的時間和經(jīng)濟成本。載荷異構為無人機的任務多樣化提供了可能,便于無人集群在執(zhí)行復雜任務時細化分配子任務。前期規(guī)范化的無人機個體設計有利于集群間協(xié)作,并提升集群的再組織能力。
個體無人機可參考腦結構中神經(jīng)元這一基本結構和功能單位,在底層模型構件中盡量趨同相似以實現(xiàn)平臺同構,在子任務中細化要素形成載荷異構。大腦的神經(jīng)元基礎形態(tài)由胞體和軸突組成,各腦區(qū)神經(jīng)元的分子組成和主要形態(tài)并無顯著區(qū)別,根據(jù)各神經(jīng)元的任務需要演化為多種功能特質,各神經(jīng)元的胞體突起大小、軸突長短、釋放神經(jīng)遞質種類可能存在顯著差異。參考大腦的神經(jīng)元分類方法,感覺神經(jīng)元負責刺激的傳入和感知,聯(lián)絡神經(jīng)元擔任神經(jīng)脈沖的任務傳遞,運動神經(jīng)元主要指導骨骼肌的運動。如圖1 所示,感知無人機可根據(jù)任務分工搭載功能性模塊,觀測無人機掛載紅外、雷達等感知模組,通信無人機配備鏈路交互單元,執(zhí)行無人機裝載執(zhí)行任務的專用儀器。無人集群可模仿人腦工作模式,在實際任務執(zhí)行中借鑒大腦的信息處理機制。類腦智能的無人集群在遂行任務中遵循OODA(Observation 觀察、Orientation 判斷、Decision 決策、Action執(zhí)行)環(huán)路,其常規(guī)協(xié)同流程如下:感知無人機類似無人集群的眼睛,主要負責觀察不同階段以獲取前方態(tài)勢信息,并將態(tài)勢信息源源不斷上傳至臨近通信無人機;通信無人機類似無人集群的大腦和嘴巴,負責態(tài)勢信息的收集、整合和溝通,主要實現(xiàn)判斷和決策任務,一方面將感興趣目標信息反饋回感知無人機進行進一步觀測,另一方面指揮執(zhí)行無人機完成預期任務;執(zhí)行無人機類似無人集群的雙手,主要負責執(zhí)行階段,基于搭載設備實現(xiàn)有利于集群的現(xiàn)實操作。神經(jīng)元在生物演化中進化出整體形態(tài)相近、功能細化不同的通用異構形態(tài),兼具低成本、高平替的特性,可以作為個體無人機規(guī)劃的參考模型。
圖1 通用異構無人機的類腦設計Fig.1 Brain-inspired design of general heterogeneous UAV swarm
通用異構設計方案與美軍最新的馬賽克作戰(zhàn)思想契合[19],運用統(tǒng)一的開放式架構,應用成熟的商用接口,面向特定任務為通用無人機部署特種功能[22]。馬賽克作戰(zhàn)思想[23]是基于大量單一、可平替的低成本平臺,構建靈活自適應的無人集群,以提升無人機間互操作性和自適應性[24]。一方面,無人集群的底層個體元素由統(tǒng)一規(guī)范接口的通用無人機組成,可有效提升內(nèi)部數(shù)據(jù)共享及信息傳輸效能。另一方面,根據(jù)任務需求設計無人機的異構方案,有利于集群的靈活組合和功能復用,提升無人系統(tǒng)整體針對動態(tài)復雜環(huán)境任務的執(zhí)行能力。
無人集群與個體無人機間一般存在多個層級,中間層級增設可提升底層組織能力和模塊間協(xié)同效率。部分無人機組成的中間層級可借鑒腦功能區(qū)的規(guī)劃模式,底層個體按照相近功能進行聚合。
研究人員發(fā)現(xiàn)大腦的信息加工主體為腦功能區(qū),目前公認的布洛德曼分區(qū)將大腦劃分為52 個區(qū)。解剖學研究發(fā)現(xiàn)刺激相應腦區(qū)會影響特定認知功能,熒光蛋白標記研究驗證了大腦工作依靠腦功能區(qū)間的協(xié)作。這些負責特定感知信息處理的腦功能區(qū)包括:處理視覺信息的枕葉視覺功能區(qū)、控制肢體運動的頂葉運動皮層、加工聽覺信息的顳葉聽覺皮層。功能區(qū)內(nèi)部的神經(jīng)元結構和功能相近,能夠集中高效處理特定的任務信息。Tang 等模仿大腦的功能區(qū)分布提出了SPAUN 腦模擬器[25],在SPAUN 腦模擬器[26]中設置了250 萬個模擬神經(jīng)元,并將其劃分為10 個模擬腦功能區(qū),這項多腦區(qū)協(xié)同計算模型具有開創(chuàng)性意義。無人集群的子部分可以模擬腦功能區(qū)的聚合形式,縮小功能相近的無人機間的距離。需要注意的是,無人機間的距離減小可以是空間距離,也可以延伸為拓撲結構的連接距離,其主要目標都是降低相近信息整合與交互過程中的通信損耗。此外,無人集群的分層設計可以借鑒視覺區(qū)V1、V2、V3的大腦層級架構,聚合單體神經(jīng)元的視覺能力,形成處理亮度、輪廓、紋理的高級功能。分布式的無人機個體通過聚合集中,形成超越個體的群體處理能力,得以完成高級復雜任務。
目前的無人集群主要執(zhí)行短時間的在外任務,執(zhí)行長時任務需要對無人機功能分層管理。無人集群在外長期執(zhí)行任務,需要穩(wěn)定可靠的生存能力,同時要具備持續(xù)更新的自學習能力。如圖2所示,大腦在進化中逐漸發(fā)展為三層結構,底層爬蟲腦負責呼吸、體溫等生命維持功能,中層哺乳腦發(fā)育出捕食及社交能力,高層的皮質腦進化出人類的感知、決策和判斷功能。爬蟲腦、哺乳腦和皮質腦分別代表了人類的生存需求、生活需求和進化需求。當下無人集群的發(fā)展處于爬蟲腦向哺乳腦的進化階段,可借鑒人腦的進化路徑增加相應功能,首先實現(xiàn)自組織的通信和觀測能力,再逐步拓展自學習的進化迭代功能。
圖2 類腦無人集群的功能分層管理Fig.2 Functional hierarchical management of brain-inspired UAV swarm
無人集群的分布式結構可抽象為邊和節(jié)點的關系,個體元素間穿點成線形成集群整體,通過溝通連接共同完成任務。無人機間的連接和分布可參考大腦信息加工模式,腦系統(tǒng)進化過程中篩選出的拓撲結構和連接模式是優(yōu)質模板。本文基于腦啟發(fā)的通信等級、交互環(huán)路、網(wǎng)絡組織三個層次探討無人集群的類腦交互模式。通信等級劃分中,對海量信息進行取舍并排序加工優(yōu)先級,預設專屬鏈路實現(xiàn)重要信息優(yōu)先處理。交互環(huán)路設計中,雙向內(nèi)外循環(huán)的指揮鏈路形成指令反饋環(huán)路并提升信息交互效率。網(wǎng)絡組織規(guī)劃中,節(jié)點拓撲組織形式模仿穩(wěn)定高效的“小世界”腦網(wǎng)絡。
無人集群在執(zhí)行任務時有大量信息排隊等待處理,包括原始環(huán)境采集數(shù)據(jù)和海量中間處理文件。無人系統(tǒng)對信息重要性排序并優(yōu)先處理關鍵任務,將提升整體任務規(guī)劃能力并優(yōu)化數(shù)據(jù)加工流程。無人集群經(jīng)常面對目標價值排序和任務優(yōu)先級設置問題,在規(guī)劃多任務時可參考腦系統(tǒng)中的通路設置,以類腦的專屬通路和預設通路為例,啟發(fā)無人系統(tǒng)的任務分配方案。
無人集群在分布式協(xié)作時首先要分清敵我,敵我識別的混亂將混淆任務對象和合作伙伴。大腦在進化過程中為自我認知構建了專屬通路,以回答“誰是我們的敵人?誰是我們的朋友?”腦機制的自我識別功能中最具代表性的是“雞尾酒原理”,即人們在嘈雜的雞尾酒會中也能清晰地聽到自己的名字。研究發(fā)現(xiàn)人腦在潛意識下也在自動捕捉自我相關信息,當自我屬性信息出現(xiàn)時會喚醒大范圍的大腦皮層。在心理學實驗中被試對自我姓名和面部的按鍵反應更快,并且對自我信息的靈敏度更高。核磁掃描發(fā)現(xiàn)大腦對自我信息有特異性反應,包括自我識別的專屬通路和右前額葉腦區(qū)的特異性激活。無人集群在自我識別時也可參照大腦機制,一方面通過設置專屬通路提升敵我識別加工的優(yōu)先性,另一方面分配部分線程進行自動持續(xù)的身份驗證。無人集群對自我識別的優(yōu)先處理有利于敵我態(tài)勢的實時感知,及時評估集群現(xiàn)存的行動能力,快速調(diào)整任務規(guī)劃并提供信息支撐。
無人集群大多采用固定處理流程加工環(huán)境信息,通用處理模板的多樣性感知信息能力仍有待提升,集群可以對感知信息預先分類并分配至預設通路進行針對性加工。例如,無人集群的目標檢測及定位可參考大腦視覺的工作模式,信息的分類加工可以參考大腦視覺處理的兩條預設通路。進行物體的視覺加工任務時,物體的識別通過大腦腹側的“what”通路加工,而物體的位置和運動信息通過大腦背側的“where”通路處理?!皐hat”和“where”通路分別預設了不同的視覺加工能力,前期視覺任務分類后會歸屬到特定通路進行針對性加工。無人集群在任務處理時可借鑒預設通路的模式,預設多種人工神經(jīng)網(wǎng)絡結構處理多樣化數(shù)據(jù)。如圖3 所示,以集群收集到的圖像、時序、拓撲信息為例,采集到的視覺圖像數(shù)據(jù)應用卷積神經(jīng)網(wǎng)絡,音頻及雷達等時序信號使用長短時記憶網(wǎng)絡,集群的拓撲圖信息運用圖神經(jīng)網(wǎng)絡等,發(fā)揮神經(jīng)網(wǎng)絡各自優(yōu)勢處理類型匹配的環(huán)境數(shù)據(jù)。將不同任務分配給專業(yè)的信息加工通路,提升差異性任務的定制化加工能力。
圖3 無人集群處理多模態(tài)數(shù)據(jù)的專屬通路Fig.3 The exclusive path of the UAV swarm processes multimodal data
無人集群任務執(zhí)行中的信息主要在感受節(jié)點和決策節(jié)點間傳遞,信息傳遞方向大多為從感受節(jié)點到?jīng)Q策節(jié)點的單向自下而上模式,以及決策節(jié)點實時控制末端節(jié)點的單向自上而下模式[27]。如圖4所示,OODA 模型提出后,部分無人集群采用觀察、判斷、決策、行動的4 步驟,形成周期性重復的單向閉環(huán),規(guī)范了無人系統(tǒng)任務執(zhí)行的操作流程?,F(xiàn)有OODA 模型仍可以進一步優(yōu)化創(chuàng)新,包括縮短環(huán)路運行周期,以及提升信息利用效率。本文提出類腦的雙向內(nèi)外循環(huán)的信息傳輸環(huán)路,雙向通路促進了層級間信息流向的多樣化,內(nèi)外循環(huán)增加了外部數(shù)據(jù)及中間信息的復用效率。
圖4 無人集群的指令鏈路Fig.4 The instruction link of UAV swarm
外部信息的通路可以參考多級視覺皮層的信息流向,視覺信息加工框架可以應用到無人集群的通信過程中。研究人員起初認為視覺信息從低級V1 區(qū)逐漸向高級區(qū)V2、V3、V5 傳遞,進一步研究發(fā)現(xiàn)高級視覺區(qū)能夠指導低級區(qū)的信息處理,形成了雙向的信息交互通路,例如高級認知分配更多注意力調(diào)整低級視覺區(qū)關注感興趣的圖像細節(jié)。更深入的研究發(fā)現(xiàn)V2、V3、V4 存在內(nèi)部信息的循環(huán)交互,信息處理中產(chǎn)生的亮度、顏色、輪廓等特征經(jīng)歷了循環(huán)加工,內(nèi)部信息循環(huán)有效提升了數(shù)據(jù)利用率。研究人員在人工智能領域中,探索使用過雙向循環(huán)的類腦模型,例如圖靈獎得主、深度學習先驅 Geoffrey Hinton 提出未來人工智能將應用“前向-前向”的前向網(wǎng)絡,在反向傳播的基礎上推廣了更接近大腦機制的正向傳播算法。
無人集群的防碰撞研究正在探索雙向內(nèi)外循環(huán)的交互方式,Girard等將腦啟發(fā)的碰撞規(guī)避原理應用于無人集群的碰撞規(guī)避[28],其提出的基底核-丘腦-額葉交互模式中包含雙向通路和多層循環(huán)。魏瑞軒等提出自主心智發(fā)育的無人機防碰撞控制架構[18],借鑒類腦模型中的避障航路方法,構建了以知識庫、避障策略、威脅模式為功能節(jié)點的雙線循環(huán)通路。ACT-R模型[29]應用腦啟發(fā)的功能區(qū)環(huán)路建模,實現(xiàn)了特定任務中的活動預測。
目前無人集群的主要拓撲結構包括:星形組網(wǎng)、中心式組網(wǎng)、網(wǎng)狀組網(wǎng)、分層混合組網(wǎng)等?,F(xiàn)實中根據(jù)任務難度評估無人集群所需的穩(wěn)定性、效率、交互性等因素,側重任務需求選擇相應的拓撲結構。然而人為預設定的拓撲方式難以滿足動態(tài)的環(huán)境變化,任務牽引的無人集群自適應拓撲方式更符合復雜多變的現(xiàn)實任務。其中,為無人集群設計優(yōu)質的默認網(wǎng)絡結構將大大降低自適應難度,促進集群在默認網(wǎng)絡基礎上的優(yōu)化改進。
大腦在長期進化中發(fā)展出一套高效穩(wěn)定的基礎網(wǎng)絡結構,“小世界”的拓撲形式在多種腦網(wǎng)絡中得以驗證[30]。如圖5所示,“小世界”規(guī)律是指融合了相鄰節(jié)點的密集連接以及遠距離節(jié)點的長程連接,其結合了正則網(wǎng)絡的穩(wěn)定性優(yōu)勢和隨機網(wǎng)絡的效率優(yōu)勢,既穩(wěn)固了相近節(jié)點的合作又降低了信息長傳的中轉次數(shù),在聚類能力和連接代價中保持了平衡。已有多項研究將“小世界”模型應用在城市交通和社區(qū)建設中。上文將個體無人機類比大腦神經(jīng)元或功能區(qū),腦網(wǎng)絡的拓撲方法同樣可以移植應用于無人機集群,提升功能相似無人機的通信頻率,增加處理任務時同類無人機的協(xié)作能力,保留部分長程中繼通信能力,為無人集群間的遠距離交互留有溝通鏈路。無人集群根據(jù)環(huán)境進行自適應調(diào)整時,只需在默認“小世界”拓撲結構中調(diào)整臨近聚類密度和長程連接數(shù)量,這將有效降低網(wǎng)絡優(yōu)化難度和重組織時間。
圖5 無人集群的交互連接方式Fig.5 Interactive connection mode of UAV swarm
通過在個體無人機與集群交互的底層框架基礎上構成靜態(tài)骨架,織線成面的無人集群將進化出更高的協(xié)同智能,實現(xiàn)動態(tài)組織和自我進化的軟實力提升。目前的無人系統(tǒng)在高損傷情況下難以達到與腦系統(tǒng)一樣的魯棒性,并且在復雜環(huán)境中缺少穩(wěn)定的自組織協(xié)同能力。類腦無人集群借鑒人腦的自修復性提升抗毀自愈能力,應用腦機制的自組織方案改善整體協(xié)調(diào)功能,參考腦啟發(fā)的自學習模式促進集群持續(xù)優(yōu)化迭代。
無人集群運行時會面臨部分節(jié)點失靈或損毀情況,子功能損傷可能引起上下游信息擁堵,節(jié)點損壞會進一步導致整體性能缺陷。目前應對突發(fā)情況通常設置緊急預案,評估集群整體損傷等級后執(zhí)行備選方案。有限固定方案難以精確應對復雜損傷問題,無人集群仍需提升針對現(xiàn)實受損情況的自我修復能力。無人集群可以參照大腦強大的自我修復功能,極端案例表明,患者在失去一半大腦后仍有機會存活。本文以大腦的日常修復、部分損傷、嚴重損傷為例,討論無人集群的類腦修復方案。
日常維護是保證無人集群穩(wěn)定運行的基礎,無人機的狀態(tài)評估和診斷預測將有效降低其老化受損風險。無人機自我診斷領域逐漸使用深度學習方法[31],Guo 等利用卷積神經(jīng)網(wǎng)絡預測無人機傳感器的故障[32],彭軍等應用深度信念網(wǎng)絡進行發(fā)動機的故障分類[33]。無人集群進行周期性的測試檢修,其檢修頻率可以參考大腦睡眠周期。通常大腦在夜間睡眠時會進行白天受損神經(jīng)元的修復,在評估白天工作量和神經(jīng)元受損狀態(tài)后調(diào)整睡眠休整時長。無人集群可借鑒大腦調(diào)整工作強度與睡眠時長的規(guī)律,評估無人集群的任務難度以調(diào)整檢修頻率,交替排布無人機的檢修和工作時間表。
無人集群的部分損傷可通過鏈路重分配方式,從全局角度尋找重組方案來盡可能保持集群的整體性能。如圖6 所示,這種全局尋優(yōu)的修復方式可參考大腦機制,例如視力障礙患者的觸覺聽覺功能得到加強,肢體永久損傷對應腦區(qū)的神經(jīng)元會被近鄰腦功能區(qū)延伸占用。神經(jīng)元功能復用和重分配有效緩解了部分節(jié)點損失,可以延伸應用到受損節(jié)點的周圍無人機,與集群整體重新建立連接。通過充分利用剩余無人機構建新的上下游連接,保障和加強集群內(nèi)其他功能通路的有效運行,實現(xiàn)功能自愈并保持整體執(zhí)行能力。在集群設計初期應預留容錯空間,布設一定比例的冗余節(jié)點,實現(xiàn)損傷個體無人機的快速替換。若預留的冗余無人機仍難以填充現(xiàn)有損失缺口,可以參考大腦中神經(jīng)干細胞的更新方式,整合各損傷無人機中完好的部分零件,拼湊重新組合成新的組裝無人機,維持集群的基本運行。
圖6 無人集群的自修復、自組織功能Fig.6 The self-repairing and self-organizing functions of UAV swarm
目前無人集群出廠及行動前被植入基礎功能,使用目標相似任務數(shù)據(jù)庫進行離線學習。然而,離線學習數(shù)據(jù)庫的方式有一定的時間滯后性,并且需要將數(shù)據(jù)庫在目標任務間遷移,難以適應動態(tài)未知的現(xiàn)實任務環(huán)境。知識的獲取有利于無人集群智能化的提升,可以參考人腦對新知識的學習模式,增加無人集群在任務中的自學習能力,獲取真實環(huán)境中的動態(tài)知識。如圖7 所示,類腦無人集群的學習可以分為3 個階段:在學習庫中存儲知識、與環(huán)境交互過程中掌握知識、開辟空間持續(xù)拓展知識。
圖7 無人集群的自學習流程Fig.7 Self-learning process of UAV swarm
無人集群通過任務獲取的數(shù)據(jù)不斷擴大知識庫,提煉整合感知的信息加入自身知識庫是自學習功能的第一步。記憶功能可參考大腦海馬體和丘腦的存儲模式,將任務經(jīng)歷重演形成知識庫的長期記憶。知識庫的構建將動態(tài)信息持續(xù)整合形成經(jīng)驗累積[34],同時便于相近任務決策時的知識快速檢索,縮短無人機的反應時間。研究學者受大腦記憶模式啟發(fā),提出了可塑突出形態(tài)的赫布法則[35],深度學習領域也將模擬人腦神經(jīng)元的脈沖神經(jīng)網(wǎng)絡應用于機器的記憶能力研究[17]。在無人系統(tǒng)的知識庫構建研究中, 魏瑞軒等在無人機避障方法中引用規(guī)避策略知識庫,模擬丘腦對知識的增量獲取功能,提升無人機預防碰撞的策略發(fā)育[18]。
無人集群在知識庫的基礎上還需反復強化運用新知識,與環(huán)境交互測試中強化新知識記憶通路和運用能力,在真實場景下改善無人系統(tǒng)的環(huán)境自適應性。強化學習模仿大腦的學習過程[36],通過環(huán)境反饋的獎勵結果優(yōu)化現(xiàn)有知識結構,這種無需人工干預和標記的方法,被廣泛應用于機器智能體的自學習過程中。Qiao 等模擬內(nèi)顳葉皮層對視覺能力設計了強化學習框架,提升了智能體物體識別在遮蔽、旋轉等不同視角下的魯棒性[37]。Jafari 等提出了大腦情緒模型啟發(fā)的智能控制器,情緒機制啟發(fā)的無人系統(tǒng)具有小型化和實時性優(yōu)勢,在無人機飛行測試中展現(xiàn)出更強的抗干擾能力[38]。機器憑借自身算力優(yōu)勢,強化學習的智能體在個別領域的能力甚至超越人類,例如DeepMind 提出的AlphaGo Zero 展現(xiàn)出極強的圍棋技術,以及Neural Turing Machine 在多智能體協(xié)同的星際爭霸游戲中擊敗了人類世界級選手。
強化學習的運用提升了無人集群的學習技能,增量學習將進一步提升無人系統(tǒng)的終身學習能力。無人集群對新知識的增量學習促進系統(tǒng)保持長久的進化趨勢,同時系統(tǒng)應保持新舊知識的更替,替換失效舊知識為新知識提供記憶空間。新舊知識替換過程可以借鑒大腦的遺忘機制,頻繁使用的知識會加強記憶通路,而長久未用的知識遵循遺忘曲線規(guī)律而逐漸忘記。研究人員提出了類腦的HAM人類關聯(lián)記憶模型[39],人工神經(jīng)網(wǎng)絡中的增量學習借鑒大腦遺忘模式,通過凍結舊神經(jīng)元和增補新神經(jīng)元獲得記憶空間,分配新記憶通路或重組記憶網(wǎng)絡獲得新知識。機器人實際應用場景中,Sandini等[40]應用增量學習思想提出了類腦的認知發(fā)育機器人,Gao 等[41]應用增量式特征提取改善機器人的辨認和識別能力。
類腦的無人集群研究是前沿的交叉領域,其整體性能的提升依靠各自學科的研究發(fā)展,混合智能效果呈現(xiàn)交互的螺旋上升趨勢?,F(xiàn)有腦啟發(fā)的無人系統(tǒng)仍處于起步階段,從整體架構到細節(jié)設計均有待探索和完善。本章列舉類腦無人集群在多個研究領域的未來增長點,多方向形成合力協(xié)助無人集群的智能化發(fā)展。
未來無人集群將負責更多的巡航、觀察等態(tài)勢感知任務,持續(xù)不間斷的信息采集成為無人集群的重要功能。大腦可以在消耗極低能量的情況下調(diào)控維持人體的生理功能,并在低功率狀態(tài)下完成與外界的多種交互。未來的類腦芯片使用將大大降低機器功耗,通過將脈沖神經(jīng)網(wǎng)絡、憶阻器等應用于類腦無人機,可顯著提升無人機的續(xù)航功能。低功耗的無人機可完成更長時間、長距離、高復雜度的任務內(nèi)容,提升個體無人機的連續(xù)工作能力,在接力偵察和周期巡邏中降低無人機架次。此外,對于處于靜默狀態(tài)的無人機,低功耗優(yōu)勢將延長其待機和壽命年限,可在更早期部署而不需擔憂短期能源問題。
目前無人集群的學習方式主要基于離線數(shù)據(jù)庫訓練,缺少自我學習的迭代更新能力,并且需要根據(jù)目標任務挑選相關數(shù)據(jù)進行預先學習。研究發(fā)現(xiàn)填鴨式教學收效快但難以迭代和創(chuàng)新,而面向環(huán)境和現(xiàn)實問題的互動啟發(fā)式教學可以調(diào)動智能體的積極性。無人集群作為智能體可借鑒交互式的訓練方法,在現(xiàn)實場景交互過程中學習針對性知識,并根據(jù)不斷變換的外部環(huán)境更新和優(yōu)化現(xiàn)有知識庫。此外,可參考教學中的辯論和討論形式,形成智能體間的對抗[41]和博弈模型,擇優(yōu)留存性能最佳的模型樣本,或針對不同智能體優(yōu)勢構建多場景的后臺預案。
目前無人集群任務執(zhí)行仍需人工在環(huán)路的指導和輔助,這需要人與機器間高效準確的交互溝通,快速變換的復雜任務場景尤其需要對無人機的精確控制。類腦無人集群模仿人腦的信息加工模式,將提升中間數(shù)據(jù)處理結果的直觀性和解釋性,間接幫助操作人員對態(tài)勢信息進行判讀和分析,有益于后方人員快速下達準確的操作命令。短期內(nèi)可借助增強現(xiàn)實、混合現(xiàn)實等沉浸式的交互應用技術,將外界信息直接刺激個人感官系統(tǒng),協(xié)助操作員獲得全方位的態(tài)勢信息。此外,目前人機交互模式為鍵盤鼠標及操控搖桿,隨著腦機接口技術的不斷發(fā)展,腦機交互可能逐漸替代外周神經(jīng)系統(tǒng)間接控制的肢體交互,人腦將實現(xiàn)與機器的直接互聯(lián)通信。研究發(fā)現(xiàn)肢體操作信號僅占大腦神經(jīng)指令的一小部分,大腦信息的直接傳輸將提升人機交互效率和指令準確性。
類腦無人集群是無人系統(tǒng)實現(xiàn)智能化和協(xié)同化的創(chuàng)新方法,腦驅智能將助力無人集群獲得類腦的感知和認知能力。本文從個體無人機設計、集群環(huán)路搭建、高級智能呈現(xiàn)三個角度討論了腦啟發(fā)的無人系統(tǒng)應用。類腦無人集群融合了人腦機制與機器結構形成混合智能,將充分發(fā)揮人類智能的認知優(yōu)勢和無人系統(tǒng)的執(zhí)行優(yōu)勢。本文借鑒人腦機制啟發(fā)無人集群的感知和決策能力,分析了無人集群與人腦系統(tǒng)的共性,并對未來無人集群的類腦方案提出研究設想及建議,為無人集群在智能化和協(xié)同化道路上的發(fā)展提供了參考。