沈宇婷, 孟新, 高躍清
(1.中國科學(xué)院 國家空間科學(xué)中心, 北京 100190; 2.中國科學(xué)院大學(xué), 北京 100049;3.中國電子科技集團公司第五十四研究所, 河北 石家莊 050081;4.河北省智能化信息感知與處理重點實驗室, 河北 石家莊 050081)
無人集群在實時作業(yè)過程中受到潛在目標(biāo)源刺激后,需要根據(jù)時域、空域、頻域等多個維度信息完成集群能力部署調(diào)配的控制決策。當(dāng)前無人系統(tǒng)的控制與信息決策等方面的研究已取得了豐碩的成果,發(fā)展了中心式、分布式以及仿生類等大量集群規(guī)劃與控制算法。
中心式主要有固定后方控制、集群固定控制中樞,或集群隨機控制中心的方式,首要和必須具備的就是全局信息或一定范圍內(nèi)足量局域信息的輸入。而往往受機間通信鏈路的狀態(tài)、自然條件的變化、其他輻射源干擾等因素的影響,中心節(jié)點控制的方式很難在任何情況下都能獲取滿足規(guī)劃計算的最優(yōu)狀態(tài)下的實時全量數(shù)據(jù)。
分布式思路是賦予集群中各節(jié)點自主的決策和行動能力,但也會引發(fā)新的問題。首當(dāng)其沖的就是個體間存在大量的不完備信息決策與沖突消解,狀態(tài)/行為空間規(guī)模增大,效率會隨之下降[1]。盡管研究人員已經(jīng)通過仿真與深度強化學(xué)習(xí)等結(jié)合的方式在一定程度上證明了這種方式的可行性,并開展了許多深入研究工作,但受限于訓(xùn)練得到?jīng)Q策神經(jīng)網(wǎng)絡(luò),不僅難以顯式解釋行為的關(guān)聯(lián)與關(guān)系,同時在開放場景中恐出現(xiàn)計算難以收斂的情況。
仿生類算法主要通過研究動物的群體行為特征構(gòu)建多智能體控制模型與協(xié)議,伴隨近年的群體智能熱潮,發(fā)展了鴿群[2]、雁群[3]、魚群[4]、蟻群[5-6]、狼群[7]等一系列理論研究與實驗成果在內(nèi)的大量仿生類算法,指導(dǎo)了無人系統(tǒng)面向任務(wù)目標(biāo)的編隊控制、會合控制、集群控制和一致性控制等問題的研究與實現(xiàn)。
綜合上述研究,盡管各式集群規(guī)劃與控制算法發(fā)展了線性規(guī)劃、遺傳算法、粒子群優(yōu)化算法、強化學(xué)習(xí)和深度強化學(xué)習(xí)等多類型方法,促進(jìn)了有關(guān)無人系統(tǒng)協(xié)同作業(yè)能力的發(fā)展。但場景訓(xùn)練數(shù)據(jù)稀疏、仿真數(shù)據(jù)與實際數(shù)據(jù)的偏差,對算法模型能夠具備差異化場景遷移能力提出了極大的挑戰(zhàn)。同時,效用和復(fù)雜度難以平衡等多方面實用化考慮往往聚焦在特定場景和特定任務(wù)問題上,并未對無人集群系統(tǒng)構(gòu)建形成面向?qū)崙?zhàn)和實用化的體系性支撐。
從實用化無人系統(tǒng)構(gòu)建的角度出發(fā),陳杰等[8-9]提出需要解決面向任務(wù)的協(xié)同能力建模與自主編配規(guī)則建立等基礎(chǔ)性科學(xué)問題。在此指導(dǎo)下,從個體/群體的不同角度看,無人系統(tǒng)實用化存在多層次控制互動統(tǒng)一問題,即個體行動、任務(wù)協(xié)同與集群組織的行為一致性與互動性的統(tǒng)一。因此,面向未來實用化無人系統(tǒng)構(gòu)建,如何找到其中能夠連接個體與群體、具備一定普適性、能夠動態(tài)擴展的共性關(guān)聯(lián),是一項重要的工作。
從美軍無人機軍事需求排序中不難分析出[10],無論是小型集群化平臺還是大型綜合性平臺,信息的獲取感知、信息的共享交互都是無人機任務(wù)場景中最根本需要具備的基礎(chǔ)能力。因此,從實用化無人系統(tǒng)需具備的基礎(chǔ)能力分析,一個關(guān)鍵問題在于信息的及時交互、有效流通和高效利用[8-15]。當(dāng)前的研究多將此問題解決集中在通信網(wǎng)絡(luò)規(guī)劃與設(shè)計、任務(wù)協(xié)同控制設(shè)計、分析處理算法效率和魯棒性提升等方面,較少從系統(tǒng)控制模型如何進(jìn)行信息解耦方面,考慮實際中存在著大量不同層級、不同顆粒度、不同尺度和不同質(zhì)量的信息共存和混雜的現(xiàn)狀。從實際應(yīng)用上看,這種對解耦方式的忽視使得無人系統(tǒng)的控制模型設(shè)計往往是自底向上的模式,而需求的提出往往是自頂向下的,就會出現(xiàn)任務(wù)規(guī)劃、目標(biāo)分配等算法設(shè)計服務(wù)于平臺搭載能力和通信設(shè)備組網(wǎng)能力等的問題。設(shè)計上的受限在實際中將演變成雙向制約,邏輯上處于上層的信息處理受限于資源環(huán)境的能力配給,而邏輯上處于下層的平臺控制在有限的指令下難以充分發(fā)揮載荷效能。
近年來,一些關(guān)于作戰(zhàn)系統(tǒng)與體系架構(gòu)的研究,已將視角聚集在復(fù)雜系統(tǒng)的網(wǎng)絡(luò)信息流轉(zhuǎn)與調(diào)度上,并基于復(fù)雜網(wǎng)絡(luò)及其相關(guān)理論構(gòu)建了作戰(zhàn)信息流轉(zhuǎn)超網(wǎng)絡(luò)模型[16]、面向任務(wù)的網(wǎng)絡(luò)分析模型[17]、基于超網(wǎng)絡(luò)的任務(wù)驅(qū)動漸進(jìn)演化模型[18]、信息驅(qū)動激進(jìn)演化模型[18]和海上編隊云作戰(zhàn)體系動態(tài)超網(wǎng)絡(luò)模型等模型和方法[19],在拓展研究界面的同時,驗證了復(fù)雜網(wǎng)絡(luò)對系統(tǒng)級、體系性架構(gòu)設(shè)計的彈性與魯棒性增益。上述研究已經(jīng)將任務(wù)協(xié)同的視角精準(zhǔn)聚焦于系統(tǒng)與體系內(nèi)節(jié)點信息關(guān)系與關(guān)聯(lián)映射規(guī)則等方面,但所研重點場景化和具象任務(wù)需求特征明顯,其網(wǎng)絡(luò)模型遷移能力尚有待驗證。而無人系統(tǒng)作為典型需要兼具自主與受控多模式混雜與平滑遷移能力的系統(tǒng),其架構(gòu)設(shè)計顯然需要以任務(wù)場景弱關(guān)聯(lián)性出發(fā),盡量剝離特異性需求,找到集群節(jié)點信息關(guān)系中的基礎(chǔ)關(guān)系及其演化規(guī)則。
本文將研究視角聚焦于無人系統(tǒng)的復(fù)雜網(wǎng)絡(luò)和信息交互,從結(jié)合中心式和分布式的目標(biāo)出發(fā),將系統(tǒng)從網(wǎng)絡(luò)動態(tài)運行過程角度,看作時空和信息域的可變?nèi)踔行幕蚨嘀行臎Q策場景,為解決自底向上的系統(tǒng)設(shè)計和自頂向下的系統(tǒng)需求之間難以匹配的問題,提供一種分層解耦的系統(tǒng)框架規(guī)劃和設(shè)計思路。據(jù)此,通過層次化網(wǎng)絡(luò)信息傳播方法模型設(shè)計,實現(xiàn)群體面向目標(biāo)的自主分配行為涌現(xiàn),以期為未來信息主導(dǎo)設(shè)計無人群智系統(tǒng)和無人群智系統(tǒng)的扁平化提供按需裝填專有決策控制算法模型的底層機制。具體而言,本文基于復(fù)雜網(wǎng)絡(luò)信息傳播、社團結(jié)構(gòu)等理論,對決策與通信解耦,構(gòu)建雙層耦合系統(tǒng)模型基礎(chǔ),提出基本的UAU-FO*層次化狀態(tài)控制方法,并面向中觀尺度動態(tài)群落信息交互控制,構(gòu)建基于UAU-FO*的層次化信息傳播方法,形成個體目標(biāo)揀選與群體協(xié)作涌現(xiàn)間可擴展關(guān)聯(lián),實現(xiàn)目標(biāo)信息的集群決策傳播效應(yīng)和自主聚合解聚。
基于復(fù)雜網(wǎng)絡(luò)及網(wǎng)絡(luò)信息交互視角看智能體動力分析如圖1所示:個體行動是基于自身及環(huán)境感知的信息決策結(jié)果;任務(wù)協(xié)同是一定范圍內(nèi)多個個體的聯(lián)合信息決策和信息交換;集群組織是更大范圍,甚至全系統(tǒng)的信息交換內(nèi)容、時間、頻次等控制問題?;趶?fù)雜網(wǎng)絡(luò)信息交互,能夠為無人系統(tǒng)實用化個體/群體的多層次控制互動統(tǒng)一提供共性的關(guān)聯(lián)基礎(chǔ)。這其中的動力要素從節(jié)點的運動與目標(biāo)作用兩方面可統(tǒng)一于基于網(wǎng)絡(luò)的交互與決策,通過級聯(lián)鄰域等范圍的局域信息感知,結(jié)合節(jié)點狀態(tài)控制,實現(xiàn)觀測信息傳播與觀測目標(biāo)選擇的統(tǒng)一。
圖1 面向局域動態(tài)認(rèn)知網(wǎng)絡(luò)的智能體動力分析Fig.1 Dynamics analysis of agents in local dynamic cognitive network
圖2 基于局域動態(tài)認(rèn)知的層次化系統(tǒng)模型Fig.2 Hierarchical system model based on local dynamic cognition
據(jù)此,面向集群目標(biāo)分配的層次化信息交互方法,基于局域動態(tài)認(rèn)知的層次化無人系統(tǒng)模型(見圖2),通過通信連接關(guān)系和任務(wù)協(xié)同關(guān)系解耦,實現(xiàn)通信連接層始終保持隨機響應(yīng)連接狀態(tài),交互決策層任務(wù)協(xié)同關(guān)系變化既有獨立性,又具備快速響應(yīng)能力。具體地,從運動行為來看,直觀改變的是節(jié)點相對位置和通信連接強度;從觀測行為來看,觀測信息流入影響網(wǎng)絡(luò)交互的內(nèi)容、頻次等,通過節(jié)點對目標(biāo)的揀選和信息的傳播來影響運動與節(jié)點的狀態(tài)控制。上述行為的產(chǎn)生是基于網(wǎng)絡(luò)的交互與決策,在觀測信息傳播行為和觀測目標(biāo)選擇行為的驅(qū)動下,產(chǎn)生交互決策層的演化動力。而時空分布層則在這種演化動力的驅(qū)動下進(jìn)行響應(yīng),完成具體的觀測行動和聚集、分散等運動。
對目標(biāo)揀選和分配來說,集群需對待觀測目標(biāo)區(qū)域完成不確定目標(biāo)的感知、觀測、監(jiān)視等,則對任一目標(biāo)所在區(qū)域,存在圖3所示狀態(tài)變遷過程。
圖3 狀態(tài)變遷過程Fig.3 State transition process
參照集合種群網(wǎng)反應(yīng)-擴散模型,將目標(biāo)區(qū)域視為亞種群節(jié)點,如圖4所示,智能體感知目標(biāo)動向并擴散信息后,能聚集相應(yīng)群落(社團)結(jié)構(gòu),即產(chǎn)生基于目標(biāo)信息的鄰域吸引和節(jié)點聚集行為[20-22]。群落形成后,需抑制目標(biāo)信息繼續(xù)擴散,降低對自由態(tài)節(jié)點的吸引,形成相對穩(wěn)定的群落結(jié)構(gòu)[23]。
圖4 目標(biāo)動向發(fā)布與穩(wěn)態(tài)觀測示意Fig.4 Target movement publishing and steady-state observation
但實際過程中,所有行為不能同步且同頻發(fā)生,如圖5所示,即為上述場景某時刻真實化描述(各群落顏色標(biāo)識的對應(yīng)狀態(tài)參見圖3)。由圖5可以看到:紫色完成觀測區(qū)域的紅色節(jié)點在釋放對鄰域各節(jié)點的吸引;資源不足和吸引過程的紅色、黃色區(qū)域,其紅色節(jié)點在擴散目標(biāo)信息;橙色區(qū)域正在進(jìn)行穩(wěn)定觀測,群落既不擴散目標(biāo)信息,也不吸引增加聚集,其群落的節(jié)點密度處在穩(wěn)定范圍。
圖5 基于群落變遷的多智能體觀測集群演化Fig.5 Multi-agent observation cluster evolution based on community change
基于上述分析,層次化演化關(guān)鍵動力問題如下:
1) 信息交互與傳播的內(nèi)容。關(guān)于目標(biāo)的信息交互與傳播,以目標(biāo)固有屬性與時空屬性(如輻射源位置等)等為內(nèi)容,時空分布層收集目標(biāo)信息,交互決策層揀選觀測,通知時空分布層規(guī)劃聚集運動。
2) 群落的構(gòu)建與隔離。構(gòu)建與隔離關(guān)注的是智能體如何以自體狀態(tài)切換產(chǎn)生群體性聚集效應(yīng)。群落的構(gòu)建與隔離針對揀選目標(biāo)的專注觀測對各智能體觀測狀態(tài)切換進(jìn)行約束控制。
3) 群落的動態(tài)擴容與釋放。動態(tài)擴容與釋放關(guān)注的是隔離邊界形成后,信息過濾約束機制使得資源不足時能再次釋放目標(biāo)信息來增補節(jié)點,或在觀測期滿后能動態(tài)釋放所有節(jié)點,讓信息面向合適的對象、在合適的范圍里進(jìn)行優(yōu)化精簡的交互。
綜上,以決策傳播效應(yīng)為目標(biāo)的信息交互傳播方法的主要問題是中觀尺度信息交互行為和傳播行為的粒度、界限如何控制。
構(gòu)建面向?qū)哟位怦畹膭討B(tài)群落控制方法,需要解決信息交互內(nèi)容的控制、種群的信息隔離和種群的聚合解聚。按交互決策和時空分布兩層考慮智能體信息解耦的節(jié)點交互關(guān)系,基于UAU-SIS的信息-病毒耦合傳播模型,改進(jìn)構(gòu)建基于UAU-FO*群落演化模型[24]。具體包括:1)采用UAU模型表征信息交互基于種群擴散與隔離;2)基于FO*局域動態(tài)認(rèn)知信息傳播模型表征節(jié)點狀態(tài)及交互決策,以及時空分布層信息交換;3)基于級聯(lián)拓?fù)溧徲蛴^測,進(jìn)行信息融合決策控制。
基于UAU-FO*群落演化模型中,智能體狀態(tài)控制主要包括U-A狀態(tài)控制與FO*狀態(tài)控制,各基本觀測狀態(tài)含義及其詳細(xì)描述如表1所示。
表1 UAU-FO*層次化模型基本觀測狀態(tài)Table 1 Basic observating state of UAU-FO* hierarchical model
UAU-FO*模型表征智能體節(jié)點層次化聯(lián)合觀測狀態(tài)(見表1)包括:1)U(無關(guān)注):表征無關(guān)注目標(biāo)狀態(tài),交互決策層不對時空分布層的信息交換加以限制,即無條件接收所有信息;2)A(有關(guān)注):表征有關(guān)注目標(biāo)狀態(tài),交互決策層對時空分布層的信息交換進(jìn)行限制約束,并以一定策略過濾時空分布與交互決策層間的交換信息;3)F(自由):自由漫游的狀態(tài),如無人機巡察狀態(tài),此時運動具有一定隨機性,交互決策層不限制約束時空分布層信息交互反饋;4)O*(聯(lián)合觀測態(tài)):有關(guān)注目標(biāo)的狀態(tài),此時運動具有指向性,交互決策層在對時空分布層的信息交互與傳播限制,在兩種隱式狀態(tài)模式下有不同策略的約束和限制。聯(lián)合觀測態(tài)細(xì)化有兩種隱式狀態(tài):一是觀測態(tài)OBS,具備觀測目標(biāo),且在觀測區(qū)域內(nèi),交互決策層將以當(dāng)前觀測目標(biāo)為過濾條件,限制時空分布層信息交換具體內(nèi)容;二是有序態(tài)ORD,具備觀測目標(biāo),但不在觀測區(qū)域內(nèi),可能出現(xiàn)觀測的關(guān)注目標(biāo)的切換,即存在被吸引、干擾和誘騙的可能情況。有序態(tài)交互決策層將以當(dāng)前觀測目標(biāo)為約束條件,抑制時空分布層信息交換后,對關(guān)注目標(biāo)揀選的評估結(jié)果,從而保證觀測的穩(wěn)定性和抗干擾性。
基于基本的UAU-FO*狀態(tài)設(shè)計,若智能體節(jié)點AICE_i所在系統(tǒng)的一層耦合網(wǎng)絡(luò)為NICE(AICE,EICE),對NICE進(jìn)行時空運動和信息協(xié)同的雙層解耦即時空分布層NICE_LUst和交互決策層NICE_LUid。假設(shè)當(dāng)狀態(tài)變遷獨立存在時,若λ為AICE_i由U態(tài)向A態(tài)的狀態(tài)變遷轉(zhuǎn)移概率、δ為由A態(tài)向U態(tài)的狀態(tài)變遷轉(zhuǎn)移概率、β為由F態(tài)向O*態(tài)的狀態(tài)變遷轉(zhuǎn)移概率、μ為由O*態(tài)向F態(tài)的狀態(tài)變遷轉(zhuǎn)移概率,則層次化聯(lián)合觀測狀態(tài)分解圖示如圖6所示。
圖6 層次化聯(lián)合觀測狀態(tài)分解Fig.6 Representation of state decomposition of hierarchical joint observations
(1)
(2)
(3)
(4)
(5)
(6)
圖7 UAU-FO*層次化演化狀態(tài)變遷Fig.7 UAU-FO * hierarchical evolution state transition
由于層次化群落控制,實質(zhì)上是利用網(wǎng)絡(luò)信息交互特性,基于層次化的個體狀態(tài)控制及其信息交互控制,通過個體基于級聯(lián)拓?fù)溧徲蛴^測,進(jìn)行信息融合決策控制,涌現(xiàn)出的群落可控。因此,基本的UAU-FO*層次化群落控制方法的算法設(shè)計,本質(zhì)上是對智能體節(jié)點AICE_i的狀態(tài)控制及信息融合決策算法設(shè)計,具體設(shè)計如圖8所示。
在UAU-FO*中的智能體狀態(tài)轉(zhuǎn)移和交互信息層次化約束時,聚集構(gòu)成觀測群組后需要信息跨層約束,將觀測期信息交互局限群組內(nèi),同時檢測觀測是否結(jié)束并釋放約束?;趶?fù)雜網(wǎng)絡(luò)老化效應(yīng)和反應(yīng)-擴散模型機理研究,提出基于動態(tài)中心周期性老化的群落信息交互約束方法,實現(xiàn)群組聚合解聚中,目標(biāo)中心對群組內(nèi)節(jié)點吸引力的可變調(diào)控[20-21]。
若對待觀測目標(biāo)tgtm,存在最短觀測時限TOBS_min和理想觀測時限TOBS_max,其對應(yīng)的觀測種群節(jié)點數(shù)需求為x。將首個感知該目標(biāo)并發(fā)布觀測提議請求的節(jié)點,將作為目標(biāo)tgtm聚合種群的中心,則中心的周期性老化與逃逸不為永久性,而是以觀測時限需求為測度的周期性、隨機性信息交互約束。若將中心節(jié)點發(fā)出提議的時刻設(shè)為t0,種群規(guī)模(即到達(dá)觀測區(qū)域的種群節(jié)點數(shù))滿足觀測需求x,以O(shè)*態(tài)是否為OBS為標(biāo)志進(jìn)行計數(shù),完成聚合的時間設(shè)為tx。
據(jù)此如圖9所示,基于UAU-FO*模型控制層次化信息交互與群落信息傳播方法,將對應(yīng)目標(biāo)tgtm單次完整觀測周期分為聚合態(tài)、隔離態(tài)、老化態(tài)和逃逸態(tài):
圖8 狀態(tài)控制流程Fig.8 State control flow
1) 聚合態(tài):從觀測發(fā)起到種群聚合完成。中心節(jié)點AICE_i不對聚集中智能體節(jié)點進(jìn)行信息跨層交互的約束和限制,僅收集到達(dá)觀測區(qū)域并將O*態(tài)切換為OBS的節(jié)點信息。一旦將觀測狀態(tài)切換為OBS,則屏蔽非關(guān)注目標(biāo)(即進(jìn)行目標(biāo)剔除等操作)。
2) 隔離態(tài):由種群觀測開始到最短觀測時限。中心節(jié)點AICE_i需要完全抑制種群外部信息對觀測的輸入,同時以群組達(dá)成觀測協(xié)定或決策的形式,擴散觀測種群已構(gòu)建的信息,從而抑制吸引聚集。
3) 老化態(tài):從達(dá)成最短觀測時限到達(dá)成理想觀測時限。中心節(jié)點AICE_i開啟老化進(jìn)程,吸引力降低,逐步降低對種群內(nèi)部節(jié)點的信息隔離程度,即種群內(nèi)的非中心節(jié)點AICE_j的時空分布層接收信息能夠以一定概率γagej反饋給交互決策層,即啟動屏蔽機制失效控制,且γagej隨著老化進(jìn)程將持續(xù)增加。需要指出的是,信息隔離度降低的同時,智能體自身會結(jié)合駐留時限偏好進(jìn)行關(guān)注目標(biāo)的揀選。
圖9 動態(tài)中心節(jié)點周期狀態(tài)Fig.9 Periodic state of dynamic central node
種群內(nèi)部節(jié)點和其鄰域內(nèi)在時空分布層隨機連接重建概率pc[20]為
pc=Π(kj,tcur-tj)kj[tcur-(tx+TOBS_min)]-v
(7)
(8)
式中:kj為節(jié)點AICE_j處的度值;Π(kj,tcur-tj)表示節(jié)點AICE_j與新節(jié)點在時空分布層建立連接的概率,tcur為當(dāng)前時間,tj為AICE_j加入此種群的時間,則tcur-(tx+TOBS_min)即為中心節(jié)點AICE_i的“年齡”;v為可調(diào)參數(shù)描述上述概率與老化進(jìn)程之間的依賴關(guān)系;CUcur為當(dāng)前種群計數(shù)。因此,在啟動屏蔽機制失效控制后,節(jié)點可能因屏蔽失效發(fā)生目標(biāo)變更。
4) 逃逸態(tài):從達(dá)成理想觀測時限開始到中心節(jié)點被其他目標(biāo)吸引或老化逃逸終止。中心節(jié)點AICE_i開啟快速釋放種群節(jié)點的模式,也表現(xiàn)為老化速率的加速。而種群解散過程和原種群節(jié)點密度以及平均度等相關(guān)[24-25]。因為富集了更大觀測資源的種群,需要更加快速的釋放,避免集群資源的負(fù)載不均[25]。對于基于UAU-FO*模型構(gòu)成的觀測群落,逃逸態(tài)的所有節(jié)點在逃逸前的聯(lián)合觀測態(tài)均為O*,因此對于非中心節(jié)點,根據(jù)中心節(jié)點的周期計時通知驅(qū)動逃逸概率的計算。具體地,群落中度為k節(jié)點的當(dāng)前時刻逃逸概率[25]為
(9)
式中:k′為度為k節(jié)點的非中心節(jié)點鄰居的度;P(k′|k)是度為k節(jié)點指向度為k′節(jié)點的概率,通過求和對所有可能指向情況進(jìn)行綜合,即沿連邊kk′逃逸的節(jié)點數(shù)均值;Dk′k為節(jié)點沿連邊kk′跳躍的概率。
基于UAU-FO*的層次化信息傳播算法設(shè)計,是基于基本的UAU-FO*層次化狀態(tài)控制的群落控制算法。由于基本的UAU-FO*模型中,U-O*和A-F難以獨立存在則基于級聯(lián)鄰域收到的目標(biāo)信息在每步?jīng)Q策時,簡化后只考慮UF和AO*之間的狀態(tài)變遷,如圖10所示。則任一智能體在時刻感知完,進(jìn)入處理流程來更新本地的UA序列和FO*序列。算法流程設(shè)計(見圖11)如下:
1) 節(jié)點狀態(tài)控制:根據(jù)O*狀態(tài),進(jìn)行待處理目標(biāo)信息的序列剔除,即若O*態(tài)為OBS,則僅保留UA序列中已激活的目標(biāo)信息;若O*態(tài)為ORD,則更新所有可能的偏好關(guān)注目標(biāo)信息。當(dāng)UA序列中出現(xiàn)了偏好列表中潛在關(guān)注目標(biāo)信息,則UA序列中相關(guān)目標(biāo)狀態(tài)被激活。若當(dāng)前更新了多個可關(guān)注目標(biāo),則關(guān)注序列中或會暫時性出現(xiàn)多個A態(tài)目標(biāo)信息激活,根據(jù)目標(biāo)收益-代價評估方法,結(jié)合動態(tài)中心周期性老化的群落信息交互約束方法,進(jìn)行目標(biāo)揀選以及是否進(jìn)行關(guān)注目標(biāo)的切換。
2) 層次化信息交互約束:當(dāng)O*狀態(tài)為OBS時,交互決策層會通知時空分布層,不再接收處理非關(guān)注目標(biāo)的相關(guān)信息。當(dāng)O*狀態(tài)為ORD或在F態(tài)時,時空分布層的接收處理將不被限制。
圖10 基于簡化UAU-FO*的層次化狀態(tài)變遷Fig.10 Hierarchical state transition based on simplified UAU-FO*
本文提出的基于UAU-FO*的層次化信息傳播方法,是針對中觀尺度下無人系統(tǒng)目標(biāo)分配的自主性涌現(xiàn),構(gòu)建的動態(tài)群落信息交互控制方法。預(yù)期面向無人系統(tǒng)對指揮控制層和通信組網(wǎng)層進(jìn)行信息交互的解耦,以通信能力來保障任務(wù)協(xié)同,以任務(wù)信息交互與個體決策完成控制,提供基本的信息交互控制機制的設(shè)計實現(xiàn)。
從實驗對比與分析的角度看,本文提出的方法框架目的在于提供分層解耦的信息交互與傳播控制方法,而非單純的目標(biāo)分配與任務(wù)規(guī)劃,目的在于為現(xiàn)有算法提供一套可擴展、可聯(lián)合的層次化系統(tǒng)容器,在實際的平臺控制模型中按需針對差異化場景狀態(tài),裝填專用的決策模型或控制算法。
因此,本文方法的仿真驗證在于以下4個方面:1)面向信息交互的分層解耦可行性;2)基于信息傳播的自主協(xié)同行為涌現(xiàn)性;3)基于層間交互約束的群組調(diào)控魯棒性;4)裝填算法模型的可調(diào)整性。其中,裝填算法模型的可調(diào)整性來源于本文方法設(shè)計原理的本身,主要在4.3節(jié)中進(jìn)行綜合分析討論。4.2節(jié)主要針對前3個方面設(shè)計相應(yīng)的仿真實驗,驗證在分層解耦的框架下,將整個無人系統(tǒng)看作時空與信息關(guān)聯(lián)的可變?nèi)踔行幕蚨嘀行臎Q策系統(tǒng),能夠基于信息交互與傳播的層次化控制,在個體目標(biāo)揀選基礎(chǔ)上涌現(xiàn)出群體性行為,支撐實現(xiàn)無人集群面向動態(tài)目標(biāo)的自主聚合解聚。
仿真場景設(shè)計如下:以無人機集群偵察作為想定任務(wù)場景,首先通過不同的通信連接保持?jǐn)?shù)LinkCapmax、仿真實驗的仿真時間TimeStepSIM,觀察無人機集群可針對目標(biāo)通過個體的自主信息交互,完成涌現(xiàn)動態(tài)群落的生成與老化逃逸過程。同時通過不同程度的連接中斷模擬,量化分析動態(tài)群落機制設(shè)計的穩(wěn)定性、魯棒性和健壯性,能夠支撐無人機集群偵察過程的穩(wěn)定長時間運行。具體而言,待偵察區(qū)域為橫向20 km、縱向50 km的矩形區(qū)域(橫縱分別按1 000個單位長度進(jìn)行柵格化),假定氣象觀測條件良好且置空距離足夠,可忽略待偵察區(qū)域地形、坡度、土質(zhì)等環(huán)境要素對觀測發(fā)現(xiàn)概率和物理運動的影響。集群數(shù)量為500架,忽略平臺實用升限、最大續(xù)航等非信息交互基本要素,將平臺抽象為質(zhì)點。由于本文所提方法驗證首先需解決解耦方案的可行性,因此對集群中的平臺節(jié)點做同構(gòu)處理。同時對非本文架構(gòu)可行性驗證重點的運動學(xué)模型進(jìn)行簡化,采用上限可調(diào)的勻加勻減速運動控制。當(dāng)且僅當(dāng)感知到目標(biāo)時,按當(dāng)前仿真步的通信連接關(guān)系,向鄰域擴散目標(biāo)位置信息。為模擬連接的隨機性,集群連接構(gòu)型基于Barabási-Albert優(yōu)先連接模型生成,并根據(jù)隨機生成的連接構(gòu)型進(jìn)行初始化重連,保證仿真初始狀態(tài)通聯(lián)關(guān)系遵循想定規(guī)則。群組想定以局域、自主和信息交互為準(zhǔn)則,在聚集、隔離、老化和逃逸過程中,僅依靠提出聚集協(xié)商請求(即目標(biāo)信息局域擴散)進(jìn)行控制。
圖11 算法流程Fig.11 Algorithm flow chart
多觀測目標(biāo)揀選算法設(shè)計如下:將信息感知融合、觀測目標(biāo)揀選和信息交互控制等方面均規(guī)范化到分布式信息交互視角下,以期構(gòu)建相對完整的、從感知發(fā)現(xiàn)到?jīng)Q策行動的信息交互控制機制。所以,在仿真實驗設(shè)計過程中,對多目標(biāo)信息同時出現(xiàn)時,無人機節(jié)點對多目標(biāo)信息偏好的評估與計算做了基于信息交互視角的基礎(chǔ)指標(biāo)評價算法設(shè)計,并提供了可擴展設(shè)計的抑制因子。在目標(biāo)揀選過程中,若t時刻,任一無人節(jié)點Ax通過直接觀測和集群通信得到的目標(biāo)信息經(jīng)過融合后的集合為Ix(t),其中包含s個目標(biāo)的可觀測序列,即為待揀選目標(biāo)序列TGTt={tgt1,…,tgtl,…,tgts}。則面向信息交互的目標(biāo)揀選方法基于交互決策層鄰域拓?fù)溥M(jìn)行計算,進(jìn)行基于信息交互評價的收益-代價評估后,篩選最大值MAX(Ix_tgtt)為擬觀測目標(biāo),具體為
(10)
(11)
表2 基于信息交互的收益-代價評估基本指標(biāo)Table 2 Basic index of benefit-cost evaluation based on statistics of information interactions
表2中:dl為任一目標(biāo)t時刻距Ax的距離;CU為計數(shù)函數(shù),CU([tgtl]Hop1)和CU([tgtl]Hop2)分別為1跳和2跳鄰域傳播信息中目標(biāo)的計數(shù)次數(shù),CU([TGTt]Hop1)和CU([TGTt]Hop2)分別為1跳和2跳鄰域傳播信息中各目標(biāo)出現(xiàn)總計數(shù),eHop1和eHop2分別為1跳鄰域與2跳鄰域的權(quán)重;TD,l是基于交互記錄的目標(biāo)信息存續(xù)度,即首次出現(xiàn)tapp,l至今總時長,TF,l為基于交互記錄的目標(biāo)tgtl信息新鮮度,即上次出現(xiàn)tlast,l到當(dāng)前時長,SUM(TD)為目標(biāo)存續(xù)度之和,SUM(TF)為目標(biāo)新鮮度之和,eD和eF分別為調(diào)節(jié)系數(shù);wpri,l為目標(biāo)優(yōu)先級值,wpref,l為目標(biāo)偏好值,SUM(wpri)和SUM(wpref)分別為所有目標(biāo)優(yōu)先級值之和與偏好值之和,epri和epref為調(diào)節(jié)系數(shù)。
本文實驗在對目標(biāo)偏好值和優(yōu)先級取值過程中,對優(yōu)先級進(jìn)行了平等化處理,并根據(jù)距離代價的排序給定偏好值排序,即將偏好預(yù)設(shè)為距離偏好。同時說明由于本文目標(biāo)揀選的收益-代價評估方法對主要處于信息交互視角,對任務(wù)場景的差異化要素沒有強約束。因此,也為后續(xù)擴展目標(biāo)揀選的具體方法,以及面向動態(tài)群落組織的多約束信息交互抑制與激勵提供了個體決策層面的可擴展、可更新的關(guān)聯(lián)作用點。
根據(jù)4.1節(jié)中論述的前三方面待驗證重點,具體設(shè)計3項實驗,并對實驗結(jié)果進(jìn)行統(tǒng)計展示。
4.2.1 面向信息交互的分層解耦可行性實驗
本節(jié)首先以任務(wù)協(xié)同關(guān)系與通聯(lián)關(guān)系分層解耦運行及其魯棒性測試實驗(實驗1),驗證集群信息解耦后能支撐集群完成目標(biāo)信息傳播,進(jìn)而支撐各節(jié)點完成目標(biāo)的揀選。同時,通過任務(wù)協(xié)同關(guān)系與通聯(lián)關(guān)系分層連接特性實驗(實驗2),驗證在上述運行過程中,各層的網(wǎng)絡(luò)聯(lián)通特性是否具備穩(wěn)定性基礎(chǔ)。
1) 實驗1:任務(wù)協(xié)同關(guān)系與通聯(lián)關(guān)系分層解耦運行實驗。待偵察目標(biāo)在(-850,850)、(850,-850)和(-850,-850)三點分別于仿真時間20、100、300出現(xiàn)、并分別于800、700和600完成最佳觀測計時進(jìn)入老化態(tài)。上述3個目標(biāo)可感知目標(biāo)范圍按分別按400、100和200計,觀察并驗證動態(tài)群落運行各階段情況。
由圖12可以看到在LinkCapmax=20條件下集群能夠在本文層次化信息傳播模型控制下,達(dá)成對鄰域無人機節(jié)點的聚集和偵察協(xié)同自主運動過程。且在此過程中,集群的通聯(lián)整體情況未發(fā)生剝離現(xiàn)象和稀疏情況。下面通過調(diào)節(jié)LinkCapmax模擬通信受到干擾、抑制和遮擋等弱通信條件,具體將通信負(fù)載上限降低為5條信道,同時降低通聯(lián)感知范圍至100。
圖12 聚合-隔離-老化-逃逸過程(LinkCapmax=20)Fig.12 Aggregation-isolation-aging-escape process (LinkCapmax=20)
圖13中由于通信抑制程度較大,在實驗中略降低了目標(biāo)節(jié)點的聚集平臺數(shù)要求。進(jìn)而盡管通信不良,集群仍可完成聚集、隔離、老化和逃逸的自主控制全過程,且未發(fā)生剝離、稀疏與突變。一方面證實了層次化信息交互對通聯(lián)關(guān)系保持穩(wěn)定性的作用,一方面說明了自主化群組控制策略的穩(wěn)定性,二者穩(wěn)定性互為支撐,即基于時空分布層的穩(wěn)定性,交互決策層的任務(wù)協(xié)同關(guān)系能夠自主化建立并保持穩(wěn)定作業(yè)。
圖13 聚合-隔離-老化-逃逸過程(LinkCapmax=5)Fig.13 Aggregation-isolation-aging-escape process (LinkCapmax=5)
2) 實驗2:任務(wù)協(xié)同關(guān)系與通聯(lián)關(guān)系分層連接特性實驗。下面驗證種群隔離前后,集群時空分布層通信連接網(wǎng)絡(luò)特性,是否能夠任務(wù)協(xié)同關(guān)系在交互決策層變化的同時保持穩(wěn)定不變。具體根據(jù)實驗1,為便于觀測度分布變化量,擴大變化程度,增加最大通信連接保持?jǐn)?shù)至30條來提升繪制的可觀測性。
如圖14所示,在任務(wù)協(xié)同群組建立和信息抑制的具體過程中,被測無人機集群的時空分布層通信連接關(guān)系中未出現(xiàn)較低通信連接數(shù)的點,基本保持在滿通信信道負(fù)載運行,均勻性和穩(wěn)定性良好?;谏鲜鰯?shù)據(jù)和交互決策層抑制信息通過時空分布層的有效抑制和傳播,同時印證了層次化解耦后各層在獨立特性保持基礎(chǔ)上,并不影響層與層之間的交互和協(xié)作,為分層解耦的無人群智系統(tǒng)模型設(shè)計提供了一定可重復(fù)的仿真驗證依據(jù)。
圖14 集群通信連接分布變化(聚集-隔離)Fig.14 Communication connection distribution of cluster (aggregation-isolation)
下面觀察整體的聚集、隔離、老化和逃逸過程,任務(wù)協(xié)同關(guān)系在交互決策層的變化,對時空分布層通聯(lián)關(guān)系的特性影響。設(shè)定如下:對目標(biāo)1規(guī)定最少觀測節(jié)點數(shù)為6架、聚集開始時刻為6、最短觀測時限(進(jìn)入隔離開始時限計時)為600、理想觀測時限(隔離到老化態(tài)分界)為900;對目標(biāo)2 規(guī)定最少觀測節(jié)點數(shù)為16、聚集開始時刻為16、最短觀測時限為450、理想觀測時限450,對目標(biāo)3 最少觀測節(jié)點數(shù)為10、聚集開始時刻為10、最短觀測時限為800、理想觀測時限900。則無人機集群應(yīng)當(dāng)在仿真步900左右進(jìn)入老化態(tài)的無人機節(jié)點群組釋放期,并在仿真步1 700左右進(jìn)入老化態(tài)的高峰釋放期。
針對上述參數(shù)設(shè)定進(jìn)行了20次重復(fù)性實驗,圖15(a)和圖15(b)為一次實驗分布圖,圖15(c)和圖15(d)為20次實驗數(shù)據(jù)按仿真步進(jìn)行均值計算的分布均值圖,重復(fù)性實驗具備結(jié)果相似性和特征一致性。將上述度分布出現(xiàn)較大波動的時刻范圍與任務(wù)協(xié)同關(guān)系群組控制時限對比可知,無人機集群的時空分布層通信連接實際分布的變化情況與任務(wù)協(xié)同關(guān)系變動情況匹配。同時在聚集、隔離和老化、逃逸過程中,時空分布層總體上未出現(xiàn)較低通信連接數(shù)的點波動擴散情況,基本保持在滿通信信道負(fù)載運行,均勻性和穩(wěn)定性良好?;谏鲜鰯?shù)據(jù)和交互決策層抑制信息通過時空分布層的有效抑制和傳播。
圖15 集群通信連接分布變化Fig.15 Communication connection distribution of cluster
4.2.2 基于信息傳播的自主協(xié)同行為涌現(xiàn)性實驗
自主協(xié)同行為涌現(xiàn)性已在4.2.1節(jié)中完成現(xiàn)象觀測與穩(wěn)定性驗證。主要驗證在具體的聚集與保持過程中(實驗3)以及在自主協(xié)同行為涌現(xiàn)過程中及其結(jié)果上(實驗4與實驗5),檢驗群組形成與運行時信息交互的實際發(fā)生行為,是否與動態(tài)群組中心節(jié)點的信息傳播意圖能夠匹配一致。
1) 實驗3:聚集與保持實驗。無人機集群群組聚集與保持實驗主要針對3個目標(biāo)的群組規(guī)模變化進(jìn)行的節(jié)點數(shù)統(tǒng)計,觀測3個目標(biāo)的聚集過程具體運行情況。為便于繪制后續(xù)實驗將三目標(biāo)出現(xiàn)時刻分別調(diào)整至5、8和10仿真時間步。
圖16中隨仿真推進(jìn),雖然首先發(fā)現(xiàn)三目標(biāo)順序依次為目標(biāo)1、目標(biāo)2和目標(biāo)3,但由于時空分布和信息擴散等情況,實際先完成聚集的是目標(biāo)2,目標(biāo)1、目標(biāo)3緊隨其后,約滯后30步。3個群組均能夠建立并穩(wěn)定運行。
圖16 目標(biāo)觀測的群組統(tǒng)計Fig.16 Statistics of targets observation group
2) 實驗4:群組內(nèi)外節(jié)點隔離實驗。群組內(nèi)外節(jié)點隔離實驗主要針對聚集前后種群和集群鄰域信息持有情況變化進(jìn)行統(tǒng)計。由于過程具備相似性,選擇最先完成聚集的目標(biāo)2進(jìn)行結(jié)果繪制,結(jié)果如圖17所示。由圖17可以看到,在群組形成過程中,隨著群組內(nèi)部節(jié)點數(shù)的增加,集群內(nèi)為與目標(biāo)2觀測群組建立任務(wù)協(xié)同關(guān)系的節(jié)點數(shù)隨之減少,在群組聚集完成后,近乎即刻完成抑制與隔離。同時持有多目標(biāo)信息節(jié)點數(shù)也在該時刻突變遞減,遞減趨勢沒有反復(fù),說明這種抑制具有傳播的能力,即本文目標(biāo)形成的基于動態(tài)多中心的決策傳播效應(yīng)。群組形成時信息交互的實際傳播行為,與動態(tài)群組中心節(jié)點的信息傳播意圖匹配一致。
圖17 群組形成過程統(tǒng)計(目標(biāo)2觀測群組)Fig.17 Statistics of formation process of group (observation group of Target 2)
3) 實驗5:群組內(nèi)外目標(biāo)信息傳播抑制實驗。群組內(nèi)外目標(biāo)信息傳播抑制實驗主要針對聚集前后群組內(nèi)部和集群內(nèi)目標(biāo)信息交互頻次變化進(jìn)行統(tǒng)計分析。
從圖17中無連接中斷情況下集群針對目標(biāo)1~目標(biāo)3信息交互的每步通信量變化。由圖18可以看到,3個目標(biāo)均能夠隨著各自群組內(nèi)部節(jié)點數(shù)的增加(即任務(wù)協(xié)同關(guān)系的逐步建立和穩(wěn)定過程),保持一定的通信量,同時在群組聚集完成后,近乎即刻完成抑制與隔離。各條曲線的趨勢一致、無反復(fù)且具備穩(wěn)定保持能力,說明這種抑制具備穩(wěn)定性。群組運行時信息交互的實際抑制行為,與動態(tài)群組中心節(jié)點的信息傳播意圖匹配一致。
圖18 信息交互頻次統(tǒng)計Fig.18 Statistics of information interaction frequency
4.2.3 基于層間交互約束的群組調(diào)控魯棒性實驗
通過模擬弱通信連接環(huán)境和通信連接不同程度的中斷等情況,分別針對4.2.2節(jié)中的聚集與保持過程、自主協(xié)同行為涌現(xiàn)過程及其結(jié)果,觀測分層解耦后,對群組形成與運行時信息交互行為,與動態(tài)群組中心節(jié)點的信息傳播意圖是否能夠穩(wěn)定的匹配一致,從而說明本文方法對群組調(diào)控的魯棒性增強。具體過程如下:
1) 實驗6:聚集與保持實驗。實驗場景要素設(shè)計與4.2.2節(jié)中的實驗3相同,同時智能體間添加頻次fINT服從泊松分布的連接中斷,在連接中斷期間,無人機節(jié)點無法與其鄰域產(chǎn)生信息交互。在此條件下,觀測3個目標(biāo)的聚集過程能夠正常完成和延遲情況,以及群組能否穩(wěn)定運行。同樣為便于繪制后續(xù)實驗將3個目標(biāo)的出現(xiàn)時刻分別調(diào)整至5、8和10仿真時間步。具體地,模擬不同程度連接中斷情況,fINT依次服從泊松分布[0,3]、[0,5]、[0,8]和[0,10],結(jié)果如圖19所示。從圖19中可以看到,弱聯(lián)通條件加劇過程中,目標(biāo)1~目標(biāo)3的群組建立完成時間明顯滯后,但3個群組均能夠建立并穩(wěn)定運行,證明本文算法在面向嚴(yán)重的通信中斷情況依舊具有較好的魯棒性。同時無人機觀測群組建立順序未發(fā)生明顯置換,在初始構(gòu)型相同的基礎(chǔ)上,表明集群運行具備穩(wěn)定性。
圖19 目標(biāo)觀測的群組統(tǒng)計(弱通聯(lián)條件)Fig.19 Statistics of targets observation group (weak connection condition)
2) 實驗7:群組內(nèi)外節(jié)點隔離實驗。實驗場景要素設(shè)計與4.2.2節(jié)的實驗4相同,針對聚集前后種群和集群鄰域信息持有情況變化進(jìn)行統(tǒng)計,采用與實驗6相同方法進(jìn)行魯棒性測試,即不同程度的連接中斷情況fINT變化相同。由于過程具備相似性,同樣選擇最先完成聚集的目標(biāo)2進(jìn)行結(jié)果繪制(見圖20)。從圖20中可以看到,弱聯(lián)通條件加劇過程中,目標(biāo)1~目標(biāo)3的無人機觀測群組建立完成的仿真時刻有明顯滯后,但均能夠建立并穩(wěn)定運行,證明方法具有較好的魯棒性。同時在連接中斷程度增大過程中,各曲線突變點順序未發(fā)生明顯置換,在初始構(gòu)型相同的基礎(chǔ)上,表明集群運行具備穩(wěn)定性。
圖20 群組形成過程統(tǒng)計(目標(biāo)2,弱通聯(lián)條件)Fig.20 Statistics of formation process of group (for Target 2, weak connection condition)
圖21 信息交互頻次統(tǒng)計(弱通聯(lián)條件)Fig.21 Statistics of information interaction frequency (weak connection condition)
3) 實驗8:群組內(nèi)外目標(biāo)信息傳播抑制實驗。實驗場景要素設(shè)計與4.2.2節(jié)中的實驗5相同,針對聚集前后群組內(nèi)部和集群內(nèi)目標(biāo)信息交互頻次變化進(jìn)行統(tǒng)計分析,采用與實驗6相同方法進(jìn)行魯棒性測試,即不同程度的連接中斷情況fINT變化相同,結(jié)果如圖21所示。從圖21中可以看到,弱聯(lián)通條件加劇過程中,任務(wù)協(xié)同群組建立完成前通信量保持高位運行,且具備一定漸次擴散能力(見圖21(b)),本文方法對集群運行具備穩(wěn)定性支撐作用。這種作用同時可體現(xiàn)在抑制作用穩(wěn)定發(fā)生且不變,即群組建立后抑制作用持續(xù)性良好,即便存在不同程度的連接中斷,也并未發(fā)生目標(biāo)信息由群組內(nèi)向外擴散傳播,說明決策傳播效應(yīng)不僅可有效發(fā)生,且具備保持能力。
根據(jù)4.1節(jié)的論述與4.2節(jié)的實驗分析,進(jìn)一步對本文方法的4方面重點進(jìn)行綜合分析與討論。由于本文方法目的在于為無人系統(tǒng)的網(wǎng)絡(luò)化、自主化信息交互,提供可支撐協(xié)同涌現(xiàn)的信息交換解耦框架與底層機制。因此在驗證的過程中,一方面需要排除差異化場景對決策算法的特殊約束要求,如leader-follower、雁群、鴿群等算法,對集群內(nèi)各個節(jié)點角色的事先劃分;另一方面需要驗證目標(biāo)信息在層次化交換約束中交換的有效性,如目標(biāo)信息是否能擴散,并在動態(tài)群組的形成與運行過程中得到信息傳播的和抑制;再一方面需要驗證網(wǎng)絡(luò)的彈性對無人系統(tǒng)信息交互自主協(xié)同涌現(xiàn)的穩(wěn)定性與魯棒性的支撐作用。通過以上驗證方可證明,UAU-FO*所提供層次化解耦的信息交互與傳播方法,具備成為中觀尺度動態(tài)群落的信息交互控制機制共性基礎(chǔ)的可能。(需要注意的是,后續(xù)分析中對中心節(jié)點的召集行為的描述并不指中心節(jié)點發(fā)出了具有指向性和需求內(nèi)容的指令,而僅僅向外傳播了目標(biāo)的觀測結(jié)果信息。所以,整體實驗過程中,集群各層之間傳播與交互的具體信息,僅包含可觀測目標(biāo)的信息。)
4.3.1 面向信息交互的分層解耦可行性分析
從信息交互的分層解耦可行性上看,依據(jù)本文設(shè)計的基于UAU-FO*的層次化信息傳播方法,在4.2.1節(jié)中,通過交互決策層的目標(biāo)揀選,完成對時空分布層自身信息擴散與層次化約束控制。具體地,將任務(wù)協(xié)同關(guān)系的建立與運行,轉(zhuǎn)換為基于信息的目標(biāo)篩選過程,局限在交互決策層,并對時空分布層的冗余信息進(jìn)行層間交互抑制;而通聯(lián)關(guān)系的構(gòu)建一方面取決于時空可達(dá)性,一方面依賴于目標(biāo)揀選后行動對時空分布變化的影響。
在4.2.1節(jié)中,基于如上設(shè)計解耦后,從實驗1的結(jié)果看,目標(biāo)動態(tài)出現(xiàn)的過程里,鄰近的節(jié)點能夠在層次化信息傳播機制的基礎(chǔ)上,實現(xiàn)對目標(biāo)的聚集-隔離-老化-逃逸全過程,協(xié)同行為能夠在與通聯(lián)關(guān)系解耦牽制的基礎(chǔ)上,自主的建立并運行。同時魯棒性測試實驗,通過調(diào)節(jié)LinkCapmax模擬通信受到干擾、抑制和遮擋等弱通信條件,無人集群的群組自主聚集行為涌現(xiàn)和消散過程并不受時空分布層不穩(wěn)定的影響。從實驗2看,整體運行過程中,無人集群的通聯(lián)整體情況穩(wěn)定,未發(fā)生剝離現(xiàn)象和稀疏情況,兩層的網(wǎng)絡(luò)特性,在行為涌現(xiàn)過程中,雖出現(xiàn)一定波動,但能夠快速恢復(fù)幾乎滿通信負(fù)載的運行狀態(tài),進(jìn)一步說明了解耦后的層次化網(wǎng)絡(luò)具備穩(wěn)定性運行基礎(chǔ)和動態(tài)恢復(fù)的彈性。
4.3.2 基于信息傳播的自主協(xié)同行為涌現(xiàn)性分析
從信息傳播的自主協(xié)同行為涌現(xiàn)性上看,其現(xiàn)象觀測與穩(wěn)定性驗證已在4.2.1節(jié)中完成,依據(jù)本文設(shè)計的基于UAU-FO*的層次化信息傳播方法,以及本文目標(biāo)形成的動態(tài)弱中心自主協(xié)同能力,還需要具備在整個過程中,檢驗聚合的群組與召集中心(即發(fā)現(xiàn)目標(biāo)的散播信息節(jié)點)決策的各階段意圖是否保持一致,用以進(jìn)一步說明這種涌現(xiàn)從宏觀觀測和個體的微觀行為上具備一致性。
在4.2.2節(jié)中,針對本文方法對動態(tài)中心周期性老化的具體階段進(jìn)行劃分,分別開展了聚集-隔離階段的聚集與保持實驗(實驗3)、隔離前后的群組目標(biāo)信息持有情況實驗(實驗4),以及隔離后集群內(nèi)和群組內(nèi)目標(biāo)信息的層次化傳播抑制實驗(實驗5)。從實驗3看,在中心節(jié)點傳播目標(biāo)信息開始召集后,接收到目標(biāo)信息并揀選了該目標(biāo)的節(jié)點開始聚集,對3個目標(biāo)的聚集均能夠較快地完成,且從群組構(gòu)成規(guī)模上具備協(xié)同關(guān)系的穩(wěn)定性。從實驗4 看,在隔離前后,群組內(nèi)目標(biāo)信息的持有情況伴隨協(xié)同關(guān)系的建立完成,隔離前后出現(xiàn)了明顯的、近乎即刻的傳播抑制,且抑制的遞減趨勢在持續(xù)觀測過程中沒有反復(fù),說明了抑制具備一定的傳播能力和穩(wěn)定性。從實驗5看,對隔離后集群內(nèi)與群組內(nèi)的每步通信量分別統(tǒng)計分析,發(fā)現(xiàn)各條曲線的趨勢一致、無反復(fù)且具備穩(wěn)定保持能力,進(jìn)一步說明這種抑制具備穩(wěn)定性。綜合上述,基于信息傳播的自主協(xié)同行為涌現(xiàn)能夠形成動態(tài)多中心的決策傳播效應(yīng),群組形成時信息交互的實際傳播行為,與動態(tài)群組中心節(jié)點的信息傳播意圖匹配一致。
4.3.3 基于層間交互約束的群組調(diào)控魯棒性分析
從基于層間交互約束的群組調(diào)控魯棒性上看,一方面在4.2.1節(jié)中初步從總體上證明了本文方法構(gòu)建的無人集群信息交互機制具備一定的魯棒性增強能力。為進(jìn)一步檢驗這種魯棒性增強和穩(wěn)定性,是否能夠體現(xiàn)在聚合群組的各階段,用以說明這種涌現(xiàn)從宏觀觀測和個體的微觀行為在具備一致性的同時,兼具魯棒性與穩(wěn)定性優(yōu)勢。
在4.2.3節(jié)中,基于4.2.2節(jié)的對應(yīng)場景,分別模擬弱通信連接環(huán)境和通信連接不同程度的中斷等情況,針對聚集-隔離階段的聚集與保持(實驗6)、隔離前后的群組目標(biāo)信息持有情況(實驗7),以及隔離后集群內(nèi)和群組內(nèi)目標(biāo)信息的層次化傳播抑制(實驗8)等各階段場景,進(jìn)行的實驗測試,檢驗本文方法模型構(gòu)建的機制,是否在各個階段均能夠具備對惡劣條件的抵御能力。從4.2.3節(jié)的3項具體實驗結(jié)果看,在通信鏈接中斷情況隨機性與頻次增大的過程中,目標(biāo)1~目標(biāo)3的無人機觀測群組的聚合完成與抑制,均較4.2.2節(jié)中對應(yīng)良好通聯(lián)情況有明顯滯后,但均能夠建立并穩(wěn)定運行,證明方法具有較好的魯棒性。同時在連接中斷程度增大過程中,各曲線突變點順序未發(fā)生明顯置換,在初始構(gòu)型相同的基礎(chǔ)上,任務(wù)協(xié)同群組建立完成前通信量保持高位運行,具備一定漸次擴散能力,且群組建立后抑制作用持續(xù)性良好,說明決策傳播效應(yīng)不僅可有效發(fā)生,且具備保持能力。在上述多個階段的魯棒性測試驗證過程中,可以看到這種魯棒性是持續(xù)作用的,是基于UAU-FO*的層次化信息傳播方法對交互決策和時空分布解耦后帶來的集群中觀尺度的固有屬性。
4.3.4裝填算法模型的可調(diào)整性
從裝填算法模型的可調(diào)整性上分析,本文方法對差異化決策與控制算法的可調(diào)整性在于信息交互的范圍控制、信息采信融合的具體策略以及決策傳播的策略的不同。涌現(xiàn)出具備協(xié)同行為的群組規(guī)模,僅取決于作為動態(tài)弱中心的節(jié)點對目標(biāo)類型、威脅等級等信息的判斷,而與具體的信息交互要素?zé)o關(guān)。這種對多類型任務(wù)規(guī)劃、目標(biāo)分配、構(gòu)型控制等方面算法的兼容適配能力,來源于基于UAU-FO*的層次化信息傳播方法本身。
由于方法的初始設(shè)計僅關(guān)注信息交互的行為特征,并不約束具體的交互內(nèi)容,各個無人節(jié)點僅按自身需求進(jìn)行信息的擴散與層間約束,而不關(guān)心是否存在類似拍賣算法的多輪出價交互、也不關(guān)心是否存在中心控制節(jié)點的指令、更不關(guān)心領(lǐng)導(dǎo)節(jié)點的動向變化。因此,無論是鄰域信息聚合決策、級聯(lián)鄰域信息聚合決策、回流剪裁的級聯(lián)信息聚合決策還是全局信息聚合決策,層次化解耦的約束要素僅在于個體對目標(biāo)信息的揀選。因此,本文所提方法具備裝填算法模型的可調(diào)整性,是系統(tǒng)級機制設(shè)計創(chuàng)新,為典型場景中目標(biāo)分配和任務(wù)規(guī)劃等需求提供了具備耦合與彈性調(diào)控能力的底層機制與架構(gòu)。
進(jìn)一步分析本文方法的裝填算法模型可調(diào)整性,當(dāng)前方法及實驗驗證過程中,各個節(jié)點的目標(biāo)信息融合、目標(biāo)評估揀選算法相同。但在開放式環(huán)境中,集群節(jié)點的信息交互及其約束需求差異化將更加劇烈。因此,在后續(xù)研究規(guī)劃中需要進(jìn)一步開展對差異化場景下、或受不同的決策與控制算法影響下,影響層次化協(xié)同行為涌現(xiàn)的共性要素。同時,研究不同分層解耦粒度的系統(tǒng),面向信息交互與傳播如何進(jìn)行層次對齊的問題。以期通過上述持續(xù)性研究,在增強和深化層次化信息交互方法的同時,保持裝填算法模型的可調(diào)整性的原始設(shè)計特性。
綜上所述,本文所提模型對動態(tài)群落目標(biāo)協(xié)商揀選與決策傳播能夠完成群組的隔離,有效控制對信息關(guān)注和交互,實現(xiàn)群落生成與規(guī)模調(diào)控,增強了無人機系統(tǒng)在信息交互與傳播演化方面的魯棒性和健壯性,可為進(jìn)一步擴展模型方法,適配多樣化的場景提供衍化基礎(chǔ)。
本文針對無人系統(tǒng)的實用化存在多層次控制的互動統(tǒng)一問題,從群體行為的中觀尺度考慮節(jié)點關(guān)系演化與控制,將結(jié)構(gòu)特性與信息交互特性解耦分層,以形成決策傳播效應(yīng)為目標(biāo),提出了基于UAU-FO*的層次化信息傳播方法,進(jìn)而構(gòu)建了面向時域、空域上動態(tài)變化目標(biāo)無人機群目標(biāo)分配的層次化信息傳播方法,通過仿真驗證了該方法對實現(xiàn)自主目標(biāo)聚合解聚的有效支持作用。具體而言,面向無人系統(tǒng)對指揮控制層和通信組網(wǎng)層進(jìn)行信息交互的解耦,以通信能力來保障任務(wù)協(xié)同,以任務(wù)信息交互與個體決策完成控制,提供基本的信息交互控制機制的設(shè)計實現(xiàn),為無人機集群以共性關(guān)聯(lián)實現(xiàn)個體行動、任務(wù)協(xié)同與集群組織的行為一致性與互動性的耦合與統(tǒng)一提供思路,提出了具備自主與受控間混合平滑模式遷移能力的層次化無人系統(tǒng)信息傳播方法與基礎(chǔ)框架,為現(xiàn)有算法面向差異化應(yīng)用場景,提供了一套可擴展、可聯(lián)合的層次化系統(tǒng)“容器”。
在本文的基本方法框架下,信息交互控制視角可為進(jìn)一步拓展研究無人節(jié)點之間以個體與群體混合形式的復(fù)雜博弈問題提供多尺度互動統(tǒng)一的方法模型,也是未來在中觀尺度繼續(xù)完善本文所提方法框架的重點。如面向運動動力學(xué)、平臺能力構(gòu)成不同的節(jié)點所組成的集群,如何構(gòu)建面向個體與群體混合形式復(fù)雜博弈的信息隔離策略,使得多維度信息在跨解耦層次、跨多個群組過程中能夠高效交互,并延續(xù)本文的對優(yōu)化通信負(fù)載、增強魯棒性、兼具個體自主性的出發(fā)點,將是后續(xù)研究中需要持續(xù)深入研究的重要課題。