国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

分布式多AUV協同搜索方法

2022-05-07 08:26:06高永琪馬威強張林森
系統工程與電子技術 2022年5期
關鍵詞:柵格概率決策

高永琪, 馬威強, 張林森, 王 鵬, 趙 苗

(海軍工程大學兵器工程學院, 湖北 武漢 430033)

0 引 言

自主式水下航行器(autonomous underwater vehicle, AUV)是一種能在水下自主航行的智能化裝置,具有成本低、隱蔽性強、活動受限小等優(yōu)點。當前,AUV的航速、續(xù)航力、通信質量、導航和控制能力等都在逐步提高,未來能更多地執(zhí)行掃雷、攻擊、情報搜集、偵察監(jiān)視等軍事任務。單一AUV作業(yè)往往會因為故障、外部威脅等導致任務失敗,而多AUV協同作業(yè)可以通過配合、補位,降低單一AUV失效的影響,從而提高作業(yè)效率。

當前,協同作業(yè)是AUV研究的一個熱點,如協同定位、協同搜索、協同作戰(zhàn)等,亦常以AUV集群為對象,開展任務規(guī)劃、編隊控制、路徑跟蹤、集群穩(wěn)定性等以協同作業(yè)為目的的研究。

AUV還可以與無人水面艇(unmanned surface vehicle,USV)組成異構協同系統發(fā)揮更大作用,如海底資源探測。為此,有學者研究了USV對AUV路徑的跟蹤算法以及異構協同系統的通信與導航。日本已陸續(xù)在研制與AUV協同的USV,如日本國家海洋研究所研制的半潛式USV和日本海洋地球科學與技術署的MAINAMI型USV。AUV異構協同也是AUV發(fā)展的一個重要方向。

搜索是AUV的核心任務之一,成功搜索到目標是執(zhí)行相關任務的前提,協同搜索是國內外多智能體協同控制領域的一個研究熱點。

常見的協同搜索方法有遍歷掃描式搜索、分區(qū)域覆蓋搜索、概率圖引導搜索等。傳統遍歷式掃描容易因目標運動、傳感器失誤等原因造成搜索失敗,常常要求智能體短時間內迂回,而AUV機動性能差,難以滿足要求。

分區(qū)域覆蓋搜索通過合理分配區(qū)域,將多機覆蓋搜索問題轉化為單機覆蓋搜索問題,文獻[21-23]所述應用Voronoi圖對搜索區(qū)域進行分割,該方法被普遍采用,但這種分割復雜,并且?guī)в胁淮_定性,對智能體的自主性要求也較高。

概率圖模型可以有效描述任務環(huán)境信息,反映任務環(huán)境變化。黃杰等人根據環(huán)境的先驗信息,在原概率圖基礎上引入標志位,建立基于雙屬性矩陣的待搜索環(huán)境概率模型,提高環(huán)境和目標的信息感知準確度,但該方法使用集中式協同結構,需要優(yōu)化的決策變量往往是高維的,求解難度大,優(yōu)化時間長。彭輝等人提出一種分布式模型預測控制的多無人機協同搜索模型,采用基于納什最優(yōu)和粒子群優(yōu)化算法進行求解,極大地降低求解維度,但無人機之間需要進行多次信息交換才能實現納什最優(yōu),對通信有很高要求,實際中往往無法滿足,具有現實局限性。張哲璇等人提出一種重訪機制驅動的協同搜索規(guī)劃方法,重返可疑區(qū)域,降低由傳感器性能不足造成誤判的影響,但該方法未考慮通信約束,也有現實局限性。

本文針對水下存在通信延時和協同過程中單AUV易失效的問題,提出一種通信實時性需求低、魯棒性強的協同搜索算法。通過構造人工勢場避免AUV碰撞與資源浪費,采用改進后的頭腦風暴優(yōu)化(brain storm optimization, BSO)算法確保多AUV在協同搜索時能在短時間內做出最優(yōu)決策。

1 問題描述

針對任務區(qū)域內存在的個靜止目標,如沉底水雷、海底應答器、海底預置武器等,通過某些手段獲取目標先驗信息(比如分析區(qū)域水文信息、地形信息判斷這些靜態(tài)目標更有可能布放在何處等),但這些信息可能存在一定誤差,因此需要指派個AUV進入任務區(qū)域,利用攜帶傳感器進行具體搜索以獲得目標信息。

對任務區(qū)域進行柵格化,每個柵格長寬均為一個單位長度,任務區(qū)域由×個柵格組成。假設每個柵格內最多只能有一個目標,AUV通過傳感器可確認所在柵格有無目標。

目前,大部分AUV搭載有先進的偵察探測裝備,如前視聲吶、高分辨率側掃聲吶及先進攝像裝備等。其中部分國家采用的干涉型合成孔徑聲吶和立體搜索聲吶,具有很高的分辨率,但是這些傳感器仍然可能誤判,具有一定探測概率和虛警概率。

圖1 AUV運動方向示意圖Fig.1 Schematic of AUV movement directions

但實際上,AUV具有機動約束,存在最大偏航角增量和最小偏航角增量。本文為表征機動約束,限制AUV運動方向為“左航、直航、右航”3種狀態(tài),偏航角增量分別用“-1、0、1”表示。+1時刻的偏航角通過取模運算獲得,計算公式如下所示:

(1)

式中: Mod(·)為求余運算。

一組偏航角增量可以表征一條搜索路徑,如初始偏航角為0,決策偏航角增量為[1,1,-1,1,0,-1]所表示的搜索路徑如圖2所示。

圖2 搜索路徑示意圖Fig.2 Schematic of search path

2 搜索模型

2.1 目標存在概率圖

概率圖中柵格(,)的數值表征目標在該柵格可能存在的概率。先驗信息中最有可能出現目標的位置為((),()),=1,2,…,。但其周邊也可能存在目標,因此以((),())作為峰值中心,利用高斯分布函數表示其附近區(qū)域的初始概率,如下所示:

(2)

式中:表示位置((),())的目標存在概率,即高斯分布的峰值;為高斯分布的方差。

當AUV航行至柵格(,)時,目標尋找概率根據貝葉斯準則更新,具體如下。

AUV在第時刻探測到目標,目標尋找概率更新如下:

(3)

式中:為探測概率,表征柵格中有目標且AUV成功探測到目標的概率;為虛警概率,表征柵格中無目標但AUV探測到目標的概率。

AUV在第時刻未探測到目標,目標尋找概率,更新如下所示:

(4)

AUV在搜索過程中,用傳感器探測柵格中是否有目標,并及時更新目標存在概率圖,當柵格內概率大于閾值時,認為該柵格存在目標,并將該柵格的概率置零,以避免吸引AUV再次前往搜索。

2.2 環(huán)境不確定度圖

環(huán)境不確定度()∈[0,1]表示AUV對柵格(,)中環(huán)境信息的掌握情況,其中()=1表示AUV對環(huán)境信息完全不確定,()=0表示AUV對環(huán)境信息完全確定。初始不確定度根據目標存在概率確定,計算公式如下:

=1-(-ln()-(1-)ln(1-))

(5)

隨著AUV對柵格的不斷探測,其對柵格環(huán)境的掌握愈發(fā)清晰,環(huán)境不確定度不斷變小,具體更新如下:

(6)

式中:∈[0,1]為環(huán)境不確定度遞減因子。

2.3 協調信息素圖

多艘AUV在同一時刻搜索同一柵格,一方面是對資源的浪費,降低了搜索效率;另一方面容易碰撞,破壞了系統結構。本文通過協調信息素圖構造人工勢場,合理協調AUV集群,避免多艘AUV同時搜索同一柵格。

(7)

柵格的協調信息素越多,說明AUV越有可能與其他AUV發(fā)生沖突,前往該柵格會給協同過程帶來更大隱患。

3 協同搜索方法

3.1 目標函數

多AUV協同搜索的目的是盡量掌握整個任務區(qū)域信息,盡可能發(fā)現更多目標。因此,綜合考慮目標存在概率收益、環(huán)境掌握程度收益和協同代價制定目標函數。

(1) 目標存在概率收益。目標存在概率收益是指按照當前目標存在概率圖,AUV依照搜索路徑航行,所經過柵格的目標存在概率之和,表征AUV沿著最有可能發(fā)現目標的路徑航行。

(8)

式中:是指第個AUV按照預測的搜索路徑航行所經過柵格的集合。

(2) 環(huán)境掌握程度收益。環(huán)境掌握程度收益是指按照當前環(huán)境不確定圖,AUV按照搜索路徑航行,所經過柵格的環(huán)境不確定度之和,表征AUV沿著環(huán)境不確定度最大的路徑航行,盡快降低環(huán)境不確定度,提高對環(huán)境的掌握程度。

(9)

目標存在概率收益與環(huán)境掌握程度收益度量標準不一,實際計入目標函數時,需要進行歸一化處理。

(10)

基于上述子目標函數,目標函數計算公式如下:

(11)

式中:,,是子目標函數影響系數;為一個充分大的正數。

3.2 分布式協同搜索過程

本文采用滾動優(yōu)化策略實時產生最優(yōu)搜索路徑,在滾動時域內預測步,但只執(zhí)行最優(yōu)決策的第一步;采用分布式結構,將整個AUV系統的全局優(yōu)化問題轉化為各AUV子系統的局部優(yōu)化問題,減小優(yōu)化規(guī)模、縮短優(yōu)化時間。

協同搜索問題實際上是一個非線性優(yōu)化問題,可以通過智能優(yōu)化算法進行優(yōu)化。本文采取基于全局最優(yōu)和差分變異的頭腦風暴優(yōu)化(global-best difference-mutation brain storm optimization, GDBSO)算法優(yōu)化目標函數,利用其收斂速度快、優(yōu)化效率高、可靠性較強的優(yōu)點,快速得到收益最大、代價最小的最優(yōu)決策,GDBSO算法主要包括以下幾個操作步驟。

聚類操作:種群中的個個體通過k-means聚類方法分成類,并定義每一類的最優(yōu)個體為該類的類中心。

取代操作:聚類后,以取代概率產生隨機個體取代某一個類的類中心,防止算法過早地收斂,并有助于算法跳出局部最優(yōu)。

選擇操作:通過4種方法選擇待變異個體。

按照輪盤賭概率選中一個類,選擇該類的類中心為待變異個體;

按照輪盤賭概率選中一個類,選擇該類中隨機一個個體為待變異個體;

隨機選中兩個類,融合兩個類的類中心成為待變異個體;

隨機選中兩個類,在兩個類中各隨機選出一個個體,融合成為待變異個體。

追隨操作:以追隨概率使得選擇出來的個體追隨全局最優(yōu)個體。

變異操作:以差分概率對待變異個體進行差分變異,否則產生隨機新個體作為變異個體。

分布式多AUV協同搜索決策算法步驟如下。

根據先驗信息初始化搜索圖。

產生第個AUV的初始種群,種群為個個體,每個個體有個自變量,每個自變量的取值范圍為-1、0、1。

利用GDBSO算法對步驟2中的種群進行優(yōu)化,對每一個選擇、追隨、變異操作產生的個體進行四舍五入取整,若取整后新個體的自變量不符合條件則重新進行選擇、追隨、變異操作。

將當前最優(yōu)決策、當前探測情況發(fā)送至其他AUV,執(zhí)行最優(yōu)決策第一步。

判斷是否達到最大搜索步長,是則結束,否則轉入步驟6。

接收上一決策時刻其他AUV共享的信息,更新搜索圖,轉入步驟2。

AUV之間交互的信息包括最優(yōu)決策與探測情況,最優(yōu)決策更新環(huán)境不確定度和協調信息素,探測情況更新目標存在概率。時刻探測當前柵格,接收到其他AUV在(-1)時刻發(fā)出的信息,融合后更新自身搜索圖,以此作出決策,并發(fā)送最優(yōu)決策與探測情況。AUV決策的實際依據為上一步的信息,由此允許通信有一定延時。

AUV根據當前時刻各自的搜索圖進行優(yōu)化決策,其中協調信息素來源于上一時刻接受的其他AUV的最優(yōu)決策,使得AUV避開可能與其他AUV沖突的柵格。

4 仿真研究

首先,為驗證本文提出的協同搜索算法的有效性,將GDBSO與BSO分別應用于決策過程,對比搜索結果。其次,改變預測步長、子目標函數影響系數等參數,分析其對搜索過程的影響。最后,分析搜索過程中某AUV失效對整個AUV集群搜索效能的影響。

為減少偶然性對仿真結果的影響,各組仿真均獨立運行50次。計算機仿真平臺為Matlab 2016a,處理器為Intel(R) Core(TM)i5-6200U CPU@2.30 GHz,RAM4GB,操作系統為windows10-64位。

分布式協同搜索模型參數如表1所示。

表1 分布式協同搜索模型參數

任務區(qū)域為20 km×20 km大小的海域,均勻劃分為20×20的柵格。根據先驗信息,初始目標存在概率分布如圖3所示。

圖3 初始目標存在概率分布圖Fig.3 Probability distribution diagram of initial target existence

4.1 不同算法比較

使用兩艘AUV搜索50步,每步決策預測=8步,AUV的出發(fā)航向均為0。將子目標函數影響系數設置為=0.4、=0.4、=0.2,GDBSO算法與BSO算法的參數設置參考文獻[31],其中,種群數量=30,最大迭代次數=30。

基于GDBSO和BSO決策的分布式多AUV協同搜索路徑如圖4所示。

圖4 基于不同決策的協同搜索路徑示意圖Fig.4 Schematics diagram of collaborative search paths based on different decision-making

圖4中,黑色三角形為AUV出發(fā)位置,黑色菱形為實際目標位置,與先驗信息中最有可能的位置存在一定差異,紅色區(qū)域為禁航區(qū)域。

GDBSO和BSO均有能力在50步內成功尋得所有目標,并且避開禁航區(qū)與避免AUV同時搜索同一柵格,可見本文提出的分布式協同搜索方法具有可行性。

GDBSO和BSO各獨立仿真50次,統計結果如表2所示。

表2 不同算法搜索效果比較

GDBSO與BSO相比,尋得目標數量更多、每步決策時間更短,可見GDBSO在決策方面更有優(yōu)勢。

4.2 參數影響分析

設定預測周期=8,取不同的子目標函數影響系數進行仿真,各組均獨立仿真50次,結果如表3所示。

表3 子目標函數影響系數的影響

結果表明,搜索結果與子目標函數影響系數的取值息息相關。目標存在概率收益權重不斷增大,環(huán)境掌握程度收益權重不斷減小,尋得目標數量逐漸增大后減小,可見這兩個權重處于某種平衡時能使算法有更好的搜索效果。當=04、=04、=0.2時,尋得目標數最多為8.80,說明目標存在概率收益權重等于環(huán)境掌握程度收益權重時,目標函數引導AUV決策的效果為佳。

設定子目標函數影響系數為=04、=04、=02,取不同預測周期,各組均獨立仿真50次,結果如圖5所示。

圖5 不同預測周期的影響Fig.5 Impact of different forecast periods

由圖5(a)可見,預測周期過長或過短都使得搜索效果變差,當預測周期=8時,搜索效果最佳。預測周期過短,AUV沒有充分利用搜索圖信息,不能作出對未來更有利的決策。預測周期變長,優(yōu)化規(guī)模變大,算法求解難度增大,更容易陷入局部最優(yōu),導致搜索效果差強人意。由圖5(b)可見,預測周期越長,每步決策時間越長,但預測周期取6~10時均小于1 s,滿足協同搜索實時性要求。綜上所述,建議設定預測周期=8,既有較好搜索效果,又滿足較短決策時間。

4.3 AUV數量變化

為分析AUV數量對搜索效果的影響,分別指派2~7艘AUV執(zhí)行協同搜索任務,每組仿真均獨立運行50次,統計尋得目標數量如圖6所示。

圖6 AUV數量變化的影響Fig.6 Impact of number changes of AUVs

當AUV數量少于5艘時,尋得目標數量隨AUV數量增大而增大,大于5艘后,尋得目標數量基本不變。在任務區(qū)域與搜索步長不變的條件下,AUV數量達到一定值后,數量增長對搜索效果基本無幫助。AUV數量為6艘時的搜索示意圖如圖7所示,在搜索后期,出現柵格被反復搜索的情況,造成資源浪費。因此要根據實際情況,指派合適數量的AUV,提高搜索效率,同時避免資源浪費。

圖7 6艘AUV搜索結果示意圖Fig.7 Schematic diagram of search result for six AUVs

由于海洋水下環(huán)境復雜,AUV編隊在執(zhí)行任務過程中容易發(fā)生部分AUV失效,為此,指派4艘AUV組成AUV集群執(zhí)行協同搜索任務,各AUV搜索50步,假設在20步時有1艘AUV失效。獨立運行仿真50次,結果如圖8所示。

圖8 單AUV失效時搜索結果示意圖Fig.8 Schematic diagram of search results in case of single AUV failure

由圖6可知,單AUV未失效時4艘AUV尋得目標數量占實際總目標數量的95.4%,而由圖8所示,單AUV在途中失效時該比例為94.8%,僅比未失效低0.6%。可見,協同搜索方法魯棒性較好,AUV集群并未因個別AUV失效而導致整體搜索效果大幅度下降。

5 結 論

本文針對水下協同搜索中通信延時、單AUV作業(yè)過程中失效的問題,提出一種具有較強實時性和魯棒性的分布式協同搜索方法,用于對任務海域的靜態(tài)目標完成協同搜索。該方法利用上一步搜索圖信息進行決策,減弱通信實時性需求,通過協調信息素避免AUV碰撞與資源浪費,使用GDBSO優(yōu)化目標函數,確保AUV短時間內獲得最優(yōu)決策。仿真結果表明,單個AUV在協同搜索過程中失效對整體搜索效果影響很小,驗證了方法的魯棒性。但本文研究的搜索目標是靜態(tài)的,實際任務中還有動態(tài)目標,協同搜索靜態(tài)和動態(tài)目標是下一步研究方向。

猜你喜歡
柵格概率決策
第6講 “統計與概率”復習精講
第6講 “統計與概率”復習精講
基于鄰域柵格篩選的點云邊緣點提取方法*
為可持續(xù)決策提供依據
概率與統計(一)
概率與統計(二)
決策為什么失誤了
不同剖面形狀的柵格壁對柵格翼氣動特性的影響
基于CVT排布的非周期柵格密度加權陣設計
雷達學報(2014年4期)2014-04-23 07:43:13
動態(tài)柵格劃分的光線追蹤場景繪制
夏津县| 永顺县| 海林市| 永福县| 阿拉善左旗| 民权县| 卫辉市| 房山区| 洛宁县| 城步| 曲松县| 南澳县| 延安市| 长葛市| 伽师县| 无为县| 泰州市| 若尔盖县| 浮梁县| 邵东县| 岑溪市| 巴楚县| 毕节市| 兴文县| 甘孜县| 青岛市| 福鼎市| 宣武区| 云南省| 景德镇市| 井陉县| 西藏| 湄潭县| 招远市| 定州市| 梓潼县| 七台河市| 吴旗县| 昌吉市| 井研县| 平昌县|