趙蕊,許建,向先波,徐國華
1 中國艦船研究設(shè)計中心,湖北 武漢 430064
2 華中科技大學(xué) 船舶與海洋工程學(xué)院,湖北 武漢 430074
自主式水下機(jī)器人(AUV)作為一種無纜型水下航行器,是海洋資源勘探和開發(fā)的重要工具。
AUV在軍用領(lǐng)域的應(yīng)用十分廣泛,可用于反潛戰(zhàn)、水雷戰(zhàn)、情報偵察、巡邏監(jiān)視、后勤支援、地形測繪和水下施工等[1-3],故世界各國都在致力研究先進(jìn)的AUV系統(tǒng)以增強國防實力。美國的伍茲霍爾海洋研究所、蒙特雷灣海洋研究所、麻省理工學(xué)院海洋研究中心等眾多研究機(jī)構(gòu)研制了大量應(yīng)用于短期水雷偵察系統(tǒng)和長期水雷偵察系統(tǒng)的AUV。1990年,挪威國防研究機(jī)構(gòu)制定了AUV長期發(fā)展計劃,其中HUGIN系列AUV已多次參加挪威皇家海軍的獵雷演示試驗。與此同時,法國及俄羅斯等國家也在軍用AUV方面開展了大量研究工作[4]。
在民用領(lǐng)域,AUV主要用于海洋環(huán)境考察、海底礦產(chǎn)和生物資源勘探、海事救援、海洋考古及海底光纜工程建設(shè)與維護(hù)等[5]。在中國大洋礦產(chǎn)資源開發(fā)研究協(xié)會的支持下,中國與俄羅斯聯(lián)合研制開發(fā)了CR-01型和CR-02型(6 000 m)AUV,可以在深海底平坦地形的多金屬結(jié)核礦區(qū)工作環(huán)境下完成聲學(xué)、光學(xué)和水文測量任務(wù)。美國Tesla Offshore公司已應(yīng)用Bluefin-21型AUV開展海洋管道檢修服務(wù)及海床地理環(huán)境地圖的繪制工作。2011年,美國蒙特雷灣海洋研究所在Juan de Fuca海嶺投放了“Dorado深海AUV”,該型AUV的最低航行高度為海底上方50 m,其配置的多波束聲吶可以精確測繪火山口周圍的海底地貌[6-7]。
近幾十年來,鑒于AUV在民用和軍用領(lǐng)域的重要地位,各國在AUV技術(shù)方面均取得了長足的發(fā)展[8-10],并基于任務(wù)需求研發(fā)了多自主式水下機(jī)器人(MAUV)系統(tǒng)。
隨著AUV技術(shù)的不斷成熟,其已成為能夠完成指定任務(wù)的水下自主作業(yè)系統(tǒng)。然而,單個AUV難以滿足一些動態(tài)復(fù)雜任務(wù)的應(yīng)用需求,MAUV系統(tǒng)由此應(yīng)運而生[11-13]。在水下作業(yè)方面,MAUV系統(tǒng)因其空間分布性、高效性、魯棒性及靈活性等特點,具備單臺AUV所無法比擬的優(yōu)勢。MAUV系統(tǒng)的核心思想是將多個功能簡單的AUV組成一個系統(tǒng),通過控制各AUV協(xié)調(diào)合作來完成給定任務(wù)[14-17]。目前,美國空間及海軍作戰(zhàn)系統(tǒng)中心設(shè)計了分布式MAUV水下監(jiān)聽系統(tǒng),并建立了水下基站用以監(jiān)測水下數(shù)據(jù)。哈爾濱工程大學(xué)海洋綜合技術(shù)工程研究中心也基于智能MAUV系統(tǒng),在海底作戰(zhàn)環(huán)境探測、水下大型物品運輸?shù)确矫骈_展了研究[18]。由MAUV組成的水下網(wǎng)絡(luò)可以與水上網(wǎng)絡(luò)相結(jié)合,形成全方位立體化的信息網(wǎng)絡(luò),其中水面艦艇或浮標(biāo)可以作為水上和水下連接的中繼節(jié)點。由于水下信息網(wǎng)絡(luò)能夠長期在復(fù)雜或高威脅環(huán)境中完成海區(qū)監(jiān)視、情報搜集和環(huán)境監(jiān)測等任務(wù)[19-22],故MAUV系統(tǒng)具有重要的研究意義和應(yīng)用價值。
為保證MAUV順利完成水下環(huán)境立體協(xié)同調(diào)查、水下協(xié)作搜索、水下協(xié)同圍捕、水下信息傳輸?shù)雀鞣N協(xié)調(diào)控制任務(wù),首先需要明確MAUV協(xié)同作業(yè)系統(tǒng)中各AUV的路徑規(guī)劃。然而,MAUV協(xié)同路徑規(guī)劃是一個包含復(fù)雜約束條件的大規(guī)模組合優(yōu)化問題,需為系統(tǒng)內(nèi)每臺AUV規(guī)劃從起點到終點的最優(yōu)或接近最優(yōu)的路徑,進(jìn)而通過協(xié)調(diào)組合策略使整個系統(tǒng)的組合路徑最優(yōu),從而實現(xiàn)系統(tǒng)總消耗時間最短、能量消耗最少、轉(zhuǎn)彎半徑最小及加速度最大等目標(biāo)[23-25]。
另一方面,MAUV集群協(xié)同完成某項任務(wù)時,一般要求多臺AUV保持一定的隊形執(zhí)行任務(wù),即在航行過程中控制AUV與群體中其他AUV的相對空間距離,實現(xiàn)AUV集群的編隊形成和編隊控制,系統(tǒng)中的多臺AUV將從一個隨機(jī)的初始狀態(tài)過渡到一個整體有規(guī)律或符合設(shè)計要求的穩(wěn)定狀態(tài)。MAUV集群在行進(jìn)過程中既要遵循一定的隊形約束,又要適應(yīng)當(dāng)前的工作環(huán)境(例如,障礙物或空間的物理限制),具有相當(dāng)?shù)奶魬?zhàn)性。
目前,MAUV的路徑規(guī)劃方法主要如下。
1)生物啟發(fā)自組織神經(jīng)網(wǎng)絡(luò)算法。
生物啟發(fā)自組織神經(jīng)網(wǎng)絡(luò)(Self-Organizing Map,SOM)算法包含3個步驟:首先,通過計算歐氏距離來選取獲勝神經(jīng)元;其次,在某個神經(jīng)元獲勝后,設(shè)計一個鄰域函數(shù),該鄰域函數(shù)決定了輸入神經(jīng)元對獲勝神經(jīng)元和相鄰神經(jīng)元的影響力,其中獲勝神經(jīng)元所受的影響最大,鄰近神經(jīng)元所受的影響逐漸減小,鄰域以外的神經(jīng)元不受影響,影響力決定了在某次迭代過程中鄰域神經(jīng)元權(quán)重調(diào)整的大??;最后,通過更新三維權(quán)向量方法使AUV到達(dá)目標(biāo)點[26]。
2)蟻群算法。
蟻群算法由意大利學(xué)者Dorigo提出,該算法通過模擬螞蟻社會的分工與協(xié)作來進(jìn)行尋優(yōu)[27]?;谙伻核惴ǖ腗AUV協(xié)調(diào)路徑規(guī)劃包括路徑優(yōu)化和路徑校核2部分。在路徑優(yōu)化之前,應(yīng)對各AUV所要訪問的路徑點數(shù)量進(jìn)行分配。為了保證各AUV的任務(wù)量相當(dāng),應(yīng)盡可能均勻分配訪問路徑點。各路徑點被訪問的先后順序由蟻群算法來實現(xiàn),依次連接某臺AUV的起點、被分配的路徑點及其終點,就形成了該AUV的路徑。對所有AUV執(zhí)行同樣的操作即可生成MAUV的路徑。若路徑點數(shù)量n恰好能被AUV數(shù)量m整除,則每個AUV將分配n/m個路徑點;若n不能被m整除,則將余數(shù)再從首至尾逐一分配給各AUV,直到分配完為止。路徑的長度可以通過計算路徑中所有相鄰路徑點(包括AUV的起點和終點)之間的距離求得,將各AUV的路徑長度求和即可得到MAUV的總路程[28-29]。
3)內(nèi)螺旋覆蓋算法。
內(nèi)螺旋覆蓋(Internal Spiral Coverage,ISC)算法是一種基于柵格地圖的在線覆蓋算法[30]。該算法采用簡單的圓形機(jī)器人來覆蓋環(huán)境,并假設(shè)機(jī)器人內(nèi)部測距傳感器(里程計)可以精確測量機(jī)器人的全局坐標(biāo)。覆蓋過程中,ISC算法分為2個階段:邊界探索階段和在線覆蓋階段。在邊界探索階段,機(jī)器人從環(huán)境的任一頂點開始,采取右側(cè)沿環(huán)境邊界行走的方式運動一周。將機(jī)器人右側(cè)接觸傳感器所在柵格賦值為0,表示該柵格無法覆蓋;將機(jī)器人走過的柵格賦值為1,表示該柵格已被覆蓋;將機(jī)器人左側(cè)柵格賦值為2,表示下一圈要覆蓋的柵格,即在線規(guī)劃的覆蓋路徑。在邊界探索階段結(jié)束時即可獲得環(huán)境邊界,此時機(jī)器人完成了邊界附近的一圈覆蓋,并規(guī)劃了下一圈的運動路徑,然后進(jìn)入在線覆蓋階段。在在線覆蓋階段,機(jī)器人沿邊界探索階段賦值為2的連續(xù)柵格運動,并將其賦值為l,同時將機(jī)器人左側(cè)未賦值的柵格賦值為2。當(dāng)?shù)?圈覆蓋結(jié)束時即可生成第3圈的覆蓋路徑,機(jī)器人以此方式向內(nèi)螺旋完成所有區(qū)域的覆蓋。如果環(huán)境內(nèi)部存在障礙物,則障礙物會阻斷規(guī)劃的路徑,導(dǎo)致賦值為2的柵格不連續(xù)。但該障礙物在下一圈的覆蓋過程中會被機(jī)器人前方的接觸傳感器檢測到。機(jī)器人將仍然采取右側(cè)沿物體邊界行走的方式繞障礙物運動,直到前方重新出現(xiàn)賦值為2的柵格,機(jī)器人才會回到原規(guī)劃路徑上繼續(xù)覆蓋。對于常見的單個矩形環(huán)境,應(yīng)用該算法可以從環(huán)境邊界向內(nèi)螺旋完成覆蓋[31-33]。
4)粒子群優(yōu)化算法。
1995年,Kennedy和Eberhart提出了粒子群優(yōu)化(Particle Swarm Oplimization,PSO)算法。在PSO算法中需要初始化一群隨機(jī)粒子,然后這些隨機(jī)粒子將追隨當(dāng)前的最優(yōu)粒子在解空間中搜索,即通過迭代找到最優(yōu)解[34]。根據(jù)PSO算法,李愛國等[35]提出了一種并行雙層結(jié)構(gòu)的MAUV協(xié)同路徑規(guī)劃算法。該算法分為2層:主層和子層。子層規(guī)劃的首要任務(wù)是對每臺AUV分別利用PSO算法規(guī)劃各自的路徑。由于系統(tǒng)內(nèi)每臺AUV的起點、終點及所處環(huán)境各不相同,所以最終每臺AUV將產(chǎn)生不同的最優(yōu)路徑。主層規(guī)劃的主要任務(wù)是對不同AUV的路徑進(jìn)行最佳組合,使組合內(nèi)的多臺AUV整體協(xié)同路徑最優(yōu)且彼此間無碰撞。在子層規(guī)劃過程中,隨著迭代次數(shù)的增加,標(biāo)準(zhǔn)的PSO算法將出現(xiàn)陷入局部最優(yōu)和算法后期收斂速度緩慢的問題。為解決這些問題,首先,需采用自適應(yīng)參數(shù)動態(tài)調(diào)整PSO算法中的慣性權(quán)重因子w以及學(xué)習(xí)因子c1和c2,并選擇適當(dāng)?shù)穆窂揭?guī)劃評價函數(shù),用以得到每臺AUV的最優(yōu)路徑。然后,應(yīng)利用結(jié)合差分進(jìn)化(Differential Evolution,DE)算法的主層規(guī)劃來計算系統(tǒng)整體的MAUV協(xié)同最優(yōu)路徑,即通過DE算法的變異、交叉和選擇得到多臺AUV之間無碰撞(AUV與障礙物,以及AUV之間)且系統(tǒng)消耗最小的組合最優(yōu)路徑。最后,對適應(yīng)函數(shù)進(jìn)行評估[36]。
執(zhí)行任務(wù)時,MAUV編隊中的各AUV應(yīng)保持一定的隊形,并與編隊中的其他AUV保持一定的空間距離。MAUV編隊控制可以借鑒移動機(jī)器人及水面船舶的編隊控制方法,例如基于領(lǐng)航者—跟隨者、基于行為和基于虛擬結(jié)構(gòu)等方法[37-38],具體如下。
1)基于行為法。
基于行為的控制方法即通過設(shè)計機(jī)器人的基本行為及局部控制規(guī)則,從而產(chǎn)生期望的整體行為。編隊控制器由一系列行為組成,每個機(jī)器人有基本的行為方式,每種行為方式有自己的目標(biāo)或任務(wù)。一般情況下,機(jī)器人的行為包括避碰、避障、駛向目標(biāo)和保持隊形等。避碰即運動過程中避免機(jī)器人之間發(fā)生相互碰撞,避障即動態(tài)環(huán)境下編隊機(jī)器人在運動過程中避免碰到障礙物,保持隊形是編隊控制中最基本的獨立行為[39],駛向目標(biāo)即實現(xiàn)預(yù)先指定的狀態(tài)。Balch和Arkin首次提出了基于行為的控制方法,并利用2個循環(huán)策略設(shè)計了保持隊形的行為控制器。Cao等[40]提出了子行為加權(quán)綜合的控制實現(xiàn)方法,即對每個子行為分別求出控制變量,然后加權(quán)平均求得綜合的控制變量。
2)人工勢場法。
人工勢場法即通過設(shè)計人工勢場和勢場函數(shù)來表示環(huán)境及隊形中各機(jī)器人之間的約束關(guān)系,應(yīng)用機(jī)器人所受到的障礙物斥力和目標(biāo)點引力來構(gòu)造勢場,并以此為基礎(chǔ)進(jìn)行分析和控制,機(jī)器人則將從平面得到的最小勢谷中選擇運動方向。該方法的優(yōu)點是計算簡單且便于實時控制,特別是可以有效處理障礙物約束的避障避碰問題;缺點是勢場函數(shù)難以設(shè)計,且存在局部極值點問題。Liang等[41]在障礙物環(huán)境下提出了非完整移動機(jī)器人基于勢場函數(shù)的分布式控制器。這種分布式控制器能夠保證編隊機(jī)器人達(dá)到預(yù)設(shè)隊形,同時避免相互碰撞以及與障礙物之間的碰撞[42]。
3)跟隨—領(lǐng)航法。
跟隨—領(lǐng)航法即在MAUV集群中指定某臺機(jī)器人為領(lǐng)航者,其余為跟隨者,跟隨者將以一定的間距跟蹤領(lǐng)航機(jī)器人的位置和方向[43-44]。該方法可以指定一個或多個領(lǐng)航者,但只能指定一個群體隊形的領(lǐng)航者。跟隨—領(lǐng)航者法有2種控制器形式:l-l控制器和l-ψ控制器。l-l控制器考慮的是3臺機(jī)器人之間的相對位置問題,一旦跟隨者與2個領(lǐng)航者之間的距離達(dá)到設(shè)定值,即可認(rèn)為整個隊形實現(xiàn)了穩(wěn)定狀態(tài)。而l-ψ控制器的目標(biāo)是使跟隨者與領(lǐng)航者之間的距離和相對轉(zhuǎn)角達(dá)到設(shè)定值[45],可利用跟隨—領(lǐng)航編隊控制方法,將水下機(jī)器人編隊控制問題轉(zhuǎn)化為跟隨者利用水聽器跟蹤領(lǐng)航者位置和航向的問題。針對MAUV編隊中某臺機(jī)器人的通信或機(jī)械故障,建立一種編隊容錯控制算法,可在機(jī)器人出現(xiàn)故障后自動重新調(diào)整編隊,避免故障機(jī)器人的后繼機(jī)器人掉隊,由此實現(xiàn)編隊的容錯控制[46-47]。
4)虛擬結(jié)構(gòu)法。
虛擬結(jié)構(gòu)法主要應(yīng)用于飛行器和人造衛(wèi)星的編隊飛行控制中。該方法的特點是機(jī)器人之間可以保持一定的幾何形狀,這樣形成的剛性結(jié)構(gòu)稱為虛擬結(jié)構(gòu)。雖然每個機(jī)器人相對于參考系統(tǒng)的位置不變,但其可以按照一定的自由度來改變各自的方向。MAUV將剛體結(jié)構(gòu)上的不同參考點作為各自的跟蹤目標(biāo)就可以形成一定的隊形:首先,需定義虛擬結(jié)構(gòu)的期望動力學(xué)特性;然后,將虛擬結(jié)構(gòu)的運動轉(zhuǎn)化為每個機(jī)器人的期望運動;最后,得出機(jī)器人的軌跡跟蹤控制方法[48-50]。
5)模型預(yù)測控制方法。
傳統(tǒng)控制方法一般適用于具有明確模型和確定性環(huán)境的控制,而實際應(yīng)用中的環(huán)境一般都是動態(tài)變化的,而且具有不確定性[51]。模型預(yù)測控制(Model Predictive Control,MPC)即基于動態(tài)環(huán)境變化和過程的不確定性,反復(fù)采用有限優(yōu)化結(jié)果代替全局優(yōu)化結(jié)果,由此實現(xiàn)優(yōu)化與反饋的理想結(jié)合以及對信息的充分利用。通過在線滾動優(yōu)化并結(jié)合實時信息的反饋校正,即可基于實際過程進(jìn)行每個時刻的優(yōu)化[52]。
MAUV系統(tǒng)對增強我國海洋資源探測能力,提高我國海洋國土的防御能力具有深遠(yuǎn)的政治意義、經(jīng)濟(jì)意義和戰(zhàn)略意義[53-54]。目前,在MAUV路徑規(guī)劃和集群協(xié)同控制研究方面,主要存在以下研究難點,這也是后續(xù)研究的發(fā)展方向。
1)MAUV動態(tài)自適應(yīng)技術(shù)。
獲取了海洋環(huán)境不確定模型后,應(yīng)研究水下航行器集群網(wǎng)絡(luò)如何通過動態(tài)自適應(yīng)的編隊來獲得整體的最優(yōu)性能,主要研究內(nèi)容包括:水中通訊受限、編隊內(nèi)航行器個體間的信息異步傳輸?shù)葐栴};MAUV編隊網(wǎng)絡(luò)自適應(yīng)控制研究;MAUV編隊系統(tǒng)整體性能實現(xiàn)情況分析;最優(yōu)控制的水下航行器路徑規(guī)劃方法研究[55-56]。
在航行過程中,可將離線規(guī)劃的全局航線作為參考航跡,分別進(jìn)行水平方向和垂直方向的路徑規(guī)劃,建立在線規(guī)劃的目標(biāo)函數(shù)。以某水下航行器的線性化橫側(cè)向運動方程作為等式約束,利用最小值原理構(gòu)造哈密爾頓函數(shù)進(jìn)行最優(yōu)航跡解算,實現(xiàn)航跡的最優(yōu)控制。同時,利用古典變分極值條件的微分方程組并結(jié)合梯度迭代法和一維搜索初值方法對其求解,即可得到更精確可行的三維水下航跡。
2)MAUV分布式控制技術(shù)。
MAUV編隊控制與人工智能領(lǐng)域中多智能體的協(xié)同控制有一定的相似之處,多智能體協(xié)同控制技術(shù)可以實現(xiàn)快速集群控制[57]、牽引控制[58]、目標(biāo)圍捕[59-61]、沿給定路徑的編隊運動[62]、時延約束下的編隊控制[63]等功能,故如何將單個航行器視為相對獨立的智能體,并借鑒現(xiàn)有智能體協(xié)同控制方法實現(xiàn)MAUV集群編隊控制是需要研究的重要內(nèi)容。值得注意的是,多智能體系統(tǒng)的協(xié)作機(jī)制與系統(tǒng)的群體體系結(jié)構(gòu)、個體體系結(jié)構(gòu)、感知、通信和學(xué)習(xí)等方面均密切相關(guān)[64-65]。
為了求解分布式控制問題,需要研究如何利用智能體獨立完成各自的子任務(wù)來實現(xiàn)相互之間的合作,并關(guān)注多個智能體之間如何協(xié)調(diào)運用各自的知識、目標(biāo)、技能和計劃來共同采取行動以解決問題。在進(jìn)行MAUV集群分布式控制的同時,可以通過搭載任務(wù)傳感器和各種聲學(xué)設(shè)備(例如,多波束測深儀、側(cè)掃聲吶、CTD、超短基線定位系統(tǒng)、多普勒速度計程儀及水下聲通訊系統(tǒng)等)來快速、有效地完成既定任務(wù)[66-67]。因此,基于分布式控制技術(shù),可以實現(xiàn)MAUV群體行為控制及多個航行器的協(xié)同決策和管理,進(jìn)而完成協(xié)同作業(yè)任務(wù)。
目前,MAUV系統(tǒng)是水下機(jī)器人技術(shù)的一個重要發(fā)展方向,通過機(jī)器人之間的合作與協(xié)調(diào),MAUV系統(tǒng)不僅可以完善每臺機(jī)器人的基本功能,還可以在機(jī)器人交互中進(jìn)一步拓展智能行為,從而完成水下環(huán)境立體協(xié)同調(diào)查、水下協(xié)作搜索、水下協(xié)同圍捕、水下信息傳輸?shù)葏f(xié)作任務(wù),有利于提高水下機(jī)器人的智能化水平并加快海洋化裝備的研制進(jìn)展。
本文針對MAUV系統(tǒng)的路徑規(guī)劃及協(xié)同控制問題,對其應(yīng)用現(xiàn)狀、科研進(jìn)展及關(guān)鍵技術(shù)進(jìn)行了系統(tǒng)的梳理和總結(jié),并在此基礎(chǔ)上探討了后續(xù)研究方向。