霍雨佳,李一平,封錫盛
(1.中國科學院沈陽自動化研究所機器人學國家重點實驗室,遼寧沈陽 110016;2.中國科學院機器人與智能制造創(chuàng)新研究院,遼寧沈陽 110169;3.遼寧省水下機器人重點實驗室,遼寧沈陽 110169;4.中國科學院大學,北京 100049)
傾轉(zhuǎn)旋翼水空跨域機器人(以下簡稱跨域機器人),充分結(jié)合了水下機器人(AUV)的隱蔽性和無人機(UAV)的機動性,具備水空兩棲多種介質(zhì)下的作業(yè)能力,擴展了原有機器人的作業(yè)環(huán)境和應(yīng)用范圍??缬驒C器人應(yīng)分別具備在水中、空氣中兩種介質(zhì)中穩(wěn)定工作,同時具備水空兩種介質(zhì)間多次反復跨介質(zhì)轉(zhuǎn)換的能力。由于兩種工作介質(zhì)在密度等方面的顯著區(qū)別,跨域機器人在多種介質(zhì)中穩(wěn)定的作業(yè)需求對機器人的運動控制器提出了艱巨的挑戰(zhàn)。因此,針對跨域機器人,建立可靠的動力學模型是設(shè)計機器人運動控制器的關(guān)鍵。
模型辨識方法在水下機器人和無人機上都有廣泛應(yīng)用,辨識數(shù)據(jù)來源于機器人傳感器的數(shù)據(jù)采集,將所獲的動力學模型用于機器人運動控制仿真平臺搭建和控制策略設(shè)計。最小二乘法、極大似然等參數(shù)化建模方法,需要一定的先驗知識,如機器人的動力學模型結(jié)構(gòu),可由流體力學、慣性和結(jié)構(gòu)布局等分析得到。所獲得的高精度模型常限制在一個小范圍內(nèi),通常通過增加建模的復雜性提高模型的范圍。利用神經(jīng)網(wǎng)絡(luò)、示教學習等非參數(shù)化建模也可獲得一定的效果,但所構(gòu)建的模型被限制在受過訓練的集合內(nèi),難以應(yīng)對模型的不確定性。
高斯過程回歸(Gaussian Processes Regression,GPR)是基于貝葉斯理論和統(tǒng)計學習理論的一種機器學習方法,適于處理小樣本、非線性等復雜問題,被廣泛應(yīng)用于機器人等領(lǐng)域。該方法提供了一種簡單有效的方式表示數(shù)據(jù)的先驗分布,可使用較少的參數(shù)得到準確的模型。GPR屬于非參數(shù)模型,只需假設(shè)它服從指定均值函數(shù)和協(xié)方差函數(shù)的高斯過程。相較于其他常用的參數(shù)模型,如神經(jīng)網(wǎng)絡(luò)、支持向量回歸、多項式回歸等,GPR具有易訓練、超參數(shù)自適應(yīng)獲取以及預測結(jié)果具有概率意義等特點。KO等利用高斯過程(Gaussian Processes,GP)模型和強化學習實現(xiàn)對飛艇的模型辨識和運動控制。FU等利用高斯過程實現(xiàn)對船舶模型的辨識。HEMAKUMARA和SUKKARIEH利用GP模型對固定翼UAV的模型進行辨識,獲得了固定翼機翼模型。CAO等利用GP模型和MPC控制器實現(xiàn)四旋翼無人機的運動控制仿真。
本文作者利用高斯過程對跨域機器人的動力學模型進行辨識。通過采集遙控飛行過程中機器人的狀態(tài)數(shù)據(jù),獲得機器人的動力學模型。這種非參數(shù)化建模方法可利用機器人運行過程中的反饋數(shù)據(jù)較大范圍地獲取機器人的動態(tài)特性,而不需要對機器人的模型結(jié)構(gòu)具備先驗知識,可以在控制器設(shè)計環(huán)節(jié)節(jié)省大量試驗成本。
為實現(xiàn)對跨域機器人的動力學模型進行辨識,應(yīng)對機器人進行模型分析。本文作者采用一種新型跨域機器人,具有4臺水空兩棲涵道推進器,如圖1所示。如圖1(b)所示,4臺推進器可以旋轉(zhuǎn)的最大角度為π/2,可實現(xiàn)推進器推力由向下到向后的切換。
該跨域機器人具備水下航行、水面滑行起飛、水面(陸地)垂直起飛懸停和空中平飛等工作模式。其中,在垂直起飛懸停模式下,推進器推力向下,機器人以旋翼飛行器模式工作;在空中平飛狀態(tài)下,機器人以固定翼飛機模式工作,通過升力體機翼提供機器人升力,通過控制涵道推進器傾轉(zhuǎn)角度和螺旋槳轉(zhuǎn)速控制機器人的俯仰。
機器人載體坐標系選擇重心為原點,遵循右手系,指向前方并與機器人縱向?qū)ΨQ軸重合;位于機器人水線面,與垂直并指向右舷;位于機器人縱中剖面,與垂直并指向下,如圖1(a)所示。
圖1 傾轉(zhuǎn)四旋翼跨域機器人
本文作者主要考慮機器人以傾轉(zhuǎn)旋翼模式在空中飛行時的運動控制問題。機器人在飛行中受力主要分為涵道推進器推力、機翼升力與阻力、重力和機身阻力。上述力會同時對機器人產(chǎn)生相應(yīng)的力矩,同時涵道推進器槳葉的旋轉(zhuǎn)也會產(chǎn)生相應(yīng)的力矩。
由文獻[16-17]可知,令=[,,]表示載體坐標系下機器人在橫滾、俯仰和偏航方向的角速度,=[,,]表示機器人姿態(tài)角,=[,,]表示載體坐標下機器人各方向線速度,=[,,]表示世界坐標系下機器人位置,則跨域機器人的動力學模型可描述為
(1)
其中:=[,,}為載體坐標系下機器人各方向分力;=[,,]為載體坐標系下機器人繞各軸力矩;為載體坐標系到世界坐標系的旋轉(zhuǎn)矩陣;為載體角速度到姿態(tài)角速率的旋轉(zhuǎn)矩陣。則世界坐標系下,機器人的受力可描述為
(2)
跨域機器人的4個涵道風扇推進器產(chǎn)生的合外力為
(3)
其中:T,、T,和T,分別表示合力在載體坐標系下、和軸上的分量,有:
同時,推進器推力產(chǎn)生的力矩為
T,=T,
(4)
式中:表示第個推旋翼進器中心距離重心的距離,表達式為
(5)
其中:,為第個傾轉(zhuǎn)旋翼推進器軸中心到機體坐標系下平面的距離;,為傾轉(zhuǎn)旋翼推進器軸中心到機體坐標系平面的距離;為推進器旋翼中心到傾轉(zhuǎn)軸的距離。
(6)
(7)
其中:(,)為通過所有數(shù)據(jù)集輸入計算得到的協(xié)方差矩陣;為單位矩陣。輸出數(shù)據(jù)集和對問詢點的預測輸出()的聯(lián)合分布為
(8)
其中:()的條件分布服從一個新的正態(tài)分布:
(|,)~[(),()]
(9)
則()的均值和方差的表達式為
(10)
()=(,)-(,)((,)+
(11)
因此,計算預測點的預測值可得:
=(,)
(12)
同時,采用平方指數(shù)協(xié)方差函數(shù)作為GPR的內(nèi)核函數(shù)(,):
(13)
(14)
(15)
則GPR模型的優(yōu)化目標為
=argmin()
(16)
對超參數(shù)進行迭代更新以最小化()。最后將優(yōu)化后的超參數(shù)代入式(10)和式(11)得到測試樣本最終的預測值和方差()。
由于高斯過程回歸在輸入訓練集較大時計算緩慢,為降低其模型回歸過程中的計算復雜度,提出采用局部高斯過程回歸方法。該方法通過引入多個局部模型,將訓練集分配到多個局部模型中進行單獨訓練,由此減少每個局部模型的數(shù)據(jù)量和總體的計算復雜度。因此,該方法可以保證模型的快速更新。
通過計算新的訓練數(shù)據(jù)與模型中心的距離,對數(shù)據(jù)進行分配,該距離可描述為
(17)
同時,設(shè)置閾值,判斷它是否屬于已有的局部模型。當數(shù)據(jù)不屬于已有的任一局部模型時,則以此數(shù)據(jù)建立新的局部模型。局部高斯過程回歸流程如圖 2所示。
圖2 局部高斯過程回歸流程
(18)
基于新型水空跨域機器人,考慮當前機器人以傾轉(zhuǎn)旋翼無人機模式進行飛行(空中懸停)的情況,通過遙控器控制機器人的飛行。機器人的輸入為其8個執(zhí)行機構(gòu)的動作量,包括4臺涵道螺旋槳的轉(zhuǎn)速(=1,2,3,4)和4臺傾轉(zhuǎn)舵機的傾轉(zhuǎn)角度(=1,2,3,4)。機器人的傳感器如IMU和GPS獲得機器人的運動狀態(tài)包括位置信息、姿態(tài)信息、速度和角速度信息等。
如圖 3所示,機器人控制模塊主要由PX-4控制板構(gòu)成,PX-4主要承擔通信、數(shù)據(jù)記錄功能,與無線遙控器實現(xiàn)通信并下發(fā)指令。同時,利用它自帶的簡單的傾轉(zhuǎn)旋翼機器人控制算法,實現(xiàn)簡單的機器人飛行控制試驗,以獲取機器人的運動狀態(tài)數(shù)據(jù)。機器人通過外接的60 V直流電源通電。
圖3 試驗平臺構(gòu)成
對于時刻,基于高斯過程的機器人動力學模型辨識有:
(19)
(20)
機器人的輸入包括執(zhí)行機構(gòu)控制量和機器人的速度和姿態(tài)等信息。同樣的,在相同的執(zhí)行機構(gòu)中控制輸入,利用第2.2節(jié)方法,獲得機器人的動力學模型。并對比相同控制輸入下的模型預測值和實際測量值。
圖4 模型預測與實際測量值對比
定義平均絕對值誤差(Mean Absolute Error,MAE)評價模型預測精度,如式(21)所示。同時,對比全局GPR和LGPR的更新時間和預測時間,評價兩種方法在計算復雜度上的區(qū)別,結(jié)果如表1所示。
表1 全局GPR和LGPR性能評價
(21)
本文作者提出了一種基于高斯過程的辨識方法,采用該方法實現(xiàn)對新型跨域機器人在空中以傾轉(zhuǎn)旋翼無人機模式下飛行的動力學模型辨識。通過試驗,對比了測量值和模型預測值,證明了該方法的有效性。該模型為跨域機器人仿真平臺及其運動控制器設(shè)計提供了參考,同時后續(xù)應(yīng)完善機器人的功能(如空中平飛和水下航行等),實現(xiàn)對機器人更多模式下的動力學模型辨識。