張藝嚴,馬巍,李彬*
1 四川大學 空天科學與工程學院,四川 成都 610065
2 航天神舟生物科技集團有限公司,北京 100086
無人機(unmanned aerial vehicle,UAV)具有高機動性、強視距(LoS)鏈路等優(yōu)點,同時不受地理環(huán)境限制,在海上通信中擁有極大的性能優(yōu)勢,可以執(zhí)行海上繪測、資源勘探、海難現(xiàn)場搜救、遠距離視頻傳輸?shù)热蝿誟1]。然而,由于無人機攜帶的能量有限,且傳遞的信息具有時效性,如何在無人機能量受限的情況下,將信息快速卸載到艦船成為當前研究的一大挑戰(zhàn)。
目前采用無人機進行海上輔助通信已經(jīng)得到了廣泛的應用[2]。蔣冰等[3]總結了海上應急通信的特點,調研了國內(nèi)外現(xiàn)有海上應急通信手段及其發(fā)展歷程,分析了中國在海上應急通信方面的不足,分別從衛(wèi)星、無人機、艦船等方面討論了海上應急通信系統(tǒng)的建設思路。芒戈等[4]提出了5G 場景下以艦船編隊為中心的無人機基站群組網(wǎng)的接入方案。隨著無人智能體研究的逐漸深入,無人機通信中軌跡規(guī)劃研究也成為一大熱點。對于無人機通信中的軌跡優(yōu)化,Zeng 等[5]研究了旋翼節(jié)能型無人機通信,考慮無人機的總能量消耗最小,為滿足多個地面用戶的通信吞吐量需求,利用凸優(yōu)化技術尋求最優(yōu)的懸停位置、持續(xù)時間、位置之間的訪問順序和速度。Huang 等[6]提出了一種無人機信息采集與傳輸?shù)能壽E優(yōu)化設計方案,在路徑增益、信道容量和小區(qū)覆蓋性能構成的指標集下使用凸優(yōu)化方法確定最優(yōu)路徑點。隨后根據(jù)生成的最優(yōu)路徑點,使用運動規(guī)劃算法有效縮短了無人機執(zhí)行不同任務時的飛行時間。Wu 等[7]研究了多UAV 的無線通信系統(tǒng),采用多UAV 空中基站為地面用戶提供服務,通過優(yōu)化多用戶通信的調度,將無人機軌跡和功率控制關聯(lián),最大化所有地面用戶的最小吞吐量。然而上述文獻只考慮了無人機平飛情況下的通信問題,并沒有對無人機的動力學性能進行深入分析研究。
近年來學者們開始關注艦船與無人機之間的通信問題。Ji 等[8]分析了艦對空數(shù)據(jù)鏈路通信模型和無人機對空干擾模型,提出了一種基于S-TK仿真軟件的通信對抗仿真方法,為無人機指揮員提供通信對抗決策依據(jù)。Tang 等[9]使用旋翼無人機進行海上覆蓋增強,采用非正交多址接入技術,討論了聯(lián)合功率和傳輸持續(xù)時間分配問題,在考慮了船上通信能量限制的情況下,最大限度地提高船舶吞吐量。
現(xiàn)有文獻中的無人機通信場景通常采用旋翼無人機,其特點是在固定位置上空懸停,可以進行更靈活的軌跡設計,但能量消耗更多。而固定翼無人機有更強的負載能力、更高的速度和更長的續(xù)航時間,但無法像旋翼無人機一樣懸停在空中。因此,旋翼無人機使用更靈活,固定翼無人機則更適用于長期通信或環(huán)境監(jiān)測。此外,固定翼無人機的飛行控制總體上更復雜,學者們普遍認為固定翼無人機的軌跡規(guī)劃比旋翼無人機更具挑戰(zhàn)性[10]。在對無人機航跡建模時,通常將無人機設定為固定高度,未考慮其完整的動力學性能,在二維平面上進行軌跡優(yōu)化,建立通用的位置、速度、加速度運動學模型。
針對無人機與艦船通信的場景,艦船在海面航行時,受海浪和雷達等因素影響,艦船位置獲取精度偏低。因此在艦船位置信息存在誤差的條件下對無人機軌跡進行優(yōu)化更貼合實際場景。為此,本文將采用固定翼無人機的三維動力學模型,對無人機與存在位置信息誤差的艦船輔助通信過程中的無人機軌跡進行優(yōu)化。將無人機的實際操縱力視為無人機動力學模型的輸入。利用現(xiàn)代控制理論中的狀態(tài)空間模型概念,將無人機耗時最小化問題表述為受狀態(tài)約束的最優(yōu)控制問題,同時受到飛行速度、高度和飛行路徑角的實際約束。由于優(yōu)化變量和狀態(tài)約束本質上都是無限維的,因此將提出基于hp 自適應Radau 偽譜法的軌跡優(yōu)化方法,并通過仿真驗證該方法的有效性。
研究場景如圖1 所示,無人機在目標點進行數(shù)據(jù)采集后,返回艦船進行數(shù)據(jù)卸載。艦船在海面航行時,在海浪、雷達等因素影響下,其位置信息可能存在誤差。本文主要設計目標是通過優(yōu)化能量受限無人機的軌跡來最小化無人機的任務時間,同時滿足無人機與艦船卸載的最小信息量,使無人機在能量消耗殆盡之前以最短時間前往岸邊充電樁進行充電。
圖1 無人機與艦船通信場景Fig. 1 Communication scene between UAV and ship
忽略迎角、發(fā)動機安裝角以及側滑力,將無人機速度、角速度和各外力的投影式通過坐標系轉換,得到航跡坐標系下的動力學方程組[11]:
式中:V為無人機飛行速度; χ,γ分別為無人機飛行的偏航角和爬升角;T,D分別為無人機的推力與阻力;L為無人機升力; μ為滾轉角;m為無人機質量;g為重力加速度常數(shù)。根據(jù)無人機空氣動力學[10],考慮無人機低速飛行,阻力D=ρV2SCD0,其中 ρ為空氣密度,S為機翼面積,CD0為無人機零升阻力系數(shù)。
將飛行速度投影到地面坐標系,通過坐標系轉換,得到無人機空間位置隨時間的變換規(guī)律:
式中:q=[x,y]T,為無人機水平坐標;h為無人機飛行高度。
根據(jù)式(1)和式(2),建立如式(3)所示的固定翼無人機三維模型[12]。
式中,n=L/mg,為無人機過載系數(shù)。
通過式(3)可以看出,固定翼無人機模型中存在很多分式,這使得其在求解問題中難以處理,為此做如下轉換,令
式中,u1,u2,u3分別為飛行加速度、偏航角變化率和爬升角變化率。這樣,系統(tǒng)實際控制量可以由u=[u1,u2,u3]T反推得到
通過式(3)和式(4),無人機飛行狀態(tài)和虛擬控制量x=[x,y,h,V,χ,γ]T,u=[u1,u2,u3]T,得到無人機的狀態(tài)空間表達式為
實際情況下,艦船受到海浪等因素影響,難以得到艦船的準確位置信息。為此,需要建立帶有坐標估計誤差的信道模型。
為簡化處理,將艦船視為質點,通過運動學方程得到如式(7)所示的艦船運動模型[13]。
其中, ηp為誤差容限。這樣,可以得到
式中, ?為所有可能的G的集合,即半徑為 ηp的圓域。
式中:B為信道帶寬;S為平均信號功率;N為平均噪聲功率;S/N為信噪比(SNR),通常以分貝表示,分貝數(shù)轉換為1 0lg(S/N) dB。
假設時變信道遵循自由空間路徑損耗模型,無人機與艦船信道系數(shù)可以表示為
式中, β0為 參考距離d0=1 m處的信道功率。假設Pmax為無人機的最大傳輸功率,可得
結合無人機坐標誤差,可以將無人機飛行過程中與艦船之間最差情況的總通信量表示為
式中,tf為無人機執(zhí)行任務的總時間。
在與艦船進行通信過程中,無人機應在能量消耗殆盡前以最短時間前往岸上充電樁充電,因此需要建立無人機能量模型,確定無人機所能攜帶的最大能量。
無人機在飛行過程中主要受到4 個力的影響,即無人機發(fā)動機所產(chǎn)生的推力T,受到空氣動力與力矩影響產(chǎn)生的升力L與 阻力D,以及無人機包括機身以及所有負載在內(nèi)的重力mg。
由于固定翼無人機發(fā)動機能耗遠遠大于通信所損失能量,因此,可以將能量模型表示為[15]
式中:x4為 無人機速度;x6為無人機爬升角。
根據(jù)建立的固定翼無人機動力學模型、信道模型、能量模型,進一步考慮無人機的實際性能等約束條件,將無人機與移動艦船通信中的軌跡優(yōu)化問題建模為一個帶有狀態(tài)約束的最優(yōu)控制問題。
2.1.1 等式約束
考慮到無人機能量受限,需要前往岸邊充電樁進行充電,因此為無人機添加如下終端等式約束:
式中: (xt f,yt f,ht f)為岸邊充電樁位置上空坐標,即
x(tf)y(tf)z(tf)無人機任務終點; , , 為位置信息終端項。
2.1.2 不等式約束
考慮到無人機自身的性能問題以及安全問題,需要添加如式(16)所示的不等式約束。
根據(jù)無人機自身機動性能的影響,需滿足最小速度Vmin以及最大速度Vmax,為保證無人機的安全,設置無人機最低安全高度為hmin, γmin和 γmax分別為無人機的最小爬升角和最大爬升角。無人機需要滿足的總通信量約束和自身最大可消耗能量約束可以寫為
為方便后續(xù)問題的建立,將式(16)和式(17)不等式約束統(tǒng)一表示為
2.1.3 控制量約束
對于無人機模型中的控制量,即無人機的加速度、偏航角變化率以及爬升角變化率,設置如式(19)所示的約束。
式中, [u1min,u2min,u3min]和 [u1max,u2max,u3max]分別為在飛行過程中無人機的加速度、偏航角變化率以及爬升角變化率的最小值和最大值。
海域面積遼闊,無人機與艦船通信時需要對能量、時間等指標進行優(yōu)化,本文將能量作為約束,以最小化通信任務時間為目標,提出軌跡優(yōu)化方法。根據(jù)推導的無人機動力學模型式(6)、信道模型式(13)、能量模型式(14)和2.1 節(jié)建立的約束,將所要解決的時間最小化軌跡規(guī)劃問題轉換為一個帶有等式約束和不等式約束的最優(yōu)控制問題P1。
式中:(x0,y0,h0) 為無人機的初始位置坐標;v0, χ0,γ0為無人機速度、航向角、爬升角的初始值。
根據(jù)離散變量的不同,可以將直接求解最優(yōu)控制問題的方法分為3 類。第1 類方法只對控制量進行離散,而狀態(tài)是連續(xù)的,將每步求得的控制變量對動力學系統(tǒng)進行積分來更新狀態(tài)和約束,如同控制參數(shù)化的方法一樣[13]。第2 類方法則同時離散狀態(tài)變量和控制變量,如配點法,將動力學約束在一系列配點上進行配置,用代數(shù)約束取代微分約束[16]。第3 類方法是只離散狀態(tài)變量的微分包含法,通過求解部分狀態(tài)方程消除控制變量,并將剩余的狀態(tài)方程進行離散,優(yōu)化變量則只剩下狀態(tài)變量序列。偽譜法是配點法中的一種,通過使用數(shù)值微分來近似導數(shù)項,并基于Lagrange 插值全局近似或者局部近似[17];而普通配點法采用數(shù)值積分或有限差分法得到微分方程。本文采用基于hp 自適應Radau 偽譜法的求解方法,該方法具有收斂域寬、求解速度快,且不會對初值估計過度依賴等優(yōu)點[18]。
Radau 偽譜法是一種正交配置方法,與Gauss偽譜法或Lobatto 偽譜法相比,其在區(qū)間切換點的狀態(tài)變量連續(xù)性條件x()=x()的實現(xiàn)上更具優(yōu)勢[19]。Radau 偽譜法在Legendre-Gauss-Radau(LGR)配置點上的每個網(wǎng)格區(qū)間中離散狀態(tài)和控制變量,從而將動態(tài)方程轉換為代數(shù)約束,將原始問題轉化為非線性規(guī)劃問題(NLP)。具體步驟如下:
1)時間區(qū)間轉換。通過將無人機飛行任務中所需要的通信時間t∈[t0,tf],分為N份網(wǎng)格區(qū)間 [tn-1,tn),n=1,2,···,N,其中tN=tf。那么,在每個網(wǎng)格區(qū)間內(nèi),時間都可以由 ζ ∈[-1,1)表示:
2) LGR 配點選擇。在每個網(wǎng)格區(qū)間內(nèi)選,通過求解下列Kn階勒讓德方程得到配點
其中,
3) 狀態(tài)和控制變量離散化。額外增加ζ=1的配點,代表每個網(wǎng)格區(qū)間的狀態(tài)終端值。通過Lagrange 多項式對連續(xù)的狀態(tài)和控制量進行插值近似離散化,可得
式中:xn(ζ),un(ζ)為 連續(xù)的狀態(tài)和控制量;Xn(ζ)和Un(ζ)為 離散后的狀態(tài)和控制量;Li(ζ)為Lagrange多項式基式。
4) 動態(tài)方程轉換。由式(24),狀態(tài)變量對 ζ的導數(shù)為
進而,式(6)的狀態(tài)空間表達式可以轉化為如式(26)所示的代數(shù)約束。
5) 約束近似化。首先將問題P1中的等式約束W以及不等式約束ga表示為
代入近似后的狀態(tài)以及控制量,約束可以近似為
經(jīng)過上述步驟,將無人機執(zhí)行任務時間最小化的軌跡優(yōu)化問題轉化為一個非線性規(guī)劃問題,從而可以通過基于梯度的非線性規(guī)劃求解器來提高計算效率。
基于上述步驟,對連續(xù)時間變量進行插值離散近似,還需評估離散化后的誤差。在第n個時間區(qū)間內(nèi)選取每2 個配點的中心位置,即
3) 繼續(xù)細分網(wǎng)格區(qū)間,其子區(qū)間個數(shù)為Ir:
式中:ceil(α)為 在 α增 大的方向取整; τ為定義的誤差閾值。令r=r+1,返回第1)步。
4) 增大網(wǎng)格區(qū)間內(nèi)的配點個數(shù)Kn,新的配點個數(shù)為
令n=n+1,返回第1)步。
將基于hp 自適應Radau 偽譜法的算法流程總結如下:
步驟1) 初始化配點個數(shù)及網(wǎng)格區(qū)間數(shù)為K0。
步驟2) 應用SQP 算法求解Radau 偽譜法轉化后的非線性規(guī)劃問題。
步驟3) 計算每個網(wǎng)格區(qū)間的誤差矩陣 ε,判斷其是否超過閾值 σmax, 如果超過 σmax,則轉至步驟 4);如果每個網(wǎng)格區(qū)間誤差 ε都小于閾值,則結束求解,輸出最優(yōu)解,算法流程結束。
步驟4) 計算當前網(wǎng)格區(qū)間平均曲率cˉn,與最大曲率偏差值比較,若cn≥C*,則根據(jù)式(32) 繼續(xù)細分該網(wǎng)格,否則按照式(33) 增加該區(qū)間配點數(shù);所有網(wǎng)格更新后返回步驟2)。
本文采用的是固定翼無人機,其相關參數(shù)如表1 所示[20]。
表1 固定翼無人機參數(shù)Table 1 Parameters of fixed-wing UAV
設置通信帶寬B=1 MHz,對應的噪聲功率σ2=N0B=-110 dBm,假設無人機的傳輸功率P=10 dBm, 并且參考信道功率 β0=-50 dB,因此可以得到無人機信噪比 為30 dB,假設坐標誤差為η=40。
假設無人機初始位置為(0 m,0 m,100 m),終點岸上充電樁位置為(1 000 m,1 000 m,100 m)。艦船初始位置為(0 m,1 000 m,0 m),速度Vp=6 m/s, 航向角 θ=0,即考慮其勻速直線運動。本文考慮5 個場景:無能量約束的時間最小化場景(圖2),帶能量約束的時間最小化場景(圖3),考慮更多通信吞吐量的帶能量約束時間最小化場景(圖4~圖6),二維與三維優(yōu)化對比場景(圖7 和表2),hp 自適應Radau 偽譜法與p 偽譜法效果對比場景(表3)。
圖2 場景1:無能量約束最小吞吐量800 Mbit 時無人機與艦船軌跡Fig. 2 Scene one: UAV and ship trajectory with a minimum throughput of 800 Mbit without energy constraints
圖3 場景2:帶能量約束最小吞吐量800 Mbit 時無人機與艦船軌跡Fig. 3 Scene two: UAV and ship trajectory with a minimum throughput of 800 Mbit and energy constraints
圖4 場景3:帶能量約束最小吞吐量1 000 Mbit 時無人機與艦船軌跡Fig. 4 Scene three: UAV and ship trajectory with a minimum throughput of 1 000 Mbit and energy constraints
圖5 無人機飛行高度變化曲線Fig. 5 Flying height variation curve of UAV
圖6 無人機與艦船通信的能量消耗與耗時Fig. 6 Energy and time consumption for communication between UAV and ship
圖7 場景4:帶能量約束最小吞吐量800 Mbit 無人機二維飛行與艦船軌跡Fig. 7 Scene four: UAV 2D flight and ship trajectory with a minimum throughput of 800 Mbit and energy constraints
表2 無人機二維飛行與三維飛行時間對比Table 2 Comparison of 2D and 3D flight time of UAV
場景1:不考慮無人機的能量限制,假設無人機與艦船之間的最小總吞吐量為800 Mbit,無人機與艦船軌跡如圖2 所示。無人機可以從起點飛往終點,在通信過程中可以很好地跟隨移動艦船的軌跡進行通信。不難看出,為了在優(yōu)化的同時滿足與艦船之間的最小通信吞吐量,無人機從起點出發(fā),首先快速接近目標點,隨后沿著艦船行駛軌跡進行通信。由于無人機速度比艦船速度快,無人機會在移動艦船的上空進行盤旋通信,在完成通信任務量的同時快速前往岸上充電樁。通過無人機信道模型式(13)可以發(fā)現(xiàn),無人機與艦船之間的距離越近,通信速率越大。與旋翼無人機不同,固定翼無人機無法懸停,所以采用盤旋方式與艦船進行通信。
場景2:考慮無人機的能量限制,假設無人機所能攜帶的最大能量為10 000 J,無人機與艦船之間的最小總吞吐量仍為800 Mbit,無人機與艦船軌跡如圖3 所示。無人機仍舊可以從起點飛往終點,但為了節(jié)省能量消耗,軌跡與場景1 有所不同。通過對比圖2(b)與圖3(b)可以發(fā)現(xiàn),當限制無人機的能量消耗后,無人機的軌跡盤旋曲線更加平穩(wěn),不會出現(xiàn)急轉彎的情況,角度也不會短時間內(nèi)發(fā)生劇烈變化,這樣的飛行方式使無人機在與艦船通信的過程中更加節(jié)省能量。
場景3:無人機與艦船之間通信的最小吞吐量增加至1 000 Mbit,兩者的通信軌跡如圖4 所示。無人機仍可以從起點飛往終點,但是其軌跡與場景1 和場景2 有顯著不同。可以看到,無人機與艦船的軌跡有一段重合。這是因為雖然相比場景2 僅僅增加了最小吞吐量,但是無人機最大能耗沒有改變;為了保證無人機自身的能量消耗,其會以一個較低的速度跟隨艦船通信,并減少盤旋所帶來的能量消耗;與場景2 相比,其代價是增加了與艦船通信任務的耗時。
場景1~場景3 的無人機在與艦船通信過程中的高度變化如圖5 所示,可以發(fā)現(xiàn),無人機在任務開始時都會快速下降到最低高度。這與所建立的信道模型相符,因為艦船位于海面,高度越低,距離艦船越近,通信效率也會越高,可以大幅度減少通信耗時。
圖6 為場景1~場景3 的無人機與艦船通信過程中的能耗與時間對比圖,圖中紅色橫線為設置的約束條件。在無能量約束情況下,無人機的能耗最高,但耗時最短。在增加能量約束后,隨著與艦船之間最小吞吐量的增加,無人機與艦船通信的耗時會隨之增多,這是因為無人機需要耗費更多時間在艦船上方進行通信。而在增大最小吞吐量后,為同時考慮能量限制,任務耗時會明顯增加。通過上述3 個場景的研究,本文方法為有能量限制的無人機與艦船通信任務時間最小化軌跡優(yōu)化問題提供了一個有效的解決方案。
場景4:研究無人機的三維運動軌跡,將無人機二維模型與三維模型的飛行軌跡進行對比。圖7 所示為無人機高度固定在100 m 與海上移動艦船通信時的飛行軌跡,表2 給出了在最小通信總吞吐量800 Mbit,能量限制為10 000 J 情況下無人機通信任務的耗時。可以看到,無人機三維飛行耗時更短。這一實驗結果表明,固定翼無人機的時間最小化軌跡通常是三維的。
場景5:采用hp 自適應Radau 偽譜法進行求解,并與p 偽譜法結果對比。相比于本文方法的更新策略,p 偽譜法不會根據(jù)每次求得的狀態(tài)變量軌跡曲線的最大曲率比選擇不同策略,而是在每次誤差不滿足要求時,直接選擇細分網(wǎng)格區(qū)間,通過不斷增加區(qū)間個數(shù),將問題最終收斂到一個局部最優(yōu)解。假設無人機與艦船之間的最小總吞吐量為800 Mbit,且最大攜帶能量為10 000 J,表3 給出了2 種方法優(yōu)化得到的飛行時間和迭代次數(shù)??梢园l(fā)現(xiàn),本文方法得到的飛行時間僅略高于p 偽譜法幾秒,但在迭代次數(shù)上遠遠小于p 偽譜法,大大節(jié)省了求解時間。
表3 不同方法飛行時間與迭代次數(shù)對比Table 3 Comparison of flight time and iteration times of different methods
本文研究了具有能量限制的固定翼無人機與艦船三維通信場景,考慮到海面眾多因素導致艦船坐標的不確定性,討論了無人機與存在坐標估計誤差的移動艦船的通信問題,并選取無人機通信任務時間作為優(yōu)化目標,優(yōu)化無人機與移動艦船通信中的三維軌跡。與大多數(shù)現(xiàn)有設計不同之處在于,由于引入了無人機的動力學性能,本文方法同時優(yōu)化了無人機的軌跡和控制輸入。因此,采用本文方法優(yōu)化的軌跡在實際應用中更易跟蹤。但要解決該最優(yōu)控制問題,仍存在許多挑戰(zhàn),為此采用hp 自適應偽譜法將無人機通信中的軌跡優(yōu)化問題轉換為非線性規(guī)劃問題。通過仿真實驗驗證,無人機在滿足自身能量約束與飛行性能約束的情況下,可以滿足海上移動艦船與無人機之間的最小通信總吞吐量,說明本文方法可以有效解決有能量限制的無人機與艦船通信任務時間最小化軌跡優(yōu)化問題,為海上通信系統(tǒng)提供有效的解決方案。
現(xiàn)有固定翼無人機動力學數(shù)學模型的研究主要集中在三自由度質點模型方面,這對于實際無人機來說不夠精確。在后續(xù)研究中,可以對六自由度剛體模型進行深入研究。此外,本文考慮的場景為單無人機與單艦通信場景,未來可以對多無人機群或艦隊通信場景作進一步研究。