趙琳, 王碩, 郝勇, 劉源
哈爾濱工程大學(xué) 自動化學(xué)院, 哈爾濱 150001
基于能量最優(yōu)的敏捷遙感衛(wèi)星在軌任務(wù)規(guī)劃
趙琳, 王碩, 郝勇*, 劉源
哈爾濱工程大學(xué) 自動化學(xué)院, 哈爾濱 150001
針對敏捷遙感衛(wèi)星對多個離散觀測點在軌自主任務(wù)規(guī)劃問題,在考慮姿態(tài)運動方程耦合性的基礎(chǔ)上,將問題分解為空間資源調(diào)度問題和連續(xù)最優(yōu)控制問題,進而提出了一種結(jié)合偽譜法和遺傳算法的混合求解算法。該算法針對基于行商問題(TSP)模型建立的空間資源調(diào)度問題模型,選用二維編碼結(jié)構(gòu)對觀測順序和相對觀測時間進行實數(shù)編碼,并采用遺傳算法求解觀測序列和觀測時間;針對判斷觀測時間可行性時涉及的時間最優(yōu)控制問題、以及姿態(tài)轉(zhuǎn)移過程中涉及的最小能量消耗問題,將其歸結(jié)為連續(xù)最優(yōu)控制問題,并基于Gauss偽譜協(xié)態(tài)變量映射定理,采用Gauss偽譜法進行求解。通過與基于單純遺傳算法的規(guī)劃算法進行對比試驗,本文所提出的基于偽譜法和遺傳算法的混合求解策略針對目標問題,在典型工況下姿態(tài)轉(zhuǎn)移過程中能量消耗降低60%。
行商問題(TSP); 能量消耗; 時間最優(yōu); 遺傳算法; Gauss偽譜法
相比于傳統(tǒng)的成像衛(wèi)星,敏捷遙感衛(wèi)星具有姿態(tài)快速機動的能力[1]?;诿艚葸b感衛(wèi)星的敏捷快速機動能力,敏捷遙感衛(wèi)星具有更大的觀測范圍和更強的觀測能力。目前成像衛(wèi)星的運動多是在管控模式下完成的,管控模式是指地面控制系統(tǒng)根據(jù)任務(wù)需求對衛(wèi)星的運動狀態(tài)進行規(guī)劃并向衛(wèi)星發(fā)射控制指令,但是由于信道占用、通信延遲、時間窗口等限制因素,衛(wèi)星無法在短時間內(nèi)對動態(tài)的觀測任務(wù)需求做出響應(yīng),因此,針對敏捷遙感衛(wèi)星敏捷機動的特點,傳統(tǒng)的管控模式不能充分發(fā)揮敏捷遙感衛(wèi)星的觀測效能。因此為了解決上述問題,基于觀測任務(wù)需求和衛(wèi)星自身資源能力的敏捷遙感衛(wèi)星在軌自主規(guī)劃是十分必要的[2-4]。
針對敏捷遙感衛(wèi)星對地觀測任務(wù)規(guī)劃問題,Gabrel等[5-6]提出了圖論問題模型,將任務(wù)規(guī)劃問題表示成一個加權(quán)有向無環(huán)圖G,并將G的路徑作為問題的解,但是對于區(qū)域觀測或立體觀測等復(fù)雜約束則無法在該模型中體現(xiàn);Vasquez和Hao[7]提出背包問題模型,以簡單的形式表示任務(wù)規(guī)劃問題的約束,但是該模型不適用于多星任務(wù)規(guī)劃問題;Bensana等[8]提出線性整數(shù)規(guī)劃模型,該模型可以描述所有線性約束,但是不能有效處理非線性約束,且其求解效率隨著問題規(guī)模的增加而降低;Lemaitre 等[9]提出約束滿足問題模型,能有效地處理線性和非線性約束,增強問題描述的完整性,但是該模型的求解效率低;Verfaillie等[10]提出序貫決策模型,采用決策理論處理問題中的不確定因素,但是模型復(fù)雜度隨著問題約束的增加而增加;賀仁杰[11]提出了具有時間約束的并行機制調(diào)度問題模型,將問題中的衛(wèi)星和觀測任務(wù)分別映射為機器和工件,并將觀測任務(wù)的總收益作為調(diào)度目標?;谏鲜瞿P?,在對對地觀測任務(wù)規(guī)劃問題進行求解中,Lemaitre等[9]采用動態(tài)規(guī)劃算法對衛(wèi)星對地觀測任務(wù)規(guī)劃問題進行求解,但是當(dāng)問題規(guī)模較大時,其求解時間過長;Xhafa[12]和Wolfe[13]等采用遺傳算法(Genetic Algorithm, GA)對問題進行求解并與優(yōu)先級調(diào)度構(gòu)造算法進行比較,結(jié)果表明遺傳算法可以大幅度地提高問題求解速度;Cordeau[14]、陳英武[15]和Sarkheyli[16]等采用禁忌搜索算法對問題進行求解,其中,文獻[15-16]在采用禁忌算法的同時也考慮了轉(zhuǎn)移時間約束;Wu等[17]采用模擬退火算法將任務(wù)目標均假設(shè)為點目標,進而對問題進行求解;賀仁杰等[4,11]采用禁忌與列生相結(jié)合算法,增強任務(wù)規(guī)劃問題的魯棒性。
目前,由于衛(wèi)星上燃料資源的限制,基于能量最優(yōu)的敏捷遙感衛(wèi)星在軌自主規(guī)劃成為研究熱點。能量最優(yōu)問題實質(zhì)是最優(yōu)控制問題,針對最優(yōu)控制問題,劉富鈺[18]和Kusuda[19]等根據(jù)遺傳算法等智能算法對問題進行求解,但是智能算法求出的最優(yōu)解具有隨機性,和真正最優(yōu)解之間存在誤差;張秋華等[20]基于龐德里亞金極小值原理將最優(yōu)控制問題轉(zhuǎn)換為一個Hamilton邊值問題(Hamilton Boundary Value Problem, HBVP),但是利用該算法推導(dǎo)一階最優(yōu)條件與橫截條件過程繁瑣,且對未知條件的初值難以準確估計;文獻[21-26]采用偽譜法對最優(yōu)控制問題進行求解。文獻[18,24-25]根據(jù)固定時間姿態(tài)機動的任務(wù)需求,以姿態(tài)機動消耗能量最小為優(yōu)化指標,只考慮了固定起止時間、固定起止姿態(tài)一次姿態(tài)機動的能量最優(yōu)控制,因此上述3類最優(yōu)控制問題的求解方法,對于基于能量最優(yōu)的敏捷遙感衛(wèi)星在軌自主規(guī)劃問題的求解存在局限性。
針對上述局限性,本文基于行商問題(Travelling Salesman Problem, TSP)模型建立了多觀測點在軌自主任務(wù)規(guī)劃問題的數(shù)學(xué)模型,在考慮姿態(tài)運動學(xué)方程耦合性的基礎(chǔ)上,將問題分解為空間資源調(diào)度問題和連續(xù)最優(yōu)控制問題,并提出了基于偽譜法和遺傳算法的混合求解策略。針對任務(wù)層面的空間資源調(diào)度問題,采用遺傳算法求解;針對規(guī)劃層面的連續(xù)最優(yōu)控制問題采用Gauss偽譜法求解,進而使得單顆敏捷遙感衛(wèi)星在固定觀測時間區(qū)域內(nèi)實現(xiàn)對多個地面靜止離散觀測點的完全觀測,并且在整個完全觀測過程中衛(wèi)星姿態(tài)機動所消耗的能量最小。
1.1 衛(wèi)星姿態(tài)機動的運動方程
1) 基于修正的羅德里格斯參數(shù)(Modified Rodrigues Parameters, MRP)的運動方程
衛(wèi)星姿態(tài)動力學(xué)方程[27]為
(1)
(2)
采用MRP表示衛(wèi)星運動姿態(tài)為σ,則衛(wèi)星的非線性運動學(xué)方程[28]為
(3)
(4)
式中:I3為3×3的單位矩陣。
2) 基于MRP的誤差運動方程
σe和ωe分別表示衛(wèi)星的姿態(tài)誤差、角速度誤差,誤差動力學(xué)方程和誤差運動學(xué)方程分別為
(5)
(6)
(7)
1.2 能量最優(yōu)的多觀測點在軌自主任務(wù)規(guī)劃描述
基于能量最優(yōu)的單顆敏捷遙感衛(wèi)星對地面多離散觀測點進行在軌自主任務(wù)規(guī)劃滿足以下幾點假設(shè):
1) 衛(wèi)星運行軌道固定。
2) 地面觀測點為離散靜止觀測點。
3) 完成觀測任務(wù)的時間區(qū)間和起始時間固定。
多觀測點任務(wù)規(guī)劃是軌道固定的單顆敏捷遙感衛(wèi)星在固定時間區(qū)域內(nèi)對多個地面靜止觀測點實現(xiàn)完全觀測的空間資源調(diào)度優(yōu)化問題,其實質(zhì)是TSP。
TSP的一般性描述為[29]:已知n個城市和n個城市間的距離,一位旅行商要找到一條能夠訪問所有n個城市,且除第一個被訪問的城市外其余每個城市只被訪問一次,最終回到第一個城市的路線,并使得該路線的長度最短,或表述為在有n個結(jié)點的完全圖中找出最短的Hamilton回路。
基于能量最優(yōu)的單顆敏捷遙感衛(wèi)星對地面多觀測點進行在軌自主任務(wù)規(guī)劃問題描述為:已知n個地面靜止觀測點,單顆敏捷遙感衛(wèi)星從規(guī)定的起始時間開始以星載相機視軸指向星下點的初始姿態(tài)在固定的時間區(qū)域內(nèi)完成對n個地面靜止觀測點的完全觀測,且每個地面靜止觀測點僅被觀測一次,并最終回歸星載相機視軸指向星下點的姿態(tài),使得該姿態(tài)轉(zhuǎn)移過程中敏捷遙感衛(wèi)星所消耗的能量最低。
1.3 能量最優(yōu)的多觀測點在軌自主任務(wù)規(guī)劃模型
根據(jù)1.2節(jié)中能量最優(yōu)的多觀測點在軌自主任務(wù)規(guī)劃描述,基于能量最優(yōu)的多觀測點在軌自主任務(wù)規(guī)劃問題與TSP的映射關(guān)系如下:
1) 觀測姿態(tài)對應(yīng)TSP中的城市
軌道信息、任務(wù)順序序列中第i個地面靜止觀測點信息及其對應(yīng)的觀測時間點共同決定了衛(wèi)星觀測任務(wù)順序序列中第i個觀測點的姿態(tài),因此衛(wèi)星觀測任務(wù)順序序列中第i個地面靜止觀測點的姿態(tài)可以表示成軌道、地面靜止觀測點、時間的函數(shù),表達式為
aηi=φ(o,Oηi,Tηi)
(8)
式中:ηi為任務(wù)順序序列的第i個任務(wù);o表示軌道信息;Oηi表示任務(wù)順序序列中第i個地面靜止觀測點信息;Tηi表示衛(wèi)星觀測任務(wù)順序序列中第i個觀測點的時間點;aηi表示衛(wèi)星觀測任務(wù)順序序列中第i個觀測點的姿態(tài)。
由于軌道在完全觀測過程中始終固定,即軌道信息為定值,因此姿態(tài)函數(shù)可以表示為觀測點信息和時間的函數(shù),式(8)可以簡化為
aηi=φ(Oηi,Tηi)
(9)
當(dāng)軌道信息、地面靜止觀測點及其對應(yīng)的觀測時間點確定時,衛(wèi)星對應(yīng)的觀測姿態(tài)確定,確定的觀測姿態(tài)a對應(yīng)TSP中的城市c。映射關(guān)系為
a→c
(10)
2) 姿態(tài)間機動能耗對應(yīng)城市間距離
衛(wèi)星從一個觀測姿態(tài)到另一個觀測姿態(tài)機動時所消耗的能量對應(yīng)城市間距離,映射關(guān)系為
E(aηi-1,aηi)→d(cγi-1,cγi)
(11)
(12)
式中:E(aηi-1,aηi)為衛(wèi)星從觀測任務(wù)順序序列中第i-1個觀測點的姿態(tài)機動到觀測任務(wù)順序序列中第i個觀測點的姿態(tài)所消耗的能量;C=[c1c2…cn](i=1,2,…,n)為TSP中的所有城市;γi為訪問城市序列的第i個城市;d(cγi-1,cγi)為城市cγi-1到城市cγi的距離。
將式(9)代入式(11)可得
E(φ(Oηi-1,Tηi-1),φ(Oηi,Tηi))→d(cγi-1,cγi)
(13)
基于上述映射關(guān)系,基于能量最優(yōu)的單顆敏捷遙感衛(wèi)星對地面多個離散觀測點進行在軌自主任務(wù)規(guī)劃的數(shù)學(xué)模型具體描述如下。
求得一個最優(yōu)任務(wù)順序序列和時間序列,分別表示為R=[η1η2…ηn]和T=[Tη1Tη2…
Tηn],滿足如下目標函數(shù):
φ(Oηi,Tηi))+E(as,φ(Oη1,Tη1))+
E(φ(Oηn,Tηn),at)
(14)
s.t.
Ts (15) Tt (16) 式中:as為衛(wèi)星在起始時間星載相機視軸指向星下點的初始姿態(tài);E(as,φ(Oη1,Tη1))為衛(wèi)星從規(guī)定的起始時間開始以星載相機視軸指向星下點的初始姿態(tài)機動到衛(wèi)星觀測任務(wù)順序序列中第一個地面靜止觀測點對應(yīng)的姿態(tài)所消耗的能量;Tt為衛(wèi)星實現(xiàn)對多地面觀測點完全觀測的結(jié)束時刻;at為衛(wèi)星在Tt時刻星載相機視軸指向星下點的終止姿態(tài);E(φ(Oηn,Tηn),at)為衛(wèi)星觀測任務(wù)順序序列中最后一個地面靜止觀測點對應(yīng)的姿態(tài)機動到星載相機視軸指向星下點的終止姿態(tài)所消耗的能量;Ts為固定時間區(qū)域的起始時間;Te為固定時間區(qū)域的終止時間。 TSP是NP(Non-deterministic Polynomial)問題,本文涉及的多觀測點在軌自主規(guī)劃問題同樣也屬于NP問題。TSP在求解過程中只涉及訪問順序,若設(shè)置需要訪問的城市數(shù)目為n,則所有訪問順序的組合數(shù)為(n-1)!/2,其對應(yīng)的找到最優(yōu)解的時間復(fù)雜度的數(shù)量級為O(n!)。而對于多觀測點在軌自主任務(wù)規(guī)劃問題,根據(jù)其目標函數(shù)式(14),可知其求解過程既包括觀測順序又包括觀測時間。若設(shè)置需要觀測的目標數(shù)目為n,則所有訪問順序的組合數(shù)為(n-1)!/2,所有觀測時間的組合為(n-1)!/2,則其對應(yīng)的找到最優(yōu)解的時間復(fù)雜度的數(shù)量級為O((n!)2),可以看出其求得最優(yōu)解的時間復(fù)雜度是傳統(tǒng)TSP的n!倍,其求解難度成平方型增長。 針對第1節(jié)提出的基于能量最優(yōu)的多觀測點在軌自主任務(wù)規(guī)劃的數(shù)學(xué)模型,其目標函數(shù)是關(guān)于時間的函數(shù),因此,軌道固定的單顆敏捷遙感衛(wèi)星在固定時間區(qū)域內(nèi)對多個地面靜止觀測點實現(xiàn)完全觀測的空間資源調(diào)度優(yōu)化問題是一個具有時間依賴性的調(diào)度問題。問題的求解不但與地面靜止觀測點的觀測順序有關(guān),也依賴于各個地面靜止觀測點的觀測時間,同時需要保證敏捷遙感衛(wèi)星觀測任務(wù)順序序列中相鄰兩地面靜止觀測點對應(yīng)的觀測姿態(tài)間機動所消耗的能量最小,增加了TSP求解復(fù)雜性。文獻[4,9,11-17]采用智能算法對任務(wù)規(guī)劃問題進行求解時,對于轉(zhuǎn)換時間約束的處理過于工程化,其轉(zhuǎn)移時間的計算只是考慮了轉(zhuǎn)移姿態(tài)與轉(zhuǎn)移平均角速度的線性比,沒有考慮衛(wèi)星實際運行過程中角加速度呈上升和下降趨勢分布的實際機理,不能保證轉(zhuǎn)換時間是最優(yōu)的,進而導(dǎo)致任務(wù)規(guī)劃結(jié)果不一定是最優(yōu)的,因此,為增強任務(wù)規(guī)劃結(jié)果的合理性,在處理轉(zhuǎn)換時間約束時,考慮衛(wèi)星從一個觀測姿態(tài)機動到另一個觀測姿態(tài)所需要的最小轉(zhuǎn)移時間,進而為觀測地面靜止觀測點的觀測時間點提供更大的選擇空間。 綜合問題模型的復(fù)雜性和轉(zhuǎn)換時間約束計算的合理性,傳統(tǒng)的單一智能求解方法已經(jīng)不能滿足該問題的復(fù)雜需求,因此,針對該問題的上述特點本文提出了基于偽譜法和遺傳算法的混合求解策略,其求解思路如圖1所示。 圖1 混合求解策略示意圖Fig.1 Schematic diagram of hybrid solution strategy 2.1 遺傳算法設(shè)計 1) 編碼方式設(shè)計 編碼即為解的表現(xiàn)型空間到基因型空間的映射,解碼即為解的基因型空間到表現(xiàn)型空間的映射。 敏捷遙感衛(wèi)星對多個地面靜止觀測點的觀測順序和敏捷遙感衛(wèi)星實現(xiàn)完全觀測過程中姿態(tài)機動所消耗的能量,是基于能量最優(yōu)的軌道固定的單顆敏捷遙感衛(wèi)星在固定時間區(qū)域內(nèi)對多個地面靜止觀測點實現(xiàn)完全觀測的空間資源調(diào)度優(yōu)化問題的解。 根據(jù)式(13)敏捷遙感衛(wèi)星姿態(tài)機動所耗能量可以表示為地面靜止觀測點信息和觀測時間的函數(shù),而地面靜止觀測點的選擇與敏捷遙感衛(wèi)星的觀測順序有關(guān),進而敏捷遙感衛(wèi)星姿態(tài)機動所耗能量這一表現(xiàn)型可以映射為敏捷遙感衛(wèi)星的觀測順序和觀測時間這兩個基因型。 對每一個地面靜止觀測點,在不同的任務(wù)順序序列中所處的位置不同,若對其對應(yīng)的觀測時間直接編碼,每次經(jīng)過交叉算子后,將產(chǎn)生大量觀測順序和觀測時間相悖的不可行解,降低種群多樣性,甚至一次迭代后沒有可行解,為解決這一問題,本文采用相對觀測時間代替絕對觀測時間作為基因型進行編碼。表現(xiàn)型到基因型的映射關(guān)系如圖2所示。 根據(jù)上述映射關(guān)系,本文基于觀測順序和相對觀測時間這兩個基因型對問題的解進行編碼。若采用一維編碼結(jié)構(gòu)對含有兩個基因型的解進行編碼必然會導(dǎo)致相當(dāng)數(shù)量的信息丟失,因此,本文基于實數(shù)編碼方式選用二維編碼結(jié)構(gòu)對上述兩個基因型進行編碼,染色體結(jié)構(gòu)如圖3所示。圖中:ΔTηi為任務(wù)順序序列中第i個觀測點相對第i-1個觀測點的相對觀測時間,當(dāng)i=1時,ΔTη1為第1個觀測點相對衛(wèi)星初始觀測時刻的相對觀測時間。 圖2 表現(xiàn)型和基因型的映射關(guān)系Fig.2 Mapping relationship of phenotype and genotype 圖3 染色體結(jié)構(gòu)示意圖Fig.3 Schematic diagram of chromosome structure 2) 初始種群生成 設(shè)種群大小為N,種群中的每一條染色體代表問題的一個解,根據(jù)編碼方式,隨機生成一條染色體,并判斷染色體對應(yīng)的基因型作為問題的解的可行性,直到生成種群大小的滿足可行性的染色體。 染色體觀測順序可行性檢驗準則為:任務(wù)順序序列中的基因位由1-n范圍內(nèi)的整數(shù)隨機、無重復(fù)排列。 染色體相對觀測時間可行性檢驗準則為:根據(jù)式(15),每一條染色體的相對觀測時間序列需要滿足 Ts (17) 且敏捷遙感衛(wèi)星觀測任務(wù)順序序列中第i個觀測點相對第i-1個觀測點的相對觀測時間需要大于或等于衛(wèi)星觀測任務(wù)順序序列中第i-1個觀測點對應(yīng)的姿態(tài)機動到衛(wèi)星觀測第i個觀測點對應(yīng)的姿態(tài)所需要的最小轉(zhuǎn)移時間,具體可表示為 min ΔTtrans ηi-1,ηi≤ΔTηi (18) 生成初始種群的步驟為 步驟1隨機生成任務(wù)順序序列。 步驟2判斷任務(wù)順序序列可行性,若不可行返回步驟1,若可行執(zhí)行步驟3。 步驟3隨機生成相對觀測時間序列。 步驟4判斷相對觀測時間可行性,若不可行返回步驟3,若可行執(zhí)行步驟5。 步驟5將可行的任務(wù)順序序列和相對觀測時間序列作為滿足可行性的染色體放入種群中,執(zhí)行步驟6。 步驟6計算當(dāng)前種群大小m,并判斷m與N的關(guān)系,若m=N則執(zhí)行步驟7,若m 步驟7初始種群生成結(jié)束。 3) 適應(yīng)度函數(shù)建立 適應(yīng)度函數(shù)是遺傳算法收斂性和穩(wěn)定性的重要影響因素。由于敏捷遙感衛(wèi)星的燃料有限,因此姿態(tài)機動過程中能量消耗是調(diào)度問題尋優(yōu)的重要影響因素。本文根據(jù)單顆敏捷遙感衛(wèi)星在固定時間區(qū)域內(nèi)對多地面靜止觀測點實現(xiàn)完全觀測所消耗的能量,即式(14)建立適應(yīng)度函數(shù)為 F0=1/f(R,T) (19) 式中:F0為單個染色體的適應(yīng)度函數(shù)值,F(xiàn)0越大,則染色體的能耗函數(shù)f(R,T)值越小,衛(wèi)星在整個調(diào)度過程中能量消耗最小,該染色體的性能越好,其適應(yīng)度越大。 4) 遺傳算子設(shè)計 本文設(shè)計了3個遺傳算子,分別是選擇算子、交叉算子、變異算子。 選擇算子采用精英保留策略和輪盤賭算法。該方法保留每一代種群中染色體適應(yīng)度函數(shù)值最高的,即適應(yīng)度函數(shù)值最高的染色體一定會被選擇,保證優(yōu)秀個體的基因可以遺傳到下一代;并根據(jù)每個染色體的適應(yīng)度函數(shù)值,計算該染色體在整個種群中被選中的概率和累計概率,其表示為 (20) (21) 式中:Pi為第i個染色體被選中的概率;Qi為第1個染色體到第i個染色體的累計概率。產(chǎn)生一個均勻分布的隨機數(shù)r∈(0,1),滿足Qi-1 針對TSP具有排列性質(zhì)的編碼方式,交叉算子采用部分匹配交叉算法。該方法隨機選擇兩個位置點,這兩點之間的基因位作為匹配基因片段,采用位置交換操作交換這兩段匹配基因片段的內(nèi)容,交換匹配基因片段后,若匹配基因片段區(qū)域外出現(xiàn)訪問重復(fù),則按照匹配基因片段區(qū)域內(nèi)對應(yīng)的位置映射關(guān)系逐一進行交換,直至整條染色體無重復(fù)排列,如圖4所示。 圖4 部分匹配交叉算子Fig.4 Partially matched crossover operators 針對TSP具有排列性質(zhì)的編碼方式,變異算子采用對換變異算法。該方法簡單地隨機選擇兩個位置并交換其內(nèi)容,如圖5所示。 當(dāng)運算經(jīng)過上述針對具有排列性質(zhì)的編碼方式設(shè)計的交叉算子和變異算子后,需要分別對交叉和變異后得到的新的染色體的相對觀測時間的可行性進行檢驗,其步驟為 步驟1根據(jù)新染色體的相對觀測時間序列和任務(wù)順序序列,計算任務(wù)順序序列中每一個觀測點的絕對觀測時間,并根據(jù)式(15)判斷觀測序列中最后一個觀測點ηn的絕對觀測時間Tηn是否滿足條件Tηn 圖5 點位變異算子Fig.5 Points mutation operator 步驟2根據(jù)任務(wù)順序序列和序列中每一個觀測點的絕對觀測時間,計算序列中每一個觀測點的觀測姿態(tài),并采用Gauss偽譜法計算兩個相鄰姿態(tài)間的最小轉(zhuǎn)移時間,并根據(jù)式(18)判斷其是否滿足要求,若滿足執(zhí)行步驟5,若不滿足執(zhí)行步驟4。 步驟3重新進行交叉算子或變異算子運算,執(zhí)行步驟1,若交叉算子或變異算子執(zhí)行10次后仍沒有可行解,則將父代個體作為新的染色體,執(zhí)行步驟5。 步驟4當(dāng)不滿足式(18)的相對觀測時間的個數(shù)為1個時,則將該基因位的相對觀測時間置換為該基因位父代的相對觀測時間,并判斷其可行性,若可行執(zhí)行步驟5,若不可行執(zhí)行步驟3。當(dāng)不滿足式(18)的相對時間的個數(shù)大于或等于2個時,按照掃描交換法交換不滿足條件的相對觀測時間在相對觀測時間序列中的位置,如圖6所示。將不可行的相對觀測時間從新染色體相對觀測時間序列中剔除,并將剔除的不可行相對觀測時間加入其他不可行相對觀測時間基因位的候選集合中。按照不可行相對觀測時間基因位在相對觀測時間序列中位置的前后順序,對該基因位候選集中剩余的相對觀測時間候選方案進行隨機選取,并判斷其可行性。若可行,剔除其后位置中不可行基因位的相對觀測時間候選集中與該基因位相同的相對觀測時間,然后在其后位置的不可行基因位候選集中進行隨機掃描工作,直至新的相對觀測時間序列生成,執(zhí)行步驟5;若不可行,則在該基因位剩余的候選方案中重新進行隨機掃描操作,直至挑選到滿足條件的方案,執(zhí)行步驟5。若觀測方案候選集都不符合,則執(zhí)行步驟3。 圖6 掃描交換相對觀測時間Fig.6 Exchanging relative observation time by scanning 步驟5輸出經(jīng)過交叉算子或變異算子后新的染色體序列,作為新種群的個體。 2.2 基于Gauss偽譜法的最小轉(zhuǎn)移時間生成 針對轉(zhuǎn)換時間約束的處理,傳統(tǒng)的處理方法過于工程化,其計算結(jié)果較真值存在一定的誤差且不具有最優(yōu)性,本文考慮姿態(tài)運動方程耦合性和轉(zhuǎn)移姿態(tài)角加速度的呈上升和下降趨勢分布的實際機理,采用Gauss偽譜法替代傳統(tǒng)的線性方法計算敏捷遙感衛(wèi)星最小轉(zhuǎn)移時間。敏捷遙感衛(wèi)星最小轉(zhuǎn)移時間問題,即為敏捷遙感衛(wèi)星從任務(wù)順序序列中的第i-1個觀測點對應(yīng)的姿態(tài)機動到衛(wèi)星觀測第i個觀測點對應(yīng)的姿態(tài)所需要的最小轉(zhuǎn)移時間,是一個時間最優(yōu)控制問題,即衛(wèi)星從一個姿態(tài)躍遷到另一個姿態(tài)的過程中滿足時間最優(yōu)性要求,其轉(zhuǎn)移過程如圖7所示,圖中Sat代表衛(wèi)星。 敏捷遙感衛(wèi)星時間最優(yōu)控制問題可以描述為多約束條件下的連續(xù)最優(yōu)控制問題。連續(xù)最優(yōu)控制問題的一般性描述見文獻[30],在此不再贅述。敏捷遙感衛(wèi)星時間最優(yōu)控制問題與連續(xù)最優(yōu)控制問題的映射如下: 圖7 衛(wèi)星姿態(tài)機動示意圖Fig.7 Schematic diagram of satellite attitude maneuver 1) 系統(tǒng)方程 相比于傳統(tǒng)的初始狀態(tài)、終止狀態(tài)、初始時刻固定、終止時刻不固定的衛(wèi)星時間最優(yōu)控制問題[30],本文涉及的衛(wèi)星時間最優(yōu)控制問題的初始狀態(tài)、初始時刻固定,終止時刻、終止狀態(tài)不固定,是關(guān)于時間的函數(shù),其表達式為 xf=ψ(tf) (22) 式中:xf為終止狀態(tài);tf為終止時刻。 傳統(tǒng)的選用絕對運動方程作為系統(tǒng)方程的方法針對終止狀態(tài)不固定的時間最優(yōu)控制問題已經(jīng)不再適用。為解決上述問題本文選取基于MRP的誤差運動方程式(5)、式(6)作為系統(tǒng)方程,進而將問題轉(zhuǎn)化為初始狀態(tài)為衛(wèi)星在初始時刻觀測第i-1個觀測點相對衛(wèi)星在初始時刻觀測第i個觀測點的相對姿態(tài),終止狀態(tài)為零、初始時刻固定、終止時刻不固定的衛(wèi)星時間最優(yōu)姿態(tài)機動問題。則系統(tǒng)的狀態(tài)變量為 (23) 2) 約束條件 x(t0)=x0 (24) x(tf)=[0 0 0 0 0 0]T (25) (26) (27) 式中:x0為衛(wèi)星在t0時刻觀測任務(wù)順序序列中的第i-1個觀測點對應(yīng)的姿態(tài)相對t0時刻衛(wèi)星觀測任務(wù)順序序列中的第i個觀測點對應(yīng)的姿態(tài)的初始誤差姿態(tài),t0為定值;x(tf)為衛(wèi)星在tf時刻的終止誤差姿態(tài),tf不是定值;umax為敏捷遙感衛(wèi)星所配置的執(zhí)行機構(gòu)所能提供的最大力矩;ωmax為敏捷遙感衛(wèi)星機動過程中最大角速度。式(24)、式(25)為邊界條件,式(26)、式(27)為路徑約束。 3) 性能指標 性能指標Jc的表達式為 (28) 針對具有強耦合性和強非線性系統(tǒng)方程的衛(wèi)星時間最優(yōu)控制問題,其解析解是無法求得的。目前求解含有約束條件的最優(yōu)控制問題的數(shù)值解的主要方法包括直接法和間接法。間接法求解最優(yōu)控制問題主要是基于龐德里亞金極小值原理和變分原理,將最優(yōu)控制問題轉(zhuǎn)換為一個Hamilton邊值問題,進而求得最優(yōu)控制問題的數(shù)值解,但是利用該算法推導(dǎo)一階最優(yōu)必要條件與橫截條件的過程較為繁瑣,且對未知條件的初值和不具有實際物理意義的協(xié)態(tài)變量的初值難以準確估計,因此,通過間接法求解最優(yōu)控制問題的數(shù)值解十分困難。直接法求解最優(yōu)控制問題的數(shù)值解時不需要求解問題的一階最優(yōu)必要條件,而是采用參數(shù)化方法將連續(xù)的最優(yōu)控制問題轉(zhuǎn)化為離散的非線性規(guī)劃(NLP)問題,其收斂域較間接法寬,對初值不敏感。傳統(tǒng)的直接法在求解最優(yōu)控制問題時其求解精度低、收斂速度慢,而Gauss偽譜法可以彌補上述傳統(tǒng)直接法的不足,近年來在最優(yōu)控制問題求解中備受關(guān)注[21-26,31-35]。 Gauss偽譜法選擇LG(Legendre-Gauss)點作為配點,采用拉格朗日全局插值多項式作為基函數(shù)近似狀態(tài)變量和控制變量在LG點處的值,采用拉格朗日全局插值多項式對時間的導(dǎo)數(shù)作為微分方程中狀態(tài)變量對時間的導(dǎo)數(shù)的近似,采用Gauss積分作為性能指標中積分項的近似。 通過Gauss偽譜法的轉(zhuǎn)換可以將連續(xù)最優(yōu)控制問題轉(zhuǎn)化為離散的NLP問題,通過高斯離散化轉(zhuǎn)換的NLP問題滿足Benson等[30]提出的高斯偽譜協(xié)態(tài)變量映射定理:NLP問題的KKT(Karush-Kuhn-Tucker)條件與采用Gauss偽譜法離散化方法離散的連續(xù)時間最優(yōu)控制問題的一階最優(yōu)必要條件是完全等價的。其等價關(guān)系如圖8 所示。 圖8 KKT條件與一階最優(yōu)必要條件等價性示意圖Fig.8 Equivalence schematic of KKT conditions and the first order optimal necessary conditions 上述定理中KKT條件與一階最優(yōu)必要條件的等價性證明了基于Gauss偽譜法求得的最優(yōu)控制問題的解與基于間接法求得的最優(yōu)控制問題的解的一致性,因此,本文采用基于Gauss偽譜法的直接法求解敏捷遙感衛(wèi)星時間最優(yōu)控制問題。求解過程如下: 1) 時間域變換 采用LG點作為配點,則需要做時域變換處理,將優(yōu)化系統(tǒng)的時間區(qū)域t∈[t0,tf]轉(zhuǎn)換為τ∈[-1,1]區(qū)間,則時間變量表示為 (29) 2) 基函數(shù)選取 選擇τ=-1和K個LG點作為節(jié)點,其分別為{τ0,τ1,τ2,…,τK},采用拉格朗日全局插值多項式作為基函數(shù),其表達式為 (30) 式中:Li為在第i個點處的拉格朗日全局插值多項式。 3) 狀態(tài)變量和控制變量近似 基于上述插值近似的基函數(shù),狀態(tài)變量和控制變量在整個時域的連續(xù)函數(shù)可由基函數(shù)表達,其表達式為 (31) (32) 式中:x(τi)為狀態(tài)變量在第i個節(jié)點的真值,i=0,1,…,K;u(τj)為控制變量在第j個節(jié)點的真值,j=1,2,…,K;X(τ)為離散的狀態(tài)變量;U(τ)為離散的控制變量。 4) 微分方程近似 通過對狀態(tài)變量函數(shù)求導(dǎo)逼近的方法,得到微分方程表達式為 (33) 式中:k=1,2,…,K;Dki為微分矩陣D∈RK×(K+1)中第k行、第i列元素,其定義為 (34) 其中:g(τ)為確定區(qū)間上第K個點處的插值基函數(shù),與拉格朗日插值基函數(shù)式(30)的關(guān)系為 (35) 基于LG點,可將微分方程動態(tài)約束轉(zhuǎn)化為代數(shù)約束,其表達式為 (36) 式中:F為關(guān)于X(τk)、U(τk)和τk的函數(shù)。 在選取節(jié)點時不包括終端時刻的節(jié)點,因此系統(tǒng)的終端狀態(tài)變量可以通過高斯積分來近似,其表達式為 (37) 式中:wk為高斯積分權(quán)重。 5) 性能指標近似 采用Gauss積分作為性能指標中積分項的近似,則性能指標可以表示為 Jc=h(X(tf),tf)+ (38) 式中:h為關(guān)于X(tf)和tf的函數(shù);H為關(guān)于X(τk)、U(τk)和τk的函數(shù)。 基于LG點,邊界條件G和路徑約束C可以離散為 G(X(t0),t0;X(tf),tf)=0 (39) C(X(τk),U(τk),τk)≤0 (40) 根據(jù)上述變換可以將連續(xù)最優(yōu)控制問題離散化為NLP問題。 本文基于MATLAB,采用求解最優(yōu)控制問題的開源程序GPOPS-II[36]對敏捷遙感衛(wèi)星時間最優(yōu)控制問題進行求解。 2.3 基于Gauss偽譜法的能量最優(yōu)姿態(tài)轉(zhuǎn)移路徑 敏捷遙感衛(wèi)星能量最優(yōu)姿態(tài)轉(zhuǎn)移路徑生成問題即為敏捷遙感衛(wèi)星從一個觀測姿態(tài)機動到另一個觀測姿態(tài)所需要的最小能量。 為保證姿態(tài)間轉(zhuǎn)移能量消耗最小,并考慮姿態(tài)運動方程的耦合性,敏捷遙感衛(wèi)星能量最優(yōu)姿態(tài)轉(zhuǎn)移路徑生成問題同樣可以描述為多約束條件下的連續(xù)最優(yōu)控制問題。映射關(guān)系如下: 1) 系統(tǒng)方程 本文涉及的衛(wèi)星能量最優(yōu)姿態(tài)轉(zhuǎn)移軌跡生成問題的初始狀態(tài)、終止狀態(tài)、初始時刻、終止時刻均固定,選用絕對運動方程式(1)、式(3)作為系統(tǒng)方程,取系統(tǒng)的狀態(tài)變量為 x=[σTωT]T (41) 2)約束條件 x(t0)=x0 (42) x(tf)=xf (43) (44) (45) 式中:tf為定值。式(42)、式(43)為邊界條件,式(44)、式(45)為路徑約束。 3) 性能指標 (46) 敏捷遙感衛(wèi)星能量最優(yōu)姿態(tài)轉(zhuǎn)移路徑生成問題求解過程按照2.2節(jié)所述,在此不再贅述。 2.4 基于偽譜法和遺傳算法的混合求解策略計算 綜合2.1~2.3節(jié)內(nèi)容,基于偽譜法和遺傳算法的混合求解策略計算流程如圖9所示。 圖9 基于偽譜法和遺傳算法的混合求解策略流程圖Fig.9 Flow chart of hybrid solution strategy based on pseudospectral and GA 基于偽譜法和遺傳算法的混合求解策略,在遺傳運算過程中,針對轉(zhuǎn)移時間約束問題,考慮本文涉及的最優(yōu)控制問題終止狀態(tài)不固定的條件,選擇基于MRP的誤差運動方程,結(jié)合誤差運動方程的耦合性和Gauss偽譜法解的最優(yōu)性,采用Gauss偽譜法代替?zhèn)鹘y(tǒng)的線性方法計算兩個相鄰姿態(tài)間的最小轉(zhuǎn)移時間,進而處理轉(zhuǎn)移時間約束,能夠使兩相鄰姿態(tài)間轉(zhuǎn)移角加速度符合上升和下降趨勢的實際機理,并為衛(wèi)星觀測地面靜止觀測點的觀測時間提供更大的求解區(qū)間。 在對多觀測點在軌自主任務(wù)規(guī)劃問題的適應(yīng)度函數(shù)求解中,選擇基于MRP的運動方程,同樣考慮運動學(xué)方程耦合性和Gauss偽譜法解的最優(yōu)性,采用Gauss偽譜法對兩個相鄰姿態(tài)間的最小能量消耗進行求解。 對于多觀測點在軌自主任務(wù)規(guī)劃問題,在求解過程中,每一條染色體的表現(xiàn)型不相同,即任務(wù)順序序列和絕對觀測時間序列都不相同,且每次迭代后新生成的可行染色體的表現(xiàn)型與其父代個體不同。根據(jù)式(9),任務(wù)順序序列和絕對觀測時間序列的不同決定了觀測姿態(tài)序列不同,且觀測姿態(tài)序列在每次迭代過程中都是高動態(tài)變化的,若采用傳統(tǒng)的單一遺傳算法進行求解,對于嵌套了姿態(tài)間時間最優(yōu)控制問題和最小能量消耗問題的多觀測點在軌自主任務(wù)規(guī)劃問題,其編碼方式較為復(fù)雜,且求得的結(jié)果精度不一定滿足最優(yōu)性要求;而采用結(jié)合Gauss偽譜法和遺傳算法的混合求解算法,可以通過高斯偽譜協(xié)態(tài)變量映射定理證明,在觀測姿態(tài)序列高動態(tài)變化條件下,該算法可以對姿態(tài)間時間最優(yōu)控制問題和姿態(tài)間能量最優(yōu)問題求得最優(yōu)解,進而降低了對遺傳算法編碼方式的要求,提高了計算精度。 3.1 仿真條件與優(yōu)化結(jié)果 1) 仿真參數(shù)設(shè)置 本文以MATLAB 2014b為實驗平臺,采用CPU為3.40 GHz/i3-3240,內(nèi)存為4.0 G,操作系統(tǒng)為Windows 7的計算機做優(yōu)化計算?;谀芰孔顑?yōu)的敏捷遙感衛(wèi)星對多個離散觀測點在軌自主任務(wù)規(guī)劃問題的參數(shù)設(shè)置為:地球半徑為6 378.136 55 km,地球曲率半徑為 1.0/298.257 22,地球引力常數(shù)為398 600.44 km3/s2。 敏捷遙感衛(wèi)星的轉(zhuǎn)動慣量為[200 0 0;0 200 0;0 0 200] kg·m2,其配置的執(zhí)行機構(gòu)所能提供的最大控制力矩為125 N·m,衛(wèi)星機動過程中所能達到的最大角速度為0.2 rad/s。衛(wèi)星從一個姿態(tài)機動到另一個姿態(tài)時的初始和終止角速度和角加速度分別為[0 0 0]Trad/s、[0 0 0]Trad/s2。 采用本文提出的基于偽譜法和遺傳算法混合求解策略,求解第1節(jié)所描述的能量最優(yōu)的多觀測點在軌自主任務(wù)規(guī)劃問題時,遺傳參數(shù)設(shè)置為:種群規(guī)模為50,迭代次數(shù)為100;交叉概率為 0.7,變異概率為0.01。 Raja等[37]以能量最優(yōu)為目標函數(shù),采用遺傳算法對運動軌跡進行優(yōu)化。本文基于文獻[37]所提單純遺傳算法方法對第1節(jié)所描述的能量最優(yōu)的多觀測點在軌自主任務(wù)規(guī)劃問題進行求解,并與本文提出算法的優(yōu)化結(jié)果進行對比。其仿真參數(shù)設(shè)置為:種群規(guī)模為50,迭代次數(shù)為5 000;對觀測順序和觀測時間進行交叉和變異操作時,其交叉概率和變異概率分別為0.7和0.01;對姿態(tài)路徑規(guī)劃時,其交叉概率和變異概率分別為0.8和0.05。 2) 仿真結(jié)果 對3個離散靜止觀測點的簡單成像任務(wù)進行規(guī)劃,初始軌道對應(yīng)的時刻為2016年4月14日0時0分0秒,初始軌道參數(shù)、衛(wèi)星觀測時間區(qū)間、觀測目標參數(shù)如表1~表3所示。表1中:a表示軌道半長軸;e表示軌道偏心率;i表示軌道傾角;Ω表示升交點赤徑;W表示近地點幅角;M表示平近點角。 基于偽譜法和遺傳算法的混合求解策略得到的仿真結(jié)果如表4、圖10所示。實現(xiàn)軌道固定的單顆敏捷遙感衛(wèi)星在固定時間區(qū)域內(nèi)對3個地面靜止觀測點的完全觀測所消耗能量為14.599 6 N2·m2·s。 表1 簡單任務(wù)初始軌道參數(shù)Table 1 Initial parameters of orbit for simple misson 表2 簡單任務(wù)觀測時間窗Table 2 Time window of observation for simple misson 表3簡單任務(wù)觀測目標信息 Table3Informationofobservationtargetforsimplemisson ObservationtargetLongitude/(°)Latitude/(°)Nanjing119.732Yinchuan106.2738.33Harbin125.744.5 表4基于混合求解策略的簡單任務(wù)觀測順序和時間 Table4Sequenceandtimeofobservationbasedonhybridsolutionstrategyforsimplemission ObservationtargetDateHourMinuteSecondNanjing2016?04?144101.8Yinchuan2016?04?1441156.2Harbin2016?04?1441310.1 圖10 基于混合求解策略的簡單任務(wù)姿態(tài)機動路徑 Fig.10 Path of attitude maneuver based on hybrid solution strategy for simple misson 基于文獻[37]中所提單純遺傳算法求解得到的仿真結(jié)果如表5、圖11所示。實現(xiàn)軌道固定的單顆敏捷遙感衛(wèi)星在固定時間區(qū)域內(nèi)對3個地面靜止觀測點的完全觀測所消耗能量為34.336 8 N2·m2·s。且兩種算法迭代過程如圖12所示。 在其他仿真參數(shù)保持不變的前提下,考慮對7個離散靜止觀測點的復(fù)雜成像任務(wù)進行規(guī)劃,其中,初始軌道的時刻為2016年4月14日0時0分0秒,初始軌道參數(shù)、觀測時間窗、觀測目標信息如表6~表8所示。 表5基于遺傳算法的簡單任務(wù)觀測順序和時間 Table5SequenceandtimeofobservationbasedonGAforsimplemisson ObservationtargetDateHourMinuteSecondYinchuan2016?04?144949.7Nanjing2016?04?1441142.5Harbin2016?04?1441226.3 圖11 基于遺傳算法的簡單任務(wù)姿態(tài)機動路徑 Fig.11 Path of attitude maneuver based on GA for simple misson 圖12 簡單任務(wù)的兩種算法迭代過程Fig.12 Iterative processes of two algorithms for simple mission 表6 復(fù)雜任務(wù)初始軌道參數(shù)Table 6 Initial parameters of orbit for complex mission 基于偽譜法和遺傳算法的混合求解策略得到的仿真結(jié)果如表9、圖13所示。實現(xiàn)軌道固定的單顆敏捷遙感衛(wèi)星在固定時間區(qū)域內(nèi)對7個地面靜止觀測點的完全觀測所消耗能量為21.576 0 N2·m2·s。 基于文獻[37]中所提單純遺傳算法求解得到的仿真結(jié)果如表10、圖14所示。實現(xiàn)軌道固定的單顆敏捷遙感衛(wèi)星在固定時間區(qū)域內(nèi)對7個地面靜止觀測點的完全觀測所消耗能量為52.842 2 N2·m2·s。兩種算法迭代過程如圖15所示。 表7 復(fù)雜任務(wù)觀測時間窗Table 7 Time window of observation for complex mission 表8復(fù)雜任務(wù)觀測目標信息 Table8Informationofobservationtargetforcomplexmission ObservationtargetLongitude/(°)Latitude/(°)Harbin125.744.5Shenyang123.3841.8Tianjin117.1239.02Yinchuan106.2738.33Taiyuan112.5337.87Nanjing119.732Wuhan114.3230.52 表9基于混合求解策略的復(fù)雜任務(wù)觀測順序和時間 Table9Sequenceandtimeofobservationbasedonhybridsolutionstrategyforcomplexmission ObservationtargetDateHourMinuteSecondWuhan2016?04?144827.93Nanjing2016?04?14494.59Tianjin2016?04?144944.99Shenyang2016?04?1441016.18Taiyuan2016?04?1441141.18Yinchuan2016?04?1441334.12Harbin2016?04?1441455.96 圖13 基于混合求解策略的復(fù)雜任務(wù)姿態(tài)機動路徑 Fig.13 Path of attitude maneuver based on hybrid solution strategy for complex mission 表10基于遺傳算法的復(fù)雜任務(wù)觀測順序和時間 Table10SequenceandtimeofobservationbasedonGAforcomplexmission ObservationtargetDateHourMinuteSecondHarbin2016?04?144841.32Shenyang2016?04?1441032.24Yinchuan2016?04?1441221.33Wuhan2016?04?1441325.39Nanjing2016?04?1441348.41Taiyuan2016?04?1441528.32Tianjin2016?04?1441615.23 圖14 基于遺傳算法的復(fù)雜任務(wù)姿態(tài)機動路徑Fig.14 Path of attitude maneuver based on GA for complex mission 3) 能量消耗 針對3個離散靜止觀測點(3個城市)的簡單成像任務(wù)規(guī)劃問題和7個離散靜止觀測點(7個城市)的復(fù)雜成像任務(wù)規(guī)劃問題,采用基于偽譜法和遺傳算法的混合求解算法與單純遺傳算法分別進行了50次測試,計算兩個算法50次仿真輸出結(jié)果中的能量值,并做平均值處理,計算結(jié)果如圖16 所示。 圖15 復(fù)雜任務(wù)的兩種算法迭代過程 Fig.15 Iterative processes of two algorithms for complex mission 圖16 兩種算法能量消耗Fig.16 Energy consumption of two algorithms 4) 仿真時間 針對3個離散靜止觀測點的簡單成像任務(wù)規(guī)劃問題和7個離散靜止觀測點的復(fù)雜成像任務(wù)規(guī)劃問題,采用兩種算法分別進行了50次測試,并得到50次測試的仿真時間見表11和表12所示。 表11 簡單任務(wù)仿真時間Table 11 Time of simulation for simple mission 表12 復(fù)雜任務(wù)仿真時間Table 12 Time of simulation for complex mission 針對3個離散靜止觀測點的成像任務(wù)規(guī)劃問題,基于偽譜法和遺傳算法的混合求解策略求解的平均仿真時間為222.41 s,基于單純遺傳算法求解的平均仿真時間為305.71 s。 針對7個離散靜止觀測點的成像任務(wù)規(guī)劃問題,基于偽譜法和遺傳算法的混合求解策略求解的平均仿真時間為483.06 s,基于單純遺傳算法求解的平均仿真時間為680.56 s。 3.2 結(jié)果分析 根據(jù)圖10、圖11和圖13、圖14,分別對比兩組算例中兩種優(yōu)化算法得到的姿態(tài)路徑轉(zhuǎn)移軌跡,其中,基于偽譜法和遺傳算法的混合求解策略規(guī)劃得到的姿態(tài)路徑轉(zhuǎn)移軌跡明顯較為平滑,避免了單純遺傳算法中編碼點數(shù)隨機性造成的求解結(jié)果中姿態(tài)路徑轉(zhuǎn)移軌跡抖動的現(xiàn)象,進而降低實現(xiàn)完全觀測姿態(tài)轉(zhuǎn)移所消耗的能量。且根據(jù)圖12、圖15和仿真結(jié)果,基于偽譜法和遺傳算法的混合求解策略實現(xiàn)軌道固定的單顆敏捷遙感衛(wèi)星在固定時間區(qū)域內(nèi)對多個地面靜止觀測點的完全觀測所消耗能量小于基于遺傳算法的求解策略實現(xiàn)完全觀測所消耗的能量,進一步驗證了上述結(jié)論。 進一步對比兩組算例中兩種優(yōu)化算法得到的姿態(tài)路徑轉(zhuǎn)移軌跡,在偏航軸上兩組仿真曲線差別較大,基于偽譜法和遺傳算法的混合求解策略考慮了衛(wèi)星運動方程的耦合性,當(dāng)偏航軸的起始和終止姿態(tài)相同、起始和終止角速度相同時,偏航軸姿態(tài)路徑會發(fā)生姿態(tài)轉(zhuǎn)移現(xiàn)象,而在采用單純遺傳算法對姿態(tài)轉(zhuǎn)移路徑進行規(guī)劃時,沒有考慮衛(wèi)星姿態(tài)運動方程的耦合性,當(dāng)偏航軸的起始和終止姿態(tài)相同、起始和終止角速度相同時,偏航軸姿態(tài)路徑不會有姿態(tài)轉(zhuǎn)移過程。 根據(jù)圖12和圖15,從兩個算例中兩種算法迭代過程可以看出,基于偽譜法和遺傳算法的混合求解策略的求解過程迭代次數(shù)小,優(yōu)化時間較短;基于單純遺傳算法的求解策略的求解過程迭代次數(shù)高,需要幾千次甚至上萬次迭代,其優(yōu)化時間長,求解效率低。根據(jù)表11和表12,通過分別對兩個算例采用兩種算法進行50次測試,得到50次測試仿真時間的平均值可以看出,基于偽譜法和遺傳算法的混合求解策略平均仿真時間小于單純遺傳算法的平均仿真時間。通過仿真曲線和仿真結(jié)果可以看到,基于偽譜法和遺傳算法的混合求解策略優(yōu)于基于遺傳算法的求解策略,且其求解效率明顯高于基于遺傳算法的求解策略。 根據(jù)圖16(a),對于3個離散靜止觀測點的簡單成像任務(wù)進行規(guī)劃問題,采用基于偽譜法和遺傳算法的混合求解策略得到的平均能量約為13.349 7 N2·m2·s,采用單純遺傳算法得到的平均能量約為32.976 9 N2·m2·s,采用混合求解策略在姿態(tài)轉(zhuǎn)移過程中能量消耗降低約為60%;根據(jù)圖16(b),對于7個離散靜止觀測點的復(fù)雜成像任務(wù)規(guī)劃問題,采用基于偽譜法和遺傳算法的混合求解策略得到的平均能量約為21.123 3 N2·m2·s,采用單純遺傳算法得到的平均能量約為53.576 0 N2·m2·s,采用混合求解策略在姿態(tài)轉(zhuǎn)移過程中能量消耗降低約為60%。因此,綜合上述兩個算例的仿真結(jié)果,采用基于偽譜法和遺傳算法的混合求解策略在姿態(tài)轉(zhuǎn)移過程中能量消耗相對于采用單純遺傳算法的能量消耗降低約為60%。 根據(jù)上述仿真結(jié)果分析,采用結(jié)合Gauss偽譜法和遺傳算法的混合求解算法的優(yōu)勢如下: 1) 避免了單純遺傳算法中編碼點數(shù)隨機性造成的求解結(jié)果中姿態(tài)路徑轉(zhuǎn)移軌跡抖動的現(xiàn)象,進而降低實現(xiàn)完全觀測姿態(tài)轉(zhuǎn)移所消耗的能量; 2) 該混合求解策略考慮了衛(wèi)星運動方程的耦合性,當(dāng)偏航軸的起始和終止姿態(tài)相同、起始和終止角速度相同時,偏航軸姿態(tài)路徑會發(fā)生姿態(tài)轉(zhuǎn)移現(xiàn)象,更加符合衛(wèi)星實際的運動特性; 3) 該混合求解策略在每次迭代過程中觀測姿態(tài)序列高動態(tài)變化條件下,可以對姿態(tài)間時間最優(yōu)控制問題和姿態(tài)間能量最優(yōu)問題求得最優(yōu)解,避免單純遺傳算法求解嵌套了姿態(tài)間時間最優(yōu)控制問題和姿態(tài)間最小能量消耗問題的多觀測點在軌自主任務(wù)規(guī)劃問題時其編碼方式較為復(fù)雜的情況,降低了對遺傳算法編碼方式的要求,提高計算精度以及求解效率。 1) 本文解決了敏捷遙感衛(wèi)星對多個離散觀測點觀測的在軌自主任務(wù)規(guī)劃問題。即在固定時間區(qū)域內(nèi)實現(xiàn)對地面多個離散觀測點的完全觀測。 2) 在考慮姿態(tài)運動方程耦合性的基礎(chǔ)上,以能量最優(yōu)為目標函數(shù),將問題分解為任務(wù)層面的空間資源調(diào)度問題和規(guī)劃層面的連續(xù)最優(yōu)控制問題,提出了一種結(jié)合偽譜法和遺傳算法的混合求解算法。對任務(wù)層選用二維編碼結(jié)構(gòu)對觀測順序和相對觀測時間進行實數(shù)編碼,并采用遺傳算法求解觀測序列和觀測時間;對時間最優(yōu)控制問題、規(guī)劃層的最小能量消耗問題這兩個連續(xù)最優(yōu)控制問題,基于Benson提的Gauss偽譜協(xié)態(tài)變量映射定理,采用Gauss偽譜法進行求解。 3) 與單純遺傳算法的仿真對比實驗驗證了本文算法的高效性。該方法規(guī)劃出的姿態(tài)路徑轉(zhuǎn)移曲線更加平滑,有效降低了單純遺傳算法編碼點數(shù)隨機性造成的曲線抖動性,進而降低了實現(xiàn)完全觀測姿態(tài)轉(zhuǎn)移所消耗的能量,在典型工況下,經(jīng)過多次仿真實驗,姿態(tài)轉(zhuǎn)移過程中能量消耗降低約為60%。 [1] 廉振宇, 譚躍進, 嚴珍珍. 敏捷衛(wèi)星調(diào)度的時間約束推理方法[J]. 系統(tǒng)工程與電子技術(shù), 2013, 35(6):1206-1211. LIAN Z Y, TAN Y J, YAN Z Z. Temporal reasoning technology for AEOS scheduling[J]. Systems Engineering and Electronics, 2013, 35(6): 1206-1211 (in Chinese). [2] BEAUMET G, VERFAILLIE G, CHARMEAU M C. Feasibility of autonomous decision making on board an agile earth-observing satellite[J]. Computational Intelligence, 2011, 27(1): 123-139. [3] XU R, CHEN H P, LIANG X L, et al. Priority-based constructive algorithms for scheduling agile earth observation satellites with total priority maximization[J]. Expert Systems with Applications, 2016, 51: 195-206. [4] 賀仁杰, 高鵬, 白保存, 等. 成像衛(wèi)星任務(wù)規(guī)劃模型、算法及其應(yīng)用[J]. 系統(tǒng)工程理論與實踐, 2011, 31(3): 411-422. HE R J, GAO P, BAI B C, et al. Models, algorithms and applications to the mission planning system of imaging satellites[J]. Systems Engineering-Theory & Practice, 2011, 31(3): 411-422 (in Chinese). [5] GABREL V, VANDERPOOTEN D. Enumeration and interactive selection of efficient paths in a multiple criteria graph for scheduling an earth observing satellite[J]. European Journal of Operational Research, 2002, 139(3): 533-542. [6] GABREL V, MOULET A, MURAT C, et al. A new single model and derived algorithms for the satellite shot planning problem using graph theory concepts[J]. Annals of Operational Research, 1997, 69(1): 115-134. [7] VASQUEZ M, HAO J K. A “l(fā)ogic-constrained” knapsack formulation and a tabu algorithm for the daily photograph scheduling of an earth observing satellite[J]. Computational Optimization and Applications, 2001, 20(2): 137-157. [8] BENSANA E, LEMAITRE M, VERFAILLIE G. Earth observation satellite management[J]. Constraints, 1999, 4(3): 293-299. [9] LEMAITRE M, VERFAILLIE G, JOUHAUD F, et al. Selecting and scheduling observations of agile satellites[J]. Aerospace Science and Technology, 2002, 6(5): 367-381. [10] VERFAILLIE G, LEMAITRE M, SCHIEX T. Russian doll search for solving constraint optimization problems[C]//Proceedings of the 13th National Conference on Artificial Intelligence. Palo Alto: AAAI, 1996: 181-187. [11] 賀仁杰. 成像偵察衛(wèi)星調(diào)度問題研究[D]. 長沙: 國防科學(xué)技術(shù)大學(xué), 2004: 15-23. HE R J. Research on imaging reconnaissance satellite scheduling problem[D]. Changsha: National University of Defense Technology, 2004: 15-23 (in Chinese). [12] XHAFA F, SUN J Z, BAROLLI A, et al. Genetic algorithms for satellite scheduling problems[J]. Mobile Information System, 2012, 8(4): 351-377. [13] WOLFE W, SORENSEN S E. Three scheduling algorithms applied to earth observing systems domain[J]. Management Science, 2000, 46(1): 148-166. [14] CORDEAU J-F, LAPORTE G. Maximizing the value of an Earth observation satellite orbit[J]. Journal of the Operational Research Society, 2005, 56(8): 962-968. [15] 陳英武, 方炎申, 李菊芳, 等. 衛(wèi)星任務(wù)調(diào)度問題的約束規(guī)劃模型[J]. 國防科技大學(xué)學(xué)報, 2006, 28(5): 126-132. CHEN Y W, FANG Y S, LI J F, et al. Constraint programming model of satellite mission scheduling[J]. Journal of National University of Defense Technology, 2006, 28(5): 126-132 (in Chinese). [16] SARKHEYLI A, BAGHERI A, GHORBANI-VAGHEI B, et al. Using an effective tabu search in interactive resource scheduling problem for LEO satellites missions[J]. Aerospace Science and Technology, 2013, 29(1): 287-295. [17] WU G H, LIU J, MA M H, et al. A two-phase scheduling method with the consideration of task clustering for earth observing satellites[J]. Computers & Operations Research, 2013, 40(7): 1884-1894. [18] 劉富鈺, 崔培玲. 基于改進遺傳算法的敏捷衛(wèi)星姿態(tài)路徑規(guī)劃[J]. 電光與控制, 2012, 19(12): 23-33. LIU F Y, CUI P L. Attitude path planning for agile satellite based on improved genetic algorithm[J]. Electronics Optics & Control, 2012, 19(12): 23-33 (in Chinese). [19] KUSUDA Y, TAKAHASHI M. Feedback control with nominal inputs for agile satellites using control moment gyros[J]. Journal of Guidance, Control, and Dynamics, 2011, 34(4): 1209-1218. [20] 張秋華, 孫松濤, 諶穎, 等. 時間固定的兩航天器追逃策略及數(shù)值求解[J]. 宇航學(xué)報, 2014,35(5): 537-544. ZHANG Q H, SUN S T, CHEN Y, et al. Strategy and numerical solution of pursuit-evasion with fixed duration for two spacecraft[J]. Journal of Astronautics, 2014, 35(5): 537-544 (in Chinese). [21] SPILLER D, ANSALONE L, CURTI F. Particle swarm optimization for time-optimal spacecraft reorientation with keep-out cones[J]. Journal of Guidance, Control, and Dynamics, 2016, 39(2): 312-325. [22] 劉剛, 李傳江, 馬廣富, 等. 應(yīng)用SGCMG的衛(wèi)星姿態(tài)快速機動控制[J]. 航空學(xué)報, 2011, 32(10): 1905-1913. LIU G, LI C J, MA G F, et al. Time efficient controller design for satellite attitude maneuvers using SGCMG[J]. Acta Aeronautica et Astronautica Sinica, 2011, 32(10): 1905-1913 (in Chinese). [23] LI J, XI X N. Time-optimal reorientation of the rigid spacecraft using a pseudospectral method integrated homotopic approach[J]. Optimal Control Application & Methods, 2015, 36(6): 889-918. [24] 豐志偉, 張永合, 劉志超, 等. 基于路徑規(guī)劃的敏捷衛(wèi)星姿態(tài)機動反饋控制方法[J]. 國防科技大學(xué)學(xué)報, 2013, 35(4):1-6. FENG Z W, ZHANG Y H, LIU Z C, et al. Feedback control method for attitude maneuver of agile satellite based on trajectory optimization[J]. Journal of National University of Defense Technology, 2013, 35(4): 1-6 (in Chinese). [25] GUO T D, JIANG F H, BAOYIN H X, et al. Fuel optimal low thrust rendezvous with outer planets via gravity assist[J]. Science China Physics, Mechanics & Astronomy, 2011, 54(4): 756-769. [26] GARG D, PATTERSON M A, FRANCOLIN C, et al. Direct trajectory optimization and costate estimation of finite-horizon and infinite-horizon optimal control problems using a Radau pseudospectral method[J]. Computational Optimization and Applications, 2011, 49(2): 335-358. [27] 黃靜. 三軸穩(wěn)定航天器姿態(tài)最優(yōu)控制方法研究[D]. 哈爾濱: 哈爾濱工業(yè)大學(xué), 2010: 15-16. HUANG J. Optimal attitude control for three-axis stabilized spacecrafts[D]. Harbin: Harbin Institute of Technology, 2010: 15-16 (in Chinese). [28] TSIOTRAS P. Stabilization and optimality results for the attitude control problem[J]. Journal of Guidance, Control, and Dynamics, 1996, 19(4): 772-779. [29] LIN W, DELGADO-FRIAS J G, GAUSE D C, et al. Hybrid Newton-Raphson genetic algorithm for the travelling salesman problem[J]. Cybernetics and Systems, 1995, 26(4): 387-412. [30] BENSON D A, HUNTINGTON G T, THORVALDSEN T P, et al. Direct trajectory optimization and costate estimation via an orthogonal collocation method[J]. Journal of Guidance, Control, and Dynamics, 2006, 29(6): 1435-1440. [31] 葉東. 敏捷衛(wèi)星姿態(tài)快速機動與穩(wěn)定控制方法研究[D]. 哈爾濱: 哈爾濱工業(yè)大學(xué), 2013: 15-19. YE D. Research on fast maneuver and stabilization control for agile satellite[D]. Harbin: Harbin Institute of Technology, 2013: 15-19 (in Chinese). [32] 呼衛(wèi)軍, 盧青, 常晶, 等. 特征趨勢分區(qū)Gauss偽譜法解再入軌跡規(guī)劃問題[J]. 航空學(xué)報, 2015, 36(10): 3338-3348. HU W J, LU Q, CHANG J, et al. Reentry trajectory planning method based on Gauss pseudospectral with character istics of trend partition[J]. Acta Aeronautica et Astronautica Sinica, 2015, 36(10): 3338-3348 (in Chinese). [33] 張煜, 張萬鵬, 陳璟, 等. 基于Gauss偽譜法的UCAV對地攻擊武器投放軌跡規(guī)劃[J]. 航空學(xué)報, 2011, 32(7): 1240-1251. ZHNAG Y, ZHANG W P, CHEN J, et al. Air-to-ground weapon delivery trajectory planning for UCAVs using Gauss pseudospectral method[J]. Acta Aeronautica et Astronautica Sinica, 2011, 32(7): 1240-1251 (in Chinese). [34] 白瑞光, 孫鑫, 陳秋雙, 等. 基于Gauss偽譜法的對UAV協(xié)同航跡規(guī)劃[J]. 宇航學(xué)報, 2014, 35(9): 1022-1029. BAI R G, SUN X, CHEN Q S, et al. Multiple UAV cooperative trajectory planning based on Gauss pseudospectral method[J]. Journal of Astronautics, 2014, 35(9): 1022-1029 (in Chinese). [35] GUO T D, JIANG F H, LI J F. Homotopic approach and pseudospectral method applied jointly to low thrust trajectory optimization[J]. Acta Astronautica, 2012, 71: 38-50. [36] PATTERSON M A, RAO A V. GPOPS-II: A MATLAB software for solving multiple-phase optimal control problems using hp-adaptive gaussian quadrature collocation methods and sparse nonlinear programming[J]. ACM Transactions on Mathematical Software, 2014, 41(1): 1-37. [37] RAJA R, DUTTA A, VENKATESH K S. New potential field method for rough terrain path planning using genetic algorithm for a 6-wheel rover[J]. Robotics and Autonomous Systems, 2015, 72: 295-306. (責(zé)任編輯: 張玉, 王嬌) Energy-optimal in orbit mission planning for agile remotesensing satellites ZHAOLin,WANGShuo,HAOYong*,LIUYuan CollegeofAutomation,HarbinEngineeringUniversity,Harbin150001,China A new hybrid algorithm combining pseudospectral method and genetic algorithm is presented in this work to solve the in orbit autonomous mission planning problem for the agile remote sensing satellite at multiple discrete observation points. The problem is broken into space resource scheduling problem and continuous optimal control problem based on the coupling of attitude motion equations. This algorithm, according to the space resource scheduling model built based on the travelling salesman problem (TSP) model, encodes the observation sequence and the relative observation time by a two-dimensional real coding structure, and calculates the observation sequence and the observation time by the genetic algorithm. The time optimal control problem in judging the observation time feasibility and the minimal energy consumption in attitude maneuvering are considered as the continuous optimal control problem, which is then solved by Gauss pseudospectral method based on Gauss pseudospectral costate mapping theorem. A comparative simulation test is carried out for the simple genetic algorithm and the proposed algorithm. The simulation results show that the energy consumption obtained by the proposed algorithm is reduced by 60% compared with that obtained by the simple genetic algorithm under typical simulation conditions. travelling salesman problem (TSP); energy consumption; time optimal; genetic algorithm; Gauss pseudospectral method 2016-07-28;Revised2016-09-07;Accepted2016-11-14;Publishedonline2016-11-211439 URL:www.cnki.net/kcms/detail/11.1929.V.20161121.1439.010.html s:NationalNaturalScienceFoundationofChina(61273081);PostdoctoralScientificResearchDevelopmentalFundofHeilongjiangProvinceofChina(LBH-Q14054);theFundamentalResearchFundsfortheCentralUniversitiesofChina(HEUCFD1503) 2016-07-28;退修日期2016-09-07;錄用日期2016-11-14; < class="emphasis_bold">網(wǎng)絡(luò)出版時間 時間:2016-11-211439 www.cnki.net/kcms/detail/11.1929.V.20161121.1439.010.html 國家自然科學(xué)基金 (61273081); 黑龍江省博士后科研啟動金 (LBH-Q14054);中央高校基本科研業(yè)務(wù)費專項資金 (HEUCFD1503) * .E-mailhaoyong@hrbeu.edu.cn 趙琳, 王碩, 郝勇, 等. 基于能量最優(yōu)的敏捷遙感衛(wèi)星在軌任務(wù)規(guī)劃J. 航空學(xué)報,2017,38(6):320654.ZHAOL,WANGS,HAOY,etal.Energy-optimalinorbitmissionplanningforagileremotesensingsatellitesJ.ActaAeronauticaetAstronauticaSinica,2017,38(6):320654. http://hkxb.buaa.edu.cnhkxb@buaa.edu.cn 10.7527/S1000-6893.2016.0298 V249.122 A 1000-6893(2017)06-320654-19 *Correspondingauthor.E-mailhaoyong@hrbeu.edu.cn2 基于偽譜法和遺傳算法的混合求解策略
3 仿真驗證與結(jié)果分析
4 結(jié) 論