龔柏春,王 沙,張偉夫,周 亮,李 爽
(1. 南京航空航天大學航天學院,南京 210016;2. 上海衛(wèi)星工程研究所,上海 201109;3. 航天科工空間工程發(fā)展有限公司,北京 100039)
編隊航天器因為具有相較于單個航天器的許多優(yōu)勢,成為學術界的研究熱點。例如,在太空任務中,單個航天器發(fā)生故障將直接導致任務失敗,而編隊航天器的冗余度設計可以在編隊某個成員發(fā)生故障時由備用航天器代替完成任務。除此之外,編隊航天器可以攜帶不同的載荷,完成單個航天器無法完成的多角度成像、通信中繼等任務。編隊航天器的飛行任務比較復雜,需要在協(xié)同飛行的過程中控制編隊成員之間的相對距離和方位,使整個編隊保持確定的幾何形態(tài),而完成編隊隊形控制的前提是編隊成員之間的精確相對導航。而要實現(xiàn)相對導航,集群成員之間首先需要進行相對測量,其次需要建立可靠通信連接實現(xiàn)信息的實時交換。受航天器載荷體積和功耗的限制,光學相機僅測角和無線電僅測距成為航天器自主相對導航的主要發(fā)展方向。
杜榮華等在僅有目標視線角測量的條件下,提出了一種空間非合作目標交會接近的自主檢測和跟蹤算法。周文雅等研究了一種改進的基于圖像特征點的快速定位和簡易旋轉算法,能夠提高雙目視覺無人機之間的相對定位精度。金澤明等聯(lián)合擴展卡爾曼濾波算法和擴展卡爾曼粒子濾波算法提高了空間非合作目標單目視覺位姿估計的精度和計算效率。然而無源相機僅測角相對導航受光照條件制約,且相機有視場角限制,在測量過程中需要不斷調整來跟蹤目標的方位,因此常用于非合作航天器的相對導航。
合作航天器利用數(shù)據(jù)鏈測距實現(xiàn)相對導航時,不需要考慮光學測量或無線電測量時的傳感器指向問題,相對導航設備質量輕、功耗低。Burchett等研究了飛行器在三維空間的僅測距相對導航算法,得出系統(tǒng)是局部弱可觀的結論。Wang等和Christian分析了Clohessy-Wiltshire(CW)動力學模型下的僅測距模糊軌道,得到僅測距相對導航存在三種鏡像模糊軌道和四種變形模糊軌道的結論。Wang等也分析了TH動力學模型下的僅測距模糊軌道,指出僅測距相對導航理論上存在三種鏡像模糊軌道,仿真中存在額外的四種變形模糊軌道。Gong等研究了近程圓或近圓軌道航天器編隊利用傳感器偏于質心安裝提供的桿臂效應來避免僅測距收斂于模糊軌道的方法,但是Wang團隊和Gong等所采用的CW和TH方程均沒有考慮航天器在軌的各種攝動因素。Shalaby等研究了利用在同一個飛行器安裝多個用于測距的通信信標,提升了僅測距相對導航系統(tǒng)的可觀測度。但是安裝在同一架飛行器上的信標基線受飛行器實際尺寸的限制,因此該方案更適合于近距離或航天器交會對接場景下的相對導航。Xiong等通過在編隊中引入一架無人機作為參考信標,文獻[12-15]利用多個固定點作為參考信標,研究了超寬帶測距相對定位方法。Martel等利用超寬帶至少六次的距離測量信息和V-SLAM測量的各飛行器從各原點出發(fā)的位移信息,提出了一種獨特的四自由度相對位姿定位方案。
本文針對近地軌道航天器編隊存在的自主相對導航需求,研究利用低成本數(shù)據(jù)鏈測距實現(xiàn)航天器相對導航的方法。論文推導了在地球非球形引力攝動下的航天器高精度相對運動模型,分析了基于該動力學模型設計的僅測距相對導航系統(tǒng)的可觀測性。此外,論文設計了以四個航天器為例的編隊分布式估計策略并研究了相對導航的誤差傳播規(guī)律,為大型航天器編隊的相對導航算法設計奠定了基礎。
本節(jié)定義描述航天器絕對運動的地心赤道慣性坐標系和相對運動的航天器軌道坐標系,第2節(jié)將在此基礎上推導航天器在J2攝動下的相對運動方程。
地心赤道慣性坐標系:原點位于地心,軸指向春分點,軸垂直于赤道平面并且與地球自轉角速度方向一致,軸位于赤道平面內與軸、軸構成右手直角坐標系。
航天器軌道坐標系:原點位于航天器質心,軸沿徑向方向由地心指向航天器質心,軸垂直于軌道平面指向軌道角速度方向,位于軌道平面內與軸、軸組成右手正交坐標系。
相對運動模型的精度直接影響著航天器相對導航的精度,已有的航天器相對導航研究所使用的動力學模型都是基于無攝動二體動力學推導的CW方程或者TH方程,具有一定的局限性。對于近地軌道航天器,特別是中低軌道航天器,地球非球形引力攝動是主要攝動源之一,而J2攝動又是地球非球形引力攝動中的最主要部分。因此為了實現(xiàn)近地軌道航天器的高精度相對導航,本文首先要建立航天器在J2攝動下的相對運動模型。
記航天器在系下的位置為=[,,],則J2攝動下航天器的動力學方程如下
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
(11)
(12)
(13)
理論上,對于近地軌道航天器,J2攝動相對運動模型因為考慮了地球非球形引力攝動源中最主要的J2攝動項,因此比CW和TH相對運動模型具有更高的精度。為了對比三種相對運動模型的精度,進行如下仿真,仿真中航天器絕對運動學只考慮地心引力和J2攝動項。根據(jù)第1節(jié)航天器軌道坐標系的定義,可以利用航天器在系下的位置換算得到系下的相對位置,并以此作為三種不同動力學模型計算結果的參考,追蹤器和目標器軌道六根數(shù)設置分別如表1中航天器1和航天器2所示。表1中,,,,,,分別代表軌道的半長軸、偏心率、升交點赤經(jīng)、軌道傾角、近地點輻角和真近點角。航天器1和2相對距離為10 km到12 km,仿真步長為10 s,總仿真時長為2個軌道周期,約3.4 h。
表1 航天器編隊軌道六根數(shù)設置Table 1 Classical orbital elements setting for spacecraft formation
仿真結果中,隨著時間的推移,根據(jù)相對運動模型遞推的狀態(tài)誤差逐漸增加,這是因為這三種相對運動模型本質上都是只保留了泰勒展開后一階項的線性相對運動模型。其中,CW相對運動模型狀態(tài)遞推誤差在0.5和1.5個軌道周期時達到最大值0.23%,TH相對運動模型狀態(tài)遞推誤差在2個軌道周期時達到最大值0.16%。J2攝動相對運動模型精度最高,狀態(tài)遞推誤差在2個軌道周期時達到最大值0.06%。
合作航天器有兩種模式可以實現(xiàn)數(shù)據(jù)鏈測相對距離,其中一種是飛行時間差(Time difference of arrival, TDOA)測距模式。記Δ是航天器2信號接收時間與航天器1信號發(fā)送時間之差,由此計算航天器之間距離
=Δ
(14)
式中:代表光速。TDOA測距是最簡單的測距方法,航天器之間的通信可以是單向的,但是它要求航天器時鐘必須是同步的。另一種是飛行時間(Time-of-flight, TOF)測距模式,Δ是航天器2接收信號時間與航天器1發(fā)送信號時間之差,Δ是航天器1接收信號時間與航天器2發(fā)送信號時間之差,航天器相對距離為
(15)
利用TOF測距時,航天器之間通信是雙向的,可以避免航天器鐘差帶來的測距誤差,因此本文將采用TOF測距模式。若時間測量誤差滿足高斯白噪聲分布,由于和Δ具有線性關系,則數(shù)據(jù)鏈測距可以建模為
(16)
可觀測性分析是指在不考慮系統(tǒng)噪聲和觀測噪聲的條件下,根據(jù)歷史測量信息能否唯一確定系統(tǒng)狀態(tài)初值,它決定了濾波算法能否有效地估計出系統(tǒng)的狀態(tài)。本節(jié)將根據(jù)第2節(jié)建立的動力學模型和第3節(jié)建立的觀測模型,分析相對導航系統(tǒng)可能存在的模糊軌道。因為J2攝動相對運動模型比較復雜,非線性系統(tǒng)可觀測性分析的李導數(shù)方法不再適用,所以本節(jié)將結合理論和數(shù)值仿真的方法分析系統(tǒng)的可觀測性。
僅測距相對導航因為缺少相對方位信息,系統(tǒng)可觀測性不足,往往存在模糊軌道。模糊軌道與真實軌道滿足相同動力學模型并且具有相同測距輸出,它與真實軌道的區(qū)別在于系統(tǒng)狀態(tài)的初值不同。Wang等的研究結果表明,僅測距相對導航可能存在的模糊軌道一共7種,見表2。其中,(a)、(b)和(c)類模糊軌道因為和真實軌道形狀大小相同,被稱為鏡像模糊軌道;(d)、(e)、(f)和(g)類模糊軌道和真實軌道形狀和大小不同,被稱為變形模糊軌道。
表2 僅測距模糊軌道初始狀態(tài)Table 2 Initial state of range-only ambiguous relative orbits
對于如下標準線性時變系統(tǒng)
(17)
根據(jù)式(17)設計的僅測距相對導航系統(tǒng),記模糊軌道初始狀態(tài)為′=-。可以證明,在動力學模型的約束下,該模糊軌道在任意時刻的狀態(tài)量′()滿足
′()=-()
(18)
它與真實軌道狀態(tài)()是相反數(shù)關系,因此與真實軌道具有同樣測距輸出,是如表2所示的(c)類鏡像模糊軌道。CW方程、TH方程和本文所建立的J2攝動相對運動方程都可以表示為式(17),因此基于這三種相對運動模型的僅測距相對導航系統(tǒng)都存在該類鏡像模糊軌道。但是對于式(17)所示的線性時變系統(tǒng),因為控制量的輸入,初始狀態(tài)為′=-的模糊軌道將不一定滿足式(18),因此可能避免模糊軌道。這種思想與Woffinden等通過軌道機動來解決僅測角相對導航的不可觀測問題很相似。
(19)
Wang等在論文中通過數(shù)值仿真發(fā)現(xiàn),保留CW方程或者TH方程推導過程中泰勒展開的二階項、三階項,可以提高僅測距相對導航系統(tǒng)的可觀測性,避免濾波收斂于模糊軌道。下面通過數(shù)值仿真分析式(9)中的J2攝動項,是否同樣有抑制濾波發(fā)散的作用。對于表1中的航天器1和2,使用無味卡爾曼濾波(Unscented Kalman filter, UKF)進行相對運動狀態(tài)的估計,仿真中假設追蹤器在系下的位置和速度精確已知。濾波關鍵參數(shù)設置見表3,總仿真時長為10000 s,約2個軌道周期。
表3 濾波算法參數(shù)設置Table 3 Simulation parameters setting for Kalman filter
定義僅測距相對導航收斂域為能使濾波收斂于真實軌道的初始估計誤差集合,收斂域越大,表示系統(tǒng)的可觀測性越好。但是在比較考慮J2攝動和不考慮J2攝動(采用TH模型)系統(tǒng)的收斂域時,因為不能窮舉所有的初始估計誤差,因此選取如表4 所示的8個方向進行比較。
表4 初始估計誤差的八個方向Table 4 Initial error setting for the eight directions
(20)
圖1是兩種相對運動模型的距離估計誤差圖,由圖1(a)可知,僅測距相對導航不同方向的收斂性是不一樣的。通過對比圖1(a)和圖1(b)可知,J2攝動模型和TH模型在選定的8個方向上具有相同的收斂性。另外,J2攝動模型具有更高的相對導航精度。例如在方向1上,當=03時,TH模型對應的RMSE為245 m,而J2攝動模型對應的RMSE為19 m。因此,可以預測J2攝動模型與TH模型存在相同的收斂域,都至少存在如表2所示的(a)、(b)和(c)三種鏡像模糊軌道,下面將對該結論進行驗證。
圖1 航天器距離估計誤差Fig.1 Graphs of relative distance estimation error
無味卡爾曼濾波4組狀態(tài)初值設置見表2中真實軌道和鏡像模糊軌道狀態(tài)初值,其余濾波參數(shù)設置見表3。雙星編隊的軌道參數(shù)設置見表1中航天器1和2,通過設置不同濾波初值可以分別得到真實軌道和鏡像模糊軌道。圖2是J2攝動下僅測距相對導航系統(tǒng)的鏡像模糊軌道與真實軌道。
圖2 僅測距相對導航鏡像模糊軌道Fig.2 Mirror ambiguous orbits for range-only relative navigation
從圖2可以看出,因為J2攝動項的存在,藍色實線表示的真實軌道不再閉合。但是三種鏡像模糊軌道與真實軌道在三維空間內仍然具有相同的形狀和大小,呈現(xiàn)“鏡像”特性。驗證了之前的可觀測性分析結論:
1) 對于式(17)所示的僅測距相對導航系統(tǒng),始終存在鏡像模糊軌道;
2) 根據(jù)式(9)與TH方程設計的僅測距相對導航系統(tǒng)可觀測性一樣,都至少存在三種鏡像模糊軌道。
Wang團隊研究了由三個航天器組成編隊的分布式相對導航算法,并利用一致性濾波來提高系統(tǒng)的可觀測性。三個航天器是相對簡單的航天器編隊,本節(jié)以四個航天器為例,研究不同分布式估計策略的相對導航精度與導航誤差傳播特性。
設無向圖由頂點集合和邊集合組成,頂點表示編隊中的航天器,邊表示兩個航天器相鄰,它們之間相互通信并估計彼此的相對運動狀態(tài)。為了實現(xiàn)編隊中任意兩個成員的相對導航,無向圖必須是連通的。這樣即使兩個航天器在無向圖中不相鄰,它們之間的相對運動狀態(tài)也可以通過如下坐標轉換矩陣與矢量運算得到
(21)
(22)
(23)
在某次更新相對運動狀態(tài)時,無向圖的邊表示執(zhí)行一次濾波算法,記計算量為。若無向圖G的邊個數(shù)為,則編隊總的計算量為。圖3是四個航天器組成編隊的分布式估計策略,圖3(a)是最簡單的情形,其計算量也最少(為3),圖3(b)、(c)和(d)估計策略的計算量分別為4,5和6。以圖3(a) 為例,航天器2相對于航天器1的運動信息可以通過濾波算法獲得,而航天器3和航天器4相對于航天器1的運動信息需要通過式(21)所示的關系計算得到。
圖3 四個航天器組成編隊的分布式估計策略Fig.3 Decentralized estimation strategy for spacecraft formation
為了研究編隊相對導航誤差傳播規(guī)律,本節(jié)采用蒙特卡洛打靶法。軌道和濾波參數(shù)設置分別見表1和表3,濾波初值誤差δ為相對運動狀態(tài)初值的0.1倍。另外,與4.3節(jié)可觀測性數(shù)值分析的仿真中假設追蹤器在系下的位置和速度精確已知不同,本節(jié)與第6節(jié)的仿真中均為表1所示四個航天器在系下的初始位置和速度添加均值為0、方差分別為10 m和0.1 m·s的高斯誤差。
以圖3(a)最簡單三條邊估計策略為例,圖4是航天器2、3、4相對于航天器1的200次蒙特卡洛打靶仿真的距離估計誤差統(tǒng)計結果。圖4中藍色雙劃線、橙色實線和紅色點劃線分別代表估計誤差的+3σ邊界、均值和-3σ邊界,邊界值表示導航精度,邊界范圍表示導航穩(wěn)定性。8000 s時,航天器1和2相對距離估計誤差在13 m到18 m之間。相比之下,8000 s時航天器1和3相對距離估計誤差較大,在42 m到74 m之間。8000 s時航天器1和4相對距離估計誤差最大,在77 m到150 m之間。
圖4 相鄰和非相鄰成員相對距離估計誤差Fig.4 Relative distance estimation error for nearby and no-nearby members
(24)
(25)
式中:表示相關的狀態(tài)量估計誤差。另外,不同航天器進行相對導航時的濾波算法和數(shù)據(jù)鏈測距結果是相互獨立的,相對導航誤差也是相互獨立的。式(24)和式(25)的導航誤差是近似線性疊加的,這揭示了編隊航天器相對導航的誤差傳播規(guī)律。因此,在實現(xiàn)編隊中兩個航天器的相對導航時,應盡可能利用這兩個航天器的相對測距信息并進行濾波。
式(21)是航天器相對運動狀態(tài)需要滿足的物理約束,通過在濾波狀態(tài)更新算法中引入該等式確定的先驗估計,可以設計一致性濾波算法。一致性濾波算法與UKF算法結合,便得到一致性無味卡爾曼濾波算法(CUKF)。因為時間更新方程和UKF相同,下面僅給出一致性濾波算法的狀態(tài)更新方程
(26)
以圖3(b)左邊四邊形環(huán)估計策略為例,研究CUKF算法下航天器相對導航系統(tǒng)可觀測性。仿真的軌道和濾波參數(shù)設置見表1和表3,令航天器1對航天器2的初始相對導航誤差為δ=2δ,δ見表4。圖5對比了UKF和CUKF濾波結果的相對距離估計誤差,由圖可知,在CUKF算法下僅測距相對導航系統(tǒng)是收斂的,驗證了一致性算法對于提高系統(tǒng)可觀測性的作用。
圖5 UKF與CUKF相對距離估計誤差Fig.5 Relative distance estimation error under UKF and CUKF
本文研究了近地軌道航天器在不完備測量即僅有相對距離情形下的相對導航問題,建立了航天器在地球非球形引力J2攝動下的僅測距相對導航系統(tǒng),并對系統(tǒng)進行了可觀測性分析和分布式估計策略設計。論文的主要研究成果包括四個方面:
1) 推導了航天器在地球非球形引力攝動下線性的J2攝動相對運動模型,該模型適用于航天器運行在圓或橢圓軌道的情形;
2) 可觀測性分析結果表明,利用J2攝動相對運動模型設計的僅測距相對導航系統(tǒng)不可觀測,存在三種鏡像模糊軌道;
3) 對于四個航天器組成的編隊,設計了六種不同的分布式估計策略,理論上分析并通過數(shù)值仿真校驗了航天器相對導航的誤差具有近似線性傳播的特性;
4) 對比了一致性算法和無味卡爾曼濾波算法的蒙特卡洛打靶結果,驗證了一致性算法對于提高系統(tǒng)可觀測性的作用。
下一步的研究將從利用航天器軌道機動提高僅測距相對導航系統(tǒng)可觀測性的角度出發(fā),研究僅測距編隊控制問題。