摘要: 近年來,地面站資源測控數(shù)傳任務的一體化調(diào)度方法受到了越來越多的關(guān)注。針對任務隨遇處理條件下的測控數(shù)傳資源調(diào)度問題,建立了面向多個優(yōu)化目標的測控數(shù)傳資源動態(tài)重調(diào)度數(shù)學模型,提出基于啟發(fā)式規(guī)則和多目標非支配解排序遺傳算法(non-dominated sorting genetic algorithm III, NSGA-III)的地面站測控數(shù)傳資源一體化動態(tài)重調(diào)度算法,可生成側(cè)重不同優(yōu)化目標的多個規(guī)劃方案供規(guī)劃人員備選。實驗結(jié)果表明該方法能有效解決測控數(shù)傳資源多目標動態(tài)重調(diào)度問題。
關(guān)鍵詞: 測控資源; 數(shù)傳資源; 動態(tài)重調(diào)度; 多目標優(yōu)化; 演化算法
中圖分類號: TP 391
文獻標志碼: A
DOI:10.12305/j.issn.1001-506X.2024.11.16
Dynamic rescheduling method for TTamp;C and data transmission resources based on multi-objective optimization
CHEN Hao, SUN Gang, PENG Shuang*, WU Jiangjiang
(College of Electronic Science and Technology, National University of Defense Technology, Changsha 410073, China)
Abstract: In recent years, integrated scheduling methods for the telemetry, track and command (TTamp;C) tasks and data transmission (DT) tasks of ground stations have attracted more and more attention. To address the scheduling problem of station resources under the condition of random arrival of emergency TTamp;C and DT tasks, a multi-objective optimization model is established for the TTamp;C and DT tasks dynamic rescheduling. Then a rescheduling method based on heuristic rules and non-dominated sorting genetic algorithm III (NSGA-III) is designed, allowing to generate multiple alternative planning schemes focusing on different optimization objectives for users. The experimental results show that the proposed algorithm can effectively solve the multi-objective dynamic rescheduling proplem of measurment and control data transmission resources.
Keywords: data transmission (DT) resource; telemetry, track and command (TTamp;C) resource; dynamic rescheduling; multi-objective optimization; evolutionary algorithm
0 引 言
近年來,衛(wèi)星在經(jīng)濟和安全等多個領(lǐng)域的創(chuàng)新應用不斷涌現(xiàn),在軌衛(wèi)星的數(shù)量和種類快速增加,而衛(wèi)星地面站的數(shù)量卻幾乎沒有變化,這導致其在星地通信中處于稀缺狀態(tài)。如何合理統(tǒng)籌使用有限的衛(wèi)星地面站資源以發(fā)揮其最佳效益,是衛(wèi)星地面站資源規(guī)劃所研究的問題[1]。為此,國內(nèi)外相關(guān)領(lǐng)域的學者和研究機構(gòu)開展了大量卓有成效的研究工作[2-5],也取得了較好的實踐效果。但這些研究工作主要面向確定性規(guī)劃場景,即假定在規(guī)劃周期內(nèi)所涉及的要素是確定不變的[6],鮮有面向動態(tài)需求的地面站資源重調(diào)度的研究工作。隨著多樣化應用需求的出現(xiàn),迫切需要面向動態(tài)需求的衛(wèi)星地面站資源重調(diào)度方法,以滿足衛(wèi)星管理機構(gòu)的實際需求[7]。
在現(xiàn)有文獻中,針對地面站資源動態(tài)重調(diào)度的研究較少,但針對衛(wèi)星資源動態(tài)重調(diào)度的研究成果較為豐碩,具有一定的參考價值。所謂動態(tài)重調(diào)度,即在已有規(guī)劃方案的基礎(chǔ)上對規(guī)劃方案予以調(diào)整以滿足動態(tài)需求,通常以完全重調(diào)度或增量重調(diào)度方式生成新的規(guī)劃方案。其中,完全重調(diào)度方式放棄已有規(guī)劃方案,重新構(gòu)建涵蓋動態(tài)需求的確定性規(guī)劃場景,并重新予以求解,其重調(diào)度計算時間較長,且新舊方案之間差別較大,在一定程度上影響了其在實際中的廣泛應用;增量重調(diào)度方法則充分考慮已有規(guī)劃方案,以基于規(guī)則的啟發(fā)式算法、智能優(yōu)化算法或機器學習方法將動態(tài)需求插入已有規(guī)劃方案,在實際中應用更為廣泛[8]。
基于啟發(fā)式規(guī)則的動態(tài)重調(diào)度方法按照任務重要性、任務沖突程度、任務靈活度、任務執(zhí)行機會等要素構(gòu)造啟發(fā)式規(guī)則[6,9-13],搜索確定新任務插入的位置和與之沖突的任務的處理方式(直接丟棄、移位再插入,或與別的任務合并等)。
基于智能優(yōu)化算法的重調(diào)度方法通常以已有規(guī)劃方案為參考構(gòu)建初始種群并予以求解。Li等[13]設計局部信息素調(diào)整修正策略并將其嵌入遺傳-蟻群混合優(yōu)化算法,提出一種修正式重調(diào)度算法。Li等[14]針對衛(wèi)星地面站數(shù)傳動態(tài)重調(diào)度問題建立多約束多路徑規(guī)劃模型,提出了K-最短路徑遺傳算法用以求解。Zheng等[15]基于混合多目標動態(tài)變異遺傳(multi-objective hybrid dynamic mutation genetic algorithm, MO-HDM GA)算法設計重調(diào)度算法。Chen等[16]面向地觀測衛(wèi)星資源動態(tài)重調(diào)度需求,提出一種基于記憶效應的吱吱輪優(yōu)化(squeaky-wheel optimization, SWO)算子,該算子由構(gòu)造器、分析器以及優(yōu)先級排序器構(gòu)成,其中分析器以任務重要性和任務覆蓋性加權(quán)之和計算動態(tài)任務的責罰值;優(yōu)先級排序器以責罰值為準則執(zhí)行排序操作;構(gòu)造器執(zhí)行插入操作及沖突消解,此三者以迭代方式搜索最優(yōu)解。林鵬等[17]采用進化計算和啟發(fā)式規(guī)則相結(jié)合的方式求解中繼星數(shù)傳資源的動態(tài)任務重調(diào)度問題,取得了較好的效果。
近年來,隨著機器學習方法的快速發(fā)展和廣泛應用,很多學者嘗試用基于機器學習模型的方法求解航天領(lǐng)域中的任務重調(diào)度問題。Chen等[16]設計機械學習算子配合遺傳算法框架,求解觀測任務變化條件下的數(shù)傳資源動態(tài)重調(diào)度問題。Wang等[18]充分考慮衛(wèi)星周期性重訪和觀測目標周期性緩慢變化的特點,設計了案例學習與修正方法,通過對歷史案例的學習,縮減規(guī)劃計算時間,使得該方法可應用于應急決策。Wang等[19]基于強化學習方法研究應急任務的動態(tài)重調(diào)度方法,可滿足應急任務快速響應需求。羅棕等[20]設計基于深度神經(jīng)網(wǎng)絡和啟發(fā)式搜索的衛(wèi)星任務應急規(guī)劃方法,能實現(xiàn)方案的準實時決策。
總體而言,基于規(guī)則的啟發(fā)式重調(diào)度方法求解效率高,能夠?qū)崟r響應動態(tài)需求,但求解的優(yōu)化性取決于啟發(fā)式規(guī)則的設計和具體任務場景,難以克服性能波動[8]?;谥悄軆?yōu)化算法的重調(diào)度方法在求解的優(yōu)化性上一般優(yōu)于基于規(guī)則的啟發(fā)式重調(diào)度方法,但計算時間更長。隨著計算資源能力的不斷增強,基于智能優(yōu)化算法的重調(diào)度方法受到了越來越多的重視?;跈C器學習的重調(diào)度方法在訓練數(shù)據(jù)質(zhì)量高、模型訓練充分且實際規(guī)劃場景與訓練場景接近的情況下,計算時間短且優(yōu)化程度高。但在實際工程中,上述3個條件較難同時滿足。因此,基于機器學習技術(shù)的重調(diào)度方法如何在工程實際中有效應用,還需進一步研究。
本文擬基于智能優(yōu)化算法,研究面向測控數(shù)傳資源一體化的動態(tài)重調(diào)度方法,其中測控數(shù)傳資源一體化是近年來衛(wèi)星地面站資源呈現(xiàn)的一種新的特性,即衛(wèi)星地面站測控設備與數(shù)傳設備在功能上趨同,測控設備具備執(zhí)行數(shù)傳任務(衛(wèi)星有效載荷數(shù)據(jù)接收任務)的能力,數(shù)傳設備也具備執(zhí)行測控任務(衛(wèi)星遙測、遙控及外測任務)的能力,二者具備兼容性,可較大程度緩解星地通信中地面站資源匱乏的現(xiàn)實難題[21-22]。另一方面,測控數(shù)傳任務一體化調(diào)度也導致了更大的搜索空間,更復雜的約束嵌套,使算法更容易陷入局部最優(yōu)[23-24]。
本質(zhì)上,地面站測控數(shù)傳資源一體化動態(tài)重調(diào)度問題是一個典型的多目標優(yōu)化問題[23,25]。一方面,要求重調(diào)度結(jié)果優(yōu)化性要盡量好,而另一方面,又要求新方案和原有方案之間應該盡量接近,以減小地面站和衛(wèi)星的控制指令變更度,提升新方案的可用性。但目前,采用多目標優(yōu)化算法研究地面站資源動態(tài)任務重規(guī)劃的研究尚未見報道。
本文首先對地面站測控數(shù)傳資源一體化動態(tài)重調(diào)度問題進行分析,在此基礎(chǔ)上建立了數(shù)學模型,提出了用于多目標優(yōu)化的基于非支配解排序的遺傳算法Ⅲ(non-dominated sorting genetic algorithm Ⅲ, NSGA-Ⅲ)[26],并設計基于領(lǐng)域知識的啟發(fā)式規(guī)則,有效縮小問題搜索空間。最后,通過實驗證明本文所提方法的可用性及有效性。
本文章節(jié)組織如下:第1節(jié)對地面站測控數(shù)傳資源一體化的動態(tài)重調(diào)度問題進行描述,并建立了多目標優(yōu)化決策模型;第2節(jié)介紹基于啟發(fā)式規(guī)則和NSGA-Ⅲ的多目標動態(tài)重調(diào)度方法;第3節(jié)通過實驗驗證了所提算法的有效性,第4節(jié)進行了總結(jié)和展望。
1 數(shù)學模型建立
本文涉及的動態(tài)需求僅限于新任務隨機到達的情況,不考慮設備狀態(tài)變化及其他特殊情況。本節(jié)將對測控數(shù)傳資源一體化的動態(tài)重調(diào)度問題進行數(shù)學描述,構(gòu)建約束滿足模型,并給出優(yōu)化目標函數(shù)、變量及約束條件。
1.1 問題描述
(1) 給定問題規(guī)劃時間段[ST,ET,ΔT],要求所有規(guī)劃要素均限定在給定規(guī)劃時間段內(nèi)。其中,ST為規(guī)劃起始時間,ET為規(guī)劃結(jié)束時間,ΔT是規(guī)劃時間段總時長。
(2) 設參與規(guī)劃的I顆衛(wèi)星組成衛(wèi)星集合S,?si∈S,si≡lt;idsi,Ωgt;,其中idsi表示衛(wèi)星標識符,Ω表示衛(wèi)星軌道信息。
(3) 設參與規(guī)劃的V個衛(wèi)星地面站組成衛(wèi)星地面站集合G,?gv∈G,gv≡lt;idgv,ζgt;,其中idgv表示衛(wèi)星地面站標識符,ζ表示地面站地理信息。
(4) 設參與規(guī)劃的K套天線資源組成天線資源集合A,?ak∈A,ak≡lt;idak,idakggt;,其中idak為天線標識符;idakg是天線ak所屬的地面站標識符。
(5) 地面站與衛(wèi)星之間只能在可見時間窗內(nèi)傳輸數(shù)據(jù)。將規(guī)劃時間段[ST,ET]內(nèi)的所有衛(wèi)星地面站可見時間窗口按起始時間升序排列,記為ω1,ω2,…,ωL。其中,L表示可見時間窗數(shù)量,W表示可見時間窗口集。?ωl∈W, ωl≡lt;idωl,idωls,idωlg,idωla,stωl,etωl,dtωl,γωlgt;。其中,idωl為可見時間窗口標識符,idωls表示該可見時間窗對應的衛(wèi)星,idωlg表示該可見時間窗對應的地面站,idωla表示對應的天線資源,stωl、etωl分別表示可見時間窗的開始時間、結(jié)束時間,dtωl表示該可見時間窗的持續(xù)時長,γωl為布爾類型的決策變量。
(6) 以Finit表示初始調(diào)度結(jié)果集合,則對于?fi∈Finit,有fi≡lt;idfi,idfiω,rfist,rfiet,rfidtgt;;N=|Finit|表示數(shù)量。當idfi=idr_ttcp時,表示執(zhí)行測控任務r_ttcp(r_ttcp∈RTTC;r_ttcp≡lt;idr_ttcp,idr_ttcps,tminr_ttcp,tvertr_ttcp,revr_ttcp,rankr_ttcpgt;;RTTC表示初始測控任務集,idr_ttcp是該測控任務標識符,idr_ttcps是衛(wèi)星標識符,表示被測控的衛(wèi)星;tminr_ttcp和tvertr_ttcp分別表示最短任務持續(xù)時長和最短任務準備時長;revr_ttcp是任務收益,rankr_ttcp表示任務性質(zhì);當rankr_ttcp=urgency時,表示r_ttcp為應急快速響應任務;當rankr_ttcp=normal時,r_ttcp為常規(guī)任務。應急任務是更重要的任務,假設一個應急任務的收益大于執(zhí)行全體常規(guī)任務的收益,從而保證應急任務能優(yōu)先執(zhí)行);當idfi=idr_dtq時,表示執(zhí)行數(shù)傳任務r_dtq(r_dtq∈RDT,r_dtq≡lt;idr_dtq,idr_dtqs,tminr_dtq,tvertr_dtq,revr_dtq,rankr_dtqgt;,RDT表示初始數(shù)傳任務集);當idfi=idr_dtqamp;idr_ttcp時,說明數(shù)傳任務r_dtq和測控任務r_ttcp同時執(zhí)行;idfiω是fi對應的可見時間窗標識,rfist和rfiet分別表示任務開始時間與結(jié)束時間,任務執(zhí)行時長用rfidt表示。
(7) 針對新任務隨機產(chǎn)生的情況,設包含X個新到達測控任務:new_ttc_r1,new_ttc_r2,…,new_ttc_rx,以new_RTTC表示新到達的測控任務集合,對于?new_ttc_rx∈new_RTTC,new_ttc_rx≡lt;idnew_ttc_rx,idnew_ttc_rxs,tminnew_ttc_rx,tvertnew_ttc_rx,revnew_ttc_rx,ranknew_ttc_rxgt;;設其中包含Y個新到達數(shù)傳任務new_dt_r1,new_dt_r2,…,new_dt_ry,以new_RDT表示數(shù)傳任務集合。對于?new_dt_ry∈new_RDT,new_dt_ry≡lt;idnew_dt_ry,idnew_dt_rys,tminnew_dt_ry,tvertnew_dt_ry,revnew_dt_ry,ranknew_dt_rygt;。
(8) 以new_F表示動態(tài)重調(diào)度結(jié)果集,對?new_fm∈new_F,有new_fm≡lt;idnew_fm,idnew_fmω,r_stnew_fm,r_etnew_fm,r_dtnew_fmgt;,M=|new_F|表示數(shù)量。
1.2 動態(tài)重調(diào)度多目標優(yōu)化模型
本文僅考慮因測控與數(shù)據(jù)傳輸任務變化導致的動態(tài)重調(diào)度,不考慮在任務執(zhí)行過程中,設備狀態(tài)變化(故障或修復)等情況。實際上,設備狀態(tài)變化的動態(tài)重調(diào)度情況亦可以轉(zhuǎn)化為任務變化的情況。本節(jié)首先介紹模型包括的集合、函數(shù)、決策變量以及約束條件。
(1) 集合
new_Fnew_TTC:在動態(tài)重調(diào)度結(jié)果集合中執(zhí)行new_RTTC的子集,new_Fnew_TTC可形式化表示為new_Fnew_TTC={new_fm|idnew_fm∩idnew_ttc_rx≠?, 1≤m≤M, 1≤x≤X}。
new_Fnew_DT:在動態(tài)重調(diào)度結(jié)果集合中執(zhí)行new_RDT的子集。new_Fnew_DT可形式化表示為new_Fnew_DT={new_fm|idnew_fm∩idnew_dt_ry≠?, 1≤m≤M, 1≤y≤Y}。
new_Finit:在動態(tài)重調(diào)度結(jié)果集合中執(zhí)行初始規(guī)劃方案Finit涉及任務的子集。new_Finit可形式化表示為new_Finit={new_fm|idnew_fm∩idfi≠?,1≤m≤M,1≤i≤N}。
new_Fak:在動態(tài)重調(diào)度結(jié)果集合中執(zhí)行天線資源ak的任務子集。new_Fak可形式化表示為new_Fak={new_fm|idnew_fmω=idωl,idωla=idak}。
new_Fsi:在動態(tài)重調(diào)度結(jié)果集合中屬于衛(wèi)星si的任務子集。new_Fsi可形式化表示為new_Fsi={new_fm|idnew_fmω=idωl,idωls=idsi}。
(2) 函數(shù)
ρ(new_fm)為動態(tài)重調(diào)度結(jié)果new_fm的任務收益。如果測控/數(shù)傳任務new_fm執(zhí)行時長大于或等于該任務最小執(zhí)行時長要求,則執(zhí)行該任務的收益等于預期收益;否則,其實際收益為按執(zhí)行時長比例降低后的預期收益。
由于new_fm可能為測控任務、數(shù)傳任務或兩者的合并任務,所以需要分別計算。
若?new_fm為測控任務,即?new_fm∈new_Fnew_TTC,如果r_ttcx∈RTTC,使得idnew_fm∩ididnew_ttc_rx≠?,則
ρ(new_fm)=revnew_ttc_rx, r_dtnew_fm≥tminnew_ttc_rx
r_dtnew_fmtminnew_ttc_rx·revnew_ttc_rx, 其他
同理,若?new_fm為數(shù)傳任務,即?new_fm∈new_Fnew_DT,如果r_dty∈RDT,使得idnew_fm∩idnew_dt_ry≠?,則
ρ(new_fm)=revnew_dt_ry, r_dtnew_fm≥tminnew_dt_ry
r_dtnew_fmtminnew_dt_ry·revnew_dt_ry, 其他
Θ(new_Fnew_TTC)為new_Fnew_TTC集合的任務收益,即執(zhí)行測控任務集new_RTTC的總收益,表示如下:
Θ(new_Fnew_TTC)=∑fm∈new_Fnew_TTCρ(fm)
Θ(new_Fnew_DT):new_Fnew_DT集合的任務收益,即執(zhí)行數(shù)傳任務集new_RDT的總收益。
Θ(new_Fnew_DT)=∑fm∈new_Fnew_DTρ(fm)
η為動態(tài)重調(diào)度收益率,表示如下:
η=Θ(new_Fnew_TTC)+Θ(new_Fnew_DT)∑Xx=1revnew_ttc_rx+∑Yy=1revnew_dt_ry
動態(tài)重調(diào)度收益率的物理意義指經(jīng)過了動態(tài)重調(diào)度,實際獲得收益占總預期收益的比例。
φ(a,b)為動態(tài)重規(guī)劃結(jié)果一致性度量函數(shù),表示如下:
?a∈new_Finit,b∈Finit,
φ(a,b)=1, (a=b)∨(ranka=normal)
0, 其他
可見,如果一個任務是應急快速響應任務,則不計入方案一致性的計算中。
Φ(a,b)為規(guī)劃結(jié)果集合一致性度量函數(shù),表示如下:
?pa∈new_Finit, pb∈Finit
Φ(pa,pb)=∑pa∈new_Finit∑pb∈Finitφ(pa,pb)
為重調(diào)度變更率,表示如下:
=1-Φ(new_Finit,F(xiàn)init)|Finit|
(3) 決策變量
γωl為布爾邏輯變量。對于?ωl∈W,
γωl=0, 在可見時間窗口ωl不規(guī)劃任務
1, 在可見時間窗口ωl規(guī)劃任務
r_stnew_fm為時間變量,決定new_fm的起始時間。
r_etnew_fm為時間變量,決定new_fm的結(jié)束時間。
基于上述集合、函數(shù)和決策變量定義,地面站測控數(shù)傳資源一體化多目標動態(tài)重調(diào)度問題的優(yōu)化目標可定義如下:
F(χ1,χ2)為優(yōu)化目標函數(shù),表示如下:
F(χ1,χ2)=min{1-η,}
即對于重調(diào)度結(jié)果,從收益率和變更率兩個指標上進行優(yōu)化。模型中包含的約束條件如下。
約束條件 1:規(guī)劃時間段約束。本文規(guī)劃的測控任務和數(shù)傳任務要求均發(fā)生在規(guī)劃時間段[ST,ET,ΔT]之內(nèi)。
?ωi∈W→[stωi,etωi] [ST,ET]
?fm∈new_F→[r_stfm,r_etfm] [ST,ET]
約束條件 2:天線能力約束。天線資源ak在任意時刻至多只能與1顆衛(wèi)星互聯(lián)執(zhí)行測控/數(shù)傳任務,即動態(tài)規(guī)劃結(jié)果集中天線資源ak執(zhí)行的任務子集new_Fak在時間軸上無重疊。
對于?fi,fj∈new_Fak,有
[r_stfi,r_etfi]∩[r_stfj,r_etfj]=?
約束條件 3:衛(wèi)星能力約束。衛(wèi)星sk在任意時刻至多只能與某一天線資源處互聯(lián),即動態(tài)規(guī)劃結(jié)果集中屬于衛(wèi)星sk的任務子集new_Fsk在時間軸上無重疊。
對于?fi,fj∈new_Fsk,有
[r_stfi,r_etfi]∩[r_stfj,r_etfj]=?
約束條件 4:任務一體化約束。同一衛(wèi)星的數(shù)傳測控任務可能同時執(zhí)行。
對于?fi∈new_F,有
約束條件 5:任務切換時間間隔約束。對于任意天線資源ak,其由執(zhí)行任務fi切換成執(zhí)行任務fj必須滿足兩個條件:① fi執(zhí)行完畢;② 兩個任務間隔時間需大于最短任務準備時長。
對于?fi,fj∈new_Fak,有
約束條件 6:可見時間窗約束。只有在可見時間窗口內(nèi),才能執(zhí)行數(shù)傳/測控任務。
2 算法設計
顯然,在求解上述模型時,需要在考慮約束條件1~約束條件6的基礎(chǔ)上尋找收益率和變更率均較好的重調(diào)度方案。
如果只考慮約束條件2、約束條件3和優(yōu)化目標函數(shù)χ1,則該問題可轉(zhuǎn)化為經(jīng)典的多維0-1背包問題。多維0-1背包問題是典型的NP-完全(nondeterministic polynomial-complete)問題[27],目前尚無快速求解算法。測控數(shù)傳資源一體化動態(tài)重調(diào)度問題,涉及到多個優(yōu)化目標和更復雜的約束嵌套,問題組合爆炸特征更加明顯。因此,提出了基于NSGA-Ⅲ的地面站測控數(shù)傳資源一體化多目標動態(tài)重調(diào)度算法(dynamic rescheduling NSGA-Ⅲ oriented integration of TTamp;C resources and data transmission resources, DRS-NSGA-Ⅲ-TTCamp;DT)。
2.1 DRS-NSGA-Ⅲ-TTCamp;DT算法框架
DRS-NSGA-Ⅲ-TTCamp;DT算法的主要步驟如圖1所示。
算法首先針對涉及的中高軌衛(wèi)星的可見時間窗口執(zhí)行時窗分割操作,其目的在于使動態(tài)重規(guī)劃結(jié)果集new_F中,任務idnew_fm與可見時間窗口idnew_fmω一一對應,即可見時間窗口idnew_fmω只能規(guī)劃某一任務idnew_fm。對于中高軌衛(wèi)星,由于可見時間窗較長,通常僅會選擇可見時間窗中連續(xù)的部分時長執(zhí)行任務。以Δt為間隔將中高軌衛(wèi)星可見時間窗口切分為多個持續(xù)時長為tminnew_fm的子時窗。記經(jīng)時窗分割處理后的可見時間窗口集為Wdiv,其數(shù)量為|Wdiv|。
算法中的“啟發(fā)式規(guī)則”以初始規(guī)劃方案Finit以及動態(tài)需求new_RTTC、new_RDT為輸入,啟發(fā)式規(guī)則將new_RTTC及new_RDT中的部分動態(tài)需求插入初始規(guī)劃方案Finit,其中基于動態(tài)需求特征的啟發(fā)式插入規(guī)則主要執(zhí)行new_RTTC及new_RDT中應急快速響應任務的插入操作,以滿足時效性要求。值得注意的是,基于動態(tài)需求特征的啟發(fā)式插入規(guī)則在執(zhí)行插入操作時可能會導致初始規(guī)劃方案Finit中部分任務被移除。為方便描述,記由基于動態(tài)需求特征的啟發(fā)式插入規(guī)則處理后形成的規(guī)劃方案為first_F,F(xiàn)init中被移除的所有測控任務記為conflict_RTTC,被移除的所有數(shù)傳任務記為conflict_RDT;基于測控數(shù)傳資源一體化特征的啟發(fā)式插入規(guī)則針對動態(tài)需求中的一般任務以及Finit中被移除的相關(guān)任務執(zhí)行插入操作,即在滿足測控數(shù)傳資源一體化約束的條件下,將其插入規(guī)劃方案first_F,記由測控數(shù)傳資源一體化特征的啟發(fā)式插入規(guī)則處理后形成的規(guī)劃方案為second_F。應急快速響應任務與一般任務的區(qū)別在于時效性要求,應急快速響應任務具有時效性優(yōu)先級,需要將其安排于規(guī)劃時間段內(nèi)所允許的第1個可見時間窗口內(nèi)執(zhí)行,一般任務無時效性要求。
經(jīng)測控數(shù)傳資源一體化特征的啟發(fā)式插入規(guī)則處理后可能仍有部分任務未規(guī)劃,記其中的測控任務集為remaining_RTTC,數(shù)傳任務集為remaining_RDT。針對remaining_RTTC、remaining_RDT及second_F,以多目標智能優(yōu)化算法NSGA-Ⅲ予以求解,其中編碼建立remaining_RTTC及remaining_RDT,與可見時間窗口之間的數(shù)值對應關(guān)系。編碼后的數(shù)值序列稱為個體。初始化以隨機方式產(chǎn)生設定數(shù)量的個體,作為NSGA-Ⅲ算法的初始種群,交叉變異算子基于初始種群產(chǎn)生子代種群,初始種群及子代種群中的每個個體經(jīng)解碼策略處理后形成各自對應的remaining_RTTC及remaining_RDT規(guī)劃方案(記為remaining_F)。分別針對每個個體合并second_F與remaining_F,以沖突消解算子處理約束條件形成每個個體對應的規(guī)劃方案(記為third_F)。計算每個個體對應的規(guī)劃方案third_F在優(yōu)化目標函數(shù)上的數(shù)值,以帕累托非支配排序準則及擁擠距離排序準則更新種群。若算法滿足設定的結(jié)束條件,則輸出帕累托前沿(Pareto front)及其對應的規(guī)劃方案,即動態(tài)重規(guī)劃結(jié)果集new_F,否則執(zhí)行循環(huán)直至滿足結(jié)束條件,結(jié)束條件可以設置為算法迭代次數(shù)的上限。
如圖1所示,DRS-NSGA-Ⅲ-TTCamp;DT算法由基于啟發(fā)式規(guī)則的插入算法和基于多目標遺傳算法的優(yōu)化算法兩個階段組成,下面將分別進行介紹。
2.2 基于啟發(fā)式規(guī)則的插入算法
在DRS-NSGA-Ⅲ-TTCamp;DT算法中,首先使用啟發(fā)式規(guī)則在初始方案中選擇合適的位置,插入新到達的任務,分別是基于動態(tài)需求特征的啟發(fā)式插入規(guī)則和基于測控數(shù)傳資源一體化特征的啟發(fā)式插入規(guī)則,算法偽代碼描述如下。
算法1基于動態(tài)需求特征的測控任務啟發(fā)式插入規(guī)則,其作用是將新到達任務中的應急任務挑選出來,并完成插入。如果不沖突,則直接插入;如沖突,則判斷與之沖突的任務是否也是應急任務。如果是應急任務,則放棄插入,否則將與當前應急任務沖突的任務刪除,并記錄在conflict_RTTC中,然后完成插入。在算法1第4行中,Widnew_ttc_rxs表示衛(wèi)星idnew_ttc_rxs的可見時間窗口集合,第6行以起始時刻對時間窗集合中的元素進行升序排列,第10行判斷first_F中與ωl存在沖突的任務是否為應急快速響應任務。
算法2的作用是判斷新到達的常規(guī)測控任務是否可以與已有數(shù)傳任務一并執(zhí)行。如能一并執(zhí)行,則當前地面站的資源可以得到更加充分的利用。
值得注意的是,算法1和算法2都是針對測控資源進行的啟發(fā)式插入操作。針對數(shù)傳資源的啟發(fā)式插入規(guī)則與之類似,這里不再贅述。
基于啟發(fā)式規(guī)則的任務插入算法的作用是為下一節(jié)將介紹的基于演化計算的多目標優(yōu)化算法提供高質(zhì)量的初始解。下文將證明,本文提出的啟發(fā)式規(guī)則不會造成目標函數(shù)的降低,見定理1和定理2。
定理 1 基于動態(tài)需求特征的啟發(fā)式插入規(guī)則與動態(tài)重調(diào)度收益率(η)及變更率()相合。
證明 由算法1可知,基于動態(tài)需求特征的啟發(fā)式插入規(guī)則將應急任務插入到現(xiàn)有方案中。由于任何一個應急任務的優(yōu)先級比所有非應急任務的和還要大,因而動態(tài)重調(diào)度收益率一定不會因插入了應急任務而降低;而變更率并不將應急任務導致的變更計算在內(nèi),所以插入應急任務與動態(tài)重調(diào)度收益率(η)及變更率()相合。證畢
定理 2 基于測控數(shù)傳資源一體化特征的啟發(fā)式插入規(guī)則與動態(tài)重調(diào)度收益率(η)及變更率()相合。
證明 在算法2中,試圖將指定任務集合插入到方案中,任務集合來源于新到達任務和與新到達應急任務沖突的常規(guī)任務兩部分。插入的方法是在同一時段既執(zhí)行測控任務也執(zhí)行數(shù)傳任務。于是,更多的任務可能被執(zhí)行,動態(tài)重調(diào)度收益率(η)增加,且這一過程屬于設備重用,并不會導致任務沖突,因而不會導致方案變更率()降低。因此,基于測控數(shù)傳資源一體化特征的啟發(fā)式插入規(guī)則與動態(tài)重調(diào)度收益率(η)及變更率()相合。證畢
由定理1和定理2可知,經(jīng)過算法1和算法2的處理后,不會導致收益率(η)和變更率()兩個目標函數(shù)的降低,且問題解空間被大幅壓縮,從而提升了第二階段搜索算法優(yōu)化區(qū)域的針對性。
2.3 基于NSGA-Ⅲ的優(yōu)化求解算法
NSGA-Ⅲ[26]算法已被廣泛應用于工業(yè)設計、生產(chǎn)調(diào)度等多個領(lǐng)域[28],是演化多目標優(yōu)化領(lǐng)域引用率最高的算法之一。該算法的迭代過程可表述為在某一次迭代過程中,父代種群規(guī)模為Z,交叉變異算子作用于父代種群產(chǎn)生Z個子代個體,稱為子代種群;父代種群與子代種群合并后形成規(guī)模為2Z的合并種群,以設定的優(yōu)化目標函數(shù)計算每個個體在解空間中的數(shù)值,在此基礎(chǔ)上通過帕累托非支配排序準則對2Z個個體執(zhí)行分層操作,并計算每層個體的擁擠距離;按層級的優(yōu)先級順序依次選擇個體構(gòu)建下一代種群直至臨界層(當臨界層個體全部填充至下一代種群時,種群規(guī)模大于Z,若該層所有個體不填充至下一代種群,則種群規(guī)模小于Z)。針對臨界層個體,按擁擠距離數(shù)值大小的順序選擇個體填充至下一代種群,直至種群規(guī)模達到Z;判斷算法是否滿足結(jié)束條件,若滿足則輸出種群的Pareto front,若不滿足,則以下一代種群為父代種群執(zhí)行下一次迭代過程,直至滿足結(jié)束條件。下面將詳細介紹針對測控數(shù)傳資源多目標動態(tài)重調(diào)度問題的編碼策略、交叉算子、變異算子設計。
(1) 編碼策略
本文以相關(guān)聯(lián)的個體編碼建立remaining_RTTC及remaining_RDT與可見時間窗口之間的數(shù)值對應關(guān)系,如圖2所示。
為了使cremaining_RTTC與remaining_RDT集合中更多的數(shù)傳與測控任務能夠被同時執(zhí)行,需要以衛(wèi)星標識符建立remaining_RTTC與remaining_RDT的匹配關(guān)系。具體而言,就是兩兩匹配remaining_RDT和remaining_RTTC中具有相同衛(wèi)星標識符的任務,具體操作如圖2左側(cè)部分所示。以A、B、C等字母表示衛(wèi)星標識符,remaining_RTTC中衛(wèi)星標識符為A(第1個A)的任務與remaining_RDT的第1個任務匹配成功,置于第1位;remaining_RTTC中衛(wèi)星標識符為C、E、B的任務分別與remaining_RDT的第3個、第5個、第2個任務匹配成功,分別置于第3位、第5位、第2位;remaining_RTTC中衛(wèi)星標識符為G、A(第2個A)的任務未匹配成功,分別置于第7位、第8位;remaining_RTTC不存在與remaining_RDT中衛(wèi)星標識符為D、F相匹配的任務,第4位、第6位以占位符(黑色方塊)表示;由此可知,匹配過程即為針對remaining_RTTC重新排序的過程。圖2右側(cè)部分為編碼方式,其中的占位符編碼為0,匹配位的編碼值一致,非匹配位獨立編碼,非0編碼數(shù)值隨機確定。以圖2中紅色橢圓中的編碼數(shù)值予以說明:假設支持衛(wèi)星A的可見時間窗口數(shù)量為8,則隨機在1至8之間選擇一個數(shù)值予以編碼,圖2所示數(shù)值為2,則表示當前任務在第2個時間窗內(nèi)執(zhí)行。
(2) 交叉操作與變異操作
交叉操作過程如圖3所示,隨機選定交叉點1和交叉點2,然后互換染色體片段。
變異操作如圖4所示,在變異概率的控制下,隨機在父個體的編碼序列中確定若干變異點,并以隨機方式變更其數(shù)值,其中0編碼表示不參與變異操作。
3 實驗及分析
在實驗中,采用演化多目標優(yōu)化計算框架MOEAFramework[29]作為實現(xiàn)本文實驗的基礎(chǔ)程序庫。
衛(wèi)星集S及天線資源集A均選自STK數(shù)據(jù)庫,共有8個地面站、268顆衛(wèi)星參與規(guī)劃,規(guī)劃時間段設置為2020年3月5日0時0分0秒-2020年3月6日0時0分0秒,利用STK計算可見時間窗口集W,測試用例如表1所示。
其中,ID是實驗用例唯一標識,|Finit|為初始方案中地面站要執(zhí)行的任務,|new_RTTC|為新到達的測控任務,其中括號中的數(shù)值表示新到達測控任務中包含的應急測控任務數(shù)量。|new_RDT|為新到達的數(shù)傳任務,其中括號中的數(shù)值表示新到達數(shù)傳任務中包含的應急數(shù)傳任務數(shù)量。
為證明DRS-NSGA-III-TTCamp;DT算法的有效性,在實驗中引入林鵬等[17]提出的多星多天線中繼星動態(tài)調(diào)度算法(tracking and data relay satellite systems dynamic sche-duling method, TDRSSDSM)、陳浩等[8]提出的衛(wèi)星動態(tài)調(diào)度算法(satellite dynamic scheduling algorithm, SDSA)以及羅棕等[20]提出的基于Transformer層次預測的多星觀測任務規(guī)劃(transformer hierarchical prediction, TTH)算法作為基線比較。TDRSSDSM是一種針對中繼星數(shù)傳資源的動態(tài)任務重規(guī)劃方法,采用了進化計算和啟發(fā)式規(guī)則相結(jié)合的方式;SDSA是一種基于吱呀輪優(yōu)化(squeaky-wheel optimization, SWO)智能優(yōu)化的衛(wèi)星數(shù)傳資源重調(diào)度算法;TTH是基于深度神經(jīng)網(wǎng)絡和啟發(fā)式搜索的衛(wèi)星任務應急規(guī)劃方法,經(jīng)過訓練后能實現(xiàn)方案的實時決策。
但值得說明的是,根據(jù)目前查閱到的資料來看,采用多目標優(yōu)化方法求解測控數(shù)傳一體化任務動態(tài)重調(diào)度問題的公開研究尚未見報道。作為基線比較的上述3種算法均是非多目標優(yōu)化方法,于是對上述3種算法進行多目標優(yōu)化的適應性改進,在固定方案變更率不超過15%、25%、35%的3種情況下,求解方案收益率,并與DRS-NSGA-Ⅲ-TTCamp;DT算法的計算結(jié)果進行比較。
在實驗中,DRS-NSGA-Ⅲ-TTCamp;DT算法種群規(guī)模設置為18,在迭代過程中保持種群規(guī)模不變。其余3種基線比較算法的參數(shù)設置方式均按其原始文獻描述的參數(shù)設置。在實驗中,每一種算法均獨立計算每一組實驗用例50次,取最優(yōu)的計算結(jié)果,以消除隨機因素對算法性能的影響,實驗結(jié)果如圖5所示。
由圖5可知,從計算結(jié)果上看,DRS-NSGA-Ⅲ-TTCamp;DT算法取得了最好的結(jié)果,得到的帕累托解集支配了其余各種算法在固定方案變更率不超過15%、25%、35%的3種情況下,所求得的結(jié)果。嚴格地說,TDRSSDSM、 SDSA和TTH算法均是單目標優(yōu)化方法,通過將方案變更率作為約束引入其中,從而得到了多目標優(yōu)化的解。這在一定程度上限制了上述3種算法的性能。與此相對的是,DRS-NSGA-Ⅲ-TTCamp;DT算法由于引入了多目標優(yōu)化技術(shù),能夠在更廣泛的解集空間進行優(yōu)化搜索,并采用演化的方法實現(xiàn)了解集之間的迭代尋優(yōu),從而獲得了更好的計算結(jié)果。此外,DRS-NSGA-Ⅲ-TTCamp;DT算法得到了完整的Pareto front,使得規(guī)劃人員能夠得到各種方案變更率和收益率下的規(guī)劃方案解集合,從而能夠選擇最合理的方案并執(zhí)行。這也是將多目標優(yōu)化應用到地面站測控數(shù)傳任務一體化動態(tài)重調(diào)度問題中的優(yōu)勢。
在圖6中,對基于演化計算的3種算法(DRS-NSGA-Ⅲ-TTCamp;DT、TDRSSDSM和 SDSA)的計算時間進行了比較。實驗設定為:實驗中采用3種算法獨立計算實驗用例50次,如果連續(xù)30代算法結(jié)果不改進,則算法退出,記錄平均計算時間。
由圖6可知,在所有的實驗用例上,DRS-NSGA-Ⅲ-TTCamp;DT算法的計算時間均高于其余兩種算法。這是由于DRS-NSGA-Ⅲ-TTCamp;DT算法是一種多目標優(yōu)化方法,其計算復雜度遠遠高于其余兩種算法??梢娝惴ㄔ讷@得優(yōu)化計算結(jié)果的同時,也付出了更多的計算代價。
但總體而言,DRS-NSGA-Ⅲ-TTCamp;DT算法的計算時間并沒有比TDRSSDSM和SDSA算法高太多,其計算時間也在能夠接受的范圍內(nèi)。這是因為,TDRSSDSM和SDSA算法是單目標優(yōu)化方法,在求解過程中需要計算變更率不超過15%、25%、35%的3種不同情況下的收益率,相當于算法連續(xù)運行了3次,且3次計算是獨立的,不能利用前次計算的中間結(jié)果縮減后續(xù)計算的時間。而DRS-NSGA-Ⅲ-TTCamp;DT算法采用多目標迭代優(yōu)化的演化計算框架,能夠較好地在上一代種群(現(xiàn)有最優(yōu)計算結(jié)果)的鄰域中搜索更加優(yōu)化的解,可以有效縮減迭代時間。此外,DRS-NSGA-Ⅲ-TTCamp;DT算法采用的啟發(fā)式規(guī)則插入方法也能大幅縮減搜索空間,提升搜索效率。
4 結(jié)束語
本文針對測控數(shù)傳資源多目標動態(tài)重調(diào)度問題建立約束滿足問題模型,設計基于啟發(fā)式規(guī)則和非支配解排序演化計算的地面站測控數(shù)傳資源一體化多目標動態(tài)重調(diào)度算法DS-NSGA-Ⅲ-TTCamp;DT,并通過實驗驗證了算法的優(yōu)化性能和計算時間。下一步,擬研究如何提取用戶偏好信息,并引導算法精細搜索用戶偏好解域,從而進一步提升算法優(yōu)化性能,收斂計算速度。
參考文獻
[1]CHEN H, ZHAI B R, WU J J, et al. A satellite observation data transmission scheduling algorithm oriented to data topics[J]. International Journal of Aerospace Engineering, 2020, 2020: 1-16.
[2]LI Y Q, WANG R X, LIU Y, et al. Satellite range scheduling with the priority constraint: an improved genetic algorithm using a station ID encoding method[J]. Chinese Journal of Aeronautics, 2015, 28(3): 789-803.
[3]ANTONIOU M, PETELIN G, PAPA G. On formulating the ground scheduling problem as a multi-objective bilevel problem[C]∥Proc.of the International Conference on Bioinspired Methods and Their Applications, 2020: 177-188.
[4]XHAFA F, IP A. Optimisation problems and resolution methods in satellite scheduling and space-craft operation: a survey[J]. Enterprise Information Systems, 2021, 15(8): 1022-1045.
[5]WU G H, LUO Q Z, ZHU Y Q, et al. Flexible task scheduling in data relay satellite networks[J]. IEEE Trans.on Aerospace and Electronic Systems, 2021, 58(2): 1055-1068.
[6]CUI J T, ZHANG X. Application of a multi-satellite dynamic mission scheduling model based on mission priority in emergency response[J]. Sensors, 2019, 19(6): 1430.
[7]CHEN H, YANG S, LI J, et al. Exact and heuristic methods for observing task-oriented satellite cluster agent team formation[J]. Mathematical Problems in Engineering, 2018, 2018: 2103625.
[8]陳浩, 李軍, 杜春, 等. 對地觀測衛(wèi)星任務規(guī)劃與調(diào)度技術(shù)[M]. 北京: 國防工業(yè)出版社, 2021.
CHEN H, LI J, DU C, et al. Task planning and scheduling technology for earth observation satellite[M]. Beijing: National Defense Industry Press, 2021.
[9]習婷, 李菊芳. 面向動態(tài)需求的成像衛(wèi)星滾動式重調(diào)度方法研究[J]. 中國管理科學, 2015(S1): 269-274.
XI T, LI J F. The rolling horizon method for EOS scheduling with dynamic requests[J]. Chinese Journal of Management Science, 2015(S1): 269-274.
[10]WANG J, ZHU X, YANG L T, et al. Towards dynamic real-time scheduling for multiple earth observation satellites[J]. Journal of Computer and System Sciences, 2015, 81(1): 110-124.
[11]DENG B Y, JIANG C X, KUANG L L, et al. Preemptive dynamic scheduling algorithm for data relay satellite systems[C]∥Proc.of the IEEE International Conference on Communications, 2017.
[12]SUN H Q, XIA W, HU X X, et al. Earth observation satellite scheduling for emergency tasks[J]. Journal of Systems Engineering and Electronics, 2019, 30(5): 931-945.
[13]LI Y Q, WANG R X, XU M Q. Rescheduling of observing spacecraft using fuzzy neural network and ant colony algorithm[J]. Chinese Journal of Aeronautics, 2014, 27(3): 678-687.
[14]LI J, CHEN H, JING N. A data transmission scheduling algorithm for rapid-response earth-observing operations[J]. Chinese Jour-nal of Aeronautics, 2014, 27(2): 349-364.
[15]ZHENG Z, GUO J, GILL E. Onboard autonomous mission re-planning for multi-satellite system[J]. Acta Astronautica, 2018, 145(4): 28-43.
[16]CHEN H, ZHOU Y R, DU C, et al. A satellite cluster data transmission scheduling method based on genetic algorithm with rote learning operator[C]∥Proc.of the IEEE Congress on Evolutionary Computation, 2016: 5076-5083.
[17]林鵬, 晏堅, 費立剛, 等. 中繼衛(wèi)星系統(tǒng)的多星多天線動態(tài)調(diào)度方法[J]. 清華大學學報, 2015, 55(5): 491-496, 502.
LING P, YAN J, FEI L G, et al. Multi-satellite and multi-antenna TDRSS dynamic scheduling method[J]. Journal of Tsinghua University, 2015, 55(5): 491-496, 502.
[18]WANG C, CHEN H, ZHAI B R, et al. Satellite observing mission scheduling method based on case-based learning and a genetic algorithm[C]∥Proc.of the 28th IEEE International Conference on Tools with Artificial Intelligence, 2016: 627-634.
[19]WANG H J, ZHEN Y, ZHOU W G, et al. Online scheduling of image satellites based on neural networks and deep reinforcement learning[J]. Chinese Journal of Aeronautics, 2019, 32(4): 1011-1019.
[20]羅棕, 杜春, 陳浩, 等. 基于Transformer層次預測的多星應急觀測任務規(guī)劃方法[J]. 航空學報, 2021, 42(4): 524271.
LUO Z, DU C, CHEN H, et al. Multi-satellite cheduling approach for emergency scenarios based on hierarchical forecasting with transformer network[J]. Acta Aeronautica et Astronautica Sinica, 2021, 42(4): 524271.
[21]孫剛, 陳浩, 彭雙, 等. 一種基于偏好MOEA的衛(wèi)星地面站資源多目標優(yōu)化算法[J]. 航空學報, 2021, 42(4): 524475.
SUN G, CHEN H, PENG S, et al. Multi-objective optimization algorithm for satellite range scheduling based on preference MOEA[J]. Acta Aeronautica et Astronautica Sinica, 2021, 42(4): 524475.
[22]孫剛, 彭雙, 陳浩, 等. 面向測控數(shù)傳資源一體化場景的衛(wèi)星地面站資源多目標優(yōu)化方法[J]. 航空學報, 2022, 43(9): 326114.
SUN G, PENG S, CHEN H, et al. Multi-objective optimization method oriented to integrated scenario of TTamp;C resources and data transmission resources[J]. Acta Aeronautica et Astronautica Sinica, 2022, 43(9): 326114.
[23]孫剛, 伍江江, 陳浩, 等. 一種基于切比雪夫距離的隱式偏好多目標進化算法[J]. 計算機科學, 2022, 49(6): 297-304.
SUN G, WU J J, CHEN H, et al. A hidden preference-based multi-objective evolutionary algorithm based on Chebyshev distance[J]. Computer Science, 2022, 49(6): 297-304.
[24]DU Y, XING L, ZHANG J, et al. MOEA based memetic algorithms for multi-objective satellite range scheduling problem[J]. Swarm and Evolutionary Computation, 2019, 50: 100576.
[25]DEB K, JAIN H. An evolutionary many-objective optimization algorithm using reference point-based nondominated sorting approach, Part I: solving problems with box constraints[J]. IEEE Trans.on Evolutionary Computation, 2014, 18(4): 577-601.
[26]MACCORMICK J. What can be computed?: a practical guide to the theory of computation[M]. Princeton: Princeton University Press, 2018.
[27]LI L M, CHEN H, WU J J, et al. Preference-based evolutionary algorithms for many-objective mission planning of agile earth observation satellites[C]∥Proc.of the Genetic and Evolutionary Computation Conference Companion, 2018.
[28]HADKA D. MOEAFramework[EB/OL].[2022-6-16]. http:∥moeaframework.org/.
[29]Analytical Graphics Inc. Satellite tool kit 10.1.3[EB/OL].[2022-6-16]. https:∥www.agi.com/.作者簡介
陳 浩(1982—),男,教授,博士,主要研究方向為智能地理信息服務、時空大數(shù)據(jù)分析、數(shù)據(jù)驅(qū)動的智能決策。
孫 剛(1988—),男,碩士研究生,主要研究方向為航天資源智能規(guī)劃調(diào)度。
彭 雙(1990—),男,講師,博士,主要研究方向為航天資源智能規(guī)劃調(diào)度、時空大數(shù)據(jù)管理與分析。
伍江江(1982—),男,副教授,博士,主要研究方向為時空大數(shù)據(jù)管理與分析、地理信息服務集成。