航天工程大學,北京 101400
成像衛(wèi)星是一類利用星載傳感器獲取特定區(qū)域圖像信息的對地觀測衛(wèi)星,主要包括可見光、紅外、多光譜、合成孔徑雷達(Synthetic Aperture Radar, SAR)等成像衛(wèi)星[1],光學成像衛(wèi)星因其高分辨率和信息的豐富性仍然是成像衛(wèi)星的主流。目前,中國已初步建立天基對地觀測系統(tǒng),用戶需求復(fù)雜、衛(wèi)星資源統(tǒng)一調(diào)度困難等問題進一步凸顯。當前自然災(zāi)害、工業(yè)事故等應(yīng)急事件頻發(fā),用戶的需求不再僅僅局限于是否能夠完成成像任務(wù),而對響應(yīng)時間也提出了要求。衛(wèi)星管控部門在進行任務(wù)規(guī)劃時既需要考慮完成盡可能多的任務(wù),又要考慮部分任務(wù)的優(yōu)先性和響應(yīng)時間,如何合理地調(diào)度衛(wèi)星資源成為多星成像規(guī)劃領(lǐng)域亟待解決的問題。
多星成像規(guī)劃是NP-Hard問題,通常要在簡化約束條件的基礎(chǔ)上構(gòu)建模型,國內(nèi)外在建立模型和求解方面開展了大量研究。Globus等[2-3]建立了多星任務(wù)規(guī)劃的約束滿足問題(Constraint Satisfaction Problem,CSP)模型,考慮了衛(wèi)星的多設(shè)備約束條件,并用遺傳算法得到了較好的結(jié)果;Gabrel等[4]建立了圖論模型,采用有向無環(huán)圖表示衛(wèi)星在觀測任務(wù)之間的轉(zhuǎn)換約束,使用最短路徑算法進行求解;Bianchessi等[5]建立了混合整數(shù)規(guī)劃模型,驗證了禁忌搜索算法求解該模型的可能性。國內(nèi)研究者對以上的經(jīng)典規(guī)劃模型持續(xù)改進并應(yīng)用于不同背景。王智勇等[6]建立了考慮衛(wèi)星載荷連續(xù)側(cè)擺的多星聯(lián)合任務(wù)規(guī)劃模型;林曉輝等[7]針對敏捷光學成像衛(wèi)星密集區(qū)域推掃成像任務(wù)規(guī)劃問題進行了建模和求解;趙萍等[8]設(shè)計了一種改進遺傳算法,驗證了此算法應(yīng)用在衛(wèi)星自主任務(wù)調(diào)度問題上的有效性,但以上研究并沒有考慮應(yīng)急條件。隨著實際中應(yīng)急需求的突出,一些研究者針對應(yīng)急任務(wù)規(guī)劃也展開了研究。Verfaillie等[9]研究了新到達任務(wù)在不影響原方案基礎(chǔ)上的插入方法;王建江等[10]提出了綜合考慮任務(wù)合成、修復(fù)和向后移位的多星動態(tài)應(yīng)急調(diào)度算法,但這些研究集中在應(yīng)急任務(wù)對原調(diào)度方案的擾動上。楊正磊等[11]首次以應(yīng)急需求的響應(yīng)時間為目標進行綜合規(guī)劃研究,但局限于單個應(yīng)急任務(wù)的規(guī)劃。
目前的研究多是單獨優(yōu)先規(guī)劃應(yīng)急任務(wù),雖然保證了應(yīng)急任務(wù)的響應(yīng)時間但犧牲了常規(guī)任務(wù)的完成度,使整體調(diào)度收益受到較大影響。針對此問題,本文建立綜合考慮應(yīng)急任務(wù)響應(yīng)時間和任務(wù)總收益的多星成像規(guī)劃模型,將規(guī)劃問題分解為任務(wù)時間窗選擇和單軌動態(tài)規(guī)劃兩部分,分別設(shè)計自適應(yīng)免疫算法(Adaptive Immune Algorithm, AIA)和前向動態(tài)規(guī)劃算法(Forward Dynamic Programming Algorithm, FDPA)進行優(yōu)化求解,并進行了仿真校驗。
本文研究的多星成像規(guī)劃問題可描述為:在某一規(guī)劃時間段內(nèi),一批成像任務(wù)T在衛(wèi)星資源集合S下具有多個時間窗。在滿足衛(wèi)星成像一系列約束的前提下為每個成像任務(wù)選擇合適的時間窗,并確定每顆衛(wèi)星的觀測路徑,使所有應(yīng)急成像任務(wù)盡可能被完成和完成時間盡可能早,在此基礎(chǔ)上再完成盡可能多的常規(guī)成像任務(wù)。依據(jù)問題特征,建立該問題的約束滿足模型,從模型要素的定義、目標函數(shù)和約束條件3方面描述模型。
模型要素定義如表1所示。
(1)
式中:i為任務(wù)編號;j為衛(wèi)星編號;k為衛(wèi)星的軌道圈次編號;b和e分別為成像開始時間和結(jié)束時間;a為側(cè)擺角。
首先給出模型的決策變量xijk:
(2)
模型具有兩級優(yōu)化目標,一級目標是應(yīng)急任務(wù)完成的平均響應(yīng)時間最短,即下式中的f1最小。
(3)
二級目標是任務(wù)總收益最大,即下式中f2最大。
(4)
1)本文假設(shè)成像任務(wù)均為單次執(zhí)行即可完成,所以任務(wù)執(zhí)行時最多占有一個衛(wèi)星資源:
(5)
2)任務(wù)所選取衛(wèi)星的最低分辨率要優(yōu)于任務(wù)要求的分辨率:
(6)
3)任務(wù)的成像時間需在要求的執(zhí)行時間范圍內(nèi):
(7)
4)任一合成任務(wù)的側(cè)擺角絕對值不能大于所用衛(wèi)星的最大側(cè)擺角度:
(8)
5)任一合成任務(wù)的成像持續(xù)時間不能大于所用衛(wèi)星的遙感器單次最長開機時間:
(9)
6)同軌道圈次兩個連續(xù)合成任務(wù)間的姿態(tài)轉(zhuǎn)換時間要小于兩合成任務(wù)的間隔時間:
(10)
7)衛(wèi)星在任一軌道圈次上成像姿態(tài)機動次數(shù)不大于單軌任務(wù)數(shù)量和衛(wèi)星單軌最大側(cè)擺次數(shù)的較小值:
(11)
多星成像規(guī)劃問題可以分解為選擇任務(wù)的時間窗和確定衛(wèi)星單軌道圈次的最優(yōu)觀測路徑兩個子問題,因此本文設(shè)計了時間窗選擇和單軌動態(tài)規(guī)劃兩個模塊耦合求解,并在兩個模塊分別使用自適應(yīng)免疫算法和前向動態(tài)規(guī)劃算法進行優(yōu)化。單軌動態(tài)規(guī)劃的結(jié)果反饋至時間窗選擇模塊計算目標函數(shù),根據(jù)目標函數(shù)的性能不斷調(diào)整部分任務(wù)的時間窗選擇,迭代計算至最優(yōu)解,模型求解流程如圖1所示。
圖1 模型求解流程Fig.1 Solving process of the model
本文依據(jù)免疫算法的基本原理,在親和力函數(shù)中加入判斷解的收益是否達到期望收益的自適應(yīng)閾值λ,用抗體的濃度體現(xiàn)解的多樣性,用期望繁殖率來尋找親和力高的且濃度低的抗體,在抗體種群更新的同時選取部分親和力較高的和部分期望繁殖概率較高的抗體進入記憶細胞(對優(yōu)良解的保留)和下一代抗體種群。每次更新種群后根據(jù)記憶細胞中優(yōu)良解的表現(xiàn),逐步調(diào)整自適應(yīng)閾值λ,迭代計算至一定次數(shù),將當前記憶細胞中的最優(yōu)解輸出。
(12)
在濃度計算之前,需要計算抗體種群中抗體的相似度??贵w長度均為lz,抗體每一個編碼位置對應(yīng)一個任務(wù)的時間窗選擇情況,若兩抗體有Ng個任務(wù)選擇了同一時間窗,則兩抗體的相似度X為:
(13)
當X達到設(shè)定的相似度閾值υ時,則認為此兩抗體為相似抗體??贵w濃度計算公式為:
(14)
式中:Cz為抗體濃度;M為抗體總數(shù);NX為抗體種群中與抗體z相似的抗體數(shù)。
期望繁殖概率Pz由抗體的親和力和濃度共同決定,其計算公式如下:
(15)
式中:α∈(0,1)為設(shè)定的多樣性評價參數(shù)。由式(15)可見,Pz在一定程度上既鼓勵高親和力的抗體,又抑制高濃度的抗體,能夠保持抗體種群的多樣性,避免陷入局部最優(yōu)解。
初始抗體種群由隨機貪婪算法[15]產(chǎn)生。記憶細胞實質(zhì)是優(yōu)良解的記憶庫,設(shè)記憶細胞的容量為B。更新種群時,為防止親和力高的抗體因為濃度高而被淘汰,先選取抗體種群中B/2個Az最大的抗體進入記憶細胞和下一代抗體,再在剩下抗體種群中分別選取B/2個和(M-3B)/2個Pz最大的抗體進入記憶細胞和下一代抗體,即淘汰B個Pz最小的抗體。
保留的抗體通過交叉和變異產(chǎn)生新抗體,再加入記憶細胞中的上一代優(yōu)良抗體更新種群??紤]到應(yīng)急任務(wù)和常規(guī)任務(wù)的不同,為更好地產(chǎn)生新個體,本文設(shè)計了兩段交叉和變異方法,如圖2所示,虛線左邊為應(yīng)急任務(wù)段,右邊為常規(guī)任務(wù)段,抗體的兩段交叉和變異是同時進行的。
圖2 抗體交叉與變異Fig.2 Cross and mutation of antibodies
每次更新記憶細胞后,判斷其中B/2的抗體收益IB/2是否均達到期望收益λIa,若均達到,說明λ的取值偏小,令λ增加1%,期望收益將在下一輪迭代中提高。自適應(yīng)免疫算法實現(xiàn)流程如圖3所示。
圖3 自適應(yīng)免疫算法實現(xiàn)流程Fig.3 Flowchat of adaptive immune algorithm
經(jīng)過每輪的時間窗選擇,應(yīng)急任務(wù)的響應(yīng)時間已經(jīng)確定,每顆衛(wèi)星的不同軌道圈次也已形成元任務(wù)序列,單軌規(guī)劃的目的是在最大限度完成應(yīng)急任務(wù)的同時使任務(wù)總收益最大??紤]到單軌規(guī)劃結(jié)果要返回至時間窗選擇模塊,遍歷尋找最優(yōu)解耗時過高,且不利于求解,本文借鑒文獻[16]的動態(tài)規(guī)劃思想,對單軌任務(wù)動態(tài)合成方法進行改進,提出了一種面向應(yīng)急任務(wù)的前向動態(tài)規(guī)劃算法(FDPA),將任務(wù)合成分為多個前后關(guān)聯(lián)的階段,按照順序解法遞推,直到達到衛(wèi)星單軌最大側(cè)擺次數(shù)或者規(guī)劃至單軌最后一個任務(wù)。
設(shè)某衛(wèi)星單軌道圈次上的元任務(wù)按照成像開始時間順序排列后為{m1,m2,…,ml},l為單軌任務(wù)數(shù)量。衛(wèi)星每觀測一次形成一個合成任務(wù)c,必包含成像時間最早的元任務(wù)mj和最晚的元任務(wù)mi,則定義cj,i為以j為起點和以i為終點的合成任務(wù),Aj,i={aj,aj+1…,ai}為cj,i包含的元任務(wù)側(cè)擺角集合。cj,i觀測角度的浮動范圍和覆蓋范圍分別如式(16)、式(17)所示:
[maxAj,i-θj/2,minAj,i+θj/2]
(16)
[maxAj,i-θj,minAj,i+θj]
(17)
cj,i對應(yīng)一次觀測活動,即決策過程中的一個階段,只需要確定cj,i的最優(yōu)觀測角度,使其覆蓋最多的應(yīng)急任務(wù)和獲得最大收益,即可認為此合成任務(wù)為此階段以j為起點、i為終點的最優(yōu)合成任務(wù),設(shè)其最優(yōu)合成收益為rj,i,最優(yōu)觀測角度為aj,i。面向應(yīng)急任務(wù)的最優(yōu)合成算法步驟為:
步驟1:判斷mj、mi是否滿足任務(wù)合成約束條件且i≥j,若不滿足,令rj,i=0、aj,i=0,合成終止;若滿足,轉(zhuǎn)入步驟2。
步驟4:返還cm對應(yīng)的am和rm,令aj,i=am,rj,i=rm,合成結(jié)束。
定義動態(tài)規(guī)劃第k階段cj,i的前接最優(yōu)合成任務(wù)集為:第k-1階段終點在j之前,且與cj,i滿足姿態(tài)轉(zhuǎn)換時間約束的最優(yōu)合成任務(wù)集合。第k階段以i為終點的最優(yōu)合成任務(wù)Ck(i)由{cj,i}(k≤j≤i)及其前接最優(yōu)合成任務(wù)集共同確定。
設(shè)fk(i)表示Ck(i)的收益,sk(i)表示其起點。設(shè)Fk為第k階段不同終節(jié)點的最優(yōu)合成任務(wù)收益向量,Sk為對應(yīng)的起點向量,并有:
(18)
則第k+1階段以i為終點的最優(yōu)合成任務(wù)的收益Fk+1(i)計算公式為:
(k+1≤j≤i)
(19)
圖4 前接最優(yōu)合成任務(wù)不存在的情況Fig.4 Non-existent situation of attachable optimal composite task
若第k+1階段cj,i的前接最優(yōu)合成任務(wù)不存在,遍歷第k階段終點在j之前的所有滿足姿態(tài)轉(zhuǎn)換時間約束的合成任務(wù)cx,y(k≤x≤y≤j-1),保留在包含最多應(yīng)急任務(wù)基礎(chǔ)上收益最大的合成任務(wù),用其收益max {rx,y}代替Fk(m)代入式(19)計算。
前向動態(tài)規(guī)劃算法(FDPA)步驟如下:
步驟1:將衛(wèi)星sj不同軌道圈次的元任務(wù)按照成像開始時間進行排序,形成每個軌道圈次元任務(wù)序列{m1,m2,…,ml},每個軌道圈次任務(wù)序列均轉(zhuǎn)入步驟2進行并行計算。
(20)
(21)
步驟3:計算動態(tài)規(guī)劃第1階段的收益向量F1和對應(yīng)的起點向量S1,令k=1,轉(zhuǎn)入步驟4。
若調(diào)度方案確定后出現(xiàn)應(yīng)急任務(wù)沒有全部完成的情況,應(yīng)進行適當修復(fù)以嘗試完成更多的應(yīng)急任務(wù),為避免計算復(fù)雜度進一步升級,本文設(shè)計了較為簡潔高效的修復(fù)方法。
步驟1:將剩下未安排的應(yīng)急任務(wù)按照優(yōu)先級從高到低排序,選擇當前優(yōu)先級最高的應(yīng)急任務(wù)ts,轉(zhuǎn)入步驟2。
步驟2:遍歷ts的每個時間窗,計算是否有其他應(yīng)急任務(wù)沖突,若均有應(yīng)急任務(wù)沖突,則ts安排失敗,用規(guī)劃總時長代替其響應(yīng)時間,結(jié)束修復(fù);否則轉(zhuǎn)入步驟3。
步驟3:對于只有常規(guī)任務(wù)沖突的時間窗,計算ts插入需刪除的常規(guī)任務(wù)優(yōu)先級之和并定義其為沖突損失。將ts插入至沖突損失最小的時間窗,若有多個時間窗沖突損失同時最小,選擇開始時間最早的時間窗插入ts,結(jié)束修復(fù)。
本文通過大量仿真試驗測試AIA+FDPA的性能,并與啟發(fā)式算法和智能優(yōu)化算法進行了比較。啟發(fā)式算法選擇文獻[17]的動態(tài)合成啟發(fā)式(DTMH)算法和文獻[10]的綜合考慮任務(wù)合成、修復(fù)和向后移位的多星動態(tài)應(yīng)急調(diào)度(TMRBS-DES)算法的結(jié)合形式,常規(guī)任務(wù)使用DTMH算法,應(yīng)急任務(wù)使用TMRBS-DES算法。智能優(yōu)化算法選擇文獻[18]中的混合遺傳禁忌搜索(HGTS)算法,HGTS算法先使用遺傳算法在解空間進行全局搜索,迭代至一定次數(shù)獲得多個局部最優(yōu)解,再使用禁忌搜索算法在局部最優(yōu)解鄰域進行小規(guī)模搜索。
本文參考國內(nèi)外民用光學遙感衛(wèi)星,選取了8顆光學遙感衛(wèi)星平臺,其軌道根數(shù)如表2所示,平臺能力的設(shè)定如表3所示。
表2 試驗選取的衛(wèi)星軌道六根數(shù)Table 2 Orbital elements of satellites selected in experiment
表3 試驗選取的衛(wèi)星平臺能力Table 3 Capability of satellites selected in experiment
為加強選取任務(wù)的真實性,本文從中國地震臺網(wǎng)獲取了一年內(nèi)全球和我國四川省發(fā)生地震的地理位置和震級信息,選取全球震級大于4級的100/200/300/400個地點和四川震級大于3級的25/50/75/100個地點作為觀測目標,如圖5和圖6所示,分別從全球背景和特定區(qū)域背景下進行測試。
設(shè)某測試實例下任務(wù)集T對應(yīng)的震級集合為ET,任務(wù)ti的震級為Ei,則本文定義ti的優(yōu)先級wi計算公式如下:
(22)
本文設(shè)定規(guī)劃起始時刻(UTC)為2019年3月24日00:00:00,結(jié)束時刻(UTC)為2019年3月25日00:00:00。假設(shè)用戶提出需求的時刻均為規(guī)劃起始時刻,目標可見時間窗采用STK軟件計算,并設(shè)置了衛(wèi)星拍攝地面目標時的太陽高度角不小于10°時為有效拍攝。所有算法均采用Matlab實現(xiàn),統(tǒng)一在配置為Intel(R) Xeon(R) CPU E5-2630的計算機上運行,其中兩種智能優(yōu)化算法的相關(guān)參數(shù)如表4和表5所示。
本節(jié)主要考察任務(wù)總數(shù)量對算法的影響,應(yīng)急任務(wù)數(shù)量設(shè)定為任務(wù)總數(shù)的10%(向上取整)。測試結(jié)果如圖7所示。
圖5 全球觀測目標分布情況Fig.5 Distribution of global ground targets
圖6 特定區(qū)域(四川)觀測目標分布情況Fig.6 Distribution of ground targets in specific area (Sichuan)
表4 自適應(yīng)免疫算法參數(shù)Table 4 Parameters of AIA
表5 混合遺傳禁忌搜索算法參數(shù)Table 5 Parameters of HGTS
從圖7可以看出,隨著任務(wù)總數(shù)量的增加,所有算法得出的應(yīng)急任務(wù)平均響應(yīng)時間和任務(wù)總收益都隨之增大,應(yīng)急任務(wù)均完成,故沒有比較展示。當任務(wù)總數(shù)較小時,任務(wù)沖突較少,3種算法的結(jié)果差距很小。隨著任務(wù)總數(shù)增加,DTMH+TMRBS-DES的解的質(zhì)量下降較快,且應(yīng)急任務(wù)平均響應(yīng)時間指標下降程度較任務(wù)總收益更明顯,這是由于其沒有考慮已插入任務(wù)的退出規(guī)則,造成后續(xù)任務(wù)的時間窗后移甚至無法插入。HGTS算法解中的任務(wù)總收益指標略優(yōu)于AIA+FDPA,但應(yīng)急任務(wù)平均響應(yīng)時間指標與AIA+FDPA相比較差,這是因為HGTS設(shè)計的目標函數(shù)中任務(wù)總收益占比較大,且在染色體交叉和變異時并沒有針對應(yīng)急任務(wù)進行處理。
圖7 任務(wù)規(guī)模對算法效果的影響Fig.7 Influence of the number of tasks on algorithm performance
從目標分布來看,特定區(qū)域背景下各算法的表現(xiàn)都優(yōu)于全球背景,一方面是任務(wù)數(shù)量較少減少了沖突,且目標的密集分布使任務(wù)合成的優(yōu)勢得到體現(xiàn)。 DTMH+TMRBS-DES算法中的任務(wù)合成啟發(fā)式規(guī)則表現(xiàn)較好,其解的質(zhì)量與兩種智能優(yōu)化算法得到的最優(yōu)解差距變小。
從各算法的耗時來看,DTMH+TMRBS-DES作為啟發(fā)式算法具有巨大的優(yōu)勢,在所有測試實例中耗時都小于1 s,而AIA+FDPA和HGTS算法耗時是其數(shù)百倍,并隨著任務(wù)總數(shù)的增加有呈指數(shù)增長的趨勢。且這兩種智能優(yōu)化算法在面對特定區(qū)域背景下目標密集分布時,計算耗時明顯大于全球背景下目標較稀疏分布的情況,這是因為目標密集分布時,分配到部分衛(wèi)星資源的任務(wù)變多,使單軌動態(tài)規(guī)劃和約束檢查計算耗時都變長。
5.2節(jié)的測試中,由于應(yīng)急任務(wù)數(shù)量較少,所有測試結(jié)果中應(yīng)急任務(wù)均完成,本節(jié)分別在全球400個目標和特定區(qū)域100個目標背景下,使應(yīng)急任務(wù)比例從10%到40%遞增,測試應(yīng)急任務(wù)數(shù)量占總?cè)蝿?wù)數(shù)量的比例對各算法的影響,結(jié)果如圖8所示。
圖8 應(yīng)急任務(wù)比例對算法效果的影響Fig.8 Influence of percentage of emergency tasks on algorithm performance
從圖8可以看出,應(yīng)急任務(wù)比例的增加對應(yīng)急任務(wù)平均響應(yīng)時間、未完成應(yīng)急任務(wù)數(shù)具有明顯的影響。DTMH+TMRBS-DES算法表現(xiàn)最差,這是因為其確定性的規(guī)則加劇了應(yīng)急任務(wù)之間的沖突。而AIA+FDPA算法在保證應(yīng)急任務(wù)平均響應(yīng)時間最優(yōu)的同時在應(yīng)急任務(wù)完成率方面同樣表現(xiàn)較好,這和此算法具備解的修復(fù)過程且在應(yīng)急任務(wù)未完成時具有懲罰機制有關(guān)。
此外,應(yīng)急任務(wù)平均響應(yīng)時間隨應(yīng)急任務(wù)比例增大而增加,這是由于應(yīng)急任務(wù)數(shù)量的增多導致部分應(yīng)急任務(wù)的執(zhí)行時間不斷后移,且一旦錯過了早期的時間窗將可能經(jīng)歷長期的夜晚不可觀測時段。
任務(wù)總收益受應(yīng)急任務(wù)比例的影響較小,即使應(yīng)急任務(wù)比例從10%增長至40%,各算法得到的任務(wù)總收益下降僅在1.4%~3.6%之間。這是由于總?cè)蝿?wù)數(shù)量是恒定的,只是部分任務(wù)從常規(guī)任務(wù)變?yōu)閼?yīng)急任務(wù),因為追求響應(yīng)時間而導致此類任務(wù)執(zhí)行時間前移,影響了少數(shù)常規(guī)任務(wù)的執(zhí)行。
本文為在成像衛(wèi)星任務(wù)規(guī)劃中可以綜合考慮應(yīng)急任務(wù)和常規(guī)任務(wù),建立兩級目標優(yōu)化模型,提出自適應(yīng)免疫算法(AIA)和前向動態(tài)規(guī)劃算法(FDPA)相結(jié)合的分解優(yōu)化策略進行求解,并通過大量仿真試驗對AIA+FDPA算法進行了測試,并與DTMH+TMRBS-DES算法和HGTS算法進行了對比。仿真結(jié)果表明,本文的AIA+FDPA算法得到的應(yīng)急成像任務(wù)的響應(yīng)時間優(yōu)于其他算法,獲得的任務(wù)總收益和HGTS算法接近,且耗時小于HGTS算法,這為需同時考慮應(yīng)急任務(wù)和常規(guī)任務(wù)的大規(guī)模多星成像規(guī)劃問題建模和求解提供了很好的途徑。同時,AIA+FDPA算法的計算耗時仍然較長,不利于對應(yīng)急任務(wù)的規(guī)劃,后續(xù)工作可在尋優(yōu)策略和算法效率方面進一步開展。