陳 浩,彭 雙,杜 春,伍江江
(國(guó)防科技大學(xué) 電子科學(xué)學(xué)院,湖南 長(zhǎng)沙 410073)
面向突發(fā)安全事件、災(zāi)害應(yīng)急救援等的航天應(yīng)急觀測(cè)、應(yīng)急通信保障、應(yīng)急高精度導(dǎo)航任務(wù)具有突發(fā)性、短暫性和局部性的特點(diǎn)[1]。傳統(tǒng)的航天系統(tǒng)通常以特定的長(zhǎng)期服務(wù)為設(shè)計(jì)目的,臨時(shí)調(diào)整其服務(wù)范圍技術(shù)復(fù)雜、成本昂貴,難以對(duì)上述的應(yīng)急航天任務(wù)提供有效支持。
因此,快速響應(yīng)空間(Operationally Responsive Space,ORS)[2]的概念應(yīng)運(yùn)而生,并得到了各航天大國(guó)的高度重視??焖夙憫?yīng)空間的核心理念在于通過低成本、低風(fēng)險(xiǎn)的模塊化小衛(wèi)星快速組裝,快速測(cè)試,按需應(yīng)急發(fā)射,并完成應(yīng)急組網(wǎng),從而有效完成各項(xiàng)應(yīng)急航天任務(wù)。美國(guó)先后發(fā)射了Jumpstart、ORS-1、TacSat-3、TacSat-4、ORS-4和ORS-5等衛(wèi)星以驗(yàn)證ORS相關(guān)關(guān)鍵技術(shù)[3]??焖夙憫?yīng)空間技術(shù)體系涉及面較廣,目前主要的研究工作集中在ORS技術(shù)體系[3-4]、ORS衛(wèi)星標(biāo)準(zhǔn)化模塊制造[5]、ORS衛(wèi)星應(yīng)急部署與組網(wǎng)[6]、ORS衛(wèi)星在軌任務(wù)調(diào)度[7-9]、ORS衛(wèi)星運(yùn)控系統(tǒng)及應(yīng)用[10-12]等方面。
隨著ORS技術(shù)的不斷發(fā)展與應(yīng)用的不斷深入,應(yīng)急航天任務(wù)對(duì)衛(wèi)星集合能力的要求不斷細(xì)化,衛(wèi)星平臺(tái)與有效載荷的型號(hào)和種類也在大幅增加。于是一個(gè)新且亟待解決的問題逐漸引起了人們的關(guān)注:面向一系列的應(yīng)急航天任務(wù),如何從型號(hào)眾多、能力各異的標(biāo)準(zhǔn)化衛(wèi)星平臺(tái)及有效載荷中快速?zèng)Q策出優(yōu)化的衛(wèi)星裝配方案,在最低限度滿足所有應(yīng)急航天任務(wù)的前提下,使得效費(fèi)比最佳。這個(gè)問題是適應(yīng)任務(wù)的模塊化衛(wèi)星快速構(gòu)建優(yōu)化決策問題。目前,對(duì)該問題的研究工作較少,尚不成體系。祝周鵬[13]對(duì)ORS衛(wèi)星平臺(tái)及載荷配置問題進(jìn)行了研究,建立能力樹模型,并采用標(biāo)準(zhǔn)遺傳算法進(jìn)行求解,但算法參數(shù)不能根據(jù)計(jì)算過程進(jìn)行自適應(yīng)調(diào)整,求解結(jié)果優(yōu)化程度尚有提升空間。
本文在深入分析適應(yīng)任務(wù)的模塊化衛(wèi)星快速構(gòu)建優(yōu)化決策問題的基礎(chǔ)上,建立約束滿足問題模型,提出基于自適應(yīng)罰函數(shù)遺傳算法的優(yōu)化決策方法,并通過實(shí)驗(yàn)證明所提方法的可用性及有效性。
面向需要被響應(yīng)的應(yīng)急航天任務(wù)集合T_Set,通過選擇標(biāo)準(zhǔn)模塊方式,快速構(gòu)建衛(wèi)星集合S_Set,需要通過優(yōu)化決策方法生成一個(gè)構(gòu)造方案Plan,使得S_Set有能力最低限度完成所有T_Set中的應(yīng)急航天任務(wù),且方案效費(fèi)比η最高。具體包括:
4)優(yōu)化決策的結(jié)果是形成衛(wèi)星集合S_Set的構(gòu)造方案Plan。即選定衛(wèi)星平臺(tái)的種類和數(shù)量,以及有效載荷的種類和數(shù)量,并分配哪些有效載荷搭載于哪個(gè)衛(wèi)星平臺(tái)之上,從而形成面向航天應(yīng)急任務(wù)T_Set的衛(wèi)星集合S_Set。對(duì)于?s∈S_Set,s=〈ps,d_Sets〉。其中,ps∈Plat_Set,d_Sets?Pyld_Set,分別表示衛(wèi)星s采用的衛(wèi)星平臺(tái)和該平臺(tái)攜帶的載荷集合。
在適應(yīng)任務(wù)的衛(wèi)星快速構(gòu)建優(yōu)化決策問題中,優(yōu)化目標(biāo)是使方案效費(fèi)比η最大化。
任務(wù)集合的執(zhí)行效果可定義為:
(1)
即任務(wù)集合總體執(zhí)行效果為任務(wù)集合中所有個(gè)體任務(wù)執(zhí)行收益之和。
任務(wù)集合的執(zhí)行代價(jià)是模塊化衛(wèi)星集合的制造代價(jià),可表示為:
(2)
式中,ps∈Plat_Set,d_Sets?Pyld_Set,ps和d_Sets分別表示衛(wèi)星s采用的衛(wèi)星平臺(tái)和該平臺(tái)攜帶的載荷集合。
則本問題的優(yōu)化目標(biāo)可表示為效費(fèi)比的形式,即:
(3)
適應(yīng)任務(wù)的衛(wèi)星快速構(gòu)建優(yōu)化決策過程還需要滿足如下約束條件。
1) 任務(wù)最低限度滿足約束(C1)。根據(jù)應(yīng)急航天任務(wù)集合T_Set構(gòu)造出的衛(wèi)星集合S_Set具有最低限度完成T_Set中所有任務(wù)的能力。
(4)
2)衛(wèi)星平臺(tái)裝載能力約束(C2)。對(duì)每一顆衛(wèi)星而言,衛(wèi)星平臺(tái)搭載的載荷不能超過該衛(wèi)星平臺(tái)裝載能力上限。
對(duì)于?s∈S_Set,有:
(5)
3)衛(wèi)星平臺(tái)質(zhì)量約束(C3)。對(duì)每一顆衛(wèi)星而言,衛(wèi)星平臺(tái)及搭載載荷的總質(zhì)量不能超過單顆應(yīng)急響應(yīng)衛(wèi)星質(zhì)量上限。
對(duì)于?s∈S_Set,有:
(6)
式中,ΔWSS是單顆應(yīng)急響應(yīng)衛(wèi)星質(zhì)量上限。
4)衛(wèi)星能量供應(yīng)約束(C4)。對(duì)每一顆衛(wèi)星而言,該衛(wèi)星搭載的載荷同時(shí)工作所消耗的總能量不大于該衛(wèi)星平臺(tái)所能提供的能量的上限。
對(duì)于?s∈S_Set,有:
(7)
式中,0<μps≤1,μps為衛(wèi)星平臺(tái)ps上所有載荷同時(shí)工作的能量復(fù)用因子。
上述數(shù)學(xué)模型是一個(gè)典型的約束滿足問題模型(constraint satisfaction problem model)。需要在考慮C1~C4等約束條件的基礎(chǔ)上尋找費(fèi)效比η最大的衛(wèi)星集合構(gòu)造方案。如果只考慮約束條件C2、C4和優(yōu)化目標(biāo)函數(shù),面向任務(wù)的模塊化衛(wèi)星快速構(gòu)建優(yōu)化決策問題可以歸約到多維0-1背包問題。依據(jù)算法復(fù)雜性理論[14],多維0-1背包問題是經(jīng)典的NP難(NP-hard)問題,目前尚沒有多項(xiàng)式時(shí)間快速算法。由于考慮更多約束條件,面向任務(wù)的模塊化衛(wèi)星快速構(gòu)建優(yōu)化決策問題組合爆炸特征更加明顯。如果需要在有效時(shí)間內(nèi),從上百種標(biāo)準(zhǔn)化衛(wèi)星平臺(tái)以及幾百種模塊化載荷中快速計(jì)算出適應(yīng)特定任務(wù)集合的衛(wèi)星構(gòu)造方案,基于窮盡搜索技術(shù)的精確算法難以滿足要求。
為了在有限的空間和時(shí)間內(nèi)得出問題優(yōu)化解,擬采用元啟發(fā)式算法(meta-heuristic algorithm)對(duì)該模型進(jìn)行求解。
遺傳算法是模擬自然界生物繁衍、進(jìn)化過程的元啟發(fā)式算法。已經(jīng)廣泛運(yùn)用于復(fù)雜的函數(shù)極值問題、組合優(yōu)化問題、規(guī)劃調(diào)度問題等問題的求解[15]。文獻(xiàn)[16-18]將進(jìn)化計(jì)算運(yùn)用到航天任務(wù)規(guī)劃調(diào)度領(lǐng)域,取得了較好的效果。
針對(duì)面向任務(wù)的模塊化衛(wèi)星快速構(gòu)建優(yōu)化決策問題特點(diǎn),提出基于自適應(yīng)罰函數(shù)遺傳算法的模塊化衛(wèi)星快速構(gòu)建優(yōu)化決策方法(optimization Decision Algorithm for Task-oriented modular Satellite rapid Construction,DA4TSC)。遺傳算法中個(gè)體適應(yīng)值采用效費(fèi)比η。下面將介紹問題編碼及遺傳算子設(shè)計(jì)。
圖1 問題編碼示意Fig.1 Illustration of problem coding
針對(duì)適應(yīng)任務(wù)的模塊化衛(wèi)星快速構(gòu)建優(yōu)化決策問題編碼特點(diǎn),設(shè)計(jì)了多點(diǎn)交叉算子(Crossover)。多點(diǎn)交叉算子在每顆衛(wèi)星構(gòu)造方案中選擇一個(gè)交叉點(diǎn)基因進(jìn)行交叉操作,如圖2所示。通過輪盤賭方式選出父代個(gè)體1,染色體被選中的概率和其適應(yīng)值大小成正比。采用隨機(jī)選擇方式得到父代個(gè)體2。
圖2中假定當(dāng)前染色體包含5個(gè)染色體段(即5顆衛(wèi)星的構(gòu)造方案),對(duì)每一個(gè)染色體段生成一個(gè)交叉點(diǎn),實(shí)現(xiàn)基因多點(diǎn)交叉互換操作。
圖2 交叉算子操作示意Fig.2 Illustration of crossover operation
變異算子(Mutation)設(shè)計(jì)為“隨機(jī)擾動(dòng)+隨機(jī)爬山”的組合方式。隨機(jī)擾動(dòng)是指隨機(jī)選擇一個(gè)屬于某顆衛(wèi)星方案的基因位,然后對(duì)該基因位隨機(jī)指定一個(gè)合法的值。由2.1節(jié)可知,基因位分為描述衛(wèi)星平臺(tái)使用情況的基因位和描述衛(wèi)星有效載荷使用情況的基因位。值得注意的是,兩類基因位將以不同概率分別進(jìn)行隨機(jī)擾動(dòng)操作。如果某顆衛(wèi)星構(gòu)造方案進(jìn)行了隨機(jī)擾動(dòng),則對(duì)該衛(wèi)星構(gòu)造方案進(jìn)行隨機(jī)爬山操作。隨機(jī)爬山操作是指針對(duì)該衛(wèi)星構(gòu)造方案中選定的衛(wèi)星平臺(tái),隨機(jī)將新的載荷加入方案中或去掉方案中已有載荷,如果適應(yīng)值提升,則采用新的構(gòu)造方案;否則,保持隨機(jī)擾動(dòng)后生成的方案。隨機(jī)爬山算法只能接收比當(dāng)前解更加優(yōu)化的解,而無法接收優(yōu)化性不如當(dāng)前解的解,容易使得算法陷入局部最優(yōu)解。而隨機(jī)擾動(dòng)算法是一種無偏的擾動(dòng)方法,能夠增加算法跳出局部最優(yōu)解的概率,同時(shí)使算法在更大范圍內(nèi)的解空間中進(jìn)行搜索。變異算子設(shè)計(jì)為上述兩種算法的混合,既能夠提升解的優(yōu)化性,又能降低搜索過程陷入局部最優(yōu)無法跳出的概率。
在選擇算子(Selection)設(shè)計(jì)中,采用含精英解池的輪盤賭選擇算子。子代個(gè)體種群由兩部分構(gòu)成。第一部分是通過輪盤賭選擇算子從父代種群中隨機(jī)選擇,適應(yīng)值大的個(gè)體被選中概率更大。另一部分則是精英解池中全部個(gè)體。精英解池保存著當(dāng)前種群發(fā)現(xiàn)的若干最優(yōu)秀個(gè)體。隨著遺傳算法的運(yùn)行,精英解池中的個(gè)體也在不斷更新。
基于上述問題編碼和遺傳算子設(shè)計(jì),提出DA4TSC算法框架,見算法1。DA4TSC算法的輸入包括應(yīng)急航天任務(wù)集合T_Set和衛(wèi)星數(shù)量g等兩個(gè)變量,輸出則是模塊化衛(wèi)星集合S_Set。
算法1 DA4TSC主要步驟Alg.1 Main steps of DA4TSC
由于需要構(gòu)造的衛(wèi)星數(shù)量g與航天應(yīng)急運(yùn)載能力、衛(wèi)星投放方式等密切相關(guān),并不僅僅由效費(fèi)比決定,所以衛(wèi)星數(shù)量g作為模型超參數(shù)直接輸入算法中。DA4TSC中,語(yǔ)句③~⑦分別使用交叉算子、變異算子和選擇算子對(duì)種群進(jìn)行操作,模擬生物種群進(jìn)化過程。語(yǔ)句⑤用于處理約束C1~C4導(dǎo)致的不可行解。語(yǔ)句⑥計(jì)算每一個(gè)個(gè)體的適應(yīng)值。
由于約束條件C1~C4的存在,遺傳算法種群中個(gè)體經(jīng)過交叉、變異和選擇算子后必然會(huì)生成部分不可行解。所以,需要采取約束處理方法對(duì)算法種群中的不可行解進(jìn)行處理,使其可行化、部分可行化或向可行化方向轉(zhuǎn)化[14]。
目前,在遺傳算法處理約束優(yōu)化問題的研究中,罰函數(shù)法是較普遍采用的約束處理方式之一[15]。罰函數(shù)法最早應(yīng)用于數(shù)學(xué)優(yōu)化方法的約束處理過程中。大量研究表明,最優(yōu)解通常出現(xiàn)在可行解域與不可行解域的邊界上[14]。在遺傳算法的進(jìn)化過程中,一個(gè)不可行解包含的染色體片段信息可能比可行解中的染色體片段信息更接近最優(yōu)解。因此,罰函數(shù)法與遺傳算法的隨機(jī)搜索特性能夠較好地結(jié)合,使得搜索過程能夠從可行解域和不可行解域兩個(gè)方向逼近優(yōu)化決策問題的最優(yōu)解。
在適應(yīng)任務(wù)的模塊化衛(wèi)星快速構(gòu)造優(yōu)化決策問題中,共有C1~C4 4個(gè)約束條件。與應(yīng)急航天任務(wù)和衛(wèi)星集合能力匹配相關(guān)的是約束C1,與衛(wèi)星平臺(tái)及載荷匹配相關(guān)的約束是C2~C4。采用罰函數(shù)方法來處理約束時(shí),可將其統(tǒng)一考慮。DA4TSC中,罰函數(shù)設(shè)計(jì)為將染色體違反約束C1~C4的總量的相反數(shù)乘以懲罰系數(shù)cp(cp>0)作為懲罰項(xiàng)。經(jīng)罰函數(shù)方法修正后的個(gè)體適應(yīng)值見式(8)。
(8)
其中,F(xiàn)itness為修正后的染色體適應(yīng)值,η為效費(fèi)比,Vpty為染色體違反約束C1~C4總量的量化值,cp(cp>0)是懲罰系數(shù)。
由式(8)可知,加入罰函數(shù)方法后,則某個(gè)體的最終適應(yīng)值為費(fèi)效比η與其懲罰項(xiàng)之和。如果個(gè)體沒有違反任何約束,則懲罰項(xiàng)為0。顯然,懲罰項(xiàng)小于等于0。
使用罰函數(shù)法進(jìn)行約束處理的難點(diǎn)在于懲罰系數(shù)的設(shè)置[15]。如果懲罰系數(shù)設(shè)置較小,種群中個(gè)體違反約束的成本降低,遺傳算法能夠在更大的解空間中搜索問題優(yōu)化解。同時(shí),也會(huì)導(dǎo)致種群中不可行解數(shù)量增加,遺傳算法收斂速度變慢。相反,如果懲罰系數(shù)設(shè)置較大,個(gè)體受到的懲罰力度增加,違反約束個(gè)體的適應(yīng)值將大幅下降,導(dǎo)致算法搜索范圍主要集中于可行解域,算法陷入局部最優(yōu)解從而早熟收斂的概率也會(huì)增加。
相關(guān)研究表明:懲罰系數(shù)的合理取值范圍不僅與問題特性及任務(wù)分布特點(diǎn)有關(guān)[15],還與算法運(yùn)行的階段聯(lián)系緊密。在遺傳算法運(yùn)行的初始階段,需要將懲罰系數(shù)設(shè)置為一個(gè)較小的數(shù)值,使得算法能夠搜索更大的解空間范圍。而在遺傳算法即將結(jié)束的階段,則應(yīng)當(dāng)加大懲罰力度,使得種群中有盡量多的可行解。此外,當(dāng)搜索過程長(zhǎng)時(shí)間沒有發(fā)現(xiàn)更好的解時(shí)(可能已經(jīng)陷入局部最優(yōu)),則應(yīng)調(diào)小懲罰系數(shù),加大算法跳出局部最優(yōu)解的概率。同理,如果算法種群中存在大量違反約束程度較多的不可行解,則應(yīng)調(diào)大懲罰系數(shù),引導(dǎo)算法搜索方向到可行解域中。
基于上述分析,設(shè)計(jì)了罰函數(shù)懲罰系數(shù)自適應(yīng)機(jī)制,如圖3所示。進(jìn)化過程中,算法依據(jù)種群當(dāng)前狀態(tài)在算法運(yùn)行階段自適應(yīng)調(diào)整懲罰系數(shù),從而控制約束處理(constraint handling)步驟中懲罰力度的大小,從而引導(dǎo)算法在最有希望獲取問題優(yōu)化解的區(qū)域進(jìn)行搜索。
圖3 自適應(yīng)懲罰系數(shù)調(diào)整示意Fig.3 Illustration of the penalty coefficient adaptive adjustment for penalty function method
自適應(yīng)懲罰系數(shù)cp(λ)動(dòng)態(tài)變化方式為:
(9)
其中:λ表示當(dāng)前進(jìn)化代數(shù);case#1 表示當(dāng)前種群中最優(yōu)個(gè)體已經(jīng)連續(xù)h代為不可行解,或最優(yōu)個(gè)體已經(jīng)連續(xù)h代沒有變化(可能陷入了局部最優(yōu));case#2表示當(dāng)前種群中最優(yōu)個(gè)體已經(jīng)連續(xù)h代為可行解;θ1、θ2為變化參數(shù),0<θ1,θ2<1,且θ1≠θ2(防止循環(huán));cgen(λ)是進(jìn)化罰系數(shù),其隨著DA4TSC進(jìn)化迭代過程的進(jìn)行而不斷增加,可表示為如式(10)所示的遞推關(guān)系式。
cgen(λ+1)=cp(λ)+cstep
(10)
式中,cstep是進(jìn)化迭代步長(zhǎng),可表示為:
(11)
式中:cp(0)是初始懲罰系數(shù);λmax是DA4TSC最大迭代次數(shù);cmax是預(yù)設(shè)懲罰系數(shù)上限,cmax可根據(jù)經(jīng)驗(yàn)估計(jì)得到。
采用隨機(jī)生成方式,產(chǎn)生應(yīng)急航天任務(wù)集合,并構(gòu)造不同規(guī)模的測(cè)試用例16組,如表1所示。
表1 實(shí)驗(yàn)數(shù)據(jù)說明Tab.1 Description of experimental data
其中,ID是實(shí)驗(yàn)用例唯一標(biāo)識(shí),|T_Set|為應(yīng)急航天任務(wù)數(shù)量,|S_Set|為需要構(gòu)造的衛(wèi)星數(shù)量,|Plat_Set|為備選的衛(wèi)星平臺(tái)集合,|Pyld_Set|為備選的有效載荷集合。
為證明DA4TSC的有效性,在實(shí)驗(yàn)中引入經(jīng)典的貪婪隨機(jī)自適應(yīng)搜索(Greedy Randomized Adaptive Search Procedure,GRASP)算法[19]和祝周鵬提出的基于進(jìn)化計(jì)算的衛(wèi)星平臺(tái)載荷配置優(yōu)化算法(Satellite Platform and Payload Selecting Algorithm,SPPSA)[13]作為基線進(jìn)行比較。由于在問題規(guī)模較大的情況下,分支限界、動(dòng)態(tài)規(guī)劃等精確搜索算法無法在有效時(shí)間內(nèi)給出問題解,所以未將其作為基線比較算法引入實(shí)驗(yàn)中。
在GRASP中,首先通過貪婪策略(greedy strategy)構(gòu)造出滿足約束C1的初始解,然后通過局部搜索(local search)方法提升初始解的優(yōu)化程度,并進(jìn)行進(jìn)一步的約束處理,使之滿足約束C1~C4。SPPSA按照作者在其論文中所描述的參數(shù)數(shù)值進(jìn)行設(shè)置。設(shè)置DA4TSC種群規(guī)模為50,交叉概率為0.90,衛(wèi)星平臺(tái)基因位變異概率為0.08,有效載荷基因位變異概率為0.15。初始懲罰系數(shù)設(shè)置為cp(0)=0.1;懲罰系數(shù)上限設(shè)置為cmax=10;算法迭代次數(shù)上限λmax=50 000;持續(xù)不變代數(shù)h=200;懲罰系數(shù)變化參數(shù)θ1=0.96,θ2=0.98。如果連續(xù)300代結(jié)果沒有改進(jìn),則算法退出。效費(fèi)比已經(jīng)進(jìn)行了歸一化。GRASP中任務(wù)接受概率設(shè)置為0.5,實(shí)驗(yàn)平臺(tái)為Intel (R) Core i5-9400 CPU + 16G 內(nèi)存+Windows 10,采用python3.5進(jìn)行編碼實(shí)現(xiàn)。
為了降低算法隨機(jī)性對(duì)評(píng)價(jià)結(jié)果的影響,實(shí)驗(yàn)中采用3種算法獨(dú)立計(jì)算實(shí)驗(yàn)用例50次,然后對(duì)計(jì)算結(jié)果取平均值,實(shí)驗(yàn)結(jié)果如圖4所示。
圖4 不同算法計(jì)算結(jié)果比較Fig.4 Comparison of the computation results of different algorithms
由圖4可知,相比于GRASP和SPPSA,DA4TSC取得了更好的計(jì)算結(jié)果。隨著問題規(guī)模增大(如航天應(yīng)急任務(wù)增多、構(gòu)造的衛(wèi)星數(shù)量增多、備選衛(wèi)星平臺(tái)和有效載荷增多),DA4TSC的計(jì)算優(yōu)勢(shì)更加明顯。相比于GRASP的貪婪隨機(jī)搜索策略,兩種基于進(jìn)化計(jì)算的算法SPPSA和DA4TSC能夠在解空間全局范圍內(nèi)迭代尋優(yōu),因而效果均比GRASP好。而與SPPSA相比,DA4TSC具有更加高效的約束處理機(jī)制,能夠通過對(duì)懲罰系數(shù)的自適應(yīng)調(diào)整,降低算法陷入局部最優(yōu)解的概率,從而能夠獲得更加優(yōu)化的計(jì)算結(jié)果。
對(duì)基于遺傳算法的兩種算法SPPSA和DA4TSC的收斂迭代次數(shù)進(jìn)行比較,如圖5所示。實(shí)驗(yàn)設(shè)定為:如果連續(xù)300代算法結(jié)果不改進(jìn),則認(rèn)為算法收斂而退出;采用兩種算法獨(dú)立計(jì)算實(shí)驗(yàn)用例50次,然后對(duì)收斂迭代次數(shù)取平均值。由圖5可知,在所有的實(shí)驗(yàn)用例中,DA4TSC的迭代次數(shù)均低于SPPSA,說明相較于SPPSA,DA4TSC具有更快的收斂速度。這是由于DA4TSC采用了基于自適應(yīng)罰函數(shù)的約束處理機(jī)制,罰函數(shù)方法能夠引導(dǎo)遺傳算法從可行解域和不可行解域雙向逼近問題最優(yōu)解,而自適應(yīng)的懲罰系數(shù)調(diào)整能夠有效地使搜索避免陷入局部最優(yōu)。因而,DA4TSC面向不同規(guī)模、不同分布的問題均能保持較好的收斂性。
圖5 元啟發(fā)式算法收斂迭代次數(shù)比較Fig.5 Comparison of the iterative times of nature-inspired metaheuristic algorithms
適應(yīng)任務(wù)的模塊化衛(wèi)星快速構(gòu)建優(yōu)化決策問題是應(yīng)急響應(yīng)空間中出現(xiàn)的新且復(fù)雜的問題。本文在深入分析該問題特點(diǎn)的基礎(chǔ)上,建立了約束滿足問題模型,設(shè)計(jì)了基于遺傳算法的優(yōu)化決策方法DA4TSC,在約束處理上,引入了基于罰函數(shù)法的約束處理方法,針對(duì)罰函數(shù)法中懲罰系數(shù)難于確定的特點(diǎn),設(shè)計(jì)了懲罰系數(shù)自適應(yīng)調(diào)整的動(dòng)態(tài)罰函數(shù)機(jī)制。通過實(shí)驗(yàn)證明本文所提方法的可用性及有效性。
下一步的工作在于將機(jī)器學(xué)習(xí)方法引入優(yōu)化決策算法之中。讓算法通過對(duì)歷史優(yōu)化決策結(jié)果的增量式學(xué)習(xí)能夠在計(jì)算過程中更加有目的地搜索解空間中更有希望包含最優(yōu)解的區(qū)域,從而進(jìn)一步提升算法優(yōu)化性能和收斂速度。