齊長興,畢義明,李 勇
(火箭軍工程大學(xué), 西安 710025)
導(dǎo)彈作戰(zhàn)時(shí)面臨著彈道導(dǎo)彈防御系統(tǒng)的攔截,充分運(yùn)用各種突防技術(shù)可以提高導(dǎo)彈突防效能,同時(shí),合理分配導(dǎo)彈,對敵方導(dǎo)彈防御系統(tǒng)進(jìn)行壓制,也是提高導(dǎo)彈作戰(zhàn)效能的重要手段。以提高導(dǎo)彈突防效能為目的,合理進(jìn)行導(dǎo)彈-目標(biāo)分配是一種典型的武器-目標(biāo)分配(Weapon,Target,Assignment,WTA)問題,就是在作戰(zhàn)資源一定的情況下,通過對進(jìn)攻導(dǎo)彈(主突導(dǎo)彈、輔攻導(dǎo)彈)合理配置,對敵方導(dǎo)彈防御系統(tǒng)進(jìn)行壓制,通過對輔攻導(dǎo)彈的合理配置和戰(zhàn)術(shù)運(yùn)用,提高導(dǎo)彈突防效能。
WTA問題是一個(gè)典型的NP完全問題[1],隨著規(guī)模的增加,問題的求解時(shí)間呈指數(shù)級增長。傳統(tǒng)的算法在解決這類問題時(shí)較為困難,當(dāng)前主要采用啟發(fā)式算法求解。文獻(xiàn)[2]提出了離散粒子群優(yōu)化求解WTA問題的方法;文獻(xiàn)[3]提出了求解WTA問題的局部協(xié)同控制方法;文獻(xiàn)[4]將MOPSO (Multi-object Particle Swarm Optimization, MOPSO) 和TOPSIS(Technique for Order Preference by Similarity to an Ideal Solution,TOPSIS)結(jié)合,進(jìn)行多目標(biāo)武器目標(biāo)分配問題求解;文獻(xiàn)[5]提出了一種自適應(yīng)并行群選擇算法解決武器目標(biāo)分配問題,取得了較好的應(yīng)用效果;文獻(xiàn)[6]建立了基于改進(jìn)型多目標(biāo)粒子群優(yōu)化算法,應(yīng)用于較大規(guī)模的WTA問題實(shí)時(shí)求解等。但是這些算法不同程度上存在早熟收斂、進(jìn)化速度慢及計(jì)算復(fù)雜等問題,在實(shí)際問題應(yīng)用中還需要進(jìn)行調(diào)整優(yōu)化。
基于突防效能的導(dǎo)彈-目標(biāo)分配問題是在給定作戰(zhàn)條件下,以導(dǎo)彈防御系統(tǒng)為作戰(zhàn)目標(biāo),合理分配火力使得主突導(dǎo)彈突防效能最高。本文構(gòu)建了基于突防效能的導(dǎo)彈-目標(biāo)分配模型,并以粒子群算法為主體,采用混沌優(yōu)化策略和禁忌搜索策略對粒子群算法進(jìn)行優(yōu)化,構(gòu)建改進(jìn)的混合粒子群算法對模型進(jìn)行求解,案例分析驗(yàn)證了方法的可行性。
設(shè)m為導(dǎo)彈武器的種類,Mi(i=1,2,3,…,m)為第i種導(dǎo)彈武器的數(shù)量;n為導(dǎo)彈防御體系中作戰(zhàn)主體(例如,預(yù)警衛(wèi)星、預(yù)警機(jī)、雷達(dá)、反導(dǎo)導(dǎo)彈、電子戰(zhàn)裝備、電磁武器等)數(shù)量。l為防御系統(tǒng)體系中作戰(zhàn)主體類型數(shù),nj(j=1,2,3,…,l)為第j種作戰(zhàn)主體的數(shù)量。第i類導(dǎo)彈對防御體系中第j個(gè)作戰(zhàn)主體毀傷概率為eij。引入WTA矩陣,分配矩陣X和毀傷概率矩陣E分別為:
(1)
(2)
xij=1表示分配了第i個(gè)導(dǎo)彈武器打擊敵j個(gè)目標(biāo),否則xij=0。eij表示第i個(gè)導(dǎo)彈武器打擊敵j個(gè)目標(biāo)使得毀傷概率。
針對導(dǎo)彈防御系統(tǒng)中不同的作戰(zhàn)主體對導(dǎo)彈防御系統(tǒng)整體功能發(fā)揮的作用重要度不同,對不同的作戰(zhàn)主體進(jìn)行打擊后,提高導(dǎo)彈突防效能的程度不同,本文引入突防貢獻(xiàn)度的概念,對導(dǎo)彈突防作戰(zhàn)效果進(jìn)行評價(jià)。突防貢獻(xiàn)度即:對導(dǎo)彈防御系統(tǒng)中某個(gè)作戰(zhàn)主體(節(jié)點(diǎn))進(jìn)行打擊后,對導(dǎo)彈突防效能提高的貢獻(xiàn),用[0,1]區(qū)間的實(shí)數(shù)表示突防貢獻(xiàn)度的大小??紤]突防貢獻(xiàn)度后,導(dǎo)彈-目標(biāo)火力分配模型可以表示為:
(3)
式中,F(xiàn)為導(dǎo)彈突防的效益函數(shù);Cj為第j個(gè)作戰(zhàn)主體被打擊后的突防貢獻(xiàn)度,采用專門的評價(jià)方法進(jìn)行確定。
粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法具有良好的全局和局部搜索能力[7],在求解問題優(yōu)化時(shí)得到了很好的應(yīng)用。但是粒子群優(yōu)化算法后期容易陷入早熟收斂,局部尋優(yōu)能力不高。本文提出了一種基于混沌優(yōu)化與禁忌搜索策略的混合粒子群優(yōu)化算法[8]。采用混沌優(yōu)化方法生成初始種群,以保持種群多樣性;采用禁忌搜索策略,以提高搜索效率,避免了基本粒子群優(yōu)化算法中存在的易于陷入局部最優(yōu)的問題。
Logistic映射和Tent映射在混沌系統(tǒng)中具有較為廣泛的應(yīng)用,Tent映射比Logistic映射的遍歷性和迭代速度更快[9]。因此,采用Tent映射產(chǎn)生混沌序列,其表達(dá)式為:
z(t+1)=T(z(t))=
(4)
式中,z(t)∈[0,1]。
Tent映射在迭代過程中存在小周期(0.2,0.4,0.8,0.6),以及在不穩(wěn)定周期點(diǎn)0.25,0.5,0.75將迭代到不動點(diǎn)0。為避免該現(xiàn)象的出現(xiàn),對tent映射進(jìn)行改進(jìn),改進(jìn)后的tent映射為:
當(dāng)z(t)=0,0.25,0.5,0.75,或z(t)=z(t-k),k=0,1,2,3,4時(shí),z(t+1)=z(t)+0.01·rand(0,1)
Tent映射混沌序列生成的步驟如下:
步驟1初始化,隨進(jìn)生成n個(gè)[0,1]區(qū)間的隨機(jī)數(shù)。
步驟2進(jìn)行混沌變換。
根據(jù)混沌模型,進(jìn)行混沌變換,生成n個(gè)混沌變量。
步驟3將混沌變量映射到變量區(qū)間。
將混沌序列映射到變量空間[xjmin,xjmax],得到初始種群中第i個(gè)體的第j個(gè)分量xij,xij=xjmin+(xjmax-xjmin)·zij。
1) 算法描述
基本PSO算法的數(shù)學(xué)描述為:N維搜索空間中,種群位置為X={x1,x2,…,xn}T,第i個(gè)粒子位置為xi=(xi1,xi2,…,xin),速度為vi=(vi1,vi2,…,vin)。在迭代過程中,通過跟蹤個(gè)體的最優(yōu)位置和全局最優(yōu)位置來更新個(gè)體的速度和位置,設(shè)pi為第i個(gè)粒子所經(jīng)歷的個(gè)體最優(yōu)位置,pi=(pi1,pi2,…,piN),pg為全局最優(yōu)位置,pg=(pg1,pg2,…,pgn)。
PSO算法的進(jìn)化方程為:第t代粒子的第n維速度和位置由以下公式計(jì)算:
vin(t+1)=ωvin(t)+c1r1(pin(t)-xin(t))+
c2r2(pgn(t)-xin(t))
(5)
xin(t+1)=xin(t)+vin(t+1)
1≤i≤M,1≤n≤N
(6)
式中,vin(t)表示第i個(gè)粒子的第n維在第t次迭代中的位置和速度;ω為慣性權(quán)重,c1、c2為學(xué)習(xí)因子,r1、r2為[0,1]區(qū)間內(nèi)的隨機(jī)數(shù);-vmax≤vin(t)≤vmax,vmax為預(yù)先設(shè)定的最大迭代步長。
對于目標(biāo)分配問題,需要對粒子的位置和速度取整,使搜索在整數(shù)域中進(jìn)行,對速度分量進(jìn)行修訂,如公式所示。
vin(t+1)=int[ωvin(t)+c1r1(pin(t)-xin(t))+
c2r2(pgn(t)-xin(t))]
(7)
xin(t+1)=xin(t)+vin(t+1)
1≤i≤M,1≤n≤N
(8)
2) 編碼和解碼
為保持種群多樣性和個(gè)體均勻分布,采用Tent混沌映射初始化種群。首先利用Tent混沌映射生成混沌序列,然后將混沌序列映射到解空間,最后對所有解排序,將適應(yīng)度較優(yōu)的作為初始化種群的解。
根據(jù)要解決的問題的需要,對PSO算法中的粒子進(jìn)行編碼,并滿足約束條件,采用實(shí)數(shù)編碼方式進(jìn)行編碼。PSO粒子編碼方案如圖1所示。
圖1 PSO算法編碼方案
圖1表示n類導(dǎo)彈打擊m個(gè)目標(biāo)的編碼,Xij表示第i類導(dǎo)彈打擊第j個(gè)目標(biāo)的數(shù)量。每個(gè)目標(biāo)對應(yīng)一個(gè)基因段,每個(gè)基因段長度為n,則編碼的長度為m×n。
3) 參數(shù)設(shè)計(jì)
取目標(biāo)函數(shù)為適應(yīng)度函數(shù)。
(9)
1) 慣性權(quán)重,
慣性權(quán)重取值大小影響算法的搜索能力,為了平衡全局搜索和局部搜索能力,設(shè)計(jì)自適應(yīng)慣性權(quán)重。在算法早期采用較大的慣性權(quán)重,以保證較強(qiáng)的全局搜索能力;在算法后期采用較小的慣性權(quán)重,可以提高局部搜索精度。
根據(jù)全局最優(yōu)值的變化情況自適應(yīng)調(diào)整慣性權(quán)重,調(diào)整策略如下:
ω(t)=(1+e-k)-1
(10)
式中,ω(t)為第t次迭代時(shí)慣性權(quán)重,k為進(jìn)化速度因子。
(11)
式中,fg(t)為第t代全局最優(yōu)值的適應(yīng)度。
2) 學(xué)習(xí)因子優(yōu)化
對學(xué)習(xí)因子進(jìn)行混沌處理,以提高算法的收斂速度。
Ci(t+1)=Cmin+(Cmax-Cmin)·zi(t+1)
(12)
式中,Ci(t)∈[1.4,2]。
4) 早熟處理
粒子群算法迭代后期,收斂速度降低,易于陷入局部最優(yōu),出現(xiàn)早熟現(xiàn)象,當(dāng)出現(xiàn)早熟現(xiàn)象時(shí),對粒子進(jìn)行混沌優(yōu)化,使其跳出局部最優(yōu),提高全局搜索能力。
設(shè)定一個(gè)計(jì)數(shù)器P,用于統(tǒng)計(jì)當(dāng)前全局最優(yōu)解連續(xù)出現(xiàn)的次數(shù)。給定一個(gè)閾值c,如果p=c則認(rèn)為出現(xiàn)局部最優(yōu),陷入早熟。
當(dāng)粒子群出現(xiàn)早熟現(xiàn)象時(shí),采用Tent混沌映射對當(dāng)前生成的粒子進(jìn)行混沌優(yōu)化,使其跳出局部最優(yōu)值。
步驟1采用Tent混沌映射對當(dāng)前全局最優(yōu)值進(jìn)行混沌變換;
步驟2計(jì)算混沌變換后適應(yīng)度值,與當(dāng)前全局最優(yōu)解比較,取較優(yōu)解作為當(dāng)前全局最優(yōu)解;
步驟3判斷是否終止條件,如果滿足則輸出最優(yōu)解,否則轉(zhuǎn)到步驟1。
TS(Tabu Search) 算法是一種全局逐步尋優(yōu)的亞啟發(fā)式搜索算法,并得到了較好的發(fā)展[10]。TS算法通過設(shè)置禁忌表,避免對局部最優(yōu)解的重復(fù)搜索,同時(shí)通過設(shè)置“特赦準(zhǔn)則”,保持搜索過程的多樣性。
禁忌搜索算法的基本過程如下:
步驟1設(shè)置禁忌表(tabu list)H=?,并選定一個(gè)初始解X′;設(shè)置禁忌長度Tmax、終止條件、候選集Can_N(X′)等。
TS算法對初值依賴性較強(qiáng),可以用PSO算法產(chǎn)生的性能優(yōu)良的解作為TS算法的初值,有利于進(jìn)行禁忌搜索,提高搜索速度;同時(shí)禁忌搜索到的解為PSO算法提供較好的粒子,提高全局搜索能力。
改進(jìn)的混合PSO算法的基本思想是,以PSO算法為主體,通過混沌序列對粒子速度和位置進(jìn)行初始化生成初始種群;設(shè)定自適應(yīng)慣性權(quán)重,平衡全局搜索能力和局部搜索能力;采用混沌序列生成學(xué)習(xí)因子;通過對粒子的速度和位置優(yōu)化獲得尋優(yōu)目的。在粒子進(jìn)化過程中引入禁忌搜索策略,避免對粒子的重復(fù)訪問,提高了搜索效率;通過早熟判斷機(jī)制進(jìn)行早熟判斷,通過混沌優(yōu)化使其跳出局部最優(yōu),提高算法的全局搜索能力。算法流程如圖2所示。
算法基本步驟如下:
步驟1初始參數(shù)設(shè)置。規(guī)模、最大迭代次數(shù)、控制變量、禁忌長度、特赦條件。
步驟2種群初始化,采用混沌優(yōu)化方法生成初始種群。
步驟3進(jìn)行種群編碼,設(shè)置禁忌表為空。
步驟4計(jì)算適應(yīng)度值。
步驟5粒子尋優(yōu),根據(jù)粒子群的狀態(tài),確定粒子群的個(gè)體最優(yōu)位置和全局最優(yōu)位置,更新粒子的個(gè)體最優(yōu)值和全局最優(yōu)值。
步驟6判斷是否滿足終止條件,如果滿足則進(jìn)行解碼、輸出結(jié)果,否則繼續(xù)進(jìn)行迭代。
步驟7確定候選解,確定當(dāng)前最優(yōu)解為候選解,并將其加入禁忌表中,更新禁忌表,用當(dāng)前的候選解替換最早進(jìn)入禁忌表的解。
步驟8判斷候選解是否滿足特赦準(zhǔn)則,如果滿足,則將解禁解作為當(dāng)前最優(yōu)解,更新禁忌表和當(dāng)前狀態(tài),轉(zhuǎn)入步驟4;否則,執(zhí)行下步操作。
步驟9判斷候選解的禁忌屬性,選擇最佳解為當(dāng)前解,更新禁忌表,轉(zhuǎn)入步驟4。
步驟10判斷是否滿足終止條件,如果滿足停止迭代,輸出最優(yōu)解;否則轉(zhuǎn)到步驟4。
圖2 算法流程
A國在XX島部署了彈道導(dǎo)彈防御系統(tǒng),包括早期預(yù)警衛(wèi)星1部(D1),預(yù)警雷達(dá)1部(D2),指控中心1部(D3),攔截彈系統(tǒng)1套(D4),電子對抗裝置一部(D5),共5個(gè)目標(biāo)。
C國導(dǎo)彈作戰(zhàn)集團(tuán)主作戰(zhàn)導(dǎo)彈型號為X型彈道導(dǎo)彈,輔助攻擊導(dǎo)彈為A型和B型常規(guī)彈道導(dǎo)彈,A型導(dǎo)彈數(shù)為15,B型導(dǎo)彈數(shù)為10,作戰(zhàn)策略為采用輔攻導(dǎo)彈進(jìn)行第1波次攻擊,對導(dǎo)彈防御系統(tǒng)進(jìn)行打擊,降低其對X型導(dǎo)彈的攔截能力。
通過專家打分法對導(dǎo)彈防御系統(tǒng)中作戰(zhàn)主體的突防貢獻(xiàn)度打分,經(jīng)過歸一化處理得到突防貢獻(xiàn)度如表1所示。
表1 突防貢獻(xiàn)度
導(dǎo)彈對目標(biāo)的毀傷概率是指導(dǎo)彈突破敵方防御后成功毀傷目標(biāo)概率,如表2所示。
表2 毀傷目標(biāo)概率
仿真環(huán)境為:Windows7 64位操作系統(tǒng),3.50 GHz處理器,8G內(nèi)存,Matlab R2014a仿真平臺。分別用粒子群優(yōu)化算法(PSO)、混沌優(yōu)化粒子群算法(CPSO)、禁忌搜索粒子群算法(TSPSO)及改進(jìn)的混合粒子群優(yōu)化算法(HPSO)進(jìn)行仿真運(yùn)算,均采用實(shí)數(shù)編碼方式進(jìn)行編碼。主要參數(shù)設(shè)置為:各算法的種群規(guī)模為30,最大迭代次數(shù)為100;PSO算法中慣性權(quán)重為0.7,學(xué)習(xí)因子為1.49;TSPSO算法中禁忌表長度為5,特赦準(zhǔn)則采用“best so far”準(zhǔn)則解禁最優(yōu)解,慣性權(quán)重為0.7,學(xué)習(xí)因子為1.49;HPSO算法初始慣性權(quán)重為0.7,初始學(xué)習(xí)因子為1.49,早熟判斷閾值為3。
分別采用粒子群優(yōu)化算法(PSO)、混沌優(yōu)化粒子群算法(CPSO)、禁忌搜索粒子群算法(TSPSO)及改進(jìn)的混合粒子群優(yōu)化算法(HPSO)進(jìn)行仿真運(yùn)行100次,
分別采用4種算法進(jìn)行仿真運(yùn)行100次,得到適應(yīng)度平均值,適應(yīng)度變化曲線如圖3所示。
圖3 平均適應(yīng)度值變化曲線
圖3描述了分別采用四種算法進(jìn)行問題求解是時(shí)適應(yīng)度變化情況,通過仿真分析可知,與PSO算法、CPSO算法和TSPSO算法相比,HPSO算法收斂速度最快,可以較快的獲得全局最優(yōu)解,而且采用HPSO算法獲得的全局最優(yōu)解優(yōu)于PSO算法、CPSO算法和TSPSO算法。
分別采用4種算法獲得的最優(yōu)導(dǎo)彈火力目標(biāo)分配結(jié)果如表3~表6所示。
表3 混合粒子群算法得到的導(dǎo)彈-目標(biāo)分配結(jié)果
表4 混沌優(yōu)化粒子群算法得到的導(dǎo)彈-目標(biāo)分配結(jié)果
表5 禁忌搜索粒子群算法得到的導(dǎo)彈-目標(biāo)分配結(jié)果
表6 粒子群算法得到的導(dǎo)彈-目標(biāo)分配結(jié)果
采用HPSO算法獲得的導(dǎo)彈-目標(biāo)分配方案對應(yīng)的最優(yōu)適應(yīng)度值為0.903,即經(jīng)過先期打擊,后續(xù)突防導(dǎo)彈的突防效能可以達(dá)到0.903;采用CPSO算法獲得的導(dǎo)彈-目標(biāo)分配方案對應(yīng)的最優(yōu)適應(yīng)度值為0.902,即經(jīng)過先期打擊,后續(xù)突防導(dǎo)彈的突防效能可以達(dá)到0.902;采用TSPSO獲得的導(dǎo)彈-目標(biāo)分配方案對應(yīng)的最優(yōu)適應(yīng)度值為0.896,即經(jīng)過先期打擊,后續(xù)突防導(dǎo)彈的突防效能可以達(dá)到0.895。可知,采用HPSO算法獲得的導(dǎo)彈目標(biāo)分配方案適應(yīng)度值最大,效果最好。
1) 通過案例分析和仿真試驗(yàn)表明,改進(jìn)的混合粒子群優(yōu)化算法具有較好的收斂性,適用于求解導(dǎo)彈目標(biāo)分配問題。
2) 本文未考慮火力打擊動態(tài)過程中目標(biāo)毀傷后對目標(biāo)分配的影響,突防貢獻(xiàn)度的賦值具有一定的主觀性,下一步將對這方面的問題加強(qiáng)研究。