王國(guó)梁,趙 滟,楊卓鵬,楊 超
(中國(guó)航天系統(tǒng)科學(xué)與工程研究院,北京 100048)
武器系統(tǒng)效能是指武器系統(tǒng)能夠滿足(或完成)一組特定任務(wù)要求的量度。如何在效能參數(shù)閾值內(nèi),尋找到最佳參數(shù)組合,達(dá)到效能最大化,是武器系統(tǒng)效能優(yōu)化的實(shí)質(zhì)。由于影響武器效能的因素眾多,這些因素間的相互關(guān)系是不確定的,與系統(tǒng)效能的關(guān)系也是不確定的。如何確定這些指標(biāo)參數(shù),從而使武器系統(tǒng)的效能值最大,對(duì)于武器的論證、研制、改進(jìn)具有重要的現(xiàn)實(shí)意義。
進(jìn)化算法作為一種智能優(yōu)化算法,由于不依賴于解析模型和梯度信息,不進(jìn)行求導(dǎo)操作,不存在函數(shù)連續(xù)的約束,并具有很強(qiáng)的全局搜索能力,因此在武器系統(tǒng)效能優(yōu)化問題上已經(jīng)得到了應(yīng)用。汪民樂等設(shè)計(jì)了新的編碼方案和遺傳算子,采用改進(jìn)遺傳算法對(duì)戰(zhàn)術(shù)導(dǎo)彈靶場(chǎng)效能進(jìn)行了優(yōu)化研究;黃昆鳥等結(jié)合系統(tǒng)效能神經(jīng)網(wǎng)絡(luò)仿真模型構(gòu)造的目標(biāo)函數(shù)和混合遺傳算法對(duì)末敏彈進(jìn)行了系統(tǒng)效能參數(shù)優(yōu)化設(shè)計(jì);李志猛等采用經(jīng)典的多種群遺傳算法對(duì)常規(guī)導(dǎo)彈綜合火力打擊效能進(jìn)行了優(yōu)化研究;黃鳳華等以灰色神經(jīng)網(wǎng)絡(luò)構(gòu)造的仿真模型作為目標(biāo)函數(shù),采用遺傳算法對(duì)末敏彈進(jìn)行了系統(tǒng)效能參數(shù)優(yōu)化設(shè)計(jì);汪樂民等設(shè)計(jì)了一種采用實(shí)數(shù)編碼的多目標(biāo)遺傳進(jìn)化算法用于求解導(dǎo)彈對(duì)面積目標(biāo)射擊效能的優(yōu)化模型;林濤等將組合差分進(jìn)化算法引入作戰(zhàn)仿真環(huán)節(jié),解決了效能優(yōu)化目標(biāo)函數(shù)難以構(gòu)建的問題,并為武器裝備作戰(zhàn)效能的優(yōu)化提供了手段;張磊瀟等通過效能分析建立了艦艇綜合防御魚雷作戰(zhàn)決策優(yōu)化模型,并采用遺傳算法求解優(yōu)化模型。
武器系統(tǒng)效能優(yōu)化問題具有多變量多峰值的特點(diǎn),而當(dāng)前武器效能優(yōu)化所采用的智能優(yōu)化算法,在面對(duì)此種情況,顯現(xiàn)出優(yōu)化效率低,優(yōu)化結(jié)果不穩(wěn)定的問題。為此,本文結(jié)合深度神經(jīng)網(wǎng)絡(luò)建立的系統(tǒng)效能模型,提出一種改進(jìn)多種群差分進(jìn)化算法,并對(duì)其優(yōu)化效果和性能進(jìn)行了對(duì)比分析。
深度神經(jīng)網(wǎng)絡(luò)具有高度非線性映射能力,是一種有效的多層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法,其主要特點(diǎn)是信號(hào)前向傳遞,而誤差后向傳播,通過不斷調(diào)節(jié)網(wǎng)絡(luò)權(quán)重值,使得網(wǎng)絡(luò)的最終輸出與期望輸出盡可能接近,以達(dá)到訓(xùn)練的目的。
圖1 深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
Z
[]=W
[]·A
[-1]+b
[](1)
激活函數(shù)g
[]:(2)
成本函數(shù)J
(w
,b
)為:(3)
利用得到的誤差值進(jìn)行逆向傳播,并采用梯度下降法對(duì)神經(jīng)元權(quán)值W
[]和閾值b
[]進(jìn)行修正(4)
(5)
(6)
(7)
(8)
(9)
由于影響防空導(dǎo)彈武器系統(tǒng)效能的因素太多,這里選取發(fā)射車輛(C
1)、平均故障間隔時(shí)間(C
2)、平均修復(fù)時(shí)間(C
3)、導(dǎo)彈飛行速度(C
4)、最大射程(C
5)、發(fā)射質(zhì)量(C
6)、導(dǎo)彈數(shù)量(C
7)、目標(biāo)通道數(shù)(C
8)、系統(tǒng)反應(yīng)時(shí)間(C
9)、最大探測(cè)距離(C
10)、制導(dǎo)精度(C
11)、單發(fā)殺傷概率(C
12)、指揮控制能力(C
13)、機(jī)動(dòng)力(C
14)等作為影響因素。由于訓(xùn)練樣本的數(shù)量與質(zhì)量關(guān)系到深度神經(jīng)網(wǎng)絡(luò)模型的仿真可信度,而實(shí)際中防空導(dǎo)彈武器系統(tǒng)效能數(shù)據(jù)樣本較少。故通過文獻(xiàn)[11]所提方法對(duì)已有樣本進(jìn)行了擴(kuò)增。由此獲得800組數(shù)據(jù),并采用離差標(biāo)準(zhǔn)化法對(duì)數(shù)據(jù)中量綱類性能指標(biāo)進(jìn)行歸一化處理,歸一化后的數(shù)據(jù)樣本見表1。
表1 歸一化后的數(shù)據(jù)樣本
使用上述訓(xùn)練樣本訓(xùn)練深度神網(wǎng)絡(luò)。通過信號(hào)的前向傳播與誤差值的反向傳播理論,利用式(1)-式(9),最終得到一個(gè)基于深度神經(jīng)網(wǎng)絡(luò)的系統(tǒng)效能模型,即系統(tǒng)效能優(yōu)化函數(shù):
(10)
差分進(jìn)化算法(Differential Evolution Algorithm,DE)是一種高效的全局優(yōu)化算法,是將種群中的向量作為尋優(yōu)個(gè)體,利用向量之間的加減、縮放以及互換信息來進(jìn)行種群的更新,不斷生成新的子代,通過適應(yīng)度選擇最后向最優(yōu)值收斂。該算法的基本思想是:從隨機(jī)生成的初始種群開始,通過差分變異和交叉不同個(gè)體所攜帶的信息以產(chǎn)生新的種群,比較產(chǎn)生的新種群與原始種群中相應(yīng)個(gè)體的適應(yīng)度,將優(yōu)勢(shì)向量保存到種群中,將劣勢(shì)向量淘汰,引導(dǎo)搜索向最優(yōu)解逼近。差分進(jìn)化算法的流程圖如圖2。
圖2 差分進(jìn)化算法流程圖
其主要步驟可總結(jié)如下:
1)種群的初始化。DE算法可在解空間中隨機(jī)產(chǎn)生M
個(gè)個(gè)體,每個(gè)個(gè)體由D
維向量組成:X
=(x
,1,x
,2,x
,3,…,x
,,)。第i
個(gè)個(gè)體的第j
維值取值方式如下:x
,=x
min,+rand
(0,1)(x
max,-x
min,)(11)
式中:i
∈(1,2,…M
),j
∈(1,2,…D
),x
max,、x
min,分別為x
,取值的上下界;2)計(jì)算種群個(gè)體適應(yīng)度。適應(yīng)度是用于度量群體中各個(gè)個(gè)體在優(yōu)化計(jì)算中有可能達(dá)到或接近于最優(yōu)解的優(yōu)良程度。通??芍苯舆x擇目標(biāo)函數(shù)或依據(jù)變換規(guī)則對(duì)目標(biāo)函數(shù)進(jìn)行變換得到適應(yīng)度函數(shù)。其中,線性變換可表示為
F
′=α
*F
(X
)+β
(12)
式中:F
(X
)為目標(biāo)函數(shù),F
′ 為變換后的適應(yīng)度函數(shù),α
、β
由目標(biāo)函數(shù)的平均值和變換后的適應(yīng)度函數(shù)最大計(jì)確定;3)差分變異操作?;镜牟罘肿儺悶?p>DE/rand/1變異,指隨機(jī)選取多個(gè)父代種群中代表不同個(gè)體的向量,通過向量之間的加減縮放運(yùn)算,得到區(qū)別于父代種群的變異個(gè)體,實(shí)現(xiàn)可行解空間中不同區(qū)域的優(yōu)化,其表示為H
(n
)=X
(n
)+F
·(X
(n
)-X
(n
))(13)
其變異方式還有很多種,在這里只列出DE/target-to-best/1變異方式,可表示為
H
(n
)=X
(n
)+F
(X
(n
)-X
(n
))+F
(X
(n
)-X
(n
))(14)
式中,n
為第n
代,X
(n
)為當(dāng)前個(gè)體,p
,p
,p
∈[1,M
],且X
(n
)≠X
(n
)≠X
(n
),X
(n
)為當(dāng)前最優(yōu)個(gè)體,F
為變異因子;4)交叉。DE
算法通過變換目標(biāo)向量X
和變異向量H
間的部分信息生成新的個(gè)體,進(jìn)而提高種群的多樣性,并將變異個(gè)體與原個(gè)體統(tǒng)稱為試驗(yàn)個(gè)體存放在試驗(yàn)種群中,二項(xiàng)交叉操作可表示為:(15)
式中,Cr
為交叉概率;V
,為試驗(yàn)個(gè)體;5)選擇操作。通過一對(duì)一生存競(jìng)爭(zhēng),比較原向量與目標(biāo)向量間的適應(yīng)值,選擇保留更高適應(yīng)值的個(gè)體,進(jìn)而生成新一代種群,完成種群的更新迭代。選擇操作可表示為:
(16)
基本差分進(jìn)化算法及其變種算法在單獨(dú)用于處理復(fù)雜的多維變量、多峰值、非線性程度高的問題時(shí),容易出現(xiàn)停滯現(xiàn)象,收斂到局部最優(yōu)。為了更穩(wěn)定、準(zhǔn)確地獲得導(dǎo)彈武器系統(tǒng)效能的最大化,引入多種群協(xié)同進(jìn)化策略和參數(shù)自適應(yīng)調(diào)整策略,結(jié)合DE/rand/1/bin與DE/target-to-best/1/bin算法,提出了改進(jìn)多種群差分進(jìn)化算法(IMPDE)。其核心思想是將種群分為多個(gè)子種群,并利用DE/rand/1/bin算法在優(yōu)化過程中可維持種群多樣性以及DE/target-to-best/1/bin算法快速尋優(yōu)的特點(diǎn),對(duì)種群進(jìn)行進(jìn)化操作。其中,奇數(shù)種群采用DE/rand/1/bin算法,且迭代次數(shù)與外部循環(huán)保持一致,偶數(shù)種群采用自適應(yīng)DE/target-to-best/1/bin算法,且內(nèi)部設(shè)置單獨(dú)循環(huán),經(jīng)過一定代數(shù)后,種群間進(jìn)行個(gè)體遷移。這種混合模式不僅保證了種群的多樣性,防止出現(xiàn)“進(jìn)化停滯”,陷入局部最優(yōu),而且可以快速收斂到最優(yōu)值,提高了算法的穩(wěn)定性與準(zhǔn)確性。
其實(shí)現(xiàn)過程如下:
1)生成和分配多種群。采用實(shí)整數(shù)編碼規(guī)則進(jìn)行編碼,在可行解空間內(nèi),由式(11)隨機(jī)初始化生成K個(gè)染色體,并將其按一定規(guī)模分配給NP個(gè)種群;
2)計(jì)算及評(píng)價(jià)種群個(gè)體適應(yīng)度。由式(12)對(duì)目標(biāo)函數(shù)式(10)進(jìn)行線性變換得到適應(yīng)度函數(shù),評(píng)價(jià)并記錄種群個(gè)體的適應(yīng)度;
3)多種群協(xié)同進(jìn)化。
對(duì)奇數(shù)種群采用DE/rand/1/bin算法進(jìn)行進(jìn)化操作。遍歷種群列表,為不同的奇數(shù)種群設(shè)置不同的變異因子和交叉概率,以等差數(shù)列的方式在F(0.4~1)和Cr(0.5~1)內(nèi)取值;然后由式(13)、式(15)和式(16),計(jì)算得到新一代種群;
對(duì)偶數(shù)種群采用DE/target-to-best/1/bin算法進(jìn)行進(jìn)化操作。首先依據(jù)文獻(xiàn)[14][15]設(shè)置自適應(yīng)的變異因子與交叉概率,公式分別如下:
(17)
(18)
其中,F
=0.
2為初始變異因子的值,g
為當(dāng)前迭代次數(shù),G
=10為獨(dú)立循環(huán)的最大迭代次數(shù),[Cr
,Cr
]=[0.
3,0.
9]為交叉概率的變化范圍,c
為初始種群平均適應(yīng)度方差,c
為第g
代種群平均適應(yīng)度方差的允許值,c
(g
)為第g
代種群平均適應(yīng)度方差;然后,由式(14)~式(16),計(jì)算得到新一代種群;最后以最大進(jìn)化代數(shù)作為循環(huán)的終止依據(jù);4)循環(huán)操作。采用最大進(jìn)化代數(shù)作為終止判據(jù),若達(dá)到最大進(jìn)化代數(shù);則終止進(jìn)化,否則進(jìn)入下一步;
5)群間個(gè)體遷移。遷移條件設(shè)置為每進(jìn)行2代,開展1次遷移。以環(huán)狀結(jié)構(gòu)為遷移結(jié)構(gòu),根據(jù)遷出概率,從遷出種群中擇優(yōu)選擇遷出個(gè)體,擇劣替換待遷入種群中的個(gè)體,流程圖如圖3。
圖3 改進(jìn)多種群差分進(jìn)化算法流程圖
本文以防空導(dǎo)彈武器系統(tǒng)效能最大化作為優(yōu)化目標(biāo),其效能優(yōu)化函數(shù)即式(10),并以表2所列的因素作為優(yōu)化參數(shù),經(jīng)歸一化處理后,轉(zhuǎn)為輸入變量。
表2 效能優(yōu)化參數(shù)
按照上述基于IMPDE算法的導(dǎo)彈武器系統(tǒng)效能優(yōu)化方法,解的系統(tǒng)參數(shù)的最佳組合為:發(fā)射車輛C=3,平均故障時(shí)間C=220.5h,平均修復(fù)時(shí)間C=1.42h,導(dǎo)彈飛行速度C=2.250馬赫,最大射程C=4.212km,發(fā)射質(zhì)量C=14.67kg,導(dǎo)彈數(shù)量C=4,目標(biāo)通道數(shù)C=3,系統(tǒng)反應(yīng)時(shí)間C=3s,最大探測(cè)距離C=18.75km,制導(dǎo)精度C=0.65m,單發(fā)殺傷概率C=0.74,指揮控制能力C=0.80,機(jī)動(dòng)力C=98.5km/h。此時(shí)防空導(dǎo)彈武器系統(tǒng)效能最大為0.7874。
為進(jìn)一步分析改進(jìn)算法在防空導(dǎo)彈武器系統(tǒng)效能優(yōu)化過程中的效果及性能,采用結(jié)果對(duì)比來驗(yàn)證,對(duì)比的算法為:
● DE/rand/1/bin(算法1)
● DE/target-to-best/1/bin(算法2)
● 基于算法1的多種群差分進(jìn)化算法(算法3)
分別采用算法1、算法2、算法3、改進(jìn)多種群差分進(jìn)化算法(IMPDE)對(duì)基于深度神經(jīng)網(wǎng)絡(luò)的系統(tǒng)效能模型進(jìn)行尋優(yōu)。其中進(jìn)化代數(shù)設(shè)置為1000代,IMPDE算法種群規(guī)模為(60,60,60);算法1和算法2的種群規(guī)模為60,變異因子F和交叉概率Cr采用固定參數(shù)(0.5,0.5);算法3的種群規(guī)模為(60,60,60),不同的種群以等差數(shù)列的方式在F(0.4~1)和Cr(0.5~1)內(nèi)取值。每個(gè)算法依次進(jìn)行100次實(shí)驗(yàn),預(yù)設(shè)精度為0.00001,分別統(tǒng)計(jì)最優(yōu)值、最差值、均值與標(biāo)準(zhǔn)差,以及100次實(shí)驗(yàn)中各個(gè)算法進(jìn)化結(jié)果進(jìn)入預(yù)設(shè)精度的成功率,并將其作為各算法穩(wěn)定性的評(píng)價(jià)指標(biāo)。各算法進(jìn)行100次實(shí)驗(yàn)的進(jìn)化結(jié)果如表3所示。
表3 各算法進(jìn)行100次實(shí)驗(yàn)的進(jìn)化結(jié)果
由表3數(shù)值進(jìn)行分析。通過100次實(shí)驗(yàn),在規(guī)定精度內(nèi),改進(jìn)算法與三種對(duì)比算法都有機(jī)會(huì)尋找到最優(yōu)值,即效能最大值;但四種算法在收斂穩(wěn)定性上差異較大,由最優(yōu)值與最差值的范圍可獲知,IMPDE算法的收斂結(jié)果在極小的范圍內(nèi)波動(dòng),算法1和算法3的波動(dòng)較小,算法2的波動(dòng)范圍則較大;由均值和標(biāo)準(zhǔn)差可知IMPDE算法每次運(yùn)行的結(jié)果基本分布在最優(yōu)值附近,成功率達(dá)到100%,算法1和3大多分布于最優(yōu)值處,部分處于0.780附近,推測(cè)原因?yàn)橄萑刖植繕O值,算法2的分布最為離散,且其成功率僅為43%。這種差異在圖4中表現(xiàn)的更為直觀,各算法進(jìn)行100次實(shí)驗(yàn)的進(jìn)化結(jié)果分布如圖4所示。由此可得,從算法收斂精度和穩(wěn)定性角度結(jié)合來看,改進(jìn)多種群差分進(jìn)化算法(IMPDE)表現(xiàn)的要優(yōu)于三種對(duì)比算法。
圖4 各算法進(jìn)行100次實(shí)驗(yàn)的進(jìn)化結(jié)果分布
由于對(duì)比算法的優(yōu)化結(jié)果存在不確定性,導(dǎo)致優(yōu)化過程不盡相同,故此處只選取IMPDE算法其中一次實(shí)驗(yàn)的優(yōu)化過程進(jìn)行展示,IMPDE算法在優(yōu)化過程中種群個(gè)體最優(yōu)目標(biāo)函數(shù)值與種群個(gè)體平均目標(biāo)函數(shù)值變化曲線如圖5所示。
圖5 IMPDE算法在優(yōu)化過程中目標(biāo)函數(shù)值變化曲線
由圖5中兩條變化曲線可知,IMPDE算法在整個(gè)優(yōu)化過程中,種群中個(gè)體的目標(biāo)函數(shù)值分布較廣,維持了種群個(gè)體的多樣性,有力地避免了在進(jìn)化后期陷入局部極值的現(xiàn)象,且種群在180代左右時(shí)已接近目標(biāo)函數(shù)的最優(yōu)值,從收斂速度的效果來看,本文所提算法可以較為快速的達(dá)到收斂。
從上述所有結(jié)果可以看出,當(dāng)面對(duì)多變量多峰值函數(shù)時(shí),在同樣維度的條件下,改進(jìn)多種群差分進(jìn)化算法相較于對(duì)比算法在收斂精度、收斂速度和穩(wěn)定性以及維持種群個(gè)體多樣性方面皆具有較大的優(yōu)勢(shì),并且這種效果隨著變量個(gè)數(shù)增多或峰值范圍變大而更加顯著。
本文以防空導(dǎo)彈武器系統(tǒng)效能優(yōu)化為研究對(duì)象,根據(jù)系統(tǒng)效能優(yōu)化問題涉及因素復(fù)雜,難以穩(wěn)定、準(zhǔn)確地獲得最佳參數(shù)組合,達(dá)到系統(tǒng)效能最大化的難題,提出了改進(jìn)多種群差分進(jìn)化算法(IMPDE),并將該算法與基于深度神經(jīng)網(wǎng)絡(luò)的系統(tǒng)效能模型相結(jié)合。通過對(duì)比實(shí)驗(yàn),表明了本文所提算法在系統(tǒng)效能優(yōu)化問題中具有較好的尋優(yōu)效果,為實(shí)現(xiàn)導(dǎo)彈武器系統(tǒng)效能研究提供了新的方法和手段。