陳潔鈺, 姚佩陽(yáng), 王 勃, 稅冬東
(空軍工程大學(xué)信息與導(dǎo)航學(xué)院, 陜西 西安 710077)
?
基于結(jié)構(gòu)熵和IGSO-BP算法的動(dòng)態(tài)威脅評(píng)估
陳潔鈺, 姚佩陽(yáng), 王勃, 稅冬東
(空軍工程大學(xué)信息與導(dǎo)航學(xué)院, 陜西 西安 710077)
摘要:針對(duì)傳統(tǒng)超視距空戰(zhàn)威脅評(píng)估不能根據(jù)各類(lèi)威脅因素的變化動(dòng)態(tài)調(diào)整其對(duì)應(yīng)權(quán)值的問(wèn)題,引入前向反饋(back propagation, BP)神經(jīng)網(wǎng)絡(luò),采用綜合考慮主客觀(guān)因素的結(jié)構(gòu)熵權(quán)法確定各威脅指數(shù)權(quán)值并作為神經(jīng)網(wǎng)絡(luò)訓(xùn)練參數(shù)進(jìn)行訓(xùn)練,提出了改進(jìn)螢火蟲(chóng)算法(improved glowworm swarm optimization, IGSO)和BP神經(jīng)網(wǎng)絡(luò)相結(jié)合的空戰(zhàn)動(dòng)態(tài)權(quán)值計(jì)算方法。該算法采用改進(jìn)螢火蟲(chóng)算法優(yōu)化BP網(wǎng)絡(luò)的權(quán)值和閾值,優(yōu)化后的BP網(wǎng)絡(luò)能更好地計(jì)算不同態(tài)勢(shì)下的威脅指數(shù)權(quán)值,從而根據(jù)威脅估計(jì)模型進(jìn)行威脅評(píng)估。以某一時(shí)刻預(yù)測(cè)多無(wú)人機(jī)空中對(duì)抗時(shí)的威脅度為想定,分別采用結(jié)構(gòu)熵權(quán)法和IGSO-BP進(jìn)行仿真計(jì)算。結(jié)果表明:結(jié)構(gòu)熵權(quán)法能夠科學(xué)合理地計(jì)算各威脅指數(shù)權(quán)值,IGSO-BP算法可有效解決空戰(zhàn)目標(biāo)威脅評(píng)估問(wèn)題,且所提算法與現(xiàn)有幾種算法相比在可靠性和準(zhǔn)確性上都有明顯提高。
關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò); 螢火蟲(chóng)算法; 結(jié)構(gòu)熵權(quán)法; 動(dòng)態(tài)權(quán)值; 威脅評(píng)估
0引言
隨著高新技術(shù)的不斷應(yīng)用,戰(zhàn)爭(zhēng)樣式的不斷翻新,多機(jī)協(xié)同超視距空戰(zhàn)逐漸發(fā)展成為現(xiàn)代空戰(zhàn)主要戰(zhàn)斗方式之一。戰(zhàn)爭(zhēng)的智能化、信息化使現(xiàn)代空戰(zhàn)面臨作戰(zhàn)節(jié)奏加快、作戰(zhàn)手段突變性強(qiáng)、對(duì)抗強(qiáng)烈等新的挑戰(zhàn)。因此,如何全面掌握當(dāng)前戰(zhàn)場(chǎng)態(tài)勢(shì),準(zhǔn)確、迅速、及時(shí)地反映戰(zhàn)場(chǎng)態(tài)勢(shì)的變化并做出威脅判斷使其更適合復(fù)雜多變的空戰(zhàn)環(huán)境是一個(gè)極具理論價(jià)值與現(xiàn)實(shí)意義的問(wèn)題。
威脅估計(jì)是多無(wú)人機(jī)協(xié)同作戰(zhàn)中的一項(xiàng)重要內(nèi)容,能夠?yàn)槲淦鞣峙浜捅Σ渴鹛峁┗疽罁?jù)。至今,國(guó)內(nèi)外許多學(xué)者從理論體系和系統(tǒng)實(shí)現(xiàn)方法上進(jìn)行了大量探索性的研究和開(kāi)發(fā),提出了很多威脅估計(jì)方法。文獻(xiàn)[1]針對(duì)不確定信息下的目標(biāo)威脅估計(jì)問(wèn)題,提出了基于博弈論的威脅估計(jì)的解決方法。文獻(xiàn)[2]采用目標(biāo)驅(qū)動(dòng)的本體分析方法有效解決了海戰(zhàn)場(chǎng)的威脅估計(jì)和火力分配問(wèn)題。文獻(xiàn)[3]提出了基于模糊貝葉斯網(wǎng)絡(luò)的有人機(jī)/無(wú)人戰(zhàn)斗機(jī)編隊(duì)對(duì)地威脅評(píng)估方法,并驗(yàn)證了該方法的實(shí)時(shí)性。文獻(xiàn)[4]提出了一種基于多屬性決策理論的威脅估計(jì)方法,該方法能有效提高防空作戰(zhàn)效能。
然而,目前大部分威脅估計(jì)采用常權(quán)向量綜合方法,不能很好地映射威脅因素間復(fù)雜的關(guān)系,難以適時(shí)反映出由于敵空戰(zhàn)性能及戰(zhàn)術(shù)手段的變化帶來(lái)的各因素權(quán)值的變化。本文針對(duì)超視距空戰(zhàn)威脅估計(jì)模型中靜態(tài)權(quán)值方法的缺陷,采用主客觀(guān)賦值相結(jié)合的“結(jié)構(gòu)熵權(quán)法” 求取神經(jīng)網(wǎng)絡(luò)訓(xùn)練參數(shù),設(shè)計(jì)改進(jìn)螢火蟲(chóng)算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)優(yōu)化后的神經(jīng)網(wǎng)絡(luò)對(duì)各威脅因素權(quán)值的動(dòng)態(tài)預(yù)測(cè)。
1空戰(zhàn)目標(biāo)威脅估計(jì)模型
在多無(wú)人機(jī)協(xié)同空戰(zhàn)的目標(biāo)威脅估計(jì)中,往往要考慮地理環(huán)境、天氣情況、敵方意圖、武器性能和作戰(zhàn)手段等諸多因素。但在實(shí)際空戰(zhàn)情況下,隨著目標(biāo)的靈活性和所攜帶武器殺傷力的增加,要求充分利用各種探測(cè)、跟蹤裝置盡早探測(cè)和識(shí)別目標(biāo),及時(shí)掌握敵方信息并給出預(yù)警,從而采用合理的方法對(duì)敵機(jī)對(duì)我機(jī)所造成的威脅程度做出正確估計(jì)。
隨著超視距空戰(zhàn)這一新的作戰(zhàn)樣式的出現(xiàn),傳統(tǒng)的參考近距空戰(zhàn)威脅估計(jì)模型[5]的方法已無(wú)法完全反應(yīng)超視距空戰(zhàn)作戰(zhàn)樣式的特點(diǎn)。因此,本文基于對(duì)空空導(dǎo)彈攻擊區(qū)的分析,評(píng)估和構(gòu)造新的威脅函數(shù),改進(jìn)超視距空戰(zhàn)威脅估計(jì)模型。
空戰(zhàn)雙方態(tài)勢(shì)關(guān)系如圖1所示。圖中:Dji為雙機(jī)的目標(biāo)線(xiàn),即敵方戰(zhàn)機(jī)Tj與我方戰(zhàn)機(jī)Ui的連線(xiàn);hji為敵我戰(zhàn)機(jī)的高度差;vi為我方戰(zhàn)機(jī)速度矢量;vj為敵方戰(zhàn)機(jī)速度矢量;φ為我方戰(zhàn)機(jī)Ui的方位角;θ為敵方戰(zhàn)機(jī)Tj的方位角;q為我方戰(zhàn)機(jī)Tj的進(jìn)入角。上述角度的方向一致規(guī)定為相對(duì)目標(biāo)線(xiàn)右偏為正,左偏為負(fù),則有0≤|φ|≤π,0≤|θ|≤π。
圖1 空戰(zhàn)雙方態(tài)勢(shì)關(guān)系
由于超視距空戰(zhàn)對(duì)機(jī)載武器、雷達(dá)設(shè)備具有更高的要求,因此在超視距空戰(zhàn)威脅估計(jì)中,除了考慮飛機(jī)性能、空戰(zhàn)雙方瞬時(shí)態(tài)勢(shì)外,還應(yīng)研究機(jī)載導(dǎo)彈攻擊區(qū)、不可逃逸區(qū)以及機(jī)載雷達(dá)的搜索區(qū)等決定中遠(yuǎn)距空空導(dǎo)彈及機(jī)載雷達(dá)的性能的參數(shù)。
(1) 距離威脅函數(shù)
文獻(xiàn)[6]認(rèn)為距離對(duì)威脅的影響主要反映在雷達(dá)發(fā)現(xiàn)概率和導(dǎo)彈殺傷概率上,即在機(jī)載雷達(dá)有效探測(cè)距離內(nèi)雷達(dá)的發(fā)現(xiàn)概率隨距離的增大而降低,從而導(dǎo)致距離威脅降低;對(duì)于導(dǎo)彈殺傷概率[7],導(dǎo)彈殺傷概率在攻擊區(qū)中間(不可逃逸區(qū))內(nèi)較大,而在攻擊區(qū)最近和最遠(yuǎn)界附近較小且變化較快。因此,將敵我之間的距離Dji分為雷達(dá)最大探測(cè)距離DRmax、導(dǎo)彈最大最小攻擊距離DMAmax、DMAmin導(dǎo)彈最大最小不可逃逸區(qū)距離DMEmax、DMEmin。
構(gòu)造距離威脅函數(shù)
(1)
(2) 角度威脅函數(shù)
方位角威脅函數(shù):
(2)
式中,φRmax為敵機(jī)雷達(dá)最大搜索方位角;φMAmax為敵機(jī)空空導(dǎo)彈最大離軸發(fā)射角;φMEmax為不可逃逸區(qū)圓錐角。
進(jìn)入角威脅函數(shù):
(3)
由此得角度威脅函數(shù)為
(4)
式(4)中,0≤a1,a2≤1為權(quán)重系數(shù),用于衡量方位角和進(jìn)入角的重要程度,本文取a1=a2=1。
(3) 速度威脅函數(shù)
(5)
(4) 高度威脅函數(shù)
(6)
(5) 空戰(zhàn)能力威脅函數(shù)
飛機(jī)的空戰(zhàn)能力用于空戰(zhàn)有關(guān)的7個(gè)主要因素來(lái)衡量,空戰(zhàn)能力指數(shù)[8]如下:
(7)
式中,B為機(jī)動(dòng)性參數(shù);A1為火力參數(shù);A2為探測(cè)能力參數(shù);ε1為操縱性能系數(shù);ε2為生存力系數(shù);ε3為航程系數(shù);ε4為電子對(duì)抗系數(shù)。C的值可通過(guò)查表得到,在綜合考慮敵我雙方空戰(zhàn)能力的基礎(chǔ)上構(gòu)造空戰(zhàn)能力威脅函數(shù)有
(8)
綜合考慮敵機(jī)空戰(zhàn)能力和空戰(zhàn)態(tài)勢(shì)威脅指數(shù)求解綜合威脅指數(shù),由直接線(xiàn)性加權(quán)法得到
(9)
式中,Tji表示敵方第j架無(wú)人機(jī)對(duì)我方第i架無(wú)人機(jī)的綜合威脅指數(shù);ωi(i=1,2,…,5)表示各個(gè)威脅指數(shù)的權(quán)值,反映了各個(gè)威脅指數(shù)在綜合威脅指數(shù)中的重要程度,其值的大小直接關(guān)系到每個(gè)威脅指數(shù)對(duì)總威脅指數(shù)的貢獻(xiàn)。因此,確定各威脅指數(shù)的權(quán)值是進(jìn)行威脅估計(jì)的必要前提。
2改進(jìn)螢火蟲(chóng)優(yōu)化算法
2.1螢火蟲(chóng)優(yōu)化算法
螢火蟲(chóng)優(yōu)化(glowwormswarmoptimization,GSO)算法是通過(guò)模擬自然界中螢火蟲(chóng)成蟲(chóng)發(fā)光這一群體行為提出的一種新型的基于群體搜索的隨機(jī)優(yōu)化算法[9]。其仿生原理[10]是:將搜索空間中的點(diǎn)模擬為螢火蟲(chóng)個(gè)體,每只螢火蟲(chóng)個(gè)體攜帶各自的熒光素,熒光素值的大小能夠衡量個(gè)體位置的優(yōu)劣,即所求解的優(yōu)劣;同時(shí)每個(gè)個(gè)體都擁有自己的感知范圍,也稱(chēng)為決策范圍。個(gè)體只能在一定的感知范圍內(nèi)尋找優(yōu)秀個(gè)體(熒光素值大的個(gè)體),進(jìn)而向其移動(dòng)。通過(guò)重復(fù)選擇移動(dòng),最終實(shí)現(xiàn)在搜索空間內(nèi)的尋優(yōu)。
GSO算法主要包括初始化螢火蟲(chóng)、螢光素更新、移動(dòng)概率更新、位置更新和決策域范圍更新5個(gè)階段,具體描述如下。
(1) 在搜索空間(即問(wèn)題求解空間)內(nèi)隨機(jī)分布n只螢火蟲(chóng),每只螢火蟲(chóng)個(gè)體代表問(wèn)題求解空間中的一個(gè)解。每只螢火蟲(chóng)i(i=1,2,…,N)在其所在位置xi(t)的熒光素值為li(t),對(duì)應(yīng)的目標(biāo)函數(shù)值為f(xi(t))。
(2) 由于熒光素值的更新與求解目標(biāo)函數(shù)f(xi(t))的值相關(guān),故根據(jù)式(10)將目標(biāo)函數(shù)值轉(zhuǎn)化為熒光素值
(10)
式中,ρ∈[0,1]為熒光素?fù)]發(fā)系數(shù);γ∈[0,1]為熒光素更新率。
(3) 每個(gè)螢火蟲(chóng)個(gè)體在自己的決策范圍內(nèi)尋找到比自己熒光素值大的所有個(gè)體組成其鄰域集合,根據(jù)式(11)計(jì)算螢火蟲(chóng)個(gè)體i向個(gè)體j的移動(dòng)概率pij,有
(11)
式中,Ni(t)為t時(shí)刻螢火蟲(chóng)i的鄰域集合,j∈Ni(t)。
(12)
式中,‖x‖表示x的范數(shù)。
(4) 螢火蟲(chóng)個(gè)體根據(jù)鄰域中所有個(gè)體的熒光素值大小選擇移動(dòng)方向,由式(13)對(duì)螢火蟲(chóng)的位置進(jìn)行更新:
(13)
式中,s為移動(dòng)步長(zhǎng)。
(14)
2.2改進(jìn)的螢火蟲(chóng)優(yōu)化算法
GSO算法具有較強(qiáng)的全局尋優(yōu)能力和局部搜索能力,并且實(shí)現(xiàn)簡(jiǎn)單,但仍存在收斂速度慢,求解精度低等缺點(diǎn),針對(duì)上述缺點(diǎn),對(duì)基本GSO算法進(jìn)行改進(jìn)。
基本的GSO算法中,若螢火蟲(chóng)個(gè)體的鄰域集合為空,個(gè)體會(huì)停止移動(dòng),從而減慢收斂速度;若鄰域集合不為空時(shí),螢火蟲(chóng)個(gè)體在決策范圍內(nèi)尋優(yōu)的過(guò)程中,隨著迭代次數(shù)不斷增加,又會(huì)出現(xiàn)個(gè)體與峰值間的距離逐漸縮小直至小于固定移動(dòng)步長(zhǎng)s的情況,從而引起峰值附近的震蕩,導(dǎo)致算法收斂速度減緩、求解精度降低,針對(duì)上述分析,提出以下改進(jìn)措施。
首先,在個(gè)體鄰域?yàn)榭諘r(shí),以螢火蟲(chóng)個(gè)體為中心按式(15)移動(dòng),若更新后的位置優(yōu)于移動(dòng)前的位置,則保留更新后的位置,否則不更新。
(15)
其次,個(gè)體鄰域非空時(shí),隨著迭代次數(shù)的增加,按式(16)計(jì)算個(gè)體與鄰域集合內(nèi)其他個(gè)體間的距離,若平均距離小于固定移動(dòng)步長(zhǎng),則增加步長(zhǎng)更新機(jī)制縮小步長(zhǎng),按式(17)更新步長(zhǎng);否則不更新。
(16)
(17)
式中,n(0 通過(guò)上述改進(jìn),能夠提高算法的局部搜索能力,收斂速度和求解精度。改進(jìn)螢火蟲(chóng)算法(improvedGSO,IGSO)的執(zhí)行流程如圖2所示。 3基于IGSO算法的BP神經(jīng)網(wǎng)絡(luò)優(yōu)化 前向反饋(backpropagation,BP)神經(jīng)網(wǎng)絡(luò)[11]的性能決定于網(wǎng)絡(luò)的參數(shù),即網(wǎng)絡(luò)權(quán)值和閾值,因此合理選擇初始權(quán)值和閾值十分重要。若選擇不當(dāng)會(huì)造成訓(xùn)練過(guò)程收斂速度慢,網(wǎng)絡(luò)的最佳逼近性能降低。螢火蟲(chóng)優(yōu)化算法是一種新型的基于群智能的進(jìn)化計(jì)算技術(shù),具有算法簡(jiǎn)單、易于實(shí)現(xiàn)、參數(shù)少、收斂速度快等優(yōu)點(diǎn)。將IGSO算法用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí),得到最優(yōu)的權(quán)值和閾值,從而構(gòu)造BP神經(jīng)網(wǎng)絡(luò),提高神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法收斂速度、泛化性能以及數(shù)據(jù)預(yù)測(cè)準(zhǔn)確性。IGSO算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的過(guò)程如圖3所示。 圖2 IGSO算法流程 圖3 IGSO算法對(duì)BP神經(jīng)網(wǎng)絡(luò)的優(yōu)化過(guò)程 利用IGSO進(jìn)行BP參數(shù)優(yōu)化的具體優(yōu)化步驟如下。 (1) 初始化。初始化BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)及其初始權(quán)值和閾值;利用IGSO算法對(duì)初始值進(jìn)行編碼,使得IGSO算法中的每個(gè)螢火蟲(chóng)個(gè)體都包含BP神經(jīng)網(wǎng)絡(luò)的輸出層與輸入層、輸入層與隱含層的權(quán)值以及隱含層閾值和輸出層閾值。 (2) 將BP網(wǎng)絡(luò)的訓(xùn)練誤差作為螢火蟲(chóng)個(gè)體的適應(yīng)度值,根據(jù)式(18)計(jì)算適應(yīng)度值。 (18) 式中,n為BP網(wǎng)絡(luò)輸出層節(jié)點(diǎn)數(shù);k為系數(shù);yi,Oi分別為第i個(gè)節(jié)點(diǎn)的實(shí)際輸出值和期望輸出值。 (3) 執(zhí)行IGSO算法部分優(yōu)化BP網(wǎng)絡(luò),得到最優(yōu)的網(wǎng)絡(luò)權(quán)值和閾值。 (4) 將所得權(quán)值和閾值帶入BP神經(jīng)網(wǎng)絡(luò),選取合適的訓(xùn)練數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)訓(xùn)練。 (5) 計(jì)算訓(xùn)練誤差,直至誤差滿(mǎn)足條件結(jié)束訓(xùn)練,得到優(yōu)化后的BP神經(jīng)網(wǎng)絡(luò)。 4基于IGSO-BP的動(dòng)態(tài)威脅評(píng)估 在多無(wú)人機(jī)協(xié)同空戰(zhàn)目標(biāo)威脅評(píng)估的指標(biāo)體系中,隨著空戰(zhàn)態(tài)勢(shì)的變化,各威脅要素對(duì)威脅評(píng)估產(chǎn)生的作用、影響不是一成不變的。因此,需要不斷調(diào)整各指標(biāo)的權(quán)值大小使其更合理地反應(yīng)各指標(biāo)的重要程度。目前,采用層次分析法[12]確定各因素的權(quán)值是最廣泛的威脅評(píng)估方法。這種方法確定的權(quán)值通常需要專(zhuān)家根據(jù)經(jīng)驗(yàn)給出,并且是固定不變的,具有很大的主觀(guān)性與盲目性,它忽略了實(shí)際戰(zhàn)場(chǎng)環(huán)境中的各因素變化產(chǎn)生的影響,往往無(wú)法反映真實(shí)情況。因此,需要一種與現(xiàn)代空戰(zhàn)動(dòng)態(tài)變化特點(diǎn)相適應(yīng)的權(quán)值確定策略。 4.1基于結(jié)構(gòu)熵的訓(xùn)練參數(shù)優(yōu)化 為了弱化層次分析法確定權(quán)值的主觀(guān)性和不確定性,得到更合理的各威脅指數(shù)權(quán)值即神經(jīng)網(wǎng)絡(luò)的訓(xùn)練輸出數(shù)據(jù),本文引入了一種將主觀(guān)賦值法與客觀(guān)賦值法相結(jié)合的“結(jié)構(gòu)熵權(quán)法”[13],它將德菲爾專(zhuān)家調(diào)查法和模糊決策分析方法相結(jié)合,采取主觀(guān)評(píng)估法由相關(guān)專(zhuān)家根據(jù)主觀(guān)經(jīng)驗(yàn)對(duì)指標(biāo)的重要性進(jìn)行評(píng)估,運(yùn)用客觀(guān)的結(jié)構(gòu)熵權(quán)法對(duì)主觀(guān)評(píng)估值的不確定性定量分析,計(jì)算熵值并“盲度”分析,從而得出各指標(biāo)的權(quán)值。 采用 “結(jié)構(gòu)熵權(quán)法”[14]優(yōu)化神經(jīng)網(wǎng)絡(luò)訓(xùn)練參數(shù)的具體步驟如下。 步驟 1通過(guò)咨詢(xún)、收集專(zhuān)家意見(jiàn),形成“典型排序”。 通過(guò)向該領(lǐng)域?qū)<摇W(xué)者進(jìn)行請(qǐng)教與咨詢(xún),參考相關(guān)文獻(xiàn)與資料,評(píng)價(jià)各威脅指數(shù)的重要程度,如表1所示,最終形成“排序意見(jiàn)”。設(shè)共有k個(gè)專(zhuān)家參加咨詢(xún)調(diào)查,各威脅指數(shù)構(gòu)成一個(gè)指標(biāo)集,記為T(mén)={T1,T2,T3,T4,T5}={Tc,Ta,Tr,Tv,Th},每個(gè)專(zhuān)家對(duì)各威脅指數(shù)做出評(píng)價(jià),獲得各類(lèi)威脅指數(shù)評(píng)估權(quán)值矩陣記為A(A=aij)k×5。式中,i=1,2,…,k;j=1,2,…,5;aij表示第i個(gè)專(zhuān)家對(duì)第j個(gè)威脅指數(shù)Tj的評(píng)價(jià)。 表1 專(zhuān)家意見(jiàn)評(píng)估表 步驟 2根據(jù)信息熵函數(shù)F(x)=-λq(x)ln(q(x)),對(duì)上述專(zhuān)家意見(jiàn)進(jìn)行定性轉(zhuǎn)化,即計(jì)算各專(zhuān)家指標(biāo)的隸屬度。 (19) 兩邊同除q(x),令 則 (20) x(x=1,2,…,j,這里j=5)為專(zhuān)家對(duì)各指標(biāo)評(píng)估后得出的定性排序數(shù),m為轉(zhuǎn)化參量數(shù),取m=j+2,即m=7,D(x)為x對(duì)應(yīng)的隸屬函數(shù)值,構(gòu)造隸屬度矩陣D: 式中,dij(1≤i≤k,1≤j≤5)表示專(zhuān)家i對(duì)第j個(gè)指標(biāo)評(píng)估的隸屬度值。 步驟 3對(duì)由專(zhuān)家意見(jiàn)形成的排序進(jìn)行盲度分析,優(yōu)化由不確定性導(dǎo)致的偏差。 首先計(jì)算k個(gè)專(zhuān)家對(duì)指標(biāo)Tj的“一致看法”,稱(chēng)為平均認(rèn)識(shí)度,記為dj,令 定義專(zhuān)家對(duì)因素Tj由認(rèn)知產(chǎn)生的不確定性,稱(chēng)為“認(rèn)識(shí)盲度”,記作Qj(Qj>0),令 (21) 對(duì)于每一個(gè)指標(biāo)Tj,定義k個(gè)專(zhuān)家關(guān)于指標(biāo)Tj的總體認(rèn)識(shí)度記作μj(μj>0),有 (22) 步驟 4對(duì)μj進(jìn)行歸一化處理 (23) 4.2IGSO-BP在威脅估計(jì)中的應(yīng)用 采用IGSO算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)得到最優(yōu)的權(quán)值和閾值后,選擇合理的訓(xùn)練參數(shù),通過(guò)結(jié)構(gòu)熵權(quán)法優(yōu)化神經(jīng)網(wǎng)絡(luò)的輸出訓(xùn)練參數(shù),通過(guò)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練實(shí)現(xiàn)動(dòng)態(tài)權(quán)值的求取,進(jìn)而進(jìn)行目標(biāo)威脅度計(jì)算。 基于IGSO-BP神經(jīng)網(wǎng)絡(luò)超視距空戰(zhàn)動(dòng)態(tài)威脅評(píng)估的步驟如下。 步驟 1確定輸入訓(xùn)練參數(shù)及其變化范圍。 輸入?yún)?shù)為敵我無(wú)人機(jī)間的距離、高度差、速度比、敵無(wú)人機(jī)機(jī)載導(dǎo)彈的攻擊距離和我方無(wú)人機(jī)的方位角。通常以飛行員的視距作為界限[15]來(lái)分,一般以敵我戰(zhàn)機(jī)間的距離為10km為標(biāo)準(zhǔn),將使用空空導(dǎo)彈進(jìn)行的空戰(zhàn)劃分為兩類(lèi):10km內(nèi)的視距內(nèi)的空戰(zhàn)即近距作戰(zhàn)和10km以外的超視距空戰(zhàn),該模式下又分為中距空戰(zhàn)和遠(yuǎn)距空戰(zhàn)。不同的空戰(zhàn)模式下,各個(gè)威脅因素的地位、影響力是不同的。在中距空戰(zhàn)下,戰(zhàn)機(jī)間的角度、高度差異最為重要;在遠(yuǎn)距空戰(zhàn)下,武器的性能會(huì)起到很大的影響作用。本文重點(diǎn)研究超視距空戰(zhàn)下的動(dòng)態(tài)威脅評(píng)估問(wèn)題,故設(shè)敵我無(wú)人機(jī)間的距離變化范圍為10~150km;高度差變化范圍為-5~5km;速度比值為大于0的正值;敵機(jī)攜帶導(dǎo)彈攻擊距離主要取決于導(dǎo)彈的性能[12],導(dǎo)彈攻擊范圍為8~80km;我機(jī)指向角φ的變化范圍為0°~180°。 步驟 2確定輸出訓(xùn)練參數(shù)種類(lèi)與數(shù)值大小。 BP網(wǎng)絡(luò)輸出訓(xùn)練參數(shù)分別為空戰(zhàn)能力威脅、角度威脅、距離威脅、速度威脅以及高度威脅的權(quán)值共5個(gè)參數(shù),即 (24) 式中,ω為威脅評(píng)估權(quán)向量;ω1為無(wú)人機(jī)作戰(zhàn)能力指數(shù)權(quán)值;ω2為角度威脅指數(shù)權(quán)值;ω3為距離威脅指數(shù)權(quán)值;ω4為速度威脅指數(shù)權(quán)值;ω5為高度威脅指數(shù)權(quán)值。 步驟 3采用IGSO算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù)設(shè)置,得到最優(yōu)的權(quán)值和閾值。 步驟 4將訓(xùn)練數(shù)據(jù)帶入經(jīng)IGSO算法優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,BP神經(jīng)網(wǎng)絡(luò)通過(guò)不斷調(diào)整權(quán)值和閾值使得訓(xùn)練誤差達(dá)到最小時(shí)完成訓(xùn)練;將不同的測(cè)試數(shù)據(jù)通過(guò)訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)即可實(shí)時(shí)動(dòng)態(tài)地給出對(duì)應(yīng)的權(quán)值。 步驟 5通過(guò)直接線(xiàn)性加權(quán)的威脅度計(jì)算式(9)計(jì)算目標(biāo)的威脅度,進(jìn)行威脅排序。 5實(shí)驗(yàn)仿真 5.1基于結(jié)構(gòu)熵權(quán)法的IGSO-BP網(wǎng)絡(luò)訓(xùn)練參數(shù)優(yōu)化驗(yàn)證 5.1.1基于結(jié)構(gòu)熵權(quán)法的訓(xùn)練參數(shù)優(yōu)化驗(yàn)證 分別以多無(wú)人機(jī)協(xié)同超視距空戰(zhàn)模式下的中距空戰(zhàn)、遠(yuǎn)距空戰(zhàn)為例,通過(guò)向該領(lǐng)域的10位專(zhuān)家、學(xué)者進(jìn)行請(qǐng)教與咨詢(xún),評(píng)價(jià)各威脅指數(shù)的重要程度,得到專(zhuān)家意見(jiàn),如表2和表3所示。 表2 中距空戰(zhàn)模式下的專(zhuān)家意見(jiàn)評(píng)估表 表3 遠(yuǎn)距空戰(zhàn)模式下的專(zhuān)家意見(jiàn)評(píng)估表 綜合考慮多位專(zhuān)家的評(píng)估可以減小單一專(zhuān)家評(píng)估的主觀(guān)性、片面性,針對(duì)不同的空戰(zhàn)模式,分別采用專(zhuān)家賦值的層次分析法和主客觀(guān)融合的結(jié)構(gòu)熵權(quán)法所求得各威脅指數(shù)權(quán)值進(jìn)行對(duì)比,結(jié)果如表4所示。 表4 不同空戰(zhàn)模式下層次分析法和結(jié)構(gòu)熵法權(quán)值對(duì)比 從表4可以得出以下結(jié)論。 (1) 中距空戰(zhàn)模式下,雙方戰(zhàn)機(jī)距離為15 km時(shí),2種方法權(quán)值的排序分別為(從大到小)(3 2 5 4 1)和(2 5 3 4 1);雙方戰(zhàn)機(jī)距離為62 km時(shí),2種方法各權(quán)值的排序分別為(從大到小)(3 4 1 5 2)和(3 2 5 4 1)。 (2) 遠(yuǎn)距空戰(zhàn)模式下,雙方戰(zhàn)機(jī)距離為110 km時(shí),2種方法各權(quán)值的排序分別為(從大到小)(4 1 3 5 2)和(3 1 4 5 2);雙方戰(zhàn)機(jī)距離為139 km時(shí),2種方法各權(quán)值的排序分別為(從大到小)(3 4 1 5 2)和(3 1 4 5 2)。 通過(guò)查閱大量文獻(xiàn)、咨詢(xún)相關(guān)領(lǐng)域權(quán)威專(zhuān)家可知:中距空戰(zhàn)中的角度威脅和高度威脅對(duì)目標(biāo)威脅度有很大影響作用;而遠(yuǎn)距空戰(zhàn)中的距離威脅起主要作用,且空戰(zhàn)能力比速度威脅對(duì)威脅評(píng)估的影響略大。對(duì)比2種方法排序結(jié)果發(fā)現(xiàn):采用結(jié)構(gòu)熵法優(yōu)化權(quán)值后的權(quán)值排序結(jié)果與該結(jié)論吻合。因此,基于結(jié)構(gòu)熵權(quán)法的權(quán)值優(yōu)化分析了評(píng)估中的專(zhuān)家“盲度”,對(duì)可能產(chǎn)生潛在的偏差數(shù)據(jù)統(tǒng)計(jì)處理,故將該方法所得權(quán)值作為訓(xùn)練參數(shù)更為客觀(guān)、合理。 5.1.2基于IGSO-BP算法的動(dòng)態(tài)權(quán)值計(jì)算 在距離10~150 km內(nèi)選取24組神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本,設(shè)定不同種類(lèi)和不同飛行條件下敵機(jī)的各態(tài)勢(shì)數(shù)據(jù)作為輸入訓(xùn)練參數(shù),并按上述結(jié)構(gòu)熵權(quán)法進(jìn)行多組評(píng)估,將優(yōu)化后的各威脅指數(shù)權(quán)值作為BP神經(jīng)網(wǎng)絡(luò)的輸出訓(xùn)練參數(shù)。 得到神經(jīng)網(wǎng)絡(luò)訓(xùn)練參數(shù)后,設(shè)計(jì)基于IGSO-BP的動(dòng)態(tài)權(quán)值生成器,BP神經(jīng)網(wǎng)絡(luò)部分分別有5個(gè)輸入輸出參數(shù),網(wǎng)絡(luò)結(jié)構(gòu)為5-8-5,故輸入層和輸出層節(jié)點(diǎn)數(shù)均為5,隱含層節(jié)點(diǎn)數(shù)為10,網(wǎng)絡(luò)需要優(yōu)化的參數(shù)為80個(gè)權(quán)值,13個(gè)閾值,故IGSO算法中螢火蟲(chóng)個(gè)體編碼長(zhǎng)度為80+13=93。IGSO部分設(shè)熒光素初值l0=5,β=0.08,nt=5, s=0.05,γ=0.6,ρ=0.4,rs=5,迭代過(guò)程按公式進(jìn)行計(jì)算;種群規(guī)模為30,迭代次數(shù)為140。在MatlaB2009a軟件下編程得到超視距空戰(zhàn)下的權(quán)值變化曲線(xiàn)如圖4所示。 圖4 超視距下各威脅指數(shù)權(quán)值分布圖 由圖4可見(jiàn),敵無(wú)人機(jī)作戰(zhàn)能力威脅指數(shù)權(quán)值、距離威脅指數(shù)權(quán)值和速度威脅指數(shù)權(quán)值隨著敵我空戰(zhàn)距離的增大而增大,其對(duì)目標(biāo)威脅度整體產(chǎn)生的作用和影響力越來(lái)越大;角度威脅指數(shù)權(quán)值和高度威脅指數(shù)權(quán)值隨著敵我空戰(zhàn)距離的增大逐漸減小。然而,在實(shí)際空戰(zhàn)中,近距作戰(zhàn)模式下角度威脅和高度威脅對(duì)威脅估計(jì)影響較大,隨著敵我空戰(zhàn)距離的逐漸增大,遠(yuǎn)距作戰(zhàn)模式下角度威脅和高度威脅產(chǎn)生的作用遠(yuǎn)沒(méi)有距離威脅和戰(zhàn)機(jī)能力威脅的作用大,這與由圖4所得結(jié)論是一致的。因此,采用IGSO-BP算法生成的動(dòng)態(tài)權(quán)值是合理和有效的。 5.1.3IGSO-BP算法的收斂性分析 將25組訓(xùn)練數(shù)據(jù)預(yù)測(cè)誤差的絕對(duì)值和作為螢火蟲(chóng)個(gè)體的適應(yīng)度值,分析對(duì)比GSO算法和IGSO算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的平均適應(yīng)度值和進(jìn)化代數(shù)之間的關(guān)系,結(jié)果如圖5所示。 圖5 IGSO和GSO算法進(jìn)化過(guò)程 分析圖5可知,改進(jìn)的螢火蟲(chóng)優(yōu)化算法在進(jìn)化到70代時(shí)就收斂到最佳適應(yīng)度值0.162,算法基本趨于穩(wěn)定;而標(biāo)準(zhǔn)螢火蟲(chóng)算法在90代左右趨于穩(wěn)定,適應(yīng)度值為0.31。通過(guò)對(duì)比可以看到:IGSO算法的收斂速度明顯高于GSO算法,能夠較快找到BP網(wǎng)絡(luò)的最優(yōu)權(quán)值和閾值,尋優(yōu)能力較強(qiáng)。 綜上所述,本文通過(guò)引入BP 神經(jīng)網(wǎng)絡(luò),并采用IGSO算法對(duì)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,將動(dòng)態(tài)權(quán)值引入空戰(zhàn)威脅評(píng)估中,彌補(bǔ)了靜態(tài)權(quán)值在空戰(zhàn)決策中存在的不足,使得超視距下的多無(wú)人機(jī)協(xié)同空戰(zhàn)威脅評(píng)估更加合理、準(zhǔn)確。 5.2多無(wú)人機(jī)協(xié)同空戰(zhàn)中的威脅評(píng)估仿真分析 假設(shè)我方無(wú)人機(jī)編隊(duì)由 4架同類(lèi)型UCAV組成,空戰(zhàn)能力為17.9,機(jī)載雷達(dá)最大探測(cè)距離為140 km,導(dǎo)彈最大射程為100 km,我機(jī)速度均為360 m/s。敵方編隊(duì)由4架不同型UCAV組成,敵方4種類(lèi)型的UCAV,空戰(zhàn)能力分別為9.8、18、16.8、13.5,機(jī)載雷達(dá)最大探測(cè)距離為120 km,導(dǎo)彈最大射程為80 km。雙方戰(zhàn)機(jī)空戰(zhàn)態(tài)勢(shì)如表5所示。 表5 敵我三維空戰(zhàn)態(tài)勢(shì) 續(xù)表5 將敵我無(wú)人機(jī)的三維空戰(zhàn)態(tài)勢(shì)數(shù)據(jù)及戰(zhàn)機(jī)參數(shù)進(jìn)行綜合處理后作為測(cè)試輸入樣本,其對(duì)應(yīng)的基于結(jié)構(gòu)熵優(yōu)化的各威脅指數(shù)權(quán)值作為測(cè)試輸出樣本,通過(guò)IGSO-BP算法得到威脅指數(shù)權(quán)值,如表6所示。 表6 威脅指數(shù)權(quán)值 根據(jù)威脅估計(jì)模型計(jì)算得到敵無(wú)人機(jī)各威脅指數(shù)并帶入式(9)線(xiàn)性加權(quán)得到綜合威脅度如表7所示。 表7 綜合威脅度 將利用結(jié)構(gòu)熵權(quán)法得到的訓(xùn)練參數(shù)分別通過(guò)PSO -RBF[16]和BP網(wǎng)絡(luò)訓(xùn)練,采用訓(xùn)練好的PSO -RBF和BP網(wǎng)絡(luò)求出16組測(cè)試數(shù)據(jù)的動(dòng)態(tài)權(quán)值,帶入威脅估計(jì)模型得到目標(biāo)威脅度,并與IGSO -BP算法所得威脅度進(jìn)行對(duì)比,實(shí)驗(yàn)結(jié)果如圖6所示。 圖6 IGSO-BP、BP和PSO-BP計(jì)算目標(biāo)威脅度誤差絕對(duì)值 分析圖6發(fā)現(xiàn),GSO -BP算法所得目標(biāo)威脅值比BP算法、PSO -RBF算法更接近理想威脅值,誤差最大僅為0.004 3,明顯低于其他2種算法。因此,IGSO -BP算法能夠有效地解決空戰(zhàn)目標(biāo)威脅評(píng)估問(wèn)題。 6結(jié)束語(yǔ) 本文以超視距空戰(zhàn)為背景,研究多無(wú)人機(jī)協(xié)同攻防威脅評(píng)估方法。能夠針對(duì)現(xiàn)代超視距空戰(zhàn)的特點(diǎn),在構(gòu)建威脅評(píng)估模型的基礎(chǔ)上,引入結(jié)構(gòu)熵權(quán)法弱化了模型中威脅指數(shù)權(quán)值求解的主觀(guān)性,并設(shè)計(jì)IGSO-BP算法動(dòng)態(tài)求解各威脅權(quán)值,實(shí)現(xiàn)了復(fù)雜空戰(zhàn)環(huán)境下的目標(biāo)威脅估計(jì)。通過(guò)算例仿真驗(yàn)證了該方法能夠快速準(zhǔn)確地解決威脅排序問(wèn)題,從而為目標(biāo)和火力的分配提供有效支持。 參考文獻(xiàn): [1] Brynielsson J, Arnborg S. Bayesian games for threat prediction and situation analysis[C]∥Proc.ofthe7thInternationalConferenceonInformationFusion, 2004:1125-1132. [2] Bourybrisset A C. Ontological engineering for threat evaluation and weapon assignment:a goal-driven approach[C]∥Proc.oftheIEEE10thInternationalConferenceonInformationFusion, 2007:1245-1252. [3] Liu Y F, Chen S D, Zhao Z Y, et al. Threat assessment of manned/unmanned combat aerial vehicle formation air-to-ground attack based on FBNs[J].SystemsEngineeringandElectronics, 2012, 34(8):1635-1639.(劉躍峰, 陳哨東, 趙振宇, 等. 基于FBNs的有人機(jī)/UCAV編隊(duì)對(duì)地攻擊威脅評(píng)估[J].系統(tǒng)工程與電子技術(shù), 2012, 34(8):1635-1639.) [4] Yao Y T, Zhao J, Wang Y, et al. MADM of threat assessment with attempt of target[J].AdvancesinTechnologyandManagement, 2012, 165(7):171-179. [5] Nguyen X T. Threat assessment in tactical airborne environments[C]∥Proc.ofthe5thInternationalConferenceonInformationFusion, 2002:1300-1307. [6] Gao Y, Xiang J W. New threat assessment non-parameter model in beyond-visual-range air combat[J].JournalofSystemSimulation, 2006, 18(9):2570-2573.(高永, 向錦武. 一種新的超視距空戰(zhàn)威脅估計(jì)非參量法模型[J].系統(tǒng)仿真學(xué)報(bào),2006, 18(9):2570-2573.) [7] Xie B R, Yang J Y, Yin J, et al. Analysis of the influencing factors upon kill probability for single missile[J].FireControl&CommandControl,2004,29(4):60-64.(謝邦榮,楊劍影,尹健,等.導(dǎo)彈單發(fā)殺傷概率影響因素分析[J].火力與指揮控制,2004,29(4):60-64.) [8] Zhu B L, Zhu R C, Xiong X F.Combataircrafteffectivenessevaluation[M]. Beijing:Aviation Industry Press:1993:287-289.(朱寶鎏, 朱榮昌, 熊笑非. 作戰(zhàn)飛機(jī)效能評(píng)估[M]北京:航空工業(yè)出版社, 1993:287-289.) [9] Krishnanand K N, Ghose D. Glowworm swarm optimization:a new method for optimizing multi-modal functions[J].InternationalJournalofComputationalIntelligenceStudies,2009,1(1):93-119. [10] Krishnanand K N, Ghose D. Glowworm swarm optimization for simultaneous capture of multiple local optimal of multimodal functions[J].SwarmIntelligence, 2009, 3(2):87-124. [11] Husken M. Structure optimization of neural networks for evolutionary design optimization[J].SoftComputingAFusionofFoundations,MethodologiesandApplication, 2005, 9(1):21-28. [12] Gu X D, Tong Z X, Chai S J, et al. Target threat assessment based on TOPSIS combined by IAHP and the maximal deviation[J].JournalofAirForceEngineeringUniversity(NationalScienceEdition),2011,12(2):27-31.(谷向東,童中翔,柴世杰,等.基于IAHP和離差最大化TOPSIS法目標(biāo)威脅評(píng)估[J].空軍工程大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,12(2):27-31.) [13] Kojadinovic I, Marichal J L. Entropy of bi-capacities[J].EuropeanJournalofOperationalResearch, 2007, 178(l):164-184. [14] Cheng Q Y. Structure entropy weight method to confirm the weight of evaluating index[J].SystemsEngineering-Theory&Pratice, 2010, 30(7):1225-1228.(程啟月.評(píng)測(cè)指標(biāo)權(quán)重確定的結(jié)構(gòu)熵權(quán)法[J].系統(tǒng)工程理論與實(shí)踐, 2010, 30(7):1225-1228.) [15] Luo D L, Yang Z, Duan H B, et al. Heuristic particle swarm optimization algorithm for air combat decision-making on CMTA[J].TransactionsonNanjingUniversityofAeronautics&Astronautics,2006,23(1):20-26. [16] Chen J Y, Qin Z, Jia J. A PSO-based subtractive clustering technique for designing RBF neural networks[C]∥Proc.oftheIEEECongressonEvolutionaryComputation, 2008:2047-2052. E-mail:cjy0706@163.com 姚佩陽(yáng)(1960-),男,教授,博士研究生導(dǎo)師,主要研究方向?yàn)橹笓]自動(dòng)化理論與技術(shù)。 E-mail:ypy_664@163.com 王勃(1990-),男,碩士研究生,主要研究方向?yàn)闊o(wú)人機(jī)編隊(duì)協(xié)同指揮與控制。 E-mail:wangbo2043@163.com 稅冬東(1978-),男,博士研究生,主要研究方向?yàn)槿蝿?wù)規(guī)劃。 E-mail:wjsdd@sina.com 網(wǎng)絡(luò)優(yōu)先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20141105.1633.013.html Dynamic threat assessment based on structure entropy and IGSO-BP algorithm CHEN Jie-yu, YAO Pei-yang, WANG Bo, SHUI Dong-dong (SchoolofInformationandNavigation,AirForceEngineeringUniversity,Xi’an710077,China) Abstract:Since the traditional threat assessment can not adjust the weights dynamically according to the changing of threat factors during beyond-visual-range air combat, the back propagation (BP) neural network is introduced. Considering the subjective factors and objective factors, the structure entropy weight method is used to confirm the weights of each threat index and the weights are supplied to BP neural network training. The dynamic weights calculating method is proposed based on the improved glowworm swarm optimization (IGSO)algorithm and the BP neural network. In IGSO-BP, IGSO is employed to simultaneously optimize the initial weights and thresholds of the BP neural network. The optimized BP network can calculate the weights in different situations better. On the circumstance of assessing the threat degree during multi-unmanned combat air vehicle (UCAV) cooperation combat, simulation results based on the structure entropy weight method and the IGSO-BP algorithm indicate that, the method can assess the weights of threat indexes effectively and can possess better reliability and veracity than conventional methods. Keywords:back propagation (BP) neural network; glowworm swarm optimization algorithm; structure entropy weight method; dynamic weights; threat assessment 通信作者陳潔鈺(1989-),,女,碩士研究生,主要研究方向?yàn)槎酂o(wú)人機(jī)協(xié)同作戰(zhàn)指揮決策與控制、戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估。 作者簡(jiǎn)介: 中圖分類(lèi)號(hào):TB 391.9 文獻(xiàn)標(biāo)志碼:ADOI:10.3969/j.issn.1001-506X.2015.05.16 基金項(xiàng)目:國(guó)家自然科學(xué)基金(61273048)資助課題 收稿日期:2014-01-17;修回日期:2014-10-18;網(wǎng)絡(luò)優(yōu)先出版日期:2014-11-05。