趙文棟,張明智,賀筱媛,郭圣明
(1. 國防大學(xué)聯(lián)合作戰(zhàn)學(xué)院,北京 100091;2. 中國人民解放軍61267部隊,北京 101114)
在現(xiàn)代化戰(zhàn)爭中,指揮員面對的是海量的、瞬息萬變的戰(zhàn)場態(tài)勢信息,大腦已經(jīng)無法快速容納和高效處理,感官也無法承受戰(zhàn)場態(tài)勢超常規(guī)的變化速度,嚴(yán)重限制了“觀察—判斷—決策—行動”(“OODA環(huán)”)的運(yùn)轉(zhuǎn)速度。準(zhǔn)確迅速地判識敵方作戰(zhàn)任務(wù)有利于提升“OODA環(huán)”的循環(huán)速度,提高作戰(zhàn)指揮效率,促使戰(zhàn)場態(tài)勢向?qū)悍接欣姆较蜣D(zhuǎn)化,對最終取得戰(zhàn)爭的勝利具有重要意義。
當(dāng)前,人們在軍事領(lǐng)域開展了許多與作戰(zhàn)任務(wù)判識相關(guān)的研究。傳統(tǒng)的方法主要有證據(jù)理論、模板匹配、貝葉斯網(wǎng)絡(luò)和神經(jīng)網(wǎng)絡(luò)等方法。證據(jù)理論方法首先建立置信規(guī)則庫,然后利用證據(jù)推理對目標(biāo)的作戰(zhàn)任務(wù)進(jìn)行判識。模板匹配方法首先根據(jù)專家經(jīng)驗(yàn)構(gòu)建模型庫,然后通過推理實(shí)際特征與模板的相似度來識別作戰(zhàn)任務(wù)。貝葉斯網(wǎng)絡(luò)方法運(yùn)用軍事專家知識構(gòu)建網(wǎng)絡(luò),特征由節(jié)點(diǎn)表示,轉(zhuǎn)移關(guān)系由邊表示,關(guān)系的強(qiáng)度由概率值表示,通過對網(wǎng)絡(luò)參數(shù)進(jìn)行更新,設(shè)定相應(yīng)閾值,進(jìn)行任務(wù)判識。神經(jīng)網(wǎng)絡(luò)法運(yùn)用特征數(shù)據(jù)集訓(xùn)練神經(jīng)網(wǎng)絡(luò),得到神經(jīng)網(wǎng)絡(luò)參數(shù),通過訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)判識目標(biāo)的作戰(zhàn)任務(wù)。然而,空中的目標(biāo)執(zhí)行作戰(zhàn)任務(wù)是通過一系列戰(zhàn)術(shù)動作來完成的,目標(biāo)的狀態(tài)特征會呈現(xiàn)出時序、動態(tài)的變化,上述的傳統(tǒng)方法僅利用單一時刻的特征信息對目標(biāo)的作戰(zhàn)任務(wù)進(jìn)行判識,并不是十分合理。
卷積神經(jīng)網(wǎng)絡(luò)和簡單的循環(huán)神經(jīng)網(wǎng)絡(luò)均可用于處理時序數(shù)據(jù),但當(dāng)時間較長時,卷積神經(jīng)網(wǎng)絡(luò)無法獲得全局特征,簡單的循環(huán)神經(jīng)網(wǎng)絡(luò)存在長程依賴問題。引入門控機(jī)制的循環(huán)神經(jīng)網(wǎng)絡(luò)解決了長程依賴問題,正逐漸被用于解決作戰(zhàn)任務(wù)判識這種時序分類問題。文獻(xiàn)[8-9]通過將不同時刻的多維態(tài)勢特征輸入基于長短時記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)的作戰(zhàn)任務(wù)智能判識模型,實(shí)現(xiàn)對作戰(zhàn)任務(wù)的判識。文獻(xiàn)[10]在LSTM網(wǎng)絡(luò)的基礎(chǔ)上,引入注意力(Attention)機(jī)制和雙向(Bidirection)循環(huán)機(jī)制,構(gòu)造AM-BiLSTM模型,充分地利用歷史和未來信息對網(wǎng)絡(luò)參數(shù)進(jìn)行訓(xùn)練,突出了影響任務(wù)判識的關(guān)鍵信息,實(shí)現(xiàn)對作戰(zhàn)任務(wù)的判識。上述模型運(yùn)用了目標(biāo)動態(tài)變化特征,在一定程度上解決了作戰(zhàn)任務(wù)判識存在的問題,但所使用的神經(jīng)網(wǎng)絡(luò)層數(shù)較少,特征抽象能力不足,影響判識效果。另外,當(dāng)獲得的時序特征信息較短時,采用上述模型對作戰(zhàn)任務(wù)進(jìn)行判識將不再有效。
綜上,本文提出了一種融合先驗(yàn)知識的作戰(zhàn)任務(wù)智能判識方法。該方法以門控循環(huán)單元(Gated Recurrent Unit, GRU)網(wǎng)絡(luò)為基干構(gòu)建兩層雙向門控循環(huán)單元(BiGRU)網(wǎng)絡(luò),引入殘差機(jī)制防止由于網(wǎng)絡(luò)層數(shù)增加可能出現(xiàn)的模型性能退化問題;運(yùn)用注意力機(jī)制捕捉相互關(guān)聯(lián)的重要態(tài)勢特征,提高判識效果,將先驗(yàn)知識融入神經(jīng)網(wǎng)絡(luò)模型,確保在獲得時序信息較短時對作戰(zhàn)任務(wù)判識的有效性。
空中目標(biāo)試圖完成的作戰(zhàn)任務(wù)是指為達(dá)到某種作戰(zhàn)目的而采取的一系列作戰(zhàn)行動。對空中目標(biāo)作戰(zhàn)任務(wù)的判識是指運(yùn)用軍事領(lǐng)域知識對從戰(zhàn)場態(tài)勢獲得的敵方目標(biāo)和環(huán)境信息進(jìn)行分析,判識出空中目標(biāo)作戰(zhàn)任務(wù)的過程,目標(biāo)作戰(zhàn)任務(wù)判識過程如圖1所示。
圖1 作戰(zhàn)任務(wù)判識過程
空中目標(biāo)執(zhí)行的作戰(zhàn)任務(wù)與其狀態(tài)之間存在特定聯(lián)系,為判識作戰(zhàn)任務(wù),應(yīng)結(jié)合相應(yīng)的作戰(zhàn)情況,確定空中目標(biāo)的作戰(zhàn)任務(wù)空間以及與之聯(lián)系緊密的特征??罩辛α克煨凶鲬?zhàn)行動時,為完成有利的戰(zhàn)場布勢,在主要作戰(zhàn)方向上形成強(qiáng)大突擊力量,達(dá)成作戰(zhàn)企圖,按照便于指揮協(xié)同,充分發(fā)揮各參戰(zhàn)力量作用等要求,將所屬的作戰(zhàn)力量編組并賦予不同的作戰(zhàn)任務(wù),本文結(jié)合軍事專家知識以及文獻(xiàn)[6]的內(nèi)容進(jìn)行分析,建立空中作戰(zhàn)任務(wù)類型空間集為{空戰(zhàn)巡邏、預(yù)警指揮、空中加油、空中偵察、電子戰(zhàn)、空中進(jìn)攻、空運(yùn)、壓制敵防空、空(機(jī))降、轉(zhuǎn)場}。與空中作戰(zhàn)任務(wù)關(guān)聯(lián)緊密的特征通常包括飛行速度、高度、航向角、方位角、距離、飛行加速度、雷達(dá)反射面積、對空雷達(dá)狀態(tài)、對海雷達(dá)狀態(tài)、干擾狀態(tài)、敵我識別應(yīng)答和機(jī)動類型等。本文在確定空中作戰(zhàn)任務(wù)特征時考慮的情況有:1)盡早判識目標(biāo)的作戰(zhàn)任務(wù),此時目標(biāo)距離較遠(yuǎn),無法準(zhǔn)確地獲得空中目標(biāo)的加速度信息;2)空中目標(biāo)在作戰(zhàn)過程中會嚴(yán)格控制使用機(jī)載電子設(shè)備,使對方難以獲得相關(guān)電子情報;3)飛機(jī)的類型限制其自身的機(jī)動能力,因此限制了其所能執(zhí)行的任務(wù);4)指揮實(shí)體往往將各種作戰(zhàn)力量按照各自作戰(zhàn)任務(wù)、作戰(zhàn)能力和戰(zhàn)場條件,在地面實(shí)行梯次部署于各機(jī)場,來獲得有利的空戰(zhàn)態(tài)勢。本文將空中目標(biāo)任務(wù)判識特征集確定為{機(jī)型、起飛機(jī)場、目標(biāo)經(jīng)度、目標(biāo)緯度、高度、速度、航向角}7維特征向量。
作為一種典型的模式識別問題,可以將作戰(zhàn)任務(wù)判識表示為由不同時刻的作戰(zhàn)任務(wù)特征向量構(gòu)成的特征集到作戰(zhàn)任務(wù)類型空間的映射函數(shù),如式(1)所示。
=(,,…,)
(1)
式中,表示作戰(zhàn)任務(wù)類型空間,表示時刻的作戰(zhàn)任務(wù)特征向量。
考慮戰(zhàn)場態(tài)勢具有動態(tài)、復(fù)雜和不確定的特點(diǎn),這種映射關(guān)系無法運(yùn)用顯式的數(shù)學(xué)公式表示。本文在假設(shè)戰(zhàn)場環(huán)境條件相同和作戰(zhàn)任務(wù)在提取任務(wù)時序特征向量的過程中保持不變的條件下,運(yùn)用深度學(xué)習(xí)相關(guān)理論構(gòu)建模型來表示這種映射關(guān)系。
模型主要由兩個BiGRU網(wǎng)絡(luò)層、注意力機(jī)制層、先驗(yàn)知識融合與分類層組成。同時,隨著網(wǎng)絡(luò)深度加深,可能會導(dǎo)致模型性能退化和模型訓(xùn)練時難以收斂的問題,引入殘差機(jī)制防止網(wǎng)絡(luò)性能退化,引入中間層正則化以解決模型在訓(xùn)練中難以收斂問題,模型結(jié)構(gòu)如圖2所示。
圖2 模型結(jié)構(gòu)
模型分為4個部分:第1部分為BiGRU層,該層得到輸入作戰(zhàn)任務(wù)的時序特征信息的隱含狀態(tài)并進(jìn)行中間層正則化操作;第2部分為殘差層,該層引入殘差機(jī)制將第一部正則化后的隱含狀態(tài)和該層BiGRU網(wǎng)絡(luò)輸出的狀態(tài)進(jìn)行求和;第3部分為注意力機(jī)制層,該層運(yùn)用權(quán)重系數(shù)對隱含特征的重要程度進(jìn)行區(qū)分;第4部分為先驗(yàn)知識融合與分類層,該層將先驗(yàn)知識融入多層神經(jīng)網(wǎng)絡(luò)并實(shí)現(xiàn)對作戰(zhàn)任務(wù)的判識。
GRU網(wǎng)絡(luò)是對LSTM網(wǎng)絡(luò)的門控機(jī)制進(jìn)行改進(jìn)的一種變體,與LSTM網(wǎng)絡(luò)相比,GRU網(wǎng)絡(luò)結(jié)構(gòu)更加簡單,需要訓(xùn)練的參數(shù)更少,訓(xùn)練速度更快,GRU網(wǎng)絡(luò)單元結(jié)構(gòu)如圖3所示。
圖3 GRU結(jié)構(gòu)
=(+-1+)
(2)
=(+-1+)
(3)
(4)
(5)
其中,、、、、、為權(quán)值矩陣,、、為偏置向量。
BiGRU網(wǎng)絡(luò)由雙向GRU網(wǎng)絡(luò)組成,能運(yùn)用歷史信息和未來信息對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,增強(qiáng)網(wǎng)絡(luò)性能,其結(jié)構(gòu)如圖4所示。
圖4 BiGRU結(jié)構(gòu)
(6)
(7)
(8)
為了使模型更好地抽象出輸入數(shù)據(jù)的特征,提升對作戰(zhàn)任務(wù)判識的準(zhǔn)確率,增加了模型隱藏層的數(shù)量。但隨著網(wǎng)絡(luò)深度的增加,可能會導(dǎo)致網(wǎng)絡(luò)性能退化,訓(xùn)練誤差增加。為此,引入殘差機(jī)制防止出現(xiàn)該問題。如圖2中殘差層所示,殘差單元由一個BiGRU網(wǎng)絡(luò)和直連邊組成,其表達(dá)式為
(9)
注意力機(jī)制通過權(quán)重系數(shù)對輸入特征的重要程度進(jìn)行區(qū)分。本文注意力機(jī)制層包括短時注意力機(jī)制與長時注意力機(jī)制,短時注意力機(jī)制對當(dāng)前時刻隱藏層的輸出特征進(jìn)行加權(quán)求和,得到當(dāng)前時間步的特征向量;長時注意力機(jī)制對作用于不同時刻的短時注意力機(jī)制的輸出進(jìn)行加權(quán)求和,得到特征向量。注意力機(jī)制的表達(dá)式為:
(10)
(11)
=tanh(+)
(12)
為上一層的輸出特征;為經(jīng)過感知機(jī)輸出的表示;為權(quán)重系數(shù);為采用注意力機(jī)制后輸出的特征向量;為隨機(jī)初始化向量;為權(quán)值矩陣;為偏置向量。
該層將先驗(yàn)知識與多層神經(jīng)網(wǎng)絡(luò)輸出的結(jié)果相融合。計算機(jī)兵棋推演重要的功能是模擬作戰(zhàn)過程,推演過程中產(chǎn)生的數(shù)據(jù)蘊(yùn)含了指揮員的軍事知識。先驗(yàn)知識是運(yùn)用概率理論分析兵棋推演產(chǎn)生的數(shù)據(jù),得到的空中目標(biāo)任務(wù)特征中的靜態(tài)屬性(機(jī)型、機(jī)場)與執(zhí)行某類作戰(zhàn)任務(wù)之間的概率值。設(shè)任務(wù)類別∈{1,2,…,}有個,飛機(jī)類型∈{1,2,…,}有個,起飛機(jī)場∈{1,2,…,}有個,則類型為的飛機(jī),從機(jī)場起飛,執(zhí)行類任務(wù)的次數(shù),執(zhí)行類任務(wù)的概率可通過式(13)計算得到。最終得到的先驗(yàn)知識可表示為=[,,…,],其中,∈{1,2,…,}表示執(zhí)行類作戰(zhàn)任務(wù)的概率。
(13)
對于多分類問題,本文給定一個模型隱藏層輸入的狀態(tài)向量,運(yùn)用Softmax回歸判別其屬于類別的概率可由式(14)計算得到。最終得到具體形式為=[,,…,],其中,∈{1,2,…,}表示執(zhí)行類作戰(zhàn)任務(wù)的概率。
(14)
式中,、分別為需要通過訓(xùn)練來獲得的第類任務(wù)的權(quán)重向量和偏置向量。
先驗(yàn)知識與神經(jīng)網(wǎng)絡(luò)輸出的融合由式(15)表示:
(=|)=+(1-)
(15)
式中,為超參數(shù)。
任務(wù)分類可由式(16)表示:
(16)
模型訓(xùn)練時,采用的損失函數(shù)為負(fù)對數(shù)似然函數(shù),并且引入L2正則化,以防止模型過擬合,由式(17)表示。
(17)
數(shù)據(jù)準(zhǔn)備主要是獲得數(shù)據(jù)樣本并對數(shù)據(jù)樣本中的數(shù)據(jù)進(jìn)行預(yù)處理,最終生成模型所能處理的特征向量。
1)數(shù)據(jù)樣本獲取
實(shí)驗(yàn)數(shù)據(jù)樣本來源于兵棋推演歷史數(shù)據(jù),兵棋系統(tǒng)在推演過程中會存儲兩種數(shù)據(jù):第一種是指揮員下達(dá)的作戰(zhàn)任務(wù)指令數(shù)據(jù);第二種是兵棋系統(tǒng)模型根據(jù)任務(wù)指令運(yùn)行產(chǎn)生的瞬時狀態(tài)數(shù)據(jù)。以“空戰(zhàn)巡邏”任務(wù)指令為例,該指令包括執(zhí)行任務(wù)的機(jī)型、機(jī)場、巡邏區(qū)域和時間等要素,當(dāng)兵棋系統(tǒng)模型按該指令運(yùn)行時,會根據(jù)指令的要素從相應(yīng)的機(jī)場派遣作戰(zhàn)飛機(jī)同時解算出飛機(jī)瞬時速度、經(jīng)緯度、高度和航向角等任務(wù)特征。通過分析兵棋系統(tǒng)數(shù)據(jù)庫,將指揮體下達(dá)的任務(wù)指令與任務(wù)特征信息進(jìn)行關(guān)聯(lián),便得到空中目標(biāo)執(zhí)行的任務(wù)及對應(yīng)的特征信息。本次實(shí)驗(yàn)從數(shù)十場兵棋推演歷史數(shù)據(jù)中抽取24 000個作戰(zhàn)任務(wù)樣本,其中各作戰(zhàn)任務(wù)占比為轉(zhuǎn)場8.6%、空戰(zhàn)巡邏13.6%、預(yù)警指揮9%、空中加油3.4%、空中偵察12.5%、電子戰(zhàn)10.1%、空中進(jìn)攻17%、空運(yùn)11.5%、壓制敵防空10.3%、空降4%;對應(yīng)的任務(wù)特征包括機(jī)型、起飛機(jī)場、飛行速度、高度、經(jīng)度、緯度、航向角共7維特征;按8∶2劃分訓(xùn)練集與測試集。
2)數(shù)據(jù)預(yù)處理
數(shù)據(jù)樣本中的數(shù)值型數(shù)據(jù)具有不同的量綱,會對模型運(yùn)行結(jié)果造成不良影響。因此,采用與文獻(xiàn)[6]相同的思路對飛行速度、高度、經(jīng)度、緯度和航向角這5種數(shù)值型特征數(shù)據(jù)進(jìn)行歸一化處理,某一時刻歸一化處理后的數(shù)據(jù)樣本示例如表1所示。歸一化處理的表達(dá)式如式(18)所示。
表1 部分?jǐn)?shù)據(jù)樣本示例
(18)
式中,=[1,2,…,](=1,2,…,5)為第種總量為的數(shù)值型特征數(shù)據(jù),為第個數(shù)值型特征數(shù)據(jù),max為第種特征數(shù)據(jù)的最大值,min為第種特征數(shù)據(jù)的最小值,′為標(biāo)準(zhǔn)化處理后的數(shù)據(jù)。
3)特征向量生成
將機(jī)型、機(jī)場這兩種非數(shù)值型數(shù)據(jù)進(jìn)行編碼,將編碼后的數(shù)據(jù)與預(yù)處理后的數(shù)值型數(shù)據(jù)進(jìn)行拼接,構(gòu)建每一時刻輸入模型的特征向量如式(19)所示。
=[,,′1,′2,′3,′4,′5]
(19)
式中,為機(jī)型,為起飛的機(jī)場,′1為飛行速度,′2為高度,′3為經(jīng)度,′4為維度,′5為航向角。
本文采用平均倒數(shù)排名()和前項命中率(@)指標(biāo)來評估作戰(zhàn)任務(wù)判識方法的有效性,判識方法的效果與指標(biāo)的數(shù)值大小成正相關(guān)關(guān)系。向模型輸入任務(wù)的特征,得到作戰(zhàn)任務(wù)類型概率排序列表,正確的結(jié)果排序位置越靠前,則模型判識的性能越高。是正確的任務(wù)在列表中排名的倒數(shù)之和的平均值,@是正確任務(wù)排在前名所占的比例,計算公式如(20)、(21)所示。
(20)
(21)
式中,表示樣本集合;||表示判識樣本的個數(shù);表示第個判識樣本正確判識結(jié)果的排名,如果≤,則()=1,否則()=0。
采用全卷積神經(jīng)網(wǎng)絡(luò)模型(FCN)、LSTM模型、AM-BiLSTM模型與本文所提的神經(jīng)網(wǎng)絡(luò)模型(Our model)、融合先驗(yàn)知識后的模型(Our+Kg model)進(jìn)行實(shí)驗(yàn)對比。在模型訓(xùn)練過程中,使用自適應(yīng)矩估計(Adam)優(yōu)化算法并利用網(wǎng)格搜索策略為模型尋找合適的參數(shù)大小。訓(xùn)練過程中的損失值變化和實(shí)驗(yàn)結(jié)果分別如圖5和表2所示。
表2 實(shí)驗(yàn)結(jié)果
圖5 損失值變化情況
從圖5可以看出,隨著訓(xùn)練輪次的增加,各種算法模型的損失值不斷降低,并且最終均可以收斂。LSTM模型損失值均優(yōu)于FCN模型,說明LSTM可以較好地學(xué)習(xí)到任務(wù)狀態(tài)間的時序關(guān)系,因而提升了性能。AM-BiLSTM模型在LSTM基礎(chǔ)上,采用了雙向的LSTM網(wǎng)絡(luò)并引入了注意力機(jī)制,既可以更好地學(xué)習(xí)到任務(wù)狀態(tài)間時序關(guān)系,又可以有效捕捉到當(dāng)前任務(wù)狀態(tài)的重要信息,從而進(jìn)一步提高了實(shí)驗(yàn)的準(zhǔn)確性。本文方法所采用的模型經(jīng)過一段輪次訓(xùn)練后,其損失值便小于其他模型,并且最終損失值遠(yuǎn)小于其他模型,說明本文構(gòu)建的由GRU網(wǎng)絡(luò)、注意力機(jī)制和殘差機(jī)制組成的深層神經(jīng)網(wǎng)絡(luò)模型不僅可以更好地對時序特征進(jìn)行表達(dá),而且能有效地捕捉到任務(wù)狀態(tài)信息,并且在訓(xùn)練過程中,殘差機(jī)制的作用可以明顯體現(xiàn),降低訓(xùn)練的容錯率,使得訓(xùn)練過程中的損失值下降平緩。在模型訓(xùn)練過程中,本文所提的模型由于參數(shù)較多,學(xué)習(xí)速度慢,所以收斂速度較慢,算法代價較大,在實(shí)際應(yīng)用中,可以將訓(xùn)練好的模型參數(shù)保存下來,當(dāng)有新的訓(xùn)練集時,直接加載模型訓(xùn)練好的參數(shù)進(jìn)行訓(xùn)練,可以極大地減少時間的開銷,滿足任務(wù)判識的實(shí)時性要求。
從表2中可以看出,在指標(biāo)上,與其他模型相比,本文所提模型在未融入先驗(yàn)知識時最低提升0017,融入先驗(yàn)知識后,再次提升了0076。在@指標(biāo)上,當(dāng)取值為1時,本文所提模型在未融入先驗(yàn)知識時低于LSTM、AM-BiLSTM模型,當(dāng)融入先驗(yàn)知識后,相比其他模型至少提升了0.03;當(dāng)分別取值為3和5時,本文所提模型在未融入先驗(yàn)知識時分別最低提升了0.095和0.146,當(dāng)融入先驗(yàn)知識后,分別再次提升了0.065和0.024。
上述實(shí)驗(yàn)結(jié)果分析表明,融入先驗(yàn)知識對提升作戰(zhàn)任務(wù)判識效果具有積極作用,證明了本文所提方法的有效性。
為滿足在復(fù)雜戰(zhàn)場環(huán)境下對敵作戰(zhàn)任務(wù)判識的需要,本文分析了任務(wù)判識問題的特點(diǎn),確定了作戰(zhàn)任務(wù)空間和任務(wù)特征,構(gòu)建了融合先驗(yàn)知識的作戰(zhàn)任務(wù)智能判識模型。該模型以BiGRU網(wǎng)絡(luò)提取任務(wù)特征向量的深層次特征,引入注意力機(jī)制對隱含特征分配不同權(quán)重,采用殘差機(jī)制確保模型的性能,將先驗(yàn)知識融入該模型進(jìn)一步提升任務(wù)判識的性能。實(shí)驗(yàn)表明,對比其他模型,該模型對作戰(zhàn)任務(wù)的判識具有較高有效性。