胡鑫武,羅鵬程,張笑楠,王 駿
(1.國防科技大學(xué)系統(tǒng)工程學(xué)院,長沙 410073;2.湖南和信智仿信息科技有限公司,長沙 410013;3.解放軍93123 部隊(duì),遼寧 遼陽 111000)
隨著復(fù)雜系統(tǒng)仿真技術(shù)、計(jì)算能力和數(shù)據(jù)管理能力的發(fā)展,仿真模型粒度越來越細(xì),體系仿真實(shí)驗(yàn)因子多、因子空間規(guī)模大、因子間關(guān)系復(fù)雜并存在組合約束,而且對體系對抗中的大規(guī)模、復(fù)雜相關(guān)、不確定、智能、自適應(yīng)等特性的仿真能力也逐漸增強(qiáng)。與此同時(shí),仿真數(shù)據(jù)逐步呈現(xiàn)大數(shù)據(jù)特點(diǎn),評(píng)估指標(biāo)之間也存在維度高和信息冗余、高度相關(guān)等突出問題。
傳統(tǒng)的體系效能評(píng)估分析方法如AHP 分析方法[1]、組合賦權(quán)評(píng)估法[2]、模糊綜合評(píng)估法[3]、灰色關(guān)聯(lián)評(píng)估法[4]等,難以對海量的仿真數(shù)據(jù)進(jìn)行充分挖掘和探索,造成對體系仿真大數(shù)據(jù)高價(jià)值性的應(yīng)用嚴(yán)重不足,而且需要專家分配評(píng)價(jià)屬性的權(quán)值,相應(yīng)的評(píng)估分析結(jié)論也不充分。針對體系仿真大數(shù)據(jù)等特點(diǎn)和評(píng)估指標(biāo)體系高維度、高冗余、高相關(guān)等突出問題,開展結(jié)合深度學(xué)習(xí)技術(shù)的智能化評(píng)估技術(shù)研究,可望利用體系仿真大數(shù)據(jù)提供的大量訓(xùn)練樣本,建立相應(yīng)的智能化評(píng)估模型,為更加全面地探索實(shí)驗(yàn)設(shè)計(jì)空間、評(píng)估和優(yōu)化體系效能等提供新的技術(shù)途徑。
體系(System of Systems,SoS)的基本含義是由系統(tǒng)組成的系統(tǒng),體系具有演化性、適應(yīng)性、學(xué)習(xí)性等特征[5]。國軍標(biāo)對效能進(jìn)行了定義,即效能為武器裝備在“規(guī)定的條件”下達(dá)到“規(guī)定使用目標(biāo)”的能力。與之對應(yīng)的效能指標(biāo)旨在反映目標(biāo)的實(shí)現(xiàn)程度。
體系仿真的效能評(píng)估問題隨著體系仿真技術(shù)不斷成熟變得日益凸顯,將效能評(píng)估與眼下發(fā)展火熱的深度學(xué)習(xí)技術(shù)結(jié)合成為必然趨勢。
體系效能評(píng)估主要包括6 種評(píng)估模式[6],包括基于專家判斷的效能評(píng)估、基于先驗(yàn)知識(shí)的效能評(píng)估、基于數(shù)學(xué)建模的效能評(píng)估、基于仿真的效能評(píng)估、基于靶場試驗(yàn)的效能評(píng)估、基于實(shí)戰(zhàn)的效能評(píng)估。顯然針對目前大數(shù)據(jù)環(huán)境,采用數(shù)學(xué)建模與仿真的方法更適用。
黃建新[7]等人提出采用基于Agent 建模仿真的方法進(jìn)行體系效能仿真開發(fā)和評(píng)估,通過構(gòu)建智能Agent 實(shí)現(xiàn)復(fù)雜系統(tǒng)的關(guān)系刻畫。但是目前Agent 的建模、交互問題研究仍不夠完善。文獻(xiàn)[8]采用面向C4ISR 的網(wǎng)絡(luò)特征分析方法進(jìn)行效能評(píng)估,采用信息流的方式分析網(wǎng)絡(luò)化C4ISR 系統(tǒng),定義了3 種系統(tǒng)結(jié)構(gòu)時(shí)效性分析指標(biāo)來反映整個(gè)作戰(zhàn)過程的時(shí)效性。文獻(xiàn)[9]提出通過構(gòu)建神經(jīng)網(wǎng)絡(luò)來選取指標(biāo),通過神經(jīng)網(wǎng)絡(luò)預(yù)測模型挖掘?qū)τ绊懶茉u(píng)估結(jié)果的主要因素,能夠減少在指標(biāo)選取上對評(píng)估結(jié)果的影響。
復(fù)雜系統(tǒng)仿真技術(shù)、計(jì)算能力和數(shù)據(jù)管理能力不斷發(fā)展,仿真的規(guī)模不斷增大,仿真模型粒度越來越細(xì),仿真包含的參數(shù)指數(shù)增長。仿真規(guī)模增大對數(shù)學(xué)建模的要求也不斷提高。模型的復(fù)雜度不斷提升,這導(dǎo)致仿真模型計(jì)算效率不斷下降,運(yùn)行一個(gè)完整仿真模型更加耗時(shí)。仿真過程產(chǎn)生的指標(biāo)統(tǒng)計(jì)結(jié)果也顯得更加龐雜。解決仿真效率低下以及指標(biāo)龐雜的一個(gè)有效辦法,就是采用深度學(xué)習(xí)技術(shù)重構(gòu)仿真過程用于效能評(píng)估研究,采用新數(shù)據(jù)處理方法進(jìn)行指標(biāo)篩選與降維。
1)體系仿真技術(shù)不斷發(fā)展,仿真涉及的數(shù)量不斷增加,加大了效能評(píng)估模型的構(gòu)建難度,傳統(tǒng)的小數(shù)據(jù)模式和專家定性判斷已不適用。
2)仿真得到指標(biāo)統(tǒng)計(jì)結(jié)果龐雜,加大了指標(biāo)體系構(gòu)建難度,需要結(jié)合新的數(shù)據(jù)處理方法開展數(shù)據(jù)篩選、數(shù)據(jù)降維。
3)現(xiàn)有的效能評(píng)估方法只能滿足靜態(tài)條件下單方的評(píng)估,不能滿足動(dòng)態(tài)、整體、對抗條件的評(píng)估需要。
4)效能評(píng)估逆問題的需求,從給定體系效能需求,要求得到最優(yōu)的體系方案。正問題用于從準(zhǔn)備好的體系方案之間的排序選擇,而效能評(píng)估的逆問題則是從所有符合條件的方案中尋優(yōu)。顯然效能評(píng)估的逆問題更具有現(xiàn)實(shí)應(yīng)用意義。
目前體系仿真技術(shù)不斷發(fā)展革新,仿真背景與仿真模型逐漸逼近實(shí)戰(zhàn),整個(gè)仿真過程趨于大數(shù)據(jù)形態(tài),無疑增加了仿真體系效能評(píng)估難度。
使用神經(jīng)網(wǎng)絡(luò)方法進(jìn)行體系仿真效能評(píng)估的研究國內(nèi)較多。文獻(xiàn)[10]設(shè)計(jì)了BP 神經(jīng)網(wǎng)絡(luò)評(píng)估方法用來解決通信電子防御作戰(zhàn)中的效能評(píng)估問題,并引入了云模型對作戰(zhàn)數(shù)據(jù)進(jìn)行處理,利用BP神經(jīng)網(wǎng)絡(luò)的非線性學(xué)習(xí)能力訓(xùn)練得到評(píng)估結(jié)果。文獻(xiàn)[11]提出了一種基于灰色AHP 理論的數(shù)據(jù)鏈系統(tǒng)BP 神經(jīng)網(wǎng)絡(luò)效能評(píng)估模型。構(gòu)造三層BP 神經(jīng)網(wǎng)絡(luò)模型,以專家的知識(shí)與經(jīng)驗(yàn)作為輸入,以灰色AHP綜合效能評(píng)價(jià)值作為輸出訓(xùn)練網(wǎng)絡(luò)。該模型運(yùn)用BP神經(jīng)網(wǎng)絡(luò)非線性擬合的優(yōu)勢繼承并有效聚合了專家的知識(shí)與經(jīng)驗(yàn),結(jié)果與專家評(píng)定一致。文獻(xiàn)[12]提出了基于神經(jīng)網(wǎng)絡(luò)的雷達(dá)抗干擾效能評(píng)估方法,實(shí)例結(jié)果表明,該評(píng)估方法能客觀、定量地評(píng)估雷達(dá)抗干擾效能,具有一定的實(shí)用性。文獻(xiàn)[13]研究末敏子彈效能優(yōu)化問題,通過構(gòu)建灰色神經(jīng)網(wǎng)絡(luò)得到命中概率的預(yù)測模型,并采用遺傳算法對網(wǎng)絡(luò)權(quán)值閾值進(jìn)行優(yōu)化。與相關(guān)實(shí)驗(yàn)數(shù)據(jù)對比,預(yù)測模型及優(yōu)化結(jié)果具有一定可靠性。
可以看出神經(jīng)網(wǎng)絡(luò)技術(shù)在作戰(zhàn)效能評(píng)估上的應(yīng)用比較廣泛,能夠利用其自學(xué)習(xí)能力完成評(píng)估任務(wù)。但是目前研究使用常規(guī)前饋神經(jīng)網(wǎng)絡(luò)為主,缺少在神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)上的創(chuàng)新性研究,導(dǎo)致模型功能不足,結(jié)果預(yù)測的準(zhǔn)確性有待提高。
深度學(xué)習(xí)(Deep Learning,DL)術(shù)語于1986 年首次被機(jī)器學(xué)習(xí)引入,后在2000 年被用于人工神經(jīng)網(wǎng)絡(luò)(ANN)的研究[14]。深度學(xué)習(xí)技術(shù)通過建立與人腦機(jī)制相似的神經(jīng)網(wǎng)絡(luò)來處理信息,從而實(shí)現(xiàn)有監(jiān)督或無監(jiān)督式的特征學(xué)習(xí)與分層特征提取,以及數(shù)據(jù)的分類與模式識(shí)別[15-16]。
下面介紹一些較新的神經(jīng)網(wǎng)絡(luò)模型架構(gòu)。
AlexNet[17]并沒有出現(xiàn)質(zhì)的飛躍,模型性能的大幅度提升是因?yàn)楦玫奶幚砥髂軌蛱幚砀嗟碾[藏層,Alex 架構(gòu)如圖1 所示。
圖1 AlexNet 架構(gòu)
VGG[18]網(wǎng)絡(luò)采用了一個(gè)簡單的標(biāo)準(zhǔn):只有步長為2 的2×2 padding 和步長為1 的3×3 卷積(帶有一個(gè)大小為1 的padding),因此,通過卷積操作保存了圖像寬度與高度的大小,VGG 架構(gòu)如圖2 所示。
圖2 VGG 架構(gòu)
GoogleNet[19]引入新型層:inception 層。GoogleNet不通過簡單的池化、卷積或全連接操作從CNN 的一個(gè)層到達(dá)下一個(gè)層,而是平均下列架構(gòu)的結(jié)果,如圖3 所示。
圖3 GoogleNet 的inception 層
ResNet[20]架構(gòu)接著堆棧大量殘差模塊,從卷積池層開始,以池化操作結(jié)束,從而獲得一個(gè)輸出函數(shù)可以直接應(yīng)用的全連接層。ResNet 在一些常見的訓(xùn)練集中都達(dá)到了業(yè)內(nèi)最佳的結(jié)果(如CIFAR、MNIST 等)。
Highway[21]是一種可學(xué)習(xí)的門限機(jī)制,在此機(jī)制下,一些信息流沒有衰減地通過一些網(wǎng)絡(luò)層,適用于SGD 法。
圖4 Bottleneck 殘差架構(gòu)
圖4 是Densnet 網(wǎng)絡(luò)[22]的經(jīng)典dense block 結(jié)構(gòu)示意圖,dense block 中每一層的輸入都是來自前面所有層的輸出,每一層輸出都會(huì)作為后面層的輸入。也就是說最后通道的疊加,通道數(shù)是變化的。在Densnet 中相當(dāng)于每一層都直接連接輸入和損失,因此,就可以減輕梯度消失現(xiàn)象,這樣更新網(wǎng)絡(luò)不是問題。
圖5 dense block 結(jié)構(gòu)
神經(jīng)網(wǎng)絡(luò)的奠基人Hinton 最近提出了Capsule[23],該網(wǎng)絡(luò)中Capsule 表示為一組神經(jīng)元,其輸入輸出向量表示特定實(shí)體類型的實(shí)例化參數(shù)。使用輸入輸出向量的長度表征實(shí)體存在的概率,向量的方向表示實(shí)例化參數(shù),例如姿勢(位置、大小、方向)、變形、速度、反射率、色彩、紋理等等。
體系仿真得到的指標(biāo)多而龐雜,且存在大量冗余和相關(guān)性高的數(shù)據(jù),因此,需要進(jìn)行降維處理,將指標(biāo)項(xiàng)目進(jìn)行約減。
數(shù)據(jù)降維方法主要包括以主成分分析(principal component analysis,PCA)[24-25]為代表的線性投影法、以核主成分分析(kernel principal component analysis,KPCA)[26-27]為代表的核方法、以等距映射算法(isometric mapping,ISOMAP)[28-29]為代表的流形學(xué)習(xí)算法和以自編碼神經(jīng)網(wǎng)絡(luò)(Autoencoder)[30-31]為代表的深度學(xué)習(xí)方法,以及其他一些新提出的方法[32-34]。
其中,線性投影法不能解決非線性數(shù)據(jù)降維問題,而核方法、流形學(xué)習(xí)等非線性方法計(jì)算復(fù)雜度高,并且隱含層較少,復(fù)雜問題表現(xiàn)能力有限。為此,Hinton 等人[30]提出了一種用于自動(dòng)提取特征的自編碼深度學(xué)習(xí)方法。通過構(gòu)建具有很多隱層的深度學(xué)習(xí)模型實(shí)現(xiàn)對訓(xùn)練數(shù)據(jù)進(jìn)行編碼/解碼學(xué)習(xí),提取能夠更加反映樣本本質(zhì)的高級(jí)抽象特征,保證在重構(gòu)誤差最小策略下實(shí)現(xiàn)數(shù)據(jù)降維,提升分類或預(yù)測的效率。
文獻(xiàn)[31]為了提高支持向量機(jī)SVM 的分類效率,采用自編碼神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)方法,實(shí)現(xiàn)高維、非線性高分辨率距離像功率譜的數(shù)據(jù)降維。仿真結(jié)果顯示,自編碼神經(jīng)網(wǎng)絡(luò)的降維效果遠(yuǎn)好于核主成分分析和等距映射算法,其降維結(jié)果對SVM 分類結(jié)果影響甚微,但大幅縮短了SVM 的計(jì)算時(shí)間,同時(shí)在隱層節(jié)點(diǎn)數(shù)相同的情況下,隨著隱含層數(shù)的增加或者深度的增加,自編碼神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)降維及特征提取效果更好。
構(gòu)造的神經(jīng)網(wǎng)絡(luò)需要通過嚴(yán)格的訓(xùn)練才能用于評(píng)估分析中,參數(shù)優(yōu)化能夠大大提高模型的訓(xùn)練準(zhǔn)確度。調(diào)節(jié)的參數(shù)包括神經(jīng)網(wǎng)絡(luò)的層數(shù)、每層神經(jīng)元的個(gè)數(shù)、初始化權(quán)重、正則化參數(shù)、學(xué)習(xí)率等,除人工調(diào)整這些參數(shù)外還可以通過智能算法進(jìn)行參數(shù)的優(yōu)化求解。
通過智能算法尋找神經(jīng)網(wǎng)絡(luò)的參數(shù)組合能夠幫助建立最優(yōu)神經(jīng)網(wǎng)絡(luò),提高網(wǎng)絡(luò)的預(yù)測能力。常見的智能算法有粒子群算法[35]、遺傳算法[36]、人工蜂群算法[37]等,文獻(xiàn)[38]采用反向傳播算法、螢火蟲算法、模擬退火算法、入侵雜草優(yōu)化算法和混合蛙跳算法,對神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行優(yōu)化,訓(xùn)練得到評(píng)估結(jié)果表明模擬退火算法的優(yōu)化效果最佳,實(shí)驗(yàn)誤差最小。
神經(jīng)網(wǎng)絡(luò)的訓(xùn)練函數(shù)選擇也比較多,針對數(shù)據(jù)特點(diǎn)選擇合適的訓(xùn)練函數(shù)、轉(zhuǎn)移函數(shù)、學(xué)習(xí)函數(shù),能夠有效提高神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力。文獻(xiàn)[39]通過試錯(cuò)法對神經(jīng)網(wǎng)絡(luò)進(jìn)行參數(shù)優(yōu)化,訓(xùn)練函數(shù)選擇包括:LM 算法(Liebenberg-Marquardt,LM),BFGS 算法(Broyden Fletcher Goldfarb Shanno,BFGS)和自適應(yīng)學(xué)習(xí)算法(adaptive learning algorithms);轉(zhuǎn)移函數(shù)選擇包括:PURELIN、LOGSIG 和TANSIG,學(xué)習(xí)函數(shù)選擇包括:梯度下降(Gradient Descent,GD)和基于動(dòng)量的梯度下降(Gradient Descent with Momentum,GDM),通過對比實(shí)驗(yàn)得到最優(yōu)的參數(shù)設(shè)計(jì)。
神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)函數(shù)還包括基于動(dòng)量兩步更新的隨機(jī)梯度下降法(SGD Nesterov Momentum)、能夠自適應(yīng)地為各個(gè)參數(shù)分配不同學(xué)習(xí)速率的Adagrad、針對RNN 最好的優(yōu)化器RMSprop、對每個(gè)權(quán)值都計(jì)算自適應(yīng)的學(xué)習(xí)速率的Adam 等[40-42]。
深度學(xué)習(xí)技術(shù)的發(fā)展為原本難以處理的大數(shù)據(jù)問題提供了解決辦法?;诜抡娲髷?shù)據(jù)的效能評(píng)估問題也可望結(jié)合深度學(xué)習(xí)技術(shù)得到突破。
首先針對評(píng)估指標(biāo)體系高維度、高冗余、高相關(guān)等問題,對仿真數(shù)據(jù)進(jìn)行數(shù)據(jù)篩選和降維處理。相比傳統(tǒng)的數(shù)據(jù)降維方法,自編碼神經(jīng)網(wǎng)絡(luò)會(huì)有更好的降維效果,其能夠?qū)W習(xí)出數(shù)據(jù)中蘊(yùn)含的特征,得到綜合評(píng)價(jià)指標(biāo)。
大數(shù)據(jù)環(huán)境下的體系仿真往往包含龐大的數(shù)學(xué)模型,仿真過程比較耗時(shí),此時(shí)可以采用深度神經(jīng)網(wǎng)絡(luò)對仿真過程進(jìn)行重構(gòu)。利用體系仿真大數(shù)據(jù)提供的大量訓(xùn)練樣本,結(jié)合降維得到的綜合指標(biāo),建立相應(yīng)的智能化評(píng)估模型。
基于深度神經(jīng)網(wǎng)絡(luò)的評(píng)估模型只需要輸入仿真的參數(shù)選擇,就能夠得到其對應(yīng)的綜合評(píng)價(jià)結(jié)果。深度神經(jīng)網(wǎng)絡(luò)能夠?qū)Ψ抡鏀?shù)據(jù)進(jìn)行充分的學(xué)習(xí),能夠挖掘出仿真數(shù)據(jù)蘊(yùn)含的豐富信息,為更加全面地探索實(shí)驗(yàn)設(shè)計(jì)空間、評(píng)估和優(yōu)化體系效能等提供新的技術(shù)途徑。
本文介紹了體系效能評(píng)估的研究進(jìn)展,及其目前存在的問題。介紹了深度神經(jīng)網(wǎng)絡(luò)的最新架構(gòu),指標(biāo)約簡的常用方法,指出自編碼神經(jīng)網(wǎng)絡(luò)具有較好的降維效果。當(dāng)前已有不少基于神經(jīng)網(wǎng)絡(luò)的效能評(píng)估技術(shù)研究,但是針對多指標(biāo)的效能評(píng)估研究較少,且采用的網(wǎng)絡(luò)模型過于簡單,而實(shí)際體系仿真往往會(huì)統(tǒng)計(jì)大量的指標(biāo)項(xiàng),數(shù)據(jù)量不斷增加,對模型的學(xué)習(xí)能力要求不斷提高。因此,對指標(biāo)進(jìn)行合理的約簡、使用高效的神經(jīng)網(wǎng)絡(luò)模型是下一步研究的重點(diǎn)。