国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于多標(biāo)簽學(xué)習(xí)的探索性仿真實驗因素篩選方法*

2023-12-06 03:15:40張雪超
指揮控制與仿真 2023年6期
關(guān)鍵詞:特征選擇標(biāo)簽特征

安 靖,張雪超,張 雷,劉 偉

(1. 國防大學(xué) 研究生院,北京 100091; 2. 國防大學(xué) 聯(lián)合勤務(wù)學(xué)院,北京 100858;3. 國防大學(xué) 聯(lián)合作戰(zhàn)學(xué)院,北京 100091; 4. 中國人民解放軍61660部隊,北京 100081)

作為一種認(rèn)識、研究戰(zhàn)爭的重要手段,探索性仿真實驗通過在可控條件下模仿軍事行動,觀察規(guī)律,獲得認(rèn)知。運行過程中,要充分考慮作戰(zhàn)體系的整體性、體系內(nèi)部的動態(tài)交互性,以及體系間的對抗性,將面臨實驗因素數(shù)量多,因素水平范圍大,實驗因素之間、實驗因素和仿真結(jié)果之間多對多交互,仿真想定樣本空間復(fù)雜程度高,空間維度爆炸等問題[1-3]。因此,需要研究實驗因素的篩選問題,確保探索性仿真樣本空間既規(guī)??山邮苡志哂械湫痛硇?。對于這一問題,文獻[4-6]采用改進的序貫分支(SB)算法對實驗因素進行篩選,文獻[7]提出Morris法,完成不確定因素的分析篩選,文獻[8]基于回歸分析和方差分析提出逐步回歸方法,文獻[9]根據(jù)輸出相對于輸入的梯度選擇重要特征,但這些方法通常不能用于非線性問題分析。文獻[10]提出的方法實現(xiàn)了非線性問題的特征選擇,但由于不限制單樣本的搜索空間,導(dǎo)致計算成本較高,文獻[11]通過特征提取壓縮空間,但由于空間轉(zhuǎn)換,無法保留現(xiàn)實意義,可解釋性差。

本文提出了一種基于定性定量相結(jié)合的多標(biāo)簽學(xué)習(xí)方法,該方法的核心是在設(shè)計與實施仿真預(yù)實驗的基礎(chǔ)上,構(gòu)建深度神經(jīng)網(wǎng)絡(luò),通過多標(biāo)簽學(xué)習(xí)過程[12-13]中的特征選擇,完成實驗因素的篩選。關(guān)鍵技術(shù)包括:一是訓(xùn)練數(shù)據(jù)集的生成與預(yù)處理,聚焦實驗?zāi)康?基于定性分析設(shè)計并實施仿真預(yù)實驗,對預(yù)實驗輸出結(jié)果進行采集和標(biāo)準(zhǔn)化等預(yù)處理,生成學(xué)習(xí)過程所需的訓(xùn)練數(shù)據(jù)集,解決軍事數(shù)據(jù)缺失問題。二是神經(jīng)網(wǎng)絡(luò)的構(gòu)建和訓(xùn)練,輸入控制層和稀疏正則化搭建深度神經(jīng)網(wǎng)絡(luò),將特征選擇(Feature Selection)過程與多標(biāo)簽(Multi-label)模型訓(xùn)練過程結(jié)合,同時關(guān)注預(yù)測和特征選擇兩個目標(biāo),得到擬合效果較好又保留軍事意義關(guān)鍵特征的回歸預(yù)測模型。三是特征的輸出和分析,對篩選特征進行定性分析,結(jié)合軍事經(jīng)驗,基于全局敏感性分析補充完善實驗因素。

1 相關(guān)定義和形式化描述

本節(jié)給出方法相關(guān)的定義,并形式化描述如下:

定義1 仿真想定是在軍事想定的基礎(chǔ)上,面向仿真系統(tǒng),根據(jù)仿真實驗的目的、邊界條件、實驗?zāi)J?、仿真系統(tǒng)需求等,對初始戰(zhàn)場態(tài)勢、交戰(zhàn)各方作戰(zhàn)力量、武器裝備、作戰(zhàn)行動、交戰(zhàn)規(guī)則、仿真規(guī)則等進行的設(shè)定。

定義2 仿真想定數(shù)據(jù)是仿真想定的數(shù)據(jù)化表現(xiàn),是對仿真想定進行抽象轉(zhuǎn)化形成的數(shù)據(jù)集合,支撐仿真系統(tǒng)的初始化和運行。

定義3 特征選擇(Feature Selection)是通過一個特定的評價標(biāo)準(zhǔn)(Evaluation Criterion),對原始特征集M各個特征的相關(guān)度進行衡量,完成從M中尋找最優(yōu)特征集N(N?M)的過程,是大數(shù)據(jù)特征工程的重要方法之一。其目的是刪除原始特征集合中的冗余(Redundant)特征和不相關(guān)(Irrelevant)特征,保留有用特征。

定義4 實驗因素篩選本質(zhì)是一個特征選擇問題,是根據(jù)特征相關(guān)度(評價標(biāo)準(zhǔn)),采用一定的搜索策略(特征選擇方法),從高維特征實驗因素向量集合(原始特征集M)選擇最能代表向量空間的實驗因素子集(最優(yōu)特征子集N),也稱屬性選擇或變量子集選擇。

定義5 多標(biāo)簽特征選擇(Multi-Label Feature Selection,MLFS)

基于上述假設(shè),本文定義多標(biāo)簽特征選擇是關(guān)注多標(biāo)簽回歸預(yù)測和特征選擇兩個目標(biāo),訓(xùn)練映射函數(shù)f:X→Y的過程。即將多標(biāo)簽學(xué)習(xí)(Multi-Label Learning,MLL)過程與特征選擇相結(jié)合,在學(xué)習(xí)過程中完成特征選擇。

2 基于定性分析的仿真預(yù)實驗設(shè)計

數(shù)據(jù)是機器學(xué)習(xí)的核心支撐,考慮到作戰(zhàn)數(shù)據(jù)不易獲取,本方法在采用機器學(xué)習(xí)進行特征選擇前,基于定性分析,設(shè)計并實施仿真預(yù)實驗,通過仿真系統(tǒng)推演,為學(xué)習(xí)訓(xùn)練生成所需的訓(xùn)練數(shù)據(jù)集。

首先,基于軍事想定,采用專家研討、影響圖分析等定性工具方法,初步篩選出相對重要的實驗因素。實驗因素的選擇依據(jù)主要包括:一是作戰(zhàn)行動典型性,采用專家研討的方法,逐層分解,篩選確定影響或代表各作戰(zhàn)主體、重要行動、作戰(zhàn)規(guī)則的典型因素;二是實驗因素可控性,盡量選取可控因素;三是因素水平定量化,盡量選擇能夠定量化的實驗因素。

隨后,確定各實驗因素的因素水平,完成實驗設(shè)計。實驗因素的確定需重點考慮:一是兼顧現(xiàn)在和未來,作戰(zhàn)問題研究具有一定的前瞻性,實驗因素在取值時不僅要考慮現(xiàn)階段情況,還要考慮未來發(fā)展情況下的取值。二是關(guān)注敏感臨界值、極端情況值,仿真預(yù)實驗的目的在于對定性分析的實驗因素進行篩選,因此因素水平將重點考慮對某作戰(zhàn)行動效果和仿真實驗結(jié)果的影響較大的臨界值、極端值。三是仿真實驗可行性,確定實驗因素水平數(shù)量時,應(yīng)在滿足實驗需求的基礎(chǔ)上,充分考慮仿真系統(tǒng)的支持度、計算能力等實驗條件的現(xiàn)狀。

最后,基于實驗設(shè)計,運行仿真系統(tǒng),并采集想定仿真結(jié)果。對采集到的仿真結(jié)果數(shù)據(jù)進行特征歸一化(Normalization)或標(biāo)準(zhǔn)化(Standardization)等特征縮放預(yù)處理。歸一化是將所有特征值映射到[0,1]或[-1,1]之間,實現(xiàn)原始數(shù)據(jù)的等比例縮放;標(biāo)準(zhǔn)化是將所有數(shù)據(jù)變換至均值為0,標(biāo)準(zhǔn)差為1的分布。

3 基于多標(biāo)簽學(xué)習(xí)特征選擇的實驗因素篩選

3.1 基本思路

按照訓(xùn)練數(shù)據(jù)集的情況,特征選擇方法可以分為有監(jiān)督(Supervised Feature Selection)、半監(jiān)督(Semi-supervised Feature Selection)和無監(jiān)督(Unsupervised Feature Selection)[14]。按照與機器學(xué)習(xí)算法的關(guān)系,又可以分為過濾式模型(Filter)、包裹式模型(Wrapper)和嵌入式模型(Embedded)[14-16]。

根據(jù)研究目標(biāo)和數(shù)據(jù)集的特點,本方法采用有監(jiān)督的嵌入式模型進行特征選擇,特征選擇和多標(biāo)簽學(xué)習(xí)訓(xùn)練在同一個優(yōu)化過程中完成?;舅悸肥?引入輸入控制層構(gòu)建深度神經(jīng)網(wǎng)絡(luò),通過多標(biāo)簽學(xué)習(xí)訓(xùn)練,得到擬合度較高的回歸預(yù)測模型。根據(jù)文獻[17-19]的實驗驗證、結(jié)果分析,在對網(wǎng)絡(luò)結(jié)構(gòu)進行一定稀疏化處理的基礎(chǔ)上,模型權(quán)值參數(shù)代表了特征對于模型的貢獻度和重要性,越是重要,就會越大,反之,與輸出無關(guān),對應(yīng)的系數(shù)則接近于0。因此,根據(jù)訓(xùn)練得到的權(quán)值參數(shù),從大到小對相應(yīng)的特征進行排序,就能夠自動完成特征選擇。

3.2 引入輸入控制層的深度神經(jīng)網(wǎng)絡(luò)構(gòu)建

多層神經(jīng)網(wǎng)絡(luò)擁有較強的復(fù)雜非線性函數(shù)處理能力,能夠提高模型的擬合度,因此,本文根據(jù)訓(xùn)練集的數(shù)據(jù)結(jié)構(gòu),將數(shù)據(jù)集映射到特征空間,搭建如圖1所示的DNN。

圖1 引入輸入控制層的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Deep neural network structure with input control layer

為保證權(quán)重的有效輸出和選擇,該網(wǎng)絡(luò)f:X→Y主要由以下三部分組成。

1)control_input輸入控制層

(1)

2)多個ANN網(wǎng)絡(luò)隱層

3)輸出層

網(wǎng)絡(luò)的輸出可表示為

(2)

其中,F(·)是含有超參數(shù)Θ={W,b}的多個隱層函數(shù)的疊加。

3.3 引入稀疏正則化的多標(biāo)簽學(xué)習(xí)訓(xùn)練算法

融合單個標(biāo)簽的特定特征空間和所有標(biāo)簽的共享特征空間,對上述網(wǎng)絡(luò)進行訓(xùn)練。考慮本文數(shù)據(jù)來源,即訓(xùn)練集特征標(biāo)簽實際值的可用性,采用人在環(huán)的干預(yù),確定單個標(biāo)簽的特定特征空間。對于共享特征空間的確定,基于經(jīng)典的兩階段訓(xùn)練過程[20],將第一階段的預(yù)測值作為附加特征擴展到原始特征空間,強化特定特征和單個標(biāo)簽之間的相關(guān)性。

訓(xùn)練過程如下:

4)訓(xùn)練模型fq,數(shù)據(jù)從輸入層通過隱層沿一個方向?qū)⒂嬎愠龅妮敵鰝鬟f到下一層,直到輸出層;在輸出層將這些計算用于反向傳播算法,根據(jù)誤差最小化的原理,采用SDG隨機梯度下降優(yōu)化器來推導(dǎo)每個特征權(quán)重參數(shù),確定下降方向,并更新每個權(quán)重參數(shù)[21]。優(yōu)化算法如下:

算法1:模型參數(shù)優(yōu)化算法輸入:訓(xùn)練數(shù)據(jù)集D′j;回歸模型fq;特征數(shù)t輸出:特征權(quán)重ωj1,…ωjt 1. initial X′TR02.g0(X′TR0)=fq(X′TR0;Yj)(3)3. fori←1 to t do4. comput ωjt=-[δl(Yj,gt-1(X′TRt-1))δgt-1(X′TRt-1)](4)5. giX′TRt()=func(fq(X′TRt;ωjt))=gt-1(X′TRt-1)+fq(X′TR;ωjt) (5)6. end for

其中,fq是回歸函數(shù),作為機器學(xué)習(xí)的基學(xué)習(xí)器,公式(3)g0(X′TR0)表示采用基學(xué)習(xí)器在輸入空間X′TR0中對目標(biāo)Yj進行學(xué)習(xí)的預(yù)測值。公式(4)求出當(dāng)前模型的權(quán)重梯度值,并將梯度值作為殘差估計,其中l(wèi)是添加L1范式正則化(Regularization)的均方誤差損失函數(shù)。添加L1范式正則化的損失函數(shù)l計算公式如下:

l=l0+λ∑ω|ω|

(6)

其中,l0為原始平方誤差損失函數(shù),ω為權(quán)重,λ為正則化參數(shù),對權(quán)重的取值增加了限制。正則化的目的是使模型稀疏化,將無關(guān)特征的系數(shù)估計(Coefficient Estimate)朝0的方向進行約束、調(diào)整或縮小。

5)將殘差估計作為目標(biāo),根據(jù)式(5)利用梯度值對模型進行更新,并作為下一輪迭代的目標(biāo)。

3.4 基于折交叉驗證的模型評價

常用的回歸預(yù)測指標(biāo)包括平均絕對誤差(Mean Absolute Error,MAE)、平均絕對百分比誤差(Mean Absolute Percentage Error,MAPE)、均方誤差(Mean Square Error,MSE)、均方根誤差(Relative Root Mean-Squared Error,RRMSE)等,降低這些誤差將意味著模型的預(yù)測結(jié)果更精確[22]。以均方根誤差(RRMSE)為例,計算公式如下:

(7)

3.5 基于訓(xùn)練模型的特征輸出

根據(jù)模型綜合評價,選擇擬合效果較好的回歸預(yù)測模型。該模型輸入控制層的特征權(quán)重代表了特征參與模型的程度,按照對應(yīng)權(quán)重大小進行排序并輸出。

同時,為了更好地保留實驗因素的軍事價值,可進一步結(jié)合軍事經(jīng)驗,基于定性分析和判斷,對實驗因素進行適當(dāng)?shù)难a充。

4 實例:某作戰(zhàn)樣式“立體投送”行動仿真實驗因素篩選

以某作戰(zhàn)樣式“立體投送”行動為背景,對本文所提方法進行可行性、有效性驗證。

4.1 仿真預(yù)實驗設(shè)計

該行動中,紅方的作戰(zhàn)目的是盡快利用火力壓制藍方,并綜合利用平面、空中、超越等多種投送方式將兵力投送至藍方陸地,同時,綠方以低、中、高三種強度進行干預(yù)。整個過程中追求戰(zhàn)損盡可能小,投送成功率盡可能高,同時上陸兵力能夠在一定時間內(nèi)完成固守任務(wù)。

上述行動構(gòu)想涉及多類裝備平臺、多支作戰(zhàn)力量以及多種行動指令,實驗因素較多,仿真實驗易陷入維度爆炸問題,需要對實驗因素進行重要程度排序,忽略部分次要因素?;趯娛聠栴}的理解和經(jīng)驗進行定性分析,初步篩選49個實驗因素,設(shè)計1個基準(zhǔn)想定,29個焦點實驗想定,實施仿真預(yù)實驗。預(yù)實驗的參數(shù)設(shè)置如表1所示。

表1 仿真實驗參數(shù)表Tab.1 Simulation experiment parameters

采集到的仿真預(yù)實驗結(jié)果包含620條樣本數(shù)據(jù),來自620次仿真實驗,每條樣本由輸入輸出兩部分組成,一是預(yù)實驗的實驗因素([24,21,4])和過程數(shù)據(jù)([24,21,4])形成的X的24*6矩陣,二是結(jié)果分值數(shù)據(jù)Y。對其進行整理,形成多標(biāo)簽學(xué)習(xí)的訓(xùn)練集。如下:

n=620

(8)

(9)

(10)

4.2 網(wǎng)絡(luò)構(gòu)建、訓(xùn)練和評估

基于Pythorch深度學(xué)習(xí)環(huán)境搭建8層全連接神經(jīng)網(wǎng)絡(luò)。包括:輸入控制層1層,relu激活層和liner全連接層各3層,輸出層1層。以仿真預(yù)實驗的數(shù)據(jù)樣本為訓(xùn)練數(shù)據(jù)集,采用SDG優(yōu)化器、MSELoss損失函數(shù)(L1正則化),按照學(xué)習(xí)率lr=0.01、Epochs=500、Batchsize=8的參數(shù)訓(xùn)練該網(wǎng)絡(luò)。訓(xùn)練過程的收斂曲線、MAE曲線、MAPE曲線、RRMSE曲線如圖2所示。

圖2 模型訓(xùn)練收斂曲線及模型評價曲線Fig.2 Model training convergence curve and model evaluation curve

4.3 實驗因素的篩選確定

在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練學(xué)習(xí)過程中,模型控制層的特征權(quán)重參數(shù)經(jīng)過了sigmoid激活函數(shù)進行轉(zhuǎn)換,采取特征熱圖進行輸出。圖3所示為Epoch=499的特征熱圖,將該圖對應(yīng)于樣本集X的24*6矩陣,對特征權(quán)重由大到小進行排序。

圖3 特征集熱圖Fig.3 Feature heat map

選擇排名靠前的12個特征,包括綠方兩型戰(zhàn)斗機數(shù)量、某型登陸艦數(shù)量、某型戰(zhàn)斗機數(shù)量、某型護衛(wèi)艦數(shù)量、某型武裝直升機數(shù)量、各集群出發(fā)時間、空中輸送編隊飛行速度等。

為確保對重點關(guān)注的投送實驗因素考慮得更加全面充分,我們結(jié)合軍事經(jīng)驗,補充了運輸直升機高度、固定翼運輸機高度和登陸艦速度三型投送平臺的3個實驗因素。

最終從原始的49個實驗因素中選定關(guān)鍵實驗因素15個。

4.4 實驗結(jié)果評估與分析

從模型預(yù)測性能、特征集有效性兩方面進行實驗評估,并對實驗結(jié)果進行定性分析。

1)預(yù)測性能評估

以RRMSE值為指標(biāo)評估預(yù)測性能。對本文算法、SST(Stacked Single Target,單目標(biāo)堆疊)、SVRCC(SVR-correlation Chains,支持向量回歸鏈)共3種算法,分別計算RRMSE值,對比結(jié)果如表2所示。可以看出,由于該算法添加了人工的特定特征分組,在預(yù)測性能上有一定的優(yōu)勢,但差異不明顯,三種算法均能夠得到較好的預(yù)測性能。

表2 RRMSE值對比Tab.2 Comparison of RRMSE values

2)特征集有效性評估

以篩選的實驗因素為變量,更改變量取值為0,加載模型重新計算預(yù)測值,并與模型標(biāo)簽結(jié)果進行比較,計算RRMSE為0.713,遠大于實驗的0.32。隨后利用統(tǒng)計檢驗的Wilcoxon signed rank test[23]在顯著水平α=0.05上進行檢驗。提出假設(shè)新計算的預(yù)測值與均值等價,無顯著差異。結(jié)果如表3所示。從表中得到p<0.05,假設(shè)不成立,前后計算均值不等,說明標(biāo)簽特征的有效性。

表3 Wilcoxon signed rank test檢驗結(jié)果Tab.3 Wilcoxon signed rank test results

3)結(jié)果定性分析

對實驗結(jié)果進行定性分析,可以發(fā)現(xiàn),實驗因素的篩選與客觀實際情況較為吻合。

首先,選擇的實驗因素有如下特點:一是作戰(zhàn)行動中奪權(quán)的關(guān)鍵節(jié)點,如某型護衛(wèi)艦、某型戰(zhàn)斗機的數(shù)量,作為對抗藍方反艦導(dǎo)彈及對地戰(zhàn)機等武器的主要平臺,如果護衛(wèi)艦、戰(zhàn)斗機數(shù)量不足的話,將很難迅速壓制藍方對海、對空力量。二是作戰(zhàn)行動中敵重點目標(biāo),如某型登陸艦數(shù)量,作為主要的投送平臺,該艦受敵火力威脅嚴(yán)重,生存率極低。三是靈敏度較高的因素,如綠方介入強度,高、中、低三種強度輸入對結(jié)果的輸出影響大。當(dāng)綠方高強度即直接提供空海力量介入時,紅方損失大幅度提高,若綠方僅提供低強度電子干擾,對紅方造成的損傷有限,與基準(zhǔn)想定相比,并無太大區(qū)別。

同時,我們主觀上認(rèn)為較為關(guān)鍵的一些因素,如水雷數(shù)量,某型導(dǎo)彈、火箭炮數(shù)量,甚至投送比例等,并沒有被選定為關(guān)鍵因素。通過分析,也有一定啟示,例如,通過對某型導(dǎo)彈數(shù)量的實驗分析發(fā)現(xiàn),由于某型護衛(wèi)艦對其攔截成功率極高,削弱了其在仿真結(jié)果中的重要程度;某型火箭炮,我們認(rèn)為其對紅方登陸部隊和水面艦艇威脅極大,但由于其開火特點,位置暴露較快,一輪開火后,很快就會被紅方升空的作戰(zhàn)平臺鎖定,因此在紅方掌握了制空權(quán)的條件下,其數(shù)量對行動影響較為有限。

5 結(jié)束語

結(jié)合定性分析和定量計算,本文提出了基于多標(biāo)簽學(xué)習(xí)特征選擇的實驗因素篩選方法,并以某作戰(zhàn)樣式“立體投送”行動的仿真實驗因素篩選為實例進行實驗驗證。實驗結(jié)果表明:該方法能夠聚焦探索性仿真實驗?zāi)康?利用深度神經(jīng)網(wǎng)絡(luò)逐層進行學(xué)習(xí),并在多標(biāo)簽學(xué)習(xí)過程中完成實驗因素的選擇。經(jīng)篩選的實驗因素在一定程度上客觀,且與作戰(zhàn)行動現(xiàn)實情況吻合。

猜你喜歡
特征選擇標(biāo)簽特征
如何表達“特征”
不忠誠的四個特征
無懼標(biāo)簽 Alfa Romeo Giulia 200HP
車迷(2018年11期)2018-08-30 03:20:32
不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
海峽姐妹(2018年3期)2018-05-09 08:21:02
抓住特征巧觀察
Kmeans 應(yīng)用與特征選擇
電子制作(2017年23期)2017-02-02 07:17:06
標(biāo)簽化傷害了誰
聯(lián)合互信息水下目標(biāo)特征選擇算法
基于多進制查詢樹的多標(biāo)簽識別方法
計算機工程(2015年8期)2015-07-03 12:20:27
基于特征選擇和RRVPMCD的滾動軸承故障診斷方法
澎湖县| 普宁市| 景泰县| 巴彦县| 元朗区| 湖南省| 永德县| 灵丘县| 驻马店市| 阿图什市| 息烽县| 河津市| 辽源市| 金门县| 周口市| 东阿县| 六安市| 凤台县| 牡丹江市| 锦州市| 高清| 永靖县| 雷波县| 冕宁县| 泰州市| 临潭县| 青州市| 西藏| 田林县| 紫云| 农安县| 云南省| 乌拉特中旗| 永泰县| 从江县| 龙泉市| 祁东县| 神农架林区| 台湾省| 拉孜县| 锦屏县|