李 京, 楊根源
(1.海軍航空工程學(xué)院,山東 煙臺(tái) 264001; 2.海軍信息化專(zhuān)家委員會(huì),北京 100073)
目標(biāo)選擇問(wèn)題,是空襲作戰(zhàn)的關(guān)鍵問(wèn)題,直接關(guān)系到戰(zhàn)役乃至戰(zhàn)略企圖的實(shí)現(xiàn),而空襲作戰(zhàn)任務(wù)的完成,則是通過(guò)摧毀被空襲方以重點(diǎn)目標(biāo)為關(guān)節(jié)點(diǎn)所構(gòu)建的目標(biāo)體系才被最終反映出來(lái)。選擇空襲目標(biāo)的過(guò)程是一項(xiàng)復(fù)雜、動(dòng)態(tài)、基于效果的系統(tǒng)控制工程。而現(xiàn)代戰(zhàn)爭(zhēng)中戰(zhàn)場(chǎng)目標(biāo)多、類(lèi)型復(fù)雜、重要程度不一,準(zhǔn)確地選擇空襲目標(biāo),對(duì)指揮員進(jìn)行敵情判斷、兵力部署、定下決心具有重要意義[1]。
本文提出了基于決策樹(shù)的空襲目標(biāo)數(shù)據(jù)挖掘方法,即在建立空襲目標(biāo)選擇指標(biāo)體系的基礎(chǔ)上,利用決策樹(shù)方法對(duì)具體的目標(biāo)數(shù)據(jù)進(jìn)行挖掘,進(jìn)而提取空襲目標(biāo)選擇依據(jù)。
參考美軍目標(biāo)選擇程序和方法的研究[2],空襲目標(biāo)可分為:1)奪取制空權(quán)目標(biāo)系統(tǒng),主要包括防空雷達(dá)系統(tǒng)、空軍基地、地對(duì)空導(dǎo)彈陣地、防空指揮控制系統(tǒng)、高炮陣地、油料倉(cāng)庫(kù)等目標(biāo);2)奪取制信息權(quán)目標(biāo)系統(tǒng),主要包括通信樞紐、通信站、指揮自動(dòng)化系統(tǒng)、計(jì)算機(jī)網(wǎng)絡(luò)中心、電子干擾機(jī)及機(jī)場(chǎng)、雷達(dá)設(shè)備、航空航天偵察地面站等;3)戰(zhàn)略攻擊目標(biāo)系統(tǒng),由各級(jí)指揮機(jī)構(gòu)、電信機(jī)構(gòu)、情報(bào)收集機(jī)構(gòu)、武器和燃料油生產(chǎn)基地、電力設(shè)施、港口、機(jī)場(chǎng)以及武器研究、生產(chǎn)、使用單位等目標(biāo)組成;4)空中遮斷目標(biāo)系統(tǒng),主要包括陸路、海上、空中交通樞紐和驛站等,如公路、鐵路的橋梁、隧道,鐵路樞紐站、軍用和民用機(jī)場(chǎng)、運(yùn)輸工具和修理廠、港口碼頭等;5)空中近距離支援目標(biāo)系統(tǒng),主要的攻擊目標(biāo)是敵方的指揮機(jī)構(gòu)和指揮系統(tǒng)、地面部隊(duì)和武器裝備、火炮陣地等。
在分析了目標(biāo)的分類(lèi)之后,準(zhǔn)確評(píng)定各種不同類(lèi)型目標(biāo)的價(jià)值是進(jìn)行目標(biāo)選擇的基礎(chǔ)。通過(guò)參照目標(biāo)選擇的相關(guān)原則,經(jīng)過(guò)詳細(xì)分析,空襲目標(biāo)價(jià)值的影響因素主要包括:目標(biāo)固有價(jià)值、目標(biāo)與作戰(zhàn)意圖及作戰(zhàn)任務(wù)的一致性、目標(biāo)的威脅程度、目標(biāo)的社會(huì)影響,以及目標(biāo)的易修復(fù)性,其具體含義如表1所示。
表1 目標(biāo)價(jià)值影響因素Table 1 Indexes affecting target value
Netica軟件工具由Norsys Software公司開(kāi)發(fā),是目前應(yīng)用比較成熟的分析軟件,在醫(yī)療、故障診斷等民用領(lǐng)域有著廣泛的應(yīng)用,其核心算法是基于貝葉斯置信網(wǎng)絡(luò)、決策網(wǎng)絡(luò)以及影響診斷。除了自身功能完備外,其最主要的特點(diǎn)就是提供API接口,利用編程工具,可以將其嵌入相關(guān)的軍事決策系統(tǒng)中,為軍事輔助決策提供強(qiáng)有力的支持。本文將利用它產(chǎn)生符合目標(biāo)選擇原則的仿真數(shù)據(jù)。
Netica軟件具有根據(jù)所建立的模型,隨機(jī)產(chǎn)生案例這一功能,可以通過(guò)它獲得需要的樣本數(shù)據(jù)。
1)對(duì)數(shù)據(jù)進(jìn)行概化處理,把數(shù)據(jù)概化到更高層次。針對(duì)數(shù)據(jù)本身的特點(diǎn),將目標(biāo)固有價(jià)值、威脅程度、社會(huì)影響概化為(高,中,低),任務(wù)一致性概化為(吻合,不吻合),目標(biāo)易修復(fù)性概化為(容易,不容易,無(wú)法修復(fù))。
2)通過(guò)對(duì)實(shí)際空襲案例進(jìn)行分析,發(fā)現(xiàn)當(dāng)某一目標(biāo)被確定為打擊目標(biāo)時(shí),其自身固有價(jià)值、社會(huì)影響程度為高的概率比較大,而其威脅程度和易修復(fù)性偏低的概率比較大;而且一般情況下都是與整體作戰(zhàn)任務(wù)相一致。因此,利用Netica軟件構(gòu)造出反映這一原則的貝葉斯網(wǎng)絡(luò)模型,如圖1所示。
圖1中攻擊目標(biāo)為父節(jié)點(diǎn),其他5個(gè)指標(biāo)為子節(jié)點(diǎn)。以固有價(jià)值為例(如表2所示),其條件概率表顯示,當(dāng)目標(biāo)被選定時(shí),其固有價(jià)值為“高”的概率為60.811%,為“中”的概率為 35.135%,為“低”的概率為 4.054%。
3)根據(jù)建立的貝葉斯網(wǎng)絡(luò)模型隨機(jī)產(chǎn)生60個(gè)案例樣本。這些案例樣本的特點(diǎn)是在總體上服從所構(gòu)建的目標(biāo)選擇原則,并存在一定的隨機(jī)性。60個(gè)案例樣本如表3所示。
圖1 基于Netica的目標(biāo)選擇模型Fig.1 Target selection model based on Netica
表2 固有價(jià)值節(jié)點(diǎn)條件概率表Table 2 CPT of inherent value dot
表3 目標(biāo)選擇訓(xùn)練樣本集Table 3 Sample set for target selection training
續(xù)表
[7-8],本文采用ID3算法構(gòu)造決策樹(shù)。
ID3[9]是Quinlan提出的一個(gè)著名決策樹(shù)生成方法,其流程如下:
1)決策樹(shù)中每一個(gè)非葉節(jié)點(diǎn)對(duì)應(yīng)著一個(gè)非類(lèi)別屬性,樹(shù)枝代表這個(gè)屬性的值,一個(gè)葉節(jié)點(diǎn)代表從樹(shù)根到葉節(jié)點(diǎn)之間的路徑對(duì)應(yīng)的記錄所屬的類(lèi)別屬性值;
2)每一個(gè)非葉節(jié)點(diǎn)都將與屬性中最大信息量的非類(lèi)別屬性相關(guān)聯(lián);
3)采用信息增益來(lái)選擇能夠最好地將樣本分類(lèi)的屬性。
該算法使用信息增益來(lái)選擇能夠最好地將樣本分類(lèi)的屬性,即選擇具有最高信息增益的屬性作為當(dāng)前節(jié)點(diǎn)的測(cè)試屬性(即最好的分裂屬性)。信息增益的計(jì)算方法如下。
設(shè)S是s個(gè)數(shù)據(jù)樣本的集合,假定類(lèi)標(biāo)號(hào)屬性具有m個(gè)不同值,定義m個(gè)不同類(lèi)Ci(i=1,2,…,m),設(shè)si是類(lèi)Ci的樣本數(shù),對(duì)一個(gè)給定的樣本分類(lèi)所需的期望信息為
式中,pi為任意樣本屬于Ci的概率。
設(shè)屬性 A 具有 v個(gè)不同值{a1,a2,…,av},則可用屬性 A 將S 劃分為v個(gè)子集{S1,S2,…,Sv},其中,Sj包含S中所有在A上具有值為aj的樣本,若A選作測(cè)試屬性,則這些子集對(duì)應(yīng)于由包含集合S的節(jié)點(diǎn)生長(zhǎng)出來(lái)的分支。設(shè)sij是子集Sj中類(lèi)Ci的樣本數(shù),根據(jù)由A劃分成子集的熵(entropy)為
由此,在A上分支將獲得的信息增益為
考慮到獲得樣本數(shù)量的有限性,一般把采集到的樣本分成兩份,一份進(jìn)行訓(xùn)練,剩下的部分則用作測(cè)試。但是,在有些情況下用作訓(xùn)練的樣本缺乏代表性。比如,某些特殊類(lèi)的樣本可能不在訓(xùn)練樣本中,這樣訓(xùn)練出來(lái)的分類(lèi)器很難準(zhǔn)確運(yùn)行。因此,本文利用10折交叉確認(rèn)法[10](10-fold cross-validation)將 60 個(gè)樣本數(shù)據(jù)平均分成10個(gè)部分,每一份用作測(cè)試,剩余的進(jìn)行樣本訓(xùn)練,這個(gè)過(guò)程一共重復(fù)10次,最終每一部分樣本都有機(jī)會(huì)進(jìn)行測(cè)試。
根據(jù)式(1)~式(4)的信息增益方法,在weka平臺(tái)上進(jìn)行仿真,最終形成的決策樹(shù)如圖2所示。圖中,葉節(jié)點(diǎn)值為null的情況,說(shuō)明在訓(xùn)練樣本集中這種情況未出現(xiàn)過(guò)。
仿真結(jié)果正確的分類(lèi)個(gè)數(shù)為54,正確率為90%;錯(cuò)誤的分類(lèi)個(gè)數(shù)為6,錯(cuò)誤率為10%。詳細(xì)結(jié)果如混淆矩陣(Confusion Matrix)所示。
該矩陣說(shuō)明當(dāng)案例目標(biāo)沒(méi)有被選為攻擊目標(biāo)時(shí),決策樹(shù)模型判斷正確的案例數(shù)為31個(gè),錯(cuò)誤的為3個(gè);當(dāng)目標(biāo)被選為攻擊目標(biāo)時(shí),決策樹(shù)模型判斷正確的案例數(shù)為23個(gè),錯(cuò)誤的為3個(gè)。仿真結(jié)果表明,由表1樣本集訓(xùn)練出來(lái)的決策樹(shù)模型的性能令人滿意。
圖2 對(duì)應(yīng)樣本集的決策樹(shù)Fig.2 Decision tree corresponding to the sample set
生成決策樹(shù)后,從決策樹(shù)的根節(jié)點(diǎn)到任何一個(gè)葉節(jié)點(diǎn)之間所形成的一條路徑就構(gòu)成一條分類(lèi)規(guī)則,該規(guī)則可用IF-THEN形式表示,最后可獲得如下14條規(guī)則:
1)IF任務(wù)一致性=“吻合”AND固有價(jià)值=“低”THEN攻擊目標(biāo)=“否”;
2)IF任務(wù)一致性=“吻合”AND固有價(jià)值=“中”AND威脅度=“高”THEN攻擊目標(biāo)=“否”;
3)IF任務(wù)一致性=“吻合”AND固有價(jià)值=“中”AND威脅度=“中”THEN攻擊目標(biāo)=“是”;
4)IF任務(wù)一致性=“吻合”AND固有價(jià)值=“中”AND威脅度=“低”THEN攻擊目標(biāo)=“是”;
5)IF任務(wù)一致性=“吻合”AND固有價(jià)值=“高”AND威脅度=“低”THEN攻擊目標(biāo)=“是”;
6)IF任務(wù)一致性=“吻合”AND固有價(jià)值=“高”AND威脅度=“中”THEN攻擊目標(biāo)=“是”;
7)IF任務(wù)一致性=“吻合”AND固有價(jià)值=“高”AND威脅度=“高”AND社會(huì)影響=“高”THEN攻擊目標(biāo)=“是”;
8)IF任務(wù)一致性=“吻合”AND固有價(jià)值=“高”AND威脅度=“高”AND社會(huì)影響=“低”THEN攻擊目標(biāo)=“否”;
9)IF任務(wù)一致性=“不吻合”AND易修復(fù)性=“容易”THEN攻擊目標(biāo)=“否”;
10)IF任務(wù)一致性=“不吻合”AND易修復(fù)性=“不容易”THEN攻擊目標(biāo)=“否”;
11)IF任務(wù)一致性=“不吻合”AND易修復(fù)性=“無(wú)法”AND固有價(jià)值=“低”THEN攻擊目標(biāo)=“否”;
12)IF任務(wù)一致性=“不吻合”AND易修復(fù)性=“無(wú)法”AND固有價(jià)值=“高”THEN攻擊目標(biāo)=“是”;
13)IF任務(wù)一致性=“不吻合”AND易修復(fù)性=“無(wú)法”AND固有價(jià)值 =“中”AND威脅度 =“中”THEN攻擊目標(biāo)=“否”;
14)IF任務(wù)一致性=“不吻合”AND易修復(fù)性=“無(wú)法”AND固有價(jià)值 =“中”AND威脅度 =“低”THEN攻擊目標(biāo)=“是”。
對(duì)14條規(guī)則做進(jìn)一步分析,得到以下結(jié)論。
1)對(duì)潛在的打擊目標(biāo)最終能否成為空襲目標(biāo),首先要考慮該目標(biāo)是否與當(dāng)前我方的作戰(zhàn)目的一致。在科索沃戰(zhàn)爭(zhēng)中,北約根據(jù)“五環(huán)”目標(biāo)理論,選擇能重創(chuàng)敵人戰(zhàn)斗力或戰(zhàn)爭(zhēng)潛力的目標(biāo),對(duì)塞族戰(zhàn)略目標(biāo)進(jìn)行打擊,最終取得了在巴爾干的勝利。
2)目標(biāo)的固有價(jià)值是其能否成為空襲目標(biāo)的重要指標(biāo),因此,要詳細(xì)地掌握空襲目標(biāo)的結(jié)構(gòu)和作用機(jī)理,準(zhǔn)確判斷其在敵作戰(zhàn)體系中的地位。如海灣戰(zhàn)爭(zhēng)中,多國(guó)部隊(duì)就將伊拉克化學(xué)工廠、化學(xué)武器庫(kù)及核設(shè)施等對(duì)己方威脅最大,同時(shí)也是能力價(jià)值最大的目標(biāo)作為首先突擊的目標(biāo)。
3)針對(duì)空中打擊的特點(diǎn),空襲目標(biāo)的對(duì)空防御能力是航空兵及導(dǎo)彈部隊(duì)能否順利完成任務(wù)的一個(gè)重要制約因素。如果對(duì)方的防空能力過(guò)于強(qiáng)大,在某些情況下,盡管摧毀目標(biāo)對(duì)作戰(zhàn)進(jìn)程有很大的推動(dòng)作用,但是,考慮到所付出的代價(jià),有可能用其他手段達(dá)到目的。海灣戰(zhàn)爭(zhēng)中,美軍為避免戰(zhàn)損,在突擊防護(hù)嚴(yán)密的巴格達(dá)時(shí),只允許F-117隱身戰(zhàn)斗機(jī)進(jìn)行突擊,另外,所選目標(biāo)從空中搜索識(shí)別的難度不能超過(guò)機(jī)載設(shè)備和人員的能力。
4)信息作戰(zhàn)已成為現(xiàn)代戰(zhàn)爭(zhēng)的主角,而信息戰(zhàn)所涉及的范圍非常廣泛,包含物理域、信息域、認(rèn)知域和社會(huì)域。決策者在選擇空襲目標(biāo)時(shí),要充分考慮打擊所帶來(lái)的更為廣泛的影響。比如在第二次世界大戰(zhàn)中同盟國(guó)與軸心國(guó)之間的戰(zhàn)略轟炸,雙方都力圖通過(guò)大規(guī)模的轟炸摧毀對(duì)方抵抗的意志,縮短戰(zhàn)爭(zhēng)進(jìn)程。但是,由于缺乏對(duì)雙方民眾的了解,轟炸雖然導(dǎo)致了大量的人員傷亡,但是雙方民眾的斗志并未瓦解,某種程度上反而更加堅(jiān)定了戰(zhàn)斗的決心。
5)目標(biāo)的易修復(fù)性有時(shí)容易被人忽略,但如果目標(biāo)容易被修復(fù),則空襲的代價(jià)與獲得的效果將不成比例。朝鮮戰(zhàn)爭(zhēng)美軍發(fā)動(dòng)的“絞殺戰(zhàn)”中,1951年11月至12月對(duì)平壤以北三角鐵路的轟炸最為嚴(yán)重,但是志愿軍搶修鐵路的能力連美國(guó)空軍也無(wú)可奈何地表示嘆服。
6)規(guī)則12)~14)可以這樣解釋?zhuān)?dāng)目標(biāo)與當(dāng)前階段作戰(zhàn)任務(wù)并不一致時(shí),仍將其列為打擊目標(biāo),是因?yàn)閺膽?zhàn)爭(zhēng)全局來(lái)看,打擊該目標(biāo)對(duì)于贏得勝利,達(dá)到作戰(zhàn)目的有一定的幫助,盡管有可能目標(biāo)并不符合局部某一階段的作戰(zhàn)目的。美軍對(duì)于未進(jìn)入打擊目標(biāo)清單的目標(biāo)并不是立即將其刪除,而是將這類(lèi)目標(biāo)分別歸納為暫不打擊、限制打擊和非打擊目標(biāo)清單等,保持對(duì)目標(biāo)的持續(xù)監(jiān)視,待到時(shí)機(jī)成熟將付諸行動(dòng)[2]。
利用決策樹(shù)對(duì)空襲目標(biāo)進(jìn)行分析,有別于以往的目標(biāo)選擇方法。它將空襲目標(biāo)選擇看作是一種數(shù)據(jù)挖掘,并可以直接建立隱含的規(guī)則和知識(shí)。仿真結(jié)果顯示,該決策樹(shù)模型的分類(lèi)合理、準(zhǔn)確度高,可為我指揮人員提供一種輔助決策的新思路。
參考文獻(xiàn)
[1] 李偉,晉華,譚斌.模糊綜合評(píng)判的空襲目標(biāo)選擇[J].武器裝備自動(dòng)化,2008,27(9):25-28.
[2] 隋鑫,毛學(xué)良,趙春三.美軍目標(biāo)選擇程序和方法的研究[J].科技創(chuàng)新導(dǎo)報(bào),2009(18):239.
[3] 劉欣,羅小明.基于綜合集成賦權(quán)法的導(dǎo)彈攻擊目標(biāo)價(jià)值分析[J].指揮控制與仿真,2008,30(2):35-38.
[4] 魯華,周德云.貝葉斯網(wǎng)絡(luò)的對(duì)地多目標(biāo)攻擊決策[J].火力與指揮控制,2008,33(7):54-58.
[5] 劉學(xué)軍.典型目標(biāo)的選擇和突擊武器的選用[J].飛航導(dǎo)彈,2000(12):32-37.
[6] 曹衛(wèi)東,丁建立,劉玉潔.基于貝葉斯網(wǎng)絡(luò)的航班離港延誤預(yù)警分析[J].計(jì)算機(jī)應(yīng)用研究,2008,25(11):3388-3390.
[7] 唐志武,薛青,劉朔.基于決策樹(shù)的裝甲兵登陸突擊仿真試驗(yàn)數(shù)據(jù)挖掘[J].裝甲兵工程學(xué)院學(xué)報(bào),2008,22(1):6-9.
[8] 胡濤.文本分類(lèi)在軍事數(shù)據(jù)分發(fā)中的應(yīng)用[D].重慶:重慶大學(xué),2005:15.
[9] MITCHELL T M.Machine learning[M].NY:McGraw-Hill Science/Engineering/Math,1997:64-75.
[10] WITTEN I H,F(xiàn)RANK E.Data mining[M].San Francisco:Morgan Kaufman Publishers,2005:149-151.