朱 豐,胡曉峰,吳 琳,賀筱媛,楊 璐
(1.國(guó)防大學(xué),北京 100091;2.軍事科學(xué)院,北京 100091;3.解放軍91053部隊(duì),北京 100070;4.空軍工程大學(xué)防空反導(dǎo)學(xué)院,西安 710051)
軍事領(lǐng)域中,戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估(主要包括戰(zhàn)場(chǎng)態(tài)勢(shì)理解和預(yù)測(cè)兩個(gè)層次)是指揮員決策的先決條件,對(duì)于指揮員作出正確決策至關(guān)重要。而其中的態(tài)勢(shì)理解是重中之重,因?yàn)閼B(tài)勢(shì)理解是預(yù)測(cè)的前提,沒(méi)有深刻、準(zhǔn)確、高效的態(tài)勢(shì)理解將無(wú)言預(yù)測(cè),更談不上指揮決策。為了有效地進(jìn)行戰(zhàn)場(chǎng)態(tài)勢(shì)理解,僅靠指揮員的個(gè)人能力已難以滿(mǎn)足要求,需要借助其他手段輔助指揮員來(lái)完成此項(xiàng)任務(wù)。當(dāng)前,以人工智能為基礎(chǔ)的智能化處理技術(shù)是輔助指揮員進(jìn)行戰(zhàn)場(chǎng)態(tài)勢(shì)理解最有效的手段之一[1]。
然而,隨著高新技術(shù)的不斷發(fā)展和進(jìn)步,當(dāng)今社會(huì)已步入了信息化大數(shù)據(jù)時(shí)代。戰(zhàn)場(chǎng)態(tài)勢(shì)中蘊(yùn)含著大量的不確定因素和非線(xiàn)性復(fù)雜信息,具有很多涌現(xiàn)性特征,態(tài)勢(shì)數(shù)據(jù)也呈現(xiàn)出了典型的大數(shù)據(jù)“4V”特性[2-3]。此時(shí),戰(zhàn)場(chǎng)態(tài)勢(shì)這個(gè)復(fù)雜系統(tǒng)更為復(fù)雜。而傳統(tǒng)基于線(xiàn)性理論的一些智能化戰(zhàn)場(chǎng)態(tài)勢(shì)理解方法已無(wú)法滿(mǎn)足當(dāng)前的任務(wù)需求,致使指揮員以及目前的智能輔助決策系統(tǒng)都難以迅速給出可靠的結(jié)果,嚴(yán)重影響了作戰(zhàn)效果??梢园l(fā)現(xiàn),人工智能的研究水平,特別是能夠模擬指揮員思維模式,適用于大數(shù)據(jù)復(fù)雜系統(tǒng)的人工智能研究水平,成為了制約戰(zhàn)場(chǎng)態(tài)勢(shì)理解技術(shù)發(fā)展的瓶頸問(wèn)題。因此,如何突破關(guān)鍵技術(shù),實(shí)現(xiàn)信息化大數(shù)據(jù)時(shí)代下有效的戰(zhàn)場(chǎng)態(tài)勢(shì)智能化理解,亟需進(jìn)一步探索研究。
眾所周知,智能主要包括計(jì)算智能、感知智能和認(rèn)知智能,這三種智能體現(xiàn)了從低級(jí)到高級(jí)的層次。作為認(rèn)知智能中的典型代表——深度學(xué)習(xí),是2006年才提出的一個(gè)新研究領(lǐng)域[4-7],它起源于人工智能中的一種典型技術(shù)——人工神經(jīng)網(wǎng)絡(luò),本質(zhì)上是模擬了人腦分析學(xué)習(xí)的過(guò)程,因而具備了多層感知的深度網(wǎng)絡(luò)模型??偟膩?lái)講,深度學(xué)習(xí)具有強(qiáng)大的非線(xiàn)性處理能力,逐層理解、自動(dòng)分析提取的結(jié)構(gòu),良好的“記憶”性質(zhì)等獨(dú)特優(yōu)勢(shì),目前已被譽(yù)為最接近人腦的智能學(xué)習(xí)方法。它不僅在語(yǔ)音識(shí)別、圖像處理、視覺(jué)處理、自然語(yǔ)言處理等方面取得了突破性的進(jìn)展,更在強(qiáng)烈依賴(lài)態(tài)勢(shì)感知和評(píng)估的自動(dòng)駕駛、電腦游戲、圍棋等方面展現(xiàn)出超強(qiáng)的能力。因此,深度學(xué)習(xí)的提出可為突破大數(shù)據(jù)戰(zhàn)場(chǎng)態(tài)勢(shì)智能化理解中的關(guān)鍵問(wèn)題提供寶貴的契機(jī)。
進(jìn)一步分析,為了能使基于深度學(xué)習(xí)的戰(zhàn)場(chǎng)態(tài)勢(shì)理解結(jié)果能與指揮員的思維結(jié)果一致,就需要研究探討指揮員戰(zhàn)場(chǎng)態(tài)勢(shì)理解思維過(guò)程模擬方法,這是本文研究工作的初衷所在。從公開(kāi)發(fā)表的文獻(xiàn)來(lái)看,目前態(tài)勢(shì)評(píng)估中指揮員的評(píng)估過(guò)程和技能并沒(méi)有明確的公認(rèn)結(jié)論。文獻(xiàn)[8]研究分析了指揮員在戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估時(shí)的一些應(yīng)用框架,基于專(zhuān)家意見(jiàn)給出了三種針對(duì)不同目標(biāo)的指揮員態(tài)勢(shì)評(píng)估方法步驟,這些方法各有側(cè)重,并沒(méi)有很好地達(dá)成一致。文獻(xiàn)[9]在分析了ATR-C框架的基礎(chǔ)上,提出了分層次的指揮員戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估模型,并利用OTB(Onesaf Testbed Baseline)仿真測(cè)試環(huán)境展開(kāi)了相關(guān)實(shí)驗(yàn),驗(yàn)證了分層次評(píng)估模型的有效性。依據(jù)文獻(xiàn)[9]的結(jié)論并通過(guò)調(diào)研作戰(zhàn)時(shí)指揮員的思維情況,可以認(rèn)為,指揮員進(jìn)行戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估通常是分層次、分階段的。其中的高級(jí)理解階段的模擬則需要利用認(rèn)知智能特別是深度學(xué)習(xí)來(lái)完成。本文就此展開(kāi)相關(guān)探索性工作,一是概述了戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估的相關(guān)概念。二是分析了指揮員理解戰(zhàn)場(chǎng)態(tài)勢(shì)時(shí)的思維模式,以掌握指揮員戰(zhàn)場(chǎng)態(tài)勢(shì)理解的主要步驟。在此基礎(chǔ)上,結(jié)合深度學(xué)習(xí),研究了基于深度學(xué)習(xí)的指揮員戰(zhàn)場(chǎng)態(tài)勢(shì)高級(jí)理解思維過(guò)程(以判斷敵方對(duì)我方可能的主攻方向?yàn)槔┠M方法,為開(kāi)展戰(zhàn)場(chǎng)態(tài)勢(shì)智能評(píng)估分析、輔助決策等研究工作奠定重要基礎(chǔ)。
戰(zhàn)場(chǎng)態(tài)勢(shì)是指作戰(zhàn)雙方各要素(主要包括兵力部署情況、裝備情況、地理環(huán)境、天氣條件等等)的狀態(tài)、變化與發(fā)展趨勢(shì)[1]。那么,何為戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估?美國(guó)國(guó)防部實(shí)驗(yàn)室聯(lián)席理事會(huì)(Joint Directors Laboratory,JDL)提出了分層多級(jí)的戰(zhàn)場(chǎng)信息模型和相對(duì)公認(rèn)的戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估的定義。美國(guó)JDL模型中,將戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估描述為:在戰(zhàn)場(chǎng)一級(jí)數(shù)據(jù)(即為對(duì)戰(zhàn)場(chǎng)上目標(biāo)位置和身份等的估計(jì))融合處理的基礎(chǔ)上,建立的關(guān)于作戰(zhàn)活動(dòng)、事件、時(shí)間、位置和兵力要素等組織形式的一張多重視圖,它將所觀測(cè)到的戰(zhàn)斗力量分布與活動(dòng)和戰(zhàn)場(chǎng)周?chē)h(huán)境、敵作戰(zhàn)意圖及敵機(jī)動(dòng)性等有機(jī)地聯(lián)系起來(lái),識(shí)別已發(fā)生的事件和計(jì)劃,得到對(duì)敵方兵力結(jié)構(gòu)、部署、行動(dòng)方向與路線(xiàn)的估計(jì)結(jié)果,指出敵軍的行為模式,推斷出敵軍的意圖,作出對(duì)當(dāng)前戰(zhàn)場(chǎng)情景的合理解釋?zhuān)礊閼?zhàn)場(chǎng)態(tài)勢(shì)理解,并對(duì)臨近時(shí)刻的態(tài)勢(shì)變化作出預(yù)測(cè),即為戰(zhàn)場(chǎng)態(tài)勢(shì)預(yù)測(cè),最終形成戰(zhàn)場(chǎng)綜合態(tài)勢(shì)圖,為指揮員進(jìn)行決策提供有力的輔助支持,JDL態(tài)勢(shì)評(píng)估模型圖如圖1所示。可見(jiàn),戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估主要包括戰(zhàn)場(chǎng)態(tài)勢(shì)理解和預(yù)測(cè)兩大部分,其中的態(tài)勢(shì)理解是至關(guān)重要的環(huán)節(jié)。
經(jīng)考證得知,通常指揮員都是分階段、分層次地進(jìn)行戰(zhàn)場(chǎng)態(tài)勢(shì)理解,主要體現(xiàn)為:初級(jí)理解和高級(jí)理解2個(gè)步驟,如圖2所示。
依據(jù)這2個(gè)主要步驟,以戰(zhàn)場(chǎng)態(tài)勢(shì)理解中判斷敵方對(duì)我方可能的主攻方向?yàn)槔⒅笓]員思維過(guò)程模型。
1)初級(jí)理解,即對(duì)于已完成位置、身份、關(guān)聯(lián)關(guān)系等的估計(jì)和數(shù)據(jù)的一致性融合而獲得的各個(gè)戰(zhàn)場(chǎng)目標(biāo)信息,結(jié)合軍事領(lǐng)域相關(guān)知識(shí)和指揮員的經(jīng)驗(yàn),通過(guò)一定的思考,將各個(gè)戰(zhàn)場(chǎng)目標(biāo)進(jìn)行抽象處理并聚合成一些作戰(zhàn)單元,并從空間分布角度展開(kāi)研究,從而提煉為圖像矩陣,矩陣中的每個(gè)元素即為圖像的像素,通過(guò)區(qū)分不同像素值來(lái)區(qū)分各方的作戰(zhàn)單元及背景圖像,同時(shí),劃定戰(zhàn)場(chǎng)中的感興趣區(qū)域U(半徑約為R),并選出U內(nèi)的敵、我雙方不同作戰(zhàn)單元。
2)高級(jí)理解,即仍然要結(jié)合軍事領(lǐng)域相關(guān)知識(shí)和指揮員的經(jīng)驗(yàn),通過(guò)一定的深入思考來(lái)判斷敵方集結(jié)區(qū)域,我方的重要目標(biāo)所在位置,以及敵方的主要作戰(zhàn)方向。具體如下。
第1步,利用求解最優(yōu)化模型獲得敵方的集結(jié)區(qū)域。一般而言,敵方集結(jié)區(qū)域是以某點(diǎn)為中心而開(kāi)展,該集結(jié)中心到各個(gè)作戰(zhàn)實(shí)體的距離應(yīng)盡可能小以更有利于通信和指揮。假設(shè)感興趣區(qū)域內(nèi)敵方有N個(gè)作戰(zhàn)單元(假設(shè)敵方作戰(zhàn)單元與作戰(zhàn)實(shí)體的空間分布密度一致),對(duì)應(yīng)坐標(biāo)分別為,集結(jié)區(qū)域V,半徑為R0,中心坐標(biāo)為(x0,y0),通過(guò)求解如下最優(yōu)化問(wèn)題來(lái)獲得(x0,y0),集結(jié)區(qū)域直徑與感興趣區(qū)域半徑大致相等。
第2步,利用求解最優(yōu)化模型估計(jì)出我方的重要目標(biāo)區(qū)域。一般而言,我方重要目標(biāo)所在位置的臨近區(qū)域內(nèi)實(shí)體數(shù)量最多,密度較大,以更有利于提高重要目標(biāo)的有效生存率。假設(shè)感興趣區(qū)域內(nèi)U我方有N'個(gè)作戰(zhàn)單元(假設(shè)我方作戰(zhàn)單元與作戰(zhàn)實(shí)體的空間分布密度一致),對(duì)應(yīng)坐標(biāo)分別為,,重要目標(biāo)位置坐標(biāo)為,臨近區(qū)域V'半徑為R'0,V'內(nèi)含有M'個(gè)我方作戰(zhàn)單元,對(duì)應(yīng)坐標(biāo)分別為,通過(guò)求解如下最優(yōu)化問(wèn)題來(lái)獲得,即
第3步,將敵方作戰(zhàn)實(shí)體集結(jié)位置與我方重要目標(biāo)所在位置連成趨勢(shì)線(xiàn),即為敵方對(duì)我方可能的主攻方向,直線(xiàn)表達(dá)如下公式,方向?yàn)閺?,并以箭頭標(biāo)出。
依據(jù)指揮員戰(zhàn)場(chǎng)態(tài)勢(shì)理解思維過(guò)程和深度學(xué)習(xí)運(yùn)行原理[10],本文提出指揮員戰(zhàn)場(chǎng)態(tài)勢(shì)高級(jí)理解思維過(guò)程深度學(xué)習(xí)模擬方法。
以深度學(xué)習(xí)中經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network,CNN)為例[11],論述利用認(rèn)知智能模擬指揮員戰(zhàn)場(chǎng)態(tài)勢(shì)高級(jí)理解思維過(guò)程。CNN具有強(qiáng)大的圖像處理、圖像信息提取等方面的優(yōu)勢(shì),更有利于分析戰(zhàn)場(chǎng)態(tài)勢(shì)圖像中各作戰(zhàn)單元的空間分布和相關(guān)特征,從而得出理解結(jié)果[12]。基于CNN的指揮員戰(zhàn)場(chǎng)態(tài)勢(shì)高級(jí)理解思維過(guò)程模擬方法運(yùn)行的主要原理是,利用CNN網(wǎng)絡(luò)中以卷積函數(shù)為基礎(chǔ)的非線(xiàn)性表達(dá)能力,依據(jù)指揮員的主觀知識(shí)和經(jīng)驗(yàn),通過(guò)擬合過(guò)程建立一個(gè)從態(tài)勢(shì)特征圖像矩陣到指揮員高級(jí)理解結(jié)果的非線(xiàn)性映射,以得到高級(jí)理解結(jié)果,從而達(dá)到模擬指揮員戰(zhàn)場(chǎng)態(tài)勢(shì)高級(jí)理解的目的,具體論述如下。事實(shí)上,這個(gè)擬合過(guò)程很復(fù)雜,具體復(fù)雜程度主要與指揮員進(jìn)行態(tài)勢(shì)理解判別時(shí)的復(fù)雜程度密切相關(guān)。
假設(shè)戰(zhàn)場(chǎng)態(tài)勢(shì)圖像矩陣SA×B,該矩陣表示在戰(zhàn)場(chǎng)平面上南北LMkm寬、東西LNkm寬范圍內(nèi)的敵我雙方各作戰(zhàn)單元地理分布情況,SA×B中共有A×B個(gè)元素,每個(gè)元素為圖像的像素,取值為[0,255]內(nèi)的整數(shù)值,A為緯度方向上的像素個(gè)數(shù),B為經(jīng)度方向上的像素個(gè)數(shù),可知
其中,DAkm、DBkm分別為緯度、經(jīng)度分辨率。
對(duì)圖像矩陣SA×B進(jìn)行綜合處理流程如圖4所示。
其中的歸一化預(yù)處理是為了適合深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練需要統(tǒng)一單位量綱,具體如下。對(duì)圖像矩陣SA×B的所有元素,進(jìn)行歸一化,處理過(guò)程如下公式
其中,
對(duì)圖像矩陣SA×B進(jìn)行矩陣卷積運(yùn)算,即
其中,F(xiàn)core為卷積核函數(shù),通常為階矩陣,即
對(duì)卷積結(jié)果 S'A'×B'進(jìn)行池化運(yùn)算,即
值得注意的是:卷積核的個(gè)數(shù)以及卷積、池化運(yùn)算次數(shù)與戰(zhàn)場(chǎng)態(tài)勢(shì)高級(jí)理解的復(fù)雜度密切相關(guān)。
指標(biāo)標(biāo)簽可通過(guò)計(jì)算敵方主攻方向直線(xiàn)的斜率,并將斜率值歸類(lèi)到東、東南、南、西南、西、西北、北、東北這8個(gè)方向角度,從而設(shè)計(jì)出標(biāo)簽,即,
{東、東南、南、西南、西、西北、北、東北}=
{00000001,00000010,00000100,00001000,
00010000,00100000,01000000,10000000}
輸出層分類(lèi)器即邏輯分類(lèi),用sigmoid函數(shù)組(即8個(gè)sigmoid函數(shù)),每個(gè)sigmoid函數(shù)表達(dá)式為:
可利用0.5為分界值,當(dāng)P(x)≥0.5時(shí),標(biāo)簽值為 1,當(dāng) P(x)<0.5 時(shí),標(biāo)簽值為 0。
假設(shè)一個(gè)戰(zhàn)場(chǎng)環(huán)境,首先,通過(guò)對(duì)戰(zhàn)場(chǎng)目標(biāo)的抽象、聚合從而提煉獲得圖像矩陣,并節(jié)選出一個(gè)感興趣區(qū)域-1,如圖6所示。通過(guò)判斷得出敵我雙方相對(duì)位置為敵右我左,然后進(jìn)行假設(shè)感興趣區(qū)域-1中敵、我雙方各有50個(gè)作戰(zhàn)單元(黃色代表我方、藍(lán)色代表敵方),我方、敵方作戰(zhàn)單元像素值分別為100、200,戰(zhàn)場(chǎng)背景像素值為0,利用式(1)~式(3)可得出敵方的集結(jié)區(qū)域、我方的重要目標(biāo)區(qū)域以及敵方對(duì)我方的主攻方向,分別用藍(lán)色圓圈、紅色圓圈和帶箭頭的藍(lán)色直線(xiàn)標(biāo)出,如圖7所示,可進(jìn)一步得出敵方對(duì)我方的主攻方向?yàn)槲鞅?,因此,?biāo)簽寫(xiě)為“00100000”。為更充分地表達(dá)樣本的選取情況,在戰(zhàn)場(chǎng)環(huán)境中再選出一個(gè)感興趣區(qū)域-2,如圖8所示,通過(guò)計(jì)算可得出相關(guān)標(biāo)記(如圖9所示)以及此情況下敵方對(duì)我方的主攻方向?yàn)槲髂?,?biāo)簽寫(xiě)為“00001000”。由此,本文構(gòu)造了帶標(biāo)簽的訓(xùn)練和測(cè)試樣本分別為60萬(wàn)個(gè)和10萬(wàn)個(gè)。
利用本文方法,首先對(duì)抽象成的圖像矩陣做歸一化處理,即得到預(yù)處理后的樣本數(shù)據(jù)集,并匹配上相應(yīng)的標(biāo)簽。再利用認(rèn)知智能中深度學(xué)習(xí)方法進(jìn)行訓(xùn)練和測(cè)試,每次迭代中的卷積和池化運(yùn)算為2組,第1、2組中卷積運(yùn)算的卷積核分別為6、12個(gè),誤差反向傳播算法用梯度下降法。圖10、圖11分別給出了訓(xùn)練終止誤差、正確識(shí)別率隨迭代次數(shù)的變化曲線(xiàn)。從圖中可以看出,隨著迭代次數(shù)的不斷增加,訓(xùn)練終止誤差不斷降低、正確識(shí)別率不斷提高,當(dāng)訓(xùn)練從1代到10代時(shí),正確識(shí)別率從70.91%到75.72%,基本在70%多的數(shù)量級(jí),誠(chéng)然,這個(gè)結(jié)果與樣本數(shù)量、訓(xùn)練中的迭代次數(shù)、卷積、池化運(yùn)算次數(shù)等都有關(guān),但已可以證明本文方法的有效性。
本文著眼于當(dāng)今信息化時(shí)代大數(shù)據(jù)條件下的軍事需求,探索研究了基于深度學(xué)習(xí)的指揮員戰(zhàn)場(chǎng)態(tài)勢(shì)高級(jí)理解思維過(guò)程模擬方法。概述了戰(zhàn)場(chǎng)態(tài)勢(shì)評(píng)估(主要包括戰(zhàn)場(chǎng)態(tài)勢(shì)理解和預(yù)測(cè))的相關(guān)概念;分析了指揮員理解戰(zhàn)場(chǎng)態(tài)勢(shì)的思維模式,以掌握指揮員理解戰(zhàn)場(chǎng)態(tài)勢(shì)時(shí)的主要步驟。在此基礎(chǔ)上,結(jié)合深度學(xué)習(xí),提出了一種基于深度學(xué)習(xí)的指揮員戰(zhàn)場(chǎng)態(tài)勢(shì)高級(jí)理解思維過(guò)程(以判斷敵方對(duì)我方可能的主攻方向?yàn)槔┠M方法,針對(duì)方法中相關(guān)要素的設(shè)計(jì)問(wèn)題,本文以CNN為例設(shè)計(jì)了帶標(biāo)簽的樣本集構(gòu)建流程、深度學(xué)習(xí)網(wǎng)絡(luò)的訓(xùn)練流程等。仿真結(jié)果表明,本文方法模擬的正確率可達(dá)到75.72%,證明了本文方法的有效性。本文工作僅是對(duì)于基于深度學(xué)習(xí)的指揮員戰(zhàn)場(chǎng)態(tài)勢(shì)高級(jí)理解思維過(guò)程模擬方法的探索性研究,進(jìn)一步的深入工作仍在開(kāi)展,但也可為開(kāi)展指揮員戰(zhàn)場(chǎng)態(tài)勢(shì)理解模擬方面的研究提供新的思路,為開(kāi)展戰(zhàn)場(chǎng)態(tài)勢(shì)智能評(píng)估分析、輔助決策等研究工作奠定基礎(chǔ)。