龔 誠 衣軍波 蔡林恭 余舟川
(91001部隊(duì) 北京 100841)
由于軍事科技的不斷發(fā)展,戰(zhàn)場環(huán)境的復(fù)雜性和信息不對稱性不斷增加,僅憑個人經(jīng)驗(yàn)不能實(shí)時準(zhǔn)確地識別敵方目標(biāo)意圖,因此需要智能識別預(yù)測方法。近年來,學(xué)者們建立了不同的智能模型來研究不同領(lǐng)域的意圖識別問題,在空戰(zhàn)目標(biāo)意圖識別領(lǐng)域,文獻(xiàn)[1]綜合分析了軌跡與戰(zhàn)術(shù)之間的相關(guān)性,利用深度神經(jīng)網(wǎng)絡(luò)對識別單個空中目標(biāo)的作戰(zhàn)意圖。文獻(xiàn)[2]研究了一種在不完備信息條件下基于信息熵的空中目標(biāo)意圖預(yù)測方法,可以對目標(biāo)協(xié)同作戰(zhàn)意圖進(jìn)行有效識別。文獻(xiàn)[3]提出了一種基于不完全信息的LSTM 網(wǎng)絡(luò)的空戰(zhàn)目標(biāo)意圖預(yù)測模型,采用自適應(yīng)矩估計(Adam)優(yōu)化算法來加快目標(biāo)意圖預(yù)測模型的訓(xùn)練,有效解決了局部優(yōu)化問題。文獻(xiàn)[4]利用目標(biāo)信息特征集合以及戰(zhàn)場目標(biāo)的作戰(zhàn)屬性與對抗?fàn)顟B(tài)間的聯(lián)系性,建立模糊推理模型和模糊推理規(guī)則識別目標(biāo)意圖。文獻(xiàn)[5]利用專家先驗(yàn)知識構(gòu)建聯(lián)合貝葉斯網(wǎng)絡(luò)識別模型來識別目標(biāo)戰(zhàn)術(shù)意圖。雖然上述方法對目標(biāo)常規(guī)戰(zhàn)術(shù)意圖識別有較好的效果,但無法有效解決復(fù)雜戰(zhàn)場環(huán)境下的目標(biāo)意圖識別問題。另外,在分類器中加入不同線性度和相關(guān)度的特征會降低一些標(biāo)簽的識別率,影響模型的可解釋性。在車輛駕駛員制動意圖識別領(lǐng)域,不同類型的神經(jīng)網(wǎng)絡(luò)通過學(xué)習(xí)累積樣本數(shù)據(jù)來提高意圖識別的準(zhǔn)確性[6~7]。SVM 用于提取低相關(guān)參數(shù)的特征,然后將提取的結(jié)果和高相關(guān)特征用于數(shù)據(jù)挖掘,進(jìn)一步提高了車輛駕駛員制動意圖識別的準(zhǔn)確性[8]。在用戶意圖識別領(lǐng)域,文獻(xiàn)[9]提出了一種啟用自動編碼器和基于k-means聚類(AKMC)的方法來識別潛在用戶,在仿真實(shí)驗(yàn)中,該方法的準(zhǔn)確率達(dá)到了80%以上。文獻(xiàn)[10]提出了一種雙向網(wǎng)格長短期記憶RNN 框架,用于提高用戶意圖識別的效率。通過綜合分析上述研究成果,學(xué)者們普遍使用機(jī)器學(xué)習(xí)來解決意圖識別問題,所選參數(shù)特征的相關(guān)性和完整性是影響識別結(jié)果準(zhǔn)確性的關(guān)鍵因素。然而這些研究并未能夠充分考慮戰(zhàn)場因素之間的關(guān)聯(lián)性,在復(fù)雜戰(zhàn)場環(huán)境下意圖識別的準(zhǔn)確性不高。
因此,本文利用知識圖譜嵌入學(xué)習(xí)技術(shù),通過目標(biāo)意圖知識圖譜來組織多源異類戰(zhàn)場情報數(shù)據(jù),構(gòu)建目標(biāo)活動因素關(guān)聯(lián)關(guān)系網(wǎng)絡(luò),形成跨時空、跨任務(wù)、跨實(shí)體等多維度的信息理解能力,實(shí)現(xiàn)在復(fù)雜戰(zhàn)場環(huán)境下對目標(biāo)作戰(zhàn)意圖智能識別。
在邏輯架構(gòu)上戰(zhàn)場目標(biāo)意圖知識圖譜可以分為模式層和數(shù)據(jù)層兩個方面,如圖1所示。模式層建立在數(shù)據(jù)層之上,通過形式化的方式描述相關(guān)公式、規(guī)則、概念實(shí)體、關(guān)系等模式信息,如圖1(a)所示。數(shù)據(jù)層含有許多實(shí)例與實(shí)例之間的關(guān)聯(lián)關(guān)系,是模式層的實(shí)例表示,如圖1(b)所示。屬性層主要是目標(biāo)本身固有的屬性信息,這些屬性是用于目標(biāo)意圖分析的參數(shù),如:飛機(jī)本體有最大速度、最小速度、巡航速度和巡航高度、最大加速度、最大減速、最大過載爬升、最大過載俯沖等。特征層以各種特征為基本節(jié)點(diǎn),節(jié)點(diǎn)信息主要包括特征類型和特征參數(shù)等,例如傳感器狀態(tài)、機(jī)動類型、環(huán)境狀態(tài)、我方目標(biāo)狀態(tài)等;而意圖層的節(jié)點(diǎn)信息主要包括目標(biāo)實(shí)體意圖間的包含關(guān)系、關(guān)系值域、關(guān)系約束等。
圖1 知識圖譜模型
目標(biāo)意圖知識圖譜的構(gòu)建是一個動態(tài)循環(huán)的過程[11],如圖2所示。首先利用知識表示技術(shù),結(jié)合可視化建模方法,對概念層、屬性、規(guī)則等進(jìn)行定義,明確概念和概念之間的語義關(guān)聯(lián),實(shí)現(xiàn)多層級領(lǐng)域知識體系構(gòu)建;然后通過實(shí)體識別、關(guān)系抽取等知識抽取相關(guān)技術(shù)從結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)中自動化地提取實(shí)體、關(guān)系、屬性、事件等知識要素;之后利用實(shí)體消歧技術(shù)、實(shí)體鏈接技術(shù)消除實(shí)體、屬性、關(guān)系、事件等知識對象之間的矛盾和歧義,利用知識合并技術(shù)來合并重復(fù)的知識;之后則是利用知識推理、知識計算、知識補(bǔ)全等技術(shù),從知識庫中已有實(shí)體關(guān)系數(shù)據(jù)出發(fā),經(jīng)過推理和計算,建立實(shí)體間的新的關(guān)聯(lián)關(guān)系,從而擴(kuò)展更新知識網(wǎng)絡(luò),最終形成目標(biāo)意圖知識圖譜;在目標(biāo)意圖知識圖譜應(yīng)用過程中,會反饋出新需求新概念,指導(dǎo)目標(biāo)意圖領(lǐng)域認(rèn)知框架的補(bǔ)充與完善[12]。
圖2 知識圖譜構(gòu)建過程
為了方便戰(zhàn)場目標(biāo)意圖識別任務(wù)的使用,我們可以利用知識圖譜嵌入學(xué)習(xí)技術(shù)來獲取實(shí)體和關(guān)系隱含的語義信息。每一個戰(zhàn)場目標(biāo)在目標(biāo)意圖知識圖譜中都會有其它的實(shí)體通過直接關(guān)系相連或者間接關(guān)系路徑與其相連,這些關(guān)系主要包括錄屬關(guān)系、包含關(guān)系、協(xié)同關(guān)系等,這些實(shí)體可以看作是目標(biāo)的屬性,結(jié)合目標(biāo)固有的屬性信息和目標(biāo)狀態(tài)信息,能一定程度上反映目標(biāo)的意圖傾向,可以通過嵌入傳播方法來利用這些知識信息。
我們定義實(shí)體和關(guān)系路徑的集合用來表示目標(biāo)實(shí)體的傳播信息,公式如下:
其中Si(0)={(<>,i)} 為最初的集合,Si(1)={(<r2,e3>,i),(<r3,e4>,i)},以此類推;||表示將關(guān)系r放到關(guān)系路徑pl-1的后面形成一個新的路徑,pl表示從目標(biāo)實(shí)體i開始傳播到第j跳的關(guān)系路徑。
目標(biāo)-關(guān)系路徑的注意力權(quán)重為
目標(biāo)-實(shí)體路徑的注意力權(quán)重為
歸一化得到最后的最終的權(quán)重:
對權(quán)重信息進(jìn)行線性組合可以得到:
因此可以得到所有L跳實(shí)體嵌入信息的集合Γi,如下所示:
將集合Γi里的進(jìn)行求和操作,可以得到新的嵌入e*i:
再通過SVD++方法將目標(biāo)間的協(xié)同信息結(jié)合到目標(biāo)的嵌入中,則可以得到目標(biāo)u的嵌入u*:
其中T(u) 表示為與目標(biāo)u交互過的意圖集合。
然后對u*和e*i進(jìn)行內(nèi)積操作,可以得到預(yù)測目標(biāo)對意圖的概率分?jǐn)?shù):
給定目標(biāo)意圖知識圖譜G 和交互圖Y,對上面的預(yù)測模型進(jìn)行最大化后驗(yàn)概率模型參數(shù)θ:
max p(θ|G,Y)
其中,θ包括參數(shù)矩陣、偏置項(xiàng)向量、目標(biāo)實(shí)體的嵌入、意圖的嵌入等。利用貝葉斯理論,上式可轉(zhuǎn)換為
利用極大似然估計理論,可以得到目標(biāo)損失函數(shù)?:
因?yàn)橐鈭D識別是一個分類問題,因此可以使用精確率、召回率、F1-分?jǐn)?shù)來驗(yàn)證方法的有效性,它們的定義為
其中真正數(shù)、假正數(shù)和假負(fù)數(shù)的含義如表1所示,真正數(shù)是預(yù)測值為正樣本且真實(shí)值也為正樣本的數(shù)量,假正數(shù)是預(yù)測值為負(fù)樣本而真實(shí)值為正樣本的數(shù)量,假負(fù)數(shù)是預(yù)測值為正樣本而真實(shí)值為負(fù)樣本的數(shù)量,真負(fù)數(shù)為預(yù)測值為負(fù)樣本且真實(shí)值也為負(fù)樣本的數(shù)量。
表1 混淆矩陣
采用某作戰(zhàn)仿真系統(tǒng)中的數(shù)據(jù),研究本方法在對海作戰(zhàn)模式下對目標(biāo)意圖識別的整體有效性。分別采用基于知識圖譜嵌入學(xué)習(xí)的目標(biāo)意圖智能識別方法①、基于注意力機(jī)制的長短期記憶網(wǎng)絡(luò)的目標(biāo)意圖識別方法②、基于深度神經(jīng)網(wǎng)絡(luò)的目標(biāo)意圖識別方法③、基于模糊推理的目標(biāo)意圖識別方法④,這四種方法識別目標(biāo)意圖,對比分析模型訓(xùn)練過程和識別結(jié)果。
從圖3損失函數(shù)值變化情況可以看出,從左往右隨著訓(xùn)練的迭代次數(shù)增加,四種意圖識別模型方法的損失函數(shù)值總體情況均逐漸下降,最后趨向于一個穩(wěn)定值,其中基于知識圖譜嵌入學(xué)習(xí)的目標(biāo)意圖智能識別方法損失函數(shù)值最小,優(yōu)于其他三種識別方法。
圖3 損失函數(shù)值變化情況
識別目標(biāo)意識所用的識別時間也是評估模型效果的一個重要指標(biāo),表2是在兩個不同的作戰(zhàn)場景采用四種識別模型對目標(biāo)意圖進(jìn)行識別所消耗的時間,從表2中可以得知,采用基于知識圖譜嵌入學(xué)習(xí)的目標(biāo)意識智能識別的方法在四種方法中所消耗的時間最少,平均單次識別時間為1.20s。
表2 不同作戰(zhàn)場景和識別方法下的目標(biāo)意圖識別時間對比
從表3中可以得到四種方法對于撤退意圖的識別率較高,而突防意圖識別率較低,經(jīng)綜合分析,撤離意圖的目標(biāo)態(tài)勢特征與其它意圖區(qū)別最大,更易識別,而突防與攻擊的態(tài)勢特征接近,更難識別。基于知識圖譜嵌入學(xué)習(xí)的目標(biāo)意圖智能識別方法對各類型的意圖的識別在四種方法中精確率、召回率、F1-分?jǐn)?shù)均最高,表明本文所提方法對目標(biāo)意圖進(jìn)行識別的準(zhǔn)確度最高。
表3 目標(biāo)意圖識別性能度量
針對當(dāng)前戰(zhàn)場目標(biāo)意圖識別方法戰(zhàn)場態(tài)勢情報信息利用率低、識別準(zhǔn)確率不高的問題,本文引入知識圖譜嵌入學(xué)習(xí)技術(shù),提出了一種基于知識圖譜嵌入學(xué)習(xí)的目標(biāo)意圖智能識別方法。利用知識圖譜的可變動態(tài)數(shù)據(jù)模式、語義信息豐富、關(guān)聯(lián)清晰等優(yōu)點(diǎn),可以有效解決多源異構(gòu)情報信息孤島問題,提高目標(biāo)意圖識別的準(zhǔn)確性。通過實(shí)驗(yàn)分析結(jié)果可以得知,基于知識圖譜嵌入學(xué)習(xí)的目標(biāo)意圖智能識別方法識別精度較高,平均識別時間短,能夠充分利用復(fù)雜環(huán)境下戰(zhàn)場因素之間的關(guān)聯(lián)關(guān)系信息獲取識別特征,擁有較好的魯棒性。