(中國電子科技集團(tuán)公司第二十八研究所 南京 210007)
空間目標(biāo)的意圖分析與威脅評估作為空間目標(biāo)監(jiān)視系統(tǒng)的重要功能,尚沒有輔助工具,目前完全依賴人工進(jìn)行分析判斷。系統(tǒng)保留的大量歷史軌道數(shù)據(jù)和歷史重大事件信息沒有得到有效挖掘和利用,急需一套能夠根據(jù)空間目標(biāo)動態(tài)情報信息自動進(jìn)行威脅評估的工具,輔助指揮人員分析決策。
空間目標(biāo)威脅評估的核心在于如何利用信息融合中的低層次數(shù)據(jù),結(jié)合高效的算法,在較高層次上對空間目標(biāo)威脅度進(jìn)行評估[1~2]。目前,對于空間目標(biāo)的意圖分析及威脅評估的研究尚處于初期階段,多數(shù)為基于單一特征的威脅等級分析。
貝葉斯網(wǎng)絡(luò)以概率模型和概率語言為推理依據(jù),尤其適用于解決戰(zhàn)場信息動態(tài)變化性問題。貝葉斯網(wǎng)絡(luò)理論,基于積累的歷史數(shù)據(jù)和專業(yè)知識進(jìn)行建模,對多傳感器、多來源的多維信源進(jìn)行合成、自動分析,生成更有效、更精確的信息,并大大提高威脅評估自動化程度,能夠極大滿足用戶的實際訴求,非常具有創(chuàng)新性和研究價值[3~6]。
傳統(tǒng)的貝葉斯網(wǎng)絡(luò)不能將時間因素對評估結(jié)果的影響反映到模型中去,由于戰(zhàn)場信息的瞬息萬變,本文考慮時間因素對事件的影響,通過動態(tài)貝葉斯網(wǎng)絡(luò)建立威脅評估模型,根據(jù)專家知識和歷史樣本數(shù)據(jù)設(shè)置模型參數(shù),最后通過空間目標(biāo)威脅評估系統(tǒng)建模仿真,驗證了方法的有效性。
貝葉斯網(wǎng)絡(luò)(SBN)是一種有向無環(huán)圖,它表示了變量間的概率依賴關(guān)系[7]。領(lǐng)域變量用X={X1,X2,…Xm} 表示,變量的取值用x={x1,x2,…xm}表示,則貝葉斯網(wǎng)絡(luò)的聯(lián)合概率分布如下:
以靜態(tài)貝葉斯網(wǎng)絡(luò)為基礎(chǔ),動態(tài)貝葉斯網(wǎng)絡(luò)(DBN)把靜態(tài)的網(wǎng)絡(luò)結(jié)構(gòu)與時序信息相結(jié)合。假設(shè)其中的變化在離散時間點間發(fā)生,這些離散時間點通過非負(fù)數(shù)索引[8~9]。假定X={X1,X2,…Xn} 屬性集隨時間變化,X1[t]表示t時刻屬性Xi的值,X[t]是隨機(jī)變量Xi[t]的集合。為表示全過程中網(wǎng)絡(luò)結(jié)構(gòu)變化軌跡的度,在隨機(jī)變量X[0]∪x[1]∪…上進(jìn)行概率分布。此處假設(shè)在X中的整個變化過程滿足馬爾可夫鏈模型,即:
還假定整個過程是靜態(tài)的,即:轉(zhuǎn)移概率P(X[t+1]|X[t])與時間t無關(guān)。基于這兩個假設(shè),動態(tài)貝葉斯網(wǎng)絡(luò)包括兩部分。
1)先驗網(wǎng)絡(luò)B0,表示初始時態(tài)X[0]的分布;
2)轉(zhuǎn)移網(wǎng)絡(luò)B→,表示所有時間t上的轉(zhuǎn)移概率P(X[t+1]|X[t])。
一個DBN是由在符合變量X[1],X[2],...X[∞]上的半無限網(wǎng)絡(luò)結(jié)構(gòu)(B0,B→)來定義的,實際應(yīng)用時只需要在有限區(qū)間0,...T上推理即可。因此,動態(tài)貝葉斯網(wǎng)絡(luò)在X[0],X[2],...X[t]上的聯(lián)合概率分布為
其中P(X[t+1]|X[t])可從轉(zhuǎn)換網(wǎng)絡(luò)模型中求得。可以看出,動態(tài)貝葉斯網(wǎng)絡(luò)通過對變量的不同特征間的依存關(guān)系建立數(shù)學(xué)模型,較好地反映了變量特征間的時序關(guān)系。
建立貝葉斯網(wǎng)絡(luò)威脅評估模型包括建立模型結(jié)構(gòu)和確定參數(shù)兩個階段。模型結(jié)構(gòu)建立的目的是為了確定滿足要求的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),首先需要確定模型的節(jié)點,可以分析模型的目標(biāo)和特征變量,其次需要分析節(jié)點之間的依賴關(guān)系;確定參數(shù)是為了根據(jù)歷史樣本數(shù)據(jù)來學(xué)習(xí)網(wǎng)絡(luò)模型的參數(shù),在確定參數(shù)后還需要逐步調(diào)整和優(yōu)化,使其更接近真實狀態(tài)。
在空間目標(biāo)威脅評估系統(tǒng)中,需要獲得目標(biāo)的多種屬性,才能最終確定目標(biāo)的威脅等級[10]。貝葉斯網(wǎng)絡(luò)模型的關(guān)鍵是選取威脅評估屬性集。
通過借鑒領(lǐng)域知識和專家知識,威脅因素中可選取的變量有威脅目標(biāo)類型、成像分辨率、信號接收能力、載荷工作狀態(tài)、目標(biāo)位置[11~13]。各威脅因素的權(quán)重是不同的,為降低個別因素造成的評估結(jié)果的不確定性,需要對各威脅因素進(jìn)行融合處理[14]。
根據(jù)建立貝葉斯網(wǎng)絡(luò)的方法,建立基于貝葉斯網(wǎng)絡(luò)的威脅評估模型。圖1是基于專家經(jīng)驗的空間目標(biāo)威脅評估貝葉斯網(wǎng)絡(luò)的先驗?zāi)P汀?/p>
圖1 貝葉斯網(wǎng)絡(luò)的先驗?zāi)P?/p>
其中T為威脅目標(biāo)類型,R為成像分辨率,S為信號接收能力,L為載荷工作狀態(tài),P為目標(biāo)位置。各變量的狀態(tài)空間設(shè)計如下。
1)目標(biāo)類型(T){偵察監(jiān)視(T1)、氣象測繪(T2)、導(dǎo)航定位(T3)、導(dǎo)彈預(yù)警(T4)、通信保障(T5)、其他(T6)};
2)成像分辨率(R){0~3m(R1)、3m~10m(R2)、10m以上(R3)};
3)信號接收能力(S){0~10dB(S1)、10~20dB(S2)、20dB以上(S3)};
4)載荷狀態(tài)(L){工作正常(L1),故障(L2)};
5)目標(biāo)位置(P){范圍內(nèi)(P1)、范圍外(P2)};
6)威脅等級(TL){高(TL1),中(TL2),低(TL3)}。
動態(tài)貝葉斯網(wǎng)絡(luò)模型則在先驗?zāi)P偷幕A(chǔ)上,根據(jù)相鄰時序間的變量構(gòu)建因果關(guān)系,以反映變量之間的依存關(guān)系以及變量隨時間變化的規(guī)律。圖2為基于連續(xù)時序的貝葉斯網(wǎng)絡(luò)威脅評估轉(zhuǎn)移模型。
圖2 貝葉斯網(wǎng)絡(luò)的轉(zhuǎn)移模型
條件概率矩陣作為一種專家知識,反映的是專家對于關(guān)聯(lián)節(jié)點間因果關(guān)系的認(rèn)識?;趯<医?jīng)驗結(jié)合對歷史樣本數(shù)據(jù)的統(tǒng)計,由T、R、S、L、P推理TL的規(guī)則采用條件概率表描述如表1。
表1 條件概率矩陣
考慮條件概率矩陣的確定有一定的人為影響,可以通過反復(fù)調(diào)試樣本數(shù)據(jù)的方法適度修正矩陣數(shù)據(jù),以提高威脅評估的準(zhǔn)確性。
根據(jù)以上模型構(gòu)建空間目標(biāo)威脅評估系統(tǒng),假設(shè)預(yù)先沒有任何情報信息,根據(jù)歷史數(shù)據(jù)統(tǒng)計出空間目標(biāo)威脅等級的先驗信息為P(TL)=(0.280,0.347,0.373)。系統(tǒng)完成初始化后,模型準(zhǔn)備完畢。當(dāng)我軍情報系統(tǒng)探測到敵方空間目標(biāo)的信息后,更新拓?fù)渚W(wǎng)絡(luò)中的觀測節(jié)點信息,并觸發(fā)網(wǎng)絡(luò)推理,完成模型中網(wǎng)絡(luò)節(jié)點的概率分布的迭代,得到目標(biāo)威脅程度的概率分布。
假設(shè)本次任務(wù)中的三個敵方空間目標(biāo)為阿派司衛(wèi)星5、長曲棍球5、空間跟蹤與監(jiān)視系統(tǒng)衛(wèi)星(以下以目標(biāo)1、目標(biāo)2、目標(biāo)3代替)。系統(tǒng)同時對這三個目標(biāo)進(jìn)行威脅評估。
對于目標(biāo)1,在T-1時刻,假設(shè)傳感器檢測到目標(biāo)類型為通信保障;下一時刻T,傳感器檢測到目標(biāo)載荷狀態(tài)為故障;T+1時刻,傳感器檢測到我方目標(biāo)在目標(biāo)1的探測范圍內(nèi);對于目標(biāo)2,在T-1時刻傳感器檢測到目標(biāo)類型為偵察監(jiān)視;下一時刻T傳感器檢測到目標(biāo)的成像分辨率為3.11m;T+1時刻,傳感器檢測到目標(biāo)載荷狀態(tài)為故障;對于目標(biāo)3,在T-1時刻,傳感器檢測到目標(biāo)類型為導(dǎo)彈預(yù)警;T時刻,傳感器檢測到目標(biāo)成像分辨率為2.13m;T+1時刻,傳感器檢測到目標(biāo)信號接收能力為5dB。
根據(jù)以上信息運用動態(tài)貝葉斯網(wǎng)絡(luò)推理,并和靜態(tài)貝葉斯網(wǎng)絡(luò)推理結(jié)果進(jìn)行對比。
動態(tài)貝葉斯網(wǎng)絡(luò)推理算法評估過程如圖3所示。
圖3 DBN算法評估流程
目標(biāo)在各時刻用靜態(tài)貝葉斯網(wǎng)絡(luò)推理得到的威脅程度概率分布如表2所示。
表2 SBN推理的威脅等級后驗概率
用動態(tài)貝葉斯網(wǎng)絡(luò)推理得到的威脅程度概率分布如表3所示。
表3 DBN推理的威脅等級后驗概率
根據(jù)以上兩組仿真結(jié)果可知,先驗信息的變化會導(dǎo)致不同的推理結(jié)果。以目標(biāo)1為例,兩組仿真結(jié)果的對比如圖4所示。
圖4 兩組數(shù)據(jù)評估結(jié)果
在第一組仿真數(shù)據(jù)中,初始先驗信息為P(TL)=(0.280,0.347,0.373),各威脅等級的概率分布相差不大而威脅等級為低的可能性最大,在T-1時刻評估結(jié)果為P(TL)=(0.114,0.281,0.605),T時 刻 評 估 結(jié) 果 為P(TL)=(0.124,0.383,0.494) ,T+1時刻的 評估結(jié) 果 為P(TL)=(0.385,0.358,0.257)。各時刻推理過程沒有更新先驗信息,推理過程是相互獨立的,最終的概率分布相差不大,威脅程度為高的概率最大。
在第二組仿真數(shù)據(jù)中,在T-1時刻得到的評估結(jié)果為P(TL)=(0.114,0.281,0.605),這與第一組數(shù)據(jù)中T-1時刻的結(jié)果一樣,因為它們的先驗信息相同;在T時刻,先驗信息更新為T-1時刻推理得到的信息,得到的評估結(jié)果為P(TL)=(0.043,0.267,0.690),進(jìn)一步提高了威脅程度為低的概率,且降低了另兩種概率值。在T+1時刻,得到的評估結(jié)果為P(TL)=(0.073,0.341,0.586),威脅程度為低的概率下降,另兩種概率值提高,最終的評估結(jié)果仍然是威脅程度為低的概率最大。顯然,當(dāng)前評估結(jié)果受歷史評估結(jié)果的影響顯著,當(dāng)前評估結(jié)果綜合了最新的證據(jù)信息和歷史信息,具有信息累積的特點。
綜上,基于動態(tài)貝葉斯網(wǎng)絡(luò)的空間目標(biāo)威脅評估結(jié)果和人類專家的評估結(jié)果高度一致。該方法不但是一種有效的推理算法,也是一種可以有效應(yīng)用人類知識的專家系統(tǒng)。
動態(tài)貝葉斯的評估方法可以對上一時刻學(xué)習(xí)來的知識進(jìn)行處理并保存,獲得的證據(jù)和有效信息會隨著時間的推移而聚積,推理結(jié)果的不確定性逐步降低,精確性也越來越高。需要指出的兩點是:1)當(dāng)系統(tǒng)產(chǎn)生大量新的樣本數(shù)據(jù)后,通過對已有樣本數(shù)據(jù)的再次統(tǒng)計,特征變量的分界值和網(wǎng)絡(luò)模型的參數(shù)可以不斷被調(diào)整優(yōu)化,評估結(jié)果的準(zhǔn)確性進(jìn)一步提升。2)在對所有證據(jù)的評估完成后可能會出現(xiàn)威脅等級的概率分布相差不大的情況,如果該類數(shù)據(jù)過多會對后續(xù)的統(tǒng)計結(jié)果產(chǎn)生一定的偏差。可以通過增加新的特征變量以及進(jìn)一步細(xì)化特征變量的分界來降低這種情況發(fā)生的概率。