王玉龍, 董志明, 彭文成, 王曉方
(1. 陸軍裝甲兵學(xué)院演訓(xùn)中心, 北京 100072; 2. 武警后勤學(xué)院裝備保障系, 天津 300309)
可信度是分布式LVC (Live Virtual and Constructive)仿真系統(tǒng)的關(guān)鍵問題之一。交互事件是分布式LVC仿真系統(tǒng)中系統(tǒng)運(yùn)行、推進(jìn)的重要基礎(chǔ),交互行為與事件可信對(duì)于系統(tǒng)的可靠運(yùn)行、仿真的正確計(jì)算以及局勢(shì)的理解與判斷至關(guān)重要?;贚VC的分布式訓(xùn)練仿真環(huán)境,可為參訓(xùn)官兵提供貼近實(shí)戰(zhàn)的氛圍和感受。在實(shí)時(shí)性要求較高的大規(guī)模分布式LVC訓(xùn)練仿真環(huán)境中,隨著實(shí)體數(shù)量的不斷增加、交互規(guī)模的不斷擴(kuò)大,加之廣域網(wǎng)的隨機(jī)網(wǎng)絡(luò)延遲,會(huì)對(duì)時(shí)間管理服務(wù)帶來極大的運(yùn)行負(fù)擔(dān),可導(dǎo)致中間件開銷過高、消息序維護(hù)效率低下等問題,無法滿足訓(xùn)練仿真活動(dòng)的實(shí)時(shí)性和可信性需求。為確保每次仿真推進(jìn)實(shí)體狀態(tài)的一致性,若采取保守機(jī)制,會(huì)導(dǎo)致仿真時(shí)間嚴(yán)重滯后,且在交互眾多、時(shí)延復(fù)雜的情況下較難獲取合理的Lookahead值;若采用樂觀機(jī)制,則會(huì)導(dǎo)致頻繁的回滾、中斷或容錯(cuò)操作,特別是,在陸戰(zhàn)炮擊和空戰(zhàn)等場(chǎng)景中,會(huì)嚴(yán)重破壞演習(xí)的連續(xù)性和沉浸感,無法保證實(shí)兵實(shí)裝的LVC訓(xùn)練仿真活動(dòng)能夠按照真實(shí)演習(xí)的節(jié)奏、以貼近實(shí)戰(zhàn)的狀態(tài)開展。因此,為獲得高度可靠的實(shí)時(shí)LVC仿真能力,在采用獨(dú)立時(shí)間推進(jìn)機(jī)制的同時(shí),可進(jìn)行系統(tǒng)交互可信狀態(tài)實(shí)時(shí)監(jiān)控,為預(yù)先故障管理或容錯(cuò)提供預(yù)警機(jī)制,以確保實(shí)兵實(shí)裝的LVC訓(xùn)練仿真能夠連續(xù)、可信地進(jìn)行。
對(duì)于仿真可信度評(píng)估問題,MEHTA等[1]指出決策者需要首先明確所使用仿真系統(tǒng)的可信度,才能夠基于該系統(tǒng)的仿真結(jié)果做出合理決策,不確定性的傳播和量化問題、參考數(shù)據(jù)或間接證據(jù)以及仿真校驗(yàn)等是建立仿真可信度的基礎(chǔ);王斐等[2]首先將可信度指標(biāo)權(quán)重確定方法分為主觀和客觀2類,通過云模型確定主觀權(quán)重,采用熵權(quán)法和信息熵確定客觀權(quán)重,然后運(yùn)用加法集成原理獲得綜合權(quán)重,最后使用變權(quán)灰色聚類理論獲得評(píng)價(jià)聚類結(jié)果,進(jìn)而分析制導(dǎo)仿真系統(tǒng)的可信度;TANG等[3]針對(duì)作戰(zhàn)仿真系統(tǒng)的特點(diǎn),提出了一種基于主題專家知識(shí)的主觀綜合評(píng)估方法,并將其應(yīng)用于作戰(zhàn)仿真中,該方法充分利用了主題專家的知識(shí)、經(jīng)驗(yàn),對(duì)評(píng)估對(duì)象相關(guān)因素進(jìn)行評(píng)判,并綜合運(yùn)用層次分析法、模糊綜合評(píng)判法、模糊層次分析法等對(duì)作戰(zhàn)仿真系統(tǒng)進(jìn)行評(píng)估,獲得整個(gè)作戰(zhàn)仿真的可信度;潘云龍等[4]提出了基于證據(jù)理論和灰云聚類的可信度評(píng)估模型,解決了復(fù)雜制導(dǎo)仿真系統(tǒng)可信度量化的主觀性和不確定性問題,該方法主要采用群組層次分析法獲得專家意見并進(jìn)行證據(jù)理論融合,得到高可信度的指標(biāo)權(quán)重,采用灰云聚類方法量化處理定性指標(biāo),并計(jì)算灰色聚類系數(shù)獲得仿真系統(tǒng)可信度評(píng)估結(jié)果。
總體來看,現(xiàn)有文獻(xiàn)并未從仿真交互層面考慮系統(tǒng)可信性問題,筆者首先針對(duì)分布式LVC訓(xùn)練仿真系統(tǒng)的仿真交互事件,給出了交互可信度的明確定義,根據(jù)歷史信息和專家經(jīng)驗(yàn)等先驗(yàn)信息,在引入繼承因子的基礎(chǔ)上,綜合得到交互可信度融合先驗(yàn)分布;然后結(jié)合測(cè)試環(huán)境中交互事件時(shí)序和間距等可信度度相關(guān)數(shù)據(jù),依據(jù)交互可信度模型和閾值進(jìn)行交互可信判斷;最后運(yùn)用貝葉斯方法得到交互可信度的后驗(yàn)分布和實(shí)時(shí)判斷,進(jìn)而為系統(tǒng)容錯(cuò)或預(yù)先故障管理等機(jī)制提供實(shí)時(shí)狀態(tài)數(shù)據(jù)支持。該過程是一個(gè)實(shí)時(shí)迭代和更新的過程,在首次后驗(yàn)評(píng)估完成后,可使用其后驗(yàn)評(píng)估數(shù)據(jù)和結(jié)果對(duì)先驗(yàn)信息進(jìn)行融合與更新,并在此基礎(chǔ)上進(jìn)行新一輪的交互可信度貝葉斯評(píng)估,從而獲得實(shí)時(shí)連續(xù)的系統(tǒng)交互可信度評(píng)估結(jié)果,實(shí)現(xiàn)對(duì)大規(guī)模分布式LVC訓(xùn)練仿真系統(tǒng)運(yùn)行質(zhì)量的實(shí)時(shí)在線監(jiān)控。
在分布式LVC仿真系統(tǒng)中,不同的節(jié)點(diǎn)都有其認(rèn)知空間,該認(rèn)知空間由節(jié)點(diǎn)對(duì)于實(shí)體狀態(tài)及其交互行為的認(rèn)知所構(gòu)成。節(jié)點(diǎn)的認(rèn)知空間不僅包含其自身所維護(hù)的實(shí)體狀態(tài)信息,還包括該節(jié)點(diǎn)所感知的局部或整個(gè)系統(tǒng)的狀態(tài)及交互信息。在仿真推進(jìn)過程中,由于存在時(shí)鐘不同步、時(shí)延和信息丟失等問題,節(jié)點(diǎn)難以同步、及時(shí)有效地獲取所需實(shí)體狀態(tài)信息,會(huì)導(dǎo)致不同節(jié)點(diǎn)對(duì)于同一實(shí)體的狀態(tài)和交互行為的認(rèn)知存在差異,這種認(rèn)知差異就是分布式LVC訓(xùn)練仿真系統(tǒng)中的交互一致性問題,如圖1所示。在大規(guī)模分布式LVC訓(xùn)練仿真系統(tǒng)中,隨著仿真實(shí)體數(shù)量的增加,中間件開銷不斷加大,加之通信網(wǎng)絡(luò)的局部時(shí)延存在差異,不同仿真實(shí)體對(duì)于其認(rèn)知空間內(nèi)狀態(tài)信息、交互行為和仿真態(tài)勢(shì)的理解存在不一致現(xiàn)象,這在一定程度上損害了仿真的真實(shí)性和公平性[5-6]。
圖1 LVC訓(xùn)練仿真系統(tǒng)中的交互不一致性
在分布式LVC訓(xùn)練仿真系統(tǒng)開發(fā)過程中,為了提高開發(fā)效率、降低開發(fā)成本,允許不同的仿真節(jié)點(diǎn)根據(jù)模型特點(diǎn),運(yùn)用不同的時(shí)空描述方法;同時(shí),為豐富和拓展分布式LVC訓(xùn)練仿真系統(tǒng)的應(yīng)用場(chǎng)景和使用范圍,也要求分布式LVC仿真系統(tǒng)可兼容不同開發(fā)者和不同建模方法所構(gòu)建的異構(gòu)模型資源,這就為實(shí)現(xiàn)仿真模型交互的一致性帶來了困難。在同一仿真環(huán)境或空間中,節(jié)點(diǎn)間的信息交互要求不同實(shí)體對(duì)于同一事件實(shí)現(xiàn)一致性的認(rèn)知與理解。若無法滿足交互一致性要求,則可能會(huì)給不同用戶造成認(rèn)知差異、困惑與矛盾,甚至?xí)绊懛抡娼Y(jié)果的正確性,導(dǎo)致用戶利益分配不公和仿真失敗等嚴(yán)重后果。因此,為保證系統(tǒng)仿真交互的真實(shí)性和公平性,應(yīng)對(duì)節(jié)點(diǎn)交互的一致性情況進(jìn)行分析和判斷。若交互行為的一致程度滿足計(jì)算精度、系統(tǒng)規(guī)范或用戶體驗(yàn)要求,則認(rèn)為該交互可信;若交互行為的不一致程度較為嚴(yán)重,甚至對(duì)分布式LVC訓(xùn)練仿真系統(tǒng)產(chǎn)生違背期望、因果顛倒和理解歧義等不良影響[7],則從用戶體驗(yàn)角度來判斷,即可認(rèn)定該仿真交互行為是不可信的。需要明確的是,交互可信只關(guān)注仿真事件本身的時(shí)序、間距或因果關(guān)系是否滿足系統(tǒng)要求等問題,而不關(guān)注實(shí)體模型層面的具體計(jì)算結(jié)果或概率。圖2為在某次炮擊事件訓(xùn)練仿真中的交互不可信事件??梢钥闯觯航换タ尚抨P(guān)注的是射擊實(shí)體的炮擊行為,在某個(gè)時(shí)間區(qū)間內(nèi)是否都被訂閱該信息的不同觀察實(shí)體觀測(cè)到,若是,則可初步認(rèn)定該交互事件可信;否則,認(rèn)為該交互行為不一致,該事件不可信。至于該炮擊行為能否擊中目標(biāo)或擊中目標(biāo)的概率,不在交互可信考慮的范圍之內(nèi)。
圖2 某次炮擊事件訓(xùn)練仿真中的交互不可信事件
交互可信的持續(xù)觀測(cè)需要量化、可測(cè)的交互可信度判斷模型來支撐。在分布式LVC訓(xùn)練仿真系統(tǒng)中,可采用順序一致、因果一致等方法維護(hù)不同節(jié)點(diǎn)的交互一致性,筆者在文獻(xiàn)[8]提出的間距一致性模型的基礎(chǔ)上,對(duì)一致性要求進(jìn)行重新定義,得到交互可信判斷依據(jù)。
設(shè)V={v1,v2,…,vn},為仿真節(jié)點(diǎn)集合,O為所有交互事件的集合,g(om)為事件om的生成節(jié)點(diǎn),R(om)為接收該事件的節(jié)點(diǎn)集合,tei為某一事件在節(jié)點(diǎn)vi(i=1,2,…,n)上被執(zhí)行的時(shí)間,tei(om)為事件Om在節(jié)點(diǎn)vi上被執(zhí)行的時(shí)間。
對(duì)于?om,on∈O,vi,vj∈R(om)∩R(on),j=1,2,…,n,定義
1) 時(shí)序一致
tei(om)≤tei(on)?tej(om)≤tej(on);
(1)
2) 絕對(duì)間距一致
tei(om)-tei(on)=tej(om)-tej(on)。
(2)
考慮到仿真系統(tǒng)及網(wǎng)絡(luò)環(huán)境變化具有很強(qiáng)的隨機(jī)性,式(2)所要求的絕對(duì)間距一致性條件相對(duì)苛刻,在分布式LVC訓(xùn)練仿真系統(tǒng)中難以完全滿足,為此,筆者重新定義間距一致性要求如下:
|(ts(om)-ts(on))-(tei(om)-tei(on))|≤ε。
(3)
式中:ts(om)為事件om在生成節(jié)點(diǎn)g(om)上被發(fā)送的時(shí)間;ε為間距一致性閾值。
ε主要用來評(píng)價(jià)同一事件在不同節(jié)點(diǎn)滿足間距一致要求的程度,并以此為基礎(chǔ)判斷該交互事件是否可信。若某次交互同時(shí)滿足時(shí)序一致性要求(1)和間距一致性要求(3),則認(rèn)為該交互可信;反之,則認(rèn)為該交互不可信。合理的閾值大小對(duì)于交互可信評(píng)估的有效性至關(guān)重要。間距一致性閾值設(shè)置不宜過大或過小,過大無法滿足間距一致性要求,過小則判斷條件過于苛刻,影響系統(tǒng)性能的發(fā)揮。
ε的設(shè)置可采用k-means聚類方法來實(shí)現(xiàn):首先,在仿真系統(tǒng)運(yùn)行狀態(tài)良好的情況下,周期性采集交互事件間距樣本,計(jì)算每一周期內(nèi)同一交互事件任意2個(gè)節(jié)點(diǎn)間距樣本的Euclidean距離,得到閾值集合;其次,根據(jù)Euclidean距離的大小,采用k-means聚類方法將閾值集合分為2類(Euclidean距離較大的稱為交互不可信閾值集,Euclidean距離較小的稱為交互可信閾值集);最后,取交互可信閾值集最大者為間距一致性閾值。具體算法流程如下:
輸入:若干仿真步長(zhǎng)內(nèi)交互事件的間距數(shù)值集合A。
輸出:ε。
1) 計(jì)算間距數(shù)值集合A中每個(gè)步長(zhǎng)同一交互事件的任意2個(gè)節(jié)點(diǎn)間距數(shù)值的Euclidean距離;
2) 保存Euclidean距離數(shù)據(jù)集B;
3) 從數(shù)據(jù)集B中隨機(jī)選取2個(gè)對(duì)象作為初始聚類中心;
4) 計(jì)算每個(gè)對(duì)象到聚類中心的距離,并將其重新劃分到最近的類中;
5) 計(jì)算新類中所有對(duì)象的均值,獲得2個(gè)新的聚類中心;
6) 重復(fù)執(zhí)行步驟4)和5),直到滿足最大迭代次數(shù)或聚類中心不再大范圍移動(dòng)為止;
7) 保存k-means聚類方法生成的2個(gè)聚類集合B1和B2;
8) 根據(jù)Euclidean距離大小,將2個(gè)聚類分為交互可信閾值集B1和交互不可信閾值集B2;
9) 取交互可信閾值集B1中的最大值為ε賦值。
在量化可測(cè)的仿真交互可信判斷的基礎(chǔ)上,交互可信度為在某一時(shí)間區(qū)間內(nèi),在特定的網(wǎng)絡(luò)環(huán)境下,同時(shí)滿足時(shí)序一致性要求(1)和間距一致性要求(3)的交互事件數(shù)量占分布式LVC訓(xùn)練仿真系統(tǒng)總的交互事件的百分比。
由于分布式LVC訓(xùn)練仿真系統(tǒng)的運(yùn)行負(fù)載和網(wǎng)絡(luò)環(huán)境時(shí)刻處于變化狀態(tài),仿真交互事件是否可信是一個(gè)隨機(jī)事件,則交互可信度為一個(gè)隨機(jī)變量。筆者選用β分布作為交互可信度評(píng)估的先驗(yàn)分布。記交互可信度為θ,根據(jù)分布式LVC訓(xùn)練仿真系統(tǒng)運(yùn)行歷史信息和專家經(jīng)驗(yàn),二者的交互可信度先驗(yàn)分布為
(4)
(5)
式中:0≤θ≤1;i=1,為歷史信息先驗(yàn),i=2,為專家經(jīng)驗(yàn)先驗(yàn);ai>0、bi>0,為多種信息條件下先驗(yàn)分布的超參數(shù),在先驗(yàn)分布形式已知的情況下,ai、bi的取值是確定先驗(yàn)分布的關(guān)鍵。
基于歷史信息的先驗(yàn)分布主要根據(jù)歷史數(shù)據(jù)分析、求解仿真交互可信度均值μ和方差S2,并確定先驗(yàn)分布的超參數(shù)
(6)
(7)
由于專家經(jīng)驗(yàn)具有模糊性,交互可信度專家經(jīng)驗(yàn)值通常以連續(xù)區(qū)間的形式給出。設(shè)在某一分布式LVC訓(xùn)練仿真系統(tǒng)的測(cè)試階段,專家經(jīng)驗(yàn)估計(jì)值為θ[θL,θH]。專家估計(jì)在區(qū)間值[θL,θH]內(nèi)每一個(gè)值的置信度相同,可認(rèn)為交互可信度θ在區(qū)間[θL,θH]上服從均勻分布,并記為θ~U(θL,θH),則均值μ和方差S2分別為
(8)
以先驗(yàn)參數(shù)為變量,均值為約束,方差為目標(biāo),建立優(yōu)化模型
(9)
式中:
分別為β(ai,bi)分布的均值和方差。
利用最優(yōu)化方法求解式(9)與均勻分布θ~U(θL,θH)擬合程度最高的β分布,即求解β(a2,b2)中的超參數(shù)a2、b2,得到交互可信度的專家經(jīng)驗(yàn)先驗(yàn)分布。
為了有效利用先驗(yàn)信息,全面描述先驗(yàn)信息與樣本的異總體性,構(gòu)造融合先驗(yàn)分布
(10)
若在分布式LVC訓(xùn)練仿真系統(tǒng)中進(jìn)行n次獨(dú)立的交互可信數(shù)據(jù)采集和判斷,其中交互可信的次數(shù)為X,則X服從二項(xiàng)分布b(n,θ),交互可信度θ的似然函數(shù)為
(11)
根據(jù)貝葉斯定理,交互可信度后驗(yàn)分布為
(12)
選后驗(yàn)期望作為θ的貝葉斯評(píng)估結(jié)論,則交互可信度θ的貝葉斯估計(jì)為
(13)
為驗(yàn)證交互可信度評(píng)估方法的可行性,在一個(gè)由20個(gè)節(jié)點(diǎn)組成的局域網(wǎng)中搭建仿真實(shí)驗(yàn)環(huán)境,該實(shí)驗(yàn)以某訓(xùn)練仿真系統(tǒng)為實(shí)驗(yàn)平臺(tái),部署RTX實(shí)時(shí)操作系統(tǒng),通過調(diào)用“RtGetClockTime”函數(shù)獲取CLOCK_2高精度時(shí)鐘來實(shí)現(xiàn)計(jì)時(shí),該時(shí)鐘精度單位為100 ns,運(yùn)行環(huán)境如圖3所示。
圖3 訓(xùn)練仿真系統(tǒng)運(yùn)行環(huán)境
交互可信度實(shí)驗(yàn)主要分為2部分:
1) 理想環(huán)境實(shí)驗(yàn),該實(shí)驗(yàn)硬件配置包括2臺(tái)仿真計(jì)算機(jī)和1臺(tái)千兆交換機(jī)。2臺(tái)仿真計(jì)算機(jī)安裝訓(xùn)練仿真基礎(chǔ)環(huán)境和其他所需軟件環(huán)境,并分別運(yùn)行事件發(fā)送和接收程序,通過驗(yàn)證收發(fā)數(shù)據(jù)包的一致性,計(jì)算測(cè)試時(shí)長(zhǎng)和間距一致性是否滿足要求來進(jìn)行交互可信判斷,獲得理想環(huán)境中交互可信度取值范圍,為基于專家經(jīng)驗(yàn)的先驗(yàn)評(píng)估提供參考。
2) 局域網(wǎng)模擬實(shí)驗(yàn),該實(shí)驗(yàn)環(huán)境為20個(gè)節(jié)點(diǎn)和1臺(tái)千兆交換機(jī)組成的局域網(wǎng)絡(luò)環(huán)境。每個(gè)節(jié)點(diǎn)同樣部署訓(xùn)練仿真基礎(chǔ)環(huán)境及其配套軟件,為模擬分布式LVC訓(xùn)練仿真系統(tǒng)網(wǎng)絡(luò)通信高延遲和動(dòng)態(tài)性的特點(diǎn),使用廣域網(wǎng)延遲模擬工具DS2來模擬網(wǎng)絡(luò)延遲情況。根據(jù)其拓展延遲模型,取若干節(jié)點(diǎn)作為仿真節(jié)點(diǎn)[11],進(jìn)而構(gòu)造間距一致性判斷模型,并對(duì)測(cè)試數(shù)據(jù)進(jìn)行間距一致性判斷;取實(shí)驗(yàn)前期若干步長(zhǎng)測(cè)試結(jié)果作為歷史先驗(yàn)信息;后續(xù)實(shí)驗(yàn)結(jié)果作為實(shí)時(shí)測(cè)試樣本,為貝葉斯后驗(yàn)評(píng)估提供數(shù)據(jù)支持。
典型交互可信度模擬實(shí)驗(yàn)測(cè)試結(jié)果如圖4所示??梢钥闯觯?/p>
1) 當(dāng)仿真時(shí)間步長(zhǎng)在0~20內(nèi),訓(xùn)練仿真實(shí)驗(yàn)環(huán)境交互可信度維持在0.80以上,該系統(tǒng)運(yùn)行負(fù)載穩(wěn)定,網(wǎng)絡(luò)環(huán)境可靠;
圖4 典型交互可信度模擬實(shí)驗(yàn)測(cè)試結(jié)果
2) 當(dāng)仿真時(shí)間步長(zhǎng)為25時(shí),交互可信度出現(xiàn)明顯下降,其原因可能是廣域網(wǎng)隨機(jī)延遲增大或者訓(xùn)練仿真系統(tǒng)負(fù)載增大導(dǎo)致。此時(shí),若交互可信度能及時(shí)回升且未對(duì)關(guān)鍵交互事件造成誤判或仿真運(yùn)行造成重大結(jié)果,短時(shí)的系統(tǒng)交互可信度下降可視情忽略;但如果交互可信度急劇或持續(xù)下降,則應(yīng)及時(shí)發(fā)出預(yù)先警告并觸發(fā)應(yīng)對(duì)措施。
由此可見:交互可信度評(píng)估可為訓(xùn)練仿真系統(tǒng)提供關(guān)于其運(yùn)行狀態(tài)的實(shí)時(shí)監(jiān)測(cè)和評(píng)估結(jié)果,進(jìn)而為及時(shí)啟動(dòng)有效的干預(yù)措施提供重要判斷依據(jù)。
筆者針對(duì)分布式LVC訓(xùn)練仿真系統(tǒng)交互可信度問題,提出了交互可信度的明確定義,建立了交互可信判斷模型,量化分析了分布式LVC訓(xùn)練仿真系統(tǒng)交互事件的可信性問題;引入繼承因子,對(duì)先驗(yàn)信息與樣本信息的異總體性進(jìn)行了判斷,融合多種先驗(yàn)信息進(jìn)行交互可信度的先驗(yàn)分布擬合,提高交互可信度評(píng)估的可靠度,并在此基礎(chǔ)上運(yùn)用貝葉斯方法得到了實(shí)時(shí)連續(xù)的交互可信度后驗(yàn)估計(jì)。實(shí)驗(yàn)結(jié)果表明:該方法對(duì)于相關(guān)變量?jī)?nèi)涵定義明確,計(jì)算簡(jiǎn)單有效,為分布式LVC訓(xùn)練仿真系統(tǒng)可信度評(píng)估問題提供了一種新的思路和方法。
本研究在一定程度上實(shí)現(xiàn)了分布式LVC訓(xùn)練仿真系統(tǒng)交互可信度實(shí)時(shí)狀態(tài)監(jiān)控,但對(duì)于交互可信度變化的具體原因以及相應(yīng)的容錯(cuò)方法和措施,并未涉及和分析,有待于下一步進(jìn)行深入研究和探索。