杜 偉
(陸軍指揮學(xué)院,南京 210045)
當(dāng)前科技水平的發(fā)展促進(jìn)了信息化戰(zhàn)爭的到來,針對機(jī)械化戰(zhàn)爭的還原論建模分析方法已經(jīng)不適用作戰(zhàn)系統(tǒng)中的各類復(fù)雜問題。信息化戰(zhàn)爭中大量的作戰(zhàn)單元以及在作戰(zhàn)使命上的有效交互和協(xié)同[1-2],戰(zhàn)場資源的快速整合,構(gòu)成了復(fù)雜的作戰(zhàn)體系網(wǎng)絡(luò)[3],這符合復(fù)雜適應(yīng)系統(tǒng)與復(fù)雜性科學(xué)理論的研究對象特征[4]。因此,在現(xiàn)代戰(zhàn)爭研究領(lǐng)域得到了廣泛的應(yīng)用。在復(fù)雜適應(yīng)系統(tǒng)理論中,基于Agent的建模仿真方法是研究復(fù)雜系統(tǒng)的有效途徑[5]。
在作戰(zhàn)系統(tǒng)中,除了各類高科技的武器裝備之外,人作為其中的主導(dǎo)者是導(dǎo)致作戰(zhàn)系統(tǒng)具有復(fù)雜性特征的主要原因。在作為發(fā)展趨勢的智能化戰(zhàn)爭研究[6]中,指揮員對作戰(zhàn)系統(tǒng)進(jìn)行控制,是決定一場戰(zhàn)爭勝敗的關(guān)鍵要素。當(dāng)前人工智能技術(shù)在各個領(lǐng)域中取得了很多的成果[7],在作戰(zhàn)領(lǐng)域中,主要對“人”發(fā)揮的作用進(jìn)行研究,因此,指揮員的指揮風(fēng)格特點(diǎn)影響勝敗的重要因素,“知己知彼,百戰(zhàn)不殆”,這里所說的“己”和“彼”,不僅包括敵我雙方的兵力多少、戰(zhàn)場部署等內(nèi)容,同時也包括對雙方指揮人員的風(fēng)格特點(diǎn)方面的把握。因此,如何對指揮員乃至一個作戰(zhàn)部隊的作戰(zhàn)風(fēng)格進(jìn)行研究,成為當(dāng)前Agent建模研究的一個熱點(diǎn)問題。在當(dāng)前的A-gent建模仿真中,不僅可以對仿真對象的屬性、事件和方法進(jìn)行封裝,而且可以封裝對象相關(guān)的思維能力、決策能力以及風(fēng)格特點(diǎn),從而體現(xiàn)出較高的自治性和社會性[8],這為研究作戰(zhàn)系統(tǒng)中人的風(fēng)格特點(diǎn)提供了技術(shù)途徑。
本文對于作戰(zhàn)系統(tǒng)中人的風(fēng)格研究,是對一般作戰(zhàn)規(guī)律中人的作用原理進(jìn)行的初步探索。研究主要聚焦于作戰(zhàn)指揮員的指揮風(fēng)格研究,通過分析不同指揮風(fēng)格下雙方部隊進(jìn)行對抗的效果,獲得各類指揮風(fēng)格在特定戰(zhàn)場條件下進(jìn)行對抗的一般規(guī)律,從而為當(dāng)前信息化戰(zhàn)爭條件下培養(yǎng)什么樣的指揮員提供建議,也可以在實(shí)際作戰(zhàn)和演習(xí)中,確定了敵方指揮員指揮風(fēng)格的基礎(chǔ)上,為我方指揮員在完善自我的指揮風(fēng)格上提供參考意見。
西方人用“血膽英雄”來形容巴頓,用“沙漠之狐”來描述隆美爾,用“穩(wěn)扎穩(wěn)打”來形容蒙哥馬利,周恩來總理評價鄧小平和劉伯承時分別使用了“舉重若輕”和“舉輕若重”[9],以上是對這些優(yōu)秀指揮員指揮風(fēng)格的概括。對于“指揮風(fēng)格”的概念,目前還沒有一個精確且權(quán)威的定義。一般來說,指揮風(fēng)格是指揮員在指揮部隊作戰(zhàn)中表現(xiàn)出的作風(fēng)和特點(diǎn)。它溶入了鮮明的個性特征,是一種強(qiáng)烈的個人行為方式。指揮員獨(dú)特的秉性,慣用的戰(zhàn)法乃至處世的特點(diǎn)構(gòu)成其獨(dú)特的指揮風(fēng)格。正是這種強(qiáng)烈的個性色彩,使指揮風(fēng)格呈現(xiàn)出千人千面,五彩繽紛的形式[10]。指揮風(fēng)格對指揮員來說,是其在進(jìn)行指揮工作的特點(diǎn),無論對于上級指揮員還是下級部署都具有特殊的作用,影響著上級遣將用人以及下級部屬的戰(zhàn)斗風(fēng)格。美軍向來重視指揮風(fēng)格的塑造,美軍認(rèn)為戰(zhàn)斗力生成必不可少的要素是能勝任和充滿信心的指揮官,而指揮官是由于其道德品質(zhì),堅強(qiáng)的意志力和業(yè)務(wù)能力而被選中遂行任務(wù)的。指揮官強(qiáng)有力的業(yè)務(wù)能力、個性和意志是任何部隊?wèi)?zhàn)斗力的一個重要組成部分[11]。指揮風(fēng)格是贏得戰(zhàn)爭勝利的重要品格,它可以成倍提高戰(zhàn)斗力,它與改進(jìn)戰(zhàn)術(shù)原則和武器同等重要,因此,應(yīng)下大力補(bǔ)充、培養(yǎng)、塑造。
部隊?wèi)?zhàn)斗力來源于指揮人員的素質(zhì)。一旦部隊投入戰(zhàn)斗,部隊在戰(zhàn)場上的行動取決于各級指揮員的指揮,而在指揮員的指揮過程中,除了遵循一般的戰(zhàn)斗規(guī)則對部隊的行動作出相應(yīng)的指令,指揮風(fēng)格對于指揮員制定決策具有重要的影響作用,例如同樣的進(jìn)攻命令,具有進(jìn)取特點(diǎn)的指揮員會要求部隊迅速靠近敵方,而比較保守的指揮員可能會選擇與友方匯合形成優(yōu)勢力量后再向敵方靠近,不同風(fēng)格類型的作戰(zhàn)行動可能導(dǎo)致不同的結(jié)果。一個具有優(yōu)秀素質(zhì)的指揮員能夠真正把握自身的指揮風(fēng)格,從而在不同的戰(zhàn)場條件下進(jìn)行適當(dāng)?shù)恼{(diào)整,使得指揮決策過程能夠更好地適應(yīng)戰(zhàn)場局勢。在一定意義上,指揮員的指揮風(fēng)格也代表著他所屬部隊的作戰(zhàn)行動風(fēng)格,兵書《六韜》中曾經(jīng)指出:“將不仁,則三軍不親;將不勇,則三軍不銳;將不智,則三軍大疑?!币虼耍瑢χ笓]員指揮風(fēng)格的研究也就包括了對整個部隊的作戰(zhàn)行動風(fēng)格研究。
指揮風(fēng)格與指揮員的性格、知識儲備有關(guān),典型的指揮風(fēng)格包括果敢型、慎思型、平和型和進(jìn)取型等等[8]。不同類型的指揮風(fēng)格具有不同的特點(diǎn),但是并不完全獨(dú)立,例如果敢型和進(jìn)取型在面對戰(zhàn)場態(tài)勢的把握上均表現(xiàn)為積極主動、迅速反應(yīng)。指揮風(fēng)格的劃分并不代表指揮員類型的劃分,一個指揮員可能近于某種指揮風(fēng)格,也可能是幾種指揮風(fēng)格的中間類型。一般來說,典型的指揮風(fēng)格彼此并無優(yōu)劣之分,在不同的作戰(zhàn)環(huán)境、作戰(zhàn)對手下,某種指揮風(fēng)格會表現(xiàn)出更有效的指揮效果。通過對指揮風(fēng)格進(jìn)行建模分析,針對不同風(fēng)格下的作戰(zhàn)部隊進(jìn)行對抗仿真實(shí)驗,用定量分析的方法確定在敵方具有某種指揮風(fēng)格的條件下,我方具備什么樣的指揮風(fēng)格,才能取得更好的作戰(zhàn)效果,這正是我們研究的主要內(nèi)容。
個性指的是在個體自然素質(zhì)基礎(chǔ)上,由于環(huán)境和實(shí)踐的影響,通過較長時間的活動而形成并且經(jīng)常表現(xiàn)出來的、具有一定傾向性的獨(dú)特和穩(wěn)定的心理品質(zhì)的總和[12-14]。個性的表現(xiàn)主要是兩個方面作用的結(jié)果,包括內(nèi)在心理和外在約束。因此,在作戰(zhàn)Agent的仿真模型中,構(gòu)建Agent的內(nèi)部意愿和自身行為準(zhǔn)則。內(nèi)部意愿對應(yīng)于個性中的內(nèi)在心理,自身行為準(zhǔn)則對應(yīng)于外在的行為規(guī)則對個體的影響作用,兩種形式共同作用,從而涌現(xiàn)出了宏觀的個性特點(diǎn),因此,把這種針對Agent的內(nèi)部意愿和自身行為準(zhǔn)則進(jìn)行建模的方法稱為Agent個性建模。
內(nèi)部意愿指的是在機(jī)動、進(jìn)攻、防御、指揮等作戰(zhàn)行為中驅(qū)使Agent采取堅定行動或者通過特殊行為證明自身的傾向,在某些情況或者某種行為刺激下,Agent會采取不同的態(tài)度并照此行事。內(nèi)部意愿反映的是Agent模型的內(nèi)部價值體系,在數(shù)學(xué)上可以表示為[-1,1]之間的數(shù)值,數(shù)值越大,表示A-gent對于該具體動作的傾向性越大,反之則越小。不同的內(nèi)部意愿相互組合,會導(dǎo)致Agent選擇不同的行為,在外部則體現(xiàn)出該Agent獨(dú)有的個性,內(nèi)部意愿按照作戰(zhàn)行為類型主要分為機(jī)動意愿、攻擊意愿、指控意愿、偵察意愿、環(huán)境反應(yīng)意愿等。
Agent的作戰(zhàn)行為產(chǎn)生主要依賴內(nèi)部意愿,內(nèi)部意愿按照不同的行為模型進(jìn)行綜合,結(jié)果值是Agent自身判斷如何行動的依據(jù)。例如機(jī)動行為,相關(guān)因素主要有N個,每個因素可以表示為一個向量,當(dāng)N個因素進(jìn)行綜合之后形成的向量value即代表Agent機(jī)動的方向。
定義向量 vect1(敵方),vect2(友方),vect3(地形),vect4(方向)…,向量X各個屬性的重要度然后相加。選擇移動方向時表示為
式中,n表示對Agent移動具有影響的因素個數(shù),wi表示Agent向第i個因素移動的意愿權(quán)重,φ(vecti)為一向量,表示Agent第i個因素vect的作用。
自身行為準(zhǔn)則指的是Agent在外界環(huán)境變化時決定Agent的行為狀態(tài)發(fā)生變化的依據(jù)。指揮員在指揮作戰(zhàn)時,除了根據(jù)自身的好惡和習(xí)慣,更重要的是根據(jù)一些通用的作戰(zhàn)規(guī)則來進(jìn)行決策,孫子兵法中說過“十則圍之,倍則殲之”,講的就是在雙方兵力對比條件下的一種決策規(guī)則。然而,作戰(zhàn)規(guī)則是不變的,每個指揮員的理解和使用卻是千差萬別,對于不同指揮風(fēng)格的指揮員來說,慎思型有可能選擇兵力對比3∶1的情況下進(jìn)行殲敵的決策,進(jìn)取型有可能選擇1.5∶1的情況下進(jìn)行殲敵的決策,這種對于作戰(zhàn)規(guī)則的理解就是我們所說的自身行為準(zhǔn)則。自身行為準(zhǔn)則的不同導(dǎo)致Agent選擇不同的行為,從而體現(xiàn)獨(dú)有的個性。自身行為準(zhǔn)則在Agent仿真平臺中表示為不同類型的觸發(fā)器,根據(jù)實(shí)體的行為準(zhǔn)則,對構(gòu)建Agent行為準(zhǔn)則觸發(fā)器主要包括命令觸發(fā)器、任務(wù)觸發(fā)器、時間觸發(fā)器、生命值觸發(fā)器、力量對比觸發(fā)器、命中觸發(fā)器等。當(dāng)A-gent所處的環(huán)境滿足該觸發(fā)器的條件時,觸發(fā)器觸發(fā),Agent的行為發(fā)生改變。
平時所謂的個性,并不是一種直接作用于感官和思維上的特點(diǎn),不能直接看某個人一眼就可以判斷出他的個性,而是通過言談舉止、行為特點(diǎn)等綜合進(jìn)行分析,從而得到這個人的個性特點(diǎn)。在Agent個性建模中,Agent的內(nèi)部意愿以及自身行為準(zhǔn)則共同作用,在宏觀上涌現(xiàn)出了不同的表現(xiàn),這些表現(xiàn)包括自身的行為特點(diǎn)以及面對環(huán)境變化時的變化特點(diǎn)等內(nèi)容,綜合這些特點(diǎn)正是形成了Agent的個性。
指揮員在作戰(zhàn)指揮中具有的個性即為通常所說的指揮風(fēng)格,通過對指揮風(fēng)格進(jìn)行剖析可以發(fā)現(xiàn),指揮員的指揮風(fēng)格主要受戰(zhàn)斗意志、精神品質(zhì)等內(nèi)在的要素、所掌握的知識和能力以及作戰(zhàn)常識等方面影響的。在Agent仿真中,每個Agent一般都代表一個作戰(zhàn)單元,如連、營、團(tuán)等,Agent表現(xiàn)的各類行為是對該部隊的指揮員帶領(lǐng)所有下級進(jìn)行作戰(zhàn)行動的仿真,因此,該Agent的行為表現(xiàn)出來的個性可以看作指揮員的指揮風(fēng)格的仿真。通過A-gent個性模型的構(gòu)建,可以對指揮員指揮風(fēng)格以及整個作戰(zhàn)部隊的作戰(zhàn)風(fēng)格進(jìn)行分析。通過對指揮風(fēng)格進(jìn)行細(xì)致的描述,將定性化的一些風(fēng)格特點(diǎn)描述轉(zhuǎn)化為定量化的數(shù)學(xué)模型,從而研究不同的指揮風(fēng)格在作戰(zhàn)中的作用。因此,Agent個性的不同反映了指揮風(fēng)格的差異,決定了指揮員在面臨不同的戰(zhàn)場態(tài)勢時所采取的不同作戰(zhàn)行為。
仿真實(shí)驗基于本團(tuán)隊自主研發(fā)的陸軍復(fù)雜性戰(zhàn)法實(shí)驗系統(tǒng)進(jìn)行實(shí)驗分析,該系統(tǒng)基于MAS理論開發(fā)設(shè)計,可以對作戰(zhàn)復(fù)雜系統(tǒng)實(shí)驗提供平臺支撐。系統(tǒng)提供了作戰(zhàn)實(shí)驗所需仿真引擎,構(gòu)建了戰(zhàn)場環(huán)境、實(shí)體、關(guān)系、毀傷等模型,可以進(jìn)行人不在回路的推演仿真實(shí)驗。
在確定紅藍(lán)雙方兵力編組的條件下,分別對藍(lán)方兵力Agent個性進(jìn)行調(diào)整,確定幾種典型的個性樣式,以模擬不同的指揮風(fēng)格,在此基礎(chǔ)上進(jìn)行紅方兵力Agent的個性優(yōu)化實(shí)驗,通過實(shí)驗系統(tǒng)提供的遺傳算法優(yōu)化功能,以紅方取得最優(yōu)戰(zhàn)果作為優(yōu)化目標(biāo),對紅方Agent的個性參數(shù)(包括內(nèi)部意愿參數(shù)、自身行為準(zhǔn)則參數(shù))進(jìn)行優(yōu)化,獲得紅方A-gent的最優(yōu)個性值。通過分析最優(yōu)個性值,確定紅方Agent個性所代表的指揮風(fēng)格。
實(shí)驗主要設(shè)置3組數(shù)據(jù),紅藍(lán)雙方各包括20個Agent,每個Agent生命值為100,分別按照藍(lán)方的個性為保守、中庸、激進(jìn)3種類型,由于個性參數(shù)較多,在此選擇較為典型的參數(shù)作為優(yōu)化參數(shù),其余參數(shù)選擇中間值(它們對應(yīng)的參數(shù)權(quán)重設(shè)置為0或者微小值),主要選擇表1中所列的7個參數(shù),白底的藍(lán)方參數(shù)值為預(yù)設(shè),其中,力量對比觸發(fā)器觸發(fā)的是后退行為。
遺傳算法參數(shù)設(shè)置:
1)編碼:以Agent個性參數(shù)值作為染色體的基因,不同參數(shù)對應(yīng)不同的基因位置;
2)生成初始種群:初始種群規(guī)模設(shè)為300;
4)選擇、交叉和變異:本實(shí)驗采用輪盤法選擇優(yōu)良個體,同時采用最優(yōu)保存策略,適應(yīng)度值最大的染色體不參與操作;
5)算法終止條件:當(dāng)適應(yīng)度函數(shù)不發(fā)生改變時(或最大迭代次數(shù)超過500),即終止運(yùn)算,輸出結(jié)果。
按照參數(shù)設(shè)計進(jìn)行3組紅藍(lán)對抗實(shí)驗,分別對紅方個性進(jìn)行優(yōu)化,確定紅方最優(yōu)個性值,仿真推演界面如圖1所示,智能優(yōu)化界面如圖2所示。
將優(yōu)化后獲得的紅方個性值填入表1中灰底部分,分別對數(shù)據(jù)進(jìn)行對比分析,可知:
表1 優(yōu)化參數(shù)結(jié)果表
1)第1組實(shí)驗中,仿真到179個步長時,紅方勝利,且兵力損失比藍(lán)方少很多,本實(shí)驗中藍(lán)方為中庸個性,各要素均采取中間的意愿值,對紅方個性數(shù)據(jù)分析,獲得優(yōu)化后的紅方具有輕微遠(yuǎn)離敵方的傾向,但是對于受傷敵方具有中等程度的接近傾向,友方之間采取較低的靠近意愿,靠近指揮員意愿非常高,對敵攻擊意愿較低,在攻擊時優(yōu)先打擊遠(yuǎn)處的敵人,在局部力量對比為3.32∶1的條件下采取后退行為。根據(jù)以上分析可知,當(dāng)敵方為中庸個性時,我方在對接敵、攻擊上采取保守行為,優(yōu)先攻擊遠(yuǎn)處敵人,保持疏散隊形,各下級成員具有較低的自主決策能力,這樣的部隊行動特點(diǎn)和指揮員指揮風(fēng)格在面對敵方為中庸指揮風(fēng)格時具有較高的對抗優(yōu)勢。
2)同理,第2組實(shí)驗中,藍(lán)方為保守個性,各要素均采取謹(jǐn)慎的意愿值,通過數(shù)據(jù)分析,紅方具有強(qiáng)烈的接敵和攻擊意愿,己方之間采取分散的隊形,各成員之間采取更加自主的決策意愿,在攻擊范圍內(nèi)優(yōu)先打擊遠(yuǎn)處敵人,這樣的部隊行動特點(diǎn)和指揮員指揮風(fēng)格在面對敵方為保守指揮風(fēng)格時具有較高的對抗優(yōu)勢。
3)第3組實(shí)驗中,藍(lán)方為激進(jìn)個性,各要素均采取激進(jìn)的意愿值,通過優(yōu)化分析,紅方在接敵和攻擊上均采取相對謹(jǐn)慎的行為,優(yōu)先打擊攻擊范圍內(nèi)中心的敵人,己方采取較為緊密的隊形,具有較低的決策自主性。這樣的部隊行動特點(diǎn)和指揮員指揮風(fēng)格在面對敵方為激進(jìn)指揮風(fēng)格時具有較高的對抗優(yōu)勢。
4)通過3組實(shí)驗的對比分析可知,在敵方個性值發(fā)生變化的情況下,通過遺傳算法進(jìn)行優(yōu)化獲得的紅方個性值也發(fā)生了相應(yīng)的變化,說明在戰(zhàn)場上面對不同指揮風(fēng)格的敵方時,我方指揮員也要相應(yīng)改變自身的指揮風(fēng)格,如此才能獲得一定的對抗優(yōu)勢。而到底需要改變成怎樣的指揮風(fēng)格,正是對個性實(shí)驗數(shù)據(jù)進(jìn)行智能優(yōu)化的基礎(chǔ)上分析獲得的。
以上通過橫向分析和縱向分析的實(shí)驗結(jié)果,充分說明指揮風(fēng)格是可以被仿真的,通過智能優(yōu)化算法對紅方的個性值進(jìn)行優(yōu)化,可以在確定的敵方指揮風(fēng)格下、確定的戰(zhàn)場條件下,獲得有利于我方的指揮風(fēng)格數(shù)據(jù),通過對數(shù)據(jù)進(jìn)行分析,可以確定不同的指揮風(fēng)格在特定的戰(zhàn)場條件下進(jìn)行對抗效果的一般規(guī)律,從而為培養(yǎng)優(yōu)秀的指揮員以及指揮員在戰(zhàn)場上修正自己的指揮風(fēng)格提供指導(dǎo)與建議。
本文主要研究如何對Agent個性進(jìn)行建模分析,從而對當(dāng)前作戰(zhàn)中的指揮員指揮風(fēng)格進(jìn)行定量化的分析,為培養(yǎng)優(yōu)秀指揮員的指揮風(fēng)格,為指揮員在戰(zhàn)場上如何清晰認(rèn)識自身指揮風(fēng)格的弊端,以及因人而異地修正完善指揮特點(diǎn)提供指導(dǎo)意見。通過典型化的對抗仿真實(shí)驗,對建模和分析理論進(jìn)行了驗證。當(dāng)然,指揮員的指揮風(fēng)格與Agent的個性并不是簡單的以上要素的組合,它是大量要素共同作用的結(jié)果。本文實(shí)驗中所列舉的要素僅僅是幾個典型的要素,在真正的指揮風(fēng)格分析中,需要對各類要素進(jìn)行精細(xì)分析以及綜合,才能分析出在敵方指揮風(fēng)格已定的條件下,我方應(yīng)該具有的指揮決策特點(diǎn)。在下一步的研究中,將著重對Agent個性進(jìn)行細(xì)化,使其能夠更好地模擬指揮員的指揮風(fēng)格,并在此基礎(chǔ)上,研究在不同的戰(zhàn)場環(huán)境、作戰(zhàn)態(tài)勢下,在不同的兵力對比條件下,進(jìn)行敵方雙方的指揮風(fēng)格分析實(shí)驗。