周慶忠,王 冰,陸思錫
(后勤工程學(xué)院,重慶 400016)
油料保障系統(tǒng)(POL support system,POLSS)將分布油料資源集成,形成多保障自治域,組成油料保障聯(lián)盟(POL support alliance,POLSA),自治感知響應(yīng)動(dòng)態(tài)環(huán)境,實(shí)現(xiàn)協(xié)同保障。在系統(tǒng)開(kāi)發(fā)中,通常將自治與協(xié)同性能融入特定功能。這隱含地意味著未對(duì)系統(tǒng)投入使用后的效果進(jìn)行充分檢查,存在自治智能離散層,導(dǎo)致系統(tǒng)自治與協(xié)同功能不平衡[2]。在保障任務(wù)任何階段,系統(tǒng)可能同時(shí)處于多個(gè)離散層,以便根據(jù)當(dāng)前保障態(tài)勢(shì)進(jìn)行自治控制。若將這類“自治層”處理作為開(kāi)發(fā)系統(tǒng)路線圖,會(huì)引發(fā)對(duì)硬件或軟件的過(guò)度關(guān)注,將導(dǎo)致最終只是提供特定功能,而不是提高感知態(tài)勢(shì)、協(xié)同保障整體效能。本文對(duì)POLSS自治與協(xié)同功能不平衡問(wèn)題進(jìn)行研究,尋求在分布動(dòng)態(tài)環(huán)境下,油料保障自治與協(xié)同效能適配的解決方案,對(duì)增強(qiáng)POLSS感知環(huán)境、協(xié)同保障響應(yīng)能力具有重要意義。
POLSA成員以多自治域?qū)哟谓换f(xié)同模式來(lái)實(shí)施保障。設(shè) POLSA 有 n 個(gè)成員 ai(i=1,2,…,n),ai∈POLSA,將聯(lián)盟成員構(gòu)成自治域Dai。自治域采用松耦合管理方式,以多庫(kù)(數(shù)據(jù)庫(kù)、知識(shí)庫(kù)、政策庫(kù)、規(guī)則庫(kù)等)聯(lián)合方式進(jìn)行數(shù)據(jù)操作。在油料保障政策全局調(diào)控下,共享油料保障資源,實(shí)現(xiàn)自治與協(xié)同平衡的跨域協(xié)同油料保障。構(gòu)建模型構(gòu)架如圖1所示。
圖1 POLSS自治協(xié)同模型構(gòu)架
POLSS獲取自治與協(xié)同性能主要通過(guò)以下3個(gè)功能單元的配置來(lái)實(shí)現(xiàn)。
該單元用于感知保障硬環(huán)境變化。融入到物理裝備硬件級(jí)別的互動(dòng)自治,被用來(lái)解釋操作指令、控制操作活動(dòng),監(jiān)測(cè)物理裝備運(yùn)行狀態(tài),對(duì)采集數(shù)據(jù)進(jìn)行實(shí)時(shí)處理。需感知的態(tài)勢(shì)很可能是危險(xiǎn)情形。例如,加油過(guò)程監(jiān)控,需監(jiān)測(cè)狀態(tài)有漏油、泄油、甚至中毒、爆炸。對(duì)此,自治功能可以不同方式給予協(xié)助,例如遠(yuǎn)程遙控加油、飛機(jī)空中加油、油庫(kù)安全智能監(jiān)控等[3]。自治神經(jīng)網(wǎng)絡(luò)(autonomous artificial neural network,AANN),是實(shí)現(xiàn)自主預(yù)測(cè)感知裝備狀態(tài)的有效方法之一。由多個(gè)AANN獨(dú)立地感知,融合感知信息形成對(duì)裝備狀態(tài)的綜合評(píng)估。
該單元用于認(rèn)知油料保障軟環(huán)境變化。關(guān)注如何根據(jù)油料保障動(dòng)態(tài)空間,分配保障資源和任務(wù)。保障軟環(huán)境態(tài)勢(shì)對(duì)保障質(zhì)量影響至關(guān)重要,各級(jí)人員易忽視這點(diǎn)。例如,對(duì)多個(gè)保障目標(biāo),派發(fā)幾十個(gè)保障任務(wù),每個(gè)任務(wù)包含多項(xiàng)作業(yè),以往采用大量手工方式進(jìn)行決策操作,費(fèi)時(shí)費(fèi)力,效率低且可靠性差。而采用基于優(yōu)化的規(guī)劃工具、智能分析軟件,可輔助決策者,對(duì)增長(zhǎng)數(shù)據(jù)量排序,提取相關(guān)信息,完成規(guī)劃決策。POLSS各類組件Agent和“用戶”角色自治性,使得成員在保障政策許可下,延伸其控制范圍,擴(kuò)大信息搜索空間,增強(qiáng)應(yīng)變能力。隨著聯(lián)合油料保障行動(dòng)展開(kāi),跨域、跨層和跨角色間協(xié)作越為重要。各自治域子系統(tǒng)均配置且共享認(rèn)知功能,各級(jí)決策者在權(quán)限范圍內(nèi)進(jìn)行通信協(xié)作。
該單元用于實(shí)現(xiàn)人與系統(tǒng)交互溝通,例如:如何塑造人與系統(tǒng)間工作關(guān)系或因果關(guān)系的互動(dòng);如何學(xué)習(xí)、增強(qiáng)人與系統(tǒng)協(xié)同;如何預(yù)測(cè)人—系統(tǒng)Agent團(tuán)隊(duì)的可用性和可靠性;如何捕捉和表達(dá)在特定保障問(wèn)題域的人—系統(tǒng)相互作用;如何將油料保障方案特征化呈現(xiàn)給各級(jí)決策者。人機(jī)交互的主要挑戰(zhàn)是如何增加系統(tǒng)能力,提供相互可預(yù)測(cè)性(誰(shuí)何時(shí)做什么)、直接能力(不但指定目標(biāo),而且如何適應(yīng)意外)、共同點(diǎn)(包括特殊語(yǔ)言或協(xié)議,以確保人和系統(tǒng)共享目標(biāo)和信息)。
將POLSA成員視為是由保障目標(biāo)驅(qū)動(dòng)的自治Agent,具有適應(yīng)保障態(tài)勢(shì)的自治決策、與其他Agent協(xié)作等能力,圍繞保障總目標(biāo),按預(yù)定策略,根據(jù)對(duì)所處保障環(huán)境的認(rèn)知,自主地對(duì)權(quán)限范圍內(nèi)的保障行動(dòng)決策。在POLSA頂層設(shè)置全局總管Agent TMA,協(xié)調(diào)、控制成員協(xié)同保障。各自治域設(shè)置主管Agent MA。根據(jù)油料保障決策時(shí)自治與協(xié)同強(qiáng)弱程度,將MA分為3類。
式中,ni表示第i類自治域的個(gè)數(shù)。
1)Agent MA1—弱自治弱協(xié)同型。例如,POLSA中的煉油廠、石油公司、鐵道運(yùn)輸部、航運(yùn)公司等國(guó)營(yíng)、民營(yíng)單位。MA1具有反應(yīng)性、持續(xù)性。“被動(dòng)”接受TMA發(fā)派的任務(wù),在保障政策約束下,具體行動(dòng)雖可由其自身控制,但整個(gè)執(zhí)行過(guò)程受TMA監(jiān)控,對(duì)環(huán)境變化只是適當(dāng)響應(yīng)。與其它自治域通信交互較少,不能察覺(jué)其它成員的保障任務(wù)和目標(biāo),獨(dú)立地按保障目標(biāo)執(zhí)行保障任務(wù)。
2)Agent MA2—強(qiáng)自治弱協(xié)同型。例如:POLSA中的軍區(qū)、武警部隊(duì)、警備區(qū)、空軍、海軍等后勤部門。除了具有MA1性能外,MA2還具有目標(biāo)導(dǎo)向性、主動(dòng)性。其本身具有特定保障目標(biāo),行動(dòng)不受外部自治域狀態(tài)變化影響。例如,空軍部門具有航空油料保障目標(biāo),當(dāng)接受全局總管TMA派發(fā)的保障任務(wù)后,調(diào)整其所屬各類Agent狀態(tài),進(jìn)入油料保障部署,由此所產(chǎn)生的狀態(tài)變化呈隱式,其他區(qū)域(如海軍、軍區(qū)等)保障部署不直接影響其內(nèi)部活動(dòng)。執(zhí)行保障任務(wù)時(shí),與其它自治域有一定聯(lián)系,察覺(jué)到對(duì)方保障行動(dòng),但不通信與交流保障意圖和計(jì)劃。在各自區(qū)域并行地完成保障任務(wù)。
3)Agent MA3—強(qiáng)自治強(qiáng)協(xié)同型。MA3除了具有MA2的性能之外,還具有適應(yīng)性。根據(jù)保障行動(dòng)結(jié)果自身評(píng)估保障效能,相互協(xié)同,調(diào)整保障行動(dòng)計(jì)劃以適應(yīng)環(huán)境。例如,在特定環(huán)境,MA3j認(rèn)知到其當(dāng)前執(zhí)行行動(dòng)狀態(tài)對(duì)另一個(gè)MA3k產(chǎn)生負(fù)面作用,影響整體保障質(zhì)量時(shí),及時(shí)調(diào)整執(zhí)行計(jì)劃。在執(zhí)行任務(wù)時(shí),頻繁互動(dòng)保持通信交流信息,明確地表達(dá)各自意圖和計(jì)劃,實(shí)時(shí)地感知對(duì)方行動(dòng),相互間緊密協(xié)同。
對(duì)各類保障人員Agent進(jìn)行用戶角色分類,賦予相應(yīng)權(quán)限和職責(zé)。
角色1:任務(wù)指揮官、主管人員、網(wǎng)絡(luò)分析師、技術(shù)支持人員,職責(zé)為保障規(guī)劃、方案評(píng)估、應(yīng)急決策和管理。
角色2:部門領(lǐng)導(dǎo)、團(tuán)隊(duì)負(fù)責(zé)人及其成員,職責(zé)為任務(wù)規(guī)劃與決策、任務(wù)調(diào)整與重新規(guī)劃、保障失效預(yù)測(cè)管理、多A-gent通信與協(xié)同。
角色3:業(yè)務(wù)員、加油員、安檢員,操作員,職責(zé)為具體行動(dòng)指導(dǎo)與控制(如控制加油裝置、操作傳感器)、油料保障硬件資源(用油裝備、儲(chǔ)運(yùn)設(shè)備、傳感器等檢測(cè)設(shè)備)管理、油料裝備故障檢測(cè)與健康管理、通信和狀態(tài)監(jiān)控。
供應(yīng)鏈協(xié)同規(guī)劃通?;诤贤W(wǎng)協(xié)議(CNP)和擴(kuò)充合同網(wǎng)協(xié)議(extended contract net protocol,ECNP),基本機(jī)理是自治Agent基于各自利益,實(shí)現(xiàn)協(xié)同任務(wù)分配[4,5]。但油料保障事關(guān)國(guó)家安全,應(yīng)以聯(lián)合行動(dòng)目標(biāo)為中心。因此,系統(tǒng)設(shè)置油料保障政策調(diào)控機(jī)制,創(chuàng)建政策引導(dǎo)Agent PAi(i=1,2,…,m),控制聯(lián)盟成員協(xié)同行動(dòng)。各PAi所表示的保障策略、原則,儲(chǔ)存在政策庫(kù)。PAi設(shè)有政策執(zhí)行點(diǎn)PEP、政策決策點(diǎn)。引入政策監(jiān)測(cè)組件PMP,監(jiān)控PAi行動(dòng)及其環(huán)境,并將監(jiān)控?cái)?shù)據(jù)存儲(chǔ)于事件庫(kù)。設(shè)置政策合規(guī)性檢查組件,監(jiān)控保障政策執(zhí)行情況。它覆蓋由PEP所觸發(fā)的預(yù)期行動(dòng)。被PMP所捕獲的事件包括各保障執(zhí)行Agent的相互作用、行動(dòng)動(dòng)態(tài)和各類保障資源Agent的當(dāng)前狀態(tài)等。
從以下5個(gè)設(shè)計(jì)空間,來(lái)實(shí)現(xiàn)POLSS自治與協(xié)同的平衡,將失衡癥狀與失衡源頭相鏈接。
該空間采用對(duì)新保障任務(wù)或意外情況的適應(yīng)能力,來(lái)平衡油料保障質(zhì)量最優(yōu)化。為了增加自治能力,可能使用基于假設(shè)的優(yōu)化模擬算法,實(shí)際保障環(huán)境復(fù)雜多變,算法使用在一定程度上削弱了對(duì)環(huán)境感知,阻礙系統(tǒng)適應(yīng)意外局勢(shì),給系統(tǒng)造成負(fù)面影響。不平衡警示有:系統(tǒng)脆性增加,難于適應(yīng)變化局勢(shì),處于不穩(wěn)定狀態(tài);保障執(zhí)行力不持久;人力資源成本超過(guò)預(yù)期。例如,遠(yuǎn)洋島嶼環(huán)境聯(lián)合行動(dòng),油料補(bǔ)給線長(zhǎng)、運(yùn)輸難度大,若片面追求全局統(tǒng)籌最優(yōu),會(huì)制定出超負(fù)荷的不可行方案。應(yīng)權(quán)衡保障質(zhì)量最優(yōu)與保障力量部署,采用跨域聯(lián)盟成員(如三軍聯(lián)勤、中石油、中海油等)協(xié)同保障。
該空間用于反映系統(tǒng)效率與完整性間相互作用?;谀承┘僭O(shè)的算法用于調(diào)整規(guī)劃,阻礙了對(duì)保障態(tài)勢(shì)感知。即使系統(tǒng)及其操作者已注意到規(guī)劃對(duì)于當(dāng)前態(tài)勢(shì)不再有效,但算法卻難于及時(shí)做出有效調(diào)整。追求系統(tǒng)效率常專注于預(yù)期效果,卻忽視對(duì)執(zhí)行情況全面檢查,造成系統(tǒng)效率與完整性間不平衡。其警示有:忽視規(guī)劃瓶頸問(wèn)題;雖認(rèn)識(shí)到規(guī)劃與當(dāng)前態(tài)勢(shì)不匹配,但仍在執(zhí)行;感知到規(guī)劃不適宜當(dāng)前局勢(shì),回落到設(shè)定的重新規(guī)劃,卻未考慮當(dāng)前局勢(shì)新約束。平衡該空間需了解油料保障意圖,自主地爭(zhēng)取較多資源或采用不同算法。
該空間表示油料保障資源集中與分布間平衡。關(guān)注問(wèn)題有:確定何時(shí)采用集中于一個(gè)單位行動(dòng)的保障模式;何時(shí)采用跨聯(lián)盟成員的協(xié)同保障模式;如何使來(lái)自遠(yuǎn)程自治域與本域信息可見(jiàn)、不被模糊化;融合各自治域保障信息,用于油料保障決策。不平衡警示是:因管理協(xié)同活動(dòng)人力增加而造成高成本;油料保障分布式部署不合理;未充分利用或不信任分布式油料保障,導(dǎo)致“微觀管理”,聯(lián)盟成員被動(dòng)執(zhí)行任務(wù),自治能力受損。過(guò)度信任聯(lián)盟成員,缺少對(duì)各自治域保障行動(dòng)缺乏統(tǒng)一約束,難于維持分布式保障資產(chǎn)合理性。要平衡這一空間需加強(qiáng)規(guī)劃和調(diào)度能力,動(dòng)態(tài)地派發(fā)保障任務(wù)。
該空間用于反映油料保障空間本地與全局視圖間平衡。通過(guò)網(wǎng)絡(luò),延伸、感知遠(yuǎn)程保障環(huán)境。對(duì)保障區(qū)域態(tài)勢(shì)的感知有時(shí)隱蔽或分布在另一個(gè)感知里,需從局部和全局視圖中獲取。這兩個(gè)視圖不平衡極易造成難于發(fā)現(xiàn)保障環(huán)境中首要事件和動(dòng)態(tài)變化,數(shù)據(jù)過(guò)載,降低油料保障決策效率??刹扇?duì)保障態(tài)勢(shì)自動(dòng)感知來(lái)解決此問(wèn)題,迫使決策者冷靜地對(duì)保障環(huán)境進(jìn)行感知和推理。并增加自治性。采用感知接口和通道,通過(guò)計(jì)算機(jī)視覺(jué)、傳感器饋送、自主推理等方式,協(xié)作引導(dǎo)各級(jí)決策者,識(shí)別和重新關(guān)注高度相關(guān)事件。
該空間用于表示各自治域聯(lián)盟成員的短期目標(biāo)和長(zhǎng)期目標(biāo)職責(zé)之間的平衡,用長(zhǎng)期目標(biāo)平衡短期目標(biāo),解決目標(biāo)沖突。不平衡警示有:職責(zé)分布不均,中斷合作與協(xié)調(diào),保障成本增加;監(jiān)控不力;跨域和跨層協(xié)同保障時(shí),對(duì)系統(tǒng)不信任或過(guò)度信任。應(yīng)根據(jù)油料保障決策總則來(lái)設(shè)計(jì)自治與協(xié)同能力,平衡自治域保障職責(zé)。使各級(jí)決策者把重點(diǎn)放在首要保障任務(wù)目標(biāo),對(duì)該任務(wù)保持優(yōu)先級(jí),而不是將精力用于運(yùn)行管理系統(tǒng)上。
油料保障各種協(xié)同過(guò)程,如預(yù)測(cè)、采購(gòu)、庫(kù)存、規(guī)劃、績(jī)效評(píng)估等,涉及保障信息交流[6]。油料保障規(guī)劃被視作是信息交換引擎。其主要因素包括:節(jié)點(diǎn)操作(如接受、發(fā)布任務(wù)、發(fā)送、接收、儲(chǔ)備、運(yùn)輸、訂購(gòu)油料等)、節(jié)點(diǎn)策略(保障政策輸入和輸出等)和保障成本(人力、價(jià)格、資產(chǎn)等)。問(wèn)題描述:聯(lián)合行動(dòng)部隊(duì)的一組不同的油料保障請(qǐng)求S={y0,y1,…,yn},保障規(guī)模n≥2,響應(yīng)保障執(zhí)行單位Agent EA={x0,x1,…,xn},n≥2 EA與保障請(qǐng)求呈“一對(duì)一”映射關(guān)系。對(duì)于所有請(qǐng)求y∈S,各Agent x∈EA向每個(gè)請(qǐng)求提供的保障質(zhì)量被定義為 g[x,y],即對(duì)于 xi,xj∈EA,∏:EA→S,i≠j意味著∏(xi)≠∏(xj)。保障任務(wù)調(diào)度規(guī)劃目標(biāo)是使整體保障質(zhì)量Qst最優(yōu)化
式中,∏(x)∈S表示 Agent x∈EA對(duì)應(yīng)的請(qǐng)求選擇。max{Qst(2)}定義為Agent EA的最優(yōu)整體保障質(zhì)量目標(biāo)。分配集對(duì)應(yīng)于∏(1)的一個(gè)排列。油料勤務(wù)知識(shí)被分布在Agent EA中,對(duì)于所有保障請(qǐng)求y∈S,各執(zhí)行單位x∈EA最初只具有自己的本地信息g[x,y]。通過(guò)保障執(zhí)行單位A-gent x∈EA間協(xié)同分配保障任務(wù)請(qǐng)求,獲得最優(yōu)整體保障質(zhì)量。
設(shè)置節(jié)點(diǎn)Agent NAi表示各節(jié)點(diǎn)間共享信息過(guò)程,NAi具有自治運(yùn)行能力。NAi間交互通信,由其在特定態(tài)勢(shì)下的行為來(lái)觸發(fā),其行為目的是產(chǎn)生油料保障需求和接受保障任務(wù)、識(shí)別此局勢(shì)下協(xié)同或非協(xié)同聯(lián)盟成員、通過(guò)通信協(xié)議接收和發(fā)送消息。多自治Agent交互支持協(xié)同規(guī)劃流程,如圖2所示。
圖2 多自治Agent交互支持協(xié)同規(guī)劃流程
1)信息共享:針對(duì)異構(gòu)數(shù)據(jù)庫(kù),設(shè)置搜索Agent FA,負(fù)責(zé)訪問(wèn)、搜索支持保障節(jié)點(diǎn)決策所需的信息。
2)信息流:與協(xié)同規(guī)劃涉及所有保障節(jié)點(diǎn)信息。當(dāng)信息流動(dòng)考慮與一定必要性相關(guān)的事實(shí)時(shí),自然流動(dòng)將停止,直到初始請(qǐng)求已送達(dá)。
3)保障節(jié)點(diǎn):當(dāng)保障信息交流涉及多自治域多節(jié)點(diǎn)時(shí),談判協(xié)作過(guò)程發(fā)生。反過(guò)來(lái),意味著這些節(jié)點(diǎn)以分布協(xié)同方式,實(shí)時(shí)交流信息,以避免來(lái)自各區(qū)域保障任務(wù)所造成的積壓。此時(shí),各節(jié)點(diǎn)NAi自主地評(píng)估自身能力,在保障相關(guān)政策約束下,執(zhí)行支持相關(guān)保障節(jié)點(diǎn)所要求的任務(wù)。
4)保障任務(wù)時(shí)序:響應(yīng)動(dòng)態(tài)環(huán)境確定任務(wù)執(zhí)行動(dòng)態(tài)優(yōu)先級(jí)。依據(jù)保障策略原則,按各任務(wù)動(dòng)態(tài)優(yōu)先級(jí)進(jìn)行自治式實(shí)時(shí)任務(wù)調(diào)度。通過(guò)協(xié)同保障任務(wù)規(guī)劃的演變,改進(jìn)油料儲(chǔ)備策略,避免保障任務(wù)過(guò)量,獲得油料保障整體最佳效能。
本文所提出的POLSS自治協(xié)同模型,根據(jù)5個(gè)設(shè)計(jì)空間的平衡狀態(tài)來(lái)約束調(diào)整自治與協(xié)同關(guān)系,進(jìn)行多自治Agent的協(xié)同保障規(guī)劃,從而實(shí)現(xiàn)油料保障全局調(diào)控。油料保障自治協(xié)同建模研究,對(duì)于獲得油料保障整體最佳效能、提高油料保障快速響應(yīng)能力具有重要作用。
[1] 周慶忠.油料勤務(wù)[M].北京:國(guó)防出版社,2008.
[2] Law K L E,Saxena A.Scalable design of a policy-based management system and its performance[J].Communications Magazine,2003(41):72 -79,.
[3] 周慶忠,曾慧娥.油料裝備智能維修決策系統(tǒng)研究[J].后勤工程學(xué)院學(xué)報(bào),2009,25(9):33 -37.
[4] Klusch M,Gerber A.Dynamic coalition formation among rational agents[J].IEEE Intelligent Systems,2002(17):42 -47.
[5] McQuay W K.Distributed collaborative environments for systems engineering[J].IEEE Aerospace and Electronic Systems,2005(20):7 -12.
[6] 周慶忠,曾慧娥.基于多智能體的裝備動(dòng)態(tài)優(yōu)化調(diào)撥系統(tǒng)研究[J].機(jī)械工程學(xué)報(bào),2005,41(2):97 -101.
(責(zé)任編輯楊繼森)