?
數(shù)據(jù)挖掘在戰(zhàn)術(shù)導(dǎo)彈保障輔助決策系統(tǒng)中的應(yīng)用
針對(duì)在戰(zhàn)術(shù)導(dǎo)彈保障管理過(guò)程中出現(xiàn)的數(shù)據(jù)種類(lèi)多、業(yè)務(wù)工作量大以及數(shù)據(jù)處理效率不高的問(wèn)題,提出使用輔助決策系統(tǒng)來(lái)優(yōu)化業(yè)務(wù)流程,提高保障效率。以某型裝備的保障為例,針對(duì)保障數(shù)據(jù)做出數(shù)據(jù)挖掘效果仿真,分析裝備的保障特性,總結(jié)保障規(guī)律,為決策者提供科學(xué)的決策依據(jù)。
數(shù)據(jù)挖掘;決策支持;數(shù)據(jù)倉(cāng)庫(kù);決策樹(shù)
隨著全壽命周期管理思想在裝備管理中的不斷應(yīng)用,如何將裝備保障做得更精確、更高效,已經(jīng)成為我軍信息化建設(shè)的一個(gè)熱點(diǎn)。我軍戰(zhàn)術(shù)導(dǎo)彈裝備分布廣泛,型號(hào)、批次眾多,即使是同一種裝備,在不同的地域、不同的氣候條件以及不同的保障單位等都會(huì)造成裝備的性能差異。如果實(shí)施同一的維護(hù)保障手段、方法,同一的管理進(jìn)度,勢(shì)必影響裝備性能的發(fā)揮。本文通過(guò)戰(zhàn)術(shù)導(dǎo)彈保障部門(mén)積累的大量使用維護(hù)數(shù)據(jù),應(yīng)用數(shù)據(jù)挖掘方法來(lái)分析裝備的保障特性,總結(jié)戰(zhàn)術(shù)導(dǎo)彈保障的規(guī)律性特點(diǎn),并將此融入到裝備管理系統(tǒng)中。
輔助決策系統(tǒng)(Decision Support System, DSS) 在裝備保障中的應(yīng)用主要是以軍事裝備學(xué)、軍事運(yùn)籌學(xué)、控制論、思維科學(xué)和行為科學(xué)為基礎(chǔ),以計(jì)算機(jī)技術(shù)、模擬技術(shù)和信息技術(shù)為手段,面向裝備保障決策問(wèn)題,支持指揮員和裝備保障機(jī)關(guān)對(duì)裝備保障活動(dòng)全過(guò)程做出決策[1]。
戰(zhàn)術(shù)導(dǎo)彈保障DSS貫穿于裝備的管理、使用和維護(hù)等各個(gè)環(huán)節(jié)。 應(yīng)用戰(zhàn)術(shù)導(dǎo)彈保障DSS可幫助裝備部門(mén)快速、準(zhǔn)確地掌握導(dǎo)彈裝備的各種信息,有效地提高管理和決策的及時(shí)性、科學(xué)性和準(zhǔn)確性。戰(zhàn)術(shù)導(dǎo)彈裝備保障流程主要包括7個(gè)部分(見(jiàn)圖1)[2]。一般情況下,決策者都是基于對(duì)當(dāng)前裝備保障狀況的掌握,對(duì)未來(lái)裝備保障的需求和發(fā)展做出預(yù)測(cè),從而制定相應(yīng)方案。
圖1 戰(zhàn)術(shù)導(dǎo)彈裝備保障流程
應(yīng)用戰(zhàn)術(shù)導(dǎo)彈保障DSS,除了利用網(wǎng)絡(luò)將各級(jí)保障單位有機(jī)的連成一體,方便、快捷和準(zhǔn)確地傳輸各種裝備保障信息、裝備狀態(tài)參數(shù),還應(yīng)將收集的數(shù)據(jù)進(jìn)行科學(xué)的分析,總結(jié)裝備保障中出現(xiàn)的規(guī)律性現(xiàn)象,以達(dá)到預(yù)測(cè)問(wèn)題并對(duì)癥下藥的效果,為決策者提供科學(xué)的決策依據(jù)。
2.1 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)分析
由裝備保障和倉(cāng)儲(chǔ)可靠性原理可知,影響戰(zhàn)術(shù)導(dǎo)彈保障質(zhì)量的主要自然因素為倉(cāng)儲(chǔ)環(huán)境和儲(chǔ)存時(shí)間。其中,倉(cāng)儲(chǔ)環(huán)境包括自然環(huán)境因素、誘導(dǎo)環(huán)境因素和復(fù)合條件因素,自然環(huán)境因素如導(dǎo)彈倉(cāng)儲(chǔ)的溫度、濕度、低氣壓、細(xì)菌和鹽霧等,誘導(dǎo)環(huán)境因素如機(jī)械沖擊、空氣污染等,還有自然環(huán)境因素和誘導(dǎo)環(huán)境因素同時(shí)作用的復(fù)合條件因素等,均可對(duì)導(dǎo)彈倉(cāng)儲(chǔ)質(zhì)量產(chǎn)生影響[3]。此外,還有人為因素會(huì)對(duì)保障質(zhì)量產(chǎn)生影響,如保障方法和手段。由于導(dǎo)彈裝備的日常維護(hù)、維修、延壽和退役等均是根據(jù)各型裝備維護(hù)細(xì)則和上級(jí)機(jī)關(guān)要求完成,在實(shí)施手段上差異不大,所以本文主要討論自然因素對(duì)導(dǎo)彈保障的影響。
從不同的方向分析戰(zhàn)術(shù)導(dǎo)彈保障質(zhì)量數(shù)據(jù)可以得到許多信息。例如,分析倉(cāng)儲(chǔ)時(shí)間,可以發(fā)現(xiàn)裝備在一年中某個(gè)特定時(shí)間段故障率較高;分析裝備的故障部件,可以發(fā)現(xiàn)哪些部件容易發(fā)生故障,哪些部件的可靠性較高;分析不同單位的保障數(shù)據(jù),可以比較各單位的倉(cāng)儲(chǔ)環(huán)境。
2.2 數(shù)據(jù)倉(cāng)庫(kù)建模
星型模型是一種由一點(diǎn)向外輻射的建模范例,中間有一個(gè)對(duì)象,延半徑向外連接到多個(gè)對(duì)象。星型模型反映了最終用戶對(duì)故障查詢的看法,檢測(cè)的情況、修復(fù)的情況和換件的情況都可以通過(guò)一維或多維來(lái)描述(按時(shí)間、地理分布等)。星型模式中心的對(duì)象稱為事實(shí)表,與之相連的對(duì)象稱為維度表(見(jiàn)表1)。
表1 故障維度表
目前,決策樹(shù)的生成方法主要有2個(gè)著名的算法:ID3算法和C4.5算法,其中,C4.5算法是ID3算法的擴(kuò)充[4],本文采用ID3算法。
信息增益是基于信息論中熵(Entropy)的概念。ID3算法總是選擇具有最高信息增益(或最大熵壓縮)的屬性作為當(dāng)前結(jié)點(diǎn)的測(cè)試屬性。該屬性使得對(duì)結(jié)果劃分中的樣本分類(lèi)所需的信息量最小,并反應(yīng)劃分的最小隨機(jī)性或不純性。采用這種信息理論方法,使得對(duì)一個(gè)對(duì)象分類(lèi)所需的期望測(cè)試數(shù)目達(dá)到最小,并盡量確保找到一棵簡(jiǎn)單的(但不必是最簡(jiǎn)單的)樹(shù)來(lái)刻畫(huà)相關(guān)的信息。
下述結(jié)合表2所示的一組簡(jiǎn)單的假想測(cè)試數(shù)據(jù),介紹數(shù)據(jù)挖掘的數(shù)據(jù)訓(xùn)練過(guò)程、知識(shí)獲取方法,構(gòu)造導(dǎo)彈保障可靠性決策樹(shù)。
表2 某型裝備測(cè)試訓(xùn)練數(shù)據(jù)
設(shè)S是此裝備測(cè)試數(shù)據(jù)所有數(shù)據(jù)樣本的集合,表2 中的10 條測(cè)試數(shù)據(jù)即構(gòu)成了一個(gè)簡(jiǎn)單的S集合。設(shè)所需要分析的結(jié)果屬性具有m個(gè)不同值,定義m個(gè)不同類(lèi)Ci(i=1,2,…,m),表2中共有3個(gè)結(jié)果屬性,m=3。類(lèi)C1對(duì)應(yīng)于“部件老化”;類(lèi)C2對(duì)應(yīng)于“正常”;類(lèi)C3對(duì)應(yīng)于“隨機(jī)故障”。設(shè)si是類(lèi)Ci中的樣本數(shù):類(lèi)C1有3個(gè)樣本,類(lèi)C2有3個(gè)樣本,類(lèi)C3有4個(gè)樣本。則對(duì)給定樣本分類(lèi)所需的期望信息由下式給出:
(1)
式中,pi是任意樣本屬于Ci的概率,一般可以用si/s來(lái)估計(jì)。因?yàn)樾畔⒂枚M(jìn)位編碼,此處對(duì)數(shù)函數(shù)以2為底。由式1得到:
(2)
式中,(s1j+s2j+…+smj)/s是第j個(gè)子集的權(quán),并且等于子集(即A值為aj)中的樣本個(gè)數(shù)除以S中的樣本總數(shù)。熵值越小,子集劃分的純度就越高。根據(jù)上述給出的期望信息計(jì)算公式,對(duì)于給定的子集Sj,其期望信息由下式計(jì)算:
(3)
式中,pij=Sij/Sj是Sj中的樣本屬于類(lèi)Ci的概率。
對(duì)于洞庫(kù)倉(cāng)儲(chǔ)=“否”,s12=1,s22=2,s32=2, 由式3得:
下述計(jì)算每個(gè)屬性的熵。首先計(jì)算屬性為“洞庫(kù)倉(cāng)儲(chǔ)”的熵。觀察屬性“對(duì)每個(gè)分布計(jì)算期望信息。如果樣本按“洞庫(kù)倉(cāng)儲(chǔ)”劃分,對(duì)一個(gè)給定樣本分類(lèi)所需的期望信息為:
由期望信息和熵值可以得到對(duì)應(yīng)的信息增益值。對(duì)于在A上分支將獲得的信息增益計(jì)算公式為:
(4)
則:
同理:
利用ID3算法計(jì)算每個(gè)屬性的信息增益,并選取具有最高增益的屬性作為給定集合S的測(cè)試屬性。對(duì)被選取的測(cè)試屬性逆光創(chuàng)建一個(gè)結(jié)點(diǎn),并以該屬性標(biāo)記,對(duì)該屬性的每個(gè)值創(chuàng)建一個(gè)分支,并據(jù)此劃分樣本。
由上述計(jì)算結(jié)果可知,倉(cāng)儲(chǔ)溫度在屬性中具有最高信息增益,被選作測(cè)試屬性。創(chuàng)建一個(gè)節(jié)點(diǎn),用倉(cāng)儲(chǔ)溫度標(biāo)記,并對(duì)每個(gè)屬性值,引出一個(gè)分支。樣本按此劃分,對(duì)每個(gè)分支再引出分支,用判定樹(shù)歸納分類(lèi)法進(jìn)行分類(lèi),而后繼續(xù)引出分支,最后,算法返回最終的判定樹(shù)(見(jiàn)圖2)。
圖2 數(shù)據(jù)判定樹(shù)
將建立的判定樹(shù)歸納分類(lèi)法模型所確定的檢驗(yàn)集實(shí)例分類(lèi)與正確分類(lèi)值進(jìn)行比較,檢驗(yàn)集分類(lèi)的正確性預(yù)示模型將來(lái)的性能。
為了說(shuō)明上文的數(shù)據(jù)挖掘模型在實(shí)際工作中的應(yīng)用,以某戰(zhàn)術(shù)導(dǎo)彈保障實(shí)例,用決策樹(shù)分類(lèi)方法對(duì)故障部件和故障時(shí)間預(yù)測(cè)。
設(shè)某型導(dǎo)彈裝備服役以來(lái),下發(fā)6個(gè)單位(a,b,c,d,e,f)對(duì)其進(jìn)行技術(shù)保障,各保障單位每次的檢測(cè)結(jié)果都有登記。現(xiàn)在每個(gè)單位選取20套此型裝備的近10年來(lái)故障數(shù)據(jù),對(duì)其進(jìn)行分析,以求得到相關(guān)的保障規(guī)律。本文選取的數(shù)據(jù)挖掘工具為微軟Analysis Manager[5],它的決策樹(shù)分類(lèi)算法為C4.5算法。保障單位決策樹(shù)如圖3所示。
圖3 保障單位決策樹(shù)
由圖3可以看出,此型裝備的2個(gè)易損部件I和II,部件I的故障率明顯高于部件II;當(dāng)裝備儲(chǔ)存至第8年后開(kāi)始進(jìn)入故障高發(fā)期。在圖右側(cè)的直方圖中可以看出,保障單位c和d所保障的裝備故障率要高于其他單位。
因此,在為此型裝備配備維修力量和維修備件時(shí),應(yīng)多考慮上述故障特征,對(duì)部件I要準(zhǔn)備高于一般水平的配件數(shù);對(duì)保障單位c和d應(yīng)多配置保障力量。
數(shù)據(jù)挖掘作為一門(mén)新興的熱點(diǎn)技術(shù),將隨著技術(shù)的成熟而被越來(lái)越廣泛地應(yīng)用于裝備保障的方方面面。這也給我們當(dāng)前裝備保障提出了一個(gè)亟需解決的問(wèn)題,即如何獲得、保存第一手裝備保障數(shù)據(jù)。在獲得數(shù)據(jù)后,應(yīng)按規(guī)范的標(biāo)準(zhǔn)將大量的保障數(shù)據(jù)保存、分類(lèi),來(lái)保證數(shù)據(jù)挖掘結(jié)果的可靠性,幫助決策者做出準(zhǔn)確的判斷,制定科學(xué)的保障方案。
[1] 馬龍,李劍雄,柳少軍.作戰(zhàn)指揮決策支持系統(tǒng)研究評(píng)述[J].軍事運(yùn)籌與系統(tǒng)工程,2004(9):48-52.
[2] 余高達(dá),趙潞生. 軍事裝備學(xué)[M].北京:清華大學(xué)出版社,2000.
[3] 陸廷孝,鄭鵬洲.可靠性設(shè)計(jì)與分析[M].北京:國(guó)防工業(yè)出版社,1995.
[4] 羅可,張學(xué)茂.SPRINT算法及其改進(jìn)方法[J] .計(jì)算機(jī)工程與應(yīng)用, 2005(32):178-180.
[5] 羅運(yùn)模.SQL Server2000數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用與開(kāi)發(fā)[M].北京:人民郵電出版社,2001.
責(zé)任編輯 馬彤
劉培毅,劉 鑫,孫迎豐
(92941部隊(duì)92分隊(duì),遼寧 葫蘆島 125001)
The Application of Data Mining in the Decision Support System of Armament Maintenance Support
LIU Peiyi, LIU Xin,SUN Yingfeng
(Detachment 92 of 92941thUnit of PLA, Huludao 125001, China)
To tactical missile types of data appeared in the process of security management, appearing the volume of business and the low data processing efficiency, propose the use of auxiliary decision system to optimize business processes, and improve the efficiency of security. By using the method of data mining to a certain type of guarantee equipment, make a data mining effect on the security data simulation, analyze the equipment security feature, summarize the security law, and provide scientific decision for decision makers.
data mining, decision support, data warehouse, decision trees
I(s1,s2,s3)=I(3,3,4)=
I(s11,s21,s31)=
I(s12,s22,s32)=
Gain(洞庫(kù)倉(cāng)儲(chǔ))=
Gain(倉(cāng)儲(chǔ)時(shí)間>7a)=
Gain(倉(cāng)儲(chǔ)溫度>18 ℃)=
Gain(倉(cāng)儲(chǔ)低氣壓)=
Gain(倉(cāng)儲(chǔ)濕度>40%)=
劉培毅(1978-),男,工程師,主要從事武器裝備試驗(yàn)方法等方面的研究。
2016-06-22
TP 311
A