柯宏發(fā), 祝冀魯, 孫云輝
(1. 航天工程大學(xué)航天保障系, 北京102206; 2. 北京亞美聯(lián)技術(shù)有限公司, 北京100080)
武器裝備維修性是指裝備在規(guī)定的條件下和規(guī)定的時(shí)間內(nèi),按規(guī)定的程序和方法進(jìn)行維修時(shí)保持或恢復(fù)其規(guī)定狀態(tài)的能力[1]。對(duì)裝備維修性進(jìn)行計(jì)算、驗(yàn)證和評(píng)估[2],通常必須選用一系列定性和定量的維修性參數(shù)[3]。由于裝備平均修復(fù)時(shí)間直接影響裝備的可用性、戰(zhàn)備完好性,且與維修保障費(fèi)用有關(guān),因此成為描述裝備維修性的一個(gè)主要參數(shù)。
目前,對(duì)裝備平均修復(fù)時(shí)間進(jìn)行估計(jì)與驗(yàn)證的常用方法為:在自然故障或模擬故障條件下進(jìn)行試驗(yàn),根據(jù)試驗(yàn)數(shù)據(jù)分析判定維修性是否達(dá)到標(biāo)準(zhǔn)要求。這種驗(yàn)證方法的理論基礎(chǔ)是經(jīng)典數(shù)理統(tǒng)計(jì)學(xué),需要假設(shè)樣本的概率分布特征,且需要較大的樣本量才能得到較高的估計(jì)精度。針對(duì)小樣本處理的Bayes方法[4-6]屬于一種概率統(tǒng)計(jì)方法,需要利用驗(yàn)前信息并確定其概率分布形式,且非常依賴于驗(yàn)前信息的融合正確性[7]。然而,隨著武器裝備的復(fù)雜化、網(wǎng)絡(luò)化、體系化發(fā)展,獲取較多裝備維修性驗(yàn)證試驗(yàn)樣本量的難度越來(lái)越大,成本也越來(lái)越高,亟需解決未知概率分布前提下小樣本數(shù)據(jù)的擴(kuò)展生成、參數(shù)估計(jì)等技術(shù)難題。
在未知概率分布前提下,小樣本數(shù)據(jù)處理通?;谝韵?種模式:1)基于不確定理論相關(guān)方法的直接估計(jì)方法[8],但這種方法難以給出參數(shù)估計(jì)的置信度;2)基于GM(1,1)模型等不確定理論相關(guān)方法的間接估計(jì)方法[9-13],如灰自助生成方法。均值GM(1,1)模型具有一定的適用范圍,對(duì)非指數(shù)增長(zhǎng)或振蕩數(shù)據(jù)序列的均值GM(1,1)模型擬合誤差偏大,而裝備維修時(shí)間虛擬樣本原始數(shù)據(jù)序列往往呈現(xiàn)振蕩特征。對(duì)于非指數(shù)增長(zhǎng)或振蕩數(shù)據(jù)序列,應(yīng)優(yōu)先選擇離散形態(tài)的原始差分、均值差分或離散GM(1,1)模型[14-15]。
筆者借鑒灰自助的樣本生成思想[10-13],提出通過(guò)離散GM(1,1)模型產(chǎn)生虛擬總體樣本的新方法,并通過(guò)未確知有理數(shù)[16-17]對(duì)總體樣本進(jìn)行相應(yīng)的點(diǎn)估計(jì)和區(qū)間估計(jì),最后對(duì)算例進(jìn)行了對(duì)比驗(yàn)證。
在武器裝備試驗(yàn)活動(dòng)中,由于試驗(yàn)條件和費(fèi)用的限制,很多測(cè)試指標(biāo)得到的數(shù)據(jù)樣本量很小,其數(shù)據(jù)集合可以描述為
T′={x(t′),t′=1,2,…,N},
(1)
式中:x(t′)為第t′個(gè)測(cè)量數(shù)據(jù);N為測(cè)量數(shù)據(jù)總數(shù),通常情況下N∈[5,10]。對(duì)于此類小樣本指標(biāo)數(shù)據(jù),難以確定其概率分布特征,即使假設(shè)其服從正態(tài)分布,其參數(shù)估計(jì)的置信度也難以保證?;疑到y(tǒng)理論認(rèn)為:這N個(gè)小樣本數(shù)據(jù)所攜帶的信息不足以確定測(cè)試指標(biāo)的真實(shí)狀態(tài)和數(shù)量關(guān)系,但已經(jīng)部分地反映了測(cè)試指標(biāo)的真實(shí)狀態(tài)。通過(guò)“已知部分”推斷“未知部分”正是灰色系統(tǒng)技術(shù)與方法的優(yōu)勢(shì)。
x(1)(k+1)=β1x(1)(k)+β2
(2)
為GM(1,1)模型的離散形式,簡(jiǎn)稱離散GM(1,1)模型。式中:β1,β2均為待估計(jì)參數(shù)。
由最小二乘法(β1,β2)T=(BTB)-1BTY,得到β1、β2的值。由
(3)
(4)
并結(jié)合初始條件x(1)(0)=x(0)(1),即可得到離散GM(1,1)模型的時(shí)間響應(yīng)序列
(5)
再將式(5)累減還原,得到X(0)的預(yù)測(cè)模型為
k=1,2,…,n。
(6)
在裝備維修時(shí)間的實(shí)際建模過(guò)程中,可以取初始序列為X(1),對(duì)其一階累減生成序列X(0)建立離散GM(1,1)模型,從而直接對(duì)X(1)進(jìn)行模擬。
根據(jù)GJB2072—94《維修性試驗(yàn)與評(píng)定》[2]規(guī)定:維修作業(yè)樣本量按選取的試驗(yàn)方法中的統(tǒng)計(jì)計(jì)算確定,也可選擇推薦樣本量。在此,將自助抽樣生成的樣本量選為推薦樣本量,即N+A=30。
自助抽樣生成原理的基本思路為:從原始數(shù)據(jù)集合X中等概率可放回地隨機(jī)抽取1個(gè)數(shù)據(jù),記為x1(1),該抽取過(guò)程重復(fù)m次,得到第1個(gè)自助樣本,記為
X1={x1(1),x1(2),…,x1(m)}。
(7)
根據(jù)離散GM(1,1)模型的建模數(shù)據(jù)需求,確定m=5~8。為獲得自助樣本,將整體抽取過(guò)程連續(xù)重復(fù)A次,則會(huì)得到A個(gè)自助樣本,可記為
YA={X1,X2,…,Xi,…,XA},
(8)
式中:Xi={xi(1),xi(2),…,xi(m)}。
針對(duì)自助樣本Xi建立離散GM(1,1)模型,對(duì)其時(shí)間響應(yīng)序列進(jìn)行一次累減生成,即可得到自助樣本Xi中第m+1個(gè)預(yù)測(cè)值,記為
(9)
進(jìn)而得到自助樣本集合,即新的裝備維修時(shí)間數(shù)據(jù)集合,為
X′={x(1),x(2),…,x(N),…,x(N+A)}。
(10)
式中:x(N+1),x(N+2),…,x(N+A)分別為A個(gè)自助樣本的離散GM(1,1)模型預(yù)測(cè)值。
上述自助抽樣生成流程如圖1所示?;陔x散GM(1,1)模型的自助抽樣生成,是通過(guò)對(duì)原始數(shù)據(jù)序列的隨機(jī)抽樣挖掘,擬合生成了符合參數(shù)估計(jì)要求的數(shù)據(jù)信息,而未對(duì)原始數(shù)據(jù)序列的概率分布信息進(jìn)行假設(shè)。然而,其中的自助樣本集合依然不能全面反映測(cè)試指標(biāo)的真實(shí)狀態(tài),在本質(zhì)上還是“部分已知,部分未知”地實(shí)現(xiàn)對(duì)測(cè)試指標(biāo)真實(shí)狀態(tài)的認(rèn)知。與原始N個(gè)數(shù)據(jù)所表征的“部分已知,部分未知”相比,前者的“已知部分”要遠(yuǎn)遠(yuǎn)地多于后者,這也是自助抽樣挖掘的目的和作用。
圖1 小樣本數(shù)據(jù)的自助抽樣生成流程
對(duì)自助樣本集合X′中N+A個(gè)數(shù)據(jù)的參數(shù)估計(jì),若假設(shè)數(shù)據(jù)的分布特征,需要采用常規(guī)的統(tǒng)計(jì)方法進(jìn)行點(diǎn)估計(jì)和參數(shù)估計(jì),這就失去了自助抽樣挖掘的意義,且數(shù)據(jù)分布特征的合理性和正確性難以驗(yàn)證。因此,不假設(shè)生成數(shù)據(jù)的概率分布規(guī)律,而直接引入未確知有理數(shù)方法進(jìn)行參數(shù)估計(jì)。
針對(duì)自助樣本集合X′,構(gòu)造一個(gè)h(h 1) 記 a=min{x(1),x(2),…,x(N), x(N+1),…,x(N+A)}; (11) b=max{x(1),x(2),…,x(N), x(N+1),…,x(N+A)}。 (12) 2) 以小區(qū)間的中間值xj(a≤xj≤b,j=1,2,…,h)為中心、λ為控制半徑,確定一數(shù)據(jù)鄰域,統(tǒng)計(jì)N+A個(gè)數(shù)據(jù)在該鄰域出現(xiàn)的頻率,則可得到可信度分布密度函數(shù)表達(dá)式 (13) 3) 大多數(shù)情況下,對(duì)區(qū)間[a,b]進(jìn)行2h個(gè)等值劃分,使得自助抽樣數(shù)據(jù)值xj(j=1,2,…,h)的鄰域控制半徑均相等,則可得到其表達(dá)式為 (14) 其可信度αj則用自助抽樣數(shù)據(jù)在xj為中心的控制鄰域內(nèi)出現(xiàn)的頻率表示,即 (15) 4) 針對(duì)上述h階未確知有理數(shù)的可信度熵 (16) (17) 稱該h*階未確知有理數(shù)U為一階未確知有理數(shù),其數(shù)學(xué)期望 (18) 式中: 用方差D(U)來(lái)描述未確知有理數(shù)U到E(U)的離散程度,即 D(U)=E(U-E(U))2= (19) 于是,自助樣本的點(diǎn)估計(jì)值為 (20) 其估計(jì)精度為 (21) 綜合未確知有理數(shù)期望的可信度,則定義自助樣本點(diǎn)估計(jì)的置信度 (22) 假設(shè)自助樣本的分布特征,可以用區(qū)間估計(jì)法給出樣本的取值范圍。一般假設(shè)自助樣本服從正態(tài)分布,常用標(biāo)準(zhǔn)正態(tài)分布上側(cè)β分位點(diǎn)如表1所示。 表1 常用標(biāo)準(zhǔn)正態(tài)分布上側(cè)β分位點(diǎn)表 給定置信水平1-β,從表1中查詢u(β/2),則給定置信水平下置信區(qū)間半長(zhǎng)度 (23) 針對(duì)自助抽樣挖掘生成的N+A個(gè)數(shù)據(jù),假設(shè)有q個(gè)數(shù)據(jù)位于上述置信區(qū)間之外,同時(shí)綜合估計(jì)區(qū)間的置信水平,則定義自助樣本在上述區(qū)間估計(jì)的置信度 (24) 需要注意置信水平和置信度2個(gè)概念的聯(lián)系與區(qū)別。本文對(duì)裝備維修時(shí)間的非統(tǒng)計(jì)估計(jì)分為自助抽樣生成、參數(shù)描述和參數(shù)估計(jì)等過(guò)程,置信水平反映了正態(tài)分布假設(shè)條件下區(qū)間估計(jì)的可靠性,覆蓋了參數(shù)估計(jì)過(guò)程;而點(diǎn)估計(jì)和區(qū)間估計(jì)的置信度則覆蓋了裝備維修時(shí)間的非統(tǒng)計(jì)估計(jì)全過(guò)程,置信水平對(duì)區(qū)間估計(jì)置信度有一定的貢獻(xiàn)率。 基于離散GM(1,1)模型的自助抽樣生成和未確知有理數(shù)的裝備維修時(shí)間非統(tǒng)計(jì)估計(jì),是在小樣本自助抽樣生成、參數(shù)描述與估計(jì)等過(guò)程中,應(yīng)用離散GM(1,1)建模技術(shù),基于未確知有理數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)等方法論的一種分析方法,其過(guò)程和方法論框架如圖2所示。 圖2 裝備維修時(shí)間的非統(tǒng)計(jì)估計(jì)模型的過(guò)程和方法論框架 為驗(yàn)證本文算法的有效性,采用GJB 2072—94《維修性試驗(yàn)與評(píng)定》[2]D1.5中的裝備維修時(shí)間數(shù)據(jù),即26,14,21,30,70,69,20,21,18,65,16,34,26,16,40,28,42,33,19,19,43,54,12,18,13,26,10,50,21,31,42,30,46,24,總計(jì)34個(gè)。將自助樣本的非統(tǒng)計(jì)估計(jì)結(jié)果與原始34個(gè)數(shù)據(jù)樣本的非統(tǒng)計(jì)估計(jì)結(jié)果、GJB2072-94建議估計(jì)模型的估計(jì)結(jié)果進(jìn)行對(duì)比驗(yàn)證。 利用本文非統(tǒng)計(jì)估計(jì)算法對(duì)D1.5中34個(gè)裝備維修時(shí)間原始數(shù)據(jù)進(jìn)行處理,其最佳4階未確知有理數(shù)為[[10,70],φ(x)],其中 對(duì)原始34個(gè)數(shù)據(jù),每間隔2個(gè)數(shù)據(jù)取為自助抽樣對(duì)象,抽樣生成小樣本數(shù)據(jù);而取小樣本數(shù)據(jù)的前10個(gè)作為驗(yàn)證數(shù)據(jù),即26,30,20,65,26,28,19,54,13,50。對(duì)這10個(gè)小樣本數(shù)據(jù)進(jìn)行等概率可放回地隨機(jī)抽樣,重復(fù)抽取m=6次視為得到1個(gè)自助樣本,總共需要得到A=20個(gè)自助樣本。 分別針對(duì)這20個(gè)自助樣本進(jìn)行離散GM(1,1)建模,取每個(gè)模型的一步預(yù)測(cè)值,從而得到自助樣本集合為X′={26,30,20,65,26,28,19,54,13,50,22.1,13.5,27.5,51.2,24.8,23.4,26.5,34.2,65.8,41.1,32.7,46.0,29.0,16.5,12.1,69.0,51.5,19.5,17.8,29.6}。上述自助樣本的最大值為69.0,最小值為12.1。構(gòu)造h階未確知有理數(shù),其對(duì)應(yīng)的可信度熵如表2所示。 表2 不同階數(shù)未確知有理數(shù)的可信度熵 由表2可以看出:可信度熵最大值為0.137 6,其對(duì)應(yīng)的最優(yōu)未確知有理數(shù)階數(shù)h*=4,則本算例構(gòu)造的4階未確知有理數(shù)為[[12.1,69.0],φ(x)],其中 假設(shè)置信水平為0.95,則β=0.05,計(jì)算給定置信水平下的置信區(qū)間半長(zhǎng)度ε=14.17,則得到裝備維修時(shí)間的區(qū)間估計(jì)[18.79,47.13],這時(shí)有q=12個(gè)點(diǎn)位于上述區(qū)間之外,區(qū)間估計(jì)的置信度p2=57.0%。 本算例中,裝備維修時(shí)間的概率分布和方差都是未知的。依據(jù)GJB2072—94《維修性試驗(yàn)與評(píng)定》[2]D2中試驗(yàn)B的估計(jì)模型,有: 結(jié)合4.1、4.2節(jié)可知:針對(duì)自助樣本、原始數(shù)據(jù)樣本,基于本文非統(tǒng)計(jì)估計(jì)算法的點(diǎn)估計(jì)和區(qū)間估計(jì)結(jié)果均較為接近,且估計(jì)置信度也很接近,說(shuō)明基于離散GM(1,1)模型的樣本數(shù)據(jù)挖掘生成方法有效可行。 結(jié)合4.1-4.3節(jié),對(duì)原始34個(gè)數(shù)據(jù)樣本和自助樣本分別進(jìn)行點(diǎn)估計(jì)及位于估計(jì)區(qū)間之外的點(diǎn)數(shù)比較,如表3、4所示。 表3 點(diǎn)估計(jì)比較 表4 估計(jì)區(qū)間之外的樣本點(diǎn)數(shù)比較 由表3可知:與GJB2072—94[2]建議估計(jì)模型的估計(jì)結(jié)果相比,原始數(shù)據(jù)樣本的非統(tǒng)計(jì)估計(jì)模型點(diǎn)估計(jì)相對(duì)誤差為1.15%,自助樣本估計(jì)相對(duì)誤差為0.39%,這2個(gè)數(shù)據(jù)樣本的點(diǎn)估計(jì)結(jié)果相對(duì)誤差均較小,而自助樣本的誤差更小。 由表4可知:同一置信水平下,估計(jì)區(qū)間覆蓋了數(shù)據(jù)樣本的個(gè)數(shù),說(shuō)明本文提出的非統(tǒng)計(jì)估計(jì)模型要遠(yuǎn)遠(yuǎn)好于GJB2072—94[2]估計(jì)模型。 上述結(jié)果表明:本文提出的小樣本裝備平均修復(fù)時(shí)間非統(tǒng)計(jì)估計(jì)模型有效可行。 針對(duì)裝備平均修復(fù)時(shí)間的小樣本參數(shù)估計(jì)問(wèn)題,提出了一種基于離散GM(1,1)模型和未確知有理數(shù)的新方法,構(gòu)建了裝備平均修復(fù)時(shí)間的點(diǎn)估計(jì)和區(qū)間估計(jì)模型,并與GJB2072—94建議的估計(jì)模型進(jìn)行對(duì)比,驗(yàn)證了其有效性。2.2 基于未確知有理數(shù)的點(diǎn)估計(jì)
2.3 基于未確知有理數(shù)的區(qū)間估計(jì)
3 非統(tǒng)計(jì)估計(jì)模型的過(guò)程和方法框架
4 裝備平均修復(fù)時(shí)間的非統(tǒng)計(jì)估計(jì)算例
4.1 原始數(shù)據(jù)非統(tǒng)計(jì)估計(jì)結(jié)果
4.2 自助樣本的非統(tǒng)計(jì)估計(jì)結(jié)果
4.3 GJB2072—94建議模型的估計(jì)結(jié)果
4.4 對(duì)比分析
5 結(jié)論