邱立軍,劉 勇,徐學(xué)文
(海軍航空工程學(xué)院a.科研部;b.接改裝訓(xùn)練大隊(duì),山東煙臺(tái)264001)
小子樣條件下正態(tài)先驗(yàn)信息的融合
邱立軍a,劉 勇b,徐學(xué)文b
(海軍航空工程學(xué)院a.科研部;b.接改裝訓(xùn)練大隊(duì),山東煙臺(tái)264001)
對(duì)于Bayes小子樣檢驗(yàn)方法,先驗(yàn)信息的有效性影響著統(tǒng)計(jì)推斷的準(zhǔn)確性。在對(duì)多源正態(tài)先驗(yàn)信息進(jìn)行融合時(shí),采用自助法將之轉(zhuǎn)換為先驗(yàn)子分布,其中采用了改進(jìn)的經(jīng)驗(yàn)分布函數(shù)法進(jìn)行再抽樣。然后,基于專家水平確定其權(quán)重,再結(jié)合專家估計(jì)法確定各先驗(yàn)子分布的權(quán)重。最后,通過(guò)計(jì)算綜合先驗(yàn)分布與假設(shè)的正態(tài)分布的差異部分的面積,對(duì)綜合先驗(yàn)分布為正態(tài)分布的假設(shè)進(jìn)行檢驗(yàn)。案例分析表明此融合方法是有效的。
先驗(yàn)信息;自助法;先驗(yàn)分布;正態(tài)分布
在裝備可靠性工程領(lǐng)域,對(duì)于指標(biāo)驗(yàn)證問(wèn)題,常常是現(xiàn)場(chǎng)作業(yè)樣本量為小子樣,同時(shí)又有多種先驗(yàn)信息,即在現(xiàn)場(chǎng)試驗(yàn)驗(yàn)證之前獲得的和裝備可靠性、維修性相關(guān)的信息,如前期試驗(yàn)信息、相似裝備系統(tǒng)的信息、仿真試驗(yàn)信息等。在這種情況下,通常采用Bayes檢驗(yàn)方法。這種分析方法需要科學(xué)合理地利用先驗(yàn)信息,因此,先驗(yàn)信息的可信度影響著統(tǒng)計(jì)推斷的結(jié)果。對(duì)于多個(gè)先驗(yàn)數(shù)據(jù)源,需要對(duì)其進(jìn)行融合,得到綜合先驗(yàn)信息。對(duì)每個(gè)先驗(yàn)數(shù)據(jù)源,都應(yīng)當(dāng)盡可能進(jìn)行規(guī)范化表示,即進(jìn)行分布擬合,得到一個(gè)先驗(yàn)子分布。如果先驗(yàn)子分布為正態(tài)分布,則稱先驗(yàn)信息源為正態(tài)先驗(yàn)信息。從已有研究文獻(xiàn)來(lái)看,對(duì)正態(tài)先驗(yàn)信息進(jìn)行融合的方法還較少。文獻(xiàn)[1-2]采用加權(quán)平均的方法對(duì)先驗(yàn)子分布進(jìn)行融合;文獻(xiàn)[3]認(rèn)為在能夠獲得先驗(yàn)信息的可信度或獲得現(xiàn)場(chǎng)數(shù)據(jù)的情況下,采用加權(quán)融合法更為合適。事實(shí)上,當(dāng)多個(gè)先驗(yàn)子分布均服從正態(tài)分布時(shí),綜合先驗(yàn)分布并不一定也服從正態(tài)分布[4]。即使服從正態(tài)分布,如果采用加權(quán)融合法,融合后的均值也會(huì)存在較小誤差,而方差會(huì)存在較大誤差。文獻(xiàn)[5]根據(jù)綜合先驗(yàn)分布與假定的正態(tài)分布的概率密度函數(shù)的最大差異來(lái)判斷綜合先驗(yàn)的正態(tài)性,這是一種根據(jù)局部差異來(lái)推測(cè)整體的方法。本文著眼于研究根據(jù)綜合先驗(yàn)分布與正態(tài)分布之間的差異部分的面積來(lái)判定綜合先驗(yàn)分布是否可視為正態(tài)分布。
確定先驗(yàn)子分布即判斷其服從何種分布,以及特征參數(shù)。對(duì)于先驗(yàn)信息為小子樣的情況,主要采用自助法(Bootstrap Method)[6-9]與隨機(jī)加權(quán)法(Random Weighting Estimation Method)[10-11]確定其分布類型及特征參數(shù),二者都是對(duì)先驗(yàn)數(shù)據(jù)的再抽樣。文獻(xiàn)[12]指出,隨機(jī)加權(quán)法并不能得到比自助法更優(yōu)的估計(jì)結(jié)果,因此,采用自助法確定先驗(yàn)子分布模型。
設(shè)Y1,Y2,…,Yn為某一未知分布F的i.i.d子樣,Yi~F(y),θ=θ(F)為總體分布F的未知參數(shù),F(xiàn)n是Y1,Y2,…,Yn的經(jīng)驗(yàn)分布,是θ的估計(jì)值,估計(jì)誤差為
式中,Tn是X和F的函數(shù)。
這樣,R(Y,F)的均值和方差表征了θ(F)估計(jì)誤差的均值與方差。利用計(jì)算機(jī)進(jìn)行N次樣本再抽樣,可獲得N個(gè)自助統(tǒng)計(jì)量R*(1),R*(2),…,R*(N)。從而,可由R*(i)的頻率曲線得出Rn的概率分布,用Rn的概率分布模擬Tn的分布。于是,可通過(guò)Y1,Y2,…,Yn來(lái)估計(jì)R(Y,F)的分布特征,并估計(jì)θ(F)。
如何進(jìn)行再抽樣,是問(wèn)題的關(guān)鍵。文獻(xiàn)[13]研究認(rèn)為,改進(jìn)的經(jīng)驗(yàn)分布函數(shù)法是再生樣本的最好獲取方法,因此,這里采用這種方法。具體如下:
1)產(chǎn)生U[0,1]上的隨機(jī)數(shù)ξ,令η=(n-1)ξ,j=[η]+1。
2)令Y*=Yj+(η-j+1)(Yj+1-Yj),得到一個(gè)再生樣本數(shù)據(jù)。
3)重復(fù)1)和2)n次,就得到一組再生子樣,s=1,2,…,n。
4)重復(fù)3)N次。
得到θ的N個(gè)估計(jì)值后,利用W檢驗(yàn)或Stat::Fit軟件進(jìn)行分布擬合,檢驗(yàn)其正態(tài)性。
為對(duì)多個(gè)正態(tài)先驗(yàn)子分布進(jìn)行融合,需要先確定先驗(yàn)信息的權(quán)重。確定先驗(yàn)信息權(quán)重的方法主要有:專家估計(jì)法[1]、相關(guān)函數(shù)法[14]及信息對(duì)比法[15-16]等,在工程實(shí)踐中,專家估計(jì)法應(yīng)用較為廣泛,因?yàn)閷<业慕?jīng)驗(yàn)往往比較貼近實(shí)際。專家的重要性是不同的,比如,項(xiàng)目總負(fù)責(zé)人就比項(xiàng)目一般成員的意見(jiàn)更具有權(quán)威性,本行專家比其他行業(yè)專家更有發(fā)言權(quán)等。因此,在對(duì)專家給出的先驗(yàn)子分布的權(quán)重進(jìn)行集結(jié)時(shí),要考慮專家權(quán)重的影響,并應(yīng)基于專家水平確定其權(quán)重。即由管理部門根據(jù)專家的威望、專家所從事的專業(yè)、專家的工作經(jīng)驗(yàn)、專家的技術(shù)職稱等指標(biāo)賦予每名專家一定的分值[17],然后求其歸一化權(quán)重。
評(píng)分標(biāo)準(zhǔn)見(jiàn)表1。在具體評(píng)分時(shí),若認(rèn)為專家權(quán)重的某項(xiàng)指標(biāo)的描述位于某兩種程度之間,則得分可取相應(yīng)的2個(gè)分值之間的數(shù)值。
表1 專家權(quán)重評(píng)分信息表Tab.1 Grading information of experts weighted
設(shè)有t位專家,其中第k位專家個(gè)人權(quán)重分值的計(jì)算方法為
式中,ak、bk、ck、dk分別表示專家威望、專業(yè)、經(jīng)驗(yàn)、職稱、以往評(píng)價(jià)業(yè)績(jī)的分值,k=1,2,…,t。
設(shè)專家的權(quán)重向量為W=(w1,w2,…,wt),第k位專家的歸一化權(quán)重為:
即子分布的權(quán)重向量為ω={ωi|i=1,2,…,m}。于是,可得到θ的綜合先驗(yàn)分布πp(θ)為
有的Bayes小子樣檢驗(yàn)方法,如序貫驗(yàn)后加權(quán)檢驗(yàn)(Sequential Posterior Odd Test,SPOT)[18-19],要求綜合先驗(yàn)分布能等效為一致分布,即其服從某一種分布,概率表達(dá)式中不含各先驗(yàn)子分布的系數(shù)。當(dāng)各先驗(yàn)信息均服從正態(tài)分布時(shí),綜合先驗(yàn)分布是否也服從正態(tài)分布,取決于其均值參數(shù)的差異程度。因此,須對(duì)綜合分布的正態(tài)性進(jìn)行檢驗(yàn)。
本文提出一種根據(jù)綜合先驗(yàn)分布與假設(shè)的正態(tài)分布概率曲線圖形之間的差異部分的面積(即概率)來(lái)檢驗(yàn)綜合先驗(yàn)分布的正態(tài)性的方法,包括準(zhǔn)確確定特征參數(shù)。
為便于討論,考慮n=2,Y1與Y2相互獨(dú)立,的情況。步驟為:
1)取 Θ1=[a1,a2],使a1≤min(θ1-3σ1,θ2-3σ2),a2≥max(θ1+3σ1,θ2+3σ2),以ρ1≤(a2-a1)/1 000為步長(zhǎng),畫出π1(θ)、π2(θ)以及πp(θ)=ω1π1(θ)+ω2π2(θ)的概率密度圖形。
2)觀察πp(θ)的形狀,若它明顯不是正態(tài)分布概率曲線,則認(rèn)為綜合先驗(yàn)分布不具有正態(tài)性;否則,認(rèn)為,計(jì)算fp(θp)=max(πp(θ))。根據(jù)正態(tài)分布概率密度函數(shù)特性,有,于是得到σp。
3)根據(jù)Matlab函數(shù) [CI]=max(πp(θ)),計(jì)算當(dāng)fp=max(πp(θ))時(shí)的指針I(yè),求得θp=a1+ρ1×(I-1)。
5)根據(jù)檢驗(yàn)精度的要求,設(shè)定閾值γ∈[0 .05,0.075]。若S≤γ,則接受fp(θ)=πp(θ)的假設(shè),即綜合先驗(yàn)分布為正態(tài)分布;否則拒絕。
在某型導(dǎo)彈設(shè)計(jì)定型階段,規(guī)定采用Bayes小子樣方法對(duì)其平均修復(fù)時(shí)間指標(biāo)進(jìn)行驗(yàn)證。已知導(dǎo)彈維修時(shí)間服從對(duì)數(shù)正態(tài)分布,須由先驗(yàn)信息確定維修時(shí)間均值的先驗(yàn)分布。
已知相似導(dǎo)彈裝備的維修時(shí)間樣本取對(duì)數(shù)后為:
導(dǎo)彈初樣機(jī)試驗(yàn)階段維修時(shí)間樣本取對(duì)數(shù)后為:
用自助法分別對(duì)Y1、Y2、Y3的均值與方差進(jìn)行1 000次仿真,再用Stat::Fit對(duì)均值進(jìn)行分布擬合,得到各組數(shù)據(jù)的均值分布為:
接下來(lái)計(jì)算各先驗(yàn)子分布的權(quán)重。先求專家的權(quán)重,邀請(qǐng)了5位專家,其權(quán)重得分信息如表2所示。
表2 專家主觀權(quán)重得分信息Tab.2 Grading information of expert weight
由式(3)、(4)可得專家權(quán)重向量為:
5位專家給出的先驗(yàn)子分布的權(quán)重分別為(0.35,0.65),(0.37,0.63),(0.32,0.68),(0.38,0.62),(0.34,0.66)。由式(5)得ω=(0.348 6,0.651 4)。
將π1(θ)、π2(θ)與 ω 的值代入式(6),取θ∈Θ1=[3.1,4.4],以0.001為步長(zhǎng),生成兩先驗(yàn)子分布與綜合分布的概率密度函數(shù)曲線,如圖1所示,其中虛線為融合后的綜合先驗(yàn)分布。
計(jì)算I=708,得θp=3.807 2。
令fp(θ)=N(3.807 0,0.155 82),取θ∈Θ2=Θ1,則綜合先驗(yàn)與fp(θ)的圖形見(jiàn)圖2。
取γ=0.05,以0.001為步長(zhǎng),計(jì)算兩者左半部分與右半部分曲線之間的面積,求其平均值,得出S=0.049 4<γ,因此,接受πp(θ)=N(3.807 2,0.155 62)。
針對(duì)維修性先驗(yàn)信息融合后的分布問(wèn)題進(jìn)行了研究。首先,采用自助法將各先驗(yàn)信息源表征為先驗(yàn)子分布,在重新抽樣時(shí),采用了改進(jìn)的經(jīng)驗(yàn)分布函數(shù)法。然后,根據(jù)專家的威望、專家所從事的專業(yè)、專家的工作經(jīng)驗(yàn)、專家的技術(shù)職稱確定專家的權(quán)重,并結(jié)合專家估計(jì)法,確定各先驗(yàn)子分布的權(quán)重。接下來(lái),假設(shè)各正態(tài)先驗(yàn)數(shù)據(jù)源融合后的綜合先驗(yàn)分布為正態(tài)分布,通過(guò)計(jì)算綜合先驗(yàn)分布的概率密度函數(shù)的最大值精確求出了方差;再根據(jù)密度函數(shù)為最大值時(shí)的指針計(jì)算出其均值;最后,通過(guò)計(jì)算綜合先驗(yàn)分布與假設(shè)的正態(tài)分布圖形差異部分的面積檢驗(yàn)其正態(tài)性。
參考文獻(xiàn):
[1]侯敏,郭基聯(lián),李建偉.多源信息的驗(yàn)前分布融合方法研究[J].火力與指揮控制,2012,37(7):57-60. HOU MIN,GUO JILIAN,LI JIANWEI.Research on fusion method for prior distribution of multiple sources information[J].Fire Control&Command Control,2012,37(7):57-60.(in Chinese)
[2]馮靜,周經(jīng)倫,孫權(quán).Bayes分析中多源驗(yàn)前信息融合的ML-II方法[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí),2006,36(6):142-145. FENG JING,ZHOU JINGLUN,SUN QUAN.Fusion of information of multiple sources based on ML-II theory in bayesian analysis[J].Mathematics in Practice and Theory,2006,36(6):142-145.(in Chinese)
[3]孫錦,李國(guó)林,許誠(chéng),等.潛射反艦導(dǎo)彈靶場(chǎng)試驗(yàn)先驗(yàn)信息融合方法仿真[J].火力與指揮控制,2014,39(8):154-158. SUN JIN,LI GUOLIN,XU CHENG,et al.Simulation research on fusion submarine launched anti method for prior distribution of ship missile in range trial[J].Fire Control&Command Control,2014,39(8):154-158.(in Chinese)
[4]姜晨,徐廷學(xué),劉勇,等.維修性小子樣驗(yàn)證中先驗(yàn)信息的融合方法[J].科學(xué)技術(shù)與工程,2014,14(22):129-133. JIANG CHEN,XU TINGXUE,LIU YONG,et al.Prior information fusion method in maintainability small sample test[J].Science Technology and Engineering,2014,14(22):129-133.(in Chinese)
[5]徐廷學(xué),劉勇,趙建忠,等.維修性先驗(yàn)信息的融合方法研究[J].系統(tǒng)工程與電子技術(shù),2014,36(9):1887-1893. XU TINGXUE,LIU YONG,ZHAO JIANZHONG,et al. Maintainability prior information fusion method[J].Systems Engineering and Electronics,2014,36(9):1887-1893.(in Chinese)
[6]夏新濤,葉亮,李云飛,等.基于多層自助最大熵法的可靠性評(píng)估[J].兵工學(xué)報(bào),2016,37(7):1317-1329. XIA XINTAO,YE LIANG,LI YUNFEI,et al.Reliability evaluation based on hierarchical bootstrap maximum entropy method[J].Acta Armamentarii,2016,37(7):1317-1329.(in Chinese)
[7]JI JIAN,LI YANG.An improved SAR image denoising method based on bootstrap statistical estimation with ICA basis[J].Chinese Journal of Electronics,2016,25(4):786-792.(in Chinese)
[8]高攀東,沈雪瑾,陳曉陽(yáng),等.基于自助法的小樣本W(wǎng)eibull分布可靠性分析[J].機(jī)械設(shè)計(jì)與研究,2015,31(2):164-167. GAO PANDONG,SHEN XUEJIN,CHEN XIAOYANG,et al.Reliability analysis under Weibull distribution in small samples based on bootstrap[J].Machine Design and Research,2015,31(2):164-167.(in Chinese)
[9]周慧,馬擎宇.用自助法估計(jì)外彈道測(cè)量數(shù)據(jù)隨機(jī)誤差分布特性[J].飛行器測(cè)控學(xué)報(bào),2012,31(1):75-79. ZHOU HUI,MA QINGYU.Estimation of the random error distribution characteristics of exterior ballistic measure data based on bootstrap method[J].Journal of Spacecraft TT&C Technology,2012,31(1):75-79.(in Chinese)
[10]GAO SHESHENG,GAO YI,ZHONG YONGMIN.Random weighting estimation method for dynamic navigation positioning[J].Chinese Journal of Aeronautics,2011,24(3):318-323.
[11]殷建,宋松柏.基于隨機(jī)加權(quán)先驗(yàn)的P-Ⅲ分布參數(shù)貝葉斯估計(jì)[J].水文,2015,35(3):1-7. YIN JIAN,SONG SONGBAI.A Bayesian method for estimation parameters of P-Ⅲ distribution based on randomly weighted prior[J].Journal of China Hydrology,2015,35(3):1-7.(in Chinese)
[12]鄭小兵,董景新,孟令晶,等.Bootstrap方法在導(dǎo)彈落點(diǎn)密集度評(píng)估中的誤用[J].中國(guó)慣性技術(shù)學(xué)報(bào),2012,20(2):239-243. ZHENG XIAOBING,DONG JINGXIN,MENG LINGJING,et al.Misapplication of Bootstrap method in dispersion assessment of missile fall points[J].Journal of Chinese Inertial Technology,2012,20(2):239-243.
[13]劉薇,常振海.自助法再生樣本的獲取方法研究[J].齊齊哈爾大學(xué)學(xué)報(bào),2012,28(4):78-80. LIU WEI,CHANG ZHENHAI.Obtaining method research of bootstrap regenerated samples[J].Journal of Qiqihar University,2012,28(4):78-80.(in Chinese)
[14]馮靜,劉琦,周經(jīng)倫,等.相關(guān)函數(shù)融合法及其在可靠性分析中的應(yīng)用[J].系統(tǒng)工程與電子技術(shù),2003,25(6):682-684. FENG JING,LIU QI,ZHOU JINGLUN,et al.Correlation information fusion method and application in reliability analysis[J].Systems Engineering and Electronics,2003,25(6):682-684.(in Chinese)
[15]閆鵬飛,孫權(quán).基于可信度加權(quán)融合方法在維修性評(píng)價(jià)的應(yīng)用[J].計(jì)算機(jī)仿真,2010,27(6):31-35. YAN PENGFEI,SUN QUAN.Weight fusion based on credibility for maintain evaluation[J].Computer Simulation,2010,27(6):31-35.(in Chinese)
[16]王小林,郭馳名,程志君,等.一種多源先驗(yàn)分布權(quán)重確定的新方法[J].兵工自動(dòng)化,2010,29(6):60-63. WANG XIAOLIN,GUO CHIMING,CHENG ZHIJUN,et al.A new method for determining weights of multisources of prior distribution[J].Ordnance Industry Automation,2010,29(6):60-63.(in Chinese)
[17]張榮,劉思峰.一種基于判斷矩陣信息的多屬性群決策方法[J].系統(tǒng)工程與電子技術(shù),2009,31(2):373-375. ZHANG RONG,LIU SIFENG.Multi-attribute group decision-making method based on the information of judgment matrixes[J].Systems Engineering and Electronics,2009,31(2):373-375.(in Chinese)
[18]董博超,宋保維,梁慶衛(wèi),等.武器裝備小子樣維修性試驗(yàn)與評(píng)定方法研究[J].兵工學(xué)報(bào),2011,32(3):327-330. DONG BOCHAO,SONG BAOWEI,LIANG QINGWEI,et al.Research on small sample maintainability experimentation and evaluation of weapon system[J].Acta Armamentarii,2011,32(3):327-330.(in Chinese)
[19]劉勇,徐廷學(xué),彭軍.維修時(shí)間截尾序貫驗(yàn)后加權(quán)檢驗(yàn)的實(shí)現(xiàn)[J].現(xiàn)代防御技術(shù),2014,42(1):106-110. LIU YONG,XU TINGXUE,PENG JUN.Realization of truncated sequential posterior odd test of maintenance time[J].Modern Defence Technology,2014,42(1):106-110.(in Chinese)
Normal Prior Information Fusion Method Under the Small Sample
QIU Lijuna,LIU Yongb,XU Xuewenb
(Naval Aeronautical and Astronautical University a.Department of Scientific Research; b.Training Brigade of Equipment Acceptance and Modification,Yaitai Shandong 264001,China)
For the small sample Bayes verification method,the effectiveness of prior information affects the correct statisti?cal inference.As for the fusion of multi-source normal prior information,the bootstrap method was used to convert a piece of prior information into a prior sub-distribution.Then experts’weight was determined based on their level,and the weight of the prior sub-distribution was determined by expert estimate method.At last,by calculating the discrepancy pro?portion between the integrated prior distribution and the hypothetical normal distribution,the hypothesis that the fused in?tegrated prior distribution was normal distribution was tested,and the method to accurately calculating the distribution pa?rameters was also put forward.The analysis by an example showed the fusion model was effective and accurate.
prior information;bootstrap method;prior distribution;normal distribution
TJ610.7
:A
1673-1522(2017)01-0111-05
10.7682/j.issn.1673-1522.2017.01.003
2016-12-01
:2016-12-14
國(guó)家自然科學(xué)基金資助項(xiàng)目(41476089)
邱立軍(1975-),男,副教授,碩士。