張煥鑫 李學(xué)鋒
北京航天自動(dòng)控制研究所,北京 100854
?
捷聯(lián)慣組歷次測(cè)試數(shù)據(jù)分布特性研究
張煥鑫 李學(xué)鋒
北京航天自動(dòng)控制研究所,北京 100854
針對(duì)捷聯(lián)慣組歷次測(cè)試數(shù)據(jù)小樣本的特點(diǎn),提出將隨機(jī)加權(quán)法與最大熵法結(jié)合應(yīng)用于捷聯(lián)慣組歷次測(cè)試數(shù)據(jù)的驗(yàn)前分布研究。在總體分布參數(shù)形式已知的情況下,根據(jù)已有的先驗(yàn)信息,采用隨機(jī)加權(quán)最大熵法獲得捷聯(lián)慣組歷次測(cè)試數(shù)據(jù)總體參數(shù)的驗(yàn)前分布。結(jié)合當(dāng)前樣本信息,利用貝葉斯方法給出捷聯(lián)慣組歷次測(cè)試數(shù)據(jù)的驗(yàn)后分布,揭示捷聯(lián)慣組歷次測(cè)試數(shù)據(jù)的統(tǒng)計(jì)特性,減少小樣本情況下的統(tǒng)計(jì)分析誤差。
捷聯(lián)慣組;隨機(jī)加權(quán)法;最大熵法;歷次測(cè)試數(shù)據(jù);驗(yàn)前分布;小樣本
捷聯(lián)慣導(dǎo)系統(tǒng)已在航天、航空、航海、陸地運(yùn)輸工具等領(lǐng)域得到廣泛應(yīng)用。但捷聯(lián)慣組的壽命有限,測(cè)試程序復(fù)雜,測(cè)試、標(biāo)定一次需要較長(zhǎng)時(shí)間,所以測(cè)試次數(shù)較少,所得到的歷次測(cè)試數(shù)據(jù)均為小樣本,使經(jīng)典的統(tǒng)計(jì)分析方法無(wú)法滿足分析的要求,為后續(xù)的統(tǒng)計(jì)推斷帶來(lái)一定困難。貝葉斯方法能夠充分利用現(xiàn)有信息,解決小樣本條件下驗(yàn)前分布的確定問(wèn)題為后續(xù)的建模補(bǔ)償工作提供分析基礎(chǔ)。
在小樣本情況下,常利用一些非參數(shù)的統(tǒng)計(jì)方法,如Bootstrap方法[1]、隨機(jī)加權(quán)法[2]等確定先驗(yàn)分布。文獻(xiàn)[3-4]分別利用Bootstrap方法和隨機(jī)加權(quán)法確定捷聯(lián)慣組歷次測(cè)試數(shù)據(jù)總體參數(shù)的驗(yàn)前分布,但Bootstrap方法、隨機(jī)加權(quán)法難以直接確定驗(yàn)前分布的參數(shù),大多數(shù)情況下,都是直接利用某一分布擬和直方圖估計(jì)分布參數(shù);而最大熵方法能夠較好地處理不完全驗(yàn)前信息的不足和盡量避免主觀因素的影響,可以求解連續(xù)概率密度函數(shù)以替代經(jīng)典統(tǒng)計(jì)學(xué)中通過(guò)直方圖確定概率分布的方法,便于估計(jì)分布參數(shù)[5]。
因此,本文將隨機(jī)加權(quán)法和最大熵方法相結(jié)合應(yīng)用于對(duì)捷聯(lián)慣組歷次測(cè)試數(shù)據(jù)的統(tǒng)計(jì)特性分析。首先利用隨機(jī)加權(quán)法對(duì)小樣本的慣組歷次測(cè)試數(shù)據(jù)進(jìn)行重復(fù)采樣,然后在二階矩等式約束下,利用最大熵方法確定驗(yàn)前分布的參數(shù),再結(jié)合當(dāng)前樣本利用貝葉斯方法確定驗(yàn)后分布,最后對(duì)統(tǒng)計(jì)分析結(jié)果進(jìn)行基于驗(yàn)后分布的統(tǒng)計(jì)推斷,確定其合理性。
捷聯(lián)慣組測(cè)試數(shù)據(jù)主要包括3部分:1)出廠前穩(wěn)定性試驗(yàn)數(shù)據(jù);2)交接轉(zhuǎn)運(yùn)過(guò)程的測(cè)試數(shù)據(jù);3)使用單位的正常測(cè)試數(shù)據(jù)。也就是本文的研究對(duì)象:歷次測(cè)試數(shù)據(jù)(或者稱為當(dāng)前測(cè)試信息)。捷聯(lián)慣組性能相對(duì)比較穩(wěn)定,在一段時(shí)間內(nèi),在沒(méi)有經(jīng)過(guò)檢修、長(zhǎng)途運(yùn)輸,而且環(huán)境因素沒(méi)有顯著變化的情況下,其歷次測(cè)試數(shù)據(jù)一般符合正態(tài)分布[3]。因此,可以設(shè)捷聯(lián)慣組歷次測(cè)試數(shù)據(jù)的總體分布形式為正態(tài)分布。
捷聯(lián)慣組驗(yàn)前信息的獲取主要依靠前2部分測(cè)試數(shù)據(jù),通稱為驗(yàn)前測(cè)試數(shù)據(jù)(或驗(yàn)前信息)。本文根據(jù)實(shí)際狀況采用第一部分的測(cè)試數(shù)據(jù)作為驗(yàn)前信息。捷聯(lián)慣組測(cè)試次數(shù)較少,因此驗(yàn)前信息的使用非常重要。由于捷聯(lián)慣組已經(jīng)得到廣泛應(yīng)用,積累了大量的驗(yàn)前測(cè)試數(shù)據(jù)和歷次測(cè)試數(shù)據(jù),這都為捷聯(lián)慣組歷次測(cè)試數(shù)據(jù)驗(yàn)前分布的研究和確定提供了充足可靠的依據(jù)。
設(shè)x1,x2,…,xn是來(lái)自正態(tài)分布N(θ,σ2)的一個(gè)樣本觀察值,其中均值θ未知,σ2已知,Bayes方法認(rèn)為總體均值θ為隨機(jī)變量。如果可以提供關(guān)于θ的歷史數(shù)據(jù),那么θ的分布可以確定。
2.1 最大熵驗(yàn)前密度
熵是衡量一個(gè)隨機(jī)變量取值的不確定性程度。隨機(jī)變量θ的概率密度π(θ)的信息熵可以定義為:
(1)
式中,R為隨機(jī)變量θ的變化空間。
概率密度π(θ)滿足以下約束條件:
(2)
(3)
其中,式(3)中g(shù)i(θ)為已知函數(shù),mi為參數(shù)θ的i階樣本矩。在此約束下,令熵取最大值,此時(shí)的π(θ)作為θ的驗(yàn)前密度。這就是所謂最大熵驗(yàn)前密度的確定方法。θ的驗(yàn)前密度(最大熵驗(yàn)前分布)可表示為:
(4)
其中,待定系數(shù)λi可由方程(2)和(3)確定。特別地,當(dāng)i=2時(shí),驗(yàn)前函數(shù)可表示為一元正態(tài)分布,即在二階矩等式約束下只要確定參數(shù)θ的期望和方差就可以確定驗(yàn)前的具體形式[6]。
2.2 隨機(jī)加權(quán)最大熵驗(yàn)前分布的確定
在二階矩等式約束下,利用隨機(jī)加權(quán)最大熵法確定驗(yàn)前分布,可采用下列步驟:
1) 考慮總體均值θ的估計(jì)偏差:
(5)
2) 分別構(gòu)造并產(chǎn)生N組Tn的隨機(jī)加權(quán)統(tǒng)計(jì)量:
(6)
其中v(i)=(v1(i),v2(i),…,vn(i))是取自Dirichlet分布的隨機(jī)變量。
3) 以Dn(i),i=1,…,N作為Tn的估計(jì),由此得到參數(shù)θ的一組隨機(jī)加權(quán)估計(jì):
(7)
在沒(méi)有樣本信息時(shí),只能根據(jù)驗(yàn)前分布對(duì)θ作出推斷。在有了樣本(歷次測(cè)試數(shù)據(jù))之后,就要將樣本與驗(yàn)前分布π(θ)進(jìn)一步綜合,設(shè)x1,x2,…,xn是來(lái)自正態(tài)分布N(θ,σ2)的一個(gè)樣本觀察值。其中σ2已知。此樣本的似然函數(shù)為:
(8)
由于已知θ的先驗(yàn)分布為正態(tài)分布N(μ,τ2):
-∞<θ<+∞
(9)
其中μ與τ2為已知,由此可以寫(xiě)出樣本x與參數(shù)θ的聯(lián)合密度函數(shù):
(10)
則有
(11)
(12)
上面兩式相除,即得θ的后驗(yàn)分布
(13)
這說(shuō)明了正態(tài)均值(方差已知)的共軛先驗(yàn)分布是正態(tài)分布。
未知參數(shù)θ的后驗(yàn)分布π(θ|x)是集3種信息(總體,樣本和先驗(yàn))于一身,它包含了θ的所有可供利用的信息,所以有關(guān)θ的估計(jì)和假設(shè)檢驗(yàn)等統(tǒng)計(jì)推斷都按一定方式從后驗(yàn)分布π(θ|x)中提取信息。
4.1 貝葉斯估計(jì)
參數(shù)θ的貝葉斯估計(jì)有3種:最大后驗(yàn)估計(jì)、θ的后驗(yàn)中位數(shù)估計(jì)和θ的后驗(yàn)期望估計(jì)[6]。在一般場(chǎng)合下,這3種貝葉斯估計(jì)是不同的,當(dāng)后驗(yàn)密度函數(shù)為對(duì)稱時(shí),這3種貝葉斯估計(jì)重合,是相同的。
(14)
4.2 假設(shè)檢驗(yàn)
H0:θ=θ0,H1:θ≠θ0
其中ε是很小的數(shù),使得[θ0-ε,θ0+ε]與θ=θ0難以辨別。
對(duì)簡(jiǎn)單假設(shè)H0:θ=θ0作貝葉斯檢驗(yàn)時(shí)不能采用連續(xù)密度函數(shù)作為先驗(yàn)分布,因?yàn)槿魏芜@種先驗(yàn)將使θ=θ0的先驗(yàn)概率為0,從而后驗(yàn)概率也為0,所以一個(gè)有效的方法是對(duì)θ=θ0給一驗(yàn)前概率π0,而對(duì)θ≠θ0給一個(gè)加權(quán)的密度π1g1(θ),g1(θ)~N(μg,v2),θ的先驗(yàn)密度為
π(θ)=π0Iθ0(θ)+π1g1(θ)
(15)
其中Iθ0(θ)為θ=θ0的示性函數(shù),π0為近似的實(shí)際假設(shè)H0:θ∈[θ0-ε,θ0+ε]上的先驗(yàn)概率。
(16)
其中
則有
(17)
其中
利用正態(tài)分布的正則性,可得
(18)
從而簡(jiǎn)單原假設(shè)與復(fù)雜備選假設(shè)(記為Θ1={θ≠θ0})的后驗(yàn)概率分別為
后驗(yàn)機(jī)會(huì)比為
從而貝葉斯因子為
(19)
對(duì)于H1:θ≠θ0上的先驗(yàn)密度g1(θ),一般地,參數(shù)θ接近于θ0比遠(yuǎn)離θ0更為可能,所以一般取μg=θ0,v2一般可以取2σ2,則有
(20)
表1 驗(yàn)前歷次測(cè)試數(shù)據(jù)
表2 驗(yàn)前分布參數(shù)
已知該此4套捷聯(lián)慣組同一誤差系數(shù)的驗(yàn)后測(cè)試樣本如表3所示。
表3 驗(yàn)后歷次測(cè)試數(shù)據(jù)
表4 驗(yàn)后分布參數(shù)
由這4套慣組得到的用于假設(shè)檢驗(yàn)的當(dāng)前測(cè)試樣本如表5所示。
表5 當(dāng)前歷次測(cè)試數(shù)據(jù)
表6 貝葉斯因子
由于貝葉斯因子均大于1,所以接受原假設(shè):H0:θ=θi0,i=1,2,3,4,這表明此誤差系數(shù)總體分布的參數(shù)符合正態(tài)分布,不同慣組其分布參數(shù)不同,同時(shí)分析結(jié)果也表明此誤差系數(shù)總體分布設(shè)為正態(tài)分布的合理性。
將隨機(jī)加權(quán)最大熵法應(yīng)用于對(duì)捷聯(lián)慣組歷次測(cè)試數(shù)據(jù)的統(tǒng)計(jì)特性分析,既能利用隨機(jī)加權(quán)法有效擴(kuò)充測(cè)試次數(shù)的樣本信息,也能采用最大熵法充分利用樣本信息,盡量避免主觀因素的影響,有效減小驗(yàn)前信息不確定性的影響,在驗(yàn)后分布的基礎(chǔ)上進(jìn)行統(tǒng)計(jì)推斷,可為進(jìn)一步的捷聯(lián)慣組歷次測(cè)試數(shù)據(jù)時(shí)間序列建模與預(yù)報(bào)提供分析基礎(chǔ)。
[1] Efron B, Stein C.The Jackknife Estimate of Variance [J]. Operations Research,1981, (9):586-596.
[2] 鄭鐘國(guó). 隨機(jī)加權(quán)法[J].應(yīng)用數(shù)學(xué)學(xué)報(bào),1987,10(2):247-253.(ZHENG Zhongguo. Random Weighting Method[J]. Acta Mathematicae Applicatae Sinica,1987,10(2):247-253.)
[3] 徐軍輝,肖正林,錢培賢.基于Bootstrap 方法的捷聯(lián)慣組歷次測(cè)試數(shù)據(jù)驗(yàn)前分布研究[J].宇航學(xué)報(bào),2006,27(3):407-411. (XU Junhui, XIAO Zhenglin, QIAN Peixian. The Prior Distribution Study of SIMU Successive Test Data Baesd on Bootstrap Method[J]. Journal of Astronautics, 2006,27(3):407-411.)
[4] 徐軍輝,錢培賢,李輝.基于隨機(jī)加權(quán)法的捷聯(lián)慣組歷次測(cè)試數(shù)據(jù)驗(yàn)前分布研究[J]. 戰(zhàn)術(shù)導(dǎo)彈技術(shù), 2007,(3):71-73.( XU Junhui, QIAN Peixian, LI Hui. The Population Parameter Prior Distribution Study of Successive Test Data of SIMU Based on Random Weighting Method[J]. Tactical Missile Technology,2007,(3):71-73.)
[5] 張守玉, 劉博強(qiáng).小樣本下裝備平均維修時(shí)間驗(yàn)前分布確定方法研究[J].裝備指揮技術(shù)學(xué)院學(xué)報(bào), 2010,5(21):353-360.(ZHANG Shouyu,LIU B0qiang. Study on Ascertainment Method of Prior Distribution for MTTR on Small Samples[J]. Journal of the Academy of Equipment Command and Technology, 2010,5(21):353-360.)
[6] 凌光, 戴怡, 王仲民.面向數(shù)控系統(tǒng)可靠性評(píng)估的最大熵先驗(yàn)信息解[J].機(jī)械工程學(xué)報(bào),2008,48(6):157-161.(LING Guang, DAI Yi, WANG Zhongmin. Maximum Entropy Prior Information Solution for Numerical Control System Reliability Assessment[J]. Journal of Mechanical Engineering, 2008,48(6):157-161.)
The Analysis of SIMU Successive Test Data Based on Combined Model
ZHANG Huanxin LI Xuefeng
Beijing Aerospace Automatic Control Institute, Beijing 100854, China
Aimingatthesmallsamplefeaturesofstrapdowninertialmeasurementunit(SIMU)successivetestdata,therandomweightingmethodandmaximumentropymethodareusedtogetthepriordistributionofpopulationparameterofsuccessivetestdataofSIMUwithpriorinformation,whenthedistributionformofpopulationparameterisknown.TheBayesianmethodisadoptedtodeterminetheposteriordistributionwiththepriorinformationandcurrentinformation,andthestatisticalcharacteristicofSIMUsuccessivetestdataarerevealedandtheerrorsofstatisticalanalysisinthecaseofsmallsamplesarereduced.
SIMU;Randomweightingmethod;Maximumentropymethod;Successivetestdata;Priordistribution;Smallsample
2013-02-04
張煥鑫(1984-),男,山東昌邑人,博士研究生,主要研究方向?yàn)榭刂葡到y(tǒng)綜合與小樣本建模;李學(xué)鋒(1966-),男,陜西漢中人,研究員,博士研究生導(dǎo)師,主要研究方向?yàn)閷?dǎo)航、制導(dǎo)與控制。
TJ765.1
A
1006-3242(2014)01-0040-04