基于Bootstrap原理的立靶密集度估計
彭峰生,舒林森,寧瑋
(陜西理工學(xué)院 機械工程學(xué)院, 陜西 漢中 723000)
[摘要]闡明了Bootstrap抽樣的理論和方法,著重對該方法的置信區(qū)間等參數(shù)估計作了詳細(xì)研究,應(yīng)用該方法進行了火炮射擊立靶密集度估計實例分析,結(jié)果表明該方法對小樣本參數(shù)估計問題有較高的實用價值。
[關(guān)鍵詞]統(tǒng)計與概率;Bootstrap理論;Monte Carlo抽樣;參數(shù)估計;立靶密集度
[文章編號]1673-2944(2015)05-0066-04
[中圖分類號]O212.2
收稿日期:2015-03-19
基金項目:陜西省教育廳科學(xué)研究計劃項目(15JK1142)
作者簡介:彭峰生(1972—),男,陜西省漢中市人,陜西理工學(xué)院高級工程師,博士,主要研究方向為復(fù)雜機電系統(tǒng)分析。
長期以來,小子樣參數(shù)估計和統(tǒng)計分析問題困擾著許多工程實踐工作,一些重大項目的試驗樣機數(shù)量很少,一般只有有限的幾個,甚至只有唯一的一件樣機。這種情況下,通過現(xiàn)場試驗測試的數(shù)據(jù)十分寶貴而有限。如何在少量測試數(shù)據(jù)的條件下,找出數(shù)據(jù)的統(tǒng)計特性和規(guī)律,為樣機的改進提供指導(dǎo)依據(jù),給工程試驗數(shù)據(jù)分析人員帶來挑戰(zhàn)。
Bootstrap方法[1-2]由美國統(tǒng)計學(xué)家Efron首次系統(tǒng)地提出,該方法并不需要對總體分布作假設(shè)或事先推導(dǎo)估計量的解析式,它要做的僅僅是重構(gòu)樣本并不斷計算估計值,本質(zhì)上是一種非參數(shù)方法[3]。在分布類型未知的情況下,Bootstrap方法為我們提供了解決此類問題的另一種有效思路。
本文通過研究Bootstrap方法和有關(guān)統(tǒng)計參數(shù)估計的理論,采用樣本數(shù)據(jù)重復(fù)抽樣的方法增大研究對象的數(shù)據(jù)樣本容量,在此基礎(chǔ)上提出參數(shù)估計的方法和步驟,并給出參數(shù)估計的誤差分析與估計辦法。最后通過一個工程實例的小樣本條件下數(shù)據(jù)參數(shù)估計計算,初步驗證了所提出的方法。
1Bootstrap方法參數(shù)估計原理
樣本參數(shù)θ是分布函數(shù)F的函數(shù),記作θ=θ(F)。當(dāng)我們將樣本看作總體來處理時,樣本分布函數(shù)的估計參數(shù)應(yīng)該是總體參數(shù)的一個良好估計。參數(shù)估計的步驟如下[6]:
(2)重復(fù)(1)中的過程B次,B是一個足夠大的整數(shù),由此獲得了B個容量為n的Bootstrap樣本;
2Bootstrap抽樣的置信區(qū)間
大多數(shù)統(tǒng)計推斷涉及到分布參數(shù)的估計。最常見的是近似置信區(qū)間估計,就是使用樣本參數(shù)確定特殊區(qū)間的一種方法[7]。理想的區(qū)間有如下兩個特性:(1)該區(qū)間包含了參數(shù)θ;(2)區(qū)間相對來說是較窄的。區(qū)間的兩個端點稱作上、下置信限,它們是隨機樣本的函數(shù),因而也是隨機變量。因此,由一個樣本計算出的區(qū)間不一定包含θ。當(dāng)然,如果采用一種合適的區(qū)間估計法,不斷地重復(fù)取樣,那么將從每個隨機產(chǎn)生的估計區(qū)間之中,確定得到以概率C包含參數(shù)θ的估計區(qū)間。置信度C定義為置信區(qū)間包含θ的近似概率。因此,如果C很大(接近于1),則我們完全可以確信由單個樣本計算出的置信區(qū)間包含參數(shù)θ。
(1)
(2)
(3)
(4)
這里η~N(0,1),當(dāng)樣本容量n→+∞時,稱之為標(biāo)準(zhǔn)正態(tài)分布。標(biāo)準(zhǔn)置信區(qū)間是根據(jù)η~N(0,1)分布推導(dǎo)出來的。
還可得到另一個更好的近似估計,設(shè)
(5)
式(5)表明η服從于n-1個自由度的t分布。定義置信度為100(1-α)%的標(biāo)準(zhǔn)置信區(qū)間為
(6)
這里α=1-C稱為顯著性水平。
3應(yīng)用Bootstrap方法分析火炮射擊密集度
火炮用相同的射擊諸元對立靶進行多發(fā)射擊,靶平面上彈著點的分布稱為彈著散布。大量統(tǒng)計試驗表明:單管火炮的射彈立靶散布服從正態(tài)分布[6]。
所有彈著點的平均坐標(biāo)稱為散布中心。以散布中心為坐標(biāo)原點O,鉛直向上為Y坐標(biāo),水平向右為Z坐標(biāo),建立直角坐標(biāo)系ZOY。假設(shè)射彈散布在Z和Y軸相互獨立,則射彈散布服從獨立二維正態(tài)分布,其分布密度為f(z,y),即:
(7)
式中z和y分別為彈著點在Z和Y軸上的坐標(biāo),σz和σy分別為彈著點在Z和Y軸上散布的均方差。
通過坐標(biāo)變換可得
(8)
r和θ仍然為獨立隨機變量,且有
(9)
稱r為彈著點的瑞利半徑,一定的半徑表示一條等概率密度橢圓線。式(8)和(9)就是用瑞利半徑表示的彈著散布概率密度的數(shù)學(xué)表達式[8]。
某型自動炮通過靶場射擊試驗,取得一組立靶密集度數(shù)據(jù)(單位:m):0.732,0.864,0.627,0.563,0.926,0.684,0.981。假設(shè)系統(tǒng)誤差為0,則由式(2)得標(biāo)準(zhǔn)差σ=0.840 m,彈丸落入瑞利半徑R為1.5 m的圓內(nèi)的概率可由下式求出:
(10)
采用基于Bootstrap方法的蒙特卡洛仿真方法,通過仿真得到一組立靶密集度數(shù)據(jù)(單位:m):0.685,0.669,0.673,0.907,0.589,0.801,0.602,0.724,0.826,0.705。將仿真數(shù)據(jù)與靶場測試試驗數(shù)據(jù)組合,得到一組新的試驗數(shù)據(jù):0.732,0.864,0.627,0.563,0.926,0.684,0.981,0.685,0.669,0.673,0.907,0.589,0.801,0.602,0.724,0.826,0.705。
同理,假定系統(tǒng)誤差為0,則由式(2)得σ=0.770 m,彈丸落入瑞利半徑R為1.5 m的圓內(nèi)的概率可由下式求出:
(11)
顯然,通過基于Bootstrap方法的蒙特卡洛仿真方法增加試驗數(shù)據(jù)后,可以明顯提高參數(shù)評估的置信度水平。
4結(jié)束語
Bootstrap抽樣分析方法對于解決小樣本問題參數(shù)估計有獨特的優(yōu)勢。其方法簡單,可操作性強,只要對初始樣本多次重復(fù)隨機抽樣,就可構(gòu)成容量大的分析樣本,從而便于構(gòu)成統(tǒng)計量。該方法分析精度高,收斂快。
需指出的是,該方法估計參數(shù)對初始樣本有較強的依賴性。Bootstrap方法是一個復(fù)雜的過程,若重復(fù)這個過程,每次得到的結(jié)果會有輕微的差別。該方法的優(yōu)點是無需任何樣本總體的分布假定,即可獲得某一感興趣的分布參數(shù)估計。
[參考文獻]
[1]BRADLEY E.Bootstrap methods:another look at the jackknife[J].The Annals of Statistics,1979,7(1):1-26.
[2]BRADLEY E,ROBERT T.An introduction to the Bootstrap[M].New York:Chapman & Hall Ltd,1993.
[3]MOONEY C Z,DUVAL R D.Bootstrapping:A Nonparametric approach to statistical inference[J].Journal of the American Statistical Association,1993(2):427.
[4]BERGES J O.Statistical Decision Theory[M].New York:Springer-Verlay Press,1986.
[5]SHALIZI C.The Bootstrap[J].American Scientist,2010,98(3):186-190.
[6]唐雪梅,張金槐,邵鳳昌,等.武器裝備小子樣試驗分析與評估[M].北京:國防工業(yè)出版社,2001:7-11,221-224.
[7]金星,洪延姬,沈懷榮,等.可靠性數(shù)據(jù)計算及應(yīng)用[M].北京:國防工業(yè)出版社,2003.
[8]彭峰生,廖震強,王濤.有脫靶彈時自動火炮立靶密集度估計[J].彈道學(xué)報,2008,20(1):66-70.
[責(zé)任編輯:張存鳳]
Crowding level of vertical target parameters estimation based on Bootstrap sampling
PENG Feng-sheng,SHU Lin-sen,NING Wei
(School of Mechanical Engineering, Shaanxi University of Technology, Hanzhong 723000, China)
Abstract:The paper concentrates on developing the using of Bootstrap sampling methods and relative theories. The crowding level of vertical target of an automatic gun is studied carefully as a real example to explain the usage of the methods. It proves that Bootstrap sampling method is of great value in parameters estimation of small sampling problems.
Key words:statistics and probability;Bootstrap theory;Monte Carlo sampling;parameters estimating;crowding level of the vertical target