崔書華,李 果,劉軍虎,宋衛(wèi)紅,沈 思
(1 宇航動(dòng)力學(xué)國家重點(diǎn)實(shí)驗(yàn)室,西安 710043;2 西安衛(wèi)星測(cè)控中心,西安 710043)
?
基于偏度與峰度的數(shù)據(jù)質(zhì)量評(píng)估
崔書華1,2,李 果2,劉軍虎2,宋衛(wèi)紅2,沈 思2
(1 宇航動(dòng)力學(xué)國家重點(diǎn)實(shí)驗(yàn)室,西安 710043;2 西安衛(wèi)星測(cè)控中心,西安 710043)
針對(duì)外彈道測(cè)量數(shù)據(jù)質(zhì)量情況,拓展數(shù)據(jù)質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn),提出了用分布偏度與峰度的分析方法描述數(shù)據(jù)質(zhì)量狀態(tài)。通過對(duì)跟蹤測(cè)量數(shù)據(jù)進(jìn)行分析驗(yàn)證,證明運(yùn)用該方法可有效、直觀的定量、定性的確定數(shù)據(jù)質(zhì)量情況,為跟蹤測(cè)量數(shù)據(jù)的使用提供了可靠性評(píng)價(jià)及使用決策。
偏度;峰度;數(shù)據(jù)分析;結(jié)果評(píng)估
正態(tài)分布是外彈道測(cè)量數(shù)據(jù)質(zhì)量分析最常使用的理論基礎(chǔ),通常也是統(tǒng)計(jì)測(cè)量數(shù)據(jù)隨機(jī)誤差的前提。所以,正態(tài)分布的檢驗(yàn)在外彈道數(shù)據(jù)處理中是關(guān)鍵環(huán)節(jié)。檢驗(yàn)一個(gè)樣本是否服從正態(tài)分布的方法有很多,包括Kolmogorov檢驗(yàn)、χ2擬合優(yōu)度檢驗(yàn)、Shapiro-Will檢驗(yàn)和偏度-峰度檢驗(yàn)等。但各有一些局限性,如Kolmogorov檢驗(yàn)只有當(dāng)假設(shè)的分布完全已知的時(shí)候才適用,χ2檢驗(yàn)犯第二類錯(cuò)誤(接受不正確零假設(shè)的錯(cuò)誤)的概率往往較大,Shapiro-Will檢驗(yàn)要求樣本容量不大于50[1]等。而偏度-峰度法是一種快速、有效的正態(tài)檢驗(yàn)方法,并且對(duì)樣本的容量沒有嚴(yán)格要求。現(xiàn)有文獻(xiàn)中,在其他領(lǐng)域有較多的利用偏度-峰度法對(duì)數(shù)據(jù)進(jìn)行分析、判斷、決策,如文獻(xiàn)[2-6]闡述了在各自的領(lǐng)域充分利用偏度-峰度技術(shù)取得的成果,但在外彈道測(cè)量數(shù)據(jù)質(zhì)量分布的偏度和峰度分析方面極少。因此,文中選用偏度-峰度檢驗(yàn)法對(duì)外彈道測(cè)量數(shù)據(jù)進(jìn)行分析,通過偏度和峰度統(tǒng)計(jì)量檢驗(yàn)樣本是否服從先前的假設(shè)條件,以期更為客觀地反映實(shí)測(cè)數(shù)據(jù)情況,并給出飛行目標(biāo)彈道計(jì)算結(jié)果的可靠性評(píng)價(jià)及使用建議,為彈道的最優(yōu)化連接和數(shù)據(jù)融合中的權(quán)值最優(yōu)匹配做出決策。
在外彈道數(shù)據(jù)處理中,最典型的擬合方法就是利用最小二乘原理求解,即要求各數(shù)據(jù)偏離曲線函數(shù)值的誤差的平方和最小。它通過最小化誤差平方和找到一組數(shù)據(jù)的最佳函數(shù)匹配。通過擬合之后,獲取隨機(jī)變量,隨機(jī)變量的三階中心矩成為偏度,隨機(jī)變量的四階中心矩成為峰度。偏度和峰度是描述分布形狀的重要數(shù)字特征。
1.1 偏度檢驗(yàn)
偏度(skewness)是統(tǒng)計(jì)隨機(jī)變量數(shù)據(jù)分布偏斜方向和程度的度量,是統(tǒng)計(jì)隨機(jī)變量數(shù)據(jù)分布非對(duì)稱的數(shù)字特征。偏度是利用三階矩定義的,其物理含義為:
設(shè)x1,x2,…,xn是來自總體x的一個(gè)樣本,則總體x的偏度可估計(jì)為:
(1)
若s>0,則稱x的分布是正偏(或右偏),意味著在概率密度函數(shù)右側(cè)的尾部比左側(cè)長,絕大部分值位于平均值的左側(cè);若s<0,則稱x的分布是負(fù)偏(或左偏),意味著在概率密度函數(shù)左側(cè)的尾部比右側(cè)長,絕大多數(shù)的值位于平均值的右側(cè);若s=0,則表示數(shù)值相對(duì)均勻的分布在平均值的兩側(cè)。|s|越大,說明分布偏斜得越厲害。對(duì)偏度值影響較大的是分布在其中一個(gè)方向上的尾部有拉長趨勢(shì)的程度[4]。
1.2 峰度檢驗(yàn)
峰度(kurtosis)是另一個(gè)反映隨機(jī)變量分布形狀的量,其是利用四階矩定義的,物理含義為:
設(shè)x1,x2,…,xn是一組樣本數(shù)據(jù)或一組有限總體數(shù)據(jù),則其峰度的計(jì)算公式為:
(2)
峰度度量的是好數(shù)據(jù)的集中程度,峰度的取值范圍是[-3,∞],正態(tài)峰度分布時(shí)為k=0,表示好壞數(shù)據(jù)差距處于一個(gè)合適的“度”;若k<0,則說明x分布尾部比正態(tài)分布的尾部細(xì),表示好數(shù)據(jù)比較分散,好壞數(shù)據(jù)差距大,且|k|越大,尾部越細(xì);若k>0,則說明隨機(jī)變量x分布的尾部比正態(tài)分布的尾部粗,表示好數(shù)據(jù)比較集中,好壞數(shù)據(jù)差距小,并且k值越大,尾部越粗;若k為無窮大時(shí),好壞數(shù)據(jù)沒有差距,曲線變成一條直線。峰度可以用來比較已標(biāo)準(zhǔn)化了的各隨機(jī)變量分布的尾部厚度。
1.3 檢驗(yàn)方法
單純利用偏度或單純利用峰度來分析數(shù)據(jù)的分布情況是有缺陷的,只有兩者同時(shí)進(jìn)行檢驗(yàn)才能保證對(duì)數(shù)據(jù)進(jìn)行客觀評(píng)價(jià)。即當(dāng)s=0且k=0時(shí),數(shù)據(jù)才能滿足正態(tài)分布。但值得關(guān)注的是,數(shù)據(jù)的偏度和峰度在什么數(shù)值范圍內(nèi)才能認(rèn)為數(shù)據(jù)分布可作正態(tài)近似,這很難給出一般性的答案[5]。所以,在外彈道測(cè)量數(shù)據(jù)進(jìn)行綜合分析時(shí)需要對(duì)隨機(jī)誤差數(shù)據(jù)同時(shí)進(jìn)行偏度和峰度的檢驗(yàn),在確定數(shù)據(jù)融合的使用跟蹤弧段時(shí),需要綜合考慮其他跟蹤測(cè)量設(shè)備的數(shù)據(jù)情況,通過比對(duì)分析同跟蹤弧段不同設(shè)備隨機(jī)誤差數(shù)據(jù)的偏度和峰度檢驗(yàn)結(jié)果,確定最優(yōu)權(quán)值的匹配,以期達(dá)到逼近實(shí)際目標(biāo)飛行的彈道參數(shù)。
以雷達(dá)跟蹤測(cè)量數(shù)據(jù)為例(這里假設(shè)雷達(dá)測(cè)量數(shù)據(jù)已對(duì)系統(tǒng)誤差進(jìn)行了充分、可靠的修正),綜合討論其從測(cè)元數(shù)據(jù)到最終結(jié)果的質(zhì)量情況,以及彈道高可信度選擇及可使用弧段的確定。
2.1 擬合殘差分析
圖1~圖3為某雷達(dá)跟蹤測(cè)量數(shù)據(jù)的測(cè)距R、俯仰角E和方位角A數(shù)據(jù)應(yīng)用最小二乘方法擬合后與原始測(cè)量數(shù)據(jù)的殘差數(shù)據(jù)圖。
圖1 測(cè)距R擬合差殘數(shù)據(jù)圖
圖2 俯仰角E擬合殘差數(shù)據(jù)圖
圖3 方位角A擬合殘差數(shù)據(jù)圖
從圖1~圖3可以直觀地看出,某些弧段跟蹤測(cè)量的數(shù)據(jù)擬合殘差較好。但是,如果定量的確定哪些跟蹤測(cè)量數(shù)據(jù)可以滿足正態(tài)分布的前提假設(shè),并確定是否具有高的可使用度,還必須進(jìn)一步進(jìn)行分析。在下面的討論中,將針對(duì)3個(gè)測(cè)元的跟蹤測(cè)量弧段280~310 s的數(shù)據(jù)進(jìn)行相關(guān)分析。
2.2 偏度峰度分析
圖4~圖6為雷達(dá)跟蹤測(cè)量數(shù)據(jù)測(cè)距R、俯仰角E和方位角A數(shù)據(jù)隨機(jī)差相對(duì)應(yīng)的偏度與峰度統(tǒng)計(jì)數(shù)據(jù)圖。
圖4 測(cè)距R偏度及峰度數(shù)據(jù)圖
圖5 俯仰角E偏度及峰度數(shù)據(jù)圖
圖6 方位角A偏度及峰度數(shù)據(jù)圖
從圖4~圖6中可以看出,測(cè)距R的隨機(jī)差數(shù)據(jù)的偏度和峰度在280~310 s弧段量值適度,其相對(duì)應(yīng)弧段的方位角A隨機(jī)誤差的偏度和峰度也較其他弧段適度。為了便于飛行器目標(biāo)定位精度情況的分析,選取具有相對(duì)較好偏度與峰度量值的280~310 s俯仰角E數(shù)據(jù)。
2.3 目標(biāo)位置精度分析
上述分析的雷達(dá)跟蹤測(cè)量的數(shù)據(jù)質(zhì)量情況,為確定高可信度的使用弧段奠定了基礎(chǔ)。為了行文方便,這里簡單介紹單臺(tái)雷達(dá)跟蹤測(cè)量數(shù)據(jù)定位精度計(jì)算方法,式(3)為飛行器目標(biāo)位置精度計(jì)算公式。
(3)
式中:R、E、A分別為測(cè)距、俯仰角和方位角的跟蹤測(cè)量數(shù)據(jù);σR、σE、σA分別為測(cè)距、俯仰角和方位角隨機(jī)誤差統(tǒng)計(jì)精度數(shù)據(jù)。
圖7~圖9為雷達(dá)跟蹤測(cè)量數(shù)據(jù)單臺(tái)定位后,飛行器目標(biāo)在3個(gè)方向的位置精度數(shù)據(jù)圖。
圖7 目標(biāo)在X方向的位置精度數(shù)據(jù)圖
圖8 目標(biāo)在Y方向的位置精度數(shù)據(jù)圖
圖9 目標(biāo)在Z方向的位置精度數(shù)據(jù)圖從圖7~圖9精度數(shù)據(jù)來看,結(jié)合偏度-峰度的統(tǒng)計(jì)結(jié)果,可信度高的使用段應(yīng)為280~310 s。相對(duì)來講,雖然飛行目標(biāo)在
Y
方向的210~250 s之間的定位精度較高,但結(jié)合式(3)和測(cè)距
R
的偏度與峰度綜合考慮,此段的樣本偏度有明顯的左偏和右偏情況,同時(shí)也處在多峰的數(shù)據(jù)弧段,故此段數(shù)據(jù)可信度不如280~310 s的數(shù)據(jù)。
通過上述分析可知,當(dāng)跟蹤測(cè)量數(shù)據(jù)的隨機(jī)誤差樣本嚴(yán)重左偏、嚴(yán)重右偏、多峰或其他非正態(tài)分布,即檢驗(yàn)樣本不服從先前的假設(shè)條件時(shí),會(huì)使目標(biāo)的定位誤差很大。只有綜合考慮跟蹤測(cè)量數(shù)據(jù)的偏度和峰度,才能準(zhǔn)確判定數(shù)據(jù)的可使用跟蹤弧段。所以,利用偏度-峰度的分析手段,不僅可以判斷數(shù)據(jù)處理的可信區(qū)域,也能為獲得更準(zhǔn)確的定位精度尋求一種合理、科學(xué)、有效的手段。文中為外彈道測(cè)量數(shù)據(jù)評(píng)價(jià)與分析的方法,以及為后續(xù)彈道的數(shù)據(jù)融合和彈道連接提供了參考。
[1] 宋震龍, 將剛毅, 黃晃, 等. 基于偏度-峰度檢驗(yàn)的無線局域網(wǎng)室內(nèi)定位算法 [J]. 通信學(xué)報(bào), 2012, 33(5): 99-105.
[2] 傅俊輝, 張衛(wèi)國, 陸倩, 等. 考慮偏度風(fēng)險(xiǎn)和峰度風(fēng)險(xiǎn)的非線性期貨套期保值模型 [J]. 系統(tǒng)工程, 2009, 27(10): 44-48.
[3] 王春峰, 莊泓剛, 房振明, 等. 多維條件方差偏度峰度建模 [J]. 系統(tǒng)工程理論與實(shí)踐, 2010, 30(2): 324-331.
[4] 王學(xué)民. 偏度和峰度概念的認(rèn)識(shí)誤區(qū) [J]. 統(tǒng)計(jì)與決策, 2008, 264(12): 145-146.
[5] 王學(xué)民. 關(guān)于樣本均值的抽樣分布能否作正態(tài)近似的探討 [J]. 統(tǒng)計(jì)研究, 2005(7): 75-77.
Assessment and Analysis of Trajectory Measurement Data Based onSkewness and Kurtosis
CUI Shuhua1,2,LI Guo2,LIU Junhu2,SONG Weihong2,SHEN Si2
(1 State Key Laboratory of Astronautic Dynamics, Xi’an 710043, China; 2 Xi’an Satellite Monitor and Control Center, Xi’an 710043, China)
Due to quality of trajectory measurement data and extension of quality standard, distributed skewness and kurtosis analysis were put forward. It is proved that application of the method is able to determine quantitative and qualitative quality of data effectively and directly by analysis and verification of measurement data. Also, the method provides reliability evaluation and suggestion on measurement data.
skewness; kurtosis; data analysis; assessment of results
2014-12-17
國家自然科學(xué)基金(61473222;61231018;41274018)資助
崔書華(1964-),女,天津人,高級(jí)工程師,研究方向:外彈道數(shù)據(jù)處理方法及評(píng)估。
V557
A