王玉偉 高 永
(海軍航空大學(xué) 煙臺 264001)
無人機(jī)發(fā)展如今邁入全新時(shí)代,無人機(jī)飛行訓(xùn)練的效能評估已成為全世界飛行訓(xùn)練行業(yè)的難點(diǎn)之一[1,13],飛行訓(xùn)練質(zhì)量評價(jià)技術(shù)漸漸變成訓(xùn)練支持技術(shù)研究領(lǐng)域的熱點(diǎn)[14]。而飛行質(zhì)量基于無人機(jī)飛參數(shù)據(jù)特征進(jìn)行評價(jià),所以數(shù)據(jù)的預(yù)處理效果好壞對于飛行質(zhì)量評價(jià)至關(guān)重要[2,8]。
針對飛參預(yù)處理,國內(nèi)外研究資料較少,文獻(xiàn)[10]采用了卡爾曼濾波的方法,采用信號和噪聲的狀況空間模式,采用前一時(shí)間的評估值與現(xiàn)一時(shí)間的測定值用來革新對于狀態(tài)變量的評估,得到時(shí)刻的評估值,在一定幅度之上降低了數(shù)據(jù)的噪音??墒菍?shí)際運(yùn)用時(shí),在噪音模式于信號模式狀況不知道的情況下,沒辦法保障評估值的準(zhǔn)確性,當(dāng)現(xiàn)實(shí)系統(tǒng)的非線性特性比較強(qiáng),或噪音特性稍微和高斯分布相差比較大的情況下,卡爾曼濾波不能夠給出真實(shí)的結(jié)論。文獻(xiàn)[3]采用了經(jīng)典最小二乘方法,實(shí)現(xiàn)了對數(shù)據(jù)野值的剔除和曲線的平滑。經(jīng)典最小二乘目的是使殘差平飛和達(dá)到最小,然而對每個(gè)樣本點(diǎn)設(shè)定的權(quán)重卻都是一樣的,所以異常值對其擬合曲線影響很大,對數(shù)據(jù)的回歸缺乏魯棒性[6]。
有鑒于此,文章中提出了基于M評估穩(wěn)健回歸多的方式對于數(shù)據(jù)預(yù)處理情況進(jìn)行研究,利用迭代加權(quán)最小二乘估計(jì)回歸方程系數(shù),根據(jù)樣本點(diǎn)偏離程度大小確定權(quán)重,對偏離程度大的設(shè)定小權(quán)重,對偏離小的設(shè)定大權(quán)重,以此建立加權(quán)最小二乘估計(jì),不斷更替改變權(quán)重系數(shù),直到擬合點(diǎn)和實(shí)測點(diǎn)中間的偏差小于制定的閾值區(qū)域,以達(dá)到穩(wěn)健的目的。
四邊航線飛行任務(wù),其中高度數(shù)據(jù)如圖1所示。
0~6000點(diǎn)是處于起飛滑跑階段,可以看出該階段內(nèi)高度接近于0,進(jìn)行飛行任務(wù)的場地是一塊平地,所以滑跑起飛段采集的高度數(shù)據(jù)理想狀態(tài)應(yīng)該是一段高度為0m的水平直線,現(xiàn)取前6000個(gè)高度數(shù)據(jù)點(diǎn)作為誤差分析對象。如圖2所示。
上圖可以看出,數(shù)據(jù)采集有野值和噪聲,存在測量誤差,導(dǎo)致數(shù)據(jù)的測量值與被測數(shù)據(jù)真值有偏差。測量誤差一般可分為隨機(jī)誤差、系統(tǒng)誤差、粗大誤差[2]。
隨機(jī)誤差:在特定的情況下實(shí)行重復(fù)測定,或時(shí)間序列之上收集數(shù)據(jù)的時(shí)候,總是存有一樣量值與符號均不確定,改變不存在規(guī)律,但是全部來看有符合特定的統(tǒng)計(jì)特性的偏差。
系統(tǒng)誤差:同一測量環(huán)境下,多次測量的數(shù)據(jù)保持不變或按照一定規(guī)律變化的誤差。在相同測定情況下,很多次測定的數(shù)據(jù)維持不變,或依照特定的規(guī)律改變的誤差。
粗大誤差:由于測量環(huán)境的意外改變或受到外界的干擾(電磁干擾,發(fā)動(dòng)機(jī)振動(dòng))等原因造成的測量誤差。
這些誤差的存在將直接影響飛參數(shù)據(jù)的判讀,對飛行數(shù)據(jù)細(xì)節(jié)要求細(xì)致的工作,如飛行動(dòng)作識別和飛行動(dòng)作質(zhì)量評估等極為不利[4]。
穩(wěn)健回歸是一樣統(tǒng)計(jì)學(xué)穩(wěn)健評估之中的方式,其重要思路是把對于異常值非常敏銳的經(jīng)典最小二乘回歸使用的目標(biāo)函數(shù)實(shí)行改進(jìn)。經(jīng)典最小二乘回歸為了使誤差平方和取得最小值作為其目標(biāo)函數(shù),由于方差是一個(gè)不穩(wěn)定統(tǒng)計(jì)量,所以經(jīng)典最小二乘也是一個(gè)不穩(wěn)定的方式[6]。
假設(shè)有k個(gè)影響因素x1,x2,…,xk,與因變量Y的關(guān)系如下:式(1)稱為多元線性回歸函數(shù)。 βi稱為回歸系數(shù),寫成矩陣表達(dá)式為
加權(quán)最小二乘估計(jì)的原理:給每種樣本點(diǎn)授予不同的權(quán)重,偏差較大的樣本授予的權(quán)重較小,偏差比較小的樣本授予的權(quán)重較大,這樣產(chǎn)生的反常野值點(diǎn)也不會(huì)對于最終的估計(jì)值造成較大干擾[6]。此時(shí)目標(biāo)優(yōu)化函數(shù)為
M估計(jì)穩(wěn)健回歸想法是,利用迭代加權(quán)最小二乘回歸系數(shù)。依據(jù)前一次測定的回歸殘差大小來決定各個(gè)樣本的權(quán)重。把目標(biāo)優(yōu)化函數(shù)改寫成:
ρ稱為影響函數(shù)。在穩(wěn)健估計(jì)中影響函數(shù)很多,可依據(jù)真實(shí)要求選擇不一樣的影響函數(shù)用來替換殘差平方和。Huber函數(shù)的影響函數(shù)如下:
為讓M估計(jì)具有穩(wěn)健性,我們在函數(shù)之中引進(jìn)一個(gè)穩(wěn)定的標(biāo)準(zhǔn)估計(jì)s讓殘差得到標(biāo)準(zhǔn)化,s一般取值為Hampel提出的絕對離差中位數(shù)除以一個(gè)常數(shù) 0.6745,獲 得 標(biāo) 準(zhǔn) 化 殘 差 ,即 ui=這里med表示中位數(shù)運(yùn)算。于是,
算法具體迭代步驟如下:
4)退回步驟 2),依序更替計(jì)算 β?(i),當(dāng)相近兩步驟的回歸系數(shù)差的絕對值取得的最大值小于原先制定的尺度誤差之時(shí),迭代結(jié)束,即max| β?(i)- β?(i-1)|< ε。 ε為預(yù)先設(shè)定的一個(gè)正數(shù),如0.0001等。和經(jīng)典最小二乘的強(qiáng)制回歸相比較,穩(wěn)健回歸存在很好的魯棒性。
飛參數(shù)據(jù)采樣間隔很短,每0.02s就進(jìn)行一次采樣,1s就會(huì)采集50個(gè)數(shù)據(jù),假如計(jì)算1h的擬合曲線,直接利用上述算法會(huì)產(chǎn)生矩陣維數(shù)過高,求解矩陣呈病態(tài)。所以可對數(shù)據(jù)進(jìn)行合理分段擬合,采用算法是從零開始取9個(gè)點(diǎn)作為第一個(gè)區(qū)間,設(shè)區(qū)間回歸方程為:y=β0+β1x,用穩(wěn)健估計(jì)出第一個(gè)區(qū)間的回歸系數(shù),計(jì)算出中間值即第5個(gè)點(diǎn)擬合值,接著取第二個(gè)點(diǎn)到第十個(gè)點(diǎn)作為第二個(gè)區(qū)間,得出第二個(gè)區(qū)間的回歸系數(shù),計(jì)算出第6個(gè)點(diǎn)擬合值,依次類推。開始4個(gè)點(diǎn)單獨(dú)作為區(qū)間得出回歸系數(shù),計(jì)算其擬合值,最后4個(gè)點(diǎn)同理可得。所有點(diǎn)擬合完,即第一輪擬合結(jié)束。
假定擬合區(qū)間具有N個(gè),每一個(gè)區(qū)間擬合值與實(shí)測值偏差的標(biāo)準(zhǔn)差的之和的平均值公式即
利用穩(wěn)健估計(jì)模型預(yù)測的擬合值,并與飛參記錄的相應(yīng)數(shù)據(jù)進(jìn)行比較,若實(shí)測數(shù)據(jù)與擬合值相差小于3δ~5δ(根據(jù)數(shù)據(jù)具體處理效果可改變閾值大小),即以為該點(diǎn)就是合理點(diǎn),反之就認(rèn)為是野值點(diǎn),排除該點(diǎn)并利用擬合點(diǎn)代替。一輪替換完畢后,進(jìn)行下輪擬合,并識別野值和替換,直至新的一輪沒有野值為止。
用穩(wěn)健回歸方法對飛參數(shù)據(jù)進(jìn)行預(yù)處理仿真實(shí)驗(yàn),空速的野值剔除以及擬合效果圖如圖3~圖5所示。
由以上仿真可以看出,該方法能有效地對14000個(gè)空速數(shù)據(jù)點(diǎn)進(jìn)行野值識別剔除,曲線擬合平滑,效果顯著。把高度數(shù)據(jù)為作為例子,運(yùn)用經(jīng)典最小二乘與穩(wěn)健回歸方式分別實(shí)行預(yù)處理,結(jié)果如圖6所示。
通過圖6能夠看出,受被野值影響,經(jīng)典最小二乘現(xiàn)在脫離了標(biāo)準(zhǔn)模式,然而穩(wěn)健回歸最后擬合的結(jié)果較好。由于基于經(jīng)典最小二乘評估的多元線性回歸是把每一個(gè)樣本授予相同的權(quán)重,并且都作為非異常值處理,但要是其中存在異常值,如飛參中那些粗大值,離預(yù)期真值較遠(yuǎn)的樣本點(diǎn),此方法獲得的估計(jì)值會(huì)起到較大影響。最小二乘為獲得最小化殘差平方和的目標(biāo),一定要將就異常野值,因此異常值對最小二乘評估非常敏感。
綜上可知,針對飛參數(shù)據(jù)采集過程中出現(xiàn)的野值、噪聲等情況,利用穩(wěn)健回歸方法進(jìn)行數(shù)據(jù)預(yù)處理,可以很好地躲避異常值的影響,并且在擬合精度上相比經(jīng)典最小二乘方式都有了顯著的提升,尤其在現(xiàn)實(shí)工程運(yùn)用上,穩(wěn)健回歸方式存在良好的魯棒性。
本文針對無人機(jī)采集飛行數(shù)據(jù)過程中存在數(shù)據(jù)野值,噪聲以及丟失現(xiàn)象,研究了飛行數(shù)據(jù)誤差的表現(xiàn)及原因,采用了一樣基于M估計(jì)穩(wěn)健回歸方式,利用反復(fù)加權(quán)最小二乘迭代的穩(wěn)健回歸方法,獲得回歸方程之中的回歸系數(shù),完成了對于飛參參數(shù)的擬合,制定偏差閾值排除了野值。仿真結(jié)論顯示,穩(wěn)健回歸方式可以有效限制異常值對于參數(shù)評估的影響,完成對于數(shù)據(jù)的擬合和野值的排除。