薛永亮,陳振林
(海軍航空大學(xué),山東煙臺264001)
航材保障能力是形成作戰(zhàn)能力、遂行多樣化軍事任務(wù)的物質(zhì)基礎(chǔ),航材供應(yīng)的及時性影響著航空部隊?wèi)?zhàn)斗力的生成。航材預(yù)測是航材精細(xì)化保障的重要工作,已有較多學(xué)者進(jìn)行了研究[1-5]。對某型直升機(jī)航材消耗建立模型時,該機(jī)型較新、服役時間短,難以獲取足夠數(shù)據(jù)。同時,該機(jī)型備件國產(chǎn)化水平低,大部分要依靠進(jìn)口,對該機(jī)型航材消耗,不僅要預(yù)測T+1時刻,還要預(yù)測T之后較長步幅的區(qū)間。本文參考多種分類、預(yù)測方法,針對上述問題,使用非參數(shù)回歸算法建立模型。非參數(shù)回歸是一種不對模型參數(shù)做任何假設(shè)的回歸算法[6],在預(yù)測的過程中,不對模型做先驗假設(shè),按照算法約定探究數(shù)據(jù)自身規(guī)律,僅規(guī)定一些一般性條件,近年來該算法在多學(xué)科運(yùn)用較為廣泛[7-13]。根據(jù)航材消耗序列轉(zhuǎn)化為消耗變異系數(shù)與序列突變系數(shù)[14],將航材分為消耗平穩(wěn)型航材、突變型航材、離散型航材。本文針對平穩(wěn)型航材波動性、離散性較小的消耗特點(diǎn),使用核近鄰非參數(shù)回歸建立消耗預(yù)測模型。
核近鄰估計是最經(jīng)典的非參數(shù)回歸算法,由Nadariyu 和Watson 提出,它的核心算法為在估計f(x0)時,給予接近觀測點(diǎn)x0更高的權(quán)重。同時,給予遠(yuǎn)離觀測點(diǎn)更低的權(quán)重[15]。令:
式(1)中:zi表示第i個觀測值x與聚焦點(diǎn)x0之間存在正負(fù)區(qū)別的距離;h表示估計帶寬,通過調(diào)整核函數(shù)的寬度來控制非參數(shù)回歸曲線的光滑程度。
當(dāng)帶寬h過大時,得到的回歸函數(shù)會失去數(shù)據(jù)曲度的一些細(xì)節(jié),導(dǎo)致回歸估計過平滑。當(dāng)帶寬h過小時,回歸估計過于密切擬合數(shù)據(jù),導(dǎo)致回歸曲線粗糙,并且容易受到異常因素影響[16]。因此,需要在光滑度與擬合度之間做有效的平衡,其方法就是選取適合的帶寬h。定義一個核函數(shù)k(z),將最大的權(quán)重靠近焦點(diǎn)x0的觀測,而后隨著 ||z的增長令權(quán)重對稱、平滑降低。得到權(quán)重[15]:
計算可得:
式中,yi表示第i個月份航材消耗數(shù)。
在核近鄰估計算法中,常用的核函數(shù)包括:三角核函數(shù)、余弦核函數(shù)、beta族核函數(shù)、高斯核函數(shù)等[16]。
核函數(shù)的選擇依據(jù)是根據(jù)距離分配各個樣本點(diǎn)不同貢獻(xiàn)程度的密度值。文獻(xiàn)[17]中指出,在核近鄰回歸中,核函數(shù)的選取對于回歸模型擬合效果影響較小。但通過航材消耗預(yù)測實(shí)驗,由于數(shù)據(jù)特點(diǎn)多樣,對于不同類型的航材消耗數(shù)據(jù),選用不同的核函數(shù)有較大影響,針對平穩(wěn)型航材,利用Quartic核函數(shù),回歸曲線能較好擬合數(shù)據(jù)。Quartic核表達(dá)式為:
當(dāng)帶寬h相對較小時,曲線擬合較好,但曲線的光滑性較差,峰值谷值突出,隨機(jī)性影響較大,出現(xiàn)過度擬合;當(dāng)帶寬h相對較大時,曲線的光滑度很高但平均化作用過于明顯,導(dǎo)致擬合不足,無法描述曲線趨勢性變化,預(yù)測效果較差[18]。
基于核近鄰回歸對平穩(wěn)型航材建立消耗模型,針對兩端極化較大、邊界帶誤差較大的問題,設(shè)計帶寬h為可變帶寬,在兩端帶寬較小,使得曲線與實(shí)際值較為貼近,在序列中端利用經(jīng)典推論。例如,最優(yōu)拇指帶寬或交叉驗證最優(yōu)帶寬等。
利用高斯核函數(shù),將對稱軸選在序列中間值,其數(shù)學(xué)表達(dá)式為:
式(5)中:h0是拇指帶寬或最優(yōu)帶寬計算結(jié)果;N為樣本容量。
設(shè)拇指帶寬計算得出h0=0.5,取某型航材6年消耗記錄,以月份為單位,N=72,可變帶寬最大值最小值之比為1.6,為進(jìn)一步強(qiáng)化帶寬在序列兩端的擬合效果,將帶寬公式調(diào)整為:
帶寬變化更為明顯,在序列兩端帶寬較小,曲線擬合時,更加接近樣本數(shù)值。
由于多種因素,某型直升機(jī)在役數(shù)量波動較大。為方便研究,本文將機(jī)群消耗數(shù)量轉(zhuǎn)變?yōu)閱螜C(jī)消耗數(shù)。同時,根據(jù)調(diào)研結(jié)果,可以假定該機(jī)型每年訓(xùn)練量、訓(xùn)練環(huán)境相近,因而可以假設(shè)其服役強(qiáng)度一致。某型航材72個月份消耗數(shù)據(jù)序列見表1。
表1 航材消耗序列表Tab.1 Sequence table of material consumption
由表1可見,該型航材消耗有一定波動,整體呈上升趨勢,數(shù)據(jù)離散程度相對較小,消耗序列突變不大。
為做充分對比,分別利用拇指法,則帶寬與可變帶寬非參數(shù)回歸(Non-Parametric Regression)對某型平穩(wěn)型航材建立消耗預(yù)測模型,并對比支持向量機(jī)回歸(Support Vector Regression)、最小二乘法(Least Squares)3 階、4 階等方法。為有效、精確評價模型預(yù)測效果,利用以下2 個指標(biāo)分析對比不同模型的預(yù)測準(zhǔn)確性。
1)均值百分比誤差MAPE,其數(shù)學(xué)表達(dá)式為[10]:
2)均方根差RMSE,其數(shù)學(xué)表達(dá)式為[10]:
式(7)、(8)中:yi為實(shí)際值;y?i為預(yù)測值。
仿真實(shí)驗對比多種預(yù)測模型,預(yù)測結(jié)果見表2。利用MAPE 與MRSE 對預(yù)測效果進(jìn)行對比,如表3 所示。利用基于可變帶寬的核近鄰非參數(shù)回歸模型,對比原回歸方法,仿真結(jié)果如圖1所示。
表2 預(yù)測結(jié)果詳表Tab.2 Table of prediction results
表3 預(yù)測結(jié)果評價表Tab.3 Comparison table of prediction results
圖1 非參數(shù)回歸對比圖Fig.1 Contrast figure of nonparametric regression
由圖1 可以看出,核鄰近非參數(shù)回歸在序列兩端偏差較大,受起始點(diǎn)位置影響較大。利用可變帶寬,在兩端帶寬較小,使得回歸曲線接近數(shù)據(jù)樣本,對數(shù)據(jù)信息更為敏感,較好地對原方法進(jìn)行了優(yōu)化。
利用改進(jìn)的核近鄰非參數(shù)回歸模型對比參數(shù)回歸模型3階、4階最小二乘算法,仿真結(jié)果見圖2。
對于平穩(wěn)型航材消耗數(shù)據(jù),4階最小二乘、非參數(shù)回歸模型都能較好擬合消耗規(guī)律,預(yù)測航材趨勢性變化,而3階最小二乘曲線過于光滑,擬合效果不佳。
對比支持向量機(jī)回歸,仿真結(jié)果見圖3。
利用支持向量機(jī)回歸建立模型時,消耗序列呈上升趨勢,因而通過逐項訓(xùn)練對比,即前一數(shù)據(jù)為后一數(shù)據(jù)的訓(xùn)練集,得出擬合函數(shù),再用后12 項數(shù)據(jù)進(jìn)行預(yù)測,仿真效果不佳,未對航材趨勢性變化做出有效預(yù)測。
圖2 回歸算法對比圖Fig.2 Comparison figure of regression algorithm
圖3 支持向量機(jī)回歸對比圖Fig.3 Comparison figure of support vector machine regression
由于航材消耗相對平穩(wěn)、呈上升趨勢,使用核近鄰非參數(shù)算法出現(xiàn)邊界帶誤差較大、中位數(shù)據(jù)權(quán)重較大的問題。針對這一問題,基于高斯函數(shù)建立可變帶,在兩端帶寬較小,使得曲線與實(shí)際值擬合更為緊密,減小中部數(shù)據(jù)權(quán)重較大的問題,對比多種預(yù)測模型,證明基于可變帶寬的核近鄰非參數(shù)回歸對于平穩(wěn)型消耗航材預(yù)測效果較好。