王 錕,王 潔*,刁迎春
(1.空軍工程大學導彈學院,陜西三原713800;2.中國人民解放軍93861部隊,陜西 三原)
發(fā)射車液壓系統(tǒng)是地空導彈武器系統(tǒng)的重要組成部分,它是與發(fā)射車的起豎、支撐機構及裝退彈設備配套使用的液壓驅動控制裝置,在作戰(zhàn)過程中起著至關重要的作用。液壓系統(tǒng)一旦出現(xiàn)故障將嚴重影響部隊訓練和作戰(zhàn)任務的完成,使用維護經(jīng)驗表明,液壓油污染是導致液壓系統(tǒng)故障的主要原因。20世紀60年代中期美國國家流體動力協(xié)會(NFPA)就得出了“液壓系統(tǒng)故障至少有75%是由于液壓油污染造成的”的結論[1]。因此,適時的對液壓系統(tǒng)油液污染度進行檢測和預測是預防和早期診斷液壓系統(tǒng)故障的有效方法。
當獲得了一定數(shù)量的油液污染度檢測數(shù)據(jù)后,可利用這些已知數(shù)據(jù)蘊含的信息來估計未來時刻的油液污染度值,這個過程便是預測。預測實踐中,對于某一問題可以運用多種預測模型進行預測,常用的預測模型有曲線擬合模型、ARMA模型、灰色模型、神經(jīng)網(wǎng)絡模型等,不同的模型有著不同的適用范圍和優(yōu)勢。從信息利用的角度來說,任何一種單一預測方法都只利用了部分有用信息,同時也拋棄了其它有用的信息。為了充分發(fā)揮各預測模型的優(yōu)勢,Bates J M和Granger C W J在1969年提出了“組合預測”的思想[2],就是將參與組合的各種預測方法的結果通過適當?shù)姆绞竭M行組合,各種預測方法通過組合可以盡可能利用全部的信息,達到改善預測性能的目的。組合預測已成為預測領域中的一個重要的研究方向,本文結合最小二乘支持向量機(LS-SVM)在非線性映射和運算時間上的優(yōu)勢,提出基于LS-SVM的非線性組合預測方法,并將其應用于某型地空導彈發(fā)射車液壓系統(tǒng)的油液污染度預測。
一個預測問題可以選擇多種不同的預測模型,每一個模型都能蘊含一定的樣本信息,但任何一個模型都難以全面的反應樣本的變化規(guī)律。不同的預測方法提供不同的有用信息,其預測精度往往也不同,如果簡單的只選擇預測誤差小的方法而將一些預測誤差較大的方法棄之不用,勢必會丟失一些有用信息。從信息利用的角度將多種預測方法進行適當?shù)慕M合,綜合利用多種預測方法的有用信息便是組合預測的思想,組合預測的結果能更全面的反應系統(tǒng)的變化規(guī)律,可以避免單一模型丟失信息的缺憾,減少隨機性,提高預測精度。簡單來說組合預測就是將參與組合的各種預測方法的結果按適當?shù)姆绞竭M行組合。
組合預測方法按照組合的函數(shù)形式可分為線性組合預測和非線性組合預測。線性組合預測指組合預測模型為各單項預測模型的線性組合;非線性組合預測指組合預測模型與各單項預測模型之間的函數(shù)關系呈非線性。
最優(yōu)組合預測是在一定的約束條件下最優(yōu)化某個目標函數(shù)(最優(yōu)性準則),對它的求解是一個尋優(yōu)的過程。不同的最優(yōu)性準則對應不同的組合預測模型,常見的最優(yōu)性準則有誤差準則[3-5]、相關性準則[6]和預測有效度準則[7]等。下面以誤差準則為例介紹基于誤差準則的線性最優(yōu)組合預測模型。
假設對某一預測問題可利用m種預測方法對其進行預測,xt(t=1,2,…,N)為第 t時刻的實際觀測值;xi
t(i=1,2,…,m;t=1,2,…,N)為第 i種預測方法在t 時刻的預測值;為組合預測在t時刻的預測值;其中f(·)為一映射函數(shù),當其為線性函數(shù)時稱為線性組合預測模型,可記做:
其中,li≥0(i=1,2,…,m)為第 i種預測方法的加權系數(shù),滿足歸一化條件;若以絕對誤差的平方和最小為優(yōu)化目標,則模型(1)中的權系數(shù)li為以下優(yōu)化問題的解:
線性組合預測模型形式固定,求解比較容易,其預測效果優(yōu)于單項預測方法,因而得到了大量的研究和應用。但線性組合預測本質(zhì)上是對不同預測方法的一種凸組合,當預測對象的實際值位于預測模型所圍成的凸區(qū)域之外時,會產(chǎn)生較大的誤差;而非線性組合預測克服了這種局限性,能夠反映系統(tǒng)的非線性,比線性預測預測更為合理。非線性組合預測,由于其非線性映射函數(shù)的形式不固定,采用什么樣的非線性函數(shù)來刻畫各單項預測結果與組合預測結果之間的關系沒有理論指導,因而對其研究和應用較少。近年來,一些學者提出了基于神經(jīng)網(wǎng)絡的非線性組合預測方法[8-9]和基于支持向量機的非線性組合預測方法[10-11],這些方法利用神經(jīng)網(wǎng)絡和支持向量機強大的非線性映射能力,通過學習得到各單項預測結果與組合預測結果之間的非線性函數(shù)關系,具有很好的應用前景。相比于支持向量機,神經(jīng)網(wǎng)絡存在過擬合和推廣能力差的問題,支持向量機是建立在統(tǒng)計學習理論的機器學習方法,基于結構風險最小準則可以有效解決神經(jīng)網(wǎng)絡的過學習和推廣能力差等問題,尤其適合小樣本的學習。
傳統(tǒng)的支持向量機求解需要解決一個二次規(guī)劃問題,最小二乘支持向量機[12]將SVM中的不等式約束改為等式約束,且將誤差平方和作為訓練集的經(jīng)驗損失,從而將SVM中的二次規(guī)劃問題轉化為一組線性方程,可利用最小二乘法對其求解,有效降低了求解問題的復雜度,可大幅減少運算時間,目前已有不少LS-SVM在回歸預測方面的應用研究[13-15]。下面簡要介紹最小二乘支持向量機回歸問題:
設訓練樣本集 D={(xi,yi)|i=1,2,…,n},其中xi∈Rd,yi∈R分別為輸入和輸出數(shù)據(jù),且yi=f(xi),f(·)為待估計的函數(shù)關系。做非線性映射φ:Rd→H,H為高維特征空間,使待估計函數(shù)f(·)可以寫成φ(x)的線性函數(shù),即:
式中,ω和b分別為權值向量和偏置。則最小二乘支持向量機回歸估計可以描述為求解如下優(yōu)化問題。
其中,ξi為松弛變量,γ為調(diào)整參數(shù)。為了求解上述最優(yōu)化問題,引入Lagrange函數(shù):
式中,αi為Lagrange乘子。最優(yōu)的α和 b可通過KKT條件獲得:
上式整理后,消去ω和ξi得到線性方程組:
其中,y=[y1,…,yn]T,Θ=[1,…1]T,α =[α1,…,αn]T,I是單位矩陣,Ω 為 n×n 方陣,其第 i行第 j列元素為 Ωij=φ(xi)Tφ(xj)=K(xi,xj),K(·)是滿足Mercer條件的和函數(shù)。
上式可用最小二乘法求出α和b,于是LS-SVM回歸函數(shù)可表示為:
LS-SVM的泛化能力取決于調(diào)整參數(shù)γ和核函數(shù)的選取及核函數(shù)參數(shù)的優(yōu)化。γ是結構風險與樣本誤差之間的折衷,其取值與可容忍的誤差相關,較大的γ允許較小的誤差,較小的γ則允許較大的誤差。核函數(shù)的選取沒有理論指導,一般在缺少過程的先驗知識時選擇高斯徑向基核函數(shù)的效果較好。高斯核徑向基函數(shù)形式如下:
式中σ為感知變量,是待優(yōu)化參數(shù),它決定了該高斯函數(shù)圍繞中心點的寬度,對于支持向量機的回歸能力有直接的影響。當核函數(shù)取高斯核時LS-SVM模型的參數(shù)為γ和σ,記做→λ=(γ,σ)。
對于LS-SVM參數(shù)的選擇,傳統(tǒng)的方法是網(wǎng)格搜索-交叉驗證法,該方法不能保證找到最優(yōu)值,且當模型參數(shù)多于兩的情況下效率低下。近年發(fā)展和應用的一些智能優(yōu)化算法可以用來對LS-SVM的參數(shù)進行優(yōu)化選擇,本文利用粒子群算法 PSO(Particle Swarm Optimization)和K-重交叉驗證來優(yōu)化模型參數(shù)→λ。
(1)PSO方法
PSO是一種基于種群進化的智能優(yōu)化方法,利用粒子集在求解空間中的運動并結合其自身和種群的經(jīng)歷進行尋優(yōu)。算法中每個粒子被賦予兩個屬性:位置與速度。粒子i的位置xi=(xi1,xi2,…,xiD)可看作D維問題空間中的一個潛在解,位置坐標對應的目標函數(shù)即是該粒子的適應度值。粒子i以一定的速度 vi=(vi1,vi2,…,viD)在搜索空間中飛行,根據(jù)計算的適應度值不斷更新位置。在標準的PSO算法中,粒子i的位置與速度更新表達式如下[16]:
其中,i=1,2,…,N,N 為種群規(guī)模;d=1,2,…,D;Pi=(Pi1,Pi2,…,PiD)為粒子 i經(jīng)歷的人個體最優(yōu)位置;Pg=(Pg1,Pg2,…,PgD)為所有粒子經(jīng)歷的全局最優(yōu)位置;w為慣性權值,w較大則算法具有較強的全局搜索能力,w較小則算法傾向于局部搜索;c1和c2為學習因子;rand為[0,1]內(nèi)的隨機數(shù)。每個粒子以其初始位置開始,融合其自身經(jīng)歷和群體經(jīng)歷不斷地向最優(yōu)位置接近。
(2)K-重交差驗證
通常模型參數(shù)的確定是通過最小化推廣誤差的估計來實現(xiàn)的,即把推廣誤差的估計作為確定模型參數(shù)的目標函數(shù)。推廣誤差是指模型對獨立的檢驗數(shù)據(jù)的預測值與實際值的誤差指標,一般用預測誤差的均方值來描述。
K-重交叉驗證是一種估計推廣誤差的方法。它首先將樣本集隨機的分為K個互不相交的子集{s1,…,sk},每個子集的大小大致相等。用其中的一個子集作為測試集,其余子集作為訓練集,進行K次訓練和測試,得到K個均方根測試誤差E1,…,Ek,則K重交差驗證的誤差指標為:
其中,nsi為測試集樣本數(shù),yj為測試集樣本對應的實際觀測值,^yj|λ表示測試集樣本通過參數(shù)為λ的LS-SVM模型的輸出值。
(3)基于PSO-交差驗證方法的LS-SVM參數(shù)優(yōu)化
讓每個粒子代表一個LS-SVM模型的參數(shù)向量,以K重交差驗證均方根測試誤差均值作為適應度函數(shù),將參數(shù)向量代入模型計算目標函數(shù)值,根據(jù)計算結果和PSO算法對粒子的位置和速度進行調(diào)整,直至粒子移動到最佳位置。具體步驟如表1所示。
表1 基于PSO和K-重交叉驗證的LS-SVM參數(shù)優(yōu)化步驟
利用上述步驟得出的全局極值位置Pg即是LS-SVM模型的優(yōu)化參數(shù),Pg=→λ=(γ,σ)。
基于LS-SVM的非線性組合預測方法的基本思路是:把m種預測方法的預測結果作為LS-SVM模型的輸入,將相應的實際值作為LS-SVM模型的輸出。用一定數(shù)量的樣本利用前述方法優(yōu)化LS-SVM的參數(shù),然后利用優(yōu)化的參數(shù)重新訓練LS-SVM模型,從而使單項預測方法的預測值與實際值之間建立一種非線性映射關系。
假設對某一預測問題可利用m種預測方法對其進行預測,xit(i=1,2,…,m;t=1,2,…,N)為第 i種預測方法在t時刻的預測值;為各單項預測方法的t時刻預測值構成的向量,是LS-SVM 模型的輸入;yt(t=1,2,…,N)為第t時刻的實際觀測值,為LS-SVM模型的輸出;則LS-SVM非線性組合預測模型為:
對線性組合預測模型來說,未知參數(shù)是參與組合的各單項預測方法的權值,如前所述,該參數(shù)是在某一最優(yōu)性準則意義下求解一個優(yōu)化問題得到的。而對于本文提出的基于LS-SVM的非線性組合預測模型來說其模型參數(shù)α和b則是通過學習自動獲得的。
某型地空導彈發(fā)射車液壓系統(tǒng)液壓油的更換是按時間定期進行的(一般由工廠在大修期間更換),若更換周期長則可能導致設備液壓油污染度超標不能及時更換的問題,造成液壓設備在受到污染的情況下繼續(xù)工作,帶來噪聲、振動和液壓沖擊,對系統(tǒng)造成長期損害,降低液壓系統(tǒng)和液壓元件的使用壽命;若更換周期太短則會造成浪費。如果能適時地檢測液壓油污染情況,并在污染度超標之前及時預測,便可有效的降低液壓系統(tǒng)故障的風險,實現(xiàn)視情維護。實際應用中對液壓油污染度的檢測有多種方法[17],如稱量法、顆粒計數(shù)法、光測法、淤積法、電測法等。出于成本和部隊使用可操作性方面考慮本文使用電測法測量液壓油的電解質(zhì)常數(shù)[18],不同污染程度的液壓油的電解質(zhì)常數(shù)會發(fā)生變化,可通過測量電解質(zhì)常數(shù)值來反應液壓油的污染程度。從某型地空導彈發(fā)射車液壓系統(tǒng)更換新油開始,在設備正常使用情況下每月檢測一次液壓油的電解質(zhì)常數(shù)值,得到的2008年12月至2010年6月的檢測數(shù)據(jù)如圖1所示。
圖1 液壓油介電常數(shù)檢測數(shù)據(jù)
圖2 三種單項預測模型預測結果
圖1顯示出了明顯的趨勢性,本文取前16個數(shù)據(jù)來建立預測模型,后3個數(shù)據(jù)用于檢驗模型的預測精度。分別建立曲線擬合模型(CFM)、灰色模型(GM)和神經(jīng)網(wǎng)絡模型(ANNM),得到的結果如圖2所示。其中CF模型選擇分母為3階,分子為2階的分式多項式,GM模型選擇Verhulst模型,神經(jīng)網(wǎng)絡選擇3層BP網(wǎng)絡,網(wǎng)絡結構為(4,10,1)。
由圖2可以看出單項預測模型在各點的預測精度不同,拋棄任何一種預測模型都有可能造成信息的丟失。本文利用三種單項預測模型的前16組預測數(shù)據(jù)訓練基于LS-SVM的非線性組合預測模型(11)并用其預測2010年4月至6月的介電常數(shù)值,最后將預測結果分別與基于誤差準則的線性組合預測模型(1)和基于神經(jīng)網(wǎng)絡的非線性組合預測模型進行比較。線性組合預測模型(L-C)、基于神經(jīng)網(wǎng)絡的非線性組合預測模型(ANN-C)和基于LS-SVM的非線性組合預測模型(LSSVM-C)的預測結果如圖3所示。其中,線性組合模型的權值向量計算為(0.445 4,0.040 7,0.513 9);神經(jīng)網(wǎng)絡選用 3 層 BP網(wǎng)絡,網(wǎng)絡結構為(3,6,1);LS-SVM模型使用高斯核函數(shù),其參數(shù)γ和σ利用PSO算法優(yōu)化,優(yōu)化結果為:γ=296 986.873 5,σ=313.836 4。
一般預測效果的評價至少可以從平方和誤差(SSE)、平均絕對誤差(MAE)、均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)、均方根百分比誤差(RMSPE)等5個方面進行全方位的綜合衡量[7]。表2和表3分別對三種組合預測方法的擬合精度(前16組數(shù)據(jù))和預測精度(后3組測試數(shù)據(jù))進行了評價。
圖3 三種組合預測模型的預測結果
表2 三種組合預測方法的擬合精度評價
表3 三種組合預測方法的預測精度評價
從表2和表3可以看出,基于LS-SVM的非線性組合預測方法的擬合精度和預測精度均高于線性組合預測方法,擬合精度與基于神經(jīng)網(wǎng)絡的非線性組合預測方法大致相當;神經(jīng)網(wǎng)絡方法具有最高的擬合精度,但預測精度不高,甚至略低于線性組合預測方法,這反映出了神經(jīng)網(wǎng)絡方法存在的過擬合和推廣能力差的問題。本文使用的基于LS-SVM的非線性組合預測方法具有最高的預測精度,并兼顧了較高的擬合精度,這正是SVM的結構風險最小化原則的體現(xiàn)。
本文提出的方法用于液壓油污染度預測取得了很好的效果。液壓油污染度指標是指示液壓系統(tǒng)故障的綜合性指標,通過設定適當?shù)拈撝?,并對其進行適時的檢測和預測可以對液壓系統(tǒng)的早期故障實現(xiàn)預警,但要實現(xiàn)對液壓系統(tǒng)故障的預測還需綜合利用其它的特征信息,如何融合其它領域的信息實現(xiàn)對液壓系統(tǒng)故障的預測將是下一步的研究方向。
[1] 張柱銀.液壓油的污染及其控制[J].機床與液壓,2004(5):178-179.
[2] Bates J M,Granger C W J.Combination of Forecasts[J].Operations Research Quarterly,1969,20(4):451-468.
[3] 楊廷方,劉沛,李浙,等.應用新型多方法組合預測模型估計變壓器油中溶解氣體濃度[J].中國機電工程學報,2008,28(31):108-113.
[4] 陳華友.全距在組合預測最優(yōu)權系數(shù)中的應用[J].安徽大學學報(自然科學版),2001,25(3):7-10,23.
[5] 高尚,張紹彪,梅亮.基于相對誤差的線性組合預測研究[J].系統(tǒng)工程與電子技術,2008,30(3):481-484.
[6] 王應明.基于相關性的組合預測方法研究[J].預測,2002,21(2):58-62.
[7] 陳華友,侯定丕.基于預測有效度的優(yōu)性組合預測模型研究[J].中國科學技術大學學報,2002,32(2):172-180.
[8] 張青.基于神經(jīng)網(wǎng)絡最優(yōu)組合預測方法的應用研究[J].系統(tǒng)工程理論與實踐,2001(9):90-93.
[9] 韓冬梅,牛文清,楊榮.線性與非線性最優(yōu)組合預測方法的比較研究[J].情報科學,2007,25(11):1672-1678.
[10]陳偉,胡昌華,樊紅東.基于小波支撐矢量機非線性組合預測的導彈慣性器件故障預報[J].戰(zhàn)術導彈技術,2006,4:84-88.
[11]趙文清,朱永利,張小奇.應用支持向量機的變壓器故障組合預測[J].中國電機工程學報,2008,28(25):14-19.
[12] Suykens J A K,Vandewalle J.Least Squares Support Vector Machine Classifiers[J].Neural Processing Letters,1999,9(3):293-300.
[13]楊麗君.基于LS-SVM的電力系統(tǒng)參考相角預測[J].傳感技術學報,2005,18(3):638-641.
[14]胡宏偉,周曉軍,龐茂.基于LS-SVM的火電廠給水泵組狀態(tài)趨勢預測研究[J].傳感技術學報,2007,20(5):1139-1143.
[15]高云紅,李一波.基于CPSO-LSSVM的陀螺儀故障趨勢預測[J].四川大學學報(工程科學版),2010,42(2):177-181.
[16] Kennedy J,Eberhartr C.Particle Swarm Optimization[C]//Proceedings of the IEEE International Joint Conference on NeuralNetworks,Perth,1995.Piscataway:IEEE Press,1995:1942-1948.
[17]董彩云.液壓油污染度的檢測[J].流體傳動與控制,2009,35(4):50-52,58.
[18]張曉飛,楊定新,胡政,等.基于電介質(zhì)介電常數(shù)測量的油液在線監(jiān)測技術研究[J].傳感技術學報,2008,21(12):2088-2091.