任 超 梁月吉 龐光鋒 藍(lán) 嵐
1 桂林理工大學(xué)測(cè)繪地理信息學(xué)院,桂林市建干路12號(hào),541004 2 廣西空間信息與測(cè)繪重點(diǎn)實(shí)驗(yàn)室,桂林市建干路12號(hào),541004
大壩在施工或運(yùn)行過程中會(huì)由于各種原因發(fā)生不同程度的形變,及時(shí)掌握大壩變形的演變規(guī)律并作出準(zhǔn)確預(yù)報(bào),對(duì)大壩安全具有重大意義。大壩變形與水壓、溫度、時(shí)效因素之間具有復(fù)雜密切的關(guān)系,而這些因素往往具有較強(qiáng)的隨機(jī)性和難以解析的非線性,導(dǎo)致大壩變形較為復(fù)雜,難以直接建立較為準(zhǔn)確的變形量與影響因素之間的非線性關(guān)系模型。針對(duì)這一問題,國(guó)內(nèi)外學(xué)者已研究出多種模型,如時(shí)間序列模型、回歸分析模型、灰色模型、神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等[1]。但每一種模型都存在自身的局限性,難以全面考慮負(fù)荷的變化趨勢(shì)和影響因素,直接通過建立單一模型進(jìn)行變形預(yù)測(cè)不易得到令人滿意的結(jié)果。灰色模型提供了在貧信息情況下解決系統(tǒng)問題的新途徑,通過自身“累加生成”的特點(diǎn),能夠?qū)?fù)雜的原始數(shù)據(jù)化為較符合客觀規(guī)律的時(shí)間序列數(shù)據(jù),但不足之處是僅適合解決呈指數(shù)增長(zhǎng)趨勢(shì)的實(shí)際問題。而實(shí)際的大壩變形規(guī)律往往與指數(shù)規(guī)律差別較大,不利于灰色模型的建立和預(yù)測(cè),且模型參數(shù)的求解也存在一定的理論缺陷[2]。支持向量機(jī)(support vector machine,SVM)是Cortes等[3]提出的一種機(jī)器學(xué)習(xí)算法,能較好地解決小樣本、非線性和高維模式識(shí)別等實(shí)際問題,已在變形預(yù)測(cè)中得到廣泛應(yīng)用。Suykens等[4]在Vapnik 統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)上提出最小二乘支持向量機(jī)(least square support vector machines,LS-SVM),將SVM 的二次規(guī)劃問題轉(zhuǎn)換為求解線性方程組的問題,降低了計(jì)算的復(fù)雜性,提高了求解速度。
基于上述研究,本文提出基于灰色最小二乘支持向量機(jī)的大壩變形預(yù)測(cè)新算法,通過利用灰色預(yù)測(cè)方法中的“累加生成”原理對(duì)原始序列進(jìn)行預(yù)處理,以削弱序列中隨機(jī)擾動(dòng)因素的影響,得到規(guī)律性較強(qiáng)的新序列,進(jìn)而建立LS-SVM 預(yù)測(cè)模型。同時(shí),考慮到LS-SVM 的參數(shù)優(yōu)化問題,采用網(wǎng)格搜索法[5](grid search)進(jìn)行尋優(yōu),該方法用于小樣本數(shù)據(jù)預(yù)測(cè)時(shí)比遺傳算法、混沌優(yōu)化算法較有優(yōu)勢(shì)。通過兩個(gè)算例,并與灰色GM(1,1)和單一最小二乘支持向量機(jī)對(duì)比分析,驗(yàn)證該算法的可行性和有效性。
設(shè)大壩原始位移時(shí)間序列為:
式中,n為大壩位移的監(jiān)測(cè)期數(shù)。首先對(duì)原始位移序列進(jìn)行一次累加:
得到規(guī)律性更強(qiáng)的新序列:
然后,以新序列的前m期為訓(xùn)練集,后(n-m)期為測(cè)試集,利用擬合能力更好的LS-SVM 建立預(yù)測(cè)模型。設(shè)樣本訓(xùn)練集為{(xi,yi)|i=1,2,…,m},其中,xi∈Rn為輸入向量,yi∈R為輸出向量,用非線性映射φ(·)將樣本輸入從原空間映射到高維特征空間,構(gòu)造出LS-SVM 的回歸函數(shù)為[4,6]:
式中,φ(x)為滿足Mercer條件的核函數(shù),w為超平面的權(quán)值向量,b為偏置項(xiàng)。
在LS-SVM 估計(jì)中,回歸問題可以等價(jià)為最小化下面泛函:
式中,γ為正則化參數(shù),ei為誤差項(xiàng)。構(gòu)造式(5)的Lagrange函數(shù)為:
式(7)消去w和ei得到線性方程組:
由于B=K(xi,yi)+γ-1I為對(duì)稱的正定矩陣,利用最小二乘運(yùn)算求解式(8)可得:
求解式(6)得到LS-SVM 的估計(jì)函數(shù)為:
最后,計(jì)算累加序列的預(yù)測(cè)值ym+j,j=1,2,…,n-m,并對(duì)其進(jìn)行累減還原,得到原始序列的預(yù)測(cè)模型:
最小二乘支持向量機(jī)的性能很大程度上取決于核函數(shù)K(x,y)、核參數(shù)σ和正則化參數(shù)γ的最優(yōu)選擇。目前,核函數(shù)主要有3 類:多項(xiàng)式核函數(shù)、徑向基核函數(shù)和線性核函數(shù),其中徑向基核函數(shù)能較好地反映模型的復(fù)雜程度,預(yù)測(cè)效果比較好。因此,選定其為L(zhǎng)S-SVM 的核函數(shù)??紤]到參數(shù)選取問題,采用網(wǎng)格搜索法進(jìn)行參數(shù)優(yōu)選。其基本原理是將σ和γ在一定的范圍劃分網(wǎng)格并遍歷網(wǎng)格內(nèi)所有點(diǎn)進(jìn)行取值,對(duì)取定的σ和γ采用交叉驗(yàn)證方法[7]獲取訓(xùn)練均方誤差作為網(wǎng)格點(diǎn)計(jì)算的目標(biāo)函數(shù),最終取訓(xùn)練集驗(yàn)證均方誤差最低的那組σ和γ作為最佳參數(shù)。該方法尋優(yōu)過程中各組參數(shù)相互解耦,較好地避免了由于參數(shù)多或參數(shù)之間可能出現(xiàn)耦合而引起的多解性問題,便于并行計(jì)算,且運(yùn)行效率較高。具體步驟如下[5]:
1)設(shè)定參數(shù)σ和γ的選擇范圍和參數(shù)步長(zhǎng)。本文尋優(yōu)過程分為粗選和精選兩步,設(shè)定σ的尋優(yōu)區(qū)間為[0 ,1010],γ的尋優(yōu)區(qū)間為[0 ,1010];粗選格點(diǎn)數(shù)為1010×1010,步長(zhǎng)為1;精選格點(diǎn)數(shù)為1010×1010,步長(zhǎng)為0.1。
2)由于尋優(yōu)過程是一個(gè)遍歷過程,因此,參數(shù)初始值的選取對(duì)結(jié)果沒有影響。此搜索過程選取的初始值為σ=0,γ=1,選擇第一個(gè)交叉驗(yàn)證網(wǎng)點(diǎn)位置,通過交叉驗(yàn)證方法獲取訓(xùn)練均方誤差(MES)作為網(wǎng)格點(diǎn)計(jì)算的目標(biāo)函數(shù),并計(jì)算所有的網(wǎng)格點(diǎn)。
3)選取均方誤差最低的一組(σ,γ)為最優(yōu)參數(shù)。若選取的參數(shù)達(dá)不到精度要求,則以選擇的參數(shù)為中心網(wǎng)格點(diǎn),在較小的范圍內(nèi)構(gòu)建新的二維網(wǎng)格平面重新計(jì)算目標(biāo)函數(shù),再次選取均方誤差最低的參數(shù)。如果滿足精度要求,則停止,否則繼續(xù)重復(fù)以上步驟,最終獲取精確的參數(shù)σ和γ作為最優(yōu)值。
圖1 模型預(yù)測(cè)流程圖Fig.1 Flow chart of model prediction
以文獻(xiàn)[7]中某大壩徑向變形監(jiān)測(cè)數(shù)據(jù)進(jìn)行實(shí)驗(yàn)。該大壩共布設(shè)C06和C11兩個(gè)監(jiān)測(cè)基準(zhǔn)點(diǎn),在大壩中部及其兩側(cè)分別布設(shè)3 個(gè)監(jiān)測(cè)變形點(diǎn)OP03、OP04與OP05。各監(jiān)測(cè)點(diǎn)的切向與徑向定義為切向(t)和徑向(r)坐標(biāo)系。為充分反映大壩變形特征,本文采用位于拱壩圓弧頂部監(jiān)測(cè)點(diǎn)OP03徑向的變化數(shù)據(jù)(2001-12-31~2002-01-20),徑向正軸方向指向雅礱江上游方向,如圖2所示。
圖2 大壩變形徑向位移序列Fig.2 Deformation of the dam radial displacement sequence
由圖2可看出,該大壩位移序列總體呈增長(zhǎng)趨勢(shì),只有第6期、第9期和第20期有所下降,波動(dòng)性較弱,大壩最大變形值為18 mm,最小為10 mm,差值為8 mm。采用灰色預(yù)測(cè)方法中的“累加生成”原理對(duì)序列進(jìn)行一次累加得到如圖3所示的結(jié)果。由圖3可見,經(jīng)一次累加生成的新序列曲線較為光滑,變化規(guī)律更為明顯,有利于模型的建立和分析。
為驗(yàn)證本文提出的基于灰色最小二乘支持向量機(jī)在大壩變形預(yù)測(cè)中的可行性,建立3種方案進(jìn)行算例分析比較:方案1——灰色GM(1,1);方案2——單一LS-SVM 預(yù)測(cè)模型;方案3——灰色最小二乘支持向量機(jī)預(yù)測(cè)模型。各方案采用前12期監(jiān)測(cè)數(shù)據(jù)進(jìn)行建模訓(xùn)練,后8期作為測(cè)試樣本。經(jīng)網(wǎng)格搜索法得到,方案2 的最優(yōu)參數(shù)σ為45.265,γ為425 316.516;方案3的最優(yōu)核參數(shù)為10 648.167,正則化參數(shù)為6 540 666.247。3種方案的預(yù)測(cè)結(jié)果見表1。
由表1可知,方案1預(yù)測(cè)不穩(wěn)定,預(yù)測(cè)值和實(shí)際值偏差比較大,最大殘差達(dá)到-1.85mm。方案2和方案3優(yōu)于方案1,而方案3的預(yù)測(cè)結(jié)果最好,殘差最小值為0.02mm,最大值僅為0.39mm。
圖3 一次疊加結(jié)果Fig.3 The results of a superposition
以文獻(xiàn)[8]中某大壩水平位移變形監(jiān)測(cè)數(shù)據(jù)為例(2003-01-06~2003-01-26)。該大壩共布設(shè)7個(gè)水平位移監(jiān)測(cè)點(diǎn),由于各點(diǎn)變化規(guī)律大致相同,本文僅選擇D4點(diǎn)進(jìn)行分析,如圖4所示。
圖4 大壩變形水平位移序列Fig.4 Deformation of the dam horizontal displacement sequence
從圖4可看出,該大壩水平位移序列的第1~5期和第8~14 期變化都比較平緩,而第6、7期和第15~21期波動(dòng)大。顯然,如果用傳統(tǒng)的預(yù)測(cè)模型,難以真實(shí)反映大壩變形的規(guī)律。對(duì)大壩原始位移序列進(jìn)行一次累加得到如圖5所示的結(jié)果。由圖5可知,對(duì)于波動(dòng)性較強(qiáng)、不穩(wěn)定的大壩位移序列,經(jīng)一次累加后變得較為光滑,有效減弱了原始序列的隨機(jī)性,使離亂的原始數(shù)據(jù)中蘊(yùn)涵的規(guī)律能夠充分顯露出來(lái),突出了大壩變形規(guī)律。
表1 各模型計(jì)算結(jié)果對(duì)比/mmTab.1 The contrast of each model calculation results/mm
圖5 一次疊加結(jié)果Fig.5 The results of a superposition
同算例一,建立3種方案進(jìn)行比較。采用前12期監(jiān)測(cè)數(shù)據(jù)進(jìn)行建模訓(xùn)練,后9期作為測(cè)試樣本。3種方案的預(yù)測(cè)結(jié)果見表2。同理得到,方案2的最優(yōu)參數(shù)σ為108.526,γ為25 412.613;方案3的最優(yōu)核參數(shù)為7 256.758,正則化參數(shù)為5 625 282.435。預(yù)測(cè)結(jié)果見表2。
從表2可看出,方案1和方案2預(yù)測(cè)不穩(wěn)定,部分預(yù)測(cè)值和實(shí)際值偏差比較大,方案1最大殘差達(dá)到-2.11 mm,方案2 殘差最大為-1.43 mm。方案3殘差最小值為0.01 mm,最大值僅為0.53mm??梢姡瑢?duì)于波動(dòng)較大和不穩(wěn)定的大壩變形序列,灰色GM(1,1)的預(yù)測(cè)結(jié)果已遠(yuǎn)遠(yuǎn)偏離監(jiān)測(cè)值,單一最小二乘支持向量機(jī)的部分預(yù)測(cè)結(jié)果也不夠穩(wěn)定,而灰色最小二乘支持向量機(jī)模型的預(yù)測(cè)效果較好,能夠保證較優(yōu)的局部預(yù)測(cè)值。
為進(jìn)一步綜合評(píng)定本文算法的性能,采用均方根誤差和平均絕對(duì)誤差兩項(xiàng)指標(biāo)進(jìn)行評(píng)定(表3)。
表3 各模型精度對(duì)比/mmTab.3 The contrast of each model precision/mm
由表3 可知,灰色GM(1,1)的預(yù)測(cè)精度較低,兩個(gè)算例的均方根誤差分別為1.01 mm 和1.27mm,單一最小二乘支持向量機(jī)表現(xiàn)出較好的預(yù)測(cè)精度,優(yōu)于灰色GM(1,1)。而本文算法的預(yù)測(cè)精度明顯較高,均方根誤差分別為0.20mm和0.18mm,平均絕對(duì)誤差分別僅為0.16mm 和0.13mm??梢?,灰色最小二乘支持向量機(jī)預(yù)測(cè)模型在一定程度上保證了較好的全局預(yù)測(cè)精度。綜上,新算法通過采用灰色原理對(duì)原始序列進(jìn)行預(yù)處理,能有效削弱原始序列的隨機(jī)性并增加規(guī)律性,利用最小二乘支持向量機(jī)優(yōu)良的學(xué)習(xí)性能,能緊跟數(shù)據(jù)的變化規(guī)律。同時(shí),對(duì)于不同尺度變化的大壩變形預(yù)測(cè),效果都比較好。新算法無(wú)論是預(yù)測(cè)結(jié)果還是預(yù)測(cè)精度,都優(yōu)于灰色GM(1,1)和單一最小二乘支持向量機(jī),能在一定程度上有效解決復(fù)雜的大壩變形問題,當(dāng)直接建立LSSVM 預(yù)測(cè)模型無(wú)法滿足精度要求時(shí),可以采用此算法。
針對(duì)大壩變形具有隨機(jī)性和非線性等特點(diǎn),本文將灰色理論和最小二乘支持向量機(jī)相結(jié)合引入到大壩變形短期預(yù)測(cè)。經(jīng)理論和算例分析,并與灰色GM(1,1)和單一最小二乘支持向量機(jī)對(duì)比表明,傳統(tǒng)的灰色GM(1,1)預(yù)測(cè)模型由于自身存在的理論缺陷,預(yù)測(cè)效果和實(shí)際偏差較大,難以解決復(fù)雜的變形問題;單一最小二乘支持向量機(jī)的預(yù)測(cè)效果和實(shí)際值較為接近,體現(xiàn)出LS-SVM在解決小樣本、貧信息和多維數(shù)的復(fù)雜非線性問題中的優(yōu)勢(shì);而本文新算法不僅引入灰色預(yù)測(cè)方法獨(dú)特的數(shù)據(jù)生成方式,增加原始數(shù)據(jù)的規(guī)律性,減少數(shù)據(jù)的隨機(jī)性,且充分發(fā)揮了LS-SVM 強(qiáng)大的非線性映射能力,預(yù)測(cè)精度優(yōu)于灰色GM(1,1)和單一最小二乘支持向量機(jī)。同時(shí),采用網(wǎng)格搜索方法可快速地選取LS-SVM 的最佳參數(shù)。
[1]馬文濤.基于小波變換和GALSSVM 的邊坡位移預(yù)測(cè)[J].巖土力學(xué),2009,30(2):394-398(Ma Wentao.The Slope Displacement Prediction Based on Wavelet Transform and GALSSVM[J].Rock and Soil Mechanics,2009,30(2):394-398)
[2]張大海,江世芳,史開泉.灰色預(yù)測(cè)公式的理論缺陷及改進(jìn)[J].系統(tǒng)工程理論與實(shí)踐,2002,22(8):1-3(Zhang Dahai,Jiang Shifang,Shi Kaiquan.Theoretical Defect of Grey Prediction Formula and Its Improvement[J].System Engineering Theory and Pratice,2002,22(8):1-3)
[3]Cortes C,Vapnik V.Support Vector Networks[J].Machine Learning,1995,20(3):273-297
[4]Suykens J A K,Vandewalle J.Least Squaresupport Vector Machine Classifiers[J].Neural Processing Letters,1999,9(3):293-300
[5]Liu X L,Jia D X,Li H.Research on Kernel Parameter Optimization of Support Vector Machine in Speaker Recognition[J].Science Technology and Engineering,2010,10(7):1 669-1 673
[6]Brabanter K,Brabanter J,Suykens J A K,et al.Approximate Confidence and Prediction Intervals for Least Squares Support Vector Regression[J].IEEE Transactions on Neural Networks,2010,22(1):110-120
[7]Ito K,Nakamo R.Optimiznig Support Vector Regression Hyperparameters Based on Crossvalidation[C].International Jonit Conference on Neural Networks,2003
[8]蔣廷臣,張勤,周立,等.基于小波方法的非線性回歸模型研究[J].測(cè)繪學(xué)報(bào),2006,35(4):337-341(Jiang Tingchen,Zhang Qin,Zhou Li,et al.The Nonlinear Regression Model Based on Wavelet Method Research[J].Acta Geodactica et Cartographica Sinica,2006,35(4):337-341)
[9]焦明連,蔣廷臣.基于小波分析的灰色預(yù)測(cè)模型在大壩安全監(jiān)測(cè)中的應(yīng)用[J].大地測(cè)量與地球動(dòng)力學(xué),2009,29(2):115-117(Jiao Minglian,Jiang Tingchen.The Grey Prediction Model Based on Wavelet Analysis in the Application of Dam Safety Monitoring[J].Journal of Geodesy and Geodynamics,2009,29(2):115-117)