梁耀東,欒元重,劉方雨,紀(jì)趙磊,莊 艷
(山東科技大學(xué)測(cè)繪科學(xué)與工程學(xué)院,青島 266000)
建立合理精準(zhǔn)的分析預(yù)測(cè)模型是大壩安全監(jiān)測(cè)中的一項(xiàng)重要工作[1]。大壩變形監(jiān)測(cè)時(shí)間序列是多種內(nèi)力的宏觀表現(xiàn),期望能從含有內(nèi)部力學(xué)演化的已知觀測(cè)數(shù)據(jù)中,找到演化的規(guī)律以及能夠預(yù)測(cè)未來(lái)的發(fā)展動(dòng)態(tài),進(jìn)而反饋給安全管理部門(mén),可以及時(shí)采取相應(yīng)的處理措施[2-4]。
近年來(lái),神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(support vector machine,SVM)和最小二乘支持向量機(jī)(least squares support vector machines,LSSVM)等算法開(kāi)始應(yīng)用于壩體變形時(shí)間序列的模擬預(yù)測(cè)分析。李松等[5]研究表明神經(jīng)網(wǎng)絡(luò)是基于大樣本的一種學(xué)習(xí)方法,當(dāng)樣本量較少時(shí)會(huì)造成預(yù)測(cè)誤差過(guò)大,同時(shí)該方法容易出現(xiàn)過(guò)學(xué)習(xí)現(xiàn)象。SVM模型可以較好地解決局部最優(yōu)、非線(xiàn)性、小樣本訓(xùn)練等問(wèn)題,LSSVM模型將不等式約束替代等式約束,通過(guò)求解最小二乘線(xiàn)性方程組得到?jīng)Q策函數(shù),更加便于求解,也避免了SVM的二次規(guī)劃問(wèn)題[6-8]。核函數(shù)的選擇對(duì)模型的特性有決定性影響,為了提高模型的精度,提出一種由全局多項(xiàng)式核和局部高斯核線(xiàn)性組成的混合核函數(shù)。由于LSSVM模型的參數(shù)嚴(yán)重影響預(yù)測(cè)結(jié)果,而粒子群算法(particle swarm optimization,PSO)有簡(jiǎn)單、收斂速度快和全局尋優(yōu)的特點(diǎn),現(xiàn)采用一種加入變異因子的自適應(yīng)PSO算法對(duì)非線(xiàn)性L(fǎng)SSVM模型參數(shù)尋優(yōu),并將之應(yīng)用于水壩變形分析與預(yù)測(cè),以驗(yàn)證混合核函數(shù)PSO-LSSVM模型在水壩變形預(yù)測(cè)中的應(yīng)用效果。
SVM的基本思想是通過(guò)內(nèi)積函數(shù)定義的非線(xiàn)性變換將輸入空間變換到一個(gè)高維空間,在這個(gè)高維空間中尋找輸入變量和輸出變量之間的一種非線(xiàn)性關(guān)系[9]。LSSVM是標(biāo)準(zhǔn)SVM的一種擴(kuò)展,將不等式約束替代等式約束,把誤差平方和損失函數(shù)作為訓(xùn)練集的經(jīng)驗(yàn)損失,從而把問(wèn)題轉(zhuǎn)換成一個(gè)線(xiàn)性矩陣求解問(wèn)題[10-12]。
假如有一組樣本數(shù)據(jù)集{(xi,yi)|xi∈Rm,i=1,2,…,n},其中xi為輸入向量,yi為輸出值,n為樣本總數(shù)。通過(guò)非線(xiàn)性函數(shù)φ(x)將輸入空間映射到高維特征空間[13],可得回歸估計(jì)函數(shù)為
f(x)=wTφ(x)+b
(1)
式(1)中:w為超平面n維權(quán)值向量;b為偏置量。
LSSVM定義優(yōu)化問(wèn)題的目標(biāo)函數(shù)為
(2)
式(2)中:c為懲罰系數(shù);ei為松弛變量。
約束條件為
yi[wTφ(x)+b]=1-ei
(3)
將式(3)代入Lagrange函數(shù)可得
(4)
式(4)中:ai為拉格朗日乘子,且ai≥0。
由KKT(Karush-Kuhn-Tucker)優(yōu)化條件可得
(5)
式(5)中:e=(1,1,…,1)T;α=(a1,a2,…,an)T;Y=(y1,y2,…,yn)T;K為核函數(shù)矩陣。
傳統(tǒng)的核函數(shù)包括線(xiàn)性核函數(shù)、多形式核函數(shù)、高斯徑向核函數(shù)(radial basis function,RBF)、拉普拉斯核函數(shù)等函數(shù),Smits等[14]提出了一種混合核函數(shù),即將兩個(gè)不同的核函數(shù)組合起來(lái),使得混合后的核函數(shù)性能更佳。核函數(shù)組合的方法很多,但最終的混合核函數(shù)要滿(mǎn)足 Mercer 條件。通過(guò)組合兩種具有代表性的高斯徑向核函數(shù)和多項(xiàng)式核函數(shù)的映射特性,構(gòu)造一種混合核函數(shù),此混合核函數(shù)滿(mǎn)足Mercer 條件[14]。該混合核函數(shù)擁有高斯徑向核函數(shù)的局部特性(函數(shù)的學(xué)習(xí)能力強(qiáng)),也可擁有多項(xiàng)式核函數(shù)的全局特性(泛化能力強(qiáng)),且多項(xiàng)式核函數(shù)選擇二階。傳統(tǒng)的多項(xiàng)式核函數(shù)、高斯徑向核函數(shù)和混合核函數(shù)表達(dá)式分別為
K(x,xi)=(xTxi+1)q
(6)
(7)
(1-λ)(xTxi+1)q
(8)
式中:σ為RBF核函數(shù)寬度;q為多項(xiàng)式核函數(shù)系數(shù);λ為混合權(quán)重系數(shù)。
最終得到LSSVM的回歸函數(shù)模型為
(9)
根據(jù)回歸理論可知,它的主要參數(shù)是RBF核函數(shù)參數(shù)σ、多項(xiàng)式核函數(shù)系數(shù)q、懲罰參數(shù)c和混合權(quán)重系數(shù)λ,這4個(gè)參數(shù)對(duì)模型的學(xué)習(xí)和泛化能力影響很大,現(xiàn)采用改進(jìn)的自適應(yīng)粒子群算法來(lái)優(yōu)化選擇4個(gè)參數(shù)σ、q、c和λ,在一定程度上減少了主觀經(jīng)驗(yàn)選擇的盲目性。
粒子群算法是模擬鳥(niǎo)群覓食行為,其原理是粒子從隨機(jī)解出發(fā)迭代尋找最優(yōu)解,并通過(guò)追隨當(dāng)前搜索到的最優(yōu)值來(lái)尋找全局最優(yōu)[15-17]。假設(shè)在N維空間m個(gè)粒子組成的一個(gè)群體,粒子的位置由{xi=(xi1,xi2,…,xiN),i=1,2,…,m}來(lái)表示,粒子對(duì)應(yīng)的飛行速度由[vi=(vi1,vi2,…,viN),i=1,2,…,m]來(lái)表示,通過(guò)根據(jù)各粒子的適應(yīng)度值來(lái)評(píng)價(jià)其優(yōu)劣性,并迭代找到每個(gè)粒子的當(dāng)前最優(yōu)位置即個(gè)體最優(yōu)值Pbest=(pi1,pi2,…,piN)和所有粒子的當(dāng)前最優(yōu)位置即局部最優(yōu)值Gbest=(g1,g2,…,gN),粒子群的速度、位置更新公式分別為
(10)
(11)
圖1 改進(jìn)自適應(yīng)混合核函數(shù)PSO-LSSVM算法流程圖Fig.1 Improved adaptive hybrid kernel function PSO-LSSVM algorithm flow chart
在PSO搜索中,慣性權(quán)重系數(shù)w的選擇十分重要,線(xiàn)性遞減權(quán)重并不適合優(yōu)化搜索過(guò)程,改用非線(xiàn)性權(quán)重遞減可以提高預(yù)測(cè)精度,w的表達(dá)式為
(12)
(13)
式中:yi為第i個(gè)樣本的實(shí)測(cè)值;Yi為第i個(gè)樣本的預(yù)測(cè)值;f(xi)為粒子當(dāng)前的適應(yīng)度值;favg和fmin分別為當(dāng)前粒子中的平均和最小適應(yīng)度值,通過(guò)粒子的離散程度來(lái)動(dòng)態(tài)調(diào)節(jié)粒子的慣性權(quán)重。
采用改進(jìn)的自適應(yīng)PSO算法對(duì)LSSVM模型中的兩個(gè)參數(shù)(RBF核函數(shù)參數(shù)σ、多項(xiàng)式核函數(shù)系數(shù)q、懲罰系數(shù)c和混合權(quán)重系數(shù)λ)進(jìn)行優(yōu)化尋優(yōu),其具體實(shí)施步驟如下:
(1)輸入訓(xùn)練樣本數(shù)據(jù)和預(yù)測(cè)樣本數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行歸一化處理,并對(duì)粒子的速度和位置進(jìn)行初始化處理。
(2)對(duì)參數(shù)進(jìn)行設(shè)置,粒子群規(guī)模m=20;迭代次數(shù)取kmax=100,對(duì)于加速度常數(shù),c1值較小會(huì)導(dǎo)致粒子缺失認(rèn)知能力,c2值較小會(huì)降低粒子間的信息共享能力,其取值范圍通常為0~2。根據(jù)經(jīng)驗(yàn)一般都取2,本文取c1=1.5,c2=1.8;對(duì)于慣性權(quán)重系數(shù)w,初始化w0=1.0,設(shè)置變化范圍為0.3~0.9;RBF核函數(shù)參數(shù)σ∈[0.01,100],多項(xiàng)式核函數(shù)參數(shù)q∈[0.1,4],懲罰系數(shù)c∈[0.01,2 000],混合權(quán)重系數(shù)λ∈[0,1]。
(3)建立PSO-LSSVM模型,由式(10)、式(11)更新粒子的速度和位置,根據(jù)式(13)計(jì)算粒子的適應(yīng)度值f(xi),并與所有粒子的最優(yōu)適應(yīng)度值f(Gbest)進(jìn)行比較,選取最小的f(xi)值,并代替f(Gbest),由式(12)計(jì)算、更新慣性權(quán)重系數(shù)w,最終終止條件為kmax=100或者滿(mǎn)足f(xi)≤0.001,最后尋找出全局最優(yōu)參數(shù),并建立改進(jìn)自適應(yīng)混合核函數(shù)PSO-LSSVM模型。
模型確定后算法程序?qū)崿F(xiàn)如圖1所示。
豐滿(mǎn)大壩為混凝土重力壩,長(zhǎng)1 080 m,高91.7 m,實(shí)驗(yàn)數(shù)據(jù)為豐滿(mǎn)大壩30#壩段監(jiān)測(cè)成果[18],包括水平變形、同期觀測(cè)水位值、溫度,將同期觀測(cè)水位值和溫度作為屬性特征。選取1985年4月20日—1987年10月25日的140組數(shù)據(jù)作為原始數(shù)據(jù),其中選取前125組數(shù)據(jù)作為訓(xùn)練樣本數(shù)據(jù),后15組數(shù)據(jù)作為預(yù)測(cè)數(shù)據(jù)。
利用MATLAB 2014b軟件上的LSSVM工具箱,編碼實(shí)現(xiàn)了改進(jìn)的自適應(yīng)粒子群算法分別對(duì)混合核函數(shù)的最小二乘支持向量機(jī)、多項(xiàng)式核函數(shù)最小二乘支持向量機(jī)和RBF核函數(shù)最小二乘支持向量機(jī)進(jìn)行參數(shù)尋優(yōu),尋優(yōu)結(jié)果如表1所示,擬合結(jié)果如圖2所示,3種不同核函數(shù)的擬合誤差結(jié)果如圖3所示。
圖2 不同核函數(shù)PSO-LSSVM結(jié)果與原始數(shù)據(jù)對(duì)比Fig.2 Comparison of PSO-LSSVM results with different kernel functions and original data
表1 不同核函數(shù)PSO-LSSVM模型的參數(shù)尋優(yōu)結(jié)果Table 1 Parameter optimization results of different kernel function PSO-LSSVM models
由圖2可知,混合核函數(shù)PSO-LSSVM模型的擬合度最高,多項(xiàng)式核函數(shù)PSO-LSSVM次之,RBF核函數(shù)PSO-LSSVM則最差。根據(jù)不同核函數(shù)模型的擬合值與真實(shí)值的對(duì)比分析可得:RBF核函數(shù)PSO-LSSVM模型的擬合曲線(xiàn)的均方根誤差為0.42 mm,多項(xiàng)式核函數(shù)PSO-LSSVM模型的擬合曲線(xiàn)均方根誤差為0.3 mm,混合核函數(shù)PSO-LSSVM模型的擬合曲線(xiàn)均方根誤差為0.26 mm,因此混合核函數(shù)的PSO-LSSVM模型和傳統(tǒng)的單個(gè)核函數(shù)PSO-LSSVM模型擬合精度高,另外從圖2中可以看出,混合核函數(shù)在曲線(xiàn)波動(dòng)較大處或拐點(diǎn)處,依然有很好的擬合值。
圖3為3種不同核函數(shù)模型對(duì)壩體的水平位移的擬合誤差對(duì)比,從圖3中可以發(fā)現(xiàn)RBF核函數(shù)PSO-LSSVM擬合誤差波動(dòng)比較大,相對(duì)比較離散,誤差范圍主要在[-1.2,1];多項(xiàng)式核函數(shù)PSO-LSSVM模型的擬合誤差值相對(duì)于前者更加向0軸附近靠攏;而較之前兩者,混合核函數(shù)PSO-LSSVM模型的擬合誤差值就更加穩(wěn)定且更小,其誤差值在[-0.4,0.3]范圍內(nèi)。
圖3 不同核函數(shù)模型擬合誤差對(duì)比Fig.3 Comparison of fitting errors of different kernel function models
表2給出了RBF核函數(shù)PSO-LSSVM模型、多項(xiàng)式核函數(shù)PSO-LSSVM模型和混合核函數(shù)PSO-LSSVM模型的預(yù)測(cè)值,以及對(duì)應(yīng)的相對(duì)誤差和中誤差。由表2可知,RBF核函數(shù)PSO-LSSVM模型的預(yù)測(cè)相對(duì)誤差絕對(duì)值范圍為1.8%~20.3%,其中誤差為0.23 mm;多項(xiàng)式核函數(shù)PSO-LSSVM模型的預(yù)測(cè)相對(duì)誤差絕對(duì)值范圍為0.7%~16.8%,其平均值為6.7%,中誤差為0.21 mm;混合核函數(shù)PSO-LSSVM模型的預(yù)測(cè)相對(duì)誤差絕對(duì)值范圍為0.3%~10.8%,其平均值為5.2%,中誤差為0.16 mm,對(duì)比前兩種模型,可以看出其預(yù)測(cè)精度提高了。發(fā)現(xiàn)在具有良好發(fā)展趨勢(shì)的情況下,預(yù)測(cè)精度較高,而在曲線(xiàn)波動(dòng)較大處或拐點(diǎn)處,傳統(tǒng)的單核函數(shù)模型的預(yù)測(cè)精度都相對(duì)降低了,比如預(yù)測(cè)序號(hào)11處,說(shuō)明時(shí)間序列趨勢(shì)性是否良好將影響預(yù)測(cè)精度,對(duì)于這種情況,混合核函數(shù)模型發(fā)揮了兩種核函數(shù)的兼容性,能夠很好地提高預(yù)測(cè)精度。
表2 PSO-LSSVM模型預(yù)測(cè)結(jié)果對(duì)比Table 2 Comparison of PSO-LSSVM model prediction results
(1)由于影響壩體的水平位移的因素很多,如樣本數(shù)量少、非線(xiàn)性波動(dòng)等特點(diǎn),傳統(tǒng)的單核PSO-LSSVM模型很難準(zhǔn)確建模,利用改進(jìn)的自適應(yīng)混合核函數(shù)PSO-LSSVM模型對(duì)壩體水平位移進(jìn)行建模預(yù)測(cè)。
(2)根據(jù)傳統(tǒng)的粒子群算法在尋優(yōu)過(guò)程中,容易陷入局部極小值和過(guò)早收斂的現(xiàn)象,采用非線(xiàn)性權(quán)重遞減的方法對(duì)粒子的速度和位置更新公式進(jìn)行改進(jìn),即改進(jìn)的自適應(yīng)粒子群算法,并對(duì)模型的參數(shù)進(jìn)行迭代尋優(yōu),實(shí)現(xiàn)高效準(zhǔn)確的全局尋優(yōu),提高了最小二乘支持向量機(jī)的學(xué)習(xí)和泛化能力。
(3)通過(guò)與傳統(tǒng)的RBF核函數(shù)PSO-LSSVM和多項(xiàng)式核函數(shù)PSO-LSSVM模型預(yù)測(cè)結(jié)果對(duì)比分析,改進(jìn)的自適應(yīng)混合核函數(shù)PSO-LSSVM模型更加準(zhǔn)確地預(yù)測(cè)了壩體的水平位移,降低了模型的預(yù)測(cè)誤差。