郝長(zhǎng)春
(安徽省水利水電勘測(cè)設(shè)計(jì)院,安徽 蚌埠233000)
為了有效保障水庫(kù)大壩的安全運(yùn)行和掌握大壩的運(yùn)行狀態(tài),目前大多使用自動(dòng)化和智能化程度較高的測(cè)量機(jī)器人對(duì)大壩進(jìn)行實(shí)時(shí)連續(xù)的精密觀測(cè)。測(cè)量機(jī)器人測(cè)角精度達(dá)±0.5″,測(cè)邊精度達(dá)±(1mm+1ppm×D)[1],為后續(xù)大壩的變形分析提供了高精度的三維坐標(biāo)。
大壩在運(yùn)行過(guò)程中受到的影響因素主要有水位、溫度、時(shí)效及日照等,這些因素具有很強(qiáng)的模糊性、離散性、隨機(jī)性等特點(diǎn)[2],而且各種影響因素之間的關(guān)系多為非線性的,很難用一種確定的模型實(shí)時(shí)逼真地反映大壩的變形狀態(tài)。目前,用于大壩變形分析的方法主要有BP神經(jīng)網(wǎng)絡(luò)模型、統(tǒng)計(jì)回歸模型等智能算法[3],而本文探索使用SVM支持向量機(jī)技術(shù)建立實(shí)時(shí)分析大壩變形的預(yù)測(cè)模型。通過(guò)對(duì)相同的變形監(jiān)測(cè)數(shù)據(jù)進(jìn)行對(duì)比分析發(fā)現(xiàn)SVM支持向量機(jī)模型比BP神經(jīng)網(wǎng)絡(luò)模型、線性回歸模型等在解決非線性、高維空間、小樣本及局部極小值等方面有更多的優(yōu)勢(shì)。
早期多采用經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化理論,即ERM準(zhǔn)則來(lái)解決模型的逼近問(wèn)題,但由于ERM準(zhǔn)則是根據(jù)經(jīng)驗(yàn)直觀的、想當(dāng)然的做法,所以缺乏必要的理論基礎(chǔ)。VC維理論是統(tǒng)計(jì)學(xué)習(xí)理論用來(lái)衡量函數(shù)集性能的重要指標(biāo),在某種程度上能反映函數(shù)集的學(xué)習(xí)能力,對(duì)學(xué)習(xí)機(jī)器泛化性能有直接的影響,如VC維越大,則學(xué)習(xí)機(jī)器的容量就越大,其本身的結(jié)構(gòu)就越復(fù)雜。
機(jī)器學(xué)習(xí)想要達(dá)到的真正目的是使經(jīng)驗(yàn)風(fēng)險(xiǎn)和VC維都盡可能的小,以取得較小的真實(shí)風(fēng)險(xiǎn),即對(duì)后期的輸入數(shù)據(jù)有更好的推廣性[4]。下面用經(jīng)驗(yàn)風(fēng)險(xiǎn)與真實(shí)風(fēng)險(xiǎn)之間的關(guān)系解釋這種推廣性。
式中:R(a)為真實(shí)風(fēng)險(xiǎn);Remp(a)為經(jīng)驗(yàn)風(fēng)險(xiǎn);l表示輸入的樣本數(shù);h表示函數(shù)集的VC維;)被稱作置信范圍。如果能使經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍同時(shí)達(dá)到最小,那么實(shí)際風(fēng)險(xiǎn)也將能實(shí)現(xiàn)最小化的目的。
SVM是以統(tǒng)計(jì)學(xué)習(xí)理論為基礎(chǔ)采用結(jié)構(gòu)風(fēng)險(xiǎn)最小 化 (Structural Risk Minimization,SRM)理論[5]建立的,其基本思想是通過(guò)內(nèi)積函數(shù)定義的非線性變換將輸入空間映射到一個(gè)高維的特征空間,并且在高維的特征空間中尋找輸入變量和輸出變量之間的一種非線性關(guān)系(最優(yōu)分類面)??稍O(shè)輸入樣本為xi(i=1,2,…,k),對(duì)應(yīng)的輸出為yi∈(+1,-1),方程x·w+b=0為高維空間中的最優(yōu)分類面,其中:w,b表示方程的系數(shù),且滿足下面的約束條件
設(shè)x到最優(yōu)分類面的距離為
在高維空間使間隔margin的值達(dá)到最大且滿足下面等式的樣本點(diǎn)就是支持向量(Support Vector,VC)[6]
在函數(shù)擬合問(wèn)題中,通常運(yùn)用核函數(shù)將大量離散的非線性數(shù)據(jù)轉(zhuǎn)化為高維空間中的線性問(wèn)題。根據(jù)相關(guān)文獻(xiàn)研究發(fā)現(xiàn)高斯徑向基核函數(shù)更適合于非線性模型的建立,故本文選高斯徑向基作為核函數(shù)
除此之外,常見(jiàn)的核函數(shù)還有d次多項(xiàng)式核函數(shù)、雙曲正切核函數(shù)等。
設(shè)(x1,y1),(x2,y2),…,(xi,yi),xi∈RN,yi∈R,xi為輸入向量,yi為輸出向量,l為樣本個(gè)數(shù),Φ表示非線性映射,F(xiàn)表示通過(guò)映射得到的高維空間,則
式中:w表示最優(yōu)分類面的權(quán)值向量;d表示偏置量。引入下面的結(jié)構(gòu)風(fēng)險(xiǎn)函數(shù)
式中:‖w‖表示函數(shù)f(x)的復(fù)雜程度;C為懲罰因子;ε表示不敏感損失函數(shù),其有如下的形式:
若實(shí)際值與預(yù)測(cè)值之間的差值不大于ε時(shí),即認(rèn)為預(yù)測(cè)值不存在損失;當(dāng)它們之間的差值為“其他”情況時(shí),也不懲罰那些造成偏差大于ε的樣本值,這樣可以使訓(xùn)練模型具有很好的魯棒性。
支持向量的回歸問(wèn)題實(shí)質(zhì)上是在一定約束條件下解下面的優(yōu)化問(wèn)題。
式中:ξ,ξ*為松弛因子,表示在|yi-[wT·Φ(xi)+d]|<ε條件下訓(xùn)練誤差的上限和下限。
需優(yōu)化的問(wèn)題為[7]
引入Lagrange函數(shù)求解上述條件下的優(yōu)化問(wèn)題,可以使式(9)成立。
最終,應(yīng)用式(4)中的對(duì)偶問(wèn)題解非線性的回歸問(wèn)題:
式中:K(xi,xj)=Φ(xi)T·Φ(xj)表示用來(lái)描述高維空間的核函數(shù),由式(3)、Lagrange函數(shù)及解得的ai和的值可得到回歸函數(shù)[8]
由式(7)可以發(fā)現(xiàn),若輸入向量xi不在|yi-[wT·Φ(xi)+b]|≤ε的范圍內(nèi),則將存在誤差,這時(shí)可采用最小化目標(biāo)函數(shù)的方法進(jìn)行回歸,避免了數(shù)據(jù)過(guò)擬合的問(wèn)題。通過(guò)使用核函數(shù)進(jìn)行低維到高維空間的轉(zhuǎn)換,大大降低了運(yùn)算的復(fù)雜度,擺脫了高維空間中維數(shù)的困擾,避免了“位數(shù)災(zāi)難”的出現(xiàn)。
皖東南某水庫(kù)大壩為混凝土面板堆石壩,壩長(zhǎng)252m,最大壩高為68m。整個(gè)監(jiān)測(cè)網(wǎng)包括7個(gè)基準(zhǔn)點(diǎn)和17個(gè)工作基點(diǎn),如圖1所示。采用TCA2003智能監(jiān)測(cè)系統(tǒng)對(duì)大壩進(jìn)行長(zhǎng)期不間斷監(jiān)測(cè)。
圖1 監(jiān)測(cè)控制網(wǎng)
為方便監(jiān)測(cè)數(shù)據(jù)的處理,本文假設(shè)沿壩體的方向?yàn)閄軸,與壩體垂直向下游的方向?yàn)閅軸正方向。本文選取位于大壩中間的工作基點(diǎn)BX7的101組數(shù)據(jù)作為一個(gè)實(shí)驗(yàn)樣本,并且把前81組數(shù)據(jù)作為模型的學(xué)習(xí)樣本,把剩下的20組數(shù)據(jù)作為預(yù)測(cè)樣本。BX7點(diǎn)Y方向的位移和沉降及水位的數(shù)據(jù)分布分別如圖2、圖3、圖4所示。
圖2 BX7點(diǎn)Y方向位移分布
本文采用“3σ準(zhǔn)則”對(duì)數(shù)據(jù)進(jìn)行粗差探測(cè),假設(shè){x1,x2,…,xn}為一觀測(cè)值序列,采用一級(jí)差分的方法求每個(gè)觀測(cè)值的預(yù)測(cè)值
則實(shí)際觀測(cè)值與預(yù)測(cè)值之差為
假設(shè)通過(guò)大量觀測(cè)資料求得的觀測(cè)值中誤差為m,由式(12)和式(13)可得dj的均方差^σd=2m。當(dāng)|dj|>3^σd時(shí),則判定xj為粗差(奇異值),應(yīng)將其剔除。
在BX7號(hào)點(diǎn)的沉降值分布圖中存在急劇跳躍的數(shù)據(jù),因而采用“3σ準(zhǔn)則”進(jìn)行探測(cè),發(fā)現(xiàn)第54組數(shù)據(jù)的沉降值有異常,故將其剔除。為了保證數(shù)據(jù)的連續(xù)性和完整性采用下面的“線性內(nèi)插法”對(duì)該組數(shù)據(jù)內(nèi)插,內(nèi)插值為147.253 2。
式中:y,yi,yi+1為效應(yīng)量;t,ti,ti+1為時(shí)間變量。
SVM、BP神經(jīng)網(wǎng)絡(luò)、多項(xiàng)式回歸模型均采用相同學(xué)習(xí)樣本和預(yù)測(cè)樣本對(duì)BX7號(hào)點(diǎn)監(jiān)測(cè)數(shù)據(jù)進(jìn)行建模和預(yù)測(cè),并對(duì)最終的預(yù)測(cè)精度進(jìn)行對(duì)比分析。
鑒于大壩所受的主要影響因素,本文選取T(觀測(cè)時(shí)的氣溫或者當(dāng)天平均氣溫)、H(庫(kù)水位),t1,t2,t3(時(shí)間t的函數(shù))為觀測(cè)量。
時(shí)間t的函數(shù)表達(dá)式為
則大壩變形預(yù)測(cè)模型可以定義為
由學(xué)習(xí)樣本值得基于SVM的大壩變形模型為
式中:x為待預(yù)測(cè)值的影響因子矩陣;xi為第i次觀測(cè)的影響因子矩陣;k(x,xi)為徑向基核函數(shù)、ai,b可通過(guò)求解二次優(yōu)化問(wèn)題得到。
本文采用徑向基核函數(shù)和交叉驗(yàn)證法建立擬合模型,通過(guò)對(duì)設(shè)置的樣本進(jìn)行學(xué)習(xí),得出核參數(shù)γ為0.071 437,懲罰因子C為147.298 15,損失函數(shù)ε為0.029 173。采用解算的參數(shù)對(duì)預(yù)測(cè)樣本進(jìn)行預(yù)測(cè),水平位移與沉降量的預(yù)測(cè)值與實(shí)測(cè)之間的誤差分布如圖5、圖6所示。
2.4.1 BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)
本文建立了以特征向量T,H,t1,t2,t3為輸入層,以監(jiān)測(cè)值的變形量為輸出層、一個(gè)隱含層的三層神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,對(duì)BX7號(hào)點(diǎn)的沉降監(jiān)測(cè)值進(jìn)行預(yù)測(cè),預(yù)測(cè)誤差曲線如圖7所示。
圖7 BP神經(jīng)網(wǎng)絡(luò)沉降預(yù)測(cè)誤差分布
2.4.2 多項(xiàng)式模型的預(yù)測(cè)
同樣以水位、氣溫和時(shí)間為自變量,定義的多項(xiàng)式模型為
采用與前兩種模型相同的學(xué)習(xí)樣本,通過(guò)回歸計(jì)算得a0=-51.2、a=0.003,b=0.335,c=0.052,則預(yù)測(cè)方程為
^y=-51.2-0.003 H+0.335T+0.052t.
通過(guò)對(duì)預(yù)測(cè)樣本沉降量進(jìn)行預(yù)測(cè)得到如圖8所示的誤差分布曲線。
圖8 多項(xiàng)式沉降預(yù)測(cè)誤差分布
從以上3種模型對(duì)沉降量的預(yù)測(cè)誤差曲線可以看出,SVM模型和BP神經(jīng)網(wǎng)絡(luò)模型具有相近的預(yù)測(cè)效果,兩者分別有85%和75%的預(yù)測(cè)點(diǎn)落在±20%的范圍內(nèi),而多項(xiàng)式僅有50%的點(diǎn)落在該范圍內(nèi),并且SVM還具有很強(qiáng)的“魯棒性”。
本文選擇平均絕對(duì)百分比誤差(MAPE)、均方誤差(MSE)、平均絕對(duì)誤差(MAE)評(píng)定模型的預(yù)測(cè)效果,并進(jìn)行對(duì)比分析,基本公式為
在上述的3種評(píng)定方法中,yt表示實(shí)測(cè)值;^yt表示預(yù)測(cè)值;n表示預(yù)測(cè)值的個(gè)數(shù),評(píng)定結(jié)果如表1所示。
表1 3種預(yù)測(cè)模型的預(yù)測(cè)精度比較
由表1可知,在3個(gè)指標(biāo)中SVM模型的沉降值最小,因而SVM模型在大壩預(yù)測(cè)上比BP網(wǎng)絡(luò)模型和回歸分析模型都有更好的效果。適合處理小樣本、非線性的數(shù)據(jù),建立的模型具有良好的推廣性,采用核函數(shù)的方法巧妙地避免了數(shù)據(jù)處理時(shí)的“維數(shù)災(zāi)難”和局部多極值的問(wèn)題。
通過(guò)模型的建立和預(yù)測(cè)分析可以發(fā)現(xiàn)SVM模型能夠很好地表達(dá)復(fù)雜因素間的非線性關(guān)系。選擇徑向基核函數(shù)能夠滿足非線性監(jiān)測(cè)數(shù)據(jù)由低維到高維的映射要求,避免模型的過(guò)度擬合,使建立的模型具有更好的泛化能力。而神經(jīng)網(wǎng)絡(luò)法是一種事后處理方法,并且存在過(guò)學(xué)習(xí)、收斂速度慢、易陷于局部極值等問(wèn)題。從誤差曲線圖中也可以看出,中間有部分預(yù)測(cè)精度非常高,而后半部分預(yù)測(cè)精度較低,因而SVM模型更適合于大壩變形數(shù)據(jù)的預(yù)測(cè)。
[1]喻興旺.TCA2003全站儀在港口灣水庫(kù)大壩變形監(jiān)測(cè)中的應(yīng)用[J].水電自動(dòng)化與大壩監(jiān)測(cè),2003,27(5):48-50.
[2]張真真.支持向量機(jī)在大壩安全監(jiān)測(cè)資料分析中的應(yīng)用[D].西安:西安理工大學(xué),2008.
[3]岳建平 田林亞.變形監(jiān)測(cè)技術(shù)與應(yīng)用[M].北京:國(guó)防工業(yè)出版社,2007.
[4]李國(guó)正,王猛,曾華軍.支持向量機(jī)導(dǎo)論[M].北京:電子工業(yè)出版社,2005.
[5]Vapnik,V.The Nature of Statistical Learning Theory[M].New York:Springer-Verlag,1995.
[6]Druker,H.Butges,C J.Kaufman,L C.Smola,A.Vapnik,V.Support vector regression machines[J].Advances in Neural Information Processing Systems,1997,9:155-161.
[7]Christopher J.C.Burges.A Tutorial on Support Vector Machines for Pattern Recognition[J].Journal of Changde Teachers University,1998.
[8]張學(xué)工.關(guān)于統(tǒng)計(jì)學(xué)習(xí)理論與支持向量機(jī)[J].自動(dòng)化學(xué)報(bào),2000,26(1).
[9]張宏偉 康世英.變形觀測(cè)數(shù)據(jù)處理粗差的定位與剔除[J].桂林工學(xué)院學(xué)報(bào),2003,23(3):310-313.