李 丹,郭芝韻, 朱延濤
(1. 河海大學(xué) 水利水電學(xué)院,南京 210098;2. 河海大學(xué)水文水資源與水利工程科學(xué)國家重點實驗室,南京 210098)
混凝土壩是大壩的重要分支,大壩安全影響著人民的生命和財產(chǎn),因此需要謹(jǐn)慎對待。隨著數(shù)學(xué)分析理論及計算機技術(shù)的發(fā)展,大壩安全監(jiān)控模型研究成為評價大壩安全性能、預(yù)測大壩運行狀態(tài)的重要手段,而在大壩安全監(jiān)控中最為重要的方面就是對大壩變形位移的監(jiān)控?,F(xiàn)階段,應(yīng)用較為廣泛的大壩安全監(jiān)控模型分為統(tǒng)計模型[1]和以人工神經(jīng)網(wǎng)絡(luò)為代表的人工智能算法等[2,3],其中,統(tǒng)計模型要求觀測樣本足夠充分,且精度受相關(guān)性影響,而人工智能算法的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和參數(shù)初值選擇有一定主觀性,并且由于采用經(jīng)驗風(fēng)險最小化準(zhǔn)則,易產(chǎn)生“過擬合”問題,泛化能力較差。
回歸型支持向量機(SVR)是Vapnik為解決回歸擬合問題提出的,在支持向量機(SVM)基礎(chǔ)上基于統(tǒng)計學(xué)習(xí)理論(STL)改進得來,能較好解決高維數(shù)和非線性問題,克服人工神經(jīng)網(wǎng)絡(luò)“過擬合”的問題,提高模型的泛化能力[4],但SVR模型中核函數(shù)參數(shù)σ、懲罰因子C和不敏感損失函數(shù)ε的選擇對預(yù)測精度影響較大[5]。為此,工程應(yīng)用中多采用智能算法進行參數(shù)尋優(yōu)。目前在大壩安全監(jiān)控模型研究方面也利用SVR模型進行了研究,如王泉,鄭東建等[6]利用PCA-SVR模型對大壩的早期裂縫預(yù)報進行了研究,證明了其在預(yù)報裂縫開合度信息方面的可行性;虞鴻,包騰飛等[7]采用ε-SVR對大壩變形進行數(shù)值模擬,得到了較為準(zhǔn)確的擬合結(jié)果和準(zhǔn)確可靠的預(yù)測結(jié)果。在其他工程應(yīng)用中,多采用遺傳算法(GA)、粒子群算法(PSA)、魚群算法(SA)和蟻群算法(ACA)等智能算法對SVR模型進行參數(shù)優(yōu)化,根據(jù)大壩變形的特點,本文采用由Dorigo等[8]提出的蟻群優(yōu)化算法,已有牛景太,魏博文等[9]將此算法用于神經(jīng)網(wǎng)絡(luò)模型的優(yōu)化,并將它應(yīng)用于混凝土壩位移安全監(jiān)控模型,利用其具有的并行性、效率高等特點可快速得到較優(yōu)參數(shù),因此,本文建立了基于ACO-SVR的混凝土壩變形監(jiān)控模型。通過工程實例分析驗證,此模型具有更高的精度和泛化能力,當(dāng)然也存在一些不足。
大壩安全監(jiān)控回歸型支持向量機(SVR)模型是SVR分類的應(yīng)用拓展,基本思想[10]是尋找一個最優(yōu)分類面使得所有訓(xùn)練樣本離該最優(yōu)分類面的誤差最小,即找到最優(yōu)擬合面。設(shè)含有l(wèi)個訓(xùn)練樣本的樣本對集合為{(xi,yi),i=1,2,…,l},其中,xi(xi∈Rd)是第i個訓(xùn)練樣本的輸入列向量,xi=[x1i,x2i,…,xdi]T,yi∈R為對應(yīng)的輸出值。根據(jù)大壩安全監(jiān)控理論,一般輸入列向量包括溫度、水位與時效等影響因子,輸出值為實測值,如大壩變形、滲流量、應(yīng)力應(yīng)變等等。
根據(jù)大壩特性,設(shè)在高維特征空間中建立關(guān)于混凝土壩的線性回歸函數(shù)為
f(x)=wΦ(x)+b
(1)
式中:Φ(x)為非線性映射函數(shù);w,b為回歸因子。
定義ε線性不敏感損失函數(shù):
(2)
式中:f(x)為回歸函數(shù)返回的預(yù)測值;y為對應(yīng)的實測值。
式(2)中當(dāng)f(x)與y之間的差別小于等于ε時,則認(rèn)為擬合較為準(zhǔn)確。
為求解w和b,引入松弛變量ξi,ξ*i,可將優(yōu)化目標(biāo)定為:
式中:C(C>0)為懲罰因子,C越大表示對訓(xùn)練誤差大于ε的樣本懲罰越大;ε規(guī)定了誤差要求,ε越小表示誤差越小。
為求解式(3),引入Lagrange函數(shù),并轉(zhuǎn)換為對偶形式:
(4)
式中:αi為Lagrange乘子;K(xi,xj)=Φ(xi)Φ(xj)為核函數(shù),常用的核函數(shù)有線性核函數(shù)、d階多項式核函數(shù)、徑向基核函數(shù)和具有參數(shù)k和θ的Sigmoid核函數(shù),本文采用徑向基核函數(shù),形如:
(5)
式中:σ為核參數(shù),是求解核函數(shù)的關(guān)鍵。
設(shè)式(4)求解得到的最優(yōu)解為α=[α1,α2,…,αl],α*=[α*1,α*2,…,α*l],則有:
(7)
式中:Nnsv為支持向量的個數(shù);SV為支持向量的樣本集合。支持向量即為當(dāng)(αi-α*i)≠0時對應(yīng)的樣本xi。
于是,得到回歸函數(shù)為:
(8)
從式(8)可以看出,SVR最終的函數(shù)形式與SVM相同,其結(jié)構(gòu)與神經(jīng)網(wǎng)絡(luò)類似,如圖1所示。大壩安全監(jiān)控SVR模型的輸出值是中間節(jié)點的線性組合,每個中間節(jié)點對應(yīng)一個支持向量。利用大量訓(xùn)練樣本擬合得到較為準(zhǔn)確的回歸函數(shù),則可根據(jù)訓(xùn)練樣本得到的回歸因子預(yù)測大壩運行性態(tài)。
圖1 大壩安全監(jiān)控SVR模型結(jié)構(gòu)示意圖Fig.1 Schematic diagram of SVM model for dam safety monitoring
由上述可知,核參數(shù)σ、懲罰因子C和線性不敏感損失函數(shù)ε的選取對大壩安全監(jiān)控SVR模型的精度有相當(dāng)大的影響,因此本文利用蟻群算法進行參數(shù)尋優(yōu),消除主觀選取參數(shù)的部分影響,并提高擬合效率。
蟻群算法,顧名思義,是模擬自然界螞蟻群體覓食行為而成的智能算法。蟻群算法用于優(yōu)化的基本思路為:用螞蟻的可行的行走路徑集合構(gòu)成待優(yōu)化問題的解空間。路徑較短的螞蟻釋放的信息素量較多,螞蟻根據(jù)信息素的濃度選擇路徑,隨著時間的推進,較短的路徑上累積的信息素濃度逐漸增高,最終,整個螞蟻會在正反饋的作用下集中到最佳路徑上,此時對應(yīng)的就是最優(yōu)解。
此處以解決旅行商(TSP)問題的過程解釋蟻群算法基本原理[11]。設(shè)螞蟻數(shù)量為m,城市數(shù)量為n,城市i與城市j之間的距離為dij(i,j=1,2,…,n),t時刻城市i與城市j連接路徑上的信息素濃度為τij(t)。初始時刻,各個城市間連接路徑上的信息素濃度相同,τij(0)=τ0。
螞蟻k(k=1,2,…,m)根據(jù)各個城市連接路徑上的信息素濃度決定其下一個訪問的城市。設(shè)Pkij(t)表示t時刻螞蟻k從城市i轉(zhuǎn)移到城市j的概率,其計算公式為:
(9)
式中:啟發(fā)函數(shù)ηij(t)=1/dij,表示螞蟻從城市i轉(zhuǎn)移到j(luò)的期望程度;allowk(k=1,2,…,m)為螞蟻k待訪問城市的集合,初始時刻其中包括除初始出發(fā)點外的(n-1)個元素,當(dāng)allowk為空時,即表示訪問結(jié)束;α為信息素重要程度因子,其值與信息素濃度在轉(zhuǎn)移中起的作用成正比;β為啟發(fā)函數(shù)重要程度因子,其值越大,表明螞蟻會以較大的概率轉(zhuǎn)移到距離短的城市。
螞蟻在釋放信息素的同時,各城市連接路徑上的信息素也在隨時間消散,設(shè)參數(shù)ρ(0<ρ<1)表示信息素的揮發(fā)程度。因此,各城市連接路徑上的信息素濃度需在一次循環(huán)結(jié)束后實時更新,即:
(10)
式中;Δτij表示所有螞蟻在城市i與城市j連接路徑上釋放的信息素濃度總和;Δτkij表示第k只螞蟻在城市i與城市j連接路徑上釋放的信息素濃度,按照ant cycle system,其計算公式如下。
(11)
式中:Q為常數(shù),表示所有螞蟻循環(huán)一次釋放的信息素之和;Lk為第k只螞蟻走過路徑的總長度[12]。
為將大壩安全監(jiān)控SVR模型參數(shù)優(yōu)化與蟻群算法的路徑尋優(yōu)結(jié)合起來,需設(shè)立相應(yīng)蟻群系統(tǒng)。本文模型使用徑向基核函數(shù)[13],共有3個參數(shù),分別是核參數(shù)σ、懲罰因子C和線性不敏感損失函數(shù)ε,主要進行核參數(shù)σ和懲罰因子C的尋優(yōu)。
由于核參數(shù)σ和懲罰因子C取值是連續(xù)的,因此,這是求連續(xù)空間最優(yōu)解問題,首先要將參數(shù)離散化[14]。在大壩安全監(jiān)控模型研究方面,需根據(jù)專家經(jīng)驗設(shè)定參數(shù)的取值范圍和精度。若設(shè)定參數(shù)的范圍為[0,100]和[0,10],小數(shù)點后保留位數(shù)分別為2位和3位,此時可借用旅行商問題(TSP)的思想設(shè)置8層城市,每層分別有10個城市,各自代表數(shù)字0~9,每層從左到右依次代表C的十位、個位、小數(shù)點后的十分位和百分位和σ的個位、小數(shù)點后的十分位、百分位和千分位,并且規(guī)定每只螞蟻只能從左往右依次移動,經(jīng)過一定次數(shù)循環(huán)尋找,可以得到較優(yōu)的路徑節(jié)點,依次組成需要優(yōu)化的參數(shù)。為尋得最優(yōu)路徑,不能單純用最短來尋找最優(yōu)參數(shù),因此選用k-fold交叉驗證誤差作為目標(biāo)值E,以E最小時的路徑為最優(yōu)路徑[15]。
該蟻群系統(tǒng)的基本思想是將對參數(shù)的直接搜索轉(zhuǎn)化為對每位數(shù)字的逐一搜索,即將連續(xù)變量轉(zhuǎn)變?yōu)槿舾呻x散變量的尋優(yōu)問題,更利于螞蟻種群對整個空間的完全搜索[14]。由此可將蟻群算法很好地應(yīng)用在參數(shù)優(yōu)化上,其余步驟、原理與解決TSP問題相同。
基于ACO-SVR的大壩安全監(jiān)控模型是用蟻群算法對核參數(shù)σ和懲罰系數(shù)C進行優(yōu)選,組成C和σ的每一位數(shù)字由節(jié)點值(相當(dāng)于TSP問題中的城市,每個城市對應(yīng)0~9)體現(xiàn)。SVR參數(shù)優(yōu)化的蟻群系統(tǒng)以最小k-fold交叉驗證誤差(目標(biāo)值E)原則來更新信息素濃度。目標(biāo)函數(shù)中隱含各螞蟻所走過的所有節(jié)點的信息以及所建模型當(dāng)前的準(zhǔn)確度[8]。為使大壩安全監(jiān)控模型更準(zhǔn)確合理,對于核參數(shù)σ和懲罰系數(shù)C的取值范圍和精度需要根據(jù)大量相關(guān)數(shù)據(jù)選取。
具體步驟是:
(1)將模型中相關(guān)參數(shù)進行初始化,其中包括模型參數(shù)C、σ的上下限和具體精度,確定k-fold交叉驗證誤差的k值,螞蟻數(shù)量m、信息素重要程度因子α、啟發(fā)函數(shù)重要程度因子β、信息素?fù)]發(fā)因子ρ、信息素釋放總量Q以及最大迭代次數(shù)iter-max,迭代次數(shù)初始值為iter=1。
(2)將各只螞蟻隨機放置于不同出發(fā)點,根據(jù)式(9)計算每個螞蟻的轉(zhuǎn)移概率來選擇下一個訪問地點,直至所有螞蟻訪問完所有節(jié)點。
(3)計算各只螞蟻經(jīng)過的路徑長度Lk(k=1,2,…,m),同時,根據(jù)式(10)~式(11)對各個城市連接路徑上的信息濃度進行更新。
(4)將訓(xùn)練樣本平均分割成k個互不包含的子集,計算k-fold交叉驗證誤差,并以此作為適應(yīng)值,記錄本次循環(huán)的最優(yōu)路徑(對應(yīng)最小適應(yīng)值)。
(5)判斷是否達(dá)到預(yù)定的迭代步數(shù),或者是否出現(xiàn)停滯現(xiàn)象。若是,算法結(jié)束,輸出當(dāng)前最優(yōu)參數(shù)C和σ;若否,令iter=iter+1,清空螞蟻經(jīng)過路徑記錄表,轉(zhuǎn)步驟(2),進行下一次迭代。
綜上所述,基于ACO-SVR的大壩安全監(jiān)控模型的構(gòu)建流程圖如圖2。
圖2 ACO-SVR模型的步驟流程圖Fig.2 Flow diagram of ACO-SVR model
某水電站位于云南水富與四川省交界的金沙江下游河段,大壩為混凝土重力壩,壩頂高程384 m,最大壩高162 m,壩頂長度909.26 m。該壩于2013年9月12日蓄水至正常水位,并維持在380.0 m水位左右運行,已在泄1、泄4、泄10、泄13、左非1和航1等壩段布置了完整的正倒垂線,現(xiàn)選取左非溢流1號壩段的垂線監(jiān)測資料對所建模型的擬合效果和預(yù)測精度進行測試。選取2013年9月12日-2015年10月29日共240組變形位移數(shù)據(jù)用于擬合,2015年11月2日-2015年12月17日共14組數(shù)據(jù)用于預(yù)測。
初始化參數(shù)如下:蟻群算法最大迭代次數(shù)為100;螞蟻數(shù)量為20;懲罰因子C和核參數(shù)σ變化范圍分別為[0,100]和[0,10],有效數(shù)字分別為2位和3位;信息素重要程度因子為7、啟發(fā)函數(shù)重要程度因子為0.5、信息素?fù)]發(fā)因子為1、信息素釋放
總量Q為100,交叉驗證參數(shù)為5。通過改進的ACO尋優(yōu)得,C=76.79,σ=0.838。
采用復(fù)相關(guān)系數(shù)R、均方差FMSE比較ACO-SVR模型、SVR模型和BP模型的擬合精度(見表1),可以看出,在訓(xùn)練擬合精度方面,ACO-SVR模型優(yōu)于SVR模型和BP模型。從預(yù)測結(jié)果來看,一個月以內(nèi)的預(yù)測數(shù)值較為準(zhǔn)確,因此只在表2中列出一個月內(nèi)的模型預(yù)測結(jié)果對比。從表中可知,ACO-SVR模型的最大絕對誤差為0.068 mm,誤差率為2.66%;SVR模型為0.094 mm,誤差率為3.48%;BP模型為0.209 mm,誤差率為8.18%。其中ACO-SVR模型的誤差值最小。為直觀分析,將ACO-SVR模型、SVR模型和BP模型的所有預(yù)測結(jié)果進行比較,如圖3~圖4所示。從圖3來看,3種模型的擬合效果都不錯,BP模型相對差一些。從圖4中的大致趨勢來看,一個月內(nèi),SVR模型的預(yù)測結(jié)果與ACO-SVR模型結(jié)果類似,但是SVR模型結(jié)果偏小,ACO-SVR模型的結(jié)果偏大而更接近實測值。但是,一個月后與實測值幾乎呈相反的趨勢增長,不能準(zhǔn)確預(yù)測變形值。相對而言,BP模型總體呈上升趨勢,只有前幾個數(shù)據(jù)預(yù)測較為準(zhǔn)確,準(zhǔn)確預(yù)測時間更短。分析表明,ACO-SVR模型的擬合精度高于SVR和BP模型,具有更好的預(yù)測效果及擬合速率。
表1 ACO-SVR模型、SVR模型和BP模型的擬合精度對比Tab.1 Fitting accuracy comparison between ACO-SVR、SVR and BP
表2 ACO-SVR模型、SVR模型和BP模型的預(yù)測結(jié)果對比(一個月內(nèi)) mm
圖3 模型訓(xùn)練擬合值與實測值對比圖Fig.3 The comparison between the fitted values of model training and the measured values
圖4 模型預(yù)測值與實測值對比圖Fig.4 The comparison between the predicted and measured values of the model
通過工程實例分析,驗證了本文的ACO-SVR模型相較于SVR模型和BP模型具有更高的精度和適用性,但同樣存在一些問題。
(1)大壩安全監(jiān)控ACO-SVR模型和SVR模型相較于BP模型有更大的可控性,BP模型的擬合結(jié)果缺少可控因素,結(jié)果有很大程度上會出現(xiàn)過擬合的情況,而SVR模型可以通過控制模型參數(shù)來得到更佳的結(jié)果,防止過擬合的情況。
(2)大壩安全監(jiān)控ACO-SVR模型大大降低了SVR模型的迭代次數(shù),減少了尋參時間,提高了擬合效率,能在短時間內(nèi)高效尋得更準(zhǔn)確的SVR參數(shù),降低了原有SVR模型參數(shù)選擇的主觀性,一定程度上彌補了SVR模型的缺陷,因此能夠得到更好的擬合結(jié)果,在大壩安全監(jiān)控模型研究中具有實用意義。
(3)根據(jù)模型研究結(jié)果,表明ACO-SVR模型只能較為準(zhǔn)確地預(yù)測短期(一個月左右)的大壩變形值,長期變形預(yù)測偏差較大,延展性不足,可能與訓(xùn)練數(shù)據(jù)量的大小和選取的輸入因子有關(guān),因此可在長期準(zhǔn)確預(yù)測上深入研究。
(4)蟻群算法雖然在尋優(yōu)方面效率較高,但是卻易陷入局部最優(yōu),從而模型導(dǎo)致運行結(jié)果不穩(wěn)定,需要多次運行才能獲得更佳結(jié)果,為使大壩安全監(jiān)控模型更加合理、準(zhǔn)確,可尋求其他智能算法的幫助。
□
[1] 陳久宇, 林 見. 觀測數(shù)據(jù)的處理方法[M]. 上海: 上海交通大學(xué)出版社,1987.
[2] SU Huaizhi, HU Jiang, WU Zhongru. A study of safety and early-warning method for dam global behavior [J]. Structural Health Monitoring, 2012,11(3):269-279.
[3] 王 凌. 智能優(yōu)化算法及其應(yīng)用[M]. 北京: 清華大學(xué)出版社,2001.
[4] Vapnik V N. The nature of statistical learning theory[M]. New York: Springer-Verlag, 1995.
[5] 郁 磊, 史 峰, 王 輝,等. MATLAB智能算法30個案例分析[M]. 北京: 北京航空航天大學(xué)出版社,2015.
[6] 王 泉, 鄭東健, 范振東, 等. 基于PCA-SVR模型的大壩裂縫早期預(yù)報研究[J].人民長江, 2015,46(5):35-38.
[7] 虞 鴻, 包騰飛, 劉海泉, 等. 大壩變形的ε-SVR數(shù)值模擬[J]. 水電自動化與大壩監(jiān)測, 2010,34(1):46-50.
[8] 劉春波, 王鮮芳, 潘 豐. 基于蟻群優(yōu)化算法的支持向量機參數(shù)選擇及仿真[J]. 中南大學(xué)學(xué)報(自然科學(xué)版) ,2008,39(6):1 309-1 313.
[9] 牛景太, 魏博文. 基于蟻群優(yōu)化神經(jīng)網(wǎng)絡(luò)的混凝土壩位移安全監(jiān)控模型[J]. 甘肅水利水電技術(shù), 2012,48(7):39-41.
[10] Huai-zhi Su, Zhong-ru Wu, Zhi-ping Wen. Identification model for dam behavior based on wavelet network [J]. Computer-Aided Civil and Infrastructure Engineering, 2007,22(6):438-448.
[11] 丁鴻飛. 基于智能優(yōu)化算法的支持向量機回歸及其應(yīng)用[D]. 成都: 西南交通大學(xué), 2011.
[12] 張冰冰,張宏立. 求解非線性方程組的蟻群算法[J]. 工業(yè)控制計算機, 2013,(1):63-64.
[13] Huaizhi Su, Zhexin Chen, Zhiping Wen. Performance improvement method of support vector machine-based model monitoring dam safety [J]. Structural Control and Health Monitoring, 2016,23(2):252-266.
[14] 張 俊,程春田,申建建,等. 基于蟻群算法的支持向量機中長期水文預(yù)報模型[J]. 水力發(fā)電學(xué)報,2010,(6):34-40.
[15] 張鈺寧. 蟻群優(yōu)化支持向量機在變壓器故障診斷中的應(yīng)用[D]. 北京: 華北電力大學(xué), 2014.
[16] 劉天祥,包騰飛. 基于遺傳算法的LIBSVM模型大壩揚壓力預(yù)測研究[J].三峽大學(xué)學(xué)報(自然科學(xué)版),2013,35(6):24-28.
[17] 吳中如, 沈長松, 阮煥祥. 水工建筑物安全監(jiān)控理論及應(yīng)用[M].南京:河海大學(xué)出版社,1990.
[18] Huaizhi Su, Zhiping Wen, Xiaoran Sun, et al. Time-varying identification model for dam behavior considering structural reinforcement [J]. Structural Safety, 2015,57:1-7.