向亞紅,張 峰,鄧念武,謝雨航
(1.湖北省防汛抗旱機(jī)動(dòng)搶險(xiǎn)總隊(duì),湖北 武漢 430064;2.武漢大學(xué)水利水電學(xué)院,湖北 武漢 430072)
大壩變形受到庫(kù)水位、溫度和時(shí)效等多種環(huán)境量因素的影響[1],為研究大壩變形規(guī)律,了解大壩變形狀態(tài),對(duì)大壩運(yùn)行過程中可能出現(xiàn)的異常狀況作好應(yīng)急準(zhǔn)備,需要通過建立數(shù)學(xué)分析模型,對(duì)大壩變形規(guī)律和變形趨勢(shì)進(jìn)行認(rèn)識(shí)和掌握。許多學(xué)者應(yīng)用神經(jīng)網(wǎng)絡(luò)[2,3]、遺傳算法[4]、支持向量機(jī)[5]等方法,以及兩種或兩種以上預(yù)測(cè)方法聯(lián)合建立的混合模型[6-9]對(duì)大壩變形進(jìn)行了研究和分析,這些方法主要是通過建立變形量與環(huán)境變量之間的映射關(guān)系對(duì)大壩變形進(jìn)行分析和研究。
大壩變形監(jiān)測(cè)數(shù)據(jù)屬于時(shí)間序列,監(jiān)測(cè)數(shù)據(jù)具有隨機(jī)性、多尺度變化等復(fù)雜的特性,分形理論可以有效識(shí)別時(shí)間序列隱含的內(nèi)在規(guī)律。Su 等[10]應(yīng)用多重分形去趨勢(shì)波動(dòng)分析法對(duì)某混凝土重力壩現(xiàn)場(chǎng)觀測(cè)數(shù)據(jù)進(jìn)行分析,確定了現(xiàn)有大壩時(shí)間序列的多重分形標(biāo)度行為,刻畫了大壩的長(zhǎng)期行為和結(jié)構(gòu)演變規(guī)律;周蘭庭等[11,12]利用分形理論解析了大壩變形性態(tài)的多重分形特征及其對(duì)稱性;利用多重分形理論對(duì)混凝土重力壩水平位移的波動(dòng)進(jìn)行了分析,指出位移多重分形特征受到環(huán)境量影響明顯。胡江等[13]利用多重分形去趨勢(shì)波動(dòng)方法從局部和整體兩個(gè)方面對(duì)大壩的工作性態(tài)及演變規(guī)律進(jìn)行了評(píng)價(jià)。大壩變形時(shí)間序列具有多重分形的特征,可以根據(jù)大壩的自相似性應(yīng)用分形插值方法對(duì)大壩變形時(shí)間序列進(jìn)行分析和預(yù)測(cè)。進(jìn)一步研究表明,在構(gòu)造分形插值擬合時(shí),由于擬合出的圖形是分?jǐn)?shù)維的,不可避免地會(huì)出現(xiàn)斷裂或周期現(xiàn)象[14];在構(gòu)造分形插值外延預(yù)測(cè)模型時(shí),對(duì)均方偏差最小的點(diǎn)進(jìn)行搜索時(shí)需要較長(zhǎng)的計(jì)算時(shí)間,且預(yù)測(cè)點(diǎn)距離已知序列越遠(yuǎn),預(yù)測(cè)誤差會(huì)越大。針對(duì)上述問題,本文嘗試引入支持向量機(jī)(SVM)對(duì)分形插值方法進(jìn)行優(yōu)化,從而獲取更優(yōu)的擬合和預(yù)測(cè)模型。
分形插值算法是將分析數(shù)據(jù)的復(fù)雜性與數(shù)據(jù)本身可規(guī)律化結(jié)合起來,來預(yù)測(cè)數(shù)據(jù)的走向、數(shù)據(jù)值與區(qū)間值,以便獲得相關(guān)成果并進(jìn)行應(yīng)用[15]。數(shù)據(jù)的屬性具有不確定性和復(fù)雜性,分形插值通過已知數(shù)據(jù)點(diǎn)之間的關(guān)系,學(xué)習(xí)和分析潛在規(guī)律并進(jìn)行自相似性延拓,經(jīng)過多次仿射系統(tǒng)迭代,可大大縮小樣本數(shù)據(jù)預(yù)測(cè)值與實(shí)測(cè)數(shù)據(jù)之間的差距,從而避免固定形式函數(shù)圖像偏離實(shí)測(cè)數(shù)據(jù)而引起的較大誤差[16]。
對(duì)于一個(gè)時(shí)間序列數(shù)據(jù),根據(jù)分形插值理論,建立時(shí)間序列點(diǎn)集{(xi,Yi),i=1,2,…,N},(xi為時(shí)間或序列值,Yi為測(cè)值)。對(duì)時(shí)間序列點(diǎn)集按照公式(1)進(jìn)行標(biāo)準(zhǔn)化處理。得到標(biāo)準(zhǔn)化點(diǎn)集{(xi,yi),i=1,2,…,N}。
式中:Ymax為最大值;Ymin為最小值。
根據(jù)分形插值理論可知,可以構(gòu)造一個(gè)R2上的迭代函數(shù)系(IFS),使它的吸引子G恰好是點(diǎn)集{(xi,yi)|i=1,2,...N}的連續(xù)函數(shù)f:[x0,xn]→R上的圖形上。該迭代函數(shù)系為:
且上式滿足端點(diǎn)條件:
式中:wi為待求的仿射變換矩陣;ai、ci、di、ei、fi為仿射變換參數(shù),具體算法如下:
其中垂直比例因子di是關(guān)鍵參數(shù),di的計(jì)算方法有幾何法、經(jīng)驗(yàn)估計(jì)、平均值法等,為了兼顧數(shù)據(jù)的整體和局部的特性,更好地體現(xiàn)數(shù)據(jù)的分形特征,提高分形插值的擬合精度,結(jié)合大壩水平位移序列特點(diǎn),本文采用隨機(jī)因子法[如式(5)]計(jì)算垂直比例因子di。
式中:ymax、ymin是指以待插值點(diǎn)為中心前后擴(kuò)展n0個(gè)點(diǎn)區(qū)間中的最大和最小值;ε=1 +rand(1),rand(1)表示隨機(jī)函數(shù),代表一個(gè)0 到1 之間的隨機(jī)數(shù)。由yi、yi-1體現(xiàn)局部信息,ymax、ymin體現(xiàn)全局信息,隨機(jī)數(shù)保證了分形本身的特性。
根據(jù)上述原理即可以求出所有變換矩陣wi,將初始迭代點(diǎn)(本文選擇時(shí)間序列第一個(gè)點(diǎn))帶入公式(2),不斷迭代吸引子,最后得出插值點(diǎn)集組成的時(shí)間序列曲線。
設(shè)訓(xùn)練樣本集為:{(xi,yi),i=1,2,…,N},xi∈Rd為輸入特征向量[5,16],在大壩監(jiān)測(cè)數(shù)據(jù)中為影響因子;yi∈{ -1,1}為標(biāo)準(zhǔn)化后的數(shù)據(jù),即算法的評(píng)判指標(biāo),在大壩監(jiān)測(cè)數(shù)據(jù)中為效應(yīng)量。支持向量機(jī)需要通過已知樣本對(duì)函數(shù)關(guān)系式(6)進(jìn)行訓(xùn)練,以便找到輸入特征向量和評(píng)判指標(biāo)間的最優(yōu)關(guān)系。
為了解決輸入特征向量和評(píng)判指標(biāo)間的非線性關(guān)系,需要將其映射到高維空間轉(zhuǎn)化為線性問題。式中ω為分類超平面的權(quán)值,b為分類超平面的偏值。
該模型的優(yōu)化問題為:
約束條件為:
式中:ξi為松弛變量;C為懲罰參數(shù);ε為估計(jì)精度,f(xi)與yi的差別小于ε時(shí)不計(jì)入誤差,大于ε時(shí)誤差記為|f(xi)-yi|-ε。
利用拉格朗日函數(shù)求解,考慮非線性可分情況,并引入用核函數(shù)K(x,xi),得到最優(yōu)超平面的決策函數(shù):
式中:αi,αi*為拉格朗日算子。核函數(shù)K(x,xi)是支持向量機(jī)的關(guān)鍵函數(shù)。目前研究中最常用的核函數(shù)主要有徑向基核函數(shù)(RBF)、多項(xiàng)式核函數(shù)和Sigmoid 核函數(shù)3 種。徑向基核函數(shù)中只有一個(gè)參數(shù)r,該核函數(shù)能夠較好地反映模型選擇的復(fù)雜度。研究表明:選擇合適的參數(shù)后,徑向基核函數(shù)可以適用于大壩變形序列的樣本。鑒于此,本文核函數(shù)采用徑向基核函數(shù),如公式(10)所示。
要構(gòu)造一個(gè)具有較高預(yù)測(cè)精度的支持向量機(jī)模型,必須進(jìn)行模型參數(shù)尋優(yōu)來選擇合適的模型參數(shù)。模型參數(shù)優(yōu)化的主要思想是將目標(biāo)函數(shù)極小化,使得模型預(yù)測(cè)值和實(shí)際觀測(cè)數(shù)據(jù)之間能夠達(dá)到最佳的擬合效果。鑒于大壩變形時(shí)間序列本身的復(fù)雜性,常規(guī)優(yōu)化算法往往難以滿足參數(shù)優(yōu)化的目的。本文采取交叉驗(yàn)證(Cross Validation,CV)方法來進(jìn)行模型參數(shù)尋優(yōu)。交叉驗(yàn)證是一種統(tǒng)計(jì)方法,它可以用來驗(yàn)證分類器的性能,交叉驗(yàn)證法的基本思想是將原始數(shù)據(jù)序列分成兩組,其中一組序列稱為訓(xùn)練集,另一組序列稱為測(cè)試集。首先用訓(xùn)練集對(duì)計(jì)算模型進(jìn)行訓(xùn)練,通過訓(xùn)練學(xué)習(xí)開展參數(shù)尋優(yōu),得到最優(yōu)的模型參數(shù),建立預(yù)測(cè)模型,然后用該模型對(duì)測(cè)試集進(jìn)行預(yù)測(cè),最后用測(cè)試集的計(jì)算結(jié)果來對(duì)該模型進(jìn)行效果評(píng)價(jià)。
基于分形插值和支持向量機(jī)的大壩變形混合模型首先是通過對(duì)時(shí)間序列的分析,找出所有滿足要求的特征點(diǎn),對(duì)特征點(diǎn)集和原始點(diǎn)集通過分形插值算法得到位移時(shí)間序列插值點(diǎn)集,然后利用支持向量機(jī)對(duì)分形插值得到的曲線通過參數(shù)尋優(yōu),得到優(yōu)化后的擬合曲線。
利用支持向量機(jī)理論預(yù)測(cè)下一個(gè)特征點(diǎn),通過分形插值按照前面的方法進(jìn)行迭代,計(jì)算插值點(diǎn),最后再利用支持向量機(jī)進(jìn)行參數(shù)尋優(yōu),得到預(yù)測(cè)曲線。其步驟如下:
(1)建立時(shí)間序列點(diǎn)集:選取各觀測(cè)點(diǎn)位移時(shí)間序列,并進(jìn)行標(biāo)準(zhǔn)化處理,得到時(shí)間序列{(xi,yi),i=1,2,…,N},利用分形檢驗(yàn)指標(biāo)和重標(biāo)極差分析法(Rescaled Range Analysis,R/S)[12]進(jìn)行序列分析,判斷其分形特征性質(zhì)。
(2)建立時(shí)間序列曲線的迭代函數(shù)系(IFS):根據(jù)公式(4)和(5)分別計(jì)算初始仿射變換參數(shù)ai、ei、ci、fi,和垂直比例因子di,構(gòu)造迭代函數(shù)系(IFS)。
(3)根據(jù)仿射變換系,以時(shí)間序列的第一個(gè)點(diǎn)作為初始迭代點(diǎn),計(jì)算初始吸引子,通過迭代擬合該測(cè)點(diǎn)的最優(yōu)位移時(shí)間序列曲線。
(4)根據(jù)基礎(chǔ)數(shù)據(jù)和位移時(shí)間序列曲線,利用支持向量機(jī)構(gòu)造一個(gè)具有更高擬合精度的SVM擬合曲線。
(5)根據(jù)上述擬合曲線及插值點(diǎn)集,利用支持向量機(jī)算法預(yù)測(cè)最近的一個(gè)特征點(diǎn)值。
(6)利用新的插值點(diǎn)集,重復(fù)(2)~(5)步,構(gòu)造新的位移時(shí)間序列曲線,步驟(4)最后的擬合值至本步驟最后的預(yù)測(cè)值間的位移時(shí)間序列曲線即為預(yù)測(cè)曲線。
(7)如此反復(fù),直至計(jì)算出所有預(yù)測(cè)數(shù)據(jù)。
以某混凝土重力壩159 m 高程廊道中水平位移實(shí)測(cè)數(shù)據(jù)為例,建立基于分形插值和支持向量機(jī)的混合模型分析大壩變形。該壩159 m高程廊道內(nèi)順河向水平位移觀測(cè)方法為引張線法,在8~35 壩段分別布設(shè)一個(gè)測(cè)點(diǎn),共28 個(gè)測(cè)點(diǎn),引張線兩端點(diǎn)(7 壩段和36 壩段)布置垂線組,以便計(jì)算引張線各測(cè)點(diǎn)的絕對(duì)水平位移。引張線觀測(cè)方法采用自動(dòng)化觀測(cè),以往下游變形為正,往上游變形為負(fù)。本文選取8 號(hào)測(cè)點(diǎn)2006 年1 月至2015年6 月共85 期數(shù)據(jù)進(jìn)行分析。前79 期數(shù)據(jù)建立模型并檢驗(yàn)擬合精度,后6期用來檢驗(yàn)?zāi)P皖A(yù)測(cè)精度。
利用分形檢驗(yàn)指標(biāo)計(jì)算8號(hào)測(cè)點(diǎn)水平位移時(shí)間序列偏度和峰度,結(jié)果表明:該測(cè)點(diǎn)時(shí)間序列偏度為-0.519,說明其時(shí)間序列數(shù)據(jù)分布有左側(cè)長(zhǎng)尾;該測(cè)點(diǎn)時(shí)間序列峰度為0.278,說明觀測(cè)點(diǎn)水平位移時(shí)間序列的整體分布比正態(tài)分布高??傮w來看,該測(cè)點(diǎn)表現(xiàn)為“胖尾”狀的非正態(tài)分布,測(cè)點(diǎn)位移時(shí)間序列具有自相似性、可相加性以及非連續(xù)性等分形特征。
運(yùn)用重標(biāo)極差分析法(Rescaled Range Analysis,R/S)[17]計(jì)算8 號(hào)測(cè)點(diǎn)的Hurst指數(shù)為0.625,大于0.5 的評(píng)判標(biāo)準(zhǔn)。擬合相關(guān)系數(shù)為0.973,擬合相關(guān)系數(shù)大于0.9 的評(píng)判標(biāo)準(zhǔn),說明監(jiān)測(cè)點(diǎn)未來的位移變化趨勢(shì)與過去的位移變化趨勢(shì)一致,存在正的長(zhǎng)程相關(guān)性。即在上一段時(shí)間內(nèi),由于荷載變化(如水位、溫度等發(fā)生變化)引起大壩向上游(或下游)移動(dòng),在下一個(gè)段時(shí)間內(nèi)相同效應(yīng)變化則會(huì)導(dǎo)致大壩向相同方向移動(dòng)。
綜合分析表明:8號(hào)測(cè)點(diǎn)水平位移時(shí)間序列具有分形特征,可以利用分形插值方法對(duì)其進(jìn)行分析。
基于MATLAB R2014a 和LIBSVM 軟件平臺(tái)編寫分形插值與支持向量機(jī)混合模型,在各自階段的參數(shù)尋優(yōu)和曲線擬合的基礎(chǔ)上,經(jīng)過多次迭代,得到最佳擬合曲線。
圖1 為8 號(hào)測(cè)點(diǎn)分形插值擬合圖,圖2 為8 號(hào)測(cè)點(diǎn)基于支持向量機(jī)和分形插值的混合模型擬合圖。觀測(cè)數(shù)據(jù)表明:大壩在水位、溫度和時(shí)效因素的多重影響下,呈現(xiàn)明顯的周期變化,上述兩種擬合方法都明顯反映了這種變化規(guī)律。但基于支持向量機(jī)和分形插值的混合模型擬合精度更高。
圖1 8號(hào)測(cè)點(diǎn)分形插值擬合圖Fig.1 No 8 fractal interpolation Model fit curve
圖2 8號(hào)測(cè)點(diǎn)混合模型擬合圖Fig.2 No 8 Hybrid Model fit curve
為了進(jìn)一步比較模型的精度,引入均方根誤差RMSE進(jìn)行評(píng)判。
均方根誤差公式為:
式中:yi為實(shí)測(cè)值模型計(jì)算值;n為數(shù)據(jù)序列數(shù)。
計(jì)算表明:分形插值模型的RMSE為0.94,分形插值與支持向量機(jī)混合模型的RMSE為0.90。
綜合分析可知,在進(jìn)行分形插值擬合后,運(yùn)用支持向量機(jī)對(duì)數(shù)據(jù)進(jìn)行優(yōu)化,在各測(cè)點(diǎn)水平位移時(shí)間序列擬合中可以取得更好的效果,混合模型的擬合精度比單獨(dú)使用分形插值模型擬合效果更好。
對(duì)2015年的前6個(gè)月測(cè)值進(jìn)行預(yù)測(cè)。8號(hào)測(cè)點(diǎn)預(yù)測(cè)時(shí)間段內(nèi)實(shí)測(cè)值,以及混合模型、分形插值模型和SVM 模型的預(yù)測(cè)值和殘差見表1所示。
表1 8號(hào)測(cè)點(diǎn)預(yù)測(cè)時(shí)間段內(nèi)的實(shí)測(cè)值、預(yù)測(cè)值和殘差表 mmTab.1 observation,predictive values and residual error of No.8
由表1可知,在進(jìn)行分形插值預(yù)測(cè)時(shí),預(yù)測(cè)點(diǎn)距離已知序列越遠(yuǎn),預(yù)測(cè)誤差會(huì)越大,說明其外延預(yù)測(cè)范圍有限。這三種模型中混合模型預(yù)測(cè)精度最高。2015 年5 月15 日的預(yù)測(cè)值不太理想,通過實(shí)測(cè)數(shù)據(jù)規(guī)律分析,該期數(shù)據(jù)很可能有粗差的影響。
為了進(jìn)一步分析分形插值與支持向量機(jī)混合模型外延預(yù)測(cè)效果,分別計(jì)算出混合模型、分形插值模型、支持向量機(jī)模型的殘差均方根RMSE分別為0.72、2.04、0.93。
計(jì)算結(jié)果可知,在進(jìn)行位移時(shí)間序列預(yù)測(cè)時(shí),分形插值與支持向量機(jī)混合模型的預(yù)測(cè)精度要高于單一模型,混合模型在工程實(shí)例中得到了較成功的應(yīng)用。
針對(duì)利用分形插值理論建立大壩位移時(shí)間序列模型過程中,預(yù)測(cè)效率較低、預(yù)測(cè)序列越長(zhǎng)精度越差等缺點(diǎn),提出了應(yīng)用支持向量機(jī)算法對(duì)分形插值模型進(jìn)行優(yōu)化。結(jié)合大壩變形時(shí)間序列特點(diǎn),通過垂直比例因子和核函數(shù)的選擇,建立了基于分形插值與支持向量機(jī)大壩變形混合模型。
結(jié)合工程實(shí)例采用分形插值與支持向量機(jī)混合模型對(duì)某大壩水平位移進(jìn)行了擬合和預(yù)測(cè)分析,結(jié)果表明:利用支持向量機(jī)優(yōu)化的分形插值模型擬合精度高于分形插值模型;混合模型預(yù)測(cè)精度也高于分形插值模型和支持向量機(jī)模型。分形插值與支持向量機(jī)混合模型在大壩變形分析研究中取得較好的效果。