張 弘
(遼寧省鐵嶺水文局,遼寧 鐵嶺 112000)
非平穩(wěn)時間序列數據是水文變量數據序列的主要特征,非平穩(wěn)數據系列很難采用傳統(tǒng)的數理統(tǒng)計學方法進行預測[1]。通常對于非平穩(wěn)水文數據系列預測,往往是通過數據處理成平穩(wěn)數據序列后再采用傳統(tǒng)的數理統(tǒng)計學方法進行預測,這種預測的方式在國內應用也較為成熟[2-6]。這其中AR-LSSVM模型由于具有較好的收斂精度,在國內一些區(qū)域河道水位預測中得到應用,應用效果要好于傳統(tǒng)水位預測數量統(tǒng)計學方法,且該模型對數據系列長度要求較低,一般序列長度達到30a即可滿足模型計算要求。但傳統(tǒng)AR-LSSVM模型對于非平穩(wěn)數據序列經常出現(xiàn)無最優(yōu)解的情況,降低了模型收斂計算精度。近些年來,有學者針對傳統(tǒng)AR-LSSVM模型在模型求解存在的局限性,引入正交小波變化函數對傳統(tǒng)模型進行改進,解決傳統(tǒng)模型對非平穩(wěn)數據系列適用性不強的問題,但改進的AR-LSSVM模型在水文變量序列中長期預測中還未得到相關應用。為此本文引入改進的AR-LSSVM模型,對鐵嶺清河開原站水位進行預測,并結合水文站實測水位數據進行精度對比。研究成果對于其他非平穩(wěn)水文序列預測基于重要參考價值。
通過對多個變量進行映射構建多變量擬合方程,其模型擬合方程形式為:
f(x,ω)=ωTφ(x)+b
(1)
式中,ω和Φ(x)—模擬擬合回歸變量參數;b—變量閾值。
模型以擬合度和相對誤差作為擬合方程的線性約束條件進行設置:
(2)
式中,ei—模型誤差計算值,%;γ—非平穩(wěn)數據序列值,m。
模型采用Lagrange函數對非約束化方程進行約束化轉換:
L(ω,b,e,a)=J(ω,e)-
∑ai[ωTφ(x)+b+ei-yi]
(3)
模型求解函數方程為:
(4)
式中,a—模型計算因子。
對各求解函數按照非線性約束條件進行線性化轉換計算:
(5)
式中,Ω—模型計算序列矩陣。
采用最小二乘支持向量機對模型計算序列矩陣進行線性擬合方程計算:
(6)
改進模型采用二進正交小波變化函進行變量重構計算:
X=D1+D2+…+DJ+CJ
(7)
式中,D—不同計算維度空間計算因子,D1={d1,1,d1,2,…},…,DJ={DJ,1,DJ,2,…};CJ={cJ,1,cJ,2,…}—不同空間維度下重構的計算因子。
采用二進小波變化方法對河道水位非平穩(wěn)數據系列進行二次分解計算:
X=G1+G2+…+GN+XN
(8)
式中,G—2個維度變量空間下重構的求解方程,G1={g1,1,g1,2,…},…,GN={g1,N,g2,N,…}。
不同時刻模型預測求解方程為:
Xi=g1,i+g2,i+…+gN,i+XN,i
(9)
在不同時間尺度下的預測值計算基礎上,對不同時間狀態(tài)下的水位進行推求:
XM+K=g1,M+K+g2,M+K+…+gN,M+k+xN,M+K
(10)
此外樣本需要在預測時進行歸一化計算:
(11)
將鐵嶺地區(qū)清河開原水文站近60a實測水位數據作為改進前后AR-LSSVM模型訓練樣本數據,并采用2013—2020年的實測月平均水位和年平均水位用于改進前后水位模擬精度對比。在采用模型進行河道水位預測前,對開原水文站近60a的水位資料分別進行可靠性、一致性、連續(xù)性的檢驗。所有年份水位資料數據均已通過資料檢驗,可用于改進前后AR-LSSVM模型應用。
鐵嶺地區(qū)河流水位存在明顯的季節(jié)變化,考慮到不同月份河流水位變化的差異程度,分別采用改進前后的AR-LSSVM模型對開原站各月平均水位進行預測,并結合實測月平均水位對預測值進行評估,評估結果見表1。
表1 月尺度下改進前后模型水位預測精度對比
對各月份不同模型河道水位預測值和實測值建立相關性分析和過程擬合分析,分析結果如圖1—2所示。
圖1 月平均水位預測值和實測月平均水位回歸方程
圖2 月平均水位預測值和實測月平均水位過程擬合
從月尺度下改進前后模型水位預測精度對比可看出,相比于改進前,改進后的AR-LSSVM模型在各月河道水位預測精度均有明顯改善,從相對誤差指標可看出,改進后開原站各月份河道水位預測相對誤差均在±15%范圍內,而傳統(tǒng)AR-LSSVM模型水位預測相對誤差均要高于改進后的模型水位預測值,相比于改進前,改進后的開原站各月份河道水位預測誤差平均降低11.3%。從各月份改進前后模型河道水位預測誤差絕對值也可看出,相比于改進前,改進后模型預測的各月河道水位絕對誤差均有減少,絕對誤差均值平均降低0.74m,具有明顯改善。這主要因為改進的AR-LSSVM模型引入正交小波變化函數對傳統(tǒng)模型進行改進,提高模型收斂度,收斂度的提高也相應增加了模型求解的精度。
從改進前后模型對開原站月平均水位預測值和實測月平均水位回歸方程可看出,相比于改進前的模型,改進后的模型水位預測和實際水位之間的相關系數提高0.2293。從改進前后AR-LSSVM模型水位預測過程和實際水位變化過程可看出,改進后模型的河道水位過程擬合度相比于改進前有明顯提高。
在月平均水位預測精度對比的基礎上,結合開原站2013—2022年實測水位資料,對比分析改進前后AR-LSSVM模型在年尺度水位預測的精度,對比結果見表2。
表2 年尺度下改進前后模型水位預測精度對比
對年尺度平均水位預測值和實測年平均水位之間的回歸性進行分析,分析結果如圖3所示。
圖3 年平均水位預測值和實測月平均水位過程擬合
從年尺度下改進前后模型水位預測精度對比,其改進前后AR-LSSVM模型在年尺度河道水位預測的精度總體要高于月尺度預測精度,這主要是因為年尺度河道水位預測由于均化影響,使得其預測精度要高于月尺度。相比于改進前,改進后AR-LSSVM模型預測各年份河道水位均化均有明顯改善,各年份河道水位預測相對誤差均值降低14.1%,絕對誤差平均減少1.65m。從年平均水位預測值和實測月平均水位過程擬合可看出,相比于改進前,其相關系數提高0.2983。改進后AR-LSSVM模型相比于改進前模型,其年尺度和月尺度河道水位預測精度均得到明顯改善,改進后的AR-LSSVM模型采用正交小波函數對模型變量進行優(yōu)化組合后,提高了傳統(tǒng)AR-LSSVM模型變量求解的精度,使得其預測精度得到改善。
(1)在采用改進后AR-LSSVM模型進行河道水位預測時,可采用最小二乘方法對其樣本數據序列矩陣進行優(yōu)化計算,可提高模型非平穩(wěn)數據序列擬合方程的回歸系數,從而提高模型收斂求解精度。
(2)為有效剔除河道水位樣本數據系列中的奇異值,可采用標準化處理的方法對河道水位樣本數據系列進行預處理,從而一定程度降低河道水位樣本數據序列的非平穩(wěn)性。
(3)改進后AR-LSSVM模型對于日水位預測的適用性還需進一步探討,此外對于中小型河流水位預測精度還需要深入分析。