梁中華
(遼寧省大連水文局,遼寧 大連 116023)
水旱災害防御及水資源管理和調配需要中長期水文預測進行決策支撐[1]。國內許多水文學者通過采樣灰色模糊、小波周期等方法對中長期水文預測進行了大量研究[2- 6]。近些年來,經(jīng)驗集合模型分解EEMD模型由于可將徑流序列從非線性、非平穩(wěn)的特點中進行逐步分解,可以較好的對徑流序列的不同時間尺度的變化特征及周期演變較為真實的反映出來,在國內許多水庫中長期水文預測中得到具體應用[7- 14]。但傳統(tǒng)EEMD模型在樣本插值尤其是端點極值很難得到確定,存在明顯的端點效應局限,為此有學者針對傳統(tǒng)EEMD模型的局限,采用三次樣條插值方法對其端點極值進行改進[15],并在水文站年徑流預測中進行適用性分析,分析表明改進后的EEMD模型在研究水文站年徑流預測中相比于傳統(tǒng)模型誤差具有較為明顯的改善。英那河水庫為大連地區(qū)大型水庫,水庫多年徑流量均值為3.34億m3,水庫為多年調節(jié)水庫,主要為大連市城市生活和工業(yè)生產(chǎn)供水,是大連地區(qū)重要水源。為提高英那河水庫水量調配調度計劃的制定,需對其年徑流量進行中長期預測,其預測精度直接影響水庫水量調度的科學性和精準性,為此本文采用改進的EEMD模型,以英那河水庫為實例,探討改進前后模型對水庫年徑流預測的適用性,研究成果對于水庫中長期水文預測具有重要的參考價值。
經(jīng)驗集合模態(tài)分解方法可以將非平穩(wěn)的年徑流序列尤其是水庫來水徑流序列進行不同尺度的逐級分解,分解過程在加入新的徑流序列后可進行自適應調節(jié)。模型分解后需要對其端點極值進行確定,以免端點極值誤差較大,影響其變量預測的精度。模型首先對于前后端年徑流序列進行均值計算:
(1)
式中,x0—前端序列值;xn+1—后端序列值。
改進的EEMD模型的計算步驟如下。
步驟1,將高斯白噪聲序列加入到延拓后徑流序列中,新的徑流序列為:
xt(i)=xt+nt(i)
(2)
式中,xt(i)—序列中加入i次高斯白噪聲序列后的徑流序列值。添加次數(shù)一般為50或100次,一般以原始樣本的標準方差為原始序列標準差進行添加次數(shù)的確定。
步驟2,對加入高斯白噪聲序列后的徑流序列值進行逐級分解,得到分解向量IMF(i)和趨勢r(i)。傳統(tǒng)模型采用三次樣條插值方法對年徑流序列的端點值進行包絡線的分析,但這種方式存在端點極值難以確定的局限,為此本文在徑流序列端點值極值采用上下包絡線方式進行極大值和極小值的均值計算,作為其端點極值的中心點,再對其端點極值進行計算,在確定其包絡線均值后對其新徑流序列的低頻序列進行去除,對年徑流序列重復進行上述步驟,直到包絡線的均值趨于0,然后對兩端延拓部分進行截斷,得到原始徑流序列的第一分解向量IMF(1),依次類推,對其i個分向向量進行計算。
步驟3,對步驟1和步驟2進行重復分解,得到其分解向量IMF的均值計算方程:
(3)
式中,ct(i)—分解向量IMF(j)值。這時候原始徑流數(shù)據(jù)序列趨勢項也被分解成IMF(M)向量,其趨勢項計算方程為:
(4)
式中,rt—序列整體趨勢的殘余分量。改進后的模型對年徑流矢量序列進行預測,預測方程為:
(5)
式中,yi(i)—年徑流量后續(xù)預測值;Wj(i)—年徑流序列分解權重值,其計算方程為:
(6)
式中,l—歐式距離。對分解向量IMF和趨勢量進行回歸方程的構建并進行加權計算得到預測的年徑流量,方程為:
(7)
英那河水庫為遼寧省大型水庫,其主要為大連市農業(yè)灌溉及城鄉(xiāng)供水水源,其供水設計能力為0.314億m3。水庫集水區(qū)域面積為692km2,設計總庫容為6053萬m3,多年徑流量均值達到3.34億m3。英那河水庫集水區(qū)域內多年平均降水量均值在800mm左右,部分地區(qū)降水量多年均值可超過1000mm。最枯連續(xù)3個月徑流量占總徑流量的比值在14%左右,7—9月份為英那河水庫徑流最大月份,其連續(xù)最豐3個月的徑流總量占年總徑流量的比值可超過40%。水庫年徑流量變差系數(shù)為0.18,徑流最大與最小比值可達到2.12。
結合英那河水庫1980—2019年年徑流資料,作為徑流樣本數(shù)據(jù)系列,分別采樣改進EEMD模型方法和傳統(tǒng)EEMD模型方法對其分解向量IMF和趨勢量進行計算,結果分別見表1—2。
表1 英那河水庫1980—2019年改進的EEMD模型的年徑流各分解向量年代均值計算結果
表2 英那河水庫1980—2019年傳統(tǒng)EEMD模型的年徑流各分解向量年代均值計算結果
分別采樣改進的EEMD模型方法和傳統(tǒng)EEMD模型方法對英那河水庫1980—2019年的年徑流數(shù)據(jù)進行不同年代尺度的分解。通過不同試錯參數(shù)分析加入到不同年代的年徑流數(shù)據(jù)系列白噪聲標準為原始數(shù)據(jù)標準差的5倍,即高斯白噪聲次數(shù)的為100次,在采用三次樣條插值方法對1980—2019年徑流數(shù)據(jù)系列進行極值計算后,其包絡線不能較好地反映徑流數(shù)據(jù)系列的頻率特征,而采用改進的EEMD模型方法下其端點極值效應有較為明顯的改善,相比于傳統(tǒng)EEMD模型其端點效應在進行端點延拓后有明顯減緩。
在進行模型向量分解時,英那河水庫1980—2019年的年徑流序列可被分解成5個分解向量模態(tài),對各模態(tài)分解向量的頻率特征進行統(tǒng)計,改進前后的EEMD模型5個模態(tài)分解向量的頻率特征統(tǒng)計結果見表3—4。
表3 改進的EEMD模型不同分解模態(tài)頻率特征統(tǒng)計結果
表4 傳統(tǒng)EEMD模型不同分解模態(tài)頻率特征統(tǒng)計結果
從改進前后模型的5個分解模態(tài)向量的頻率特征統(tǒng)計結果可看出,在改進的EEMD模型下英那河水庫年徑流的變動周期分別為4、6、9、13、16年,IMF1在5個分解模態(tài)向量中振動幅度最大,其他4個分解模態(tài)向量振動幅度和頻率均較低。傳統(tǒng)EEMD模型下英那河水庫年徑流的變動周期分別為4、6、15、39、67年,由于水庫建站以來年徑流資料數(shù)據(jù)有限,很難確定其徑流變化周期是否可達到67年。在傳統(tǒng)EEMD模型下IMF1、IMF2、IMF3在5個分解模態(tài)向量中具有較高的振動幅度和頻率,由于改進前后的EEMD模型下的年徑流序列周期有所差異,為此本文采用小波周期分析方法對英那河水庫1980—2019年年徑流周期進行識別,經(jīng)識別其年徑流變化周期為4、7、11、15年,改進模型下的周期與小波周期分析方法下識別的周期較為接近,也表明改進的模型具有較好的周期分析效果。
將改進前后EEMD模型分解的5個分解模態(tài)向量及趨勢項代入最近鄰抽樣回歸模型進行年徑流多元回歸方程的建立,通過試錯方法對其模型2個參數(shù)P=4和K=8進行確定后,以英那河水庫1970—2019年年徑流序列為模型訓練樣本,以2005—2019年為驗證樣本數(shù)據(jù)序列,分別基于改進前后的EEMD模型進行預測,并將預測的年徑流和實測年徑流進行誤差對比,對比結果見表5。
表5 改進前后的EEMD模型的英那河水庫年徑流預測誤差對比結果
改進后的EEMD模型預測的年徑流值和實測年徑流值之間的相對誤差均低于±20%,而傳統(tǒng)EEMD模型預測的年徑流值和實測年徑流值之間的相對誤差均高于±20%,相比于傳統(tǒng)模型,其在英那河水庫年徑流預測誤差平均值從25.7%降低到16.2%,預測精度得到總體提升。從2005—2019年的年徑流序列值可看出,2019年為這一階段的高值,而2015年為低值,改進后的模型相比于改進前分別降低8.55%和8.20%,表明改進后的模型相比于改進前在端點有一定程度的改善。
(1)在采用改進的EEMD模型進行模態(tài)向量分解和確定趨勢項后,建議采用最近鄰抽樣回歸模型來進行其回歸方程的建立,可顯著提高回歸方程的收斂精度,從而提高水庫中長期年徑流預測的精度。
(2)改進的EEMD分解各模態(tài)分解向量下的變化周期,尤其是高階數(shù)分解向量的周期,可能超過年徑流系列樣本的變化周期,因此可采用小波周期分析方法對其模態(tài)分解向量進行修正。
(3)改進的EEMD分解適合于非平穩(wěn)的數(shù)據(jù)系列的預測,對于非線性如人類活動影響較為徑流序列的預測適用性還需要進行深入探討。