馬盼盼,白 濤,武連洲,黃 強(qiáng)
(西安理工大學(xué) 西北旱區(qū)生態(tài)水利工程國家重點(diǎn)實(shí)驗(yàn)室培育基地,陜西 西安710048)
隨著氣候變化和人類活動(dòng)等影響的深入,水文過程變化愈加復(fù)雜[1-2]。徑流預(yù)測(cè)對(duì)分析流域洪水和干旱致災(zāi)過程,以及水資源合理開發(fā)與水庫的安全、經(jīng)濟(jì)運(yùn)行等具有重要的指導(dǎo)意義。國內(nèi)外徑流預(yù)測(cè)方法眾多,大致可分為傳統(tǒng)方法和現(xiàn)代方法兩類。傳統(tǒng)方法如成因分析法[3]和水文統(tǒng)計(jì)法[4]等,主要是根據(jù)徑流變化特性來開展研究;現(xiàn)代方法則是隨著計(jì)算機(jī)技術(shù)的發(fā)展而新拓展的[5],目前應(yīng)用廣泛的現(xiàn)代方法有人工神經(jīng)網(wǎng)絡(luò)、模糊推理、支持向量機(jī)、小波變換等[6-13],這些方法在徑流預(yù)測(cè)中雖效果較好,但存在一些問題,如人工神經(jīng)網(wǎng)絡(luò)不能較好地處理和描述徑流隨機(jī)變化的模糊信息;模糊推理不能自動(dòng)地將歷史長系列資料中總結(jié)的經(jīng)驗(yàn)轉(zhuǎn)化為推理規(guī)則庫,缺乏有效的方法來改進(jìn)隸屬函數(shù)以提高預(yù)測(cè)精度[14]。
自適應(yīng)神經(jīng)模糊推理系統(tǒng)(adaptive network-based fuzzy inference system,ANFIS)是在神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,增加模糊推理系統(tǒng)的模糊規(guī)則,將水文要素的不確定性通過模糊推理進(jìn)行詮釋,再通過神經(jīng)網(wǎng)絡(luò)進(jìn)行模擬、預(yù)測(cè)。ANFIS在預(yù)測(cè)方面的發(fā)展正逐步推進(jìn),并顯示了很強(qiáng)的優(yōu)越性。有關(guān)ANFIS在水文領(lǐng)域的應(yīng)用,國外開始較早且發(fā)展較快,ANFIS在徑流預(yù)測(cè)[15-16]、蒸發(fā)估計(jì)[17]、河段洪峰量[18]估算等方面均取得較好的成果,且ANFIS與其他算法或模型結(jié)合應(yīng)用也具有巨大的發(fā)展空間[19-20]。國內(nèi)ANFIS的應(yīng)用相對(duì)緩慢,近年來ANFIS開始用于水質(zhì)、水位、洪水及徑流量預(yù)測(cè)[21-26];林劍藝等[27]、馬細(xì)霞等[28-30]、路劍飛等[31]分別從ANFIS參數(shù)分析、優(yōu)越性比較及ANFIS與其他算法或模型結(jié)合等方面進(jìn)行了研究,但ANFIS在河川徑流預(yù)測(cè)方面的應(yīng)用,仍待進(jìn)一步拓展。
本研究選取黃河源區(qū)出口水文站軍功站為研究對(duì)象,建立ANFIS徑流預(yù)測(cè)模型,旨在深入、系統(tǒng)地分析ANFIS模型結(jié)構(gòu)及輸入輸出參數(shù)對(duì)預(yù)測(cè)結(jié)果的影響,為揭示黃河上游河川徑流規(guī)律、水庫群優(yōu)化調(diào)度和水資源優(yōu)化配置提供參考依據(jù)。
ANFIS由Jang[32]于1993年首次提出,是人工神經(jīng)網(wǎng)絡(luò)與模糊推理系統(tǒng)的結(jié)合,其通過神經(jīng)網(wǎng)絡(luò)自身的訓(xùn)練和學(xué)習(xí),在初始建立模糊規(guī)則的基礎(chǔ)上多次重復(fù),自動(dòng)調(diào)整變量、隸屬函數(shù)和圖形參數(shù),使之適應(yīng)FIS對(duì)應(yīng)的輸入、輸出關(guān)系,完成網(wǎng)絡(luò)系統(tǒng)參數(shù)的最佳設(shè)置。本研究采用Sugeno型模糊推理方法進(jìn)行模糊推理,使用IF-THEN規(guī)則描述模糊信息,輸出模糊值后,將其轉(zhuǎn)化為精確量。
若一階Sugeno模糊模型的ANFIS結(jié)構(gòu)有2個(gè)輸入,設(shè)其各輸入變量具有2條模糊規(guī)則,則對(duì)一階Sugeno模糊系統(tǒng),模糊規(guī)則表示如下:
rule 1:若x=A1,y=B1,則f1=p1x+q1y+r1;
rule 2:若x=A2,y=B2,則f2=p2x+q2y+r2。
式中:x、y分別為2個(gè)輸入變量;Ai、Bi(i=1,2)為x、y的模糊集合,與輸入層相對(duì)應(yīng)的隸屬度函數(shù)有關(guān);pi、qi、ri(i=1,2)為一階Sugeno模糊模型的結(jié)論參數(shù),在結(jié)論推出層產(chǎn)生;fi(i=1,2)為結(jié)論參數(shù)的線性組合形式,用來表示模糊規(guī)則。
采用神經(jīng)網(wǎng)絡(luò)+Sugeno型模糊推理的算法建立徑流預(yù)測(cè)ANFIS模型。通常,ANFIS模型結(jié)構(gòu)包括5層,即輸入層、規(guī)則層、歸一化層、結(jié)論推出層和輸出層,其結(jié)構(gòu)層次如圖1所示。
第一層:輸入層,將采集的實(shí)際樣本作為輸入,經(jīng)模糊化處理后,輸出對(duì)應(yīng)模糊集的隸屬度。有:
(1)
(2)
(3)
(4)
式中:aAi、bAi、cAi(其中i=1,2)和aBi、bBj、cBj(其中j=1,2)均為前提參數(shù)。
第二層:規(guī)則層。開展模糊規(guī)則運(yùn)算,計(jì)算每條規(guī)則的適用度。計(jì)算公式為:
(5)
第三層:歸一化層。對(duì)第二層的輸出結(jié)果進(jìn)行歸一化處理。如第i條規(guī)則的歸一化適用度為:
(6)
第四層:結(jié)論推出層。計(jì)算各自適應(yīng)節(jié)點(diǎn)輸出值。計(jì)算公式為:
(7)
第五層:去模糊化計(jì)算層。計(jì)算模糊系統(tǒng)的總輸出,即所有規(guī)則的輸出之和,用O2表示為:
(8)
ANFIS模型的計(jì)算流程見圖2。
圖1 ANFIS模型的結(jié)構(gòu)層次Fig.1 Structure of ANFIS model
圖2 ANFIS模型的計(jì)算流程Fig.2 Flow chart of ANFIS model
杜富慧等[33]在基于ANFIS的黃河靈口流域水文預(yù)報(bào)模型研究中,選定模型輸入變量為平均降雨強(qiáng)度、雨強(qiáng)距離指數(shù)和植被指數(shù);Badrzadeh等[34]在應(yīng)用ANFIS進(jìn)行洪水預(yù)測(cè)時(shí),以降雨徑流資料為輸入,預(yù)測(cè)效果較好。本研究區(qū)域地面徑流主要來源于降雨,因此以日尺度徑流資料為模型輸入,日徑流量為輸出變量,進(jìn)行黃河上游徑流預(yù)測(cè)研究。
ANFIS模型求解過程即為模型參數(shù)的率定過程。ANFIS參數(shù)包括確定參數(shù)和待定參數(shù), Jang[32]首次提出用混合學(xué)習(xí)算法全局搜尋系統(tǒng)最優(yōu)參數(shù),對(duì)確定參數(shù)通過梯度下降法返回誤差值,繼而依據(jù)誤差大小改變隸屬度函數(shù)圖形參數(shù),更新參數(shù)值,依次反復(fù)最終確定前提參數(shù),最后由最小二乘法求解確定結(jié)論參數(shù)[35];對(duì)待定參數(shù)的率定,首先由用戶基于經(jīng)驗(yàn)設(shè)定初值,后改變參數(shù)值,比較不同參數(shù)值對(duì)應(yīng)的模型預(yù)測(cè)精度,依據(jù)預(yù)測(cè)精度要求修正參數(shù)值,直到模型參數(shù)達(dá)到最優(yōu),確定預(yù)見期為1 d的徑流預(yù)測(cè)模型的各待定參數(shù),然后再延長模型預(yù)見期,計(jì)算預(yù)測(cè)結(jié)果的誤差,分析不同預(yù)見期下模型運(yùn)行的合理性,并通過誤差分析與合理性分析確定徑流預(yù)測(cè)的最長預(yù)見期。
ANFIS模型的徑流預(yù)測(cè)過程如圖3所示。
圖3 基于ANFIS模型的徑流預(yù)測(cè)流程Fig.3 Runoff forecasting flowchart base on ANFIS model
選取前3時(shí)段的徑流資料,即以t-3、t-2、t-1時(shí)段實(shí)測(cè)徑流為ANFIS模型的輸入變量;初步選定訓(xùn)練次數(shù)為50次;輸入變量的隸屬函數(shù)選擇三角形隸屬函數(shù)、鐘形隸屬函數(shù)和高斯隸屬函數(shù),其數(shù)目分別初步選定為2,3,4條。基于各個(gè)待定參數(shù)的不同選擇,初步擬定9個(gè)預(yù)測(cè)方案,其參數(shù)設(shè)定見表1。
表1 基于各個(gè)待定參數(shù)的預(yù)測(cè)方案集Table 1 Solution sets of runoff prediction based on parameters to be determined
軍功水文站位于黃河上游青海省瑪沁縣,1977年8月建站,是黃河源區(qū)國家一級(jí)水文站,距離河口4 057 km,是龍羊峽等水庫入庫徑流控制站,集水面積達(dá)98 414 km2。該站以上區(qū)域徑流量占黃河總徑流量的13.5%,是黃河流域徑流的重要組成部分,對(duì)龍羊峽以上水庫群調(diào)度和水資源配置具有重要的作用。軍功水文站實(shí)測(cè)數(shù)據(jù)系列長,資料可靠。本研究以軍功水文站為研究對(duì)象,采用黃河水利委員會(huì)相關(guān)部門提供的2010-2015年共計(jì)2 191個(gè)時(shí)段的日尺度實(shí)測(cè)數(shù)據(jù),經(jīng)三性審查可作為基本資料進(jìn)行ANFIS模型的預(yù)報(bào)研究。
選定各階段樣本資料,并確定訓(xùn)練集、驗(yàn)證集、測(cè)試集的數(shù)據(jù)比例為4∶1∶1,以選定的各階段樣本實(shí)測(cè)資料為依據(jù)求解ANFIS模型,獲得各方案計(jì)算結(jié)果。鑒于篇幅所限,本研究僅列出各方案測(cè)試階段的計(jì)算結(jié)果。繪制各方案測(cè)試階段預(yù)測(cè)徑流值與實(shí)測(cè)徑流值的對(duì)比結(jié)果如圖4所示,并選定均方根誤差RMSE、相關(guān)性系數(shù)R2個(gè)指標(biāo),對(duì)比分析各方案預(yù)測(cè)結(jié)果的差異性,并采用RMSE和R及平均絕對(duì)誤差(MAE)、擬合度系數(shù)(CE)等4個(gè)指標(biāo)分析最終預(yù)測(cè)結(jié)果的精度。各指標(biāo)的計(jì)算公式如下:
(1)均方根誤差(RMSE)。
(9)
(2)相關(guān)系數(shù)(R)。
(10)
(3)平均絕對(duì)誤差(MAE)。
(11)
(4)擬合度系數(shù)(CE)。
(12)
9種預(yù)測(cè)方案預(yù)測(cè)結(jié)果的RMSE與R見圖4。圖4表明,基于ANFIS模型得到的各徑流預(yù)測(cè)方案的預(yù)測(cè)值與實(shí)測(cè)值之間無明顯差異;進(jìn)一步比較各方案的RMSE和R2個(gè)指標(biāo)值,選定其最優(yōu)值為:RMSE=6.31,R=0.999 8。綜合預(yù)測(cè)值與實(shí)測(cè)值擬合圖以及2個(gè)指標(biāo)值,選定最優(yōu)方案為方案6,即訓(xùn)練次數(shù)為50次、每個(gè)輸入變量有4條鐘形隸屬函數(shù)、預(yù)測(cè)未來1 d的方案為徑流預(yù)測(cè)的最佳方案。
敏感性分析是通過逐一改變相關(guān)變量數(shù)值的方法來解釋關(guān)鍵指標(biāo)受某些因素變動(dòng)影響的規(guī)律。本研究的敏感性分析,是通過改變相關(guān)參數(shù)來揭示ANFIS徑流預(yù)測(cè)模型受各系統(tǒng)參數(shù)變動(dòng)影響的大小。在上述選定的最優(yōu)方案的基礎(chǔ)上,分析ANFIS模型參數(shù)變化對(duì)預(yù)測(cè)精度的影響。
3.2.1 輸入變量 目前,ANFIS模型輸入變量的選擇尚無具體標(biāo)準(zhǔn)。總結(jié)以往經(jīng)驗(yàn),本研究在已選定的最優(yōu)方案基礎(chǔ)上,分別以滯時(shí)τ=3,2,1 d,即t-3、t-2、t-1時(shí)段,t-2、t-1時(shí)段及t-1時(shí)段的徑流量為徑流預(yù)測(cè)模型的輸入,以預(yù)見期為1 d的徑流量為模型輸出。實(shí)測(cè)徑流與模型預(yù)測(cè)徑流值的擬合結(jié)果見圖5。
圖4 黃河上游軍功水文站預(yù)測(cè)徑流與實(shí)測(cè)徑流的對(duì)比Fig.4 Comparison of predicted and measured runoffs in Jungong station
圖5 不同輸入變量時(shí)預(yù)測(cè)1 d徑流量與實(shí)測(cè)徑流量的對(duì)比Fig.5 Comparison of 1-day predicted runoff and measured runoff with different input variables
基于模型預(yù)測(cè)時(shí)效性的考慮,分析圖5不同輸入變量時(shí)模型預(yù)測(cè)值與實(shí)測(cè)值的擬合結(jié)果及RMSE、R2個(gè)指標(biāo)值,選定最優(yōu)輸入為:滯時(shí)為2 d,即t-2、t-1時(shí)段的徑流量,其RMSE=3.14,R=0.999 95。
3.2.2 訓(xùn)練次數(shù) 采用滯時(shí)為2 d的徑流資料為模型輸入,每個(gè)輸入變量選用4條鐘形隸屬函數(shù),以預(yù)見期為1 d的徑流量為輸出,分析訓(xùn)練階段訓(xùn)練次數(shù)與ANFIS訓(xùn)練結(jié)果的均方誤差的關(guān)系,結(jié)果見圖6。圖6顯示,隨訓(xùn)練次數(shù)增加,均方根誤差逐漸減小,約訓(xùn)練50次后均方根誤差的變化開始趨于平穩(wěn),且在訓(xùn)練約100次時(shí),均方根誤差達(dá)最?。浑S著訓(xùn)練次數(shù)的增大,模型計(jì)算效率降低。
3.2.3 隸屬度函數(shù) 隸屬度函數(shù)的分析包括隸屬度函數(shù)的數(shù)目和隸屬度函數(shù)的類型。假定隸屬度函數(shù)為鐘形隸屬度函數(shù),訓(xùn)練次數(shù)為100次,隸屬度函數(shù)數(shù)目分別取2~7條,分別確定模型預(yù)測(cè)精度,并確定最優(yōu)隸屬度函數(shù)數(shù)目。然后選定最優(yōu)隸屬函數(shù)數(shù)目,以此為基礎(chǔ),選用常用隸屬函數(shù)類型,即鐘形隸屬函數(shù)、三角形隸屬函數(shù)、高斯隸屬函數(shù)和雙邊高斯型隸屬函數(shù)進(jìn)行比較分析,確定最優(yōu)隸屬函數(shù)類型。圖7顯示了不同隸屬函數(shù)數(shù)目對(duì)應(yīng)預(yù)測(cè)值的均方根誤差及其徑流預(yù)測(cè)值。
圖6 訓(xùn)練次數(shù)與均方根誤差的關(guān)系Fig.6 Relationship between training time and mean square error
由圖7可知,隨隸屬度函數(shù)數(shù)目增多,徑流預(yù)測(cè)值的RMSE逐漸減小,在輸入變量的隸屬函數(shù)數(shù)目為4后,RMSE基本趨于穩(wěn)定;隨著訓(xùn)練次數(shù)增大,預(yù)測(cè)值RMSE稍有減小,但模型的計(jì)算速率顯著降低。由此選定的最優(yōu)隸屬函數(shù)中,每個(gè)輸入變量有4個(gè)鐘形、三角形、高斯及雙邊高斯隸屬函數(shù)。
訓(xùn)練前后隸屬函數(shù)圖像的變化體現(xiàn)了模型訓(xùn)練前后原有徑流信息的改變。在圖8中,x1、x2分別表示2個(gè)輸入變量,即t-2、t-1的徑流量,訓(xùn)練前后各輸入變量隸屬度函數(shù)的變化顯而易見。
圖8 訓(xùn)練前后各隸屬函數(shù)圖像的變化Fig.8 Changes of membership function images before and after training
圖8表明,區(qū)別于其他類型的隸屬度函數(shù),三角形隸屬度函數(shù)圖像在訓(xùn)練前后差異很小,保留的原有數(shù)據(jù)信息更符合實(shí)際情況,因此選定三角形隸屬函數(shù)為最優(yōu)隸屬函數(shù)類型。
綜合上述參數(shù)敏感性分析結(jié)果,本研究選定的基于最優(yōu)參數(shù)的ANFIS徑流預(yù)測(cè)模型為:以滯時(shí)為2 d的徑流量為輸入變量,訓(xùn)練100次,每個(gè)輸入變量取4條三角形隸屬度函數(shù),輸出變量為預(yù)見期為1 d的徑流量。
基于確定的最佳方案,通過ANFIS模型的參數(shù)敏感性分析確定基于最優(yōu)參數(shù)的徑流短期預(yù)測(cè)ANFIS模型。其中,預(yù)見期為1 d時(shí),模型預(yù)測(cè)精度見表2。
表2 基于ANFIS模型預(yù)見期為1 d時(shí)的短期徑流預(yù)測(cè)結(jié)果Table 2 Prediction short-term runoff in 1-day forecast period base on ANFIS model
由表2可知,預(yù)見期(ε)為1 d時(shí),本研究建立的徑流短期預(yù)測(cè)ANFIS模型的預(yù)測(cè)合格率達(dá)100%,預(yù)測(cè)精度較高。基于此,延長預(yù)見期至ε=2,3,4和5 d,進(jìn)一步確定ANFIS的合理預(yù)測(cè)范圍,結(jié)果見表3。
表3 延長預(yù)見期后ANFIS模型短期徑流的預(yù)測(cè)結(jié)果Table 3 Prediction of shirt-tem runoff in different foreseeable periods base on ANFIS model
表3表明,在合理的預(yù)見期內(nèi),ANFIS徑流預(yù)測(cè)模型的預(yù)測(cè)效果好且精確度高;隨著預(yù)見期延長,實(shí)測(cè)徑流與預(yù)測(cè)徑流擬合度趨低,預(yù)測(cè)誤差顯著增大。當(dāng)預(yù)見期延長至5 d時(shí),根據(jù)《水文情報(bào)預(yù)報(bào)規(guī)范(GB/T 22482-2008)》的規(guī)定,預(yù)測(cè)徑流與實(shí)測(cè)徑流的相對(duì)誤差已超過20%的精度要求。因此,預(yù)見期不要超過4 d,否則預(yù)測(cè)精度不能滿足規(guī)定要求。
1)以黃河源區(qū)的軍功水文站為研究對(duì)象,建立了短期徑流預(yù)測(cè)ANFIS模型,基于模型參數(shù)設(shè)定了9個(gè)預(yù)測(cè)方案;采用實(shí)測(cè)徑流與預(yù)測(cè)徑流對(duì)比及評(píng)價(jià)指標(biāo)(RMSE、R)進(jìn)行分析比較,最終選擇訓(xùn)練次數(shù)為50次、每個(gè)輸入變量有4條鐘形隸屬函數(shù)、預(yù)測(cè)未來1 d的方案6為徑流預(yù)測(cè)的最佳方案。
2)對(duì)ANFIS徑流預(yù)測(cè)模型的輸入、訓(xùn)練次數(shù)、隸屬度函數(shù)個(gè)數(shù)和類型等參數(shù)進(jìn)行敏感性分析,獲得了最優(yōu)參數(shù)組合的ANFIS徑流預(yù)測(cè)模型,其預(yù)測(cè)結(jié)果全部合格且精度較高;延長短期徑流預(yù)測(cè)的預(yù)見期至4 d,預(yù)測(cè)結(jié)果仍能滿足精度要求,說明ANFIS模型具有較好的適用性,可為黃河源區(qū)徑流規(guī)律演變、水庫群規(guī)劃施工調(diào)度和全流域水資源配置提供重要參考。
3)河川徑流影響因素眾多,下一步將繼續(xù)開展ANFIS模型結(jié)構(gòu)以及人類活動(dòng)、降雨、氣溫等因素對(duì)黃河源區(qū)徑流演變的影響研究。