王文梅,孫蓉琳,高 巖
(1.中國地質大學 環(huán)境學院,武漢 430074;2.貴州大學資源與環(huán)境工程學院,貴陽 550003)
在巖溶地區(qū),特別是巖溶管道、裂隙、溶洞發(fā)育地帶,各種巖溶地貌導致地表地下分水嶺不重合,流域劃分難,流域出口斷面總徑流量來源的匯水面積、匯水量不確定。徑流預報最早采用回歸、時間序列分析方法[1-3],此類方法過于簡單,達不到洪水預報精度;之后又發(fā)展了適用于濕潤地區(qū)的新安江模型、陜北模型[4-5],如今已經很成熟,但對于復雜的巖溶地區(qū),其參數(shù)確定困難,預報精度差;為提高徑流預報的精度,避免下墊面各種不確定地質、地貌因素影響,人工神經網絡預報徑流已經成了一種可能。
人工神經網絡[6](Artificial Neural Network,ANN)是一個可自動提取一組預報變量和另一組自變量之間非線性關系的數(shù)據(jù)處理系統(tǒng),該網絡的建立過程稱為人工神經網絡的訓練過程,通過自適應算法遞歸迭代求解因變量與自變量之間的非線性關系。BP(Back Propagation)網絡是人工神經網絡中最普遍、最有效、最活躍的網絡結構,可以模擬非線性問題。在國內外已有很多研究者運用人工神經網絡進行洪水、徑流、水位等預報。
BP神經網絡有以下缺點[7]:①具有學習收斂速度緩慢;②不能保證收斂到全局最小點;③網絡的學習記憶具有不穩(wěn)定性;④網絡隱含層數(shù)及隱含層單元數(shù)的選取尚無統(tǒng)一的理論指導。鑒于BP網絡的這些缺點,目前有通過尋找最優(yōu)的輸入層影響因子[8-11],建立不同水期預報模型[12-14],其目的是為了優(yōu)化BP網絡的輸入層因子,但未能克服BP自身缺陷;運用遺傳算法、最小二乘法等調整輸入層神經元數(shù)和權重值[15-17]進行模型優(yōu)化。以上模型可以避免新安江模型、陜北模型中不確定參數(shù)的獲取,但從根本上說都沒有克服BP網絡根據(jù)全局誤差修改網絡權重,使得較大和較小的輸出層誤差偏大,預報精度不高。
基于BP根據(jù)全局誤差修改網絡權重缺點和徑流預報中對大洪水和小洪水預報精度不高的問題,本文采用SPASS軟件,進行快速聚類、多元回歸分析,消除原始信息中相關性大又對模型解釋能力小的信息,調整BP初始權值;采用對數(shù)處理方法對逐日降雨量進行對數(shù)處理,克服BP根據(jù)全局誤差修改網絡權重的缺陷。最后以巖溶地區(qū)徑流量預報為例進行可行性驗證。
BP網絡[18]是一種根據(jù)誤差,反向傳遞修正隱層間權值從而達到訓練精度要求的多層網絡,它由輸入層、隱層、輸出層構成,每一層之間通過權值因子連接。基本的工作原理是:根據(jù)輸入層、權值因子輸出下一層,輸出層又將作為下一層的輸入層,以此逐步連接到輸出層;通過BP輸出層與期望的輸出層的誤差再反向調整各層的權重,直到達到允許誤差范圍或超過訓練次數(shù)結束訓練。BP網絡的優(yōu)點在于它不需要知道中間的演變過程,直接是個黑箱模型,通過輸入得輸出。在實際的復雜問題上,也可以人為地根據(jù)重要因素的先驗概率調整其在輸入層中權值,從而使得模型具有現(xiàn)實性。
BP網絡神經元(不同層的輸入因子與輸出因子)之間的傳遞函數(shù)常用有:Hardlim,purelin,singmoid函數(shù),各自的特點為對數(shù)據(jù)的處理方式不同[19]。圖1是一個經典的常用3層BP網絡結構,其中輸入節(jié)點為R,表示R維輸入,隱層節(jié)點數(shù)為N,隱層傳遞函數(shù)采用Sigmoid,輸出節(jié)點數(shù)為S,表示S維輸出,輸出層傳遞函數(shù)采用purelin函數(shù)。XR表示第R個輸入層因子,aN表示第N個隱層因子,YS表示第S個輸出層因子,WNR表示第R輸入層因子與第N個隱層因子之間的連接權值。
圖1 BP神經網絡結構圖Fig.1 Structure of BP neural network
BP神經網絡的基本核心是BP算法,由正向傳播和反向傳播組成。楊桂芳[20]等人于2000年在巖溶水庫滲透研究中提出正向傳播和反向傳播過程的公式及各層相關關系表達式。在BP算法中,用于對求和單元進行函數(shù)運算的激勵函數(shù)f常用singmoid函數(shù),該函數(shù)分為對數(shù)Sigmoid函數(shù)(Logsig)和正切Sigmoid函數(shù)(Tansig)。本文采用Logsig函數(shù),其形式為
根據(jù)Logsig函數(shù)的特點,其輸入層一般需要將原始數(shù)據(jù)進行歸一化才能作為BP網絡的輸入值,其原因在于把不同量綱的建模原始數(shù)據(jù)量綱化以減小不同的數(shù)值差異。一般將數(shù)據(jù)歸一化到[0,1]之間,對于有限的訓練和驗證樣本資料而言,不能完全包括所有特性的徑流預報,為了使模型對超出訓練、樣本和驗證樣本以外的預報數(shù)據(jù)仍能夠歸一化到[0,1]之間,使模型適用性更強,本文將建模數(shù)據(jù)(流域的日降水量、平均日蒸發(fā)量、前期流量、出口斷面流量)歸一化到0.2~0.8之間。歸一化的公式為:
式中:xmax為原始數(shù)據(jù)中最大值;xmin為原始數(shù)據(jù)中最小值;c為常數(shù);xi為原始數(shù)據(jù)中第i個數(shù)據(jù);yi為歸一化后第i個數(shù)據(jù);i的取值由樣本量決定。
洪水預報的誤差指標采用以下3種:絕對誤差、相對誤差、確定性系數(shù)DC[21]。洪水預報過程與實測過程之間的吻合程度可用確定性系數(shù)作為指標,按下式計算:
式中:DC為確定性系數(shù)(取兩位小數(shù));yc為預報值(m3/s);y0為實測值(m3/s);y0為實測值的平均值(m3/s);n為資料系列長度。DC在0~1之間,越大表示吻合程度越好,如果DC算出負值表示誤差太大,計算時選用的方法不合理。
當一次預報的誤差小于許可誤差時,稱為合格預報[21]。降雨徑流預報[21]以實測洪峰流量的20%作為許可誤差。峰現(xiàn)時間[21]以預報根據(jù)時間至實測洪峰出現(xiàn)時間之間時距的30%作為許可誤差,當許可誤差小于3 h或一個計算時段長,則以3 h或一個計算時段長作為許可誤差。合格預報次數(shù)與預報總次數(shù)之比的百分數(shù)為合格率[21],其公式為
式中:QR為合格率(取1位小數(shù));n為合格預報次數(shù);m為預報總次數(shù)。
烏江屬于長江流域,六沖河位于烏江上游西南方向貴州畢節(jié)赫章縣,六沖河七星關站屬于基本水文站,控制的流域面積為2 970km2。七星關站是貴州典型的巖溶代表站,上游還有2個雨量站,分別為水營站和六曲溝站。流域內地勢西高東低,具有山高坡陡、河谷深切的特點,降水量西部為951.8mm,中部為1 180.8mm,東部為1 229.2mm,多集中在6-9 月份。
模型采用六沖河七星關站1974-1978年資料作為訓練和調整模型樣本,以1982年資料作為訓練樣本。運用SPASS聚類分析,對各年份進行豐水年與平水年劃分,對同年進行豐水期和平水期劃分,從而建立不同年份不同水期的預報模型。由于資料有限本文只做各年豐水期的模擬。根據(jù)貴州六沖河七星關站蒸發(fā)、降雨和流量資料,六曲溝站、水營站的降雨資料,其中日降雨量按照算術平均算出。通過SPASS 聚類分析把 5,6,7,8,9,10 月份劃分為豐水期,3,4,11 月份為平水期,1,2,12 月份為枯水期。并計算出不同時期不同參數(shù)的c值見表1。
表1 豐水期c值計算表Table 1 Calculation results of c value in wet season
通過輸入1974-1978年不同時期實際的降水量、蒸發(fā)量、前期流量進行BP訓練,采用經典的3層BP網絡模型,選擇Sigmoid為隱層傳遞函數(shù),purelin函數(shù)為輸出層傳遞函數(shù),traindx為訓練函數(shù),訓練最大迭代次數(shù)為10000,goal誤差目標0.001,隱層數(shù)從1開始逐步增加訓練模型,其它參數(shù)采用BP網絡默認值,最后通過1974-1978年訓練所得徑流量與實測徑流量的誤差,選擇最優(yōu)的隱層數(shù)確定模型.根據(jù)訓練模型進行預報,將輸出數(shù)據(jù)反歸一化得到1982年豐水期預報值為例,結果見圖2。
圖2 1982年改進前仿真與實測徑流量比較圖Fig.2 Comparison of simulated runoff and observed runoff before model modification in 1982
通過上述仿真結果分析:仿真結果與實測流量過程線走勢一樣,證明BP神經網絡在巖溶地區(qū)建立降雨—徑流預報模型具有一定的可行性。但是發(fā)現(xiàn)洪峰值的仿真效果和起落峰時流量過程線吻合不好。這主要是由于經典的BP算法,網絡訓練是根據(jù)全局誤差修改網絡權重的,這種權重修改方法很難控制洪峰流量的變化規(guī)律,所以經過訓練的網絡對中、低流量的預報精度相對較高,而對洪峰的預報精度往往低一些;同時網絡默認的初始權值是隨機生成的,收斂的速度慢,使模型與真實之間不完全一致。鑒于這樣的弊端,本文試圖用回歸分析對BP網絡各初始權值進行調整,用對數(shù)處理方法降低洪峰流量與平均流量之間的數(shù)量級。
BP網絡中各隱層訓練的初始權值是隨機生成的,具有偶然性,本文通過巖溶地區(qū)降雨、徑流、蒸發(fā)之間的關系,運用SPASS軟件,建立各站降雨量、流域日蒸發(fā)量、前期徑流量之間的相關關系作為BP網絡中各隱層初始訓練權值,可以優(yōu)化初始的BP網絡結構,使模型預報效果更好。并通過統(tǒng)計學中的DW,VIF,F(xiàn)檢驗確定回歸方程:
式中:x1為前1 d徑流量;x2為前期2 d徑流量;x3為前期3 d徑流量;x4為日蒸發(fā)量;x5為水營站逐日降雨量;x6為六曲溝站逐日降水量;x7為七星關站逐日降水量;~y為流域出口斷面預測徑流量。
其中要說明的是:回歸方程中沒有體現(xiàn)x7,其原因是七星關站正好是流域出口斷面上的水文站,不能反映流域中的降雨量;沒有x2,x3,其主要原因是所選取的流域面積不大,加上貴州屬于高原地區(qū),坡降大,其匯流時間小于預報時間1 d。
由于BP算法顧及全局,而對局部的差異性數(shù)據(jù)糾正量少,那么對于洪峰而言本身就是局部變化量大的數(shù),BP網絡的結構決定了其誤差一定是很大的。如果將全部的徑流量數(shù)據(jù)取對數(shù)后再進行訓練和仿真,這樣可以有效地縮小各個逐日徑流量數(shù)據(jù)之間的數(shù)量級,使得BP網絡訓練時局部誤差變化變小,可以有效地校正洪峰處的誤差。從豐水期逐日流量數(shù)據(jù)中可以看到,最大流量在707 m3/s,最小流量為6.9 m3/s,相差數(shù)量級為2;通過對數(shù)處理后,最大流量為2.849 4 m3/s,最小流量為0.838 8 m3/s,屬于同一個數(shù)量級。
同時在未用對數(shù)處理前,逐日流量的歸一化值大多集中在0.2~0.3之間,通過對數(shù)處理后,歸一化值在0.2~0.8之間分布均勻。通過這樣處理BP在訓練時就可以有效地顧及洪峰流量。
通過網絡權值的調整和流量對數(shù)處理后的訓練同樣以1974-1978年的數(shù)據(jù)做訓練樣本,以1979-1983年的數(shù)據(jù)做仿真。模型中初始權值按照回歸方程系數(shù)給定,其它參數(shù)不變,通過訓練生成模型預報1982年的徑流過程結果見圖3。
圖3 1982年改進后仿真與實測徑流量比較圖Fig.3 Comparison of simulated runoff and observed runoff after model modification in 1982
從圖3可以看出,改進的模型在巖溶地區(qū)的徑流預報可以有效地校正中等及以下洪峰。根據(jù)1982年,大于豐水期平均流量76.64 m3/s的洪峰共有15次。結果見表2。
表2 對數(shù)處理和初始權值修正改進前后的仿真徑流量和峰現(xiàn)時間比較表Table 2 Comparison of simulated runoffs and peak dates before and after logarithm processing and initial weight modification
由表2的結果可以看出:通過改進后的BP網絡模型可以有效地提高徑流量特別大和徑流量特別小的洪峰預報精度;但是,也降低了洪峰流量適中的預報精度。其原因在于BP算法通過全局誤差調整網絡傳遞權值,對數(shù)處理使數(shù)量級降低,會減小中等洪峰在全部洪峰中的影響權值,增加大洪峰和小洪峰的影響權值。
本文進行的是逐日徑流量預報,預報時段為1d,故按照峰現(xiàn)時間許可誤差要求,峰現(xiàn)時間允許值為1 d。對于洪峰流量預報以實測洪峰流量的20%作為許可誤差。從表2和表3可以看出改進前后各項指標的精度值,表現(xiàn)為改進后峰現(xiàn)時間、洪峰流量精度提高,DC系數(shù)變大,誤差減小。
總體上,通過對徑流量進行對數(shù)處理,降低預報對象的數(shù)量級,可以提高大洪峰和小洪峰的洪峰流量預報精度;通過SPASS軟件對BP訓練賦初始權重進行建模,可使洪峰漲落過程與實際徑流過程更加吻合,同時提高洪峰預報時間合格率,這是因為網絡初始權值的調整提高了模型對實際降雨-徑流過程的吻合性(表3)。
表3 1982年徑流量預報評價指標Table 3 Evaluation indexes of runoff forecasting in 1982
本文通過改進的BP算法,建立了巖溶地區(qū)流量預報模型,主要研究成果和不足如下。
(1)BP網絡是一個黑箱模型,通過BP網絡在巖溶地區(qū)徑流預報中的應用,可以避免常用的新安江模型、陜北模型中的參數(shù)在地下巖溶管道、裂隙發(fā)育巖溶地區(qū)難以確定的弊端。
(2)對于巖溶地區(qū)的降雨徑流非線性問題,前期通過SPASS軟件的線性處理調整BP網絡初始權值,使模型在訓練中提早知道了降雨徑流的時間過程,有效地提高降雨徑流中時間的預報精度。
(3)通過對徑流量進行對數(shù)處理,可以降低原始數(shù)據(jù)之間的數(shù)量級,從而提高徑流量大和徑流量小的洪峰流量,這為運用BP進行極端氣候中干旱和洪澇災害的預報提出一種可能的方法。
(1)降雨、蒸發(fā)在流域上有其差異性,雨量站、流量站、水文站的分布不均勻,因此建立降雨-徑流模型時,在計算逐日平均降水量,逐日平均蒸發(fā)量時,應按照地形圖進行加權計算。
(2)數(shù)據(jù)量太小,未能建立豐水年、枯水年各自的徑流預報模型。
[1]范鐘秀.中長期水文預報[M].南京:河海大學出版社,1999.(FAN Zhong-xiu.Mid-and-Long-Term Hydrological Forecasting[M].Nanjing:Hohai University Press,1999.(in Chinese))
[2]丁 晶,鄧育仁.隨機水文學[M].成都:成都科技大學出版社,1988.(DING Jing,DENG Yu-ren.Stochastic Hydrology[M].Chengdu:Publishing House of Chengdu University of Science and Technology,1988.(in Chinese))
[3]劉 勇,陳元芳,王銀堂,等.基于OSR-BP神經網絡的丹江口秋汛期徑流長期預報研究[J].水文,2010,30(6):32-36.(LIU Yong,CHEN Yuan-fang,WANG Yin-tang,et al.Long-term Forecasting for Autumn Flood Season in Danjiangkou Reservoir Basin Based on OSR-BP Neural Network[J].Journal of China Hydrology,2010,30(6):32-36.(in Chinese))
[4]許明一.渭河流域水文模型研制及應用[D].南京:河海大學,2007.(XU Ming-yi.Study and Application of Hydrological Model for Weihe River Basin[D].Nanjing:Hohai University,2007.(in Chinese))
[5]鄒文安,劉興富,劉寶涵.新安江模型在洪水預報中的應用[J].吉林水利,2000,(11):5-6.(ZOU Wen-an,LIU Xing-fu,LIU Bao-han.Application of Xinanjiang Model to Flood Forecasting[J].Jilin Water Resources,2000,(11):5-6.(in Chinese))
[6]黃海洪,孫崇智,金 龍.基于主分量的神經網絡水位預報模型應用研究[J].南京氣象學院學報,2005,28(1):58-63.(HUANG Hai-hong,SUN Chong-zhi,JIN Long.Neural Network Prediction Model of Xijiang River Water Level Based on Principal Component Analysis[J].Journal of Nanjing Institute of Meteorology,2005,28(1):58-63.(in Chinese))
[7]杜 剛.改進BP神經網絡在地下水質評價中的應用[D].上海:上海師范大學,2007.(DU Gang.Application of Improved BP Network in Groundwater Quality E-valuation[D].Shanghai:Shanghai Normal University,2007.(in Chinese))
[8]李根義,朱學愚,錢家忠,等.實數(shù)編碼遺傳算法優(yōu)化的神經網絡模型在巖溶水水位預報中的應用[J].南京大學學報(自然科學),2001,37(3):324-326.(LI Gen-yi,ZHU Xue-yu,QIAN Jia-zhong,et al.Neural Network Model Based on RNCGA and Its Application to Karst Groundwater Evaluation[J].Journal of Nanjing U-niversity(Natural Sciences),2001,37(3):324-326.(in Chinese))
[9]占玉林,王長耀,牛 錚.基于BP網絡的降雨水位預報模型應用研究[J].中國科學院研究生院學報,2007,24(1):81-85.(ZHAN Yu-lin,WANG Changyao,NIU Zheng.An Application Research of Rainfall-Water Level Forecast Model Based on BP Network[J].Journal of the Graduate School of the Chinese Academy of Sciences,2007,24(1):81-85.(in Chinese))
[10]朱星明,盧長娜,王如云,等.基于人工神經網絡的洪水水位預報模型[J].水利學報,2005,36(7):806-811.(ZHU Xing-ming,LU Chang-na,WANG Ru-yun,et al.Artificial Neural Network Model for Flood Water Level Forecasting[J].Journal of Hydraulic Engineering,2005,36(7):806-811.(in Chinese))
[11]REN M L,WANG B D,LIANG Q H,et al.Classified Real-time Flood Forecasting by Coupling Fuzzy Clustering and Neural Network[J].International Journal of Sediment Research,2010,25(6):134-148.
[12]JU Q,YU Z B,HAO Z C,et al.Division-based Rainfall-Runoff Simulations with BP Neural Networks and Xinanjiang Model[J].Neurocomputing,2009,72(8):2873-2883.
[13]LUK K C,BALL J E,SHARMA A.A Study of Optimal Model Lag and Spatial Inputs to Artificial Neural Networks for Rainfall Forecasting[J].Journal of Hydrology,2000,227(1):56-65.
[14]SINGH PANKAJ,DEOM C.Suitability of Different Neural Networks in Daily Flow Forecasting[J].Applied Soft Computing,2007,7(6):968-978.
[15]尚曉三,王棟.貴州典型巖溶流域日降雨徑流過程模擬研究[J].中國巖溶,2009,28(1):43-48.(SHANG Xiao-san,WANG Dong.Simulation to Daily Rainfall-Runoff Process in Typical Karst Basin in Guizhou[J].Carsologica Sinica,2009,28(1):43-48.(in Chinese))
[16]LEAHY PAUL,KIELY GER,CORCORAN GEAROID.Structural Optimisation and Input Selection of an Artificial Neural Network for River Level Prediction[J].Journal of Hydrology ,2008,355(6):192-201.
[17]束龍倉,董貴明,陶玉飛,等.地下河天窗水位變化分析及預測[J].水力學報,2009,40(5):529-533.(SHU Long-cang,DONG Gui-ming,TAO Yu-fei,et al.Forecast and Analysis on Water Level Fluctuation in Sinkhole of Underground Rivers[J].Journal of Hydraulic Engineering,2009,40(5):529-533.(in Chinese))
[18]葛哲學,孫志強.神經網絡理論與MATLABR2007實現(xiàn)[M].北京:電子工業(yè)出版社,2007.(GE Zhe-xue,SUN Zhi-qiang.Theory of Neural Network and Its Application in MATLABR2007[M].Beijing:Electronic Industry Press,2007.(in Chinese))
[19]武 鵬.動力電池數(shù)字終端管理系統(tǒng)的研究[D].天津:天津大學,2007.(WU Peng.Study on Digital End Management System of Power Battery[D].Tianjin:Tian-jin University,2007.(in Chinese))
[20]楊桂芳,姚長宏,王增銀,等.BP神經網絡在巖溶水庫滲漏評價中的應用[J].中國巖溶,2000,19(1):73-80.(YANG Gui-fang,YAO Chang-hong,WANG Zengyin,et al.Application of Back Propagation Artificial Neural Network in Leakage Evaluation for Karst Reservoirs[J].Carsologica Sinica,2000,19(1):73-80.(in Chinese))
[21]程根偉,舒棟材.水文預報的理論與數(shù)字模型[M].北京:中國水利水電出版社,2006.(CHENG Gen-wei,SHU Dong-cai.Theory and Digital Models of Hydrological Forecasting[M].Beijing:China Water Power Press,2006.(in Chinese))