丁 薇
(山西省水文水資源勘測局)
水面蒸發(fā)既是江河湖庫渠塘等水體水量損失的主要形式之一,同時也是自然水循環(huán)的一個重要環(huán)節(jié)。研究預測水面蒸發(fā),能夠提高我們對水文循環(huán)模擬的精度,為水資源的合理利用提供基礎依據,對于合理制定農田灌溉制度及對水文循環(huán)的深入研究等均有重要意義[1]。
在現階段,對大水體的水面蒸發(fā)量預測可通過計算或估算獲得,但由于受到其相關資料及方法的不確定性限制,會影響到預測精度。對小水體的蒸發(fā)量預測,由于資料更為短缺,預測困難較大。近年來,我國對水面蒸發(fā)量的預測研究越來越受到重視[2]。但隨著氣候變化及天然降水量時空分布的影響,水面蒸發(fā)量的變化也相應較大。總體來講,目前對水面蒸發(fā)量預測的相關研究仍然較少,且與現階段氣候變化條件下的水文循環(huán)不相適應[3-5],遠不能滿足實際需求。由此可見,對于水面蒸發(fā)量預測研究,仍是現階段有待深入研究解決的重要課題[6-7]。本文以太原地區(qū)的水面蒸發(fā)量預測為例,應用主成分分析法(PCA)[8]與RBF神經網絡相結合的方法—PCA-RBF神經網絡法,建立數學模型,進行預測演算,并對預測模型的合理性進行分析,以驗證該模型對水面蒸發(fā)量的預測精度,可為水面蒸發(fā)量的預測提供參考。
主成分分析法能夠將多個研究對象標準化后,縮減為幾個綜合指標,且不丟失原有信息,簡化了統計分析系統結構,被廣泛應用于水文學、經濟學等領域。本文通過主成分分析法,篩選出影響水面蒸發(fā)量的主要氣象因子,并作為RBF神經網絡的輸入層。具體步驟如下:
(1)構造樣本矩陣X。
式中:xij為第i個樣本中第j個指標的值。
(2)對樣本矩陣X進行標準化,變?yōu)闃藴驶仃嘫。
(3)標準矩陣Y的相關系數計算。
(4)計算主成分貢獻率及累計貢獻率。主成分Fi的貢獻率計算公式:
累計貢獻率計算公式:
其中λi(i=1,2,…,m)為指標序列的特征值,可通過方程=0求出,并對其進行排序,即λ1≥λ2≥…λm≥0,Im為特征值λ對應的特征向量。當λk對應的累計貢獻率大于或等于85%時,則其有k(k≤m)個與λ1,λ2,…,λk對應的主成分。
徑向基函數(RBF)神經網絡現已在氣象、水文等方面具有廣泛的應用。已有研究通過RBF神經網絡,對降雨、徑流進行預測,并且通過RBF神經網絡還可以進行模型參數的預報。RBF神經網絡在處理多因子對單因子拓撲關系時運算簡單,功能強大。RBF神經網絡通常有3層網絡結構,包括輸入層、隱含層和輸出層。網絡模型的拓撲關系如圖1所示。
圖1 RBF神經網絡結構
本項研究選取太原地區(qū)為研究區(qū)域。眾所周知,水面蒸發(fā)量受到氣候條件影響較大,如風速與溫度的增加可使蒸發(fā)量變大,而相對濕度與氣壓的升高則會影響蒸發(fā)。目前,對于各氣象因子在水面蒸發(fā)過程中所占據的重要程度,尚未有明確的定論。為此,在研究過程中,收集了2010年1月1日至2010年1月28日太原站氣壓(PRS)、相對濕度(RHU)、氣溫(TEM)、風向風速(WIN)、日照時數(SSD)和0 cm地溫(GST)作為海選氣象預測因子,水面蒸發(fā)量作為被預測因子。首先,通過采用主成分分析法提取影響水面蒸發(fā)量的主要因子,并對提取到的主要氣象因子通過相關性識別檢驗,確定所選氣象因子的合理性;然后,將提取出的主要氣象因子作為RBF神經網絡的輸入層,對水面蒸發(fā)量進行預測。分別以2010-1-1至2010-1-25的數據及2010-1-25至2010-1-31的數據作為RBF神經網絡的訓練與檢驗樣本,根據檢驗樣本的合格率對PCA-RBF神經網絡的預測精度進行檢驗。
運用SPSS軟件對標準化的氣象因子的樣本數據進行主成分分析,得到表1。
表1 解釋的總方差
由表1可知,日照時數和相對濕度成分的特征累積方差貢獻率達到75.359%。因此,這兩個主成分在評價體系中起主要作用。
為進一步檢驗并確定主成分分析法所提取指標的合理性,對各氣象因子與蒸發(fā)量的相關性與顯著性進行分析。分析結果見表2及圖2至圖7。由表2及圖2至圖7可知,日照時數(SSD)與水面蒸發(fā)EVP為正相關,相關系數最大為0.665,且滿足P=0.05的顯著性水平檢驗;相對濕度(RHU)與水面蒸發(fā)量為負相關,相關系數最大為-0.408,且滿足P=0.05的顯著性水平檢驗。研究認為,本次主成分分析提取的主要氣象因子合理,滿足相關性及顯著性檢驗。
表2 氣象要素間相關性分析
圖2 SSD與EVP變化趨勢圖
圖3 RHU與EVP變化趨勢圖
圖4 PRS與EVP變化趨勢圖
圖5 TEM與EVP變化趨勢圖
圖6 WIN與EVP變化趨勢圖
圖7 GST與EVP變化趨勢圖
由主成分分析及相關性檢驗可知,日照時數(SSD)與相對濕度是影響蒸發(fā)量EVP的主要因素。因此選擇2010-1-1至2010-1-25的數據作為訓練指標,而2010-1-25至2010-1-31日的數據作為檢驗指標。使用Matlab R2013a編程實現模型算法,得到當所構建的RBF神經網絡模型的中心化方法為Cluster、硬漢節(jié)點數為10、加權種子數為2、sigma參數為0.1、迭代最大次數為100時,模型誤差最小,為4.555。模型檢驗結果見表3。
表3 模型檢查結果表
由模擬結果可知,模型最大相對誤差為72.32%,最小相對誤差為2%。從26日到31日預測值與實際值偏差較小,最大誤差出現在30日,究其原因,可能與僅選取了一個月的氣象數據作為研究樣本有關。由于研究樣本較少,而RBF神經網絡要求數據量越大其精度越高,因此,應在今后的研究中加大數據量的輸入,作為神經網絡的訓練樣本,則本文提出的方法所預測的蒸發(fā)量數據精度將會大大提高。總體來看,如果相對誤差絕對值小于20%算作合格的話,合格率等于(5/6)×100%=83%。
本文以太原地區(qū)為例,從多個影響因子分析出發(fā),應用主成分分析法提取了主要的氣象因子,并對所提取的氣象因子進行了相關性檢驗,證明了主成分分析法對RBF神經網絡預測因子(即輸入層)識別的合理性。在此基礎上進行的水面蒸發(fā)量預測,大大減少了實際運用數據中的工作量,且PCA-RBF神經網絡預測精度較高,達到了83%的合格率。
本項研究所提出的水面蒸發(fā)量預測模型,簡便實用,對于氣象數據缺失的地區(qū),可有效進行水面蒸發(fā)量預測,克服了計算公式需要太多資料和經驗系數的缺陷,具有一定的實用意義。但本文建模數據量較少,不能充分體現該模型的優(yōu)越性,因此,在今后的研究中,需要借助大量資料進一步驗證該方法的實用性。