国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于偏互信息篩選的中長期徑流預(yù)報方案比選

2022-11-04 01:50:26榮,湯陽,曹
人民長江 2022年10期
關(guān)鍵詞:石鼓氣候因子互信息

張 海 榮,湯 正 陽,曹 輝

(1.三峽水利樞紐梯級調(diào)度通信中心,湖北 宜昌 443002; 2.智慧長江與水電科學湖北省重點實驗室,湖北 宜昌 443002)

0 引 言

精度較高的徑流預(yù)報是水工程調(diào)度、水資源高效利用的重要基礎(chǔ)。徑流預(yù)報從預(yù)報尺度區(qū)分,可以分為以日或者小時為尺度的短期預(yù)報和以月或者旬為尺度的中長期預(yù)報。隨著衛(wèi)星遙感和數(shù)值天氣預(yù)報等技術(shù)的快速發(fā)展,短期降雨預(yù)報在預(yù)見期和預(yù)報精度上都有了長足進步[1-2],考慮水文循環(huán)特性的短期徑流方法層出不窮,短期徑流預(yù)報精度不斷提高。然而,由于大氣環(huán)流異常復(fù)雜,較長時間尺度的降雨等氣象因素預(yù)報效果欠佳,中長期徑流預(yù)報較長時期以內(nèi)仍以數(shù)理統(tǒng)計方法為主,具體可分為時間序列方法和多元數(shù)理回歸方法等[3]。

近年來,隨著氣候觀測技術(shù)和機器學習技術(shù)的快速發(fā)展,較多學者嘗試將遙相關(guān)氣候因子和機器學習引入中長期徑流預(yù)報,并取得了不錯效果[4-5]。受海陸循環(huán)影響,陸地水循環(huán)過程可能會受到大氣環(huán)流指數(shù)、海平面氣溫、氣壓等遙相關(guān)氣候因子的影響,但影響流域水文循環(huán)的因子往往成百上千,且存在不同程度的時滯效應(yīng),如前5個月的太平洋區(qū)域平均海平面溫度與宜昌站的徑流存在較強相關(guān)關(guān)系[6]。如此眾多的輸入因子在輸入模型訓練之前必須進行一定的預(yù)報因子篩選,保證模型的計算精度與效率。

輸入因子的選擇是中長期徑流預(yù)報研究的重要內(nèi)容。由于影響流域徑流的遙相關(guān)氣候因子往往與徑流存在高維的非線性關(guān)系,一般的統(tǒng)計方法難以挖掘其中的相關(guān)關(guān)系。同時,因子與因子之間的相關(guān)關(guān)系如何剔除,如某一個因子可由其他因子推導(dǎo)得出,那么此因子包含的信息就是冗余信息,應(yīng)該予以剔除。在眾多輸入因子篩選方法中,有學者以互信息為基礎(chǔ),通過度量輸入變量與預(yù)報對象之間的相關(guān)關(guān)系,提出偏互信息方法,可有效剔除新加入因子對預(yù)報對象相關(guān)性的增量,有效避免了冗余變量的選入[7]。

在中長期徑流預(yù)報模型研究方面,人工神經(jīng)網(wǎng)絡(luò)等模型發(fā)展迅速,其中包括BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)[8]、自組織映射(Self-organizing Map,SOM)神經(jīng)網(wǎng)絡(luò)[9]、Hopfield神經(jīng)網(wǎng)絡(luò)[10]、徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)[11]、廣義回歸神經(jīng)網(wǎng)絡(luò)(General Regression Neural Network,GRNN)[12]等模型,均取得了較好的預(yù)報精度[13-17]。長短時記憶(Long Short- Term Memory,LSTM)網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)中一種帶有門控的網(wǎng)絡(luò),能夠考慮到數(shù)據(jù)的時序性特點,學習到數(shù)據(jù)之間的長期依賴關(guān)系,在處理時間序列數(shù)據(jù)的預(yù)測方面具有獨特的優(yōu)勢,在時間序列預(yù)測領(lǐng)域使用廣泛[18-20]。

隨著電力市場改革的不斷推進、水電站長中短期精細化調(diào)度要求的不斷提高,長江流域中長期徑流預(yù)報的重要性不斷凸顯,有眾多學者采用多元線性回歸[21]、人工神經(jīng)網(wǎng)絡(luò)[22]、貝葉斯經(jīng)驗統(tǒng)計[23]等方法探索了長江流域徑流預(yù)報方法,但對業(yè)務(wù)預(yù)報中,如何有效應(yīng)用遙相關(guān)氣候因子、降雨信息等多源數(shù)據(jù)制定合理的預(yù)報方案,缺乏進一步的對比研究?;诖?,本文以長江上游流域宜昌站為主要研究對象,在歷史降雨徑流數(shù)據(jù)的基礎(chǔ)上,引入130個遙相關(guān)氣候因子,基于偏互信息篩選輸入因子,應(yīng)用LSTM神經(jīng)網(wǎng)絡(luò)模型建模,對宜昌站的月徑流預(yù)報方案進行比選。

1 研究區(qū)域概況

本文以長江上游主要控制站點宜昌站徑流為主要研究對象。長江干流自江源至湖北省宜昌段為長江上游,包括江源段、通天河段、金沙江段和川江段。長江干流上游河段長4 504 km,流域面積約100萬km2。長江流域的多年平均徑流量中上游來水量占47.0%,其中金沙江水系占16.1%,岷沱江占10.9%,嘉陵江占7.4%,烏江占5.7%,長江上游干流占6.9%。

1.1 降雨與徑流數(shù)據(jù)

研究采用1981~2019年宜昌站的還原月徑流量,以及石鼓以上、雅礱江、石鼓-宜賓段、岷沱江、嘉陵江、烏江、宜賓-重慶段、重慶-宜昌段等8個子流域或區(qū)間的面平均累計月降雨作為基礎(chǔ)數(shù)據(jù)。徑流數(shù)據(jù)來源于長江水利委員會水文局歷史整編資料,降雨數(shù)據(jù)來源于湖北省氣象局整編資料。

1.2 氣候因子

研究采用的氣候因子從國家氣候中心(https:∥cmdp.ncc-cma.net/Monitoring/cn_index_ 130.php)下載,包括北半球副高面積指數(shù)、北非副高面積指數(shù)、北非-大西洋-北美副高面積指數(shù)等88項大氣環(huán)流指數(shù),NINO 1+2區(qū)海表溫度距平指數(shù)、NINO 3區(qū)海表溫度距平指數(shù)、NINO 4區(qū)海表溫度距平指數(shù)等26項海溫指數(shù),冷空氣次數(shù)、西太平洋編號臺風數(shù)、登陸中國臺風數(shù)等16項其他指數(shù),一共130個遙相關(guān)氣候因子。

2 研究方法

2.1 偏互信息法

互信息(Mutual Information,MI)表示一個隨機變量中包含另一個隨機變量的信息量,可用于度量隨機變量間的所有相關(guān)關(guān)系,包括線性相關(guān)關(guān)系和非線性相關(guān)關(guān)系。令X和Y為兩個隨機變量,其互信息可定義為

(1)

式中:fX(x)和fY(y)分別為隨機變量X和Y的邊緣概率密度函數(shù);fX,Y(x,y)為X、Y的聯(lián)合概率密度函數(shù)。若X、Y相互獨立,聯(lián)合概率密度函數(shù)等于邊緣概率密度函數(shù)和的乘積,式(1) 中對數(shù)函數(shù)內(nèi)的值恒為1,MI值等于0;相反,隨機變量X和Y的相關(guān)性越強,MI值越大。

用互信息方法挑選影響徑流的遙相關(guān)因子難以避免冗余信息,為此采用偏互信息法(Partial Mutual Information,PMI),剔除無關(guān)變量以精簡模型輸入。離散型偏互信息的定義為

(2)

(3)

式中:E為期望值;x為備選輸入變量;y為預(yù)報對象;z為已選入的預(yù)報變量集合;x′為排除z影響x的殘差;y′為排除z影響y的殘差。其中,針對偏互信息中變量的邊緣概率密度函數(shù)和聯(lián)合概率密度函數(shù)估計,采取高斯函數(shù)作為核函數(shù)估計樣本概率密度:

(4)

(5)

以 Hampel 顯著性檢驗作為偏互信息的顯著性檢驗標準確定選擇邊界,計算式為

(6)

2.2 LSTM

LSTM是從循環(huán)神經(jīng)網(wǎng)絡(luò)(Rerrent Neural Network,RNN)衍生而來。在求解時間相關(guān)的輸入信號時,傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò)由于其正向連接結(jié)構(gòu)特性使其僅處理當前輸入,而不能使用先前信息。RNN 是一個循環(huán)網(wǎng)絡(luò),它將隱藏神經(jīng)元在前一個時間步的狀態(tài)作為下一個時間步的附加輸入。LSTM 則在RNN基礎(chǔ)上具有刪除或添加一些信息的能力。這個過程稱為門的結(jié)構(gòu)控制。LSTM 用一個記憶單元和3個門代替了隱藏層中的普通神經(jīng)元:輸入門、遺忘門和輸出門。LSTM可以根據(jù)新的輸入有選擇地更新記憶細胞狀態(tài),忘記不相關(guān)的內(nèi)容,或者分別根據(jù)輸入、遺忘和輸出門的狀態(tài)有選擇地輸出一部分記憶細胞狀態(tài)作為新的隱藏神經(jīng)元狀態(tài)。通過這種方式,LSTM 能夠?qū)W習長時間跨度的時間序列。當前時間步ht的神經(jīng)元狀態(tài)計算如下[19-20]:

ft=σ(Wf·[ht-1,xt]+bf)

(7)

it=σ(Wi·[ht-1,xt]+bi)

(8)

(9)

ot=σ(Wo·[ht-1,xt]+bo)

(10)

(11)

ht=ot⊙tanh(Ct)

(12)

式中:ft,it分別為t時刻的兩個控制門,ft為t時刻刪除的舊消息,it為t時刻添加的新消息;Ct為t時刻的網(wǎng)絡(luò)狀態(tài),Ct′為t時刻網(wǎng)絡(luò)的更新信息;ht為t時刻LSTM隱藏層狀態(tài);xt為t時刻的預(yù)報因子;yt為t時刻的預(yù)報對象;σ為sigmoid函數(shù);Wf為遺忘門權(quán)重矩陣;bf為遺忘門偏斜向量;Wi為輸入門權(quán)重矩陣;bi為輸入門偏斜向量;WC為狀態(tài)更新的權(quán)重矩陣;bC為狀態(tài)更新的偏斜向量;Wo為輸出門權(quán)重矩陣;bo為輸出門偏斜向量;ot為模型輸出。

3 研究結(jié)果

3.1 相關(guān)因子選擇

為充分對比宜昌站徑流與遙相關(guān)氣候因子、前期降雨和徑流的關(guān)系,設(shè)計以下3種研究方案。

(1) 方案1:歷史遙相關(guān)氣候因子。由于遙相關(guān)氣候因子與徑流存在一定的滯后性,因此以1 a(12個月)為滯后時期,分別比選130個遙相關(guān)氣候因子與長江上游徑流預(yù)報的相關(guān)關(guān)系,形成1 560(130×12)個遙相關(guān)備選輸入因子。特別說明,由于宜昌站徑流存在較強的周期特性,在歷史遙相關(guān)因子的分析中,并未將宜昌站歷史徑流放入備選因子,僅單獨挖掘遙相關(guān)因子與宜昌站徑流的相關(guān)關(guān)系。

(2) 方案2:歷史降雨徑流因子。參考遙相關(guān)因子的處理辦法,對石鼓以上、雅礱江、石鼓-宜賓段、岷沱江、嘉陵江、烏江、宜賓-重慶段、重慶-宜昌段等8個子流域或區(qū)間的面平均累計月降雨,和宜昌站歷史徑流共計9個因子,以1 a(12個月)為時滯形成108(9×12)個降雨徑流備選因子。

(3) 方案3:考慮徑流及當月降雨。參考方案2,在此基礎(chǔ)上增加石鼓以上、雅礱江、石鼓-宜賓段、岷沱江、嘉陵江、烏江、宜賓-重慶段、重慶-宜昌段等8個子流域或區(qū)間的預(yù)報當月降雨,共計116(108+8)個降雨徑流備選因子。

偏互信息篩選因子的方法分為2步。第1步,對每個因子對應(yīng)的時滯作為輸入變量集合,如{石鼓以上前1月降雨,石鼓以上前2月降雨,…,石鼓以上前12月降雨},采用偏互信息法篩選石鼓以上降雨與宜昌站徑流相關(guān)性顯著的時滯。第2步,將第1步選出的輸入因子重新組成集合,再次運用偏互信息法挑選與宜昌站徑流相關(guān)性高的變量,形成最終的輸入變量。

通過對上述3種方案進行偏互信息篩選,得到各種方案的輸入因子如表1所列。

表1 不同方案輸入因子選擇結(jié)果Tab.1 Selection results of input factors for different schemes

從歷史遙相關(guān)因子的結(jié)果篩選可知,長江上游來水與半年前的西太平洋副高、厄爾尼諾NINO 1+2區(qū)海表溫度距平指數(shù)關(guān)系密切。這也與麥紫君等[6]的研究成果類似,而本研究更進一步印證了西太平洋副高系統(tǒng)對長江流域的徑流影響。從歷史降雨與徑流的相關(guān)關(guān)系來看,宜昌站徑流與去年同期宜昌站徑流、上一月的岷沱江、烏江和雅礱江降雨關(guān)系密切,同時,模擬當月的嘉陵江、宜賓-重慶段降雨與宜昌站徑流相關(guān)性較強。

3.2 中長期徑流預(yù)報結(jié)果分析

利用LSTM模型,分別采用不同方案的輸入因子,對宜昌站徑流進行預(yù)報。其中,70%數(shù)據(jù)用作訓練,30%數(shù)據(jù)用作檢驗。訓練期以及檢驗期精度如表2 所列。

表2 不同方案預(yù)報精度結(jié)果Tab.2 Forecast accuracy of different schemes

從表2的結(jié)果可知,應(yīng)用遙相關(guān)氣候因子進行中長期徑流預(yù)報具有一定的可行性,在未加入前期徑流的情況下,檢驗期確定性系數(shù)為72%,且理論上單獨使用遙相關(guān)氣象因子進行預(yù)報,可以具有5個月的預(yù)見期。在應(yīng)用歷史降雨徑流因子的預(yù)報中,由于去年同期和上月宜昌站徑流的引入,檢驗期預(yù)報精度可以達到84%。進一步,若引入徑流預(yù)報當月的實測降雨,檢驗期預(yù)報精度可達到93%,證明了宜昌站徑流與當月降雨的強相關(guān)性,在中長期徑流預(yù)報中應(yīng)用定量預(yù)報降雨對于提升預(yù)報精度效果顯著。

3種方案的實測與模擬徑流值如圖1~3所示。3種方案對徑流的周期性,以及低流量過程都有很好的預(yù)報效果。方案1應(yīng)用遙相關(guān)因子的中長期徑流預(yù)報中,在訓練期對于大流量過程刻畫段準確,但在檢驗期,存在預(yù)報較大的情況。方案2中,對訓練期內(nèi)大流量過程存在預(yù)報偏小的問題,但對檢驗期的大流量過程刻畫較準確。在方案3中,由于引入了模擬當月預(yù)報降雨,訓練期和檢驗期的大流量過程模擬效果都較為優(yōu)秀。對比方案1和方案2,可以得出遙相關(guān)氣候因子相比于降雨信息,對中長期的極值預(yù)報具有更高的指導(dǎo)性,例如1998年的長江流域大洪水,厄爾尼諾便是其重要原因,而遙相關(guān)因子正好可以有效刻畫這一現(xiàn)象。

4 結(jié) 語

本文以長江上游流域宜昌站為主要研究對象,在歷史降雨徑流數(shù)據(jù)的基礎(chǔ)上,引入130個遙相關(guān)氣候因子,基于偏互信息篩選輸入因子,應(yīng)用LSTM神經(jīng)網(wǎng)絡(luò)模型建模,對宜昌站的月徑流預(yù)報方案進行比選。研究表明:長江上游來水與半年前的西太平洋副高關(guān)系密切,NINO 1+2區(qū)海表溫度距平指數(shù)也與宜昌站徑流存在較強的相關(guān)性。在遙相關(guān)氣候因子之外,宜昌站徑流與去年同期宜昌徑流、上一月的岷沱江、烏江和雅礱江降雨關(guān)系密切,若能加入預(yù)報當月的嘉陵江、宜賓-重慶段降雨,將大幅提升宜昌站的中長期預(yù)報精度。

猜你喜歡
石鼓氣候因子互信息
基于氣候變量的苧麻產(chǎn)量SSA-BP預(yù)測模型
石鼓響了
嶺南音樂(2022年4期)2022-09-15 14:03:12
周野鹿鳴——石鼓山西周墓葬群
“中華第一古物”:故宮石鼓
金橋(2018年2期)2018-12-06 09:30:30
石鼓滄桑
四川水稻產(chǎn)量及其構(gòu)成要素對不同生育期氣候因子的響應(yīng)分析
基于互信息的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學習
聯(lián)合互信息水下目標特征選擇算法
改進的互信息最小化非線性盲源分離算法
電測與儀表(2015年9期)2015-04-09 11:59:22
基于增量式互信息的圖像快速匹配方法
临泉县| 囊谦县| 长宁区| 建湖县| 酒泉市| 惠安县| 科技| 九江市| 军事| 长春市| 栾川县| 盱眙县| 内黄县| 团风县| 贵州省| 乌恰县| 津南区| 河间市| 紫云| 衡南县| 德阳市| 利津县| 漳平市| 通化县| 广平县| 香格里拉县| 靖边县| 井冈山市| 娱乐| 峡江县| 育儿| 西林县| 巴林左旗| 英德市| 宜兰县| 奉新县| 芜湖县| 湘潭市| 日照市| 邳州市| 泾源县|