崔 震,郭生練,王 俊,,張 俊,周研來(lái)
(1.武漢大學(xué) 水資源與水電工程科學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430072;2.長(zhǎng)江水利委員會(huì)水文局,湖北 武漢 430010)
隨著人工智能技術(shù)快速發(fā)展,出現(xiàn)了能夠有效處理非線性、非穩(wěn)態(tài)時(shí)間序列的深度學(xué)習(xí)模型。長(zhǎng)短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)是最具代表性的模型之一[1],相較于傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò),它有更先進(jìn)的理論基礎(chǔ)和模型結(jié)構(gòu),能夠在多時(shí)段洪水預(yù)報(bào)中取得較好的預(yù)報(bào)精度[2]。但深度學(xué)習(xí)模型缺少物理機(jī)制支撐,可解釋性較低[3-4],而且無(wú)法量化預(yù)報(bào)不確定性,預(yù)報(bào)價(jià)值和可靠度較低[5]。
近年來(lái),概念性水文模型與深度學(xué)習(xí)耦合的混合模型引起水文學(xué)者的廣泛關(guān)注[6-9]?;旌夏P涂梢栽谏窠?jīng)網(wǎng)絡(luò)中學(xué)習(xí)概念性模型的產(chǎn)匯流過(guò)程,一定程度上提高了LSTM模型的可解釋性和預(yù)報(bào)精度。隨著深度學(xué)習(xí)的研究不斷深入,出現(xiàn)了可以解決序列到序列問(wèn)題的編碼-解碼結(jié)構(gòu)[9]。耦合遞歸編碼-解碼(RED)結(jié)構(gòu)的LSTM-RED神經(jīng)網(wǎng)絡(luò),可以在編碼和解碼過(guò)程中將前一時(shí)刻提取的有效特征傳遞給后一時(shí)刻[10-12],在保證輸出變量時(shí)間相關(guān)性的前提下,獲得多時(shí)段洪水過(guò)程預(yù)報(bào),具有較高的內(nèi)部可解釋性和適用性[10]。但LSTM-RED模型存在曝光偏差問(wèn)題(即訓(xùn)練和驗(yàn)證過(guò)程不一致問(wèn)題)[11],使得模型性能不穩(wěn)定,在多時(shí)段洪水過(guò)程預(yù)報(bào)的精度不佳。Cui等[11]將新安江(XAJ)模型預(yù)報(bào)流量過(guò)程輸入到解碼過(guò)程中代替遞歸過(guò)程,建立了基于外源輸入編碼-解碼(EDE)結(jié)構(gòu)的XAJ-LSTM-EDE模型,不僅可以學(xué)習(xí)XAJ模型的產(chǎn)匯流過(guò)程,還克服了LSTM-RED模型的曝光偏差問(wèn)題,提高了預(yù)報(bào)精度。
目前,深度學(xué)習(xí)模型輸出形式多為確定性點(diǎn)估計(jì),由于模型參數(shù)、結(jié)構(gòu)和輸入資料等不確定性因素的影響,水文預(yù)報(bào)不可避免地存在不確定性問(wèn)題[13],僅提供點(diǎn)估計(jì)的深度學(xué)習(xí)模型為防洪決策提供的不確定性(或風(fēng)險(xiǎn))信息是有限的。已有研究通過(guò)引入先進(jìn)的不確定性量化技術(shù)或改進(jìn)現(xiàn)有的神經(jīng)網(wǎng)絡(luò)構(gòu)建了深度學(xué)習(xí)概率預(yù)報(bào)模型[8,14-16]?;旌厦芏染W(wǎng)絡(luò)(MDN)是一種可以估計(jì)目標(biāo)變量條件概率分布的神經(jīng)網(wǎng)絡(luò)。MDN將神經(jīng)網(wǎng)絡(luò)與混合密度函數(shù)相結(jié)合,借助神經(jīng)網(wǎng)絡(luò)生成多個(gè)核函數(shù)的權(quán)重和參數(shù),將核函數(shù)按照權(quán)重相加組合為混合密度函數(shù),理論上可以表示任意條件概率分布[15],在能源、氣象等領(lǐng)域獲得廣泛關(guān)注[19-21],其損失函數(shù)依據(jù)最大似然估計(jì)法構(gòu)建[19]。當(dāng)前,多數(shù)深度學(xué)習(xí)概率預(yù)報(bào)研究主要集中在單個(gè)時(shí)間步長(zhǎng)的概率預(yù)報(bào)中,無(wú)法在考慮預(yù)報(bào)洪水過(guò)程時(shí)間相關(guān)性的前提下獲得不確定性估計(jì),缺乏可解釋性和適用性。因此,有必要開展基于混合深度學(xué)習(xí)模型的多時(shí)段洪水過(guò)程概率預(yù)報(bào)研究,實(shí)現(xiàn)實(shí)時(shí)量化預(yù)報(bào)洪水過(guò)程的不確定性,為水庫(kù)防洪調(diào)度等決策提供更多的風(fēng)險(xiǎn)信息。
本文首先將XAJ模型的預(yù)報(bào)流量過(guò)程嵌入XAJ-LSTM-EDE模型的解碼過(guò)程;其次,將MDN耦合至XAJ-LSTM-EDE模型解碼過(guò)程的輸出層以實(shí)現(xiàn)概率分布轉(zhuǎn)換,構(gòu)建XAJ-LSTM-EDE-MDN混合深度學(xué)習(xí)模型;最后,依據(jù)最大似然估計(jì)法構(gòu)建損失函數(shù),以優(yōu)化XAJ-LSTM-EDE-MDN模型的權(quán)重等參數(shù)。本文以陸水和建溪兩個(gè)流域?yàn)榘咐?,?duì)XAJ-LSTM、XAJ-LSTM-EDE和XAJ-LSTM-EDE-MDN模型進(jìn)行對(duì)比驗(yàn)證,并分析了所提模型的不確定性量化性能。
2.1 XAJ-LSTM模型長(zhǎng)短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)由遺忘門、輸入門、更新記憶單元狀態(tài)和輸出門等4個(gè)計(jì)算結(jié)構(gòu)構(gòu)成。XAJ-LSTM模型結(jié)構(gòu)見圖1(a)。XAJ-LSTM模型是將XAJ模型的預(yù)報(bào)流量作為L(zhǎng)STM神經(jīng)網(wǎng)絡(luò)在預(yù)報(bào)時(shí)刻的輸入。其中,XAJ模型參數(shù)率定方法和結(jié)果見文獻(xiàn)[11]。XAJ模型預(yù)報(bào)流量與目標(biāo)輸出變量(即每一預(yù)見期對(duì)應(yīng)的實(shí)測(cè)流量)有較強(qiáng)的相關(guān)性,因此期望其可引導(dǎo)神經(jīng)網(wǎng)絡(luò)產(chǎn)生較合理的預(yù)報(bào)流量過(guò)程。同時(shí),XAJ模型預(yù)報(bào)流量增加了模型輸入數(shù)量,可在一定程度上緩解過(guò)擬合問(wèn)題。XAJ-LSTM模型為單輸出結(jié)構(gòu)(與文獻(xiàn)[3]相似),未在時(shí)間維度上考慮預(yù)報(bào)洪水間的相關(guān)性。
圖1 XAJ-LSTM和XAJ-LSTM-EDE-MDN模型結(jié)構(gòu)圖
2.2 XAJ-LSTM-EDE模型基于外源輸入編碼-解碼結(jié)構(gòu)的XAJ-LSTM-EDE模型由編碼過(guò)程(圖1(b)-(1))和解碼過(guò)程(圖1(b)-(2))構(gòu)成。為克服傳統(tǒng)遞歸編碼-解碼結(jié)構(gòu)的曝光偏差問(wèn)題,將XAJ模型的預(yù)報(bào)流量過(guò)程與解碼過(guò)程相耦合(圖1(b)-(2)虛線框),以替代解碼中的遞歸過(guò)程,使得解碼過(guò)程的輸入始終為編碼過(guò)程提取的重要信息(即圖1(b)-(2)中的中間向量C)和XAJ模型的預(yù)報(bào)流量。XAJ-LSTM-EDE模型可以在考慮輸出變量時(shí)間相關(guān)性的前提下,實(shí)時(shí)預(yù)報(bào)多時(shí)段洪水過(guò)程,相對(duì)XAJ-LSTM模型更具可解釋性和適用性。XAJ-LSTM-EDE模型未考慮預(yù)見期內(nèi)預(yù)報(bào)降雨數(shù)據(jù),為保持輸入變量一致,XAJ-LSTM模型同樣未考慮預(yù)報(bào)降雨數(shù)據(jù),即Pt+m+1~Pt+m+n為0 mm。
2.3 混合深度學(xué)習(xí)模型本文將MDN耦合至XAJ-LSTM-EDE模型解碼過(guò)程的輸出層,即將XAJ-LSTM-EDE模型解碼過(guò)程隱含層輸出X作為混合密度網(wǎng)絡(luò)(MDN)的輸入,增加了概率預(yù)報(bào)過(guò)程(圖1(b)-(3)),從而構(gòu)建XAJ-LSTM-EDE-MDN混合深度學(xué)習(xí)模型。該模型可以在考慮輸出變量時(shí)間相關(guān)性的前提下,將解碼過(guò)程產(chǎn)生的點(diǎn)估計(jì)轉(zhuǎn)化為概率分布估計(jì),能夠反映預(yù)報(bào)過(guò)程的不確定性,提供更多的風(fēng)險(xiǎn)信息。
XAJ-LSTM-EDE-MDN模型輸出多個(gè)核函數(shù)的權(quán)重w和參數(shù)θ,其中w通過(guò)Softmax函數(shù)進(jìn)行歸一化,以確保核函數(shù)形成有效的分布函數(shù),其他輸出值可通過(guò)適當(dāng)?shù)暮瘮?shù)處理(如指數(shù)函數(shù)),以確保其值在規(guī)定范圍內(nèi)。洪水預(yù)報(bào)序列一般為一維時(shí)間序列,給定XAJ-LSTM-EDE模型隱含層輸出X時(shí),目標(biāo)變量Y的條件概率密度函數(shù)f(Y|θ,X)為
(1)
(2)
(3)
式中:m為核函數(shù)的數(shù)量,一般采用試錯(cuò)法來(lái)確定m,其范圍一般為1~5;函數(shù)φi是第i個(gè)核函數(shù);Yw為MDN對(duì)應(yīng)權(quán)重參數(shù)的輸出信息。
常用的核函數(shù)為高斯核函數(shù),公式為:
(4)
式中:μ為期望值;σ為方差,采用指數(shù)函數(shù)處理,σ=exp(Yσ),以保證為非負(fù)值函數(shù)。
MDN的輸出變量Yf元素個(gè)數(shù)為3m。
(5)
圖2展示了以3個(gè)高斯核函數(shù)為例的MDN計(jì)算過(guò)程示意圖?;旌厦芏群瘮?shù)直接取決于網(wǎng)絡(luò)輸入。神經(jīng)網(wǎng)絡(luò)每次收到新的輸入時(shí),混合密度函數(shù)的參數(shù)都會(huì)發(fā)生變化,這意味著可以獲得目標(biāo)變量的時(shí)變條件分布函數(shù),即時(shí)變的不確定性信息。XAJ-LSTM-EDE-MDN模型的確定性預(yù)報(bào)值為條件分布的期望值,并取95%置信度預(yù)報(bào)區(qū)間量化預(yù)報(bào)不確定性。
圖2 包含3個(gè)高斯核函數(shù)的MDN計(jì)算過(guò)程示意圖
為防止密度泄露等[19]問(wèn)題,采用標(biāo)準(zhǔn)化方法消除各個(gè)特征量綱的影響。
(6)
式中:Z′和Z分別為未標(biāo)準(zhǔn)化和標(biāo)準(zhǔn)化后的變量;μZ和σZ分別為變量的均值和方差。
在訓(xùn)練神經(jīng)網(wǎng)絡(luò)時(shí),采用最大似然估計(jì)法構(gòu)建損失函數(shù)[19]。不同于確定性輸出深度學(xué)習(xí)的損失函數(shù)(如均方誤差和平均絕對(duì)誤差等),XAJ-LSTM-EDE-MDN模型的損失函數(shù)原理是通過(guò)量化目標(biāo)變量在網(wǎng)絡(luò)輸出條件分布函數(shù)f(Y|θ,X)中的概率密度大小來(lái)調(diào)整超參數(shù)。通過(guò)自適應(yīng)矩估計(jì)(Adam)算法使得目標(biāo)變量Y在對(duì)數(shù)似然函數(shù)log(f(Y|θ,X))中概率密度最大。Adam算法在反向傳播算法中,總是朝損失函數(shù)減小速率最快的方向優(yōu)化神經(jīng)網(wǎng)絡(luò)超參數(shù),損失函數(shù)公式為
loss=-log(f(Yi|θi,Xi))
(7)
確定性預(yù)報(bào)結(jié)果采用納什效率系數(shù)(NSE)、徑流總量相對(duì)誤差(RE)和平均絕對(duì)誤差(MAE)三個(gè)指標(biāo)進(jìn)行評(píng)價(jià)[11]。概率預(yù)報(bào)采用平均相對(duì)寬度(RB)、平均覆蓋率(CR)、可靠度(α-index)[13]和連續(xù)排位概率分?jǐn)?shù)(CRPS)[17]四個(gè)指標(biāo)進(jìn)行評(píng)價(jià)。
3.1 陸水流域陸水河是長(zhǎng)江中游的一級(jí)支流(圖3(a)),流域面積約為3950 km2,地處亞熱帶季風(fēng)氣候區(qū),年平均氣溫、降雨量和徑流量分別約為15.5 ℃、1550 mm和30.3億m3。降雨一般集中在4—9月,約占全年降雨量的70%。陸水水庫(kù)位于河谷干流的出口處,水庫(kù)的有效庫(kù)容為4.08億m3,防洪庫(kù)容僅為1.63億m3。由于水庫(kù)防洪庫(kù)容較小,且流域產(chǎn)匯流較快,準(zhǔn)確的洪水預(yù)報(bào)對(duì)陸水水庫(kù)的防洪和水資源管理至關(guān)重要。
圖3 陸水和建溪流域
在陸水流域,收集整理了2012—2019年汛期5月1日—10月31日的數(shù)據(jù),包括17個(gè)測(cè)站的3 h降雨量、3 h蒸發(fā)量和入庫(kù)流量數(shù)據(jù)。采用泰森多邊形法獲得面平均降雨量。2012—2016年的數(shù)據(jù)用作訓(xùn)練模型(訓(xùn)練期),2017—2019年數(shù)據(jù)用作驗(yàn)證模型(驗(yàn)證期)。
3.2 建溪流域建溪河是閩江的支流(圖3(b)),流域面積約為14 787 km2,地處亞熱帶季風(fēng)氣候區(qū),其地形特征以丘陵和山地為主。年平均氣溫、降雨量和徑流量分別約為18 ℃、2000 mm和158億m3。降雨主要集中在4—9月,約占全年降雨量的75%。
在建溪流域,收集整理了2009—2013年汛期4月1日—9月30日的數(shù)據(jù),包括16個(gè)測(cè)站的3 h降雨量、3個(gè)測(cè)站的3 h蒸發(fā)量和七里街水文站的3 h流量數(shù)據(jù)。面平均降雨和蒸發(fā)數(shù)據(jù)采用泰森多邊形法計(jì)算。訓(xùn)練期和驗(yàn)證期分別為2009—2011年和2012—2013年。
3.3 模型輸入及參數(shù)選擇本研究選擇降雨和流量變量作為神經(jīng)網(wǎng)絡(luò)的輸入。通過(guò)不同滯時(shí)的降雨徑流相關(guān)系數(shù)選擇輸入變量,依據(jù)相關(guān)系數(shù)最大時(shí)對(duì)應(yīng)的滯時(shí)可大致估算出流域平均產(chǎn)匯流時(shí)間[8-9],進(jìn)而選擇輸入變量的時(shí)間步數(shù)。由圖4可知,陸水和建溪流域分別在12 h和21 h滯時(shí)的相關(guān)系數(shù)最高,則分別選擇前12 h和前21 h的降雨徑流數(shù)據(jù)作為編碼過(guò)程的輸入,解碼輸入(即外源輸入序列)為XAJ模型的預(yù)報(bào)流量序列,對(duì)滿足實(shí)際需求的3~12 h預(yù)見期預(yù)報(bào)流量分別進(jìn)行確定性預(yù)報(bào)評(píng)價(jià)[8,11]。
圖4 不同滯時(shí)降水與流量相關(guān)系數(shù)
采用試錯(cuò)法確定核函數(shù)個(gè)數(shù)和神經(jīng)網(wǎng)絡(luò)模型的超參數(shù)(如神經(jīng)元數(shù)量、隱藏層層數(shù)、丟失率(dropout)等)。其中,核函數(shù)個(gè)數(shù)、神經(jīng)元數(shù)量和隱藏層數(shù)的優(yōu)選范圍分別為1~5、16~128(間隔為16)和1~5,丟失率優(yōu)選范圍為0.1、0.01和0.001。本文采用Adam算法訓(xùn)練模型。批次(batch)大小和迭代次數(shù)(epochs)分別設(shè)置為120和600。
建立XAJ-LSTM、XAJ-LSTM-EDE和XAJ-LSTM-EDE-MDN三種模型,經(jīng)試算法優(yōu)選計(jì)算,編碼器和解碼器中均選擇采用一層包含64個(gè)神經(jīng)元的LSTM神經(jīng)網(wǎng)絡(luò)。XAJ-LSTM模型選擇采用一層包含64個(gè)神經(jīng)元的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。陸水和建溪流域的MDN均選擇3個(gè)高斯核函數(shù),丟失率優(yōu)選為0.1。在獲得最優(yōu)超參數(shù)后分別訓(xùn)練模型10次,選取結(jié)果最優(yōu)的神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比分析。采用NSE、RE和MAE三個(gè)指標(biāo)來(lái)評(píng)價(jià)各模型確定性預(yù)報(bào)精度。采用CR、RB、α-index和CRPS四個(gè)指標(biāo)評(píng)價(jià)XAJ-LSTM-EDE-MDN模型量化不確定性的性能。
4.1 確定性預(yù)報(bào)結(jié)果評(píng)價(jià)表1顯示了三種模型在陸水和建溪流域的確定性預(yù)報(bào)結(jié)果的評(píng)價(jià)指標(biāo)??梢钥闯?,預(yù)報(bào)精度隨著預(yù)見期的增加而明顯下降。根據(jù)NSE、RE和MAE指標(biāo)可以看出,XAJ-LSTM-EDE和XAJ-LSTM-EDE-MDN模型預(yù)報(bào)性能相近,XAJ-LSTM模型相對(duì)較差。以評(píng)價(jià)指標(biāo)差異較大的驗(yàn)證期12 h預(yù)見期為例進(jìn)行說(shuō)明。
表1 陸水和建溪流域三種模型在訓(xùn)練期和驗(yàn)證期的確定性預(yù)報(bào)結(jié)果的評(píng)價(jià)指標(biāo)
在陸水和建溪流域驗(yàn)證期12 h預(yù)見期中,XAJ-LSTM模型NSE和RE值分別為0.76和-4.30%,0.91和-6.92%;XAJ-LSTM-EDE模型分別為0.81和0.97%,0.93和-2.10%;XAJ-LSTM-EDE-MDN模型分別為0.80和-0.48%,0.93和-4.34%。XAJ-LSTM-EDE-MDN和XAJ-LSTM-EDE模型12 h預(yù)見期的預(yù)報(bào)性能明顯優(yōu)于XAJ-LSTM模型。
圖5和圖6分別為XAJ-LSTM、XAJ-LSTM-EDE和XAJ-LSTM-EDE-MDN模型在陸水和建溪流域的散點(diǎn)圖。R1和R2分別表示訓(xùn)練期和驗(yàn)證期散點(diǎn)圖的相關(guān)系數(shù)。在陸水流域,驗(yàn)證期有較多高流量點(diǎn)在1∶1線以下,這可能因?yàn)橛?xùn)練期樣本缺少驗(yàn)證期大量級(jí)的流量樣本,導(dǎo)致各模型低估驗(yàn)證期的高流量點(diǎn)。同時(shí),在6 h和12 h預(yù)見期的散點(diǎn)圖差異明顯。如圖5所示,XAJ-LSTM-EDE和XAJ-LSTM-EDE-MDN模型的散點(diǎn)分布相對(duì)緊湊,更接近1∶1理想線。建溪流域不同模型的散點(diǎn)圖差異較小。在12 h預(yù)見期內(nèi),XAJ-LSTM-EDE-MDN模型在高流量處的散點(diǎn)相對(duì)最接近1∶1的理想線(圖6(f)),驗(yàn)證期相關(guān)系數(shù)為0.96。因此,可以得出結(jié)論XAJ-LSTM-EDE和XAJ-LSTM-EDE-MDN模型的散點(diǎn)圖相對(duì)最優(yōu),XAJ-LSTM模型的散點(diǎn)圖相對(duì)最差。
圖5 陸水流域三種模型在預(yù)見期6 h和12 h的實(shí)測(cè)流量(Qo)和預(yù)報(bào)流量(Qf)散點(diǎn)圖
圖6 建溪流域三種模型在預(yù)見期6 h和12 h的實(shí)測(cè)流量(Qo)和預(yù)報(bào)流量(Qf)散點(diǎn)圖
4.2 不確定性量化性能評(píng)價(jià)表2列出了XAJ-LSTM-EDE-MDN模型概率預(yù)報(bào)的評(píng)價(jià)指標(biāo)。隨著預(yù)見期的延長(zhǎng),CR值逐漸減小,RB值和CRPS值逐漸增加,表明預(yù)報(bào)不確定性逐漸增大,概率預(yù)報(bào)性能不斷降低。在訓(xùn)練期和驗(yàn)證期,XAJ-LSTM-EDE-MDN模型的CR值均接近或超過(guò)95%置信度,表明置信區(qū)間是合理可靠的。
表2 XAJ-LSTM-EDE-MDN模型在陸水和建溪流域的概率預(yù)報(bào)評(píng)價(jià)指標(biāo)
根據(jù)反映概率預(yù)報(bào)可靠性的α-index指標(biāo)可知,XAJ-LSTM-EDE-MDN模型的α-index值均超過(guò)0.93,并接近理想值1,其中,在陸水和建溪流域的驗(yàn)證期分別為0.93~0.97和0.93~0.96,這表明所提模型的概率預(yù)報(bào)能夠較好地捕捉預(yù)報(bào)不確定性,進(jìn)一步反映了概率預(yù)報(bào)結(jié)果是合理可靠的。根據(jù)反映概率預(yù)報(bào)整體性能的CRPS指標(biāo)可知,在陸水和建溪流域的CRPS值始終小于確定性期望值預(yù)報(bào)的MAE值,在驗(yàn)證期降幅分別在23.08%~25.93%和26.17%~26.83%范圍內(nèi),這表明所提模型可以有效擬合目標(biāo)變量的真實(shí)分布函數(shù)。
為進(jìn)一步驗(yàn)證模型的預(yù)報(bào)性能,在陸水和建溪流域的驗(yàn)證期分別隨機(jī)選取兩場(chǎng)洪水過(guò)程。圖7和圖8分別為陸水和建溪流域的洪水預(yù)報(bào)置信區(qū)間圖。
圖7 XAJ-LSTM-EDE-MDN模型在陸水流域2017/6/12 T5∶00-6/15 T2∶00洪水事件的置信區(qū)間圖
圖8 XAJ-LSTM-EDE-MDN模型在建溪流域2012/5/3 T3∶00-5/6 T21∶00洪水事件的置信區(qū)間圖
從圖7可以看出,XAJ-LSTM-EDE-MDN模型在陸水流域6 h預(yù)見期可以較好地?cái)M合實(shí)測(cè)流量,置信區(qū)間覆蓋全部實(shí)測(cè)流量點(diǎn),且區(qū)間寬度較窄,表明置信區(qū)間可以較好地反映預(yù)報(bào)不確定性。12 h預(yù)見期的預(yù)報(bào)洪水?dāng)M合效果有所下降,在漲水過(guò)程出現(xiàn)較大幅度波動(dòng),但仍然可以較為準(zhǔn)確地預(yù)報(bào)洪峰及峰現(xiàn)時(shí)間;置信區(qū)間逐漸變寬,表明預(yù)報(bào)不確定性逐漸增大,但覆蓋率仍接近95%。
如圖8所示,XAJ-LSTM-EDE-MDN模型在建溪流域6 h預(yù)見期具有較好的預(yù)報(bào)效果。隨著預(yù)見期的延長(zhǎng),在12 h預(yù)見期,預(yù)報(bào)洪水過(guò)程線擬合效果降低,并高估了洪峰,預(yù)報(bào)峰現(xiàn)時(shí)間滯后兩個(gè)時(shí)段,但仍然可以較好地?cái)M合退水過(guò)程;置信區(qū)間變寬,表明預(yù)報(bào)不確定性增加,但仍能覆蓋大多數(shù)實(shí)測(cè)流量點(diǎn)。
4.3 分析討論根據(jù)前述評(píng)價(jià)指標(biāo)可知,XAJ-LSTM-EDE-MDN模型可以在不降低XAJ-LSTM-EDE模型預(yù)報(bào)精度的前提下,獲得相對(duì)較為可靠的概率預(yù)報(bào)。該模型的優(yōu)勢(shì)包括:
(1)無(wú)須假設(shè)分布函數(shù)。所提模型通過(guò)神經(jīng)網(wǎng)絡(luò)調(diào)整多個(gè)核函數(shù)的權(quán)重和參數(shù)來(lái)擬合條件分布函數(shù),可以避免分布函數(shù)假設(shè)。
(2)目標(biāo)變量條件分布中核函數(shù)的參數(shù)和權(quán)重可以隨模型輸入變化,提高了應(yīng)對(duì)不同量級(jí)流量概率預(yù)報(bào)的適應(yīng)性。
(3)XAJ-LSTM-EDE-MDN模型具有較高的預(yù)報(bào)精度,并可直接量化洪水過(guò)程預(yù)報(bào)的不確定性,為防洪減災(zāi)決策提供有效的風(fēng)險(xiǎn)信息。
本研究也存在幾個(gè)不足,包括:
(1)因增加了MDN概率預(yù)報(bào)過(guò)程,模型訓(xùn)練成本有所增加;采用試錯(cuò)法優(yōu)選網(wǎng)絡(luò)參數(shù),計(jì)算效率較低。
(2)條件密度函數(shù)可能更傾向于產(chǎn)生集中度高的概率預(yù)報(bào)性能,這一現(xiàn)象可能與訓(xùn)練神經(jīng)網(wǎng)絡(luò)使用的損失函數(shù)有關(guān)。采用目標(biāo)變量在條件分布函數(shù)中的概率盡可能大作為網(wǎng)絡(luò)訓(xùn)練標(biāo)準(zhǔn),可能使神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的條件密度函數(shù)更加尖銳。
(3)將XAJ模型預(yù)報(bào)流量作為外源輸入是在深度學(xué)習(xí)可解釋性方面的初步嘗試,距離在內(nèi)部結(jié)構(gòu)或參數(shù)中實(shí)現(xiàn)物理意義上的解釋,還有很多工作需要進(jìn)一步研究。
本研究提出了一種新的深度學(xué)習(xí)概率預(yù)報(bào)模型,將不確定性量化層(MDN層)耦合至XAJ-LSTM-EDE模型的輸出層,構(gòu)建了可以量化預(yù)報(bào)不確定性的XAJ-LSTM-EDE-MDN模型。并以XAJ-LSTM和XAJ-LSTM-EDE模型為基準(zhǔn)模型,從確定性預(yù)報(bào)和不確定性量化性能兩個(gè)方面分析了所提模型的有效性。結(jié)論如下所示。
(1)根據(jù)NSE、RE和MAE指標(biāo)可以看出,XAJ-LSTM-EDE-MDN模型可以獲得與XAJ-LSTM-EDE模型相近的預(yù)報(bào)性能,并優(yōu)于XAJ-LSTM模型的預(yù)報(bào)性能。
(2)XAJ-LSTM-EDE-MDN模型可以獲得覆蓋率接近95%置信水平的置信區(qū)間,同時(shí)根據(jù)α-index和CRPS指標(biāo),XAJ-LSTM-EDE-MDN模型的概率預(yù)報(bào)結(jié)果是合理可靠的,可以有效反映預(yù)報(bào)不確定性,并能產(chǎn)生相對(duì)接近預(yù)報(bào)量真實(shí)分布的條件分布。
(3)在深度學(xué)習(xí)模型中采用混合密度網(wǎng)絡(luò)逼近后驗(yàn)分布是可行的,XAJ-LSTM-EDE-MDN模型可以獲得時(shí)變的不確定性信息,且無(wú)須假設(shè)分布函數(shù)。
后續(xù)研究可集中于參數(shù)優(yōu)化算法和探討洪水過(guò)程概率預(yù)報(bào)在調(diào)度中的應(yīng)用等,并對(duì)流域滯時(shí)和預(yù)見期長(zhǎng)度對(duì)預(yù)報(bào)精度的影響進(jìn)行研究。同時(shí),還可探討在深度學(xué)習(xí)模型的損失函數(shù)中加入額外約束,使得概率預(yù)報(bào)性能兼顧可靠性和集中度。