練繼建, 張 玥, 趙 新
(1.天津大學 水利工程仿真與安全國家重點實驗室, 天津 300350; 2.天津大學 建筑工程學院, 天津 300350)
南水北調中線工程是解決我國水資源分布不均問題的戰(zhàn)略性特大型跨流域調水工程,提高南水北調中線工程冬季輸水效率迫在眉睫[1-4]。輻射和氣溫是影響水溫及冰情變化的重要因素[5-8],其中冬季輸水氣象特征指標是反映冰情產生和發(fā)展的重要指標[9-11],常見的冬季輸水氣象特征指標有最低氣溫出現(xiàn)日、氣溫穩(wěn)定轉負日及穩(wěn)定負溫持續(xù)時間等。對于河渠水流而言,當氣溫穩(wěn)定低于0 ℃后,水體處于持續(xù)失熱的狀態(tài),冰情開始產生、發(fā)展并最終逐漸趨于穩(wěn)定;當氣溫升高轉正時,水體吸收熱量逐漸升溫,進入開河期。在最低氣溫日前后冰情發(fā)展較為迅速,可以反映出整個冰期的發(fā)展強度。更準確地了解輻射及氣溫的變化規(guī)律并對氣象特征指標進行預測對于提高冬季輸水效率有著重要意義[12-14]。
現(xiàn)有的冬季輸水氣象特征指標分析及預測研究基本都建立在公歷時間坐標系上,多年來中國傳統(tǒng)歷法在氣象、水文、農業(yè)和生活中的應用經驗證明其在氣象規(guī)律分析及預測中可能有更好的表現(xiàn),這為開展氣象特征指標預測提供了新思路[15]?,F(xiàn)在世界上常用的歷法有許多,如公歷、伊斯蘭歷、佛歷、伊朗歷和農歷等[16-17],我國常用歷法為公歷、陰歷、干支歷和農歷[18]。陰歷年稱為平均歷年,以月相朔望變化周期為一個月,地月關系的變化對小區(qū)域氣象影響很大;干支歷為陽歷,將太陽回歸年劃分為二十四節(jié)氣,依據(jù)歷年氣候變化總結劃分,更加直觀地表現(xiàn)了一年四時氣候的進展與演變,如春分、秋分、夏至和冬至反映了太陽高度的變化;農歷為陰陽歷,是基于天文運行規(guī)律的、適應于我國氣候氣象變化的歷法[19-20],陰歷和陽歷兩部分分別運算同時通過設置閏月來進行協(xié)調[21- 22]。
冬至日作為干支歷的起點[23],在傳統(tǒng)氣候變化預測中有重要意義。如“冬至在月頭, 大寒年夜交;冬至在月中,天寒也無霜;冬至在月尾,大寒正二月?!泵枋隽硕寥盏年帤v日期的早晚與寒冷天氣來臨早晚的關系,冬至過后進入數(shù)九寒天,數(shù)九歌[24]直接反映了氣候冰情發(fā)展變化的情況。所以,基于中國傳統(tǒng)歷法坐標對冬季輸水氣象特征指標進行分析和預測為研究氣象規(guī)律提供了一個更好的方向。在中國傳統(tǒng)歷法坐標基礎上建立氣象預測模型的研究已有一定探索,如王濤等[25]建立了經Levenberg-Marquardt算法改進的BP神經網絡模型,對比了氣溫穩(wěn)定轉負日期預測能力在干支歷坐標系和公歷坐標系下的區(qū)別,表明干支歷對氣象預測有明顯優(yōu)越性。因此,進一步分析中國傳統(tǒng)歷法坐標系下冬季輸水氣象特征指標變化規(guī)律,分析氣象特征指標與入冬前氣溫之間的相關性,對比干支歷、陰歷與公歷坐標系的氣象特征指標預測結果,對提高冬季氣象預測準確度有重要意義。
隨著機器學習的不斷發(fā)展和研究的逐漸深入,氣象預測開始進入機器學習算法預測時代[26-30]。其中的一種循環(huán)神經網絡RNN (recurrent neural network)模型展現(xiàn)出其在時間序列數(shù)據(jù)處理問題上的巨大優(yōu)勢,其變體長短期記憶LSTM (long short-term memory)模型更是改進了RNN長期依賴能力的不足和存在梯度消失等缺點[31-34]。現(xiàn)有研究已經證明利用LSTM模型進行氣象預測的可行性較強、準確性較好[35]。
本文以南水北調中線冰情出現(xiàn)較早且形勢較為嚴峻的邢臺站、保定站和北京站為研究對象,分別建立以公歷、干支歷和陰歷為時間軸的3種坐標系,分析冬季輸水氣象特征指標在不同歷法下的變化規(guī)律,對比各歷法下入冬前氣溫值與當年冬季輸水氣象特征指標之間的相關性,并建立LSTM氣象預測模型對比不同歷法下氣象特征指標預測能力的優(yōu)劣。
氣象數(shù)據(jù)來源于國家氣象科學數(shù)據(jù)中心(http://data.cma.cn),太陽輻射數(shù)據(jù)選用2018-2021年滹沱河倒虹吸、漕河渡槽渠段和北拒馬河暗渠前渠段3測站實測值,氣溫數(shù)據(jù)選用1994-2020年南水北調沿線邢臺站 (53798)、保定站 (54602) 和北京站 (54511) 3站實測值。圖1為2018-2021年滹沱河倒虹吸、漕河渡槽渠段和北拒馬河暗渠前渠段3測站輻射實測值,圖2為1994-2020年南水北調沿線邢臺、保定和北京3站氣象特征指標最低氣溫出現(xiàn)日、氣溫穩(wěn)定轉負日及穩(wěn)定負溫持續(xù)時間統(tǒng)計情況。
圖1 2018-2021年3測站冬季輻射量實測值
圖2 1995-2020年3站氣象特征指標統(tǒng)計情況
為了進一步分析穩(wěn)定負溫持續(xù)時間在不同典型年下的變化特征,根據(jù)最新頒布的《暖冬等級》(GB/T 21983—2020)[36]及《冷冬等級》(GB/T 33675—2017)[37]規(guī)范分別劃分1995-2020年邢臺站、保定站及北京站冬季典型年狀態(tài),結果如圖3所示。
圖3 1995-2020年3站典型年劃分
圖4為2018-2021年每年12月-次年2月3測站上界直接輻射計算值曲線。從圖4可以發(fā)現(xiàn),各年份3測站的輻射最低值均出現(xiàn)在冬至日前后。在一個回歸年中,冬至日是太陽直射點到達地球南回歸線開始北返的轉折點,我國領土位于地球北半球,輻射值會在冬至日左右達到最低,日照時數(shù)在冬至日最少。
圖4 2018-2021年每年12月-次年2月3測站上界直接輻射計算值曲線
輻射是影響氣溫的重要原因之一,輻射量的減少會造成氣溫明顯下降。冬至日作為年輻射最低值的標志日,可能對年統(tǒng)計氣象特征指標變化規(guī)律有特殊意義,因而干支歷冬至日與陰歷歷時之間的關系值得關注。圖5為邢臺站、保定站和北京站在陰歷坐標下最低氣溫出現(xiàn)日與當年冬至日在陰歷坐標系中歷時的關系。由圖5可以看出,若當年冬至日在陰歷上的日期較早,則最低氣溫出現(xiàn)日也較早;若當年冬至日在陰歷上的日期較晚,則最低氣溫出現(xiàn)日同樣較晚,在陰歷坐標下,最低氣溫日出現(xiàn)時間的早晚變化與當年冬至日出現(xiàn)的早晚步調一致。冬至日前后輻射值達全年最低,冬至日出現(xiàn)的早晚意味著輻射最低值出現(xiàn)的早晚。冬至日在陰歷冬月(農歷十一月)內不斷變化,結合輻射對氣溫的影響作用,冬月的氣溫值及其變化走向在一定程度上可以反映出冬季低溫期來臨的早晚。
圖5 1995-2020年陰歷坐標下最低氣溫出現(xiàn)日與當年冬至日關系
圖6為1995-2020年3站各類冬季典型年氣溫穩(wěn)定轉負日和穩(wěn)定負溫持續(xù)天數(shù)。由圖6可得,以冬至日為時間界限,在同種典型年狀態(tài)下,如果氣溫穩(wěn)定轉負日出現(xiàn)在冬至日之前,則穩(wěn)定低溫持續(xù)時間通常較長;如果氣溫穩(wěn)定轉負日出現(xiàn)在冬至日之后,穩(wěn)定低溫持續(xù)時間則相對較短。冬至日前后輻射值較低,這時氣溫如果已經進入負溫狀態(tài),則大氣通過太陽輻射獲得熱量較少,會導致穩(wěn)定負溫持續(xù)時間較長。冬至日前氣溫狀態(tài)及變化趨勢在一定程度上預示著氣溫未來的變化形勢。以上分析表明,冬至日前及陰歷初的氣溫值及變化形勢在氣溫變化分析及預測中具有獨特的意義。
圖6 1995-2020年各類冬季典型年狀態(tài)下3站氣溫穩(wěn)定轉負日和穩(wěn)定負溫持續(xù)天數(shù)
由3.1節(jié)分析可知,中國傳統(tǒng)歷法坐標系下氣溫有著更加明顯的變化規(guī)律,為了確定傳統(tǒng)歷法坐標系下入冬前氣溫數(shù)據(jù)與冬季輸水氣象特征指標之間是否存在更好的內在關系,分別建立公歷坐標系、干支歷坐標系和陰歷坐標系進行相關性分析。當相關性分析的自變量為多元自變量時,采用復相關分析模型(最小二乘法),相關性程度的描述選用決定系數(shù)及修正決定系數(shù)共同表示。
設置因變量1995-2020年26 a冬季輸水氣象特征指標為yn,其中n為1,2,…,j;自變量氣溫數(shù)據(jù)為xmn,其中m為1,2,…,i,即x1n,x2n,…,xin(單位:℃);權重分別為b1,b2,…,bi,建立多元線性回歸模型如下:
(1)
決定系數(shù)R2計算公式為:
(2)
(3)
以當年入冬前氣溫數(shù)據(jù)為自變量元素,氣溫數(shù)據(jù)的時間起點和選用天數(shù)的不同會獲得不同的相關性分析結果。為了尋找更優(yōu)的相關性分析影響因子集,本研究分別選擇不同天數(shù)的氣溫數(shù)據(jù):即10、15和20 d,同時根據(jù)不同歷法選擇不同日期起點進行分析來確定相關性最好的影響因子選取方案。公歷坐標系下12-次年2月為冬季,因此選擇其12月1日前45 d的氣溫數(shù)據(jù);干支歷坐標系選擇冬至日前45 d的氣溫數(shù)據(jù);陰歷坐標系選擇臘月初一前45 d的氣溫數(shù)據(jù)。以邢臺站為例,不同時間起點不同選用天數(shù)的公歷坐標系下、干支歷坐標系下及陰歷坐標系下各氣象特征指標影響因子選取方案結果對比見圖7~9。
圖8 邢臺站干支歷坐標系各氣象特征指標影響因子選取方案結果對比圖
圖9 邢臺站陰歷坐標系各氣象特征指標影響因子選取方案結果對比圖
以上結果表明,時間長度為15 d氣溫數(shù)據(jù)構成的相關性分析因子集與冬季輸水氣象特征指標的相關性更強。以公歷坐標系下11月1日-11月15日、干支歷坐標系下冬至日前5~20 d及陰歷坐標系下十月二十-冬月初五構成的相關性分析影響因子集與冬季最低氣溫出現(xiàn)日、氣溫穩(wěn)定轉負日和穩(wěn)定負溫持續(xù)時間之間的相關關系均較強。
為了更直觀、更有代表性地對比不同歷法下入冬前氣溫數(shù)據(jù)與冬季輸水氣象特征指標之間相關性的優(yōu)劣,3站各氣象特征指標均選擇公歷坐標系下11月1日-11月15日、干支歷坐標系下冬至日前5~20 d及陰歷坐標系下十月二十-冬月初五構成的相關性分析影響因子集進行相關性分析。表1為邢臺、保定和北京3站最低氣溫出現(xiàn)日、氣溫穩(wěn)定轉負日及穩(wěn)定負溫持續(xù)時間在3個坐標系下相關性分析結果表。
如表1所示,陰歷坐標系下3站最低氣溫出現(xiàn)日、氣溫穩(wěn)定轉負日和穩(wěn)定負溫持續(xù)時間與其相關性分析影響因子的相關性均更強,其中僅保定站的穩(wěn)定負溫持續(xù)時間在干支歷坐標系下與其相關性分析影響因子的相關性更強。這一結果表明陰歷坐標系下入冬前氣溫值及其變化趨勢與當年冬季輸水氣象特征指標有更強的相關關系,干支歷坐標系次之,公歷坐標系較差。利用陰歷坐標系構建冬季氣象分析模型,能夠更好地利用入冬前氣溫判斷當年冬季氣象、冰情的變化形勢。
表1 3站各氣象特征指標在不同坐標系下的相關性分析結果
相關性分析體現(xiàn)了利用農歷作為冬季輸水氣象特征指標預測時間坐標來改善預測結果的可行性。所以,在農歷時間軸坐標系下建立預測模型是具有探索意義的。
長短期記憶(LSTM)模型基本結構與循環(huán)神經網絡(RNN)模型大致相同,為了解決長時間工況模擬存在短期依賴的問題,增設了門控結構,包括遺忘門、輸入門、輸出門,來控制信息選擇性輸入[32]。圖10為LSTM基本結構,其中,A為重復結構,X為輸入項,h為記憶單元輸出項;矩形為神經網絡層,圓形為運算操作,箭頭為信息傳遞與合成。
圖10 LSTM結構示意圖
LSTM模型具體工作原理表達式如下:
ft=σ(Wf·[ht-1,xt]+bf)
(4)
it=σ(Wi·[ht-1,xt]+bi)
(5)
(6)
(7)
Ot=σ(Wo·[ht-1,xt]+bo)
(8)
ht=Ot·tanh(Ct)
(9)
式中:ft、it、Ot分別為t時刻遺忘門、輸入門、輸出門的輸出值[32];Wf、Wi、Wc、Wo為權重值;bf、bi、bc、bo為偏置向量,即網絡需要學習的參數(shù)。遺忘門判斷信息是否舍棄。輸入門決定要往Memory Cell中保存新信息的內容。輸出門決定了輸出信息的取舍。
在Python平臺的Keras框架下訓練LSTM模型。在構建LSTM預測模型的過程中,通過引入Adma 優(yōu)化器來提高機器學習的訓練速率及收斂速率,實現(xiàn)梯度下降。通過調節(jié)訓練集維度并引入Dropout層很好地解決了過擬合現(xiàn)象。為了解決數(shù)據(jù)量綱不一致的問題,引入歸一化的方法對數(shù)據(jù)進行處理。模型各項設置值見表2。
表2 LSTM模型設置
預測模型的學習數(shù)據(jù)選用1994-2017年氣溫數(shù)據(jù)及冬季輸水氣象特征指標,預測目標為2018-2020年3 a的最低氣溫出現(xiàn)日、氣溫穩(wěn)定轉負日及穩(wěn)定負溫持續(xù)時間。結合相關性分析,為了使預測更具有統(tǒng)一性、代表性和強對比性,預測模型分別以公歷11月1日、干支歷坐標下冬至日前第20 d、陰歷十月二十為時間軸基準點來建立坐標系。構建LSTM模型對3項氣象特征指標進行預測,表3為2018-2020年3站各氣象特征指標預測誤差(預測日期不滿1 d的情況認為過滿這1 d)。為了更明顯更直觀地對比不同坐標系之間的預測結果,將3個坐標系預測的結果日期均推導至同一時間坐標系下,與實測日期做差,直接對比預測誤差。經對比選出3站各預測年份各氣象特征指標預測誤差最小值,在表3中以粗體顯示。
表3 2018-2020年3站各氣象特征指標預測誤差 d
由表3可知,在最低氣溫出現(xiàn)日的預測試驗中,公歷坐標系預測結果僅在2020年的北京站與陰歷相同,但未更優(yōu)。在氣溫穩(wěn)定轉負日的預測試驗中,公歷坐標系預測結果僅在2019年的北京站與干支歷及陰歷誤差絕對值相同,均為與實際日期相差1 d。在穩(wěn)定負溫持續(xù)時間的預測試驗中,公歷坐標系預測結果與陰歷相同的概率為33%,但未更優(yōu)。結合表3標粗數(shù)據(jù),分別統(tǒng)計3個坐標系下各氣象特征指標預測結果能夠達到每個站點歷年預測結果最優(yōu)解的概率,如表4所示。
表4 各氣象特征指標預測結果達到最優(yōu)解的概率 %
表4表明,陰歷坐標系下3項冬季輸水氣象特征指標預測結果的誤差均能夠達到多次試驗綜合最優(yōu)解,具有明顯的優(yōu)越性。綜上分析可以看出,以陰歷為時間坐標軸建立預測體系時,冬季輸水氣象特征指標的預測結果更加準確,與相關性分析的結論相同。
對于預測結果的綜合評價指標采用均方誤差RMSE,公式如下:
(10)
RMSE值越小,則表明預測結果越好。將各站點各氣象特征指標的預測結果進行RMSE評價,評價結果見表5。
表5 3站各氣象特征指標預測值RMSE評價結果 d
從表5可以看出,同一特征指標同一站點的預測結果RMSE值在陰歷坐標系下最小,干支歷與公歷的RMSE值相差較小,干支歷RMSE值總體較公歷更小。均方差的結果同樣體現(xiàn)了以陰歷為時間坐標軸的模型在氣象預測模型中的優(yōu)越性。
陰歷坐標系下,各項氣象特征指標3站點RMSE均值大小關系為: 穩(wěn)定負溫持續(xù)時間>氣溫穩(wěn)定轉負日>最低氣溫出現(xiàn)日,顯示出最低氣溫出現(xiàn)日的可預測性最強,氣溫穩(wěn)定轉負日次之,穩(wěn)定負溫持續(xù)時間可預見性最差。說明利用入冬前氣溫數(shù)據(jù)對當年冬季輸水氣象特征指標進行預測時,特殊時間點的預測試驗具有更高的精度。
對比表6中邢臺站、保定站和北京站預測結果RMSE平均值可以發(fā)現(xiàn),北京站預測結果最優(yōu),保定站次之,邢臺站最差。這說明越靠北的地方寒冷天氣出現(xiàn)日期、持續(xù)時間及寒冷程度的突變性越小,冬季輸水氣象特征指標的可預見性越強;處于寒潮南下邊緣影響區(qū)的冬季氣象變化規(guī)律越不明顯,預測難度越大。
表6 各氣象特征指標在不同站點下RMSE平均值 d
最低氣溫出現(xiàn)日、氣溫穩(wěn)定轉負日和穩(wěn)定負溫持續(xù)時間3項冬季輸水氣象特征指標是影響冬季渠道冰情產生和發(fā)展的重要因素,實現(xiàn)上述氣象特征指標的準確預測對提高冬季渠道輸水效率有著重要意義。傳統(tǒng)歷法自古以來在農業(yè)、水利上的優(yōu)秀表現(xiàn)啟發(fā)了將農歷應用在冬季輸水問題中的探索。本文對比了不同歷法下入冬前氣溫與冬季輸水氣象特征指標間的相關性,并利用LSTM預測模型對公歷、干支歷和陰歷3種坐標系下冬季輸水氣象特征指標進行預測,來研究不同歷法對冬季輸水氣象特征指標分析和預測的影響。本文主要結論如下:
(1)不同時間起點和不同時間長度構成的入冬前氣溫數(shù)據(jù)集與冬季輸水氣象特征指標的相關性分析結果顯示:選擇15 d的氣溫數(shù)據(jù)作為影響因子較10和20 d氣溫數(shù)據(jù)構成的影響因子的相關性分析結果更好,3站用公歷坐標系下11月1日-11月15日、干支歷坐標系下冬至日前5-20 d及陰歷坐標系下十月二十-冬月初五構成的相關性分析影響因子集與3項氣象特征指標的相關性分析結果均較優(yōu)。
(3)利用LSTM模型對2018-2020年3站點3項冬季輸水氣象特征指標進行預測的結果表明:3項氣象特征指標預測結果在陰歷坐標系下預測誤差最小、RMSE值最小,預測結果比公歷坐標系和干支歷坐標系更準確。
(4)陰歷坐標系下3項冬季輸水氣象特征指標預測結果顯示了最低氣溫出現(xiàn)日具有較好的可預見性,表現(xiàn)了利用入冬前氣溫數(shù)據(jù)進行氣象特征指標預測時,時間點的可預見性較時間段更強。
(5)對于緯度較高的地區(qū),冬季寒潮降臨時間及寒冷程度突變性更小,冬季輸水氣象特征指標可預見性更高,而緯度偏低的地區(qū),寒冷空氣變化復雜,影響因素繁多,可預見性較差。
綜上所述,以陰歷為坐標時間軸對冬季輸水氣象特征指標進行分析和預測在各歷法分析及預測能力中具有明顯的優(yōu)越性,可以利用陰歷對氣候變化和冰情發(fā)展進行探索。在構建氣象、冰情預測模型的過程中,可以通過利用陰歷作為時間坐標的方法大幅提高預測模型的準確性。