羅宇 羅林艷 范嘉智 段思汝 高文娟
摘要:基于深度長(zhǎng)短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò),分別利用地面氣象多要素(氣溫、氣壓、露點(diǎn)溫度、相對(duì)濕度、水汽壓、小時(shí)降水量)和單要素(水汽壓)建立懷化地區(qū)GPS大氣可降水量估算模型LSTM5和LSTM1,并對(duì)模型精度進(jìn)行分析。結(jié)果表明,利用地面氣象要素建立的2種大氣可降水量深度LSTM模型有較好的估算精度,決定系數(shù)均大于0.94,均方根誤差均值小于1.158 1 mm,平均絕對(duì)誤差均值小于0.709 9 mm,平均絕對(duì)百分比誤差均值小于4.54%,較基于水汽壓的可降水量線性擬合或二次多項(xiàng)式擬合模型的估算精度提升了70%以上,且LSTM1模型精度略優(yōu)于LSTM5模型;模型估算精度與大氣可降水量條件相關(guān),當(dāng)可降水量較低或較高時(shí),模型估算結(jié)果更為理想;同時(shí)模型估算精度與觀測(cè)站海拔呈現(xiàn)正相關(guān),觀測(cè)站海拔越高LSTM模型精度越高。
關(guān)鍵詞:LSTM;GPS/MET;大氣可降水量;估算模型;懷化地區(qū)
中圖分類號(hào):TP183? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):0439-8114(2020)02-0161-05
DOI:10.14088/j.cnki.issn0439-8114.2020.02.036? ? ? ? ? ?開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
Estimation model of precipitable water vapor based on deep LSTM neural network
LUO Yu1,LUO Lin-yan2,F(xiàn)AN Jia-zhi1,DUAN Si-ru1,GAO Wen-juan1
(1.China Meteorological Training Center Hunan Branch,Changsha 410125,China;
2.Hunan Provincial Meteorological Information Center,Changsha 410118,China)
Abstract: Based on deep long short term memory(LSTM) neural network, the estimation models (LSTM5 and LSTM1) of precipitable water vapor (PWV) in Huaihua distinct are proposed by using multi(air temperature, air pressure, dew point temperature, relative humidity, water vapor pressure and hourly precipitation) and single factor(water vapor pressure) separately, besides the estimation precision of the models are analyzed. As the result shown, the LSTM models have high estimation precision, whose coefficients of determination are both greater than 0.94, mean values of root square error, mean absolute error and mean absolute percentage error are below 1.158 1 mm, 0.709 9 mm and 4.54% respectively. The precision of LSTM models improves more than 70% compared to linear estimation model or quadratic polynomial estimation based on water vapor pressure, and the precision of LSTM1 model slightly better than that of LSTM5. The distribution of estimation errors relates to PWV value, which is first increased and then decreased along with the increasing of PWV. Furthermore, there is negative correlation between the estimation precision of the models and altitude of the stations.
Key words: LSTM; GPS/MET; atmospheric precipitable water vapor; estimation model; Huaihua area
水汽在大氣中含量雖少,卻影響著能量傳輸、輻射平衡和成云致雨等大氣物理化學(xué)過程,是大氣的重要組成部分,是天氣變化和氣候演變的主要驅(qū)動(dòng)力,也是影響災(zāi)害性天氣形成和發(fā)展的關(guān)鍵性因子[1]。實(shí)際應(yīng)用中,一般采用大氣可降水量(Precipitable water vapor,PWV),即單位面積大氣柱內(nèi)水汽量來表示大氣水汽含量[2]。但大氣水汽變化迅速,時(shí)空分布較為復(fù)雜,作為國(guó)內(nèi)氣象部門常規(guī)探測(cè)手段的無線電探空限于站網(wǎng)分布和觀測(cè)時(shí)次,資料時(shí)空分辨率較低[3]。利用全球?qū)Ш叫l(wèi)星系統(tǒng)(GPS)進(jìn)行大氣水汽探測(cè)技術(shù)的出現(xiàn)彌補(bǔ)了常規(guī)探測(cè)手段的不足,其探測(cè)精度達(dá)毫米級(jí),可提供全天候、高分辨率的水汽信息[4-6]?;贕PS反演的可降水量可以反映特定區(qū)域水汽流入、流出情況,因此廣泛應(yīng)用于氣象數(shù)據(jù)融合、數(shù)值預(yù)報(bào)和降水研究及預(yù)報(bào)等方面[7-9]。湖南省氣象局與湖南省國(guó)土資源廳合作建設(shè)GPS/MET探測(cè)網(wǎng),截至2015年共71個(gè)站點(diǎn)建成并投入業(yè)務(wù)運(yùn)行,為湖南省天氣預(yù)報(bào)、氣候預(yù)測(cè)及氣象防災(zāi)減災(zāi)提供更高時(shí)空分辨率的水汽場(chǎng)。但相較于湖南省近22萬km2土地面積,觀測(cè)站數(shù)量仍相對(duì)較少,大多數(shù)地區(qū)無法直接探測(cè)得到大氣可降水量,因此有必要利用站網(wǎng)密度更大、時(shí)間序列更長(zhǎng)的地面氣象資料估算大氣可降水量。國(guó)內(nèi)外相關(guān)研究表明,地面氣象要素與可降水量之間存在明顯相關(guān)性,可利用地面氣象要素對(duì)可降水量進(jìn)行估算[10-12]。但相關(guān)研究一般利用水汽壓與可降水量進(jìn)行線性擬合或二次多項(xiàng)式建模,未考慮地面氣象要素與可降水量時(shí)間序列上的相關(guān)性。20世紀(jì)80—90年代,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)能以很高的效率對(duì)序列的非線性特征進(jìn)行學(xué)習(xí),而作為RNN變體之一的長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)因可有效解決簡(jiǎn)單RNN的梯度爆炸或消失問題,使其在氣象相關(guān)時(shí)間序列建模和預(yù)測(cè)方面得到廣泛應(yīng)用[13-16]。本研究基于深度LSTM神經(jīng)網(wǎng)絡(luò)模型,利用湖南省懷化市地面氣象數(shù)據(jù)對(duì)GPS可降水量進(jìn)行建模,以改進(jìn)地面氣象要素估算大氣可降水量精度。
1? 資料與方法
1.1? 資料選取
本研究選用湖南懷化地區(qū)沅陵、溆浦、靖州和通道4個(gè)GPS/MET觀測(cè)站逐小時(shí)資料和地面氣象觀測(cè)逐小時(shí)資料(觀測(cè)站位置、海報(bào)高度等信息如表1所示),數(shù)據(jù)時(shí)間為2017年1月1日至2017年12月31日。懷化地處湘中丘陵向云貴高原的過渡地帶,屬中亞熱帶季風(fēng)氣候區(qū),四季分明,雨量充沛,且雨熱同步,對(duì)農(nóng)作物生長(zhǎng)有利。但受地形影響,地域差異和垂直差異明顯,旱澇等自然災(zāi)害時(shí)有發(fā)生。所有數(shù)據(jù)均由全國(guó)綜合氣象信息共享平臺(tái)(CIMISS)上獲取??紤]到地域性差異,在GPS/MET站探測(cè)得到天頂總延遲(ZTD)的基礎(chǔ)上,采用本地化的靜力延遲模型[5]和加權(quán)平均溫度模型[6]反演4個(gè)觀測(cè)站的GPS可降水量。
根據(jù)大氣科學(xué)相關(guān)知識(shí),對(duì)GPS可降水量與各地面氣象要素[氣溫(T)、氣壓(P)、露點(diǎn)溫度(DP)、相對(duì)濕度(RH)、水汽壓(VAP)和小時(shí)降水量(OHP)]進(jìn)行相關(guān)性檢驗(yàn),并計(jì)算相關(guān)系數(shù)如表2所示。由表2可知,除氣壓外,可降水量與氣溫、露點(diǎn)溫度、相對(duì)濕度、水汽壓和小時(shí)降水量均呈正相關(guān),除與相對(duì)濕度和小時(shí)降水量相關(guān)系數(shù)小于0.3,其余相關(guān)系數(shù)均大于0.6。考慮到相關(guān)研究[7-9]表明降水與可降水量存在時(shí)間上的關(guān)聯(lián)性,初步確定特征向量Xt=[x , x ,…,x ]T,其中x ~x 分別為T、P、DP、VAP和OHP,t為某一特定時(shí)刻。考慮時(shí)間窗為48 h,即利用過去47 h和當(dāng)前時(shí)刻的特征向量序列X={x(t-47), x(t-46),…,x(t)}作為輸入,建模當(dāng)前時(shí)刻的可降水量Y={y(t)}。
1.2? 長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)
與簡(jiǎn)單RNN相比,LSTM能夠捕獲任意長(zhǎng)度時(shí)間序列的自回歸結(jié)構(gòu),其在序列建模任務(wù)中取得了廣泛的成功[17-19]。LSTM單元結(jié)構(gòu)如圖1所示,it,ft和ot分別為輸入門、輸出門和遺忘門3種門控,ct為單元間激活向量,ht為存儲(chǔ)了t時(shí)刻及之前時(shí)刻有用信息的隱狀態(tài)向量,其計(jì)算公式依次為式(1)~式(5)。
it=?滓(∑Wx ixt+∑Wh ixt-1+∑Wc ixt-1+bi)? (1)
ft=?滓(∑Wx fxt+∑Wh fxt-1+∑Wc fxt-1+bf)? (2)
ot=?滓(∑Wx oxt+∑Wh oxt-1+∑Wc oxt-1+bo)? (3)
ct=ftct-1+ittanh(∑Wx cxt+∑Wh cxt-1+bc) (4)
ht=ottanh(ct)? (5)
式中,xt為t時(shí)刻輸入向量,W為權(quán)重矩陣,b為對(duì)映權(quán)重偏執(zhí)項(xiàng),σ為sigmoid函數(shù)。
1.3? 數(shù)據(jù)預(yù)處理
地面氣象要素由國(guó)家級(jí)氣象觀測(cè)站獲取,且已經(jīng)過審核,因此數(shù)據(jù)質(zhì)量及連續(xù)性得到保障;GPS/MET數(shù)據(jù)由于供電、網(wǎng)絡(luò)等故障影響,存在少量缺測(cè),利用地面水汽壓線性擬合得到GPS可降水量[8]進(jìn)行補(bǔ)缺,形成4個(gè)觀測(cè)站各8 760個(gè)時(shí)次的觀測(cè)資料時(shí)間序列。相關(guān)研究表明[20,21],氣象數(shù)據(jù)(尤其降水量)時(shí)間序列多為存在較明顯周期和趨勢(shì)的非平穩(wěn)序列,而平穩(wěn)時(shí)間序列相對(duì)更容易分析建模。因此,采用一階差分方法對(duì)4個(gè)觀測(cè)站的時(shí)間序列數(shù)據(jù)平穩(wěn)化。若不對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理可能導(dǎo)致計(jì)算負(fù)擔(dān)增大,甚至模型無法收斂等問題。因此,采用Z-SCORE方法對(duì)各特征向量進(jìn)行標(biāo)準(zhǔn)化處理,使處理后的特征向量分布于(0,1)區(qū)間。
1.4? 大氣可降水量建模
沅陵、溆浦、靖州和通道4個(gè)觀測(cè)站數(shù)據(jù)按9∶1的比例,將數(shù)據(jù)前90%用作訓(xùn)練集,后10%用作測(cè)試集。采用決定系數(shù)(R2)、均方根誤差(RMSE)、平均絕對(duì)誤差(MAE)和平均絕對(duì)百分比誤差(MAPE)對(duì)模型估算值和真實(shí)值偏離程度進(jìn)行度量,其計(jì)算公式如下:
式中,PWVto和PWVtm分別為t時(shí)刻可降水量實(shí)測(cè)值和模型估算值, 為可降水量實(shí)測(cè)平均值。
用于估算大氣可降水量的4層LSTM模型結(jié)構(gòu)如圖2所示。分別采用溫度、氣壓、露點(diǎn)溫度、水汽壓及小時(shí)降水量5個(gè)特征和水汽壓1個(gè)特征作為輸入層的輸入向量(相應(yīng)LSTM模型分別簡(jiǎn)稱LSTM5和LSTM1),各層節(jié)點(diǎn)數(shù)分別為20、15、20和1。LSTM層激活函數(shù)為tanh,Dense層激活函數(shù)為linear,各層節(jié)點(diǎn)丟棄率設(shè)為0.2,以降低節(jié)點(diǎn)間的相互依賴性從而避免過擬合。模型選擇均方差損失函數(shù)獲取模型輸出誤差,模型優(yōu)化方法采用均方根RMSProp算法,學(xué)習(xí)率為0.001,訓(xùn)練迭代次數(shù)為50。研究基于Windows操作系統(tǒng),結(jié)合Python語言和Keras深度學(xué)習(xí)框架中的Sequential模型進(jìn)行。
2? 結(jié)果與分析
利用地面氣象要素基于深度LSTM神經(jīng)網(wǎng)絡(luò)對(duì)懷化地區(qū)4個(gè)觀測(cè)站的GPS可降水量估算建模進(jìn)行訓(xùn)練,并利用測(cè)試集對(duì)模型精度進(jìn)行檢驗(yàn),結(jié)果如表3和圖3(以LSTM1模型為例)所示。由表3可知,沅陵、溆浦、靖州和通道4個(gè)觀測(cè)站的深度LSTM可降水量估算模型決定系數(shù)均大于0.94,LSTM5模型RMSE均值為1.158 1 mm,MAE均值為0.709 9 mm,MAPE均值為4.54%;LSTM1模型RMSE均值為1.130 3 mm,MAE均值為0.670 7 mm,MAPE均值為4.23%。相較于基于水汽壓的可降水量線性擬合或二次多項(xiàng)式擬合模型5 mm的RMSE的估算精度[8,10-12],LSTM模型精度提升了70%以上,且R2、MAE和MAPE指標(biāo)均得到大幅改進(jìn)。LSTM1模型精度略優(yōu)于LSTM5模型,可能是由于LSTM5模型選用的5個(gè)特征因子間存在一定相關(guān)性造成的信息冗余影響模型精度。由圖3可知,除個(gè)別時(shí)次外,可降水量LSTM模型估算值均能較好反映實(shí)際觀測(cè)值,且對(duì)可降水量的轉(zhuǎn)折性變化有較好體現(xiàn),進(jìn)而反映可降水量變化趨勢(shì)。對(duì)比4個(gè)觀測(cè)站LSTM模型估算可降水量精度,可見其與測(cè)站海拔高度呈現(xiàn)正相關(guān),海拔最高的通道站(表1)其大氣可降水量估算RMSE僅為0.847 9 mm,為4個(gè)觀測(cè)站最小。其原因可能是大氣水汽分布隨海拔呈指數(shù)衰減,低海拔地區(qū)水汽更為充沛且變化迅速,增加了模型的訓(xùn)練難度。
3? 小結(jié)
本研究首先利用相關(guān)性檢驗(yàn)分析了大氣可降水量與地面氣象要素的關(guān)系,同時(shí)結(jié)合時(shí)間上的關(guān)聯(lián)性篩選估算可降水量的特征因子;針對(duì)氣象數(shù)據(jù)的非平穩(wěn)序列特性,采取一階差分方法提升序列平穩(wěn)性,并對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理;在此基礎(chǔ)上構(gòu)建了4層的深度LSTM模型,按時(shí)間順序劃分訓(xùn)練集和測(cè)試集,利用訓(xùn)練集對(duì)深度LSTM模型進(jìn)行訓(xùn)練后使用測(cè)試集評(píng)估大氣可降水量的估算精度。
1)基于懷化地區(qū)4個(gè)觀測(cè)站的地面氣象要素,對(duì)大氣可降水量建立的深度LSTM模型,其決定系數(shù)均大于0.94,利用氣溫、氣壓、露點(diǎn)溫度、相對(duì)濕度、水汽壓和小時(shí)降水量作為特征因子建立的LSTM5模型RMSE均值為1.158 1 mm,MAE均值為0.709 9 mm,MAPE均值為4.54%;單獨(dú)利用水汽壓作為特征因子建立的LSTM1模型RMSE均值為1.130 3 mm,MAE均值為0.670 7 mm,MAPE均值為4.23%。較基于水汽壓的可降水量線性擬合或二次多項(xiàng)式擬合模型的估算精度提升了70%以上。LSTM1模型精度略優(yōu)于LSTM5模型,產(chǎn)生該結(jié)果的原因可能是特征因子間存在一定相關(guān)性造成信息冗余進(jìn)而影響模型精度。
2)利用基于深度LSTM的大氣可降水量模型對(duì)懷化地區(qū)4個(gè)觀測(cè)站的PWV進(jìn)行估算,結(jié)果顯示估算誤差分布與大氣可降水量條件相關(guān),誤差較大的樣本多出現(xiàn)在15~25 mm區(qū)間,估算模型的精度隨大氣可降水量的增加呈先降低后升高的趨勢(shì),當(dāng)可降水量較低或較高時(shí),模型估算結(jié)果更為理想。
3)基于深度LSTM的大氣可降水量估算模型精度與觀測(cè)站海拔呈正相關(guān),觀測(cè)站海拔越高LSTM模型精度越高,其原因可能是低海拔地區(qū)水汽更為充沛且變化迅速,增加了模型的訓(xùn)練難度,進(jìn)而降低了模型精度。
參考文獻(xiàn):
[1] BRAUN J,ROCKEN C,WARE R. Validation of line-of-sight water vapor measurements with GPS[J].Radio science,2001,36:259-472.
[2] 李國(guó)平,黃丁發(fā),郭? 潔,等.地基GPS氣象學(xué)[M].北京:科學(xué)出版社,2010.148-150.
[3] WANG H,HE J,WEI M,et al. Synthesis analysis of one severe convection precipitation event in Jiangsu using ground-gased GPS technology[J].Atmosphere,2015,6:908-927.
[4] BEVIS M,BUSINGER S,HERRING T A,et al. GPS meteorology:Remote sensing of atmosphere water vapor using the global positioning system[J].Journal of geophysical research,1992,97(D14):15787-15801.
[5] 羅? 宇,羅林艷,范嘉智,等.天頂靜力延遲模型對(duì)GPS可降水量反演的影響分析及改進(jìn)[J].測(cè)繪工程,2018,27(8):13-17.
[6] 羅? 宇,羅林艷,呂冠儒.加權(quán)平均溫度模型對(duì)GPS水汽反演的影響[J].測(cè)繪科學(xué),2018,43(9):6-9,15.
[7] PRIEGO E,SECO A,JONES J,et al. Heavy rain analysis based on GNSS water vapour content in the Spanish Mediterranean area[J].Meteorological application,2016,23:640-649.
[8] 羅林艷,羅? 宇,段思汝,等.郴州地區(qū)GPS可降水量精度及其變化特征[J].湖北農(nóng)業(yè)科學(xué),2018,57(11):14-18.
[9] 楊璐瑛,劉? 暢,楊成芳,等.不同天氣系統(tǒng)影響下強(qiáng)降雨過程GPS可降水量變化特征對(duì)比[J].干旱氣象,2018,36(3):475-482.
[10] 楊景梅,邱金桓.用地面濕度參量計(jì)算我國(guó)整層大氣可降水量及有效水汽含量方法的研究[J].大氣科學(xué),2002(1):9-22.
[11] 李? 超,魏合理,劉厚通,等.整層大氣水汽含量與地面水汽壓相關(guān)性的統(tǒng)計(jì)研究[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2008,33(11):1170-1173.
[12] 李? 穎,張俊東,羅? 鵬.大氣可降水量估算模型研究[J].氣象與環(huán)境科學(xué),2013,36(2):21-25.
[13] HOCHREITER S,SCHMIDHUBER J. Long short-term memory[J].Neural computation,1997,9(8):1735-1780.
[14] ZHENG D Y,HU W S,WANG J,et al. Research on regional zenith tropospheric delay based on neural network technology[J].Survey review,2014,343(47):286-295.
[15] DING M. A neural network model for predicting weighted mean temperature[J].Journal of geodesy,2018.doi:10.1007/s 00190-018-1114-6.
[16] WANG H,WEI M,ZHOU S H. A feasibility study for the construction of an atmospheric precipitable water vapor model based on the neural network technology[J].Desalination and water treatment,2014,52(37-39):7412-7421.
[17] QING X,NIU Y. Hourly day-ahead solar irradiance prediction using weather forecasts by LSTM[J].Energy,2018,148:461-468.
[18] 徐堯強(qiáng),方樂恒,趙冬華,等.基于LSTM神經(jīng)網(wǎng)絡(luò)的用電量預(yù)測(cè)[J].電力大數(shù)據(jù),2017,20(8):25-29.
[19] ZHANG D,KABUKA M R. Combining weather condition data to predict traffic flow:A GRU-based deep learning approach[J].IET intelligent transport systems,2018,12(7):578-585.
[20] ADIB A,KALAEE M M K,SHOUSHTARI M M,et al. Using of gene expression programming and climatic data for forecasting flow discharge by considering trend, normality,and stationarity analysis[J].Arabian journal of geosciences,2017,10(9):208.
[21] 許家琦,李顏伶,舒? 紅.中國(guó)東北地區(qū)氣象數(shù)據(jù)的空間平穩(wěn)性檢驗(yàn)[J].華中師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,48(2):279-283.
收稿日期:2019-10-18
基金項(xiàng)目:湖南省氣象局面上科研項(xiàng)目(XQKJ19B053)
作者簡(jiǎn)介:羅? 宇(1984-),男,四川巴中人,高級(jí)工程師,主要從事大氣遙感與探測(cè)研究,(電話)18075183271(電子信箱)mariachi41@qq.com。