国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于自動LightGBM的貴州局地大氣加權(quán)平均溫度模型構(gòu)建

2024-09-30 00:00:00方省張瓊莉張顯云
貴州大學(xué)學(xué)報(自然科學(xué)版) 2024年5期

文章編號1000-5269(2024)05-0112-06 DOI:10.15958/j.cnki.gdxbzrb.2024.05.15

摘要:針對貴州地形起伏大、探空站數(shù)量少,以及現(xiàn)有大氣加權(quán)平均溫度(Tm)模型不能很好地刻畫Tm及其垂向變化的空間差異性和日變化特征等問題,結(jié)合貝葉斯超參數(shù)優(yōu)化和LightGBM機(jī)器學(xué)習(xí)方法各自的優(yōu)勢,提出了一種顧及Tm及其垂向變化的空間差異性、年周期、季節(jié)周期和日變化特征的自動機(jī)器學(xué)習(xí)建模方法,并以包圍威寧探空站的4個ERA5格網(wǎng)點為例,構(gòu)建了一種無氣象參數(shù)依賴的貴州局地Tm經(jīng)驗?zāi)P停╓NTm模型)。實驗結(jié)果表明:WNTm模型在訓(xùn)練集和驗證集上均取得了較高的擬合精度,其不僅可以診斷出Tm的日變特征,還能較好地刻畫Tm的垂向變化趨勢;以探空站氣象資料計算的Tm為參考值,WNTm模型相比于目前較優(yōu)的GPT3模型取得了更高的預(yù)測精度,平均絕對誤差和均方根誤差分別降低了14.63%和20.14%。該研究方法和思路可為進(jìn)一步改善Tm的精度提供一種新的途徑。

關(guān)鍵詞:大氣加權(quán)平均溫度;日變化特征;垂向變化;自動LightGBM 中圖分類號:P228.9 文獻(xiàn)標(biāo)志碼:A

大氣中的大氣可降水量(precipitable water vapor, PWV)在大氣能量傳輸、云的形成、天氣演變和全球氣候變化等方面都扮演著重要作用[1]?;谌?qū)Ш叫l(wèi)星系統(tǒng)GNSS的PWV探測技術(shù)由于具備高精度、全天候和易于實現(xiàn)高時空分辨率等優(yōu)點,已發(fā)展成為獲取PWV的一種有力手段[2]。大氣加權(quán)平均溫度(Tm)是GNSS信號所受對流層天頂濕延遲向PWV轉(zhuǎn)換的關(guān)鍵參量,學(xué)者們就如何獲取Tm進(jìn)行了豐富的研究,先后建立了眾多Tm模型??偟膩碚f,現(xiàn)有Tm模型可分為兩類,即氣象因子(surface meteorological factor,SMF)模型和非氣象因子(non-meteorological factor,NMF)模型[3]。由于GNSS站點往往缺少同址的氣象傳感器,導(dǎo)致基于SMF模型難以實現(xiàn)Tm的精確估算。為彌補(bǔ)SMF模型的缺陷,學(xué)術(shù)界先后建立和發(fā)展了大量的區(qū)域和全球NMF模型[4-11],極大地促進(jìn)了GNSS氣象學(xué)的發(fā)展。然而,受建模所用氣象資料時空分辨率低的限制,現(xiàn)有NMF模型大都未能很好地刻畫Tm的日變化特征[12]。

受空氣中水汽壓、大氣壓及大氣溫度在空間域和時間域上存在差異性的影響,Tm不僅與地理位置和時間密切相關(guān),而且在高程方向(垂向)存在顯著的遞減趨勢。Tm的垂向變化不僅具有空間差異性,而且在時間域上存在復(fù)雜的周期特性[2],如果忽略Tm的垂向改正,勢必將降低PWV的探測精度。為此,針對Tm的垂向改正研究越來越受到重視,如文獻(xiàn)[9]在全球范圍內(nèi)基于同一個Tm 垂直遞減率,構(gòu)建了一種全球Tm模型;文獻(xiàn)[13]建立了一種中國區(qū)域統(tǒng)一的Tm垂直遞減率模型,并在此基礎(chǔ)上構(gòu)建了一種顧及垂直遞減率的中國區(qū)域Tm模型;謝劭峰等[14]針對現(xiàn)有Tm垂直遞減率模型數(shù)據(jù)源單一、難以精確捕獲Tm的日變化特征等缺陷,建立了一種高精度的中國區(qū)域Tm垂直遞減率模型。這些研究較為顯著地改善了Tm的精度,可為局地Tm模型的構(gòu)建提供借鑒。

貴州地勢西高東低,高程起伏大,地方性氣候差異顯著[15],難以用一個統(tǒng)一的全球模型或區(qū)域模型較為精確地表征貴州Tm的時空變化特征。有鑒于此,本文以ERA5高時空分辨率再分析氣象資料為數(shù)據(jù)源,同時顧及Tm及其垂向變化的空間差異性和時域周期特性,基于自動機(jī)器學(xué)習(xí)的方法構(gòu)建了一種無氣象參數(shù)依賴的貴州局地Tm經(jīng)驗?zāi)P停⒉捎肊AR5和探空站氣象資料對模型的精度進(jìn)行了驗證。

1研究區(qū)及數(shù)據(jù)源

1.1研究區(qū)

研究區(qū)為地處中國西南的貴州省,位于北緯24°37′—29°13′、東經(jīng)103°36′—109°35′,面積約176 167 km2;區(qū)內(nèi)地貌屬高原山地,地勢西高東低,最低處高程約為147.8 m,而最高處高達(dá)2 900.6 m,平均海拔約1 100 m。受大氣環(huán)流及多山地形等的影響,區(qū)內(nèi)氣候多樣性明顯,溫度和降水的區(qū)域差異性顯著。

1.2數(shù)據(jù)源

1.2.1ERA5大氣再分析數(shù)據(jù)集

ERA5是歐洲中期天氣預(yù)報中心發(fā)布的第五代大氣再分析產(chǎn)品,可提供逐小時的全球37個等壓分層氣象資料,其中包括經(jīng)緯度、位勢、比濕、大氣溫度和大氣壓等,由此可計算出高時空分辨率的大氣加權(quán)平均溫度。

Tm=∑ni=1(ei/Ti)·Δhi∑ni=1(ei/Ti2)·Δhi(1)

式中:n為大氣層數(shù);Ti為相鄰大氣層的平均溫度,K;Δhi為相鄰大氣層的平均厚度,m;ei為相鄰大氣層的平均水汽壓,hPa。單層水汽壓e可采用式(2)進(jìn)行計算。

e=q0.622+qP (2)

式中:q為比濕,kg/kg;P為大氣壓,hPa。

由于具備高精度和高時空分辨率的特點,ERA5已被廣泛應(yīng)用于大氣加權(quán)平均溫度的建模和相關(guān)氣象研究。針對貴州山地氣候空間差異性顯著的問題,本文以2014—2019年0.25°×0.25°(約31 km×31 km)的逐小時ERA5氣象資料作為建模數(shù)據(jù)源,其中2014—2018年的氣象資料用于模型構(gòu)建,2019年的氣象資料用于模型精度驗證。為保證Tm的準(zhǔn)確性,采用了與文獻(xiàn)[16]相同的質(zhì)量控制措施;同時,鑒于頂層大氣壓力小于200 hPa時Tm數(shù)值差異甚微,故為刻畫Tm的垂向變化趨勢,實驗時基于式(1)分別對各等壓層至大氣壓力為200 hPa大氣層的Tm進(jìn)行了計算,從而每小時1個格網(wǎng)點不同高度處的大氣加權(quán)平均溫度共有22個。

1.2.2無線探空數(shù)據(jù)

探空站可提供每日0時和12時的實測地表及分層氣象數(shù)據(jù),主要包括大氣壓、分層氣象數(shù)據(jù)對應(yīng)的高程、溫度、露點溫度,以及測站的經(jīng)度、緯度和高程信息,可從美國懷俄明州立大學(xué)網(wǎng)站下載(http://weather.uwyo.edu/upperair/sounding.html)。本文選用貴州省威寧(WN)無線探空站2019年的氣象數(shù)據(jù),在采用式(1)計算出大氣加權(quán)平均溫度的基礎(chǔ)上,對Tm模型的精度進(jìn)行評價。威寧探空站位置圖如圖1所示。

2建模方法

LightGBM是由微軟提供的以決策樹為學(xué)習(xí)器的一種梯度提升算法,其不僅能夠處理大規(guī)模數(shù)據(jù),而且具有速度快、精度高和支持并行運(yùn)算等優(yōu)點[17]。LightGBM參數(shù)眾多,人工手動調(diào)參費(fèi)時費(fèi)力,且不易捕獲最優(yōu)參數(shù)組合;網(wǎng)格搜索和隨機(jī)搜索雖自動化程度高,但網(wǎng)格搜索需以極大的時間成本為代價,隨機(jī)搜索則易陷于局部最優(yōu)[18]。貝葉斯超參數(shù)優(yōu)化作為自動機(jī)器學(xué)習(xí)中的重要概念,是一種先進(jìn)的全局優(yōu)化自動調(diào)參技術(shù),具有較網(wǎng)格搜索和隨機(jī)搜索更佳的搜索效率和性能[19]。本文采用基于樹形結(jié)構(gòu)的貝葉斯優(yōu)化方法對LightGBM超參數(shù)進(jìn)行全局自動尋優(yōu)(以下簡稱“自動Light-GBM”)。

自動LightGBM主要包括超參數(shù)閾值空間、目標(biāo)函數(shù)、優(yōu)化算法、結(jié)果4個部分。其中,超參數(shù)閾值空間如表1所示;目標(biāo)函數(shù)使用了5折交叉驗證,并采用均方根誤差作為評價指標(biāo);優(yōu)化算法采用algo=tpe.suggest;結(jié)果即為目標(biāo)函數(shù)的評估結(jié)果,包含超參數(shù)和驗證損失。

3貴州局地Tm模型精度評價

3.1精度評價指標(biāo)

以ERA5和探空站Tm為參考值,采用平均絕對誤差(MAE,EMA)、均方根誤差(RMSE,ERMS)和決定系數(shù)(R2)3個指標(biāo)對貴州局地大氣加權(quán)平均Tm模型的精度進(jìn)行評價。各指標(biāo)計算公式如下:

EMA=1N∑Ni=1(YOi-YTi)(3)

ERMS=1N∑Ni=1(YOi-YTi)2(4)

R2=1-∑Ni=1(YTi-YOi)2∑Ni=1(YTi-Y)2(5)

式中:N為Tm的個數(shù);YOi為Tm的模型擬合值或預(yù)測值;YTi為Tm的參考值(或真值);Y為Tm模型擬合值或預(yù)測值的均值。

3.2貴州局地大氣加權(quán)平均溫度模型的建立及精度評價

3.2.1模型的建立

Tm及其垂向變化除表現(xiàn)出顯著的空間差異性外,還具有年周期、季節(jié)周期和日周期特性[11-12]。因此,為提升Tm模型的精度,本文顧及Tm及其垂向變化的空間差異性、年周期、季節(jié)周期和日變化特征,以地理位置(經(jīng)度lon,緯度lat)、年(year)、年積日(day of year,doy)、日積時(hour of day,hod)以及高程(height)為自變量,基于自動LightGBM構(gòu)建無氣象參數(shù)依賴的貴州局地Tm經(jīng)驗?zāi)P?。Tm模型可簡單表示為

Tm=F[lon,lat,height,year,doy,hod]1

[lon,lat,height,year,doy,hod]2

[lon,lat,height,year,doy,hod]i

[lon,lat,height,year,doy,hod]n(6)

式中:自變量[lon,lat,height,year,doy,hod]i包含了4個格網(wǎng)點的地理坐標(biāo)、各格網(wǎng)點第i年每天逐小時分層大氣加權(quán)平均溫度對應(yīng)的高程(height)和時間(year、doy、hod)。

鑒于區(qū)域Tm模型較全球Tm模型具有更高的精度[20],限于篇幅,并為方便采用探空站Tm對貴州局地Tm模型的精度進(jìn)行評價,本文僅以包圍威寧探空站的4個ERA5格網(wǎng)點為例,構(gòu)建威寧大氣加權(quán)平均溫度模型(WNTm)。同時,為提升模型泛化能力,建模時按6∶4劃分訓(xùn)練集和驗證集,建模精度統(tǒng)計如表2所示。

由表2可知,WNTm在訓(xùn)練集和驗證集上的EMA、ERMS和R2分別為0.85 K、1.18 K、0.996 2和0.87 K、1.21 K、0.996 1,說明WNTm在訓(xùn)練集和驗證集上均獲得了較高的擬合精度。為進(jìn)一步探究各變量對貴州局地Tm的影響,繪制自變量特征重要性,如圖2所示。

由圖2可以看出:自變量對Tm的影響程度由高到低排序依次為doy、height、hod、year、lat和lon。其中,doy和height對Tm的影響占絕對主導(dǎo),說明Tm具有明顯的季節(jié)周期,且Tm在高程方向上的變化較為顯著;影響程度較小的是hod和year,說明Tm除具有日周期特性外,還表現(xiàn)出一定的年趨勢,但年趨勢沒有季節(jié)周期和日周期明顯。此外,lat和lon對Tm的影響最小,lat對Tm的影響較lon稍大,這可能是由于建模所用4個格網(wǎng)點距離較近, Tm數(shù)值本身差異不是十分顯著所致。

3.2.2模型精度評價

以包圍威寧探空站4個角點(左上、右上、左下、右下)2019-6-1T12:0:0的EAR5各層大氣加權(quán)平均溫度為參考值,對WNTm模型刻畫Tm垂向變化特征的能力進(jìn)行評價,結(jié)果如圖3所示。

由圖3可看出,WNTm模型預(yù)測值在高程方向與參考值間具有十分相似的變化趨勢,決定系數(shù)均大于0.99,說明所建模型能夠很好地描述Tm的垂向變化特征。此外,預(yù)測值與參考值間的相關(guān)性隨緯度的升高有所降低,而同一緯度方向的變化卻很小,說明Tm垂向變化受緯度的影響更大。由于探空站氣象資料為實測數(shù)據(jù),具有較高的精度,本文以2019年威寧探空站的Tm為參考值,對模型的預(yù)測性能作進(jìn)一步評價,并將其與GPT3模型的預(yù)測值進(jìn)行比較,結(jié)果如表3和圖4所示。

由表3可知:以探空站Tm為參考值,WNTm模型預(yù)測值的EMA和ERMS分別為3.56 K和4.40 K;GPT3模型預(yù)測值的EMA和ERMS分別為4.17 K和5.51 K,WNTm模型較GPT3模型的預(yù)測精度分別提升了14.63%和20.15%。由圖4可進(jìn)一步看出,探空站Tm、WNTm模型預(yù)測值和GPT3模型預(yù)測值三者的變化趨勢一致,但GPT3模型的預(yù)測值整體偏大,原因可能是威寧探空站海拔較高(高程為2 236 m),GPT3模型不能很好地刻畫Tm的垂向變化趨勢,而WNTm模型不僅可較好地表征Tm的垂向變化趨勢,還可較好地體現(xiàn)Tm的日變化特征。

4結(jié)語

結(jié)合貝葉斯超參數(shù)優(yōu)化和LightGBM機(jī)器學(xué)習(xí)方法各自的優(yōu)勢,本文提出了一種顧及Tm及其垂向變化空間差異性和時域周期特性的大氣加權(quán)平均溫度建模方法。同時,為方便對模型精度進(jìn)行評價,以威寧探空站為例,基于4個ERA5格網(wǎng)點氣象數(shù)據(jù)構(gòu)建了一種無氣象參數(shù)依賴的WNTm大氣加權(quán)平均溫度經(jīng)驗?zāi)P?。在此基礎(chǔ)上,分別以ERA5和探空站Tm為參考值,對模型的建模精度、模型垂向變化特征的表達(dá)能力和預(yù)測性能進(jìn)行了評價。結(jié)果表明:WNTm模型取得了較高的建模精度,在訓(xùn)練集和驗證集上的EMA、ERMS和R2分別為0.85 K、1.18 K、0.996 2和0.87 K、1.21 K、0.996 1;WNTm模型不僅可以探測出Tm的年、季節(jié)和日變化特征,還能較好地刻畫Tm的垂向變化趨勢,Tm垂向預(yù)測值與對應(yīng)參考值間的決定系數(shù)均接近于1,統(tǒng)計學(xué)上表現(xiàn)為極強(qiáng)相關(guān);以探空站Tm為參考值,所建模型相較于GPT3模型取得了更高的預(yù)測精度,EMA和ERMS分別降低了14.63%和20.15%。以上結(jié)論證明了本文所提建模方法和思路的有效性和可靠性,可為進(jìn)一步改善Tm精度的相關(guān)研究提供參考。

參考文獻(xiàn):

[1]WANG J H, ZHANG L Y, DAI A, et al. A near-global, 2-hourly data set of atmospheric precipitable water from ground-based GPS measurements[J]. Journal of Geophysical Research, 2007, 112(D11): D11107.1- D11107.17.

[2] HUANG L K, LIU L L, CHEN H, et al. An improved atmospheric weighted mean temperature model and its impact on GNSS precipitable water vapor estimates for China[J]. GPS Solutions, 2019, 23: 51.1-51.16.

[3] LONG F Y, HU W S, DONG Y F, et al. Neural network-based models for estimating weighted mean temperature in China and adjacent areas[J]. Atmosphere, 2021,12: 169.1-169.27.

[4] 曲雙寶. 一種新的青藏高原地區(qū)加權(quán)平均溫度模型[J]. 無線電工程, 2023, 53(4): 844-852.

[5] ZHAO Q Z, LIU K, ZHANG T X, et al. A global conversion factor model for mapping Zenith total delay onto precipitable water[J]. Remote Sensing, 2022, 14: 1086.1-1086.17.

[6] 石靈璠, 王萍, 黃良珂. 青藏高原地區(qū)大氣加權(quán)平均溫度模型的構(gòu)建[J]. 測繪通報, 2021(4): 52-59.

[7] LANDSKRON D, BOHM J. VMF3/GPT3: refined discrete and empirical troposphere mapping functions[J]. Journal of Geodesy, 2018, 92(4): 349-360.

[8] BOHM J, MOLLER G, SCHINDELEGGER M, et al. Development of an improved empirical model for slant delays in the troposphere (GPT2w)[J]. GPS Solutions, 2015, 19(3): 433-441.

[9] YAO Y B, XU C Q, ZHANG B, et al. GTm-III: a new global empirical model for mapping zenith wet delays onto precipitable water vapour[J]. Geophysical Journal International, 2014, 197(1): 202-212.

[10]YAO Y B, ZHANG B, YUE S Q, et al. Global empirical model for mapping zenith wet delays onto precipitable water[J]. Journal of Geodesy, 2013, 87: 439-448.

[11]YAO Y B, ZHU S, YUE S Q. A globally applicable, season-specific model for estimating the weighted mean temperature of the atmosphere[J]. Journal of Geodesy, 2012, 86(12): 1125-1135.

[12]SUN Z Y, ZHANG B, YAO Y B. An ERA5-based model for estimating tropospheric delay and weighted mean temperature over China with improved spatiotemporal resolutions[J]. Earth and Space Science, 2019, 6(10): 1926-1941.

[13]黃良珂, 彭華, 劉立龍, 等. 顧及垂直遞減率函數(shù)的中國區(qū)域大氣加權(quán)平均溫度模型[J]. 測繪學(xué)報, 2020, 49(4): 432-442.

[14]謝劭峰, 王義杰, 黃良珂, 等. 中國區(qū)域大氣加權(quán)平均溫度垂直遞減率格網(wǎng)模型[J]. 測繪學(xué)報, 2023, 52(2): 206-217.

[15]焦權(quán). 典型喀斯特微流域土壤資源賦存及小氣候特征[D]. 貴州: 貴州大學(xué), 2018.

[16]HE C Y, WU S Q, WANG X, et al. A new voxel-based model for the determination of atmospheric weighted mean temperature in GPS atmospheric sounding[J]. Atmospheric Measurement Techniques, 2017, 10(6): 2045-2060.

[17]KE G L, MENG Q, FINLEY T, et al. LightGBM: a highly efficient gradient boosting decision tree[C]// Proceedings of the 31st International Conference on Neural Information Processing Systems, NY: Curran Associates Inc., 2017: 3149-3157.

[18]JLASSI S, JDEY I, LTIFI H. Bayesian hyperparameter optimization of deep neural network algorithms based on ant colony optimization[C]// ICDAR 2021, Cham: Springer Nature Switzerland AG, 2021: 585-594.

[19]SNOEK J, LAROCHELLE H, ADAMS R P. Practical Bayesian optimization of machine learning algorithms[C]// Proceedings of the 25th International Conference on Neural Information Processing Systems, NY: Curran Associates Inc., 2012: 2951-2959.

[20]HUANG L K, JIANG W P, LIU L L, et al. A new global grid model for the determination of atmospheric weighted mean temperature in GPS precipitable water vapor[J]. Journal of Geodesy, 2019, 93(2): 159-176.

(責(zé)任編輯:周曉南)

Abstract:

To address the problems of large topographic fluctuation, small number of radiosonde in Guizhou, and the fact that the existing weighted mean temperature (Tm) model can not describe the spatial difference and diurnal variation of Tm and its vertical variation. This paper combined the advantages of Bayes hyperparameter optimization and LightGBM machine learning method, thus proposed an automatic machine learning modeling method, which took into account the spatial difference, annual cycle, seasonal cycle and diurnal variation of Tm and its vertical variation. A local empirical model of Tm (WNTm model) in Guizhou province without meteorological parameter dependence is constructed by taking 4 ERA5 grid points surrounding Weining Sounding Station as an example. The experimental results show that the WNTm model achieves high fitting accuracy on both training set and verification set. It can not only diagnose the diurnal characteristics of Tm, but also describe the vertical variation trend of Tm well. Compared with the current better GPT3 model, WNTm model can achieve higher prediction accuracy, and the mean absolute error and root-mean-root error are reduced by 14.63% and 20.14% respectively. The research methods and ideas in this paper can provide a new way to further improve the accuracy of Tm.

Key words:

atmospheric weighted mean temperature; daily variation characteristics; vertical variation; automatic LightGBM

收稿日期:2024-05-17

基金項目:貴州大學(xué)“SRT計劃”資助項目(貴大SRT字[2022]332號)

作者簡介:方省(2001—),女,貴州大學(xué)礦業(yè)學(xué)院2020級測繪工程專業(yè)在讀本科生,E-mail:14785221693@163.com.

*通訊作者:張顯云,E-mail:mec.xyzhang@gzu.edu.cn.

台州市| 常州市| 三明市| 吴江市| 柏乡县| 上蔡县| 巴里| 安康市| 双柏县| 东安县| 福贡县| 吉林省| 青神县| 镇沅| 藁城市| 黑山县| 景德镇市| 浠水县| 垦利县| 扶余县| 阜阳市| 九江市| 张家港市| 宁蒗| 垦利县| 万全县| 拉萨市| 内乡县| 馆陶县| 博罗县| 伊通| 蒙山县| 顺平县| 泾阳县| 友谊县| 贡嘎县| 凤城市| 平阳县| 扶余县| 深泽县| 平安县|