国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于XGBoost和LSTM的臺(tái)風(fēng)強(qiáng)度預(yù)測(cè)模型分析

2022-06-22 12:46:44峻,高珊,2
無(wú)線(xiàn)互聯(lián)科技 2022年6期
關(guān)鍵詞:強(qiáng)臺(tái)風(fēng)臺(tái)風(fēng)誤差

劉 峻,高 珊,2

(1.廣西大學(xué)計(jì)算機(jī)與電子信息學(xué)院,廣西 南寧 530004;2.廣西壯族自治區(qū)氣象服務(wù)中心,廣西 南寧530022)

0 引言

臺(tái)風(fēng)是在溫帶洋面上生成和發(fā)展的熱帶天氣系統(tǒng),引發(fā)的次生災(zāi)害具有極大的破壞性。準(zhǔn)確估算臺(tái)風(fēng)強(qiáng)度是臺(tái)風(fēng)預(yù)報(bào)和災(zāi)害預(yù)警中極為關(guān)鍵的問(wèn)題,可以為防災(zāi)部門(mén)提供有效的信息支持,大大減少生命和財(cái)產(chǎn)的損失。

目前,世界上對(duì)臺(tái)風(fēng)強(qiáng)度預(yù)測(cè)仍處于探索研究階段,隨著機(jī)器學(xué)習(xí)在各行業(yè)的應(yīng)用逐漸深入,氣象領(lǐng)域的研究人員開(kāi)始嘗試將機(jī)器學(xué)習(xí)算法應(yīng)用于天氣預(yù)報(bào)領(lǐng)域。自從Knaff等人于2002年開(kāi)發(fā)了第一版 “統(tǒng)計(jì)臺(tái)風(fēng)強(qiáng)度預(yù)報(bào)方案” (STIPS)以來(lái),研究人員相繼提出了基于人工神經(jīng)網(wǎng)絡(luò)、徑向基函數(shù)網(wǎng)絡(luò)(RBFN)、多層感知器(MLP)、統(tǒng)計(jì)多元線(xiàn)性和普通線(xiàn)性回歸等模型的方案對(duì)臺(tái)風(fēng)強(qiáng)度進(jìn)行預(yù)測(cè)。Jin等[1]認(rèn)為臺(tái)風(fēng)強(qiáng)度的變化受包括海洋熱量、垂直風(fēng)切變和下墊面變化等許多因素的影響,極端梯度提升算法XGBoost算法可以挖掘、處理多個(gè)維度因素,進(jìn)行多因素預(yù)測(cè),因而基于XGBoost模型和風(fēng)云衛(wèi)星影像估算南海熱帶氣旋強(qiáng)度。而Yuan等[2]考慮到影響臺(tái)風(fēng)強(qiáng)度的變化因素多呈非線(xiàn)性特征,且往往具有時(shí)間相關(guān)性,因此采用LSTM模型將臺(tái)風(fēng)強(qiáng)度預(yù)報(bào)作為時(shí)間序列問(wèn)題進(jìn)行研究。這些方法在機(jī)器學(xué)習(xí)應(yīng)用到臺(tái)風(fēng)強(qiáng)度預(yù)測(cè)方面進(jìn)行了有益嘗試,取得了較好的結(jié)果,但仍存在預(yù)測(cè)誤差率不夠高、特征提取復(fù)雜等問(wèn)題。

考慮到XGBoost具有較高的預(yù)測(cè)精度、良好的擬合和泛化能力等優(yōu)點(diǎn),LSTM擅長(zhǎng)處理時(shí)間序列問(wèn)題,以及XGBoost樹(shù)模型和LSTM神經(jīng)網(wǎng)絡(luò)模型的方法原理不同,兩者進(jìn)行方法組合,產(chǎn)生的結(jié)果相關(guān)性較低,有利于提高預(yù)測(cè)的準(zhǔn)確性。因此本文基于XGBoost和LSTM對(duì)臺(tái)風(fēng)強(qiáng)度進(jìn)行組合建模和預(yù)測(cè),將其預(yù)測(cè)結(jié)果與單機(jī)器學(xué)習(xí)模型XGBoost和LSTM進(jìn)行對(duì)比,以研究這些機(jī)器學(xué)習(xí)方法在臺(tái)風(fēng)預(yù)報(bào)與監(jiān)測(cè)中的應(yīng)用。

1 臺(tái)風(fēng)強(qiáng)度預(yù)測(cè)模型

極度梯度提升算法(eXtreme Gradient Boosting,XGBoost)[1]是一種Boosting集成學(xué)習(xí)方法,通過(guò)不斷形成新的決策樹(shù)來(lái)擬合上一步預(yù)測(cè)的殘差,逐步縮減真實(shí)值與預(yù)測(cè)值之間殘差,以達(dá)到準(zhǔn)確分類(lèi)的效果,十分適合作為臺(tái)風(fēng)強(qiáng)度預(yù)測(cè)的分類(lèi)模型。

而長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short Term Memory,LSTM)[2]是一種時(shí)間循環(huán)神經(jīng)網(wǎng)絡(luò),是為了解決一般的循環(huán)神經(jīng)網(wǎng)絡(luò)RNN存在的長(zhǎng)期依賴(lài)問(wèn)題而專(zhuān)門(mén)設(shè)計(jì)出來(lái)的,適于對(duì)與時(shí)間相關(guān)的臺(tái)風(fēng)強(qiáng)度影響因素進(jìn)行建模。

本文將XGBoost和LSTM模型組合在一起,進(jìn)行臺(tái)風(fēng)強(qiáng)度預(yù)測(cè)實(shí)驗(yàn)。預(yù)測(cè)模型使用當(dāng)前時(shí)間和提前不同時(shí)間的臺(tái)風(fēng)強(qiáng)度、位置和移動(dòng)速度等數(shù)據(jù)來(lái)共同預(yù)測(cè)下一個(gè)時(shí)間點(diǎn)的臺(tái)風(fēng)強(qiáng)度。該過(guò)程可以獲得提前6,12,24小時(shí)等預(yù)報(bào)時(shí)間的臺(tái)風(fēng)強(qiáng)度數(shù)據(jù)。

組合模型預(yù)測(cè)流程為:首先對(duì)臺(tái)風(fēng)原始數(shù)據(jù)集進(jìn)行預(yù)處理,提取出氣候、環(huán)境、歷史數(shù)據(jù)等特征;然后將這些特征輸入LSTM模型中進(jìn)行訓(xùn)練,得到LSTM模型的初步預(yù)測(cè)值;再次,將LSTM模型的初步預(yù)測(cè)值作為一個(gè)新的特征,與原始數(shù)據(jù)集經(jīng)過(guò)預(yù)處理得到的其他氣候、環(huán)境、歷史數(shù)據(jù)特征一起構(gòu)成一個(gè)新的數(shù)據(jù)集,將其輸入XGBoost模型中進(jìn)行訓(xùn)練和預(yù)測(cè),得到最終的預(yù)測(cè)值。

本文構(gòu)建的XGBoost+LSTM預(yù)測(cè)模型的輸入數(shù)據(jù)集,不但包含了對(duì)臺(tái)風(fēng)原始數(shù)據(jù)集進(jìn)行預(yù)處理而提取出的氣候、環(huán)境、歷史數(shù)據(jù)等特征參數(shù),還包括了經(jīng)過(guò)LSTM模型處理得到的初步預(yù)測(cè)值作為另一維度特征參數(shù)。兩種特征參數(shù)一起作為XGBoost臺(tái)風(fēng)強(qiáng)度預(yù)測(cè)模型的輸入,參加臺(tái)風(fēng)強(qiáng)度的預(yù)測(cè)過(guò)程。這一方式主要是利用XGBoost模型和LSTM模型結(jié)構(gòu)上的差異,充分發(fā)揮兩個(gè)模型各自的優(yōu)勢(shì),降低模型過(guò)擬合的風(fēng)險(xiǎn),提高臺(tái)風(fēng)強(qiáng)度的預(yù)測(cè)精度。預(yù)測(cè)模型流程如圖1所示。

圖1 XGBoost+LSTM臺(tái)風(fēng)強(qiáng)度預(yù)測(cè)模型流程

2 實(shí)驗(yàn)分析

本文XGBoost臺(tái)風(fēng)強(qiáng)度預(yù)測(cè)模型使用的數(shù)據(jù)來(lái)自廣西壯族自治區(qū)氣象局及中央氣象臺(tái)臺(tái)風(fēng)網(wǎng)(http://typhoon.nmc.cn/web.html)。臺(tái)風(fēng)強(qiáng)度根據(jù)中國(guó)氣象局發(fā)布的《關(guān)于實(shí)施<熱帶氣旋等級(jí)>國(guó)家標(biāo)準(zhǔn)(GB/T 19201—2006)的通知》[3](氣發(fā)〔2006〕154號(hào))中的標(biāo)準(zhǔn)進(jìn)行劃分,熱帶氣旋底層中心附近最大平均風(fēng)速達(dá)到10.8~17.1 m/s(風(fēng)力6~7級(jí))為熱帶低壓,達(dá)到17.2~24.4 m/s(風(fēng)力8~9級(jí))為熱帶風(fēng)暴,達(dá)到24.5~32.6 m/s(風(fēng)力10~11級(jí))為強(qiáng)熱帶風(fēng)暴,達(dá)到32.7~41.4 m/s(風(fēng)力12~13級(jí))為臺(tái)風(fēng),達(dá)到41.5~50.9 m/s(風(fēng)力14~15級(jí))為強(qiáng)臺(tái)風(fēng),達(dá)到或大于51.0 m/s(風(fēng)力16級(jí)或以上)為超強(qiáng)臺(tái)風(fēng)。

為了驗(yàn)證臺(tái)風(fēng)強(qiáng)度預(yù)測(cè)模型性能,本文使用平均絕對(duì)誤差MAE指標(biāo)對(duì)模型進(jìn)行評(píng)估。由于臺(tái)風(fēng)強(qiáng)度一般認(rèn)為由底層中心附近最大平均風(fēng)速?zèng)Q定,因此本文主要對(duì)臺(tái)風(fēng)不同階段的風(fēng)速進(jìn)行驗(yàn)證對(duì)比。本文將基于XGBoost和LSTM組合的臺(tái)風(fēng)強(qiáng)度預(yù)測(cè)模型的結(jié)果誤差與單獨(dú)基于LSTM和XGBoost的臺(tái)風(fēng)強(qiáng)度預(yù)測(cè)模型的結(jié)果誤差進(jìn)行了對(duì)比分析,并選取提前6小時(shí)和提前24小時(shí)的預(yù)測(cè)誤差,如圖2—3所示。

在提前6小時(shí)預(yù)報(bào)中,組合模型對(duì)于所有臺(tái)風(fēng)強(qiáng)度級(jí)別的預(yù)測(cè)的平均絕對(duì)誤差(MAE)均小于單一模型的平均絕對(duì)誤差,尤其在強(qiáng)臺(tái)風(fēng)以下的級(jí)別預(yù)報(bào)中,組合模型的MAE誤差值一直保持在5以下,LSTM模型和XGBoost模型的MAE誤差值則一直隨著臺(tái)風(fēng)強(qiáng)度級(jí)別的增強(qiáng)而不斷上升。

在提前24小時(shí)的預(yù)報(bào)中,組合模型明顯更適合熱帶低氣壓、臺(tái)風(fēng)和強(qiáng)臺(tái)風(fēng)等級(jí)的預(yù)報(bào),而LSTM模型對(duì)熱帶風(fēng)暴、強(qiáng)熱帶風(fēng)暴和超強(qiáng)臺(tái)風(fēng)等級(jí)的預(yù)報(bào)誤差更低一些。

由圖2—3可以看出,在預(yù)報(bào)提前時(shí)間小于24小時(shí)的預(yù)報(bào)中,LSTM模型更適合預(yù)報(bào)提前時(shí)間量偏長(zhǎng)的超強(qiáng)臺(tái)風(fēng)級(jí)別的預(yù)測(cè),而XGBboost+LSTM組合模型更適合預(yù)報(bào)提前時(shí)間量偏短的臺(tái)風(fēng)級(jí)別預(yù)測(cè),且適用性更廣。因此,在進(jìn)行臺(tái)風(fēng)強(qiáng)度預(yù)報(bào)時(shí),可以根據(jù)不同時(shí)間階段和不同臺(tái)風(fēng)強(qiáng)度等級(jí),采用不同模型進(jìn)行預(yù)測(cè),這樣更能發(fā)揮各自模型算法的優(yōu)勢(shì)。

圖2 單一模型和組合模型提前6小時(shí)預(yù)報(bào)不同強(qiáng)度臺(tái)風(fēng)的誤差

圖3 單一模型和組合模型提前24小時(shí)預(yù)報(bào)不同臺(tái)風(fēng)強(qiáng)度的誤差

3 結(jié)語(yǔ)

本文對(duì)比分析了基于XGBoost和LSTM的臺(tái)風(fēng)強(qiáng)度預(yù)測(cè)模型,經(jīng)過(guò)多輪迭代訓(xùn)練,優(yōu)化相應(yīng)超參數(shù),構(gòu)建相應(yīng)深度神經(jīng)網(wǎng)絡(luò)對(duì)臺(tái)風(fēng)強(qiáng)度進(jìn)行了分析和預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,在不同時(shí)間階段和不同臺(tái)風(fēng)強(qiáng)度等級(jí)的預(yù)測(cè)中,模型的正確選擇有利于降低預(yù)測(cè)的誤差??傮w而言,與XGBoost和LSTM單機(jī)器學(xué)習(xí)模型相比,由于XGBoost和LSTM組合模型不僅考慮了影響臺(tái)風(fēng)強(qiáng)度的因素的時(shí)間序列特征,同時(shí)又兼顧了這些因素的非線(xiàn)性特征。因此,組合模型的預(yù)測(cè)誤差相對(duì)更小,穩(wěn)定性也更強(qiáng),更適用于臺(tái)風(fēng)強(qiáng)度預(yù)測(cè)。今后,筆者將進(jìn)一步擴(kuò)大樣本數(shù)量,優(yōu)化模型的預(yù)測(cè)效果,以期將該臺(tái)風(fēng)強(qiáng)度預(yù)測(cè)模型真正應(yīng)用于實(shí)際。

猜你喜歡
強(qiáng)臺(tái)風(fēng)臺(tái)風(fēng)誤差
臺(tái)風(fēng)過(guò)韓
角接觸球軸承接觸角誤差控制
哈爾濱軸承(2020年2期)2020-11-06 09:22:26
Beidou, le système de navigation par satellite compatible et interopérable
臺(tái)風(fēng)來(lái)了
小讀者(2020年4期)2020-06-16 03:33:46
淮委防御超強(qiáng)臺(tái)風(fēng)“利奇馬”
治淮(2019年9期)2019-10-09 07:24:52
壓力容器制造誤差探究
臺(tái)風(fēng)愛(ài)搗亂
超強(qiáng)臺(tái)風(fēng)
臺(tái)風(fēng)來(lái)時(shí)怎樣應(yīng)對(duì)
九十億分之一的“生死”誤差
山東青年(2016年2期)2016-02-28 14:25:41
溆浦县| 麻城市| 宾川县| 嵊州市| 新乡县| 新蔡县| 法库县| 吕梁市| 庆城县| 嘉黎县| 松阳县| 邻水| 武邑县| 吴川市| 涪陵区| 永德县| 大关县| 赤水市| 永兴县| 荥阳市| 霸州市| 景宁| 区。| 卫辉市| 房山区| 碌曲县| 祁东县| 公安县| 锡林郭勒盟| 太和县| 汪清县| 腾冲县| 赞皇县| 海宁市| 莒南县| 留坝县| 遵化市| 高平市| 西乡县| 新化县| 灵寿县|