朱國棟,朱 蕾,王 楠,孫少明,梁 艷
(1.民航新疆空中交通管理局空管中心氣象中心,新疆 烏魯木齊830016;2.民航新疆空中交通管理局培訓(xùn)中心,新疆 烏魯木齊830016;3.民航新疆空中交通管理局氣象服務(wù)部,新疆 烏魯木齊830016)
在民航機(jī)場運(yùn)行中,機(jī)場溫度是決定航空器配載和起飛降落滑跑距離的重要?dú)庀笾笜?biāo)。隨著機(jī)場溫度的升高,航空器的起飛全重會逐漸減小,滑跑距離變長,為確保航空器運(yùn)行的安全,必須對航空器進(jìn)行減載[1],或者調(diào)整起飛計劃等待溫度降低,這些操作都將會對航空公司運(yùn)力資源調(diào)配造成困難,嚴(yán)重影響航空公司效益和旅客出行體驗[2]。
溫度作為天氣預(yù)報中最基本的氣象要素,其變化受到諸如季節(jié)、日照、天氣現(xiàn)象等因子的影響。國內(nèi)已有研究表明,ECMWF細(xì)網(wǎng)格模式2 m溫度預(yù)報產(chǎn)品對制作烏魯木齊市未來24和48 h溫度預(yù)報具有很好的指導(dǎo)意義[3],國內(nèi)多地采用該產(chǎn)品進(jìn)行最高、最低溫度預(yù)測,均取得較好效果[4-6]。結(jié)合東北中東部復(fù)雜地形條件下,EC模式溫度預(yù)報產(chǎn)品在山區(qū)預(yù)報準(zhǔn)確率偏低,系統(tǒng)性偏差較大,而通過客觀訂正方法,可將山區(qū)的預(yù)報均方根誤差由1.48℃降低至平均0.03℃[7]。通過采用一元線性回歸、多元回歸方程、誤差訂正以及最優(yōu)集合訂正等方法,并結(jié)合本地天氣特征,進(jìn)行溫度客觀預(yù)報[8-11],能較好地改善ECMWF細(xì)網(wǎng)格模式直接輸出的溫度預(yù)報效果。除了結(jié)合EC數(shù)值預(yù)報之外,還有結(jié)合WRF中尺度模式產(chǎn)品,通過MOS方法改善機(jī)場要素預(yù)報的效果[12]。
隨著近些年機(jī)器學(xué)習(xí)及深度學(xué)習(xí)方法的快速發(fā)展,國內(nèi)外學(xué)者嘗試?yán)弥С窒蛄繖C(jī)、人工神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等方法,構(gòu)建預(yù)測模型,改善溫度預(yù)測結(jié)果[13-25]。但是已有的站點(diǎn)溫度預(yù)測方法,缺少逐小時的溫度預(yù)測研究,且未綜合考量不同機(jī)器學(xué)習(xí)方法的差異,因此本文根據(jù)ECMWF細(xì)網(wǎng)格數(shù)值模式0~72 h預(yù)報產(chǎn)品,引入各層次風(fēng)、溫度、高度及地面風(fēng)、降水、氣壓、溫度等要素構(gòu)建模型因子,利用自動機(jī)器學(xué)習(xí)工具包,分別構(gòu)建深度學(xué)習(xí)模型[26](Auto-Keras)和常規(guī)機(jī)器學(xué)習(xí)模型[27](Auto-sklearn),進(jìn)行機(jī)場逐小時溫度預(yù)報的預(yù)測,經(jīng)過自動機(jī)器學(xué)習(xí)方法的自動建模和參數(shù)尋優(yōu),模型改善了數(shù)值模式直接輸出的站點(diǎn)溫度預(yù)報,提高了機(jī)場逐小時溫度預(yù)報準(zhǔn)確率。
結(jié)合機(jī)場氣象服務(wù)工作的需求,將烏魯木齊機(jī)場逐小時2 m溫度作為預(yù)報對象。選取2015年1月—2021年3月ECMWF細(xì)網(wǎng)格數(shù)值預(yù)報的預(yù)報產(chǎn)品作為因子,包含逐3 h各層次高度、u分量、v分量、溫度、相對濕度、垂直速度、散度等要素,以及地面風(fēng)、溫度、露點(diǎn)溫度、氣壓、降水等要素??紤]模式的不穩(wěn)定和準(zhǔn)確性,臨近起報時間的預(yù)報場準(zhǔn)確性和參考性較高,故選取0~72 h內(nèi)的預(yù)報產(chǎn)品進(jìn)行建模??紤]地面、高空的模式產(chǎn)品網(wǎng)格間距的差異,此處統(tǒng)一選用最近網(wǎng)格點(diǎn)方法,將地面、高空的預(yù)報產(chǎn)品中距離烏魯木齊機(jī)場最近網(wǎng)格點(diǎn)的數(shù)據(jù)抽取出來,并與小時、月份信息共同構(gòu)成數(shù)據(jù)集,合計93個因子。
由于EC細(xì)網(wǎng)格數(shù)值預(yù)報產(chǎn)品時間間隔3 h,與機(jī)場逐小時溫度預(yù)報無法一一對應(yīng)建模,此處將EC細(xì)網(wǎng)格數(shù)據(jù)3 h間隔數(shù)據(jù)線性插值至1 h,剔除缺測數(shù)據(jù)后,與機(jī)場逐小時溫度構(gòu)建訓(xùn)練樣本,合計44 529條樣本,為確保足夠的訓(xùn)練樣本,并預(yù)留一定數(shù)量的檢驗樣本,將67%的樣本(29 835條)用于建模訓(xùn)練和參數(shù)尋優(yōu),剩余33%的樣本(14 694條)用于模型結(jié)果的檢驗。模型訓(xùn)練過程中為防止欠擬合和過擬合,不同的自動機(jī)器學(xué)習(xí)方法采用不同的方法來處理,其中Auto-sklearn方法通過多次嘗試模型尋優(yōu)的時長,防止訓(xùn)練次數(shù)過多、或過少,并按比率保留多個機(jī)器學(xué)習(xí)方法,集成獲得最優(yōu)模型。而Auto-Keras則采用K-fold交叉驗證,在模型構(gòu)建過程中從訓(xùn)練樣本中抽取20%的數(shù)據(jù)進(jìn)行交叉驗證,構(gòu)建最優(yōu)的深度學(xué)習(xí)模型。
在給定的數(shù)據(jù)集中實現(xiàn)最佳的預(yù)測模型,傳統(tǒng)的機(jī)器學(xué)習(xí)方法需要數(shù)據(jù)預(yù)處理和清洗、選擇和構(gòu)建合適的特征、選擇合適的模型、優(yōu)化模型超參數(shù)、機(jī)器學(xué)習(xí)模型后流程處理等,這些任務(wù)的處理通常非常復(fù)雜,一般非機(jī)器學(xué)習(xí)專家無法處理,隨著越來越多的模型不斷被開發(fā)出來,如何選擇合適的模型變得越來越困難,并且參數(shù)調(diào)優(yōu)需要遍歷所有可能的值,這些都需要大量的人工操作,進(jìn)而導(dǎo)致流程效率低,難于管理。
自動機(jī)器學(xué)習(xí)(AutoML)的任務(wù)是使所有這些步驟(或至少其中一些步驟)自動化[26],消除常規(guī)的操作順序和模型的手動枚舉,隱藏建模過程中大量的數(shù)學(xué)問題和代碼編寫過程,簡化氣象領(lǐng)域中應(yīng)用機(jī)器學(xué)習(xí)方法的流程,將機(jī)器學(xué)習(xí)專家的經(jīng)驗固化,利用最優(yōu)的數(shù)據(jù)科學(xué)實踐,減少人工對機(jī)器學(xué)習(xí)過程的參與,幫助非機(jī)器學(xué)習(xí)專家輕松處理任務(wù),在確保預(yù)測準(zhǔn)確性的基礎(chǔ)上提高建模效率。
目前,許多商業(yè)公司也在積極發(fā)展自動機(jī)器學(xué)習(xí)平臺的開發(fā),例如微軟Azure Automated ML、谷歌的AutoML,通過購買公有云平臺的算力和機(jī)器學(xué)習(xí)算法,即可快速構(gòu)建機(jī)器學(xué)習(xí)業(yè)務(wù)流程。同時機(jī)器學(xué)習(xí)開源社區(qū),也積極借鑒商業(yè)公司成熟的算法,推出各類開源的自動機(jī)器學(xué)習(xí)工具,例如基于貝葉斯優(yōu)化和自動集成構(gòu)造的Auto-sklearn,以及利用神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索的Auto-Keras深度自動學(xué)習(xí)工具??紤]到氣象歷史建模數(shù)據(jù)體量和系統(tǒng)設(shè)計成本,本文選取Auto-sklearn和Auto-Keras兩種成熟的開源工具包來構(gòu)建自動機(jī)器學(xué)習(xí),并利用本地CPU、GPU資源進(jìn)行建模運(yùn)算。
1.2.1Auto-sklearn自動機(jī)器學(xué)習(xí)方法
Auto-sklean是基于Auto-Weka的組合算法選擇和超參數(shù)優(yōu)化問題的定義,采用與微軟Azure Automated ML相同的思路構(gòu)建的,同時選擇一個學(xué)習(xí)算法和設(shè)置其超參數(shù)的問題。主要區(qū)別是將兩個額外的步驟合并到主進(jìn)程中,首先是元學(xué)習(xí)步驟,最后是自動化集成構(gòu)造步驟[27]。
圖1 Auto-sklearn自動機(jī)器學(xué)習(xí)方法示意圖
該方法使用元特征來描述數(shù)據(jù)集,包括簡單的、信息論的和統(tǒng)計的元特征,如數(shù)據(jù)點(diǎn)的數(shù)量、特征和分類,以及數(shù)據(jù)偏度和目標(biāo)的熵。利用這些信息,選擇k個采樣點(diǎn)作為貝葉斯優(yōu)化的初始采樣點(diǎn)。在完成貝葉斯優(yōu)化之后,構(gòu)建一個由所有嘗試過的模型組成的集成模型。這一步的思路是將訓(xùn)練每個模型所做的努力都存儲下來。沒有拋棄這些模型而選擇更好的模型,而是將它們存儲起來,最終構(gòu)建出一個集成模型。這種自動集成構(gòu)造方法避免了陷入單個超參數(shù)的設(shè)置中,因此魯棒性更強(qiáng)且不容易過擬合。使用集成選擇(這個貪婪過程從空集成開始,迭代地添加能夠最大化集成驗證性能的模型)來構(gòu)建集成模型。
結(jié)合基于EC細(xì)網(wǎng)格數(shù)值預(yù)報產(chǎn)品建立的訓(xùn)練樣本,使用Auto-sklearn工具包進(jìn)行模型訓(xùn)練,Auto-sklearn方法無需關(guān)注參數(shù)設(shè)置和模型選擇,僅需要通過設(shè)置不同的運(yùn)行時間,讓算法在給定的時間內(nèi),盡可能嘗試更多的模型和參數(shù)方案,進(jìn)而得到其中最優(yōu)的集成模型(表1)。
表1 Auto-sklearn自動機(jī)器學(xué)習(xí)的最優(yōu)集成模型
1.2.2Auto-Keras自動深度學(xué)習(xí)方法
Auto-Keras使用一個通過循環(huán)訓(xùn)練的RNN控制器,對候選架構(gòu)(即子模型)進(jìn)行采樣,然后對其進(jìn)行訓(xùn)練,以測量其在期望任務(wù)中的性能[28]。接著,控制器使用性能作為指導(dǎo)信號,以找到更有前景的架構(gòu)。然而神經(jīng)架構(gòu)搜索在計算上非常昂貴、耗時。為了解決這個問題,Auto-Keras使用了高效神經(jīng)架構(gòu)搜索(ENAS)。ENAS采用類似于遷移學(xué)習(xí)的概念,在特定任務(wù)上為特定模型學(xué)習(xí)的參數(shù)可以用于其他任務(wù)上的模型。因此,ENAS迫使所有生成的子模型共享權(quán)值,從而刻意防止從頭開始訓(xùn)練每一個子模型。ENAS不僅可以在子模型之間共享參數(shù),還能夠獲得非常強(qiáng)的性能。
本文使用Nvidia P6000 GPU進(jìn)行Auto-Keras的模型構(gòu)建和運(yùn)算加速,解決神經(jīng)架構(gòu)搜索的計算耗時問題。結(jié)合整體計算資源和建模時效性,設(shè)置Auto-Keras方法構(gòu)建100種組合進(jìn)行模型訓(xùn)練,通過訓(xùn)練最終獲得最優(yōu)的深度學(xué)習(xí)模型(表2)。
表2 Auto-Keras自動深度學(xué)習(xí)的最優(yōu)模型及參數(shù)
1.2.3機(jī)器學(xué)習(xí)方法
為了綜合衡量自動機(jī)器學(xué)習(xí)方法的預(yù)測能力,本文引入機(jī)器學(xué)習(xí)方法的決策樹回歸進(jìn)行對比,考慮到單決策樹功能過于簡單,且容易出現(xiàn)過擬合現(xiàn)象,此處采用迭代決策樹(GBRT)[29]和隨機(jī)森林(RF)[30,31]方法構(gòu)建多決策樹進(jìn)行機(jī)場溫度的回歸預(yù)測。
由于每種方法都有各自的優(yōu)缺點(diǎn),Auto-sklearn主要應(yīng)用于回歸、分類任務(wù),計算量較少,實現(xiàn)成本較低,Auto-Keras則使用神經(jīng)架構(gòu)搜索和強(qiáng)化學(xué)習(xí),構(gòu)建更復(fù)雜的深度神經(jīng)網(wǎng)絡(luò)模型,但計算量巨大,實現(xiàn)成本較高。為了綜合考量不同自動機(jī)器學(xué)習(xí)方法的差異,并與傳統(tǒng)的集成學(xué)習(xí)方法、數(shù)值模式2 m溫度進(jìn)行對比,分析不同的方法下溫度預(yù)測效果的差異。本文使用平均絕對誤差(MAE)、預(yù)報準(zhǔn)確率[32]來判定模型對機(jī)場溫度的回歸預(yù)測效果,具體公式為:
通過使用EC細(xì)網(wǎng)格2 m溫度、自動機(jī)器學(xué)習(xí)方法以及常規(guī)機(jī)器學(xué)習(xí)方法,分析烏魯木齊機(jī)場溫度預(yù)測的平均絕對誤差可知,EC細(xì)網(wǎng)格2 m溫度直接輸出的烏魯木齊機(jī)場溫度平均絕對誤差為1.68℃,誤差相對較大,通過機(jī)器學(xué)習(xí)方法構(gòu)建的預(yù)測模型,能夠改善模式直接輸出的溫度預(yù)報,GBRT方法的平均絕對誤差改善至1.44℃,而采用自動機(jī)器學(xué)習(xí)方法的Auto-Keras和Auto-sklearn預(yù)測烏魯木齊機(jī)場溫度效果更好,其中Auto-sklearn模型的平均絕對誤差最低,達(dá)到1.35℃。
通過分析烏魯木齊機(jī)場溫度的預(yù)報準(zhǔn)確率可以看到,EC細(xì)網(wǎng)格2 m溫度的預(yù)報準(zhǔn)確率(≤2℃)為67.09%,預(yù)報準(zhǔn)確率(≤1℃)為40.21%,機(jī)器學(xué)習(xí)方法構(gòu)建的模型均能夠提升預(yù)報準(zhǔn)確率,其中Auto-sklearn模型的預(yù)報準(zhǔn)確率(≤2℃)最高,達(dá)到77.84%,Auto-Keras模型的預(yù)報準(zhǔn)確率(≤1℃)則達(dá)到49.67%,而常規(guī)的機(jī)器學(xué)習(xí)方法GBRT和RF的預(yù)報準(zhǔn)確率則低于自動機(jī)器學(xué)習(xí)方法,具體結(jié)果見表3。
表3 不同方法預(yù)測烏魯木齊機(jī)場溫度的誤差統(tǒng)計
通過模型總體預(yù)測效果可以看到,自動機(jī)器學(xué)習(xí)方法通過自動構(gòu)建模型和參數(shù)尋優(yōu),能夠改善模式直接輸出的溫度預(yù)測結(jié)果,且預(yù)測效果優(yōu)于傳統(tǒng)的機(jī)器學(xué)習(xí)方法;但是考慮到自動機(jī)器學(xué)習(xí)方法需要利用大量的資源進(jìn)行模型和參數(shù)的遍歷和嘗試,相對傳統(tǒng)機(jī)器學(xué)習(xí)方法更加耗時,在實際業(yè)務(wù)建模中,需要預(yù)留充足的計算資源來提高建模工作的效率。
2.2.1平均絕對誤差分析
通過分析2020年1月—2021年2月烏魯木齊機(jī)場逐月溫度的平均絕對誤差得到,EC細(xì)網(wǎng)格預(yù)測的溫度平均絕對誤差存在明顯的月度變化,2月、4—6月以及11月誤差較小,維持在1.5℃左右,其余月份誤差均>1.7℃,12月誤差最大(2.28℃),由此可見,EC模式輸出的溫度預(yù)測在12月—次年1月平均絕對誤差較大,4—6月平均絕對誤差較小。
4種機(jī)器學(xué)習(xí)方法均能夠改善模式直接輸出的溫度預(yù)測結(jié)果見表4,其中4—11月誤差最小,平均絕對誤差均維持在1.2℃左右,Auto-sklearn模型在5月達(dá)到最低,為0.97℃;針對冬季12月的溫度,Auto-Keras模型改善效果明顯,平均絕對誤差僅為1.79℃;1月不同模型的預(yù)測效果差異較大,Auto-Keras模型預(yù)測效果與EC模式基本持平,其余模型預(yù)測效果均比EC模式差,平均絕對誤差比EC模式偏大0.1~0.2℃;2月機(jī)器學(xué)習(xí)方法則沒有明顯改善模式輸出的溫度預(yù)測效果。
表4 烏魯木齊機(jī)場溫度逐月平均絕對誤差/℃
通過平均絕對誤差的月度對比分析發(fā)現(xiàn),針對不同季節(jié)下烏魯木齊機(jī)場溫度,Auto-sklearn模型在4—5月、7月、9—10月平均絕對誤差最小,Auto-Keras模型在冬季12月平均絕對誤差最小;但是在1、2月,機(jī)器學(xué)習(xí)方法并沒有改善模式輸出的溫度預(yù)報效果,上述機(jī)器學(xué)習(xí)模型的平均絕對誤差均超過了EC模式,因此不同月份的溫度預(yù)報,需要綜合考慮EC模式直接輸出及不同機(jī)器學(xué)習(xí)方法預(yù)測的結(jié)果。
2.2.2預(yù)報準(zhǔn)確率分析
通過分析2020年1月—2021年2月逐月的烏魯木齊機(jī)場溫度預(yù)報準(zhǔn)確率得到,EC細(xì)網(wǎng)格預(yù)測的機(jī)場溫度預(yù)報準(zhǔn)確率有明顯的月季變化,11月預(yù)報準(zhǔn)確率(≤2℃)最高為80.94%,4—6月預(yù)報準(zhǔn)確率(≤2℃)相對較高,維持在75%左右,其余月份的預(yù)報準(zhǔn)確率(≤2℃)相對較低,預(yù)報準(zhǔn)確率(≤2℃)維持在60%~65%,12月最低,僅有48.38%,12月—次年1月,模式直接輸出的溫度預(yù)報效果較差。
機(jī)器學(xué)習(xí)方法構(gòu)建的模型則能夠直接改善預(yù)報準(zhǔn)確率,4—10月的預(yù)報準(zhǔn)確率(≤2℃)均超過80%,大幅提升模式直接預(yù)報溫度的準(zhǔn)確率;1—3月的預(yù)報準(zhǔn)確率(≤2℃)相對較差,且變化范圍較大,為57%~75%,12月的預(yù)報準(zhǔn)確率最差為50%~60%(圖2)。3—10月各類模型的預(yù)報準(zhǔn)確率均有大幅提升,2、11月的預(yù)報準(zhǔn)確率提升不明顯,基本持平模式直接輸出的預(yù)報準(zhǔn)確率,1、12月Auto-sklearn、GBRT、RF模型預(yù)測準(zhǔn)確率低于模式直接輸出的預(yù)報準(zhǔn)確率,僅有Auto-Keras模型能夠維持或略微改善模式直接輸出的結(jié)果。
圖2 逐月不同方法預(yù)測烏魯木齊機(jī)場溫度的預(yù)報準(zhǔn)確率差異(溫度誤差≤2℃)
烏魯木齊機(jī)場2020年1月—2021年2月平均溫度為7.97℃,最低溫度為-26℃,最高溫度為40℃,溫度變化區(qū)間大,其中90%的溫度記錄分布在-20~30℃,為考量不同溫度的預(yù)測效果,將溫度按照10℃量級進(jìn)行劃分,分析不同溫度下的預(yù)測效果。
從表5可知,EC細(xì)網(wǎng)格預(yù)測機(jī)場溫度的平均絕對誤差大部分為1.7℃左右,其中30~40℃平均絕對誤差最小,為1.19℃,因溫度≥40℃區(qū)間樣本數(shù)量僅為4個,故不單獨(dú)分析該溫度區(qū)間的平均絕對誤差。
表5 不同溫度范圍內(nèi)機(jī)場溫度預(yù)測的平均絕對誤差/℃
機(jī)器學(xué)習(xí)方法構(gòu)建的模型能夠改善模式直接輸出的溫度預(yù)測結(jié)果,但是在不同溫度區(qū)間下,不同的模型預(yù)測效果差別顯著。20~40℃平均絕對誤差穩(wěn)定維持在1℃左右,且不同的模型預(yù)測效果差異較??;-10~20℃平均絕對誤差在1.2~1.4℃,Autosklearn模型預(yù)測的效果最優(yōu),Auto-Keras模型預(yù)測效果最差為1.4℃;-30~-10℃平均絕對誤差偏大,Auto-Keras模型預(yù)測的效果優(yōu)于數(shù)值模式直接輸出的溫度預(yù)報,其余模型均出現(xiàn)平均絕對誤差大于數(shù)值模式直接輸出的溫度預(yù)報。Auto-Keras模型預(yù)測的效果整體優(yōu)于數(shù)值模式直接輸出的結(jié)果,機(jī)場溫度≥0℃Auto-sklearn模型預(yù)測效果更好,Auto-Keras模型預(yù)測效果在機(jī)場溫度<0℃情況下更好,常規(guī)機(jī)器學(xué)習(xí)方法GBRT和RF雖然能夠改善模式直接輸出結(jié)果,但是整體預(yù)測效果不如自動機(jī)器學(xué)習(xí)方法構(gòu)建的模型。
本文基于EC細(xì)網(wǎng)格模式直接輸出的烏魯木齊機(jī)場2 m溫度預(yù)報產(chǎn)品,運(yùn)用自動機(jī)器學(xué)習(xí)方法,簡化常規(guī)的機(jī)器學(xué)習(xí)方法中的模型選擇和參數(shù)尋優(yōu)過程,降低氣象技術(shù)人員運(yùn)用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的難度,通過構(gòu)建Auto-sklearn機(jī)器學(xué)習(xí)模型和Auto-Keras深度學(xué)習(xí)模型,改善模式直接輸出的預(yù)報產(chǎn)品。
(1)Auto-Keras模型和Auto-sklearn模型將溫度平均絕對誤差由模式直接輸出的1.7℃降低至1.4℃左右,并且預(yù)測效果優(yōu)于GBRT和RF方法手動參數(shù)調(diào)優(yōu)的模型,自動機(jī)器學(xué)習(xí)方法獲得的模型能夠提升溫度預(yù)報的平均絕對誤差。
(2)構(gòu)建的模型均能夠大幅提升4—10月的預(yù)報準(zhǔn)確率,其中Auto-sklearn模型的預(yù)報準(zhǔn)確率(≤2℃)在4—10月穩(wěn)定在85%以上,效果優(yōu)于其余模型,但是在1、12月Auto-sklearn、GBRT、RF模型預(yù)測準(zhǔn)確率低于模式直接輸出的預(yù)報準(zhǔn)確率,僅有Auto-Keras模型能夠維持或略微改善模式直接輸出的結(jié)果。
(3)機(jī)場溫度≥0℃時,Auto-sklearn模型預(yù)測效果較好,Auto-Keras模型預(yù)測效果在機(jī)場溫度<0℃情況下更好,常規(guī)機(jī)器學(xué)習(xí)方法GBRT和RF雖然能夠改善模式直接輸出結(jié)果,但是整體預(yù)測效果不如自動機(jī)器學(xué)習(xí)方法構(gòu)建的模型。
自動機(jī)器學(xué)習(xí)方法的訓(xùn)練樣本基于EC細(xì)網(wǎng)格數(shù)值模式產(chǎn)品,因此模型預(yù)測的效果依賴于數(shù)值模式產(chǎn)品本身的準(zhǔn)確性,在冬季低溫情況下,數(shù)值模式輸出的產(chǎn)品,尤其是低空及地面的物理量預(yù)測準(zhǔn)確性較差,進(jìn)而導(dǎo)致模型在冬季的溫度預(yù)測效果較差。為提升冬季低溫預(yù)測效果,后續(xù)將對比EC細(xì)網(wǎng)格、GRAPES以及區(qū)域中尺度數(shù)值模式,并優(yōu)化站點(diǎn)數(shù)據(jù)插值方法,分析相關(guān)產(chǎn)品的溫度預(yù)測結(jié)果,通過選取預(yù)測性能更優(yōu)的數(shù)值預(yù)報產(chǎn)品作為訓(xùn)練樣本,改善溫度預(yù)測的準(zhǔn)確性。
另外,不同機(jī)器學(xué)習(xí)方法底層實現(xiàn)算法的區(qū)別,也導(dǎo)致模型預(yù)測效果存在差異,為彌補(bǔ)不同方法缺陷,改善溫度預(yù)測結(jié)果,后續(xù)將結(jié)合機(jī)器學(xué)習(xí)工具的改進(jìn),引入更多適合溫度回歸預(yù)測的模型方法,通過綜合應(yīng)用多種機(jī)器學(xué)習(xí)方法進(jìn)行溫度預(yù)測,提高預(yù)報產(chǎn)品的穩(wěn)定性和準(zhǔn)確性。