李晶,唐全莉
(1. 寧波工程學院經濟與管理學院,浙江 寧波 315000;2. 昆明理工大學理學院,云南 昆明 650500)
氣溫是影響氣候最主要的參數(shù)之一,其變化可導致財產損失,甚至會威脅人類生命。因此,精準的氣溫預報在人類的經濟活動、地質災害防控、醫(yī)療實踐等眾多領域具有重要意義[1-5]。因此,有效挖掘地面氣象觀測站中的時間序列數(shù)據(jù),預知未來氣溫的動態(tài)變化,受到國內外專家學者的高度重視[6-8]。
早期的氣溫預報方法大多運用數(shù)值預報方法[9]和傳統(tǒng)的統(tǒng)計學預報方法[10]。張金秀等[11]運用統(tǒng)計學方法系統(tǒng)分析了河西走廊東部強降溫的時空分布、強度等氣候特征,并利用Press 準則和逐步回歸方法對預報因子進行初選和精選,構建了一種基于最優(yōu)子集回歸的各地月最低氣溫預報方法,為強降溫預報和預警提供了客觀有效的參考依據(jù)。張穎超等[12]基于氣溫在空間上的相關性,運用粒子群算法進一步改進了多面函數(shù)內插算法,進而構建了一種基于地面逐時氣溫觀測資料的多站聯(lián)網(wǎng)質量控制方法,該方法具有較強的地區(qū)適應性和氣候適應性。李江峰等[13]基于偏最小二乘回歸能完全消除多重共線性的特點,構建了水汽和地面氣溫多模式集成預報模型,進一步改善了比濕和地面氣溫多模式集成預報的效果。雖然這些方法在氣溫預報上都取得了良好的預報效果,但因受制于較大的計算代價、大量物理噪聲以及與氣溫無關的冗余特征對氣溫變化的影響,傳統(tǒng)的統(tǒng)計學氣溫預報方法無法有效地學習氣象觀測數(shù)據(jù)間的時間相關性,在氣溫預報精度上仍具有一定的提升空間。
隨著深度學習的發(fā)展,人工神經網(wǎng)絡(Artificial Neural Networks,ANN)憑借超強的自學習能力,可深度學習海量數(shù)據(jù)間隱藏的復雜關系,在氣象領域已取得一定的應用成果[14-18],例如小波神經網(wǎng)絡(Wavelet Neural Network,WNN)[19]、反向傳播神經網(wǎng)絡(Back Propagation,BP)[20]、長短期記憶神經網(wǎng)絡(Long Short-Term Memory,LSTM)以及一維卷積神經網(wǎng)絡(One - Dimensional Convolutional Neural Network,1DCNN)等。其中,1DCNN 神經網(wǎng)絡的表征學習能力,可挖掘時間序列數(shù)據(jù)中存在的長期依賴關系,進而提取高階特征[21];LSTM 神經網(wǎng)絡利用遺忘門、輸入門和輸出門,被證實在時間序列任務中具有較好的預報效果[22]。倪錚等[23]將LSTM 深度神經網(wǎng)絡用于精細化氣溫預報,在空軍T511 數(shù)據(jù)模型產品的試用過程中,發(fā)現(xiàn)該模型對轉折天氣具有較好的氣溫預報效果。陶曄等[24]利用隨機森林(Random Forest,RF)可度量特征重要性的特點,將RF 與LSTM 模型相結合,構建了RF-LSTM 氣溫預報模型。然而,盡管LSTM 神經網(wǎng)絡對時間序列數(shù)據(jù)具有較好的預報能力,但由于海量氣象觀測數(shù)據(jù)間存在大量的物理噪聲和與氣溫無關的冗余特征,因此,僅運用LSTM 模型對氣溫進行預報存在訓練時間長、易過擬合等缺陷。
鑒于此,本文基于1DCNN 能夠進行特征提取的特點和LSTM 較強的時間序列數(shù)據(jù)處理能力,構建了一種多信息融合氣溫預報方法1DCNNLSTM。該方法可有效地挖掘氣象觀測數(shù)據(jù)間存在的時間相關性,剔除與氣溫變化無關的物理噪聲和冗余特征,降低數(shù)據(jù)維度和時間復雜度,進而可提取出與氣溫高度相關的潛在特征,進一步提高氣溫預報精度。
1DCNN 神經網(wǎng)絡是卷積神經網(wǎng)絡(Convolutional Neural Network,CNN)的一種特殊結構,具有強大的表征學習能力,能夠從輸入信息中提取高階特征[25]。一個典型的1DCNN 模型通常包括輸入層、若干個交替的卷積層和池化層、全連接層和輸出層這5個部分。其中,卷積層可對輸入數(shù)據(jù)進行特征提取[26]。
卷積層。卷積層通過卷積運算從輸入數(shù)據(jù)中提取子序列,以達到從局部輸入中提取高階特征,提高特征魯棒性的目的,卷積公式如式(1)所示。為了提高1DCNN 模型的稀疏性,減少參數(shù)之間的依存關系,通常采用線性整流函數(shù)(Rectified Linear Unit,ReLU)作為卷積層的激活函數(shù),數(shù)學表達式如式(2)所示,
池化層。池化層在卷積層之后,利用最大池化方法對卷積層的輸出執(zhí)行池化操作,如式(3)所示,
LSTM 神經網(wǎng)絡是遞歸神經網(wǎng)絡(Recursive Neural Network,RNN) 的 一 種 變 體,是Sepp Hochreiter 和Jürgen Schmidhuber 專門研究梯度消失問題所提出的重要研究成果[27]。該方法提出了一種可攜帶信息跨越多個時間步的設計,因此,能夠挖掘數(shù)據(jù)間存在的時間相關性,有效避免傳統(tǒng)RNN模型由于無法學習數(shù)據(jù)間的時間依賴關系而面臨的梯度爆炸和梯度消失問題。其單元結構如圖1所示。
圖1 LSTM單元結構圖
由圖1 可看出,LSTM 是由多個結構完全相同的單元構成,利用遺忘門、輸入門和輸出門的相互作用來調節(jié)單元狀態(tài)。遺忘門、輸入門和輸出門的具體調節(jié)步驟如下。
(1) 通過遺忘門從單元狀態(tài)中找到需要丟棄的信息,如式(4)所示,
其中,ft為遺忘門,σ為sigmoid 激活函數(shù),ht-1和xt分別為前一時刻的輸出值和當前時刻的輸入值,Wf和bf分別表示遺忘門的權重矩陣和偏置項。
(2) 通過輸入門決定加入新狀態(tài)的時間。①通過sigmoid 層找到需要更新的單元狀態(tài);②通過雙曲正切函數(shù)(tanh)層創(chuàng)建一個新的單元狀態(tài)值;③將舊單元狀態(tài)更新到新單元狀態(tài),具體計算步驟如式(5)~式(7)所示,
其中,it、?、Ct-1和Ct分別表示輸入門、當前輸入的單元狀態(tài)、舊單元狀態(tài)和跟新后的新單元狀態(tài),Wi和bi分別表示輸入門的權重矩陣和偏置項,Wc和bc分別表示單元狀態(tài)的權重矩陣和偏置項。
(3) 通過輸出門將新單元狀態(tài)和輸入數(shù)據(jù)相結合,確定LSTM 模型的輸出值。首先,利用sigmoid 層確定需要輸出的信息,如式(8)所示;其次,將tanh 層和sigmoid 層相乘,得到最終的輸出值,如式(9)所示,
其中,ot表示輸出門,ht表示LSTM 模型最終的輸出,Wo和bo分別表示輸出門的權重矩陣和偏置項。
本文研究區(qū)域為云南省昆明市。由于其獨特的地理位置,經常出現(xiàn)倒春寒、洪澇、干旱等多種氣象災害,以及由氣象災害引發(fā)的泥石流、山體滑坡等地質災害,該地區(qū)時常遭受經濟和人員等重大損失。因此,本文將通過挖掘云南省昆明市氣象觀測數(shù)據(jù)間的隱藏特征,進而提高氣溫預報精度,增強氣象災害預防能力。
氣溫變化易受到各種不可控因素的影響,隨著預報時間的增加,預報誤差逐漸累積,進而導致氣溫預報模型的預報精度不斷降低。因此,預報時間越長,氣溫預報誤差就越大?;诖?,本文擬運用過去一周(即7 天)的歷史氣象觀測數(shù)據(jù)來預測云南省昆明市未來24 小時的逐時氣溫,進一步探究多信息融合氣溫預報模型1DCNN-LSTM 在未來24 小時中的氣溫預報效果,為中長期氣溫預報的研究提供理論基礎。
傳統(tǒng)的氣溫預報方法主要基于單變量的氣溫預報,即僅考慮了氣溫這一氣象要素,忽略了其他氣象要素對氣溫變化的影響。因此,導致氣溫預報模型的輸入變量過少,時間序列數(shù)據(jù)之間關聯(lián)信息不足,進而降低傳統(tǒng)氣溫預報方法的精度?;诖?,本文將構建多信息融合的預報方法對氣溫變化進行深入探究。通過運用文獻分析法,得出影響氣溫變化的主要因素有氣溫(T)、氣象站氣壓(PO)、海 平 面 氣 壓(P)、相 對 濕 度(RH)、風 向(WD)、風速(WS)以及水平能見度(VV)。其單位分別為攝氏度(℃)、hPa、hPa、百分率(%)、羅盤方向、米/秒(m/s)、千米(km)。其中,T為本文的預測值(y),PO、P、RH、WD、WS 以及VV 為特征值(x)。根據(jù)以上影響因素,本文將收集云南省昆明市地面氣象站2017 年1 月1 日00 時—2019 年12 月31 日23 時(北京時間,共計1 095 天)的每小時氣象觀測數(shù)據(jù)(共計26 280條)進行實證研究。同時,運用差分法對氣象觀測數(shù)據(jù)進行預處理,將預處理后的數(shù)據(jù)集中的前80%作為訓練集,后20%作為測試集,并隨機抽取訓練集中的20%作為驗證集。
由于本文所收集到的氣象觀測數(shù)據(jù)具有明顯的季節(jié)性變化,且其中的的風向數(shù)據(jù)屬于文本數(shù)據(jù),因此,本文的數(shù)據(jù)預處理主要包括以下3 個方面:(1) 運用地面氣象電碼將風向中的文本數(shù)據(jù)轉換成對應的風向電碼(數(shù)值數(shù)據(jù)),得到適用于神經網(wǎng)絡模型的數(shù)據(jù)集;(2) 運用差分法對轉換后的氣象觀測數(shù)據(jù)集進行去季節(jié)化處理,剔除季節(jié)性變化對模型產生的信號干擾,進而得到平穩(wěn)的時間序列數(shù)據(jù);(3) 運用z-score標準化方法對去季節(jié)化后的數(shù)據(jù)進行標準化處理,得到均值為0標準差為1的服從標準正態(tài)分布的數(shù)據(jù),以解決不同氣象要素之間由于量綱和量綱單位不統(tǒng)一而造成的可比性問題,如式(10)所示。該方法使訓練數(shù)據(jù)更加集中,有效縮短了模型的訓練時間,更有利于模型的正常運行。
其中,x為原始時間序列數(shù)據(jù),x*、xˉ和σ分別為x標準化后的樣本數(shù)據(jù)、x的均值和標準差。
通常情況下,用于評估機器學習模型預報性能所采用的評價指標主要包括均方根誤差(Root Mean Square Error,RMSE)、平均絕對誤差(Mean Absolute Error,MAE)、皮爾遜相關系數(shù)(Pearson Correlation Coefficient,PCCs)以及高斯核密度估計(Gaussian Kernel Density Estimation,GKDE)等。其中,RMSE 和MAE 是預測誤差的衡量指標,指標值越小,表明預測精度越高,即預測值越接近真實值。PCCs 是度量相關性的衡量指標,常用r表示。r值越接近1,表明預測值與真實值之間的相關性越強,擬合度越高。GKDE 模型是一種用于估計概率密度函數(shù)的非參數(shù)方法,通過比對各模型的誤差分布,GKDE 曲線峰度越高,表明模型產生的預報誤差越集中地分布在0附近,即氣溫預測值越接近真實值。因此,本文選取模型的泛化能力、預報精度以及誤差分布作為衡量1DCNNLSTM 多信息融合氣溫預報模型預報性能的評價指標。其中,RMSE、MAE 和r的計算公式分別如式(11)~(13)所示:
其中,yi、y′i、以及分別為真實氣溫值、預報氣溫值、真實氣溫值的均值和預報氣溫的均值,N為測試樣本的數(shù)量。
隨著科學技術的不斷進步,尤其是計算機領域的逐漸壯大,神經網(wǎng)絡模型在氣溫預報領域已取得一定的應用成果。其中,傳統(tǒng)的氣溫預報方法主要包括1DCNN、LSTM 和BP 神經網(wǎng)絡。LSTM 神經網(wǎng)絡具有良好的長期依賴性,能夠挖掘出時間序列數(shù)據(jù)間存在的時間相關性,但存在參數(shù)過多、訓練時間較長且容易過擬合的缺陷。1DCNN 神經網(wǎng)絡具有強大的特征學習能力,能夠從輸入信息中提取隱藏特征,從而挖掘出與氣溫高度相關的高階特征,有效彌補了LSTM 的不足,在提高模型預報精度的同時減少訓練時間。BP神經網(wǎng)絡具有較強的非線性映射能力,可利用誤差反向傳播算法自動調整權值和閾值,能夠較好地完成時間序列預報任務。
鑒于此,本文構建了一種將1DCNN 神經網(wǎng)絡和LSTM 神經網(wǎng)絡相結合的多信息融合氣溫預報模型1DCNN-LSTM,該模型主要由輸入層、卷積層、SpatialDropout1D 層、池 化 層、LSTM 層、Dropout 層和全連接層構成。1DCNN-LSTM 模型的總體氣溫預報過程可分為5步。(1) 運用輸入層將形為(batch_size,time_steps,input_features)的氣象觀測數(shù)據(jù)輸入神經網(wǎng)絡模型。其中,batch_size表示用于訓練的數(shù)據(jù)批量大小,即每次喂入神經網(wǎng)絡的樣本數(shù),屬于樣本數(shù)量上的概念。經過反復試驗,本文將其設置為32;time_steps 表示氣溫預報的時間步長,即每個樣本內包含的步長數(shù),屬于樣本內部概念。由于本文運用過去7天(t-6,t-5,t-4,t-3,t-2,t-1,t)內T、PO、P、RH、WD、WS 和VV的時間序列數(shù)據(jù)來預測t+24 小時內的逐時氣溫,故將time_steps 設置為7;input_features 表示輸入數(shù)據(jù)的特征維度,由于輸入7 個特征因子,因此本文將其設置為7。(2) 運用卷積層對輸入數(shù)據(jù)進行特征提取。(3) 運用池化層對提取到的深層特征進行下采樣,以進一步降低數(shù)據(jù)維度。(4) 運用LSTM 層挖掘時間序列數(shù)據(jù)之間的時間相關性,進而有效地學習氣象觀測數(shù)據(jù)之間的時間依賴關系。(5) 運用全連接層輸出第t+1時刻各氣象要素的預報值,并利用該預報結果繼續(xù)更新輸入層中的時間序列數(shù)據(jù),即輸入(t-5,t-4,t-3,t-2,t-1,t,t+1)內各氣象要素的數(shù)據(jù)來預測t+2 時刻的氣溫值。通過重復這個過程,可實現(xiàn)t+n小時內的逐時氣溫預報,本文將n設置為24。
在整個試驗過程中,設置1DCNN-LSTM 氣溫預報模型的優(yōu)化器為Adam,損失函數(shù)RMSE,epoch 為200,batch_size 為32,學習率η=0.000 1,且每隔100 個epoch,學習率減小為原來的1/10。同時,經過本文的反復實驗,發(fā)現(xiàn)將1DCNNLSTM 模型中一維卷積層層數(shù)設置為1,且該層一維卷積核大小設置為5,一維卷積核個數(shù)設置為200,LSTM 層層數(shù)設置為2,且每層LSTM 神經元個數(shù)分別設置為128 和64 時,該模型的氣溫預報效果最好。此外,為了降低1DCNN-LSTM 模型的過擬合,進一步提高氣溫預報精度,本文在一維卷積層和LSTM 層之后,分別添加了比率為0.5 的SpatialDropout1D 層和Dropout 層。其總體框架如圖2所示。
圖2 多信息融合氣溫預報方法1DCNN-LSTM的總體框架
由圖2 可看出,多信息融合氣溫預報方法1DCNN-LSTM 主要分為兩部分。第一部分,將經過數(shù)據(jù)預處理后7 天內的氣象觀測數(shù)據(jù)作為1DCNN 神經網(wǎng)絡的輸入變量,通過卷積層進行特征提取,利用池化層降低數(shù)據(jù)維度,進而提取出與氣溫高度相關的深層特征;第二部分,將1DCNN模型提取到的特征向量輸入LSTM 神經網(wǎng)絡中,利用LSTM 模型特殊的門結構,進一步學習數(shù)據(jù)間的時間依賴關系,進而對氣溫進行預報。
由3.4 節(jié)可知,基于深度學習的傳統(tǒng)氣溫預報方法主要包括1DCNN、LSTM和BP神經網(wǎng)絡。因此,本文將選取1DCNN、LSTM 和BP 神經網(wǎng)絡作為基線模型,與所構建的1DCNN-LSTM 在模型總體預報效果、氣溫預報性能兩個方面進行對比分析。
通常情況下,測試集樣本數(shù)更多且數(shù)據(jù)分布可能發(fā)生變化,比驗證集更能考驗模型的泛化能力、預報精度和總體預報效果。因此,在進行氣溫預報性能對比之前,本文首先針對測試集中的數(shù)據(jù),對模型的總體預報效果進行對比分析,分別繪制出1DCNN-LSTM、1DCNN、LSTM 和BP 模型的氣溫真實值(折線)與預測誤差(柱狀)的對比圖,如圖3~圖6所示。
由圖3~圖6 可看出,在對氣溫預報總體趨勢的過程中,除了少數(shù)的波峰和波谷預報效果較差以外,1DCNN-LSTM、1DCNN、LSTM 和BP 模型都能較好地刻畫氣溫的動態(tài)變化,氣溫預測值與真實值的總體走勢基本一致。
為了更清晰地描述各模型的預報效果,本文隨機抽取了圖3~圖6中連續(xù)2天(共48個)的數(shù)據(jù)進行分析,具體如圖7所示。
圖3 1DCNN-LSTM模型氣溫預報結果
圖6 BP模型氣溫預報結果
由圖7 可看出,相較于傳統(tǒng)的1DCNN、LSTM和BP 模型,本文所構建的多信息融合氣溫預報模型1DCNN-LSTM 的氣溫預報曲線更貼近氣溫真實曲線。因此,該模型具有較好的氣溫預報效果,氣溫預測值更接近真實值。這進一步表明1DCNN-LSTM 模型可有效地剔除歷史氣象觀測數(shù)據(jù)間的物理噪聲和與氣溫無關的冗余特征,進而提取出與氣溫高度相關的隱藏特征;在考慮數(shù)據(jù)間時間相關性的同時,彌補了LSTM 模型訓練時間長、易過擬合的缺陷,這也是本文將1DCNN模型和LSTM 模型相結合構建多信息融合氣溫預報模型的原因所在。
圖7 1DCNN-LSTM、1DCNN、LSTM和BP模型隨機抽取的氣溫預報結果
圖4 1DCNN模型氣溫預報結果
圖5 LSTM模型氣溫預報結果
由3.5 節(jié)可知,用于評估機器學習模型預報性能所采用的評價指標主要包括模型的泛化能力、預報精度以及誤差分布。針對測試集中的數(shù)據(jù),分別從以下3 個方面對各模型的氣溫預報性能進行對比分析。(1)對1DCNN-LSTM、1DCNN、LSTM和BP模型的泛化能力進行對比分析。模型的泛化能力越強,表明該模型的實際預測能力越強,理論上氣溫預報精度就越高,具有進一步研究的價值。(2)從RMSE、MAE、r以及p值的角度對模型的預報精度進行對比分析。其中,p值是統(tǒng)計學中應用最廣的假設檢驗指標之一,將其與給定的顯著性水平進行比較,可確定是否具有統(tǒng)計學意義。本文將選定顯著性水平為0.05,則當p≤0.05時,表明該模型的RMSE、MAE和r值均具有統(tǒng)計學意義。RMSE 和MAE 的值越小且r值越接近1,表明該模型的預報精度越高。(3) 針對1DCNN-LSTM、1DCNN、LSTM 和BP 模型的氣溫預測值,對模型的誤差分布進行對比分析,預報誤差越集中地分布在0附近,表明模型的預報性能越好。
4.2.1 模型泛化能力對比分析
針對測試集中的數(shù)據(jù),分別繪制出1DCNNLSTM、1DCNN、LSTM 和BP 模型在200 次迭代下的RMSE、MAE對比圖,分別如圖8和圖9所示。
圖8 1DCNN-LSTM、1DCNN、LSTM和BP模型未來24小時的RMSE曲線對比圖
圖9 1DCNN-LSTM、1DCNN、LSTM和BP模型未來24小時的MAE曲線對比圖
由圖8 可看出,在對未來24 小時的逐時氣溫預報過程中,1DCNN-LSTM 模型的RMSE 曲線明顯比1DCNN、LSTM 和BP 模型低,表明1DCNNLSTM 模型隨著預報時間的不斷增加,始終保持較高的氣溫預報精度,具有較強的實際氣溫預報能力。同時,1DCNN-LSTM、1DCNN、LSTM 和BP 模型的RMSE 曲線均隨著預報時間的增加而持續(xù)上升,且最終趨于穩(wěn)定。這可能是因為在整個氣溫預報過程中,各模型的預報誤差隨著預報時間的增加而不斷累積,模型的可預報性逐漸降低,進而導致各模型的RMSE 曲線隨著預報時間的增加而持續(xù)上升。此外,由前10 小時的氣溫預報結果可看出,相較于1DCNN、LSTM和BP模型,1DCNN-LSTM 模型的RMSE 曲線最低,表明在短時氣溫預報過程中,1DCNN-LSTM 模型的氣溫預報精度更高,氣溫預報值更接近真實值。由后15~24 小時的氣溫預報結果可看出,1DCNN-LSTM模型的RMSE 曲線在0.700 附近趨于穩(wěn)定,LSTM和BP 模型的RMSE 曲線在0.715 附近趨于穩(wěn)定,1DCNN 模型的RMSE 曲線在0.745 附近趨于穩(wěn)定。1DCNN-LSTM 模型的RMSE 穩(wěn)定值最低,表明隨著預報時間的持續(xù)增加,1DCNN-LSTM 模型在未來48 小時、72 小時甚至未來幾天的氣溫預報過程中,均具有較好的氣溫預報效果。綜上所述,對比1DCNN、LSTM 和BP 模型,無論是短期氣溫預報還是長期氣溫預報,本文所提出的多信息融合氣溫預報模型1DCNN-LSTM 均具有更好的學習能力和泛化能力,能夠更有效地對氣溫進行精準預報。
由圖9 可看出,相較于1DCNN、LSTM 和BP模型,1DCNN-LSTM模型在總體24小時氣溫預報過程中的MAE 曲線最低,表明1DCNN-LSTM 模型具有更好的氣溫預報效果,能夠更有效地提高氣溫預報精度。同時,與圖8 中1DCNN-LSTM、1DCNN、LSTM 和BP 模型的RMSE 曲線相似,在對未來24 小時的逐時氣溫預報過程中,各模型的MAE 曲線均隨著預報時間的增加而持續(xù)上升,且最終趨于穩(wěn)定。其中,1DCNN-LSTM 模型的MAE 曲線在0.575 附近趨于穩(wěn)定,LSTM 模型的MAE 曲線在0.585 附近趨于穩(wěn)定,BP 模型的MAE曲線在0.590 附近趨于穩(wěn)定,1DCNN 模型的MAE曲線在0.625 附近趨于穩(wěn)定。綜上所述,對比1DCNN、LSTM 和BP 模型,本文所構建的多信息融合氣溫預報模型1DCNN-LSTM 能夠進一步提高氣溫的預報精度,進而對氣溫進行精準預報。
4.2.2 模型預報精度對比分析
由4.2.1 節(jié) 可 知,1DCNN-LSTM、1DCNN、LSTM 和BP 模型的RMSE 和MAE 曲線在 未 來10小時氣溫預報之后均趨于穩(wěn)定?;诖?,為了進一步比較各模型的氣溫預報精度,分別計算得出在對未來10 小時的氣溫預報過程中,1DCNNLSTM 模型相較于LSTM、1DCNN 和BP 模型在RMSE、MAE 和r上改進的百分比,具體如表1 所示。
表1 1DCNN-LSTM相較于1DCNN、LSTM和BP模型在RMSE、MAE、r和p上改進的百分比
由表1 可看出,LSTM、1DCNN 和BP 模型的p值均等于0.000(小于0.050),表明各模型的RMSE、MAE 和r值均具有統(tǒng)計學意義。同時,在對未來10 小時的總體氣溫預報過程中,各模型每小時的RMSE、MAE 和r值的百分比都大于0,表明相較于LSTM、1DCNN 和BP模型,1DCNN-LSTM 模型的氣溫預報精度更高,能夠更好地對氣溫進行精準預報,與圖8 和圖9 得到的結論相符。其中,由表1 加粗的數(shù)據(jù)可看出,1DCNN-LSTM 模型的RMSE 和MAE 在第1 小時內降低的最多,表明1DCNN-LSTM 模型的短時氣溫預報效果較好,為后續(xù)進一步提高中長期氣溫預報精度提供了理論依據(jù);相關性r在第10 小時內提高的最多,表明1DCNN-LSTM 模型的氣溫預測值與真實值之間的相關性不斷增強,具有更好的氣溫預報效果。接下來,本文將1DCNN-LSTM 模型分別與LSTM、1DCNN和BP模型進行對比分析。
(1) 對比LSTM 模型,1DCNN-LSTM 模型的RMSE 和MAE 最大降低了5.221%和4.419%,相關性r最大提高了0.131%。這是因為LSTM 模型雖然可較好地學習氣象觀測數(shù)據(jù)間的時間依賴關系,但無法避免不能進行特征提取、訓練時間較長、易過擬合的缺陷,而1DCNN-LSTM 模型可提取出與氣溫變化相關的深層特征,進而有效地彌補了LSTM模型的不足。
(2) 對比1DCNN 模型,1DCNN-LSTM 模型的RMSE 和MAE 最大降低了19.350%和17.520%,相關性r最大提高了0.482%。這是因為1DCNN模型雖然能夠挖掘出與氣溫高度相關的隱藏特征,但忽略了氣象觀測數(shù)據(jù)之間的時間相關性,而1DCNN-LSTM 模型可運用LSTM 模型學習數(shù)據(jù)間的時間依賴關系,進而有效彌補了1DCNN 模型無法挖掘數(shù)據(jù)間時間相關性的缺陷。
(3) 對 比BP 模 型,1DCNN-LSTM 模 型 的RMSE 和MAE 最大降低了9.253%和8.089%,相關性r最大提高了0.246%。這是因為BP 模型是一種無時序概念的前饋神經網(wǎng)絡,雖然該模型具有較強的非線性映射能力,但與LSTM 模型不能進行特征提取的缺陷相似,BP 模型無法避免物理噪聲和與氣溫無關的冗余特征對氣溫變化的影響;同時,也與1DCNN 模型無法挖掘數(shù)據(jù)之間時間相關性的缺陷相似,BP 模型不能學習數(shù)據(jù)間的時間依賴關系,因此,導致氣溫預報精度遠低于1DCNN-LSTM模型。
由上述1DCNN-LSTM 模型與傳統(tǒng)氣溫預報模型的對比分析可看出,針對RMSE 指標,1DCNN-LSTM 模型較LSTM、1DCNN 和BP 模型最大降低了5.221%、19.350%和9.253%,氣溫預測值更接近真實值;針對MAE 指標,1DCNN-LSTM模型較LSTM、1DCNN 和BP 模型最大降低了4.419%、17.520%和8.089%,具有較高的預測精度;針對r指標,1DCNN-LSTM 模型較LSTM、1DCNN 和BP 模型最大提高了0.131%、0.482%和0.246%,氣溫預測值與真實值的相關性最高。因此,4 種模型的氣溫預報精度從優(yōu)到劣依次是1DCNN-LSTM 模 型、LSTM 模 型、BP 模 型、1DCNN模型。
綜上所述,相較于LSTM、1DCNN和BP模型,本文所構建的多信息融合氣溫預報模型1DCNNLSTM 是基于1DCNN 較強的特征提取能力和LSTM 能夠挖掘時間相關性的特點等優(yōu)勢。因此,該模型較好地彌補了LSTM 和1DCNN 存在的缺陷,有效提高了氣溫預報精度。
4.2.3 模型誤差分布對比分析
為了進一步說明1DCNN-LSTM 模型具有更好的氣溫預報效果,本文將運用GKDE 方法對模型產生的誤差進行分析(圖10)。
圖10 1DCNN-LSTM、1DCNN、LSTM和BP模型的誤差分布對比結果
由 圖10 可 看 出,1DCNN-LSTM、1DCNN、LSTM和BP模型的誤差分布近似于高斯分布。對比1DCNN 模型,1DCNN-LSTM 模型的GKDE 曲線峰度明顯更高,預報誤差更集中地分布在0 附近;對比LSTM 模型,雖然1DCNN-LSTM 模型的KDE 曲線峰度略低,但由4.1 節(jié)所分析的,1DCNN-LSTM 模型的整體預報效果明顯優(yōu)于LSTM 模型;對比BP 模型,1DCNN-LSTM 模型的GKDE 曲線的密度更高且平均值更接近于0。因此,相較于1DCNN、LSTM 和BP 模型,1DCNNLSTM 模型產生的預報誤差更密集地分布在0 附近,氣溫預測值更接近真實值,具有顯著良好的氣溫預報效果,可對氣溫進行精準預報。
為了剔除大量物理噪聲和與氣溫無關的冗余特征對氣溫變化的影響,挖掘出海量氣象觀測數(shù)據(jù)之間的時間相關性,本文構建了一種將特征提取能力較強的1DCNN 神經網(wǎng)絡和時間序列處理能力較強的LSTM 神經網(wǎng)絡相結合的多信息融合氣溫預報方法1DCNN-LSTM。該方法不僅有效地緩解了傳統(tǒng)氣溫預報模型因關聯(lián)信息不足而導致的預報精度降低、泛化能力下降的弱點,還較好地彌補了LSTM 模型訓練時間長、易過擬合的缺陷。實驗結果表明,在對未來24 小時的逐時氣溫預報過程中,相較于傳統(tǒng)的1DCNN、LSTM 和BP模型,本文所構建的多信息融合氣溫預報方法1DCNN-LSTM 的RMSE 和MAE 值最小且r值最接近1,表明1DCNN-LSTM 模型具有較好的氣溫預報效果,能夠有效地降低數(shù)據(jù)維度和時間復雜度,進而提高氣溫預報精度。此外,由前10小時的氣溫預報結果可看出,相較于1DCNN、LSTM 和BP 模型,1DCNN-LSTM 模型的RMSE 和MAE 值在第1小時內降低的最多,相關性r在第10小時內提高的最多,表明1DCNN-LSTM 模型在短時氣溫預報過程中的氣溫預報精度較高,氣溫預報值更接近真實值。因此,在進一步的工作中,可考慮將本文所構建的多信息融合氣溫預報模型1DCNNLSTM 與滾動預測方法相結合,進而在提高短時氣溫預報精度的基礎上,進一步提高中長期氣溫預報精度。