寇凱淇 杜思靜 王夢巧 劉欣宇 仲萬桐 喬百友
(東北大學計算機科學與工程學院 遼寧·沈陽 110819)
在全球氣候變暖的背景下,各類極端自然災害頻發(fā)。臺風作為氣象災害中最具破壞性的天氣現(xiàn)象之一,嚴重制約著沿海地區(qū)的經(jīng)濟發(fā)展和人類社會的生命財產(chǎn)安全。準確預測臺風的移動路徑對于有效降低臺風災害帶來的損失至關重要。傳統(tǒng)的臺風預測方法主要采用數(shù)值計算方法,計算代價大,預測耗時比較長,而且需要人工不斷地矯正,因此需要積極探索新的臺風路徑預測方法。
近年來,隨著大數(shù)據(jù)和人工智能技術的發(fā)展,人們開始積極探索基于數(shù)據(jù)驅(qū)動的方法來預測,期望能夠更加準確高效地預測臺風移動路徑。為此提出了一系列的預測方法,如基于BP神經(jīng)網(wǎng)絡預測方法,基于卷積神經(jīng)網(wǎng)絡的集合預報方法等。由于神經(jīng)網(wǎng)絡在預測問題中僅需要較少的人工干預,已經(jīng)廣泛用于各個研究領域當中。因此,相比于以往利用動力學參數(shù)和統(tǒng)計學方法等需要大量人工測算的臺風路徑預測方法相比,可有更加快速地擬合真實的臺風路徑。
時間卷積神經(jīng)網(wǎng)絡模型(Temporal Convolution Networks,TCN)在時間序列問題的處理上要優(yōu)于一般的卷積神經(jīng)網(wǎng)絡方法。臺風本身是一種時序過程,臺風路徑的預測本身就是一種復雜的時間序列預測問題,非常適合TCN模型,為此本文提出了一種基于 TCN的臺風路徑預測方法。該方法首先整合海洋、大氣數(shù)據(jù)和歷史臺風路徑數(shù)據(jù)建立可用于訓練的特征集,之后將其輸入到TCN模型中進行訓練,從而建立數(shù)據(jù)與路徑經(jīng)緯度間的序列映射關系,最終實現(xiàn)臺風移動路徑預測。一系列的實驗結果表明所提出基于 TCN的預測方法能夠較準確地擬合真實臺風移動路徑。
本文數(shù)據(jù)來自中國臺風中心,南海區(qū)域海洋大氣數(shù)據(jù)和臺風數(shù)據(jù),數(shù)據(jù)時間范圍從1949年-2018年共計1170場臺風,提取了臺風到達前和臺風經(jīng)過的經(jīng)緯度、氣壓、風速、時間、海表信息、氣候信息數(shù)據(jù)和該區(qū)域內(nèi)的臺風路徑數(shù)據(jù),每條數(shù)據(jù)包含268個特征。為了降低數(shù)據(jù)維度,避免數(shù)據(jù)分析與處理對系統(tǒng)資源的大量消耗,本文采用皮爾遜相關系數(shù)對輸入特征向量進行特征選擇。皮爾遜系數(shù)(Pearson correlation coefficient)常用于衡量兩個變量之間的線性相關程度,計算公式如下:
皮爾遜相關系數(shù)的結果r的值介于-1與1之間。r值的絕對值越大,說明兩個變量的線性相關性越強。當r值的絕對值介于0.8-1.0之間時,通常稱兩個變量具有極強相關性。當r值為正時,兩個變量呈正線性相關,當r值為負時,兩個變量為負線性相關。根據(jù)已知的臺風路徑數(shù)據(jù)特征信息,可通過皮爾遜相關系數(shù)計算變量之間的相關性,并用于特征的選擇。每組數(shù)據(jù)經(jīng)過預處理后包含經(jīng)緯度、氣壓、風速、時間、海表面溫度、高度以及24小時經(jīng)緯度變化量等107個比較相關性的特征。
本文采用時間卷積網(wǎng)絡TCN來實現(xiàn)對臺風路徑的預測。TCN是一種特殊的卷積神經(jīng)網(wǎng)絡,能夠較好地擬合時間序列的預測問題。以往時序問題的處理上,通常選用LTSM網(wǎng)絡預測或者CNN卷積神經(jīng)網(wǎng)絡。TCN網(wǎng)絡結合了時域卷積網(wǎng)絡,融合了時域上的建模能力,具有較強的低參數(shù)量下的特征提取能力,在一系列應用中優(yōu)于LSTM和CNN網(wǎng)絡。故本文選用TCN網(wǎng)絡來預測臺風路徑?;赥CN的臺風路徑預測模型如圖1所示。
圖1:基于TCN的臺風路徑預測模型
從圖中可以看出,原始海洋、大氣和臺風數(shù)據(jù)經(jīng)過預處理后,采用皮爾遜相關系數(shù)進行特征選擇,之后利用滑動窗口進行切分,形成訓練數(shù)據(jù),輸入TCN網(wǎng)絡模型,進行模型訓練和預測。本文提出的 TCN臺風路徑預測模型由8層殘差塊與1層全連接層組成。整個網(wǎng)絡模型的輸入數(shù)據(jù)維度為107,包含大氣、海洋和臺風路徑數(shù)據(jù),模型窗口設置為1,每個殘差塊的神經(jīng)元個數(shù)設置為128個,全連接層神經(jīng)網(wǎng)絡神經(jīng)元個數(shù)為64。預測時間步長為4,輸出維度為2維,即預測的經(jīng)緯度數(shù)據(jù)。
殘差模塊也是TCN網(wǎng)絡的重要組成結構,其結構如圖中所示。每個殘差模塊由兩個卷積組成,并且添加了跨層連接恒等映射,加快了網(wǎng)絡的反饋與收斂速度,防止梯度爆炸與梯度消失。TCN網(wǎng)絡使用因果卷積來保證未來信息不泄露,通過增加信息量來提高了模型的預測精度,但同時增加了模型的復雜度。為此TCN使用擴張卷積來增加網(wǎng)絡的感受野,使網(wǎng)絡可以看到更久遠的信息。擴張卷積的感受范圍取決于卷積核的大小K或擴張系數(shù)d,擴張系數(shù)d通常取1,2,4,8。設第 i個卷積層中卷積核的感受野為Fi,卷積步長為sn,則擴張卷積感受野的計算公式為:
考慮網(wǎng)絡模型的訓練需求與數(shù)據(jù)集情況,本文主要對24小時臺風路徑的變化進行預測。用于模型訓練的數(shù)據(jù)集來自于南海,主要由1170組臺風數(shù)據(jù)和對應的海洋、大氣數(shù)據(jù)組成,共22128條數(shù)據(jù)。其中10%數(shù)據(jù)作為驗證集數(shù)據(jù)。整個模型訓練100輪次,學習率為0.001。
TCN網(wǎng)絡采用ReLU函數(shù)作為激活函數(shù),采用Adam優(yōu)化算法對模型進行優(yōu)化。在多次的訓練以及參數(shù)調(diào)整中,選取在驗證集中誤差最小的參數(shù)模型。表1為模型參數(shù)設定對比實驗。從對照實驗組1和2發(fā)現(xiàn),適當增加殘差層數(shù)可以提高網(wǎng)絡預測的精度。對照實驗組1和3發(fā)現(xiàn),適當增加單層網(wǎng)絡的神經(jīng)元個數(shù)可以有效提高網(wǎng)絡的精度。對照實驗組1和4發(fā)現(xiàn),增加時間步長可以提高網(wǎng)絡模型的預測經(jīng)度。對照實驗組1和5發(fā)現(xiàn),過少的特征個數(shù)雖然可以降低系統(tǒng)資源的消耗,但會使得網(wǎng)絡模型感受的信息降低,訓練經(jīng)度不佳。通過整體的實驗對比,發(fā)現(xiàn)適當加深神經(jīng)網(wǎng)絡的深度,可以在一定程度上提高本文模型的預測經(jīng)度,但過于深層的模型往往容易導致模型訓練所消耗的時間開銷大,所需數(shù)據(jù)量高,因此本實驗中采用8層殘差結構。
表1:模型參數(shù)對比
在完成對模型參數(shù)設定后,本文采用TCN模型對24H臺風預測路徑進行了預測,并與基于GRU的模型和基于LSTM的臺風路徑預測進行了對比,表2為三種模型的實驗結果。
表2:模型精度對比
從表2中可以看出,在三個模型中TCN模型的緯度平均誤差是最低的,而經(jīng)度誤差在GRU和LSTM中間,綜合平均誤差是三種方法中最低的,這也體現(xiàn)出了TCN模型的先進性。當然由于實驗訓練數(shù)據(jù)比較小,另外模型僅僅訓練了100次,因此誤差還是偏大,后續(xù)還需要進一步改進和測試。
圖2為其中一場臺風的TCN模型預測結果的展示,藍色為實際臺風路線,紅色為預測值,可以看出預測路徑趨勢基本能夠擬合真實路徑。
圖2:路徑預測圖
本文提出了一種新的臺風路徑預測模型。該模型通過對海洋、氣象數(shù)據(jù)和臺風路徑數(shù)據(jù)的分析學習,選取更適用于解決時間序列問題的時間卷積神經(jīng)網(wǎng)絡 TCN模型來解決臺風移動路徑的預測問題,并利用南海臺風數(shù)據(jù)對基于TCN的臺風預測模型進行了訓練和測試。初步實驗結果表明基于TCN的臺風路徑預測模型具有較好的預測精度,后續(xù)將進一步進行深入研究,從模型結構、特征選擇等多方面進行優(yōu)化,以進一步提高模型的預測精度。從而為我國臺風路徑的準確預測提供支持。