金曈宇,葉小嶺, 2,熊雄,鞏燦燦,姚錦松
高鐵沿線大風預(yù)測技術(shù)研究
金曈宇1,葉小嶺1, 2,熊雄1,鞏燦燦1,姚錦松1
(1. 南京信息工程大學(xué) 自動化學(xué)院,江蘇 南京 210044;2. 南京信息工程大學(xué) 氣象災(zāi)害預(yù)報預(yù)警與評估協(xié)同創(chuàng)新中心,江蘇 南京 210044)
風速預(yù)測是風致災(zāi)害預(yù)警的關(guān)鍵技術(shù)。針對高鐵大風預(yù)測中延遲性和誤報的問題,提出一種基于完整集合經(jīng)驗?zāi)B(tài)分解(CEEMDAN)和長短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)的組合預(yù)測模型對高鐵沿線風速進行預(yù)測。為了減少預(yù)測模型的復(fù)雜度和提高模型預(yù)測精度,原始風速數(shù)據(jù)用CEEMDAN分解并利用樣本熵(SE)理論將分解出的分量按照樣本熵近似值重組成趨勢、細節(jié)、隨機三分量后用長短期記憶神經(jīng)網(wǎng)絡(luò)建立預(yù)測模型。以高鐵沿線某段風速氣象數(shù)據(jù)為例,實驗結(jié)果表明,與其他預(yù)測方法相比,本方法可有效降低預(yù)測延遲性和提高預(yù)測精度,準確追蹤風速的波動性和非線性非平穩(wěn)的變化,性能更加優(yōu)越。在高速鐵路沿線大風預(yù)測中能夠發(fā)揮良好的適用性,減少大風預(yù)警的誤報或不報等情況的發(fā)生。
鐵路大風預(yù)測;樣本熵;完整集合經(jīng)驗?zāi)B(tài)分解;長短期記憶神經(jīng)網(wǎng)絡(luò)
隨著高速鐵路的快速發(fā)展,高鐵安全問題也愈加重要。高速列車的速度越快,臨界傾覆風速越 小[1],更容易受強風天氣的影響,發(fā)生傾覆等風致災(zāi)害,造成嚴重的經(jīng)濟損失和人身傷害。因此建立一套高速鐵路沿線大風預(yù)警系統(tǒng)是十分有必要的。相較于其他行業(yè),高速鐵路對短期乃至超短期的風速預(yù)測需求更大,要求更高。常規(guī)預(yù)報分辨率太低、預(yù)測時間過長,缺乏針對性,難以滿足鐵路運行的精細化和個性化要求,因此解決高速鐵路的風速預(yù)測問題是大風預(yù)警的一項關(guān)鍵環(huán)節(jié)。目前國內(nèi)外用于風速預(yù)測的方法主要有卡爾曼濾波法[2?4],支持向量機法[5?7],空間相關(guān)性法[8],以上方法在短期乃至超短期風速預(yù)測中誤差較大,顯然不能滿足高速鐵路沿線大風預(yù)警這種要求精度高,時效短的預(yù)測。針對以上研究中存在的不足,文章提出了一種基于完整集合經(jīng)驗?zāi)B(tài)分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise, CEEMDAN)和長短期記憶神經(jīng)網(wǎng)絡(luò)(Long-Short- Term Memory Neural Network, LSTM)的超短期高鐵風速預(yù)測模型。首先CEEMDAN對原始風速序列進行分解,接著利用樣本熵(Sample Entropy, SE)進行重構(gòu),最后利用LSTM對重構(gòu)后的模態(tài)分量建模進行超短期風速預(yù)測。以國內(nèi)高鐵某段沿線氣象站點的歷史數(shù)據(jù)為例,通過實驗和其他的預(yù)測方法進行對比,以期證明本方法可以有效地提高高速鐵路沿線風速超短期預(yù)測的精度和降低預(yù)測的延遲性。減少大風預(yù)警誤報或不報等情況的發(fā)生。
不同于傳統(tǒng)行業(yè)的風速預(yù)測需求。高速鐵路采用分級限速模式。孫呈欣[9]提出了不同風速級別下對應(yīng)的列車限速如表1所示。
區(qū)別于其他行業(yè),低風速段的預(yù)測精度對高鐵大風預(yù)警系統(tǒng)的意義不大,高速鐵路沿線大風預(yù)警更注重在高風速段和臨界值點的預(yù)測精度。
表1 不同風速級別下對應(yīng)的列車限速
為了驗證提出的方法在高速鐵路沿線大風預(yù)警中的效果,特意選用國內(nèi)高速鐵路某段沿線氣象監(jiān)測站臺風季7,8和9共3個月的氣象數(shù)據(jù),包含了低中高3段風速,時間分辨率為秒級。風速觀測資料經(jīng)過傳統(tǒng)的數(shù)據(jù)質(zhì)量控制,明顯錯誤的數(shù)據(jù)已經(jīng)被剔除。為了減少風速時間序列的噪聲干擾,提高大風預(yù)警的準確率。選用以下方法對原始風速序列進行預(yù)處理和復(fù)雜性分析。
EMD是一種希爾伯特-黃變換(Hibert-Huang Transform, HHT)中一種進行信號分析的方法,EMD改良而來的方法就是CEEMDAN。CEEMDAN通過自適應(yīng)的添加白噪聲能夠有效的利用噪聲特性減弱模態(tài)混疊現(xiàn)象,同時也剔除了噪聲的影響,提高了分解效率。CEEMDAN在EMD的基礎(chǔ)上改進 如下:
為添加噪聲的次數(shù)。
2) 計算CEEMDAN的第1個余量信號:
4) 重復(fù)式(1)和式(2),得到第個余量信號和第+1階IMF分量分別如式(4)和式(5):
5) 重復(fù)上述步驟,直到余量信號再也無法進行EMD分解為止。
記最后分解出個IMF分量。最終得到的余量信號為:
CEEMDAN雖然能夠自適應(yīng)地分解時間序列。但分解出來的子分量數(shù)量眾多,如果對每一個分量都建立模型進行預(yù)測。不僅大幅增加了模型復(fù)雜性和運算量。而且也忽略了各個子分量之間的相關(guān)性。如果能夠把相關(guān)性高的子分量進行重組,即能夠降低預(yù)測模型的復(fù)雜性,減少計算量,又更能夠突出預(yù)測分量的特性。信息論中提出的熵理論就能夠很好的達到以上的效果。其中運用較為廣泛的就是樣本熵理論。
和的取值大小雖然會影響到樣本熵的取值,但是樣本熵的整體趨勢走向是不會改變的。樣本熵的維度一般取1或2。容限一般取0.1~0.25SD,SD為時間序列的標準差。這里取為2,為0.25SD。
在LSTM的神經(jīng)網(wǎng)絡(luò)模型中,x為LSTM時刻的輸入,h則為輸出,=1,2,3,…由文獻[10]可知。LSTM記憶單元的輸出h由以下各式迭代得到:
其中:w,w和w分別為輸入,上時刻的輸出和記憶細胞到輸入門的權(quán)重矩陣。w,w和w分別為輸入,上一時刻的輸出和記憶細胞到遺忘門的權(quán)重矩陣。w,w和w則分別為輸入,上一時刻的輸出和記憶細胞到輸出門的權(quán)重矩陣。b,b,b和b則分別為輸入門,遺忘門,輸出門還有記憶細胞的偏置量。(?)為函數(shù)。(?)為激活函數(shù)。一般取雙曲正切函數(shù)tan(?)。
自然風具有波動性大,非平穩(wěn)性嚴重的特點,因此風速序列也具有非平穩(wěn)性和非線性的特點,限制了風速預(yù)測模型,為了更加準確的預(yù)測風速,提出了一種CEEMDAN-LSTM風速預(yù)測模型。先利用CEEEMDAN分解風速序列,然后利用樣本熵衡量各子分量的復(fù)雜性和隨機性。按照樣本熵值將近似的子分量重組成趨勢分量、細節(jié)分量、隨機分量3個分量,分別利用LSTM建模預(yù)測。風速預(yù)測模型如圖1所示。
詳細建模步驟如下:
1) 將逐秒級的風速時間序列使用CEEEMDAN分解成個不同尺度的,相對平穩(wěn)的固有模態(tài)函數(shù)IMF1~。
2) 分別計算各個固有模態(tài)函數(shù)的樣本熵值,然后把個固有模態(tài)函數(shù)按照樣本熵值相似性重組,從高到低分別重組為隨機分量,細節(jié)分量和趨勢分量。
3) 將隨機分量,細節(jié)分量和趨勢分量分別進行歸一化處理,統(tǒng)一量綱,劃分測試集和訓(xùn)練集。
4) 分別對各個分量的訓(xùn)練集和預(yù)測集建立LSTM模型進行預(yù)測,得到風速時間序列子序列。
5) 對不同時間尺度的時間序列子序列進行反歸一化處理后進行疊加,得到最終的風速預(yù)測結(jié)果。
圖1 基于CEEMDAN和LSTM的超短期風速預(yù)測模型
實驗選用2019年高速鐵路沿線某段氣象監(jiān)測站臺風季7,8和9 3個月的風數(shù)據(jù),為了保證泛化性,從3個月的時間序列中隨機截取2 000段時間序列。每段2 400個數(shù)據(jù)。以其中一段數(shù)據(jù)為例:
原始風速數(shù)據(jù)經(jīng)過CEEMDAN的自適應(yīng)分解得到了11個固定模態(tài)函數(shù),為了衡量每個模態(tài)分量的復(fù)雜性,計算每一個模態(tài)函數(shù)的樣本熵值大小,其值如圖2所示。
通過圖2可以發(fā)現(xiàn),固定模態(tài)函數(shù)IMF1~11的樣本熵值從高到低依次下降,說明IMF1~11的風速時間子序列復(fù)雜性從高到低依次降低。為了驗證樣本熵判斷風速時間序列復(fù)雜性的正確性,將IMF1~11的波形進行對比,如圖3所示。通過觀察可以看出IMF1~11的波動性和復(fù)雜性從上到下依次降低。
圖2 模態(tài)函數(shù)樣本熵值
分解的固定模態(tài)函數(shù)如果全部單獨建模預(yù)測后再合成為最終結(jié)果,不僅會增大預(yù)測模型的復(fù)雜性同時也會增大時間成本,這和高速鐵路沿線大風預(yù)警的高時效性要求是背道而馳的。為了在保證預(yù)測精度不變的情況下,盡量減少預(yù)測時間和模型復(fù)雜度,將分解的固定模態(tài)函數(shù)按照提前設(shè)定的閾值,將樣本熵值近似的分量重構(gòu)為趨勢分量,細節(jié)分量和隨機分量。實驗中閾值取0.6和0.01來劃分分量,具體重構(gòu)情況如表2所示。
圖3 CEEMDAN分解圖
表2 CEEMDAN分量重構(gòu)
重組后的3個分量如圖4所示。
(a) 趨勢分量;(b) 細節(jié)分量;(c) 隨機分量
分析圖4可以發(fā)現(xiàn),重組后的3個分量各自有各自的特點:趨勢分量4(a)為低樣本熵值重構(gòu)分量,波動性和隨機性低,具有明顯的趨勢性,用來預(yù)測風速的變化趨勢;細節(jié)分量4(b)為中樣本熵值重構(gòu)分量,波動性和隨機性一般,用來預(yù)測風速時間序列的細節(jié)波動情況;隨機分量4(c)為高樣本熵值重構(gòu)分量,具有高波動性和隨機性,用來預(yù)測風速時間序列的隨機性波動情況。以上分類情況同時也符合自然風的構(gòu)成特征。
LSTM的網(wǎng)絡(luò)超參數(shù)中最為重要的參數(shù)是Batchsize.Batchsize決定著每個批次輸入LSTM的數(shù)據(jù)的大小,當Batchsize取值過小時,模型的精度會提高,但是預(yù)測時間會大幅增加;當Batchsize取值過大時,預(yù)測時間縮短,但是精度也會下降。因此為了兼顧預(yù)測時間成本和預(yù)測精度,使用網(wǎng)格搜索法對Batchsize進行尋優(yōu),尋優(yōu)結(jié)果如圖5所示。
從圖5可以看出,當Batchsize逐漸增大時,時間成本逐漸下降,但是超過30后下降速度逐漸減緩,而誤差卻呈現(xiàn)一個近似于線性的增長,繼續(xù)增大Batchsize弊大于利,因此當Batchsize取值為30時最為合適,可以在保持精度的情況下盡可能的減少預(yù)測時間。
圖5 Batchsize參數(shù)尋優(yōu)結(jié)果對比
為了便于觀察重組分量和原始時間序列預(yù)測的結(jié)果,僅截取其中一部分樣本切片作圖:通過圖6的對比可以發(fā)現(xiàn),未經(jīng)處理的時間序列直接利用LSTM預(yù)測具有明顯的延遲性,在波峰和波谷的預(yù)測誤差較大。而經(jīng)過提出方法改進過后,隨機分量(a)能夠緊跟變化反映時間序列的短時波動;細節(jié)分量(b)在保持了原有波動趨勢的情況下,延遲性得到明顯改善;趨勢分量(c)則反應(yīng)風速整體呈下降的變化趨勢。3個分量合成的風速序列(e)兼具3個分量的特點,不僅預(yù)測誤差減小,同時也減少了延遲性。
實驗采用均方根誤差RMSE,平均絕對誤差MAE,平均絕對百分比誤差MAPE來評價預(yù)測結(jié)果。公式分別為:
(a) 隨機分量;(b) 細節(jié)分量;(c) 趨勢分量;(d) 原始風速序列;(e) 重組風速序列
為了驗證所提出的模型的優(yōu)越性,分別選用未改進的模型(LSTM),BP神經(jīng)網(wǎng)絡(luò)(BP Neural Network, BPNN),支持向量機(Support Vector Machine,)這3種模型來進行對比。
各模型上下限極值處的預(yù)測結(jié)果對比如圖7和圖8所示。
圖7 各模型風速上限極值預(yù)測對比
圖8 各模型風速下限極值預(yù)測對比
分析圖7可以看出:BP神經(jīng)網(wǎng)絡(luò)風速上限極值預(yù)測值偏大,容易引起誤報;SVM預(yù)測值偏小,容易引起不報;LSTM雖然預(yù)測值比前兩者誤差較小,但仍存在延遲性;CEEMDAN-LSTM則在誤差和延遲性上均優(yōu)于其他模型。分析圖8可得:各模型在風速下限極值的預(yù)測值均大于實際風速,但CEEMDAN-LSTM的誤差與延遲性明顯小于其他模型。為了更好的貼合鐵路需求,按照表1把風速劃分為高中低3種風速段統(tǒng)計誤差,誤差值取2 000段時間序列均值,如表4所示。
從表4可以看出各模型在高風速段的預(yù)測效果最好,中風速次之,低風速段效果最差,符合高鐵大風預(yù)警系統(tǒng)的需求。而CEEMDAN-LSTM在各風速段均優(yōu)于其他模型。從圖7,8和表4中的預(yù)測結(jié)果評價對比可以看出,文章所提出的CEEMDAN-LSTM模型各項指標均優(yōu)于其他模型,與其他模型相比,CEEMDAN-LSTM預(yù)測模型的預(yù)測誤差更小,同時預(yù)測的延遲性得到降低,說明CEEMDAN-LSTM模型能夠更加準確的預(yù)測出風速的波動性和非線性非平穩(wěn)的變化,性能更加優(yōu)越,在高速鐵路沿線大風預(yù)警中能夠發(fā)揮良好的適用性。
表4 模型預(yù)測結(jié)果對比
1) 文中提出的CEEMDAN分解時間序列并利用樣本熵近似值重組為趨勢、細節(jié)、隨機三分量的方法可以有效減少預(yù)測模型的復(fù)雜度與延遲性。
2) 在對比實驗中,文章所提出的方法在高、中、低3個風速段RMSE,MAE和MAPE誤差相較于其他模型都得到了減少,其中高風速預(yù)測效果最好,中風速次之,低風速最差。整體具有更高的預(yù)測精度,有效減少大風預(yù)警誤報或不報的幾率。
3) 在研究中發(fā)現(xiàn),LSTM模型對趨勢分量擬合效果誤差較大,進一步的研究中可以考慮加入多要素(氣壓、濕度、溫度)和風速的空間特性。
[1] 劉榮, 姚松, 許嬌娥. 側(cè)風下高速列車臨界傾覆風速研究[J]. 鐵道科學(xué)與工程學(xué)報, 2019, 16(11): 2643?2650. LIU Rong, YAO Song, XU Jiaoe. Research on critical overturning wind speed of high-speed trains under crosswinds[J]. Journal of Railway Science and Engineering, 2019, 16(11): 2643?2650.
[2] Alexander Samalot, Marina Astitha, Jaemo Yang, et al. Combined Kalman filter and universal kriging to improve storm wind speed predictions for the northeastern united states[J]. Weather and Forecasting,2019, 34(3): 587?601.
[3] Carlos D Zuluaga, Mauricio A álvarez, Eduardo Giraldo. Short-term wind speed prediction based on robust Kalman filtering: An experimental comparison[J]. Applied Energy, 2015, 156: 321?330.
[4] CHEN Kuilin, YU Jie. Short-term wind speed prediction using an unscented Kalman filter based state-space support vector regression approach[J]. Applied Energy, 2014, 113: 690?705.
[5] LIU M, CAO Z, ZHANG J, et al. Short-term wind speed forecasting based on the Jaya-SVM model[J]. International Journal of Electrical Power & Energy Systems, 2020, 121: 106056.
[6] DANG X J, CHEN H Y, JIN X M. A method for forecasting short-term wind speed based on EMD and SVM[J]. Applied Mechanics & Materials, 2013, 392: 622?627.
[7] Natarajan Y J, Nachimuthu D S. New SVM kernel soft computing models for wind speed prediction in renewable energy applications[J]. Soft Computing, 2019(3): 1?18.
[8] L Yang, Y Zhengling, Z Ze, et al. Improvement of spatial correlation wind speed prediction based on variable coefficient model[J]. Guangdong Electric Power, 2017, 151: 737?752.
[9] 孫呈欣. 鐵路綜合防災(zāi)安全監(jiān)測預(yù)警系統(tǒng)研究與實現(xiàn)[D]. 蘭州: 蘭州交通大學(xué), 2014. SUN Chengxin. Research and implementation of railway comprehensive disaster prevention safety monitoring and early warning system[D]. Lanzhou: Lanzhou Jiaotong University, 2014.
[10] Hochreiter S, Schmidhuber J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735?1780.
Research on prediction technology of high wind along high-speed railway
JIN Tongyu1, YE Xiaoling1, 2, XIONG Xiong1, GONG Cancan1, YAO Jinsong1
(1. School of Automation, Nanjing University of Information Science and Technology, Nanjing 210044, China;2. Collaborative Innovation Center on Forecast and Evaluation of Meteorological Disasters, Nanjing University of Information Science and Technology, Nanjing 210044, China)
Wind speed prediction is a key technology for early warning of wind-induced disasters. Aiming at the problems of delay and false positives in high-speed rail gale warning, a combined prediction model based on complete ensemble empirical mode decomposition with adaptive noise (CEEMDAN) and longshort-term memory neural network (LSTM) was proposed to predict the wind speed along the high-speed railway. In order to reduce the complexity of the prediction model and improve the prediction accuracy of the model, the original wind speed data was decomposed with CEEMDAN and the decomposed components were reconstructed into three components of trend, detail and randomness according to the sample entropy approximation by using the sample entropy (SE) theory. Then the long short-term memory neural network was used to establish the prediction model. Taking a piece of meteorological data of wind speed along a high-speed railway as an example, the experimental results show that, compared with other prediction methods, this method can effectively reduce the prediction delay and improve the prediction accuracy, accurately track the fluctuation of wind speed and nonlinear and non-stationary changes, and the performance is more superior. It can play good applicability in the gale warning along the high-speed railway and reduce the occurrence of false alarm or non-reporting of gale warning.
railway gale forecast; sample entropy; complete ensemble empirical mode decomposition with adaptive noise; longshort-term memory neural network (long short-term memory neural network)
P425.6+2
A
1672 ? 7029(2021)03 ? 0615 ? 08
10.19713/j.cnki.43?1423/u.T20200435
2020?05?02
高鐵氣象圖譜與列車運行氣象輔助技術(shù)研究(N2019T003);高鐵氣象定制化監(jiān)測分析技術(shù)與行車安全輔助保障系統(tǒng)研究(2019041);江蘇省高校自然科學(xué)研究面上項目(19KJB170004)
葉小嶺(1964?),女,河南封丘人,教授,從事氣象信息集成與分析研究;E?mail:xyz.nim@163.com
(編輯 蔣學(xué)東)