朱國梁
摘 要:文章選取烏魯木齊機場2007年至2016年10月至次年3月的逐小時觀測資料,嘗試使用MLP神經(jīng)網(wǎng)絡方法,建立主導能見度的回歸預測模型,通過對預測效果檢驗可以看到,該模型預測主導能見度的平均絕對誤差為706m,對小于1000m的主導能見度平均絕對誤差為325m,并且該方法能夠較好的預測主導能見度的變化趨勢,可以為主導能見度的定量客觀預報提供參考。
關鍵詞:多層感知器;人工神經(jīng)網(wǎng)絡;能見度;回歸預測
中圖分類號:V321.2 文獻標志碼:A 文章編號:2095-2945(2018)18-0001-04
Abstract: In this paper, the hourly observation data of Urumqi Airport from October to next March of the years from 2007 through 2016 are selected and the regression forecasting model of leading visibility is established using MLP neural network method. The average absolute error of leading visibility is 706 m, and the average absolute error of dominant visibility is 325 m as regards less than 1000 m. This method can predict the trend of dominant visibility and provide reference for quantitative and objective forecast of leading visibility.
Keywords: multi-layer perceptron; artificial neural network; visibility; regression prediction
1 概述
隨著國民經(jīng)濟的快速發(fā)展和民航運輸?shù)娜找嫫占埃瑱C場運行對能見度的依賴日益突出,由霧、霾等天氣引起的長時間低能見度天氣,會造成機場大范圍的航班延誤、取消,對航空公司、機場帶來巨大損失,也對公眾出行造成影響。同時能見度與飛行安全關系密切,低能見度現(xiàn)象也是引發(fā)飛行事故最常見的因素之一。烏魯木齊國際機場作為新疆區(qū)域的樞紐機場,承擔著新疆區(qū)域及中亞地區(qū)的航班運行。已有的氣候資料統(tǒng)計顯示[1,2],烏魯木齊機場能見度低于1000m的年平均日數(shù)為60天,大部分低能見度日數(shù)發(fā)生在冬半年(11月至次年3月),可達57天,造成低能見度的天氣現(xiàn)象主要為霧和煙。
提高能見度的預報水平是保障機場安全穩(wěn)定運行的重要措施,目前對于煙、霧等天氣造成的低能見度預測,仍然以經(jīng)驗預報和統(tǒng)計預報為主,盡管隨著數(shù)值預報的發(fā)展,現(xiàn)在也有數(shù)值釋用和霧模式預報,但許多試驗記過表明:霧模式僅有一定的機理分析用途,難以進行實際預報,因此對大氣能見度的預報研究仍然是近年來氣象預報中的一個難點和熱點[3-11]。MLP作為處理非線性問題的方法,在上世紀80年代的時候曾是相當流行的機器學習方法,擁有廣泛的應用場景,譬如語音識別、圖像識別、機器翻譯等等,但自90年代以來,MLP遇到來自更為簡單的支持向量機的強勁競爭。而到2006年以后,由于深度神經(jīng)網(wǎng)絡的快速發(fā)展和大規(guī)模的應用,具備深層結構的MLP又重新得到了關注。本文嘗試利用烏魯木齊機場近10年逐小時的觀測資料,探索人工神經(jīng)網(wǎng)絡在天氣預測領域的應用,為氣象預報人員提供新的能見度回歸預報產(chǎn)品。
2 多層感知器MLP簡介
傳統(tǒng)的線性統(tǒng)計模型在處理實際問題,如溫度預測、圖像識別等包含非線性因素的問題,通常是無能威力的。而神經(jīng)網(wǎng)絡通過構建合適的模型,可以描述出輸入數(shù)據(jù)和輸出數(shù)據(jù)間的復雜關系,而它的強大之處在于這種關系可以是線性的,也可以是非線性的。
MLP(Multilayer Perceptron),即多層感知器,是一種常見的神經(jīng)網(wǎng)絡模型,它是一種有監(jiān)督學習模型,在訓練它的過程中我們需要給它提供完整的輸入、輸出,模型基于一定長度的歷史數(shù)據(jù),不斷訓練、學習,構建出輸入和我們期望的輸出之間的最優(yōu)模型,而后利用這個最優(yōu)模型來進行預測。圖1就是三層MLP網(wǎng)絡的的示意圖,MLP可以被看做是一個有向圖,由多個節(jié)點層組成,每一層全連接到下一層。除了輸入節(jié)點,每個節(jié)點都是一個帶有非線性激活函數(shù)的神經(jīng)元(或稱處理單元)。MLP是感知器的推廣,克服了感知器不能對線性不可分數(shù)據(jù)進行識別的弱點。
3 預測模型的建立
3.1 資料預處理
本文使用烏魯木齊機場2007年至2016年10月至次年3月的每天24小時觀測資料,包含逐小時的主導能見度、溫度、露點溫度、相對濕度、平均風向和平均風速,通過整理和數(shù)據(jù)質(zhì)量控制,共得到43752條數(shù)據(jù)記錄,由于各因子由不同的氣象要素組成,為了避免各個因子之間的量級差異,在作為人工神經(jīng)網(wǎng)絡的輸入因子前,需要對其進行歸一化處理,使其數(shù)值限定在[0,1]之間,具體算法見公式1。
data=(data-min(data))/(max(data)-min(data))(1)
3.2 預報因子的篩選
對于時間序列的回歸預測,最簡單的方法就是構建基于歷史數(shù)據(jù)的非線性函數(shù),結合對主導能見度的預測,我們構建兩種類型的因子:第一類預報因子僅包含過去時次的主導能見度(Vis),具體見公式2;由于主導能見度與風、溫度、相對濕度等要素也有一定的關聯(lián),故構建第二類預報因子不僅包含過去時次的主導能見度,還包括過去時次的溫度(T)、露點溫度(TD)、相對濕度(RH)、風向(WD)和風速(WS),具體見公式3。
Vist=f(Vist-1,Vist-2,……Vist-n) (2)
Vist=f((Vis,T,TD,RH,WD,WS)t-1,(Vis,T,TD,RH,WD,
WS)t-2,……,(Vis,T,TD,RH,WD,WS)t-n) (3)
其中主導能見度為Vist為當前時次的主導能見度,為驗證不同時間長度的因子對主導能見度的預測效果,此處n設置多個進行建模運算,用于評估不同時間長度樣本下模型的預測效果差異。
3.3 構建樣本序列
本文以烏魯木齊機場逐小時主導能見度為預測對象,使用近十年10月至次年3月的觀測記錄,按照預報因子的選取,分別建立兩類共28個樣本序列,具體見表1。其中每個樣本序列,為了進行預測模型訓練和預測效果檢驗,隨機選取43752條歷史資料中的80%作為訓練樣本,其余的作為測試樣本。
按照上述兩類因子選取方式建立的28個樣本序列,使用Keras中的MLP模型分別進行建模運算,并使用測試樣本進行測試,最終得到28個不同的對主導能見度預測模型,下面將詳細討論模型的預測效果:
4 預測效果檢驗
本文構建的預測對象為烏魯木齊機場逐小時主導能見度,共包含近4.5萬條記錄,通過對預測對象進行分析,可以看到烏魯木齊機場能見度變化范圍在0~10000m之間,26.9%的主導能見度為10000m,而對民航機場運行影響較大主導能見度低于1000m的記錄占12.3%,具體分布見圖2。通過使用MLP模型對主導能見度進行回歸預測,得到逐小時的主導能見度預測結果,下面我們從兩類不同的預報因子組成的模型檢驗本方法的預測效果。
4.1 以主導能見度為預測因子的模型
本類型模型僅包含過去時刻的主導能見度,未加入其他氣象要素,構建單純依賴歷史時刻主導能見度的預測模型,以當前時刻的主導能見度為預測對象,分別用過去1、3、6、9、12、24、36、48、60、72、84、96、108、120小時的主導能見度為預測因子,建立預測模型。
從圖3的預測效果分析顯示,使用不同時間長度的歷史主導能見度作為預測因子,對主導能見度的平均絕對誤差在966m至706m之間,其中使用當前時刻前1小時的預測效果最好,平均絕對誤差在706.98m,不同時間長度的預測因子構建的模型預測效果存在差異,且隨時間長度增加,誤差緩慢增加。
為充分檢驗不同因子的模型對主導能見度,下面通過統(tǒng)計5000m以內(nèi)的主導能見度預測平均絕對誤差,分析模型對不同量級主導能見度的預測能力,從表2可以看到,本類型的模型對1000m以內(nèi)的預測平均絕對誤差在325m至520m之間,訓練樣本與測試樣本的平均絕對誤差區(qū)別較小,其中使用過去1、3小時兩種的因子預測效果較好,隨著預測因子中時間長度增加,主導能見度的平均絕對誤差逐漸增加。另外隨著預測對象量級的增加,主導能見度在[4000,5000)區(qū)間內(nèi)的平均絕對誤差明顯大于[0,1000)范圍內(nèi)的平均絕對誤差,達到1200m左右。
4.2 以多氣象要素作為預報因子的模型
由于導致低能見度天氣出現(xiàn)的原因較多,且能見度與溫度、相對濕度等要素都有一定的相關性,因此本文嘗試將預報因子擴展至包含過去時次的主導能見度、溫度、露點溫度、風向和風速,建立模型對主導能見度進行預測。通過對預測結果進行分析可以發(fā)現(xiàn),使用多要素預報因子的模型,在不同時間長度的模型預測平均絕對誤差在799m至827m,不同模型的平均絕對誤差穩(wěn)定在10m左右,其中使用過去24小時的多要素預報因子構建的模型預測效果最好,絕度誤差為798.87m,具體見圖4。
為充分檢驗不同因子的模型對主導能見度,下面通過統(tǒng)計5000m以內(nèi)的主導能見度預測平均絕對誤差,分析模型對不同量級主導能見度的預測能力,模型對主導能見度在1000m以內(nèi)的預測效果最好,平均絕對誤差在450m至550m之間,其中使用過去72、120小時因子構建的模型預測效果較好,隨著主導能見度量級的增加,模型預測的誤差逐漸增大,達到1100m左右,詳細數(shù)據(jù)統(tǒng)計表格此處省略。
4.3 實際預測效果建議
結合本文討論的兩類預報因子構建的模型預測效果,單要素構建的預測模型對能見度低于1000m的預測效果較好,多要素構建的預測模型對能見度高于2000m的預測效果較為穩(wěn)定,故此處同時選用這兩類模型,并考慮到能見度變化的連續(xù)性,選取采用過去12h的預報因子的模型進行實際預報。
主導能見度預測效果檢驗
這里選取烏魯木齊機場2016年12月31日的能見度進行預測,當天機場能見度變化較大,11時之前維持1000m以上,之后迅速下降維持兩個小時的100m,而后16時突然好轉(zhuǎn)至2000m,然后下降維持在100m,具體見圖5,此次低能見度過程包含持續(xù)性的低能見度,以及能見度的突然好轉(zhuǎn),對模型預測的能力有著較高的考驗。
通過模型預測可以看到,兩類模型均能夠預測出當日能見度下降、轉(zhuǎn)好的趨勢,在實況能見度大于1500m的時候,多要素模型的預測誤差相對較小,當主導能見度小于1000m時,單要素模型的預測效果相對更好,尤其是在長時間持續(xù)能見度小于300m時,單要素預測的能見度平均絕對誤差達到86m。因此通過將兩類預測模型配合使用,可以為預報人員提供能見度預測的定量參考。但是通過此次實際個例的模擬也可以看到,模型在預測主導能見度轉(zhuǎn)好或轉(zhuǎn)差的時刻具有一定的滯后性,且能見度大于1500m后誤差明顯增大。
5 結束語
由于導致低能見度天氣出現(xiàn)的因素較多,影響系統(tǒng)較為復雜,尤其是預報低能見度的起止時間難度較大,因而如何盡可能地預報出低能見度天氣出現(xiàn)、消散的時間,是烏魯木齊機場冬季服務保障的重點。
本文嘗試使用人工神經(jīng)網(wǎng)絡進行機場能見度預測,利用近十年的資料進行建模預測,通過分析模型預測結果表明,它能夠較好地反映烏魯木齊機場主導能見度的變化趨勢;平均絕對誤差最小能夠達到706m,其中對小于1000m的預測平均絕對誤差最低可達325m;同時可以看到多要素因子預測模型的預測結果較為穩(wěn)定,后續(xù)我們將嘗試將本模型投入實際業(yè)務,并進行持續(xù)檢驗,改善本方法在主導能見度的定量預報能力。
該方法雖然有較好的預測效果,但是在詳細分析其預測結果也發(fā)現(xiàn)一些不足,例如預測能見度轉(zhuǎn)好或轉(zhuǎn)壞的時次具有一定的滯后性,主導能見度大于2000m以上的預測平均絕對誤差較大,主導能見度小于1000m的預測效果不穩(wěn)定等問題。后續(xù)我們將配合低能見度天氣發(fā)生下的天氣形勢,嘗試結合能夠反應低層層結條件、高空風場以及地面氣壓場等要素作為預報因子,確保預報因子能夠較好的包含導致低能見度天氣發(fā)生的條件,改善模型的預測效果。
參考文獻:
[1]朱蕾,朱國棟.烏魯木齊機場近30年低能見度天氣特征分析[J].中國民航飛行學院學報,2012,23(5):27-30.
[2]朱蕾,朱國棟.支持向量機方法在機場跑道視程預報中的應用[J].暴雨災害,2010,29(2):171-175.
[3]李沛,王式功,尚可政,等.基于神經(jīng)網(wǎng)絡逐級分類建模的北京地區(qū)能見度預報[J].蘭州大學學報(自然科學版),2012,48(3):52-57.
[4]王愷,趙宏,劉愛霞,等.基于風險神經(jīng)網(wǎng)絡的大氣能見度預測[J].中國環(huán)境科學,2009,29(10):1029-1033.
[5]陳會芝,郝麗萍,謝娜,等.信息數(shù)字化與霧的細化預測[J].自然災害學報,2009,18(5):151-156.
[6]朱國棟.基于SVM方法的烏魯木齊國際機場多要素預測[J].沙漠與綠洲氣象,2011,05(4):40-43.
[7]彭士濤,胡焱弟,周然,等.人工神經(jīng)網(wǎng)絡在城市能見度短期預報中的應用C//中國顆粒學會第六屆學術年會暨海峽兩岸顆粒技術研討會論文集,2008:606-609.
[8]邵振平.鄭州機場能見度變化特征及霧的成因分析[J].氣象與環(huán)境科學,2014,37(1):75-82.
[9]賀皓,羅慧.基于支持向量機模式識別的大霧預報方法[J].氣象科技,2009,37(2):149-151.
[10]曹治強,吳兌,吳曉京,等.1961~2005年中國大霧天氣氣候特征[J].氣象科技,2008,36(5):556-560.
[11]李秀連,陳克軍,王科,等.首都機場大霧的分類特征和統(tǒng)計分析[J].氣象科技,2008,36(6):717-723.
[12]Y.Bengio. Learning deep architectures for AI. in Foundations and Trends in Machine Learning,2009,2(1):1-127.
[13]G.Hinton,S.Osindero,and Y.Teh. A fast learning algorithm for deep belief nets. Neural Computation,2006,18:1527-1554.