彭科曼,劉 博,陳海鳳,田 程
(1.貴州省貴陽市氣象臺,貴州 貴陽 550001;2.天津市氣象臺,天津 300074)
貴陽遷站后霧的氣候特征及預報模型研究*
彭科曼1,劉 博2,陳海鳳1,田 程1
(1.貴州省貴陽市氣象臺,貴州 貴陽 550001;2.天津市氣象臺,天津 300074)
該文利用貴陽基準站2000—2013年的地面觀測資料,運用線性分析、相關分析等方法對貴陽2000年遷站后霧的氣候特征進行分析,結果表明:貴陽的年霧日分布不均,總體呈增長趨勢;霧的盛發(fā)期在冬季,占全年的36.81%;霧在06—08時生成的概率比較高;09時左右消散的概率最高,持續(xù)時間多在6 h以下。該文還采用了CIMISS數(shù)據(jù)庫2000—2015年的逐日氣象資料,運用決策樹方法建立統(tǒng)計模型來對貴陽霧的預報進行初探,命中率達到76.19%,該預報結果能夠基本滿足預報需求,為預報員提供一定參考。
貴陽;霧;氣象要素;決策樹
霧是近地面層空氣中懸浮著的大量水滴或冰晶微粒而使水平能見度小于1 km的天氣現(xiàn)象,是一種常見的災害性天氣。霧對交通的危害很大,同時還會加劇近地層的空氣污染,危害身體健康[1〗[2-6],如劉玉英等[2〗對吉林省霧的氣候特征及變化成因進行了分析;賀皓等[3〗運用數(shù)值預報釋用技術、統(tǒng)計學方法和診斷分析方法對陜西省的大霧進行了研究;羅喜平等[4〗利用貴州省84個觀測站的觀測資料以及9個地州市代表站的氣溫、地溫和相對濕度資料較為全面的分析了貴州省霧的時間、空間分布特征(其中對貴陽市霧的分析研究截止到1999年),研究表明,霧的氣候特征具有明顯的地域性差異,因此研究本地霧的氣候特征以及發(fā)生規(guī)律,具有很大的現(xiàn)實意義。由于貴陽基準站于2000年遷站,新舊兩站的海拔高度相差較大,對霧的觀測有較大差異。目前學者們對貴陽遷站后霧的特征研究較少,并且在2014年之后,能見度觀測由人工觀測改為了能見度儀自動觀測,由于觀測方式的差異,使得能見度觀測結果存在一定的差異,因此本文主要研究貴陽2000—2013年霧的氣候特征,并采用決策樹方法建立統(tǒng)計模型來對貴陽霧的預報進行初探,以期對霧的預報提供參考。
2.1 資料
本文所使用的氣象數(shù)據(jù)來自于貴陽基準站2000—2013年的地面觀測資料以及CIMISS數(shù)據(jù)庫2000—2015年的逐日氣象資料,通過數(shù)據(jù)質(zhì)量控制后處理為時間序列和氣象要素完整的逐日氣象數(shù)據(jù)。霧日的記錄以觀測資料為準,一天之中任一時次能見度小于1 km,均定義為一個霧日。
2.2 研究方法
2.2.1 本文主要采用了線性分析和相關分析等氣候診斷方法來研究貴陽遷站后霧的氣候特征。
2.2.2 決策樹 本文采用決策樹方法初步嘗試了對貴陽霧日進行預報。
決策樹是一種統(tǒng)計學分類算法,是以實例為基礎的歸納學習算法,代表了對象的屬性和值之間的映射關系,能夠從一組無次序、無規(guī)則的元組中推理出決策樹表示形式的分類規(guī)則[7]??梢姡捎脹Q策樹方法進行霧日和非霧日的分類預報具有直觀、便捷的特點,故本文選取決策樹方法嘗試對貴陽霧日進行預報。本研究采用C4.5算法來進行決策樹分類[8],該方法能夠選擇具有最大增益率的屬性作為分裂屬性,對目標類進行最佳的分割。
3.1 霧的年際變化
圖1 2000—2013年貴陽市霧日的年際變化Fig.1 The annual variation of foggy days in Guiyang from 2000 to 2013
經(jīng)統(tǒng)計,2000—2013年貴陽的年平均霧日為41 d。從圖1可以看出,貴陽的年霧日分布不均,總體呈增長趨勢,2006年以前,增長得比較迅速,在2006年達到第一個峰值,為61 d,之后略有下降;又在2012年陡增,霧日達到最多,為81 d。霧日最少年為2001年,僅有17 d。
3.2 霧的季節(jié)變化
圖2 貴陽市2000—2013年各季節(jié)霧日數(shù)占全年 霧日總數(shù)的比例Fig.2 The proportion of each season’s foggy days to the whole year in Guiyang from 2000 to 2013
從圖2可以看出,四季中,貴陽冬季霧最多,占全年的36.81%,春季最少,為19.79%,夏季、秋季分別為20.83%、22.57%。
冬季冷空氣頻繁,貴陽多處于變性冷高壓控制下,近地面大氣層結較穩(wěn)定,夜間輻射降溫加劇,且多靜風、微風,在低層水汽充足的情況下,易形成輻射霧[9],并且冬季云貴靜止鋒比較活躍,受靜止鋒的影響,貴陽地區(qū)常常有鋒面霧出現(xiàn)。因此與春、夏、秋三個季節(jié)相比,冬季貴陽霧日明顯偏多。
3.3 霧的月際變化
圖3 貴陽市2000—2013年月平均霧日數(shù)Fig.3 Monthly average number of foggy days in Guiyang from 2000 to 2013
經(jīng)統(tǒng)計,2000—2013年,貴陽月均霧日數(shù)為3.4 d。從圖3可以看出,月均霧日數(shù)多于平均值的月份有:1—3月、6月、10—12月,其余各月的月均霧日數(shù)均低于平均值。貴陽霧的盛發(fā)期出現(xiàn)在1、2、12月,均在5 d以上,4月、9月霧日較少,分別為2.0 d、1.9 d。
3.4 霧的生消和持續(xù)時間
掌握霧的生消和持續(xù)時間的氣候特征,對于規(guī)避霧天帶來的危害具有重要的意義,因此本文對貴陽站2000—2013年霧的生成時間、消散時間和持續(xù)時間進行了統(tǒng)計,統(tǒng)計時規(guī)定,當生成時間處于兩個整點之間時,按第一個整點來統(tǒng)計,當消散時間處于兩個整點之間時,按第二個整點來統(tǒng)計[2],例如,當生成時間為09時20分,作為09時來統(tǒng)計,當消散時間為10時35分,作為11時來統(tǒng)計。從圖4可以看出,霧在06—08時生成的概率比較高,合計出現(xiàn)概率為45.0%,其中06時是全天各時次中出現(xiàn)概率最高的,為16.9%;霧的消散時間主要出現(xiàn)在08—11時以及20時,合計出現(xiàn)概率為59.2%,其中09時是全天各時次中出現(xiàn)概率最高的,為20.9%。霧消散的最高概率出現(xiàn)的時段比生成的最高概率出現(xiàn)的時段要晚2~3 h。從霧的生消時間多處于早晨來看,貴陽站的霧多以輻射霧為主,夜間氣溫下降,空氣濕度逐漸增加,早晨日出前氣溫最低,空氣濕度最大,因此有利于形成霧,日出后,隨著氣溫上升,空氣濕度減小,霧逐漸消散。從霧的持續(xù)時間來看(表1),持續(xù)時間在6 h以內(nèi)的,占總數(shù)的85.2%,其中持續(xù)時間在3 h以內(nèi)的出現(xiàn)概率最高,為61.7%。從持續(xù)時間上也可看出,貴陽站出現(xiàn)的霧多屬于輻射霧。
圖4 貴陽市2000—2013年霧的生消時間概率的日變化Fig.4 The diurnal variation of the probability of the time of fog formation and dispersion in Guiyang from 2000 to 2013
持續(xù)時間(h)0~34~67~12>12概率(%)61723511929
決策樹方法對于判別霧日及類似的分類氣象預報具有直觀、便捷的特點,適于對霧日和非霧日進行分類預報。故本文選取決策樹方法嘗試對貴陽霧日進行預報。
4.1 預報因子的篩選
選取不同的預報因子進入模型,對最終的預報準確率影響很大。由于各個氣象要素之間存在共線性的作用,對預報效果會有一定影響,因此綜合氣象要素與霧日的相關性分析結果,結合已有數(shù)值模式可預報的氣象要素,本文共篩選出3組預報因子對霧日和非霧日的分類判別進行預報模型的建立,通過對3個模型預報準確率的比較確定最優(yōu)模型。
第1組預報因子按照相關性大小來進行篩選(表2),對2000—2015年逐日氣象要素和每日08時的氣象要素進行普查,從(溫、壓、濕、風、降水)各類氣象要素中分別選取出與日最小水平能見度相關性最大的要素作為預報因子輸入模型;第2組預報因子為日氣象要素;第3組預報因子僅包括08時氣象要素。
表2 各氣象要素與日最小水平能見度的相關性大小Tab.2 The correlation between the meteorological factors and the minimum visibility
注:**在置信度(雙測)為 0.01 時,相關性是顯著的
篩選的預報因子如表3所示:
表3 預報因子篩選結果Tab.3 The results of selected predictors
4.2 劃分訓練集和驗證集
本文選取貴陽站進行預報試驗,氣象數(shù)據(jù)來自于CIMISS數(shù)據(jù)庫2000—2015年的逐日氣象資料,以日最小能見度小于1 km確定為一個霧日。將確定好的霧日作為決策樹分類的目標變量,1為有霧,0為無霧。通過對原始氣象數(shù)據(jù)中缺省數(shù)據(jù)的處理及空值的剔除,最終獲得5 738個樣本(包括霧日和非霧日)。在預報模型的建立過程中發(fā)現(xiàn),由于非霧日樣本數(shù)遠多于霧日樣本數(shù),模型確定分枝節(jié)點時,會更多的考慮非霧日的預報準確率,而忽視了霧日的預報準確率,因此對樣本進行預處理,隨機抽取(按時間序列均勻分布)非霧日樣本的1/7,使其樣本數(shù)與霧日樣本數(shù)基本一致,最終確定進行預報模型建立和檢驗的非霧日樣本數(shù)為713個,霧日樣本數(shù)為722個。將所有樣本按照時間序列排序,取其前90%時間序列(2000年—2014年4月)為訓練集,并進行10%交叉測試,后10%(2014年5月—2015年12月)為驗證集。
4.3 建立決策樹模型
本文使用weka軟件,采用c4.5算法建立決策樹。步驟如下:
①數(shù)據(jù)預處理。
②通過訓練集建立決策樹模型并在運行過程中進行10%數(shù)據(jù)交叉驗證,最終挑選擬合準確率最高的決策樹來確定模型。
③保存決策樹結果。
④進行驗證集準確率測試。
將3組預報因子分別建立決策樹模型,預報結果如表4所示。
表4 3組預報因子所建立的決策樹模型預報結果對比Tab.4 The comparison of decision tree model forecast results set up by three sets of predictors
最終根據(jù)預報準確率和可行性(有些預報因子無模式直接預報結果),確定最優(yōu)預報模型為第3組預報因子建立的預報模型(圖5),即采用08時氣象要素對霧日預報命中率最高,且漏報率和空報率都最低。采用該模型對驗證集(2014年5月—2015年12月)的105個霧日進行預報,共命中80個霧日。
圖5 最優(yōu)決策樹模型Fig.5 The optimal Decision Tree Model
該預報結果能夠基本滿足預報需求,但準確率仍有提升空間,今后會嘗試添加新的預報因子來對霧進行預報,如EC細網(wǎng)格預報的850 hPa溫度、10 m風速等,以期能達到更好的預報效果,為提高貴陽霧日預報的準確率提供參考。
①貴陽的年霧日分布不均,總體呈增長趨勢;霧的盛發(fā)期出現(xiàn)在1月、2月和12月;4月、9月的霧日較少;四季中,貴陽冬季霧最多,占全年的36.81%。霧在06—08時生成的概率比較高;09時左右消散的概率最高,持續(xù)時間多在6h以下。
②本文運用決策樹方法,結合相關分析方法通過多次比對預報因子進行決策樹預報試驗,選取了與霧日的預報相關性最高的一組預報因子,嘗試對貴陽霧日進行預報,最終建立的預報模型預報命中率達到76.19%。該預報結果能夠滿足預報需求,為預報員提供一定參考。
[1〗 周斌斌.論霧與污染的關系[J〗.氣象,1994,20(9):19-24.
[2〗 劉玉英,李宇凡,張婷,等.吉林省霧的氣候特征及變化成因分析[J〗.地理科學,2015,35(8):1 060-1 066.
[3〗 賀皓,劉子臣,徐虹,等.陜西省高等級公路大霧的預報方法研究[J〗.陜西氣象,2003(1):7-10.
[4〗 羅喜平,楊靜,周成霞.貴州省霧的氣候特征研究[J〗.北京大學學報(自然科學版),2008,44(5):765-772.
[5〗 高陽華,冉榮生.重慶市霧的區(qū)域分布及變化特征[J〗.貴州氣象,1999(6):3-5.
[6〗 周濤,周成霞.貴州霧的時空分布特征[J〗.貴州氣象,2005,29(s1):32-34.
[7〗 Tan Pang-Ning,Steinbach Michael,Kumar Vipin,數(shù)據(jù)挖掘?qū)д揫M〗:北京:人民郵電出版社,2006.
[8〗 林玲玲.基于C4.5算法的高血壓分類規(guī)則提取的研究[D〗:太原理工大學,2012.
[9〗 童堯青,銀燕,許遐禎.南京地區(qū)霧的氣候特征[J〗.南京氣象學院學報,2009,32(1):115-120.
Study on climatic characteristics and forecast model of fog inGuiyang after relocation
PENG Keman1, LIU Bo2, CHEN Haifeng1, TIAN Cheng1
(1.Guiyang Meteorological Observatory, Guiyang, 550001, China;2.Tianjin Meteorological Observatory, Tianjin 300074, China)
Based on the surface observation data of Guiyang station in 2000-2013, the study analyzed the climatic characteristics of fog in Guiyang after relocation using linear analysis and correlation analysis method. The results show that the annual distribution of foggy days in Guiyang is uneven, and the annual trend of foggy days is increasing. Foggy days are concentrated in winter, accounting for 36.81% of the whole year. Fog usually forms from 6:00 to 8:00 and disperses at 9:00, while the duration of fog is usually less than 6 hours. And a fog prediction model, whose accuracy reached 76.19%, was constructed by Decision Tree Method according to meteorological data from 2000 to 2015 of CIMISS. The forecast results can basically satisfy the forecast demand and provide reference for the forecaster.
Guiyang; fog; meteorological factors; decision tree method
2017-01-20
彭科曼(1991—),女,助工,主要從事天氣預報工作,E-mail:493069676@qq.com。
貴陽市氣象局氣象科研基金項目(筑氣科合201405號)。
1003-6598(2017)03-0051-05
P426.4
B