朱華亮,溫華洋,華連生,金素文,陳菁菁
基于Logistic回歸建立霜自動判識模型*
朱華亮,溫華洋**,華連生,金素文,陳菁菁
(安徽省氣象信息中心,合肥 230031)
利用安徽省23個典型氣象站2003?2017年觀測數(shù)據(jù),根據(jù)無霜日的氣象要素閾值條件進行質(zhì)量控制,在此基礎上,構建各氣象站基于Logistic回歸的霜自動判識模型,并對模型的霜判識效果進行評估。結果表明:(1)通過氣溫、風速和降水量等氣象要素閾值,能夠有效判定出安徽各站當日無霜現(xiàn)象;(2)各氣象站的霜判識模型均入選了溫度、濕度和風速等相關要素作為判識因子,入選要素的時次多集中在4:00?8:00區(qū)間;(3)獨立樣本檢驗表明,基于Logistic回歸的霜判識模型對安徽地區(qū)霜的平均判識準確率、命中率、漏判率、空判率和TS評分分別為89.0%、91.6%、8.4%、15.8%和78.2%,表明模型對安徽地區(qū)的霜具有較好的判識能力;(4)與Bayes判別模型對比發(fā)現(xiàn),基于Logistic回歸的霜判識模型在準確率、空判率和TS評分方面表現(xiàn)更優(yōu),可以使用Logistic回歸模型實現(xiàn)霜的自動化判識。
霜;Logistic回歸;自動判識
霜是指水汽在地面和近地面物體上凝華而成的白色松脆的冰晶,易在晴朗風小且寒冷的夜間生成[1]。霜的出現(xiàn)標志著低溫季節(jié)的開始,如果繼續(xù)降溫,容易引起霜凍的發(fā)生。霜凍是一種農(nóng)業(yè)氣象災害,春季發(fā)生會對花果蔬菜造成危害,秋冬季發(fā)生會對小麥產(chǎn)生危害,嚴重時造成作物大幅減產(chǎn),甚至絕收,經(jīng)濟損失巨大[2?5]。因此,氣象部門對霜的觀測和預報非常重視。霜作為地面氣象站觀測業(yè)務中的重要內(nèi)容,目前仍依靠人工目測來記錄。人工目測方式存在著主觀性強、觀測頻率低、惡劣天氣無法觀測等諸多弊端。為提高霜的觀測準確性和觀測效率,得到全面、連續(xù)的霜觀測資料,霜的自動化觀測已成為必然趨勢。
針對霜的自動化觀測,諸多學者從不同角度開展了研究,如馬舒慶等[6]設計了基于圖像、光學散射和常規(guī)地面氣象觀測多種技術的天氣現(xiàn)象自動化觀測系統(tǒng),對北京市氣象臺2010年8、9和10月凝結天氣現(xiàn)象進行了自動觀測試驗,其準確率僅84%、83.3%和71%。宗晨臨等[7]設計了電容式自動化觀測裝置,對北京南郊觀測場2014年9?12月凝結天氣現(xiàn)象進行了觀測試驗,與人工觀測結果相比準確率僅76.6%;茆佳佳等[8]基于草溫與近地面露點溫度之差作為露霜形成的判別因子,在2014年1月23日?5月31日的對比試驗期間,準確率達到84.5%;華連生等[9]應用Bayes判別法建立多套霜生自動判別模型,對安徽省碭山氣象站霜的判別準確率達到90%。然而,由于相關設備價格較高,判識效果還夠不理想,國內(nèi)外尚未有成熟的自動化觀測設備。此外,大部分學者所用方法只在局部地區(qū)進行了對比試驗,相關方法在其它地區(qū)的適用性也鮮有探討。
霜是在一定的天氣條件下產(chǎn)生的,是各氣象要素變化的綜合結果[10?12]。提高霜的自動化識別的準確性,還得從霜產(chǎn)生的天氣條件入手。為此,本研究采用對模型訓練樣本限制較為寬松的Logistic回歸算法,構建霜的自動判識模型,并探討模型在安徽各地區(qū)的適用性,以期為全面開展霜的自動化觀測提供參考。
選用安徽省23個典型國家級氣象站(基本氣象站、基準氣候站),分布如圖1所示。建站初期,各氣象站對氣溫等基本氣象要素進行每日3~4次人工定時觀測。隨著科學技術的發(fā)展,進入21世紀后,各氣象站陸續(xù)啟動觀測自動化,對氣溫等基本氣象要素進行每日24次觀測,至2003年絕大部分站點實現(xiàn)了氣溫等基本氣象要素的自動化觀測。因此,采用資料時段為2003?2017年的逐日觀測數(shù)據(jù),其中2003?2012年共10a逐日觀測數(shù)據(jù)作為模型訓練樣本,2013?2017年共5a逐日觀測數(shù)據(jù)作為獨立檢驗樣本,涉及要素如表1所示。各要素實測資料均通過質(zhì)量控制,資料完整性接近100%。
圖1 安徽省23個典型國家級氣象站分布
表1 相關氣象要素的記號和觀測頻次
注:逐時氣溫表示每整點時刻進行氣溫觀測,其它類同。
Note: Hourly temperature indicates temperature observations at each hour, and so on.
通過式(1)將當日氣溫、水汽壓和風速等觀測值轉(zhuǎn)化成概率,來表征當日有霜的概率,即
式中,因變量Y表示當日有無霜現(xiàn)象,Y=0表示當日無霜,Y=1表示當日有霜。解釋變量x1、x2、…、xp表示相應的氣象要素,如氣溫、水汽壓和風速等。P表示當日有霜的概率,X表示相應的氣象要素向量。如果當日有霜的概率大于當日無霜的概率,就認為當日有霜,即P>0.5時,因變量Y=1;反之,認為當日無霜,因變量Y=0。對式(2)作Logit變換,即用有霜概率P與無霜概率1-P作比值,并取自然對數(shù)得到
式(3)稱之為Logistic回歸模型,作為判斷當日有無霜現(xiàn)象的線性決策邊界,其中β0、β1、…、βp為模型參數(shù)。若Logit(Y)>0,認為當日有霜;反之,認為當日無霜。
采用以下評價指標對霜判識模型進行效果檢驗。
判識準確率:
PC?=?(NA+ND)/(NA+NB+NC+ND)×100% (4)
命中率:
POH?=?NA/(NA+NC)×100% (5)
漏判率:
PO?=?NC/(NA+NC)×100% (6)
空判率:
FAR?=?NB/(NA+NB)×100% (7)
TS評分:
TS?=?NA/(NA+NB+NC)×100% (8)
式中,NA表示人工觀測有霜現(xiàn)象且模型判識也有霜現(xiàn)象的日數(shù)(d),NB表示人工觀測無霜現(xiàn)象且模型判識有霜現(xiàn)象的日數(shù)(d),NC表示人工觀測有霜現(xiàn)象且模型判識無霜現(xiàn)象的日數(shù)(d),ND表示人工觀測無霜現(xiàn)象且模型判識也無霜現(xiàn)象的日數(shù)(d)。若模型的判識準確率、命中率和TS評分越高,漏判率和空判率越低,則模型的判識效果越好;反之,模型的判識效果越差。
由霜的形成機理[15]可知,氣溫必須低于霜點才能形成霜,溫度過高易形成露;而風速過大時,由于空氣流動很快,接觸冷物體表面的時間太短,同時上下層的空氣容易互相混合,不利于溫度降低,也會妨礙霜的形成;另外,云對地面物體夜間的輻射冷卻也有妨礙,天空有云不利于霜的形成,所以霜大都出現(xiàn)在晴朗的夜晚,也即地面輻射冷卻強烈時易出現(xiàn)霜。為此,部分學者采用閾值法對霜是否出現(xiàn)進行判別,如茆佳佳等[8]利用草面溫度與近地面露點溫度差小于某閾值作為霜形成的判別因子,霜判識一致率為92.5%;黃思源等[16]采用最低氣溫小于5℃,相對濕度大于65%作為霜形成的判別閾值,平均一致率為93.0%。然而,研究發(fā)現(xiàn),無法找到某種臨界天氣條件能百分之百判別霜是否出現(xiàn)。因此,首先通過對部分氣象要素設定閾值,對2003?2017年的逐日氣象觀測數(shù)據(jù)進行篩選,將明顯不會形成霜的日數(shù)據(jù)剔除,得到較易形成霜的日數(shù)據(jù),并在此基礎上構建霜自動判識模型。通過大量數(shù)據(jù)的分析和驗證,得到無霜現(xiàn)象氣象要素閾值條件(表2),只需滿足表中3個條件之一即可判斷當日無霜現(xiàn)象發(fā)生。
表3為安徽省各氣象站2003?2017年觀測數(shù)據(jù)通過表2中閾值條件的篩選結果。由表可見,2003?2017年共計5479d,利用表2氣象要素閾值條件平均每站篩選掉無霜日3788.5d,得到用于模型建立和檢驗的樣本數(shù)據(jù)平均每站為1690.5d,緯度較低的站點篩選掉的無霜日較多,隨著緯度的增加站點篩選掉的無霜日減少??傮w表明,表2中的氣象要素閾值條件能夠正確判定出當日無霜現(xiàn)象,對各站均能剔除不利于霜形成的日數(shù)據(jù),得到難以通過氣象要素閾值判斷是否有霜的日數(shù)據(jù),進一步用于模型構建和檢驗。
表2 無霜日氣象要素閾值條件
表3 安徽省各氣象站2003?2017年觀測數(shù)據(jù)的篩選結果
Note: FD is frosty days, FFD is frost-free days.
考慮到各氣象站觀測員對霜的觀測方式和觀測習慣不同,以及地理位置環(huán)境對霜形成的影響,采用一站一模型的方式構建各氣象站的霜判識模型,模型訓練樣本為處理后的2003?2012年逐日觀測數(shù)據(jù)。由于霜的形成受到溫度、水汽壓和風速等多種氣象要素影響,且易出現(xiàn)在晴朗的夜間。因此,選擇夜間各時次的氣溫、地表溫度、露點溫度、水汽壓、相對濕度和風速等氣象要素作為模型自變量代入式(3),利用極大似然估計法[14]對模型參數(shù)進行估計,并通過向前步進法[17]選擇模型變量,構建各站基于Logistic回歸的霜判識模型。其中,自變量的進入和移除采用似然比檢驗法[18]進行檢驗,自變量進入和移除的顯著性閾值(P值)分別為0.05和0.1。
表4給出了安徽省各氣象站基于Logistic回歸的霜判識模型。從中可以發(fā)現(xiàn),各站判別模型選擇的氣象要素與時次各不相同,所有氣象站判識模型均入選了溫度相關要素,其中所有站點均入選了氣溫日較差作為模型判識因子,表明溫度是判斷霜是否形成的主要因子,晝夜溫差較小,溫度較高均不利于霜的形成。此外,各氣象站判識模型還不同程度地入選了濕度和風速等要素作為判識因子,這也表明僅僅通過溫度不能較好地判識出霜是否形成,還需要濕度和風速等次要因子進一步輔助判識。在要素入選時次上,多集中在4:00?8:00區(qū)間,這是由于霜多在下半夜形成,而氣象站觀測員通常在6:00左右進入觀測場進行觀測,此時有利于霜形成的天氣條件應滿足溫度較低、濕度較大、風速較小,因此,大部分臺站在構建模型時選取的要素時次多集中在4:00?8:00。
表4 安徽省各氣象站基于Logistic回歸的霜判識模型
注:Y、T、D、G、E、H和F代表的要素同表1。D02表示2:00地表溫度,其它類同。
Note: Y, T, D, G, E, H and F the same elements in Table 1. For example, D02represents the surface temperature at 2:00, and so on.
2.3.1 與實測數(shù)據(jù)對比
表5給出了基于處理后的2013?2017年觀測數(shù)據(jù)的檢驗效果。由表可見,2013?2017年的檢驗樣本中,平均每站有霜日233.1d,平均每站無霜日306.8d,共計539.9d,其中安徽省北部地區(qū)有霜日數(shù)較多,長江以南地區(qū)有霜日數(shù)較少。應用基于Logistic回歸的霜判識模型檢驗發(fā)現(xiàn),233.1個有霜日中模型正確判識有霜日213.6d,306.8個無霜日中模型正確判識無霜日266.6d,霜判識模型平均準確率為89.0%,其中滁州站的模型準確率最低為84.0%,祁門站的模型準確率最高為93.8%,大部分氣象站的模型準確率在86%~90%,表明基于Logistic回歸的霜判識模型對安徽各氣象站是否出現(xiàn)霜都具有較高的判識準確率。在命中率方面,模型平均有霜命中率為91.6%,有霜命中率高于90%的有15個站點,其中合肥站的有霜命中率最高,為95.8%,太湖站的有霜命中率最低,為80.2%,總體表明基于Logistic回歸的霜判識模型對安徽省各站的霜有較好的命中率。在漏判率方面,模型平均漏判率為8.4%,其中六安站和太湖站的漏判率較高,分別為16.2%和19.8%,其余各站霜模型漏判率較低。在空判率方面,模型平均空判率為15.8%,空判率高于20%的有7個站點,其中馬鞍山站的空判率最高,為26.2%。統(tǒng)計發(fā)現(xiàn),2013年以后各臺站觀測人員記錄到的霜日數(shù)明顯減少(圖略),這是由于2013年氣象站實行觀測業(yè)務改革,減少夜間觀測時次導致霜漏測現(xiàn)象偏多,因此模型空判率有所偏高。在TS評分方面,霜判識模型平均TS評分為78.2%,大部分站點的霜判識模型TS評分較高,其中有8個站點的模型TS評分在80%以上,而模型TS評分較低的站點為馬鞍山站和太湖站,TS評分分別為67.3%和68.4%。這是因為馬鞍山站和太湖站在2013?2017年期間人工觀測的有霜日分別為121d和116d,相比周邊臺站,記錄的霜日數(shù)明顯偏少,存在著明顯的漏測現(xiàn)象,導致模型誤判較多。所以,馬鞍山站和太湖站霜判識模型的TS評分偏低??傮w上,模型對霜具有較高的判識準確率、命中率和TS評分,且對霜的漏判率、空判率較低。這充分反映出基于Logistic回歸的霜判識模型對日霜是否出現(xiàn)的判識能力,表明應用Logistic回歸建立的霜判識模型是合理的,可以接受的。
表5 基于獨立檢驗樣本的霜判識模型檢驗效果
注:NA表示人工觀測有霜現(xiàn)象且模型判識也有霜現(xiàn)象的日數(shù),NB表示人工觀測無霜現(xiàn)象而模型判識有霜現(xiàn)象的日數(shù),NC表示人工觀測有霜現(xiàn)象但模型判識無霜現(xiàn)象的日數(shù),ND表示人工觀測無霜現(xiàn)象模型判識也無霜現(xiàn)象的日數(shù)。下同。
Note: NA is the days with frost phenomena from artificial observation and model identification. NB is the days with frost phenomena from model identification but not from artificial observation. NC is the days with frost phenomena from artificial observation but not from model identification. ND is the days with frost-free phenomena not from artificial observation and model identification. The same as below.
2.3.2 與Bayes判別法結果對比
華連生等[9]利用Bayes判別法對安徽省碭山氣象站的霜判別模型進行了探討,發(fā)現(xiàn)應用日最低地表溫度、7:00水汽壓和7:00風速建立的模型效果最優(yōu)(即文獻[9]中的模型6)。利用碭山站基于Logistic回歸的霜判識模型對該站2001?2013年歷年10月1日?翌年4月30日期間的霜進行判識,并與文獻[9]中基于Bayes判別法的模型6判別效果進行對比驗證,其中檢驗評價指標采用本研究相關定義。
表6給出了基于兩種算法的霜判識模型對碭山站檢驗效果。2001?2011年歷年10月?翌年4月的觀測數(shù)據(jù)中,基于Logistic回歸的霜判識模型的準確率、命中率、漏判率、空判率和TS評分分別為92.7%、92.9%、7.1%、9.6%和84.5%,比基于Bayes判別法的模型6準確率提升了2.6個百分點,命中率下降了1.4個百分點,漏判率增加了1.4個百分點,空判率下降了5.9個百分點,TS評分提升了4.1個百分點;2011?2013年歷年10月?翌年4月的觀測數(shù)據(jù)中,基于Logistic回歸的霜判識模型的準確率、命中率、漏判率、空判率和TS評分分別為94.8%、93.8%、6.2%、5.2%和89.2%,比基于Bayes判別法的模型6準確率提升了3.0個百分點,命中率下降了2.6個百分點,漏判率增加了2.6個百分點,空判率下降了7.9個百分點,TS評分提升了5.0個百分點。通過文獻中訓練樣本和獨立樣本檢驗發(fā)現(xiàn),基于Logistic回歸的霜判識模型準確率、空判率、TS評分均優(yōu)于基于Bayes判別法的霜判識模型,尤其空判率和TS評分提升較為明顯,而基于Logistic回歸的霜判識模型比基于Bayes判別法的模型6命中率有所下降,漏判率有所增加。為提高對霜的綜合判識能力,可以考慮將Logistic回歸模型與Bayes判別模型進行結合,應用于霜的判識。
表6 本模型與文獻[9]中基于Bayes判識模型對碭山站2001?2013年霜判識效果的比較
(1)本研究采用的溫度、風速和降水量閾值能夠正確判定當日無霜現(xiàn)象,對安徽省各站均能剔除大量的不可能形成霜的日數(shù)據(jù),減少了樣本中雨雪、大風等天氣現(xiàn)象的日數(shù)據(jù)對模型建立和判識的干擾?;贚ogistic回歸建立的各站霜判識模型均選擇了溫度、濕度和風速作為判識因子,這符合霜的形成原理[15],也與華連生等[9]研究發(fā)現(xiàn),霜的形成主要受溫度、濕度和風速的影響的研究結論一致。經(jīng)獨立樣本的檢驗評估發(fā)現(xiàn),各站霜判識模型的準確率、命中率、漏判率、空判率和TS評分分別為89.0%、91.6%、8.4%、15.8%和78.2%,模型的判識準確率、命中率和TS評分較高,漏判率、空判率較低。這充分反映出基于Logistic回歸的霜判識模型對霜是否出現(xiàn)具有較好的判識能力,表明基于Logistic回歸建立的霜判識模型是合理的,可以接受的。
(2)基于Logistic回歸對安徽各地建立的霜判識模型對霜是否出現(xiàn)均具有較好的判識能力,表明基于Logistic回歸建立的模型在安徽地區(qū)具有一定的適用性。由于各氣象站所處地理位置環(huán)境不同,且各地觀測員對霜的觀測方式和觀測習慣不同,各站形成的樣本數(shù)據(jù)所含特點有所差異,采用“一站一模型”的建模方式,能夠最大程度地挖掘出樣本數(shù)據(jù)呈現(xiàn)的特征,建立最優(yōu)的霜判識模型,以適應對本地霜的自動判識。中國幅員遼闊,跨緯度較廣,距海遠近差距較大,加之地勢高低不同,地形類型及山脈走向多樣,全國同一模型難以適應各地區(qū)霜的判識,“一站一模型”的建模方式,可為在全國的推廣應用提供參考。
(3)本研究借鑒霜凍的預報預測技術方法探究霜的自動化判識,相較于DZT-1型天氣現(xiàn)象自動化觀測儀[6]和電容式自動化觀測裝置[7],霜的判識準確率更高,實施的成本較低,方法便于在全國推廣應用。與Bayes判別模型[9]的檢驗結果對比發(fā)現(xiàn),基于Logistic回歸的霜判識模型在準確率、空判率和TS評分方面優(yōu)于基于Bayes判別法的霜判識模型,而在模型命中率、漏判率方面,基于Logistic回歸的模型要略低于基于Bayes判別的模型。為提高霜的綜合判識能力,可以考慮將Logistic回歸模型與Bayes判別模型進行結合,形成判別分類器,應用于霜的自動判識。若兩者都判定當日有霜(或無霜),就認定當日有霜(或無霜);若兩者判識結果不一致,則以TS評分較高的模型判識結果為準。
[1] 中國氣象局.地面氣象觀測規(guī)范[M].北京:氣象出版社, 2003:23-26.
China Meteorological Administration.Specification for ground meteorological observation[M].Beijing:China Meteorology Press, 2003:23-26.(in Chinese)
[2] 李軒,張艷紅,韓麗娟,等.2018年春季氣象條件對農(nóng)業(yè)生產(chǎn)的影響[J].中國農(nóng)業(yè)氣象,2018,39(7):490-492.
Li X,Zhang H Y,Han L J,et al.The impact of meteorological conditions on agricultural production in the spring of 2018 [J].Chinese Journal of Agrometeorology,2018,39(7):490-492. (in Chinese)
[3] 王景紅,劉璐,高峰,等.陜西富士系蘋果花期霜凍災害氣象指標的修訂[J].中國農(nóng)業(yè)氣象,2015,36(1):50-56.
Wang J H,Liu L,Gao F,et al.Revision on meteorological indices of florescence frost disaster for Fuji apple in Shaanxi Province[J].Chinese Journal of Agrometeorology,2015,36(1): 50-56.(in Chinese)
[4] 張艷紅,劉維,張蕾.2017年秋季氣候?qū)r(nóng)業(yè)生產(chǎn)的影響[J].中國農(nóng)業(yè)氣象,2018,39(1):69-71.
Zhang H Y,Liu W,Zhang L.The impact of climate on agricultural production in the autumn of 2017[J].Chinese Journal of Agrometeorology,2018,39(1):69-71.(in Chinese)
[5] 劉紅杰,武永峰,任德超,等.黃淮冬麥區(qū)氣象因子與小麥晚霜凍害關系研究:以商丘市為例[J].中國農(nóng)業(yè)氣象,2017, 38(8):517-525.
Liu H J,Wu Y F,Ren D C,et al.Correlation between meteorological factors and late frost damage in Huanghuai winter wheat region:a case study of Shangqiu in Henan province[J].Chinese Journal of Agrometeorology,2017,38(8): 517-525.(in Chinese)
[6] 馬舒慶,吳可軍,陳冬冬,等.天氣現(xiàn)象自動化觀測系統(tǒng)設計[J].氣象,2011,37(9):1166-1172.
Ma S Q,Wu K J,Chen D D,et al.Automated present weather observing system and experiment[J].Meteorological Monthly, 2011,37(9):1166-1172.(in Chinese)
[7] 宗晨臨,朱海兵,王志成,等.電容式霜露傳感器自動化觀測對比分析[J].氣象科技,2016,44(2):204-210.
Zong C L,Zhu H B,Wang Z C,et al.Comparative analysis of observations from capacitive frost and dew sensor on frost and dew phenomenon[J].Meteorological Science and Technology, 2016,44(2):204-210.(in Chinese)
[8] 茆佳佳,張雪芬,鞏娜,等.基于近地面溫濕度觀測的露霜綜合判別技術[J].氣象科技,2016,44(2):197-203.
Mao J J,Zhang X F,Gong N,et al.Comprehensive discrimination of dew and frost based on near surface temperature and humidity observations[J].Meteorological Science and Technology,2016,44(2):197-203.(in Chinese)
[9] 華連生,溫華洋,朱華亮,等.基于Bayes判別法的霜生自動化觀測模型探討[J].氣象,2015,41(8):964-969.
Hua L S,Wen H Y,Zhu H L,et al.Automated observation model for frost based on Bayes discriminant method [J].Meteorological Monthly,2015,41(8):964-969.(in Chinese)
[10] 朱虹暉,武永峰,宋吉青,等.基于多因子關聯(lián)的冬小麥晚霜凍害分析:以河南省為例[J].中國農(nóng)業(yè)氣象,2018,39(1): 59-68.
Zhu H H,Wu Y F,Song J Q,et al.Analysis to late frost damage for winter wheat based on meteorological factors:taking Henan province as an example[J].Chinese Journal of Agrometeorology,2018,39(1):59-68.(in Chinese)
[11] 劉紅杰,倪永靜,任德超,等.黃淮冬麥區(qū)晚霜凍易發(fā)時段冠層內(nèi)最低氣溫分布及估算[J].中國農(nóng)業(yè)氣象,2018,39(12): 786-795.
Liu H J,Ni Y J,Ren D C,et al.Estimation and distribution of minimum air temperature within winter wheat canopy in prone period of late frost[J].Chinese Journal of Agrometeorology, 2018,39(12):786-795.(in Chinese)
[12] 郭小芹,錢莉.河西走廊東部一次霜凍成因分析[J].氣象科技,2018,46(2):369-373.
Guo X Q,Qian L.Causal analysis of a late frost event in eastern Hexi corridor[J].Meteorological Science and Technology,2018,46(2):369-373.(in Chinese)
[13] Collins M,Schapire R E,Singer Y.Logistic regression, adaboost and bregman distances[J].Machine Learning,2002, 48(1-3):253-285.
[14] Gareth J,Daniela W,Trevor H,等.統(tǒng)計學習導論:基于R應用[M].王星等譯.北京:機械工業(yè)出版社,2015:92-94.
Gareth J,Daniela W,Trevor H,et al.Introduction to statistical learning:based on R application[M].Translated by Wang X,et al.Beijing:Machinery Industry Press,2015:92-94.(in Chinese)
[15] 盛裴軒,毛節(jié)泰,李建國,等.大氣物理學[M].北京:北京大學出版社,2003:310-325.
Sheng P X,Mao J T,Li J G,et al.Atmospheric physics [M].Beijing:Peking University Press,2003:310-325.(in Chinese)
[16] 黃思源,傅偉忠.露?霜?結冰天氣現(xiàn)象綜合判別[J].氣象科技,2014,42(3):359-363.
Huang S Y,Fu W Z.A study of comprehensive discrimination of dew,frost and freezing[J].Meteorological Science and Technology,2014,42(3):359-363.(in Chinese)
[17] 王松桂,陳敏,陳立萍.線性統(tǒng)計模型[M].北京:高等教育出版社,1999:127-134.
Wang S G,Chen M,Chen L P.Linear statistical model[M]. Beijing:Higher Education Press,1999:127-134.(in Chinese)
[18] 鄭明,陳子毅,汪嘉岡.數(shù)理統(tǒng)計講義[M].上海:復旦大學出版社,2006:148-151.
Zheng M,Chen Z Y,Wang J G.Lectures on mathematical statistics[M].Shanghai:Fudan University Press,2006:148-151. (in Chinese)
朱華亮,溫華洋,華連生,等.基于Logistic回歸建立霜自動判識模型[J].中國農(nóng)業(yè)氣象,2019,40(8):534-542
Frost Automatic Identification Model Based on Logistic Regression
ZHU Hua-liang, WEN Hua-yang, HUA Lian-sheng, JIN Su-wen, CHEN Jing-jing
(Anhui Meteorological Information Center, Hefei 230031, China)
Using the threshold-based methods of meteorological elements on frost-free days, the quality-controlled daily observation data were firstly established, using the observed data from 23 typical meteorological stations in Anhui province from 2003 to 2017. The automatic identification models of frost based on Logistic regression were constructed for each meteorological station in Anhui province, and the performance of the frost identification model was evaluated. The results showed that: (1) the daily frost-free phenomena could be correctly determined for each station in Anhui province by the thresholds of meteorological elements such as temperature, wind speed and precipitation amount. (2)Temperature, humidity and wind speed were selected as the identification elements in the frost identification models for all meteorological stations. The observation time of model elements mostly occurred at the stage from 4:00 to 8:00. (3)The accuracy rate, hit rate, miss rate, empty judgement rate and TS score of Logistic regression model based on independent sample test were 89.0%, 91.6%, 8.4%, 15.8% and 78.2%, respectively. This indicates that the frost recognition model established by Logistic regression has good ability to identify frost in Anhui province. (4) Compared with Bayes discriminant model, it was found that the frost identification model based on Logistic regression had higher accuracy rate and TS score, and lower empty judgement rate. Therefore, the proposed Logistic regression model can be applied to the automatic identification of frost in the future.
Frost; Logistic regression; Automatic identification
2019?01?27
。E-mail:wenhy12@163.com
中國氣象局小型業(yè)務能力建設項目;安徽省氣象科技發(fā)展基金項目(KM201715)
朱華亮(1988?),碩士,工程師,主要從事氣象資料分析與評估。E-mail:hualiangzhu@126.com
10.3969/j.issn.1000-6362.2019.08.006