張華龍 伍志方,2 肖柳斯 涂 靜
ZHANG Hualong1 WU Zhifang1,2 XIAO Liusi3 TU Jing1
1. 廣東省氣象臺(tái),廣州,510080
2. 中國(guó)氣象局廣州熱帶海洋氣象研究所/廣東省區(qū)域數(shù)值天氣預(yù)報(bào)重點(diǎn)實(shí)驗(yàn)室,廣州,510640
3. 廣州市氣象臺(tái),廣州,511430
1. Guangdong Meteorological Observatory,Guangzhou 510080,China
2. Institute of Tropical and Marine Meteorology/ Key Laboratory of Regional Numerical Weather Prediction,CMA,Guangzhou 510640,China
3. Guangzhou Meteorological Observatory,Guangzhou 511430,China
廣東省地處亞熱帶季風(fēng)氣候區(qū),短時(shí)強(qiáng)降水頻率和最大小時(shí)雨強(qiáng)在中國(guó)均位于最高水平(陳炯等,2013)。短時(shí)強(qiáng)降水多由中小尺度系統(tǒng)造成,具有尺度小、突發(fā)性強(qiáng)、生命期短、致災(zāi)嚴(yán)重的特點(diǎn),已有一些研究總結(jié)了廣東短時(shí)強(qiáng)降水出現(xiàn)的不同天氣流型配置(伍志方等,2016;陳元昭等,2016)以及華南前、后汛期引發(fā)強(qiáng)降水的天氣系統(tǒng)配置(王堅(jiān)紅等,2014;梁巧倩等,2019)。邊界層急流(Du,et al,2018)、華南復(fù)雜地形特別是海陸對(duì)比(Chen,et al,2018)在華南強(qiáng)降雨演變過(guò)程中起重要作用,這些要素之間的特殊相互作用是復(fù)雜的,導(dǎo)致了華南強(qiáng)降水的獨(dú)特特征,致使預(yù)報(bào)存在相當(dāng)大的困難(Luo,et al,2020)。如2017 年廣州“5?7”特大暴雨過(guò)程,增城新塘鎮(zhèn)記錄雨強(qiáng)184.4 mm/h,各主流模式對(duì)該區(qū)域僅預(yù)報(bào)小雨或中雨級(jí)別降水(伍志方等,2018),造成業(yè)務(wù)預(yù)報(bào)的嚴(yán)重漏報(bào)。在目前數(shù)值模式對(duì)于華南降水預(yù)報(bào)評(píng)分仍較低的情況下(Zhang,et al,2016),利用天氣過(guò)程的物理參數(shù)建立綜合多方面要素的預(yù)報(bào)模型,是一個(gè)有益嘗試。
短時(shí)強(qiáng)降水屬于強(qiáng)對(duì)流天氣現(xiàn)象之一,不同類別的強(qiáng)對(duì)流具有不一樣的環(huán)境條件和物理量閾值特征,目前已有較多研究工作利用觀測(cè)或再分析資料計(jì)算強(qiáng)對(duì)流發(fā)生的物理量,并使用統(tǒng)計(jì)后處理技術(shù)或機(jī)器學(xué)習(xí)方法構(gòu)建預(yù)報(bào)模型,在雷電(Gijben,et al,2017;Bates,et al,2018)、強(qiáng)雷暴(Gallo,et al,2018)、強(qiáng)冰雹(Mohr,et al,2015)和龍卷(Simon,et al,2018)的預(yù)測(cè)上取得一定效果。這種基于構(gòu)成要素預(yù)報(bào)強(qiáng)對(duì)流的方法稱“配料法”(俞小鼎等,2020)。中國(guó)國(guó)家氣象中心較早基于“配料法”思路開展強(qiáng)對(duì)流天氣概率預(yù)報(bào)業(yè)務(wù)(張小玲等,2012),之后一些研究通過(guò)模式輸出參數(shù)進(jìn)行統(tǒng)計(jì)后處理,構(gòu)建短時(shí)強(qiáng)降水預(yù)報(bào)模型。雷蕾等(2012)基于快速更新循環(huán)同化預(yù)報(bào)系統(tǒng)(BJ-RUC 模式)計(jì)算了一系列物理量,探索對(duì)強(qiáng)對(duì)流天氣分類預(yù)報(bào)的可行性。曾明劍等(2015)應(yīng)用相對(duì)偏差模糊矩陣評(píng)價(jià)技術(shù),對(duì)中尺度模式輸出的對(duì)流參數(shù)進(jìn)行逐次篩選和權(quán)重分配,構(gòu)建分類強(qiáng)對(duì)流天氣預(yù)報(bào)概率模型并業(yè)務(wù)應(yīng)用。朱月佳等(2019)借鑒“配料法”的思路建立基于集合預(yù)報(bào)的對(duì)流聯(lián)合概率預(yù)報(bào)方法,對(duì)區(qū)域性集中短時(shí)強(qiáng)降水取得較好的應(yīng)用效果。洪偉等(2018)利用ECMWF 全球模式細(xì)網(wǎng)格預(yù)報(bào)產(chǎn)品,通過(guò)物理量閾值判定和箱形圖差異指數(shù)評(píng)估與短時(shí)強(qiáng)降水發(fā)生敏感度的方法建立短時(shí)強(qiáng)降水預(yù)報(bào)模型。
多數(shù)概率預(yù)報(bào)方法均直接以物理量作為模型預(yù)報(bào)因子。當(dāng)物理量數(shù)增多時(shí),某些無(wú)效物理量的引入會(huì)影響預(yù)測(cè)模型效果,因此需要構(gòu)建合理的物理量篩選標(biāo)準(zhǔn);另外,部分物理量之間的相關(guān)也會(huì)為模型帶來(lái)冗余信息。為簡(jiǎn)化模型的輸入變量,可對(duì)物理量進(jìn)行二次處理,減少因子數(shù)量,提高因子的有效性。因子分析是一種構(gòu)建少數(shù)幾個(gè)因子描述多個(gè)指標(biāo)聯(lián)系的方法,能夠從變量的方差/協(xié)方差結(jié)構(gòu)入手,在盡可能多地保留原始變量信息的基礎(chǔ)上,用少數(shù)新變量來(lái)解釋原始變量。由于因子模型的特性,能夠?qū)Π瑥?fù)雜信息的對(duì)流性降水(Godart,et al,2010)和極端強(qiáng)降水(Felzer,et al,2020)的環(huán)境因子進(jìn)行有效分析,并基于因子分析改進(jìn)預(yù)報(bào)模型(熊開國(guó)等,2012;農(nóng)孟松等,2011)。
為解決一般物理量預(yù)測(cè)短時(shí)強(qiáng)降水出現(xiàn)的命中率和虛警率同步上升而導(dǎo)致TS 評(píng)分降低的問題,提高模型預(yù)測(cè)有效性,文中以顯著性(物理量與多年平均態(tài)的差異)和敏感性(特征曲線面積)為標(biāo)準(zhǔn),篩選在業(yè)務(wù)應(yīng)用中具有較低虛警率和高預(yù)報(bào)技巧的物理量。廣東省北依南嶺,南鄰南海,在華南前、后汛期,不同區(qū)域氣候和降水特征差異大,導(dǎo)致短時(shí)強(qiáng)降水發(fā)生時(shí)各物理量與多年平均態(tài)偏差的差異顯著,若采用所有數(shù)據(jù)樣本直接進(jìn)行因子建模,將導(dǎo)致因子預(yù)測(cè)能力減弱。為此文中按照前、后汛期以及不同區(qū)域的有效因子特征,建立分期、分區(qū)短時(shí)強(qiáng)降水概率預(yù)報(bào)模型。在實(shí)際業(yè)務(wù)應(yīng)用中,將歐洲中期天氣預(yù)報(bào)中心細(xì)網(wǎng)格數(shù)值模式(ECMWF-Fine)預(yù)報(bào)數(shù)據(jù)輸入概率預(yù)報(bào)模型,形成短時(shí)強(qiáng)降水0—36 h 逐6 h 概率預(yù)報(bào)產(chǎn)品。除提供概率預(yù)報(bào)外,模型還可輸出多個(gè)獨(dú)立因子,分別反映短時(shí)強(qiáng)降水發(fā)生、發(fā)展的不同環(huán)境特征,可提供有利條件的定量指標(biāo),幫助識(shí)別不同類型的短時(shí)強(qiáng)降水,為主觀預(yù)報(bào)短時(shí)強(qiáng)降水落區(qū)、強(qiáng)度提供參考。
建模實(shí)況數(shù)據(jù)為廣東省區(qū)域地面氣象站(包含基本站和自動(dòng)站)的小時(shí)雨量數(shù)據(jù)。自動(dòng)氣象站雨量資料經(jīng)過(guò)質(zhì)量控制處理:若某一站點(diǎn)記錄到20 mm/h以上降水量,但以該站為中心,50 km 半徑范圍內(nèi)的其余站點(diǎn)均無(wú)降水,則認(rèn)為該短時(shí)強(qiáng)降水記錄可疑;當(dāng)1 a 內(nèi)某一站點(diǎn)缺測(cè)數(shù)據(jù)比例超過(guò)5%,則視為故障站點(diǎn)。故障站點(diǎn)當(dāng)年的數(shù)據(jù)與可疑數(shù)據(jù)均不作為短時(shí)強(qiáng)降水事件記錄?;谡军c(diǎn)觀測(cè)記錄,構(gòu)建與ERA-Interim 具有相同空間分辨率(0.125°)的格點(diǎn)數(shù)據(jù)集并進(jìn)行參數(shù)統(tǒng)計(jì)(曾明劍等,2015),方法如下:遍歷所有格點(diǎn),在再分析資料時(shí)次對(duì)應(yīng)代表時(shí)段(前后3 h)內(nèi),若格點(diǎn)區(qū)域內(nèi)有站點(diǎn)記錄到≥20 mm/h 降水,則認(rèn)為該格點(diǎn)出現(xiàn)了短時(shí)強(qiáng)降水。
文中使用歐洲中期天氣預(yù)報(bào)中心的再分析同化數(shù)據(jù)集(ERA-Interim)計(jì)算相關(guān)物理量。ERAInterim 作為目前廣泛使用的再分析資料,使用四維變分同化技術(shù)同化了大量衛(wèi)星觀測(cè)資料,結(jié)合多種誤差校正技術(shù)實(shí)現(xiàn)了資料質(zhì)量的提升,對(duì)于形勢(shì)場(chǎng)具有較好的反映能力(Dee,et al,2011;慕丹等,2018),在中國(guó)地形復(fù)雜、觀測(cè)資料稀缺的地區(qū)具有較好的適用性(Bao,et al,2013)。建模數(shù)據(jù)樣本訓(xùn)練期為2009—2018 年的4—9 月,測(cè)試期為2019年4—9 月,模型效果驗(yàn)證和業(yè)務(wù)運(yùn)行均使用ECMWF-Fine 預(yù) 報(bào) 場(chǎng)。 ECMWF-Fine 提 供1 天2 次起報(bào)(08 時(shí)與20 時(shí),北京時(shí),下同)、地面要素空間分辨率為0.125°、高空要素分辨率為0.25°的預(yù)報(bào);為生成0.125°分辨率的模型輸出產(chǎn)品,將高空預(yù)報(bào)要素進(jìn)行雙線性插值,形成與地面要素分辨率(0.125°)一致的格點(diǎn)場(chǎng)。將ECMWF-Fine 預(yù)報(bào)場(chǎng)計(jì)算的物理量參數(shù)輸入概率預(yù)報(bào)模型,生成0—36 h 逐6 h 短時(shí)強(qiáng)降水客觀概率預(yù)報(bào)產(chǎn)品。
2.2.1 物理量計(jì)算與遴選
利用各層次ERA-Interim 資料風(fēng)、溫度、濕度、氣壓等要素,計(jì)算49 個(gè)反映大氣動(dòng)力、熱力的物理量(見附錄表1)。為減少氣候背景差異對(duì)建模的影響,對(duì)物理量進(jìn)行多年平均態(tài)扣除處理:對(duì)應(yīng)某一天的某個(gè)時(shí)次,計(jì)算多年(2001—2018 年)當(dāng)天及前后各2 d(共5 d)同一時(shí)次的物理量平均值。
為遴選具有更好指示意義的物理量作為建模參數(shù),以顯著性指標(biāo)和敏感性指標(biāo)為標(biāo)準(zhǔn)。顯著性即短時(shí)強(qiáng)降水發(fā)生時(shí)物理量與多年平均態(tài)差異的顯著性。用T 檢驗(yàn)量作為評(píng)價(jià)指標(biāo),計(jì)算公式
除考慮顯著性以外,引入特征曲線面積(AROC,Area under Receiver Operating Characteristic Curve)(Richardson,2000)作為敏感性指標(biāo),該指標(biāo)衡量物理量作為預(yù)報(bào)因子識(shí)別短時(shí)強(qiáng)降水發(fā)生的能力,值越大,預(yù)報(bào)技巧越高,對(duì)事件預(yù)報(bào)的敏感性越優(yōu)。圖1 為49 個(gè)物理量對(duì)應(yīng)的受試者操作特征曲線(ROC,Receiver Operating Characteristic Curve)(Richardson,2000),其中紅線為24 個(gè)T 檢驗(yàn)量顯著性較高的指標(biāo),可見,并非所有顯著性高的因子均具有較優(yōu)的敏感性,部分紅線對(duì)應(yīng)物理量的AROC 處于較低分位水平,表明兩個(gè)指標(biāo)的優(yōu)勢(shì)參數(shù)并不具有一致性。
對(duì)所有物理量的T 和AROC 兩個(gè)指標(biāo)進(jìn)行標(biāo)準(zhǔn)化處理并相加,計(jì)算綜合評(píng)價(jià)指標(biāo)。綜合評(píng)價(jià)指標(biāo)較小的物理量,傾向于對(duì)應(yīng)某一指標(biāo)值較低,或兩個(gè)指標(biāo)優(yōu)勢(shì)均不明顯(見附錄表1)。文中挑選綜合評(píng)價(jià)指標(biāo)最大的18 個(gè)物理量作為建模參數(shù),對(duì)遴選的18 個(gè)物理量利用因子分析方法,組合成6 個(gè)表征熱力、動(dòng)力、水汽等不同物理特性的因子,并賦予不同權(quán)重。
2.2.2 因子分析
圖1 49 個(gè)物理量受試者操作特征曲線 (AROC 為受試者操作特征曲線與y=x 函數(shù)線圍成的面積;紅、藍(lán)色線分別代表在所有物理量的顯著性檢驗(yàn)中,顯著度位于前50%分位、后50%分位的物理量)Fig. 1 ROC curves of 49 physical parameters (AROC represents the area surrounded by the ROC curve and the y=x line;Red lines and blue lines respectively represent physical parameters ranking the top 50% and the last 50% in the significance test of all physical parameters)
基于2.2.1 節(jié)選取的18 個(gè)物理量進(jìn)行因子分析,因子分析的算法核心是將p 個(gè)物理量 x ( x=x1,x2, x3, ···, xp) 表 達(dá) 為m 個(gè) 因 子 f ( f = f1, f2, f3,···,fm)的線性組合形式,即
式中,A 為因子分析法的因子荷載矩陣,通過(guò)對(duì)原始變量( x)的相關(guān)系數(shù)矩陣變換處理得到。u( u=u1, u2, ···, up) 為原始變量( x)的平均值。為使每一個(gè)物理量在少數(shù)幾個(gè)主因子上具有高載荷,采用方差最大正交旋轉(zhuǎn)法對(duì)因子載荷矩陣(A)進(jìn)行旋轉(zhuǎn)變換。用因子載荷矩陣列元素的平方和除以維數(shù),即可得到各因子貢獻(xiàn)率,將各因子貢獻(xiàn)率累加,即可得到因子累計(jì)貢獻(xiàn)率。累計(jì)貢獻(xiàn)率表明當(dāng)前數(shù)目的因子累計(jì)方差占樣本總方差的比例(在[0%,100% ]內(nèi)變化,值越大,因子的解釋能力越好)。雖然因子數(shù)增加,累計(jì)貢獻(xiàn)率同步增加,但過(guò)多的因子不利于物理量的有效歸納和解釋,理想模型是通過(guò)盡可能少的因子數(shù)獲得最大的解釋能力。圖2 為因子數(shù)與貢獻(xiàn)率/累計(jì)貢獻(xiàn)率的關(guān)系??梢?,當(dāng)因子數(shù)較少(<5)時(shí),因子貢獻(xiàn)率增加幅度較大,因子數(shù)為6 時(shí),總貢獻(xiàn)已超過(guò)75.9%,但因子數(shù)繼續(xù)增加,因子總解釋能力提升幅度較小。因此,文中確定因子數(shù)為6,貢獻(xiàn)率依次為19.1%、18.8%、12.2%、10.8%、9.8%、5.2%。
圖3 為式(2)計(jì)算的載荷系數(shù)矩陣A。載荷系數(shù)反映了因子與物理量的相關(guān)性,同一因子對(duì)應(yīng)的幾個(gè)高載荷物理量所代表的共同物理意義反映了因子主要特征。如物理量組合因子1(簡(jiǎn)稱組合因子1,其余因子同)系數(shù)較高的物理量分別為1000、925 和850 hPa 的假相當(dāng)位溫、總指數(shù)、修正K 指數(shù)與K 指數(shù)等,可知主要是反映大氣的熱力不穩(wěn)定尤其是低層(850 hPa 以下)能量增長(zhǎng)的因子。組合因子2 的高相關(guān)物理量為大氣垂直液態(tài)水積分和大氣可降水量,主要是反映大氣水汽變化的因子;組合因子3 的高相關(guān)物理量為500 hPa 垂直速度、700 hPa 垂直速度與中低層垂直速度積分,主要反映大氣中層垂直運(yùn)動(dòng)條件;組合因子4 的高相關(guān)物理量為修正K 指數(shù)、K 指數(shù)、700 hPa 相對(duì)濕度和總指數(shù);組合因子5 的高相關(guān)物理量為850 hPa 垂直速度和渦度、700 hPa 垂直速度與中低層垂直速度積分;組合因子6 的高相關(guān)物理量為850 hPa 假相當(dāng)位溫和相對(duì)濕度、總指數(shù)、K 指數(shù)。
2.2.3 因子概率與組合因子優(yōu)勢(shì)
圖2 因子總貢獻(xiàn)和貢獻(xiàn)率增加值隨因子數(shù)變化Fig. 2 Total factor contribution and the variation of increase in the contribution rate with the number of factors
圖3 6 個(gè)物理量組合因子對(duì)應(yīng)遴選出的18 個(gè)物理量的因子相關(guān)系數(shù)Fig. 3 The load coefficients of 18 selected physical parameters corresponding to 6 factors
因子概率通過(guò)對(duì)因子得分處理得到,因子得分通過(guò)Thompson 方法(Devlieger,et al,2016)計(jì)算所得,即對(duì)2.2.2 節(jié)計(jì)算的因子載荷矩陣A 采用正交旋轉(zhuǎn)變換,計(jì)算公式為
重組后的因子概率指示短時(shí)強(qiáng)降水的效果較單一物理量更好。以組合因子1 為例,該因子的AROC 顯著大于6 個(gè)高權(quán)重物理量(圖4a);對(duì)比該因子與各物理量在30%預(yù)測(cè)閾值時(shí)的虛警率與命中率(圖4b),可以發(fā)現(xiàn)該因子的虛警率(35%)低于所有單個(gè)物理量,而命中率(88.2%)與6 個(gè)物理量相比接近(相差在1%范圍內(nèi))。因此物理量組合后的因子模型在保證具有較高命中率的同時(shí),顯著降低了虛警率,體現(xiàn)了優(yōu)化模型因子的效果。
2.2.4 概率預(yù)報(bào)模型
在業(yè)務(wù)中為應(yīng)用概率預(yù)報(bào)模型生成產(chǎn)品,利用ECMWF-Fine 預(yù)報(bào)數(shù)據(jù),通過(guò)2.2.3 節(jié)的處理步驟計(jì)算各因子概率;進(jìn)一步對(duì)6 個(gè)因子概率進(jìn)行加權(quán)組合,形成綜合概率預(yù)報(bào)模型。各個(gè)因子概率的權(quán)重為因子貢獻(xiàn)率占總貢獻(xiàn)的比值(因子貢獻(xiàn)率計(jì)算方法見2.2.2 節(jié)),因子貢獻(xiàn)率占比越大,則該因子對(duì)環(huán)境物理量變化的總方差貢獻(xiàn)越大,可在預(yù)報(bào)結(jié)果中有效體現(xiàn)大氣環(huán)境參數(shù)的主要變化特征。當(dāng)因子數(shù)為6 時(shí),因子總貢獻(xiàn)率為75.9%,單個(gè)因子的權(quán)重值是因子貢獻(xiàn)率占6 個(gè)因子總貢獻(xiàn)率的比值。因此綜合概率計(jì)算公式為
圖4 組合因子1 與高相關(guān)物理量受試者操作特征曲線檢驗(yàn) (a)、虛警率與命中率 (b) (a 選取物理量為構(gòu)成組合因子1 相關(guān)系數(shù)較高的物理量,b 為各因子與物理量對(duì)應(yīng)30%分位預(yù)測(cè)閾值時(shí)的虛警率與命中率,PPT 為假相當(dāng)位溫縮寫)Fig. 4 ROC tests (a),false alarm ratio and hit ratio (b) of Factor 1 and its highly correlated physical parameters(Physical parameters which are highly correlated with Factor 1 are selected. Fig. 4b presents the false alarm ratio and hit ratio of Factor 1 and each physical parameter corresponding to 30% fractional forecast threshold value. PPT is the abbreviation name ofpotential pseudo-equivalent temperature)
式中, Fall為 模型的 概 率 預(yù)報(bào)值, fi(i=1,2,···,6)為因子概率,各因子權(quán)重系數(shù)分別為單個(gè)因子貢獻(xiàn)率占總貢獻(xiàn)率之比。
由于前、后汛期廣東省短時(shí)強(qiáng)降水的氣候背景與環(huán)流形勢(shì)明顯不同(梁巧倩等,2019),致使各物理量閾值分布也具有顯著差別,因此首先對(duì)因子進(jìn)行時(shí)、空統(tǒng)計(jì),劃分因子特征相似的時(shí)期與區(qū)域,進(jìn)而建立獨(dú)立模型,以提升模型有效性。為體現(xiàn)因子得分相對(duì)于多年平均態(tài)的偏離幅度,定義短時(shí)強(qiáng)降水對(duì)應(yīng)的各因子偏離度(FB,F(xiàn)actor Bias)。式中, Fi(i=1,2,···,6)為經(jīng)過(guò)標(biāo)準(zhǔn)化處理的短時(shí)強(qiáng)降水因子得分平均值, Fmean為因子得分的多年平均值。
圖5 不同月份廣東省短時(shí)強(qiáng)降水因子偏離度Fig. 5 SHR deviation rates of individual factors in Guangdong in different months
圖5 為廣東省范圍內(nèi)所有格點(diǎn)的因子偏離度逐月變化,前汛期(4—6 月)所有因子偏離度隨月份增長(zhǎng)均呈下降態(tài)勢(shì),但不同因子的偏離度差異較小,顯著小于后汛期(7—9 月);后汛期除組合因子1 隨月份增長(zhǎng)而增大外,其余因子均維持相對(duì)穩(wěn)定。與動(dòng)力和水汽條件相關(guān)的因子(組合因子2、3、5)偏離度比較一致,但與熱力條件相關(guān)的因子(組合因子1、4、6)偏離度均低于動(dòng)力和水汽因子,且因子間偏離度有明顯差異,上述特征表明,隨著季節(jié)逐漸從前汛期過(guò)渡到后汛期,上、下氣層間的熱力差異逐漸減小,組合因子1 的相對(duì)重要性也不斷下降。值得注意的是,多數(shù)因子在6 月出現(xiàn)谷值,可能與該月短時(shí)強(qiáng)降水發(fā)生頻率較高有關(guān),過(guò)多的樣本量導(dǎo)致因子偏離度較低。上述因子偏離度差異特征可作為前、后汛期獨(dú)立建模的依據(jù)。
除季節(jié)差異外,不同地區(qū)的氣候背景差異(孫喜艷等,2017)亦導(dǎo)致不同地域因子偏離度不同。為體現(xiàn)因子偏離的空間分布特征,計(jì)算廣東省區(qū)域格點(diǎn)因子偏離度占所有格點(diǎn)總因子偏離度的比值,作為因子的相對(duì)偏離度,反映各因子對(duì)不同區(qū)域的相對(duì)重要性。由圖6 可見,除組合因子4 外,其余因子在廣東省北部和西南部均具有反向分布特征,組合因子1 相對(duì)偏離度較高的區(qū)域(粵北),不穩(wěn)定能量條件對(duì)于短時(shí)強(qiáng)降水重要性高于相對(duì)偏離度較小的區(qū)域(粵西南)(圖6a);與之類似,組合因子3 的南北差異(圖6c)表明垂直運(yùn)動(dòng)條件對(duì)于粵西南的短時(shí)強(qiáng)降水發(fā)生具有更重要作用。組合因子2、5、6 也有類似的南北差異特征,且高、低值分布區(qū)域相似。因此,在分區(qū)建模中,考慮到上述因子相對(duì)偏離度的空間分布特征,以及廣東沿海兩個(gè)降水中心與內(nèi)陸降水中心性質(zhì)的不同(王堅(jiān)紅等,2017;Li,et al,2008),將廣東省劃分為3 個(gè)區(qū)域進(jìn)行單獨(dú)建模(圖6a)。
基于上述的分時(shí)期與分區(qū)域方法,可形成6 個(gè)因子模型,在相同的因子數(shù)目下,不同模型選取的物理量、各因子貢獻(xiàn)率、組成各因子的物理量的權(quán)重系數(shù)均有差別。進(jìn)行時(shí)、空分區(qū)的獨(dú)立建模后,其應(yīng)用效果較未分區(qū)前模型有一定改善,尤其對(duì)于廣東省西南部地區(qū),短時(shí)強(qiáng)降水的命中率明顯提升(圖略)。
為檢驗(yàn)概率模型的業(yè)務(wù)應(yīng)用效果,對(duì)測(cè)試期(2019 年4—9 月)模型輸出結(jié)果進(jìn)行檢驗(yàn)。由于模型輸出為概率值,為得到格點(diǎn)短時(shí)強(qiáng)降水預(yù)報(bào)產(chǎn)品,需要設(shè)定一個(gè)固定概率值作為預(yù)測(cè)概率閾值,閾值的選取方法為:對(duì)訓(xùn)練期間前、后汛期和不同區(qū)域設(shè)置不同的因子概率閾值,檢驗(yàn)對(duì)應(yīng)短時(shí)強(qiáng)降水TS 評(píng)分,以最優(yōu)TS 評(píng)分對(duì)應(yīng)概率值作為預(yù)報(bào)業(yè)務(wù)中的短時(shí)強(qiáng)降水的預(yù)測(cè)概率閾值。圖7 為不同區(qū)域和時(shí)期預(yù)測(cè)概率閾值對(duì)應(yīng)的TS 評(píng)分,可見,隨著概率閾值增大,TS 評(píng)分均為先增大、后減小的趨勢(shì),當(dāng)概率閾值大于40%時(shí),命中率迅速下降。以分區(qū)、分期的最優(yōu)TS 評(píng)分對(duì)應(yīng)的概率閾值代入預(yù)測(cè)模型,并在測(cè)試期進(jìn)行檢驗(yàn),具體概率閾值見表1。檢驗(yàn)方案為:參考洪偉等(2018)區(qū)塊TS 檢驗(yàn)方法,對(duì)廣東省區(qū)域劃分為空間分辨率更高的0.5°×0.5°網(wǎng)格,同時(shí)采用更精細(xì)的時(shí)間尺度,預(yù)報(bào)時(shí)段為每天兩次起報(bào)(08、20 時(shí))12 h 預(yù)報(bào)時(shí)效內(nèi)的逐6 h 產(chǎn)品,如08 時(shí)起報(bào),則檢驗(yàn)14 和20 時(shí)的短時(shí)強(qiáng)降水,對(duì)應(yīng)短時(shí)強(qiáng)降水實(shí)況時(shí)段分別為11—17 時(shí)、17—23 時(shí)。在判定區(qū)塊的對(duì)應(yīng)時(shí)段內(nèi),若有2 個(gè)以上的測(cè)站記錄到>20 mm/h 降水,則認(rèn)為實(shí)況出現(xiàn)短時(shí)強(qiáng)降水。
為體現(xiàn)上述方法相對(duì)確定性模式要素預(yù)報(bào)的優(yōu)勢(shì),將模型結(jié)果與業(yè)務(wù)常用的ECMWF-Fine 雨量預(yù)報(bào)產(chǎn)品進(jìn)行對(duì)比。由于ECMWF-Fine 預(yù)報(bào)產(chǎn)品時(shí)間分辨率為3 h,并且檢驗(yàn)評(píng)估表明ECMWFFine 對(duì)華南對(duì)流性降水經(jīng)常低估(Huang,et al,2017),因此對(duì)確定性模式采取較寬松的標(biāo)準(zhǔn):當(dāng)檢驗(yàn)時(shí)段對(duì)應(yīng)格點(diǎn)內(nèi)3 h 累計(jì)雨量預(yù)報(bào)最大值超過(guò)20 mm,則判定預(yù)報(bào)為短時(shí)強(qiáng)降水。另外,為考察模型對(duì)短時(shí)強(qiáng)降水的預(yù)報(bào)偏差,計(jì)算逐個(gè)格點(diǎn)的偏差(Bias)(江崟等,2019),當(dāng)偏差大于1 時(shí),表明模型虛警較多,值越大,虛警越嚴(yán)重;當(dāng)偏差小于1 時(shí),模型漏報(bào)較多。圖8 為上述模型與ECMWF-Fine 模式的檢驗(yàn)結(jié)果對(duì)比,可見,無(wú)論前汛期或后汛期,概率模型在全省大部分地區(qū)TS 評(píng)分均在0.25 以上,前汛期TS 評(píng)分高值(>0.30)區(qū)位于珠江三角洲及粵北地區(qū)(圖8a),最大TS 評(píng)分超過(guò)0.42;后汛期TS 評(píng)分高值(>0.30)區(qū)則位于南部沿海區(qū)域(圖8d),最大TS 評(píng)分超過(guò)0.41。而ECMWF-Fine 預(yù)報(bào)評(píng)分在前汛期較低,南部地區(qū)均在0.1 以下,后汛期有所增大,但最大不超過(guò)0.15(圖8b、e)。前、后汛期概率模型全場(chǎng)平均較ECMWF-Fine 分別提升0.23 與0.21,尤其對(duì)前汛期的廣東省南部沿海,以及后汛期廣東省西南部,模型TS 評(píng)分提升顯著。TS 評(píng)分提高的主要貢獻(xiàn)來(lái)源于漏報(bào)率的降低,在獲得高命中率的同時(shí),虛警率雖有一定程度增大,但與命中率之間有較好的平衡。從圖8c 可見,前汛期在TS 評(píng)分較高的珠江三角洲地區(qū),偏差整體為0.75—1.5,而粵東以及粵西的沿海地區(qū)則是虛警相對(duì)較多的區(qū)域(偏差>1.5);后汛期,除了在粵東的沿海地區(qū)偏差接近1 以外,其余地區(qū)出現(xiàn)一定程度的虛警,以粵北地區(qū)虛警相對(duì)更多(圖8f)。在天氣尺度強(qiáng)迫較弱的情況下,應(yīng)用概率模型有助于彌補(bǔ)數(shù)值模式漏報(bào)嚴(yán)重的缺陷,有效降低漏報(bào)率,并在短時(shí)強(qiáng)降水高頻地區(qū)獲得虛警率與命中率較好的平衡,但在部分地區(qū)會(huì)出現(xiàn)虛警增多的情況。
圖6 汛期短時(shí)強(qiáng)降水的因子相對(duì)偏離度空間分布與區(qū)域劃分(色階為各因子相對(duì)偏離度,Reg. A—C 分別對(duì)應(yīng)3 個(gè)獨(dú)立建模區(qū)域,a—f. 組合因子1—6)Fig. 6 Spatial distributions of factor relative deviation rate of SHR in flood season (Color shadings represent relative deviation rate of each factor, Reg. A—C represent three independent areas for model training, a—f. respectively indicate Factor 1—6)
實(shí)際業(yè)務(wù)應(yīng)用中,基于模型輸出的各因子概率對(duì)比可為預(yù)報(bào)難度更大的暖區(qū)強(qiáng)降水提供更多預(yù)警信息。目前主流的數(shù)值模式對(duì)于暖濕平流驅(qū)動(dòng)的局地對(duì)流性降水預(yù)報(bào)技巧較低(Huang,et al,2017),因此當(dāng)反映熱力條件增長(zhǎng)的因子概率較高時(shí),業(yè)務(wù)人員仍要密切關(guān)注短時(shí)強(qiáng)降水發(fā)生的可能性。
圖7 訓(xùn)練期分期、分區(qū)模型不同預(yù)測(cè)概率閾值與對(duì)應(yīng)TS 評(píng)分(a. 前汛期Reg. A, b. 前汛期Reg. B, c. 前汛期Reg. C, d. 后汛期Reg. A, e. 后汛期Reg. B, f. 后汛期Reg. C)Fig. 7 TS corresponding to different probability thresholds of the forecast model in different regions and periods during the training period (Results of Reg. A,Reg. B and Reg. C during pre-flood season are respectively shown in (a,b,c),and results of Reg. A,Reg. B and Reg. C during post-flood season are respectively shown in (d,e,f))
選擇2019 年2 次暖區(qū)降水個(gè)例(個(gè)例1 為2019 年5 月26 日,個(gè) 例2 為2019 年6 月13 日)進(jìn)行對(duì)比分析。個(gè)例期間華南地區(qū)低層(700 hPa 以下)均受西南或偏南氣流控制,無(wú)明顯溫度鋒區(qū)。圖9 分別為ECMWF-Fine 預(yù)報(bào)的6 h 累計(jì)降水、短時(shí)強(qiáng)降水實(shí)況及模型概率預(yù)報(bào)。兩個(gè)個(gè)例短時(shí)強(qiáng)降水分別集中發(fā)生于珠江三角洲和粵西沿海(圖9a、c 矩形),最大小時(shí)雨量均超過(guò)50 mm。ECMWFFine 顯著低估了兩個(gè)個(gè)例的雨量預(yù)報(bào),尤其對(duì)個(gè)例2,在強(qiáng)降水發(fā)生區(qū)的6 h 雨量預(yù)報(bào)<5 mm。而概率模型對(duì)于兩個(gè)個(gè)例的預(yù)報(bào)效果均較好,個(gè)例1 位于珠江三角洲及韶關(guān)、清遠(yuǎn)南部(圖9a)的短時(shí)強(qiáng)降水落區(qū)與模型高概率區(qū)(>0.7)(圖9b)一致,個(gè)例
2 預(yù)報(bào)的短時(shí)強(qiáng)降水概率在粵西南部(圖9d)雖低于個(gè)例1,空間分布較不均勻,但仍出現(xiàn)>0.6 的高概率中心。整體而言,兩個(gè)個(gè)例模型的高概率區(qū)對(duì)于短時(shí)強(qiáng)降水均有較好的指示作用。
表1 不同區(qū)域及時(shí)期模型固定預(yù)測(cè)概率閾值Table 1 The determined probabilistic thresholds of the forecast model in different regions and periods
圖8 前汛期 (a、b、c)、后汛期 (d、e、f) 短時(shí)強(qiáng)降水概率預(yù)報(bào)模型TS 評(píng)分 (a、d)、偏差 (c、f) 與ECMWF-Fine 模式降水預(yù)報(bào)TS 評(píng)分 (b、e)Fig. 8 TS scores of probabilistic model forecasts of SHR (a,d),TS scores of ECMWF-Fine model precipitation forecasts (b,e) and BIAS of SHR probabilistic model forecasts (c,f) during the pre-flood season (a,b,c) and the post-flood season (d,e,f)
圖9 2019 年5 月25 日23 時(shí)—26 日05 時(shí) (a、b)和6 月13 日11—18 時(shí) (c、d) 數(shù)值模式6 h 降水量預(yù)報(bào)(單位:mm)、短時(shí)強(qiáng)降水實(shí)況及模型概率預(yù)報(bào) (a、c 色階為ECMWF 細(xì)網(wǎng)格模式6 h 累計(jì)降水量預(yù)報(bào),散點(diǎn)為小時(shí)分級(jí)的短時(shí)強(qiáng)降水觀測(cè)站點(diǎn)分布,b、d 色階為短時(shí)強(qiáng)降水概率預(yù)報(bào)模型預(yù)報(bào)場(chǎng))Fig. 9 NWP precipitation forecasts (unit:mm),observations at weather sites and probabilistic model forecasts of SHR from 23:00 BT 25 May 2019 to 05:00 BT 26 May 2019 (a,b) and from 11:00 to 18:00 BT 13 June 2019 (c,d)(6 h cumulative precipitation forecast of ECMWF-Fine and the distribution of SHR graded by hourly precipitation at weather stations are respectively shown in (a,c), color shadings in (b,d) represent the SHR forecast by the probabilistic model)
兩個(gè)個(gè)例的主要驅(qū)動(dòng)因子不同,個(gè)例1 與沿海風(fēng)速輻合的動(dòng)力作用關(guān)系密切,個(gè)例2 則是在弱動(dòng)力強(qiáng)迫、強(qiáng)熱力不穩(wěn)定的環(huán)境下發(fā)生的,預(yù)報(bào)難度更大(Huang,et al,2017),對(duì)上游不穩(wěn)定能量具有更顯著的敏感性。圖10 給出了兩個(gè)個(gè)例組合因子1、組合因子3 的空間分布以及925 hPa 風(fēng)場(chǎng)、中低層垂直速度分布。個(gè)例1 降水區(qū)的組合因子3 概率(圖10c)高于組合因子1(圖10a),而個(gè)例2 降水區(qū)組合因子1 概率則更高(圖10b、d)。個(gè)例1 動(dòng)力條件更好的原因?yàn)槟虾1辈看嬖谖髂蠚饬髋c東南氣流的輻合區(qū),因此在珠江口西側(cè)具有大的垂直上升運(yùn)動(dòng)區(qū)(圖10e 箭頭),但個(gè)例2 動(dòng)力條件相對(duì)較弱,南海北部受西南氣流控制(圖10f),風(fēng)向與海岸線接近平行,因此粵西南部的垂直速度也較小。但對(duì)于熱力條件,則是個(gè)例1 顯著弱于個(gè)例2,兩個(gè)個(gè)例降水區(qū)的925 hPa 假相當(dāng)位溫分別為354 K 與362 K(圖10e、f 箭頭),后者高假相當(dāng)位溫主要來(lái)源于季風(fēng)氣流導(dǎo)致強(qiáng)烈的增暖、增濕。在熱力條件較好的背景下,個(gè)例2 出現(xiàn)了超50 mm/h 的短時(shí)強(qiáng)降水。而ECMWF-Fine 降水量預(yù)報(bào)以及組合因子3 概率對(duì)個(gè)例2 的降水預(yù)報(bào)值均顯著偏低,僅組合因子1(圖10b)給出了較高概率,提示了降水系統(tǒng)將在不穩(wěn)定區(qū)域內(nèi)發(fā)展的可能性。
在華南汛期季風(fēng)爆發(fā)后,暖濕平流增強(qiáng),熱力不穩(wěn)定性導(dǎo)致與個(gè)例2 類似的對(duì)流性降水增多,這一類強(qiáng)降水通常難以被業(yè)務(wù)模式的降水預(yù)報(bào)很好反映。而通過(guò)因子分析模型,預(yù)報(bào)員可進(jìn)一步結(jié)合低空環(huán)流形勢(shì)對(duì)不同地區(qū)的熱力條件進(jìn)行分析,有助于提升對(duì)暖區(qū)對(duì)流性降水事件預(yù)報(bào)的命中率。
利用2009—2018 年汛期(4—9 月)廣東省地面氣象觀測(cè)站數(shù)據(jù)建立短時(shí)強(qiáng)降水?dāng)?shù)據(jù)集,采用ERA-Interim 再分析資料計(jì)算數(shù)十個(gè)物理量與多年平均態(tài)的偏差值。在計(jì)算物理量參數(shù)及扣除多年平均態(tài)的基礎(chǔ)上,提出了遴選物理量的指標(biāo)AROC和分期、分區(qū)域建立因子分析模型方法,在業(yè)務(wù)應(yīng)用中提升預(yù)報(bào)命中率的同時(shí)控制虛警率上升,為預(yù)報(bào)難度大的暖區(qū)短時(shí)強(qiáng)降水提供更多參考信息。
不同月份的因子偏離度具有明顯差異:前汛期各因子偏離度隨月份增長(zhǎng)而不斷下降,但各因子偏離度差異較?。缓笱雌谂c熱力條件有關(guān)的因子偏離度差異較大,其相對(duì)重要性與前汛期相比也明顯降低;各因子在不同區(qū)域的相對(duì)重要性也有差異,多數(shù)因子具有明顯的南、北反向特征。根據(jù)因子偏離度的時(shí)、空分布,劃分前、后汛期以及3 個(gè)空間區(qū)域,構(gòu)建6 個(gè)因子模型。將各因子貢獻(xiàn)率作為6 個(gè)因子概率的權(quán)重,采用加權(quán)組合方法構(gòu)建分期、分區(qū)的短時(shí)強(qiáng)降水概率預(yù)報(bào)模型,其預(yù)測(cè)效果較未分區(qū)前有明顯改善。
以訓(xùn)練期間最優(yōu)TS 評(píng)分的概率閾值作為短時(shí)強(qiáng)降水預(yù)報(bào)閾值,在測(cè)試期對(duì)短時(shí)強(qiáng)降水概率預(yù)報(bào)模型進(jìn)行TS 評(píng)分檢驗(yàn),前、后汛期廣東省大部分區(qū)域TS 評(píng) 分 在0.25 以 上, 最 高 達(dá)0.42, 相 對(duì) 于ECMWF-Fine 全場(chǎng)平均在前、后汛期分別提升0.23與0.21,南部沿海TS 評(píng)分提升幅度最大。模型在獲得高命中率的同時(shí),虛警率與命中率取得較好的平衡,短時(shí)強(qiáng)降水高頻地區(qū)偏差接近1,驗(yàn)證了模型業(yè)務(wù)應(yīng)用的有效性。選擇2019 年2 次ECMWFFine 模式漏報(bào)的暖區(qū)強(qiáng)降水個(gè)例,概率模型對(duì)于兩個(gè)個(gè)例的強(qiáng)降水均做出高概率預(yù)報(bào);對(duì)于動(dòng)力強(qiáng)迫較弱,但不穩(wěn)定條件好的對(duì)流性強(qiáng)降水,確定性模式容易漏報(bào),而通過(guò)分析各個(gè)因子,可知表征不穩(wěn)定的組合因子1 概率較高,為業(yè)務(wù)中預(yù)報(bào)難度較大的暖區(qū)強(qiáng)降水提供早期預(yù)警信號(hào)。
模型中輸入因子與輸出概率具有明確的映射關(guān)系,能清晰反映短時(shí)強(qiáng)降水發(fā)生、發(fā)展的環(huán)境條件。但模型的輸入因子多,并且輸入因子與短時(shí)強(qiáng)降水發(fā)生概率存在非線性關(guān)系,因此從模型優(yōu)化角度而言,可引進(jìn)機(jī)器學(xué)習(xí)算法,以應(yīng)對(duì)具有復(fù)雜輸入、輸出因子關(guān)聯(lián)特征的預(yù)報(bào)建模問題。將各建模因子作為輸入量,針對(duì)華南區(qū)域進(jìn)行機(jī)器學(xué)習(xí)訓(xùn)練以獲得更優(yōu)的預(yù)測(cè)效果,加強(qiáng)氣象領(lǐng)域的人工智能技術(shù)專業(yè)性,將是未來(lái)的發(fā)展方向。
致 謝:感謝孫繼松研究員和王秀明教授的指導(dǎo)。