溫華洋,陳鳳嬌,邱康俊,朱華亮
1.安徽省氣象信息中心,合肥 230031
2.南京氣象科技創(chuàng)新研究院,南京 210019
安徽省位于東亞季風(fēng)區(qū),同時(shí)因皖南及皖西山區(qū)地形地質(zhì)條件復(fù)雜,局地強(qiáng)降水容易引發(fā)泥石流、山體滑坡等地質(zhì)災(zāi)害[1-6]。獲取高精度、高時(shí)空分辨率且長(zhǎng)時(shí)間連續(xù)的降水觀測(cè)資料是我們?nèi)嬲J(rèn)知不同氣候區(qū)內(nèi)降水變化趨勢(shì)的重要手段。而目前常規(guī)氣象觀測(cè)雨量站進(jìn)行單點(diǎn)觀測(cè),站點(diǎn)布設(shè)具有空間不均勻性,使得高空間分辨率的降水資料匱乏,無(wú)法滿足氣象服務(wù)的需要。因此,迫切需要我們研制高精度且高空間分辨率的精細(xì)化的降水資料。常規(guī)空間插值算法包括多元回歸法、反距離權(quán)重法(Inverse Distance Weight,簡(jiǎn)稱IDW)、Kringing插值和薄盤(pán)光滑樣條函數(shù)法(Thin Plate Smoothing Spline,簡(jiǎn)稱TPS)[7]。近年來(lái),學(xué)者們研究發(fā)現(xiàn),TPS插值算法在對(duì)不同時(shí)間尺度、不同區(qū)域的氣候數(shù)據(jù)插值的精度較高,在氣象數(shù)據(jù)科學(xué)領(lǐng)域具有較高的應(yīng)用價(jià)值,但由于不同氣象要素、不同區(qū)域的TPS插值算法的最優(yōu)模型略有差異,往往需要提前進(jìn)行模型優(yōu)選已生成高精度的氣象數(shù)據(jù)產(chǎn)品。[8-13]。因此,本研究基于2008-2018年安徽省及周邊省氣象站觀測(cè)的小時(shí)降水資料、以及地理信息資料,利用薄盤(pán)樣條插值算法,經(jīng)過(guò)模型優(yōu)選、精度評(píng)估,研制了安徽省11年的1 km分辨率的小時(shí)降水網(wǎng)格產(chǎn)品。
本研究使用源數(shù)據(jù)來(lái)自安徽省氣象信息中心。數(shù)據(jù)包括空間范圍在 29°23′24′′-34°39′N,114°52′12′′-119°38′24′′E 內(nèi)的氣象觀測(cè)站小時(shí)降水觀測(cè)數(shù)據(jù)和對(duì)應(yīng)站點(diǎn)地理信息。該區(qū)域主要包括安徽省境內(nèi)為主的2400多個(gè)區(qū)域氣象站和81個(gè)國(guó)家氣象站。由于使用薄盤(pán)樣條插值算法插值時(shí),需考慮到地理高程信息,還使用了相應(yīng)區(qū)域的5 km分辨率的地理高程信息。
基于薄盤(pán)樣條插值算法的安徽省1 km分辨率的小時(shí)降水柵格產(chǎn)品的實(shí)現(xiàn)主要包括數(shù)據(jù)獲取、轉(zhuǎn)換、預(yù)處理、插值算法調(diào)用、最優(yōu)模型篩選及評(píng)估、長(zhǎng)序列數(shù)據(jù)產(chǎn)品研制等步驟。技術(shù)路線如圖1所示,具體如下:
圖1 安徽省1 km分辨率降水產(chǎn)品研制技術(shù)流程Figure 1 Data processing flow of the gridded hourly precipitation at 1-km resolution over Anhui Province
(1)數(shù)據(jù)源。基于全國(guó)綜合氣象信息共享平臺(tái)(China Integrated Meteorological Information Service System, 簡(jiǎn)稱CIMISS)獲取小時(shí)降水資料,剔除其中標(biāo)注為錯(cuò)誤、可疑類型的數(shù)據(jù),形成規(guī)定格式的數(shù)據(jù)文件。
(2)數(shù)據(jù)預(yù)處理。配置多個(gè)模型參數(shù)文件、高程基礎(chǔ)信息數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)文件,為插值算法做準(zhǔn)備。
(3)插值算法。本數(shù)據(jù)集使用的插值算法為薄盤(pán)樣條插值算法[10,14]。
(4)最優(yōu)模型篩選。薄盤(pán)樣條插值算法中高程參數(shù)設(shè)置為1000,節(jié)點(diǎn)數(shù)目設(shè)置為1/3。再將獨(dú)立變量(可選參數(shù)2或3)、協(xié)變量(可選參數(shù)1或0)和樣條次數(shù)(可選參數(shù)2或3或4),這三個(gè)參數(shù)的多種排列組合,設(shè)置為多個(gè)模型。利用氣象觀測(cè)站觀測(cè)資料開(kāi)展模型試驗(yàn),用交叉檢驗(yàn)和獨(dú)立樣本檢驗(yàn)等方法,通過(guò)偏差、均方根誤差、相關(guān)系數(shù)、平均誤差等方法比較評(píng)估各模型參數(shù)的精度。最終,篩選出當(dāng)獨(dú)立變量參數(shù)為2,協(xié)變量為1,樣條次數(shù)為4時(shí),高分辨率降水產(chǎn)品的精度最高,將該參數(shù)設(shè)置的模型定義為最優(yōu)模型。
(5)數(shù)據(jù)產(chǎn)品研制。利用最優(yōu)模型、實(shí)時(shí)數(shù)據(jù)文件、高程文件,采用薄盤(pán)樣條插值算法生成格點(diǎn)化降水?dāng)?shù)據(jù)產(chǎn)品。
數(shù)據(jù)集為基于薄盤(pán)樣條插值的安徽省1km分辨率的小時(shí)降水柵格數(shù)據(jù)。時(shí)間段為2008年1月至 2018年 12月,共 132個(gè)月。數(shù)據(jù)集壓縮后文件共計(jì) 5.8 GB。文件命名方式為:Model02_Z_SURF_MUL_AHFC_YYYYMMDDHHmmss_PRE_HOR_GRD.grd。文件名含義見(jiàn)表1。
表1 文件名含義Table 1 The meaning of the variables in the file name
數(shù)據(jù)文件的內(nèi)容由文件頭和數(shù)據(jù)項(xiàng)組成。圖2為grd文件的示例。其中,第1-6行為頭文件,分別代表列、行、起始經(jīng)度、起始緯度、空間分辨率和數(shù)據(jù)缺省值,如表2。從第七行開(kāi)始為數(shù)據(jù)項(xiàng),代表小時(shí)降水量,單位為毫米每小時(shí)。值得說(shuō)明的是,數(shù)據(jù)塊每隔48行,代表一個(gè)緯度帶。數(shù)據(jù)塊一共10列,代表隨著起始經(jīng)度開(kāi)始,以0.01度為間隔增加(見(jiàn)表3)。圖3給出了2018年6月的1次降水過(guò)程的降水強(qiáng)度空間分布圖。
圖2 安徽省1 km分辨率格式降水產(chǎn)品數(shù)據(jù)樣例Figure 2 A case of the gridded hourly precipitation dataset at 1 km resolution
表2 文件頭文件格式說(shuō)明Table 2 The illustration of the format of the head in the dataset
表3 數(shù)據(jù)段格式說(shuō)明Table 3 The illustration of the format of the data segment in the dataset
圖3 2018年6月8日16點(diǎn)安徽省1 km分辨率的小時(shí)降水產(chǎn)品空間分布圖Figure 3 The spatial pattern of the gridded hourly precipitation at 1 km resolution over Anhui Province at 16:00 on June 8th, 2018
氣象觀測(cè)數(shù)據(jù)采集、傳輸、質(zhì)控、歸檔由省級(jí)氣象信息中心負(fù)責(zé),嚴(yán)格遵循氣象觀測(cè)質(zhì)量管理體系的要求。質(zhì)量控制步驟包括:數(shù)據(jù)采集后通過(guò)通信系統(tǒng)傳輸,由氣象資料業(yè)務(wù)系統(tǒng)(Meteorological Data Operational System,簡(jiǎn)稱MDOS)進(jìn)行實(shí)時(shí)質(zhì)量控制,主要包括降水天氣現(xiàn)象觀測(cè)與“雨量值”是否匹配、小時(shí)雨量和分鐘合計(jì)雨量是否匹配檢查,再由 CIMISS提供實(shí)時(shí)數(shù)據(jù)服務(wù);次月形成歸檔數(shù)據(jù)文件,再次進(jìn)行人機(jī)交互軟件質(zhì)量控制(如地面自動(dòng)站觀測(cè)資料三級(jí)質(zhì)量控制軟件,Climate data quality control,簡(jiǎn)稱CDQC),主要進(jìn)行“降水閾值檢查”。利用質(zhì)量控制后的數(shù)據(jù)更新CIMISS的數(shù)據(jù),供氣候變化、預(yù)報(bào)檢驗(yàn)等業(yè)務(wù)科研使用,并用于歸檔。本研究采用歸檔數(shù)據(jù)中質(zhì)控標(biāo)識(shí)位正確的數(shù)據(jù)。整體質(zhì)控過(guò)程嚴(yán)格,數(shù)據(jù)可靠性高。
對(duì)插值后生成的數(shù)據(jù)產(chǎn)品同樣進(jìn)行了質(zhì)量控制,剔除了其中異常數(shù)據(jù),使用的質(zhì)量控制方法主要是界限值檢查法(為基于安徽區(qū)域降水氣候極值范圍)。
逐小時(shí)的氣象觀測(cè)資料作為實(shí)況,按照臨近站法,逐小時(shí)1 km格點(diǎn)化產(chǎn)品結(jié)果與氣象觀測(cè)站觀測(cè)值進(jìn)行統(tǒng)計(jì)比較,引入偏差(Bias,記為BIAS)、均方根誤差(Root Mean Square Error, 簡(jiǎn)稱RMSE)和相關(guān)系數(shù)(Correlation coefficient, 簡(jiǎn)稱COR)等統(tǒng)計(jì)指標(biāo)進(jìn)行精度評(píng)估。相關(guān)計(jì)算公式如下:
偏差(BIAS):
均方根誤差(RMSE):
相關(guān)系數(shù)(COR):
其中,Oi為站點(diǎn)觀測(cè)值,站點(diǎn)觀測(cè)值總樣本的平均值,Gi為實(shí)況分析產(chǎn)品插值到檢驗(yàn)站點(diǎn)得到的數(shù)值,實(shí)況分析產(chǎn)品總樣本的平均值,N為參與檢驗(yàn)的總樣本數(shù)(站次數(shù))。
視觀測(cè)值為“真值”,對(duì)網(wǎng)格產(chǎn)品進(jìn)行評(píng)估,針對(duì)2016年的安徽省高分辨率的1km小時(shí)降水?dāng)?shù)據(jù)的評(píng)估結(jié)果表明:數(shù)據(jù)集和觀測(cè)值之間數(shù)據(jù)整體偏差為1.05,均方根誤差為0.67 mm/h,相關(guān)系數(shù)為0.80??傮w偏差較小,且偏差相對(duì)穩(wěn)定,兩者相關(guān)系數(shù)高,總體準(zhǔn)確性較高。針對(duì)2016年汛期網(wǎng)格產(chǎn)品的精度評(píng)估可參考文獻(xiàn)[15]。
降水是全球水循環(huán)的重要一環(huán),對(duì)安徽省降水的精細(xì)化監(jiān)測(cè)和預(yù)報(bào)一直是人民生產(chǎn)生活的關(guān)鍵所在。本研究提供的數(shù)據(jù)集具有時(shí)空分辨率高、精度高、序列長(zhǎng)等特點(diǎn),安徽省1km分辨率的小時(shí)降水產(chǎn)品可有效地反映地面降水實(shí)況,同時(shí)長(zhǎng)時(shí)間序列的柵格產(chǎn)品未來(lái)可廣泛應(yīng)用于氣候變化、災(zāi)害風(fēng)險(xiǎn)評(píng)估、數(shù)值預(yù)報(bào)精度評(píng)估等領(lǐng)域。未來(lái)可進(jìn)一步利用傳統(tǒng)質(zhì)控算法或人工智能方法對(duì)高分辨率降水產(chǎn)品進(jìn)行數(shù)據(jù)質(zhì)控,進(jìn)一步提高數(shù)據(jù)產(chǎn)品精度。