周志君, 周秋雪
(1.綿陽市氣象局,四川綿陽621000;2.成都信息工程學院,四川成都610225)
能夠反映氣候?qū)嶋H變化的均一性氣候序列是進行氣候預測以及氣候變化預估的基礎。理論上,歷史氣候要素序列應該是不包括人為干擾因素的能夠真實反映當?shù)靥鞖夂蜌夂蜃兓畔⒌臄?shù)據(jù)。但在氣候序列形成過程中,站址遷移、儀器變更、儀器故障、新的平均計算公式、觀測時次變化以及觀測者的操作誤差等人為因素,導致了氣候序列產(chǎn)生突然不連續(xù)(即斷點),站址環(huán)境的漸變也可能產(chǎn)生漸變的非均一性。
氣候資料的非均一性,直接影響到氣候分析研究結論的代表性和準確性。氣候資料的均一性檢驗和訂正對于提高氣候資料的質(zhì)量和均一性狀況具有實用意義和價值。早在20世紀80年代中期,國外許多研究者就開始在氣候資料均一性檢驗和訂正方面開展了大量的探索性研究工作,并已經(jīng)取得了一定的進展[1-9]。近年來中國不少研究者也開始注重這方面的工作,分別對中國的地面及探空資料進行了均一性檢驗與訂正研究[10-17]。
在前人大量工作的基礎上,利用SNHT方法對綿陽氣象站點年平均氣溫序列做均一性檢驗和資料訂正工作。旨在對四川氣候資料均一性研究提供依據(jù)。
綿陽及周圍共14個站點1961~2010年月平均氣溫的觀測資料。14個站點名稱及其相應的臺站號分別為:綿陽(56196),安縣(56190),平武(56193),江油(56195),梓潼(57304),三臺(57307),鹽亭(57308),綿竹(56186),彭州(56189),什邡(56197),德陽(56198),中江(56199),廣漢(56291),資陽(56298)。
1.2.1 氣溫序列的正態(tài)性檢驗
常用的正態(tài)檢驗方法有Shapiro-Wilk檢驗,Mudholkar檢驗,Kolmogorov-Smirnov檢驗,X2檢驗,Anderson-Darling檢驗,Epps-Pulley檢驗,偏度和峰度檢驗等。其中許多方法均要求樣本大小n要充分大(n≥50),即只適用于大樣本,而且計算工作量較大,普及范圍較差。但是Mudholkar檢驗、Shapiro-Wilk檢驗和偏度和峰度檢驗就沒有大樣本的要求。其中Mudholkar檢驗的特點是簡便、靈敏,僅需要10個以上的數(shù)據(jù)便可。Shapiro-Wilk檢驗需要的樣本數(shù)只要8≤n≤50就適用,因為小樣本(n<8)對偏離正態(tài)分布的檢驗不太有效。Shapiro-Wilk檢驗是目前被公認的比較好的正態(tài)檢驗方法。偏度和峰度檢驗適用于樣本容量1<n<5000的場合。
而對氣象要素序列進行均一性檢驗,最關鍵的就是要求被檢驗序列要服從正態(tài)分布。文中采用的正態(tài)性檢驗方法為Shapiro-Wilk檢驗。
該檢驗由Shapiro和Wilk在1965年和1968年提出,用于檢驗一個隨機樣本是否取自正態(tài)分布。檢驗方法及步驟:
(1)將每個站點50年的年平均溫度值按從小到大排列 x1≤x2≤x3≤…≤xn,如果有一些值相等,則按順序重復列出。
(2)計算 S=∑ak[x(n+1-k)-x(k)],當 n為偶數(shù)時,k=n/2;當 n為奇數(shù)時,k=(n-1)/2。ak在樣本容量為n是有固定值,查表可得。
(4)選定檢驗水平α,按n和α查w分布表(表1)。當w>w(n,α)時,認為站點的年氣溫序列是服從正態(tài)分布。
表1 Shapiro-Wilk檢驗統(tǒng)計量分位數(shù)P=0.01和P=0.05分布表
1.2.2 氣溫序列的非均一性檢驗
常用的非均一性檢驗方法有:距平累加法,連續(xù)t檢驗法,回歸檢驗法,標準正態(tài)法(SNHT)等等。其中SNHT不依賴元數(shù)據(jù),它對于幅度較小的不連續(xù)點的檢測較為敏感,并且所檢驗的序列可以是不同的氣候要素,諸多優(yōu)點使SNHT檢驗被眾多學者爭相采用。采用該方法對綿陽站點年均氣溫序列進行均一性檢驗。方法及步驟會在第三部分加以說明。
對某一個測站資料進行均一化檢驗,必須先了解氣候資料包含了哪些非均一性的因素。一般有3種[20]:序列本身存在時間非均一性,大尺度的影響(常常是由于大氣環(huán)流所造成的突變現(xiàn)象),局地環(huán)境產(chǎn)生的影響。實際上,一個地區(qū)內(nèi)的若干測站,由于受大氣環(huán)流控制,應該有共同的氣候變化特征。但是對于某個測站由于局地環(huán)境變化給資料帶來的影響,只能通過與相鄰測站的資料進行比較及診斷。這種比較可以使用與鄰站的比值序列或差值序列進行診斷[10]。為了排除選用單個站點產(chǎn)生的隨機性影響,參照前人的研究方法,選用綿陽周圍的多個站點作為參考站點。
圖1 綿陽及周圍測站海拔高度等值線圖
表2 綿陽站及其相鄰站點的位置和建站時間
圖1顯示的綿陽及周圍共14個站點的分布圖,從圖中可以很直觀的看到周圍站點與綿陽站點的遠近程度和高度差異。表2具體列出了14個站點的經(jīng)緯度,海拔高度,建站時間等信息。從中篩選出距離綿陽15km以內(nèi),海拔高度差在100m以內(nèi),并且在該時段內(nèi)數(shù)據(jù)完善的8個站點,并對這8個站點的年平均溫度序列用Shapiro-Wilk方法進行正態(tài)性檢驗。結果如表3所示。
氣候序列均一性檢驗的基礎和關鍵是建立待檢序列的參考序列和檢驗序列,通過待檢序列和參考序列的對比來判斷序列的均一性。參考序列首先必須是均一的,才可以代表待檢序列真實的氣候序列變化,但這種理想狀況是不可能達到的。因此先用兩種常用的突變檢驗法(滑動t檢驗和山本檢驗),對8個站點的氣溫序列進行檢驗,排除掉兩種方法共同檢測出相同突變點的站點。結果如表3所示。
表3 篩選站點的正態(tài)性檢驗結果
查表1,w(50,0.05)的值為0.947。從表3中可以看到,在該顯著性水平下只有廣漢站點的氣溫序列不符合要求?;瑒?t檢驗和山本法共同檢測出江油有3個突變點,因此該站點也排除。在剩下的站點中再選取相關系數(shù)最高的四個站點作為參考站點,即綿竹、德陽、中江、廣漢。
參照文獻[21]的方法構建被檢驗序列z。被檢驗站(綿陽)氣溫序列x為f(xi),參照站點的函數(shù)g(yi)是用4個參照站點氣溫序列加權平均求取的。即
(1)式中rj為被檢測站與第j個參照站之間的相關系數(shù),k為參照站的站數(shù),yij為第j個站點第i年的年均氣溫值,為被檢測站點50年的年均氣溫均值為第j個站點50年的年均氣溫均值。求 f(xi)與g(yi)的差值序列再對差值序列進行標準化處理其中為差值序列的標準差。即為被檢驗序列。
為了更加有效的檢測出盡可能多的斷點,參考文獻[21],同樣采用半級分段法。比如在[1,n]之間第一次檢測出了一個超過信度的 T0max,斷點在a處。再把序列分為兩個子段:[1,a]和[a+1,n],分別對這兩個子段進行均一性檢驗。若某一個字段內(nèi)再出現(xiàn)斷點,就繼續(xù)再分再檢驗,直到?jīng)]有新的斷點出現(xiàn)。
圖2 T0max顯著性水平臨界值
圖3為采用半級分段法后檢測出來的各段 T0值曲線圖。綿陽站在這母段里面檢測出來的 T0max=11.75,遠超過了該序列長度95%信度檢驗的閾值,出現(xiàn)斷點的序列號為 32,對應的年份為 1992年。然后再對和這兩個子段進行SNHT檢驗,第一個子段的斷點的年份是1962年,T0max=12.18,同樣超過了該序列長度95%信度檢驗的閾值。第二個子段的斷點年份是2002年,T0max=6.32,超過了該序列長度90%信度檢驗的閾值。繼續(xù)再分后,只有這個子段檢測出了斷點,對應的年份為1975年,T0max=6.75,超過了該序列長度90%信度檢驗的閾值。即在1961~2010這50年間,綿陽的氣溫序列一共產(chǎn)生了四個斷點,對應的年份分別是:1962,1975,1992,2002。其中1992年和1962年這兩個斷點達到了95%的信度檢驗,1975和2002年達到了90%的信度檢驗。根據(jù)間斷點位置查閱綿陽站的歷史沿革發(fā)現(xiàn),1963年1月綿陽站有遷站記錄。新站地址為綿陽市普明公社,經(jīng)度為 104°40′E,緯度為31°28′N,海拔高度為470.8米。與原址綿陽縣北門外沿江村(104°46′E,31°29′N)的海拔高度差約20.8米。2003年1月綿陽站再次遷站,新站地址為綿陽市涪城區(qū)石塘鎮(zhèn)瓦店村八社(104°44′E、31°27′N),海拔高度為 522.7米,距上一個站址的海拔高度差約51.9米。此次遷站前后,觀測場拔海高度變化相對較大,且觀測場周圍環(huán)境也發(fā)生了較大變化。以前測站是面靠公路,周圍房屋較多。新搬遷的地址位于城郊坡上,周圍鮮有樓房,視野開闊。固認為該兩次遷站是致使氣溫序列數(shù)據(jù)不均一的主要原因之一,這是一種較為典型的臺站遷移導致某個月平均氣溫序列發(fā)生變化的例子。1975年斷點產(chǎn)生的原因可能是其附近年份的觀測時次發(fā)生了變化。綿陽站歷史沿革資料顯示,1978年以前是采用02、08、14、20時4次實測數(shù)據(jù)計算的平均值,1978年以后改成了每日5次定時觀測。不過1992年前后既沒有發(fā)生臺站遷移,也沒有儀器的變更和計算方法的改變,故認為該斷點的產(chǎn)生并不是人為因素造成的。接下來對該斷點產(chǎn)生的原因做如下分析。
圖3 被檢測序列 z的分段T0值曲線圖
圖4為綿陽站1961~2010年氣溫距平的時間序列圖,從圖中可以看到該地區(qū)的氣溫在近50年來是顯著增加的,其氣候趨勢系數(shù)[22-24]通過了99%的信度檢驗。增溫速率達到了0.2℃/10a,高于整個四川盆地的平均增溫速率[25]。從趨勢線(經(jīng)過9年滑動平均)來看,20世紀90年代初期以前,趨勢線均位于零線以下,氣溫偏低。20世紀80年代中期開始持續(xù)增溫,與整個中國地區(qū)顯著增溫發(fā)生的時間段一致[26]。但是,從圖中可以明顯看到,1992年的年平均氣溫值是這個增溫的過程中的極低點,說明1992年氣溫的異常偏低是使該年份成為顯著斷點的原因之一。
圖4 綿陽年平均氣溫距平序列(粗實線為9年滑動平均)
圖5 1989~1995年逐月平均氣溫
圖5為1989年~1995年逐月的月平均氣溫圖。從圖中可以看到6月份的平均氣溫顯著偏低,其次是1、2、3月。參照表4中的數(shù)據(jù)可知,1992年綿陽氣溫異常偏低主要是由于1、2、3、6月氣溫偏低所致。這也是造成1992年為氣溫序列斷點的主要原因之一。
表4 1992年月平均氣溫以及與1991、1993年的氣溫差值(℃)
經(jīng)過檢測發(fā)現(xiàn),綿陽站 1961~2010間年均氣溫序列一共產(chǎn)生了 4個斷點,即 1962、1975、1992、2002年。其中1962年和2002年這2個斷點均是因為綿陽站遷站造成的,再次證明臺站的遷移對氣溫資料均一性的影響較大。1975年斷點產(chǎn)生的原因可能是其附近年份的觀測時次發(fā)生了變化,由4次定點觀測改為了5次定點觀測。1992年斷點產(chǎn)生原因是由于該年1、2、3、6月份氣溫異常偏低所致。至于影響氣溫異常偏低的物理機制還需要進一步研究分析。
雖然文中只檢驗出綿陽氣溫序列的間斷點,這只是數(shù)據(jù)均一化工作最基礎的部分。因此下一步的工作重點是將這些變點后的數(shù)據(jù)給予訂正,給出均一化的數(shù)據(jù),為氣候與氣候變化研究提供可靠的數(shù)據(jù)來源。
[1]Alexandersson H.A homogeneity test applied to precipitation data[J].International Journal of Climatology,1986,6:661-675.
[2]Groisman P Y,Koknaeva V V,Belokrylova T A,et al.Overcoming biases of precipitation measurement:A history of the USSR experience[J].Bull.Amer.Mereor.Soc.,1991,72:1725-1733.
[4]Easterling D R,Peterson T C.A new method for detecting and adjusting for undocumented discontinuities in climatological time series[J].International Journal of Climatology,1995,15:369-377.
[5]Vincent L A.A technique for the identification of inhomogeneities inCanadian temperature series[J].Journal of Climate,1998,11:1094-1104.
[6]Li Q X,Liu X N,Zhang H Z,et al.Detecting and adjusting on temporalinhomogeneity in Chinese mean surface air temperature dataset[J].Advances in Atmospheric Sciences,2004,21(2):260-268.
[7]Yan Z W,Jones P D.Detecting inhomogeneity in daily climate seriesusing wavelet analysis[J].Advances in Atmospheric Sciences,2008,25(2):157-163.
[8]Li Z,Yan Z W.Homogenized daily mean/maximum/minimumtemperature series for China from 1960-2008[J].Atmospheric andOceanic Science Letters,2009,2:236-242.
[9]Li Q X,Dong W J.Detection and adjustment of undocumenteddiscontinuitiesin Chinese temperature seriesusing a composite approach[J].Advances in Atmospheric Sciences,2009,26(1):143-153.
[10]李慶祥,劉小寧,張洪政,等.定點觀測氣候序列均一性研究[J].氣象科技,2003,31(1):2-11.
[11]吳增祥.氣象臺站歷史沿革信息及其對觀測資料序列均一性影響的初步分析[J].應用氣象學報,2005,16(4):461-467.
[12]崔宜少,李建華,叢美環(huán),等.威海氣象站年平均氣溫等氣象要素資料的非均一性檢驗[J].應用氣象學報,2006,17(4):511-513.
[13]高鳳姣,李長軍.山東省45年年平均氣溫均一性檢驗[J].氣象科技,2007,35(5):744-749.
[14]吳利紅,康麗莉,陳海燕,等.地面氣象站環(huán)境變化對氣溫序列均一性影響[J].氣象科技,2007,35(1):154-158.
[15]高曉容,李慶祥,董文杰.五臺山站歷史氣候資料的均一性分析[J].氣象科技,2008,36(1):112-118.
[16]江志紅,黃群,李慶祥.近50年中國降水序列均一性檢驗與訂正研究[J].氣候與環(huán)境研究,2008,13(1):67-73.
[17]郭艷君,李慶祥,丁一匯.探空資料中的人為誤差對中國溫度長期變化趨勢的影響[J].大氣科學,2009,33(6):1309-1318
[18]李慶祥,張洪政,劉小寧,等.中國均一化歷史氣溫數(shù)據(jù)集(1951-2004)(1.0版)[R].北京:國家氣象信息中心氣象資料室,2006.
[19]曹麗娟,嚴中偉.地面氣候資料均一性研究進展[J].氣候變化研究進展,2011,7(2):129-135.
[20]黃嘉佑,李慶祥.一種診斷序列非均一性的新方法[J].高原氣象,2007,26(1):62-66.
[21]韓海濤,胡文超,劉積林,等.蘭州站氣候資料序列均一性的初步分析[J].干旱氣象,2008,26(3):34-38.
[22]施能,陳家其,屠其璞.中國近100年四個年代際的氣候變化特征[J].氣象學報,1995,53(4):531-539.
[23]施能.北半球冬季大氣環(huán)流遙相關的長期變化及其與我國氣候變化的關系[J].氣象學報,1996,54(6):675-683.
[24]施能,黃先香,楊揚.1948-2000年全球陸地年降水量場趨勢變化的時、空特征[J].大氣科學,2003,27(6):971-982.
[25]陳權亮,任景軒,晁華,等.20世紀50年代以來我國氣溫的區(qū)域變化[J].安徽農(nóng)業(yè)科學,2010,38(7):3571-3574.
[26]左洪超,呂世華,胡隱樵.中國近50年氣溫及降水量的變化趨勢分析[J].高原氣象,2004,23(2):238-244.