Wilcoxon秩和檢驗在熱帶氣旋強度預報方法評定中的應用

2014-08-13 07:33周聰余暉傅剛

大氣科學學報 2014年3期

周聰，余暉，傅剛

(1．中國海洋大學海洋環(huán)境學院，山東青島266100;2．中國氣象局上海臺風研究所，上海200030)

0 引言

熱帶氣旋(tropical cyclone，簡稱TC)強度變化的研究和預報歷來受到重視(于潤玲等，2013)。目前國內(nèi)外常見的熱帶氣旋強度預報方法主要有數(shù)值預報方法和統(tǒng)計預報方法。研究表明，數(shù)值預報對TC路徑預報效果較好，而統(tǒng)計預報對TC強度預報的優(yōu)勢較明顯(湯杰等，2011)。在對TC強度業(yè)務預報的精度進行評定時，一般考慮TC強度的平均絕對誤差、預報趨勢一致率、均方根誤差、箱線圖和技巧水平等指標(占瑞芬等，2010;湯杰等，2011)。

在TC強度的業(yè)務預報上，除了關(guān)注上述指標外，往往還需要知道TC強度預報的顯著性檢驗結(jié)果。從統(tǒng)計的角度看，由于對TC強度預報精度評定時所考慮的樣本總體分布是非正態(tài)分布，所以在顯著性檢驗時不能直接利用常規(guī)的t、F等參數(shù)檢驗方法，而應先對樣本采取正態(tài)化轉(zhuǎn)換，或者使用簡單有效的非參數(shù)檢驗法。事實上，氣象統(tǒng)計樣本總體分布往往是非正態(tài)分布，或僅滿足局部正態(tài)分布(Gunn and Marshall，1958;White，1980;Ulbrich，1983;Birmili et al．，2001)，因此研究非參數(shù)檢驗法在氣象上的應用具有十分重要的科學意義和實用價值。氣象上常見的非參數(shù)檢驗方法是蒙特卡羅檢驗，在使用蒙特卡羅檢驗時，為使其統(tǒng)計檢驗有較高的模擬精度，樣本量N需要很大(超過十萬甚至上百萬)。本文將介紹一種不依賴樣本總體分布，且不需要滿足大樣本條件的非參數(shù)Wilcoxon檢驗法。

目前中國TC強度的業(yè)務客觀預報方法(中國氣象局，2012)有4個:氣候持續(xù)法模型(余暉等，2006)、統(tǒng)計預報模型(Chen et al．，2011)、遺傳神經(jīng)網(wǎng)絡模型(姚才等，2007)、偏最小二乘模型(宋金杰等，2011)。為便于討論，本文選擇兩種TC強度業(yè)務預報方法進行比較，即:氣候持續(xù)模型(Climatology and Persistence Scheme，簡稱CLIPER)和偏最小二乘法(Partial Least Squares Scheme，簡稱 PLS)。CLIPER于2005年正式投入業(yè)務使用，PLS于2010年投入準業(yè)務使用。

1 熱帶氣旋強度誤差分布

將某一時次的TC強度誤差(Error，簡稱E)定義為

式中:i指第 i個時次樣本，i=1，2，…，n;n指預報時次總數(shù);I代表臺風強度(以TC近中心最大風速表征);f、r分別代表強度預報模型和實際情形。

計算2005—2012年6月12 h預報時刻 CLIPER模型的預報誤差，記為Ei。

將 Ei(i=1，2，…，n)標準化，記為，繪制頻率分布，如圖1所示，其中x軸表示E(1)i值，y軸表示對應值出現(xiàn)的頻數(shù)。與標準正態(tài)分布曲線(虛線)比較，初步判斷的分布是非正態(tài)分布。進一步對E(1)i做描述性統(tǒng)計分析，發(fā)現(xiàn)其偏度與峰度超過正態(tài)分布臨界標準(Mardia，1970;Srivastava，1984)，可以判定該數(shù)據(jù)的總體分布是顯著非正態(tài)分布。如果對此類對象進行顯著性檢驗，常用的t檢驗、F檢驗等參數(shù)檢驗無法使用。

記 Ei(i=1，2，…，n)中位數(shù)為 θ，記θ(i=1，2，…，n)，并繪制頻率分布，如圖 2 所示，其中x軸表示值，y軸表示對應值出現(xiàn)的頻數(shù)。若將看作近似的對稱分布，此時可采取適用于對稱分布總體的非參數(shù)檢驗方法。

2 非參數(shù)檢驗法

參數(shù)檢驗指用某些參數(shù)(如正態(tài)分布中的平均值和方差)來描述總體的特征并對樣本所屬總體的性質(zhì)做出若干假設(shè)檢驗，是近代氣候?qū)W研究中最常用的統(tǒng)計方法。由這類方法導出的結(jié)論會受到參數(shù)假設(shè)的限制。而對參數(shù)不作嚴格的假設(shè)，相對于參數(shù)檢驗而言，對資料的分布形態(tài)沒有特殊的要求或只作一點諸如對稱性之類的簡單假設(shè)，一般稱作非參數(shù)檢驗。

圖1 E的頻數(shù)分布Fig．1 Frequency distribution of E

圖2 E的頻數(shù)分布Fig．2 Frequency distribution of E

非參數(shù)檢驗把數(shù)據(jù)按大小排隊，使每個數(shù)據(jù)都有自己的“地位”，稱為秩(Rank)。雖然不知道原始數(shù)據(jù)的分布形式，但是這些秩及由其產(chǎn)生的一些統(tǒng)計量的性質(zhì)和分布是可以得到的。吳喜之(2006)研究認為，由這種方法得出的結(jié)論更具普遍意義。

常用的非參數(shù)統(tǒng)計方法有符號檢驗、秩和檢驗、等級相關(guān)檢驗、Mann-Whitney檢驗，超大樣本如氣候?qū)W研究中常見的蒙特卡羅檢驗等。在氣象學研究中，很多情況下參數(shù)檢驗不適用，這是因為在參數(shù)檢驗中，數(shù)據(jù)的分布一般默認為正態(tài)分布、方差齊性，然而大多數(shù)氣象數(shù)據(jù)并不滿足此種特征，在這種情況下假如堅持使用參數(shù)檢驗，勢必會歪曲數(shù)據(jù)的本來面目，從而使人們對檢驗的有效性產(chǎn)生懷疑。

Wilcoxon(1945)針對對稱分布提出了一種簡單有效的非參數(shù)檢驗方法，在總體分布未知、或者不考慮研究對象具體分布的情況下，非參數(shù)檢驗可以用于研究目標總體與理論總體分布是否相同，或者各樣本所在總體的分布位置是否相同(張文彤和閆潔，2004)。Wilcoxon(1945)巧妙地將非參數(shù)過程轉(zhuǎn)化為參數(shù)過程(Conover and Iman，1981)，該方法在醫(yī)學統(tǒng)計、生物、行為科學中已有廣泛應用(Gehan，1965;Tarone and Ware，1977;蔣知儉，1997;Roth et al．，1998)。

3 Wilcoxon符號秩和檢驗

在 X1，X2，…，Xn中，Xi如果是第 Ri個最小值，即Xi=X(Ri)(第 Ri個順序統(tǒng)計量)，稱 Ri為 Xi的秩。R統(tǒng)計量只考慮了樣本點的大小而未考慮其絕對值的大小，然而其絕對值的大小有時也必須考慮。

Wilcoxon符號秩統(tǒng)計量用W來表示。樣本的絕對值|X1|，|X2|，…，|Xn|排序，其順序統(tǒng)計量為表示|Xj|在絕對值樣本中的秩，即，還用S(x)表示符號函數(shù)I(x＞0)，它在x＞0時為1，否則為0。Wilcoxon符號秩統(tǒng)計量定義為

它是正的樣本點按絕對值所得的秩的和(Wilcoxon，1945)。

假設(shè)F(x－θ)為連續(xù)分布的總體，通常零假設(shè)為H0:θ=0，按照以上定義，有以下定理:

如果零假設(shè) H0:θ=0成立，則 W1，W2，…，Wn是獨立同分布的(吳喜之，2006)，其分布為P(Wi=

用正態(tài)近似求W+的分布，則

由中心極限定理，在n大時，可近似地認為

對于上面的正態(tài)近似，也可以如下表示，當n很大時，有

以上檢驗過程不僅適用于單樣本，而且可推廣到配對樣本上(Wilcoxon，1945;吳喜之，2006)。假設(shè)(X1，Y1)，(X2，Y2)，…，(Xn，Yn)代表隨機抽樣的一組配對數(shù)據(jù)。

令 Pi=Yi－ Xi，Qi=Xi－ Yi(i=1，2，…，n)，根據(jù)中位數(shù)性質(zhì)，Pi、Qi的總體也具有連續(xù)對稱性，設(shè)其總體的中位數(shù)為 θP、θQ，則原假設(shè) H0:θ1= θ2可替換為H'0:θP=θQ=0，即回歸到單樣本情形。

在TC強度預報中實現(xiàn)Wilcoxon秩和檢驗，首先定義誤差E1i、E2i:

其中:i指第 i個時次樣本，i=1，2，…，n;n代表獨立樣本個數(shù);代表兩種臺風強度預報方法的預報結(jié)果;f、r分別代表強度預報模型和實際情形。

經(jīng)過整理簡化，Wilcoxon符號秩檢驗在TC強度預報檢驗中的流程為:

1)令 Wi=E2i－ E1i(i=1，2，…，n)，如果 Wi是正數(shù)，記為正號;Wi為負數(shù)，記為負號。

2)計算Wi的絕對值。

3)將Wi的絕對值按升序排列，求出相應的秩。

4)分別計算正、負號Wi的秩和，分別記為W+和W－。

若正、負秩總和大致相當，可以認為兩配對樣本數(shù)據(jù)正負變化程度基本相當，分布差距較小。

兩配對樣本的Wilcoxon符號秩和檢驗，按照下面的公式計算Z統(tǒng)計量，當樣本容量足夠大時，Z近似服從正態(tài)分布。

對于單邊檢驗H0:θ=θ0，Hα:θ＞θ0及水平α，W的臨界值為

其中:Zα通過查正態(tài)分布表獲得。若W的計算值超過臨界值c，則否定原假設(shè)，認為兩個樣本的分布不同。

分別計算2005—2012年12 h預報時刻下CLIPER模型、PLS模型的預報誤差，記 ECLIPERi、EPLSi。根據(jù)Wilcoxon秩和檢驗方法，得到Z統(tǒng)計量超過臨界值，拒絕原假設(shè)，即認為2005—2012年6月的CLIPER模型和PLS模型在12 h的預報誤差存在顯著性差異。

4 結(jié)論與討論

TC強度的預報結(jié)果與觀測結(jié)果的誤差分布是非正態(tài)分布，此時若進行顯著性檢驗，可使用非參數(shù)檢驗方法。作為最常用的非參數(shù)檢驗方法之一，Wilcoxon秩和檢驗不要求確保樣本所屬的總體符合某種理論分布，僅需總體具有對稱性，具有十分廣泛的適用性(吳喜之，2006)。

Wilcoxon秩和檢驗也可以與其他TC強度預報評定參數(shù)相結(jié)合，有利于進一步提高當前精度預報水平。然而，該方法也有一定的局限性。在總體分布已知時，相比參數(shù)方法，非參數(shù)方法無法充分利用樣本中信息，因此，在大多情況下參數(shù)檢驗方法仍然是最有效的顯著性檢驗方法。

蔣知儉．1997．醫(yī)學統(tǒng)計學［M］．北京:人民衛(wèi)生出版社:168-174．

宋金杰，王元，陳佩燕，等．2011．基于偏最小二乘回歸理論的西北太平洋熱帶氣旋強度統(tǒng)計預報方法［J］．氣象學報，69(5):745-756．

湯杰，陳國民，余暉．2011.2010年西北太平洋臺風預報精度評定及分析［J］．氣象，37(10):1320-1328．

吳喜之．2006．非參數(shù)統(tǒng)計［M］．北京:中國統(tǒng)計出版社:23-25;32-41．

姚才，金龍，黃明策．2007．遺傳算法與神經(jīng)網(wǎng)絡相結(jié)合的熱帶氣旋強度預報方法試驗［J］．海洋學報，29(4):11-19．

余暉，胡春梅，蔣樂貽．2006．熱帶氣旋強度資料的差異性分析［J］．氣象學報，64(3):357-363．

于潤玲，余暉，端義宏．2013．登陸華南熱帶氣旋強度變化與大尺度環(huán)流的關(guān)系［J］．大氣科學學報，36(5):619-625．

占瑞芬，湯杰，余暉．2010.2009年西北太平洋熱帶氣旋定位和業(yè)務預報精度評定［J］．氣象，36(10):114-121．

張文彤，閆潔．2004．SPSS統(tǒng)計分析基礎(chǔ)教程［M］．北京:高等教育出版社:279-301．

中國氣象局．2012．臺風業(yè)務和服務規(guī)定［S］．北京:氣象出版社．

Birmili W，Wiedensohler A，Heintzenberg J，et al．2001．Atmospheric particle number size distribution in central Europe:Statistical relations to air masses and meteorology［J］．J Geophys Res，106(D23):32005-32018．

Chen P Y，Yu H，Chan J C．2011．A western North Pacific tropical cyclone intensity prediction scheme［J］．Acta Meteor Sinica，25:611-624．

Conover W J，Iman R L．1981．Rank transformations as a bridge between parametric and nonparametric statistics［J］．Am Stat，35(3):124-129．

Gehan E A．1965．A generalized two-sample Wilcoxon test for doubly censored data［J］．Biom，52(3/4):650-653．

Gunn K L S，Marshall J S．1958．The distribution with size of aggregate snowflakes［J］．J Meteor，15(5):452-461．

Mardia K V．1970．Measures of multivariate skewness and kurtosis with applications［J］．Biom，57(3):519-530．

Roth J A，Atkinson E N，F(xiàn)ossella F，et al．1998．Long-term follow-up of patients enrolled in a randomized trial comparing perioperative chemotherapy and surgery with surgery alone in resectable stage III:A non-small-cell lung cancer［J］．Lung Cancer，21(1):1-6．

Srivastava M S．1984．A measure of skewness and kurtosis and a graphical method for assessing multivariate normality［J］．Stat Probabil Lett，2(5):263-267．

Tarone R E，Ware J．1977．On distribution-free tests for equality of survival distributions［J］．Biom，64(1):156-160．

Ulbrich C W．1983．Natural variations in the analytical form of the raindrop size distribution［J］．J Climate Appl Meteor，22(10):1764-1775．

White G H．1980．Skewness，kurtosis and extreme values of Northern Hemisphere geopotential heights［J］．Mon Wea Rev，108(9):1446-1455．