国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

* 重尾分布尾指數(shù)估計(jì)研究進(jìn)展

2012-01-11 08:21劉維奇邢紅衛(wèi)
關(guān)鍵詞:尾部閾值定義

劉維奇,邢紅衛(wèi)

(山西大學(xué) 管理學(xué)院,山西 太原 030006)

*重尾分布尾指數(shù)估計(jì)研究進(jìn)展

劉維奇,邢紅衛(wèi)

(山西大學(xué) 管理學(xué)院,山西 太原 030006)

氣象、水文、環(huán)境、電信、保險(xiǎn)、金融等許多領(lǐng)域的數(shù)據(jù)不滿足正態(tài)分布假設(shè),而是具有尖峰、重尾特征.過去三十多年間,針對(duì)重尾分布及尾指數(shù)估計(jì)的研究得到了長(zhǎng)足發(fā)展.文章回顧了沖擊正態(tài)性假設(shè)的重尾分布的發(fā)現(xiàn)過程,描述了重尾分布的定義,極值理論及正則變換條件,并從研究?jī)?nèi)容的階段特征、研究方法的不同類型總結(jié)、歸納、評(píng)述了各類尾指數(shù)估計(jì)方法及重尾閾值選取方法,最后就這些估計(jì)方法的不足和應(yīng)用局限性以及如何改進(jìn)和深化重尾指數(shù)的估計(jì)問題作了展望.

極值理論;重尾指數(shù)估計(jì);重尾閾值;降偏差估計(jì)

0 重尾分布的發(fā)現(xiàn)

23歲畢業(yè)于牛津大學(xué)、就職于愛爾蘭都柏林吉尼斯釀造公司(Guinness Brewing Company)的化學(xué)技師戈塞特(Gosset),在長(zhǎng)期從事實(shí)驗(yàn)和數(shù)據(jù)分析工作中發(fā)現(xiàn)了T分布,由于可能涉及公司商業(yè)機(jī)密外泄,Gosset以“Student”的筆名發(fā)表了此項(xiàng)結(jié)果,這也是后人稱T分布為“學(xué)生氏分布”的原因.然而,在當(dāng)時(shí)正態(tài)分布一統(tǒng)天下的情形下,Gosset的發(fā)現(xiàn)并沒有被外界理解和接受.直到1923年英國(guó)統(tǒng)計(jì)學(xué)家費(fèi)歇爾(R.A.Fisher)給出T分布的嚴(yán)格推導(dǎo)并于1925年編制分布表之后,T分布才得到學(xué)術(shù)界承認(rèn),并得到快速的傳播、發(fā)展和應(yīng)用.T分布堪稱一類典型的重尾分布.1949年,Zipf[1]在研究美國(guó)城市規(guī)模問題時(shí),發(fā)現(xiàn)第二大城市的規(guī)模只有第一大城市規(guī)模的一半,而第三大城市規(guī)模是第一大城市規(guī)模的1/3,發(fā)現(xiàn)城市規(guī)模的頻率分布圖近似于下降的雙曲線,具有重尾特征,在研究詞頻問題時(shí)發(fā)現(xiàn)了同樣的特征.1963年,Mandelbrot[2]發(fā)現(xiàn)棉花的期貨價(jià)格相對(duì)于正態(tài)分布也具有尖峰、重尾特征,服從一族Levy穩(wěn)定分布.

重尾現(xiàn)象幾乎出現(xiàn)于所有經(jīng)濟(jì)、生活領(lǐng)域,金融資產(chǎn)、保險(xiǎn)索賠、氣象觀察、網(wǎng)絡(luò)流量以及眾多人類行為的數(shù)據(jù)均表現(xiàn)出尖峰重尾特征,由此,重尾分布得到金融、統(tǒng)計(jì)、環(huán)境科學(xué)等學(xué)術(shù)界和實(shí)踐者的關(guān)注和重視.在金融方面,F(xiàn)ama[3]發(fā)現(xiàn)了股票收益的尖峰重尾特征,Mandelbrot[2]發(fā)現(xiàn)棉花期貨價(jià)格也具有這一特征,Brodin和Kluppelberg[4]介紹了重尾分布在金融資產(chǎn)風(fēng)險(xiǎn)管理方面的應(yīng)用,Bollerslev和Todorov[5]將重尾分布及重尾指數(shù)估計(jì)應(yīng)用于金融資產(chǎn)定價(jià)模型.在氣象、環(huán)境科學(xué)方面,Tessier et al.[6]發(fā)現(xiàn)降雨量和河流水文數(shù)據(jù)具有尖峰重尾特征,并以重尾分布進(jìn)行建模,Richard[7]介紹了重尾分布在大氣臭氧層研究、風(fēng)速和降雨量預(yù)測(cè)等方面的應(yīng)用,Omey et al.①Omey E,Mallor F,Nualor E.An Introduction to Statistical Modeling of Extreme Values.Application to Calculate Extreme Wind Speedsl.2009,working paper.http://ideas.repec.org/p/hub/wpecon/200936.html.也將重尾分布應(yīng)用于極端風(fēng)速的研究,Allan和Soden[8]以重尾分布預(yù)測(cè)了溫室效應(yīng)和極端降雨量.在人類社會(huì)現(xiàn)象及其它方面,除Zipf[1]在研究人類學(xué)及語(yǔ)言學(xué)問題時(shí)發(fā)現(xiàn)重尾分布并加以研究外,Barabasi[9]在研究宇宙爆炸起源和人類動(dòng)力學(xué)問題時(shí)也利用了重尾分布,Vazquez[10]、Vazquez et al.[11]利用重尾分布對(duì)Barabasi[9]的人類動(dòng)力學(xué)模型進(jìn)行了進(jìn)一步擴(kuò)展.

重尾分布由于其對(duì)數(shù)據(jù)刻畫更具現(xiàn)實(shí)性,因此激發(fā)了金融、保險(xiǎn)、氣象、環(huán)境、通訊等領(lǐng)域的研究需求.重尾分布也由于其非正態(tài)表現(xiàn)的特質(zhì)性,給統(tǒng)計(jì)學(xué)家在研究方法和研究難度上提出了挑戰(zhàn),關(guān)于重尾分布的理論研究和應(yīng)用研究任重道遠(yuǎn).

1 重尾分布的定義

重尾分布可以從分布函數(shù)的矩性質(zhì)、矩母函數(shù)性質(zhì)和分布的尾部性質(zhì)來(lái)定義,分別闡述如下.

1.1 以四階矩定義

重尾分布的定義相對(duì)于正態(tài)分布而言,是以其四階中心矩為基礎(chǔ)的.

定義1.1 隨機(jī)變量X服從的分布F是重尾的,若

其中μX,σX分別為X的期望和標(biāo)準(zhǔn)差.由于正態(tài)分布的峰度(kurtosis)為3,因此該性質(zhì)被稱為尖峰,該定義只適用于4階矩存在的情形(詳見 Thomas et al.2002)[12].

1.2 以矩母函數(shù)定義

定義1.2 稱分布函數(shù)F是重尾分布,或其隨機(jī)變量X服從于重尾(heavy-tailed)分布,如果對(duì)?λ>0,即不存在指數(shù)階矩(詳見Embrechts et al.)[13].

1.3 以分布尾部的收斂速率定義

定義1.3 如果密度函數(shù)是以冪指數(shù)速率衰減至0,稱該分布函數(shù)是重尾的;如果密度函數(shù)是以指數(shù)速率衰減至0的,稱該分布函數(shù)是輕尾的(詳見Embrechts et al.)[13].

目前在重尾分布研究領(lǐng)域,大多是以正則變化理論為基礎(chǔ),因此分布尾部的收斂速率成為研究主題,而其中的重點(diǎn)和難點(diǎn)是尾指數(shù)估計(jì).考慮到這一原因,定義1.3更具有普遍指導(dǎo)意義.一般認(rèn)為,分布尾部收斂速率快于正態(tài)分布尾部收斂速率的為輕尾分布,而尾部收斂速率慢于正態(tài)分布尾部收斂速率的為重尾分布[14].

2 極值理論基礎(chǔ)

假設(shè)X1,X2,…,X n是分布F的隨機(jī)變量,

令X1,n≤X2,n≤…≤X n,n為X1,X2,…,Xn的次序統(tǒng)計(jì)量,若存在常數(shù)序列an和bn∈R,使得(Xn,n-bn)/an收斂于非退化極值分布G,

則F∈D M(EVγ),即F屬于極值分布EVγ的吸引域,其中γ為重尾指數(shù).

如果非退化分布G存在,則應(yīng)屬于以下三類分布之一:

對(duì)x>0,正則變化一階條件為

其中L(x)為慢變化函數(shù),記為∈RV-α,α=1/γ.設(shè)分位數(shù)函數(shù)U(t)=(1/(1-F))←(t)=F←(1-1/t),t>1,其中F←(x)=inf{y:F(y)≥x},則具有如下等價(jià)定義.

二階參數(shù)ρ(ρ<0)反映了一階條件(7)的收斂速率,|A(t)|以指數(shù)ρ正則變化,即|A(t)|∈RVρ.特別對(duì)于標(biāo)準(zhǔn)的Pareto分布F(x)=1-Cx-1/γ,x>Cγ,lnU(tx)-lnU(t)-γlnx≡0.

Pickands估計(jì)[15],Hill估計(jì)[16],矩估計(jì)[17]等一系列參數(shù)或半?yún)?shù)估計(jì)都密切依賴于選取的次序統(tǒng)計(jì)量個(gè)數(shù)k,如果對(duì)慢變化函數(shù)L(x)沒有嚴(yán)格的限制條件,很難確定用于重尾指數(shù)估計(jì)的k值.對(duì)于Pareto型分布,可以假設(shè)

C>0,ρ<0,D為非零實(shí)數(shù),(8)成立且可以選擇A(t)=γρDCρtρ.

為了獲得二階參數(shù)估計(jì)的性質(zhì),進(jìn)一步假設(shè)三階條件

如果∶=1-F是以指數(shù)α的正則變化函數(shù),則U以指數(shù)γ正則變化.二階條件為

三階參數(shù)ρ′(ρ′<0)反映了二階條件(8)的收斂速率,|B(t)|以指數(shù)ρ′正則變化,即|B(t)|∈RVρ′.這個(gè)條件已經(jīng)被 Gomes et al.[18],F(xiàn)raga Alves et al.[19]用來(lái)研究ρ估計(jì)的漸近性質(zhì),Gomes et al.[20]用來(lái)研究降偏差尾指數(shù)估計(jì),Caeiro和Gomes[21]以其為基礎(chǔ)研究尾指數(shù)估計(jì)和高分位點(diǎn).

對(duì)于Pareto型分布,進(jìn)一步具體化o(xρ/γ),假設(shè)C>0,D1,D2為非零實(shí)數(shù),ρ,ρ1<0,ρ′=max(ρ,ρ1)>ρ.

對(duì)于大多數(shù)重尾分布,三階參數(shù)ρ′等于二階參數(shù)ρ,即例如Fréchet分布F(x)=exp(-x-1/γ),x≥0,ρ′=ρ=-1;廣義Pareto分布F(x)=1-(1+γx)-1/γ,x≥0,ρ′=ρ=-γ;Burr分布F(x)=1-(1+x-ρ/γ)1/ρ,x≥0,ρ′=ρ<0;Student-t n分布(n為自由度),γ=1/n,ρ′=ρ=-2/n.

3 傳統(tǒng)的重尾指數(shù)估計(jì)方法

由于對(duì)極端事件的敏感和關(guān)注,有必要盡可能了解分布尾部的全部信息,最直接的方式是得到尾分布函數(shù).假設(shè)了尾分布函數(shù)的參數(shù)形式后,這個(gè)問題就轉(zhuǎn)化為如何估計(jì)函數(shù)當(dāng)中的未知參數(shù),因此估計(jì)重尾指數(shù)的本質(zhì)是為了估計(jì)尾分布函數(shù).

3.1 重尾指數(shù)估計(jì)方法

1949年Zipf[1]在研究詞頻和城市規(guī)模等問題時(shí)發(fā)現(xiàn)了尖峰重尾特征的分布,并利用Zipf-plot給出了重尾指數(shù)的估計(jì)方法.Fama和 Roll[22]、Press[23]和Zolotarev[24]分別基于穩(wěn)定分布(0<α<2)的特征函數(shù)給出了指數(shù)α的不同估計(jì)方法.Pickands[15]在假定尾部分布函數(shù)的前提下,通過求分位數(shù)給出了基于三個(gè)次序統(tǒng)計(jì)量的Pickands估計(jì)

其中X1,n≤X2,n≤…≤Xn,n是隨機(jī)變量X1,X2,…,Xn的次序統(tǒng)計(jì)量,k是估計(jì)中所選取的極大次序統(tǒng)計(jì)量的個(gè)數(shù).de Haan[25]研究了Hill估計(jì)的漸近性質(zhì),Hill估計(jì)具有強(qiáng)相合性以及漸近正態(tài)性,當(dāng)隨機(jī)變量不是i.i.d時(shí)也能得到類似的結(jié)果,但是Hill估計(jì)要求γ>0.

de Haan和 Resnick[26]提出了

Davison[27]提出了極大似然估計(jì)

其中X1,n≤X2,n≤…≤X n,n是隨機(jī)變量X1,X2,…,Xn的次序統(tǒng)計(jì)量.Dekkers et al.[17]研究了Pickands估計(jì)的漸近性質(zhì).Pickands估計(jì)相對(duì)于其它估計(jì)而言,它是一種相合估計(jì),然而缺點(diǎn)也很明顯,這種估計(jì)的漸近有效性比較差.

Hill[16]在假設(shè)F為Pareto分布的前提下,以極大似然方法給出了重尾指數(shù)γ的估計(jì)

其中是廣義Pareto分布GPγ(ax/γ),a>0的內(nèi)含規(guī)模參數(shù)a的極大似然估計(jì).

Cs¨org¨o et al.[28]提出了核估計(jì)方法其中K是定義在(0,1)上的非負(fù)非增核.當(dāng)K(u)=1(0,1)(u)時(shí)就是 Hill估計(jì),由de Haan和Resnick[26]提出^γ=(logX n,n-logXn-k,n)/logk,de Haan[29],Bacro和 Brito[30]提 出的估計(jì) 方法也 都屬于 核估計(jì),隨 后有Smith[31-32]的參數(shù)估計(jì)方法.

Dekkers et al.[17]提出了矩估計(jì)方法

1996年Kratz和Resnick[34]提出了基于最小二乘法的qq-plot估計(jì),該估計(jì)的殘差所包含的信息在一定程度上能抵消偏差,但漸近方差卻是Hill估計(jì)漸近方差的2倍,同年Beirlant et al.[35]提出Pareto quantile plots方法,對(duì)于小樣本來(lái)說(shuō)能得到很好的估計(jì)結(jié)果,所選擇的權(quán)重也能克服不收斂問題.但是該方法對(duì)所選擇的權(quán)重很敏感,權(quán)重有時(shí)會(huì)對(duì)估計(jì)產(chǎn)生負(fù)面影響.

Fraga Alves et al.[36]提出了混合矩估計(jì)(MM 估計(jì))

3.2 重尾閾值的選取

如何選取重尾閾值,或者如何選取用于估計(jì)的次序統(tǒng)計(jì)量個(gè)數(shù)k,經(jīng)驗(yàn)上的初步判斷是選取次序統(tǒng)計(jì)量的2%-10%.學(xué)者們從理論上提出了選取重尾閾值k的許多方法.其中一類是作圖法,比如Hill[16]提出的Hill-plot,Kratz和 Resnick[34]提出的qq-plot,Beirlant et al.[35]提出的 Pareto分位數(shù)圖,Resnick和 Starica[37]給出的對(duì) Hill-plot改進(jìn)的smoo Hill-plot,以及 Drees et al.[38]給出的對(duì) Hill-plot改進(jìn)的 Alt Hill-plot等,這些作圖法都有一定的優(yōu)越性,但整體而言都不能適用于所有重尾分布族.像Hill-plot,qq-plot,當(dāng)隨機(jī)變量服從Pareto分布時(shí),這兩種方法表現(xiàn)出十分優(yōu)良的性質(zhì),能夠容易選取重尾閾值.一旦隨機(jī)變量不服從Pareto分布,卻不能很好地選取重尾閾值,甚至無(wú)法選取重尾閾值.Pareto分位數(shù)圖,smoo Hill-plot和Alt Hill-plot相對(duì)于Hill-plot估計(jì)精度稍高一些,但是也不能對(duì)所有的重尾分布較好地選擇重尾閾值.Sousa[39]在其博士論文中提出的Sum-plot方法在一定程度上克服了前幾種方法中選取重尾閾值所遇到的困難,而且具有比較好的性質(zhì).但是由于Sum-plot方法是以觀察圖形得到重尾閾值,因此選擇重尾閾值有一定的猜測(cè)性,因而會(huì)對(duì)重尾指數(shù)估計(jì)造成一定誤差.另一類方法就是以估計(jì)的最小均方誤差(MSE)為標(biāo)準(zhǔn)來(lái)確定重尾閾值,最優(yōu)閾值應(yīng)該與最小化均方誤差一致.1990年Hall[40]提出利用Bootstrap方法來(lái)選取重尾閾值,Danielsson[41]在2001年對(duì)Hall的方法作了進(jìn)一步改進(jìn),提出了Danielsson-Bootstrap方法,然而劉維奇等[42]在2010年的實(shí)證研究發(fā)現(xiàn),Bootstrap方法受異常值和樣本容量的影響較大,并在此基礎(chǔ)上提出了收斂速度更好的M-Bootstrap方法.2010年劉維奇和邢紅衛(wèi)[43]提出一種選取重尾閾值的簡(jiǎn)便優(yōu)化方法,可以得到重尾閾值的解析結(jié)果.

以上這些估計(jì)方法各有特點(diǎn),各有優(yōu)劣,然而也存在一些共有的缺點(diǎn).首先,這些方法都依賴于用于估計(jì)的次序統(tǒng)計(jì)量的個(gè)數(shù)k,或者說(shuō)依賴于重尾閾值,并且估計(jì)路徑波動(dòng)明顯,對(duì)選取的k異常敏感;其次,Hill類估計(jì)對(duì)于樣本不具有位置變換不變性,對(duì)樣本進(jìn)行位置變換后,估計(jì)就會(huì)失效,對(duì)現(xiàn)實(shí)問題的適用性大打折扣,而Pickands估計(jì)具有位置變換不變性,這一點(diǎn)有別于Hill估計(jì);第三,這些估計(jì)方法在有限樣本情形具有不可忽略的偏差,處理實(shí)際問題時(shí)難以得到優(yōu)良的估計(jì)結(jié)果.對(duì)于傳統(tǒng)估計(jì)方法的這些缺點(diǎn),在重尾指數(shù)估計(jì)的發(fā)展歷程中又提出了一些針對(duì)性的改進(jìn)方法.

4 改進(jìn)的重尾指數(shù)估計(jì)方法

4.1 降偏差重尾指數(shù)估計(jì)

上世紀(jì)90年代末至今,研究重尾分布尾部指數(shù)估計(jì)的重點(diǎn)有所突破.學(xué)者們不太關(guān)注重尾閾值的選取,而是希望能夠提出在有限樣本情形下偏差小而且對(duì)閾值有優(yōu)良穩(wěn)健性的估計(jì)方法,這樣既符合無(wú)法取到無(wú)限樣本的實(shí)際情況,又不至于對(duì)閾值選取有苛刻的要求,于是出現(xiàn)了許多穩(wěn)健性較好的降偏差重尾指數(shù)估計(jì).

Gomes和 Martins[53]提出了 Generalized Jackknife(GJ)估計(jì)

GJ估計(jì)的漸近方差為γ2((1-ρ)/ρ)2,是Drees類估計(jì)中漸近方差最小的.

Beirlant et al.[54]提出了廣義 Hill(GH)估計(jì)

Gomes和Pestana[50]提出了

以及其漸近等價(jià)估計(jì)

Caeiro et al.[49]提出了修正 Hill估計(jì)

在二階條件及

4.2 位置變換不變性重尾指數(shù)估計(jì)

大部分Hill類估計(jì),如矩估計(jì)、核估計(jì)、混合矩估計(jì),對(duì)樣本進(jìn)行規(guī)模變換后滿足不變性,對(duì)樣本進(jìn)行位置變換后卻會(huì)失效,然而在實(shí)際問題中往往需要對(duì)樣本進(jìn)行位置變換.為此,除了上文提到的Pickands估計(jì)和極大似然估計(jì)等位置變換不變性估計(jì)外,一些學(xué)者在考慮估計(jì)特性的同時(shí)也提出了另外的位置變換不變性估計(jì)方法,并使這一問題成為今后研究重尾分布尾指數(shù)估計(jì)的熱點(diǎn)之一.

Falk[56]提出了類似于 Hill估計(jì)的NH估計(jì)(γ<0),

4.3 其它重尾指數(shù)估計(jì)方法

Gray和Schucany[65]提出的Jackknife方法主要目的也是降低估計(jì)偏差,為此出現(xiàn)了許多基于Jackknife方法的重尾指數(shù)估計(jì).Falk[66]構(gòu)造了Pickands估計(jì)的線性組合,并發(fā)現(xiàn)其優(yōu)于Pickands估計(jì).然而,Martins et al.[67]的模擬結(jié)果發(fā)現(xiàn),Hill估計(jì)的線性組合并沒有改進(jìn)Hill估計(jì).Peng[68]以Jackknife方法得到一類重尾指數(shù)的估計(jì)方法,Gomes et al.[69]比較研究了基于Vries估計(jì)和不同水平下Hill估計(jì)的廣義Jackknife估計(jì),得到的幾類方法在二階位置參數(shù)ρ的不同范圍內(nèi)各有千秋,且模擬結(jié)果都依賴于樣本容量.Gomes et al.[70]研究了基于Hill類的Jackknife估計(jì),模擬發(fā)現(xiàn)對(duì)于Hall類分布有較好的均方誤差(MSE)結(jié)果.

Paulauskas[72]研究發(fā)現(xiàn)DPR估計(jì)在大樣本情形有很好的估計(jì)性質(zhì),然而漸近方差大于Hill估計(jì)的漸近方差.Qi[73]以類似于Davydov et al.的思路提出一種新的估計(jì)方法,

Qi估計(jì)與DPR估計(jì)相比有較小的漸近方差,然而并非漸近無(wú)偏,在正則變換二階條件下其漸近偏差與每塊中用于估計(jì)的最大次序統(tǒng)計(jì)量個(gè)數(shù)有關(guān),這也將是今后研究的另一熱點(diǎn).

5 展望

自從Levy,Mandelbrot,Gosset,Zipf等先驅(qū)者們發(fā)現(xiàn)較正態(tài)分布具有尖峰重尾特征的分布以來(lái),關(guān)于重尾分布及重尾指數(shù)估計(jì)的研究就一直沒有停止過.由于實(shí)際中極端值所帶來(lái)的突出影響,如何根據(jù)實(shí)際數(shù)據(jù)推斷其尾分布的形狀,這是學(xué)界非常關(guān)注的問題.學(xué)者們根據(jù)正則變化理論假設(shè)了重尾分布尾部的參數(shù)形式,通過估計(jì)其中內(nèi)含的參數(shù),把問題轉(zhuǎn)化為了重尾指數(shù)估計(jì).

上個(gè)世紀(jì)七十年代,學(xué)者們?cè)诩僭O(shè)尾分布參數(shù)形式的前提下,給出了許多重尾指數(shù)的估計(jì)方法,并且具有非常優(yōu)良的統(tǒng)計(jì)性質(zhì).同時(shí)在正則變化條件下從分布尾部的收斂速率出發(fā),也對(duì)重尾分布的尾部參數(shù)形式做了更為詳細(xì)的分析和假設(shè).然而這些估計(jì)方法都涉及一個(gè)無(wú)法回避的問題,即有多少個(gè)極值統(tǒng)計(jì)量滿足所假設(shè)的尾分布函數(shù),或者該用多少個(gè)極值統(tǒng)計(jì)量來(lái)估計(jì)重尾指數(shù).上個(gè)世紀(jì)八十年代以后,學(xué)者們對(duì)重尾閾值的選取興致高漲,提出了許多選取方法,并研究了閾值選取對(duì)估計(jì)結(jié)果的影響.本世紀(jì)以來(lái),重尾分布的研究又有新突破,不太關(guān)注于重尾閾值的選取,嘗試提出對(duì)重尾閾值有優(yōu)良穩(wěn)健性的最小方差漸近無(wú)偏估計(jì),以及改進(jìn)這些方法更廣泛的適用性.

[1] Zipf G K.Human Behavior and the Principle of Least Effort:an Introduction to Human Ecology[M].Cambridge,Mass,1949.

[2] Mandelbrot B.The Variation of Certain Speculative Prices[J].JBusiness,1963,36:394-419.

[3] Fama E.The Behavior of Stock Market Prices[J].JBusiness,1965,38:34-105.

[4] Brodin E,Kluppelberg C.Extreme Value Theory in Finance[C]//Everitt,B.and Meiinick,E.(Eds.)Encyclopedia of Quantitive Risk Assessment,2007.

[5] Bollerslev T,Todorov V.Tail,F(xiàn)ears and Risk Premia[J].JFinance,2011,66:2165-2211.

[6] Tessier Y,Lovejoy S,Hubert P,etal.Multifractal Analysis and Modeling of Rainfall and River Flows and Scaling,Causal Transfer Functions[J].JGeophysRes,1996,101:427-440.

[7] Richard L.Smith.Statistics of Extremes,with Applications in Enviroment,Insurance and Finance[C]//Extreme Values in Finance,Telecommunications and the Environment,edited by B.Finkenstadt and H.Rootzen,London:Chapman and Hall/CRC Press,2003:1-78.

[8] Allan R,Soden B.Atmospheric Warming and the Amplification of Precipitation Extremes[J].Science,2008,321(5895):1481-1484.

[9] Barabasi A L.The Origin of Bursts and Heavy Tails in Human Dynamics[J].Nature,2005,435(7039):207-211.

[10] Vazquez A.Exact Results for the Barabasi Model of Human Dynamics[J].PhysicalReviewLetters,2005,95:248701(1)-248701(4).

[11] Vazquez A,Oliveira J G,Dezs?Z,etal.Modeling Bursts and Heavy Tails in Human Dynamics[J].PhysicalReviewE,2006,73(3):036127(1)-036127(19).

[12] Werner T,Upper C.Time Variation in the Tail Behaviour of Bund Futures Returns[J].JournalofFuturesMarkets,2004,24(4):387-398.

[13] Embreehts P,Kluppelberg C,Mikoseh C.Modeling Extremal Events for Insurance and Finance[M].Berlin:Springer,1997.

[14] 邢紅衛(wèi).重尾現(xiàn)象、重尾分布與重尾指數(shù)估計(jì)[D].太原:山西大學(xué),2010.

[15] Pickands J.Statistical Inference Using Extreme Order Statistics[J].AnnalsofStatistics,1975,3:119-131.

[16] Hill B.A Simple General Approach to Inference About the Tail of a Distribution[J].AnnalsofStatistics,1975,3:1163-1174.

[17] Dekkers A,Einmahl J,De Haan L.A Moment Estimator for the Index of an Extreme-value Distribution[J].Annalsof Statistics,1989,17:1833-1855.

[18] Gomes M I,De Haan,Peng L.Semi-parametric Estimation of the Second Order Parameter Asymptotic and Finite Sample Behaviour[J].Extremes,2002,5(4):387-414.

[19] Fraga Alves M I,Gomes M I,De Haan.A new Class of Semi-parametric Estimators of the Second Order Parameter[J].PortugaliaeMathematic,2003,60(1):193-213.

[20] Gomes M I,Caeiro F,F(xiàn)igueiredo F.Bias Reduction of a Tail Index Estimator Trough an External Estimation of the Second Order Parameter[J].Statistics,2004,38(6):497-510.

[21] Caeiro F,Gomes M I.Minimum-variance Reduced-bias Tail Index and Quantile Estimation[J].Revstat,2008,6(1):1-20.

[22] Fama F,Roll R.Some Properties of Symmetric Stable Distributions[J].JournaloftheAmericanStatisticalAssociation,1968,63:817-836.

[23] Press S.Estimation in Univariate and Multivariate Stable Distributions[J].JournaloftheAmericanStatisticalAssociation,1972,67(340):842-847.

[24] Zolotarev V.One-dimensional Stable Distributions[J].TranslationsofMathematicalMonographs,1986,65.

[25] de Haan.Extreme Value Statistics[C]//Galambos,J.,Lechner,J.,Simiu,E.(eds.)Extreme Value Theory and Applications,Kluwer Academic Publications,Dordrecht,1994:93-122.

[26] de Haan,Resnick S.A Simple Asymptotic Estimate for the Index of a Stable Distribution[J].JournaloftheRoyalStatisticalSociety,SeriesB,1980,42:83-87.

[27] Davison A C.Modelling Excesses Over High Thresholds[C]//Tiago de Oliveira,J.(Ed),Statistical Extremes and Applications.Reidel,Dordrecht,1984:461-482.

[28] Cs?rg?S,Deheuvels P,Mason D.Kernel Estimates of the Tail Index of a Distribution[J].AnnalsofStatistics,1985,13(3):1050-1077.

[29] De Haan.Estimation of the Minimum of a Function Using Order Statistics[J].JournaloftheAmericanStatisticalAssociation,1981,76:467-469.

[30] Bacro J N,Brito M.Strong Limiting Behaviour of a Simple Tail Pareto-index Estimator[J].StatisticsandDecision,1993,3:133-134.

[31] Smith R.Estimating Tails of Probability Distributions[J].AnnalsofStatistics,1987,15:1174-1207.

[32] Smith R.Extreme Value Analysis of Environmental Time Series:an Application to Trend Detection in Ground-level ozone[J].StatisticalScience,1989,4:367-393.

[33] Deheurels P,De Haan L,Peng L,etal.Comparison of Extreme Value Index Estimators[J].NEPTUNE.T400:EUR-09.

[34] Kratz M,Resnick S.The qq-estimator and Heavy Tails[J].StochasticModelsm,1996,12(4):699-724.

[35] Beirlant J,Vynckier P,Teugels J L.Tail Index Estimation,Pareto Quantile Plots,and Regression Diagnostics[J].Journal oftheAmericanStatisticalAssociation,1996,436:1659-1667.

[36] Fraga Alves M I,Gomes M I,De Haan L,etal.Mixed Moment Estimators and Location Invariant Alternatives[J].Extremes,2009,12:149-185.

[37] Resnick S,Starica C.Smoothing the Hill Estimator[J].AdvancesinAppliedProbability,1997,29:271-293.

[38] Drees H,De Haan L,Resnick S.How to Make a Hill Plot[J].AnnalsofStatistics,2000,28:254-274.

[39] Sousa B.A Contribution to the Estimation of the Tail Index of Heavy-tailed Distributions[D].The University of Michigan,2002.

[40] Hall P.Using the Bootstrap to Estimate Mean Square Error and Select Smoothing Parameters in Non-parametric Problems[J].JournalofMultivariateAnalysis,1990,32:177-203.

[41] Danielsson J.Using a Bootstrap Method Choose the Sample Fraction in Tail Index Estimation[J].JournalofMultivariateAnalysis,2001,76:226-248.

[42] 劉維奇,赫英迪,邢紅衛(wèi).選擇重尾閾值 K的Bootstrap方法[J].山西大學(xué)學(xué)報(bào):自然科學(xué)版,2010,4:508-512.

[43] 劉維奇,邢紅衛(wèi).重尾指數(shù)估計(jì)中閾值 K的簡(jiǎn)便優(yōu)化估計(jì)[J].系統(tǒng)工程理論與實(shí)踐,2010,30(8):1465-1470.

[44] de Haan,Peng L.Comparison of Tail Index Estimators[J].StatisticaNeerlandica,1998,52:60-70.

[45] Beirlant J,Dierckx G,Goegebeur Y,etal.Tail Index Estimation and an Exponential Regression Model[J].Extremes,1999,2:177-200.

[46] Feuerverger A,Hall P.Estimating a Tail Exponent by Modeling Departure from a Pareto Distribution[J].Annalsof Statistics,1999,27:760-781.

[47] Beirlant J,Dierckx G,Guillou A,etal.On Exponential Representations of Log-spacings of Extreme Order Statistics[J].Extremes,2002,5(2):157-180.

[48] Caeiro F,Gomes M I.A Class of Asymptotically Unbiased Semi-parametric Estimators of the Tail Index[J].Test,2002,11(2):345-364.

[49] Caeiro F,Gomes M I,Pestana D D.Direct Reduction of Bias of the Classical Hill Estimator[J].Revstat,2005,3(2):111-136.

[50] Gomes M I,Pestana D D.A Simple Second Order Reduced-bias Tail Index Estimator[J].JournalofStatisticalComputationandSimulation,2007,77(6):487-504.

[51] Gomes M I,Martins M J,Neves M M.Improving Second Order Reduced-bias Tail Index Estimation[J].Revstat,2007,5(2):177-207.

[52] Gomes M I,De Haan,Henriques R L.Tail Index Estimation for Heavy-tailed Models:Accommodation of Bias in Weighted Log-excesses[J].JournaloftheRoyalStatisticalSociety:SeriesB,2008,70(1):31-52.

[53] Gomes M I,Martins M J.“Asymptotically Unbiased”Estimators of the Tail Index Based on External Estimation of the Second Order Parameter[J].Extremes,2002,5(1):5-31.

[54] Beirlant J,Dierckx G,Guillou A.Estimation of the Extreme Value Index and Generalized Quantile Plots[J].Bernoulli,2005,11(6):949-970.

[55] Gomes M I,F(xiàn)raga Alves M I,Araújo Santos P.PORT Hill and Moment Estimators for Heavy-tailed Models[J].CommunicationsinStatisticsSimulationandComputation,2008,37:1281-1306.

[56] Falk M.Some Best Parameter Estimates for Distributions with Finite Endpoint[J].Statistics,1995,27:115-125.

[57] Müller S,Hüsler J.Iterative Estimation of the Extreme Value Index[J].MethodologyandComputinginAppliedProbability,2005,2:139-145.

[58] Weiss L.Asymptotic Inference About a Density Function at the end of Its Range[J].NavResLogistQ,1971,1:111-114.

[59] Peng Z,Nadarajah S.The Pickands’Estimator of the Negative Extreme Value Index[J].ActaScientiarumNaturalium UniversitatisPekinensis,2001,37:12-19.

[60] Fraga Alves M I.Weiss-Hill Estimator[J].Test,2001,10:203-224.

[61] Araújo Santos P,F(xiàn)raga Alves M I,Gomes M I.Peaks Over Random Threshold Methodology for Tail Index and Quantile Estimation[J].Revstat,2006,4:227-247.

[62] Fraga Alves M I.A Location Invariant Hill-type Estimator[J].Extremes,2001,4:199-217.

[63] Ling C,Peng Z,Nadarajah S.A Location Invariant Moment-type Estimator I[J].TheoryofProbabilityandMathematicalStatistics,2007,76:23-31.

[64] Ling C,Peng Z,Nadarajah S.A Location Invariant Moment-type Estimator II[J].TheoryofProbabilityandMathematicalStatistics,2007,77:177-189.

[65] Gray H L,Schucany W R.The Generalized Jackknife Statistic[M].New York:Marcel Dekker,1972.

[66] Falk M.Efficiency of Convex Combinations of Pickands Estimator of the Extreme Value Index[J].NonparametricStatistics,1994,4:133-147.

[67] Martins M J,Gomes M I,Neves M.Some Results on the Behavior of Hill’s Estimator[J].JournalofStatisticalComputationandSimulation,1999,63:283-297.

[68] Peng L.Asymptotically Unbiased Estimators for the Extreme-value Index[J].StatisticsandProbabilityLetters,1998,38(2):107-115.

[69] Gomes M I,Martins M J,Neves M.Alternatives to a Semi-parametric Estimator of Parameters of Rare Events-the Jackknife Methodology[J].Extremes,2000,3(3):207-299.

[70] Gomes M I,Pereira H,Miranda M C.Revisiting the Role of the Jackknife Methodology in the Estimation of a Positive Tail Index[J].CommunicationsinStatisticsTheoryandMethods,2005,34:319-335.

[71] Davydov Y,Paulauskas V,Rackauskas A.More on P-stable Convex Sets in Banach Spaces[J].JournalofTheoreticalProbability,2000,13:39-64.

[72] Paulauskas V.A new Estimator for a Tail Index[J].ActaApplicandaeMathematicae,2003,79:55-67.

[73] Qi Y.On the Tail Index of a Heavy Tailed Distribution[J].AnnalsoftheInstituteofStatisticalMathematics,2010,62:277-298.

Advanced in Heavy-tailed Distribution Tail Index Estimation

LIU Wei-qi,XING Hong-wei
(SchoolofManagement,ShanxiUniversity,Taiyuan030006,China)

Many studies show that the data in application fields,such as meteorology,hydrology,environment,telecommunications,insurance and finance,does not meet the normal distribution assumption,but illustrates spikes and heavy tail characteristics.In the last three decades,the research on heavy-tailed distributions and tail index estimation has been developed rapidly.We review the discovery process of heavy tailed distributions challenging the normal distribution assumption,and introduce several different definitions of the heavy-tailed distribution,extreme value theory and regular variation conditions;moreover,summarize different types of tail index estimators and methods of selecting the heavy tail threshold by development periods and method types,and discuss the characteristics and shortages of these methods,finally,in term of the deficiencies and limitations of current estimators,how to deepen and improve the problem are reviewed.

extreme value theory;heavy tail index estimator;heavy tail threshold;reduce-biased estimator

O212

A

0253-2395(2012)02-0163-11*

2012-03-16;

2012-03-19

山西省高校人文社科重點(diǎn)研究基地項(xiàng)目(2011305)

劉維奇(1963-),男,山西忻州人,博士,教授,主要從事金融工程與時(shí)間序列分析研究.Email:liuwq@sxu.edu.cn

猜你喜歡
尾部閾值定義
船舶尾部響應(yīng)特性試驗(yàn)與計(jì)算
超聲及磁共振診斷骶尾部藏毛竇1例
小波閾值去噪在深小孔鉆削聲發(fā)射信號(hào)處理中的應(yīng)用
基于自適應(yīng)閾值和連通域的隧道裂縫提取
比值遙感蝕變信息提取及閾值確定(插圖)
室內(nèi)表面平均氡析出率閾值探討
成功的定義
彎式尾部接頭注塑模具設(shè)計(jì)
修辭學(xué)的重大定義
山的定義