韓明
(寧波工程學(xué)院理學(xué)院,浙江 寧波 315211)
Pareto分布形狀參數(shù)的E-Bayes估計(jì)和多層Bayes估計(jì)及其應(yīng)用
韓明
(寧波工程學(xué)院理學(xué)院,浙江 寧波 315211)
給出了參數(shù)的E-Bayes估計(jì)的定義,對(duì)Pareto分布在尺度參數(shù)已知時(shí),在平方損失下給出了形狀參數(shù)的E-Bayes估計(jì)和多層Bayes估計(jì),并且用Monte Carlo方法給出了模擬算例.最后,結(jié)合高爾夫球手收入數(shù)據(jù)的實(shí)際問(wèn)題進(jìn)行了計(jì)算,結(jié)果表明本文提出的方法可行且便于應(yīng)用.
Pareto分布;E-Bayes估計(jì);多層Bayes估計(jì);尺度參數(shù);形狀參數(shù)
1972年,文獻(xiàn)[1]中提出了多層先驗(yàn)分布的想法、1997年,文獻(xiàn)[2]中提出了多層先驗(yàn)分布的構(gòu)造方法以來(lái),多層Bayes方法在參數(shù)估計(jì)方面取得了一些進(jìn)展(見文獻(xiàn) [3]).但用多層Bayes方法得到的結(jié)果一般都要涉及復(fù)雜積分的計(jì)算,有時(shí)甚至是一些高維的復(fù)雜積分,雖然有MCMC(Markov Chain Monte Carlo)等計(jì)算方法(見文獻(xiàn)[4]),但在有些問(wèn)題的應(yīng)用上還是不太方便,這在一定程度上制約了多層Bayes方法的應(yīng)用.在本文中我們將會(huì)看到,參數(shù)的E-Bayes估計(jì)與多層Bayes估計(jì)相比,在表達(dá)式上簡(jiǎn)單,在應(yīng)用上更方便一些.
Pareto分布是收入分配理論中的一種重要的統(tǒng)計(jì)分布,最初是由意大利人Pareto作為收入分布于1897年提出來(lái)的.Pareto是意大利工程師,社會(huì)學(xué)家,經(jīng)濟(jì)學(xué)家,其中以經(jīng)濟(jì)學(xué)家的身份最為著名.通過(guò)對(duì)有關(guān)收入分配的研究,Pareto發(fā)現(xiàn)一國(guó)之內(nèi)人們的收入在高于某個(gè)值時(shí)的分布與社會(huì)經(jīng)濟(jì)結(jié)構(gòu)和“收入”的定義無(wú)關(guān),具有普適性,大部分財(cái)富是集中在少數(shù)人手里的(20%的人占有80%的財(cái)富).此后,人們廣泛地將其用來(lái)描述自然和社會(huì)現(xiàn)象.1963年,曼德布羅特使用Pareto分布描述投機(jī)市場(chǎng)收益率的分布,1965年法瑪用Pareto分布研究過(guò)投資組合問(wèn)題.這之后的很長(zhǎng)時(shí)間,Pareto分布在主流金融領(lǐng)域默默無(wú)聞,直到1990年后,隨著對(duì)風(fēng)險(xiǎn)管理的重視,Pareto分布重新登上金融舞臺(tái).例如,城市人口容量,股票價(jià)格的波動(dòng),保險(xiǎn)風(fēng)險(xiǎn)等,都可以用Pareto分布來(lái)描述,因此對(duì)Pareto分布的研究具有重要的理論和實(shí)際應(yīng)用價(jià)值.
Arnold在文獻(xiàn)[5]中,比較全面地研究了 Pareto分布的有關(guān)問(wèn)題.在文獻(xiàn)[6]中,介紹了 Pareto分布 (特別是 Pareto分布與金融中的厚尾分布),并對(duì) Pareto分布的參數(shù)給出了Bayes估計(jì)及其應(yīng)用.在文獻(xiàn)[7]中,對(duì)Pareto分布的參數(shù),討論了LINEX損失下參數(shù)的經(jīng)驗(yàn)Bayes估計(jì).在文獻(xiàn)[8]中,對(duì)Pareto分布的參數(shù),根據(jù)文獻(xiàn)[9]中提出的E-Bayes估計(jì)法,在復(fù)合LINEX對(duì)稱損失下給出了參數(shù)的Bayes估計(jì)和E-Bayes估計(jì)及其應(yīng)用.
本文將在第二節(jié)中,給出參數(shù)的E-Bayes估計(jì)的定義,并在此基礎(chǔ)上給出Pareto分布形狀參數(shù)的E-Bayes估計(jì);在第三節(jié)中,給出Pareto分布形狀參數(shù)的多層Bayes估計(jì);在第四節(jié)中,給出模擬算例;在第五節(jié)中,給出應(yīng)用實(shí)例.
以下首先給出參數(shù)的 E-Bayes估計(jì)的定義,然后在此基礎(chǔ)上給出 Pareto分布參數(shù)的E-Bayes估計(jì).
2.1 E-Bayes估計(jì)的定義
對(duì)0<a<1,b越大,Gamma分布密度函數(shù)的尾部越細(xì).根據(jù)Bayes估計(jì)的穩(wěn)健性(見文獻(xiàn)[10]),尾部越細(xì)的先驗(yàn)分布常會(huì)造成Bayes估計(jì)的穩(wěn)健性越差,因此b不宜過(guò)大,應(yīng)該有一個(gè)界限.設(shè)b的上界為c,其中c>0為常數(shù).這樣可以確定超參數(shù)a和b的范圍為0<a<1,0<b<c(常數(shù)c的具體確定,見后面的應(yīng)用實(shí)例).
2.2 λ的E-Bayes估計(jì)
定理2.2.1 設(shè)x1,x2,···,xn為來(lái)自Pareto分布(1)的樣本觀察值,在尺度參數(shù)α已知時(shí),若λ的先驗(yàn)分布為Gamma分布,其密度函數(shù)由(3)式給出,超參數(shù)a和b的先驗(yàn)分布分別為(0,1)和(0,c)上的均勻分布,在a和b獨(dú)立時(shí),則有如下結(jié)論:
若λ的先驗(yàn)分布為Gamma分布,其密度函數(shù)由(3)式給出,超參數(shù)a和b的先驗(yàn)分布分別為(0,1)和(0,c)上的均勻分布,在a和b獨(dú)立時(shí),則λ的多層先驗(yàn)密度函數(shù)為
定理3.1 設(shè)x1,x2,···,xn為來(lái)自Pareto分布(1)的樣本觀察值,在尺度參數(shù)α已知時(shí),若λ的多層先驗(yàn)密度函數(shù)由(4)式給出,則在平方損失下λ的多層Bayes估計(jì)為
以下采用Monte Carlo方法進(jìn)行模擬計(jì)算.在模擬計(jì)算中參數(shù)估計(jì)的精度采用指標(biāo)––參數(shù)估計(jì)的平均偏差,其定義如下:
在Pareto分布中,給定尺度參數(shù)α=100和形狀參數(shù)λ=3時(shí),對(duì)n=10,30,50,100和c=0.1,0.5,1,用R軟件并采用Monte Carlo方法進(jìn)行模擬計(jì)算,每種情況均進(jìn)行1000次模擬計(jì)算,其計(jì)算結(jié)果如表1所示.
從表 1的計(jì)算結(jié)果來(lái)看,對(duì)相同的 n(n=10,30,50,100)和不同的 c(c=0.1,0.5,1),和的計(jì)算結(jié)果都是比較穩(wěn)健的;對(duì)相同的n(n=10,30,50,100)和相同的c(c= 0.1,0.5,1),和的計(jì)算結(jié)果比較接近.
表1 △EB和△HB的模擬計(jì)算結(jié)果
表1 △EB和△HB的模擬計(jì)算結(jié)果
nc △λEB△λHBn c △λEB△λHB0.1 0.166 927 288 0.167 027 543 0.1 0.110 346 873 0.110 333 778 10 0.5 0.168 414 045 0.169 209 135 50 0.5 0.110 880 019 0.110 893 966 1.0 0.178 816 928 0.179 310 887 1.0 0.111 883 383 0.111 884 211 0.1 0.130 214 005 0.130 338 976 0.1 0.076 230 148 0.076 240 283 30 0.5 0.133 002 473 0.132 932 032 100 0.5 0.076 492 109 0.076 488 513 1.0 0.131 759 074 0.131 676 551 1.0 0.076 542 861 0.076 550 125
文獻(xiàn)[5]中給出了 50名收入超過(guò) 70000美元的高爾夫球手,他們到1980年為止的收入的數(shù)據(jù)如表2所示(單位:1000美元),并且這些數(shù)據(jù)服從尺度參數(shù)為 α=703,形狀參數(shù)為λ=2.23的Pareto分布.
表2 表高爾夫球手收入的數(shù)據(jù)
根據(jù)表2、定理2.2.1和定理3.1,λ的E-Bayes和多層Bayes估計(jì)的計(jì)算結(jié)果,如表3所示(c=0.1,0.3,0.5,1,1.5,2).
表3EB和HB的計(jì)算結(jié)果
表3EB和HB的計(jì)算結(jié)果
c 0.1 0.3 0.5 1 1.5 2︿λEB2.294 2 2.304 7 2.315 2 2.268 8 2.244 0 2.220 0︿λHB2.297 7 2.306 9 2.315 7 2.278 8 2.266 3 2.258 8︿λ-B0.003 5 0.002 2 0.000 5 0.010 0 0.022 3 0.038 8
從表3可以看出,對(duì)不同的c(c=0.1,0.3,0.5,1,1.5,2),和都是穩(wěn)健的;對(duì)相同的c(c=0.1,0.3,0.5,1,1.5,2),和比較接近.
由于對(duì)不同的c(c=0.1,0.3,0.5,1,1.5,2),和都是穩(wěn)健的,因此在應(yīng)用中,作者建議:c在0.1,0.3,0.5,1,1.5,2居中附近取值,如取c=1.
根據(jù)文獻(xiàn)[5],表2的數(shù)據(jù)來(lái)自尺度參數(shù)為α=703和形狀參數(shù)為λ=2.23的Pareto分布.根據(jù)表3可以得到與λ=2.23的偏差:
其計(jì)算結(jié)果如表4所示.
表4△EB和△HB的計(jì)算結(jié)果
表4△EB和△HB的計(jì)算結(jié)果
c 0.1 0.3 0.5 1 1.5 2△︿λEB0.064 2 0.074 7 0.085 2 0.038 8 0.014 0 0.010 0△︿λHB0.067 7 0.076 9 0.085 7 0.048 8 0.036 3 0.028 8
從表4可以看出,
因此在c(c=0.1,0.3,0.5,1,1.5,2)時(shí),EB、HB與λ=2.23的偏差都很小,并且EB的偏差比HB的偏差小,所以從這個(gè)意義上說(shuō)E-Bayes估計(jì)比多層Bayes估計(jì)的精度更高.
從表 3可以看出,本文的計(jì)算結(jié)果與文獻(xiàn) [8]中在復(fù)合 LINEX對(duì)稱損失下給出的 λ的Bayes估計(jì)和E-Bayes估計(jì)的計(jì)算結(jié)果比較接近.
本文對(duì)Pareto分布在尺度參數(shù)為已知時(shí),在平方損失下給出了形狀參數(shù)的E-Bayes估計(jì)(定理2.2.1)和多層Bayes估計(jì)(定理3.1),并且給出了模擬算例和應(yīng)用實(shí)例.
作者認(rèn)為,提出一種新的參數(shù)估計(jì)方法,必須回答兩個(gè)問(wèn)題:第一個(gè)問(wèn)題,新的估計(jì)方法與已有估計(jì)方法(計(jì)算)結(jié)果的差異有多大;第二個(gè)問(wèn)題,新的估計(jì)方法與已有估計(jì)方法相比,有哪些優(yōu)點(diǎn).
至于第二個(gè)問(wèn)題——E-Bayes估計(jì)法的優(yōu)點(diǎn),從定理2.2.1和定理3.1的表達(dá)式上看,顯然λ的E-Bayes估計(jì)比多層Bayes估計(jì)簡(jiǎn)單.另外,從模擬算例和應(yīng)用實(shí)例的具體計(jì)算中,我們也可以體驗(yàn)到E-Bayes估計(jì)比多層Bayes估計(jì)簡(jiǎn)單,E-Bayes估計(jì)法在應(yīng)用上更方便一些.
關(guān)于E-Bayes估計(jì)法的其它優(yōu)點(diǎn),還有待進(jìn)一步研究.關(guān)于E-Bayes估計(jì)法的其他研究,見文獻(xiàn)[11-12]等.
[1]Lindley D V,Smith A F M.Bayes estimaters for the linear model[J].Journal of the Royal Statistical Society,Series B,1972,34:1-41.
[2]韓明.多層先驗(yàn)分布的構(gòu)造及其應(yīng)用[J].運(yùn)籌與管理,1997,6(3):31-40.
[3]Ando T,Zellner A.Hierarchical Bayesian analysis of the seemingly unrelated regression and simultaneous equations models using a combination of direct monte Carlo and importance sampling techniques[J]. Bayesian Analysis,2010,5(1):65-96.
[4]Andrieu C,Thoms J.A tutorial on adaptive MCMC[J].Statistics and Computing,2008,18(4):343-373.
[5]Arnold B C.Pareto Distributions[M].2nd ed.London/Boca Raton:Chapman and Hall/CRC,2015.
[6]韓明.貝葉斯統(tǒng)計(jì)學(xué)及其應(yīng)用[M].上海:同濟(jì)大學(xué)出版社,2015.
[7]康會(huì)光,師義民.LINEX損失下Pareto分布參數(shù)的經(jīng)驗(yàn)Bayes估計(jì)[J].純粹數(shù)學(xué)與應(yīng)用數(shù)學(xué),2001,17(2):169-171.
[8]韋程?hào)|,韋師,蘇韓.復(fù)合LINEX對(duì)稱損失下Pareto分布形狀參數(shù)的E-Bayes估計(jì)及其應(yīng)用[J].統(tǒng)計(jì)與決策,2009,17:7-9.
[9]韓明.Pascal分布的參數(shù)估計(jì)[J].純粹數(shù)學(xué)與應(yīng)用數(shù)學(xué),2006,22(4):510-515.
[10]Berger J O.Statistical Decision Theory and Bayesian Analysis[M].2nd ed.New York:Springer-Verlag,1985.
[11]Han M.E-Bayesian estimation of failure probability and its application[J].Mathematical and Computer Modelling,2007,45:1272-1279.
[12]Han M.E-Bayesian estimation of the reliability derived from binomial distribution[J].Applied Mathematical Modelling,2011,35:2419-2424.
The E-Bayesian estimation and hierarchical Bayesian estimation of shape parameter for Pareto distribution and its applications
Han Ming
(School of Science,Ningbo University of Technology,Ningbo 315211,China)
In this paper,the definition of E-Bayesian estimation of the parameter is provided;moreover,for Pareto distribution,under the condition of the scale parameter is known,based on the square error loss function,formulas of E-Bayesian estimation and hierarchical Bayesian estimation for the shape parameter are also provided,and using the Monte Carlo method simulation example is given.Finally,combined with the golfer income data practical problem are calculated,the results show that the proposed method is feasible and convenient for application.
Pareto distribution,E-Bayesian estimation,hierarchical Bayesian estimation,scale parameter,shape parameter
O213.2
A
1008-5513(2016)03-0235-08
10.3969/j.issn.1008-5513.2016.03.002
2015-11-21.
寧波市自然科學(xué)基金(2013A610108).
韓明(1961-),博士,教授,研究方向:數(shù)理統(tǒng)計(jì)與可靠性理論.
2010 MSC:62F15
純粹數(shù)學(xué)與應(yīng)用數(shù)學(xué)2016年3期