徐曉嶺, 顧蓓青,王蓉華
(1.上海對(duì)外經(jīng)貿(mào)大學(xué) 統(tǒng)計(jì)與信息學(xué)院,上海 201620; 2.上海師范大學(xué) 數(shù)理學(xué)院,上海 200234)
?
【基礎(chǔ)理論與應(yīng)用研究】
壽命服從兩參數(shù)對(duì)數(shù)Laplace分布的統(tǒng)計(jì)分析方法研究
徐曉嶺1, 顧蓓青1,王蓉華2
(1.上海對(duì)外經(jīng)貿(mào)大學(xué) 統(tǒng)計(jì)與信息學(xué)院,上海 201620; 2.上海師范大學(xué) 數(shù)理學(xué)院,上海 200234)
首先提出了一種新的壽命分布——兩參數(shù)對(duì)數(shù)Laplace分布,研究該分布的密度函數(shù)、失效率函數(shù)的圖像特征以及數(shù)字特征,其次在全樣本、定數(shù)截尾樣本以及缺失數(shù)據(jù)場(chǎng)合下,分別研究了位置參數(shù)、刻度參數(shù)的點(diǎn)估計(jì)與區(qū)間估計(jì)問(wèn)題,為滿(mǎn)足實(shí)際工作者的需要,列出了與樞軸量對(duì)應(yīng)的分位數(shù)表,最后通過(guò)一個(gè)實(shí)例說(shuō)明方法的應(yīng)用。
兩參數(shù)對(duì)數(shù)Laplace分布;全樣本;定數(shù)截尾樣本;缺失數(shù)據(jù);點(diǎn)估計(jì);區(qū)間估計(jì)
稱(chēng)某產(chǎn)品的壽命T服從兩參數(shù)對(duì)數(shù)Laplace分布LNL(μ,β),記為T(mén)~LNL(μ,β),其分布函數(shù)FT(t)和密度函數(shù)fT(t)分別為
其中,-∞<μ<+∞稱(chēng)為位置參數(shù), β>0稱(chēng)為刻度參數(shù)。
若令X=lnT,則X服從位置參數(shù)μ、刻度參數(shù)β的兩參數(shù)對(duì)稱(chēng)Laplace分布,記為X~L(μ,β),其分布函數(shù)FX(x)和密度函數(shù)fX(x)分別為
特別地,當(dāng)取μ=0,此時(shí)稱(chēng)X服從單參數(shù)Laplace分布,記為X~L(β);而若取μ=0,β=1,此時(shí)X~L(1),稱(chēng)X服從標(biāo)準(zhǔn)Laplace分布。
兩參數(shù)對(duì)稱(chēng)Laplace分布由于它與正態(tài)分布相比具有尖峰厚尾的特性而使得它在工程科學(xué)、質(zhì)量控制、環(huán)境科學(xué)以金融等領(lǐng)域得到了廣泛的應(yīng)用。鑒于兩參數(shù)對(duì)數(shù)Laplace分布與兩參數(shù)對(duì)稱(chēng)Laplace分布的對(duì)數(shù)關(guān)系,所以關(guān)于兩參數(shù)對(duì)數(shù)Laplace分布的統(tǒng)計(jì)分析可以通過(guò)分析兩參數(shù)對(duì)稱(chēng)Laplace分布來(lái)實(shí)現(xiàn)。關(guān)于兩參數(shù)對(duì)稱(chēng)Laplace分布的統(tǒng)計(jì)分析及應(yīng)用已有許多文獻(xiàn)作了較為深入的研究。Pedro Puig和Michael A.Stephens在文獻(xiàn)[1]中通過(guò)4個(gè)實(shí)例研究了兩參數(shù)對(duì)稱(chēng)Laplace分布的擬合檢驗(yàn)問(wèn)題。王振杰等[2]推導(dǎo)了兩參數(shù)對(duì)稱(chēng)Laplace分布總體中位數(shù)的概率密度函數(shù),證明了位置參數(shù)的極大似然估計(jì)是無(wú)偏的。唐林俊等[3]通過(guò)對(duì)深滬兩地股票市場(chǎng)的股指收益率數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)兩地股票收益率分布均呈“尖峰厚尾”的特性,為此引入兩參數(shù)對(duì)稱(chēng)Laplace分布代替過(guò)去人們常用的正態(tài)分布去刻畫(huà)收益率分布,結(jié)果顯示Laplace分布比正態(tài)分布擬合效率有了明顯的提高。杜紅軍等[4]采用兩參數(shù)對(duì)稱(chēng)Laplace分布來(lái)刻畫(huà)尖峰厚尾性,給出了金融資產(chǎn)的VaR和CVaR風(fēng)險(xiǎn)的計(jì)算和估計(jì)。王炳章[5]證明了兩參數(shù)對(duì)稱(chēng)Laplace分布(原文獻(xiàn)稱(chēng)其為對(duì)稱(chēng)指數(shù)分布)位置參數(shù)的極大似然估計(jì)為樣本中位數(shù),并證明了位置參數(shù)的極大似然估計(jì)具有無(wú)偏性與強(qiáng)相合性,同時(shí)還證明了刻度參數(shù)的估計(jì)也具有強(qiáng)相合性。徐美萍等[6]研究單參數(shù)Laplace分布的貝葉斯點(diǎn)估計(jì),并用上證指數(shù)收益率數(shù)據(jù)作了實(shí)證分析。張永芳等[7]根據(jù)金融資產(chǎn)收益率的實(shí)際分布具有尖峰厚尾特性,引入兩參數(shù)對(duì)稱(chēng)Laplace分布,得到了風(fēng)險(xiǎn)價(jià)值VaR和條件風(fēng)險(xiǎn)價(jià)值CVaR的計(jì)算公式,并采用滬深股市的股票進(jìn)行了實(shí)證研究。趙志文等[8]研究?jī)蓚€(gè)單參數(shù)Laplace分布總體在數(shù)據(jù)有部分缺失的情形下參數(shù)的估計(jì)及相關(guān)假設(shè)檢驗(yàn)問(wèn)題。就目前關(guān)于兩參數(shù)對(duì)稱(chēng)Laplace分布的統(tǒng)計(jì)分析而言大都涉及參數(shù)的點(diǎn)估計(jì)(包括極大似然估計(jì)與貝葉斯估計(jì)等),而參數(shù)的區(qū)間估計(jì)的研究卻很少涉及。
利用高等數(shù)學(xué)的知識(shí)容易得到如下關(guān)于兩參數(shù)對(duì)數(shù)Laplace分布密度函數(shù)、失效率函數(shù)的圖像特征以及數(shù)字特征:
定理:設(shè)某產(chǎn)品的壽命T服從兩參數(shù)對(duì)數(shù)Laplace分布,T~LNL(μ,β),則T有如下特征性質(zhì):
2) 失效率函數(shù)λT(t)的圖像特征為:當(dāng)β<1時(shí),λT(t)在t∈(0,eμ)上嚴(yán)格單調(diào)增加,在t∈[eμ,+∞)上嚴(yán)格單調(diào)下降;當(dāng)β=1時(shí),λT(t)在t∈(0,eμ)上嚴(yán)格單調(diào)增加,在t∈[eμ,+∞)上嚴(yán)格單調(diào)下降;當(dāng)β>1時(shí),λT(t)在t∈(0,eμ)上嚴(yán)格單調(diào)下降,后嚴(yán)格單調(diào)增加,在t∈[eμ,+∞)上嚴(yán)格單調(diào)下降。
首先,分別給出單參數(shù)Laplace分布總體和兩參數(shù)對(duì)稱(chēng)Laplace分布總體全樣本場(chǎng)合下參數(shù)的極大似然估計(jì)。
引理1:設(shè)總體X服從單參數(shù)Laplace分布,X~L(β),X1,X2,…,Xn是來(lái)自總體X的容量為n的一個(gè)簡(jiǎn)單隨機(jī)樣本,其次序統(tǒng)計(jì)量記為X(1),X(2),…,X(n),則參數(shù)β的極大似然估計(jì)為
引理2:設(shè)X1,X2,…,Xn是來(lái)自總體X服從兩參數(shù)對(duì)稱(chēng)Laplace分布L(μ,β)的一個(gè)容量為n的簡(jiǎn)單隨機(jī)樣本,其對(duì)應(yīng)的樣本觀察值為x1,x2,…,xn,次序統(tǒng)計(jì)量記為X(1),X(2),…,X(n),對(duì)應(yīng)的次序觀察值為x(1),x(2),…,x(n),則
2) 刻度參數(shù)β的極大似然估計(jì)為:
2.1 位置參數(shù)μ的區(qū)間估計(jì)
于是F(μ)是僅含有參數(shù)μ的樞軸量,又F(μ)為μ的嚴(yán)格單調(diào)增函數(shù),且
由此,給定顯著性水平α,樞軸量F(μ)的上側(cè)1-α/2,α/2的分位數(shù)記為F1-α/2和Fα/2,易見(jiàn)參數(shù)μ的置信水平1-α的區(qū)間估計(jì)為:
于是F(μ)是僅含有參數(shù)μ的樞軸量,又F(μ)為μ的嚴(yán)格單調(diào)增函數(shù),且
由此,給定顯著性水平α,樞軸量F(μ)的上側(cè)1-α/2,α/2的分位數(shù)記為F1-α/2和Fα/2,易見(jiàn)參數(shù)μ的置信水平1-α的區(qū)間估計(jì)為
取樣本容量n=3(1)30,通過(guò)10 000次Monte-Carlo模擬得F(μ)的0.99,0.95,0.90,0.85,0.15,0.10,0.05,0.025,0.01的上側(cè)分位數(shù),如表1所示。
2.2 刻度參數(shù)β的區(qū)間估計(jì)
又
于是T(β)是僅含有參數(shù)β的樞軸量,又T(β)是β的嚴(yán)格單調(diào)減函數(shù)。
給定顯著性水平α,樞軸量T(β)的上側(cè)1-α/2,α/2的分位數(shù)分別記為T(mén)1-α/2和Tα/2,參數(shù)β的置信水平1-α的區(qū)間估計(jì)為
取樣本容量n=3(1)30,通過(guò)10 000次Monte-Carlo模擬得T(β)的0.99,0.95,0.90,0.85,0.15,0.10,0.05,0.025,0.01的上側(cè)分位數(shù),如表2所示。
2.3 模擬分析
給定置信水平1-α=0.90,取樣本容量n=5(5)30,參數(shù)真值取為μ=-5,0,5,β=0.5,1,2通過(guò)1 000次Monte-Carlo模擬得參數(shù)μ,β的區(qū)間估計(jì)的平均下限、平均上限和平均長(zhǎng)度,同時(shí)統(tǒng)計(jì)1 000次模擬所得的區(qū)間估計(jì)包含參數(shù)真值的次數(shù),結(jié)果如表3所示,其中k1,k2分別表示參數(shù)μ,β區(qū)間估計(jì)包含參數(shù)真值的次數(shù)。從中可以看到:
1) 固定參數(shù)真值,區(qū)間估計(jì)的長(zhǎng)度隨樣本容量的增加而變小,即區(qū)間估計(jì)愈精確;
2)k1,k2的值大多在900以上,這也說(shuō)明置信水平達(dá)到了0.90。
表1 樞軸量F(μ)的上側(cè)分位數(shù)
表2 樞軸量T(β)的上側(cè)分位數(shù)
續(xù)表(表2)
表3 兩參數(shù)對(duì)稱(chēng)Laplace分布參數(shù)μ,β區(qū)間估計(jì)的1 000次模擬
續(xù)表(表3)
μβnμ的區(qū)間估計(jì)平均下限平均上限平均長(zhǎng)度k1β的區(qū)間估計(jì)平均下限平均上限平均長(zhǎng)度k200.51210-0.43030.33550.76599060.26431.16410.899791115-0.30360.27960.58329030.28371.04720.763490520-0.24690.26270.50969020.28980.96960.679990625-0.23970.22470.46459010.29390.91970.625890330-0.21730.21260.43009000.30040.91450.614291510-0.84390.66701.51089000.52992.33371.803789915-0.61150.57261.18419020.56602.08901.522990620-0.51140.51251.02409010.57401.92061.346690325-0.47650.44780.92439070.59261.85441.261789930-0.44130.41890.86029100.59841.82191.223591210-1.65081.33602.98688981.06644.69613.629689915-1.17451.15532.32989001.13274.18033.047689820-1.00701.04492.05199161.14473.83012.685490325-0.92350.91861.84219111.18293.70152.518590830-0.85780.85611.71399261.20723.67542.468291350.512104.58645.33800.75169000.25831.13760.8792909154.69515.28460.58959010.28141.03830.7570901204.74825.26430.51619070.28990.96990.6800907254.76235.22370.46149070.29320.91750.6243910304.77485.20320.42849030.30060.91520.6146908104.14275.65771.51509130.52772.32361.7959917154.39245.58551.19319090.56402.08161.5176902204.50375.52991.02628990.58171.94651.3648899254.53095.45270.92189000.59081.84861.2578904304.57225.43110.85899000.60061.82851.2279911103.34456.38573.04129051.04854.61703.5685907153.79236.16932.37709121.10784.08852.9807903203.99376.01362.01999031.15913.87842.7193905254.06005.90031.84029001.18523.70852.5233900304.12155.83671.71519021.20913.68112.4720905
設(shè)總體T服從兩參數(shù)對(duì)數(shù)Laplace分布LNL(μ,β),T(1),T(2),…,T(r)是來(lái)自總體T的容量為n的前r個(gè)次序統(tǒng)計(jì)量。
令X=lnT,X(i)=lnT(i),i=1,2,…,r,則X~L(μ,β),而X(1),X(2),…,X(r)是來(lái)自總體X的容量為n的前r個(gè)次序統(tǒng)計(jì)量。
3.1 位置參數(shù)μ的點(diǎn)估計(jì)與區(qū)間估計(jì)
1) 當(dāng)r≥[n/2]+1時(shí),參數(shù)μ的點(diǎn)估計(jì)可取為
2) 當(dāng)r<[n/2]+1時(shí)
于是F(μ)是僅含有參數(shù)μ的樞軸量,又F(μ)為μ的嚴(yán)格單調(diào)增函數(shù),且
則參數(shù)μ的點(diǎn)估計(jì)為
給定顯著性水平α,樞軸量F(μ)的上側(cè)1-α/2,α/2的分位數(shù)記為F1-α/2和Fα/2,易見(jiàn)參數(shù)μ的置信水平1-α的區(qū)間估計(jì)為:
值得指出的是上述所得到的參數(shù)μ的區(qū)間估計(jì)對(duì)r≥[n/2]+1也是成立的。
于是F(μ)是僅含有參數(shù)μ的樞軸量,又F(μ)為μ的嚴(yán)格單調(diào)增函數(shù),且
給定顯著性水平α,樞軸量F(μ)的上側(cè)1-α/2,α/2的分位數(shù)記為F1-α/2和Fα/2,易見(jiàn)參數(shù)μ的置信水平1-α的區(qū)間估計(jì)為
值得指出的是上述所得到的參數(shù)μ的區(qū)間估計(jì)對(duì)r≥[n/2]+1也是成立的。
3.2 刻度參數(shù)β的點(diǎn)估計(jì)與區(qū)間估計(jì)
2) 構(gòu)造如下僅含有參數(shù)β的樞軸量:
又
于是T(β)是僅含有參數(shù)β的樞軸量,又T(β)是β的嚴(yán)格單調(diào)減函數(shù)。
則參數(shù)β的點(diǎn)估計(jì)為
給定顯著性水平α,樞軸量T(β)的上側(cè)1-α/2,α/2的分位數(shù)分別記為T(mén)1-α/2和Tα/2,參數(shù)λ的置信水平1-α的區(qū)間估計(jì)為
4.1 位置參數(shù)μ的點(diǎn)估計(jì)與區(qū)間估計(jì)
于是F(μ)是僅含有參數(shù)μ的樞軸量,又F(μ)為μ的嚴(yán)格單調(diào)增函數(shù),且
則參數(shù)μ的點(diǎn)估計(jì)為
給定顯著性水平α,樞軸量F(μ)的上側(cè)1-α/2,α/2的分位數(shù)記為F1-α/2和Fα/2,易見(jiàn)參數(shù)μ的置信水平1-α的區(qū)間估計(jì)為
于是F(μ)是僅含有參數(shù)μ的樞軸量,又F(μ)為μ的嚴(yán)格單調(diào)增函數(shù),且
則參數(shù)μ的點(diǎn)估計(jì)為
給定顯著性水平α,樞軸量F(μ)的上側(cè)1-α/2,α/2的分位數(shù)記為F1-α/2和Fα/2,易見(jiàn)參數(shù)μ的置信水平1-α的區(qū)間估計(jì)為
4.2 刻度參數(shù)β的點(diǎn)估計(jì)與區(qū)間估計(jì)
又
于是T(β)是僅含有參數(shù)β的樞軸量,又T(β)是β的嚴(yán)格單調(diào)減函數(shù)。
則參數(shù)β的點(diǎn)估計(jì)為
給定顯著性水平α,樞軸量T(β)的上側(cè)1-α/2,α/2的分位數(shù)分別記為T(mén)1-α/2和Tα/2,參數(shù)β的置信水平1-α的區(qū)間估計(jì)為
下面通過(guò)文獻(xiàn)[1]中所涉及的兩個(gè)服從兩參數(shù)對(duì)稱(chēng)Laplace分布X~L(μ,β)的實(shí)例數(shù)據(jù)說(shuō)明本文方法的應(yīng)用。
文獻(xiàn)[1]提供的100個(gè)紗線斷裂強(qiáng)度數(shù)據(jù),從小到大排序?yàn)椋?2,66,78,79,80,84,84,85,85,86,86,87,88,88,89,89,91,91,91,91,92,92,92,92,93,94,94,94,95,95,95,96,96,96,96,96,97,97,97,97,97,97,98,98,98,98,98,98,98,99,99,99,99,99,100,100,100,100,100,101,101,101,101,102,102,102,102,102,102,102,103,103,103,103,104,104,104,104,104,104,105,105,106,107,107,109,110,111,111,111,111,114,115,117,122,132,132,137,137,138。
1) 在全樣本場(chǎng)合下,易見(jiàn)參數(shù)的極大似然估計(jì)為
利用本文方法,通過(guò)Monte-Carlo模擬當(dāng)n=100時(shí)樞軸量F(μ)的上側(cè)0.975,0.95,0.05,0.025分位數(shù)分別為:1.558 69,1.618 75,2.606 81,2.776 97,樞軸量T(β)的上側(cè)0.975,0.95,0.05,0.025分位數(shù)分別為:272.172,291.44,679.648,758.688。于是可得參數(shù)μ的置信水平0.90,0.95的區(qū)間估計(jì)分別為:(97.460 5,101.357)和(97.064 4,101.748),而參數(shù)β的置信水平0.90,0.95的區(qū)間估計(jì)分別為:(5.505 79,12.839 7)和(4.932 2,13.748 7)
作為比較,參數(shù)μ的點(diǎn)估計(jì)也可取為:
作為比較,參數(shù)β的點(diǎn)估計(jì)也可取為
若給定置信水平0.90,0.95,則可知參數(shù)μ的區(qū)間估計(jì)分別為:(97.036 2,100.316)和(96.692 6,100.622),而參數(shù)β的區(qū)間估計(jì)分別為:(5.380 38,12.810 3)和(4.900 16,13.601 7)。
若給定置信水平0.90,0.95,則可知參數(shù)μ的區(qū)間估計(jì)分別為:(95.578 5,103.293)和(95.122,104.428),而參數(shù)β的區(qū)間估計(jì)分別為:(5.001 05,14.804 3)和(4.428 14,16.066 2)。
4) 若這100個(gè)數(shù)據(jù)僅保留15個(gè)數(shù)據(jù):x(1),x(2),x(3),x(4),x(5),x(12),x(25),x(83),x(86),x(87),x(92),x(93),x(94),x(95),x(100),此時(shí)r1=1,r2=2,r3=3,r4=4,r5=5,r6=12,r7=25,r8=83,r9=86,r10=87,r11=92,r12=93,r13=94,r15=100,而k=15,j=8。
參數(shù)μ的點(diǎn)估計(jì)為:
參數(shù)β的點(diǎn)估計(jì)為:
若給定置信水平0.90,0.95,則可知參數(shù)μ的區(qū)間估計(jì)分別為:(95.527 7,103.028)和(94.796 2,103.713),而參數(shù)β的區(qū)間估計(jì)分別為:(6.173 08,11.654 7)和(5.737 09,12.277 9)。
[1] PEDRO P,MICHAEL A S.Tests of Fit for the Laplace Distribution with Applications[J].Technometrics,2000,42(4):417-424.
[2] 王振杰,歐吉坤,曲國(guó)慶.一元Laplace分布的L1-范估計(jì)的無(wú)偏性[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2001,26(4):361-363.
[3] 唐林俊,楊虎.深滬股市收益率分布特征的統(tǒng)計(jì)分析[J].數(shù)理統(tǒng)計(jì)與管理,2004,23(5):1-4.
[4] 杜紅軍,劉小茂.拉普拉斯分布下的VaR和CVaR風(fēng)險(xiǎn)計(jì)算[J].應(yīng)用數(shù)學(xué),2006(S):225-228.
[5] 王炳章.對(duì)稱(chēng)指數(shù)分布的參數(shù)估計(jì)及其優(yōu)良性[J].煙臺(tái)大學(xué)學(xué)報(bào),2007,20(4):250-253.
[6] 徐美萍,段景輝.Laplace分布參數(shù)估計(jì)的損失函數(shù)和風(fēng)險(xiǎn)函數(shù)的Bayes推斷[J].統(tǒng)計(jì)與決策,2010(1):13-14.
[7] 張永芳,張全元.基于Laplace分布和CVaR的投資組合模型研究[J].重慶工商大學(xué)學(xué)報(bào),2014,31(4):1-7.
[8] 趙志文,劉洋萍,于薇.具有部分缺失數(shù)據(jù)的兩個(gè)拉普拉斯分布總體參數(shù)的估計(jì)與檢驗(yàn)[J].吉林師范大學(xué)學(xué)報(bào),2015(3):61-64.
[9] BAIN L J,ENGLEHART M.Interval Estimation for the Two Parameter Double Exponential Distribution[J].Technometrics,1973,15:875-887.
(責(zé)任編輯 唐定國(guó))
Statistical Analysis Method Study of the Life with Two-Parameter Logarithmic Laplace Distribution
XU Xiao-ling1, GU Bei-qing1, WANG Rong-hua2
(1.School of Statistics and Information, Shanghai University of International Businessand Economics, Shanghai 201620, China; 2.College of Mathematics and Physics,Shanghai Normal University, Shanghai 200234, China)
A new life distribution called two-parameter logarithmic Laplace distribution was proposed. The image characteristics of density function and failure rate function as well as the numerical characteristics were studied for this distribution. Then the point estimates and interval estimates of location parameter and scale parameter were respectively researched under complete sample, type-I censored sample and missing data. To meet the needs of practitioners, we listed parts of quantile tables of pivotal quantity. Finally, one example was illustrated for the application of methods.
two-parameter logarithmic Laplace distribution; complete sample; type-I censored sample; missing data; point estimate; interval estimate
2016-11-23;
2016-12-25
國(guó)家自然科學(xué)基金資助項(xiàng)目(11671264)
徐曉嶺 (1965—),男,博士,教授,主要從事可靠性統(tǒng)計(jì)研究。
10.11809/scbgxb2017.04.036
徐曉嶺, 顧蓓青,王蓉華.壽命服從兩參數(shù)對(duì)數(shù)Laplace分布的統(tǒng)計(jì)分析方法研究[J].兵器裝備工程學(xué)報(bào),2017(4):169-178.
format:XU Xiao-ling, GU Bei-qing, WANG Rong-hua.Statistical Analysis Method Study of the Life with Two-Parameter Logarithmic Laplace Distribution[J].Journal of Ordnance Equipment Engineering,2017(4):169-178.
O213
A
2096-2304(2017)04-0169-10