房婷婷,竇 燕
(新疆財經(jīng)大學(xué), 烏魯木齊 830012)
信度理論是一種重要的經(jīng)驗估費方法,精算師利用過去n年的索賠數(shù)據(jù)預(yù)測第n+1年的最優(yōu)保費,而研究信度保費最重要的環(huán)節(jié)是關(guān)于損失數(shù)據(jù)X=(X1,X2,…,Xn)的分布的討論。
經(jīng)驗表明:由于歷史數(shù)據(jù)的不穩(wěn)定性很難給出索賠數(shù)據(jù)的分布,有學(xué)者提出采用在更一般的分布框架下建立信度模型,這樣可以使估計結(jié)果具有更強的通用性和穩(wěn)健性。例如, Hassan Zadeh等[1]研究了Phase-type分布下的貝葉斯保費和信度保費。其次,經(jīng)典信度模型中使用的對稱損失函數(shù)僅關(guān)注了估計值的精確度,忽略了擬合度的重要性。因此,許多學(xué)者致力于研究非對稱損失函數(shù)下的信度保費。例如,溫利民等[2-3]分別在指數(shù)損失函數(shù)及Linex損失函數(shù)下推導(dǎo)了信度保費;王娜娜[4]在熵?fù)p失函數(shù)下推導(dǎo)了信度保費;張強等[5]在加權(quán)平衡損失函數(shù)下推導(dǎo)了信度保費;房婷婷等[6]在Mlinex損失函數(shù)下推導(dǎo)了信度保費。此外,在經(jīng)典信度模型中常假設(shè)索賠數(shù)據(jù)服從某個分布,實際上,歷史索賠數(shù)據(jù)X1,X2,…,Xn分布通常是未知的。在此情況下,胡瑩瑩等[7-8]研究了最大熵方法下的信度估計及純穩(wěn)健信度估計。章溢等[9]討論了概率密度函數(shù)的信度模型。李新鵬等[10]推導(dǎo)了具有風(fēng)險相依效應(yīng)的信度模型。
經(jīng)典信度理論中,確定合適的Xij|θi的分布是十分困難的,這是因為個體經(jīng)驗數(shù)據(jù)不能用某個特定的分布描述。因此,采用具有多樣性結(jié)構(gòu)的分布將使預(yù)測結(jié)果更加精確。進一步地,在索賠數(shù)據(jù)分布未知情況下,需要討論如何計算信度保費才更符合實際要求。而在建立信度模型時,使用非對稱損失函數(shù)可以避免由對稱損失函數(shù)引起的高保費征收問題,尋找合適的非對稱損失函數(shù)尤為必要。結(jié)合以上問題,本文以具有多樣性結(jié)構(gòu)的Phase-type分布為基礎(chǔ),首先討論了帶通貨膨脹因子的單合同信度保費和精確信度;再將信度估計結(jié)果推廣到多合同情況;最后,推導(dǎo)了平衡損失函數(shù)下的多合同信度保費及精確信度形式;最后進行數(shù)值模擬部分,展示模型的穩(wěn)健性。
Phase-type分布描述了具有有限個瞬時態(tài)和一個吸收態(tài)的馬爾可夫過程進入吸收態(tài)的時間分布。Phase-type分布有許多優(yōu)秀的性質(zhì),其一,它可以近似為任何一種分布;其二,用PH分布代替指數(shù)分布,使得其在算法上更易求出顯式解。這些性質(zhì)使得PH分布廣泛應(yīng)用于衛(wèi)生保健、金融、運輸?shù)阮I(lǐng)域,但在保險精算方面的研究卻少之又少。
考慮一個有n+1個狀態(tài)的連續(xù)時間馬氏鏈{X(t),t≥0},其中{1,2,…,n}為瞬時態(tài), {n+1}為吸收態(tài)。另外,假設(shè)n+1個狀態(tài)的初始概率為(π,πn+1),這里πn+1=1-π′1,1是元素為1的列向量。記無窮小生成元Q為
這里D0為n×n的矩陣,d1為n×1的列向量。由于Q為馬氏鏈的生成元,所以有
Dij≥0, for 1≤i≠j≤n
Dii<0, for 1≤i≤n
和
D01+d1=0
定義1[1]若馬氏鏈進入吸收態(tài){n+1}的時間分布為
X(t)=inf{t≥0,X(t)=n+1}
則稱X(t)為PH分布,記作X~PH(π,D0)。
根據(jù)定義,隨機變量X的概率密度函數(shù)有以下形式:
引理1[1]若X~PH(π,D0),則X的概率密度函數(shù)為
f(x)=π′exp(D0x)d1,x≥0
不失一般性地,D0可以寫成
P=I+(1/θ)D0
這里矩陣I為n階單位陣。因此,P可以寫作
(1)
且
引理2[1]X|θ~PH(π,D0)的密度函數(shù)可以寫成無窮個Erlang分布密度函數(shù)的和:
qn+1=π′Pn(I-P)1≥0,n=0,1,…
(2)
在經(jīng)典信度理論中,給定風(fēng)險參數(shù)Θ=θ時,索賠X1,X2,…,Xn是獨立同分布的,并且E(Xi|Θ)=μ(Θ),Var(Xi|Θ)=υ(Θ)。然而,每年的索賠數(shù)據(jù)會受到通貨膨脹因子的影響。因此,需要建立帶通貨膨脹因子的信度模型。假設(shè)某保單n年的索賠數(shù)據(jù)為X=(X1,X2,…,Xn),這些索賠數(shù)據(jù)的風(fēng)險參數(shù)為Θ,Θ的先驗分布為π(θ)。本節(jié)的目的是預(yù)測第n+1年的索賠。首先假設(shè)給定Θ=θ時,X1,X2,…,Xn條件獨立同分布,且
E(Xj|Θ)=rjμ(Θ)
Var(Xj|Θ)=r2jσ2(Θ)
j=1,2,…,n
(3)
其中r為每年的通貨膨脹因子,并記
(4)
定理1在假設(shè)條件(3)(4)下,Xn+1的最優(yōu)線性信度估計為
(5)
證明:
為得到Xn+1的最優(yōu)線性信度估計,首先最小化下式
(6)
對(6)關(guān)于α0和αj求偏導(dǎo)并令結(jié)果為0,有
基于式(3)(4),可得
(7)
(8)
聯(lián)立式(7)(8),有
因此,可得
綜上,定理1得證。
根據(jù)式(5),假設(shè)隨機變量Xi|Θ服從PH分布,則它可以寫成N個參數(shù)為Θ的指數(shù)分布的和,即
Xn+1=Y1+…+YN
(9)
這里Yj,j=1,2,…,N是相互獨立的指數(shù)分布。N表示馬氏鏈到達(dá)吸收態(tài)的轉(zhuǎn)移數(shù)且N~PHd(π,P),P如式(1)所示。則Xn+1的條件均值和條件方差可以寫成
rn+1μ(Θ)=E(Xn+1|Θ)=E(Y1|Θ)E(N)=
Θ-1E(N)
r2(n+1)υ(Θ)=Var(Xn+1|Θ)=
Θ-2(Var(N)+E(N))
(10)
因為N~PHd(π,P),易計算出式(10)的前半部分。特別地,若風(fēng)險參數(shù)Θ~Γ(Κ,γ),即
那么式(10)的后部分可以寫成
綜上,信度保費(5)可表示為
接下來討論帶通貨膨脹因子的精確信度。
Jewell[11]證明了在均方損失函數(shù)下,若給定Θ=θ時,損失X1,X2,…,Xn服從參數(shù)為θ的指數(shù)分布,且Θ的先驗分布π(θ)服從指數(shù)分布族,則貝葉斯保費具有信度保費的形式。對于帶通貨膨脹因子的信度模型,得到的結(jié)論如下。
定理2在假設(shè)條件(3)(4)下,給定Θ=θ時,若條件密度函數(shù)fXj|Θ(xj|θ)有線性指數(shù)分布族的形式:
且共軛先驗分布為
(11)
其中π(θ0)=π(θ1)=0,那么精確信度存在。
證明:
因為E(μ(Θ))=μ且
下面有
(q(θ))-k*e-θμ*k*
即葉斯保費E(Xn+1|X)具有信度保費的形式,精確信度存在。
下面討論PH分布下的精確信度形式。由式(9),有
Xi=Yi1+…+Yi,Ni,i=1,…,n+1
假設(shè)X1,X2,…,Xn+1相應(yīng)的嵌入式馬爾可夫鏈為U1,U2,…,Un+1,參數(shù)記為(π,D0)。給定Θ=θ時,變量U1,U2,…,Un+1是條件獨立的。另外假定:
1) 給定Θ=θ和i時,Yij,j=1,…,Ni為條件獨立同指數(shù)分布的隨機變量。
2)Ni,i=1,…,n+1為獨立同分布的隨機變量,且與Θ獨立。
3)Θ服從如式(11)所示的先驗分布。
因此,給定Θ=θ時,損失X1,X2,…,Xn+1獨立同分布且服從參數(shù)為(π,D0)的PH分布。那么
(12)
因為σ(X1,X2,…,Xn)是H的子集,在(12)兩邊取關(guān)于X1,X2,…,Xn的條件期望后會有
E(Yn+1,1|X1,X2,…,Xn)=
又因為
因此,
(13)
此時, 貝葉斯保費可以寫成如下形式
以上結(jié)果可以推廣到多合同情形。類似地,假設(shè)給定Θi=θi時,Xi1,…,Xin,i=1,…,m獨立同分布,且有E(Xij|Θi)=rjμ(Θi),Var(Xij|Θi)=r2jυ(Θi)。另外,記μ=E(μ(Θi)),υ=E(υ(Θi)),a=Var(μ(Θi))。由此易得帶有通貨膨脹因子的多合同模型下的信度保費及精確信度,下文不再贅述。
假設(shè)某保險公司有m份保單,第i份保單的索賠數(shù)據(jù)記作Xi=(Xi1,Xi2,…,Xin)′,i=1,…,m。每份保單的風(fēng)險參數(shù)記為Θi,先驗分布為π(θ)。本節(jié)的目標(biāo)是預(yù)測下一年的保費,即μn+1(Θi)=E(Xi,n+1|Θi)。下面給出一些假設(shè)條件和記號:
假設(shè)1給定Θi=θi時,Xi1,Xi2,…,Xin,i=1,2,…,m條件獨立同分布,并有
E(Xij|Θi)=μ(Θi),Var(Xij|Θi)=σ2(Θi)
假設(shè)2{(Xi,Θi),i=1,2,…,m}相互獨立,Θ1,…,Θm獨立同分布。并記
E(δ0i)=E(μ(Θi))=μ, Cov(δ0i,Xij)=si
Var(μ(Θi))=τ2,E(σ2(Θi))=σ2
其中δ0i(x)為第i份保單的目標(biāo)保費。
由Zellner[12]定義的平衡損失函數(shù)
(14)
可以得出如下結(jié)論。
定理3根據(jù)假設(shè)條件1、2及平衡損失函數(shù)(14),μ(Θi)的最優(yōu)線性非齊次估計為
證明:
由假設(shè)1、2易知,E(Xij)=μ,Var(Xij)=τ2+σ2,且
Cov(Xij,Xij′)=τ2,Cov(Xij,Xi′j′)=0,i≠i′,j≠j′
Cov(μ(Θi),Xij)=τ2,Cov(μ(Θi),Xi′j)=0,i≠i′
令
(15)
對式(15)關(guān)于α0求偏導(dǎo)并令結(jié)果為0,有
將α0代入Φ,那么
(16)
對式(16)關(guān)于αij′求偏導(dǎo)并令結(jié)果為0,則有
因此可得
則在平衡損失函數(shù)下,μ(Θi)的最優(yōu)線性非齊次估計為
綜上,定理3得證。
假定Xij|Θi~PH(π,D0),那么Xij可以寫成:
Xij=Yij1+Yij2+…+YijN
(17)
這里給定Θi=θi時,Yijl,l=1,2,…,N獨立同分布且服從參數(shù)為θi的指數(shù)分布。N表示馬氏鏈到達(dá)吸收態(tài)的轉(zhuǎn)移數(shù),N~PHd(π,P)。
定理4假設(shè)給定Θi=θi時,隨機變量Xi1|Θi,…,Xin|Θi獨立同分布且服從PH(π,D0)。 若Θi服從如下分布
(18)
則基于平衡損失函數(shù)式(14)得到信度保費估計為
證明:
Xij|Θi的條件均值和方差可以表示為
μ(Θi)=E(Xij|Θi)=
σ2(Θi)=Var(Xij|Θi)=
E2(Yij1|Θi)Var(N)+
E(N)Var(Yij1|Θi)=
所以有
又因為N~PHd(π,P),則
E(N)=π′(I-P)-11
E(N(N-1))=2π′P(I-P)-21
那么,
Var(N)+E(N)=E(N2)-E2(N)+E(N)=
E(N(N-1))+2E(N)-E2(N)=
2π′P(I-P)-21+2π′(I-P)-11-
(π′(I-P)-11)2=2π′(I-P)-21-
(π′(I-P)-11)2
另一方面,Θi服從式(18)所示分布,顯然有
綜上定理4得證。
溫利民等[13]得出了在平衡損失函數(shù)下精確信度存在的結(jié)論,即
由式(17),這里有
Xi,n+1=Yi,n+1,1+Yi,n+1,2+…+Yi,n+1,Nn+1
假設(shè)Xi1,Xi2,…,Xin+1相應(yīng)的嵌入式馬爾可夫鏈為Ji1,Ji2,…,Jin+1,參數(shù)是(π,D0)。給定Θi=θi,變量Ji1,Ji2,…,Jin+1是條件獨立的。此外,本文還假設(shè):
1) 給定i,j及Θi=θi時,Yijk,k=1,2,…,Nj為條件獨立同分布且服從指數(shù)分布。
2)Nj,j=1,…,n+1為獨立同分布隨機變量,并獨立于Θi。
3)Θi,i=1,…,k服從(18)的先驗分布。
基于以上假設(shè)條件,有
E(Yi,n+1,1|H)=
(19)
這里H=σ(Y1,1,1,…,YK,n,Nn,N1,…,Nn)??紤]在式(19)兩邊求關(guān)于Xi1,Xi2,…,Xin的條件期望。那么
E(Yi,n+1,1|Xi1,Xi2,…,Xin)=
進一步地,
E(Nn+1)E(Yi,n+1,1|H)
因此, 貝葉斯保費可以寫成
因為
E(N)=π′(I-P)-11
Var(N)+E(N)=2π′(I-P)-21-
(π′(I-P)-11)2
則
E(N)=2.06,Var(N)+E(N)=4.93
圖1 信度保費的MSE曲線
由圖1可以看出MSE隨著θ的增加而減小,如:
θ=187.78時,MSE=0.000 38
θ=241.58時,MSE=0.000 31
預(yù)測結(jié)果具有較高精度。
例2 取式(11)中Gamma先驗分布的參數(shù)為γ=1,K=2,通貨膨脹因子r=1.02。矩陣P為
令MSE1,MSE2分別表示定理1的信度保以及經(jīng)典信度保費的均方誤差,分別取n=5、10、15完成5 000次模擬,所得結(jié)果如表1所示。
表1 定理1的信度保以及經(jīng)典信度保費的均方誤差
由表1可知:PH分布下的信度保費的精確度遠(yuǎn)高于經(jīng)典信度保費,這是因為PH分布具有多樣性結(jié)構(gòu),提高了索賠數(shù)據(jù)分布的擬合度。
1) 由于服從PH分布的隨機變量的構(gòu)成特點,單合同的索賠數(shù)據(jù)是穩(wěn)定的并易于預(yù)測。
2) 考慮通貨膨脹因素的信度模型,預(yù)測的保費更符合實際情況。
3) 帶有非對稱損失函數(shù)的信度模型擬合優(yōu)度高,估計結(jié)果更準(zhǔn)確。
在帶有通脹因子和非對稱損失函數(shù)的信度模型的背景下,假設(shè)索賠數(shù)據(jù)對風(fēng)險是獨立的。然而在大多數(shù)情況下,索賠之間具有很強的依賴關(guān)系[14-15]。因此,在今后的工作中,可以針對索賠數(shù)據(jù)的相依性進行研究。