国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Tweedie和零調(diào)整逆高斯回歸的索賠額模型

2010-10-21 06:25:20黃順林
統(tǒng)計(jì)與決策 2010年4期
關(guān)鍵詞:泊松高斯分布保單

黃順林,張 穎,陳 娜

(1.南京財(cái)經(jīng)大學(xué) 應(yīng)用數(shù)學(xué)學(xué)院,南京 210046;2.中國人民大學(xué) 統(tǒng)計(jì)學(xué)院,北京 100872;3.南京郵電大學(xué) 通達(dá)學(xué)院,南京 210003)

0 引言

在財(cái)產(chǎn)保險中,保險定價、損失理賠是保險業(yè)務(wù)的核心問題,而保費(fèi)定價的基礎(chǔ)就是對所考慮險種索賠金額損失分布的精確估計(jì),因此,財(cái)產(chǎn)損失分布建模,是精算師的一項(xiàng)極為重要的工作。一般來說,不同保險標(biāo)的財(cái)產(chǎn)損失具有不同的分布模型,因此在早期的研究中,人們通常針對具體險種的歷史損失數(shù)據(jù),選擇理論模型,然后再利用實(shí)際數(shù)據(jù)進(jìn)行參數(shù)估計(jì)和擬合檢驗(yàn)。Hogg等(1984)[1]給出了很多索賠額分布的可能選擇。由于索賠額的損失分布通常是連續(xù)右偏的分布,所以常常使用伽瑪分布、逆高斯分布、對數(shù)正態(tài)分布和帕累托分布來對索賠額進(jìn)行量化。在應(yīng)用中,韓天雄[2]根據(jù)具體險種特點(diǎn),提出構(gòu)造索賠額密度函數(shù)的修正方法來擬合索賠額分布,達(dá)到了比較理想的擬合效果。但是,如果統(tǒng)計(jì)數(shù)據(jù)中含有與索賠額相關(guān)的風(fēng)險因素信息時,直接對索賠數(shù)據(jù)進(jìn)行擬合就不是很有用,因?yàn)樗鼪]有把所觀察到的風(fēng)險因素信息考慮在內(nèi)。廣義線性模型將經(jīng)典線性模型中的因變量的正態(tài)假設(shè)放寬為具有離散參數(shù)的指數(shù)型分布,并通過聯(lián)結(jié)函數(shù)將因變量和解釋變量之間的關(guān)系設(shè)定為非線性關(guān)系,從而克服了經(jīng)典線性模型在應(yīng)用上的局限性。廣義線性模型因此在精算學(xué)的各個領(lǐng)域中得到廣泛運(yùn)用。

在對索賠額建立廣義線性模型時,傳統(tǒng)上是把索賠額分為零索賠額和非零索賠額來考慮,先對零索賠額建立以“索賠發(fā)生與否”為因變量的模型,再對非零索賠額建立模型,然后把兩個模型的結(jié)果合并,來對索賠額進(jìn)行預(yù)測分析。如Haberman和Renshaw(1996)[3]基于非零索賠額與風(fēng)險因素的關(guān)系建立了索賠額模型,得到非零索賠額的估計(jì)和風(fēng)險因素的影響,然后再考慮索賠發(fā)生的概率,最后把兩者結(jié)合在一起,對索賠額進(jìn)行了分析研究。之后的許多研究大多是在此基礎(chǔ)上發(fā)展的,而把零索賠額和非零索賠額作為整體來考慮建立模型的很少,如 Jφrgensen和 de Souza(1994)[4]和 Smyth和Jφrgensen(2002)[5]基于復(fù)合泊松分布,并對期望值和離散參數(shù)分別建立與風(fēng)險因素的關(guān)系,對索賠額進(jìn)行了研究。

本文將以零索賠額和非零索賠額的整體作為研究對象,基于Tweedie分布族和零調(diào)整逆高斯分布建立索賠額回歸模型,并以汽車第三者責(zé)任保險的損失數(shù)據(jù)為例,應(yīng)用這兩個回歸模型。

1 Tweedie和零調(diào)整逆高斯回歸模型

1.1 Tweedie回歸模型

Tweedie分布族是指數(shù)散度模型中的一類,一般用Twp(θ,φ)來表示,其中,θ為規(guī)范參數(shù),φ為離散參數(shù)。Tweedie分布族由其方差函數(shù)V(μ)=μp完全確定,p取值于 (-∞,0)∪[1,+∞)。它包括了幾個常見重要分布作為其特例:p=0,1,2,3分別對應(yīng)于正態(tài)分布、泊松分布、伽瑪分布和逆高斯分布。在1<p<2 時,相應(yīng)的 Twp(θ,φ)是一個復(fù)合泊松分布,即 y=x1+x2…+XC,C服從泊松分布,xj獨(dú)立且服從伽瑪分布,則y就服從Twp(θ,φ)(1<p<2)。

實(shí)際中許多保單都允許多次索賠,令Ni表示第i個風(fēng)險類別的索賠次數(shù),ωi表示第i個風(fēng)險類別的風(fēng)險個數(shù),yi表示第i個風(fēng)險類別的每單位索賠額隨機(jī)變量,i=1,2,…,n。假設(shè)Ni服從泊松分布,每次索賠額獨(dú)立且服從伽瑪分布,則yi服從 Twp(θi,φi)(1<p<2)分布,其在零點(diǎn)有一個集中概率,在大于零時,是連續(xù)分布。

以Tweedie分布為因變量的分布建立廣義線性模型:

其中xi=(xi1,…,xiq)T是由q個分類變量構(gòu)成的向量,T表示轉(zhuǎn)置,β是q×1階的參數(shù)向量。

回歸參數(shù)β可用極大似然法估計(jì),其Fisher得分更新方程為:

可以看出這與加權(quán)最小二乘法的估計(jì)方程具有相同的形式,只是需要迭代使用,所以模型的極大似然估計(jì)等價于迭代加權(quán)最小二乘估計(jì)。參數(shù)估計(jì)的標(biāo)準(zhǔn)誤可以從Fisher信息矩陣的逆中得到,F(xiàn)isher信息矩陣為:

Δ近似服從自由度為n-q的卡方分布。因此,如果模型是適當(dāng)?shù)模瑒t根據(jù)觀察數(shù)據(jù)與模型計(jì)算的Δ值應(yīng)該接近n-q。

1.2 零調(diào)整逆高斯回歸模型

把索賠額分為零索賠額和非零索賠額考慮時,先對零索賠額建立以“索賠發(fā)生與否”為因變量的logistic回歸模型,再對非零索賠額建立伽瑪或逆高斯等回歸模型,然后把兩個模型的結(jié)果合并,來對索賠額進(jìn)行預(yù)測分析。而零調(diào)整逆高斯回歸模型把這兩個模型合并在一個模型中,直接對索賠額建立預(yù)測分析模型。

假定y表示索賠額,則其分布是離散與連續(xù)相混合的。假定發(fā)生索賠的概率為π,非零索賠額的密度函數(shù)為h(y),則y的密度函數(shù)為:

若假設(shè)“索賠發(fā)生與否”這個二元隨機(jī)變量服從參數(shù)為π的貝努利分布,非零索賠額服從逆高斯分布IG(μ,σ2),則索賠額服從零調(diào)整逆高斯分布。其期望和方差分別為:

以零調(diào)整逆高斯分布作為因變量的分布可建立零調(diào)整逆高斯回歸模型,其π、μ和σ都可以是解釋變量的函數(shù):

其中 g1、g2、g3是聯(lián)結(jié)函數(shù),x、z、w 是由解釋變量構(gòu)成的向量,β、γ、λ是相應(yīng)的需要估計(jì)的參數(shù)向量。模型的參數(shù)可使用Rigby和 Stasinopoulos(2005)[6]介紹的backfitting算法進(jìn)行估計(jì),利用統(tǒng)計(jì)軟件R的gamlss模塊可以實(shí)現(xiàn)。

2 在汽車保險定價中的應(yīng)用

下面用汽車第三者責(zé)任保險的一組損失數(shù)據(jù)討論Tweedie回歸模型與零調(diào)整逆高斯回歸模型在汽車保險定價中的具體應(yīng)用 (數(shù)據(jù)來源http://www.statsci.org/data/general/motorins.html)。該數(shù)據(jù)包含的變量有:每年行駛里程數(shù)(5個水 平 : <1000、1000 ~15000、15000 ~20000、20000 ~25000、 >25000;用K表示);地區(qū)(7個地理區(qū)域,用Z表示);無賠款折扣等級(7個等級,用 B表示);車型(9個水平,用 M表示);保單年數(shù),索賠次數(shù)和總索賠額。

設(shè)y表示每保單年數(shù)的索賠額,將每年行駛里程數(shù)、地區(qū)、無賠款折扣等級、車型作為解釋變量來對索賠額建立Tweedie回歸模型與零調(diào)整逆高斯回歸模型。

首先建立Tweedie回歸模型,選擇對數(shù)聯(lián)結(jié)函數(shù),即

其中 β=(β0,β1,…,β28)T,x=(1,x1,x2,…,x28)T,參數(shù) β0對應(yīng)截距項(xiàng),β1至β28分別是對應(yīng)5個里程數(shù)、7個地區(qū)、7個折扣等級、9種車型的系數(shù)。

先用極大似然法估計(jì)參數(shù)p,調(diào)用R軟件中的tweedie模塊得到p=1.53。然后運(yùn)用R軟件中的statmod模塊得到模型擬合結(jié)果。從結(jié)果(具體結(jié)果表略)中可以看出,大部分參數(shù)的估計(jì)值都是顯著的,而且偏差為48217/40=1205,自由度為2157,說明模型整體擬合的效果比較理想。

以對應(yīng)于地區(qū)1、年行駛里程數(shù)小于1000公里、無賠款折扣等級1、車型1為基準(zhǔn)的保單年索賠額的估計(jì)值為713.37,其他類別保單的年索賠額為基準(zhǔn)類別的年索賠額乘以相應(yīng)的eβ^。下面考慮各個風(fēng)險因素對索賠額的具體影響。除了年行駛里程數(shù)水平3,其對索賠額的影響是單調(diào)的,隨著行駛里程數(shù)的增加,索賠額也相應(yīng)增加。就無賠款折扣等級而言,其對索賠額的影響也近乎單調(diào)的,處在折扣的等級越高,其索賠額越低,風(fēng)險也就相對較小。在折扣等級7的索賠額只有等級1得索賠額的33%。對所處地區(qū)而言,地區(qū)1的風(fēng)險最大,地區(qū)7的風(fēng)險最小,其他地區(qū)的索賠額相差不大。從車型看,參數(shù)估計(jì)的顯著性普遍不是太顯著,可認(rèn)為車型對索賠額的影響不大,不過從估計(jì)的結(jié)果還是能發(fā)現(xiàn),車型4的風(fēng)險最小,車型5與車型8的風(fēng)險相對較高,而且是比較顯著的。

再對這組數(shù)據(jù)建立零調(diào)整逆高斯回歸模型:

這里μ和σ的聯(lián)結(jié)函數(shù)為對數(shù)聯(lián)結(jié)函數(shù),而π選用lo?gistic聯(lián)結(jié)函數(shù)。

選用與Tweedie回歸模型相同的基準(zhǔn)類別,并運(yùn)用R軟件中的gamlss模塊得到模型擬合結(jié)果:模型的偏差為25491,基準(zhǔn)類別的非零索賠額估計(jì)值為749.94,索賠發(fā)生概率的估計(jì)值為:

從實(shí)際數(shù)據(jù)看,基準(zhǔn)類別保單索賠是發(fā)生的,所以與實(shí)際相符,則索賠額的估計(jì)值為 749.94×0.998=748.21,與Tweedie回歸模型的估計(jì)值相差不大。其它類別保單的非零索賠額與索賠概率可從相應(yīng)的參數(shù)估計(jì)值中得到,例如對于地區(qū)5、年行駛里程數(shù)20000~25000公里、無賠款折扣等級6、車型4的保單,其非零索賠額估計(jì)值為749.94×0.84×1.62×0.38×0.52=201.65,索賠概率估計(jì)值為:

從參數(shù)估計(jì)結(jié)果看 (Tweedie回歸與零調(diào)整逆高斯回歸的參數(shù)估計(jì)結(jié)果表略),零調(diào)整逆高斯回歸模型得出的各風(fēng)險因素對索賠額的影響與Tweedie回歸模型基本相同。但由于這組數(shù)據(jù)的索賠概率很高,使得零調(diào)整逆高斯模型的擬合偏差較大,所以對這組損失數(shù)據(jù)來說,Tweedie回歸模型的整體擬合效果更好。

3 結(jié)束語

本文針對零索賠額和非零索賠額建立了Tweedie和零調(diào)整逆高斯回歸模型,并且給出參數(shù)估計(jì)方法和擬合檢驗(yàn)過程,結(jié)合實(shí)際案例進(jìn)行了系統(tǒng)的理論方法論述和比較分析,對于零索賠額和非零索賠額損失分布建模問題給出了一套完整、清晰的思路。

另外,在零調(diào)整逆高斯回歸模型中假定保單分為有索賠和無索賠兩類,而沒有考慮多次索賠的情形,在Tweedie回歸模型中,假定了保單的索賠次數(shù)服從泊松分布,每次索賠額獨(dú)立且服從伽瑪分布的情形。在進(jìn)一步的研究中我們可以把多次索賠的其他情形考慮進(jìn)去,不同的索賠次數(shù)分布與每次索賠額分布的假定,都會相應(yīng)產(chǎn)生不同的索賠額的分布,從而得到不同的回歸模型。比如,索賠次數(shù)的分布可以是負(fù)二項(xiàng)分布、零膨脹泊松分布等,每次索賠額分布可以是逆高斯分布、對數(shù)正態(tài)分布等。在具體應(yīng)用時,要根據(jù)損失數(shù)據(jù)的具體特點(diǎn)以及積累經(jīng)驗(yàn),來選取合適的模型。

[1]Hogg,R.V.,Klugman,S.A.Loss Distributions[M].New York:Wiley,1984.

[2]韓天雄.保險索賠額的分布及其應(yīng)用[J].華東師范大學(xué)學(xué)報(自然科學(xué)版),1997,(4).

[3]Haberman,S.,Renshaw,A.E.Generalized Linear Models and Actuarial Science[J].The Statistician,1996,45(4).

[4]Jφrgensen,B.,de Souza,M.Fitting Tweedie’s Compound Poisson Model to Insurance Claims Data[J].Scandinavian Actuarial Journal,1994,(1).

[5]Smyth,G.K.,Jφrgensen,B.Fitting Tweedie’s Compound Poisson Modelto Insurance ClaimsData:Dispersion Modelling[J].Astin Bulletin,2002,(32).

[6]Rigby,R.A.,Stasinopoulos,D.M.Generalized Additive Models for Location,Scale and Shape(with discussion)[J].Applied Statistics,2005,(54).

猜你喜歡
泊松高斯分布保單
人身險保單貼現(xiàn)制度本土化法律問題研究
上海保險(2023年11期)2023-12-15 07:55:26
消費(fèi)者要的是保單貼現(xiàn)而不是保單轉(zhuǎn)換
基于泊松對相關(guān)的偽隨機(jī)數(shù)發(fā)生器的統(tǒng)計(jì)測試方法
利用Box-Cox變換對移動通信中小區(qū)級業(yè)務(wù)流量分布的研究
帶有雙臨界項(xiàng)的薛定諤-泊松系統(tǒng)非平凡解的存在性
2種非對稱廣義高斯分布模型的構(gòu)造
一種基于改進(jìn)混合高斯模型的前景檢測
泊松著色代數(shù)
1<γ<6/5時歐拉-泊松方程組平衡解的存在性
一種改進(jìn)的混合高斯模型背景估計(jì)方法*
荣成市| 平原县| 军事| 正宁县| 甘泉县| 儋州市| 张家港市| 丹凤县| 东阳市| 昭通市| 十堰市| 莫力| 沁源县| 湖北省| 深圳市| 施秉县| 苗栗县| 礼泉县| 梓潼县| 留坝县| 延安市| 萨嘎县| 正安县| 湛江市| 武夷山市| 绥滨县| 商南县| 开封市| 于田县| 乐山市| 昆山市| 南投县| 镇远县| 安泽县| 中牟县| 斗六市| 荣成市| 景德镇市| 剑川县| 吴旗县| 稻城县|