国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于分位回歸的風險保費預測

2016-10-17 10:02孟生旺
統(tǒng)計與信息論壇 2016年9期
關鍵詞:分位保單位數(shù)

楊 亮,孟生旺

(中國人民大學 a.應用統(tǒng)計科學研究中心; b.統(tǒng)計學院, 北京100872)

?

【統(tǒng)計應用研究】

基于分位回歸的風險保費預測

楊亮a,b,孟生旺a,b

(中國人民大學 a.應用統(tǒng)計科學研究中心; b.統(tǒng)計學院, 北京100872)

風險保費預測是非壽險費率厘定的重要組成部分。在傳統(tǒng)的分位回歸厘定風險保費中,通常假設分位數(shù)水平是事先給定的,缺乏一定的客觀性。為此,提出了一種應用分位回歸厘定風險保費的新方法?;谄飘a概率確定保單組合的總風險保費,建立個體保單的分位回歸模型,并與總風險保費建立等式關系,通過數(shù)值方法求解出分位數(shù)水平,實現(xiàn)對個體保單風險保費的預測。通過一組實際數(shù)據(jù)分析表明,該方法具有良好的預測效果。

保費原理;風險保費;分位回歸;Tweedie回歸

一、引 言

非壽險保費由純保費、風險附加、費用附加和利潤附加構成。純保費用于補償保險公司的期望賠款支出。風險附加用于支付實際損失中超過純保費的不利偏差所導致的額外賠款支出。費用附加用于支付保險公司的經(jīng)營管理費用。利潤附加是對保險業(yè)務占用資本金的一種合理補償。在保險實踐中,廣泛使用的費率厘定方法為:首先,應用廣義線性模型等方法預測純保費;其次,應用保費原理計算風險附加;最后,根據(jù)經(jīng)驗數(shù)據(jù)確定費用附加和利潤附加。純保費與風險附加之和稱為風險保費。

純保費的厘定方法主要包括廣義線性模型及其推廣模型。廣義線性模型作為非壽險費率厘定的標準方法,首次由McCullagh等人將其應用于精算領域[1]296-300,后來逐步得到廣泛應用[2][3]121[4]?;趶V義線性模型的費率厘定方法,通常假設因變量服從指數(shù)分布族,如索賠次數(shù)服從泊松分布或負二項分布,索賠強度服從伽馬分布或逆高斯分布,純保費服從Tweedie分布,并在此基礎上建立廣義線性模型對索賠頻率、索賠強度或純保費的均值進行預測。為了解決費率厘定中的一些特殊問題,如連續(xù)型協(xié)變量的非線性影響和因變量的組內相關性等,還可以將廣義線性模型進一步擴展。譬如,在廣義線性模型中引入連續(xù)型協(xié)變量的平滑函數(shù),就可以將廣義線性模型推廣到廣義可加模型,該模型解決了連續(xù)型協(xié)變量與因變量之間的非線性關系問題[5][6]136-174。如果將協(xié)變量的系數(shù)由固定未知參數(shù)擴展到服從特定分布的隨機參數(shù),就可以將廣義線性模型推廣到廣義線性混合模型,該模型可以有效地度量因變量的組內相依結構[7][8]9-21[9]。對位置參數(shù)、尺度參數(shù)、形狀參數(shù)同時建立回歸的廣義可加模型,是對廣義線性模型、廣義可加模型和廣義線性混合模型的進一步推廣,該模型可以從多個角度對研究對象進行刻畫[10]337-345[11]。

在純保費的基礎上,應用保費原理可以求得風險附加,然后將二者相加就得到了風險保費。常用的保費原理包括期望值原理和標準差原理。譬如,應用期望值原理計算的風險保費等于純保費加上純保費的一個百分比,而應用標準差原理計算的風險保費等于純保費加上標準差的若干倍。應用保費原理計算風險附加往往存在一定的理論缺陷,譬如,在期望值原理中,風險附加是純保費的一定比例,這就意味著純保費越大,損失的不確定性也越大,而現(xiàn)實情況顯然并非如此。在標準差原理中,雖然應用標準差在一定程度上反映了損失的不確定性,但對于長尾損失而言,標準差對不確定性的度量也不夠準確。

在預測純保費時,無論是應用廣義線性模型、廣義可加模型、廣義線性混合模型,還是應用對位置參數(shù)、尺度參數(shù)、形狀參數(shù)同時建立回歸的廣義可加模型,它們都要對因變量的分布類型做出假設,且預測結果容易受到數(shù)據(jù)中異常值的影響。在應用保費原理計算風險附加時,由于僅僅考慮了損失分布的期望值或標準差,未能準確反映損失的波動性和尾部特征,所以也會導致一定的偏差。

與均值回歸模型相比,分位回歸具有下述優(yōu)點:第一,分位回歸無需分布假設,增加了模型的靈活性;第二,參數(shù)估計受異常值的影響較小,估計結果更加穩(wěn)??;第三,分位回歸描述了自變量對因變量不同分位點的影響,可以更為有效地解釋分布的尾部特征。有鑒于此,基于分位回歸計算風險保費的應用受到很多關注[12-13]。但是,目前的研究成果僅僅討論了在個體保單層面應用分位回歸的問題,譬如在99%的可靠性水平下,把保單損失的99%分位數(shù)作為風險保費,然后把每份保單的風險保費相加即得整個保單組合的風險保費。這種做法的缺陷是,對于個體保單而言,風險保費可以保證實際損失超過風險保費的概率不會超過1%,但對于整個保單組合而言,由于個體保單之間存在一定的風險分散作用,保單組合的累積損失超過總風險保費的概率就不會是1%,很可能遠遠小于1%,也就是說,這種方法求得的風險保費是偏高的。合理的風險保費應該確保整個保單組合的實際損失超過風險保費的概率被控制在一個可以接受的水平,如不超過1%。

本文的主要貢獻有:第一,基于分位回歸提出了一種自上而下計算風險保費的新方法,即在給定的可靠性水平下,首先計算保單組合的總風險保費,然后應用數(shù)值算法和分位回歸將其分解到每份保單上,使得每份保單的風險保費之和等于保單組合的總風險保費。這種方法可以保證整個保單組合的實際損失之和超過總風險保費的概率被控制在一個可以接受的概率水平之內。第二,在應用標準差原理厘定風險保費時,基于已經(jīng)求得總風險保費計算每個保單的風險附加,改進了傳統(tǒng)方法對風險保費的計算結果。第三,基于中國汽車保險的實際損失數(shù)據(jù),對風險保費的各種厘定方法進行了比較研究。

二、分位回歸

(1)

(2)

當τ=0.5時,就是中位數(shù)回歸,其回歸系數(shù)使得殘差的絕對值之和達到最?。?/p>

分位回歸具有優(yōu)良的統(tǒng)計性質,能全面考察因變量的分布特征,在經(jīng)濟、金融和保險等領域的應用受到越來越多的關注[12-14]。

三、風險保費

(3)

在應用標準差原理計算風險保費時,首先,通過回歸模型預測每個風險類別的期望損失(即純保費)及其標準差;其次,利用期望損失加上α倍的標準差得到風險保費。

在保費的構成中,之所以要包括一定的風險附加,其目的是為了應對隨機損失所帶來的不利偏差,從而確保保險公司收取的風險保費不足以支付實際損失的概率很小,如小于1%。這就意味著,保險公司收取的風險保費總額應該大于實際損失總額的99%分位數(shù)。上述的標準差原理顯然無法滿足這個總體性要求。此外,對于每份保單而言,其風險附加的大小也應該與其損失分布有關,譬如,越是右偏的損失,風險附加應該越大。標準差原理雖然可以在一定程度上反映損失分布的離散程度和右偏性,但其效果遠不及分位數(shù),因為后者可以對損失分布的右偏性進行完整刻畫。由此可見,應用標準差原理計算風險附加,不能保證風險附加在總體上的充足性以及在不同保單之間分配的合理性。

假設保單組合的總風險保費為C,則保險公司的累積賠款超過總風險保費C的概率(即保險公司破產的概率)可以表示為:

(4)

由此可以求得總風險保費應為:

(6)

(一)基于標準差原理計算個體保單的風險保費

在實際保險業(yè)務中,大多數(shù)保單不會發(fā)生索賠,只有少數(shù)保單會發(fā)生索賠,所以個體保單在一個保險期間的累積損失Y在零點會有一個較大的概率堆積,表示沒有發(fā)生索賠的概率。在對個體保單的累積損失觀察值建模時,通常假設Y服從零調整逆高斯分布或Tweedie分布[15]216-217。

當Y服從零調整逆高斯分布時,其密度函數(shù)可以表示為

(7)

其中μ>0,σ>0,0<ν<1。零調整逆高斯分布的均值和方差分別為:

(8)

(9)

應用式(8)和式(9),可以求得應用標準差原理計算的風險保費為:

(10)

在零調整逆高斯分布的參數(shù)μ中引入解釋變量xi,可建立如下回歸模型:

如果進一步要求所有保單的風險保費之和等于總風險保費C,則應有如下等式成立:

從上式可以求出風險附加的比例α,再應用式(10),就可以求得每份保單的風險保費。

(11)

(12)

在標準差原理下,風險保費可以表示為:

(13)

對Tweedie分布的均值參數(shù)μ中引入解釋變量xi,可建立如下回歸模型:

如果進一步要求所有保單的風險保費之和等于總風險保費C,則應有如下等式成立:

(14)

從上式可以求解出風險附加的比例α,再應用式(13),就可以求得每份個體保單的風險保費。

(二)基于分位回歸計算個體保單的風險保費

由于許多保單在保險期間不會發(fā)生索賠,所以它們的損失觀察值為零。此時,普通的分位回歸將不再適用,需要采用零調整分位回歸模型[13]。建立零調整分位回歸模型的具體過程如下。

(15)

其中p為保單發(fā)生索賠的概率。由公式(15)可知,當y=0時,有:

當y>0時,有:

因此,含零損失Y的τ分位數(shù)可以表示為:

(16)

上式表明,含零損失Y的τ分位數(shù)可以通過非零損失Y*的τ*分位數(shù)求得,且滿足:

(17)

由式(17)容易看出,τ*<τ,且τ*關于p單調遞增。

(18)

求解式(18)可以利用分位回歸的單調同變性,即

四、實證分析

以下基于國內某保險公司的車損險數(shù)據(jù)進行實證分析。數(shù)據(jù)來源可參見孟生旺的《回歸模型》[15]220。

(一)數(shù)據(jù)描述

在本例的數(shù)據(jù)中,因變量是每個風險類別中平均每個車每年的索賠金額,解釋變量如表 1所示,包括車主年齡、車齡、續(xù)保類型、駕駛人性別和保單持有人所在地區(qū),其中車主年齡和車齡是連續(xù)變量,續(xù)保類型和保單持有人所在地區(qū)是分類變量。本文選取車年數(shù)為1的73 500份保單進行分析,其中發(fā)生了52 853次索賠,涉及33 029份保單,總的索賠金額為104 772 648元。

表1 變量描述

索賠金額的直方圖呈現(xiàn)出明顯的尖峰厚尾特征(圖1),偏度和峰度分別為88.161和16 315.430,遠遠大于正態(tài)分布的偏度和峰度(分別為0和3)。

圖1 索賠金額的直方圖

(二)保單組合的總風險保費

為了計算保單組合的總風險保費,首先需要求得該保單組合總索賠額的分布。圖 1是單次索賠額的直方圖。從該圖可以看出,單次索賠額呈現(xiàn)出明顯的尖峰厚尾特征,但根據(jù)中心極限定理,當索賠次數(shù)足夠大時,保單組合的總索賠額將近似服從正態(tài)分布。

E(S)=E(N)E(Xi)=104 772 648

=1 404 6442

根據(jù)正態(tài)分布的性質,累積損失99%分位數(shù)為108 040 339。換言之,如果將該保單組合的總風險保費確定為C = 108 040 339,則保險公司收取的風險保費不足以支付索賠的概率不會超過1%。

(三)個體保單的風險保費

在求得保單組合的總風險保費以后,需要將其分攤到每份保單上。由于每份保單的累積賠款在零點存在概率堆積,所以在均值回歸中需要采用零調整逆高斯回歸或Tweedie回歸,并在分位回歸中采用零調整分位回歸。在零調整分位回歸中,用數(shù)值方法求得的分位數(shù)水平為τ*=50.15%。模型的參數(shù)估計結果如表 2所示。從表 2可以看出,分位回歸與均值回歸選取的解釋變量基本一致,大多數(shù)回歸系數(shù)的符號也完全相同。

表2 模型的參數(shù)估計值

從理論上講,風險保費應該是賠款的某個分位數(shù),所以應用分位回歸求得的風險保費在理論上更加合理。圖 2揭示了應用均值回歸模型和標準差原理計算的風險保費可能帶來的偏差。從總體上看,應用均值回歸計算的風險保費在某些風險類別上偏低,而在另外一些風險類別上偏高。這是因為基于零調整逆高斯回歸和Tweedie回歸計算的風險保費,都是按照標準差的一個百分比作為風險附加,容易受到觀察數(shù)據(jù)中異常值的影響。應用分位回歸求得的風險保費與各個風險類別的50.15%分位數(shù)比較接近,不易受觀察數(shù)據(jù)中異常值的影響,所以沒有過于偏高或偏低的費率厘定值。

圖2 均值回歸與分位回歸的風險保費

五、小 結

在傳統(tǒng)的費率厘定中,通常應用均值回歸模型求得純保費,然后在純保費的基礎上按照標準差的一定百分比計算風險附加。純保費與風險附加之和就是所謂的風險保費。風險保費從本質上講應該是損失的一個分位數(shù),從而使得實際損失超過風險保費的概率被控制在一個可以接受的水平,如1%。因此,應用分位回歸模型直接對風險保費進行預測具有理論上的優(yōu)勢。

在應用分位回歸厘定風險保費的現(xiàn)有文獻中,都沒有解決如何確定分位數(shù)水平的問題。本文在給定保單組合破產概率的條件下,求得保單組合的總風險保費,然后用數(shù)值方法求得分位數(shù)水平,最后基于分位回歸厘定了每份保單的風險保費。應用這種方法求得的風險保費具有兩個特點:一方面可以保證公司的破產概率被控制在一個可以接受的水平,如不超過1%,另一方面可以保證每份保單的風險保費之和等于保單組合的總風險保費。

基于一組數(shù)據(jù)的實證研究結果表明,應用分位回歸計算的風險保費不易受數(shù)據(jù)中異常值的影響,而均值回歸容易受到數(shù)據(jù)中異常值的影響,從而有可能使得一些保單的風險保費偏大,而另一些保單的風險保費偏小。

[1]McCullagh P N J A. Generalized Linear Models[M]. London: Chapman & Hall, 1989.

[2]孟生旺. 廣義線性模型在汽車保險定價的應用[J]. 數(shù)理統(tǒng)計與管理, 2007, 26(1).

[3]Piet de Jong,Gillian Z Heller. Generalized Linear Models for Insurance Data [M].Cambridge: Cambridge University Press,2008.

[4]劉兆君.伴隨置信度的線性回歸模型[J]. 統(tǒng)計與信息論壇, 2015(7).

[5]Hastie T, Tibshirani R.Generalized Additive Models (with Discussion) [J]. Statistical Science, 1986(42).

[6]Hastie T J T R. Generalized Additive Models [M]. London: Chapman & Hall, 1990.

[7]Breslow N E, Clayton D G. Approximate Inference in Generalized Linear Mixed Models [J]. Journal of the American Statistical Association, 1993, 88(421).

[8]Stroup W W.Generalized Linear Mixed Models: Modern Concepts, Methods and Applications[M]. Florida: CRC Press,2012.

[9]孟生旺, 李政宵. 基于隨機效應零調整回歸模型的保險損失預測[J]. 統(tǒng)計與信息論壇, 2015(12).

[10]Rigby R A, Stasinopoulos D M. The GAMLSS Project: A Flexible Approach to Statistical Modelling[C]//New Trends In Statistical Modelling: Proceedings of the 16th International Workshop on Statistical Modelling, 2001.

[11]Rigby R A, Stasinopoulos D M. Generalized Additive Models for Location, Scale and Shape (with Discussion) [J]. Journal of the Royal Statistical Society: Series C (Applied Statistics), 2005, 54(3).

[12]Pitselis G.Quantile Regression in a Credibility Framework[C]∥11th International Congress Insurance:Mathematics and Economics,2007.

[13]Kudryavtsev A A. Using Quantile Regression for Rate-making[J]. Insurance: Mathematics and Economics, 2009(2).

[14]Koenker R, Bassett G. Regression Quantiles [J]. Econometrica, 1978, 46(1).

[15]孟生旺. 回歸模型[M]. 北京:中國人民大學出版社, 2015.

(責任編輯:李勤)

Prediction of Risk Premium Based on Quantile Regression

YANG Lianga,b, MENG Sheng-wanga,b

(a. Center for Applied Statistics;b. School of Statistics, Renmin University of China, Beijing 100872, China)

Prediction of risk premiums is an important part in the non-life insurance premium ratemaking. During the determining the risk premium in the traditional quantile regression, quantile level is generally given in advance, which is lack of objectivity. Therefore, we propose a new method for determining the risk premium by applying of quantile regression. Firstly, determining the total risk premiums based on the probability of bankruptcy; secondly, to establish quantile regression model in individual policies, and establish relationships with total risk premium; finally, to solve for quantile level by numerical methods, obtain the individual risk premiums. Basing on a set of actual data, the results demonstrates that the method has high forecasting accuracy.

premium principle; risk premium; quantile regression; Tweedie regression

2016-05-18

國家自然科學基金項目《考慮風險相依的非壽險精算模型研究》(71171193); 教育部重點研究基地重大項目《隨機效應模型及其在非壽險風險管理中的應用》(12JJD790025)

楊亮,男,安徽阜陽人,博士生,研究方向:非壽險精算與統(tǒng)計模型;

F840∶O212

A

1007-3116(2016)09-0083-06

孟生旺, 男, 甘肅秦安人,經(jīng)濟學博士,教授, 博士生導師,研究方向:應用統(tǒng)計,風險管理與精算。

猜你喜歡
分位保單位數(shù)
1980~2019年夏季青藏高原中東部極端日降水分布特征
最清晰的加倉信號:估值
五次完全冪的少位數(shù)三進制展開
連續(xù)自然數(shù)及其乘積的位數(shù)分析
貴州近50 a來夏季不同等級強降水事件特征研究
急用錢,試試人身險保單貼現(xiàn)
基于“業(yè)績與薪酬雙對標”的國有企業(yè)負責人薪酬研究
壽險保單貼現(xiàn)證券化探析
遙感衛(wèi)星CCD相機量化位數(shù)的選擇
葉麗婭的年齡
阿尔山市| 富顺县| 阿拉善左旗| 汉川市| 慈溪市| 吴旗县| 茌平县| 城市| 建昌县| 灌阳县| 阳原县| 阿尔山市| 新泰市| 修文县| 凤冈县| 华阴市| 临泽县| 渭源县| 普格县| 井研县| 香格里拉县| 三江| 常熟市| 景泰县| 沐川县| 洪泽县| 剑河县| 龙海市| 普洱| 邹平县| 盐池县| 青阳县| 双峰县| 积石山| 响水县| 郎溪县| 大田县| 芜湖县| 诏安县| 大名县| 宁陕县|