姚正錕 南開大學(xué)金融學(xué)院
財(cái)產(chǎn)保險(xiǎn)的一個(gè)特點(diǎn)是,損失的大小取決于事故或損失的嚴(yán)重程度。投保的保額只有在非常嚴(yán)重或完全損失的情況下才支付。在大多數(shù)情況下,損失是以低于最大保額的方式結(jié)算的。由于這種“部分損失”的特點(diǎn),任何一種風(fēng)險(xiǎn)的保險(xiǎn)金額增加或減少都不需要按比例改變保險(xiǎn)費(fèi)。這種非比例或非線性關(guān)系會(huì)導(dǎo)致定價(jià)的復(fù)雜化,特別是當(dāng)它與承保范圍的限制相結(jié)合時(shí)。對(duì)保險(xiǎn)金額的限制可以采取多種形式。免賠額、特許權(quán)、超額保險(xiǎn)、保留金、共同保險(xiǎn)和最高限額都是限制保險(xiǎn)范圍的方式。為了正確評(píng)估有限保險(xiǎn)保障的成本,有必要衡量已消除損失的比例或剩余損失的比例。而風(fēng)險(xiǎn)曲線就是為了解決這一問題而產(chǎn)生的。
風(fēng)險(xiǎn)曲線的概念最早由Ruth E.Salzmann(1963)提出,該研究以北美保險(xiǎn)公司(INA)的索賠數(shù)據(jù)為基礎(chǔ),對(duì)1960 年至1961 年間發(fā)生的火災(zāi)損失進(jìn)行了分析,得出按保險(xiǎn)價(jià)值百分比計(jì)算的累積損失成本的經(jīng)驗(yàn)數(shù)據(jù)分布,并表明對(duì)于同質(zhì)風(fēng)險(xiǎn)組,這種分布是穩(wěn)定的。隨后S.Ludwig(1991)對(duì)Salzmann曲線進(jìn)行進(jìn)一步修正,并將此方法應(yīng)用到更新的數(shù)據(jù)。而在行業(yè)中被廣泛應(yīng)用的Swiss Re curves(瑞士再保險(xiǎn)曲線)和Lloyds curves(勞合社曲線)在S. Bernegger(1997)提出的MBBEFD 分布得到證明。MBBEFD(Maxwell-Boltzmann,Bose-Einstein,F(xiàn)ermi-Dirac distribution)是物理學(xué)中統(tǒng)計(jì)力學(xué)的分布,該分布被Bernegger發(fā)現(xiàn)非常適合[0,1]區(qū)間上的經(jīng)驗(yàn)損失分布建模,其通過使用MBBEFD 分布成功擬合了Swiss Re curves 和Lloyds curves,此后MBBEFD 被作為歐洲主要的風(fēng)險(xiǎn)曲線的模型基礎(chǔ)。而Clive L.Keatinge(1999)提出了一種通過混合指數(shù)模型進(jìn)行保險(xiǎn)數(shù)據(jù)損失分布擬合的新的方法,本文就是在其基礎(chǔ)上運(yùn)用EM算法對(duì)風(fēng)險(xiǎn)曲線進(jìn)行構(gòu)建。
假設(shè)F(x)是區(qū)間在[0,1]上的損失分布函數(shù),有限期望函數(shù)L(d)=E[min(d,x)],X是實(shí)際損失,M是最大可能損失,并且X≤M,D是財(cái)產(chǎn)險(xiǎn)的免賠額或險(xiǎn)位超賠再保險(xiǎn)的最大自留額。其中d=D/M,x=X/M分別代表了標(biāo)準(zhǔn)化后的免賠額和標(biāo)準(zhǔn)化后的損失。
根據(jù)定義可看出,M·L(d)是財(cái)產(chǎn)險(xiǎn)免賠額以下或再保險(xiǎn)分出公司自留部分的期望損失,M·(L(1)-L(d))是財(cái)產(chǎn)險(xiǎn)免賠額以上或再保險(xiǎn)分入公司的期望損失。因此,這部分純風(fēng)險(xiǎn)保費(fèi)比率就是風(fēng)險(xiǎn)曲線G(d)。
其中,G(0)=0,G(1)=1。
因?yàn)?-F(x)≥0,并且F'(x)=f(x)≥0,所以G(d)在區(qū)間[0,1]上是一個(gè)遞增的凹函數(shù)。
風(fēng)險(xiǎn)曲線描述的是免賠額與損失扣減率(給定免賠額以下的賠付成本占總賠付成本的比率)的關(guān)系。風(fēng)險(xiǎn)曲線的橫軸數(shù)值代表免賠額占總保險(xiǎn)金額或者最大可能損失(MPL)的比例,它的縱軸對(duì)應(yīng)的數(shù)值代表損失扣減率(LER)。在對(duì)含有免賠額的財(cái)產(chǎn)險(xiǎn)保單和險(xiǎn)位超賠再保險(xiǎn)合同的定價(jià)過程中,定價(jià)人員經(jīng)常借助風(fēng)險(xiǎn)曲線解決相關(guān)問題,風(fēng)險(xiǎn)曲線是基于歷史索賠數(shù)據(jù)的傳統(tǒng)建模方法的有力替代方法,尤其對(duì)于新興的中小保險(xiǎn)公司來說,在定價(jià)中具有很大的參考意義。
?圖1 風(fēng)險(xiǎn)曲線示例
以圖1 為例,對(duì)于非比例的險(xiǎn)位超賠再保險(xiǎn)來說,假設(shè)每層保額為2000萬元,占全部保額比例為10%,橫軸10%對(duì)應(yīng)的曲線縱坐標(biāo)為55%,橫軸20%對(duì)應(yīng)的曲線縱坐標(biāo)為70%,那么再保險(xiǎn)承保在10%到20%部分的保費(fèi)為(70%-55%)×原保費(fèi)。
對(duì)于直保公司免賠額定價(jià)來說,從圖1 可看出,其自變量為10%時(shí)所對(duì)應(yīng)的因變量為55%,那么對(duì)于該類風(fēng)險(xiǎn),當(dāng)免賠額相當(dāng)于保額的10%時(shí),該免賠額可以去除55%的預(yù)期損失強(qiáng)度。換句話說,扣去免賠額后的預(yù)期損失強(qiáng)度僅相當(dāng)于無免賠額時(shí)的45%。
根據(jù)損失數(shù)據(jù)的特性,我們使用的是混合指數(shù)分布的離散形式,其中x是損失數(shù)據(jù),pi是與λi對(duì)應(yīng)的混合權(quán)重。
基于混合模型的特性,我們將使用EM 算法對(duì)模型進(jìn)行參數(shù)估計(jì)。
1.參數(shù)估計(jì)方法
EM 算法又稱期望最大化(Expectation Maximization)算法,是基于極大似然估計(jì)(Maximum Likelihood Estimation, MLE)理論的優(yōu)化算法,十分適合解決具有缺失數(shù)據(jù)或者隱變量的模型的求參問題,而這種特性可以很好地應(yīng)用在混合模型之中。給定相互獨(dú)立的觀測(cè)數(shù)據(jù)x=(x1,...,xn),模型的參數(shù)為θ,概率密度函數(shù)為p(xi;θ),根據(jù)MLE 理論,極大化的對(duì)數(shù)似然函數(shù)為:
假設(shè)觀測(cè)數(shù)據(jù)中存在隱變量z=(z1,z2,…,zk),隱變量可以表示缺失數(shù)據(jù),或概率模型中任何無法直接觀測(cè)的隨機(jī)變量,在混合分布中,隱變量的意義是表示樣本中的數(shù)據(jù)屬于哪個(gè)分布,根據(jù)邊緣概率的求解,再加入隱變量之后,概率密度函數(shù)p(xi;θ)可以表示為:
其中第一行是隱變量為連續(xù)變量的情況,第二行為隱變量為離散變量的情況。
在這里我們以離散變量為例進(jìn)行相關(guān)的推導(dǎo)說明。此時(shí)極大化的對(duì)數(shù)似然函數(shù)為:
由于隱變量zj的存在,所以我們無法直接求出參數(shù)θ,這時(shí)我們引入與隱變量有關(guān)的概率分布Qj(zj),由Jensen 不等式觀測(cè)數(shù)據(jù)的對(duì)數(shù)似然有如下不等關(guān)系:
這個(gè)過程相當(dāng)于確定了似然函數(shù)的下界,再假設(shè)θ固定的情況下,那么所求的似然函數(shù)的值是由Qj(zj)和p(xi;zj)決定的,我們需要不斷調(diào)整這兩個(gè)概率來逼近真實(shí)值,而當(dāng)滿足上式的等號(hào)時(shí),所得結(jié)果大致滿足真實(shí)值。
若要滿足不等式的等號(hào)條件,需要滿足p(xi;zj;θ)/(Qj(zj))=m,其中m為常數(shù)。
因?yàn)镼j(zj)是關(guān)于隱變量的概率分布,所以滿足,因此
由上面兩個(gè)式子,我們可以得到:
從中我們可以看到,在滿足等號(hào)條件下,Qj(zj)應(yīng)該是隱變量對(duì)觀測(cè)數(shù)據(jù)的后驗(yàn)概率,所以在確定了Qj(zj)的情況下,我們讓因此我們的求解目標(biāo)為:
總的來說,EM 標(biāo)準(zhǔn)算法是一組迭代計(jì)算,迭代分為兩部分,即E步和M 步,其中E 步“固定”前一次迭代的θ(t-1),求解Q(t),使L(θ,Q)取極大值;M步使用Q(t),求解θ(t),使L(θ,Q)取極大值。EM算法需要給定一個(gè)參數(shù)初值θ(0)后開始迭代,迭代中E 步和M 步交替進(jìn)行,當(dāng)∥θ(t)-θ(t-1)∥小于某個(gè)給定的閾值時(shí)停止迭代。
2.應(yīng)用EM算法求混合指數(shù)模型的參數(shù)
朱利平、盧一強(qiáng)、茆詩松(2006)提到,以單參數(shù)混合指數(shù)分布為例,使用EM算法進(jìn)行參數(shù)估計(jì),密度函數(shù)為:
其中:
xi服從混合指數(shù)分布fi。如果Ii為示性變量,那么,Ii=1表示xi來自密度函數(shù)f1i的指數(shù)總體,Ii=0表示xi來自密度函數(shù)f2i的指數(shù)總體??芍?,Ii服從二項(xiàng)分布,P(Ii=1)=p,P(Ii=0)=1-p。因?yàn)槲覀儾恢纗i來自f1i還是f2i的指數(shù)總體,因而,Ii是不能被觀測(cè)到的隨機(jī)變量。
xi和Ii的聯(lián)合分布為g(xi,Ii,θ)=(pf1i)Ii [(1-p)f2i](1-Ii),從而Ii在xi給定的條件分布為:
給定初值θ(0),EM算法步驟為:
E步——求期望值。
其中,
M步——極大化求θ(m),使得Q(θm,θ(m-1))=maxQ(θ,θ(m-1))。
以θm作為θ(m-1的更新值,重復(fù)第1和第2步,當(dāng)∥θ(m)-θ(m-1)∥小于某個(gè)給定的閾值時(shí)停止迭代。由于EM算法的收斂性是有理論保證的,因此上述迭代過程一定收斂。
本文采用同質(zhì)性的一般責(zé)任險(xiǎn)的336條損失數(shù)據(jù),并使用Python進(jìn)行風(fēng)險(xiǎn)曲線的構(gòu)建,數(shù)據(jù)來源于Klugman、Panjer、Willmot(1998)。首先我們使用EM算法對(duì)經(jīng)驗(yàn)數(shù)據(jù)進(jìn)行混合指數(shù)的參數(shù)估計(jì),結(jié)果如表1所示。
?表1 EM算法對(duì)混合指數(shù)模型的參數(shù)估計(jì)結(jié)果
我們采用DNML(Decomposed Normalized Maximum Likelihood)作為擬合優(yōu)度的檢驗(yàn)標(biāo)準(zhǔn),DNML 值越低,說明擬合效果越好。所以我們可以看到當(dāng)k的初值為2時(shí),模型的擬合結(jié)果最好,其中最優(yōu)結(jié)果見表2,擬合曲線見圖2。
?表2 最優(yōu)DNML下的參數(shù)估計(jì)結(jié)果
?圖2 經(jīng)驗(yàn)數(shù)據(jù)與混合指數(shù)的擬合曲線
在得到混合指數(shù)形式的損失分布函數(shù)F(x)后,進(jìn)行風(fēng)險(xiǎn)曲線G(x)的構(gòu)建,因?yàn)槲覀償?shù)據(jù)中最大損失為1972367,所以我們選取M 為2000000(假設(shè)最大可能損失等于保額),從而構(gòu)造出對(duì)應(yīng)的風(fēng)險(xiǎn)曲線,如圖3所示。
?圖3 基于混合指數(shù)模型構(gòu)建的風(fēng)險(xiǎn)曲線
從圖3 中,我們可以看出,絕大多數(shù)的索賠損失集中在最大損失的30%以內(nèi),其中一半以上的損失集中在最大損失的10%以內(nèi)。所以僅根據(jù)此例來說,對(duì)于該責(zé)任險(xiǎn)的免賠額定價(jià),當(dāng)免賠額為保額的10%,所收取的保費(fèi)應(yīng)為無免賠額情況下的40%。
從文中圖2的經(jīng)驗(yàn)數(shù)據(jù)和混合指數(shù)的擬合曲線來看,擬合效果很好,說明混合指數(shù)模型確實(shí)比較適合保險(xiǎn)業(yè)的損失分布,可以在實(shí)務(wù)中加以應(yīng)用。而目前在美國(guó)普遍使用的是基于ISO's PSOLD方法構(gòu)建的風(fēng)險(xiǎn)曲線,其采用的損失模型就是混合指數(shù)模型。這也說明基于混合指數(shù)模型的風(fēng)險(xiǎn)曲線在實(shí)務(wù)中已經(jīng)具有了一定的實(shí)踐意義。
但仍需注意的是,就實(shí)務(wù)中風(fēng)險(xiǎn)曲線的構(gòu)建而言,對(duì)于數(shù)據(jù)的要求是比較高的。首先是需要大量的行業(yè)損失數(shù)據(jù)(比如水險(xiǎn)、家財(cái)險(xiǎn)、企財(cái)險(xiǎn))。僅靠單一保險(xiǎn)公司很難有足夠的數(shù)據(jù)量積累,所以最好是行業(yè)內(nèi)的保險(xiǎn)公司可以聯(lián)合起來共同構(gòu)建相應(yīng)的風(fēng)險(xiǎn)曲線,在大量數(shù)據(jù)的基礎(chǔ)上,才能使風(fēng)險(xiǎn)曲線的精度更高,從而更準(zhǔn)確地幫助相應(yīng)的定價(jià)工作。
其次是對(duì)同質(zhì)性數(shù)據(jù)的篩選和處理。同一行業(yè)內(nèi)部可能存在許多差異,比如對(duì)于電廠的企財(cái)險(xiǎn)來說,火電廠和水電廠的風(fēng)險(xiǎn)就不同質(zhì),所以需要對(duì)行業(yè)小類進(jìn)行區(qū)分。同時(shí),在同一行業(yè)小類內(nèi)部的很多保單也存在保額差異很大的情況,這時(shí)就要對(duì)風(fēng)險(xiǎn)曲線進(jìn)行保額分段的處理,不同的保額段構(gòu)建不同的風(fēng)險(xiǎn)曲線,這樣可以更好地滿足同質(zhì)性要求。