王志剛,張國慶,張 巖
(內(nèi)蒙古財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)與數(shù)學(xué)學(xué)院,呼和浩特 010071)
人口問題的研究是社會(huì)、政治、經(jīng)濟(jì)決策的基礎(chǔ),歷來受到業(yè)界和學(xué)界的關(guān)注,其中死亡率預(yù)測(cè)模型作為人口預(yù)測(cè)的重要組成部分,一直是人口研究的重點(diǎn)。自1992年,Lee-Carter[1]提出第一個(gè)死亡率預(yù)測(cè)模型后,該領(lǐng)域產(chǎn)生了大量研究成果。這些模型由于主要考慮到了年齡(Age)、時(shí)期(Period)和出生年(Cohort)三個(gè)因素對(duì)死亡率的影響,因此這類模型被統(tǒng)稱為APC模型。
APC模型的主要研究成果包括Lee和Carter(1992)[1]提出的Lee-Carter模型及其擴(kuò)展模型,以及Cairns等(2006)[2]提出的CBD模型及其擴(kuò)展模型。影響最為廣泛的模型是Lee和Carter提出的Lee-Carter模型,具體表達(dá)式為:ln(mx,t)=αx+βxκt+εx,t,該模型包含了年齡和時(shí)間兩個(gè)成分。Renshaw和Haberman(2006)[3]在Lee-Carter模型基礎(chǔ)上增加了出生年因素得到相應(yīng)擴(kuò)展模型:ln(mx,t)=。Yang等(2010)[4]將Lee-Carter模型中的主成分項(xiàng)由一項(xiàng)擴(kuò)展為兩項(xiàng),得到多年齡項(xiàng)和時(shí)期項(xiàng)的Lee-Carter擴(kuò)展模型CBD模型及其擴(kuò)展模型也體現(xiàn)了相似的特征,包括Cairns等提出的原始CBD模型,以及增加出生年項(xiàng)和擴(kuò)展主成分項(xiàng)的擴(kuò)展CBD模型。
經(jīng)過二十多年的發(fā)展,APC模型積累了大量研究成果,不過這些成果主要集中在提高單一總體死亡率的擬合效果上。而在研究跨國、跨區(qū)域、多組別的死亡率風(fēng)險(xiǎn)時(shí),構(gòu)建能夠定量描述多人群死亡率整體變動(dòng)特征的多總體APC模型就變得必不可少,并有了一些有價(jià)值的研究成果[5、6]。此時(shí)細(xì)致考察多總體死亡率變動(dòng)間的相關(guān)性,并以此為基礎(chǔ)建立多總體APC模型就非常有意義。如果在死亡率變動(dòng)過程中,不同總體死亡率變動(dòng)軌跡不具有相關(guān)性,此時(shí)通過使用單總體死亡率模型,并進(jìn)行簡單加總就可以得到所需的結(jié)果,然而當(dāng)死亡率變動(dòng)過程中體現(xiàn)出相關(guān)性時(shí),簡單的加總會(huì)產(chǎn)生對(duì)風(fēng)險(xiǎn)估計(jì)的偏差,因此死亡率變動(dòng)相關(guān)性的考察是建立多總體APC模型的前提。
現(xiàn)實(shí)經(jīng)驗(yàn)告訴我們死亡率變動(dòng)具有一定的相關(guān)性,為驗(yàn)證該經(jīng)驗(yàn),本文首先利用世界人口死亡率數(shù)據(jù)庫(Human Mortality Database,簡稱HMD)中的死亡率數(shù)據(jù),對(duì)世界范圍內(nèi)的死亡率變動(dòng)過程中的共同趨勢(shì)和相關(guān)性做出研究,本文選取HMD數(shù)據(jù)庫中33個(gè)國家1985—2010年間的死亡率作為研究對(duì)象,觀察60歲男性與女性死亡率變動(dòng)趨勢(shì)。結(jié)果表明,男性死亡率整體明顯高于女性死亡率,且男性死亡率變化幅度略大于女性死亡率變化幅度。1985—2010年間,33個(gè)國家男性與女性死亡率變動(dòng)均表現(xiàn)出相同的下降趨勢(shì),這表明33個(gè)國家的死亡率變動(dòng)存在相關(guān)性。
雖然部分國家,如烏克蘭等國受到原蘇聯(lián)社會(huì)動(dòng)蕩的影響,男性人口在2000年前后出現(xiàn)了死亡率上升的波動(dòng),但隨著社會(huì)變動(dòng)沖擊逐漸減弱,此后這些國家很快再次進(jìn)入死亡率下降趨勢(shì)中;同時(shí),這些國家的女性死亡率數(shù)據(jù)中體現(xiàn)出更強(qiáng)的同步性,這印證了死亡率逆向波動(dòng)源于社會(huì)動(dòng)蕩的判斷。
此外,文中利用HMD數(shù)據(jù)計(jì)算了不同國家間的相關(guān)系數(shù),相關(guān)系數(shù)矩陣也驗(yàn)證了這一觀點(diǎn),絕大多數(shù)國家的死亡率相關(guān)系數(shù)都高于0.8。并且一些國家間,死亡率相關(guān)系數(shù)超過0.95。因此,本文認(rèn)為世界死亡率變動(dòng)具有廣泛的、明顯的相關(guān)性,該結(jié)論和實(shí)際生活經(jīng)驗(yàn)相吻合,因此在模型建立過程中應(yīng)該充分考慮相關(guān)性。
針對(duì)死亡率模型變動(dòng)過程中廣泛存在的相關(guān)性,國外學(xué)者開始對(duì)現(xiàn)有單總體死亡率模型的研究成果做出改進(jìn),在死亡率建模中引入相關(guān)性,進(jìn)而構(gòu)建兩總體以及多總體死亡率預(yù)測(cè)模型。為了將相關(guān)性納入模型,國外學(xué)者針對(duì)單總體模型做了以下兩種修改。學(xué)者首先嘗試?yán)脙烧呦嚓P(guān)關(guān)系建立統(tǒng)一的死亡率估計(jì)模型對(duì)多總體死亡率進(jìn)行整體估計(jì)。其中主要包括嘗試使用線性回歸對(duì)死亡率建模[5]和使用協(xié)整分析[6]對(duì)動(dòng)態(tài)死亡率模型中的時(shí)間項(xiàng)進(jìn)行建模。此外,Cairns等(2006)[2]針對(duì)一個(gè)總體及其子集總體,在假設(shè)子集總體的死亡率改善和總體死亡率改善間存在著一個(gè)固定比例關(guān)系的條件下,構(gòu)建主人口和從屬人口兩總體死亡率模型。
這兩種研究方案都是在原有動(dòng)態(tài)死亡率模型上增加了新的假設(shè)條件,并基于此構(gòu)建了多元?jiǎng)討B(tài)死亡率模型。本文逐一考察這兩個(gè)新增條件的合理性及其新增的約束。首先,在Yang等(2011)使用的回歸關(guān)系[5]和Darkiewicz等(2004)使用的協(xié)整分析[6]中,兩種方法都要建立回歸模型,而回歸分析通常是將因變量的變動(dòng)看作為自變量變動(dòng)的結(jié)果。本文認(rèn)為不同地區(qū)或不同組別的死亡率變動(dòng)都是由自身所處的經(jīng)濟(jì)、社會(huì)及生物學(xué)特征所決定的,而不是由另外一個(gè)人口總體死亡率變動(dòng)軌跡所決定的。因此,使用回歸方法對(duì)死亡率變動(dòng)進(jìn)行建模,相當(dāng)于對(duì)死亡率變動(dòng)過程中外加了一個(gè)沒有被驗(yàn)證的,并且很可能是錯(cuò)誤的外加條件。本文認(rèn)為,死亡率改善進(jìn)程中體現(xiàn)出的相關(guān)關(guān)系,應(yīng)該是社會(huì)、醫(yī)療和經(jīng)濟(jì)條件共同影響下的結(jié)果,雖具有相關(guān)性,但彼此之間不一定具有因果關(guān)系,所以本文認(rèn)為在沒有被驗(yàn)證之前,應(yīng)該使用相關(guān)模型,而不是回歸模型描述兩者相關(guān)關(guān)系。
同時(shí)在使用協(xié)整分析工具時(shí),針對(duì)兩變量和多變量使用的模型和處理難度具有明顯的差異,特別是多變量協(xié)整分析中使用的Johanson協(xié)整分析和VECM工具,需要針對(duì)不同數(shù)據(jù)進(jìn)行有針對(duì)性的建模,模型使用者要在其中進(jìn)行大量的參數(shù)選擇和模型設(shè)定,難度明顯高于兩變量的Engle-Granger協(xié)整方法和ECM工具,對(duì)模型使用者提出較高要求,不利于相關(guān)方法的廣泛普及。
在Cairns等(2011)構(gòu)建主人口和從屬人口兩總體死亡率模型中要求大總體死亡率m1(x,t)和子集總體死亡率m2(x,t)的比保持不變,即要求C為常數(shù)。這無疑也增加了一個(gè)比較苛刻的前提假設(shè)。這也是Cairns將其模型使用范圍限定在一個(gè)總體是另外一個(gè)總體的子集的原因。即使在Cairns限定的條件內(nèi),該假設(shè)也是一個(gè)無法驗(yàn)證的假設(shè)。
另一點(diǎn)值得說明的是,雖然這些方法使用了不同的假設(shè)去構(gòu)建多總體動(dòng)態(tài)死亡率模型,但這些模型的基礎(chǔ)——單總體動(dòng)態(tài)死亡率模型,不是選用原生的Lee-Carter模型,就是選用Lee-Carter擴(kuò)展模型(包括CBD模型研究團(tuán)隊(duì)中的Cairns在構(gòu)建多元死亡率模型時(shí),也使用了Lee-Carter擴(kuò)展模型),因此這樣看來,現(xiàn)階段多總體動(dòng)態(tài)死亡率模型構(gòu)建中的基礎(chǔ)模型都選用的是數(shù)據(jù)擬合效果較好、應(yīng)用較為廣泛的Lee-Carter模型族。
與已有的多總體死亡率模型構(gòu)建思路不同,本文不引入任何新建假設(shè)條件將相關(guān)性一攬子納入模型中,而是從APC動(dòng)態(tài)死亡率模型構(gòu)成因素(年齡、時(shí)間、出生年)入手,探尋這些因素對(duì)死亡率變動(dòng)的影響,并進(jìn)而將相關(guān)性納入到動(dòng)態(tài)死亡率模型中,構(gòu)建出多總體動(dòng)態(tài)死亡率模型。模型選取帶出生年因素Lee-Carter擴(kuò)展模型:
為了通過模型分解不同因素隨死亡率變動(dòng)體現(xiàn)出的相關(guān)性,本文從HMD數(shù)據(jù)庫中選取了數(shù)據(jù)質(zhì)量較好,分屬于三個(gè)不同大洲的澳大利亞、美國和日本三個(gè)國家作為示例。使用SVD方法分別針對(duì)三個(gè)國家的參數(shù)做出估計(jì),并將估計(jì)結(jié)果繪制為折線圖(見圖1)。圖形顯示這些國家在兩個(gè)年齡項(xiàng)和一個(gè)時(shí)期項(xiàng)上存在著明顯的相關(guān)性,而同時(shí)在出生年項(xiàng)上并不具有明顯的相關(guān)性,同時(shí)使用統(tǒng)計(jì)相關(guān)性檢驗(yàn)也支持該結(jié)論。據(jù)此,通過對(duì)數(shù)據(jù)的分析可以看出,死亡率變動(dòng)過程的相關(guān)性主要體現(xiàn)在兩個(gè)年齡項(xiàng)和一個(gè)時(shí)間項(xiàng)上,據(jù)此構(gòu)建相應(yīng)的多元APC模型。
圖1 澳大利亞、美國和日本三國Alpha、beta、kappa、cohort折線圖
出生年因素主要體現(xiàn)了在死亡率變動(dòng)過程中一代人具有與其他不同出生年人群,在死亡率上體現(xiàn)出的特有特征,會(huì)在殘差熱點(diǎn)圖中體現(xiàn)出明顯的積聚和規(guī)律性變動(dòng)。文中給出美國人口殘差熱點(diǎn)圖(見下頁圖2),圖中顯示殘差分布并不是白噪聲,而是具有明顯的規(guī)律性。這種規(guī)律性也體現(xiàn)在澳大利亞和日本兩個(gè)國家死亡率殘差圖中(圖略)。因此,有必要在模型中增加出生年因素項(xiàng),這也是本文沒有選擇原生Lee-Carter模型,而是選用增加出生年因素項(xiàng)的擴(kuò)展Lee-Carter模型的原因。
圖2 美國人口數(shù)據(jù)殘差熱點(diǎn)圖①圖中使用了單色配色方案,顏色深淺主要體現(xiàn)出殘差絕對(duì)值的變動(dòng)趨勢(shì)。實(shí)際問題中隊(duì)列效應(yīng)帶來的殘差具有持續(xù)性,不會(huì)在正負(fù)之間大幅波動(dòng),單色圖也可以觀測(cè)到變動(dòng)趨勢(shì)??梢月?lián)系作者索取彩色圖。
對(duì)于k個(gè)組別,多元的APC模型中只需要考慮年齡和時(shí)期兩個(gè)方面的相關(guān)性,對(duì)于出生年項(xiàng)不需要考慮其相關(guān)性對(duì)整體模型的影響。其中第一部分年齡項(xiàng)包括評(píng)價(jià)死亡率水平和死亡率改善系數(shù),這兩個(gè)非參數(shù)估計(jì)值不具有外推性,同時(shí)相關(guān)性內(nèi)置在了估計(jì)值中,因此非參數(shù)項(xiàng)和包括了死亡率隨年齡變動(dòng)中體現(xiàn)出的相關(guān)性特征,相應(yīng)的多元形態(tài)為:
在現(xiàn)有研究成果中,第二部分時(shí)間項(xiàng)通常項(xiàng)設(shè)定帶漂移項(xiàng)ARIMA(0,1,1)②雖然此處限定了kt項(xiàng)的具體表達(dá)式,但是后面的研究框架并不限于該情形,可以推廣到其他情形。的時(shí)間序列,即:
其中,i=1,2,...,k,本文將其相關(guān)性內(nèi)置到時(shí)間序列產(chǎn)生機(jī)制的中,將et服從一元正態(tài)分布的假設(shè)擴(kuò)展至多元正態(tài)分布:
至此,式(2)至式(4)構(gòu)成包含不同組別死亡率變動(dòng)相關(guān)性的多元APC模型。
假設(shè)目標(biāo)人群是一組由澳大利亞、美國和日本三個(gè)國家女性人口1:1:1混合構(gòu)成,并且其死亡率變動(dòng)特征與本國人口變動(dòng)特征相同。在2010年,該人群加入一個(gè)為期30年的社會(huì)保障計(jì)劃,這組人群在該計(jì)劃內(nèi)的平均停留時(shí)間及其分布可以使用上文介紹的方法加以估計(jì)。
根據(jù)前文的分析可知,三組人群的死亡率隨年齡波動(dòng)具有相近特征,同時(shí)死亡率改善具有相似的軌跡,其中死亡率改善的相關(guān)系數(shù)矩陣分別為ρAU,USA=0.99,ρAU,JPN=0.96,ρUSA,JPN=0.98都是高度線性相關(guān),再一次印證了使用多總體APC模型建模的必要性,相應(yīng)的的分布為,使用隨機(jī)模擬的方法產(chǎn)生10000組樣本,基于模擬結(jié)果得到對(duì)未來該人群在計(jì)劃內(nèi)的平均時(shí)間為14.42年,密度函數(shù)估計(jì)結(jié)果見圖2,為了和現(xiàn)有方案作比較,本文還計(jì)算了不考慮相關(guān)性情況下的平均時(shí)間為14.43年,兩種方法計(jì)算結(jié)果比較接近,差異主要源于樣本偏差和計(jì)算誤差。但兩種估計(jì)得到的方差估計(jì)結(jié)果和密度函數(shù)明顯不同(見圖3)。本文的方法考慮了不同總體間變動(dòng)的相關(guān)性和死亡率變動(dòng)的同步性,這種相關(guān)性會(huì)增加整個(gè)人群死亡率波動(dòng)的方差,多總體APC模型考慮了這種相關(guān)性得到的密度估計(jì)函數(shù)方差更大,而獨(dú)立估計(jì)因忽略相關(guān)性,會(huì)低估方差。
圖3 兩種方法估計(jì)對(duì)比圖
本文以死亡率變動(dòng)的相關(guān)性為切入點(diǎn),利用1985—2010年澳大利亞、美國、日本歷史死亡率數(shù)據(jù),基于帶有出生年因素項(xiàng)的lee-carter擴(kuò)展模型,建立了多總體APC模型,定量研究顯示:三個(gè)國家在兩個(gè)年齡項(xiàng)和一個(gè)時(shí)期項(xiàng)上存在著明顯的相關(guān)性,在出生年項(xiàng)上并不存在明顯的相關(guān)性;此外,充分考慮死亡率變動(dòng)過程中相關(guān)性的多總體APC模型更加準(zhǔn)確地展示了余壽的波動(dòng)范圍,更符合實(shí)際情況。
為了將全球化背景下,死亡率變動(dòng)具有相同的趨勢(shì),納入到模型中,文中使用了澳大利亞、美國、日本三個(gè)分屬于不同大洲的國家,出于篇幅考慮,沒有將研究擴(kuò)展到所有國家,但本文的研究框架可以適用于更多國家間死亡率研究,具有借鑒價(jià)值。
本文建立的多總體APC模型是對(duì)傳統(tǒng)APC模型的擴(kuò)展,是長壽風(fēng)險(xiǎn)管理等相關(guān)問題的基礎(chǔ),將為長壽風(fēng)險(xiǎn)的識(shí)別和量化、年金產(chǎn)品的定價(jià)、養(yǎng)老產(chǎn)品的設(shè)計(jì)、個(gè)體退休計(jì)劃的制訂、養(yǎng)老保障體系的完善等提供重要參考。