國家癌癥中心/國家腫瘤臨床醫(yī)學(xué)研究中心/中國醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)學(xué)院腫瘤醫(yī)院(100021)
安 瀾 鄭榮壽 張思維 楊謹(jǐn)成 孫可欣 曾紅梅△
【提 要】 目的 介紹Elandt-Johnson模型法推算完全壽命表的方法學(xué)原理,并應(yīng)用該方法推算中國完全壽命表。方法 以全國第六次人口普查結(jié)果2009年11月1日至2010年10月31日分年齡、性別的死亡率為實(shí)例構(gòu)建真實(shí)完全壽命表,計(jì)算出簡略壽命表,然后以簡略壽命表為基礎(chǔ)數(shù)據(jù),采用Elandt-Johnson模型法推算理論完全壽命表,并與真實(shí)完全壽命表比較以評估模型擬合效果。結(jié)果 采用Elandt-Johnson模型推算出的男女分年齡死亡率與真實(shí)死亡率擬合優(yōu)度良好,決定系數(shù)R2分別為0.9966和0.9994。依據(jù)理論完全壽命表估算出的預(yù)期壽命(男性72.43,女性77.23)與真實(shí)完全壽命表計(jì)算出的預(yù)期壽命非常接近(男性72.38,女性77.30)。結(jié)論 Elandt-Johnson模型法可以將簡略壽命表推算出較為準(zhǔn)確的完全壽命表。
壽命表是根據(jù)特定人群的年齡組死亡率編制出的一種統(tǒng)計(jì)表,用以說明在特定人群年齡組死亡率條件下人的生命過程[1]。壽命表是社會科學(xué)的重要工具、并在科研中廣泛運(yùn)用,是用于計(jì)算預(yù)期壽命的基礎(chǔ)。完全壽命表是按每個(gè)年份、一歲一個(gè)年齡組和性別來計(jì)算死亡概率和死亡率。簡略壽命表習(xí)慣以5歲一組,由于0~歲組嬰兒死亡率對壽命表的影響相當(dāng)大,簡略壽命表將0~4歲拆分為0~,1~歲組。在很多情況下,簡略壽命表因其構(gòu)造簡單被廣泛運(yùn)用[2]。一方面是因?yàn)楹喡詨勖硎前凑?歲年齡組劃分而計(jì)算的死亡率,數(shù)據(jù)相對穩(wěn)定;另一方面由于各地區(qū)全死因登記數(shù)據(jù)質(zhì)量問題,在無法獲得穩(wěn)定而完整的完全壽命表資料時(shí),死因數(shù)據(jù)結(jié)果常以簡略壽命表資料呈現(xiàn)。在計(jì)算人群癌癥相對生存率時(shí),我們需要根據(jù)完全壽命表計(jì)算分年齡、性別和時(shí)期的預(yù)期生存概率[3]。由于從我國部分腫瘤登記地區(qū)難以獲得精準(zhǔn)的完全壽命表資料,部分死因監(jiān)測地區(qū)僅提供簡略壽命表數(shù)據(jù)[4],因此需要在缺乏完全壽命表的情況下,采用科學(xué)的方法將簡略壽命表資料推算成完全壽命表。
本文介紹Elandt-Johnson模型法將簡略壽命表推算至完全壽命表的原理,并根據(jù)用漏報(bào)方法調(diào)整的我國第六次全國人口普查數(shù)據(jù)建立簡略壽命表和完全壽命表,運(yùn)用該方法將簡略壽命表推算出完全壽命表,將推算出的完全壽命表與真實(shí)完全壽命表進(jìn)行比較,評價(jià)Elandt-Johnson模型推算完全壽命表的效果。
1.數(shù)據(jù)來源
本研究使用2009年11月1日至2010年10月31日全國分性別1歲一個(gè)年齡組的死亡率數(shù)據(jù)。數(shù)據(jù)來源于國家統(tǒng)計(jì)局公布的2010年第六次全國人口普查資料各地區(qū)分年齡、性別死亡人口狀況(2009年11月1日-2010年10月31日)[5]。采用國家統(tǒng)計(jì)局公布的死亡人口漏報(bào)率調(diào)整年齡別死亡率[6]。
2.預(yù)期壽命計(jì)算方法
本研究利用壽命表法,利用第六次人口普查數(shù)據(jù)庫中提供的分年齡組平均人口數(shù)、實(shí)際死亡人數(shù),計(jì)算各年齡組死亡率。采用黃榮清[7]等人的嬰兒死亡率估計(jì)值(男性為16.85‰,女性為17.69‰)修正0歲組死亡率,使用國家統(tǒng)計(jì)局公布的死亡人口漏報(bào)率18.4%修正其他年齡別死亡率,得出調(diào)整年齡別死亡率和死亡概率[6]。假設(shè)0歲組人數(shù)為10萬人,以調(diào)整年齡別死亡率計(jì)算各年齡組死亡人數(shù)、生存人數(shù)、生存人年數(shù)和累積生存總?cè)四陻?shù),最后算得各年齡組預(yù)期壽命。
(1)年齡分組nx:簡略壽命表分為0歲組(x=0,n=1),1~4歲(x=1,n=4),5~9歲(x=5,n=5),10~14,…,95+;完全壽命表1歲一組(n=1)。
(1)
(2)
(4)年齡組死亡概率nqx:
nqx=1-e-nx×nMx’
(3)
(5)x歲年齡組總死亡人數(shù)dx:
dx=lx×qx
(4)
(6)x歲年齡組總生存人數(shù)lx:
令l0=100000,lx+1=lx-dx
(5)
(7)生存人年數(shù)Lx:
(6)
(8)x歲年齡組生存總?cè)四陻?shù)Tx:
(7)
(9)x歲年齡組的預(yù)期壽命ex:
(8)
3.Elandt-Johnson模型推算法
Elandt-Johnson模型推算法是利用三個(gè)不同年齡段所對應(yīng)的三種插值函數(shù)與平滑公式,將簡略壽命表資料推算至完全壽命表[8]。推算過程是先由簡略壽命表中的生存人數(shù)AlX推算完全壽命表中的生存人數(shù)ClX,進(jìn)而推算出完全壽命中各年齡組死亡率。生存人數(shù)的計(jì)算根據(jù)年齡分為三組:
(1)0~9歲組:采用六點(diǎn)拉格朗日內(nèi)插公式進(jìn)行推算。對于簡略壽命表中的Alx將使用表1的系數(shù)推算完全壽命表中的Clx(x<10)[8],即我們用l1、l5、l10、l15、l20和l25的數(shù)值進(jìn)行線性內(nèi)插計(jì)算。線性內(nèi)插法可以確保在推算出的完全壽命表中保留了簡略壽命表中的原始數(shù)據(jù)[9]。舉例如下:
Cl2=0.562030l1+0.717600l5-0.478400l10+0.282886l15-0.100716l20+0.015600l25
(2)10~74歲組:采用六點(diǎn)拉格朗日內(nèi)插公式進(jìn)行推算。對于10歲~74歲年齡組的系數(shù),將使用表2的系數(shù)進(jìn)行線性內(nèi)插計(jì)算[8]。舉例如下:
Cl11=0.008064l0-0.073920l5+0.887040l10+0.221760l15-0.049280l20+0006336l25
(3)75歲及以上組:75歲及以上人群推算采用龔帕茲Gomepertz生存曲線擬合法估計(jì)[10-11]。
表1 計(jì)算完全壽命表Cl2-Cl9的系數(shù)
表2 計(jì)算完全壽命表Cl11-Cl74的系數(shù)
*:m=2時(shí),可計(jì)算Cl11-Cl14;m=3時(shí),可計(jì)算Cl16-Cl19;以此類推,m=14時(shí),可計(jì)算Cl71-Cl74。
龔帕茲生存公式為:
(9)
x1和x1+5成為lx兩個(gè)接點(diǎn)可得出,
(10)
代入(9)公式計(jì)算得出
lx1=b1-cx1,lx1+5=b1-cx1+5
同樣,對于x2和x2+5
(11)
(12)
結(jié)合公式(10)
(13)
用公式(12)和(13)得出各年齡x的參數(shù)b和c(參數(shù)a和R的函數(shù))。再結(jié)合公式(9)計(jì)算出各年齡組生存人數(shù)lx:
4.應(yīng)用軟件
應(yīng)用SAS 9.2軟件編制壽命表計(jì)算預(yù)期壽命,應(yīng)用STATA 13.0軟件實(shí)現(xiàn)Elandt-Johnson模型推算,采用Excel軟件繪圖并計(jì)算推算出的完全壽命表數(shù)據(jù)與真實(shí)完全壽命表數(shù)據(jù)的擬合程度。
表3以全國各年齡組平均人口數(shù)和漏報(bào)調(diào)整死亡人數(shù)為例,展示了2010年中國分性別簡略壽命表的基本指標(biāo),根據(jù)壽命表法計(jì)算的分性別、分年齡組死亡概率、預(yù)期壽命見表3。
表3 2010年中國分性別簡略壽命表
表4給出完全壽命表及Elandt-Johnson模型推算出的完全壽命表中的死亡率、死亡概率以及預(yù)期壽命。完全壽命表結(jié)果顯示2010年中國男性預(yù)期壽命為72.38歲,Elandt-Johnson模型推算結(jié)果為72.43歲;中國女性預(yù)期壽命為77.30歲,Elandt-Johnson模型推算結(jié)果為77.23歲。各指標(biāo)值見表4。
表4 2010年中國分性別完全壽命表及Elandt-Johnson模型推算出的完全壽命表
續(xù)表4
續(xù)表4
圖1表示2010年中國男性與女性真實(shí)死亡率與擬合死亡率的相關(guān)程度,分別采用線性回歸模型和二次多項(xiàng)式回歸模型計(jì)算擬合死亡率與真實(shí)死亡率間的擬合優(yōu)度,結(jié)果顯示男性擬合死亡率與真實(shí)死亡率間決定系數(shù)R2為0.9966,女性R2為0.9994,均優(yōu)于線性擬合曲線R2,二次多項(xiàng)式模型為最優(yōu)擬合模型。圖2為2010年中國兩性各年齡組死亡率與推算出完全壽命表中擬估計(jì)年齡組死亡率的半對數(shù)線圖??梢钥闯?~10歲死亡率呈現(xiàn)下降趨勢,表示該年齡段的死亡率相對水平在逐步下降,其中0歲組死亡率最高,符合壽命表年齡組死亡率的特點(diǎn),10歲以上年齡組死亡率呈現(xiàn)上升趨勢。各年齡組死亡率與推算出的年齡組死亡率曲線擬合效果良好。圖3表示2010年中國分性別分年齡生存人數(shù)與推算出的擬估計(jì)生存人數(shù)的擬合程度??梢钥闯龈髂挲g組生存人數(shù)基本上與推算出的年齡組生存人數(shù)的曲線貼合,且該曲線的曲度、高度符合一般規(guī)律,即0~65歲年齡段曲線較平緩,生存人數(shù)減少較慢,65歲之后曲線較陡峭,生存人數(shù)減少較快,死亡概率較高。從圖中可以看出,女性各年齡段生存人數(shù)均高于男性,可解釋女性預(yù)期壽命高于男性。
圖1 2010年中國分性別分年齡真實(shí)死亡率與模型推算出死亡率的擬合曲線
圖2 2010年中國分性別分年齡死亡率與模型推算出死亡率的擬合曲線
圖3 2010年中國分性別分年齡生存人數(shù)與模型推算出生存人數(shù)的擬合程度
壽命表是評價(jià)地區(qū)人口健康狀況的綜合性指標(biāo)[12],它可以提供不同人群完整的死亡信息[13],且其在時(shí)間、空間的縱橫比較上具有良好的可比性[14]。壽命表提供的預(yù)期壽命指標(biāo)是衡量國家或地區(qū)社會發(fā)展的重要指標(biāo)[15]。編制完全壽命表時(shí),觀察人數(shù)要足夠多,因?yàn)橥耆珘勖矸纸M細(xì),各年齡組死亡率又低,在某些人口較少地區(qū)因?yàn)橛^察人數(shù)不夠多,容易出現(xiàn)年齡組死亡率不夠穩(wěn)定的現(xiàn)象;簡略壽命表年齡分組少,每個(gè)年齡組人數(shù)較多,年齡組死亡率比較穩(wěn)定,因此人口較少的地區(qū)簡略壽命表較為常見。簡略壽命表只能提供有限的死亡信息,有時(shí)難以滿足精細(xì)化的分析需求,如何科學(xué)地依據(jù)簡略壽命表構(gòu)建完全壽命表就顯得尤為重要[16]。
Elandt-Johnson模型法是依據(jù)簡略壽命表推算出完全壽命表的一種常見方法,自20世紀(jì)80年代起由美國Elandt-Johnson教授提出并廣為使用[8,17]。本研究詳細(xì)闡述了該模型的方法學(xué)原理并用于中國人群壽命表的推算。結(jié)果顯示采用Elandt-Johnson模型推算出的年齡別死亡率和生存人數(shù)都與真實(shí)指標(biāo)值擬合程度較好。同時(shí)推算出的壽命表計(jì)算出的預(yù)期壽命與實(shí)際完全壽命表計(jì)算出的預(yù)期壽命非常接近。依據(jù)壽命表中的年齡組死亡概率,可計(jì)算出分年齡、性別和時(shí)期的期望生存概率,而期望生存概率是計(jì)算人群相對生存率的關(guān)鍵指標(biāo)之一。精確的完全壽命表信息可協(xié)助提供特定人群中的期望生存概率,在計(jì)算人群癌癥相對生存率中,期望生存概率作為分母調(diào)整人群背景死亡概率。在計(jì)算我國2003-2015年人群癌癥相對生存率時(shí),由于腫瘤登記地區(qū)上報(bào)的均為簡略壽命表數(shù)據(jù),本研究團(tuán)隊(duì)[4,18]即采用Elandt-Johnson模型法推算出每個(gè)腫瘤登記地區(qū)分年齡、性別和年份的完全壽命表,后續(xù)用于癌癥相對生存率計(jì)算。國際癌癥生存分析團(tuán)隊(duì)CONCORD[16]、歐洲人群癌癥生存分析研究協(xié)作組EUROCARE[3]也都采用這一方法推算出完全壽命表。有研究表明[19],針對完全壽命表的推算,Elandt-Johnson模型法較其他完全壽命表推算法推導(dǎo)20~99歲年齡段人口的完全壽命表效果最好。本研究通過實(shí)例驗(yàn)證Elandt-Johnson模型法可以將簡略壽命表推算出較為準(zhǔn)確的完全壽命表。