胡桂華 吳笛 劉譽(yù)環(huán)
摘 要: 戶籍登記系統(tǒng)存在登記誤差,為發(fā)揮其作用,應(yīng)估計(jì)其凈誤差。我國(guó)尚未估計(jì)戶籍登記系統(tǒng)的凈誤差,這一狀況應(yīng)該改變。雙系統(tǒng)估計(jì)量是目前估計(jì)凈誤差的重要方法。
本研究的目的是,用組合式三系統(tǒng)估計(jì)量替代雙系統(tǒng)估計(jì)量來(lái)估計(jì)我國(guó)戶籍登記系統(tǒng)的凈誤差,即目標(biāo)總體的未知實(shí)際人口數(shù)與已知的戶籍登記系統(tǒng)人口數(shù)之差,為相關(guān)部門或有關(guān)人員科學(xué)使用戶籍資料提供依據(jù)。采用抽樣理論和數(shù)理模型方法構(gòu)造組合式三系統(tǒng)估計(jì)量,利用樣本普查小區(qū)的三份人口名單演示其計(jì)算過(guò)程。研究發(fā)現(xiàn):雖然戶籍登記系統(tǒng)是獲得人口統(tǒng)計(jì)數(shù)據(jù)的重要來(lái)源,但由于它內(nèi)含錯(cuò)誤登記或漏登人口的登記誤差,因此它所提供的人口數(shù)偏離實(shí)際人口數(shù),需要采取恰當(dāng)?shù)姆椒ü烙?jì)這種偏離程度;抽樣登記的組合式三系統(tǒng)估計(jì)量適合于凈誤差估計(jì);為使估計(jì)的戶籍登記系統(tǒng)凈誤差符合統(tǒng)計(jì)口徑的一致性要求,樣本普查小區(qū)的普查人口名單、事后計(jì)數(shù)調(diào)查人口名單和戶籍人口名單中的每一個(gè)人必須具有本地戶籍,否則從名單中剔除;組合式三系統(tǒng)估計(jì)量須在同質(zhì)人口層建立,否則內(nèi)含異質(zhì)性偏差,低估總體實(shí)際人口數(shù);在分層二重抽樣下,組合式三系統(tǒng)估計(jì)量各個(gè)元素的估計(jì)量采用雙重?cái)U(kuò)張估計(jì)量構(gòu)造,抽樣方差采用分層刀切法近似計(jì)算;凈誤差估計(jì)既可以在普查年進(jìn)行,也可以在非普查年進(jìn)行。本研究的意義在于,組合式三系統(tǒng)估計(jì)量有望被國(guó)家統(tǒng)計(jì)局采納,用于未來(lái)戶籍登記系統(tǒng)的凈誤差率估計(jì)。此外,還可以用來(lái)估計(jì)人口普查、農(nóng)業(yè)普查及經(jīng)濟(jì)普查的凈誤差率。
關(guān)鍵詞:抽樣調(diào)查;政府統(tǒng)計(jì);人口行政記錄;組合式三系統(tǒng)估計(jì)量;分層刀切法
中圖分類號(hào): C921.2
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1000-4149(2023)04-0056-19
DOI:10.3969/j.issn.1000-4149.2023.00.028
一、引言
國(guó)民經(jīng)濟(jì)發(fā)展中迫切需要解決的一個(gè)關(guān)鍵問(wèn)題是人口數(shù)目的準(zhǔn)確性問(wèn)題。對(duì)作為世界第一人口大國(guó)的中國(guó)尤其如此【 聯(lián)合國(guó)發(fā)布的《世界人口展望2022》報(bào)告顯示,中國(guó)2022年7月1日總?cè)丝跀?shù)為14.25887億人?!俊H丝诮y(tǒng)計(jì)調(diào)查和人口行政記錄是我國(guó)國(guó)家統(tǒng)計(jì)局獲得人口統(tǒng)計(jì)數(shù)據(jù)的兩大來(lái)源。人口統(tǒng)計(jì)調(diào)查包括每隔10年進(jìn)行一次的人口普查及非普查年進(jìn)行的人口抽樣調(diào)查。戶籍登記系統(tǒng)、常住人口登記系統(tǒng)、出生人口登記系統(tǒng)、死亡人口登記系統(tǒng)和人口遷移登記系統(tǒng),是我國(guó)常見(jiàn)的人口行政記錄。從對(duì)總體人口登記的范圍和準(zhǔn)確性等來(lái)看,戶籍登記系統(tǒng)是最重要的。中國(guó)公安部每年向國(guó)家統(tǒng)計(jì)局提供戶籍登記系統(tǒng)人口數(shù)。
相關(guān)信息表明,我國(guó)的戶籍登記系統(tǒng)人口數(shù)存在誤差,因而有必要研究或估計(jì)它,其必要性具體體現(xiàn)在兩個(gè)方面:
一方面,作為我國(guó)人口行政記錄中最重要的戶籍登記系統(tǒng),在登記目標(biāo)總體人口的過(guò)程中,通常會(huì)發(fā)生兩種誤差,一種是應(yīng)該登記卻未登記而引起的漏登誤差[1],另外一種是無(wú)效登記引起的錯(cuò)誤登記誤差[2-3],包括重復(fù)登記、目標(biāo)總體外登記和地址錯(cuò)誤登記。漏登誤差使戶籍登記系統(tǒng)不適當(dāng)減少人口數(shù),而錯(cuò)誤登記誤差導(dǎo)致戶籍登記系統(tǒng)虛增人口數(shù)。漏登誤差和錯(cuò)誤登記誤差相抵后的結(jié)果,即為凈誤差【 凈誤差可定義為漏登誤差與錯(cuò)誤登記誤差之差,或者定義為目標(biāo)總體實(shí)際人口數(shù)與戶籍登記系統(tǒng)人口數(shù)之差。各國(guó)政府統(tǒng)計(jì)部門在人口普查凈誤差中使用第二種定義。本文也采用第二種定義計(jì)算戶籍登記系統(tǒng)的凈誤差。】。另一方面,為確定能否使用及在多大程度上使用戶籍登記系統(tǒng)人口數(shù)提供依據(jù),因?yàn)槭褂幂^大凈誤差的戶籍登記系統(tǒng)人口數(shù)可能會(huì)影響決策的科學(xué)性。
本文擬用組合式三系統(tǒng)估計(jì)量來(lái)估計(jì)中國(guó)戶籍登記系統(tǒng)的凈誤差[4],即目標(biāo)總體未知的實(shí)際人口數(shù)【 目標(biāo)總體實(shí)際人口數(shù)為全國(guó)各個(gè)普查小區(qū)的應(yīng)該有本地戶口的無(wú)重復(fù)的人口數(shù)之和,其中包括應(yīng)該且實(shí)際擁有本地戶口的人口數(shù)和應(yīng)該有但實(shí)際上沒(méi)有本地戶口的人口數(shù)。】與已知的戶籍登記系統(tǒng)人口數(shù)【 戶籍登記系統(tǒng)人口數(shù)為全國(guó)所有公安部門派出所戶籍底冊(cè)所顯示的某一指定時(shí)點(diǎn)的人口數(shù)之和,或者是全國(guó)各個(gè)普查小區(qū)的擁有本地戶口的人口數(shù)之和?!恐?。實(shí)際人口數(shù)可以采用雙系統(tǒng)估計(jì)量、普通三系統(tǒng)估計(jì)量和組合式三系統(tǒng)估計(jì)量【 雙系統(tǒng)估計(jì)量依據(jù)普查人口名單和在它之后進(jìn)行的事后計(jì)數(shù)調(diào)查人口名單建立,普通三系統(tǒng)估計(jì)量依據(jù)這兩份調(diào)查人口名單和戶籍人口名單構(gòu)造,組合式三系統(tǒng)估計(jì)量的缺失單元估計(jì)量依據(jù)多個(gè)普通三系統(tǒng)估計(jì)量的缺失單元估計(jì)量建立?!抗烙?jì)[5-10]。組合式三系統(tǒng)估計(jì)量相對(duì)較優(yōu),首先它比普通三系統(tǒng)估計(jì)量利用的信息更多,其次它不像雙系統(tǒng)估計(jì)量那樣要求系統(tǒng)之間獨(dú)立。
與已有相關(guān)論文和其他研究成果相比,本文具有一定的學(xué)術(shù)價(jià)值和應(yīng)用價(jià)值。
學(xué)術(shù)價(jià)值體現(xiàn)在四個(gè)方面。
第一,提出抽樣登記的組合式三系統(tǒng)估計(jì)量,使其應(yīng)用于戶籍登記系統(tǒng)凈誤差估計(jì)成為可能。
第二,利用不完整三維列聯(lián)表單元數(shù)據(jù)構(gòu)造的組合式三系統(tǒng)估計(jì)量的缺失單元估計(jì)量的分子和分母,分別是若干個(gè)普通三系統(tǒng)估計(jì)量的缺失單元估計(jì)量的分子和分母之和,其中每個(gè)子總體指標(biāo)使用線性估計(jì)量構(gòu)造。
第三,研究不同抽樣方法下的刀切抽樣方差估計(jì)量及復(fù)制權(quán)數(shù)計(jì)算公式,為相關(guān)人員提供更多選擇。
第四,利用樣本普查小區(qū)的三份人口名單和公式,計(jì)算戶籍登記系統(tǒng)的凈誤差及抽樣方差估計(jì)值,使相關(guān)人員可以正確使用組合式三系統(tǒng)估計(jì)量。
應(yīng)用價(jià)值體現(xiàn)在三個(gè)方面。第一,為政府統(tǒng)計(jì)部門制定戶籍登記系統(tǒng)凈誤差估計(jì)方案提供參考,提高方案的科學(xué)性和可操作性,對(duì)戶籍登記系統(tǒng)的質(zhì)量作出客觀科學(xué)評(píng)價(jià)。第二,為相關(guān)
工作者正確認(rèn)識(shí)和使用戶籍登記系統(tǒng)數(shù)據(jù)提供依據(jù)。第三,開(kāi)發(fā)利用包括戶籍登記系統(tǒng)在內(nèi)的行政記錄資料,從而為實(shí)施以戶籍登記系統(tǒng)為核心的行政記錄式人口普查創(chuàng)造更好的條件。
二、文獻(xiàn)綜述
包括美國(guó)、北歐在內(nèi)的許多西方發(fā)達(dá)國(guó)家,以及部分非洲國(guó)家已經(jīng)建立起類似于中國(guó)、朝鮮和貝寧的戶籍登記系統(tǒng)的民事登記系統(tǒng)和人口動(dòng)態(tài)統(tǒng)計(jì)系統(tǒng)[11]。民事登記系統(tǒng)是確立一國(guó)個(gè)人權(quán)利和特權(quán)的法律基礎(chǔ),是對(duì)活產(chǎn)、胎兒死亡、死亡、結(jié)婚、離婚、收養(yǎng)等重要民事事件進(jìn)行強(qiáng)制性、連續(xù)性記錄的系統(tǒng)。人口動(dòng)態(tài)統(tǒng)計(jì)系統(tǒng)依據(jù)民事登記系統(tǒng)的人口動(dòng)態(tài)記錄,人口普查、抽樣調(diào)查和行政記錄的人口記錄,樣本登記區(qū)的人口動(dòng)態(tài)記錄和保健服務(wù)部門的記錄建立。只要堅(jiān)持詳細(xì)登記,民事登記系統(tǒng)就可以成為人口動(dòng)態(tài)統(tǒng)計(jì)系統(tǒng)的主要來(lái)源。戶籍登記系統(tǒng)是登記自然人的姓名、出生日期、戶主或與戶主關(guān)系、住址、性別、籍貫、居民身份證號(hào)碼、文化程度、婚姻狀況、民族、死亡和收養(yǎng)等的系統(tǒng)。我國(guó)《戶口登記條例》規(guī)定,出生者和死亡者應(yīng)該攜帶有關(guān)證件在規(guī)定時(shí)間內(nèi)到常住地辦理入戶、注銷戶口,每個(gè)人都有資格上戶口,而且只能有一個(gè)戶口。這三個(gè)系統(tǒng)的共同點(diǎn)都是對(duì)總體人口的登記,存在登記誤差和需要估計(jì)凈誤差。不同點(diǎn)是:建立戶籍登記系統(tǒng)的目的是限制人口的無(wú)序流動(dòng),減少人口管理的社會(huì)成本,提供人口數(shù)不是其主要功能,而是其副產(chǎn)品;構(gòu)建民事登記系統(tǒng)有雙重目的,即行政和法律目的及統(tǒng)計(jì)、人口和流行病學(xué)目的;建立人口動(dòng)態(tài)統(tǒng)計(jì)系統(tǒng)的主要目的是為政府統(tǒng)計(jì)部門和其他相關(guān)部門提供準(zhǔn)確的人口數(shù)。由于這三個(gè)系統(tǒng)的登記人口數(shù)已知,所以凈誤差估計(jì)只與總體實(shí)際人口數(shù)的估計(jì)有關(guān),與這三個(gè)系統(tǒng)的功能和登記對(duì)象無(wú)關(guān),組合式三系統(tǒng)估計(jì)量適合于它們的凈誤差估計(jì)。
相關(guān)文獻(xiàn)資料顯示,關(guān)于民事登記系統(tǒng)、人口動(dòng)態(tài)統(tǒng)計(jì)系統(tǒng)和戶籍登記系統(tǒng)的研究主要集中在系統(tǒng)的建立、資料來(lái)源及用于政策或計(jì)劃的制定方面[12-15]。有關(guān)估計(jì)這三個(gè)系統(tǒng)凈誤差的研究成果并不多見(jiàn)[16]。因此,本文研究中國(guó)戶籍登記系統(tǒng)的凈誤差估計(jì)。
為提高中國(guó)戶籍登記系統(tǒng)凈誤差估計(jì)精度,了解其發(fā)生登記誤差的三個(gè)原因是很有必要的。
第一,雖然戶籍管理?xiàng)l例明確規(guī)定為出生者或戶口遷移者及時(shí)入戶,為死亡者及時(shí)銷戶,但實(shí)際上從出生到入戶,從遷出地到遷入地入戶,從死亡到銷戶有一個(gè)時(shí)間差。如果這個(gè)時(shí)間差發(fā)生在估計(jì)戶籍登記系統(tǒng)凈誤差時(shí),就會(huì)發(fā)生漏登誤差和錯(cuò)誤登記誤差。
第二,我國(guó)曾經(jīng)實(shí)施過(guò)嚴(yán)格的計(jì)劃生育政策【 1971年到2015年,為控制人口增長(zhǎng),我國(guó)實(shí)行計(jì)劃生育政策。在這一政策背景下,超生嬰兒是無(wú)法入戶的。如果不能入戶,就失去讀書(shū)和享受福利等權(quán)利。】,禁止為超生嬰兒入戶,或只有繳納足額罰款才讓超生嬰兒入戶,導(dǎo)致較為嚴(yán)重的漏登誤差。隨著二孩或三孩政策的實(shí)施【 為鼓勵(lì)生育,解決勞動(dòng)力不足問(wèn)題,我國(guó)于2015年起開(kāi)始實(shí)施二孩或三孩政策,所有活產(chǎn)嬰兒都有資格入戶,戶籍登記系統(tǒng)漏登人口的幅度減少?!浚m然所有出生時(shí)的活產(chǎn)嬰兒目前都有資格入戶,但仍然沒(méi)有做到一旦出生便及時(shí)入戶。
第三,
在實(shí)行農(nóng)村養(yǎng)老保險(xiǎn)政策之前,有些農(nóng)村老年人一輩子都沒(méi)有上戶口,導(dǎo)致漏登誤差。隨著新型農(nóng)村社會(huì)養(yǎng)老保險(xiǎn)試點(diǎn)指導(dǎo)意見(jiàn)的實(shí)施(有戶籍的年滿60周歲的農(nóng)村老人可以按月領(lǐng)取養(yǎng)老金),漏登戶口的情況顯著減少,盡管這樣,及時(shí)入戶并未做到。第六次人口普查前的戶籍整頓結(jié)果顯示,全國(guó)有1300萬(wàn)凈無(wú)戶籍人口,占總?cè)丝诘?%【 數(shù)據(jù)來(lái)源于國(guó)家統(tǒng)計(jì)局《馬建堂解讀中國(guó)第六次全國(guó)人口普查》,stats.gov.cn/zt_18555/zdtjgz/zgrkpc/d6crkpc/dcrkpcyw/202303/t20230306_1935378.htm
】。凈無(wú)戶籍人口數(shù)就是凈誤差,為無(wú)戶籍人口數(shù)與重復(fù)登記戶籍人口數(shù)和死亡未注銷戶籍人口數(shù)之差。從以上三方面的原因分析可知,我國(guó)戶籍登記系統(tǒng)確實(shí)存在登記誤差,應(yīng)該采取恰當(dāng)方法估計(jì)其凈誤差。
聯(lián)合國(guó)經(jīng)濟(jì)及社會(huì)事務(wù)部和統(tǒng)計(jì)司在關(guān)于《人口動(dòng)態(tài)統(tǒng)計(jì)系統(tǒng)的原則和建議(修訂版2)》報(bào)告
中,使用雙系統(tǒng)估計(jì)量來(lái)估計(jì)民事登記系統(tǒng)或人口動(dòng)態(tài)登記系統(tǒng)的凈誤差。該報(bào)告未提及戶籍登記系統(tǒng)有兩個(gè)原因,一是世界上只有三個(gè)國(guó)家實(shí)施戶籍登記制度,二是這兩個(gè)系統(tǒng)的凈誤差率估計(jì)方法同樣適合于戶籍登記系統(tǒng)。這里的雙系統(tǒng)估計(jì)量中的兩個(gè)系統(tǒng)包括民事登記系統(tǒng)和人口統(tǒng)計(jì)調(diào)查系統(tǒng)。使用雙系統(tǒng)估計(jì)量的前提條件是,民事登記系統(tǒng)對(duì)總體人口的覆蓋率不得低于既定標(biāo)準(zhǔn)(如80%)。美國(guó)全國(guó)衛(wèi)生統(tǒng)計(jì)中心建立的民事登記系統(tǒng)的覆蓋率在1960年以后接近100%。美國(guó)人口普查局構(gòu)造人口統(tǒng)計(jì)分析模型所需要的出生人口數(shù)和死亡人口數(shù)可以直接從該系統(tǒng)獲得。美國(guó)對(duì)民事登記系統(tǒng)的凈誤差率每年或每隔2—3年估計(jì)一次。然而,一些非洲國(guó)家的民事登記系統(tǒng)的覆蓋率往往達(dá)不到標(biāo)準(zhǔn),不具備使用雙系統(tǒng)估計(jì)量的條件。我國(guó)戶籍登記系統(tǒng)的覆蓋率超過(guò)標(biāo)準(zhǔn),可以使用雙系統(tǒng)估計(jì)量來(lái)估計(jì)其凈誤差率。使用雙系統(tǒng)估計(jì)量還要滿足另外一個(gè)條件,即兩個(gè)系統(tǒng)必須獨(dú)立,否則會(huì)低估或高估總體實(shí)際人口數(shù)[17]。相比依據(jù)人口普查資料和人口抽樣調(diào)查資料構(gòu)造的雙系統(tǒng)估計(jì)量,根據(jù)民事登記系統(tǒng)和人口統(tǒng)計(jì)調(diào)查資料建立的雙系統(tǒng)估計(jì)量,能比較好地滿足獨(dú)立性條件。這是因?yàn)椋丝谄詹橘Y料和人口抽樣調(diào)查資料均來(lái)源于政府統(tǒng)計(jì)部門,獨(dú)立性自然難以保證,而民事登記系統(tǒng)數(shù)據(jù)和人口統(tǒng)計(jì)調(diào)查資料分別來(lái)源于行政管理部門和統(tǒng)計(jì)部門,獨(dú)立性應(yīng)該能夠滿足。也就是說(shuō),在民事登記系統(tǒng)凈誤差估計(jì)中,構(gòu)造和使用依據(jù)民事登記系統(tǒng)和人口統(tǒng)計(jì)調(diào)查資料的雙系統(tǒng)估計(jì)量是合適和可行的。盡管如此,我們還是認(rèn)為用三系統(tǒng)估計(jì)量取代雙系統(tǒng)估計(jì)量更為合適。一方面,雙系統(tǒng)估計(jì)量只利用了兩種資料,而三系統(tǒng)估計(jì)量利用了三種資料。抽樣理論指出,在構(gòu)造估計(jì)量的時(shí)候,利用的有效信息越多,估計(jì)量的精度也會(huì)越高。另一方面,三系統(tǒng)估計(jì)量不要求三個(gè)系統(tǒng)相互獨(dú)立,既可以在它們獨(dú)立,也可以在它們非獨(dú)立的情況下構(gòu)造。按照缺失單元估計(jì)量構(gòu)造方法的不同,三系統(tǒng)估計(jì)量包括普通和組合式兩種。對(duì)我國(guó)來(lái)說(shuō),在人口普查年,三系統(tǒng)估計(jì)量的三個(gè)系統(tǒng)分別是人口普查、人口普查之后組織的事后計(jì)數(shù)調(diào)查和戶籍登記系統(tǒng);在非人口普查年,三個(gè)系統(tǒng)分別是人口抽樣調(diào)查、人口抽樣調(diào)查的事后計(jì)數(shù)調(diào)查和戶籍登記系統(tǒng)?;谌到y(tǒng)估計(jì)量的戶籍登記系統(tǒng)凈誤差估計(jì)工作,既可以在人口普查年進(jìn)行,也可以在非人口普查年實(shí)施。
我國(guó)國(guó)家統(tǒng)計(jì)局尚未開(kāi)展戶籍登記系統(tǒng)凈誤差估計(jì)工作,這一狀況應(yīng)該改變。使戶籍登記系統(tǒng)在人口統(tǒng)計(jì)中發(fā)揮應(yīng)有作用,應(yīng)加強(qiáng)戶籍登記系統(tǒng)凈誤差估計(jì)基礎(chǔ)理論研究,尤其是組合式三系統(tǒng)估計(jì)量的研究工作,逐步建立起符合我國(guó)國(guó)情的以組合式三系統(tǒng)估計(jì)量為核心的戶籍登記系統(tǒng)凈誤差(率)估計(jì)體系。
三、理論
使用組合式三系統(tǒng)估計(jì)量估計(jì)人口普查年中國(guó)戶籍登記系統(tǒng)的凈誤差,需要建立相應(yīng)的理論,包括普通和組合式三系統(tǒng)估計(jì)量、戶籍登記系統(tǒng)凈誤差及其抽樣方差估計(jì),以及對(duì)三份人口名單的必要說(shuō)明。
1. 普通三系統(tǒng)估計(jì)量
為了更好地理解和運(yùn)用組合式三系統(tǒng)估計(jì)量,有必要對(duì)其進(jìn)行簡(jiǎn)要介紹。這個(gè)估計(jì)量的理論基礎(chǔ)是三次捕獲模型?!俺霈F(xiàn)在本次捕獲結(jié)果之中”和“未出現(xiàn)在本次捕獲結(jié)果之中”是每一次捕獲結(jié)果的兩種取值。用來(lái)構(gòu)造普通三系統(tǒng)估計(jì)量的普查人口名單、事后計(jì)數(shù)調(diào)查人口名單和戶籍人口名單分別對(duì)應(yīng)于三次捕獲模型的第一次、第二次和第三次捕獲。
三次捕獲模型要求總體中的個(gè)體同質(zhì),而人類總體中的人不具有同質(zhì)性,這樣在構(gòu)造基于三次捕獲模型的普通三系統(tǒng)估計(jì)量之前,需要對(duì)總體中的人進(jìn)行同質(zhì)性分層。我們將總體劃分為V個(gè)同質(zhì)人口層,并且將同質(zhì)人口層v(v=1,2,…,V)中的人在三份人口名單的登記結(jié)果指定到不完整三維列聯(lián)表的相應(yīng)單元,其中七個(gè)單元的人口數(shù)是已知的,其和用xv表示,一個(gè)缺失單元的人口數(shù)未知,其估計(jì)量使用 m︿000,v表示。普通三系統(tǒng)估計(jì)量(General Triple System Estimator,GTSE)由這兩部分組成。七個(gè)單元中的每個(gè)單元的實(shí)際人口數(shù)使用xijk,v表示,右下標(biāo)i,j,k分別為同質(zhì)人口層v的人是否
在普查人口名單、
事后計(jì)數(shù)調(diào)查人口名單和戶籍人口名單的登記結(jié)果的
變量。i=1表示該人登記在普查人口名單,i=0表示該人未登記在普查人口名單;j=1表示該人登記在事后計(jì)數(shù)調(diào)查人口名單,j=0表示該人未登記在事后計(jì)數(shù)調(diào)查人口名單;k=1表示該人登記在戶籍人口名單,k=0表示該人未登記在戶籍人口名單。將這些符號(hào)及其人口數(shù)填寫(xiě)在表1中。注意,表1假設(shè)事后計(jì)數(shù)調(diào)查為全面調(diào)查。
4. 對(duì)三份人口名單的必要說(shuō)明或規(guī)定
為了正確地、合乎邏輯地使用式(12)到式(35),有必要對(duì)用來(lái)構(gòu)造組合式三系統(tǒng)估計(jì)量的普查人口名單、事后計(jì)數(shù)調(diào)查人口名單和戶籍人口名單做必要說(shuō)明或規(guī)定。前兩份調(diào)查人口名單依據(jù)普查表和事后計(jì)數(shù)調(diào)查表編制而成,戶籍人口名單依據(jù)派出所提供的戶籍登記底冊(cè)編制。組合式三系統(tǒng)估計(jì)量的使用須符合我國(guó)人口口徑、統(tǒng)計(jì)調(diào)查及估計(jì)理論的要求。
我國(guó)戶籍登記系統(tǒng)凈誤差為目標(biāo)總體實(shí)際人口數(shù)與戶籍登記系統(tǒng)人口數(shù)之差。按照國(guó)家統(tǒng)計(jì)局人口口徑的劃分,目標(biāo)總體實(shí)際人口數(shù)有三種口徑,即常住人口數(shù)、現(xiàn)有人口數(shù)和戶籍人口數(shù)。依據(jù)統(tǒng)計(jì)指標(biāo)計(jì)算要求,目標(biāo)總體實(shí)際人口數(shù)與戶籍登記系統(tǒng)人口數(shù)在口徑上需一致。對(duì)于實(shí)際人口數(shù)估計(jì),就是要估計(jì)目標(biāo)總體有戶口且只有一個(gè)戶口的戶籍人口數(shù)。按照統(tǒng)計(jì)調(diào)查要求,對(duì)發(fā)生的人口動(dòng)態(tài)事件要及時(shí)登記或處理,所估計(jì)的戶籍人口數(shù)就應(yīng)該包括在普查標(biāo)準(zhǔn)時(shí)點(diǎn)前出生但未入戶的嬰兒,但不包括該時(shí)點(diǎn)前死亡但未注銷戶口者,也不包括重復(fù)戶口者。按照戶籍登記條例及現(xiàn)實(shí)做法,公安部門公布的戶籍登記系統(tǒng)人口數(shù)包括了死亡未注銷戶口者和重復(fù)戶口者人數(shù),但未包括應(yīng)該及時(shí)入戶的嬰兒人數(shù)。可見(jiàn),估計(jì)的目標(biāo)總體戶籍人口數(shù)不同于戶籍登記系統(tǒng)人口數(shù)。
為了獲得與戶籍登記系統(tǒng)人口數(shù)在口徑上一致的目標(biāo)總體戶籍人口數(shù)的估計(jì)值,在確定三份人口名單的戶籍人口時(shí),要堅(jiān)持三項(xiàng)原則。
一是研究范圍原則。如果研究范圍是重慶市,只要這個(gè)人在該市的任何地方上了戶口,就可作為本樣本普查小區(qū)的戶籍人口,而不要求這個(gè)人的戶口登記在本樣本普查小區(qū)的所在地。如果研究范圍是全國(guó),只要這個(gè)人在全國(guó)的任何地方有戶口,即可視為本樣本小區(qū)的戶籍人口。例如,某人是重慶市的常住人口,但其戶口登記在武漢市,也可以算作是本樣本普查小區(qū)的戶籍人口。這是可以理解的,因?yàn)槭褂媒M合式三系統(tǒng)估計(jì)量估計(jì)的是研究范圍內(nèi)擁有戶籍的人口數(shù),而不是估計(jì)所有樣本普查小區(qū)本身有戶口的人口數(shù)。
二是登記范圍原則。普查標(biāo)準(zhǔn)時(shí)點(diǎn)居住在本樣本普查小區(qū)的人,不管其戶籍登記在何處,以及戶口登記在本樣本普查小區(qū)但在該時(shí)點(diǎn)未居住在本樣本普查小區(qū)的人,無(wú)論其外出時(shí)間多長(zhǎng)、外出原因如何,都要進(jìn)行登記。對(duì)于出差、旅游、走親訪友等原因臨時(shí)外出的人口,也要進(jìn)行登記。為避免重復(fù)登記,臨時(shí)來(lái)訪的人不登記。標(biāo)準(zhǔn)時(shí)點(diǎn)后出生的人和該時(shí)點(diǎn)前死亡的人、港澳臺(tái)和外籍人員以及現(xiàn)役軍人不登記。使用出生醫(yī)學(xué)證明、死亡醫(yī)學(xué)證明、居民身份證號(hào)碼或現(xiàn)場(chǎng)調(diào)查法,核對(duì)樣本普查小區(qū)的三份人口名單,判斷它們是否登記了普查標(biāo)準(zhǔn)時(shí)點(diǎn)之前出生的嬰兒及死亡者或重復(fù)戶口者。如果未登記該時(shí)點(diǎn)前出生的嬰兒,則添補(bǔ)到這三份人口名單,這是因?yàn)檫@類嬰兒在該時(shí)點(diǎn)具備了上戶口資格,未上戶口是因?yàn)槠渌y以抗拒的原因,因此應(yīng)該視為戶籍人口。如果三份名單登記了該時(shí)點(diǎn)之前死亡者或重復(fù)戶口,或者登記了標(biāo)準(zhǔn)時(shí)點(diǎn)之后出生的嬰兒,則從中剔除。
三是分割指定原則。組合式三系統(tǒng)估計(jì)量對(duì)總體戶籍人口數(shù)的估計(jì)依據(jù)的是樣本普查小區(qū)的三份人口名單,因而須獲得這樣的三份人口名單,可是我國(guó)的戶籍登記系統(tǒng)并不是按普查小區(qū)劃分的,而是以街道為范圍登記的,街道建立了分建筑物的普查小區(qū)戶籍登記系統(tǒng)。這樣一來(lái),為了獲得本樣本普查小區(qū)的戶籍人口信息,需要在街道的戶籍登記系統(tǒng)搜索本樣本普查小區(qū)的戶籍人口,或者比對(duì)本樣本普查小區(qū)三份人口名單的人口地址和街道戶籍登記系統(tǒng)的人口地址。
四、實(shí)證研究
按理應(yīng)該以全國(guó)為實(shí)證范圍估計(jì)全國(guó)戶籍登記系統(tǒng)的凈誤差率,但是因?yàn)闊o(wú)法獲得估計(jì)全國(guó)戶籍登記系統(tǒng)凈誤差的原始數(shù)據(jù),所以從數(shù)據(jù)可獲得性及數(shù)據(jù)處理難度兩個(gè)方面考慮,選擇重慶市某行政區(qū)為研究范圍,估計(jì)其2010年11月1日戶籍登記系統(tǒng)的凈誤差率(沒(méi)有獲得該行政區(qū)2020年戶籍登記系統(tǒng)凈誤差率估計(jì)所需要的原始數(shù)據(jù))。
1. 抽樣方法
采用分層二重抽樣方法。在抽取第一重樣本之前,為提高樣本對(duì)總體的代表性及便于編制抽樣框,按照住房單元數(shù)將該行政區(qū)的總共2200個(gè)普查小區(qū)分為兩層(H=2)。h=1表示含80個(gè)及以上住房單元的普查小區(qū)層,h=2表示含80個(gè)以下住房單元的普查小區(qū)層。以普查小區(qū)為抽樣單位,在每層采用簡(jiǎn)單隨機(jī)不重復(fù)抽樣方式抽取樣本普查小區(qū)。Nh表示層h的普查小區(qū)總數(shù),nh表示從層h抽取的樣本小區(qū)數(shù)。對(duì)抽取的第一重樣本普查小區(qū),了解每一樣本普查小區(qū)的戶籍人口數(shù),并作為第二重抽樣的輔助變量。依據(jù)戶籍人口占全部人口數(shù)比例將第一重樣本普查小區(qū)重新分為兩層(G=2)。g=1表示戶籍人口比例不足50%的普查小區(qū)層,g=2表示戶籍人口比例大于等于50%的普查小區(qū)層。Mhg表示交叉層hg的普查小區(qū)總數(shù),mhg表示從交叉層hg抽取的樣本小區(qū)數(shù)。表2和表3為樣本形成過(guò)程及抽樣權(quán)數(shù),其中,第一重樣本含普查小區(qū)13個(gè),第二重樣本含普查小區(qū)8個(gè)。
2. 數(shù)據(jù)采集與處理
估計(jì)該行政區(qū)戶籍登記系統(tǒng)的凈誤差,所需要的是表2中帶有“*”號(hào)和“**”的8個(gè)樣本普查小區(qū)的三份人口名單。通過(guò)比較,得到了每個(gè)樣本普查小區(qū)人口在三份人口名單的登記結(jié)果。為簡(jiǎn)化計(jì)算,按照性別對(duì)樣本普查小區(qū)的人口同質(zhì)分層(V=2),v=1表示男性層,v=2表示女性層。比較結(jié)果見(jiàn)表4和表5。
3. 估計(jì)結(jié)果
(1)戶籍登記系統(tǒng)凈誤差(率)估計(jì)值。使用表1到表4數(shù)據(jù)和式(12)到式(16)得到男性層、女性層和總體的實(shí)際人口數(shù)及戶籍登記系統(tǒng)的凈誤差(率)估計(jì)值,見(jiàn)表6。
從表6可以看出以下三點(diǎn)重要信息。
第一,總體的戶籍登記系統(tǒng)的凈誤差估計(jì)值5657人,并不是漏登人口數(shù),而是凈漏登人口數(shù),即從漏登人口數(shù)中剔除錯(cuò)誤地登記后的剩余人口數(shù)。有學(xué)者將國(guó)家統(tǒng)計(jì)局人口和就業(yè)統(tǒng)計(jì)司估計(jì)的2020年人口普查凈誤差率0.05%錯(cuò)誤地解讀為漏登率0.05%。戶籍登記系統(tǒng)凈誤差可以表現(xiàn)為該系統(tǒng)的漏登誤差與錯(cuò)誤登記誤差之差,也可以表現(xiàn)為估計(jì)的目標(biāo)總體戶籍人口數(shù)與該系統(tǒng)人口數(shù)之差,所以凈誤差既不是漏登誤差,也不是錯(cuò)誤登記誤差。
第二,從總?cè)丝跀?shù)來(lái)看,采用組合式三系統(tǒng)估計(jì)量估計(jì)的重慶市某行政區(qū)2010年的戶籍人口數(shù)為563227人,總體的戶籍登記系統(tǒng)人口數(shù)為557570人。這表明總體的戶籍登記系統(tǒng)凈漏登人口數(shù)5657人,凈誤差率為1.004%。《中國(guó)統(tǒng)計(jì)年鑒》上提供的是戶籍登記系統(tǒng)人口數(shù),而不是估計(jì)的戶籍人口數(shù)。如果估計(jì)的凈漏登人數(shù)多,那么依據(jù)戶籍登記系統(tǒng)人口數(shù)進(jìn)行人口統(tǒng)計(jì)研究工作就有可能得出錯(cuò)誤的結(jié)論。所估計(jì)的凈誤差率1.004%與公安部門組織的同年戶籍整頓得到的凈誤差率很接近。
戶籍整頓采用的是全面調(diào)查,即對(duì)每個(gè)住戶進(jìn)行調(diào)查,登記其無(wú)戶籍人口、重復(fù)登記戶口者和死亡未注銷戶口者,而全面調(diào)查得到的結(jié)果受到研究人員和實(shí)際工作者的廣泛認(rèn)可。我們估計(jì)的結(jié)果與全面調(diào)查得到的結(jié)果接近,一定程度上說(shuō)明我們提出的組合式三系統(tǒng)估計(jì)量適合于戶籍登記系統(tǒng)的凈誤差率估計(jì)。
第三,從類別人口數(shù)來(lái)看,男性的凈誤差估計(jì)值為3453人,凈誤差率為1.2%,而女性的凈誤差估計(jì)值為2204人,凈誤差率為0.799%。這表明,無(wú)論從絕對(duì)數(shù)還是從相對(duì)數(shù)來(lái)看,戶籍登記系統(tǒng)漏登男性的情況比女性要嚴(yán)重。這主要源于我國(guó)在2015年前實(shí)行計(jì)劃生育政策,在這一政策背景下,對(duì)于超生人口需要按規(guī)定繳納社會(huì)撫養(yǎng)費(fèi)才能入戶,而很多家庭無(wú)力足額繳納社會(huì)撫養(yǎng)費(fèi),因而超生人口實(shí)際上沒(méi)有申報(bào)戶口的資格或機(jī)會(huì),而在超生人口中,男性所占比率大于女性,這是因?yàn)樵谥袊?guó)農(nóng)村,養(yǎng)兒防老思想在一些人的頭腦中根深蒂固,即便無(wú)力繳納社會(huì)撫養(yǎng)費(fèi),在沒(méi)有兒子之前,也要冒著無(wú)法入戶的風(fēng)險(xiǎn)超生男嬰。戶籍登記系統(tǒng)漏登人口,除了超生人口之外,還有申報(bào)戶口手續(xù)不全者(出生證明不全、抱養(yǎng)手續(xù)不全)、正在申報(bào)戶口但未入戶者、戶口待定人口。
(2)戶籍登記系統(tǒng)凈誤差(率)估計(jì)值的抽樣標(biāo)準(zhǔn)誤差估計(jì)值。首先,使用式(22)和表2到表3數(shù)據(jù),得到逐一剔除第一重樣本普查小區(qū)后,進(jìn)入第二重樣本的普查小區(qū)的復(fù)制權(quán)數(shù)(見(jiàn)表7)。然后,使用表2到表7數(shù)據(jù)和式(23)到式(31),計(jì)算男性層、女性層的抽樣方差,以及它們之間的協(xié)方差,見(jiàn)表8到表10。
表7中的第二重樣本普查小區(qū)的復(fù)制權(quán)數(shù)是構(gòu)造復(fù)制組合式三系統(tǒng)估計(jì)量及戶籍登記系統(tǒng)復(fù)制凈誤差估計(jì)量的基礎(chǔ)數(shù)據(jù)。復(fù)制組合式三系統(tǒng)估計(jì)量不同于組合式三系統(tǒng)估計(jì)量,前者依據(jù)復(fù)制權(quán)數(shù)構(gòu)造,后者依據(jù)抽樣權(quán)數(shù)構(gòu)造。
在表8中,CTSEB(st)男性
=1∑Hh=1nh∑Hh=1∑nht=1
CTSEB(st)男性
。
表8中的合計(jì)數(shù)5619324.20為男性層戶籍登記系統(tǒng)凈誤差的抽樣方差,其抽樣標(biāo)準(zhǔn)誤差約為2371人,這表明男性估計(jì)的戶籍人口數(shù)和戶籍登記系統(tǒng)凈誤差的估計(jì)值與其實(shí)際值平均相差2371人。抽樣標(biāo)準(zhǔn)誤差越小,估計(jì)值的精度越高。
在表9中,CTSEB(st)女性
=1∑Hh=1nh∑Hh=1∑nht=1
CTSEB(st)女性
。
表9中的合計(jì)數(shù)1914029.94為女性層戶籍登記系統(tǒng)凈誤差的抽樣方差,其抽樣標(biāo)準(zhǔn)誤差約為1383人,這表明估計(jì)的女性戶籍人口數(shù)和戶籍登記系統(tǒng)凈誤差的估計(jì)值與其實(shí)際
值平均相差1383人。與表8中男性抽樣標(biāo)準(zhǔn)誤差相比,表9女性的抽樣標(biāo)準(zhǔn)誤差要小許多,因此使用組合式三系統(tǒng)估計(jì)量估計(jì)的女性實(shí)際人口數(shù)的精度高于男性。
在表10中,CTSEB(st)男性
=
1∑Hh=1nh∑Hh=1∑nht=1
CTSEB(st)男性,CTSEB(st)女性
=
1∑Hh=1nh∑Hh=1∑nht=1
CTSEB(st)女性
。
與表8和表9中的抽樣方差所不同的是,表10提供的是男性層和女性層戶籍人口數(shù)估計(jì)
值的協(xié)方差,為-1747676.22。協(xié)方差可能為正、負(fù)和零。若為零,表示這兩個(gè)同質(zhì)人口層無(wú)關(guān),對(duì)總體抽樣方差無(wú)影響;若為正,表示正相關(guān),增大總體抽樣方差;若為負(fù),表示負(fù)相關(guān),減少總體的抽樣方差。
我們最后根據(jù)前面的有關(guān)計(jì)算結(jié)果和式(32)到式(35)給出戶籍登記系統(tǒng)凈誤差和凈誤差率的抽樣標(biāo)準(zhǔn)誤差,見(jiàn)表11。
表11分別提供了重慶市某行政區(qū)戶籍登記系統(tǒng)的凈誤差(率)及其抽樣標(biāo)準(zhǔn)誤差,其中,總體的凈誤差率為1.004%,抽樣標(biāo)準(zhǔn)誤差為0.357%,男性凈誤差率和抽樣標(biāo)準(zhǔn)誤差分別為1.2%和0.824%,而女性凈誤差率和抽樣標(biāo)準(zhǔn)誤差分別為0.799%和0.502%。可見(jiàn),總體的凈誤差率介于男性層和女性層之間,其抽樣標(biāo)準(zhǔn)誤差也在它們之間。從數(shù)據(jù)上看,這三個(gè)凈誤差率的抽樣標(biāo)準(zhǔn)誤差均較小,估計(jì)精度均較高。
五、結(jié)語(yǔ)
第一,雖然中國(guó)建立戶籍登記系統(tǒng)的目的并不是提供人口數(shù)據(jù),但它客觀上成了人口統(tǒng)計(jì)數(shù)據(jù)的重要來(lái)源。由于種種原因,該系統(tǒng)可能會(huì)重復(fù)登記、漏登、滯后登記目標(biāo)總體人口,從而導(dǎo)致戶籍登記系統(tǒng)人口數(shù)偏離戶籍實(shí)際人口數(shù)。這就需要采取恰當(dāng)?shù)姆椒ü烙?jì)這種偏離的程度,從而更有效地發(fā)揮該戶籍登記系統(tǒng)人口數(shù)在社會(huì)經(jīng)濟(jì)發(fā)展與科學(xué)研究中的作用。此外,部門應(yīng)建立起密切的數(shù)據(jù)共享關(guān)系,并制定必要的數(shù)據(jù)共享規(guī)則以保證能夠從公安部門順暢地得到戶籍微觀數(shù)據(jù)。
第二,是否使用估計(jì)的凈誤差率調(diào)整戶籍登記系統(tǒng)人口數(shù)要考慮兩個(gè)方面的因素。一是凈誤差率估計(jì)值的大小。如果誤差程度很小,就可以考慮直接使用戶籍登記系統(tǒng)人口數(shù)作決策或開(kāi)展科學(xué)研究;如果誤差程度較大,就需要根據(jù)估計(jì)的凈誤差率調(diào)整戶籍登記系統(tǒng)人口數(shù),依據(jù)調(diào)整后的戶籍登記系統(tǒng)人口數(shù)進(jìn)行相關(guān)工作。
二是調(diào)整對(duì)象的范圍。
在決定調(diào)整時(shí),調(diào)整的對(duì)象既可能是全國(guó)的戶籍登記系統(tǒng)人口數(shù),也可能是全國(guó)以下地區(qū)的省級(jí)單位或其下所管轄的行政區(qū)的戶籍登記系統(tǒng)人口數(shù);既可能是對(duì)總?cè)丝诘膽艏怯浵到y(tǒng)人口數(shù)調(diào)整,也可能是類別人口的人口數(shù)調(diào)整。本文只估計(jì)了總體的戶籍人口數(shù)。建議國(guó)家統(tǒng)計(jì)局使用組合式三系統(tǒng)估計(jì)量估計(jì)全國(guó)和全國(guó)以下較大范圍的行政區(qū)的戶籍實(shí)際人口數(shù),以及總體全部人口和類別人口(男性和女性等)的戶籍實(shí)際人口數(shù),為戶籍登記系統(tǒng)人口數(shù)的調(diào)整提供數(shù)據(jù)基礎(chǔ)。
第三,估計(jì)戶籍登記系統(tǒng)凈誤差的關(guān)鍵是構(gòu)造估計(jì)目標(biāo)總體戶籍實(shí)際人口數(shù)的估計(jì)量。建議國(guó)家統(tǒng)計(jì)局培訓(xùn)人口數(shù)目估計(jì)專門人才,加強(qiáng)組合式三系統(tǒng)估計(jì)量及其抽樣方差估計(jì)量的研究,為戶籍登記系統(tǒng)凈誤差估計(jì)做好理論和人才準(zhǔn)備工作,以提高凈誤差估計(jì)的精度。
第四,使用組合式三系統(tǒng)估計(jì)量估計(jì)戶籍登記系統(tǒng)的凈誤差時(shí),需要解決的一個(gè)關(guān)鍵問(wèn)題是,怎樣對(duì)總體中的人進(jìn)行同質(zhì)性分層。如果分層不當(dāng),在同一層內(nèi)出現(xiàn)異質(zhì)情況的,在這樣的層內(nèi)建立組合式三系統(tǒng)估計(jì)量則會(huì)導(dǎo)致人口數(shù)估計(jì)值的異質(zhì)性偏差,低估目標(biāo)總體實(shí)際人口數(shù)和戶籍登記系統(tǒng)的凈誤差。為解決這一問(wèn)題,建議國(guó)家統(tǒng)計(jì)局慎重選擇分層變量。
參考文獻(xiàn):
[1]胡桂華, 漆莉, 遲璐婕. 人口普查中遺漏人口數(shù)的估計(jì)[J]. 數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究, 2022(1): 132-153.
[2]胡桂華, 劉譽(yù)環(huán), 文婷. 人口普查多報(bào)估計(jì)研究[J]. 人口與經(jīng)濟(jì), 2022(3): 71-85.
[3]張廣宇, 顧寶昌. 人口普查重報(bào): 人口普查面臨的新挑戰(zhàn)[J]. 人口與經(jīng)濟(jì), 2018(3): 1-12.
[4]胡桂華. 人口普查凈誤差估計(jì)綜述[J]. 數(shù)理統(tǒng)計(jì)與管理, 2018(5): 796-814.
[5]胡桂華, 吳迪,遲璐婕. 人口普查覆蓋誤差估計(jì)方法研究[J].
徐州工程學(xué)院學(xué)報(bào)(自然科學(xué)版), 2023(2): 8-16.
[6]胡桂華, 遲璐婕. 基于四系統(tǒng)估計(jì)量的人口普查凈覆蓋誤差估計(jì)[J]. 系統(tǒng)科學(xué)與數(shù)學(xué), 2022(7): 1910-1928.
[7]遲璐婕, 胡桂華. 人口數(shù)目估計(jì)的多來(lái)源方法[J]. 徐州工程學(xué)院學(xué)報(bào)(自然科學(xué)版), 2021(2): 84-92.
[8]孟杰, 楊貴軍, 馮國(guó)雷, 滑夢(mèng)珂. 人口總數(shù)估計(jì):基于三系統(tǒng)估計(jì)量與比率估計(jì)量的組合方法[J]. 系統(tǒng)科學(xué)與數(shù)學(xué), 2022(1): 35-49.
[9]ZHANG L C. A note on dual system population size estimation[J]. Journal of Official Statistics, 2019, 35(1): 279-283.
[10]GRIFFIN R. Potential uses of the administrative records for triple system modeling for estimation of census coverage error in 2022[J]. Journal of Official Statistics, 2014, 30(2): 177-189.
[11]聯(lián)合國(guó)經(jīng)濟(jì)及社會(huì)事務(wù)部, 聯(lián)合國(guó)統(tǒng)計(jì)司. 關(guān)于人口動(dòng)態(tài)系統(tǒng)的原則和建議(修訂本2)[R], 2002.
[12]張慶五, 張?jiān)? 從國(guó)外民事登記看我國(guó)戶籍制度改革[J]. 人口與計(jì)劃生育, 2002(3): 21-23.
[13]接棟正. 國(guó)外民事登記制度及其對(duì)我國(guó)戶籍制度改革的啟示[D]. 上海:華東師范大學(xué), 2009:95-112.
[14]靳衛(wèi)東, 杜育紅. 農(nóng)民工城鎮(zhèn)居留意愿、自主就業(yè)選擇與戶籍歧視變化[J]. 華中師范大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版), 2022(4): 25-37.
[15]李五榮, 豐晨宇, 陳華帥. 城市落戶門檻對(duì)農(nóng)村流動(dòng)人口創(chuàng)業(yè)決策的影響——基于新一輪戶籍制度改革的分析[J]. 中南財(cái)經(jīng)政法大學(xué)學(xué)報(bào), 2022(4): 82-95.
[16]胡桂華, 薛婷. 中國(guó)戶籍登記系統(tǒng)覆蓋評(píng)估研究[J]. 統(tǒng)計(jì)與信息論壇, 2018(7): 34-46.
[17]孟杰. 雙系統(tǒng)估計(jì)量的交互作用偏差研究[J]. 數(shù)理統(tǒng)計(jì)與管理, 2019(5): 858-872.
[18]胡桂華, 吳婷, 范署姍. 人口普查質(zhì)量評(píng)估中的三系統(tǒng)估計(jì)量研究[J]. 數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究, 2020(8): 159-175.
[19]胡桂華. 人口普查質(zhì)量評(píng)估中抽樣后分層變量的選擇[J]. 數(shù)理統(tǒng)計(jì)與管理, 2015(2): 254-263.
[20]胡桂華, 武潔, 丁楊. 人口普查質(zhì)量評(píng)估中Logistic回歸模型的應(yīng)用[J]. 數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究, 2015(4): 106-122.
[21]金勇進(jìn), 劉曉宇. 大數(shù)據(jù)背景下的抽樣調(diào)查[J]. 系統(tǒng)科學(xué)與數(shù)學(xué), 2022(1): 2-16.
[22]金勇進(jìn), 劉曉宇. 權(quán)數(shù)對(duì)基于模型推斷的影響分析[J]. 統(tǒng)計(jì)與信息論壇, 2022(3): 3-13.
[23]王小寧. 權(quán)數(shù)在人口抽樣調(diào)查估計(jì)中的應(yīng)用研究[J]. 統(tǒng)計(jì)與信息論壇, 2019(12): 9-15.
[24]鞏紅禹, 張士琦, 王春枝. 基于分層平衡抽樣的多目標(biāo)代表性樣本設(shè)計(jì)——以住戶調(diào)查為例[J]. 統(tǒng)計(jì)與信息論壇, 2021(2): 36-44.
[25]陳光慧, 劉建平. 構(gòu)建新時(shí)代現(xiàn)代化統(tǒng)計(jì)調(diào)查體系的問(wèn)題研究[J]. 統(tǒng)計(jì)研究, 2018(6): 11-17.
[26]EFRON B, STEIN? C. The jackknife estimate of variance [J]. Annals of Statistics, 1981, 9(3): 586-596.
[27]孟杰, 沈文靜, 楊貴軍, 劉楊. 復(fù)雜抽樣的Bootstrap方差估計(jì)方法及應(yīng)用[J]. 數(shù)理統(tǒng)計(jì)與管理, 2021(2): 266-278.
Estimation of Net Error in Household Registration System
HU? Guihua, WU? Di, LIU Yuhuan
(School of Mathematics and Statistics, Chongqing Technology and Business University,
Chongqing 400067, China)
Abstract: There are registration errors in the registered residence system. In order to play its role, the net error should be estimated. The net error of the registered residence system has not been estimated in China, which requires to be changed. Dual system estimator is an important method to estimate net error at present. The purpose of this study is to estimate the net error of household registration system by using the combined three-system estimator instead of the dual-system estimator. It is the difference between the unknown actual population of the target population and the known population of the registered residence registration system, which? provides the basis for the scientific use of registered residence registration data by relevant departments or personnel.The sampling theory and mathematical model method are used to construct a combined three-system estimator, and the calculation process is demonstrated by using three population lists of sample census districts.
The research finds that:
1) Although the registered residence system is an important source of demographic data, due to the error of misregistration or missing population registration, the population provided by registered residence registration system is different from actual population, where appropriate methods should be adopted to estimate the extent of such deviation.
2) The combined three-system estimator of sampling registration is appropriate for net error estimation.
3) In order to make the estimated net error of the registered residence system meet the consistency requirements of the statistical caliber, each person in the census population list the post-enumeration survey population list and the registered residence population list of the sample census communities must have local registeration, otherwise they must be removed from these lists.
4) The combined three-system estimator must be established in the homogeneous population stratum, otherwise it contains heterogeneity bias and underestimates the actual population size.
5) Under stratified double sampling, the estimators of each element of the combined three-system estimator are constructed by the double expansion estimator, where the sampling variance is approximately calculated by the stratified jack-knife method.
6) Net error estimation can be conducted in either a census year or a non-census year. The research significance is that the combined three-system estimator is expected to be adopted by the National Bureau of Statistics to estimate the net error rate of registered residence system in the future. In addition, it can also be used to estimate the net error rate of population census, agricultural census and economic census.
Keywords:sampling survey;official statistics;population administrative records;combined three-system estimator;stratified cutting method
[責(zé)任編輯 崔子涵,方 志]