陳培培++金勇進(jìn)
摘要:文章根據(jù)官方公布的歷次中國(guó)人口普查方案和相關(guān)數(shù)據(jù)質(zhì)量抽查實(shí)施辦法,分別從普查摸底階段、普查登記匯總編碼階段和普查事后質(zhì)量抽查階段分析現(xiàn)有人口普查數(shù)據(jù)質(zhì)量評(píng)估特點(diǎn),并在此基礎(chǔ)上提出了雙系統(tǒng)估計(jì)量在我國(guó)普查實(shí)踐中的科學(xué)應(yīng)用、匯總數(shù)據(jù)時(shí)要綜合運(yùn)用評(píng)估方法和在普查數(shù)據(jù)質(zhì)量抽查中采用系統(tǒng)完善的抽樣設(shè)計(jì)等改進(jìn)措施,期望能夠進(jìn)一步完善人口普查數(shù)據(jù)質(zhì)量評(píng)估的理論方法。
關(guān)鍵詞:人口普查;數(shù)據(jù)質(zhì)量評(píng)估;事后質(zhì)量抽查
一、 引言
人口普查是一項(xiàng)重大的國(guó)情國(guó)力調(diào)查,人口普查的數(shù)據(jù)結(jié)果為科學(xué)制定國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展規(guī)劃、統(tǒng)籌安排人民的物質(zhì)和文化生活、構(gòu)建社會(huì)主義和諧社會(huì)提供科學(xué)準(zhǔn)確的統(tǒng)計(jì)信息支持。目前國(guó)內(nèi)學(xué)者主要從數(shù)據(jù)質(zhì)量控制和數(shù)據(jù)質(zhì)量評(píng)估兩個(gè)方面對(duì)人口普查的數(shù)據(jù)質(zhì)量進(jìn)行研究,比較有代表性的有:李成瑞(1984)從我國(guó)1982年人口普查的方案設(shè)計(jì)、普查登記和數(shù)據(jù)處理等方面介紹了數(shù)據(jù)質(zhì)量控制的具體措施;武潔(2002)介紹了我國(guó)第五次人口普查的事后質(zhì)量抽查;張為民等(2003)采用人口統(tǒng)計(jì)分析法評(píng)估了我國(guó)第五次人口普查的某些代表性指標(biāo);胡桂華(2013)通過(guò)對(duì)比我國(guó)與美國(guó)等五個(gè)國(guó)家的人口普查數(shù)據(jù)質(zhì)量評(píng)估情況,對(duì)我國(guó)人口普查質(zhì)量評(píng)估提出若干改進(jìn)建議。
我國(guó)先后經(jīng)歷了六次人口普查,1953年第一次人口普查后在全國(guó)抽取了9%的人進(jìn)行復(fù)查,這可以被視為我國(guó)最早的事后質(zhì)量抽查嘗試。改革開(kāi)放后,從第三次全國(guó)人口普查開(kāi)始,每次都要在普查登記工作結(jié)束后開(kāi)展事后質(zhì)量抽查,并從2000年第五次人口普查開(kāi)始引入雙系統(tǒng)估計(jì)量評(píng)估普查數(shù)據(jù)質(zhì)量。雖然歷次人口普查都開(kāi)展了事后抽查,但相比國(guó)外,我國(guó)的人口普查數(shù)據(jù)質(zhì)量評(píng)估尚處于經(jīng)驗(yàn)借鑒中。從我國(guó)已有的人口普查事后抽查看,人口普查事后抽查也亟待進(jìn)一步從理論上加強(qiáng)和完善。
二、 對(duì)現(xiàn)有人口普查數(shù)據(jù)質(zhì)量評(píng)估的認(rèn)識(shí)
1. 普查摸底階段缺乏嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)質(zhì)量評(píng)估方法?!度珖?guó)人口普查條例》規(guī)定人口普查對(duì)象為普查標(biāo)準(zhǔn)時(shí)點(diǎn)在中華人民共和國(guó)境內(nèi)的自然人以及在中華人民共和國(guó)境外但未定居的中國(guó)公民,不包括在中華人民共和國(guó)境內(nèi)短期停留的境外人員。為了保證人口普查登記期間普查登記工作的不重不漏,需要通過(guò)普查登記前的摸底工作編制《戶(hù)主姓名底冊(cè)》,真實(shí)、全面地記錄本普查小區(qū)所有房屋及其他建筑物內(nèi)居住人口的狀況。《戶(hù)主姓名底冊(cè)》不僅是普查登記工作的主要依據(jù),而且也是各級(jí)人口普查辦公室指導(dǎo)工作、核查質(zhì)量和驗(yàn)收數(shù)據(jù)的重要依據(jù),同時(shí)還為抽取普查表長(zhǎng)表調(diào)查戶(hù)提供抽樣框,因此編制高質(zhì)量的《戶(hù)主姓名底冊(cè)》至關(guān)重要。
我國(guó)第一次和第二次人口普查方案中均未明確說(shuō)明普查登記前是否編制《戶(hù)主姓名底冊(cè)》,1982年第三次和1990年第四次人口普查方案僅規(guī)定在普查登記前根據(jù)戶(hù)口整頓情況編制《戶(hù)主姓名底冊(cè)》,但未開(kāi)展摸底工作。2000年第五次和2010年第六次人口普查方案明確規(guī)定在戶(hù)口整頓和區(qū)域劃分的基礎(chǔ)上由普查員、普查指導(dǎo)員通過(guò)實(shí)地勘察和入戶(hù)訪(fǎng)查,開(kāi)展摸底工作,并在此基礎(chǔ)上編制《戶(hù)主姓名底冊(cè)》。摸底工作完成后,鄉(xiāng)級(jí)人口普查辦公室組織村級(jí)人口普查小組和普查指導(dǎo)員對(duì)各普查小區(qū)《戶(hù)主姓名底冊(cè)》的匯總結(jié)果進(jìn)行評(píng)估,結(jié)合經(jīng)整理的流動(dòng)人口、戶(hù)籍人口、港澳臺(tái)和外籍人員、死亡人口和出生人口等資料以及房管、物業(yè)部門(mén)提供的入住率(空房)清單、出租房屋戶(hù)數(shù)等資料進(jìn)行比對(duì),確保在正式普查登記之前及時(shí)發(fā)現(xiàn)問(wèn)題,保證普查數(shù)據(jù)質(zhì)量。
人口普查數(shù)據(jù)主要從普查摸底和登記填報(bào)這兩個(gè)環(huán)節(jié)取得,其中普查摸底工作關(guān)系到普查地址碼庫(kù)建立的準(zhǔn)確性,是一項(xiàng)基礎(chǔ)性工作。因此,普查摸底數(shù)據(jù)質(zhì)量不僅是普查數(shù)據(jù)質(zhì)量的基礎(chǔ),同時(shí)也關(guān)系到普查事后抽查樣本框的質(zhì)量。雖然我國(guó)自第五次人口普查以來(lái)均制定了全國(guó)統(tǒng)一的摸底工作細(xì)則,明確了摸底工作的實(shí)施過(guò)程和質(zhì)量控制措施,但只是對(duì)各普查小區(qū)《戶(hù)主姓名底冊(cè)》的匯總結(jié)果進(jìn)行比對(duì)評(píng)估,并沒(méi)有在摸底工作結(jié)束后隨機(jī)抽取一部分普查區(qū)重新逐戶(hù)調(diào)查核對(duì),也沒(méi)有制定統(tǒng)一的主要數(shù)據(jù)質(zhì)量評(píng)估指標(biāo)。因此,有必要采用系統(tǒng)完善的抽樣設(shè)計(jì)保證普查摸底質(zhì)量評(píng)估的可行性。
2. 普查登記匯總編碼階段的檢驗(yàn)規(guī)則過(guò)于單一。我國(guó)人口普查主要調(diào)查人口和住戶(hù)的基本情況,內(nèi)容包括姓名、性別、年齡、民族、國(guó)籍、受教育程度、行業(yè)、職業(yè)、遷移流動(dòng)、社會(huì)保障、婚姻、生育、死亡和住房情況等。1953年我國(guó)第一次人口普查僅調(diào)查6個(gè)項(xiàng)目;1964年增加了本人成分、職業(yè)和文化程度3項(xiàng);1982年增加到19項(xiàng);1990年又增加了“遷來(lái)本地的原因”和“1985年7月1日常住地狀況”兩項(xiàng);2000年第五次全國(guó)人口普查表分為普查表長(zhǎng)表、普查表短表、暫住人口調(diào)查表和死亡人口調(diào)查表四類(lèi),其中長(zhǎng)表已達(dá)到49個(gè)項(xiàng)目,分為按戶(hù)填報(bào)的項(xiàng)目和按人填報(bào)的項(xiàng)目,比上一次普查增加了28項(xiàng),并首次加進(jìn)了住房項(xiàng)目;2010年第六次全國(guó)人口普查表分為普查表長(zhǎng)表、普查表短表、境外人員普查表和死亡人口調(diào)查表四類(lèi),其中長(zhǎng)表共計(jì)45個(gè)項(xiàng)目。由此可見(jiàn),普查表和普查項(xiàng)目越來(lái)越多。雖然我國(guó)歷次人口普查均開(kāi)展了復(fù)查審核驗(yàn)收工作,但還是很有必要建立一套系統(tǒng)完善的數(shù)據(jù)質(zhì)量控制和評(píng)估系統(tǒng)。
人口普查登記匯總編碼階段的審核評(píng)估屬于數(shù)據(jù)質(zhì)量評(píng)估技術(shù)中的邏輯規(guī)則檢驗(yàn)范疇,主要檢驗(yàn)普查表填報(bào)代碼、普查表內(nèi)和表間相關(guān)指標(biāo)的邏輯關(guān)系的一致性和準(zhǔn)確性,主要通過(guò)匯總、議查或個(gè)別訪(fǎng)查和人工邏輯檢查方法驗(yàn)收。這種審核驗(yàn)收方法需要事先了解普查表內(nèi)和表間進(jìn)行對(duì)比的相關(guān)指標(biāo)間的邏輯關(guān)系,而且這些相互對(duì)比的指標(biāo)又互為參照標(biāo)準(zhǔn),使得驗(yàn)收結(jié)果只能反映誤差的方向(被高估或低估),不能反映誤差的確切水平。所以實(shí)踐中,需要采用更多的方法評(píng)估人口普查登記匯總數(shù)據(jù)的質(zhì)量。
3. 普查事后抽查階段的數(shù)據(jù)質(zhì)量評(píng)估缺乏嚴(yán)謹(jǐn)?shù)目茖W(xué)依據(jù)。事后質(zhì)量抽樣調(diào)查是在普查登記結(jié)束之后進(jìn)行的獨(dú)立調(diào)查,是整個(gè)普查工作的一部分,其目的在于評(píng)價(jià)全國(guó)人口普查登記的質(zhì)量,而不評(píng)價(jià)省級(jí)及其以下各級(jí)人口普查的登記質(zhì)量,也不對(duì)抽中普查小區(qū)的登記質(zhì)量進(jìn)行評(píng)價(jià)。1953年第一次人口普查后在全國(guó)抽取了9%的人進(jìn)行復(fù)查,抽查的結(jié)果是,重復(fù)人口占抽查人口0.139%,遺漏人口占0.255%,二者相抵,凈遺漏人數(shù)僅占0.110%。改革開(kāi)放后,1982年第三次人口普查的事后質(zhì)量抽查以全國(guó)各省為層,按照區(qū)(縣)、街道(鎮(zhèn)、公社)、普查區(qū)、普查小區(qū)的分層四階段整群抽樣設(shè)計(jì),在全國(guó)共抽取972個(gè)普查小區(qū),重報(bào)人口占0.71‰;漏報(bào)人口占0.56‰,重漏相抵,凈差人口占0.15‰。1990年的人口普查事后抽查也基本沿用了這一事后抽查設(shè)計(jì)思路。2000年第五次人口普查的事后質(zhì)量抽查將全國(guó)31個(gè)省按總?cè)丝诘亩嗌俜譃樗膶?,?duì)每個(gè)省再按城鄉(xiāng)分層,在每個(gè)層內(nèi)采用一階段隨機(jī)等距整群抽樣,直接抽取調(diào)查小區(qū)。同一層內(nèi)的各省分配相同的樣本量,全國(guó)共抽取了602個(gè)調(diào)查小區(qū),抽查結(jié)果顯示,人口漏登率為1.81%。本次普查數(shù)據(jù)質(zhì)量評(píng)估除了以事后質(zhì)量抽查為準(zhǔn)計(jì)算漏報(bào)率以外,初次應(yīng)用雙系統(tǒng)模型評(píng)估普查數(shù)據(jù)質(zhì)量。2010年第六次人口普查事后質(zhì)量抽樣調(diào)查根據(jù)人口普查地址碼庫(kù),首先將全國(guó)31個(gè)省市區(qū)按人口流動(dòng)類(lèi)型(流入、流出和流入流出基本平衡地區(qū))分為三類(lèi),然后按照常住人口規(guī)模或者凈流入人口規(guī)模等指標(biāo)對(duì)以上各類(lèi)進(jìn)行分層,最后在每層內(nèi)按照一階段隨機(jī)等距整群抽樣的方法抽取普查小區(qū)。第六次全國(guó)人口普查共抽取了402個(gè)普查小區(qū),抽查結(jié)果顯示,人口漏登率為0.12%。
由此可見(jiàn),雖然第六次全國(guó)人口普查的事后質(zhì)量抽查在抽樣設(shè)計(jì)和估計(jì)方法等方面有所改進(jìn),但仍然存在以下問(wèn)題。第一,在?。ㄗ灾螀^(qū)、直轄市)層級(jí)只按城鄉(xiāng)標(biāo)志對(duì)普查小區(qū)分層,然后在每層內(nèi)采用隨機(jī)等距整群抽樣直接抽取普查小區(qū),以這種方式抽出的樣本的代表性明顯不足;第二,估計(jì)方法存在漏洞:在當(dāng)前流動(dòng)人口規(guī)模大,流動(dòng)速度快的情況下,普查和事后質(zhì)量抽查均存在人口遺漏問(wèn)題,所以以事后質(zhì)量抽查為準(zhǔn)評(píng)估普查數(shù)據(jù)質(zhì)量的做法并不科學(xué),有必要引入考慮兩次調(diào)查均存在遺漏問(wèn)題而構(gòu)建的雙系統(tǒng)估計(jì)量評(píng)估普查數(shù)據(jù)質(zhì)量;第三,違背抽樣估計(jì)理論的要求,沒(méi)有利用抽樣權(quán)數(shù)把樣本數(shù)據(jù)還原為總體估計(jì)量,而是直接使用樣本調(diào)查小區(qū)的普查人口數(shù)和事后抽查人口數(shù)估計(jì)該調(diào)查小區(qū)的真實(shí)人口數(shù)。
三、 對(duì)人口普查數(shù)據(jù)質(zhì)量評(píng)估的若干建議
1. 科學(xué)應(yīng)用雙系統(tǒng)估計(jì)量。人口普查作為大規(guī)模的數(shù)據(jù)收集過(guò)程,無(wú)法準(zhǔn)確計(jì)數(shù)目標(biāo)總體的每一個(gè)人及其人口統(tǒng)計(jì)特征,所以不可避免地會(huì)存在兩種類(lèi)型的調(diào)查誤差。一種類(lèi)型是遺漏誤差,當(dāng)真實(shí)的普查人口被遺漏時(shí),便會(huì)發(fā)生這種誤差,并會(huì)引起人口低估。另一種類(lèi)型是由普查中的無(wú)效記錄引起的計(jì)數(shù)誤差(EE),比如虛假或重復(fù)的人口,會(huì)使普查計(jì)數(shù)增加。這兩種誤差都會(huì)顯著影響普查人口總數(shù)的準(zhǔn)確性。因此,評(píng)估人口普查的數(shù)據(jù)質(zhì)量,需要估計(jì)人口普查的誤差。人口普查誤差可進(jìn)一步分為覆蓋誤差和內(nèi)容誤差。其中人口普查覆蓋誤差是普查人口數(shù)和真實(shí)人口數(shù)N之間的差,它直接影響人口總數(shù)的精度,進(jìn)一步分為遺漏和錯(cuò)誤計(jì)數(shù)。人口普查內(nèi)容誤差雖然不影響人口總數(shù)的精度,但卻影響普查各個(gè)類(lèi)別人口數(shù)的精度。所以,世界各國(guó)政府統(tǒng)計(jì)機(jī)構(gòu)都在致力于研究評(píng)估人口普查數(shù)據(jù)質(zhì)量的方法,其中又以估計(jì)人口普查覆蓋誤差為主。
雙系統(tǒng)估計(jì)是建立在捕獲—再捕獲模型基礎(chǔ)上的。人口普查摸底階段沒(méi)有應(yīng)用雙系統(tǒng)估計(jì)評(píng)估摸底數(shù)據(jù)質(zhì)量;事后抽查階段雖然應(yīng)用了雙系統(tǒng)估計(jì),但在抽樣設(shè)計(jì)和估計(jì)方法等方面并未嚴(yán)格滿(mǎn)足應(yīng)用雙系統(tǒng)估計(jì)的前提假設(shè)。把雙系統(tǒng)估計(jì)科學(xué)引入我國(guó)人口普查數(shù)據(jù)質(zhì)量評(píng)估,需要同時(shí)滿(mǎn)足如下假設(shè)條件:
(1)封閉性假定。即總體U是封閉的,總體單位數(shù)N固定。實(shí)踐中,該假定意味著普查的推斷期得到了很好的定義,而且在此期間沒(méi)有新增(出生或遷入)和損失(死亡或遷出)人口。
(2)獨(dú)立性假定。該假定包含兩層含義:一層含義是指事件第i個(gè)人是否被普查(或事后調(diào)查)調(diào)查到與事件第j個(gè)人是否被普查(或事后調(diào)查)調(diào)查到相互獨(dú)立,另一層含義是指事件第i個(gè)人在普查中是否被調(diào)查到與事件該人在事后調(diào)查中是否被調(diào)查到相互獨(dú)立。其中:i,j=1,2,…,N,i (3)匹配假定。即假定樣本調(diào)查結(jié)果可以和普查結(jié)果進(jìn)行正確匹配。也就是說(shuō),可以毫無(wú)誤差地確定樣本調(diào)查中的哪些個(gè)體出現(xiàn)在普查中,哪些個(gè)體不在普查中。 (4)虛假事件假定(Spurious Events Assumption)。即假定普查和事后調(diào)查均不存在虛假事件,或者這些虛假事件在估計(jì)之前已經(jīng)被剔除。這意味著普查和調(diào)查結(jié)果均不存在記錄誤差。實(shí)踐中確實(shí)存在一些虛假事件,如:①普查表中的重復(fù)記錄;②在普查或樣本調(diào)查中報(bào)告了本不存在的個(gè)體;③普查中錯(cuò)誤登記了范圍外的個(gè)體,如在推斷期之后出生的個(gè)體。 (5)無(wú)回答假定。即假定一定會(huì)存在某種程度的無(wú)回答,但在普查和樣本調(diào)查中均會(huì)向無(wú)回答者收集充分的識(shí)別信息,實(shí)現(xiàn)調(diào)查和普查的精確匹配。 (6)事后分層假定。即假定估計(jì)N時(shí)最好采用某種事后分層。例如,可以按照年齡進(jìn)行事后分層,得出特定年齡的人口數(shù)估計(jì)值,然后加總所有事后層人口數(shù)估計(jì)值便可得到人口總數(shù)N的估計(jì)值。普查和樣本調(diào)查中任何事后分層變量都必須在所有個(gè)體上正確登記。 (7)捕獲概率滿(mǎn)足pi1+=p1+,pi+1=p+1,i=1,2,…,N。即第i個(gè)人在普查(或事后調(diào)查)中的捕獲概率和第j個(gè)人在普查(或事后調(diào)查)中的捕獲概率相同,但第i個(gè)人在普查中的捕獲概率和他在事后調(diào)查中的捕獲概率不相同。i,j=1,2,…,N,i≠j。 顯然,科學(xué)應(yīng)用雙系統(tǒng)估計(jì)量的關(guān)鍵是看人口普查及其事后調(diào)查的實(shí)際情況是否符合模型中的假設(shè)條件。對(duì)于假定1,由于人口出生、遷移和死亡,人口總體總是處于動(dòng)態(tài)變化之中,縮短兩次調(diào)查的時(shí)間間隔將有助于人口總體的穩(wěn)定。為滿(mǎn)足假定2,從事事后調(diào)查工作的調(diào)查員不應(yīng)該是普查中的普查員。但在實(shí)際調(diào)查中,為節(jié)約時(shí)間和便于事后調(diào)查工作的開(kāi)展,事后調(diào)查仍然使用普查時(shí)的普查員。為保證兩次調(diào)查一定程度上的獨(dú)立性,不讓普查員事先知道選為事后調(diào)查員,將他派往不同于普查時(shí)工作過(guò)的調(diào)查區(qū)都是必要措施。假定4和5的實(shí)現(xiàn)有助于滿(mǎn)足假定3,即在估計(jì)之前應(yīng)該剔除普查和事后調(diào)查中的虛假事件。針對(duì)無(wú)回答個(gè)體,可以通過(guò)后續(xù)調(diào)查收集充分的識(shí)別信息,使得樣本調(diào)查結(jié)果可以和普查結(jié)果進(jìn)行正確匹配。假定6的實(shí)現(xiàn)有助于滿(mǎn)足假定7,即可以通過(guò)適當(dāng)?shù)氖潞蠓謱?,使層?nèi)個(gè)體具有相同或相似的捕獲概率。 2. 匯總數(shù)據(jù)時(shí)要綜合運(yùn)用評(píng)估方法。人口普查登記匯總編碼階段產(chǎn)生的數(shù)據(jù)屬于總量匯總數(shù)據(jù)。一般而言,匯總數(shù)據(jù)的質(zhì)量評(píng)估方法有邏輯規(guī)則檢驗(yàn)、相關(guān)指標(biāo)比對(duì)、經(jīng)驗(yàn)參數(shù)比對(duì)、參數(shù)穩(wěn)定性分析和基于模型的異常值識(shí)別等。所以,該階段的數(shù)據(jù)質(zhì)量評(píng)估方法除邏輯規(guī)則檢驗(yàn)以外,還可以利用評(píng)估參照標(biāo)準(zhǔn)來(lái)檢驗(yàn)待評(píng)估數(shù)據(jù)的準(zhǔn)確性。若已知某些統(tǒng)計(jì)指標(biāo)與待評(píng)估數(shù)據(jù)具有較長(zhǎng)時(shí)期穩(wěn)定的高度相關(guān)關(guān)系,并且這些指標(biāo)事先已知是正確的,那么可以把這些相關(guān)指標(biāo)作為評(píng)估參照標(biāo)準(zhǔn),根據(jù)這些相關(guān)指標(biāo)的變動(dòng)趨勢(shì)遞推待評(píng)估數(shù)據(jù)的變動(dòng)趨勢(shì),以此檢驗(yàn)待評(píng)估數(shù)據(jù)的準(zhǔn)確性。若能掌握某些反映人口特征的統(tǒng)計(jì)指標(biāo)間較為穩(wěn)定的變動(dòng)關(guān)系,如比例或比率等相對(duì)指標(biāo),可以把它們視為這些指標(biāo)間基本固定的經(jīng)驗(yàn)參數(shù),然后把這些經(jīng)驗(yàn)參數(shù)作為評(píng)估參照標(biāo)準(zhǔn)。如果根據(jù)待評(píng)估數(shù)據(jù)計(jì)算的比例或比率關(guān)系值與經(jīng)驗(yàn)參數(shù)嚴(yán)重不一致,就可以對(duì)待評(píng)估數(shù)據(jù)的準(zhǔn)確性提出質(zhì)疑。 以上評(píng)估方法要求事先確定評(píng)估參照標(biāo)準(zhǔn),當(dāng)難以得到與待評(píng)估數(shù)據(jù)存在穩(wěn)定而確切相關(guān)關(guān)系的統(tǒng)計(jì)指標(biāo)時(shí),可以考慮采用基于模型的評(píng)估方法。通常情況下,該評(píng)估方法從以下兩個(gè)方面檢查待評(píng)估數(shù)據(jù)的質(zhì)量:一方面通過(guò)分析模型參數(shù)估計(jì)值的實(shí)際意義是否合理,來(lái)判斷模型所反映的人口特征是否違背現(xiàn)實(shí)情況和模型假定;另一方面通過(guò)分析待評(píng)估數(shù)據(jù)與模型擬合值之間的差異情況,識(shí)別出嚴(yán)重偏離擬合值的異常值。
3. 數(shù)據(jù)質(zhì)量抽查中采用系統(tǒng)完善的抽樣設(shè)計(jì)。2010年全國(guó)人口普查事后質(zhì)量抽查采用分層一階段隨機(jī)等距整群抽樣方法從城市層和鄉(xiāng)村層分別抽取樣本普查小區(qū),這樣的樣本明顯缺乏代表性。為提高樣本代表性,本文提出兩步抽樣法,即首先依據(jù)事后質(zhì)量調(diào)查目的確定全國(guó)樣本量,然后根據(jù)全國(guó)各?。ㄗ灾螀^(qū)、直轄市)的上次普查人口數(shù)按比例分配它們?cè)谌珖?guó)的樣本總量,再根據(jù)各抽樣層的具體情況分配該?。ㄗ灾螀^(qū)、直轄市)各地區(qū)的樣本量,最后以?xún)刹椒绞綇母鞒闃訉映槿∽罱K樣本單元。具體來(lái)看,第一步,首先在各?。ㄗ灾螀^(qū)、直轄市)內(nèi)將所有調(diào)查小區(qū)按城鄉(xiāng)標(biāo)志分為城市層和鄉(xiāng)村層,然后在層內(nèi)以調(diào)查小區(qū)為抽樣單元進(jìn)行等距抽樣,抽取樣本調(diào)查小區(qū);第二步,分別對(duì)抽取的城市層和鄉(xiāng)村層樣本調(diào)查小區(qū)編制家庭戶(hù)目錄,這樣便使得屬于同一個(gè)樣本調(diào)查小區(qū)的家庭擁有兩個(gè)家庭戶(hù)目錄,即普查目錄和事后調(diào)查目錄。對(duì)這兩個(gè)家庭戶(hù)目錄進(jìn)行比較,會(huì)出現(xiàn)兩種情形,要么事后調(diào)查目錄的家庭戶(hù)數(shù)目與普查目錄的家庭戶(hù)數(shù)目差異較小,要么兩者數(shù)目差異較大,即兩個(gè)層。相應(yīng)地,我們把第一步抽取的樣本調(diào)查小區(qū)分在這兩個(gè)層中,在層內(nèi)仍然以調(diào)查小區(qū)為抽樣單元,采用等距抽樣抽取最終樣本調(diào)查小區(qū)。
參考文獻(xiàn):
1. 張為民,崔紅艷.對(duì)中國(guó)2000年人口普查準(zhǔn)確性的估計(jì).人口研究,2003,(7):25-35.
2. 王謙等.中國(guó)第六次人口普查:經(jīng)驗(yàn)與啟示.人口研究,2010,11(6):19-31.
3. 陶然,金勇進(jìn).普查事后抽查理論研究與經(jīng)驗(yàn)啟示.調(diào)研世界,2010,(9):9-12.
4. 陳培培,金勇進(jìn).對(duì)經(jīng)濟(jì)普查數(shù)據(jù)質(zhì)量評(píng)估的若干思考.市場(chǎng)研究,2012,(5):49-53.
5. 戴世光.我國(guó)1953年的人口普查.教學(xué)與研究,1957,(4):1-6.
6. 胡桂華.國(guó)外人口普查質(zhì)量評(píng)估方法綜述.調(diào)研世界,2011,(11):55-58.
7. 胡桂華.人口普查覆蓋誤差估計(jì)方法綜述.統(tǒng)計(jì)與信息論壇,2013,(9):39-46.
8. 武潔.人口普查中的事后質(zhì)量抽樣調(diào)查.南方人口,2002,(3):18-24.
基金項(xiàng)目:國(guó)家社科基金項(xiàng)目“普查數(shù)據(jù)質(zhì)量的事后抽查理論及其應(yīng)用研究”(項(xiàng)目號(hào):11BTJ009);教育部人文社會(huì)科學(xué)研究項(xiàng)目“復(fù)雜抽樣中的模型方法研究”(項(xiàng)目號(hào):10JJD790036)。
作者簡(jiǎn)介:金勇進(jìn),教育部重點(diǎn)研究基地“應(yīng)用統(tǒng)計(jì)科學(xué)研究中心”研究員,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院教授、博士生導(dǎo)師;陳培培,中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院博士生。
收稿日期:2014-07-18。