胡桂華,文 婷,劉譽環(huán)
(重慶工商大學(xué) a.數(shù)學(xué)與統(tǒng)計學(xué)院;b.經(jīng)濟社會應(yīng)用統(tǒng)計重慶市重點實驗室,重慶 400067)
在人口普查質(zhì)量評估領(lǐng)域,研究凈誤差具有重要意義。凈誤差率是衡量一個國家或地區(qū)人口普查登記質(zhì)量的核心指標(biāo)。凈誤差率不足2%或超過5%表明普查登記質(zhì)量較高或登記質(zhì)量較低。凈誤差率也是修正普查登記人口數(shù)的主要依據(jù)。有些國家直接依據(jù)估計的凈誤差率修正普查登記人口數(shù),也有些國家基于凈誤差率估計值和其他數(shù)據(jù)來源對普查登記人口數(shù)進行修正。因此,研究凈誤差具有重要意義。
凈誤差率計算的關(guān)鍵是估計總體實際人口數(shù)。目前大多數(shù)國家使用雙系統(tǒng)估計量來估計它。但是,雙系統(tǒng)估計量有一個內(nèi)含交互作用偏差的“軟肋”。研究表明,依據(jù)三次捕獲模型構(gòu)造的三系統(tǒng)估計量能夠較好地解決雙系統(tǒng)估計量的交互作用偏差問題。與雙系統(tǒng)估計量所不同的是,三系統(tǒng)估計量并不要求三份人口名單必須獨立,從而避免了人口名單之間不獨立引起的交互作用偏差。
三系統(tǒng)估計量為不完整三維列聯(lián)表7個已知單元的人口數(shù)和1個未知單元(未登記在任何一份名單的人口構(gòu)成的子總體)的人口數(shù)估計量(稱為缺失單元估計量)之和。缺失單元估計量依據(jù)7個已知單元的人口數(shù)來估計,其具體形式依據(jù)三份人口名單的統(tǒng)計關(guān)系確定。把這種模式下構(gòu)造的三系統(tǒng)估計量稱為普通三系統(tǒng)估計量,共有8種普通三系統(tǒng)估計量。
普通三系統(tǒng)估計量有兩個局限性。一是在給出每種統(tǒng)計關(guān)系的普通三系統(tǒng)估計量的情況下,使用皮爾遜卡方統(tǒng)計量或?qū)?shù)似然比統(tǒng)計量,選擇最適合于既定樣本數(shù)據(jù)描述的普通三系統(tǒng)估計量。這兩個檢驗統(tǒng)計量應(yīng)用的前提條件是,構(gòu)造每個已知單元的期望頻數(shù)估計量。這是一項困難的工作。二是普通三系統(tǒng)估計量要么未利用7個已知單元信息,要么不加區(qū)分地對待每個信息。抽樣推斷理論指出,在構(gòu)造總體參數(shù)估計量時,既要盡可能利用已知信息,還要根據(jù)信息的重要性確定其使用的次數(shù)。在總體中,同時登記在三份人口名單的人口所占比例最大,是最重要的信息,其在估計量中使用的次數(shù)應(yīng)該最多;同時登記在兩份人口名單的人口所占比例相對較少,是次重要的信息,其在估計量中使用的次數(shù)應(yīng)相對少一些;而只登記在一份人口名單的人口更少,屬于不重要信息,其在估計量中使用的次數(shù)應(yīng)為最少。
為避免上述缺陷,提出組合式三系統(tǒng)估計量。通過研究,為政府統(tǒng)計部門使用三系統(tǒng)估計量提供更多選擇。組合式三系統(tǒng)估計量的學(xué)術(shù)價值體現(xiàn)在兩個方面。第一,它為7個已知單元的人口數(shù)與1個缺失單元的人口數(shù)估計量之和。缺失單元估計量的分子為三份人口名單同一類統(tǒng)計關(guān)系下的3個普通三系統(tǒng)估計量的分子之和,分母為它們的分母之和。在計算總體的組合式三系統(tǒng)估計量的抽樣方差時,除了采用分層刀切法計算每一等概率人口層的抽樣方差外,還要計算等概率人口層之間的協(xié)方差,否則低估或高估總體的組合式三系統(tǒng)估計量的抽樣方差。第二,它須在等概率人口層建立,否則產(chǎn)生異質(zhì)性偏差而影響其估計精度。
組合式三系統(tǒng)估計量的應(yīng)用價值體現(xiàn)在兩個方面。一方面,它省去了使用對數(shù)似然比選擇最優(yōu)組合式三系統(tǒng)估計量這一繁瑣環(huán)節(jié),便于在實際部門推廣應(yīng)用。對政府統(tǒng)計部門的實際工作人員來說,他們希望得到的是便于操作應(yīng)用的、理論可靠的參數(shù)估計量。另一方面,它可以拓展到其他領(lǐng)域,解決其相關(guān)問題。例如,估計經(jīng)濟普查、農(nóng)業(yè)普查的凈誤差率、戶籍登記系統(tǒng)的覆蓋率、老年人口數(shù)目估計。
創(chuàng)新之處體現(xiàn)在三個方面。第一,提出兩種抽樣登記的、人口移動的組合式三系統(tǒng)估計量,并在后面的實證分析中進行了抽樣估計精度比較。第二,將抽樣調(diào)查領(lǐng)域的分層二重抽樣方法移植到人口普查凈誤差估計領(lǐng)域,解決其事后計數(shù)調(diào)查樣本抽取及組合式三系統(tǒng)估計量各個單元估計量的構(gòu)造問題。第三,厘清了普通三系統(tǒng)估計量與組合式三系統(tǒng)估計量的內(nèi)在邏輯關(guān)系,這有助于讀者理解和應(yīng)用組合式三系統(tǒng)估計量。
在捕獲—再捕獲模型基礎(chǔ)上,美國學(xué)者增加了一次捕獲,利用三次捕獲的結(jié)果構(gòu)造三次捕獲模型[1-5];將三次捕獲模型拓展到人口普查質(zhì)量評估領(lǐng)域構(gòu)造三份人口名單兩種統(tǒng)計關(guān)系下的全面登記的普通三系統(tǒng)估計量[6]。孟杰等研究了普通三系統(tǒng)估計量及其統(tǒng)計性質(zhì)[7]。胡桂華等研究了8種統(tǒng)計關(guān)系下的抽樣登記的、人口移動的普通三系統(tǒng)估計量,為其應(yīng)用于人口普查凈誤差估計奠定了理論基礎(chǔ)[8-12]。
美國普查局2010年人口普查質(zhì)量評估后,曾經(jīng)打算在未來使用普通三系統(tǒng)估計量。美國普查局專家Griffin撰寫了一篇這方面的研究論文,分析了雙系統(tǒng)估計量低估總體實際人口數(shù)的主要原因在于,未包括同時傾向于遺漏普查與事后計數(shù)調(diào)查的人口,并且使用不完整三維列聯(lián)表、最大似然估計和對數(shù)線性模型建立了三份人口名單各種統(tǒng)計關(guān)系下的普通三系統(tǒng)估計量[13]。后來由于未建立起覆蓋人口總體范圍廣的行政記錄系統(tǒng),以及未進行大規(guī)模的試點研究,于是美國在2020年仍然使用雙系統(tǒng)估計量。
中國原計劃在2020年使用普通三系統(tǒng)估計量,后來由于三個原因放棄。一是普查名單和事后計數(shù)調(diào)查名單與戶籍人口名單高度相似,即外表看起來是三份名單,其實是兩份人口名單,從而失去了構(gòu)建三系統(tǒng)估計量的意義[14]。二是尚未建立起科學(xué)完整的普查名單、事后計數(shù)調(diào)查名單與戶籍人口名單的比對方案。在2020年,中國仍然使用在等概率人口層建立的雙系統(tǒng)估計量[15]。三是中國并未建立起適合于普通三系統(tǒng)估計量所需要的復(fù)合人口行政記錄名單。由于每份人口行政記錄有其特定的用途和范圍,因此建立中國的復(fù)合人口行政記錄名單,不能只包括戶籍名單,除該名單外,還要把常住人口名單,出生和死亡醫(yī)學(xué)證明納入其中,尤其是要把這些名單中的人具體落實到每一個樣本普查小區(qū)。這項工作最好在普查標(biāo)準(zhǔn)時點前一個星期完成。復(fù)合人口行政記錄名單最理想的截止時間是普查標(biāo)準(zhǔn)時點。這在實際中難以做到。丹麥、挪威和冰島等北歐國家的行政記錄截止日在普查時點前一個星期。
研究組合式三系統(tǒng)估計量的意義在于,將利用信息量不足的若干普通三系統(tǒng)估計量組合在一起,構(gòu)造出一個新的三系統(tǒng)估計量,從而間接利用了多個信息,避免了普通三系統(tǒng)估計量的缺陷。建立三系統(tǒng)估計量的初衷就是要盡可能多地使用多個信息來源。利用更多相關(guān)信息,有助于提高估計精度。從這個角度看,組合式三系統(tǒng)估計量具有研究價值,有助于提高凈誤差的抽樣估計精度。
我們首先依據(jù)三次捕獲模型要求,構(gòu)造事后計數(shù)調(diào)查對總體全面登記的普通三系統(tǒng)估計量。這么做的理由是,普通三系統(tǒng)估計量來源于三次捕獲模型。三次捕獲模型是在三次全面捕獲的情況下構(gòu)造的。
普通三系統(tǒng)估計量由雙系統(tǒng)估計量拓展而來。為便于推導(dǎo)普通三系統(tǒng)估計量公式,簡要介紹一下雙系統(tǒng)估計量是有必要的。構(gòu)造雙系統(tǒng)估計量的重要工具是不完整二維列聯(lián)表。在假設(shè)總體中的每一個人有同樣的概率登記在普查的情況下,總體中的人口在普查與事后計數(shù)調(diào)查中的登記情況列示在該表中,見表1。
表1 不完整二維列聯(lián)表
在表1中,右下腳標(biāo)1表示登記在普查或事后計數(shù)調(diào)查中,0表示未登記在普查或事后計數(shù)調(diào)查中。在假設(shè)總體人口有同樣的概率登記在普查或事后計數(shù)調(diào)查,以及事后計數(shù)調(diào)查對總體全面登記情況下,估計總體規(guī)模的雙系統(tǒng)估計量(Dual System Estimator,DSE)為:
(1)
從式(1)可以看出,x11,x10,x01是已知單元人口數(shù),而x00是未知單元人口數(shù),需要估計。未知單元的人口數(shù)可以通過式(2)來估計:
(2)
為便于普通三系統(tǒng)估計量的建立,需要將總體中的人口在三份人口名單的登記情況列示在不完整三維列聯(lián)表,見表2。
表2 不完整三維列聯(lián)表
在表2中,xijk中的右下腳標(biāo)i,j,k為示性變量,均取值1或0,1表示在普查登記中,0表示不在普查登記中。除最后一個單元(ijk)=(000)的x000需要估計外,其他單元的人口數(shù)都是可以觀察到的。
如果不存在比對誤差,兩項調(diào)查和人口行政記錄均是對同一總體的全面登記,總體人口有同樣概率登記在普查的情況下,那么估計總體規(guī)模的普通三系統(tǒng)估計量(Triple System Estimator,TSE)為:
(3)
(4)
(5)
(6)
(7)
(8)
(9)
全面登記的組合式三系統(tǒng)估計量為7個已知單元的人口數(shù)與組合式缺失單元估計量之和。
1.全面登記的、無人口移動的組合式三系統(tǒng)估計量
不難看出,式(4)至式(6)屬于同類統(tǒng)計關(guān)系,而式(7)至式(9)屬于另一類統(tǒng)計關(guān)系。式(4)至式(6)存在的問題是,對7個已知單元的信息給予同樣的關(guān)注,賦予同樣的權(quán)數(shù)1。式(7)至式(9)只是使用了7個已知單元信息中的3個,使用的信息量過少,必然影響估計精度。針對這種情況,可以構(gòu)造兩種組合式缺失單元估計量。一是將式(4)至式(6)的分子和分母分別相加,得到組合式三系統(tǒng)估計量式(10);二是將式(7)至式(9)的分子和分母分別相加,得到組合式缺失單元估計量式(11)。
(10)
(11)
將式(10)和式(11)分別代入式(3),得到兩種組合式三系統(tǒng)估計量,見式(12)和式(15)。
(12)
(13)
(14)
(15)
(16)
(17)
式(1)至式(17)未考慮普查標(biāo)準(zhǔn)時點與事后計數(shù)調(diào)查標(biāo)準(zhǔn)時點之間的人口移動(不包括出生和死亡者)。但實際上,這兩個標(biāo)準(zhǔn)時點之間不可避免有人口移動。有三種移動人口:一是無移動人口(Non-movers,縮寫為n),即普查標(biāo)準(zhǔn)時點和事后計數(shù)調(diào)查標(biāo)準(zhǔn)時點之間一直居住在本普查小區(qū)的人口。二是向內(nèi)移動人口(In-movers,縮寫為i),即普查標(biāo)準(zhǔn)時點居住在其他普查小區(qū),在事后計數(shù)調(diào)查標(biāo)準(zhǔn)時點前來到本普查小區(qū)的人口。三是向外移動人口(Out-movers,縮寫為o),即普查標(biāo)準(zhǔn)時點在本普查小區(qū),事后計數(shù)調(diào)查標(biāo)準(zhǔn)時點前離開本普查小區(qū)的人口。事后計數(shù)調(diào)查人口構(gòu)成有兩種方法:一是A構(gòu)成方法,由無移動人口和向外移動人口構(gòu)成。二是B構(gòu)成方法,由無移動人口和向內(nèi)移動人口構(gòu)成。
對式(12)至式(17),均構(gòu)造兩種方法下的人口移動的組合式三系統(tǒng)估計量。此時,式(12)至式(17)中每個單元涉及事后計數(shù)調(diào)查的項一律變?yōu)閮身???紤]到向內(nèi)移動人口不可能出現(xiàn)在本普查小區(qū)的行政記錄人口名單中,因為其普查標(biāo)準(zhǔn)時點在其他小區(qū),而不在本小區(qū),因此向內(nèi)移動人口涉及到的人口行政記錄的項一律為零,例如x111i=0。另外,向外移動人口不可能登記在本小區(qū)的事后計數(shù)調(diào)查人口名單中,因為事后計數(shù)調(diào)查標(biāo)準(zhǔn)時點時不在本普查小區(qū),因此向外移動人口涉及事后計數(shù)調(diào)查的項一律為零,例如x011o=0。
2.式(12)至式(14)全面登記的、人口移動的組合式三系統(tǒng)估計量
如果采取A構(gòu)成法,那么式(12)至式(14)變?yōu)?
(18)
x1,A=x111n+x111o+x110n+x110o+x101n+x101o+x100n+x100o+x011n+x011o+x010n+x010o+x001n+x001o
(19)
由于x111o=x110o=x011o=x010o=0,因此式(19)變?yōu)槭?20):
x1,A=x111n+x110n+x101n+x101o+x100n+x100o+x011n+x010n+x001n+x001o
(20)
(21)
如果使用B構(gòu)成法,那么式(12)~(14)變?yōu)?
(22)
x1,B=x111n+x111i+x110n+x110i+x101n+x101i+x100n+x100i+x011n+x011i+x010n+x010i+x001n+x001i
(23)
由于x111i=x101i=x001i=x011i=0,因此式(23)變?yōu)?
x1,B=x111n+x110n+x101n+x100n+x011n+x010n+x001n+x010i+x100i+x110i
(24)
(25)
3.式(15)至式(17)全面登記的、人口移動的組合式三系統(tǒng)估計量
如果采取A構(gòu)成法,那么式(15)至式(17)變?yōu)?
(26)
x2,A=x111n+x111o+x110n+x110o+x101n+x101o+x100n+x100o+x011n+x011o+x010n+x010o+x001n+x001o
(27)
由于x111o=x110o=x011o=x010o=0,因此式(27)變?yōu)槭?28):
x2,A=x111n+x110n+x101n+x101o+x100n+x100o+x011n+x010n+x001n+x001o
(28)
(29)
如果使用B構(gòu)成法,那么式(15)至式(17)變?yōu)?
(30)
x2,B=x111n+x111i+x110n+x110i+x101n+x101i+x100n+x100i+x011n+x011i+x010n+x010i+x001n+x001i
(31)
由于x111i=x101i=x001i=x011i=0,因此式(31)變?yōu)?
x2,B=x111n+x110n+x101n+x100n+x011n+x010n+x001n+x010i+x100i+x110i
(32)
(33)
事后計數(shù)調(diào)查是對樣本普查小區(qū)人口的抽樣登記[16-18]。這決定了只能建立抽樣登記的組合式三系統(tǒng)估計量。這項工作分為兩個步驟,第一步是在全面登記的組合式三系統(tǒng)估計量基礎(chǔ)上,寫出抽樣登記的組合式三系統(tǒng)估計量。第二步是采用有限總體概率樣本數(shù)據(jù),構(gòu)造抽樣登記的組合式三系統(tǒng)估計量每個單元人口數(shù)的估計量。
1.式(12)至式(14)抽樣登記的、人口移動的組合式三系統(tǒng)估計量
如果采取A構(gòu)成法,那么:
(34)
(35)
(36)
如果使用B構(gòu)成法,那么:
(37)
(38)
(39)
2.式(15)至式(17)抽樣登記的、人口移動的組合式三系統(tǒng)估計量
如果使用A構(gòu)成法,那么:
(40)
(41)
(42)
如果使用B構(gòu)成法,那么:
(43)
(44)
(45)
(46)
在式(46)中,yhgi表示層hg的最終進入第二重樣本的普查小區(qū)i在三份人口名單登記的人口數(shù),例如同時在三份人口名單登記的無移動人口數(shù)x111n,在普查中登記但未在事后計數(shù)調(diào)查和人口行政記錄登記的向外移動人口數(shù)x100o;H為第一重抽樣前對總體普查小區(qū)劃分的總層數(shù),h為任意層;G是對第一重樣本普查小區(qū)進一步劃分的總層數(shù),g是任意層;xhgi為層h的樣本普查小區(qū)是否在層g的示性函數(shù),如果在,xhgi=1,否則xhgi=0;Ihgi為層hg的第一重樣本普查小區(qū)是否進入第二重樣本的示性函數(shù),如果進入了,Ihgi=1,否則Ihgi=0;αhgi為第i樣本普查小區(qū)經(jīng)過二重抽樣后進入到第二重樣本的最終抽樣權(quán)數(shù)。如果樣本答復(fù)率不足100%,則要根據(jù)樣本答復(fù)率調(diào)整初始抽樣權(quán)數(shù)。調(diào)整的辦法是,將初始抽樣權(quán)數(shù)除以樣本答復(fù)率。在后面的實際案例中,樣本答復(fù)率為100%。
如果層h的普查小區(qū)總數(shù)為Nh,樣本普查小區(qū)數(shù)為nh,層hg的普查小區(qū)總數(shù)為Mhg,樣本普查小區(qū)數(shù)為mhg,并且每重抽樣采取簡單隨機抽樣,每重抽樣的抽樣單位均為普查小區(qū),那么經(jīng)過兩重抽樣后,第i樣本普查小區(qū)的最終抽樣權(quán)數(shù)αhgi=(Nh/nh)(Mhg/mhg)。
注意式(34)至式(45),需要在等概率人口層v建立。這里只是為了書寫便利,才在式(34)至式(45)中省去了v記號。在建立了等概率人口層v的組合式三系統(tǒng)估計量之后,還要建立總體的抽樣登記的、人口移動的組合式三系統(tǒng)估計量,用P表示總體:
(47)
(48)
(49)
(50)
式(34)、式(37)、式(40)、式(43),以及式(47)至式(50)是較為復(fù)雜的估計量,其抽樣方差使用刀切法近似計算。刀切法實施的關(guān)鍵是復(fù)制權(quán)數(shù)的計算[19-20]。復(fù)制權(quán)數(shù)是指每剔除第一重樣本中的一個樣本普查小區(qū)后重新計算的進入第二重樣本普查小區(qū)的抽樣權(quán)數(shù)。
(51)
(52)
(53)
(54)
(55)
(56)
(57)
(58)
(59)
(60)
(61)
等概率人口層抽樣登記的三系統(tǒng)估計量的刀切抽樣方差估計量為:
(62)
(63)
(64)
(65)
總體的抽樣登記的三系統(tǒng)估計量的刀切抽樣方差估計量為:
(66)
(67)
(68)
(69)
(70)
(71)
(72)
(73)
在式(70)~(73)中,Cp是總體的、已知的最終普查登記人口數(shù),其抽樣方差為零。從式(70)~(73)可以看出,只要估計了總體的實際人口數(shù),將其減去普查登記人口數(shù),便可以很方便地估計人口普查凈誤差,并且兩者的抽樣方差相等。
為計算人口普查凈誤差,在實證分析中,應(yīng)該獲得實證范圍內(nèi)普查年樣本普查小區(qū)人口的微觀資料、各個等概率人口層的普查登記人口數(shù)。然而,我們沒有得到這樣的數(shù)據(jù),只是獲得了非普查年某行政區(qū)的相關(guān)資料。根據(jù)這些相關(guān)資料,可以估計總體實際人口數(shù),而總體實際人口數(shù)的估計是凈誤差計算的關(guān)鍵。從這個意義上來看,在凈誤差估計中,非普查年的微觀資料還是有使用價值的。
實證資料來源于某行政區(qū)的20個樣本普查小區(qū)的三份人口名單。時間為2017年8月31日。研究采取分層二重抽樣方法,在第一重抽樣前,將其所有普查小區(qū)分在兩層:街道層共有1 970個普查小區(qū),記為h=1和N1=1 970;鎮(zhèn)層共有1 068個普查小區(qū),記為h=2和N2=1 068。這兩層總共有普查小區(qū)3 038個,記為N=3 038。對h層樣本普查小區(qū),進一步按照調(diào)查難度分為三層:調(diào)查難度大層,記為g=1;調(diào)查難度中等層,記為g=2;調(diào)查難度小層,記為g=3。在每重抽樣中,以普查小區(qū)為抽樣單位,簡單隨機不重復(fù)抽取樣本。樣本形成過程見表3,樣本數(shù)據(jù)見表4至表7。
總體人口劃分在四個等概率人口層:0~64歲男性;0~64歲女性;65歲及以上男性;65歲及以上女性。
利用表3至表7樣本數(shù)據(jù),以及使用式(34)至式(69),得到等概率人口層及總體實際人口數(shù)的估計值及其抽樣標(biāo)準(zhǔn)誤差估計值,見表8。從表8可以得到如下重要信息。
表3 樣本形成、樣本量和抽樣權(quán)數(shù)
第一,表8提供了4個等概率人口層及總體的實際人口數(shù)及其抽樣標(biāo)準(zhǔn)誤差估計值。各個等概率人口層的實際人口數(shù)使用組合式三系統(tǒng)估計量估計。組合式三系統(tǒng)估計量不能直接用來估計總體的實際人口數(shù)??傮w的抽樣標(biāo)準(zhǔn)誤差不是四個等概率人口層的抽樣標(biāo)準(zhǔn)誤差之和,而是四個等概率人口層的抽樣方差之和及它們之間協(xié)方差2倍之和總和的平方根。
第二,使用兩種組合式三系統(tǒng)估計量估計的總體實際人口數(shù)在77萬人左右。按照中國平均每個普查小區(qū)250人常住人口來算,本行政區(qū)的3 038個普查小區(qū)的人口數(shù)應(yīng)為759 500人??梢?兩種組合式三系統(tǒng)估計量估計的結(jié)果與現(xiàn)實情況基本吻合,是有效的三系統(tǒng)估計量。如果把759 500人視作普查登記人口數(shù),那么基于A構(gòu)成法的第一個估計量估計的實際人數(shù)為769 339人,凈誤差為9 839人,凈誤差率為1.27%,這也屬于合理估計值。
第三,對同一種組合式三系統(tǒng)估計量,使用A構(gòu)成法和B構(gòu)成法得到的估計結(jié)果不盡相同。如果采取第一種組合式三系統(tǒng)估計量,兩種構(gòu)成法提供的人口數(shù)估計值分別為769 339人和773 742人。采取第二種組合式三系統(tǒng)估計量,這兩種構(gòu)成法提供的人口數(shù)估計值分別為770 212人和775 640人。A構(gòu)成法直接提供的是普查標(biāo)準(zhǔn)時點的人口數(shù)估計值,與人口普查凈誤差對普查目標(biāo)總體實際人口數(shù)估計值的要求一致,但找到向外移動人口有比較大的困難。B構(gòu)成法雖然也是提供普查標(biāo)準(zhǔn)時點的人口數(shù)估計值,但它是通過向內(nèi)移動人口回憶普查標(biāo)準(zhǔn)時點的情況得到的,可能發(fā)生回憶誤差。不過B構(gòu)成法也有其優(yōu)勢,那就是向內(nèi)移動人口在本樣本普查小區(qū),不存在尋找人的問題,調(diào)查方便。因此,兩種構(gòu)成法各有利弊,需要進行選擇。為了更好實現(xiàn)凈誤差估計目標(biāo),應(yīng)該選取A構(gòu)成法。為便于調(diào)查,則選取B構(gòu)成法。在實際應(yīng)用中,選取A構(gòu)成法是合適的。
表4 0~64歲男性層各單元的常住人口數(shù)單位:人
表5 0~64歲女性層各單元的常住人口數(shù)單位:人
表6 65歲及以上男性層各單元的常住人口數(shù)單位:人
表7 65歲及以上女性層各單元的常住人口數(shù)單位:人
表8 基于組合式三系統(tǒng)估計量的人口數(shù)及其抽樣標(biāo)準(zhǔn)誤差估計值 單位:人
表9 組合式三系統(tǒng)估計量與普通三系統(tǒng)估計量的比較 單位:人
從表9可以看出:
第一,兩個組合式三系統(tǒng)估計量估計的總體實際人口數(shù)分別為769 339人和773 742人,而普通三系統(tǒng)估計量估計的總體實際人口數(shù)為766 859人。如果普查登記人口數(shù)為759 500人,那么兩個組合式三系統(tǒng)估計量和普通三系統(tǒng)估計量估計的人口普查凈誤差分別為9 839人、14 242人和7 359人。這說明,由于利用的信息量不足,普通三系統(tǒng)估計量低估總體的凈誤差。組合式三系統(tǒng)估計量能避免低估總體凈誤差。
第二,從總體實際人口數(shù)估計值的抽樣標(biāo)準(zhǔn)誤差來看,兩個組合式三系統(tǒng)估計量的抽樣標(biāo)準(zhǔn)誤差分別為5 018人和5 301人,而普通三系統(tǒng)估計量的抽樣標(biāo)準(zhǔn)誤差為5 390人。這意味著,組合式三系統(tǒng)估計量比起普通三系統(tǒng)估計量擁有更高的估計精度。
第三,從各個等概率人口層實際人口數(shù)估計值的抽樣標(biāo)準(zhǔn)誤差來看,除0~64歲男性層外,兩個組合式三系統(tǒng)估計量的其他所有等概率人口層的抽樣標(biāo)準(zhǔn)誤差均小于普通三系統(tǒng)估計量。例如,0~64歲女性層,兩個組合式三系統(tǒng)估計量的抽樣標(biāo)準(zhǔn)誤差分別為1 910人和1 630人,而普通三系統(tǒng)估計量實際人口數(shù)估計值的抽樣標(biāo)準(zhǔn)誤差為1 932人。這表明兩個組合式三系統(tǒng)估計量更適合于等概率人口層實際人口數(shù)的估計。
第一,組合式三系統(tǒng)估計量是在普通三系統(tǒng)估計量的基礎(chǔ)上建立起來的,是一個全新的三系統(tǒng)估計量。與普通三系統(tǒng)估計量不同的是,它是把三份人口名單同一類統(tǒng)計關(guān)系下的三個普通三系統(tǒng)估計量的缺失單元估計量的分子和分母分別相加得到的。與普通三系統(tǒng)估計量相同的是,它的7個已知單元的人口數(shù)與普通三系統(tǒng)估計量的相同。
第二,組合式三系統(tǒng)估計量須在等概率人口層建立。為此,需要選擇變量對總體分層。在選擇分層變量時,要考慮到變量值能否獲得。個人性格雖然是影響人們是否參與人口普查的重要變量,但很難知悉一個人的性格,因此不應(yīng)該把性格作為對總體人口分層的重要變量。
第三,刀切法適合于組合式三系統(tǒng)估計量的抽樣方差計算。組合式三系統(tǒng)估計量利用的是樣本資料,需要計算其抽樣方差。由于估計量結(jié)構(gòu)復(fù)雜,無法用代數(shù)方法直接計算其方差。然而,不能因此就放棄了方差的計算。用分層刀切法近似計算這個方差是可行的。
第四,組合式三系統(tǒng)估計量對實際人口數(shù)的估計精度高于普通三系統(tǒng)估計量,希望被政府統(tǒng)計部門采納及推廣應(yīng)用。