劉 展,金勇進(jìn)
(中國(guó)人民大學(xué)a.統(tǒng)計(jì)學(xué)院;b.應(yīng)用統(tǒng)計(jì)科學(xué)研究中心,北京100872)
基于傾向得分匹配與加權(quán)調(diào)整的非概率抽樣統(tǒng)計(jì)推斷方法研究
劉 展a,金勇進(jìn)b
(中國(guó)人民大學(xué)a.統(tǒng)計(jì)學(xué)院;b.應(yīng)用統(tǒng)計(jì)科學(xué)研究中心,北京100872)
文章針對(duì)非概率抽樣統(tǒng)計(jì)推斷問(wèn)題,提出了一種解決方法:首先采用傾向得分匹配選擇樣本,然后采用傾向得分逆加權(quán)、加權(quán)組調(diào)整和事后分層調(diào)整三種方法對(duì)匹配樣本進(jìn)行加權(quán)調(diào)整來(lái)估計(jì)目標(biāo)總體,并比較不同方法估計(jì)的效果。蒙特卡羅模擬與實(shí)證研究表明:當(dāng)網(wǎng)絡(luò)訪問(wèn)固定樣本大小與目標(biāo)樣本大小的比率小于3時(shí),三種加權(quán)方法估計(jì)的效果均比未加權(quán)時(shí)匹配樣本的估計(jì)效果好;當(dāng)網(wǎng)絡(luò)訪問(wèn)固定樣本大小與目標(biāo)樣本大小的比率不小于3時(shí),傾向得分事后分層調(diào)整與未加權(quán)的匹配樣本估計(jì)效果較好。
傾向得分;匹配;加權(quán)調(diào)整;非概率
在當(dāng)今的大數(shù)據(jù)時(shí)代,大數(shù)據(jù)還不能代替總體,但大數(shù)據(jù)下的抽樣仍然是必要的。只是由于數(shù)據(jù)的大體量、非結(jié)構(gòu),且數(shù)據(jù)來(lái)源復(fù)雜化,難以構(gòu)造抽樣框,使得一些抽取的樣本屬于非概率樣本,難以將傳統(tǒng)的抽樣推斷理論應(yīng)用到非概率樣本中。與此同時(shí),隨著網(wǎng)絡(luò)調(diào)查特別是網(wǎng)絡(luò)訪問(wèn)固定樣本的發(fā)展,非概率抽樣重新引起了人們廣泛的關(guān)注與重視,如何解決非概率抽樣的統(tǒng)計(jì)推斷問(wèn)題,不僅是大數(shù)據(jù)背景下抽樣調(diào)查面臨的嚴(yán)重挑戰(zhàn),也是網(wǎng)絡(luò)調(diào)查發(fā)展的迫切需求。
解決非概率抽樣統(tǒng)計(jì)推斷問(wèn)題的一種方法就是樣本匹配。樣本匹配多年來(lái)一直被用于觀察性研究中,主要目的是根據(jù)一個(gè)或多個(gè)協(xié)變量找到與處理組相匹配(近似)的對(duì)照組,從而減少處理效應(yīng)估計(jì)的偏差,直到最近才被提倡用于網(wǎng)絡(luò)訪問(wèn)固定樣本的相關(guān)調(diào)查中[1]。所謂網(wǎng)絡(luò)訪問(wèn)固定樣本[2]就是愿意完成網(wǎng)絡(luò)調(diào)查的網(wǎng)絡(luò)訪問(wèn)(上網(wǎng))人群,這就意味著存在一個(gè)潛在的受訪者的樣本數(shù)據(jù)庫(kù),在未來(lái)的數(shù)據(jù)收集中,如果他們被選擇為調(diào)查對(duì)象,他們將愿意配合完成調(diào)查。目前已有研究者對(duì)網(wǎng)絡(luò)訪問(wèn)固定樣本調(diào)查中的樣本匹配問(wèn)題進(jìn)行了一些研究。Rivers[3]在2006年就提出可使用樣本匹配從網(wǎng)絡(luò)訪問(wèn)固定樣本中抽取代表性樣本。Vavreck與Rivers[4]在2008年采用了這種方法,他們首先從公布的美國(guó)社區(qū)調(diào)查文檔中抽取了一個(gè)38000人的隨機(jī)樣本,并對(duì)每個(gè)隨機(jī)樣本單元從網(wǎng)絡(luò)訪問(wèn)固定樣本中找到了最近的匹配單元,并利用匹配單元的調(diào)查數(shù)據(jù)來(lái)估計(jì)總體。Rivers與Bailey(2009)[5]使用了2008年美國(guó)總統(tǒng)選舉的數(shù)據(jù)評(píng)價(jià)了利用從網(wǎng)絡(luò)訪問(wèn)固定樣本中選擇的匹配樣本進(jìn)行推斷的效果,提出由于不完美的匹配,有必要在匹配后對(duì)匹配樣本進(jìn)一步加權(quán)調(diào)整。Terhanian與Bremer(2012)[6]基于平行調(diào)查(一個(gè)隨機(jī)數(shù)字撥號(hào)電話調(diào)查和一個(gè)網(wǎng)絡(luò)訪問(wèn)固定樣本調(diào)查)使用傾向得分來(lái)選擇匹配樣本,相對(duì)于直接基于協(xié)變量的匹配來(lái)說(shuō),傾向得分匹配具有將匹配的維度降為一維的優(yōu)點(diǎn),這極大的簡(jiǎn)化了匹配的過(guò)程,因而受到廣泛的使用。事實(shí)上,傾向得分已經(jīng)被用于非概率抽樣的加權(quán)調(diào)整階段(Terhanian et al.,2001;Lee&Valliant,2009),直到最近才被引入非概率調(diào)查的匹配抽樣之中(Rivers,2007;Terhanian&Bremer, 2012)?;诖耍疚目紤]在非概率樣本選擇階段采用傾向得分來(lái)選擇匹配樣本,同時(shí)為了減少不完美匹配造成的偏差,進(jìn)一步采用傾向得分對(duì)匹配樣本進(jìn)行加權(quán)調(diào)整,從而降低估計(jì)的偏差,提高估計(jì)的精度。
本文針對(duì)非概率抽樣的統(tǒng)計(jì)推斷問(wèn)題,提出在樣本選擇階段采用傾向得分匹配選擇匹配樣本,進(jìn)一步對(duì)匹配后的樣本采用傾向得分逆加權(quán)、加權(quán)組調(diào)整和事后分層調(diào)整三種方法進(jìn)行加權(quán)調(diào)整,估計(jì)目標(biāo)總體,并比較各種方法估計(jì)的效果,以期豐富非概率抽樣的統(tǒng)計(jì)推斷問(wèn)題研究,促進(jìn)非概率抽樣的廣泛應(yīng)用,也給大數(shù)據(jù)時(shí)代下海量數(shù)據(jù)的處理與分析提供一定的啟示。
對(duì)于非概率抽樣的統(tǒng)計(jì)推斷,可分為兩個(gè)階段來(lái)考慮,第一個(gè)階段是非概率樣本的選擇階段,可考慮采用傾向得分匹配來(lái)選擇樣本;第二個(gè)階段是加權(quán)調(diào)整階段,主要是對(duì)第一階段選擇的匹配樣本進(jìn)行傾向得分加權(quán)調(diào)整,最終實(shí)現(xiàn)對(duì)目標(biāo)總體的估計(jì)。
1.1 基于傾向得分匹配的樣本選擇
傾向得分為在給定協(xié)變量Xi的條件下,個(gè)體i接受處理的條件概率[7]。假設(shè)是否接受處理為Di(接受處理,Di=1;否則Di=0),則第i個(gè)單元的傾向得分定義為:p(Xi)=P(Di=1|Xi)。根據(jù)傾向得分來(lái)進(jìn)行匹配的方法就是傾向得分匹配(Propensity Score Matching,PSM)。這里,所謂的匹配就是假設(shè)個(gè)體i屬于處理組,找到屬于對(duì)照組的某個(gè)體 j,使得個(gè)體 j與個(gè)體i的協(xié)變量或傾向得分取值盡可能相似,即Xi?Xj或p(Xi)?p(Xj)。為了刻畫(huà)個(gè)體j與個(gè)體i之間的相似(相近)程度,產(chǎn)生不同的距離函數(shù)定義方法,也由此產(chǎn)生不同的匹配方法,常用的匹配方法有:最近鄰匹配、卡鉗與半徑匹配、分層或區(qū)間匹配、核與局部線性匹配等。
基于傾向得分匹配樣本選擇的基本思想是首先從抽樣框(包含一系列的協(xié)變量)中抽取一個(gè)概率樣本,其中目標(biāo)總體單元個(gè)數(shù)為N,樣本量為n,每個(gè)單元i都有一個(gè)目標(biāo)變量Yi和一些協(xié)變量組成的向量 Xi=(Xi1,Xi2,...,Xip),i=1…n,p為協(xié)變量的個(gè)數(shù),稱這個(gè)樣本為目標(biāo)樣本,因?yàn)檫@是一個(gè)概率樣本,因此具有總體的代表性。為了便于討論,假設(shè)從抽樣框中抽取的概率樣本為簡(jiǎn)單隨機(jī)樣本。本來(lái)將調(diào)查目標(biāo)樣本中的對(duì)象,但是當(dāng)發(fā)現(xiàn)目標(biāo)樣本的調(diào)查比較困難時(shí),并不要求用目標(biāo)樣本中的對(duì)象完成調(diào)查,相反地尋找網(wǎng)絡(luò)訪問(wèn)固定樣本(包含了與抽樣框相同的一系列協(xié)變量)中與目標(biāo)樣本對(duì)象相似(近)的成員,稱為匹配單元,匹配單元的集合稱為匹配樣本,邀請(qǐng)匹配樣本單元完成調(diào)查。假設(shè)匹配樣本的回答率為100%,可以看到匹配樣本本質(zhì)上屬于非概率的樣本。這里,在尋找網(wǎng)絡(luò)訪問(wèn)固定樣本中與目標(biāo)樣本對(duì)象相似(近)的成員,即選擇匹配樣本時(shí),采用傾向得分匹配方法。引入二值示性變量Di,如果單元i在目標(biāo)樣本中,則Di=1(相當(dāng)于接受處理),否則Di=0,在本文中Di=0表示單元i在網(wǎng)絡(luò)訪問(wèn)固定樣本中。傾向得分匹配方法具體步驟如下:
(1)估計(jì)傾向得分
傾向得分常常需要估計(jì),在估計(jì) p(Xi)=P(Di=1|Xi)時(shí),可使用參數(shù)估計(jì)(probit或logit)或非參數(shù)估計(jì),最流行的方法為logit,即常常將示性變量(D)作為因變量,單元的協(xié)向量 X作為解釋變量建立Logistic回歸模型來(lái)得到。具體地,假設(shè)Xi都經(jīng)過(guò)中心化變換,則有:
由式(1)可得:
(2)匹配樣本的選擇
當(dāng)選擇匹配樣本時(shí),對(duì)目標(biāo)樣本的每個(gè)成員,有必要在網(wǎng)絡(luò)訪問(wèn)固定樣本中找到最近的匹配單元,可以采用一些匹配方法,方法之一就是最近鄰匹配。最近鄰匹配(Nearest Neighbor Matching,NNM)[8]包括單一無(wú)放回最近鄰匹配、單一有放回最近鄰匹配和多重最近鄰匹配,本文主要采取單一無(wú)放回最近鄰匹配。設(shè)集合
為目標(biāo)樣本(D=1)中每個(gè)單元i的一個(gè)鄰域,|| ||是一個(gè)范數(shù),如1-范數(shù)、2-范數(shù)、¥-范數(shù)等。單一無(wú)放回最近鄰匹配就是將與Xi最近的Xj對(duì)應(yīng)的一個(gè)網(wǎng)絡(luò)訪問(wèn)固定樣本單元(Dj=0)選擇為匹配單元,且該匹配單元僅能匹配一個(gè)目標(biāo)樣本單元。當(dāng)然匹配方法不一定在所有的情形下都是非常有效的,當(dāng)它滿足以下兩個(gè)條件[9]時(shí)最可能有效:
假設(shè)1:可忽略性。假設(shè)網(wǎng)絡(luò)訪問(wèn)固定樣本關(guān)于用于匹配的變量(簡(jiǎn)稱匹配變量)是可忽略的。這意味著如果本文檢驗(yàn)匹配變量值完全相同的網(wǎng)絡(luò)訪問(wèn)固定樣本成員和非網(wǎng)絡(luò)訪問(wèn)固定樣本成員,則通常這兩者在調(diào)查中的回答將沒(méi)有區(qū)別。
假設(shè)2:共同的支撐。對(duì)于網(wǎng)絡(luò)訪問(wèn)固定樣本成員和非網(wǎng)絡(luò)訪問(wèn)固定樣本成員,匹配變量的分布應(yīng)該有重疊。
1.2 傾向得分加權(quán)調(diào)整
在基于傾向得分匹配的樣本選擇中,已將目標(biāo)樣本與網(wǎng)絡(luò)訪問(wèn)固定樣本結(jié)合,建立了Logistic回歸模型,估計(jì)出匹配樣本第k個(gè)單元在目標(biāo)樣本中的傾向得分為(Xk),則相應(yīng)的第k個(gè)單元在匹配樣本中的傾向得分估計(jì)為假設(shè)采用傾向得分匹配方法最終選擇的匹配樣本為sM,可以利用匹配樣本單元的傾向得分估計(jì)進(jìn)一步對(duì)匹配樣本進(jìn)行加權(quán)調(diào)整,從而實(shí)現(xiàn)對(duì)目標(biāo)總體的估計(jì)。考慮采取以下三種傾向得分加權(quán)調(diào)整方法:
(1)傾向得分逆加權(quán)
其中Y0k為匹配樣本單元k的觀察值,dMk為匹配樣本單元k的基礎(chǔ)權(quán)數(shù),由于匹配樣本為非概率樣本,沒(méi)有基礎(chǔ)權(quán)數(shù),但因其與目標(biāo)樣本相匹配,所以匹配樣本單元的基礎(chǔ)權(quán)數(shù)可采用與之相匹配的目標(biāo)樣本單元的基礎(chǔ)權(quán)數(shù),即為目標(biāo)樣本單元入樣概率的倒數(shù)。因本文主要討論的目標(biāo)樣本為簡(jiǎn)單隨機(jī)樣本,故每個(gè)目標(biāo)樣本單元的基礎(chǔ)權(quán)數(shù)均為
(2)傾向得分加權(quán)組調(diào)整
其中sMg是在第g組中匹配樣本單元的集合。同理,若目標(biāo)樣本為簡(jiǎn)單隨機(jī)樣本,則
(3)傾向得分事后分層調(diào)整
其中YˉMg為在第g層中匹配單元目標(biāo)變量均值。
為了檢驗(yàn)采用傾向得分匹配來(lái)選擇樣本,并對(duì)匹配樣本進(jìn)行傾向得分加權(quán)調(diào)整后的估計(jì)效果,采用蒙特卡羅模擬進(jìn)行分析。
2.1 方法
數(shù)據(jù)生成過(guò)程如下:
目標(biāo)總體協(xié)變量:X1~N(0,1),X1?[-1,1];X2~N(0,1),X2?[-1,1];ρ(X1,X2)=-0.6
網(wǎng)絡(luò)訪問(wèn)固定樣本協(xié)變量:X1~N(0.8,0.4),X1? [-1,1];X2~N(0.7,0.35),X2?[-1,1];Cov(X1,X2)=0.3
由上可知,網(wǎng)絡(luò)訪問(wèn)固定樣本關(guān)于協(xié)變量(匹配變量)是可忽略的,且目標(biāo)總體與網(wǎng)絡(luò)訪問(wèn)固定樣本的協(xié)變量分布有重疊,但協(xié)變量的分布不同。在模擬中,目標(biāo)樣本是從目標(biāo)總體中簡(jiǎn)單隨機(jī)抽取的樣本量n=1000的樣本,因?yàn)镋(X1)=E(X2)=0,θ0=E(Y)=0為總體參數(shù)真值,從目標(biāo)總體中抽取的簡(jiǎn)單隨機(jī)樣本將產(chǎn)生θ0的一個(gè)無(wú)偏估計(jì);同時(shí)考慮網(wǎng)絡(luò)訪問(wèn)固定樣本的規(guī)模分別為1500、2000、3000、5000、10000。因?yàn)槟繕?biāo)變量依賴于協(xié)變量X1、X2,因此若X1、X2來(lái)自目標(biāo)總體協(xié)變量的分布,則示性變量D=1,若X1、X2來(lái)自網(wǎng)絡(luò)訪問(wèn)固定樣本協(xié)變量的分布,則示性變量D=0,并進(jìn)一步由協(xié)變量與示性變量估計(jì)傾向得分,利用傾向得分匹配選擇匹配樣本,匹配方法為單一無(wú)放回最近鄰匹配。最后,采用傾向得分逆加權(quán)、加權(quán)組調(diào)整和事后分層調(diào)整三種方法對(duì)匹配后的樣本進(jìn)行加權(quán)調(diào)整,估計(jì)目標(biāo)總體均值θ0。重復(fù)進(jìn)行蒙特卡羅模擬1000次,并計(jì)算1000次模擬數(shù)據(jù)集上目標(biāo)總體均值估計(jì)的均值(Mean)、標(biāo)準(zhǔn)差(SD)和均方誤差(RMSE)。此外,數(shù)據(jù)的生成、傾向得分匹配與加權(quán)調(diào)整均在R軟件中進(jìn)行。特別地,單一無(wú)放回最近鄰匹配采用的是Package Matching中的Match函數(shù)進(jìn)行編程。
2.2 結(jié)果
利用未加權(quán)匹配樣本以及對(duì)匹配樣本采用傾向得分逆加權(quán)、加權(quán)組調(diào)整、事后分層調(diào)整后,計(jì)算目標(biāo)總體均值估計(jì)的均值(Mean)、標(biāo)準(zhǔn)差(SD)和均方誤差(RMSE),見(jiàn)表1。由表1可見(jiàn),利用未加權(quán)匹配樣本估計(jì)目標(biāo)總體均值,隨著網(wǎng)絡(luò)訪問(wèn)固定樣本規(guī)模的增大,其均值絕對(duì)值從0.285逐漸減少至0.003;標(biāo)準(zhǔn)差先減小后增大,基本穩(wěn)定在0.030~0.045之間,估計(jì)比較穩(wěn)定。對(duì)匹配樣本采用傾向得分逆加權(quán)估計(jì)目標(biāo)總體均值,隨著網(wǎng)絡(luò)訪問(wèn)固定樣本規(guī)模的增大,其均值絕對(duì)值從0.012先增大后減少至0.071;標(biāo)準(zhǔn)差在0.030~0.055之間波動(dòng)。對(duì)匹配樣本采用傾向得分加權(quán)組調(diào)整估計(jì)目標(biāo)總體均值,隨著網(wǎng)絡(luò)訪問(wèn)固定樣本規(guī)模的增大,其均值絕對(duì)值從0.076先減小再增大再減小至0.061;標(biāo)準(zhǔn)差在0.030~0.050之間波動(dòng)。對(duì)匹配樣本采用傾向得分事后分層調(diào)整估計(jì)目標(biāo)總體均值,隨著網(wǎng)絡(luò)訪問(wèn)固定樣本規(guī)模的增大,其均值絕對(duì)值從0.001開(kāi)始波動(dòng)最終升至0.003;標(biāo)準(zhǔn)差先減小后逐漸增大,基本穩(wěn)定在0.025~0.045之間??偟膩?lái)說(shuō),隨著網(wǎng)絡(luò)訪問(wèn)固定樣本規(guī)模的增大,各種方法下估計(jì)的均值絕對(duì)值均在0.001~ 0.285之間,并且各種方法下估計(jì)的波動(dòng)較小,比較穩(wěn)定。
表1 匹配樣本未加權(quán)與三種方法加權(quán)調(diào)整后的模擬結(jié)果
進(jìn)一步結(jié)合表1與圖1來(lái)分析各種方法下的RMSE。首先從不同方法的網(wǎng)絡(luò)訪問(wèn)固定樣本規(guī)模變化來(lái)看RMSE,使用未加權(quán)的匹配樣本估計(jì)目標(biāo)總體均值,RMSE隨著網(wǎng)絡(luò)訪問(wèn)固定樣本規(guī)模的增大,先急劇減小后趨于穩(wěn)定(穩(wěn)定于0.040左右),估計(jì)效果變好并逐漸穩(wěn)定。采用傾向得分逆加權(quán)估計(jì)目標(biāo)總體均值,RMSE隨著網(wǎng)絡(luò)訪問(wèn)固定樣本規(guī)模的增大,先增大至最高(N=3000,RMSE= 0.160)后逐漸減小,估計(jì)效果先變差然后逐漸變好。采用傾向得分加權(quán)組調(diào)整估計(jì)目標(biāo)總體均值,RMSE隨著網(wǎng)絡(luò)訪問(wèn)固定樣本規(guī)模的增大,先減小至最低(N=2000,RMSE=0.038),后增大至最高(N=3000,RMSE=0.124),此后逐漸下降,估計(jì)效果呈波動(dòng)狀態(tài)。采用傾向得分事后分層調(diào)整估計(jì)目標(biāo)總體均值,RMSE隨著網(wǎng)絡(luò)訪問(wèn)固定樣本規(guī)模的增大,變化較為平穩(wěn),基本穩(wěn)定在0.025~0.045之間,估計(jì)效果非常好并且非常穩(wěn)定。
另一方面,從不同網(wǎng)絡(luò)訪問(wèn)固定樣本規(guī)模來(lái)比較四種方法估計(jì)的RMSE,當(dāng)N=1500和2000時(shí),未加權(quán)匹配樣本估計(jì)的RMSE均最大,傾向得分事后分層調(diào)整估計(jì)的RMSE均最小,傾向得分加權(quán)組調(diào)整與逆加權(quán)估計(jì)的RMSE均處于兩者之間,可見(jiàn)傾向得分事后分層調(diào)整估計(jì)的效果最好,傾向得分加權(quán)組調(diào)整與事后分層調(diào)整估計(jì)效果次之,未加權(quán)匹配樣本估計(jì)效果最差。當(dāng)N=3000和5000時(shí),傾向得分逆加權(quán)估計(jì)的RMSE均最大,估計(jì)效果均最差,其次是傾向得分加權(quán)組調(diào)整估計(jì),此時(shí)未加權(quán)匹配樣本估計(jì)的RMSE均較小,估計(jì)效果較好,但估計(jì)效果最好的仍然是傾向得分事后分層調(diào)整估計(jì)。當(dāng)N=10000時(shí),傾向得分逆加權(quán)與加權(quán)組調(diào)整估計(jì)的RMSE仍然較高,未加權(quán)匹配樣本估計(jì)與傾向得分事后分層調(diào)整估計(jì)的RMSE基本相同,估計(jì)效果差不多??偟膩?lái)說(shuō),當(dāng)網(wǎng)絡(luò)訪問(wèn)固定樣本規(guī)模較小時(shí),三種加權(quán)方法下的估計(jì)效果均好于未加權(quán)的匹配樣本估計(jì);當(dāng)網(wǎng)絡(luò)訪問(wèn)固定樣本規(guī)模較大時(shí),未加權(quán)的匹配樣本估計(jì)效果較好;無(wú)論網(wǎng)絡(luò)訪問(wèn)固定樣本規(guī)模如何變化,傾向得分事后分層調(diào)整估計(jì)的效果始終都是最好的。這與Rivers(2007)[10]所提到的“當(dāng)網(wǎng)絡(luò)訪問(wèn)固定樣本規(guī)模較小時(shí),對(duì)匹配樣本的事后分層調(diào)整是有用的,有助于減少不完美匹配所造成的偏差。”想法是一致的。同樣的思想Rivers和Bailey(2009)[5]在“2008年美國(guó)全國(guó)選舉的匹配樣本推斷”一文中也提到,并且他們進(jìn)一步指出當(dāng)網(wǎng)絡(luò)訪問(wèn)固定樣本大小與目標(biāo)樣本大小的比率比5還小時(shí),有必要對(duì)匹配后的樣本加權(quán)。本文的模擬結(jié)果與之不同的是當(dāng)網(wǎng)絡(luò)訪問(wèn)固定樣本大小與目標(biāo)樣本大小的比率比3(非5)小時(shí),有必要對(duì)匹配后的樣本加權(quán),可采取傾向得分逆加權(quán)、加權(quán)組調(diào)整和事后分層調(diào)整三種方法加權(quán),估計(jì)效果均比未加權(quán)的匹配樣本估計(jì)好。存在不同的原因可能是本文在樣本匹配時(shí)采用的匹配方法(傾向得分匹配)與Rivers和Bailey不同,說(shuō)明若將傾向得分用于樣本選擇階段,可能會(huì)出現(xiàn)當(dāng)網(wǎng)絡(luò)訪問(wèn)固定樣本大小與目標(biāo)樣本大小的比率(大于等于3)比5還小時(shí),仍可直接利用匹配樣本估計(jì)目標(biāo)總體均值,而無(wú)需進(jìn)一步加權(quán)調(diào)整。
圖1 網(wǎng)絡(luò)訪問(wèn)固定樣本規(guī)模與RMSE之間的關(guān)系
本文采用2014年美國(guó)社區(qū)調(diào)查中阿拉斯加州的數(shù)據(jù)http://factfinder.census.gov/faces/nav/jsf/pages/searchresults. xhtml?refresh=t,進(jìn)一步驗(yàn)證本文所提出的方法。選取阿拉斯加州數(shù)據(jù)中的年齡、公民身份、婚姻狀況、教育、性別、就業(yè)狀況記錄、種族、過(guò)去12個(gè)月的工資或工資收入共8個(gè)變量,6787個(gè)個(gè)案。其中年齡在1歲以下的記為0,1到99歲分別記為1,…,99;公民身份的取值為1、2、3、4、5,1表示在美國(guó)出生,2表示出生于波多黎各、關(guān)島、美屬維爾京群島或北馬里亞納群島,3表示出生在國(guó)外的美國(guó)父母,4表示加入美國(guó)國(guó)籍的美國(guó)公民,5表示非美國(guó)公民;婚姻狀況的取值為1、2、3、4、5,1表示已婚,2表示喪偶,3表示離異,4表示分居,5表示未婚或者15歲以下;教育的取值為0到24,0表示小于3歲,1表示沒(méi)有上學(xué),2表示幼兒園,3表示學(xué)前班,4到9分別表示小學(xué)一年級(jí)到六年級(jí),10到12分別表示初中一年級(jí)到三年級(jí),13、14分別表示高中一年級(jí)和二年級(jí),15表示高中三年級(jí)但無(wú)文憑,16表示普通高中文憑,17表示GED證書(shū)或者同等學(xué)歷證明,18表示上了大學(xué)但不到1年,19表示上了1年或以上的大學(xué)但沒(méi)有學(xué)位,20表示準(zhǔn)學(xué)士學(xué)位或?qū)?飘厴I(yè)證書(shū),21表示學(xué)士學(xué)位,22表示碩士學(xué)位,23表示除了學(xué)士學(xué)位還有專業(yè)學(xué)位,24表示博士學(xué)位;性別的取值為1、2,1表示男性,2表示女性;就業(yè)狀況記錄取值為0到6,0表示小于16歲,1表示聘用的文職人員且正在工作,2表示聘用的文職人員有一個(gè)職位,但并沒(méi)有工作,3表示失業(yè),4表示武裝部隊(duì)且正在工作,5表示武裝部隊(duì)有一個(gè)職位,但并沒(méi)有工作,6表示無(wú)勞動(dòng)能力;種族取值為1到9,1表示白人,2表示黑人或非裔美國(guó)人,3表示美國(guó)印第安人,4表示阿拉斯加本地人,5表示既是美國(guó)印第安人又是阿拉斯加本地人或者不確定是美國(guó)印第安人還是阿拉斯加本地人,6表示亞洲人,7表示夏威夷原住民和其他太平洋島民,8表示一些其他種族,9表示兩個(gè)或多個(gè)種族。過(guò)去12個(gè)月的工資或工資收入取值為0到999999美元,該變量取值的最大值為366000,最小值為0,均值為20516.589,標(biāo)準(zhǔn)差為33308.300。
假設(shè)該6787個(gè)單元構(gòu)成目標(biāo)總體,從目標(biāo)總體中簡(jiǎn)單隨機(jī)抽取一個(gè)樣本量為1000的樣本(目標(biāo)樣本),并以過(guò)去12個(gè)月的工資或工資收入為目標(biāo)變量,其他變量為協(xié)變量。假設(shè)網(wǎng)絡(luò)訪問(wèn)固定樣本為從目標(biāo)總體中除去目標(biāo)樣本后的剩余單元中選?。ㄍㄟ^(guò)網(wǎng)絡(luò)招募),其規(guī)模分別為1500、2000和3000。在不同的網(wǎng)絡(luò)訪問(wèn)固定樣本規(guī)模下,利用傾向得分匹配選擇樣本,匹配方法為單一無(wú)放回最近鄰匹配;并對(duì)匹配后的樣本采用傾向得分逆加權(quán)、加權(quán)組調(diào)整和事后分層調(diào)整三種方法進(jìn)行加權(quán)調(diào)整,估計(jì)目標(biāo)總體均值,每種方法重復(fù)進(jìn)行10次,最終計(jì)算的目標(biāo)總體均值估計(jì)的均方誤差(RMSE)見(jiàn)表2。
表2 匹配樣本未加權(quán)與三種方法加權(quán)調(diào)整后的RMSE
由表2可見(jiàn),當(dāng)網(wǎng)絡(luò)訪問(wèn)固定樣本規(guī)模為1500和2000時(shí),采用傾向得分逆加權(quán)、加權(quán)組調(diào)整和事后分層調(diào)整三種方法估計(jì)目標(biāo)總體均值的效果均優(yōu)于未加權(quán)時(shí)匹配樣本的估計(jì)效果,并且傾向得分事后分層調(diào)整的估計(jì)效果最好,傾向得分加權(quán)組調(diào)整的估計(jì)效果次之。當(dāng)網(wǎng)絡(luò)訪問(wèn)固定樣本規(guī)模為3000時(shí),采用傾向得分事后分層調(diào)整的估計(jì)效果最好,其次是未加權(quán)時(shí)匹配樣本的估計(jì),兩者估計(jì)的RMSE相差不大,并且采用傾向得分逆加權(quán)和加權(quán)組調(diào)整的估計(jì)效果均不如未加權(quán)時(shí)匹配樣本的估計(jì)效果??梢钥吹?,實(shí)證結(jié)果與模擬結(jié)果基本一致。
本文提出采用傾向得分匹配選擇樣本,并對(duì)匹配后的樣本利用傾向得分逆加權(quán)、加權(quán)組調(diào)整和事后分層調(diào)整三種方法進(jìn)行加權(quán)調(diào)整,從而提高估計(jì)的精度,實(shí)現(xiàn)對(duì)目標(biāo)總體的統(tǒng)計(jì)推斷,并進(jìn)一步采用蒙特卡羅模擬和實(shí)際數(shù)據(jù)比較各種方法的估計(jì)效果。蒙特卡羅模擬與實(shí)證研究表明:當(dāng)網(wǎng)絡(luò)訪問(wèn)固定樣本大小與目標(biāo)樣本大小的比率比3小時(shí),有必要對(duì)匹配后的樣本加權(quán),可采取傾向得分逆加權(quán)、加權(quán)組調(diào)整和事后分層調(diào)整三種方法加權(quán),估計(jì)效果均比未加權(quán)的匹配樣本估計(jì)的效果好;當(dāng)網(wǎng)絡(luò)訪問(wèn)固定樣本大小與目標(biāo)樣本大小的比率不小于3時(shí),傾向得分事后分層調(diào)整與未加權(quán)的匹配樣本估計(jì)效果較好,可以考慮利用未加權(quán)的匹配樣本或者傾向得分事后分層調(diào)整進(jìn)行估計(jì)。
本文所提出的方法將傾向得分同時(shí)運(yùn)用于非概率的樣本選擇階段與加權(quán)調(diào)整階段,提高了估計(jì)的精度,豐富了非概率抽樣的統(tǒng)計(jì)推斷方法。同時(shí),由于網(wǎng)絡(luò)訪問(wèn)固定樣本具有成本較低,且能得到較快回答的特點(diǎn),使得本文所提出的方法具有較強(qiáng)的可操作性。
[1]Baker R,Brick J M,Bates N A,et al.Summary Report of the AAPOR Task Force on Nonprobability Sampling[J].Journal of Survey Statis?tics and Methodology,2013,1(2).
[2]Svensson J.Web Panel Surveys--Can They Be Designed and Used in a Scientifically Sound Way?[C].HongKong:59th World Statistics Congress,2013.
[3]Rivers D.Sample Matching--representative Sampling From Internet Panels[J].Polimetrix White Paper Series,2006.
[4]Vavreck L,Rivers D.The 2006 Cooperative Congressional Election Study[J].Journal of Elections,Public Opinion&Parties,2008,18(4). [5]Rivers D,Bailey D.Inference From Matched Samples in the 2008 U. S.NationalElections[J].American Association of Public Re?search--JSM,2009.
[6]Terhanian G,Bremer J.A Smarter Way to Select Respondents for Sur?veys?[J].International Journal of Market Research,2012,54(6).
[7]Rosenbaum P R,Rubin D B.The Central Role of the Propensity Score in Observational Studies for Causal Effects[J].Biometrika,1983,70 (1).
[8]Smith J A,Todd P E.Does Matching Overcome LaLonde’s Critique of Nonexperimental Estimators?[J].Journal of Econometrics,2005,125 (2).
[9]Caliendo M,Kopeinig S.Some Practical Guidance for the Implementa?tion of Propensity Score Matching[J].Journal of Economic Surveys, 2008,22(1).
[10]Rivers D.Sampling for Web Surveys[C].The 2007 Joint Statistical Meetings,2007.
(責(zé)任編輯/易永生)
C811
A
1002-6487(2016)21-0004-05
國(guó)家社會(huì)科學(xué)基金資助項(xiàng)目(15BTJ014);中國(guó)人民大學(xué)2015年度拔尖創(chuàng)新人才培育資助計(jì)劃項(xiàng)目
劉 展(1981—),女,湖北宜昌人,博士研究生,研究方向:抽樣調(diào)查技術(shù)與數(shù)據(jù)分析。
金勇進(jìn)(1953—),男,北京人,教授,博士生導(dǎo)師,研究方向:抽樣調(diào)查技術(shù)與數(shù)據(jù)分析。