国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

復(fù)雜抽樣情形下樣本量的確定

2019-07-02 10:16張幗奮
關(guān)鍵詞:抽樣調(diào)查樣本量

張幗奮

【摘要】本文討論了如何在一個抽樣調(diào)查項目中設(shè)計抽樣方案,確定樣本量,以及估計目標(biāo)指標(biāo)的精度的問題,并將教科書中相關(guān)問題進(jìn)行總結(jié),提出一些想法.

【關(guān)鍵詞】抽樣調(diào)查;樣本量;PPS抽樣

一、引 言

《抽樣調(diào)查》課程的基本內(nèi)容是介紹簡單隨機(jī)抽樣、分層抽樣、整群抽樣、多階段抽樣、不等概率抽樣、系統(tǒng)抽樣,以及基于這些抽樣方式下樣本量的確定問題.但在實際問題中,一個抽樣調(diào)查方案往往會將幾種抽樣方式綜合起來使用,成為一個復(fù)雜抽樣方案.如何設(shè)計抽樣方案?樣本量取多少?如何估計目標(biāo)指標(biāo)的精度等問題隨之產(chǎn)生.本文針對這些問題將教科書[1]中的已有結(jié)論進(jìn)行綜合,并提出自己的一些想法.

二、如何抽樣

根據(jù)是否依據(jù)隨機(jī)原則抽樣可以將抽樣方式分為概率抽樣與非概率抽樣.

非概率抽樣包括方便抽樣、自愿樣本、配額抽樣等.例如,為了解杭州市民消費(fèi)情況,選擇若干大超市購物中心發(fā)放問卷進(jìn)行調(diào)查;為了解杭州市民對“看病難”問題的看法,選擇若干家醫(yī)院,對病人及醫(yī)護(hù)人員進(jìn)行攔截式問卷調(diào)查;為了解大學(xué)生對網(wǎng)上某種現(xiàn)象的看法,在網(wǎng)上發(fā)起調(diào)查等等.這些調(diào)查都是非概率抽樣調(diào)查,其特點是能夠方便快捷獲得樣本數(shù)據(jù),這對調(diào)查一些突發(fā)的,需要及時了解民眾態(tài)度的調(diào)查項目來說是很有必要的,從這些調(diào)查中能夠及時發(fā)現(xiàn)問題,從而提出應(yīng)對措施.但非概率抽樣效果的好壞很大程度上依賴抽樣者主觀判斷能力和經(jīng)驗,它不能計算抽樣誤差,不能從概率意義上控制誤差并以此來保證推斷的準(zhǔn)確性[1].

為了保證抽樣的準(zhǔn)確性,控制抽樣誤差,就需要采用概率抽樣.基本的概率抽樣方法就是前面提到的簡單隨機(jī)抽樣、分層抽樣、整群抽樣、多階段抽樣、不等概率抽樣、系統(tǒng)抽樣等.而具體在確定抽樣方案時往往要將多種抽樣方式組合使用.例如,要對杭州市高校學(xué)生進(jìn)行抽樣調(diào)查,可以采用三階段PPS抽樣:第一階段列出在杭全部高校名冊抽樣框,及相應(yīng)的在校學(xué)生人數(shù),按照與在校學(xué)生人數(shù)成比例的概率抽取n個大學(xué),第二階段,對抽中的這n個大學(xué),每個學(xué)校列出學(xué)院名冊的抽樣框及學(xué)院人數(shù),按照與學(xué)院人數(shù)成比例的概率抽取m個學(xué)院(每個學(xué)校抽取的學(xué)院個數(shù)相同),第三階段,在抽中的學(xué)院中列出學(xué)院全部學(xué)生名冊抽樣框,并隨機(jī)抽取l名學(xué)生(每個學(xué)院抽取的學(xué)生數(shù)相同),這樣共抽取樣本量為lmn的學(xué)生數(shù)據(jù).而這種抽樣設(shè)計是自加權(quán)的,其優(yōu)點是在不考慮非抽樣誤差的情況下,可以認(rèn)為自加權(quán)樣本完全代表了總體,此時可以用標(biāo)準(zhǔn)的統(tǒng)計方法來進(jìn)行點估計,否則的話,在大規(guī)模調(diào)查中,樣本量很大,而每個單位的權(quán)數(shù)不等,計算權(quán)數(shù)的工作量很大,對參數(shù)進(jìn)行估計都要加權(quán)會使得數(shù)據(jù)處理相當(dāng)復(fù)雜[1].如果將高校分為本科院校與??圃盒?,則可以采用分層三階段PPS抽樣;如果每個年級的學(xué)生都要抽到,則可以再按年級分層;如果每個學(xué)校按宿舍樓抽樣,就要有宿舍樓的抽樣框等等.由此可見,同樣是抽取高校學(xué)生進(jìn)行調(diào)查,如果根據(jù)方便選中幾個高校,然后在高校的圖書館、教室、食堂等地進(jìn)行調(diào)查,就是非概率抽樣,無法計算抽樣誤差,如果按照多階段PPS抽樣(例如,按學(xué)院或者按宿舍樓),則需要每個階段的抽樣框,按一定的概率抽取樣本,此時可以計算抽樣誤差,以及根據(jù)誤差限度確定樣本量.

三、樣本量的確定

通常情況下,復(fù)雜抽樣樣本量的確定需要根據(jù)置信度1-α 以及絕對誤差限度d(或相對誤差限度r)先計算在簡單隨機(jī)抽樣情況下的樣本量,再估計設(shè)計效應(yīng)及樣本的有效率綜合而成.

如何計算簡單隨機(jī)抽樣的樣本量?我們知道,在進(jìn)行抽樣調(diào)查時,調(diào)查問卷上的問題少則二三十個,多則上百個,甚至數(shù)百個,每個問題取值的離散程度是不一樣的,如果要使所有指標(biāo)都達(dá)到一定的精度要求,則在考慮抽樣方案時,必須根據(jù)離散程度最大的指標(biāo)來設(shè)計[2].這將導(dǎo)致很大的樣本量,也是不切實際的,所以通常的做法應(yīng)該是以調(diào)查的一兩個主要問題為目標(biāo)指標(biāo)進(jìn)行抽樣設(shè)計.

例如,某項調(diào)查主要目標(biāo)是關(guān)注滿意度這個指標(biāo),而在問卷中將該項指標(biāo)設(shè)計為:1.非常不滿意,2.不滿意,3.一般,4.滿意,5.非常滿意.情形一,如果將問題轉(zhuǎn)化為考慮滿意的比例P,也就是選4和5的比例,Q=1-P,則利用公式

就可以計算樣本量n.其中N是總體數(shù),當(dāng)N很大時,n≈t2PQd2.關(guān)于t,d,P的取值,t是置信度為1-α的標(biāo)準(zhǔn)正態(tài)分布上α2分位數(shù),通常取置信度為95%,此時t=1.96,絕對誤差限度d常取為0.05,而P在調(diào)查前未知,一種辦法是保守計算,當(dāng)P=0.5時PQ達(dá)到最大值0.25;另一種辦法是進(jìn)行預(yù)調(diào)查,得到P的估計值,比如,估計值P=0.8,則PQ=0.16.

情形二,如果該項指標(biāo)按得分計算,根據(jù)置信度1-α以及絕對誤差限度d,則計算樣本容量的公式為

當(dāng)N很大時,n≈t2S2d2;根據(jù)置信度1-α與相對誤差限度r,則計算樣本容量的公式由

確定.在公式(2)中需要估計總體方差S2,在公式(3)中需要估計總體變異系數(shù)c=SY.一般估計總體方差和總體變異系數(shù)需要進(jìn)行預(yù)調(diào)查,根據(jù)預(yù)調(diào)查數(shù)據(jù)進(jìn)行計算,或者是采用以往的文獻(xiàn)資料數(shù)據(jù)估計;絕對誤差限度d在估計比例P時常取不超過0.05,如果是1~5的計分問題可以適當(dāng)放寬,比如,取0.1,0.2等,相對誤差限度r可以取10%~20%左右.

在獲得簡單隨機(jī)抽樣情況的樣本量以后,考慮復(fù)雜樣本與簡單隨機(jī)樣本之間的設(shè)計效應(yīng)deff,deff定義為任意抽樣方式下的抽樣方差除以簡單隨機(jī)抽樣方式下的抽樣方差的商.一般地,簡單隨機(jī)抽樣的deff=1,分層隨機(jī)抽樣的deff<1,整群隨機(jī)抽樣的deff>1,系統(tǒng)隨機(jī)抽樣的deff≈1[1].如前面提到的分層多階段PPS抽樣,估計設(shè)計效應(yīng)在2~3左右,再將有效問卷的比例a考慮進(jìn)去,最后的樣本容量為n′=n×deffa.如果將n′分解為前面例子高校學(xué)生抽樣方案中的lmn,再將樣本量分配到各階段就可以完成抽樣.

猜你喜歡
抽樣調(diào)查樣本量
醫(yī)學(xué)研究中樣本量的選擇
配對設(shè)計中缺乏差值標(biāo)準(zhǔn)差情況下的樣本量估計策略*
航空裝備測試性試驗樣本量確定方法
Sample Size Calculations for Comparing Groups with Binary Outcomes
對整群抽樣與分層抽樣結(jié)合使用的探究
計算機(jī)輔助的抽樣調(diào)查應(yīng)用框架探討
《抽樣調(diào)查》實驗教學(xué)創(chuàng)新性研究
中小企業(yè)融資問題研究及對策
城市居民住戶調(diào)查抽樣框存在的缺陷及優(yōu)化策略分析
簡述抽樣調(diào)查在“大數(shù)據(jù)”時代下的意義