蘇州大學(xué)醫(yī)學(xué)部公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計(jì)學(xué)教研室(215123) 傅 穎 高 歌劉升學(xué) 周云華 施佳琛
樣本輪換下兩階段抽樣連續(xù)調(diào)查的統(tǒng)計(jì)方法及應(yīng)用*
蘇州大學(xué)醫(yī)學(xué)部公共衛(wèi)生學(xué)院衛(wèi)生統(tǒng)計(jì)學(xué)教研室(215123) 傅 穎 高 歌△劉升學(xué) 周云華 施佳琛
目的為實(shí)際需要的樣本輪換下兩階段抽樣連續(xù)調(diào)查提供科學(xué)的調(diào)查方法與統(tǒng)計(jì)公式,為制定某核電站職工輻射防護(hù)措施提供依據(jù)。方法采用數(shù)理統(tǒng)計(jì)學(xué)的理論方法推導(dǎo)統(tǒng)計(jì)量的計(jì)算公式;采用本文研究的樣本輪換下兩階段抽樣連續(xù)調(diào)查的統(tǒng)計(jì)方法,對(duì)某核電站職工的白細(xì)胞數(shù)進(jìn)行了連續(xù)三年的調(diào)查分析;采用SAS編程模擬調(diào)查分析100個(gè)樣本,對(duì)本文研究的調(diào)查方法及其統(tǒng)計(jì)公式作信度與效度評(píng)價(jià)。結(jié)果對(duì)樣本輪換下兩階段抽樣連續(xù)調(diào)查,推導(dǎo)出總體均值的估計(jì)量及其方差與估計(jì)方差的計(jì)算公式;該核電站職工兩階段抽樣均輪換樣本的2010年、2011年白細(xì)胞數(shù)總體均值的估計(jì)量分別為5.88、5.84(103/mm3),其標(biāo)準(zhǔn)誤分別為0.247、0.255,與一般成人白細(xì)胞均數(shù)的差異具有統(tǒng)計(jì)學(xué)意義;100個(gè)總體均數(shù)的95%可信區(qū)間均包含模擬總體均數(shù)。結(jié)論本文研究的樣本輪換下兩階段抽樣連續(xù)調(diào)查的統(tǒng)計(jì)方法具有較好的理論與實(shí)際意義以及較高的效度與信度;該核電站職工的白細(xì)胞數(shù)偏低,應(yīng)引起相關(guān)部門(mén)的高度重視。
兩階段抽樣 樣本輪換 連續(xù)調(diào)查 核電站職工 白細(xì)胞
為了調(diào)查總體在不同時(shí)間上的水平變化、平均水平或者累計(jì),連續(xù)調(diào)查的方法已廣泛采用。樣本疲勞和代表性下降是多次調(diào)查固定樣本的兩個(gè)不可忽視的問(wèn)題。不同次調(diào)查中重新抽取新樣本,也存在以下幾個(gè)嚴(yán)重問(wèn)題:不能很好地體現(xiàn)出總體隨時(shí)間的變化;不能以固定樣本的前期資料對(duì)現(xiàn)期總體做出精度較高的回歸組合估計(jì);調(diào)查時(shí)間、費(fèi)用、操作要求均比固定樣本高。樣本輪換(sample rotation)是指在樣本容量不變的前提下,每隔一定時(shí)間更換部分樣本單元,既保留了部分原有樣本單元,又增加了部分新樣本單元,所以兼有全新樣本與固定樣本的優(yōu)點(diǎn),是控制系統(tǒng)誤差、減小抽樣誤差、提高估計(jì)精度、減少調(diào)查費(fèi)用的重要手段,是國(guó)內(nèi)外統(tǒng)計(jì)專(zhuān)業(yè)公認(rèn)的在連續(xù)調(diào)查中采用的好方法。
目前,國(guó)內(nèi)外對(duì)一次性(橫斷面)抽樣調(diào)查的統(tǒng)計(jì)方法研究較多,理論及方法也比較成熟;而對(duì)于連續(xù)抽樣調(diào)查,主要局限于樣本輪換下簡(jiǎn)單隨機(jī)抽樣調(diào)查的研究。本文對(duì)實(shí)際調(diào)查中常需采用的樣本輪換下兩階段抽樣連續(xù)調(diào)查的統(tǒng)計(jì)方法進(jìn)行了研究。
1.調(diào)查方法
在兩階段樣本均輪換的過(guò)程中,第一階段是初級(jí)單元的輪換,使現(xiàn)期初級(jí)樣本單元中既有保留的初級(jí)單元,又有輪換的初級(jí)單元,在輪換的初級(jí)單元中所有次級(jí)單元均是新樣本。第二階段是在保留的初級(jí)單元中對(duì)次級(jí)單元進(jìn)行輪換,使現(xiàn)期次級(jí)單元中既有保留的次級(jí)單元,又有輪換的次級(jí)單元。對(duì)于初級(jí)單元和次級(jí)單元均按照最優(yōu)樣本輪換率計(jì)算輪換和保留的個(gè)數(shù)并實(shí)施簡(jiǎn)單隨機(jī)抽樣進(jìn)行相應(yīng)的輪換和保留。
設(shè)總體包含L個(gè)初級(jí)單元,第i個(gè)初級(jí)單元包含Ni個(gè)次級(jí)單元。初級(jí)單元的樣本容量為l,第i個(gè)初級(jí)單元的樣本容量為ni,第h次調(diào)查保留初級(jí)單元數(shù)為vh,輪換初級(jí)單元數(shù)為別是第一階段與第二階段的抽樣比。記Yhij為第h次抽樣時(shí)總體第i個(gè)初級(jí)單元中第j個(gè)次級(jí)單元的指標(biāo)值,i=1,2,…,L;j=1,2,…,Ni。yhij為第h次抽樣時(shí)樣本第i個(gè)初級(jí)單元中第j個(gè)次級(jí)單元的指標(biāo)值,i=1,2,…,l;j=1,2,…,ni。
2.總體均值的估計(jì)量
在樣本輪換下的簡(jiǎn)單隨機(jī)抽樣,前人已給出第h次抽樣總體均值的組合估計(jì)量,因第h次抽中的第i個(gè)保留初級(jí)單元內(nèi)作樣本輪換下的簡(jiǎn)單隨機(jī)(第二階段)抽樣,故第h次抽中的第i個(gè)保留初級(jí)單元按次級(jí)單元指標(biāo)均值的組合估計(jì)量為[1-2]:
因第h次抽中的第i個(gè)輪換初級(jí)單元,是采用簡(jiǎn)單隨機(jī)抽樣獲取的新樣本,所以第i個(gè)輪換初級(jí)單元按次級(jí)單元指標(biāo)樣本均值為:
這里,yhuij為第h次抽中的第i個(gè)輪換初級(jí)單元第j個(gè)次級(jí)單元的指標(biāo)值,則兩階段樣本都輪換的第h次總體均值的估計(jì)量為[1-2]:
3.總體均值估計(jì)量的方差
對(duì)(3)式按方差的性質(zhì),總體均值估計(jì)量的方差為:
其中,根據(jù)初級(jí)單元大小不等的不放回抽樣的研究結(jié)果可知[3-5]:
因第h次抽中的第i個(gè)保留初級(jí)單元內(nèi)作樣本輪換下的連續(xù)抽樣調(diào)查,故(7)式中的計(jì)算公式為[3-5]:
職業(yè)放射損傷是以造血組織損傷為主,而職業(yè)群體的血細(xì)胞變化特點(diǎn)是以中性粒細(xì)胞為主的白細(xì)胞降低,以及血紅蛋白、血小板的下降[6]。為了了解某核電站職工的健康狀況及其在連續(xù)時(shí)間上的水平變化,探討職業(yè)病危險(xiǎn)因素,我們對(duì)該核電站職工的白細(xì)胞數(shù)進(jìn)行了兩階段抽樣下樣本輪換連續(xù)三次(年)的調(diào)查分析。
1.調(diào)查設(shè)計(jì)
(1)調(diào)查對(duì)象 以2009-2011年中國(guó)某核電站(共22個(gè)處)全體職工為調(diào)查對(duì)象,調(diào)查指標(biāo)為血液學(xué)指標(biāo)白細(xì)胞(WBC)數(shù)(103/mm3)。
(2)調(diào)查方法
采用兩階段抽樣下樣本輪換的連續(xù)調(diào)查,以處為初級(jí)單元,以職工為次級(jí)單元,初級(jí)單元和次級(jí)單元均進(jìn)行樣本輪換。對(duì)總體22個(gè)處(L=22)統(tǒng)一編號(hào)。根據(jù)相關(guān)公式[5]估計(jì)得:2009年(h=1)按40%的抽樣比隨機(jī)抽取9個(gè)處(l=9),每個(gè)抽中處按45%的抽樣比隨機(jī)抽取次級(jí)單元組成2009年的樣本;2010年輪換初級(jí)單元數(shù)u2=6,保留初級(jí)單元數(shù)v2=3;2011年輪換初級(jí)單元數(shù)u3=5,保留初級(jí)單元數(shù)v3=4(表1)。首先在初級(jí)單元進(jìn)行樣本輪換,保留部分舊的處,換入部分新的處,保持l=9不變。新?lián)Q入的各處中仍按45%的抽樣比隨機(jī)抽取次級(jí)單元;保留的各處中保留部分舊的次級(jí)單元,換入部分新的次級(jí)單元(舊的次級(jí)單元和新的次級(jí)單元來(lái)自同一個(gè)處)。2009、2010、2011年分別調(diào)查次級(jí)單元(職工)199人、218人、202人,共調(diào)查619人次。
表1 2009-2011年樣本處及其調(diào)查人數(shù)
(3)質(zhì)量控制
蘇州大學(xué)醫(yī)學(xué)部前身隸屬于核工業(yè)部,長(zhǎng)期以來(lái)與各核電站保持著良好的課題合作關(guān)系,本次調(diào)查亦得到了該核電站的大力支持。在本次調(diào)查之前對(duì)調(diào)查員組織培訓(xùn),讓其了解整個(gè)課題的意義并掌握樣本輪換的具體實(shí)施步驟。所采血液樣本亦是由專(zhuān)人送指定醫(yī)院測(cè)定,實(shí)驗(yàn)室檢查結(jié)果返回后數(shù)據(jù)采用雙人錄入并校對(duì)。
2.調(diào)查分析結(jié)果
(1)2009年的調(diào)查計(jì)算結(jié)果
因第一年未涉及樣本輪換,所以按照一般(非輪換樣本)二階段抽樣均值的算法,得2009年的均值ˉy=6.26(103/mm3)。
(2)2010年的調(diào)查計(jì)算結(jié)果
基本指標(biāo)vh、uh、nhi、uhi、mhi、Φh、Φhi等根據(jù)本研究提供的相關(guān)公式(本文從略)或按文獻(xiàn)[3-5]估計(jì)。
①總體均值的估計(jì)量
由式(2)計(jì)算得第7、8、11、15、17、20六個(gè)輪換處均值的估計(jì)值分別為5.54、5.91、6.47、5.53、 5.55、5.71(103/mm3),則按式(3)計(jì)算得輪換處均值的估計(jì)值為5.79(103/mm3)。
由式(3)得2010年總體均值估計(jì)量:
②總體均值估計(jì)量的方差
由式(4)得2010年總體均值估計(jì)量的估計(jì)方差:
(3)2011年的調(diào)查計(jì)算結(jié)果
(4)統(tǒng)計(jì)推斷
一般成人白細(xì)胞數(shù)的平均值為6.50(103/mm3),將樣本輪換后的2010年、2011年該核電站職工白細(xì)胞樣本均數(shù)分別與之比較做Z檢驗(yàn),結(jié)果如表2。表中可見(jiàn)兩個(gè)總體均值的95%可信區(qū)間均不包含正常均值,P值均小于0.05,表明該核電站職工2010年及2011年白細(xì)胞數(shù)的總體均值低于一般成人的總體均值。
表2 核電站職工與正常人白細(xì)胞數(shù)(103/mm3)的比較
1.基于計(jì)算機(jī)模擬的效度信度評(píng)價(jià)方法
以本文應(yīng)用實(shí)例中該核電站為模擬總體,包含22個(gè)初級(jí)單位,次級(jí)單位數(shù)共3500。以次級(jí)單位(職工)白細(xì)胞數(shù)2010年調(diào)查所得樣本均數(shù)5.88、標(biāo)準(zhǔn)差2.11作為模擬總體的參數(shù)。通過(guò)SAS編程:建立模擬總體;模擬樣本輪換下二階段抽樣連續(xù)10次調(diào)查100個(gè)樣本(第一階段抽40%的初級(jí)單位,第二階段抽10%的次級(jí)單位);對(duì)模擬調(diào)查資料運(yùn)用本文給出的公式計(jì)算10次調(diào)查總體均值估計(jì)量及其估計(jì)方差、總體均數(shù)95%的上下限,來(lái)評(píng)價(jià)本文研究的調(diào)查方法及其公式的效度和信度。
2.模擬調(diào)查分析結(jié)果
以樣本的序號(hào)為橫坐標(biāo),以每個(gè)樣本所得的總體均值95%可信區(qū)間為縱坐標(biāo)畫(huà)圖,見(jiàn)圖1。圖1中的中橫線為模擬總體均數(shù)。從圖1看出,100個(gè)模擬樣本得到的100個(gè)總體均數(shù)95%可信區(qū)間全部包含模擬總體均數(shù),可認(rèn)為100個(gè)樣本均數(shù)與總體均數(shù)(模擬真值)的差別無(wú)統(tǒng)計(jì)學(xué)意義,說(shuō)明本文研究的樣本輪換下二階段抽樣連續(xù)調(diào)查的調(diào)查方法及其統(tǒng)計(jì)公式具有較高的效度;又因100個(gè)樣本均數(shù)均接近同一數(shù)值(模擬總體均值),同時(shí)也說(shuō)明本文研究的調(diào)查方法及其統(tǒng)計(jì)公式具有良好的信度。
圖1樣本輪換下二附段抽樣連續(xù)調(diào)查分析的模擬結(jié)果
1.樣本輪換的連續(xù)調(diào)查是固定樣本與全新樣本連續(xù)調(diào)查的折中方法,既能反映變化也能節(jié)省一定資源,其理論發(fā)展相對(duì)滯后[7-8],主要集中于對(duì)簡(jiǎn)單抽樣下樣本輪換問(wèn)題的研究[9]。本文對(duì)實(shí)際需要的樣本輪換下二階段抽樣連續(xù)調(diào)查,從數(shù)學(xué)上首次推導(dǎo)出總體均數(shù)的估計(jì)量及其方差、估計(jì)方差的統(tǒng)計(jì)公式,具有統(tǒng)計(jì)理論方法學(xué)意義。
2.新的調(diào)查方法及其統(tǒng)計(jì)公式的效度與信度需采用大個(gè)數(shù)樣本多次連續(xù)調(diào)查分析來(lái)驗(yàn)證,進(jìn)行實(shí)例調(diào)查幾乎不可能。本文采用計(jì)算機(jī)模擬的方法,不僅能實(shí)現(xiàn)理論上的大量重復(fù)抽樣調(diào)查,還能保證獲取資料的各項(xiàng)條件的穩(wěn)定性。本文基于SAS進(jìn)行大樣本個(gè)數(shù)(100個(gè)樣本)連續(xù)10次的計(jì)算機(jī)模擬實(shí)驗(yàn),對(duì)本文研究的調(diào)查方法及其統(tǒng)計(jì)公式,得到了高信度、高效度的評(píng)價(jià)結(jié)論。
3.樣本輪換下連續(xù)抽樣調(diào)查在國(guó)內(nèi)外應(yīng)用比較廣泛,主要應(yīng)用于住戶(hù)調(diào)查[10]、貿(mào)易[11]、社會(huì)經(jīng)濟(jì)[12]等領(lǐng)域,尚未見(jiàn)文獻(xiàn)報(bào)道用于醫(yī)學(xué)領(lǐng)域。本文首次在醫(yī)學(xué)領(lǐng)域,使用二階段抽樣下樣本輪換的方法調(diào)查分析出該核電站職工的白細(xì)胞數(shù)比正常人白細(xì)胞數(shù)低,與姚志剛[13]、馮曉敏[14]等人得出的結(jié)論一致,提示長(zhǎng)期低劑量電離輻射已影響了放射人員的健康,放射人員要增強(qiáng)自我保護(hù)意識(shí),同時(shí)相關(guān)部門(mén)要定期給職工做血液檢查并在輻射防護(hù)設(shè)計(jì)、管理和運(yùn)行過(guò)程中應(yīng)更加嚴(yán)格遵守ALARA原則[15]。
4.本研究對(duì)模擬總體,同時(shí)模擬二階段橫斷面抽樣調(diào)查100個(gè)樣本(各階段抽樣比與樣本輪換模擬相同),分析結(jié)果樣本均數(shù)的標(biāo)準(zhǔn)誤比樣本輪換模擬調(diào)查平均高出30%,說(shuō)明本文研究的樣本輪換下二階段抽樣連續(xù)調(diào)查的方法可大大提高抽樣精度。因篇幅所限,精度比較的模擬實(shí)驗(yàn)結(jié)果本文未予介紹。
1.趙俊康.考慮偏差時(shí)的樣本輪換問(wèn)題研究.山西財(cái)經(jīng)大學(xué)學(xué)報(bào),2001,23(4):100-102.
2.Lind JT.Repeated surveys and the kalman filter.Econometrics Journal,2005,8(3):418-427.
3.Cochran WG.Sampling Techniques.3rd.New York:John Wiley&Sons,1977.
4.Fuller WA,Rao JNK.A regression composite estimator with application to the Canadian Labour Force Survey.Survey Methodology,2001,27:45-51.
5.歐輝,潘紅艷.不同規(guī)模單水平樣本輪換最優(yōu)輪換率的確定.數(shù)學(xué)理論與應(yīng)用,2010,30(3):88-92.
6.商希梅,喬建維,侯殿俊,等.150名60Coγ射線工作者輻射效應(yīng)分析研究.中國(guó)輻射衛(wèi)生,2003,12(3):183.
7.陳光慧.連續(xù)性抽樣估計(jì)方法研究綜述.統(tǒng)計(jì)與信息論壇,2010,25(12):3-9.
8.Duncan GJ,Kalton G.Issues of Design and Analysis of Surveys Across Time.International Statistical Review,1987,55(1):97-117.
9.U.K.Office of Population Censuses and Surveys.General Household Survey 1982.London:HMSO,1984.
10.陳光慧,劉建平.我國(guó)農(nóng)村住戶(hù)連續(xù)性抽樣調(diào)查方案設(shè)計(jì).統(tǒng)計(jì)研究,2013,30(2):80-87.
11.張同利,萬(wàn)壽橋,任志安.小型批發(fā)零售貿(mào)易行業(yè)抽樣中樣本輪換方法.財(cái)貿(mào)研究,1996(4):58-60.
12.喻艷.連續(xù)性統(tǒng)計(jì)調(diào)查在社會(huì)經(jīng)濟(jì)研究領(lǐng)域的應(yīng)用.現(xiàn)代經(jīng)濟(jì)信息,2011,24:264.
13.姚志剛,衣同曄,錢(qián)志遠(yuǎn),等.2007-2011年秦山核電站工作人員健康狀況分析.職業(yè)與健康,2012,28(11):1326-1327.
14.馮曉敏.放射工作人員的血液檢驗(yàn)結(jié)果探討.中國(guó)輻射衛(wèi)生,2012,21(3):294.
15.田浩天.核電站大修集體劑量控制管理淺析.科協(xié)論壇,2013,6:64-65.
(責(zé)任編輯:丁海龍)
The Statistical Method of Sample Rotation Under Two-stage Sampling Successive Survey and its Application
Fu Ying,Gao Ge,Liu Shengxue,et al.(Department of Epidemiology and Biostatistics,School of Public Health,Soochow University(215123),Suzhou)
ObjectiveTo provide a scientific survey method and formulae of sample rotation under two-stage sampling,and to offer scientific basis for the relevant departments to set the strategy on radiation protection.MethodsWe derived the statistic formulae with mathematical statistics method.Sample rotation under two-stage sampling was applied to successive survey on the number of white blood cells(WBC)three years.SAS programming to simulate 100 samples was taken to make validity and reliability assessment on the survey method and its statistical formulae.ResultsWe derived the formulae of estimation of population mean,variance and estimated variance for the sample rotation under two-stage sampling.After two-stage sample rotation,population means of nuclear workers′WBC were respectively 5.88 and 5.84(103/mm3)in 2010 and 2011,and corresponding standard errors were respectively 0.247 and 0.255,which were of statistical differences compared with healthy adults.Simulated population means was totally included in 100 population mean 95%confidence intervals.ConclusionSample rotation under two-stage sampling and its formulae have achieved well theoretical and practical significance,which are also of high validity and reliability.For the nuclear workers,numbers of their WBC were lower than healthy adults in 2010 and 2011,which should be paid more attention to.
Two-stage sampling;Sample rotation;Successive survey;Nuclear workers;White blood cells
*:國(guó)家自然科學(xué)基金項(xiàng)目(項(xiàng)目編號(hào):81273188)
△通信作者:高歌,E-mail:gaoge@suda.edu.cn
中國(guó)衛(wèi)生統(tǒng)計(jì)2015年2期