張建斌
摘要:在科學研究研究中,經(jīng)常會遇到隨機抽樣的問題,利用專業(yè)的統(tǒng)計軟件雖可很好的實現(xiàn),但需要購買專業(yè)軟件和具備專業(yè)知識人員來完成,對基層科研人員難以做到。Excel軟件是一基礎軟件,內(nèi)嵌許多函數(shù),筆者利用Excel函數(shù)編制了單純隨機抽樣模板,很好解決了隨機抽樣問題,為非統(tǒng)計專業(yè)人員提供了一種操作簡單,易學易用方法?,F(xiàn)介紹模板制作的了具體方法,并舉例指出使用方法和注意問題,為今后進一步改進指出方向。
關鍵詞:抽樣;Excel;總體;樣本
中圖分類號:TP317 文獻標識碼:A 文章編號:1009-3044(2017)03-0091-02
單純隨機抽樣也稱簡單隨機抽樣,是最簡單、最基本的抽樣方法。從總體N個對象中,通過逐個抽取的方法從中抽取一個樣本,且每次抽取時各個對象被抽到的概率相等,則這樣的抽樣方法叫做簡單隨機抽樣。常用的抽樣形式利用抓鬮、隨機數(shù)字表,也可以利用統(tǒng)計軟件來實現(xiàn)。但前者操作簡單,但總體含量大,不太容易實現(xiàn);而后者操作起來簡單,但必須擁有專業(yè)統(tǒng)計軟件及掌握相應操作技能。本人利用Excel編制了隨機抽樣模板,并在流行病學調(diào)查中得到應用?,F(xiàn)介紹如下:
1 簡單隨機抽樣模板制作原理:
1)對N條研究總體記錄,從1到N編號;2)利用隨機函數(shù)給對應標號賦給隨機數(shù)字;3)對隨機數(shù)從高到低排序生成相應的序號;4)根據(jù)需要樣本的多少,從總體記錄中從排序中由高到低的原則依次取出相應的記錄。
2 簡單隨機抽樣模板的制作:
本模板主要由三張工作表組成:分別定義為抽樣表、總體表和樣本表,下面按總體為1000條記錄內(nèi),介紹每張表的編制方法和作用。
1)抽樣表,在A1寫出“總體記錄數(shù)”,A2空出備填總體記錄個數(shù);B2填編號,在B3填入函數(shù)“=IF((ROW(B3)-2)<=$A$2,(ROW(B3)-2)," ")”,把B3公式拷貝到B4到B1002,根據(jù)總體個數(shù)自動生成1000之內(nèi)的編碼;在C2填隨機數(shù)字,在C3單元格填入公式” =IF(B3<>" ",RAND()," ")” ,把C3公式拷貝到C4到C1002,實現(xiàn)在C3:C1002自動生成0-1間的隨機數(shù);在D2輸入“隨機數(shù)位次”,在D3填入公式“=IF(C3<>" ",RANK(C3,$C$3:$C$1002)," "),把D3公式拷貝到D4到D1002,實現(xiàn)對C3:C1002單元格的隨機數(shù)自動排序,排序結果在D列顯示;再在E2填編號,在E3填入函數(shù)“=IF((ROW(E3)-2)<=$A$2,(ROW(E3)-2)," ")”,便于看樣本編碼;在F2單元格鍵入“=IF(ISBLANK(總體!A1)," ",總體!A1)”,將此公式向右拖放至IV2,向下拖放致IV1002,能使F2:IV1002存放字段在250以內(nèi)1000條記錄。
2)總體表:本表存放總體記錄,要求第一行存放字段名稱,從第二行開始放第一條記錄,以便由抽樣表調(diào)用數(shù)據(jù)。
3)樣本表編制:在在A1輸入“樣本記錄數(shù)”;A2空出備填樣本記錄數(shù); B2鍵入樣本編號,B3鍵入公式“=IF((ROW(B3)-2)<=$A$2,MATCH(抽樣表!E3,抽樣表!$D$3:$D$1002,0)," "),把此公式向下拖至B1002,實現(xiàn)根據(jù)樣本大小,抽出相應隨機數(shù)大的記錄編號;在C2鍵入編號排序,在C3錄入公式” =IF(B3=" "," ",SMALL($B$3:$B$1002,ROW(B3)-2))” ,下拉至C1003,實現(xiàn)抽到樣本編號由小到大排序;在D1鍵入樣本,D2鍵入公式“=IF(ISBLANK(抽樣表!F2)," ",抽樣表!F2)”,向右拖至IT2,用來存放樣本記錄字段。D3鍵入“=IF(D$2=" "," ",IF(C3<>" ",OFFSET(抽樣表!F$2,樣本!$C3,0)," "))”,把公式向右和向下拖復制到D3:IT1002
實現(xiàn)完整顯示樣本記錄信息。
3 實例
例如 現(xiàn)要從住院號為2008001-2008030妊娠分娩數(shù)據(jù)30條記錄中,利用簡單隨機抽取3條進行研究。如何實現(xiàn)。
3.1 把總體原始數(shù)據(jù)復制到總體表1中。
3.2 切換到抽樣表,在A2鍵入30,即可見到如下表。
表2 抽樣表調(diào)用總體表數(shù)據(jù)及抽樣賦值
3.3 切換到樣本表,在A2鍵入“3”,即得到如下樣本信息。
4 結束語
1)本模板利用傳統(tǒng)軟件制作,操作簡單,易學易用,特別適用于沒用正版專業(yè)統(tǒng)計軟件,抽樣總體有不太大的情況使用。避免了利用抓鬮等原始方法抽樣,需要重新整理數(shù)據(jù)庫的繁瑣工作,在本單位科學研究中得到很好的應用。
2)對于Excel操作不夠熟練的人員,對模板中含公式和函數(shù)的單元格鎖定和隱藏,只需把總體按要求放入總體sheet,在抽樣sheet中填好總體數(shù),樣本sheet中填好樣本量,即可得到所抽樣本信息。
3)本模板在相同的抽樣比例多次抽樣,不能得到相同的樣本信息,也就是樣本信息不可重現(xiàn);同時抽到樣本時,需要利用復制和選擇性粘貼固定信息,這一值得今后改進的地方。
參考文獻:
[1] 于傳華. Excel統(tǒng)計分析與電腦實驗[M]. 北京:電子工業(yè)出版社,2009: 60-61.
[2] 李立明. 流行病學[M]. 7版.北京:人民衛(wèi)生出版社,2007: 46-47.
[3] 陳青山, 鐘倩紅, 林佩賢, 等. 在Excel中完成實驗對象的隨機化分組[J]. 中國衛(wèi)生統(tǒng)計, 2009, 26(3): 296.