国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

簡單隨機(jī)抽樣的一個注記

2021-07-09 10:02:30董俊超
大學(xué)數(shù)學(xué) 2021年3期
關(guān)鍵詞:等價(jià)總體概率

董俊超

(煙臺大學(xué) 數(shù)學(xué)與信息科學(xué)學(xué)院, 山 煙臺264005)

1 引 言

簡單隨機(jī)抽樣是抽樣調(diào)查課程中最簡單的一種抽樣方法,因?yàn)槠湓趯?shí)踐中操作簡單,所以使用最為廣泛.關(guān)于它的定義一般有兩個:一個是基于全樣本過程(whole sample procedure)的抽樣(見下文定義1),另一個是基于逐個抽取不放回過程(draw-by-draw without replacement procedure)的抽樣(見下文定義2).關(guān)于這兩個定義的關(guān)系, 國內(nèi)一般的教科書及一些專著,比如馮士雍等[1],杜子芳[2],孫山澤[3]的著作中都略有論述.本文的目的則是更詳盡地討論它們的關(guān)系,說明在一定意義下,它們是等價(jià)的;在另外的意義下,它們是不等價(jià)的;同時(shí)指出也可以有其它的方法來實(shí)現(xiàn)簡單隨機(jī)抽樣.

另外需要指出的一點(diǎn)是,在一般的《數(shù)理統(tǒng)計(jì)》教課書中所說的抽樣方法是放回的簡單隨機(jī)抽樣,而在抽樣調(diào)查課程中所說的抽樣方法要多很多.現(xiàn)在越來越多的人都在用抽樣調(diào)查的方法來研究實(shí)際問題,比如孫華娟等[4],胡良劍等[5]就用抽樣調(diào)查方法來研究問題.

2 變概率抽樣可作為簡單隨機(jī)抽樣的例子

為了下面敘述的方便,把馮士雍等[1]著作中的定義敘述如下:

定義2[1]從總體的N個單元中,逐個不放回地抽取單元,每次抽取到尚未在樣本(未入樣)中的任何一個單元的概率都相等,直到抽足n個單元為止,這樣所得的n個單元組成一個簡單隨機(jī)樣本.

為了區(qū)分定義1與定義2,不妨稱定義1中的簡單隨機(jī)抽樣為基于全樣本過程(whole sample procedure)的簡單隨機(jī)抽樣;定義2中的簡單隨機(jī)抽樣為基于逐個抽取不放回過程(draw-by-draw without replacement procedure)的簡單隨機(jī)抽樣.

一般的統(tǒng)計(jì)學(xué)課程中考慮的是無序樣本,只要樣本的分布是一樣的,這樣的抽樣就認(rèn)為是等價(jià)的.因此從這個意義上講,由于基于全樣本過程(whole sample procedure)的簡單隨機(jī)抽樣(定義1)與基于逐個抽取不放回過程(draw-by-draw without replacement procedure)的簡單隨機(jī)抽樣(定義2)所得的樣本分布是一樣的,可以說這兩個定義是等價(jià)的.這個在在馮士雍等[1]中已有說明.

但是從另外意義上來講,抽樣調(diào)查不僅要考慮樣本的分布,還要考慮抽樣過程的設(shè)計(jì),因?yàn)槔贸闃舆^程所包含的信息可以設(shè)計(jì)出更好的估計(jì)量.這個在著作[1]中的第五章中就有論述,更詳盡的論述可參看MURTHY[6]及DES R[7].定義1得到的是一個無序樣本,它只說明了最終的樣本分布,而不包含抽樣的過程;而定義2得到的是一個有序樣本(盡管我們不考慮它的順序),它不僅包含抽樣的過程,還有與定義1有相同的樣本分布.定義2包含的信息比定義1包含的信息要多,所以在這個意義下,不能說定義1與定義2是等價(jià)的.

為了更清楚地說明這一點(diǎn), 不妨借助于變概率抽樣(varying-probability sampling) 這個概念來說明變概率抽樣也可以實(shí)現(xiàn)定義1中的簡單隨機(jī)抽樣.關(guān)于變概率抽樣,文獻(xiàn)中并沒有給出精確的說法, 只有一個比較籠統(tǒng)的說法,比如在戈文達(dá)拉玉盧[8]中略有介紹.為了下面說話方便, 給出一個精確性的定義:

定義3在由N個單元組成的總體中,逐個從總體當(dāng)中抽取單元(可以是放回抽樣也可以是不放回抽樣);如果至少有一次在抽取尚未在樣本中的單元時(shí),它們被抽到的概率不都相等,直到抽足n個單元為止,則這樣的一種抽樣方法稱為變概率抽樣(varying-probability sampling).

定義3實(shí)際上就是與定義2相對立的概念, 即不滿足定義2的概念我們稱為定義3(在不放回抽樣時(shí)). 下面將說明,變概率抽樣也可以滿足定義1.

用pi表示逐個抽樣抽取第一個樣本單元時(shí),第i個單元被抽到的概率;用pj|i表示抽取第二個樣本單元時(shí),在第1次抽到第i個單元的條件下第2次抽到第j個單元時(shí)的概率;其它記號以此類推.

現(xiàn)考慮一個從由N=4個單元組成的總體中,抽取容量為n=2的一個樣本,pi及pj|i(i,j=1,2,3,4;i≠j)的定義分別見表1及表2.

表1 pi的值

表2 pj|i的值

顯然上面定義的抽樣是一個變概率抽樣,因?yàn)闊o論是抽取第1個樣本單元還是抽取第2個樣本單元,抽取它們的概率并不都相等;現(xiàn)計(jì)算任意一個樣本{i,j}被抽中的概率p(i,j):

p(i,j)=pipj|i+pjpi|j,i≠j;i,j=1,2,3,4.

分別計(jì)算之,比如

注1 定義2只是定義1的一個實(shí)現(xiàn);變概率抽樣也可以是定義1的一個實(shí)現(xiàn).

3 進(jìn)一步的討論

對于抽樣設(shè)計(jì),除了前面提到的全樣本方法(whole sample procedure),逐個抽取不放回方法(draw-by-draw without replacement procedure)外;還有逐個抽取放回方法(draw-by-draw with replacement procedure).逐個抽取放回抽樣也可以實(shí)現(xiàn)定義1的簡單隨機(jī)抽樣,見SAMPFORD M R[9], 不再討論.

表3 總體容量N=6樣本容量n=3的一個抽樣分布

π12=P{1,2,3}+P{1,2,4}+P{1,2,5}+P{1,2,6}=0.04+0.03+0.04+0.09=0.2,

注2 不等概率抽樣(定義4)也可以有與滿足定義1抽樣一樣的性質(zhì)(限于一階矩及二階矩).

由此,不妨給出簡單隨機(jī)抽樣的更具一般性的(廣義)定義:

4 結(jié)束語

本文給出了變概率抽樣(定義3)以及廣義簡單隨機(jī)抽樣(定義5)的定義.指出了不僅基于逐個抽取不放回過程(draw-by-draw without replacement procedure)的簡單隨機(jī)抽樣(定義2)可以實(shí)現(xiàn)基于全樣本過程(whole sample procedure)的簡單隨機(jī)抽樣(定義1),而且變概率抽樣(定義3)也可以實(shí)現(xiàn)基于全樣本過程(whole sample procedure)的簡單隨機(jī)抽樣(定義1);基于一階矩及二階矩,不等概率抽樣(定義4)也可以實(shí)現(xiàn)基于全樣本過程(whole sample procedure)的簡單隨機(jī)抽樣(定義1).但變概率簡單隨機(jī)抽樣在實(shí)際當(dāng)中很難操作,它只是一個理論結(jié)果,實(shí)際當(dāng)中的簡單隨機(jī)抽樣還是用定義2所確定的簡單隨機(jī)抽樣.本文的結(jié)論只是對簡單隨機(jī)抽樣理論的一個補(bǔ)充,希望對有關(guān)人員有所裨益.

致謝作者非常感謝審稿專家提出的寶貴意見,使得本文的論述更加清晰,準(zhǔn)確.

猜你喜歡
等價(jià)總體概率
第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
第6講 “統(tǒng)計(jì)與概率”復(fù)習(xí)精講
概率與統(tǒng)計(jì)(二)
概率與統(tǒng)計(jì)(一)
用樣本估計(jì)總體復(fù)習(xí)點(diǎn)撥
2020年秋糧收購總體進(jìn)度快于上年
外匯市場運(yùn)行有望延續(xù)總體平穩(wěn)發(fā)展趨勢
中國外匯(2019年6期)2019-07-13 05:44:06
n次自然數(shù)冪和的一個等價(jià)無窮大
中文信息(2017年12期)2018-01-27 08:22:58
直擊高考中的用樣本估計(jì)總體
收斂的非線性迭代數(shù)列xn+1=g(xn)的等價(jià)數(shù)列
郸城县| 灵宝市| 涞源县| 大连市| 孟村| 古浪县| 赤壁市| 平和县| 浪卡子县| 讷河市| 哈巴河县| 九龙坡区| 睢宁县| 临清市| 衡东县| 祁阳县| 澄江县| 青龙| 富蕴县| 龙胜| 南溪县| 广水市| 玉山县| 盱眙县| 安平县| 通江县| 牡丹江市| 开鲁县| 凤凰县| 仪征市| 五华县| 乌兰县| 肇庆市| 财经| 霍林郭勒市| 永靖县| 孝义市| 嘉禾县| 鹿邑县| 上虞市| 泸水县|