国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

極小樣本兩獨(dú)立定量資料假設(shè)檢驗(yàn)方法比較

2023-08-05 08:01:30郭軼斌李佳迅
關(guān)鍵詞:偏態(tài)置信區(qū)間均數(shù)

郭軼斌,李佳迅,吳 騁,郭 威,何 倩

1.海軍軍醫(yī)大學(xué)衛(wèi)生勤務(wù)學(xué)系軍隊(duì)衛(wèi)生統(tǒng)計(jì)學(xué)教研室(上海 200433)

2.海軍軍醫(yī)大學(xué)基礎(chǔ)醫(yī)學(xué)院(上海 200433)

在基礎(chǔ)醫(yī)學(xué)實(shí)驗(yàn)研究中,研究對(duì)象以細(xì)胞、動(dòng)物為主,一些實(shí)驗(yàn)細(xì)胞或動(dòng)物模型不僅構(gòu)造困難,而且花費(fèi)較大,如巴馬小型豬或恒河猴等,不僅動(dòng)物本身費(fèi)用較高,同時(shí)因倫理限制無法納入太多。因此,部分動(dòng)物實(shí)驗(yàn)的樣本量極小,如每組小于10 例[1-3]。統(tǒng)計(jì)學(xué)上為了保證一定的統(tǒng)計(jì)檢驗(yàn)效率,常要求樣本例數(shù)不能過小。此外,在使用如獨(dú)立樣本t檢驗(yàn)等參數(shù)檢驗(yàn)方法時(shí),還要求樣本服從正態(tài)分布和方差齊性的假設(shè)[4]。但在極小樣本的情況下,即使是不服從正態(tài)分布的樣本,在統(tǒng)計(jì)檢驗(yàn)效率很低的情況下也無法拒絕H0假設(shè)(樣本服從正態(tài)分布或滿足方差齊性)。當(dāng)獨(dú)立定量資料樣本不滿足正態(tài)分布或方差齊性假設(shè)時(shí),可以使用對(duì)數(shù)據(jù)分布不敏感的非參數(shù)檢驗(yàn),對(duì)于兩組獨(dú)立定量資料,可以使用Wilcoxon秩和檢驗(yàn)或Mann-WhitneyU檢驗(yàn)來比較兩個(gè)樣本所代表的總體分布位置是否相同[5-6]。但這兩種方法是將樣本的原始數(shù)據(jù)編秩后再進(jìn)行后續(xù)的假設(shè)檢驗(yàn),當(dāng)資料服從參數(shù)檢驗(yàn)的條件時(shí),會(huì)導(dǎo)致樣本大量變異的信息損失,進(jìn)而影響統(tǒng)計(jì)檢驗(yàn)效率,增加犯Ⅱ類錯(cuò)誤的概率[7]。當(dāng)樣本量小于4 時(shí),使用Wilcoxon 秩和檢驗(yàn)的P值均大于0.05。Siegel 認(rèn)為樣本量小于6 時(shí),不能使用t檢驗(yàn)[8]。祝國強(qiáng)等認(rèn)為在對(duì)非正態(tài)極小樣本的定量資料進(jìn)行統(tǒng)計(jì)推斷時(shí),不適合使用t檢驗(yàn),推薦使用Wilcoxon 秩和檢驗(yàn)[9]。林正大等認(rèn)為在大樣本或偏離對(duì)稱性較遠(yuǎn)的情況下,Wilcoxon 秩和檢驗(yàn)更優(yōu)[10]。對(duì)于統(tǒng)計(jì)學(xué)的頻率學(xué)派來說,假設(shè)檢驗(yàn)和置信區(qū)間(Confidence Interval,CI)是一對(duì)相伴相隨的概念,在同一置信度/檢驗(yàn)水準(zhǔn)下,參數(shù)的置信區(qū)間未跨過拒絕域,假設(shè)檢驗(yàn)則不能拒絕H0。Bootstrap 法是一種可以用來穩(wěn)健地估計(jì)置信區(qū)間的非參數(shù)方法,其通過對(duì)原始樣本數(shù)據(jù)進(jìn)行有放回抽樣得到統(tǒng)計(jì)量的經(jīng)驗(yàn)分布,從而估計(jì)統(tǒng)計(jì)量對(duì)應(yīng)總體參數(shù)的置信區(qū)間[11]。在極小樣本時(shí),Bootstrap 法能否達(dá)到其在大樣本中的穩(wěn)健性,以及該方法估計(jì)的置信區(qū)間的精度也值得進(jìn)一步探索。

本研究采用蒙特卡洛數(shù)據(jù)模擬方法,比較兩獨(dú)立樣本t檢驗(yàn)、Wilcoxon 秩和檢驗(yàn)和Bootstrap 置信區(qū)間法在解決極小樣本兩獨(dú)立定量資料比較中的表現(xiàn),以期為相關(guān)實(shí)驗(yàn)性研究提供方法學(xué)參考。

1 資料與方法

1.1 模擬數(shù)據(jù)的生成

通過蒙特卡洛數(shù)據(jù)模擬方法生成模擬數(shù)據(jù),主要有以下幾個(gè)模擬情景。樣本含量:本研究主要模擬極小樣本量下的統(tǒng)計(jì)方法表現(xiàn)性能,共模擬5 種樣本量——每組各2、3、5、10 和20。均數(shù)差:共設(shè)置5 種均數(shù)差——0、0.5、1、2 和3。從均數(shù)相同的兩總體中抽樣,兩總體均數(shù)差為0,H0成立,且均數(shù)差的置信區(qū)間包含0,認(rèn)為兩樣本來自同一總體,兩組樣本均數(shù)的不同由抽樣誤差造成,當(dāng)統(tǒng)計(jì)檢驗(yàn)方法拒絕H0時(shí)則認(rèn)為發(fā)生I類錯(cuò)誤。當(dāng)兩樣本均數(shù)差不為0 時(shí),兩樣本不是來自同一樣本,若統(tǒng)計(jì)檢驗(yàn)方法未能拒絕H0,則認(rèn)為發(fā)生Ⅱ類錯(cuò)誤。樣本分布:共設(shè)置3 種總體分布,第1 種為兩樣本均服從總體方差為12 的正態(tài)分布,總體均數(shù)根據(jù)均數(shù)差確定(其中一組為0,即第一組的總體為標(biāo)準(zhǔn)正態(tài)分布);第2種(偏態(tài)分布一)為兩樣本服從偏度系數(shù)為1.5,峰度系數(shù)為3.0 的偏態(tài)分布;第3 種(偏態(tài)分布二)為兩樣本服從偏度系數(shù)為1.0,峰度系數(shù)為2.0 的偏態(tài)分布[12]。

對(duì)以上三個(gè)因素的不同水平進(jìn)行全排列構(gòu)建75 種(5 種樣本量×5 種均數(shù)差×3 種總體分布)情景,每種生成10 000 個(gè)模擬數(shù)據(jù)集。

1.2 檢驗(yàn)方法

基于Bootstrap 法估計(jì)均數(shù)差的置信區(qū)間。采用Bootstrap 重抽樣技術(shù)對(duì)模擬數(shù)據(jù)集進(jìn)行1 000次重抽樣構(gòu)建兩樣本均數(shù)差的經(jīng)驗(yàn)分布。通過估計(jì)經(jīng)驗(yàn)分布的第2.5%和第97.5%分位數(shù)確定均數(shù)差的95%CI。當(dāng)95%CI 下限大于0 或上限小于0 時(shí),認(rèn)為兩組均數(shù)差異有統(tǒng)計(jì)學(xué)意義,兩樣本對(duì)應(yīng)的總體均數(shù)不同。

參數(shù)和非參數(shù)假設(shè)檢驗(yàn)法。采用兩獨(dú)立樣本t檢驗(yàn)和Wilcoxon 秩和檢驗(yàn)對(duì)兩總體均數(shù)是否相同進(jìn)行假設(shè)檢驗(yàn)。與Bootstrap 法估計(jì)的95%CI相對(duì)應(yīng),假設(shè)檢驗(yàn)的檢驗(yàn)水準(zhǔn)α=0.05,均為雙側(cè)檢驗(yàn)。

1.3 評(píng)價(jià)標(biāo)準(zhǔn)

在均數(shù)差為0 時(shí),若t檢驗(yàn)和Wilcoxon 秩和檢驗(yàn)的P值小于α,或Bootstrap 法估計(jì)的均數(shù)差95%CI 未跨過0,認(rèn)為發(fā)生I 類錯(cuò)誤。在均數(shù)差不為0 時(shí),以上情形認(rèn)為成功檢驗(yàn)出統(tǒng)計(jì)學(xué)差異,即未發(fā)生Ⅱ類錯(cuò)誤。

分別使用t檢驗(yàn)、Wilcoxon秩和檢驗(yàn)和Bootstrap 置信區(qū)間法對(duì)75 種情景下,每種情景的10 000 個(gè)模擬數(shù)據(jù)集進(jìn)行分析。計(jì)算并比較3 種方法在不同數(shù)據(jù)情景下的I 類錯(cuò)誤發(fā)生率和100%-Ⅱ類錯(cuò)誤發(fā)生率(統(tǒng)計(jì)效率)。

1.4 統(tǒng)計(jì)軟件和硬件

本研究使用的統(tǒng)計(jì)軟件為R 4.1.3,數(shù)據(jù)模擬的平臺(tái)為塔式服務(wù)器,處理器型號(hào)為Intel Xeon Gold 6230,內(nèi)存為384GB。

2 結(jié)果

2.1 I類錯(cuò)誤

大樣本時(shí)I 類錯(cuò)誤的發(fā)生與樣本量無關(guān),其僅與檢驗(yàn)水準(zhǔn)α 有關(guān),但根據(jù)本研究的模擬結(jié)果,t檢驗(yàn)和Wilcoxon 秩和檢驗(yàn)的I 類錯(cuò)誤發(fā)生率均小于檢驗(yàn)水準(zhǔn)(圖1a 和圖1b)。當(dāng)樣本量n=2、n=3 時(shí),Wilcoxon 秩和檢驗(yàn)的I 類錯(cuò)誤發(fā)生率為0。這是由Wilcoxon 秩和檢驗(yàn)方法特性造成的[8]。對(duì)于t檢驗(yàn)來說,極小樣本時(shí)的I 類錯(cuò)誤發(fā)生率小于檢驗(yàn)水準(zhǔn)α,尤其是當(dāng)數(shù)據(jù)分布為本研究設(shè)定的兩種偏態(tài)分布時(shí)更為明顯,這可能與此種情形下不適用t檢驗(yàn)有關(guān)。但Bootstrap 置信區(qū)間法的I 類錯(cuò)誤發(fā)生率較高,當(dāng)數(shù)據(jù)服從正態(tài)分布時(shí),I類錯(cuò)誤發(fā)生率隨著樣本量的增加而下降,當(dāng)數(shù)據(jù)為偏態(tài)分布時(shí),I 類錯(cuò)誤發(fā)生率隨著樣本量的增加而上升(圖1c)。

圖1 三種方法的I類錯(cuò)誤發(fā)生率(%)Figure 1.Type I error rate of three methods (%)

2.2 統(tǒng)計(jì)效率

三種總體分布下(正態(tài)分布、偏態(tài)分布一和偏態(tài)分布二)分別使用三種方法(t檢驗(yàn)、Wilcoxon 秩和檢驗(yàn)和Bootstrap 置信區(qū)間法)的統(tǒng)計(jì)效率分別如圖2a、圖2b 和圖2c 所示。當(dāng)均數(shù)差較小時(shí),無論使用哪種方法,統(tǒng)計(jì)效率都很低,Bootstrap 置信區(qū)間法表現(xiàn)略優(yōu)于另外兩種假設(shè)檢驗(yàn)的方法;當(dāng)均數(shù)差較大時(shí),即使樣本量很小,Bootstrap 置信區(qū)間法仍有較高的統(tǒng)計(jì)效率,說明此時(shí)犯Ⅱ類錯(cuò)誤的概率較低(圖2c)。

圖2 不同情形下三種方法的統(tǒng)計(jì)效率(%)Figure 2.Power of three methods in different scenarios (%)

無論數(shù)據(jù)是否服從正態(tài)分布,當(dāng)樣本量極小時(shí)(n=2、n=3),t檢驗(yàn)的表現(xiàn)優(yōu)于Wilcoxon 秩和檢驗(yàn)。但當(dāng)樣本量較大且均數(shù)差也較大時(shí),t檢驗(yàn)與Wilcoxon 秩和檢驗(yàn)統(tǒng)計(jì)效率差異不大(圖2a、圖2b)。

3 結(jié)論

本研究通過數(shù)據(jù)模擬的方法,探索了采用兩獨(dú)立樣本t檢驗(yàn)、Wilcoxon 秩和檢驗(yàn)和Bootstrap置信區(qū)間法對(duì)極小樣本兩獨(dú)立定量資料進(jìn)行統(tǒng)計(jì)推斷時(shí)統(tǒng)計(jì)效率的差異。由模擬結(jié)果可見,相較于Wilcoxon 秩和檢驗(yàn),t檢驗(yàn)在樣本量極小時(shí)(n=2、n=3)仍有一定的統(tǒng)計(jì)效率,且對(duì)總體數(shù)據(jù)分布不是很敏感。當(dāng)數(shù)據(jù)服從本研究設(shè)定的兩種偏態(tài)分布時(shí),t檢驗(yàn)的表現(xiàn)不差于Wilcoxon 秩和檢驗(yàn)。在樣本量極小時(shí),Bootstrap 置信區(qū)間法可以增加統(tǒng)計(jì)效率,但在兩組樣本均數(shù)差為0(即兩組樣本來自同一總體),且數(shù)據(jù)服從正態(tài)分布時(shí),犯I 類錯(cuò)誤的概率較高。

綜上,根據(jù)本模擬研究結(jié)果,當(dāng)數(shù)據(jù)服從正態(tài)分布時(shí),建議使用t檢驗(yàn)對(duì)極小樣本進(jìn)行統(tǒng)計(jì)推斷;當(dāng)數(shù)據(jù)不服從正態(tài)分布時(shí),建議使用Bootstrap 置信區(qū)間法對(duì)極小樣本進(jìn)行統(tǒng)計(jì)推斷。由于對(duì)于極小樣本統(tǒng)計(jì)效率太低,當(dāng)樣本量極小時(shí),無論數(shù)據(jù)服從何種分布,均不建議使用Wilcoxon 秩和檢驗(yàn)進(jìn)行統(tǒng)計(jì)推斷。

猜你喜歡
偏態(tài)置信區(qū)間均數(shù)
定數(shù)截尾場(chǎng)合三參數(shù)pareto分布參數(shù)的最優(yōu)置信區(qū)間
p-范分布中參數(shù)的置信區(qū)間
多個(gè)偏正態(tài)總體共同位置參數(shù)的Bootstrap置信區(qū)間
考試成績轉(zhuǎn)換成偏態(tài)分布量化成績的算法
列車定位中置信區(qū)間的確定方法
隧穿量子點(diǎn)分子的Wigner-Yanase偏態(tài)信息
關(guān)于均數(shù)與偏差
雙模壓縮真空態(tài)光場(chǎng)作用下耦合雙原子的Wigner-Yanase偏態(tài)信息
關(guān)于均數(shù)與偏差
關(guān)于均數(shù)與偏差
双辽市| 茂名市| 大足县| 双峰县| 仙居县| 察哈| 上高县| 武功县| 集安市| 汝阳县| 平果县| 高台县| 肇州县| 泽州县| 武邑县| 阳泉市| 黑山县| 牙克石市| 松江区| 车致| 旬邑县| 夹江县| 连城县| 梨树县| 类乌齐县| 丘北县| 澄迈县| 元江| 汶上县| 西城区| 株洲市| 稷山县| 邓州市| 渝中区| 秦安县| 河北省| 尤溪县| 随州市| 乐平市| 西丰县| 华亭县|