張惠風(fēng) 揭著業(yè) 唐欣然 陳平雁
2.1.1.5 多分類樣本率(單組構(gòu)成比)的χ2檢驗(yàn)
方法:本文所述的多分類樣本率的χ2檢驗(yàn)實(shí)質(zhì)上是指樣本構(gòu)成比與總體構(gòu)成比的 χ2檢驗(yàn)。Lachin(1977)〔4〕提出的此類資料的樣本量估計(jì)是建立在非中心的χ2分布基礎(chǔ)上的。其檢驗(yàn)效能的計(jì)算公式為:
式中,c為分類數(shù);Δ2為效應(yīng)量,nΔ2為非中心參數(shù);χ2(x,df,np)是非中心χ2分布的累積分布函數(shù)。Δ2的計(jì)算公式如下,
式中,π0i為原假設(shè)下(總體)第 i類的構(gòu)成比,π1i為備擇假設(shè)下(樣本)第i類的構(gòu)成比;值得注意的是,這里假設(shè)每類的樣本量n相等。樣本量可以通過逼近的方法求得。
【例2-5】某研究欲比較某醫(yī)院感染病例三類病原菌(G+菌、G-菌和真菌)的比例與一般醫(yī)院有無差異,根據(jù)已有的研究報(bào)道,一般醫(yī)院感染病例中三類病原菌的分布為 G+菌(35%)、G-菌(50%)、真菌(15%),假設(shè)通過預(yù)調(diào)查獲得某醫(yī)院感染病例的三類病原菌分布為 G+菌(31.2%)、G-菌(57.6%)、真菌(11.2%),試估計(jì)檢驗(yàn)效能為80%所需的樣本量。
nQuery Advisor7.0實(shí)現(xiàn):設(shè)定檢驗(yàn)水準(zhǔn)α=0.05;檢驗(yàn)效能取1-β=80%。已知 c=3,總體構(gòu)成比為0.35、0.50、0.15;預(yù)期的總體構(gòu)成比為 0.312、0.576、0.112。在nQuery Advisor7.0主菜單選擇:
Goal:Make Conclusion Using:⊙Proportions
Number of Groups:⊙One
Analysis Method:⊙Test
方法框中選擇:Chi-square test of specified proportions in C categories。
注意,這里首先應(yīng)根據(jù)總體和樣本構(gòu)成比對效應(yīng)量Δ2進(jìn)行估計(jì),在菜單欄中選擇:
Assistants:⊙Compute Effect Size
彈出輔助計(jì)算窗口。依據(jù)上述基礎(chǔ)數(shù)據(jù),總體構(gòu)成比為 0.350,0.500,0.150,樣本構(gòu)成比為 0.312,0.576,0.112,在彈出的計(jì)算窗口將各參數(shù)值鍵入,如圖2-10所示,結(jié)果為Δ2=0.025。
點(diǎn)擊Transfer后,將所計(jì)算參數(shù)傳輸至樣本量估計(jì)窗口,如圖2-11所示,結(jié)果為n=381。
圖2-10 nQuery Advisor7.0關(guān)于例2-5樣本量估計(jì)中效應(yīng)量的計(jì)算
圖2-11 nQuery Advisor7.0關(guān)于例2-5樣本量估算的參數(shù)設(shè)置與計(jì)算結(jié)果
圖2-12 SAS9.2關(guān)于例2-5樣本量估計(jì)的參數(shù)設(shè)置與計(jì)算結(jié)果
2.1.2 等效性/非劣性檢驗(yàn)
2.1.2.1 配對設(shè)計(jì)一致率的等效性檢驗(yàn)
方法:Tango(1998)〔5〕根據(jù)正態(tài)近似法提出該檢驗(yàn)的樣本量估計(jì)方法,公式如下:
式中,s在nQuery Advisor7.0軟件中默認(rèn)為1,即單側(cè)檢驗(yàn);η為結(jié)果不一致的對子數(shù)占總對子數(shù)的比例,其含義見表2-1;Δ0為等效性界值,即應(yīng)用方面可以接受的試驗(yàn)組與對照組總體陽性率的差值;Δ1為預(yù)期兩個(gè)總體陽性率之差,等效性檢驗(yàn)通常取Δ1=0,但Δ1也可以不取0;相應(yīng)的檢驗(yàn)效能由上述公式反推求得。
【例2-6】某臨床試驗(yàn)欲采用配對設(shè)計(jì),證實(shí)一種新的較廉價(jià)的某疾病的診斷方法其靈敏度與現(xiàn)有標(biāo)準(zhǔn)診斷方法等效。已知現(xiàn)有標(biāo)準(zhǔn)診斷方法的靈敏度為85%,假設(shè)新診斷方法的靈敏度預(yù)期為85%,兩種診斷方法都為陽性結(jié)果的比例占80%,臨床應(yīng)用的等效界值為5%,那么當(dāng)檢驗(yàn)效能為85%時(shí)所需的樣本量是多少?
nQuery Advisor 7.0實(shí)現(xiàn):設(shè)定單側(cè)檢驗(yàn)水準(zhǔn)α=0.025;檢驗(yàn)效能取1-β=85%。依題意可知,Δ0=ΔT-ΔS= -0.05,Δ1=0.85-0.85=0,兩種診斷結(jié)果均為陽性的比例為80%,可得到表2-1數(shù)據(jù),由此推算出結(jié)果不一致的對子占總對子數(shù)的比例為η=0.05+0.05=0.10。
在nQuery Advisor7.0主菜單選擇:
Goal:Make Conclusion Using:⊙Proportions
Number of Groups:⊙One
Analysis Method:⊙Equivalence
表2-1 例2-6所形成的數(shù)據(jù)
方法框中選擇:Paired responses:Equivalence of proportions。
在彈出的樣本量估計(jì)窗口將各參數(shù)值鍵入,如圖2-13所示,結(jié)果為 n=360。需要指出,若 Δ1取0,則Δ0的符號(hào)可以忽略;否則Δ0的符號(hào)就非常重要了,一定要定義好差值的方向。
圖2-13 nQuery Advisor7.0關(guān)于例2-6樣本量估計(jì)的參數(shù)設(shè)置與計(jì)算結(jié)果
圖2-14 SAS9.2關(guān)于例2-6樣本量估計(jì)的參數(shù)設(shè)置與計(jì)算結(jié)果
2.1.2.2 配對設(shè)計(jì)基于非劣效下限的檢驗(yàn)(試驗(yàn)組-對照組)
方法:Newcombe(1988)〔6〕提出的配對設(shè)計(jì)的二分類數(shù)據(jù)的等效性或非劣性驗(yàn)證的樣本量估計(jì)是基于可信區(qū)間的方法,通過模擬實(shí)現(xiàn)的。首先模擬產(chǎn)生四格表資料,然后使用Newcombe-Wilson score的連續(xù)校正方法計(jì)算每一次模擬數(shù)據(jù)的可信區(qū)間,如果該區(qū)間落在事先確定的等效或非劣效區(qū)間內(nèi),則記為成功,總的成功次數(shù)除以總的模擬次數(shù)所得的就是所需要的檢驗(yàn)效能。非劣效下限檢驗(yàn)用于非劣效驗(yàn)證中試驗(yàn)組的陽性率雖低于對照組但其差異不大于某一界值的設(shè)計(jì)。
四格表的產(chǎn)生及資料形式見表2-2,這里π11表示對照組和實(shí)驗(yàn)組均為陽性事件的概率,頻數(shù)為e,π10表示對照組陽性而實(shí)驗(yàn)組陰性的概率,頻數(shù)為f,π01表示對照組陰性而實(shí)驗(yàn)組陽性的概率,頻數(shù)為g,π00表示對照組和實(shí)驗(yàn)組均為陰性事件的概率,頻數(shù)為h。首先,使用二項(xiàng)分布隨機(jī)數(shù)產(chǎn)生對照組成功的一列n1,參數(shù)為n和π11+π10,對照組不成功為n-n1;再使用二項(xiàng)隨機(jī)數(shù)產(chǎn)生e,參數(shù)為先前產(chǎn)生的n1和π11/(π11+π10);f=n1-e;其他的類似。
表2-2 四格表的產(chǎn)生及資料形式*
Newcombe-Wilson Score非連續(xù)校正可信區(qū)間的計(jì)算公式:區(qū)間從L=^θ-δ到U=^θ+ε,其中,
Newcombe-Wilson Score連續(xù)性校正可信區(qū)間:在非連續(xù)性校正可信區(qū)間基礎(chǔ)上對^θ進(jìn)行校正,如果eh>fg,^θ的分子等于max(eh-fg-n/2,0)。
配對設(shè)計(jì)基于非劣效下限的檢驗(yàn)效能:對于每個(gè)模擬出來的四格表,運(yùn)用Newcombe-Wilson Score方法求出的可信區(qū)間下限大于事先設(shè)定的區(qū)間下限,就算成功1次,總的成功次數(shù)除以總的模擬次數(shù)所得的就是檢驗(yàn)效能。
【例2-7】某臨床試驗(yàn)欲采用配對設(shè)計(jì)非劣效驗(yàn)證。已知現(xiàn)有標(biāo)準(zhǔn)診斷方法的準(zhǔn)確度為85%,假設(shè)新診斷方法的準(zhǔn)確度預(yù)期為85%,兩種診斷方法不一致的對子占總對子的比例η為0.1,臨床認(rèn)可的非劣效界值為8%,那么當(dāng)檢驗(yàn)效能分別為80%和90%時(shí)所需的樣本量是多少?
nQuery Advisor7.0實(shí)現(xiàn):非劣效驗(yàn)證采用單側(cè)檢驗(yàn),設(shè)定檢驗(yàn)水準(zhǔn)α=0.025;檢驗(yàn)效能1-β=90% 。非劣效界值Δ0為-0.08,預(yù)期的率差Δ1為0。種子設(shè)為1000,模擬次數(shù)為10000次。在 nQuery Advisor7.0主菜單選擇:
方法框中選擇:Paired responses:Equivalence of Proportions。
在彈出的樣本量估計(jì)窗口將各參數(shù)值鍵入,如圖2-15所示,當(dāng)檢驗(yàn)效能為80%時(shí)樣本量為140;檢驗(yàn)效能為90%時(shí)樣本量為182。
圖2-15 nQuery Advisor7.0關(guān)于例2-7樣本量估計(jì)的參數(shù)設(shè)置與計(jì)算結(jié)果
SAS 運(yùn)行結(jié)果:
SAS9. 2 模擬結(jié)果和nQuery Advisor7. 0 稍有偏差,這可能是由于兩種軟件在模擬過程隨機(jī)數(shù)發(fā)生機(jī)制不同所導(dǎo)致。
圖2-16 SAS9.2關(guān)于例2-7樣本量估計(jì)的參數(shù)設(shè)置與計(jì)算結(jié)果
2.1.2.3 配對設(shè)計(jì)基于非劣效上限的檢驗(yàn)(試驗(yàn)組-對照組)
方法:將上述的配對設(shè)計(jì)基于非劣效下限檢驗(yàn)的估計(jì)方法由下限改為上限,就是配對設(shè)計(jì)基于非劣效上限檢驗(yàn)的樣本量估計(jì)方法,這里就不贅述。
2.1.2.4 配對設(shè)計(jì)雙單側(cè)等效性檢驗(yàn)(試驗(yàn)組-對照組)
方法:將配對設(shè)計(jì)基于非劣效下限檢驗(yàn)和上限檢驗(yàn)的樣本量估計(jì)結(jié)合在一起就是所謂的雙單側(cè)等效性檢驗(yàn)的樣本量估計(jì)。概括而言,對于每個(gè)模擬出來的四格表,如果運(yùn)用Newcombe-Wilson Score方法求出的置信區(qū)間在我們事先設(shè)定的區(qū)間內(nèi),就算成功1次,總的成功次數(shù)除以總的模擬次數(shù)得到的就是檢驗(yàn)效能。
【例2-8】以例2-6為例,應(yīng)用Newcombe-Wilson Score方法估計(jì)樣本量。
nQuery Advisor7.0實(shí)現(xiàn):等效性驗(yàn)證采用雙單側(cè)檢驗(yàn),設(shè)定每個(gè)單側(cè)的檢驗(yàn)水準(zhǔn)α=0.025,即對應(yīng)的可信區(qū)間范圍為97.5%;檢驗(yàn)效能1-β=85%,非劣效界值的下限為-5%,上限為5%。
在nQuery Advisor7.0主菜單選擇:
Goal:Make Conclusion Using:⊙Proportions
Number of Groups:⊙One group
Analysis Method:⊙Equivalence
方法框中選擇:Paired responses:Equivalence of Proportions(using Confidence Interval)。
在彈出的樣本量估計(jì)窗口將各參數(shù)值鍵入,如圖2-17所示,求得樣本量為569例。需要指出,例2-6應(yīng)用正態(tài)逼近方法求得的樣本量為360例,兩種方法所得結(jié)果的差距較大,我們將對此問題進(jìn)行深入研究,盡早給出這一問題的研究結(jié)論。
SAS9.2軟件實(shí)現(xiàn):
圖2-17 nQuery Advisor7.0關(guān)于例2-8樣本量估計(jì)的參數(shù)設(shè)置與計(jì)算結(jié)果
圖2-18 SAS9.2關(guān)于例2-8樣本量估計(jì)的參數(shù)設(shè)置與計(jì)算結(jié)果