谷恒明,胡良平,2*
(1.軍事醫(yī)學科學院生物醫(yī)學統(tǒng)計學咨詢中心,北京 100850;2.世界中醫(yī)藥學會聯(lián)合會臨床科研統(tǒng)計學專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu812@sina.com )
?
試驗設計類型之無法考察交互作用的多因素設計:隨機區(qū)組設計與拉丁方設計
谷恒明1,胡良平1,2*
(1.軍事醫(yī)學科學院生物醫(yī)學統(tǒng)計學咨詢中心,北京 100850;2.世界中醫(yī)藥學會聯(lián)合會臨床科研統(tǒng)計學專業(yè)委員會,北京 100029*通信作者:胡良平,E-mail:lphu812@sina.com )
本文目的是介紹兩種無法考察交互作用的多因素設計類型,即隨機區(qū)組設計與拉丁方設計。通過詳細介紹與前述兩種設計類型對應的“主要內(nèi)容”“操作方法”和“設計變形”,全面展示了這兩種設計類型的核心內(nèi)容、要領(lǐng)和注意事項,為用戶正確、合理地選用前述的兩種設計類型創(chuàng)造了有利的條件。
交互作用;隨機區(qū)組設計;拉丁方設計;交叉設計;嵌套設計
1.1 攜帶式與統(tǒng)籌式多因素設計的區(qū)別
攜帶式多因素設計,就是以一個單因素K(≥2)水平設計為“骨架”,記錄各組受試對象所有重要非試驗因素的取值。臨床科研中絕大多數(shù)都采用此種多因素設計類型[1-4]。
所謂統(tǒng)籌式多因素設計,就是在試驗研究開始之前,就決定了多個試驗因素及其水平,并依據(jù)一定原理(如因素水平全面組合或正交性或均勻性或優(yōu)良性),將全部擬同時考察的試驗因素進行合理布局,以表格的形式呈現(xiàn)出各試驗點(即各因素分別取什么水平的一種特定試驗條件)是如何組合的。如析因設計、正交設計、均勻設計、組合設計、最優(yōu)設計等[5-10]。
上述兩類多因素設計之間的區(qū)別在于:
攜帶式多因素設計屬于“順水推舟”,其結(jié)果準確與否,取決于樣本含量。當樣本含量足夠大時,其結(jié)論的可信度比較高。其優(yōu)點是:可以同時記錄的影響因素非常多且不需要事先為其設定具體的水平,靈活方便、適用面寬;其缺點是:需要的樣本含量非常大且要求樣本對于總體的代表性非常好,不能明確得出哪些非試驗因素或區(qū)組因素與充當“骨架”的那個單因素在什么樣的水平組合下,試驗效果最好。
統(tǒng)籌式多因素設計屬于“主動作為”,其結(jié)果準確與否,取決于設計者對試驗因素及其交互作用有關(guān)信息把握的精準程度以及所選取的設計類型是否合適。其優(yōu)點是:能主動駕馭多個試驗因素及其交互作用,所需要的樣本含量相對較少,結(jié)果及預測結(jié)果的精確度較高;其缺點是:在樣本含量相對較小的情況下,不能精準估計試驗因素之間高階交互作用的效應大小。
1.2 何為交互作用
所謂因素之間的交互作用,就是一個因素各水平對評價指標影響不是恒定的,而是隨著另一個因素的水平改變而變化(或多個因素的水平組合所處的具體的特定條件的改變而改變)。舉一個通俗的例子:假定用不同種類的藥物(設為A藥與B藥)治療某病患者時,發(fā)現(xiàn)對男性患者而言,A藥的療效優(yōu)于B藥,而對女性患者而言,A藥的療效劣于B藥。在這種情況下,就說“藥物種類”與“患者性別”之間存在不可忽視的交互作用。
1.3 無法考察交互作用的多因素設計類型種類
在一個試驗研究項目中,同時考察的因素數(shù)目≥2時,就屬于多因素試驗研究。如何進行多因素設計,關(guān)鍵在于是否需要考察交互作用。若需要考察,考察哪些交互作用??疾斓慕换プ饔庙椩蕉唷⒔换プ饔玫碾A數(shù)越高,對應的多因素設計類型就越復雜。一般來說,試驗因素與區(qū)組因素之間的交互作用可以忽略不計,但在樣本含量允許的條件下,最好先采取可以估計交互作用效應的統(tǒng)計模型對試驗數(shù)據(jù)進行統(tǒng)計分析,依據(jù)初步統(tǒng)計分析結(jié)果決定是否需要在最終的統(tǒng)計分析模型中考慮交互作用項。
無法考察交互作用的多因素設計類型有如下幾種:無重復試驗的隨機區(qū)組設計、無重復試驗的平衡不完全隨機區(qū)組設計、無重復試驗的拉丁方設計、無重復試驗的正交拉丁方設計、交叉設計、嵌套(或系統(tǒng)分組)設計,本文只介紹隨機區(qū)組設計與拉丁方設計。
2.1 無重復試驗的隨機區(qū)組設計
2.1.1 問題與設計架構(gòu)
【例1】 某研究者以小白鼠為受試對象,研究3種抗癌藥物(A藥、B藥和C藥)對其肉瘤的抑瘤療效,所做的試驗安排和得到的試驗結(jié)果見表1。問:這是什么試驗設計類型?具體的操作方法是什么?
表1 不同藥物作用后小白鼠肉瘤重量
注:表中“X”代表待測定的肉瘤重量
2.1.2 無重復試驗的隨機區(qū)組設計及有關(guān)重要內(nèi)容
表1的設計被稱為無重復試驗隨機區(qū)組設計或無重復試驗配伍組設計。該設計的特點是:可以考察一個試驗因素和一個單純型(只涉及一個重要非試驗因素)或復合型(由多個重要非試驗因素水平全面組合而成)區(qū)組因素(即重要非試驗因素)對評價指標的影響。該設計的要求是:試驗因素與區(qū)組因素之間的交互作用可以忽略不計。該設計與單因素K(≥2)水平設計的區(qū)別是:它比單因素K(≥2)水平設計多考察了一個區(qū)組因素,而且,在對受試對象進行分組時,它以分層隨機化取代了單因素K(≥2)水平設計時采用的“完全隨機化”。
2.1.3 無重復試驗的隨機區(qū)組設計的具體操作方法
第1步:由研究者確定試驗因素的名稱和具體水平(如本例,試驗因素的名稱為抗癌藥物種類,其有3個水平,分別為A藥、B藥和C藥)。
第2步:根據(jù)藥物性質(zhì)和研究目的,確定受試對象的種類,制訂納入和排除標準,此處從略。在本例中,假定有根據(jù)地選定了小白鼠作為受試對象,并制訂出了嚴格的納入和排除標準。
第3步:根據(jù)文獻資料或預試驗結(jié)果估算出所需要的最少樣本含量,在本例中,假定經(jīng)過計算總共需要15只小白鼠。
第4步:假定由基本常識和專業(yè)知識得知,小白鼠的原始體重可能對抗癌藥物的療效有較大的影響,于是,擬將“小白鼠體重分組”作為一個單純型區(qū)組因素。先將15只染有肉瘤的小白鼠按體重大小形成5個區(qū)組,使每個區(qū)組內(nèi)的3只小白鼠體重最接近。
第5步:隨機決定每個區(qū)組中的3只小白鼠接受3種藥物中的一種藥物治療,即在每個區(qū)組內(nèi)對小白鼠進行隨機分組(必須確保每個藥物組都可以被分配到相同數(shù)目的小白鼠)。
第6步:以肉瘤的重量為指標,在標準操作規(guī)程指導下并實時精準地進行嚴格的質(zhì)量控制,確保給藥方法規(guī)范、觀察和測定的方法與時間統(tǒng)一,從而獲得原始、精準的試驗結(jié)果。
第7步:將測自每個區(qū)組、每種藥物條件下的那只小白鼠的“肉瘤重量數(shù)值”準確地填寫入表1中相應位置上去,最終的試驗結(jié)果見表2。
表2 不同藥物作用后小白鼠肉瘤重量
2.1.4 隨機區(qū)組設計的變形
第1種情形:區(qū)組因素為“窩別”,這是以動物為受試對象開展試驗研究的優(yōu)勢,因為以“窩別”為區(qū)組因素,可以有效地控制“遺傳因素”對評價指標的影響,更好地顯露試驗因素不同水平之間的差別。
第2種情形:可以構(gòu)造出“具有重復試驗的隨機區(qū)組設計”。在例1中,若各體重組中有6只小白鼠,于是,可將每個區(qū)組中的6只小白鼠隨機均分入3個藥物組中去,這樣就構(gòu)造出“具有2次重復試驗的隨機區(qū)組設計”。顯然,對試驗資料進行方差分析時,誤差項的自由度增大了,結(jié)論的可信度就更高了。
第3種情形:可以構(gòu)造出含“復合型區(qū)組因素的隨機區(qū)組設計”。在例1中,可同時考慮小白鼠的體重、性別、年齡三個重要的非試驗因素,由它們復合成一個區(qū)組因素(即在同一個區(qū)組內(nèi)的小白鼠性別、年齡相同且體重最為接近)。這種“復合型區(qū)組因素”可以有效地控制多個重要非試驗因素對評價指標的影響。
第4種情形:在某些實際應用場合下,由于每個區(qū)組內(nèi)的受試對象的數(shù)目少于試驗因素的水平數(shù)(例如有4種治療腳氣的藥物,而每位患有腳氣病的患者只有兩只腳),此時,可依據(jù)動態(tài)平衡的原則,構(gòu)造出被稱為“平衡不完全隨機區(qū)組設計”,此設計比較繁瑣,需要時請參閱文獻[11]。
2.2 無重復試驗的拉丁方設計
2.2.1 問題與設計架構(gòu)
【例2】 某研究者以家兔為受試對象,研究A、B、C、D、E五種血壓計測定的血壓結(jié)果是否存在差異。所做的試驗安排和得到的設計架構(gòu)見表3。問:這是什么試驗設計類型?具體的操作方法是什么?
表3 用血壓計多次測量家兔血壓值
注:表中“X”代表待測定的血壓值
【例3】 某試驗研究的資料見表4。研究者關(guān)心的是藥液(A~G)、離體腸管標本(a~g)、用藥次序(1~7)對作用強度的影響是否具有統(tǒng)計學意義。
表4 不同藥液、不同標本和不同用藥次序?qū)ψ饔脧姸鹊挠绊?/p>
注:各行上的標本被分成7份分別接受不同的藥液處理
【例4】 為了研究5個不同劑量的甲狀腺提取液對豚鼠甲狀腺腫的影響,考慮到鼠的種系和體重對觀測指標可能有一定的影響,設計試驗時,最好將這兩個重要的非試驗因素一并安排。根據(jù)專業(yè)知識得知,這三個因素之間的交互作用可忽略不計,設計格式和收集的資料見表5。
表5 5個不同劑量的甲狀腺提取液對豚鼠甲狀腺重的影響
注:A、B、C、D、E所代表的具體劑量從略;每行上的5個數(shù)據(jù)測自種系相同的5只豚鼠
2.2.2 無重復試驗的拉丁方設計及有關(guān)重要內(nèi)容
表3、表4、表5的設計被稱為無重復試驗拉丁方設計。該設計的特點是:可以考察一個試驗因素和一個單純型(只涉及一個重要非試驗因素)或復合型的(由多個重要非試驗因素水平全面組合而成)區(qū)組因素(即重要非試驗因素)以及一個名叫“測定次序”的區(qū)組因素對評價指標的影響。該設計的要求是:試驗因素與兩個區(qū)組因素之間的交互作用可以忽略不計。該設計與單因素K(≥2)水平設計的區(qū)別是:它比單因素K(≥2)水平設計多考察了兩個區(qū)組因素。
2.2.3 無重復試驗的拉丁方設計的具體操作方法
以表3的設計為例,介紹其具體操作方法:
第1步:由研究者確定試驗因素的名稱和具體取哪幾個水平(如本例中,試驗因素的名稱為血壓計種類,其有5個水平,分別為A、B、C、D、E)。
第2步:根據(jù)研究目的,確定受試對象的種類,制訂納入和排除標準,此處從略。在本例中,假定有根據(jù)地選定了家兔作為受試對象,并制訂出了嚴格的納入和排除標準。
第3步:根據(jù)文獻資料或預試驗結(jié)果估算出所需要的最少樣本含量(注意:在傳統(tǒng)的拉丁方設計中,樣本含量就是試驗因素的水平數(shù)),在本例中,樣本含量為5只家兔。
第4步:假定由基本常識和專業(yè)知識得知:家兔個體差異比較大,于是,擬將“家兔編號”作為一個單純型區(qū)組因素,而將測定次序作為另一個區(qū)組因素。
第5步:將五種血壓計的代號A、B、C、D、E隨機排列成5行5列的方陣,簡稱為5×5拉丁方陣(注意:最早人們使用的是拉丁字母,而不是英文字母,由此而得名“拉丁方陣”),在本例中,方陣的具體排列形式見表3中表身部分。再在表3的左邊放置“家兔編號”及其水平1~5、在表3的表頭短橫線下方放置“測定次序”及其水平1~5。
第6步:以血壓值為指標,在標準操作規(guī)程指導下并實時精準地進行嚴格的質(zhì)量控制,確保測定方法規(guī)范,統(tǒng)一觀察和測定的方法與時間,從而獲得原始、精準的試驗數(shù)據(jù)。
第7步:將測自每只家兔在每個測定時間點上的“血壓值”準確地填寫入表3中相應位置上去,最終的試驗結(jié)果見表6。
表6 每只家兔在5個不同時間點上被測得的血壓值
注:表中“Xij”代表第i行第j列上測定出來的具體血壓值(因為沒有真實的原始數(shù)據(jù))
2.2.4 拉丁方設計的變形
根據(jù)拉丁方設計中“橫向區(qū)組因素”各水平的具體情況,可將拉丁方設計劃分成以下五種類型:
第一種類型:為“不可拆分的單個體型區(qū)組因素”(即每行上的多個數(shù)據(jù)重復測自同一個個體),見表3。
第二種類型:為“可拆分的單個體型區(qū)組因素”(即每行上的多個數(shù)據(jù)測自同一個標本分解后的多個子標本),見表4。
第三種類型:為“多個體型區(qū)組因素”(即每行上的K個數(shù)據(jù)測自K個條件接近的個體),見表5。
第四種類型:安排一個試驗因素和三個區(qū)組因素的拉丁方設計,被稱為正交拉丁方設計,見表7。在表7中,“血壓計代號”為試驗因素,而“護士代號”“受試者號”和“測定號”屬于三個區(qū)組因素。
表7 四臺血壓計測定結(jié)果
注:A-D分別代表4臺血壓計、α-δ分別代表4名護士;圓括號中的“X”代表相應位置上的血壓值
第五種類型:在上述第二種和第三種拉丁方設計中,若各行與各列交叉處有兩個或兩個以上獨立的受試對象接受試驗,就稱為“有重復試驗的拉丁方設計”。
2.2.5 正確運用拉丁方設計的要領(lǐng)
拉丁方設計正確與否,取決于兩個方面:試驗因素的性質(zhì)和橫向區(qū)組因素的具體情況。
情形一:當試驗因素為“藥物種類”或“劑量大小”時,應盡可能采取“多個體型區(qū)組因素”,也可采取“可拆分的單個體型區(qū)組因素”。此時應盡可能避免使用“不可拆分的單個體型區(qū)組因素”。
情形二:當試驗因素為“重量計量器種類(如秤或天平)”或“體溫計種類”時,可以選擇“不可拆分的單個體型區(qū)組因素”(可以減少樣本含量),因為試驗因素不會改變評價指標的數(shù)值。
情形三:當試驗因素為“血壓計種類”時,最好選擇“多個體型區(qū)組因素”。此時若選擇“不可拆分的單個體型區(qū)組因素”,若受試對象為動物,基本可行;若受試對象為人,結(jié)果的準確度會有所下降,這是由于人的“心理因素”可能會暫時影響評價指標的數(shù)值。
[1] 宋輝, 方靈芝, 陶用富, 等. 酒精戒斷所致震顫譫妄與非震顫譫妄患者DNA氧化損傷的比較[J]. 四川精神衛(wèi)生, 2016, 29(3): 238-241.
[2] 蔡穎蓮, 陳曉東, 劉國雄, 等. 廣東省懷集縣中學生自殺未遂狀況調(diào)查及相關(guān)因素分析[J]. 四川精神衛(wèi)生, 2016, 29(3): 249-253.
[3] Young D, Lamb SE, Shah S, et al. High-frequency oscillation for acute respiratory distress syndrome[J]. N Engl J Med, 2013, 368(9): 806-813.
[4] Vain NE, Satragno DS, Gorenstein AN, et al. Effect of gravity on volume of placental transfusion: a multicentre, randomised, non-inferiority trial[J]. Lancet, 2014, 384(9939): 235-240.
[5] 任露泉. 試驗優(yōu)化設計與分析[M]. 2版. 北京: 高等教育出版社, 2001: 246-278.
[6] 田口玄一. 實驗設計法(上)[M]. 北京: 機械工業(yè)出版社, 1987: 170-325.
[7] 方開泰, 馬長興. 正交與均勻試驗設計[M]. 北京: 科學出版社, 2001: 83-211.
[8] 王萬中. 試驗的設計與分析[M]. 北京: 高等教育出版社, 2004: 333-357.
[9] 胡良平. 統(tǒng)計學三型理論在實驗設計中的應用[M]. 北京: 人民軍醫(yī)出版社, 2006:139-165.
[10] Douglas CM. Design and analysis of experiments[M]. 北京: 人民郵電出版社, 2007: 119-558.
[11] 薛仲三. 醫(yī)學統(tǒng)計方法和原理[M]. 北京: 人民衛(wèi)生出版社, 1978: 335-345.
(本文編輯:吳俊林)
Types of the multifactor experimental designs with no interaction: randomized block design and Latin square design
GuHengming1,HuLiangping1,2*
(1.ConsultingCenterofBiomedicalStatistics,AcademyofMilitaryMedicalSciences,Beijing100850,China;2.SpecialtyCommitteeofClinicalScientificResearchStatisticsofWorldFederationofChineseMedicineSocieties,Beijing100029,China*Correspondingauthor:HuLiangping,E-mail:lphu812@sina.com)
The purpose of this paper is to introduce two types of the multifactor experimental designs with no interaction——randomized block design and Latin square design. Through the detailed introduction of the "main contents" "operation method" and "design deformation" corresponding to the above two types of designs, the three aspects, such as the core contents, essentials and matters needing attention, are displayed comprehensively in this article, which results to provide better conditions for users choose a correct and reasonable design type from the two designs.
Interaction; Randomized block design; Latin square design; Crossover design; Nested design
國家高技術(shù)研究發(fā)展計劃課題資助(2015AA020102)
R195.1
A
10.11886/j.issn.1007-3256.2017.01.003
2017-02-11)