高 輝 胡良平△ 李長平 郭 晉
實(shí)驗(yàn)設(shè)計(jì)是統(tǒng)計(jì)學(xué)中的重要內(nèi)容,是整個(gè)科研工作的行動指南。在實(shí)驗(yàn)前制定一個(gè)科學(xué)、完善、合理、可行的設(shè)計(jì)方案,可保證整個(gè)實(shí)驗(yàn)過程有章可循。完整的實(shí)驗(yàn)設(shè)計(jì)方案,涉及實(shí)驗(yàn)設(shè)計(jì)的“三要素、四原則和設(shè)計(jì)類型”的全面考慮和妥善安排。然而,由于不同設(shè)計(jì)類型的特點(diǎn)各異,常規(guī)的隨機(jī)數(shù)字表、隨機(jī)排列表應(yīng)用起來不是十分方便。本文借助SAS 9.2簡體中文版軟件的plan、optex過程,實(shí)現(xiàn)了五種含區(qū)組因素設(shè)計(jì)類型的設(shè)計(jì)方案。此外,plan過程和optex過程的直接輸出結(jié)果只是因素水平值的交叉組合,不易被用戶所理解。本文以tabulate過程對隨機(jī)化結(jié)果進(jìn)行調(diào)整,使其以能體現(xiàn)設(shè)計(jì)類型特點(diǎn)的形式展現(xiàn)出來,程序簡潔,方便科研人員修改使用;結(jié)果清晰明了,方便實(shí)驗(yàn)者記錄實(shí)驗(yàn)數(shù)據(jù)。
隨機(jī)區(qū)組設(shè)計(jì)是配對設(shè)計(jì)的擴(kuò)展,它首先將受試對象按可能影響實(shí)驗(yàn)結(jié)果的屬性分組,使屬性相同或接近的分在同一組內(nèi),形成區(qū)組,然后將各區(qū)組內(nèi)的受試對象隨機(jī)分配至各處理組〔1〕。
【例1】選擇4組受試對象,共16個(gè),各組內(nèi)受試對象條件相近。分別給予4種不同的處理,擬采用隨機(jī)區(qū)組設(shè)計(jì)安排實(shí)驗(yàn),請給出具體的設(shè)計(jì)方案。
對受試對象進(jìn)行編號,第1組編號范圍為1~4,第2組編號范圍為5~8,依此類推。
SAS程序如下:
proc plan seed=10000;
factors group=4 ordered treat=4;
output out=a group cvals=('第1組 ''第2組 ''第3組 ''第4組')
treat cvals=('處理1''處理2''處理3''處理4');
run;
data b;set a;subject=_n_;run;
ods html style=analysis;
proc tabulate format=2.0;class group treat;var subject;
table group=",subject='受試對象編號'*
treat=''*sum=''/box=[label='區(qū)組 '];
run;
ods html close;
輸出結(jié)果見表1。表格內(nèi)數(shù)字為受試對象的編號。如數(shù)字“3”所在的行標(biāo)識為第1組,列標(biāo)識為處理1,表示區(qū)組1中的3號受試對象接受處理1的處理。科研人員可在數(shù)字后記錄受試對象的觀測結(jié)果。
表1 例1的隨機(jī)化設(shè)計(jì)方案
拉丁方設(shè)計(jì)是在隨機(jī)區(qū)組設(shè)計(jì)的基礎(chǔ)上發(fā)展的,適用于實(shí)驗(yàn)中安排一個(gè)處理因素和兩個(gè)區(qū)組因素且各因素水平數(shù)相等的研究〔2〕。
【例2】擬采用拉丁方設(shè)計(jì)考察4個(gè)不同的受試對象在4個(gè)不同的時(shí)間接受4種不同方法的檢測,請給出具體的設(shè)計(jì)方案。
對4種檢測方法進(jìn)行編號,范圍為1~4。
SAS程序如下:
proc plan seed=10000;
factors subject=4 ordered period=4 ordered;
treatments test=4 cyclic;
output out=a subject cvals=('受試者1''受試者2''受試者3''受試者4')random period cvals=('時(shí)間1''時(shí)間2''時(shí)間3''時(shí)間4')
random test nvals=(1 2 3 4)random;
run;
ods html style=analysis;
proc tabulate format=2.0;
class subject period;var test;
table subject='',test='檢測方法 '*period=''*sum=''/box=[label='受試者編號 '];
run;
ods html close;
輸出結(jié)果見表2。表格內(nèi)數(shù)字為檢測方法的編號。
表2 例2的隨機(jī)化設(shè)計(jì)方案
交叉實(shí)驗(yàn)設(shè)計(jì)是按事先設(shè)計(jì)好的處理次序,在實(shí)驗(yàn)對象上按各個(gè)時(shí)期逐一依次實(shí)施各項(xiàng)處理,以比較這些處理的作用。2×2交叉設(shè)計(jì)指的是兩個(gè)時(shí)期、兩個(gè)處理的交叉設(shè)計(jì)〔3〕。
【例3】擬采用2×2交叉設(shè)計(jì)來考察兩種藥物的療效,選擇8個(gè)受試對象參與實(shí)驗(yàn),請給出具體的設(shè)計(jì)方案。
對兩種藥物進(jìn)行編號,范圍為1~2。
SAS程序如下:
proc plan seed=10000;
factors subject=8 period=2 ordered;treatments drug=2 cyclic;
output out=a period cvals=('第1階段''第2階段')drug nvals=(1 2);
run;
ods html style=analysis;
proc tabulate format=2.0;
class subject period;var drug;
table subject='',drug='藥物種類 '*
period=''*sum=''/box=[label='受試者編號 '];
run;
ods html close;
輸出結(jié)果見表3。表格內(nèi)數(shù)字為藥物的編號。
表3 例3的隨機(jī)化設(shè)計(jì)方案
含區(qū)組因素的析因設(shè)計(jì),比析因設(shè)計(jì)多考慮了一個(gè)區(qū)組因素。它先按受試對象的某種屬性形成區(qū)組,然后將各區(qū)組內(nèi)的受試對象隨機(jī)地分配至各因素各水平完全組合形成的各處理組中去〔4〕。
【例4】選擇4個(gè)區(qū)組的受試對象,各區(qū)組內(nèi)有4個(gè)條件接近的受試對象。擬采用含區(qū)組因素的析因設(shè)計(jì)考察藥物(兩種藥物)及劑量(兩個(gè)劑量)的效應(yīng)。請給出具體的設(shè)計(jì)方案。
對16個(gè)受試對象進(jìn)行編號,區(qū)組1內(nèi)的受試對象編號范圍為1~4,區(qū)組2內(nèi)的受試對象編號范圍為5~8,依此類推。
SAS程序如下:
%let factor_a=2;
proc plan seed=10000;
factors block=4 ordered r=4;output out=aa;
run;
data bb;
set aa;subject=_n_;do i=1 to&factor_a;if r< =i* &factor_a and r>(i-1)* &factor_a then do;a=i;b=r-(i-1)* &factor_a;end;end;
run;
data cc;
set bb;
if a=1 and b=1 then c='A1B1';
if a=1 and b=2 then c='A1B2';
if a=2 and b=1 then c='A2B1';
if a=2 and b=2 then c='A2B2';
run;
ods html style=analysis;
proc tabulate format=2.0;
class block c;var subject;
table block='',subject='受試對象編號'*c=''*sum=''/box=[label='區(qū)組 '];
run;
ods html close;
程序中設(shè)置了宏變量,factor_a的值為因素藥物種類的水平數(shù)。輸出結(jié)果見表4。表格內(nèi)數(shù)字為受試對象的編號。
表4 例4的隨機(jī)化設(shè)計(jì)方案
平衡不完全隨機(jī)區(qū)組設(shè)計(jì)是隨機(jī)區(qū)組設(shè)計(jì)的一種補(bǔ)救,適用于原本可采用隨機(jī)區(qū)組設(shè)計(jì)但實(shí)驗(yàn)因素的水平數(shù)大于每個(gè)區(qū)組內(nèi)實(shí)際可用的受試對象數(shù)的情形〔5〕。
【例5】擬采用平衡不完全隨機(jī)區(qū)組設(shè)計(jì)考察5種處理方法的效果,選取5個(gè)區(qū)組的受試對象,每個(gè)區(qū)組內(nèi)有3個(gè)。請給出具體的設(shè)計(jì)方案。
對受試對象進(jìn)行編號,區(qū)組1內(nèi)的受試對象編號范圍為1~3,區(qū)組2內(nèi)的受試對象編號范圍為4~6依此類推。
SAS程序如下:
%let block=5;%let treat=5;%let subject=3;%macro aa(treat);
data a;%do i=1%to&treat;
treatment=compress('療法 '||& i);
output;%end;
run;
%mend aa;
%aa(&treat);
proc optex data=a seed=10000 coding=orth;
class treatment;model treatment;blocks structure=(&block)&subject;output out=b;
run;
data c;
set b;number=_n_;
run;
ods html style=analysis;proc tabulate format=2.0;
class block treatment;var number;
table block='',number='受試對象編號 '*
treatment=''*sum=''/box=[label='區(qū)組 '];
run;
ods html close;
程序中使用%let語句設(shè)置了三個(gè)宏變量,block、treat和subject分別表示區(qū)組的個(gè)數(shù)、處理的個(gè)數(shù)和每組中所能處理的受試對象個(gè)數(shù)。輸出結(jié)果見表5。表格內(nèi)數(shù)字為受試對象的編號。
表5 例5的隨機(jī)化設(shè)計(jì)方案
總之,借助SAS軟件的強(qiáng)大功能,可以較為方便地實(shí)現(xiàn)各種含區(qū)組因素的實(shí)驗(yàn)設(shè)計(jì)類型。本文所涉及的plan過程和optex過程,均基于隨機(jī)數(shù)來產(chǎn)生設(shè)計(jì)方案〔6〕。所以,借助這兩個(gè)過程,事先給出隨機(jī)種子數(shù),進(jìn)行隨機(jī)化后得到的實(shí)驗(yàn)設(shè)計(jì)方案,既符合隨機(jī)原則的要求,也具有可重現(xiàn)性,應(yīng)予以提倡〔7〕。
1.徐勇勇.醫(yī)學(xué)統(tǒng)計(jì)學(xué).第2版.北京:高等教育出版社,2004:167-170.
2.孫振球.醫(yī)學(xué)統(tǒng)計(jì)學(xué).北京:人民衛(wèi)生出版社,2002:59-60.
3.蘇炳華.新藥臨床試驗(yàn)統(tǒng)計(jì)分析新進(jìn)展.上海:上??茖W(xué)技術(shù)文獻(xiàn)出版社,2000:63-115.
4.胡良平.統(tǒng)計(jì)學(xué)三型理論在實(shí)驗(yàn)設(shè)計(jì)中的應(yīng)用.北京:人民軍醫(yī)出版社,2006:71-106.
5.胡良平.SAS統(tǒng)計(jì)分析教程.北京:電子工業(yè)出版社,2010:687-689.
6.王睿,賀佳.隨機(jī)抽樣方法的SAS實(shí)現(xiàn).中國衛(wèi)生統(tǒng)計(jì),2007,24(1):85,93.
7.劉玉秀,姚晨,楊友春,等.隨機(jī)化臨床試驗(yàn)及隨機(jī)化的SAS實(shí)現(xiàn).中國臨床藥理學(xué)與治療學(xué),2001,6(3):193-195.