王瑞平 李斌
摘 要 臨床研究數(shù)據(jù)分析是呈現(xiàn)研究結(jié)果的方式,是評(píng)估臨床研究干預(yù)措施效果的重要參考和依據(jù)。研究者選擇合適的數(shù)據(jù)采集工具收集數(shù)據(jù),進(jìn)行數(shù)據(jù)質(zhì)量控制和清理后,便可以開展統(tǒng)計(jì)分析工作。本文主要介紹了臨床研究數(shù)據(jù)統(tǒng)計(jì)分析的原則、統(tǒng)計(jì)分析過程中須注意的事項(xiàng)和要點(diǎn),以及如何應(yīng)用SPSS軟件實(shí)現(xiàn)數(shù)據(jù)的統(tǒng)計(jì)分析等內(nèi)容,以期為今后臨床研究人員開展數(shù)據(jù)統(tǒng)計(jì)分析提供參考。
關(guān)鍵詞 臨床研究 意向性分析 檢驗(yàn)水準(zhǔn) 統(tǒng)計(jì)學(xué)描述 統(tǒng)計(jì)推斷
中圖分類號(hào):R-3 文獻(xiàn)標(biāo)志碼:C 文章編號(hào):1006-1533(2022)11-0036-06
引用本文 王瑞平, 李斌. 臨床研究數(shù)據(jù)分析原則、要點(diǎn)和統(tǒng)計(jì)軟件實(shí)現(xiàn)[J]. 上海醫(yī)藥, 2022, 43(11): 36-41; 79.
Principles, elements and statistical software implementation for the analysis of clinical research data
WANG Ruiping, LI Bin
(Clinical Research & Innovation Center, Shanghai Skin Disease Hospital, Shanghai 200443, China)
ABSTRACT The analysis of clinical research data is a way of presenting the results of a study and is an essential reference and basis for assessing the effectiveness of clinical research interventions. After researchers have selected an appropriate data collection tool to collect the data and performed data quality control and cleaning, statistical analysis can then be carried out. This article introduces the principles of statistical analysis of clinical research data, the key points to note in the process of statistical analysis, and how to apply SPSS software to achieve statistical analysis of data so as to provide a reference for clinical researchers to carry out statistical data analysis in the future.
KEY WORDS clinical research; intention to treat analysis; testing level; statistical description; statistical reference
本刊2022年第43卷第1期“臨床研究規(guī)范”欄目刊發(fā)的《臨床醫(yī)學(xué)研究數(shù)據(jù)統(tǒng)計(jì)分析思路概述》[1]基于臨床研究數(shù)據(jù)分類,解讀了臨床醫(yī)學(xué)研究的統(tǒng)計(jì)分析思路,主要包括統(tǒng)計(jì)學(xué)描述和統(tǒng)計(jì)學(xué)推斷2個(gè)部分。然而,在臨床研究數(shù)據(jù)分析實(shí)踐中,仍會(huì)存在研究者不清楚統(tǒng)計(jì)分析數(shù)據(jù)庫的選擇原則、統(tǒng)計(jì)分析中須要注意細(xì)節(jié)和易錯(cuò)點(diǎn)等情況。因此,為幫助研究者理清臨床研究數(shù)據(jù)分析的原則和要點(diǎn),本文將重點(diǎn)介紹臨床研究數(shù)據(jù)統(tǒng)計(jì)分析的原則、統(tǒng)計(jì)分析過程中須注意的事項(xiàng)和要點(diǎn),以及如何應(yīng)用SPSS軟件實(shí)現(xiàn)統(tǒng)計(jì)分析等內(nèi)容,以期為研究人員開展數(shù)據(jù)統(tǒng)計(jì)分析提供依據(jù)和參考。
1 臨床研究數(shù)據(jù)集選擇
廣義的臨床研究包括描述性研究(現(xiàn)況研究、縱向研究、病例系列研究等)、分析性研究(病例對(duì)照、隊(duì)列研究)、臨床試驗(yàn)研究(社區(qū)試驗(yàn)研究、個(gè)體試驗(yàn)研究等)和數(shù)理研究(統(tǒng)計(jì)學(xué)建模、疾病轉(zhuǎn)歸預(yù)測(cè)等),而狹義的臨床研究是指隨機(jī)對(duì)照臨床試驗(yàn)研究(randomized control trial, RCT)。無論是廣義臨床研究還是狹義臨床研究,項(xiàng)目組完成研究數(shù)據(jù)的采集、清理和質(zhì)量控制后,都會(huì)產(chǎn)生數(shù)據(jù)庫,也即是統(tǒng)計(jì)分析數(shù)據(jù)集。描述性和分析性臨床研究均屬于觀察性研究范疇,研究者未對(duì)研究對(duì)象實(shí)施干預(yù)措施,而僅通過觀察和測(cè)量收集研究對(duì)象的人口學(xué)、生活行為、疾病特征等數(shù)據(jù)信息。除前瞻性隊(duì)列研究外,其他類別的觀察性臨床研究的研究周期短,項(xiàng)目完成后通常僅形成一個(gè)數(shù)據(jù)庫,后續(xù)統(tǒng)計(jì)分析將基于該數(shù)據(jù)庫(數(shù)據(jù)集)開展,研究者只須描述清楚研究對(duì)象的應(yīng)答率、在隊(duì)列研究隨訪過程中的失訪情況,而對(duì)于因失訪而導(dǎo)致的數(shù)據(jù)缺失無須填補(bǔ),后續(xù)通過比例風(fēng)險(xiǎn)回歸分析等展示即可。
在臨床試驗(yàn)研究中,研究者的目標(biāo)為驗(yàn)證病因假設(shè)或評(píng)估干預(yù)措施的療效和安全性,并綜合考量研究周期、經(jīng)費(fèi)、倫理等方面問題,其研究對(duì)象的規(guī)模相比于觀察性臨床研究往往要小很多,而且在研究對(duì)象篩選方面也十分嚴(yán)格,因此須要對(duì)入組的每一個(gè)研究對(duì)象給予充分重視。在研究對(duì)象招募階段及整個(gè)研究全過程均須要與其保持密切溝通和聯(lián)系,盡可能避免研究對(duì)象的脫落和失訪,從而提高研究數(shù)據(jù)的完整性。鑒于臨床試驗(yàn)研究的特殊性,理想的研究數(shù)據(jù)集應(yīng)是包含所有入組對(duì)象在全研究周期內(nèi)的所有數(shù)據(jù),無漏填缺項(xiàng),無失訪與脫落。但在臨床研究實(shí)踐中,由于種種原因還是會(huì)出現(xiàn)研究對(duì)象脫落、數(shù)據(jù)采集不完整等情況,所以在研究項(xiàng)目結(jié)束后,須對(duì)最后形成的數(shù)據(jù)庫進(jìn)行判定和必要的技術(shù)修正,保證項(xiàng)目產(chǎn)生的有效數(shù)據(jù)的利用最大化。為此,臨床研究專家和統(tǒng)計(jì)學(xué)家對(duì)RCT的數(shù)據(jù)庫進(jìn)行分類,包括意向性分析集(intention-to-treat population, ITT)、全分析集(full analysis set, FAS)和符合方案集(per-protocol analysis, PP)。
如圖1所示,①ITT納入了所有隨機(jī)化分組后的受試者進(jìn)入分析,而不僅是實(shí)際完成的受試者。須注意的是,如果某受試者被隨機(jī)分配到了A組,后續(xù)ITT分析中該患者也必須一直在A組,即便該受試者后來接受的是B組的治療方案或沒有接受任何治療。這樣做的目的是要保持兩組間的基線特征均衡可比,使得除研究因素以外的其他變量完全均衡和匹配,能夠充分觀察干預(yù)效果。②FAS是ITT的子集,是指對(duì)所有隨機(jī)化受試者的數(shù)據(jù)做最少和公正的剔除后所得到的數(shù)據(jù)集,為的是保持原始數(shù)據(jù)集的完整性,減少偏倚。③PP則是FAS的一個(gè)子集,是指研究對(duì)象均依從干預(yù)措施的數(shù)據(jù)集,即該子集內(nèi)的受試者在納入與排除標(biāo)準(zhǔn)、接受治療、主要指標(biāo)測(cè)量等方面不存在嚴(yán)重違背方案的情況。一般情況下,臨床試驗(yàn)研究?jī)?yōu)先選擇FAS進(jìn)行統(tǒng)計(jì)分析,不過研究者也應(yīng)報(bào)告基于PP的分析結(jié)果,將其作為補(bǔ)充材料(supplementary material)放在文章附件中。相比于PP,基于FAS的數(shù)據(jù)分析更容易得到無統(tǒng)計(jì)學(xué)差異的結(jié)果,在非劣性或等效性臨床研究設(shè)計(jì)時(shí)將會(huì)導(dǎo)致Ⅰ類錯(cuò)誤風(fēng)險(xiǎn)的增加,研究者應(yīng)給予充分關(guān)注,盡可能同時(shí)應(yīng)用PP和FAS分析,綜合評(píng)估臨床研究中干預(yù)措施的療效和安全性。
2 臨床研究數(shù)據(jù)分析原則
臨床研究數(shù)據(jù)統(tǒng)計(jì)分析至少應(yīng)包括4個(gè)方面的內(nèi)容:①對(duì)臨床研究數(shù)據(jù)庫中的變量定義或分類處理給出解釋說明。如“吸煙率”“飲酒率”“治療有效率”等應(yīng)給出定義和計(jì)算方法;“年齡”“文化程度”“收入”等分類變量給出具體的分組和依據(jù)。②統(tǒng)計(jì)學(xué)描述內(nèi)容,應(yīng)對(duì)臨床研究數(shù)據(jù)庫中的定量變量和定性變量的給出詳細(xì)描述方案。例如:定量變量如符合正態(tài)分布,用均數(shù)±標(biāo)準(zhǔn)差描述,如不符合正態(tài)分布,用中位數(shù)和四分位數(shù)間距描述;定性變量一般用率、構(gòu)成比或百分比描述。③統(tǒng)計(jì)學(xué)檢驗(yàn)和推斷內(nèi)容,同樣應(yīng)根據(jù)變量類型的不同,給出具體的統(tǒng)計(jì)分析方案。例如:定量變量如符合正態(tài)分布且方差齊,兩組之間的比較采用t檢驗(yàn),多組之間的比較采用方差分析;如方差不齊,兩組之間的比較采用t’檢驗(yàn),多組之間的比較先進(jìn)行數(shù)據(jù)轉(zhuǎn)換(對(duì)數(shù)變換、平方根變換、平方根反正弦變換等)再采用方差分析;如不符合正態(tài)分布,則選擇非參數(shù)檢驗(yàn)分析組間的差異。而對(duì)于定性變量,通常選擇χ2檢驗(yàn)、趨勢(shì)χ2檢驗(yàn)進(jìn)行單因素分析,探討兩組或多組變量之間的差異;應(yīng)用logistic回歸開展多因素分析,探索研究變量的獨(dú)立危險(xiǎn)因素。④交代清楚數(shù)據(jù)分析所使用的統(tǒng)計(jì)學(xué)分析軟件及檢驗(yàn)水準(zhǔn)。常用的統(tǒng)計(jì)學(xué)分析軟件包括SPSS、SAS、Epi-info、Stata和R軟件等,檢驗(yàn)水準(zhǔn)一般設(shè)定為0.05或0.01,描述為“本研究以P<0.05提示差異有統(tǒng)計(jì)學(xué)意義”或“本研究以P<0.01提示差異有統(tǒng)計(jì)學(xué)意義”。在優(yōu)效性設(shè)計(jì)、非劣性設(shè)計(jì)中,因統(tǒng)計(jì)學(xué)檢驗(yàn)為單側(cè),檢驗(yàn)水準(zhǔn)調(diào)整為0.025或0.005。
在臨床研究數(shù)據(jù)分析結(jié)果呈現(xiàn)的內(nèi)容方面,觀察性臨床研究(現(xiàn)況研究、病例對(duì)照研究、隊(duì)列研究等)一般應(yīng)包括3個(gè)方面內(nèi)容:①研究對(duì)象的一般人口學(xué)特征,以及與不同暴露組或不同病例分組研究對(duì)象一般人口學(xué)特征比較;②暴露因素和結(jié)局變量(疾病、死亡等)之間的單因素分析,包括潛在混雜因素與暴露因素和結(jié)局變量之間的單因素分析結(jié)果;③暴露因素和結(jié)局變量之間的多因素分析,以控制混雜因素,評(píng)估暴露因素與結(jié)局之間的單獨(dú)效應(yīng)。相比觀察型臨床研究,RCT呈現(xiàn)的分析結(jié)果則更加“固定”,一般包括1張圖和3個(gè)表,研究者可參考本專欄往期刊登的文章《隨機(jī)對(duì)照臨床試驗(yàn)CONSORT聲明解讀》[2]。其中,1張圖為“隨機(jī)對(duì)照臨床研究各實(shí)施階段流程圖”(圖2),3個(gè)表分別為:①受試者一般情況表,包括試驗(yàn)組和對(duì)照組;②主要療效指標(biāo)和次要療效指標(biāo)評(píng)估表;③安全性和不良反應(yīng)情況表。
3 臨床研究數(shù)據(jù)分析要點(diǎn)和在SPSS軟件中的實(shí)現(xiàn)
臨床研究中,不同類型的設(shè)計(jì)其數(shù)據(jù)統(tǒng)計(jì)分析的整體思路實(shí)則一致,均包括統(tǒng)計(jì)學(xué)描述和統(tǒng)計(jì)學(xué)推斷兩個(gè)部分。如圖3所示,臨床研究數(shù)據(jù)統(tǒng)計(jì)分析方法的選擇均基于變量類型,同時(shí)不同變量類型還須要根據(jù)其自身分布特點(diǎn)來進(jìn)一步選擇合適的指標(biāo)和分析方法。統(tǒng)計(jì)分析方法選擇這部分內(nèi)容研究者可參考本專欄往期發(fā)表的《臨床醫(yī)學(xué)研究數(shù)據(jù)統(tǒng)計(jì)分析思路概述》[1]或查閱其他統(tǒng)計(jì)學(xué)書籍,不再贅述。本文將重點(diǎn)介紹臨床研究數(shù)據(jù)統(tǒng)計(jì)過程中,研究者容易疏忽的細(xì)節(jié),以及須注意的核心內(nèi)容和易錯(cuò)點(diǎn)。
1)定量變量分布的正態(tài)性 臨床研究數(shù)據(jù)統(tǒng)計(jì)分析實(shí)踐中,許多研究者對(duì)定量變量直接選擇均數(shù)±標(biāo)準(zhǔn)差進(jìn)行描述,并應(yīng)用t檢驗(yàn)或方差分析進(jìn)行組間差異的統(tǒng)計(jì)學(xué)檢驗(yàn)。如前文所述,對(duì)于定量變量統(tǒng)計(jì)分析方法的選擇須首先考慮其是否符合正態(tài)分布,隨后才能相應(yīng)地選擇合適的指標(biāo)和統(tǒng)計(jì)學(xué)檢驗(yàn)方法。正態(tài)性檢驗(yàn)在SPSS軟件中可以用“explore”模塊實(shí)現(xiàn)。具體操作如圖4所示,選擇“analyze→descriptive statistics→explore”后,在“dependent list”放入須要分析的變量(例如“b2a”),然后點(diǎn)擊“plots”按鈕,在“descriptive”處勾選“histogram”,并將“normality plots with tests”勾選上,最后再選擇“continue→ok”即可。分析結(jié)果主要通過Sig值來判定,Shapiro-Wilk檢驗(yàn)法對(duì)應(yīng)的Sig值>0.05時(shí),數(shù)據(jù)符合正態(tài)分布,頻數(shù)圖呈現(xiàn)“中間高,兩邊低,左右對(duì)稱”的特征。當(dāng)Shapiro-Wilk對(duì)應(yīng)的Sig值<0.05時(shí),數(shù)據(jù)將不符合正態(tài)分布。而Kolmogorov-Smirnov檢驗(yàn)法則常用于樣本量n>2 000時(shí)變量的正態(tài)性檢驗(yàn)。
2)重復(fù)測(cè)量方差分析 RCT中,研究者常常設(shè)置多個(gè)療效評(píng)價(jià)時(shí)間點(diǎn),對(duì)于這種類型的定量變量數(shù)據(jù),不能簡(jiǎn)單地使用不同評(píng)價(jià)時(shí)點(diǎn)測(cè)量值與基線測(cè)量值之間開展t檢驗(yàn)來評(píng)估療效,這時(shí)候應(yīng)該選擇重復(fù)測(cè)量方差分析,來分析不同組別、不同評(píng)估時(shí)間點(diǎn)干預(yù)措施臨床療效差異的“組間效應(yīng)”“時(shí)間效應(yīng)”和“組間與時(shí)間交互效應(yīng)”。具體操作如圖5所示,選擇“analyze→general linear model→repeated measures”,在“define factors”中定義重復(fù)測(cè)量變量名稱和次數(shù),完成后點(diǎn)擊“define”按鈕,在“within subjects variables”中放入重復(fù)測(cè)量變量,在“between subjects factors”中放入組別變量,點(diǎn)擊“plots”定義繪圖,在“post hoc”和“options”定義數(shù)據(jù)分析結(jié)果展現(xiàn)內(nèi)容,最后再點(diǎn)擊“ok”即可。
3)χ2檢驗(yàn)結(jié)果解讀 對(duì)于定性變量組間比較,通常采用χ2檢驗(yàn)。具體操作如圖6所示,選擇“analyze→descriptive statistics→crosstabs”,在“rows”和“columns”處放入要分析的變量,點(diǎn)擊“statistics”按鈕,勾選“chi-square”,然后點(diǎn)擊“continue→ok”即可。這些操作過程對(duì)于研究者來說都比較熟悉,但須注意的是:不能把四格表χ2檢驗(yàn)結(jié)果的第一行直接拿來使用,而是應(yīng)該先看一下分析結(jié)果下方提示(“a.”“b.”“c.”)。其中,第1條提示四格表中每個(gè)格子期望值的大小,進(jìn)而可以幫助研究者選擇合適的統(tǒng)計(jì)量和P值:①當(dāng)樣本量n≥40,同時(shí)格子期望值T≥5,選擇“Pearson chisquare”對(duì)應(yīng)的統(tǒng)計(jì)量和P值;②當(dāng)樣本量n≥40,但有格子期望值1≤T<5時(shí),采用連續(xù)性校正χ2檢驗(yàn),選擇“continuity correction”對(duì)應(yīng)的統(tǒng)計(jì)量和P值;③當(dāng)總樣本量n<40,或格子期望值T<1,采用Fisher確切概率法檢驗(yàn),即選擇“Fisher’s exact test”對(duì)應(yīng)的統(tǒng)計(jì)量與P值。
4)定量變量轉(zhuǎn)換為定性變量 數(shù)據(jù)統(tǒng)計(jì)分析過程中,有時(shí)候須要將定量變量轉(zhuǎn)換為定性變量進(jìn)行分析,如將患者的“實(shí)際年齡”根據(jù)一定的規(guī)則轉(zhuǎn)換為“年齡組”,這時(shí)候便要用到“transform”功能。具體操作如圖7所示,選擇“transform→x-y recode into different variable”,將須要進(jìn)行轉(zhuǎn)換的變量放入“numeric variable→output variable”框,在“output variable”中定義新的變量名稱,點(diǎn)擊“change”進(jìn)行轉(zhuǎn)換,然后再點(diǎn)擊“old and new variable”打開一個(gè)新的對(duì)話框,在這個(gè)新對(duì)話框中,根據(jù)自己設(shè)定的規(guī)則,將定量變換轉(zhuǎn)換為定性變量。須注意的是,盡管“transform→x-x recode into same variable”也可以使用,但這樣的操作會(huì)覆蓋掉原始變量值,無法恢復(fù)。因此,建議研究者優(yōu)先使用“x-y recode into different variable”轉(zhuǎn)換新變量。
5)logistic回歸分析中多分類定性變量設(shè)置啞變量 在應(yīng)用logistic模型進(jìn)行回歸分析時(shí),如果自變量中包含多分類定性變量,須將其設(shè)置為啞變量放入模型,否則統(tǒng)計(jì)分析結(jié)果展示的將不是各分類之間的差別,而是1/2/3/4等數(shù)量之間的差異。具體操作如圖8所示,選擇“analyze→regression”,點(diǎn)擊“binary logistic”打開對(duì)話框,在“dependent”框放入因變量,在“covariates”框放入自變量,然后點(diǎn)擊“categorical”打開新的對(duì)話框,將須要設(shè)置為啞變量的變量名放入“categorical covariates”,在下方“contrast”設(shè)定“indicator”選擇其余選項(xiàng)與第一個(gè)比(first)或其余選項(xiàng)與最后一個(gè)比(last),隨后再選擇“continue→ok”即可。
參考文獻(xiàn)
[1] 王瑞平, 李斌. 臨床醫(yī)學(xué)研究數(shù)據(jù)統(tǒng)計(jì)分析思路概述[J].上海醫(yī)藥, 2022, 43(1): 7-9.
[2] Moher D, Hopewell S, Schulz KF, et al. CONSORT 2010說明與詳述: 報(bào)告平行對(duì)照隨機(jī)臨床試驗(yàn)指南的更新[J]. 中西醫(yī)結(jié)合學(xué)報(bào), 2010, 8(8): 701-741.
[3] 王瑞平, 李斌. 隨機(jī)對(duì)照臨床試驗(yàn)CONSORT聲明解讀[J]. 上海醫(yī)藥, 2022, 43(5): 58-62.