尚志忠,姜彥彪,趙冰,張哲文,張婷,張俊華,馬彬
目前,開展動物實驗Meta分析已被認為是探索提升動物實驗對臨床研究指導價值的有效途徑,可有效降低其結果向臨床轉化時的風險[1]。但由于動物實驗與臨床試驗間存在一定差異[2],使得動物實驗Meta分析在方法學標準等多個方面與臨床研究不同。在對動物實驗進行Meta分析時,可參考臨床試驗Meta分析的方法學,但需要針對動物研究特點進行調整和優(yōu)化[3]。因此,本文主要介紹動物實驗Meta分析中異質性的來源、相關數據處理等問題,以期為動物實驗Meta分析提供一定的指導。
由于動物實驗的特點,使得動物實驗Meta分析與臨床試驗Meta分析在研究目的、數據效應量的選擇、異質性的來源等多個方面存在差異(表1)[4]。
表1 動物實驗與臨床試驗Meta分析的區(qū)別
動物實驗Meta分析步驟主要包括5個步驟:①納入研究間異質性評估;②數據收集及效應尺度選擇;③選擇合理的統(tǒng)計分析模型;④減小與評估發(fā)表偏倚;⑤數據結果呈現(xiàn)并作出相應的解釋。
2.1 納入研究間異質性評估由于動物實驗Meta分析通常解決是比原始研究更廣泛的研究問題[5],因此,納入的研究在動物種屬、結果類型、測量時間等方面具有多樣性。為了能夠對某一特定的研究問題提供有指導意義的證據,進行Meta分析的研究必須在研究對象、干預措施、實驗設計和結果等方面具有充分的同質性[6]。因此,在合并統(tǒng)計量前,需對納入研究進行異質性檢驗。通過前瞻性定義嚴格納入和排除標準,并對相似研究進行合理的比較,可減少/降低異質性。此外,如果Meta分析是以研究影響總效應量的因素或關注研究特征和結局指標間的關系為目的,則可包括更多異質性較大的研究。
2.1.1 異質性的來源動物實驗Meta分析中,異質性可分為研究內和研究間兩方面。動物實驗研究內異質性主要來自:①研究對象:同一種屬或品系動物在飼養(yǎng)過程中因疾病或外界環(huán)境影響,在實驗過程中其對相同干預措施及環(huán)境因素的反應存在差異;②動物安置:實驗動物安置的不同可導致其生存條件的差異,如當飼養(yǎng)動物的籠子處于不同高度或位置時,其光照強度與溫度等均存在細微差異,亦若在動物飼養(yǎng)過程中研究人員未對動物進行隨機化安置,則造成動物因不同的外界環(huán)境而產生不同的反應[7]。
相較于動物研究內的異質性,動物研究間異質性更明顯,主要包括:①研究對象:各研究間納入/排除標準的差異,實驗動物所代表的群體差異,實驗規(guī)模的大小、實驗場所不同以及對照個體的選擇所造成的差異等。②干預措施:藥物的劑量與劑型、給藥途徑與時間、干預措施的組合方式與作用時間的差異等。③實驗設計:如實驗動物是否隨機分組、隱蔽分組是否正確、是否實施盲法、樣本大小是否合理、實驗動物模型是否充分一致、實驗過程中對結局指標的定義和測量方法是否一致、納入研究可能由于研究目的不同導致對實驗動物的選擇、數據的收集與評價的傾向性出現(xiàn)差異;④統(tǒng)計學:因隨機誤差和多種偏倚的存在,動物實驗結果僅能近似反映研究的真實效應。若研究結果與真實效應的差異超出了隨機誤差的范圍,則會導致各研究間存在較大統(tǒng)計學異質性。⑤結果合并:不同種屬動物,由遺傳決定的生物學基礎不同,在解剖結構、代謝過程、疾病的發(fā)病機制等方面均存在差異,則需考慮合并的合理性;不同種屬或品種的實驗動物的結果合并后能夠代表何種動物的合并結果,其代表的研究總體是否產生了更大不確定性;是否需要限定最低的樣本量以使各研究具有較好的同質性和代表性;研究所得的結果及結論是否真實可靠,結果報告是否充分正確。此外,雖然使用多個種屬動物模型的研究可探索或全面評估干預措施的有效性和安全性,但不同研究的動物模型是否足夠標準化或是否使用了公認而穩(wěn)定的模型以降低研究間異質性。
2.1.2 異質性的檢驗與處理Meta分析僅對符合納入/排除標準,探索相同主題的研究進行統(tǒng)計合并。異質性的存在影響各研究之間效應量的合并,若不能對研究間存在的異質性加以控制,或進行合理解釋和分析,將嚴重降低Meta分析所得結果和結論的可信度[8,9]。因此,必須對納入研究的異質性進行評價,包括異質性檢驗和異質性處理兩個方面。
①異質性檢驗的方法異質性檢驗的方法包括定性和定量兩種,其中定性方法有圖示法,包括森林圖、拉貝圖、星狀圖,可以直觀觀察研究之間是否存在異質性[10];定量統(tǒng)計分析方法包括Q檢驗,I2和H檢驗,可準確檢驗異質性大小[9]。若經上述方法檢測出研究間存在較大異質性(P<0.05或I2>50%[11]),可通過亞組分析、Meta回歸分析等方法探索異質性的來源并對異質性進行處理[12]。
②異質性處理動物實驗研究的亞組分析是根據一定的研究水平變量(如研究設計、研究對象、干預措施的種類等)將研究分為若干亞組,然后對每個亞組分別進行效應量的合并以探討異質性的來源[13]。亞組分析等同于Meta回歸分析中實驗水平上的分類協(xié)變量。一次亞組分析僅能分析一個變量,而動物實驗通常樣本量較小而異質性較大[4],過多亞組分析會導致Meta分析變得復雜而難以理解,因此,宜采用Meta回歸分析探索異質性的來源以簡化分析步驟。
Meta回歸分析是以研究結果的估計為因變量,一個或多個研究水平變量為自變量,采用回歸分析的方法探討各變量對Meta分析中合并效應的影響,以明確各研究間異質性的來源的研究[13,14]。因其屬于Meta分析的一部分,需遵守Meta分析的一般規(guī)律,符合Meta分析的特點;同時,也要符合回歸分析的一般規(guī)律,如樣本量不能過小,否則會降低檢驗效能。此外,Meta回歸分析也存在局限性,包括混雜偏倚、測量誤差、無法獲取所需的全部信息資料,假陽性結論等[15,16]。
2.2 數據收集及效應尺度選擇[17,18]
2.2.1 二分類數據及效應尺度選擇對于各實驗組只有兩種結果,如死亡或存活、治療成功或失敗等,可選擇比值比(OR)、相對危險度(RR)、危險差(RD)為合并統(tǒng)計量。若不能獲得總樣本量和目標事件發(fā)生數,僅報告OR或RR值及其95%可信區(qū)間(CI)、標準誤(SE)或P值,則可通過經典的方差倒數法合并數據[3]。OR、RR值作為相對效應尺度指標,其不受基線風險的影響,具有較好的一致性。但某些情況下相對指標不能反應事件的真實風險情況,易夸大研究結果的效應,如實驗組中某種不良反應的發(fā)生率為0.8%,對照組為0.08%,此時RR=10,此時若單獨報告RR=10,則意味著非常強的聯(lián)系,難以接受干預措施的風險,但如果計算RD,其數值僅為0.72%。RD值適用于研究對象的基線特征具有較好的一致性,當所研究的結局事件在實驗組或對照組中全部發(fā)生或為0時,此時不能計算OR和RR,可計算RD值。
2.2.2 連續(xù)型數據及效應尺度選擇若納入研究中可提取的數據為各實驗組測量結果的均數、標準差和測量結果的研究對象的數目,則可選擇均數差(MD or WMD)、標準化均數差(SMD)或正態(tài)化均數差(NMD)合并統(tǒng)計量。①MD和WMD是以各研究間的結果測量方法或單位相同為基礎計算合并效應量的大小,消除了研究間絕對值大小的影響,以原有的單位真實地反應實驗效應。MD和WMD作為絕對效應尺度指標,其結果易于解釋。但因其易夸大研究效應且需納入的各研究間結果測量方法和尺度相同,導致可推廣性受到限制,如某一干預措施的干預效果,使得腦梗塞體積在小鼠模型中減少10 mm3,該結果與在靈長類動物模型中同樣減少10 mm3相比,小鼠疾病模型的干預效果要明顯優(yōu)于靈長類動物疾病模型。②NMD是將實驗組干預措施產生的效應與對照組動物自身的效應進行比較,其應用的前提是對照組的動物是未接受任何干預措施的“正?!眲游铮耀@得自身效應,同時實驗組和對照組之間的效應可用比例尺度進行量化比較。NMD的計算公式為:其中和分別代表研究中對照組和干預組的平均效應,代表未接受任何干預措施的“正?!眲游锏钠骄?。NMD的優(yōu)勢在于將實驗組的效應與正常動物相比較,可更好地揭示干預措施的效應。但由于動物實驗的樣本量通常較小,且易受到隨機誤差的影響,導致實驗效應的夸大,此時要使用矯正方法計算NMD,其具體計算方法詳見 Vesterinen等[3]。若無法得到正常動物的效應,如每個高倍視野中的神經元數量,或者自發(fā)的運動行為等,此時可計算SMD[3]。③SMD既不受研究間絕對值大小的影響,也不受測量單位的差異對結果的影響,適用于各研究間相同干預措施采用不同的測量方法,也適用于研究間均數差異過大的情況。
有時原始研究數據報告并非標準和充分,如研究中僅報告中位數而未報告均數;有些僅報告標準誤、可信區(qū)間、四分位間距、甚至最大值、最小值而未報告標準差;有些研究報告的結局指標也不同,如有些研究報告干預前后的差值,有些報告原始數值,有些報告對數值等。因此,需要對納入研究的數據處理后再進行Meta分析[3,16,19]。
2.3 有序數據及效應尺度選擇各研究對象被分為幾個有自然順序的類別,如病情程度的“輕、中、重”等。此外,還有一種常用于測量行為及認知功能的量表所得到的“得分”的特殊類型有序數據,可作為連續(xù)型數據或有序數據進行提取。如果分類等級較少,可采用比例優(yōu)勢模型進行Meta分析;如果分類等級較多,可作為連續(xù)型數據進行Meta分析,也可以選取適當的切割點將其轉換為二分類數據。
2.4 計數數據及效應尺度選擇部分研究中報告的是事件發(fā)生的次數,如癲癇發(fā)生次數等,此類數據即為計數數據。可分為罕見事件數據和常見事件數據。對于罕見事件數據,常采用的指標是“率”,“率”常與觀察時間跨度內事件發(fā)生的次數有關。對于常見事件數據,可作為連續(xù)型數據提取。當獲得的頻數為小概率事件時,若可獲得發(fā)病率,則計算RR或RD;當頻數為非小概率事件時,可將頻數當作連續(xù)性變量處理。
2.5 時間事件(生存)數據及效應量的選擇對于以死亡、疾病進展等某些重要事件發(fā)生的時間為結局的觀察性動物實驗,最好聯(lián)系作者獲得個體化數據,重新分析得到logHR及其標準誤,然后進行Meta分析。
總之,進行Meta分析時,納入研究的不同類型的數據均需轉化為二分類或連續(xù)性變量合并分析。
隨機效應模型和固定效應模型是基于不同的假設對研究結果進行合并的兩種統(tǒng)計方法。固定效應模型假設納入研究間的差異僅由隨機誤差引起,各研究具有相同的潛在真實效應;隨機效應模型允許各研究間因研究特征等方面的差異而存在不同的潛在效應[20],其比固定效應模型具有更寬的可信區(qū)間。
統(tǒng)計分析模型的選擇取決于納入研究間異質性的大小。若各研究間存在的異質性較大,則需通過亞組分析、Meta回歸分析等探索異質性的來源,使之達到同質后再使用固定效應模型;若經過異質性分析和處理后,各研究間的異質性依舊較大,則考慮選擇隨機效應模型。動物實驗因其研究性質和多樣性,導致各研究間通常具有較大的異質性,宜選擇隨機效應模型進行統(tǒng)計分析[2]。
雖然發(fā)表偏倚在動物實驗和臨床試驗中均可能出現(xiàn),但在動物實驗中可能更為嚴重[21]。相較于陽性結果,陰性或中立實驗結果被發(fā)表的概率較低,因此對陰性或中立實驗結果的不報告會導致高估干預措施效果[22]。Sena等[23]基于發(fā)表在CAMARARDS上的急性缺血性卒中動物實驗系統(tǒng)評價發(fā)現(xiàn):約14%的原始動物實驗未被發(fā)表,這些未發(fā)表的原始動物實驗導致的缺失數據使其結果比實際值高估了30%。
系統(tǒng)化地全面收集與當前研究問題有關的全部資料是控制發(fā)表偏倚的唯一措施。對動物實驗而言,除必檢數據庫PubMed、EMbase和Web of Science外,還應檢索BIOSIS Previews等相關數據庫[24]。此外,會議摘要、灰色文獻、參考文獻目錄檢索都是必要的補充檢索手段。同時,可借鑒臨床試驗Meta分析的發(fā)表偏倚評估方法,如漏斗圖法、失安全數法、剪補法、森林圖法等識別動物實驗的發(fā)表偏倚。
作為Meta分析結果的主要呈現(xiàn)形式,森林圖中的相對效應尺度指標(RR和OR)的無效豎線的橫軸尺度為1,絕對效應指標(如RD、MD、SMD)的無效豎線的橫軸尺度為0。若某個研究95%CI的線條橫跨無效豎線,則該研究無統(tǒng)計學意義,反之,則該研究有統(tǒng)計學意義。每條橫線直觀地表示各研究的95%可信區(qū)間范圍的大小,線條中央的小方塊為統(tǒng)計量的位置,其方塊大小代表該研究權重大小。以ZHOU等[25]的關于白藜蘆醇對膿毒癥動物模型組織中丙二醛影響的Meta分析結果為例。如圖1所示,圖中“菱形”為合并效應量的圖示結果,“-3.10(-5.27,-0.93)”表示合并效應量及其95%CI;“Z=2.80,P=0.005”,表示假設檢驗中的統(tǒng)計量及其P值?!唉?=30.20,df=3,P<0.00001”,表示異質性檢驗的Q統(tǒng)計量、自由度及P值,異質指數I2=90%(圖1)。
相比較于單個實驗動物研究,基于高質量動物研究的Meta分析的結果更為可靠,不僅可以有效評估和優(yōu)選最佳的實驗動物模型,避免衛(wèi)生資源的浪費和實驗動物的重復利用,亦可在即將開展的臨床試驗中計算效能時增加估計療效的精度,降低假陰性結果的風險,從而降低動物實驗結果向臨床試驗轉化時的風險,促進其成果的轉化和利用。
圖1 白藜蘆醇對膿毒癥動物模型組織中丙二醛的影響的森林圖