鄧平基
揭示疾病的發(fā)生原因并不容易,因為病因往往隱藏在復雜的自然、社會現(xiàn)象中,因果聯(lián)系非常復雜。統(tǒng)計學作為一種工具,為尋找病因提供了科學的因果推斷方法,曾經(jīng)改變了人們的純粹生物學病因觀念;同時,統(tǒng)計學改變了科學界幾乎所有領域的決定論觀點,以至于許多統(tǒng)計概念和思想已經(jīng)成為世界通俗文化的一部分,我們很自然地接受統(tǒng)計推斷結果,似乎忘了哲學上一直以來關于因果關系的爭論。事實上,對于病因推斷的認識是一個還在不斷向前發(fā)展的過程[1]。臨床中關于藥物治療的推理通常也有兩種因果思維,一種基于藥物的作用機制,一種基于嚴格的臨床試驗得到的經(jīng)驗證據(jù)。例如,達菲(Tamiflu)是治療流行性感冒的藥物,其作用機制是能有效遏制一種叫做神經(jīng)氨(糖)酸苷酶的病毒蛋白質(zhì),從而阻止病毒擴散。從機制上講,它對治療禽流感和甲型H1N1流感應該有較好的療效,但至少在高致病性禽流感的臨床試驗來看,還存在許多不確定性[2]。由客觀作用機制而做出的因果推理未必與臨床觀察的經(jīng)驗證據(jù)相吻合[2]。病因的統(tǒng)計推斷方法往往有其成立的先驗假設條件,甚至這些條件是不可經(jīng)驗證偽的,應該受到哲學思辨的拷問。本文旨在討論統(tǒng)計推斷中因果關系的含義,揭示因果統(tǒng)計推斷背后隱藏的假設條件,從而看到病因統(tǒng)計推斷的局限性。
統(tǒng)計學上的因果推斷主要有實驗性研究和觀察性研究兩種基本方法。觀察向我們提供的知識似乎是自己呈現(xiàn)出來的;而實驗則是為了知道事實是否如此,根據(jù)一定的理論或假設進行有計劃的試驗設計,主動獲取數(shù)據(jù),其特點在于能夠在人為控制的情境之下研究事物的變化,從而發(fā)現(xiàn)其因果關系??茖W研究中,通常先進行觀察,形成假設后,設計實驗方案進行實驗,最后得出結論。實驗試圖探索因果信息,觀察僅能獲得相關信息[3]。根據(jù)統(tǒng)計學家Howland的觀點:如果沒有不可檢驗的假定的話,就不能由觀察數(shù)據(jù)得出因果結論?,F(xiàn)代統(tǒng)計學的奠基者之一Fisher也曾指出,不通過隨機化實驗,根本無法證明任何東西。當然,也有人持樂觀觀點,統(tǒng)計學家Cornfield就認為,有些現(xiàn)象雖然無法設計隨機化實驗,但相關證據(jù)的累積也能說明一些問題。這些學術思想的繼承者盡管至今還在爭論,但統(tǒng)計學作為科學研究的普遍工具已經(jīng)成為共識,它在醫(yī)學研究領域應該有所作為。
因果與相關是兩個不同的概念,盡管在醫(yī)學研究領域因果比相關更讓人感興趣,但目前的大多數(shù)統(tǒng)計方法僅適用于相關性研究,因果推斷的統(tǒng)計模型相對還很少。尤其要注意的是,利用統(tǒng)計推斷得到事物之間的聯(lián)系,常常被錯誤地用于解釋為原因和結果的關系。相關的結論意味著可能有因果關系,也可能沒有,需要進一步研究加以區(qū)別。兩個因素之間無因果關系,可能會表現(xiàn)出虛假的相關性;相反地,有因果關系也可能表現(xiàn)出虛假的相關性。英國新赫布里底(New Hebrides)群島上的土著居民曾經(jīng)有一個信條:身上的跳蚤會帶來健康的身體。因為通過長期的經(jīng)驗累積,土著居民發(fā)現(xiàn)健康的人身上總有一些跳蚤,而身體贏弱的人通常沒有。于是他們得出結論:跳蚤使人身體健康,每個人身上都應該有跳蚤。這種觀察發(fā)現(xiàn)跳蚤與健康之間似乎是相關的,并經(jīng)歷了多年來人們隨意的檢驗。但這并不意味著土著居民的病因推論也是正確的,后來的研究工作最終發(fā)現(xiàn)了新赫布里底的真相:在大多數(shù)情況下,每個居民身上都有跳蚤,這是正常情況,然而,隨著體溫升高,跳蚤不能承受高溫而引起的不適,因此選擇離開。由此可以看到,統(tǒng)計數(shù)據(jù)往往容易被混雜因素所混淆或遮擋因果或相關關系。統(tǒng)計結果更多反映的是相關關系,而非因果關系。
鑒于因果關系的自相矛盾,為了取代因果概念,羅素提出了實質(zhì)蘊涵。從符號邏輯的角度,通過定義原子命題和基本聯(lián)結詞如“與”、“或”、“非”、“蘊含”與“等價”,再附加一些邏輯規(guī)則,完成“若命題A,則命題B”的推理。19世紀后期,德國醫(yī)師科赫(Koch)提出了一組必要的假設,用來證明某種病原體將導致某種特定的疾?。?]。通俗地說,這些必要假設是:①只要病原體能夠培養(yǎng)出來,疾病就會發(fā)生;②從研究疾病的所有病例中總是能檢出該種病原體;③當病原體被消除,疾病就會消失??坪者@里給出的即是實質(zhì)蘊涵的條件,現(xiàn)在看看肺癌和吸煙之間的聯(lián)系在多大程度上符合科赫假設(從而檢驗了羅素的實質(zhì)蘊涵是否適用):病原體是吸煙史,疾病是肺部表皮癌。一些吸煙者并沒有患肺癌,不滿足科赫的第一個假設;一些患肺癌的人卻聲稱他們沒有吸過煙,若我們信其所言,則不滿足科赫的第二個假設。如果我們拿掉病原體,也就是讓病人停止吸煙,他還是可能得病,因此不滿足科赫的第三個假設。如果我們應用科赫假設(應用羅素的實質(zhì)蘊涵),符合這些假設的,只有那些由血液或者其他體液培育出的特定病原體所引發(fā)的疾病。但是,對于心臟病、糖尿病、哮喘、關節(jié)炎或者其他形式的癌癥,這些假設就不再適用。以上的實例說明,由于病因中可能有混雜因素或虛假相關,導致患者個體會表現(xiàn)出一些不確定性,這使我們在分析原因和結果時,難以應用事物實質(zhì)蘊涵的精確性。
統(tǒng)計學上直接用于因果推斷的模型并不多,早期有列聯(lián)表、路徑分析、結構方程等,后來,Rubin提出虛擬事實模型,Pearl提出因果推斷的網(wǎng)絡圖方法[3]。在病因推斷的統(tǒng)計學方法中,很多數(shù)據(jù)分析方法都是首先得到相關關系,然后在一定的假設條件下轉(zhuǎn)化成因果聯(lián)系。如果忽視了原來模型提出時對因果機制的假定,將表示相關關系的參數(shù)當作因果關系處理,統(tǒng)計結論將被扭曲。以下給出一個理想實驗:表1為一組隨機對照研究病例,吸煙人群的患癌百分比與不吸煙人群的患癌百分比相比低10%,似乎吸煙對人類沒有患病的危害。
表1 吸煙與肺癌的數(shù)值例 n
再根據(jù)性別將上面的數(shù)據(jù)進行分層后,得到表2的數(shù)據(jù),分別計算男性吸煙人群的患癌百分比(60%),女性吸煙人群的患癌百分比(50%),男性不吸煙人群的患癌百分比(60%)和女性不吸煙人群的患癌百分比(20%),發(fā)現(xiàn)吸煙對男性和女性似乎都有患病的危害,這種現(xiàn)象稱為Simpson悖論[4]。
表2 按性別分層后的吸煙與肺癌數(shù)值例 n
同樣的數(shù)據(jù)不同的統(tǒng)計處理方法得到兩個迥然不同的結論。如果我們采信第二種分析方法,那意味著我們先驗地認為:吸煙致癌受到性別因素的混雜,分析時需要觀察性別這一背景變量,并以此變量將數(shù)據(jù)分層,從而消除混雜因素影響。因此,在統(tǒng)計調(diào)查和分析時,必須慎重考慮哪些變量需要觀察,哪些可以忽略。一個潛在的前提是吸煙致癌受到性別因素的混雜這一假設條件通常是不可經(jīng)驗證偽的。
病因的統(tǒng)計推斷是因果推理的數(shù)學模型,其思想沒有脫離哲學范疇,任何一個統(tǒng)計模型都有其局限性,它對因果關系的解釋也需要綜合多方面的證據(jù)。疾病的統(tǒng)計因果推理更多的是測量某種因素作用大小,而不是作為某種因素是否構成疾病原因的判斷標準,盲目依賴統(tǒng)計工具是不利的。
[1]廖兵榮,譚紅專.流行病學病因推斷的辯證思維[J].醫(yī)學與哲學(人文社會醫(yī)學版),2007,28(1):14-15.
[2]Aalen O.Causality and Mechanisms:Between Statistics and Philosophy[M].Consilience:Center for Advanced Study,Oslo,2007.79-82.
[3]耿直.觀察性研究與混雜因素[J].統(tǒng)計與信息論壇,2004,19(5):13-17.
[4]陶秋山,詹思延,李立明.流行病學研究中的病因與病因推斷[J].中華流行病學雜志,2004,25(11):1000-1003.