任曉明,黃閃閃,南開大學(xué)哲學(xué)院,天津300071
在科學(xué)推理中,波普爾的證偽主義是一種處理確定性理論的極具影響力的方法。同邏輯經(jīng)驗(yàn)主義一樣,證偽主義認(rèn)為觀察陳述是評(píng)價(jià)科學(xué)理論的基礎(chǔ),評(píng)價(jià)科學(xué)理論就是找到該理論與觀察陳述之間的邏輯關(guān)系。這種方法也主張發(fā)現(xiàn)與檢驗(yàn)的嚴(yán)格區(qū)分,它把科學(xué)發(fā)現(xiàn)的范圍劃給心理學(xué)、社會(huì)學(xué)去研究,而把科學(xué)推理的任務(wù)限制在檢驗(yàn)范圍內(nèi),只是邏輯經(jīng)驗(yàn)主義要求證實(shí)或確證,而它則提倡證偽。從這個(gè)意義上看,證偽主義類似一種反歸納方法,即演繹證偽法。
除了波普爾本人,費(fèi)希爾、奈曼和皮爾遜等人都試圖將證偽主義方法擴(kuò)展到統(tǒng)計(jì)推理中,他們希望采用這種方法來處理不確定性理論和統(tǒng)計(jì)假說。尤其是費(fèi)希爾提出的顯著性檢驗(yàn),以及奈曼和皮爾遜的N-P檢驗(yàn),構(gòu)成了統(tǒng)計(jì)推理的經(jīng)典方法,成為許多科學(xué)家的校正標(biāo)準(zhǔn)。但是這種以證偽主義為方法論依據(jù)的檢驗(yàn)?zāi)P?,遭遇了缺乏歸納顯著性的詰難。
對(duì)于證偽主義,國(guó)內(nèi)學(xué)界大多專注于該方法在確定性理論范圍內(nèi)的討論,而對(duì)證偽主義方法在統(tǒng)計(jì)推理中的運(yùn)用鮮為關(guān)注,缺乏系統(tǒng)而深入的探討。基于此,本文重點(diǎn)介紹證偽主義方法在統(tǒng)計(jì)推理中的擴(kuò)展和運(yùn)用,對(duì)這種方法在科學(xué)推理中出現(xiàn)的問題作全面分析。
證偽主義的提出與休謨的歸納問題相關(guān),它是波普爾解決歸納問題的一種嘗試。傳統(tǒng)歸納問題是對(duì)簡(jiǎn)單枚舉歸納法的合理性質(zhì)疑,即如果假說的所有信息都由經(jīng)驗(yàn)觀察導(dǎo)出,那么我們能如何保證任一特定解釋理論一定正確呢?休謨本人的回應(yīng)是,將歸納問題分為邏輯問題和心理問題,并基于自然齊一性回答了歸納的心理問題,即未來將會(huì)類似于過去,歸納是人的習(xí)慣性聯(lián)想;而回避了歸納的邏輯問題,否定了歸納的邏輯基礎(chǔ),即要證明超出經(jīng)驗(yàn)得到的事實(shí)知識(shí)的合理性是不可能的。所以休謨將因果關(guān)系或基于因果關(guān)系的歸納推理置于一種非理性的基礎(chǔ)之上??档拢?]9則宣稱他的“獨(dú)斷論迷夢(mèng)”被歸納問題中斷,受休謨關(guān)于歸納問題的論述影響,他試圖提出一個(gè)同時(shí)具備先驗(yàn)確定性和充分必然性的原理,即先天綜合判斷來確保物理理論中的真理。但是豪森等人[2]1認(rèn)為,這種努力無疾而終,康德所提倡的原理不過是堅(jiān)持一個(gè)事件都有一個(gè)原因。不管這條原理有效與否,它都與歸納問題無關(guān)。歸納問題并不關(guān)注每個(gè)事件是否有一個(gè)原因,而是追問一個(gè)截然不同的問題:在任何特定情況下,一個(gè)人如何確保自己從無限、眾多的可能原因中找到某個(gè)事件的正確原因?可見,休謨和康德都未能最終解決歸納的邏輯問題。
波普爾認(rèn)為,證偽主義方法已經(jīng)解決了歸納問題,并能夠?qū)⒖茖W(xué)置于理性之上。為此他用多種方式重新表述了歸納的邏輯問題。如憑借“經(jīng)驗(yàn)推理”可以判定表示解釋性普遍理論的陳述語句嗎?由于檢驗(yàn)陳述(基礎(chǔ)陳述)可以證偽一個(gè)全稱假說,所以波普爾堅(jiān)定的回答了歸納問題:“我們有時(shí)候可以使用準(zhǔn)確的檢驗(yàn)陳述來判定某個(gè)解釋性全稱理論是錯(cuò)誤的。”[3]324波普爾為演繹證偽的可能性提供了兩個(gè)論據(jù):其一,證明與證偽具有不對(duì)稱性,經(jīng)驗(yàn)觀察雖然不能邏輯地證明理論,但它有時(shí)候可以推翻理論;其二,理論的演繹性結(jié)論有時(shí)候可在經(jīng)驗(yàn)上被證明。
雖然波普爾的這種“原創(chuàng)”極力展示科學(xué)推理的理性,但是證偽主義本身存在的一些問題,使得它遭受了一些詰難,主要問題有:第一,波普爾的原理并不能解釋科學(xué)推理中的許多經(jīng)典模型;第二,這個(gè)原理側(cè)重于理論的邏輯推論上。而許多證據(jù)表明,科學(xué)家對(duì)理論的支持或者反對(duì),并不屬于這個(gè)范疇。這些證據(jù)表現(xiàn)在三個(gè)方面:(1)科學(xué)中的確定性理論沒有可以直接檢驗(yàn)的推斷結(jié)論,只能借助輔助理論才能得以檢驗(yàn)和證實(shí),如牛頓定律;(2)許多科學(xué)理論(及其邏輯推論)可以擁有確定的概率,它們沒有絕對(duì)的可證實(shí)性,如孟德爾遺傳理論(其中的3/4和1/4);(3)經(jīng)常用來確證確定性假說的證據(jù),并不具有完全可靠性和絕對(duì)必然性,如預(yù)測(cè)一個(gè)行星方位的理論,該理論的預(yù)測(cè)利用了適當(dāng)?shù)耐h(yuǎn)鏡進(jìn)行檢驗(yàn)。由于影響望遠(yuǎn)鏡光路的多種不可預(yù)測(cè)性大氣條件,以及其他不可控制的因素,其中有些是與實(shí)驗(yàn)者個(gè)人因素有關(guān),另一些則與自然的變化無常有關(guān),這些因素導(dǎo)致在試驗(yàn)中肯定的實(shí)際讀數(shù)并非完全可信。
盡管證偽主義存在上述問題,但是它直接反映了科學(xué)推理的兩個(gè)特征。第一,在科學(xué)研究中,有可能出現(xiàn)理論被經(jīng)驗(yàn)證據(jù)駁倒的情況;第二,當(dāng)研究一個(gè)恰當(dāng)確定性理論,科學(xué)家會(huì)利用該理論導(dǎo)出一些結(jié)論,并通過一個(gè)適當(dāng)?shù)膶?shí)驗(yàn)來檢驗(yàn)這些結(jié)論,如果這些結(jié)論被證明是可靠的,那么通??梢詳喽ㄔ摾碚摰玫酱_證,或者我們對(duì)該理論的信任得到強(qiáng)化。
除了確定性理論,波普爾還試圖將證偽主義方法擴(kuò)展到統(tǒng)計(jì)推理中,來處理不確定性理論或統(tǒng)計(jì)假說。由于統(tǒng)計(jì)假說可真可假,并且沒有斷定可能事件一定會(huì)出現(xiàn)或者不出現(xiàn),所以憑借觀察證據(jù)試圖在邏輯上直接推翻假說的簡(jiǎn)單化的做法,對(duì)統(tǒng)計(jì)假說根本不起作用。波普爾為此修正了中心法則,希望修正后的證偽主義能夠解決科學(xué)推理中的不確定理論問題。
這個(gè)修正觀點(diǎn)預(yù)設(shè)了一條小概率事件實(shí)際不可能的原理,作為這種證偽主義方法的基礎(chǔ),即認(rèn)為小概率事件在一次試驗(yàn)中是實(shí)際不可能發(fā)生的,科學(xué)家應(yīng)該把包含可能性極小事件的假說排除在外。與卡爾納普相反,波普爾認(rèn)為,用概率正面表征一個(gè)科學(xué)理論的歸納支持程度的研究是無效的。在我看來,波普爾的證偽主義實(shí)際上暗含著一種歸納法的定性模式;這與統(tǒng)計(jì)假說的特性不一致,即這類假說把概率歸于可能事件,它們是定量的。為此,波普爾試圖用小概率原理來協(xié)調(diào)證偽主義的定性特征與統(tǒng)計(jì)假說的定量特性之間的不協(xié)調(diào)性。他主張,科學(xué)家應(yīng)該做出“一個(gè)方法論決策來把可能性非常小的事件看作是排除在外的——看作是禁止的”,那么科學(xué)家談及的假說就是“事實(shí)上假的”[4]191。數(shù)學(xué)家和經(jīng)濟(jì)學(xué)家古諾(Cournot)[5]155在闡述完全不可能事件“都被恰當(dāng)?shù)目醋魇俏锢硪饬x上不可能的”時(shí),也表達(dá)了同樣的觀點(diǎn)。所以這種修正的證偽主義可以稱為統(tǒng)計(jì)推理中的波普爾—古諾觀點(diǎn)。
但是小概率原理本身與統(tǒng)計(jì)假說的特性之間存在著尖銳矛盾,這使得波普爾—古諾觀點(diǎn)遭到了質(zhì)疑。小概率原理主張否定概率小的事件,但是統(tǒng)計(jì)假說不能排除那些被視為不可能發(fā)生的事件。可見這條預(yù)設(shè)的基礎(chǔ)原理不能滿足統(tǒng)計(jì)假說的要求。例如,分子運(yùn)動(dòng)論對(duì)浴缸中熱水自發(fā)結(jié)成冰的事件指派了很小的概率,但是不能排除這個(gè)事件。又如硬幣拋擲試驗(yàn)中,論證某個(gè)給定硬幣在不斷拋擲過程中,有一個(gè)正面朝上為1/2,反面朝上也為1/2的物理概率(那么該硬幣被認(rèn)為是“公平的”)。假定硬幣在1 000次拋擲過程中,出現(xiàn)正面朝上和反面朝上的任意特定序列的概率是,這個(gè)極小值是每個(gè)試驗(yàn)可能結(jié)果的概率,并且其中一個(gè)可能結(jié)果肯定會(huì)出現(xiàn)。但是波普爾—古諾觀點(diǎn)根據(jù)小概率原理含蓄地指出,應(yīng)該將這個(gè)確定出現(xiàn)的事件看作是物理意義上不可能的,顯然這一結(jié)論是站不住腳的。
著名統(tǒng)計(jì)學(xué)家費(fèi)希爾(R.A.Fisher)受證偽主義方法的啟發(fā),認(rèn)為證據(jù)對(duì)一個(gè)統(tǒng)計(jì)假說具有決定性的否定作用,進(jìn)而提出了顯著性檢驗(yàn)?zāi)P蛠頇z驗(yàn)統(tǒng)計(jì)假說或不確定性理論。費(fèi)希爾沒有假定一個(gè)最小概率來表征物理不可能,進(jìn)而回避了波普爾—古諾觀點(diǎn)遇到的難題。他的方案大致上認(rèn)為,一個(gè)統(tǒng)計(jì)假說應(yīng)該被某特定相對(duì)不可能結(jié)果包含的實(shí)驗(yàn)證據(jù)所摒棄,此處的“相對(duì)不可能”是相對(duì)于實(shí)驗(yàn)的其它可能結(jié)果而言。
費(fèi)希爾將一種接受檢驗(yàn)的特定假說稱為零假說(null hypothesis),他認(rèn)為“零假說永遠(yuǎn)不會(huì)被證明或證實(shí),但它有可能在實(shí)驗(yàn)過程中被否證。每個(gè)實(shí)驗(yàn)存在的目的,僅僅是給予事實(shí)為零假說提供否證機(jī)會(huì)”[6]16。費(fèi)希爾理論的推理模型一般可以表現(xiàn)為:用一種反證的方法檢驗(yàn)零假說H0,在設(shè)定的顯著性水平上比較H0的檢驗(yàn)結(jié)果,意在根據(jù)對(duì)比結(jié)果證偽H0,進(jìn)而接受與其矛盾的備擇假說H1。所謂顯著性水平就是檢驗(yàn)時(shí)采納的臨界概率,費(fèi)希爾將這個(gè)臨界概率設(shè)定為0.05。例如,倘若H0的檢驗(yàn)結(jié)果類似P0≤0.05,那么可認(rèn)為它在顯著性水平0.05上是顯著的,且認(rèn)為零假說H0在水平0.05上是被拒絕的,繼而接受備擇假說H1。雖然這種模型的推理程序看似演繹過程,但其實(shí)質(zhì)上是歸納過程,因?yàn)槠浣Y(jié)果具有或然性。
我們用公平硬幣假說來舉例說明費(fèi)希爾的顯著性檢驗(yàn),其中假定硬幣的拋擲次數(shù)是20次。具體來說,費(fèi)希爾的顯著性檢驗(yàn)可以分為四個(gè)步驟:(1)列舉結(jié)果空間,即實(shí)驗(yàn)本該產(chǎn)生的所有結(jié)果。在本例中,它通常包含20次正面或反面朝上的個(gè)可能序列。用r表示這個(gè)結(jié)果正面朝上的數(shù)量,即檢驗(yàn)統(tǒng)計(jì)量。樣本的檢驗(yàn)統(tǒng)計(jì)量對(duì)應(yīng)總體的參數(shù),在形式上是某個(gè)隨機(jī)變量,即隨機(jī)現(xiàn)象中各種結(jié)果的變量。(2)針對(duì)零假說,計(jì)算檢驗(yàn)統(tǒng)計(jì)量的每個(gè)可能值的概率——它的抽樣分布。如果硬幣拋擲實(shí)驗(yàn)中獲得正面朝上的概率是p,且獲得反面朝上的概率是q,那么在n次硬幣拋擲中出現(xiàn)r次正面朝上的概率是。在本例中,且,繼而能夠直接計(jì)算所求的概率,如r=0時(shí),p=9×10-7;r=1時(shí),p=1.9 ×105;……;r=20 時(shí),p=9 ×10-7。(3)檢驗(yàn)試驗(yàn)的可能結(jié)果,指出零假說的相關(guān)結(jié)果會(huì)更加“異?!?。這里的“異?!笨梢杂酶怕市问絹肀碚鳎磳?duì)于零假說,指出可能結(jié)果的概率小于或等于實(shí)際結(jié)果的概率。接著計(jì)算這組結(jié)果中會(huì)出現(xiàn)的實(shí)驗(yàn)結(jié)果的概率()。例如假設(shè)硬幣實(shí)驗(yàn)產(chǎn)生4次正面朝上和16次反面朝上,此時(shí)零假說為真的概率是0.0046。這個(gè)結(jié)果小于或等于r=4,3,2,1,0,以及r=16,17,18,19,20時(shí)的結(jié)果,其中任一結(jié)果出現(xiàn)的概率是它們獨(dú)立概率的和,即=2×(0.0046﹢0.0011﹢2 ×104﹢ 1.9 ×10-5﹢ 9 ×10-7)=0.012。(4)按照費(fèi)希爾的觀點(diǎn),只要當(dāng)時(shí),才能形成拒絕零假說的約定。但是一些統(tǒng)計(jì)學(xué)家建議0.01甚至0.001作為顯著性水平,并常常將其記作。如果一個(gè)實(shí)驗(yàn)結(jié)果類似于,可認(rèn)為它在顯著性水平上是顯著的,且可認(rèn)為零假說在水平上是被拒絕的。在本例中,拋擲20次硬幣產(chǎn)生4次正面朝上對(duì)應(yīng)的 =0.012;既然它低于0.05,那么零假說應(yīng)該在水平0.05或5%上被拒絕。但是一個(gè)6次正面朝上和14次反面朝上的結(jié)果,其概率=0.115,它不會(huì)是顯著的,所以零假說在那個(gè)水平上不應(yīng)該被拒絕。
費(fèi)希爾的方法在統(tǒng)計(jì)推理中被廣泛運(yùn)用,它是顯著性檢驗(yàn)的基本模型,通常用來檢驗(yàn)兩個(gè)總體是否具有相同平均數(shù)這類統(tǒng)計(jì)任務(wù)。例如,是否兩組孩子具有相同的IQ平均數(shù)。在這種情況下,測(cè)量每個(gè)孩子的IQ并不可行,建議程序是從每組中隨機(jī)抽取孩子建立樣本,并比較樣本中孩子的IQ,根據(jù)抽樣結(jié)果確定一個(gè)已知分布的檢驗(yàn)統(tǒng)計(jì)量,憑此完成顯著性檢驗(yàn)來判定這項(xiàng)統(tǒng)計(jì)任務(wù)。
但是費(fèi)希爾理論在邏輯上存在不一致,具體表現(xiàn)在選擇檢驗(yàn)統(tǒng)計(jì)量的環(huán)節(jié)上。在檢驗(yàn)零假說的過程中,選擇不同的檢驗(yàn)統(tǒng)計(jì)量,可能會(huì)導(dǎo)出不同的結(jié)論,導(dǎo)致應(yīng)該選擇哪個(gè)檢驗(yàn)統(tǒng)計(jì)量的難題。一個(gè)統(tǒng)計(jì)量可以是人為的,但在定義層面上卻是完全恰當(dāng)?shù)?。而且,一個(gè)檢驗(yàn)統(tǒng)計(jì)量可以指導(dǎo)你拒絕某個(gè)假說,相反另一個(gè)檢驗(yàn)統(tǒng)計(jì)量則告訴你不可以拒絕該假說。例如上文列舉的實(shí)驗(yàn)中,r分別等于4與6時(shí),導(dǎo)出了截然相反的結(jié)論:r=4時(shí),零假說在顯著性水平0.05上被拒絕;r=6時(shí),零假說在這個(gè)顯著性水平上不應(yīng)該被拒絕。這些問題表明,必須對(duì)檢驗(yàn)統(tǒng)計(jì)量附加一些約束條件,且這些約束與一致性相關(guān),來確保最終選擇的統(tǒng)計(jì)量導(dǎo)出相似的結(jié)論。但大多數(shù)約束條件在實(shí)際推理中是很難獲得的,這影響了費(fèi)希爾檢驗(yàn)方法的合理性基礎(chǔ)。在目前這種情況下,戈賽特(W.S.Gossett,其著作使用的是筆名Student)找到了一個(gè)解決方法,他要求,提供的實(shí)驗(yàn)抽樣足夠大到確保是近似正態(tài)的。
奈曼(Neyman)和皮爾遜(Pearson)詳述的顯著性檢驗(yàn)類似于Fisher的檢驗(yàn)?zāi)P停温栠d檢驗(yàn)(N-P檢驗(yàn))保留了費(fèi)希爾的大部分理論成果,如零假說的概念和二價(jià)統(tǒng)計(jì)實(shí)驗(yàn)的觀點(diǎn);但對(duì)費(fèi)希爾的方法論進(jìn)行了揚(yáng)棄,即修正了檢驗(yàn)的證偽方法。
N-P檢驗(yàn)在費(fèi)希爾理論的基礎(chǔ)上引入了競(jìng)爭(zhēng)假說,定義了推理中的兩種錯(cuò)誤,并規(guī)定統(tǒng)計(jì)推理的目的是最小化兩種錯(cuò)誤發(fā)生的可能性。費(fèi)希爾理論認(rèn)為統(tǒng)計(jì)推理類似于確定性事例的證偽;所以他強(qiáng)調(diào)檢驗(yàn)應(yīng)該在單個(gè)假說上進(jìn)行。但是統(tǒng)計(jì)假說不能被駁倒,費(fèi)希爾這樣一個(gè)準(zhǔn)反證的個(gè)人分析和辯護(hù)是非常不令人滿意的?;谶@個(gè)原因,N-P檢驗(yàn)在費(fèi)希爾理論的基礎(chǔ)上引入了競(jìng)爭(zhēng)假說,將推理中的兩種類型的錯(cuò)誤規(guī)定為:假說為真卻被視為假的,或者假說為假卻被視為真的。并借助“嚴(yán)重性”,將相對(duì)嚴(yán)重的錯(cuò)誤稱為第一類型錯(cuò)誤,次嚴(yán)重的錯(cuò)誤稱為第二類型錯(cuò)誤??梢酝ㄟ^一個(gè)假設(shè)產(chǎn)生的實(shí)際結(jié)果來判定兩種錯(cuò)誤類型,這個(gè)假設(shè)就是【應(yīng)當(dāng)】拒絕為假的假說,且【卻實(shí)際】接受為真的假說。例如,兩個(gè)關(guān)于某種事物許可添加劑的備擇假說,一個(gè)假說認(rèn)為這種添加劑是安全的,另一個(gè)則認(rèn)為它是非常有毒的。在各種情況下,假定一種有毒添加劑安全比假定一種安全添加劑有毒更加嚴(yán)重。N-P檢驗(yàn)將零假說定義為,做出更為嚴(yán)重的錯(cuò)誤拒絕的假說。由于統(tǒng)計(jì)假說具有似然性且不能被駁倒,所以N-P方法不是為了證偽某個(gè)假說,而是竭力使兩種錯(cuò)誤發(fā)生的可能性最小化。
我們可以借用小凱伯格(Kyburg)[7]26-35的例子來表述N-P檢驗(yàn)。一顆代售的郁金香球莖的標(biāo)簽遺失了,并且買方不記得它是:包含40%紅色和和60%黃色的花種,還是:包含40%黃色和60%紅色的花種。分別規(guī)定和的概率,并且將視做零假說。檢驗(yàn)這些假說的實(shí)驗(yàn)應(yīng)該包括栽培球莖的預(yù)設(shè)數(shù)量,在此假設(shè)為10顆,它們從代售中隨機(jī)選擇,還應(yīng)該觀察其中哪些分別長(zhǎng)成紅色和黃色。這個(gè)檢驗(yàn)程序與費(fèi)希爾的程序相似,且包含以下步驟。(1)規(guī)定結(jié)果空間,本例中包含個(gè)序列,每個(gè)序列表明郁金香球莖的花色選擇從一、二,直至第十次。(2)確定檢驗(yàn)統(tǒng)計(jì)量r,在此r表示樣本中紅色出現(xiàn)的數(shù)量。(3)針對(duì)每個(gè)兩兩競(jìng)爭(zhēng)的假說,計(jì)算每個(gè)檢驗(yàn)統(tǒng)計(jì)量可能值的概率。我們假定,如果代售的郁金香球莖是大量的,那么在隨機(jī)樣本n中選擇紅花球莖r的概率,近似于常見的二項(xiàng)式函數(shù)。我們?cè)诖思僭O(shè)選擇一個(gè)紅花球莖的概率p是恒定的,這個(gè)假設(shè)越近似為真,球莖的總量就越大。在本例中,對(duì)應(yīng)p=0.40,對(duì)應(yīng)p=0.60。憑此規(guī)定這個(gè)猜想實(shí)驗(yàn)關(guān)于兩個(gè)假說的抽樣分布,如紅色r=0,黃色10-r=10 時(shí),p1=0.0060,p2=0.0001;r=1,10 -r=9時(shí),p1=0.0403,p2=0.0016;……;r=10,10 -r=0 時(shí),p1=0.0001,p2=0.0060。(4)最后規(guī)定一個(gè)何時(shí)拒絕零假說的法則,在此考察樣本中出現(xiàn)的紅花幼苗等于或大于6的情形時(shí)拒絕假說的概率,即拒絕為真的的概率。這個(gè)概率同樣稱為檢驗(yàn)的顯著性水平,或者顯著性檢驗(yàn)的范圍,它是與拒絕法則相關(guān)的第一類型錯(cuò)誤。第二類型錯(cuò)誤的概率是接受為假的的概率;我們假定這兩個(gè)假說中的一個(gè)為真,其概率等于拒絕為真的的概率,根據(jù)(3)中規(guī)定的假說抽樣分布可以計(jì)算出這個(gè)概率是0.3664。
盡管N-P檢驗(yàn)較之費(fèi)希爾的理論,更貼合統(tǒng)計(jì)假說的特性,但是這種方法存在主觀因素:零假說的選擇和確定結(jié)果空間的方法。首先,N-P檢驗(yàn)方法在進(jìn)行檢驗(yàn)時(shí),需要選擇一個(gè)競(jìng)爭(zhēng)假說來作為零假說,并通過這個(gè)選擇的結(jié)果來影響假說最終的接受或拒絕。但是零假說有可能是被任意指派的,使得N-P檢驗(yàn)理論帶上了主觀色彩。例如100個(gè)隨機(jī)抽樣中,存在50個(gè)郁金香的紅花幼苗,那么(40%紅)會(huì)在0.05水平上被拒絕,假如它是零假說的話,而(60%紅)就會(huì)被接受。但是把作為零假說,就會(huì)產(chǎn)生相反的判定!其次,顯著性檢驗(yàn)的完成,需要比較獲得的結(jié)果概率與其它可能結(jié)果概率。N-P檢驗(yàn)認(rèn)為,憑借停止法則可以創(chuàng)建可能結(jié)果空間。這條法則預(yù)先滿足了實(shí)驗(yàn)應(yīng)該停止的情況。由于停止法則暗含了主觀意圖,使得結(jié)果空間的確定具有主觀性,進(jìn)而影響了科學(xué)判斷。例如檢驗(yàn)公平硬幣假說的試驗(yàn),要求出現(xiàn)6次正面朝上就停止試驗(yàn),與要求試驗(yàn)者拋擲20次硬幣后停止相比,會(huì)排除許多預(yù)先可能出現(xiàn)的結(jié)果,并引入大量新結(jié)果。這兩條任意的停止法則,會(huì)產(chǎn)生不同的可能結(jié)果空間。
顯著性檢驗(yàn)方法在20世紀(jì)占主導(dǎo)地位,而且至今仍然深具影響力,許多高等教育院校的推薦教科書都對(duì)其介紹和提倡。雖然這種方法自身存在一些問題,但并沒有影響它在不確定性理論和統(tǒng)計(jì)假說中的運(yùn)用。在科學(xué)推理中,它推崇的實(shí)驗(yàn)設(shè)計(jì)程序和數(shù)據(jù)分析已經(jīng)成為許多科學(xué)家的校正標(biāo)準(zhǔn)。
然而,從科學(xué)方法論的層面上看,顯著性檢驗(yàn)面臨是否具有歸納意義的質(zhì)疑。這種質(zhì)疑源于其方法論根源。顯著性檢驗(yàn)適用于統(tǒng)計(jì)推理,其結(jié)論具有或然性,它本質(zhì)上是一種歸納方法。但是這種檢驗(yàn)的方法論基礎(chǔ)是波普爾的證偽主義,其推理程序追求的是零假說被否證或拒絕。而“零假說在某顯著性水平上被拒絕”是一種專門表述,僅僅記錄了一個(gè)經(jīng)驗(yàn)結(jié)果落在一個(gè)結(jié)果的特定“拒絕空間”上。然而,作為一個(gè)該假說的歸納推論,又是什么意思呢?換言之,接受和拒絕一個(gè)假說到底意味著什么呢?關(guān)于顯著性歸納的辯護(hù)沒有一種是令人滿意的。
費(fèi)希爾把邏輯反駁的過程作為其顯著性檢驗(yàn)的模型。他認(rèn)為這類檢驗(yàn)?zāi)軌颉胺醋C”一個(gè)理論[8]16。費(fèi)希爾在此似乎表明了統(tǒng)計(jì)理論事實(shí)上或許可被證偽,雖然他清楚這是不可能的,但是他最終仍訴諸一個(gè)弱解釋,即在顯著性檢驗(yàn)中,零假說對(duì)應(yīng)的顯著結(jié)果或臨界結(jié)果是不大可能的。因此,一個(gè)顯著性結(jié)果的影響力相當(dāng)于邏輯上簡(jiǎn)單析取的影響力:或者具有“很小的可能性”(一個(gè)不可能事件),或者零假說是錯(cuò)的,或者二者兼?zhèn)?。哈金認(rèn)為,費(fèi)希爾的辯護(hù)只是相當(dāng)于空洞的老生常談[9]81。
奈曼和皮爾遜把歸納視作一種行為,顯著性檢驗(yàn)的結(jié)果是一種決策。即在顯著性檢驗(yàn)后,一個(gè)人接受某個(gè)假說時(shí),他應(yīng)該假定相信該假說為真;且如果一個(gè)人拒絕某個(gè)假說,他的行為應(yīng)該受到假說為假的假定的指導(dǎo)。奈曼和皮爾遜規(guī)定拒絕法則的根據(jù)在于[10]142,雖然一個(gè)顯著性檢驗(yàn)沒有確定假說h在特定情形下是否為真,但是如果我們根據(jù)拒絕法則行動(dòng),那么我們會(huì)在這個(gè)長(zhǎng)序列中拒絕h。這類實(shí)用且任意的決策不具有認(rèn)識(shí)論意義,且不能構(gòu)成歸納支持的基礎(chǔ):(1)一個(gè)人的行為與信念相關(guān),而與假說的實(shí)際真假可能無關(guān),即如果某個(gè)人無論如何都不相信h,那么不管h確定為真或?yàn)榧?,他都?huì)受到信念的鼓舞,而堅(jiān)持拒絕假說h;(2)一個(gè)人的行為與信念不對(duì)稱,因?yàn)閷?shí)際上只有兩個(gè)行為是可能的,即行或不行,但這并不意味著只能抱有兩個(gè)關(guān)于這些行為的信念。如商家可以指派概率給不同假說,然后通過權(quán)衡這些行為可能結(jié)果效用的概率,決定是否出售這批商品。
古典統(tǒng)計(jì)學(xué)家承認(rèn),通常不能用絕對(duì)化的術(shù)語來評(píng)估理論的接受和拒絕,所以他們嘗試著在分析中附加關(guān)于證據(jù)強(qiáng)度或歸納支持的觀念,但這種把顯著性水平與證據(jù)強(qiáng)度聯(lián)系起來的努力并沒有付諸成功的可能性。為了證明這種聯(lián)系,你需要以一個(gè)恰當(dāng)?shù)淖C據(jù)或歸納支持概念作為出發(fā)點(diǎn);事實(shí)上,在顯著性檢驗(yàn)術(shù)語中沒有系統(tǒng)闡述過這種概念,沒有一個(gè)術(shù)語可能做到。這里有兩個(gè)理由。第一,顯著性檢驗(yàn)導(dǎo)出的結(jié)論通常與一個(gè)公正科學(xué)家或普通觀察者刻畫的結(jié)論截然相反,相互矛盾。第二,顯著性檢驗(yàn)的影響因素,被合理視作與證據(jù)支持的判定無關(guān)。
波普爾提出的證偽主義顛覆了邏輯經(jīng)驗(yàn)主義的證實(shí)或確證進(jìn)路,采取了一種否證的態(tài)度,為科學(xué)推理提供了新的推理模式。但是這種方法的反歸納性,有時(shí)候并不符合科學(xué)探索活動(dòng)的實(shí)際過程。而且將證偽方法擴(kuò)展到不確定性理論的推理中,也出現(xiàn)了同樣的問題,即基于證偽主義方法論的統(tǒng)計(jì)推理模型——顯著性檢驗(yàn),面臨歸納意義的質(zhì)疑。證偽主義方法的可能修正進(jìn)路有:一是,從定性進(jìn)路上看,引入“真”的概念,明確證偽方法的歸納性。這種進(jìn)路的依據(jù)在于,波普爾后期對(duì)真理語義學(xué)的贊同和嘗試。波普爾早在1934年的《探究的邏輯》(德文版)中曾經(jīng)回避過“真”和“假”的概念(當(dāng)時(shí)認(rèn)為“真”的概念缺乏語義確定性),但當(dāng)知悉塔爾斯基的真理語義學(xué)理論后,他十分認(rèn)同該理論的恰當(dāng)性,隨后也嘗試著將該理論運(yùn)用于自己的科學(xué)哲學(xué)中,而真理語義學(xué)理論回答了一個(gè)陳述為真的語義學(xué)問題。二是,從定量進(jìn)路上看,引入概率分析,顯示證偽方法的定量歸納支持。這種進(jìn)路的可行性表現(xiàn)在統(tǒng)計(jì)推理中,用貝葉斯主義概率方法檢驗(yàn)假說時(shí)取得的成功。貝葉斯統(tǒng)計(jì)推理不同于顯著性檢驗(yàn)的證偽方法,它是一種依托貝葉斯定理,通過相應(yīng)先驗(yàn)分布而來的后驗(yàn)概率或密度分布,來獲取新信息的計(jì)算。一方面,貝葉斯方法避免了費(fèi)希爾理論中檢驗(yàn)統(tǒng)計(jì)量的選擇任意性難題,以及N-P檢驗(yàn)中零假說和可能結(jié)果空間的選擇主觀性問題,它通過計(jì)算后驗(yàn)概率來直接檢驗(yàn)假說。另一方面,貝葉斯定理成為定量進(jìn)路的歸納邏輯的模式,可見這種概率方法在統(tǒng)計(jì)推理中具有優(yōu)越性和歸納性。
[1]Kant,I.1783,Prolegomena to any Future Metaphysics,Edited by L.W.Beck,1950.Indianapolis:The Bobbs- Merrill Company,Inc.
[2]Howson,C.and Urbach,P.2006,Scientific Reasoning:The Bayesian Approach,La Salle,IL:Open Court.
[3]Keuth,H.2005,The Philosophy of Karl Popper,Cambridge,UK:Cambridge University Press.
[4]Popper,K.R.1959a.The Logic of Scientific Discovery,London:Hutchinson.
[5]Cournot,A.A.1843,Exposition de la Théories des Chances et des Probabilités,Paris.
[6]Fisher,R.A .1947,The Design of Experiments,4th edition.Edinburgh:Oliver and Boyd.
[7]Kyburg,H.E.,Jr.1974,The Logical Foundations of Statistical Inference,Dordrecht and Boston:Reidel Publishing Company.
[8]Fisher,R.A.1947,The Design of Experiments,4th edition.Edinburgh:Oliver and Boyd.
[9]Hacking,I.1965,Logic of Statistical Inference,Cambridge:Cambridge University Press.
[10]Neyman,J.and Pearson,E.S.1933.“One the Problem of the Most Efficient Tests of Statistical Hypotheses”,Philosophical Transactions of the Royal Society,vol.231A.
華中科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2013年2期