證偽主義方法在統(tǒng)計(jì)推理中的擴(kuò)展和運(yùn)用

2013-04-08 11:08:52任曉明黃閃閃南開大學(xué)哲學(xué)院天津300071

華中科技大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版) 2013年2期

任曉明，黃閃閃，南開大學(xué)哲學(xué)院，天津300071

在科學(xué)推理中，波普爾的證偽主義是一種處理確定性理論的極具影響力的方法。同邏輯經(jīng)驗(yàn)主義一樣，證偽主義認(rèn)為觀察陳述是評(píng)價(jià)科學(xué)理論的基礎(chǔ)，評(píng)價(jià)科學(xué)理論就是找到該理論與觀察陳述之間的邏輯關(guān)系。這種方法也主張發(fā)現(xiàn)與檢驗(yàn)的嚴(yán)格區(qū)分，它把科學(xué)發(fā)現(xiàn)的范圍劃給心理學(xué)、社會(huì)學(xué)去研究，而把科學(xué)推理的任務(wù)限制在檢驗(yàn)范圍內(nèi)，只是邏輯經(jīng)驗(yàn)主義要求證實(shí)或確證，而它則提倡證偽。從這個(gè)意義上看，證偽主義類似一種反歸納方法，即演繹證偽法。

除了波普爾本人，費(fèi)希爾、奈曼和皮爾遜等人都試圖將證偽主義方法擴(kuò)展到統(tǒng)計(jì)推理中，他們希望采用這種方法來處理不確定性理論和統(tǒng)計(jì)假說。尤其是費(fèi)希爾提出的顯著性檢驗(yàn)，以及奈曼和皮爾遜的N－P檢驗(yàn)，構(gòu)成了統(tǒng)計(jì)推理的經(jīng)典方法，成為許多科學(xué)家的校正標(biāo)準(zhǔn)。但是這種以證偽主義為方法論依據(jù)的檢驗(yàn)?zāi)Ｐ?，遭遇了缺乏歸納顯著性的詰難。

對(duì)于證偽主義，國(guó)內(nèi)學(xué)界大多專注于該方法在確定性理論范圍內(nèi)的討論，而對(duì)證偽主義方法在統(tǒng)計(jì)推理中的運(yùn)用鮮為關(guān)注，缺乏系統(tǒng)而深入的探討。基于此，本文重點(diǎn)介紹證偽主義方法在統(tǒng)計(jì)推理中的擴(kuò)展和運(yùn)用，對(duì)這種方法在科學(xué)推理中出現(xiàn)的問題作全面分析。

一、證偽主義方法與歸納問題

證偽主義的提出與休謨的歸納問題相關(guān)，它是波普爾解決歸納問題的一種嘗試。傳統(tǒng)歸納問題是對(duì)簡(jiǎn)單枚舉歸納法的合理性質(zhì)疑，即如果假說的所有信息都由經(jīng)驗(yàn)觀察導(dǎo)出，那么我們能如何保證任一特定解釋理論一定正確呢?休謨本人的回應(yīng)是，將歸納問題分為邏輯問題和心理問題，并基于自然齊一性回答了歸納的心理問題，即未來將會(huì)類似于過去，歸納是人的習(xí)慣性聯(lián)想;而回避了歸納的邏輯問題，否定了歸納的邏輯基礎(chǔ)，即要證明超出經(jīng)驗(yàn)得到的事實(shí)知識(shí)的合理性是不可能的。所以休謨將因果關(guān)系或基于因果關(guān)系的歸納推理置于一種非理性的基礎(chǔ)之上?？档拢?］9則宣稱他的“獨(dú)斷論迷夢(mèng)”被歸納問題中斷，受休謨關(guān)于歸納問題的論述影響，他試圖提出一個(gè)同時(shí)具備先驗(yàn)確定性和充分必然性的原理，即先天綜合判斷來確保物理理論中的真理。但是豪森等人［2］1認(rèn)為，這種努力無疾而終，康德所提倡的原理不過是堅(jiān)持一個(gè)事件都有一個(gè)原因。不管這條原理有效與否，它都與歸納問題無關(guān)。歸納問題并不關(guān)注每個(gè)事件是否有一個(gè)原因，而是追問一個(gè)截然不同的問題:在任何特定情況下，一個(gè)人如何確保自己從無限、眾多的可能原因中找到某個(gè)事件的正確原因?可見，休謨和康德都未能最終解決歸納的邏輯問題。

波普爾認(rèn)為，證偽主義方法已經(jīng)解決了歸納問題，并能夠?qū)⒖茖W(xué)置于理性之上。為此他用多種方式重新表述了歸納的邏輯問題。如憑借“經(jīng)驗(yàn)推理”可以判定表示解釋性普遍理論的陳述語句嗎?由于檢驗(yàn)陳述(基礎(chǔ)陳述)可以證偽一個(gè)全稱假說，所以波普爾堅(jiān)定的回答了歸納問題:“我們有時(shí)候可以使用準(zhǔn)確的檢驗(yàn)陳述來判定某個(gè)解釋性全稱理論是錯(cuò)誤的。”［3］324波普爾為演繹證偽的可能性提供了兩個(gè)論據(jù):其一，證明與證偽具有不對(duì)稱性，經(jīng)驗(yàn)觀察雖然不能邏輯地證明理論，但它有時(shí)候可以推翻理論;其二，理論的演繹性結(jié)論有時(shí)候可在經(jīng)驗(yàn)上被證明。

雖然波普爾的這種“原創(chuàng)”極力展示科學(xué)推理的理性，但是證偽主義本身存在的一些問題，使得它遭受了一些詰難，主要問題有:第一，波普爾的原理并不能解釋科學(xué)推理中的許多經(jīng)典模型;第二，這個(gè)原理側(cè)重于理論的邏輯推論上。而許多證據(jù)表明，科學(xué)家對(duì)理論的支持或者反對(duì)，并不屬于這個(gè)范疇。這些證據(jù)表現(xiàn)在三個(gè)方面:(1)科學(xué)中的確定性理論沒有可以直接檢驗(yàn)的推斷結(jié)論，只能借助輔助理論才能得以檢驗(yàn)和證實(shí)，如牛頓定律;(2)許多科學(xué)理論(及其邏輯推論)可以擁有確定的概率，它們沒有絕對(duì)的可證實(shí)性，如孟德爾遺傳理論(其中的3/4和1/4);(3)經(jīng)常用來確證確定性假說的證據(jù)，并不具有完全可靠性和絕對(duì)必然性，如預(yù)測(cè)一個(gè)行星方位的理論，該理論的預(yù)測(cè)利用了適當(dāng)?shù)耐h(yuǎn)鏡進(jìn)行檢驗(yàn)。由于影響望遠(yuǎn)鏡光路的多種不可預(yù)測(cè)性大氣條件，以及其他不可控制的因素，其中有些是與實(shí)驗(yàn)者個(gè)人因素有關(guān)，另一些則與自然的變化無常有關(guān)，這些因素導(dǎo)致在試驗(yàn)中肯定的實(shí)際讀數(shù)并非完全可信。

盡管證偽主義存在上述問題，但是它直接反映了科學(xué)推理的兩個(gè)特征。第一，在科學(xué)研究中，有可能出現(xiàn)理論被經(jīng)驗(yàn)證據(jù)駁倒的情況;第二，當(dāng)研究一個(gè)恰當(dāng)確定性理論，科學(xué)家會(huì)利用該理論導(dǎo)出一些結(jié)論，并通過一個(gè)適當(dāng)?shù)膶?shí)驗(yàn)來檢驗(yàn)這些結(jié)論，如果這些結(jié)論被證明是可靠的，那么通?？梢詳喽ㄔ摾碚摰玫酱_證，或者我們對(duì)該理論的信任得到強(qiáng)化。

二、統(tǒng)計(jì)推理的波普爾—古諾觀點(diǎn):統(tǒng)計(jì)中的證偽主義

除了確定性理論，波普爾還試圖將證偽主義方法擴(kuò)展到統(tǒng)計(jì)推理中，來處理不確定性理論或統(tǒng)計(jì)假說。由于統(tǒng)計(jì)假說可真可假，并且沒有斷定可能事件一定會(huì)出現(xiàn)或者不出現(xiàn)，所以憑借觀察證據(jù)試圖在邏輯上直接推翻假說的簡(jiǎn)單化的做法，對(duì)統(tǒng)計(jì)假說根本不起作用。波普爾為此修正了中心法則，希望修正后的證偽主義能夠解決科學(xué)推理中的不確定理論問題。

這個(gè)修正觀點(diǎn)預(yù)設(shè)了一條小概率事件實(shí)際不可能的原理，作為這種證偽主義方法的基礎(chǔ)，即認(rèn)為小概率事件在一次試驗(yàn)中是實(shí)際不可能發(fā)生的，科學(xué)家應(yīng)該把包含可能性極小事件的假說排除在外。與卡爾納普相反，波普爾認(rèn)為，用概率正面表征一個(gè)科學(xué)理論的歸納支持程度的研究是無效的。在我看來，波普爾的證偽主義實(shí)際上暗含著一種歸納法的定性模式;這與統(tǒng)計(jì)假說的特性不一致，即這類假說把概率歸于可能事件，它們是定量的。為此，波普爾試圖用小概率原理來協(xié)調(diào)證偽主義的定性特征與統(tǒng)計(jì)假說的定量特性之間的不協(xié)調(diào)性。他主張，科學(xué)家應(yīng)該做出“一個(gè)方法論決策來把可能性非常小的事件看作是排除在外的——看作是禁止的”，那么科學(xué)家談及的假說就是“事實(shí)上假的”［4］191。數(shù)學(xué)家和經(jīng)濟(jì)學(xué)家古諾(Cournot)［5］155在闡述完全不可能事件“都被恰當(dāng)?shù)目醋魇俏锢硪饬x上不可能的”時(shí)，也表達(dá)了同樣的觀點(diǎn)。所以這種修正的證偽主義可以稱為統(tǒng)計(jì)推理中的波普爾—古諾觀點(diǎn)。

但是小概率原理本身與統(tǒng)計(jì)假說的特性之間存在著尖銳矛盾，這使得波普爾—古諾觀點(diǎn)遭到了質(zhì)疑。小概率原理主張否定概率小的事件，但是統(tǒng)計(jì)假說不能排除那些被視為不可能發(fā)生的事件。可見這條預(yù)設(shè)的基礎(chǔ)原理不能滿足統(tǒng)計(jì)假說的要求。例如，分子運(yùn)動(dòng)論對(duì)浴缸中熱水自發(fā)結(jié)成冰的事件指派了很小的概率，但是不能排除這個(gè)事件。又如硬幣拋擲試驗(yàn)中，論證某個(gè)給定硬幣在不斷拋擲過程中，有一個(gè)正面朝上為1/2，反面朝上也為1/2的物理概率(那么該硬幣被認(rèn)為是“公平的”)。假定硬幣在1 000次拋擲過程中，出現(xiàn)正面朝上和反面朝上的任意特定序列的概率是，這個(gè)極小值是每個(gè)試驗(yàn)可能結(jié)果的概率，并且其中一個(gè)可能結(jié)果肯定會(huì)出現(xiàn)。但是波普爾—古諾觀點(diǎn)根據(jù)小概率原理含蓄地指出，應(yīng)該將這個(gè)確定出現(xiàn)的事件看作是物理意義上不可能的，顯然這一結(jié)論是站不住腳的。

三、費(fèi)希爾的顯著性檢驗(yàn):統(tǒng)計(jì)證偽方法的發(fā)展

著名統(tǒng)計(jì)學(xué)家費(fèi)希爾(R.A.Fisher)受證偽主義方法的啟發(fā)，認(rèn)為證據(jù)對(duì)一個(gè)統(tǒng)計(jì)假說具有決定性的否定作用，進(jìn)而提出了顯著性檢驗(yàn)?zāi)Ｐ蛠頇z驗(yàn)統(tǒng)計(jì)假說或不確定性理論。費(fèi)希爾沒有假定一個(gè)最小概率來表征物理不可能，進(jìn)而回避了波普爾—古諾觀點(diǎn)遇到的難題。他的方案大致上認(rèn)為，一個(gè)統(tǒng)計(jì)假說應(yīng)該被某特定相對(duì)不可能結(jié)果包含的實(shí)驗(yàn)證據(jù)所摒棄，此處的“相對(duì)不可能”是相對(duì)于實(shí)驗(yàn)的其它可能結(jié)果而言。

費(fèi)希爾將一種接受檢驗(yàn)的特定假說稱為零假說(null hypothesis)，他認(rèn)為“零假說永遠(yuǎn)不會(huì)被證明或證實(shí)，但它有可能在實(shí)驗(yàn)過程中被否證。每個(gè)實(shí)驗(yàn)存在的目的，僅僅是給予事實(shí)為零假說提供否證機(jī)會(huì)”［6］16。費(fèi)希爾理論的推理模型一般可以表現(xiàn)為:用一種反證的方法檢驗(yàn)零假說H0，在設(shè)定的顯著性水平上比較H0的檢驗(yàn)結(jié)果，意在根據(jù)對(duì)比結(jié)果證偽H0，進(jìn)而接受與其矛盾的備擇假說H1。所謂顯著性水平就是檢驗(yàn)時(shí)采納的臨界概率，費(fèi)希爾將這個(gè)臨界概率設(shè)定為0.05。例如，倘若H0的檢驗(yàn)結(jié)果類似P0≤0.05，那么可認(rèn)為它在顯著性水平0.05上是顯著的，且認(rèn)為零假說H0在水平0.05上是被拒絕的，繼而接受備擇假說H1。雖然這種模型的推理程序看似演繹過程，但其實(shí)質(zhì)上是歸納過程，因?yàn)槠浣Y(jié)果具有或然性。

我們用公平硬幣假說來舉例說明費(fèi)希爾的顯著性檢驗(yàn)，其中假定硬幣的拋擲次數(shù)是20次。具體來說，費(fèi)希爾的顯著性檢驗(yàn)可以分為四個(gè)步驟:(1)列舉結(jié)果空間，即實(shí)驗(yàn)本該產(chǎn)生的所有結(jié)果。在本例中，它通常包含20次正面或反面朝上的個(gè)可能序列。用r表示這個(gè)結(jié)果正面朝上的數(shù)量，即檢驗(yàn)統(tǒng)計(jì)量。樣本的檢驗(yàn)統(tǒng)計(jì)量對(duì)應(yīng)總體的參數(shù)，在形式上是某個(gè)隨機(jī)變量，即隨機(jī)現(xiàn)象中各種結(jié)果的變量。(2)針對(duì)零假說，計(jì)算檢驗(yàn)統(tǒng)計(jì)量的每個(gè)可能值的概率——它的抽樣分布。如果硬幣拋擲實(shí)驗(yàn)中獲得正面朝上的概率是p，且獲得反面朝上的概率是q，那么在n次硬幣拋擲中出現(xiàn)r次正面朝上的概率是。在本例中，且，繼而能夠直接計(jì)算所求的概率，如r=0時(shí)，p=9×10－7;r=1時(shí)，p=1.9 ×105;……;r=20 時(shí)，p=9 ×10－7。(3)檢驗(yàn)試驗(yàn)的可能結(jié)果，指出零假說的相關(guān)結(jié)果會(huì)更加“異?！?。這里的“異?！笨梢杂酶怕市问絹肀碚鳎磳?duì)于零假說，指出可能結(jié)果的概率小于或等于實(shí)際結(jié)果的概率。接著計(jì)算這組結(jié)果中會(huì)出現(xiàn)的實(shí)驗(yàn)結(jié)果的概率()。例如假設(shè)硬幣實(shí)驗(yàn)產(chǎn)生4次正面朝上和16次反面朝上，此時(shí)零假說為真的概率是0.0046。這個(gè)結(jié)果小于或等于r=4，3，2，1，0，以及r=16，17，18，19，20時(shí)的結(jié)果，其中任一結(jié)果出現(xiàn)的概率是它們獨(dú)立概率的和，即=2×(0.0046﹢0.0011﹢2 ×104﹢ 1.9 ×10－5﹢ 9 ×10－7)=0.012。(4)按照費(fèi)希爾的觀點(diǎn)，只要當(dāng)時(shí)，才能形成拒絕零假說的約定。但是一些統(tǒng)計(jì)學(xué)家建議0.01甚至0.001作為顯著性水平，并常常將其記作。如果一個(gè)實(shí)驗(yàn)結(jié)果類似于，可認(rèn)為它在顯著性水平上是顯著的，且可認(rèn)為零假說在水平上是被拒絕的。在本例中，拋擲20次硬幣產(chǎn)生4次正面朝上對(duì)應(yīng)的 =0.012;既然它低于0.05，那么零假說應(yīng)該在水平0.05或5%上被拒絕。但是一個(gè)6次正面朝上和14次反面朝上的結(jié)果，其概率=0.115，它不會(huì)是顯著的，所以零假說在那個(gè)水平上不應(yīng)該被拒絕。

費(fèi)希爾的方法在統(tǒng)計(jì)推理中被廣泛運(yùn)用，它是顯著性檢驗(yàn)的基本模型，通常用來檢驗(yàn)兩個(gè)總體是否具有相同平均數(shù)這類統(tǒng)計(jì)任務(wù)。例如，是否兩組孩子具有相同的IQ平均數(shù)。在這種情況下，測(cè)量每個(gè)孩子的IQ并不可行，建議程序是從每組中隨機(jī)抽取孩子建立樣本，并比較樣本中孩子的IQ，根據(jù)抽樣結(jié)果確定一個(gè)已知分布的檢驗(yàn)統(tǒng)計(jì)量，憑此完成顯著性檢驗(yàn)來判定這項(xiàng)統(tǒng)計(jì)任務(wù)。

但是費(fèi)希爾理論在邏輯上存在不一致，具體表現(xiàn)在選擇檢驗(yàn)統(tǒng)計(jì)量的環(huán)節(jié)上。在檢驗(yàn)零假說的過程中，選擇不同的檢驗(yàn)統(tǒng)計(jì)量，可能會(huì)導(dǎo)出不同的結(jié)論，導(dǎo)致應(yīng)該選擇哪個(gè)檢驗(yàn)統(tǒng)計(jì)量的難題。一個(gè)統(tǒng)計(jì)量可以是人為的，但在定義層面上卻是完全恰當(dāng)?shù)?。而且，一個(gè)檢驗(yàn)統(tǒng)計(jì)量可以指導(dǎo)你拒絕某個(gè)假說，相反另一個(gè)檢驗(yàn)統(tǒng)計(jì)量則告訴你不可以拒絕該假說。例如上文列舉的實(shí)驗(yàn)中，r分別等于4與6時(shí)，導(dǎo)出了截然相反的結(jié)論:r=4時(shí)，零假說在顯著性水平0.05上被拒絕;r=6時(shí)，零假說在這個(gè)顯著性水平上不應(yīng)該被拒絕。這些問題表明，必須對(duì)檢驗(yàn)統(tǒng)計(jì)量附加一些約束條件，且這些約束與一致性相關(guān)，來確保最終選擇的統(tǒng)計(jì)量導(dǎo)出相似的結(jié)論。但大多數(shù)約束條件在實(shí)際推理中是很難獲得的，這影響了費(fèi)希爾檢驗(yàn)方法的合理性基礎(chǔ)。在目前這種情況下，戈賽特(W.S.Gossett，其著作使用的是筆名Student)找到了一個(gè)解決方法，他要求，提供的實(shí)驗(yàn)抽樣足夠大到確保是近似正態(tài)的。

四、奈曼—皮爾遜顯著性檢驗(yàn):對(duì)費(fèi)希爾證偽方法的修正

奈曼(Neyman)和皮爾遜(Pearson)詳述的顯著性檢驗(yàn)類似于Fisher的檢驗(yàn)?zāi)Ｐ停温栠d檢驗(yàn)(N－P檢驗(yàn))保留了費(fèi)希爾的大部分理論成果，如零假說的概念和二價(jià)統(tǒng)計(jì)實(shí)驗(yàn)的觀點(diǎn);但對(duì)費(fèi)希爾的方法論進(jìn)行了揚(yáng)棄，即修正了檢驗(yàn)的證偽方法。

N－P檢驗(yàn)在費(fèi)希爾理論的基礎(chǔ)上引入了競(jìng)爭(zhēng)假說，定義了推理中的兩種錯(cuò)誤，并規(guī)定統(tǒng)計(jì)推理的目的是最小化兩種錯(cuò)誤發(fā)生的可能性。費(fèi)希爾理論認(rèn)為統(tǒng)計(jì)推理類似于確定性事例的證偽;所以他強(qiáng)調(diào)檢驗(yàn)應(yīng)該在單個(gè)假說上進(jìn)行。但是統(tǒng)計(jì)假說不能被駁倒，費(fèi)希爾這樣一個(gè)準(zhǔn)反證的個(gè)人分析和辯護(hù)是非常不令人滿意的?；谶@個(gè)原因，N－P檢驗(yàn)在費(fèi)希爾理論的基礎(chǔ)上引入了競(jìng)爭(zhēng)假說，將推理中的兩種類型的錯(cuò)誤規(guī)定為:假說為真卻被視為假的，或者假說為假卻被視為真的。并借助“嚴(yán)重性”，將相對(duì)嚴(yán)重的錯(cuò)誤稱為第一類型錯(cuò)誤，次嚴(yán)重的錯(cuò)誤稱為第二類型錯(cuò)誤?？梢酝ㄟ^一個(gè)假設(shè)產(chǎn)生的實(shí)際結(jié)果來判定兩種錯(cuò)誤類型，這個(gè)假設(shè)就是【應(yīng)當(dāng)】拒絕為假的假說，且【卻實(shí)際】接受為真的假說。例如，兩個(gè)關(guān)于某種事物許可添加劑的備擇假說，一個(gè)假說認(rèn)為這種添加劑是安全的，另一個(gè)則認(rèn)為它是非常有毒的。在各種情況下，假定一種有毒添加劑安全比假定一種安全添加劑有毒更加嚴(yán)重。N－P檢驗(yàn)將零假說定義為，做出更為嚴(yán)重的錯(cuò)誤拒絕的假說。由于統(tǒng)計(jì)假說具有似然性且不能被駁倒，所以N－P方法不是為了證偽某個(gè)假說，而是竭力使兩種錯(cuò)誤發(fā)生的可能性最小化。

我們可以借用小凱伯格(Kyburg)［7］26－35的例子來表述N－P檢驗(yàn)。一顆代售的郁金香球莖的標(biāo)簽遺失了，并且買方不記得它是:包含40%紅色和和60%黃色的花種，還是:包含40%黃色和60%紅色的花種。分別規(guī)定和的概率，并且將視做零假說。檢驗(yàn)這些假說的實(shí)驗(yàn)應(yīng)該包括栽培球莖的預(yù)設(shè)數(shù)量，在此假設(shè)為10顆，它們從代售中隨機(jī)選擇，還應(yīng)該觀察其中哪些分別長(zhǎng)成紅色和黃色。這個(gè)檢驗(yàn)程序與費(fèi)希爾的程序相似，且包含以下步驟。(1)規(guī)定結(jié)果空間，本例中包含個(gè)序列，每個(gè)序列表明郁金香球莖的花色選擇從一、二，直至第十次。(2)確定檢驗(yàn)統(tǒng)計(jì)量r，在此r表示樣本中紅色出現(xiàn)的數(shù)量。(3)針對(duì)每個(gè)兩兩競(jìng)爭(zhēng)的假說，計(jì)算每個(gè)檢驗(yàn)統(tǒng)計(jì)量可能值的概率。我們假定，如果代售的郁金香球莖是大量的，那么在隨機(jī)樣本n中選擇紅花球莖r的概率，近似于常見的二項(xiàng)式函數(shù)。我們?cè)诖思僭O(shè)選擇一個(gè)紅花球莖的概率p是恒定的，這個(gè)假設(shè)越近似為真，球莖的總量就越大。在本例中，對(duì)應(yīng)p=0.40，對(duì)應(yīng)p=0.60。憑此規(guī)定這個(gè)猜想實(shí)驗(yàn)關(guān)于兩個(gè)假說的抽樣分布，如紅色r=0，黃色10－r=10 時(shí)，p1=0.0060，p2=0.0001;r=1，10 －r=9時(shí)，p1=0.0403，p2=0.0016;……;r=10，10 －r=0 時(shí)，p1=0.0001，p2=0.0060。(4)最后規(guī)定一個(gè)何時(shí)拒絕零假說的法則，在此考察樣本中出現(xiàn)的紅花幼苗等于或大于6的情形時(shí)拒絕假說的概率，即拒絕為真的的概率。這個(gè)概率同樣稱為檢驗(yàn)的顯著性水平，或者顯著性檢驗(yàn)的范圍，它是與拒絕法則相關(guān)的第一類型錯(cuò)誤。第二類型錯(cuò)誤的概率是接受為假的的概率;我們假定這兩個(gè)假說中的一個(gè)為真，其概率等于拒絕為真的的概率，根據(jù)(3)中規(guī)定的假說抽樣分布可以計(jì)算出這個(gè)概率是0.3664。

盡管N－P檢驗(yàn)較之費(fèi)希爾的理論，更貼合統(tǒng)計(jì)假說的特性，但是這種方法存在主觀因素:零假說的選擇和確定結(jié)果空間的方法。首先，N－P檢驗(yàn)方法在進(jìn)行檢驗(yàn)時(shí)，需要選擇一個(gè)競(jìng)爭(zhēng)假說來作為零假說，并通過這個(gè)選擇的結(jié)果來影響假說最終的接受或拒絕。但是零假說有可能是被任意指派的，使得N－P檢驗(yàn)理論帶上了主觀色彩。例如100個(gè)隨機(jī)抽樣中，存在50個(gè)郁金香的紅花幼苗，那么(40%紅)會(huì)在0.05水平上被拒絕，假如它是零假說的話，而(60%紅)就會(huì)被接受。但是把作為零假說，就會(huì)產(chǎn)生相反的判定!其次，顯著性檢驗(yàn)的完成，需要比較獲得的結(jié)果概率與其它可能結(jié)果概率。N－P檢驗(yàn)認(rèn)為，憑借停止法則可以創(chuàng)建可能結(jié)果空間。這條法則預(yù)先滿足了實(shí)驗(yàn)應(yīng)該停止的情況。由于停止法則暗含了主觀意圖，使得結(jié)果空間的確定具有主觀性，進(jìn)而影響了科學(xué)判斷。例如檢驗(yàn)公平硬幣假說的試驗(yàn)，要求出現(xiàn)6次正面朝上就停止試驗(yàn)，與要求試驗(yàn)者拋擲20次硬幣后停止相比，會(huì)排除許多預(yù)先可能出現(xiàn)的結(jié)果，并引入大量新結(jié)果。這兩條任意的停止法則，會(huì)產(chǎn)生不同的可能結(jié)果空間。

五、顯著性與顯著性水平:歸納與歸納支持

顯著性檢驗(yàn)方法在20世紀(jì)占主導(dǎo)地位，而且至今仍然深具影響力，許多高等教育院校的推薦教科書都對(duì)其介紹和提倡。雖然這種方法自身存在一些問題，但并沒有影響它在不確定性理論和統(tǒng)計(jì)假說中的運(yùn)用。在科學(xué)推理中，它推崇的實(shí)驗(yàn)設(shè)計(jì)程序和數(shù)據(jù)分析已經(jīng)成為許多科學(xué)家的校正標(biāo)準(zhǔn)。

然而，從科學(xué)方法論的層面上看，顯著性檢驗(yàn)面臨是否具有歸納意義的質(zhì)疑。這種質(zhì)疑源于其方法論根源。顯著性檢驗(yàn)適用于統(tǒng)計(jì)推理，其結(jié)論具有或然性，它本質(zhì)上是一種歸納方法。但是這種檢驗(yàn)的方法論基礎(chǔ)是波普爾的證偽主義，其推理程序追求的是零假說被否證或拒絕。而“零假說在某顯著性水平上被拒絕”是一種專門表述，僅僅記錄了一個(gè)經(jīng)驗(yàn)結(jié)果落在一個(gè)結(jié)果的特定“拒絕空間”上。然而，作為一個(gè)該假說的歸納推論，又是什么意思呢?換言之，接受和拒絕一個(gè)假說到底意味著什么呢?關(guān)于顯著性歸納的辯護(hù)沒有一種是令人滿意的。

費(fèi)希爾把邏輯反駁的過程作為其顯著性檢驗(yàn)的模型。他認(rèn)為這類檢驗(yàn)?zāi)軌颉胺醋C”一個(gè)理論［8］16。費(fèi)希爾在此似乎表明了統(tǒng)計(jì)理論事實(shí)上或許可被證偽，雖然他清楚這是不可能的，但是他最終仍訴諸一個(gè)弱解釋，即在顯著性檢驗(yàn)中，零假說對(duì)應(yīng)的顯著結(jié)果或臨界結(jié)果是不大可能的。因此，一個(gè)顯著性結(jié)果的影響力相當(dāng)于邏輯上簡(jiǎn)單析取的影響力:或者具有“很小的可能性”(一個(gè)不可能事件)，或者零假說是錯(cuò)的，或者二者兼?zhèn)?。哈金認(rèn)為，費(fèi)希爾的辯護(hù)只是相當(dāng)于空洞的老生常談［9］81。

奈曼和皮爾遜把歸納視作一種行為，顯著性檢驗(yàn)的結(jié)果是一種決策。即在顯著性檢驗(yàn)后，一個(gè)人接受某個(gè)假說時(shí)，他應(yīng)該假定相信該假說為真;且如果一個(gè)人拒絕某個(gè)假說，他的行為應(yīng)該受到假說為假的假定的指導(dǎo)。奈曼和皮爾遜規(guī)定拒絕法則的根據(jù)在于［10］142，雖然一個(gè)顯著性檢驗(yàn)沒有確定假說h在特定情形下是否為真，但是如果我們根據(jù)拒絕法則行動(dòng)，那么我們會(huì)在這個(gè)長(zhǎng)序列中拒絕h。這類實(shí)用且任意的決策不具有認(rèn)識(shí)論意義，且不能構(gòu)成歸納支持的基礎(chǔ):(1)一個(gè)人的行為與信念相關(guān)，而與假說的實(shí)際真假可能無關(guān)，即如果某個(gè)人無論如何都不相信h，那么不管h確定為真或?yàn)榧?，他都?huì)受到信念的鼓舞，而堅(jiān)持拒絕假說h;(2)一個(gè)人的行為與信念不對(duì)稱，因?yàn)閷?shí)際上只有兩個(gè)行為是可能的，即行或不行，但這并不意味著只能抱有兩個(gè)關(guān)于這些行為的信念。如商家可以指派概率給不同假說，然后通過權(quán)衡這些行為可能結(jié)果效用的概率，決定是否出售這批商品。

古典統(tǒng)計(jì)學(xué)家承認(rèn)，通常不能用絕對(duì)化的術(shù)語來評(píng)估理論的接受和拒絕，所以他們嘗試著在分析中附加關(guān)于證據(jù)強(qiáng)度或歸納支持的觀念，但這種把顯著性水平與證據(jù)強(qiáng)度聯(lián)系起來的努力并沒有付諸成功的可能性。為了證明這種聯(lián)系，你需要以一個(gè)恰當(dāng)?shù)淖C據(jù)或歸納支持概念作為出發(fā)點(diǎn);事實(shí)上，在顯著性檢驗(yàn)術(shù)語中沒有系統(tǒng)闡述過這種概念，沒有一個(gè)術(shù)語可能做到。這里有兩個(gè)理由。第一，顯著性檢驗(yàn)導(dǎo)出的結(jié)論通常與一個(gè)公正科學(xué)家或普通觀察者刻畫的結(jié)論截然相反，相互矛盾。第二，顯著性檢驗(yàn)的影響因素，被合理視作與證據(jù)支持的判定無關(guān)。

六、結(jié)語

波普爾提出的證偽主義顛覆了邏輯經(jīng)驗(yàn)主義的證實(shí)或確證進(jìn)路，采取了一種否證的態(tài)度，為科學(xué)推理提供了新的推理模式。但是這種方法的反歸納性，有時(shí)候并不符合科學(xué)探索活動(dòng)的實(shí)際過程。而且將證偽方法擴(kuò)展到不確定性理論的推理中，也出現(xiàn)了同樣的問題，即基于證偽主義方法論的統(tǒng)計(jì)推理模型——顯著性檢驗(yàn)，面臨歸納意義的質(zhì)疑。證偽主義方法的可能修正進(jìn)路有:一是，從定性進(jìn)路上看，引入“真”的概念，明確證偽方法的歸納性。這種進(jìn)路的依據(jù)在于，波普爾后期對(duì)真理語義學(xué)的贊同和嘗試。波普爾早在1934年的《探究的邏輯》(德文版)中曾經(jīng)回避過“真”和“假”的概念(當(dāng)時(shí)認(rèn)為“真”的概念缺乏語義確定性)，但當(dāng)知悉塔爾斯基的真理語義學(xué)理論后，他十分認(rèn)同該理論的恰當(dāng)性，隨后也嘗試著將該理論運(yùn)用于自己的科學(xué)哲學(xué)中，而真理語義學(xué)理論回答了一個(gè)陳述為真的語義學(xué)問題。二是，從定量進(jìn)路上看，引入概率分析，顯示證偽方法的定量歸納支持。這種進(jìn)路的可行性表現(xiàn)在統(tǒng)計(jì)推理中，用貝葉斯主義概率方法檢驗(yàn)假說時(shí)取得的成功。貝葉斯統(tǒng)計(jì)推理不同于顯著性檢驗(yàn)的證偽方法，它是一種依托貝葉斯定理，通過相應(yīng)先驗(yàn)分布而來的后驗(yàn)概率或密度分布，來獲取新信息的計(jì)算。一方面，貝葉斯方法避免了費(fèi)希爾理論中檢驗(yàn)統(tǒng)計(jì)量的選擇任意性難題，以及N－P檢驗(yàn)中零假說和可能結(jié)果空間的選擇主觀性問題，它通過計(jì)算后驗(yàn)概率來直接檢驗(yàn)假說。另一方面，貝葉斯定理成為定量進(jìn)路的歸納邏輯的模式，可見這種概率方法在統(tǒng)計(jì)推理中具有優(yōu)越性和歸納性。

［1］Kant，I.1783，Prolegomena to any Future Metaphysics，Edited by L.W.Beck，1950.Indianapolis:The Bobbs－ Merrill Company，Inc.

［2］Howson，C.and Urbach，P.2006，Scientific Reasoning:The Bayesian Approach，La Salle，IL:Open Court.

［3］Keuth，H.2005，The Philosophy of Karl Popper，Cambridge，UK:Cambridge University Press.

［4］Popper，K.R.1959a.The Logic of Scientific Discovery，London:Hutchinson.

［5］Cournot，A.A.1843，Exposition de la Théories des Chances et des Probabilités，Paris.

［6］Fisher，R.A .1947，The Design of Experiments，4th edition.Edinburgh:Oliver and Boyd.

［7］Kyburg，H.E.，Jr.1974，The Logical Foundations of Statistical Inference，Dordrecht and Boston:Reidel Publishing Company.

［8］Fisher，R.A.1947，The Design of Experiments，4th edition.Edinburgh:Oliver and Boyd.

［9］Hacking，I.1965，Logic of Statistical Inference，Cambridge:Cambridge University Press.

［10］Neyman，J.and Pearson，E.S.1933.“One the Problem of the Most Efficient Tests of Statistical Hypotheses”，Philosophical Transactions of the Royal Society，vol.231A.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

證偽主義方法在統(tǒng)計(jì)推理中的擴(kuò)展和運(yùn)用

一、證偽主義方法與歸納問題

二、統(tǒng)計(jì)推理的波普爾—古諾觀點(diǎn):統(tǒng)計(jì)中的證偽主義

三、費(fèi)希爾的顯著性檢驗(yàn):統(tǒng)計(jì)證偽方法的發(fā)展

四、奈曼—皮爾遜顯著性檢驗(yàn):對(duì)費(fèi)希爾證偽方法的修正

五、顯著性與顯著性水平:歸納與歸納支持

六、結(jié)語

二、統(tǒng)計(jì)推理的波普爾—古諾觀點(diǎn):統(tǒng)計(jì)中的證偽主義

三、費(fèi)希爾的顯著性檢驗(yàn):統(tǒng)計(jì)證偽方法的發(fā)展

四、奈曼—皮爾遜顯著性檢驗(yàn):對(duì)費(fèi)希爾證偽方法的修正

五、顯著性與顯著性水平:歸納與歸納支持

六、結(jié)語