李 帥
實(shí)質(zhì)歸納理論是近些年歸納邏輯領(lǐng)域發(fā)展出的一套新理論,它拒斥帶有普遍模式的歸納理論。該理論倡導(dǎo)“‘沒(méi)有普遍適用的歸納規(guī)則’(there are no universal rules for inductive inference)、‘所有歸納都是局部的’(all induction is local),強(qiáng)調(diào)歸納推理從科學(xué)實(shí)踐的事實(shí)中獲得合法性和可靠性,這些事實(shí)就是歸納的實(shí)質(zhì),每一個(gè)領(lǐng)域的特定事實(shí)證明了在該領(lǐng)域內(nèi)可接受的歸納推理”(1)李帥《一種舊的新邏輯:實(shí)質(zhì)歸納理論》,《科學(xué)技術(shù)哲學(xué)研究》2020年第1期,第20頁(yè)。。歸納的實(shí)質(zhì)進(jìn)路有一個(gè)推論,即概率方法不能為歸納推理提供普遍適用的解釋。實(shí)質(zhì)歸納理論并不排斥數(shù)學(xué)方法,前提是當(dāng)形式方法適用時(shí)才能發(fā)揮其效用。問(wèn)題恰恰出在這里。目前學(xué)界有一種觀點(diǎn)傾向認(rèn)為概率理論能夠適用于幾乎所有的科學(xué)領(lǐng)域,甚至可以擴(kuò)展至某些人文社會(huì)科學(xué)領(lǐng)域。我們指出貝葉斯主義推理無(wú)法達(dá)成此目標(biāo),并通過(guò)討論擴(kuò)展1,3,5,7序列的歸納問(wèn)題,闡明實(shí)質(zhì)歸納理論的基本思想,說(shuō)明貝葉斯主義推理的局限性。在處理這個(gè)具體問(wèn)題時(shí),如果沒(méi)有背景事實(shí)保證該推理,問(wèn)題將不可解,而背景事實(shí)正是形式歸納理論所忽視的。
實(shí)質(zhì)歸納理論的競(jìng)爭(zhēng)理論是形式歸納理論,而最有資格代表形式歸納理論的就是貝葉斯推理。粗略地看,貝葉斯理論不能被歸為演繹推理,而是運(yùn)用概率論的數(shù)學(xué)理論形式地表述其規(guī)則(2)Jonathan Weisberg, “Varieties of Bayesianism,” in Handbook of the History of Logic, Volume 10: Inductive Logic, ed. Dov M. Gabbay, Stephan Hartmann and John Woods (Amsterdam: North-Holland, 2011), 477.。有一個(gè)群體自稱為“貝葉斯主義者”,他們致力于所謂的“貝葉斯主義認(rèn)識(shí)論”,其核心思想是信念問(wèn)題和歸納推理問(wèn)題只能用概率論的方法解決。中心結(jié)構(gòu)是一個(gè)條件概率測(cè)度P(A|B),即命題A相對(duì)于背景命題B的概率。“貝葉斯主義”一詞源于概率演算中的一個(gè)定理——貝葉斯定理,該定理為貝葉斯主義認(rèn)識(shí)論提供了“引擎”。推理始于對(duì)假設(shè)h的驗(yàn)前信念或歸納支持度P(h),學(xué)習(xí)證據(jù)e使得驗(yàn)前概率更新為驗(yàn)后概率P(h/e),驗(yàn)后概率就是導(dǎo)入證據(jù)后的修正概率,驗(yàn)后概率借助貝葉斯定理計(jì)算。
就目前而言,貝葉斯理論在歸納邏輯文獻(xiàn)中占據(jù)主導(dǎo)地位。各種版本的貝葉斯理論所共有的核心思想是:在一個(gè)近似值的基礎(chǔ)上,科學(xué)家的信念應(yīng)該符合一個(gè)概率測(cè)度,新證據(jù)的引入則是通過(guò)條件化來(lái)實(shí)現(xiàn)的。
貝葉斯理論之所以占據(jù)歸納邏輯的主導(dǎo)地位,主要在于它有三個(gè)顯著優(yōu)點(diǎn):第一,該理論將通常模糊的歸納邏輯概念簡(jiǎn)化為單一的、精確的演算,即概率演算;第二,該理論的解釋力強(qiáng)、兼容性佳,能夠?qū)⒃谄渌胤匠霈F(xiàn)的獨(dú)立證據(jù)系統(tǒng)化;第三,是一致性的保證,這也是該理論最為突出的優(yōu)點(diǎn)。當(dāng)一個(gè)待確證理論的范圍越大,我們就越有必要吸收各類證據(jù),但大多都不能在處理大量證據(jù)時(shí)保證一致性。貝葉斯確證理論為我們提供了一個(gè)簡(jiǎn)單的圖景:任何時(shí)刻的全部證據(jù)都被納入到一個(gè)概率分布中。無(wú)論證據(jù)范圍有多大,只要我們按照概率演算規(guī)則形成和更新信念,就不會(huì)在證據(jù)判斷中產(chǎn)生矛盾(3)John D. Norton, “Challenges to Bayesian Confirmation Theory,” in Handbook of the Philosophy of Science, Volume 7: Philosophy of Statistics, ed. Prasanta S. Bandyopadhyay and Malcolm R. Forster (Amsterdam: North-Holland, 2011), 391.。
正是有了這些優(yōu)點(diǎn),貝葉斯主義的支持者們希望貝葉斯主義的優(yōu)勢(shì)地位能夠延續(xù)下去。但從歸納的演進(jìn)歷史來(lái)看,我們認(rèn)為貝葉斯主義目前的成功是相對(duì)的、暫時(shí)的。在18世紀(jì),托馬斯·貝葉斯(Thomas Bayes)首先將歸納推理方法用于概率論基礎(chǔ)理論,并創(chuàng)立了貝葉斯統(tǒng)計(jì)理論。但即便如此,在當(dāng)時(shí)也只有少數(shù)人認(rèn)為概率論提供了理解歸納推理的正確方法。19世紀(jì)歸納法的主流觀點(diǎn)沿襲了培根及其三表法的傳統(tǒng),其最具影響力的表述是密爾在《邏輯體系》中提出的“穆勒五法”(4)舊稱之為“穆勒五法”,已約定成俗。雖然在本文中人名統(tǒng)一譯為“密爾”,但已經(jīng)約定的術(shù)語(yǔ)便不做改動(dòng)。。這種優(yōu)勢(shì)一直持續(xù)到20世紀(jì)中期,在此期間,與密爾方法競(jìng)爭(zhēng)的是歸納推理中的假說(shuō)-演繹法。假說(shuō)-演繹法歷史悠久,可由笛卡爾的假設(shè)方法追溯至古希臘時(shí)期,柏拉圖曾要求天文學(xué)家尋找能夠“拯救天文學(xué)現(xiàn)象”的幾何行星結(jié)構(gòu)。就在數(shù)十年前,科學(xué)哲學(xué)文獻(xiàn)中還充斥著處理亨普爾烏鴉悖論的方案(5)John D. Norton, “Challenges to Bayesian Confirmation Theory,” in Handbook of the Philosophy of Science, Volume 7: Philosophy of Statistics, 392.。貝葉斯歸納理論和確證理論直到20世紀(jì)下半葉才逐漸在歸納邏輯和科學(xué)哲學(xué)中占據(jù)優(yōu)勢(shì)地位,科林·豪森(Colin Howson)和彼得·烏爾巴赫(Peter Urbach)等人是貝葉斯進(jìn)路的旗手,這段時(shí)期貝葉斯理論的書籍如雨后春筍般冒出來(lái)。
貝葉斯主義經(jīng)歷了過(guò)山車般的幾起幾落。為此,我們似乎應(yīng)該秉持一種更加謹(jǐn)慎的立場(chǎng),預(yù)想貝葉斯方法可能會(huì)從目前的優(yōu)勢(shì)地位上退下來(lái),再次成為評(píng)估歸納推理關(guān)系的諸多有用工具之一。這主要基于兩個(gè)原因:首先是那些不屬于貝葉斯陣營(yíng)的人,他們提出了直接的挑戰(zhàn);其次是貝葉斯主義者發(fā)現(xiàn)了貝葉斯主義推理的缺點(diǎn),他們轉(zhuǎn)而在貝葉斯體系中作修補(bǔ)。
實(shí)質(zhì)歸納理論的中心論點(diǎn)是,歸納推理沒(méi)有統(tǒng)一的規(guī)則,反對(duì)任何演算的、概率的或其他可以普遍適用的觀點(diǎn)。其核心在于:任何歸納邏輯都必須限制超出邏輯一致性的方法。因此,如果該領(lǐng)域的事實(shí)符合歸納邏輯的事實(shí)限制,那么歸納邏輯就適用于某些領(lǐng)域。由于沒(méi)有普遍適用的事實(shí)限制,一般來(lái)說(shuō),不同的領(lǐng)域需要不同的歸納邏輯。約翰·諾頓(John Norton)認(rèn)為所有的歸納都可以歸為三個(gè)“家族”:歸納概括、假說(shuō)歸納、概率歸納。每個(gè)“家族”都有一個(gè)原則,依據(jù)該原則可以區(qū)分不同的“家族”。此外,每個(gè)“家族”各有其“原型”(Archetype),這是該原則的首次運(yùn)用或?yàn)槲覀兯煜さ脑缙谛螒B(tài)。但是這些“原型”都有不完善的地方,不存在完美的“家族”和“原型”(6)John D. Norton, “A Little Survey of Induction,” in Scientific Evidence: Philosophical Theories and Applications, ed. Peter Achinstein (Baltimore: The Johns Hopkins University Press, 2005), 10-11.。而貝葉斯推理屬于概率歸納“家族”,也不可避免地存在缺陷。
擴(kuò)展1,3,5,7序列的歸納推理問(wèn)題是這樣的:給定數(shù)字1,3,5,7的初始序列,那么該序列的后繼該以何種方式接續(xù)下去?給定的前提是一個(gè)極平凡的數(shù)學(xué)事實(shí),該序列能以可設(shè)想的任何一種方式延綿展開(kāi)。
有人可能會(huì)認(rèn)為,此類歸納推理問(wèn)題不過(guò)是某位哲學(xué)家坐在扶手椅上的構(gòu)想,與科學(xué)中歸納推理的實(shí)際運(yùn)用無(wú)關(guān),因此我們大可不必去理會(huì)。事實(shí)上,這個(gè)問(wèn)題是科學(xué)歸納推理的經(jīng)典問(wèn)題之一,如果結(jié)合具體的科學(xué)史案例,這個(gè)特殊的數(shù)字序列甚至可被列為科學(xué)史上最偉大的發(fā)現(xiàn)之一。在伽利略·伽利雷(Galileo Galilei)的《關(guān)于兩門新科學(xué)的對(duì)話》(以下簡(jiǎn)稱《對(duì)話》)中,他提出了自由落體定律,斷言物體作初速度為零的勻加速直線運(yùn)動(dòng),從開(kāi)始計(jì)時(shí)起,在相等的時(shí)間間隔內(nèi)的位移比為奇數(shù)比1∶3∶5∶7∶……,盡管呈現(xiàn)出來(lái)的規(guī)律很簡(jiǎn)單,但伽利略的發(fā)現(xiàn)之路卻漫長(zhǎng)而曲折(7)伽利略《關(guān)于兩門新科學(xué)的對(duì)話》,武際可譯,北京大學(xué)出版社2006年版,第161頁(yè)。。
我們提出一個(gè)簡(jiǎn)化的伽利略式的歸納問(wèn)題??紤]到連續(xù)時(shí)間單位的增量距離在1∶3∶5∶7之間,在隨后的時(shí)間里,距離是多少?利用對(duì)伽利略來(lái)說(shuō)可用的資源,如何解決這個(gè)問(wèn)題?伽利略假定下落物體受一條規(guī)則支配,這條規(guī)則可以用數(shù)學(xué)手段表達(dá)。這一想法在《對(duì)話》中得到了體現(xiàn),伽利略考察了下落物體速度的增加:“為什么我不相信這種增加發(fā)生的方式是以對(duì)任何人都非常簡(jiǎn)單的和相當(dāng)明顯的方式發(fā)生的呢?”(8)伽利略《關(guān)于兩門新科學(xué)的對(duì)話》,第148頁(yè)。伽利略的推理由一個(gè)事實(shí)所保證:世界這一部分的性質(zhì)是簡(jiǎn)單的。如果我們細(xì)致閱讀伽利略的著作,就會(huì)發(fā)現(xiàn)一個(gè)更有力的表述,伽利略提出了某種“簡(jiǎn)單性”概念。
伽利略在《試金者》(TheAssayer)中有一段膾炙人口的名言:“哲學(xué)在宇宙這本宏偉巨著中書寫著,宇宙不斷地向我們的凝視敞開(kāi)。但是,除非首先學(xué)會(huì)理解語(yǔ)言并閱讀它所構(gòu)成的字母,否則我們無(wú)法理解這本巨著。它是用數(shù)學(xué)的語(yǔ)言寫成的,它的文字是三角形、圓形和其他幾何圖形。沒(méi)有這些,人類根本不可能理解書中的一個(gè)字;沒(méi)有這些,人類還在黑暗的迷宮中游蕩?!?9)Galileo Galilei, Discoveries and Opinions of Galileo, trans. Stillman Drake (New York: Doubleday, 1957), 237-238.
這是一種典型的數(shù)學(xué)柏拉圖主義,即認(rèn)為世界的結(jié)構(gòu)是完美數(shù)學(xué)形式的副本。這個(gè)關(guān)于世界的事實(shí)陳述保證了一個(gè)簡(jiǎn)單的數(shù)學(xué)推理規(guī)則的延續(xù)序列:1,3,5,7,……。
要是初次接觸這種觀念,我們免不了被其深深吸引。倘若世界可以用簡(jiǎn)單的數(shù)學(xué)描述來(lái)刻畫,為什么我們不能用這個(gè)事實(shí)來(lái)進(jìn)行歸納推理呢?在更審慎地考察后,我們的熱情就會(huì)迅速消退。在柏拉圖主義者看來(lái),世界可以被描述為簡(jiǎn)單的數(shù)學(xué)模式,這就是一種擔(dān)保性的事實(shí)。但從伽利略時(shí)代至今,數(shù)學(xué)方法在科學(xué)上的成功并不能證明柏拉圖主義觀點(diǎn)是正確的,這種成功僅能反映出數(shù)學(xué)對(duì)于新的科學(xué)發(fā)現(xiàn)的特殊適應(yīng)性。
如果1,3,5,7序列目前只列出了前四項(xiàng),那么該序列后續(xù)數(shù)字的排列可能性將是無(wú)窮的。因此,倘若要使對(duì)序列進(jìn)行歸納推理成為可能的話,必須要借助一些背景事實(shí)。否則,無(wú)窮多可能的序列便不存在規(guī)律性,歸納推理對(duì)沒(méi)有規(guī)律性的東西也束手無(wú)策。
如果我們假設(shè)序列受某個(gè)簡(jiǎn)單規(guī)則約束,那么序列展開(kāi)的可能性會(huì)受到極大的限制。但即便有某個(gè)簡(jiǎn)單的規(guī)則約束,該序列仍有許多可能的擴(kuò)展形式。
比如,序列可能只是奇數(shù):1,3,5,7,9,11,13,15,…… 。
或者,序列也可能是奇質(zhì)數(shù),如:1,3,5,7,11,13,17,……。
甚至可以是359/2 645的十進(jìn)制擴(kuò)展的數(shù):1,3,5,7,2,7,7,8,8,2,8,……。
雖然序列的可能性是有限的,但這里顯露的歸納問(wèn)題仍舊很棘手,因?yàn)檫@里所謂的“簡(jiǎn)單規(guī)則”概念沒(méi)有得到充分說(shuō)明。這樣的話,就使得尋找其他的可能延續(xù)方式變成了一項(xiàng)單純的創(chuàng)造性活動(dòng)。在某種意義上說(shuō),這些規(guī)律看起來(lái)很簡(jiǎn)單,并且我們恰好發(fā)現(xiàn)它們也是恰當(dāng)?shù)?。這里的“恰當(dāng)”并無(wú)任何優(yōu)先級(jí)的意味,如果我們單就簡(jiǎn)單性而論,這些序列都是簡(jiǎn)單的。
另一種方法就是將該序列嵌入到具有更多信息的語(yǔ)境中。例如,這些數(shù)字可能來(lái)自隨機(jī)抽獎(jiǎng)機(jī),然后隨機(jī)化的事實(shí)授權(quán)了概率分析,概率歸納支持分布在剩余的數(shù)字上;或許這些數(shù)字出現(xiàn)在智商測(cè)試的問(wèn)題中;諸如此類。這些不同的背景事實(shí)將會(huì)授權(quán)對(duì)序列的不同推理,盡管背景的復(fù)雜性使得辨別它們的精確特征變得更為繁瑣。但是,世界的復(fù)雜性造就了多樣化的領(lǐng)域,我們必須正視它,而不是回避它,即便采用此類處理方式會(huì)帶來(lái)更大的工作量。
隨著探查的深入,面對(duì)這些不斷增加的困難,我們很可能會(huì)懷疑伽利略是否有足夠的背景事實(shí)來(lái)保證它是一個(gè)好的推理。我們幸運(yùn)地發(fā)現(xiàn),他確實(shí)假定了另一個(gè)背景事實(shí),可以保證推理的進(jìn)行并排除其他可能性,盡管他的這方面工作在歷史上很少受到關(guān)注。
伽利略的實(shí)驗(yàn)方法無(wú)法確定精確的時(shí)間單位。在一個(gè)實(shí)驗(yàn)中,他最多可以確定連續(xù)的時(shí)間間隔是相等的,盡管時(shí)間單位會(huì)發(fā)生變化,但他發(fā)現(xiàn)實(shí)驗(yàn)結(jié)果卻是穩(wěn)定的。在測(cè)量落體速度時(shí),無(wú)論使用何種不同時(shí)間單位,都出現(xiàn)了相同的比率1∶3∶5∶7……。伽利略指出了這個(gè)重要事實(shí),當(dāng)他提出這個(gè)奇數(shù)比例公式時(shí)。他寫道:因此很明顯,如果我們采取相同的間隔時(shí)間,計(jì)算從一開(kāi)始的運(yùn)動(dòng),如AD,DE,EF,F(xiàn)G,在空間HL,LM,MN,NI遍歷,這些空間將彼此有著相同的比率:一系列奇數(shù),1,3,5,7……(10)John D. Norton, “Invariance of Galileo’s Law of Fall under a Change of the Unit of Time,” PhilSci-Archive, last modified August 8, 2014, accessed March 5, 2021, https://philsci-archive.pitt.edu/id/eprint/10931.。由此得出結(jié)果的不變性:通過(guò)簡(jiǎn)單的計(jì)算,我們可以看到在時(shí)間單位變化下的不變性。在連續(xù)的時(shí)間單位里,物體落下的距離為:1、3、5、7、9、11、13、15、17、19……。
現(xiàn)在用一個(gè)等于兩個(gè)舊單位的新單位替換原來(lái)的時(shí)間單位。與新單位的連續(xù)單位時(shí)間內(nèi)的距離為:
1+3,5+7,9+11,13+15,17+19,……
=4,12,20,28,36,……
=4×1,4×3,4×5,4×7,4×9,……
伽利略定律只需要這些距離的比率為1∶3∶5∶7……。因此,我們可以忽略倍數(shù)4的因素,并觀察它們是否符合規(guī)律(11)John D. Norton, “Invariance of Galileo’s Law of Fall under a Change of the Unit of Time,” PhilSci-Archive, last modified August 8, 2014, accessed March 5, 2021, https://philsci-archive.pitt.edu/id/eprint/10931.。伽利略斷言,無(wú)論我們選擇哪一種時(shí)間單位,都可以得到這種不變性。
值得注意的是,很少有遵守這種不變性的定律。利用微積分和函數(shù)分析,可以證明該定律,當(dāng)然伽利略不可能用到這樣的技術(shù)手段。如果d(t)是時(shí)間單位(t-1)到t的距離,那么,d(t)與tp-(t-1)p成正比。其中p是大于0的實(shí)數(shù)。這意味著在任何測(cè)量之前,定律允許的范圍已經(jīng)大幅減少。
賦予該推理以極大效力的是這樣一個(gè)事實(shí):在定律中只有一個(gè)自由參數(shù)p。因此,根據(jù)實(shí)驗(yàn),僅保證一個(gè)距離比就確定了唯一的定律。例如,據(jù)伽利略所測(cè)量的第一個(gè)比率,d(2)/d(1)=3。那么p必須滿足:
唯一解是p=2,所以d(t)正比于t2-(t-1)2=t2-(t2-2t+1)=2t-1。
因此連續(xù)時(shí)間t=1,2,3,4,……,我們有d(t)=1,3,5,7,……,即奇數(shù)序列。
當(dāng)然,伽利略并不知道這一結(jié)果的普遍性,他很有可能意識(shí)到了這種不變性有多么地嚴(yán)格。雖然伽利略在《對(duì)話》中沒(méi)有對(duì)這一結(jié)果加以詳細(xì)闡述,但克里斯蒂安·惠更斯(Christiaan Huygens)隨后獨(dú)立發(fā)現(xiàn)了這個(gè)結(jié)果。但惠更斯的證明還不夠普遍,因?yàn)樗雎粤司嚯xd(t)在公式tp-(t-1)p中除了p值為2以外的情況。雖然有人設(shè)想可能以更普遍的方式給出證明,但如果沒(méi)有比伽利略和惠更斯所使用的更為強(qiáng)大的數(shù)學(xué)手段,似乎就沒(méi)有明顯的方法來(lái)達(dá)到一般的證明,這也解釋了為什么伽利略沒(méi)有詳細(xì)闡釋《對(duì)話》的結(jié)果。
伽利略式歸納推理問(wèn)題預(yù)設(shè)有一個(gè)現(xiàn)成的解決方案。我們假設(shè)在連續(xù)的時(shí)間單位中,增量距離的比率是1∶3∶5∶7……伽利略有兩個(gè)可獲得的事實(shí):約束序列的規(guī)則是簡(jiǎn)單的;規(guī)則在時(shí)間單位的變化下不變。更完整的分析表明,第二個(gè)事實(shí)——不變性本身就足以授權(quán)這個(gè)推理。這種不變性可能排除了奇數(shù)之外的所有擴(kuò)展。
有人可能會(huì)辯駁,將序列擴(kuò)展為1,3,5,7的一般性歸納問(wèn)題,是貝葉斯方法所擅長(zhǎng)的。貝葉斯分析是否能在不需要特定背景事實(shí)的情況下取得成功呢?很遺憾,貝葉斯分析不能提供一個(gè)成功的、普遍的解決方案。在貝葉斯分析中有兩個(gè)明顯失誤:一是貝葉斯分析未能提供初始序列1,3,5,7歸納學(xué)習(xí)的證據(jù);二是驗(yàn)前概率以及標(biāo)準(zhǔn)化的要求制約了分析。接下來(lái),將探討貝葉斯分析如何幫助我們選擇序列1,3,5,7的兩種方式的擴(kuò)展:
奇數(shù)序列Hodd:1,3,5,7,9,11,13,15,……
奇質(zhì)數(shù)序列Hprime*:1,3,5,7,11,13,15,……
所使用的證據(jù)E:1,3,5,7。
運(yùn)用貝葉斯定理:
由于Hodd和Hprime*的每一項(xiàng)都演繹地蘊(yùn)涵E,所以有P(E|Hodd)=P(E|Hprime*)=1。
因此貝葉斯定理可以簡(jiǎn)化為:
根據(jù)定理,我們從E的證據(jù)中學(xué)到了什么?驗(yàn)前概率P(Hodd)和P(Hprime*)表示我們對(duì)這兩個(gè)假設(shè)的初始不確定性;一旦我們有了證據(jù),驗(yàn)后概率P(Hodd|E)和P(Hprime*|E)代表了它們的更新值。貝葉斯定理的簡(jiǎn)化形式告訴我們,這兩個(gè)假設(shè)在證據(jù)上的條件化上沒(méi)有區(qū)別。驗(yàn)前概率與驗(yàn)后概率之比相同,這對(duì)于任何一對(duì)假設(shè)的序列都成立。即就在兩個(gè)假設(shè)之間的選擇而言,我們并沒(méi)有從證據(jù)中學(xué)到什么新的東西。
邏輯上與證據(jù)不相容的假設(shè)將被消除。例如,自然數(shù)Hnat,1,2,3,4,5,6,……由于Hnat在邏輯上與E不相容,我們有P(E|Hnat)=0,驗(yàn)后概率為P(Hnat|E)=0。然而,這個(gè)結(jié)果并不是歸納的,我們簡(jiǎn)單地排除了與證據(jù)不符的所有假設(shè)。我們很容易得到這個(gè)演繹結(jié)果,不需要概率演算或任何其他的歸納操作。證據(jù)是否支持那些演繹上與之相符的假設(shè)?我們關(guān)注的是歸納問(wèn)題,在這里貝葉斯分析沒(méi)有提供任何有用的東西。在我們學(xué)習(xí)證據(jù)之前,我們的歸納偏好是完全一樣的。結(jié)果令人失望,然而追問(wèn)如何賦值驗(yàn)前概率將是有益的。根據(jù)我們是主觀貝葉斯主義者還是客觀貝葉斯主義者,分析會(huì)大不一樣。如果我們是主觀貝葉斯主義者,那么我們的驗(yàn)前概率僅僅是偏好的表達(dá),只有與概率演算的公理相容才會(huì)受到約束。我們可能會(huì)認(rèn)為這些偏好決定了Hodd的概率是Hprime*的三倍。然后我們得出驗(yàn)后概率:
P(Hodd|E)= 3*P(Hprime*|E)
似乎可以從該等式中學(xué)到一些東西,但實(shí)際上并沒(méi)有,Hodd與Hprime*的三倍驗(yàn)后概率差異是對(duì)我們先前偏好的直接表征。
如果我們是客觀貝葉斯主義者,將會(huì)訴諸驗(yàn)前概率,客觀地反映我們所知道的。在這種情況下,假設(shè)我們一無(wú)所知,所以我們沒(méi)有理由更喜歡一個(gè)假設(shè)的序列。因此適當(dāng)?shù)尿?yàn)前概率分配相同的小概率ε,即:
P(Hodd)= P(Hprime*)= ε
轉(zhuǎn)換為貝葉斯定理的簡(jiǎn)化形式:
P(Hodd|E)= P(Hprime*|E)
依舊什么也沒(méi)學(xué)到。我們最初的假設(shè)是所有的假設(shè)都是相同的,對(duì)于任何與證據(jù)相容的假設(shè)都成立。最后的結(jié)論忽略了一個(gè)復(fù)雜的問(wèn)題,這個(gè)問(wèn)題深深地困擾著主觀和客觀貝葉斯主義者。驗(yàn)前概率分布必須標(biāo)準(zhǔn)化,即分配給所有可能序列的驗(yàn)前概率必須等于1。如果給定一個(gè)不可數(shù)無(wú)限的可能序列,這意味著,在很大程度上,大多數(shù)可能序列的驗(yàn)前概率必須被賦值為零。一旦一個(gè)序列的驗(yàn)前概率被指派為零,它在任何證據(jù)上的驗(yàn)后概率都是零。這意味著,無(wú)論多么有利的證據(jù),我們都不予考慮。因此,無(wú)論是持主觀的還是客觀的立場(chǎng),貝葉斯推理都必然在學(xué)習(xí)任何證據(jù)之前作出不可避免的負(fù)面性決定,因?yàn)樵谌魏巫C據(jù)面前,幾乎沒(méi)有哪個(gè)序列是可學(xué)習(xí)的。
當(dāng)然,也有解決該問(wèn)題的辦法。我們可能會(huì)保留齊一的驗(yàn)前概率分布,通過(guò)簡(jiǎn)單地選擇一個(gè)有限子集的序列,然后將剩余的部分扔到零概率的“垃圾簍”中。如果我們避開(kāi)驗(yàn)前概率的齊一性變量的概率,我們可以擴(kuò)展非零驗(yàn)前概率序列集至可數(shù)無(wú)窮集。只要當(dāng)我們處理集合的時(shí)候驗(yàn)前概率降低得足夠快,那么這些概率的總和就可以是1,滿足標(biāo)準(zhǔn)化的要求。一種實(shí)現(xiàn)的方法是將這些不同的非零概率較少指派給任意長(zhǎng)度的序列,但長(zhǎng)度總是有限的。如果這樣做,我們需要一些規(guī)則來(lái)決定哪些序列指派更大概率,哪些是不可能的。通行的選擇是使用雷·所羅門諾夫(Ray Solomonoff)所倡導(dǎo)的驗(yàn)前概率分布(12)R. J. Solomonoff, “A Formal Theory of Inductive Inference. Part Ⅰ,” Information and Control 7, no. 1 (March 1964): 1.??珊?jiǎn)要描述的序列,如1,2,1,2,1,2……比不能簡(jiǎn)單描述的序列具有更大的驗(yàn)前概率。這是通過(guò)指數(shù)因子(1/2)N使用“懲罰函數(shù)”(Penalizing Function)指派每個(gè)序列的概率來(lái)實(shí)現(xiàn)的,其中N為序列的最短可描述的圖靈機(jī)程序長(zhǎng)度。采用這種驗(yàn)前概率分布的貝葉斯分析以天真的熱情構(gòu)建了“歸納推理的完備理論”(Complete Theory of Inductive Inference)或“通用歸納”(13)“通用歸納”的譯法借鑒李熙。參見(jiàn):李熙《卡爾納普式的歸納邏輯的局限與所羅門諾夫先驗(yàn)的優(yōu)勢(shì)》,《自然辯證法研究》2018年第12期。(Universal Induction)(14)R. J. Solomonoff, “A Formal Theory of Inductive Inference. Part Ⅰ,” Information and Control 7, no. 1 (March 1964): 7.。
這里的方法也有缺陷,困難在于這種驗(yàn)前概率分布的比較判斷永遠(yuǎn)不會(huì)消失。這種比較判斷決定了在學(xué)習(xí)證據(jù)E=1,3,5,7時(shí)我們?nèi)绾螀^(qū)分Hodd和Hprime*,因此,這種驗(yàn)前概率分布的選擇不是良性的,必須用更有力的證據(jù)來(lái)辯護(hù)。作為一個(gè)普遍命題,我們的世界傾向于使用短圖靈機(jī)程序的序列。這種傾向在特定的語(yǔ)境下可能是可信的,比如我們知道人們?cè)陬^腦中思考的序列,但我們要假設(shè),在采取任何限制條件之前,這種傾向是正確的,無(wú)論這些序列出現(xiàn)在什么地方。我們很難理解為什么這個(gè)世界更傾向于為我們提供可計(jì)算的數(shù)字序列,并用指數(shù)懲罰函數(shù)序列使其具有更長(zhǎng)的程序。支持所羅門諾夫方法的文獻(xiàn)則不這么認(rèn)為,他們常常通過(guò)“奧卡姆剃刀”來(lái)回答這一問(wèn)題(15)Samuel Rathmanner and Marcus Hutter, “A Philosophical Treatise of Universal Induction,” Entropy 13,no. 6 (June 2011), 1128。。所羅門諾夫的歸納推理理論是對(duì)奧卡姆剃刀敘述的數(shù)學(xué)化描述,該理論指出:在所有能夠完全描述的已觀測(cè)的可計(jì)算類中,較短的可計(jì)算理論在估計(jì)下一次觀測(cè)結(jié)果的概率時(shí)具有較大的權(quán)重。簡(jiǎn)而言之,在幾組可以給出的答案的假設(shè)論述中,假設(shè)越少越能被人們選擇,可概述為“越簡(jiǎn)單的越易行”,這似乎是對(duì)中世紀(jì)學(xué)者觀點(diǎn)的過(guò)度推崇。
概言之,適應(yīng)標(biāo)準(zhǔn)化要求的挑戰(zhàn)使分析變得更加復(fù)雜。貝葉斯分析本身就會(huì)產(chǎn)生大量問(wèn)題,而這些問(wèn)題的復(fù)雜性會(huì)給我們?cè)噲D解決的問(wèn)題帶來(lái)新的挑戰(zhàn)。我們可以選擇在這個(gè)問(wèn)題上繼續(xù)絞盡腦汁,也可以選擇換個(gè)思路:貝葉斯分析是解決歸納問(wèn)題的一個(gè)不太適用的工具。與簡(jiǎn)單的擴(kuò)展1,3,5,7的實(shí)質(zhì)分析相比,一旦我們找到合適的語(yǔ)境,如伽利略的自由落體定律,就會(huì)發(fā)現(xiàn)在時(shí)間單位變化下的不變性要求會(huì)有效解決該擴(kuò)展問(wèn)題。因此,我們認(rèn)為,解決此類棘手的歸納問(wèn)題,關(guān)鍵要找到該應(yīng)用語(yǔ)境之下的實(shí)質(zhì)事實(shí),如伽利略在分析中得到事實(shí)保證。上述序列擴(kuò)展的案例旨在說(shuō)明歸納推理兩個(gè)方面的發(fā)展趨勢(shì)。首先,我們從更一般的推理過(guò)渡到更具體的和局部的推理。其次,我們從事實(shí)演繹授權(quán)結(jié)論的例子發(fā)展到事實(shí)歸納授權(quán)結(jié)論的例子。這個(gè)案例為我們提供了應(yīng)用范圍較窄的事實(shí)原則,在相應(yīng)的范圍內(nèi),這些事實(shí)原則能夠保證歸納推理。沿著歸納推理兩個(gè)方面的發(fā)展趨勢(shì),一種局部適用的概率觀便呼之欲出了。
為了克服概率邏輯形式化過(guò)程中所帶來(lái)的問(wèn)題,特別是魯?shù)婪颉た柤{普(Rudolf Carnap)的λ系統(tǒng)的缺陷,陳克艱、鞠實(shí)兒、李小五、陳曉平等各自提出了自己的系統(tǒng)(16)鞠實(shí)兒等主編《當(dāng)代中國(guó)邏輯學(xué)研究(1949-2009)》,中國(guó)社會(huì)科學(xué)出版社2013年版,第228頁(yè)。。“卡爾納普的λ系統(tǒng)的一個(gè)重大缺點(diǎn)是在個(gè)體域?yàn)闊o(wú)窮的情況下不能給全稱事實(shí)句以非零的概率”,“陳克艱對(duì)卡爾納普的λ系統(tǒng)進(jìn)行了修正,建立了一個(gè)θ系統(tǒng)”,“這樣,在無(wú)窮個(gè)體域中,在無(wú)反例的情況下,全稱假說(shuō)可以得到非零的確證度”(17)宋文堅(jiān)、熊立文、鄒崇理《我國(guó)現(xiàn)代邏輯研究概況》,《哲學(xué)動(dòng)態(tài)》2000年第3期,第40頁(yè)。。“李小五建立了一個(gè)概率演算的語(yǔ)法系統(tǒng)”,他“希望建立起歸納邏輯的語(yǔ)法部分,采用可能世界語(yǔ)義學(xué),并把這種語(yǔ)義學(xué)對(duì)可能性概念的刻畫定量化,從而把歸納邏輯和其他重要的哲學(xué)邏輯統(tǒng)一于一種語(yǔ)義學(xué)”,“陳曉平建立了一個(gè)貝葉斯認(rèn)證邏輯系統(tǒng)J6”,“用貝葉斯定理作為工具重新考察了古典的假說(shuō)演繹法,指出其確證形式和否證形式的不當(dāng)之處”(18)鞠實(shí)兒等主編《當(dāng)代中國(guó)邏輯學(xué)研究(1949-2009)》,第228頁(yè)。。但是,這些努力皆沒(méi)有得到一種完全令人滿意的理論。近年來(lái),還有些哲學(xué)家干脆拋棄了概率演算的框架,采用其他方法建立歸納邏輯。如約翰·柯恩(John Cohen)就以一種廣義的模態(tài)邏輯作為歸納理論的基本結(jié)構(gòu),建立了一個(gè)非巴斯卡概率系統(tǒng)——新培根主義概率邏輯系統(tǒng)(19)陳曉平《概率歸納邏輯的三大流派》,《哲學(xué)研究》1985年第10期,第60頁(yè)。。柯恩的非巴斯卡歸納邏輯包括歸納支持理論在邏輯哲學(xué)上的意義是比較大的,但是,它在邏輯上卻存在若干缺陷(20)鞠實(shí)兒等主編《當(dāng)代中國(guó)邏輯學(xué)研究(1949-2009)》,第239頁(yè)。。
總的來(lái)說(shuō),貝葉斯主義存在諸多問(wèn)題,也許這些問(wèn)題中最棘手的是驗(yàn)前概率問(wèn)題。貝葉斯分析得以進(jìn)行,總是需要提供一些驗(yàn)前概率。而一旦提供驗(yàn)前概率,就引入了任意性,這種任意性一直是所有形式的貝葉斯主義的“禍根”。
概率演算并沒(méi)有提供一種普遍適用的歸納邏輯。這里的重點(diǎn)是普遍適用性,我們不懷疑貝葉斯分析在特定領(lǐng)域的實(shí)用價(jià)值,在這些領(lǐng)域,背景事實(shí)可以保證它是正確無(wú)誤的。我們希望貝葉斯主義者可以放棄對(duì)“一切皆為概率”理念的執(zhí)著追求。當(dāng)人們發(fā)現(xiàn)貝葉斯分析的某些顯著優(yōu)點(diǎn),便不可抗拒地希望貝葉斯分析能得到普遍應(yīng)用。即便出現(xiàn)了無(wú)法避免的問(wèn)題,人們也不愿把貝葉斯分析排除出去。因?yàn)樵谟行┤丝磥?lái),貝葉斯主義認(rèn)識(shí)論就像剛剛長(zhǎng)出乳牙的嬰兒,有著無(wú)窮潛力,會(huì)慢慢變得更加成熟。這曾經(jīng)是一種站得住腳的立場(chǎng),但隨著時(shí)間的推移,這些問(wèn)題仍未得到較好的解決,我們不能再單純滿足憧憬普遍適用的愿景。如果要從根本上理解歸納推理,我們可能需要一種不同的方法。只有這樣,我們才能重新處理這些歸納推理的基本問(wèn)題,并試圖找到更好的解決辦法。實(shí)質(zhì)歸納理論作為對(duì)歸納推理本質(zhì)的基本問(wèn)題的解決方案,放棄對(duì)概率方法普適性的期望,放棄試圖構(gòu)建大一統(tǒng)的歸納概率理論,更傾向宣揚(yáng)一種局部適用的概率觀。
所謂局部適用的概率觀并不是提出某種具體的概率理論或系統(tǒng),而是一種對(duì)待概率的觀念和態(tài)度,即放棄尋找一個(gè)單一的、通用的演算。取而代之的是,從局部著手考察歸納推理,當(dāng)某些領(lǐng)域適合概率演算則采用此種方式,而不是一味地?cái)U(kuò)大概率的適用范圍。局部適用的概率觀也體現(xiàn)了歸納邏輯研究領(lǐng)域的多元論或語(yǔ)境論轉(zhuǎn)向趨勢(shì)。例如,許多物理學(xué)家期望借助簡(jiǎn)單的相似性建立大一統(tǒng)的萬(wàn)物理論,但是根據(jù)實(shí)質(zhì)歸納理論,定律的應(yīng)用范圍必定是有限、有界的。對(duì)不同的學(xué)科領(lǐng)域而言是如此,對(duì)同一個(gè)領(lǐng)域而言亦是如此。類似地,作為形式歸納理論的概率理論,試圖構(gòu)造一個(gè)通用的范式運(yùn)用于盡可能多的領(lǐng)域,似乎是行不通的,比如一些不確定性系統(tǒng)的歸納推理,貝葉斯分析就無(wú)法派上用場(chǎng)(21)John D. Norton, “Probability Disassembled,” The British Journal for the Philosophy of Science 58, no. 2 (June 2007): 141.。所適用演算及其規(guī)則是什么,這將取決于該領(lǐng)域中普遍存在的背景事實(shí)。
無(wú)論是歸納的局域化進(jìn)路,抑或是局部適用的概率觀都面臨著一個(gè)無(wú)法回避的問(wèn)題:普遍適用和領(lǐng)域分殊的辯證關(guān)系,即實(shí)質(zhì)歸納理論與形式歸納理論的關(guān)系問(wèn)題。諾頓的做法是非此即彼,對(duì)于某些合法的案例而言,形式的進(jìn)路失敗了,實(shí)質(zhì)理論就成功了。我們認(rèn)為這種觀點(diǎn)斷言性太強(qiáng),失之偏頗。實(shí)質(zhì)歸納理論在說(shuō)明和解釋具體案例方面,憑借著局域化的思路,確實(shí)有特殊的優(yōu)勢(shì)。但它有一個(gè)致命缺陷:缺乏規(guī)范性,并且在一些基本術(shù)語(yǔ)上含混不清。一言以蔽之,實(shí)質(zhì)歸納理論解釋力強(qiáng),但應(yīng)用性較弱。正如保羅·巴薩(Paul Bartha)對(duì)諾頓的關(guān)于類比推理的回應(yīng):由于實(shí)質(zhì)類比理論的應(yīng)用局限,我們需要一種準(zhǔn)形式的(Quasi-Formal)類比推理理論(22)Paul Bartha, “Norton’s material theory of analogy,” Studies in History and Philosophy of Science Part A 82, (August 2020): 105.。熊明輝指出,實(shí)踐取向是邏輯學(xué)的初衷,當(dāng)今邏輯學(xué)要重返這一初衷,既要強(qiáng)調(diào)數(shù)理邏輯所體現(xiàn)的徹底形式化和嚴(yán)格必然性,又不能忽略實(shí)踐推理(23)《中山大學(xué)熊明輝教授南開(kāi)談邏輯學(xué)的演進(jìn)》,南開(kāi)大學(xué)新聞網(wǎng),2019年11月19日發(fā)布,2019年12月10日訪問(wèn),https://news.nankai.edu.cn/zhxw/system/2019/11/19/030036423.shtml。。同樣地,將此觀點(diǎn)推而廣之,我們也需要一種準(zhǔn)形式的歸納理論,這也許是未來(lái)研究的著力點(diǎn)。實(shí)質(zhì)歸納理論似乎不能完全規(guī)避形式歸納理論的缺陷,也不能兼?zhèn)湫问綒w納理論的優(yōu)勢(shì),那么探尋二者從對(duì)立到相容、從互斥到互補(bǔ)可能是解決之道。