[德]沃爾夫?qū)な┎ǘ?文
陳偉/譯
博弈論和決策論具有同質(zhì)性。或者從它們具有相似的主題內(nèi)容、基本概念和方法來(lái)說(shuō),人們至少可以有這樣的期待。并且,通過(guò)首先考察這些理論的標(biāo)準(zhǔn)解釋能證明這個(gè)期待是合理的:決策論研究的是孤立的單獨(dú)個(gè)體的理性行為;博弈論關(guān)涉的是多人相互依賴性決策的理性問(wèn)題。因此,博弈論是一種更具有包容性的理論;而決策論是特殊情形,是一個(gè)人的博弈,或者用一種不太恰當(dāng)?shù)恼f(shuō)法,是對(duì)自然的博弈。
然而,經(jīng)過(guò)更仔細(xì)的考察,博弈論的標(biāo)準(zhǔn)解釋及其與決策論的關(guān)系就顯得不盡如人意。當(dāng)然,決策論也被各種問(wèn)題所籠罩;但相較而言,我認(rèn)為博弈論又被三個(gè)相互關(guān)聯(lián)的問(wèn)題弄得大傷元?dú)猓赫f(shuō)嚴(yán)重點(diǎn),它混淆了適用于它的理性概念,對(duì)其主體(局中人)的假定非常不清楚,并因此導(dǎo)致它所使用的決策規(guī)則含混不清。或者,用有些自相矛盾的話來(lái)說(shuō):(從博弈論來(lái)看)決策論是博弈論的特殊化;但是,(從決策論來(lái)看)如今表達(dá)的博弈論不再是決策論的一般化。不如說(shuō),由此可預(yù)料的是,博弈論應(yīng)被視作決策論的特殊化。
這就是我的不滿。我將在接下來(lái)的各節(jié)中具體闡述這一點(diǎn),并解釋我認(rèn)為應(yīng)該采納的補(bǔ)救辦法。
讀者也許會(huì)懷疑這些異議將會(huì)使博弈論導(dǎo)向更為高深莫測(cè)的領(lǐng)域,諸如三人或更多人的博弈或具有特征函數(shù)形式的博弈,于是可能會(huì)自動(dòng)地放棄這些異議。但是,相反的是,這些異議處理的是那些看似清晰并且基礎(chǔ)穩(wěn)定的兩人零和博弈。為求簡(jiǎn)明,我將只處理標(biāo)準(zhǔn)形式的博弈。①澤爾騰所展示的標(biāo)準(zhǔn)形式問(wèn)題與我的考慮無(wú)關(guān),因而這也適用于他改進(jìn)過(guò)的觀念。參見(jiàn)R.Selten,“Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games”, International Journal of Game Theory, Vol. 4, No.1, 1975, pp.25—55。
讀者也許還會(huì)懷疑這是為貝葉斯式博弈論所作的一個(gè)辯護(hù),并且我也確實(shí)是從一個(gè)純粹的貝葉斯式立場(chǎng)進(jìn)行的論證。然而,“貝葉斯式博弈論”的標(biāo)簽已經(jīng)和約翰·C.海薩尼(John C.Harsanyi)的工作有極為顯著的聯(lián)系。在我看來(lái),后者在精神上依然是博弈論的而非決策論的,因此,基于類似的理由,它和標(biāo)準(zhǔn)解釋一樣是可批評(píng)的。這樣一來(lái),這里就存在一種區(qū)別,我們不得不在最后一節(jié)來(lái)討論這一點(diǎn)。
總之,我不是宣稱這里提出的立場(chǎng)及其論證將會(huì)是全新的(盡管有些手法會(huì)是全新的)。只是那些在同樣精神指導(dǎo)下的對(duì)博弈論的早期攻擊,顯然不能使已被接受的理論不再成立,并使博弈論走上一條根基更為穩(wěn)固的道路。正是這種情況,導(dǎo)致我作出另外的一種嘗試。
在證實(shí)這種不滿之前,不妨先勾勒一下這種不滿所依據(jù)的基本確信(basic conviction)。這個(gè)基本確信是一種正統(tǒng)的貝葉斯式確信。
根據(jù)這種確信,人們有目標(biāo)和愿望,他們希望這個(gè)世界如此這般;他們有信念(belief),相信這個(gè)世界會(huì)如此這般;并且,如果合理的話,他們會(huì)根據(jù)自己的信念來(lái)行動(dòng),以便最大程度地促進(jìn)他們的愿望的實(shí)現(xiàn)。為追求確定性,決策論用量化決策模型來(lái)使之公式化。在這樣一種模型中,一個(gè)人的決策情境被公式化,這個(gè)人被假定為具有數(shù)字上的主觀效用和概率;于是,理性行動(dòng)(rational action)就被定義為一種最大預(yù)期效用的行動(dòng)。并且,作為一種規(guī)范性理論,決策論建議理性行動(dòng)。而作為一種經(jīng)驗(yàn)理論,決策論假定了理性行動(dòng);眾所周知,這就具有強(qiáng)烈的理想化色彩,最多只有近似的有效性。不過(guò),這種模型宣稱在原則上適用于一切的人類行動(dòng)。[這個(gè)宣稱并不像它看起來(lái)的那樣有力,因?yàn)樗鼪](méi)有擴(kuò)展到所有的人類行為。我們必須看到,行動(dòng)(action)是一個(gè)比行為(behaviour)更加狹窄的概念;并且,即使撇開(kāi)其中的循環(huán)味道,我們也不能合理地說(shuō),行動(dòng)只是決策論可適用的行為。①關(guān)于這個(gè)行動(dòng)理論的主題,舉例來(lái)說(shuō),可參見(jiàn)P. M. Churchland, “The Logical Character of Action-Explanations”,Philosophical Review, Vol. 79, No. 2, 1970, pp.214—236。]
在這里,并非真的有必要走進(jìn)決策論公式化的具體細(xì)節(jié)。但是,讓我們假設(shè),為求精確,公式化運(yùn)用了眾所周知的薩維奇(L. J. Savage)方式。在這種方式中,概率是對(duì)一組可能世界狀態(tài)的定義,效用是指可能的結(jié)果,每一個(gè)結(jié)果僅僅由一個(gè)世界狀態(tài)和一個(gè)行動(dòng)來(lái)決定,然后標(biāo)準(zhǔn)形式的兩人博弈中所出現(xiàn)的常見(jiàn)效用矩陣就隨之產(chǎn)生。對(duì)我們的討論而言,這是最合適的公式化。②盡管它不是唯一的,甚至在我看來(lái)不是最好的。參見(jiàn)W. Spohn, Grundlagen der Entscheidungstheorie,Kronberg/ Ts.: Scriptor, 1978, Ch. 2。
順便說(shuō)一句,努力使量化模型成為某種派生物,是更為審慎的情況,不太是常見(jiàn)的情況。薩維奇方式將理性行動(dòng)定義為根據(jù)理性偏好選擇最優(yōu)先之物的行動(dòng)。如果偏好能滿足一些相當(dāng)明顯的條件,諸如傳遞性等等,那么它就是理性的;然后,令人驚奇的是,這可以證明似乎是理性行動(dòng)最大化了預(yù)期效用。但是,這個(gè)“似乎”如同說(shuō)物體穿越空間是似乎它們有體積、似乎它們遵從牛頓第二定律等等一樣,是不合適的。不,根據(jù)牛頓力學(xué),物體那樣移動(dòng)的方式是因?yàn)樗鼈冇腥绱诉@般的體積,有如此這般的外力加諸其上,等等。并且,根據(jù)決策論,人們之所以那樣行動(dòng),是因?yàn)樗麄冇腥绱诉@般強(qiáng)烈的愿望,他們有如此這般堅(jiān)定的信念,等等??梢钥隙ǖ氖?,這個(gè)問(wèn)題后面潛藏著大量的微妙之處,科學(xué)哲學(xué)家對(duì)此依然有分歧。但是,毫無(wú)疑問(wèn)的是,如同在物理學(xué)和其他任何領(lǐng)域中表達(dá)的“似乎”一樣,科學(xué)哲學(xué)家眼中的操作主義已經(jīng)過(guò)時(shí)了。③例如,參見(jiàn) W. Stegmüller, Probleme und Resultate der Wissenschaftstheorie und Analytischen Philosophie, Band Ⅱ,Theorie und Erfahrung, Halbband, Heidelberg: Springer, 1970, Ch.Ⅲ -Ⅴ, 以 及 W. Stegmüller, Probleme und Resultate der Wissenschaftstheorie und Analytischen Philosophie, Band Ⅱ, Theorie und Erfahrung, Halbband, Berlin,Heidelberg: Springer, 1973, Ch. Ⅷ;或者 H. Putnam, Mind, Language, and Reality, Philosophical Papers, Vol. 2,Cambridge: University Press, 1975, Ch. 11, 12 and 22。因此,人們應(yīng)把量化決策模型作為基礎(chǔ)。(這也許會(huì)改變所有支持“似乎”理論的、具有獨(dú)創(chuàng)性的可度量化定理的地位,但絲毫沒(méi)有降低它們的價(jià) 值。)
現(xiàn)在來(lái)看相互依賴性決策的博弈式情景,那么,上述決策情景的任何一般刻畫(huà)有什么被撤銷(xiāo)嗎?不,沒(méi)有任何東西。對(duì)我們而言,其他人及其行為僅僅與其他事物一樣都是外部世界的組成部分,盡管他們肯定相當(dāng)復(fù)雜,也常常非常珍貴。從形式上講,這意味著在任何局中人的決策模型中,其他局中人的可能行動(dòng)僅僅是可能世界狀態(tài)的組成部分。我們可以進(jìn)一步將這些可能行動(dòng)(在薩維奇的技術(shù)意義上①參見(jiàn) L. J. Savage, The Foundations of Statistics, New York: Wiley ﹠ Sons, 1954, sect. 5.5。)看作一個(gè)微觀世界的組成部分,并使這一模型縮小到這一微觀世界——實(shí)際上,這同將一個(gè)擴(kuò)展形式的博弈歸約到其標(biāo)準(zhǔn)形式一樣。因而,簡(jiǎn)化模型包含有這種標(biāo)準(zhǔn)形式的效用矩陣。并且,完善它的唯一正確的方式是為其可能世界狀態(tài),即為其他局中人的行動(dòng),增加局中人的主觀概率。畢竟,要做的理性事情總是要使預(yù)期效用最大化;這才是理性行動(dòng)。
事實(shí)上,更為常見(jiàn)的情況是,基本上不存在博弈式情景。在我們的眾多日常事務(wù)中,我們對(duì)待他人就像他們都是有規(guī)律的并且可靠的行為自動(dòng)機(jī)一樣,對(duì)于他們,我們有著非常明確的預(yù)期而不用多想;他們就像是交通或天氣狀況那樣被包括在我們的決策問(wèn)題之內(nèi)。(這個(gè)有點(diǎn)兒冷酷無(wú)情的說(shuō)辭不過(guò)是無(wú)害的“專業(yè)性畸變”;幸運(yùn)的是,我們確實(shí)能夠?qū)σ恍┤擞懈嗟呐d趣。)
但是,如果這一點(diǎn)被接受,那么還剩下什么是博弈論的獨(dú)特領(lǐng)域?當(dāng)我們將外部世界的其他人嚴(yán)肅地當(dāng)作個(gè)人來(lái)對(duì)待時(shí),當(dāng)我們放棄僅僅觀察他們的行為并著手將他們理論化時(shí),并且尤其當(dāng)我們發(fā)現(xiàn)決策論大約是關(guān)于他們的正確理論時(shí),當(dāng)我們努力計(jì)算出他們可能的目標(biāo)和信念是什么時(shí),假定他們理性地行動(dòng),那么博弈論就開(kāi)始了。然而,需要注意的是,在這一論述中,博弈論并不包含決策論,而只不過(guò)是決策論的一種具體化。博弈論是關(guān)于具體決策者的決策論,也就是說(shuō),那些決策者把其他人算入他們的決策情景,并根據(jù)決策理論對(duì)之進(jìn)行理論化。②同樣,對(duì)一個(gè)在策略上思考和行動(dòng)的人而言,一種恰當(dāng)而統(tǒng)一的觀點(diǎn)是把關(guān)于他或她自己未來(lái)行動(dòng)的理論決策進(jìn)行理論化。參見(jiàn) W. Spohn, Grundlagen der Entscheidungstheorie, Kronberg/ Ts.: Scriptor, 1978, Ch. 4。
所有這些可能聽(tīng)起來(lái)都非常熟悉。這正是正統(tǒng)的貝葉斯定理關(guān)于博弈論的主張,基本上就是海薩尼在20多年前反復(fù)告訴我們的東西。但奇怪的是,所有人——那些標(biāo)準(zhǔn)的博弈理論家和像海薩尼這樣的貝葉斯主義者(參見(jiàn)最后一節(jié))——似乎都違背了那個(gè)純粹的原理,都在把博弈論推向它的結(jié)果的過(guò)程中退縮了。
然而,這種過(guò)失是有其原因的。因?yàn)槿绻⒎遣豢赡艿脑?,要在純粹的貝葉斯定理內(nèi)證明每個(gè)人所持有觀念的正當(dāng)性,即證明均衡點(diǎn)是兩人零和博弈或通常的非合作博弈的解決方法(參見(jiàn)第四節(jié)),看起來(lái)是困難的。這樣一來(lái),我們必須仔細(xì)看一下在不背叛這個(gè)迄今為止的概略性原理的條件下用它能具體做些什么。但是,讓我先從這個(gè)貝葉斯主義視角來(lái)審視標(biāo)準(zhǔn)博弈論對(duì)兩人零和博弈的理論推理。
有鑒于此,我們應(yīng)該簡(jiǎn)要概括一下現(xiàn)有的推理。我希望每個(gè)人都同意盧斯、雷法①R. D. Luce ﹠ H. Raiffa, Games and Decisions, New York: Wiley ﹠ Sons, 1957, Ch.4.和馮·諾依曼、摩根斯坦②J. von Neumann ﹠ O. Morgenstern, Theory of Games and Economic Behavior, Princeton: University Press, 1944,Ch. Ⅲ.不僅是代表人物,而且還對(duì)這個(gè)推理提供了最徹底、最令人信服的敘述,以便于我可以在他們的基礎(chǔ)上進(jìn)行概述。這個(gè)概述包含四個(gè)部分。
第一部分(與所有標(biāo)準(zhǔn)形式的博弈相關(guān)):賦予博弈以標(biāo)準(zhǔn)形式。非常含糊地說(shuō),博弈論的基本問(wèn)題就是以某種方式為每個(gè)局中人找到對(duì)他而言哪個(gè)選擇是一個(gè)好選擇。然而,這是一個(gè)過(guò)于模糊的問(wèn)題,它需要具體說(shuō)明。因此,讓我們先假定,每個(gè)局中人是理性的,要么在寬泛的意義上(根據(jù)他的效用函數(shù))盡可能地努力擺脫博弈,要么在更為嚴(yán)格的意義上,“在既有兩種選擇的情況下,他將總是選擇他所偏好的,也就是那個(gè)效用更大的選項(xiàng)”③R. D. Luce ﹠ H. Raiffa, Games and Decisions, New York: Wiley ﹠ Sons, 1957, p.55.。并且,讓我們接下來(lái)假定,每個(gè)局中人對(duì)標(biāo)準(zhǔn)形式的博弈都了如指掌,也就是說(shuō),他知道每個(gè)局中人的可能選擇(策略),也知道每個(gè)局中人所有可能策略組合結(jié)果的效用(通常而言,關(guān)于博弈的機(jī)會(huì)步驟,這些就是已經(jīng)預(yù)期到的效用)。
如果沒(méi)有第一個(gè)假定,博弈論就根本不可能運(yùn)作。一般理論怎么可能是關(guān)于非理性行動(dòng)的呢?并且,第二種假定也是必要的;否則博弈理論家所處理的問(wèn)題就可能是錯(cuò)誤的,也就是說(shuō),那個(gè)問(wèn)題不同于博弈理論家在主觀上所認(rèn)識(shí)到的局中人的問(wèn)題。然而,如果有這些假設(shè),我們就有希望使我們的問(wèn)題具體到足以是可解決的。因此,讓我們?cè)囍鴣?lái)解決它。
第二部分(與所有標(biāo)準(zhǔn)形式的非合作博弈相關(guān)):一個(gè)首要的考慮可使我們有比較大的進(jìn)展。這個(gè)考慮是,如果博弈論應(yīng)當(dāng)具有至少潛在的公共性——正如它無(wú)疑應(yīng)該是這樣的——那么它就能夠區(qū)分僅僅作為局中人理性選擇的均衡策略。(可以肯定的是,到目前為止,我只是在討論純粹策略;混合策略要到第四部分才會(huì)提出。)或者,更確切地說(shuō):博弈論是要為每個(gè)局中人找到哪個(gè)選擇對(duì)他而言是更為理性的選擇。如果能做到這點(diǎn),那么每個(gè)局中人也能像博弈理論家一樣,知道哪些選擇對(duì)其他局中人而言是理性的選擇(因?yàn)楦鶕?jù)上面的第二個(gè)假定,每個(gè)局中人是使用和博弈理論家一樣的方式看待博弈情景的);并且,因?yàn)槊總€(gè)局中人被假定為是理性地行動(dòng),這個(gè)假定對(duì)任何局中人而言就一定不能成為一個(gè)理由,讓他背離對(duì)他而言依據(jù)這個(gè)理論是理性的東西;于是,只有均衡點(diǎn)才是理性的策略組合,并且,只有均衡策略即導(dǎo)向某個(gè)這樣點(diǎn)的策略才是理性的選擇。
眾所周知,這個(gè)考量能發(fā)生變化。有些博弈在純粹策略中沒(méi)有均衡點(diǎn),而有些有很多,在這些情形中其成功依然是不完備的。但是,對(duì)于純粹策略中具有均衡點(diǎn)的兩人零和博弈來(lái)說(shuō),這是關(guān)鍵所在,因?yàn)樵谶@種博弈中的均衡點(diǎn)被證明在本質(zhì)上是獨(dú)一無(wú)二的。①參見(jiàn) R. D. Luce ﹠ H. Raiffa, Games and Decisions, New York: Wiley ﹠ Sons, 1957, sect. 4.5。這樣一來(lái),在這個(gè)具體情形中,我們就已解決基本的博弈理論問(wèn)題。
第三部分(僅與純粹策略中具有均衡點(diǎn)的兩人零和博弈相關(guān)):在這種具體情形中,還存在另一個(gè)有說(shuō)服力的考量,它具有相同的影響??煞Q這兩個(gè)局中人為查理和露西。查理也許會(huì)根據(jù)直覺(jué)作如下推理:“露西這個(gè)理性的家伙,想盡可能地努力擺脫博弈。這與我的利益相抵觸。所以,我最好看看從我的每個(gè)選項(xiàng)中我最少能得到多少,然后努力使這個(gè)數(shù)量盡可能地大,也就是,正如我聽(tīng)到有人表述的那樣,我最好最大化我的安全等級(jí)。如果這是合理的,那么理性的露西將做相同的事情,也就是說(shuō),最大化她的安全等級(jí)。哦,但是我的安全等級(jí)最大值是對(duì)她的安全等級(jí)最大值的最大抵觸,因此,我應(yīng)該更加堅(jiān)持我的選擇 。”
或者,用馮·諾依曼的話來(lái)說(shuō):考慮查理的弱函數(shù)博弈和強(qiáng)函數(shù)博弈。在弱函數(shù)博弈中,查理必須首先做出選擇,然后露西在已知他作了什么的情況下,再進(jìn)行選擇。在強(qiáng)函數(shù)博弈中,正好倒過(guò)來(lái)。顯然,在弱函數(shù)博弈中,查理最多和在實(shí)際博弈中的處境一樣好;而在強(qiáng)函數(shù)博弈中,他至少和在實(shí)際博弈中的處境一樣好。并且,同樣顯然的是,在弱函數(shù)博弈中,對(duì)他而言唯一可做的理性事情就是最大化他的安全等級(jí);而在強(qiáng)函數(shù)博弈中,唯一可做的理性事情就是選擇那個(gè)最能抗衡露西的安全等級(jí)最大值(假使她已經(jīng)很理性地作出這一選擇)的選項(xiàng)。但是,這兩種情形得出相同的策略組合,并且對(duì)查理而言是相同的效用。這樣一來(lái),對(duì)于處在弱函數(shù)與強(qiáng)函數(shù)博弈“之間的”實(shí)際博弈而言,恰恰只有這一點(diǎn)是理性的。
總結(jié)一下:從第一部分中的假定開(kāi)始,我們已經(jīng)給出了兩個(gè)完全獨(dú)立的推理。每個(gè)推理都單獨(dú)地在所考慮到的具體情形中展開(kāi),并且兩者被證實(shí)可以得到相同的結(jié)果。還會(huì)有什么更好的理由呢?
第四部分(與所有的兩人零和博弈相關(guān)):現(xiàn)在,馮·諾依曼告訴我們,如果我們?cè)敢庠试S一些小把戲,即允許每個(gè)局中人把他的純粹策略混合起來(lái),那么我們就能夠把整個(gè)理論推廣到所有的兩人零和博弈。進(jìn)一步的論證被虛構(gòu)出來(lái),用來(lái)給那些對(duì)這種小把戲感到不自在的人以最后的推力,比如說(shuō),秘密論證、對(duì)重復(fù)博弈的考慮或者大量反復(fù)的論證。②參見(jiàn) Ibid., p.75。但是,我們不需要在這里對(duì)這個(gè)附加的支持作詳細(xì)的闡述,因?yàn)槿绻麤](méi)有主要的推理這就都是無(wú)用的。并且,這個(gè)可以獨(dú)自成立。事實(shí)上,任何局中人都能自由地選擇一種混合策略;這樣一來(lái),混合策略就在各種被考慮的選項(xiàng)之中,關(guān)于它們的上述推理和關(guān)于純粹策略的推理一樣有力。因此,這就是混合策略、最大最小值和均衡點(diǎn)是如何發(fā)現(xiàn)彼此并能一直愉快相處的原因。
不幸的是,這一理論并不像它聽(tīng)起來(lái)的那樣好。有必要作一番評(píng)論,批判的不是這個(gè)理論的結(jié)論,而是得到那些結(jié)論的方法。
對(duì)第一部分的評(píng)論:人們可能會(huì)認(rèn)為,第一部分的理性和知識(shí)假設(shè)過(guò)于限制博弈論的運(yùn)用。但是,實(shí)際上,它們不過(guò)是要么不太有力要么不夠清楚。假設(shè)局中人是理性的真的就足夠了嗎?看起來(lái),當(dāng)然還要假設(shè)每個(gè)局中人都相信其他局中人是理性的。這在這個(gè)理論的第二部分中尤為清楚,在那里,我們非常松散地區(qū)分了博弈理論家假設(shè)一個(gè)局中人對(duì)其他局中人作出的假設(shè)和博弈理論家本人對(duì)其他局中人作出的假設(shè)。但是,這樣一來(lái),大概還應(yīng)該假定每個(gè)局中人都相信其他局中人也認(rèn)為他們的同伴是理性的。在這一點(diǎn)上,有人可能會(huì)傾向于一個(gè)激進(jìn)的步驟,也就是,爬上迭代的相互理性假設(shè)的無(wú)窮階梯,就像有些人在意義理論中在一個(gè)類似情形下所做的那樣。①例如,參見(jiàn) D. K. Lewi, Convention. A Philosophical Study, Cambridge, Mass.: University Press, 1969;以及S. R. Schiffer, Meaning, Oxford: University Press, 1972。也就是說(shuō),(在西菲爾的技術(shù)意義上②S. R. Schiffer, Meaning, p. 30f, or D. K. Lewi, Convention. A Philosophical Study, p. 56; 也參見(jiàn)本文第四節(jié)。)博弈理論家可能會(huì)假設(shè),在局中人之間,局中人的理性是相互的或者是常識(shí)。當(dāng)然,所有這些都同樣適用于第二個(gè)假設(shè),即該理論第一部分中的知識(shí)假設(shè)。因此,博弈理論家應(yīng)該假設(shè)什么呢?人們覺(jué)得,關(guān)于局中人作多少假設(shè)確實(shí)是有不同影響的;但是,很難看出來(lái)這在被接受的理論中有怎樣的體現(xiàn)。
還存在另一個(gè)模糊性。在理性假設(shè)中所使用的“理性的”確切含義是什么?從盧斯和雷法援引而來(lái)的解釋沒(méi)有多大幫助,因?yàn)槠没蛐в脙H僅指的是策略組合;在標(biāo)準(zhǔn)博弈論中,不存在僅僅針對(duì)單個(gè)局中人的選擇的偏好次序甚或效用函數(shù)。因此,在“理性的”更有效用的意義上,一方會(huì)愿意截然地規(guī)定另一方。然而,按此推斷,這一問(wèn)題是錯(cuò)誤的。按此推斷,標(biāo)準(zhǔn)博弈論認(rèn)為,在保證后面會(huì)精確起來(lái)的前提下,在初始的假設(shè)和解釋中它更偏好或不能避免“理性的”含混。但在當(dāng)下,這只是說(shuō)“理性的”是有意的模糊,這就沒(méi)有什么實(shí)質(zhì)進(jìn)展。
這個(gè)問(wèn)題的難點(diǎn)在于:標(biāo)準(zhǔn)博弈論確實(shí)在任何地方都沒(méi)有以一種嚴(yán)格的方式從初始假設(shè)開(kāi)始推理;它們被排他性地使用在看似成立的論證之中。這里的態(tài)度似乎已經(jīng)是,最初直觀的根據(jù)被用來(lái)為一系列嚴(yán)格的理論化作準(zhǔn)備,人們就不需要掂量這個(gè)準(zhǔn)備中的每個(gè)詞。這樣一來(lái),在直觀階段一些細(xì)微的區(qū)別就已經(jīng)模糊不清,沒(méi)有給艱難的理論化任何機(jī)會(huì)來(lái)消除這種不嚴(yán)謹(jǐn)。從貝葉斯定理的角度來(lái)看,這是邁向不可靠根基的第一個(gè)決定性滑坡。
對(duì)第二部分的評(píng)論:我們已經(jīng)提到過(guò),為使局中人具有與博弈理論家一樣的方式來(lái)看待博弈情境,比第一部分中更強(qiáng)的關(guān)于局中人的假設(shè)就是必要的,于是第二部分有這一假設(shè)也是必要的。但是,還有另一個(gè)不足之處,這在純粹策略中具有一個(gè)均衡點(diǎn)的兩人零和博弈的情形中尤為明顯。在這種情形中,第二部分得出的結(jié)論是,每個(gè)局中人只能理性地選擇他的均衡策略。但是,這個(gè)結(jié)論下得太早;能夠得出的只是:如果博弈理論家成功地區(qū)分出一個(gè)理性的選擇,那么這一定是均衡策略。然而,并不保證以上的“如果”句是真的。也許博弈理論家的問(wèn)題是他能夠僅僅部分地縮小理性選擇的范圍,而不是將其縮小到一個(gè)。更一般地說(shuō):第二部分所表明的是,博弈理論家并不能在均衡策略之外建立某個(gè)理性的選擇集合;但是,根據(jù)其他的理由仍然表明,一個(gè)選擇只有在均衡策略之中才能肯定地被確立是理性的。第三部分也許準(zhǔn)備了這樣的理由,因此,讓我們轉(zhuǎn)向第三部 分。
對(duì)第三部分的評(píng)論:人們對(duì)最大最小化決策規(guī)則已經(jīng)有很多論述,并且我們知道了所有實(shí)質(zhì)上贊成或反對(duì)的觀點(diǎn)。我覺(jué)得,目前的討論狀態(tài)有一點(diǎn)兒順利。似乎通??山邮艿氖牵畲笞钚』荒茏鳛橐粋€(gè)基本的決策規(guī)則被普遍應(yīng)用;它在許多情景中造成了荒謬的結(jié)果。不過(guò),在某些類型的情景,尤其在兩人零和博弈中,而且對(duì)不確定性條件下的決策而言,在統(tǒng)計(jì)學(xué)的決策理論中,以及新近在羅爾斯的初始狀態(tài)①參見(jiàn) J. Rawls, A Theory of Justice, Cambridge, Mass.: Harvard University Press, 1971, sect. 26。中,最大最小化都被認(rèn)為是一個(gè)可討論的、還不錯(cuò)的甚至是可信的決策規(guī)則。
然而,從理論的角度來(lái)看,這種事態(tài)是完全不能讓人滿意的。從這個(gè)角度來(lái)看,沒(méi)有辦法很簡(jiǎn)單地做到,為不同類型的情景找到直觀上可信的決策規(guī)則,以通過(guò)某種系統(tǒng)的論證來(lái)支持直觀判斷,并且就此終止。不,如果不同的決策規(guī)則確實(shí)被不同類型的情景所接受,那么人們就想知道一些主導(dǎo)的或統(tǒng)一的原則,以解釋或至少準(zhǔn)確地描述在哪些條件下哪些決策規(guī)則在哪些情景中是適當(dāng)?shù)模换蛘?,更好的是,人們?cè)敢庥幸恍┗镜臎Q策規(guī)則,其他的規(guī)則可以從它們推導(dǎo)出來(lái)。但是,在試圖回答關(guān)于博弈論的這一要求時(shí),我們很明顯直接陷入了在第一部分就發(fā)現(xiàn)的那種晦澀之中。
誠(chéng)然,我在這里所做的一切是訴諸理論意識(shí)。但是,我想通過(guò)接下來(lái)的論證使這個(gè)訴諸更為迫切。
這需要利用薩維奇的微觀世界理論。關(guān)于這個(gè)主題的理論重要性,我認(rèn)為沒(méi)有被充分認(rèn)識(shí)到。這個(gè)主題與對(duì)世界的描述相關(guān),相似的決策情景可能是基于不同的世界。在這里,一個(gè)世界——寬泛講而不需要真的深入技術(shù)細(xì)節(jié)——是所有項(xiàng)目(item)的集合,這些項(xiàng)目應(yīng)當(dāng)在決策情景的描述中被明確地考慮到。薩維奇的評(píng)論是,現(xiàn)在似乎沒(méi)有一種好的方式來(lái)指明哪個(gè)是正確世界,并以之作為給定決策情景描述的基礎(chǔ)。從表面來(lái)看,將每個(gè)實(shí)際相關(guān)的項(xiàng)目放入一個(gè)世界之中,似乎是合情合理的,但通常這會(huì)產(chǎn)生很多難以處理的宏觀世界。因此,不是要尋找正確的世界,而是我們應(yīng)該努力發(fā)現(xiàn)何時(shí)兩個(gè)依據(jù)不同世界的描述可以被說(shuō)成是相同的。為此,薩維奇找到一個(gè)方法,可以將依據(jù)宏觀世界的描述還原為依據(jù)微觀世界的描述,并且可以保證這兩個(gè)世界相等。還原方法的實(shí)質(zhì)特征是,它如何能將效用歸因于包含在微觀世界描述中的可能結(jié)果。薩維奇采取以下方式:從宏觀世界描述的觀點(diǎn)來(lái)看,如果有確定概率pi,通過(guò)它,一個(gè)不甚詳細(xì)的微觀世界的結(jié)果,比如c,塑造出千變?nèi)f化的、更為詳細(xì)的宏觀世界結(jié)果ci,它具有確定效用ui;那么,微觀世界描述中的效用c應(yīng)當(dāng)是期望值∑piui。①關(guān)于所有的詳細(xì)說(shuō)明,參見(jiàn) L. J. Savage, The Foundations of Statistics, New York: Wiley ﹠ Sons, 1954, sect.5.5;以及 W. Spohn, Grundlagen der Entscheidungstheorie, Kronberg/ Ts.: Scriptor, 1978, sect. 2.3 and 3.6。
有人也許會(huì)想出另外一些還原方法(盡管我認(rèn)為這沒(méi)有必要);但目前對(duì)我們重要的是,不管選擇什么樣的還原方法,一定要與所采用的決策規(guī)則相容。這意味著,當(dāng)決策規(guī)則被應(yīng)用于宏觀世界描述時(shí),必須導(dǎo)致和決策規(guī)則被應(yīng)用于還原的微觀世界描述時(shí)相同的決策(實(shí)際上,是可選項(xiàng)中相同的偏好次序)。②由于薩維奇的決策規(guī)則是使預(yù)期效用最大化,他的還原方法和預(yù)期效用同樣起作用也就無(wú)足為奇了。參見(jiàn) L. J. Savage, The Foundations of Statistics, 1954。事實(shí)上,單說(shuō)還原方法與決策規(guī)則相容是有一點(diǎn)兒誤導(dǎo)的。不如說(shuō),還原方法是被選定的基本東西,然后決策規(guī)則作為純粹的特例隨之而來(lái)。決策規(guī)則除了影響將最大描述還原為最小描述之外沒(méi)有其他作用,最小描述明確考慮的僅僅是決策者的可選項(xiàng),而不涉及其他任何東西。
接下來(lái)要考察的是,作為最大最小化決策規(guī)則的自然推廣,還原方法事實(shí)上是一種不切實(shí)際的方法。根據(jù)這種方法,微觀世界結(jié)果的效用會(huì)是它所形成的宏觀世界結(jié)果效用的最小值;并且,不需要證明這將導(dǎo)致各種荒謬的和直觀上不可接受的結(jié)果。實(shí)際上,沒(méi)有人甚至是最大最小化策略的追隨者都不曾嚴(yán)肅地考慮過(guò)這種還原方法。也就是說(shuō),最大最小化被認(rèn)為只對(duì)決策情景的微觀世界描述可合理應(yīng)用,這是已經(jīng)由形成預(yù)期效用的薩維奇的還原方法得到的結(jié)論?;蚋?jiǎn)潔地說(shuō),最大最小化的東西總是(關(guān)于某個(gè)宏觀世界描述的)預(yù)期效用。這在博弈論中尤其明顯,其標(biāo)準(zhǔn)形式的效用就是派生自擴(kuò)展形式的預(yù)期效用。
因此,最大最小化決策規(guī)則所出現(xiàn)的理論混亂要比它看起來(lái)的意義更為深遠(yuǎn)。首先,這種混亂表現(xiàn)在各種決策規(guī)則似乎適合于不存在任何統(tǒng)一原則的各種決策情景。但現(xiàn)在,當(dāng)決策規(guī)則被看作還原方法的特例時(shí),我們?cè)趩为?dú)決策情景中就有了混亂,因?yàn)閷?duì)最大最小化預(yù)期效用實(shí)際上在一個(gè)決策情景中應(yīng)用了兩個(gè)不同的還原方法。于是,就有一個(gè)迫切的問(wèn)題:哪種還原方法精確適合于決策情景中的哪些項(xiàng)目?又是為什么?為什么首先采用預(yù)期效用還原然后再考慮最小效用還原?為什么不是反過(guò)來(lái)?等等。(這有不同影響,這兩種方法不是可交換的。)所有這些都非常難辦,我們應(yīng)盡最大努力避免這種混亂。
結(jié)語(yǔ):馮·諾依曼的第三種說(shuō)法,即“中間性”論證,比查理的直觀推理更具有嚴(yán)格性。但并非如此。在弱函數(shù)博弈中,查理知道露西將知道他要做的,在強(qiáng)函數(shù)博弈中他將知道露西要做的并且也知道露西知道這些,等等。在真實(shí)的博弈情境中他并不知道這些,也就是說(shuō),他比在弱函數(shù)博弈和強(qiáng)函數(shù)博弈中的處境都更不利(然而,這也意味著按照預(yù)期效用他也許會(huì)比在其他兩種博弈中的處境更有利)。在這方面,真實(shí)的博弈并非處于弱函數(shù)博弈和強(qiáng)函數(shù)博弈之間,并且似乎沒(méi)機(jī)會(huì)導(dǎo)致“中間性”論證的正確性(正如麥克倫南也論證的那樣①E. F. McClennen, “Some Formal Problems with the von Neumann and Morgenstern Theory of Two-Person Zero-Sum Games, Ⅰ: The Direct Proof”, Theory and Decision, Vol. 7, No.1—2, 1976, pp.1—28.)。
對(duì)第四部分的評(píng)論:這部分公認(rèn)的理論在我看來(lái)依然有最清晰的癥狀,有些地方一定有問(wèn)題。莫名其妙的是,這些小小的錯(cuò)誤都會(huì)使我們徹底迷失方向?;旌喜呗圆豢赡芎?jiǎn)單地就是那個(gè)理性的或最佳的選擇。我認(rèn)為,這無(wú)須再爭(zhēng)論;像切諾夫②H. Chernoff, “Rational Selection of Decision Functions”, Econometrica, Vol. 22, No. 4, 1954, pp.422—443.的那種牽強(qiáng)推理的無(wú)效性,只能由標(biāo)準(zhǔn)理論(的其他部分)已深深占據(jù)人心這一事實(shí)來(lái)解釋。讓我來(lái)只是重復(fù)一下那個(gè)推理的簡(jiǎn)版:它從以下假設(shè)開(kāi)始,局中人在他們的可選項(xiàng)中有某種偏好排序。盡管博弈論并沒(méi)有建立這種排序,正如上面所提到的那樣,但否定其可能性或者只在博弈情景中才講得通確實(shí)會(huì)是一個(gè)奇怪的斷言?,F(xiàn)在,兩個(gè)可比較選項(xiàng)的混合明顯不比它們兩個(gè)好。并且,如果排序不應(yīng)該是完全的或相關(guān)的,如果應(yīng)該有兩個(gè)不可比選項(xiàng),那么它們的混合就與它們兩個(gè)中的每一個(gè)都不具有可比性。因此,一種混合在任何情況下都不比組成混合的成分更有效,也就沒(méi)有必要考慮把混合策略作為局中人的選項(xiàng)。
實(shí)際上,是否任何人都已經(jīng)真的主張把混合均衡策略作為那個(gè)理性選擇,這是不清楚的,因?yàn)榇嬖谙旅孢@個(gè)固有的相反論證,這個(gè)論證是眾所周知的。如果一個(gè)局中人堅(jiān)信他的對(duì)手使用他的混合均衡策略,那么所有的混合在他自己的均衡策略中的純粹策略(以及所有的它們的其他混合)就會(huì)有相同的最大預(yù)期效用。也就是說(shuō),如果其中一個(gè)局中人相信博弈論,另一個(gè)人就不需要這樣并被證明忽視混合策略;如果其中一個(gè)局中人不相信博弈論,那么無(wú)論如何博弈論馬上就會(huì)中止。海薩尼在他的文章③J. C. Harsanyi, “Games with Randomly Disturbed Payoffs: A New Rationale for Mixed-Strategy Equilibrium Points”, International Journal of Game Theory, Vol.2, No.1, 1973, pp.1—23.中也擔(dān)心混合策略中均衡點(diǎn)的這種不穩(wěn)定性(它表明,即使第二部分無(wú)可爭(zhēng)議,也不可能順利延續(xù)到第四部分),我們稍后回到那里。
在這里,通常附加的論證毫無(wú)用處。秘密論證,即隨機(jī)化有利于對(duì)付聰明的對(duì)手①例如,參見(jiàn) R. D. Luce ﹠ H. Raiffa, Games and Decisions, New York: Wiley ﹠ Sons, 1957, p.75。,是不切實(shí)際的。因?yàn)檎纾?biāo)準(zhǔn)形式)博弈情景所通常描述的那樣,局中人在他們作出選擇之前不可能知道或發(fā)現(xiàn)其他對(duì)手的做法,除非他們有通心術(shù)或相似的特異功能。他們也許多少對(duì)其他人有明顯的信念,但根據(jù)通常的描述,在目前情況下未發(fā)現(xiàn)的選擇過(guò)程不可能成為證據(jù)的一部分。多少帶有爭(zhēng)論性地講:博弈論中的有趣之處并不是害怕知識(shí)的出現(xiàn),而是害怕知識(shí)所缺乏的確定性。
無(wú)論是出于解釋性理由還是證明性理由,在教科書(shū)中常常可以找到另一條線索。這條線索是,想象一個(gè)被玩了很多次或無(wú)數(shù)次的博弈。可是,如果它被當(dāng)成人們?cè)谕鏄?gòu)建自原初博弈的超級(jí)博弈,這條線索就無(wú)任何進(jìn)步,只是因?yàn)槲覀冊(cè)谠醪┺闹兴械睦碚撀闊?huì)再次出現(xiàn)在超級(jí)博弈中。但即使我們假定在統(tǒng)計(jì)上無(wú)法使用的(在適當(dāng)之處中顯示的)原初博弈純粹策略的隨機(jī)序列在超級(jí)博弈中是(當(dāng)然是)一個(gè)合理的選擇,并且會(huì)有一個(gè)理論上無(wú)可爭(zhēng)議的正當(dāng)理由,我們?nèi)詻](méi)有獲得成功。當(dāng)原初博弈只使用一次時(shí),從那里到理性的東西之間并沒(méi)有嚴(yán)格的推理。②在這里,也許值得注意的是,根據(jù)長(zhǎng)期考慮來(lái)解釋個(gè)案概率的嘗試也被證明是得不到結(jié)果的;參見(jiàn)I. Hacking, Logic of Statistical Inference, Cambridge: University Press, 1965, Ch.4。
秘密論證在這種反復(fù)博弈的語(yǔ)境中更能講得通,因?yàn)樵缙诓┺闹械碾S機(jī)化可能在后期博弈中變得無(wú)法計(jì)算。但所有這些都忽視了這一點(diǎn)。這些考慮的可信性和實(shí)際價(jià)值是無(wú)可爭(zhēng)辯的。然而這一點(diǎn)就其本身而言,并沒(méi)有使它有助于基礎(chǔ)導(dǎo)向的理論化。并且,作為局中人可能選擇的混合策略就因上述理由而被放心地忽略 掉。
我們可以通過(guò)嚴(yán)格堅(jiān)守決策論的立場(chǎng)來(lái)避開(kāi)所有這些麻煩。那我們將不得不為局中人詳細(xì)地說(shuō)明完全決策模型,這就促使我們要清晰地陳述所有我們關(guān)于局中人的假設(shè),尤其是認(rèn)知假設(shè),并從它們出發(fā),依據(jù)最大預(yù)期效用規(guī)則而不是貌似可信的推理來(lái)嚴(yán)格地得出理性的選擇。因此,理論的第一部分應(yīng)盡可能地精確。第二部分盡管以其弱化的方式在評(píng)論中提到,但它依然有效。第三部分的混亂將會(huì)立即澄清。并且,我們將不會(huì)有采用混合策略的任何想法。
那非常好,但積極的貝葉斯理論看起來(lái)又怎樣呢?它沒(méi)有陷入新的麻煩嗎?讓我們看看。我們首先應(yīng)該介紹一些術(shù)語(yǔ)。在這一節(jié)中,理性的(rational)就是恰恰指最大預(yù)期效用而不是其他任何東西;這很重要。一個(gè)人堅(jiān)信p,就意味著其關(guān)于p的主觀概率是1。關(guān)于兩個(gè)人1和2,我們用遞歸方式定義:如果人i(i=1,2)堅(jiān)信p,那么其對(duì)p有一階信念;如果人i堅(jiān)信人j(j≠i)對(duì)p有n階信念,那么其對(duì)p有n+l階信念;當(dāng)且僅當(dāng)p為真并且兩個(gè)人對(duì)p的信念一直到n階,p是這兩個(gè)人之間的n階共同知識(shí)(盡管?chē)?yán)格來(lái)講,需要的不是他們所具有的知識(shí),而只是真的信念)。
現(xiàn)在讓我們轉(zhuǎn)向最簡(jiǎn)單的情形,看看純粹策略中只有一個(gè)均衡點(diǎn)的標(biāo)準(zhǔn)形式的兩人零和博弈,在那里查理(橫向選擇者)和露西(縱向選擇者)是我們的兩個(gè)對(duì)手。公認(rèn)理論的第一部分和對(duì)它的評(píng)論都建議通過(guò)假設(shè)以下一點(diǎn)開(kāi)始分析:查理和露西的理性和他們由博弈矩陣得來(lái)的效用都是還須在它們之間詳加說(shuō)明的某階共同知識(shí)。如果是n階,我們可稱這個(gè)假設(shè)為RUMn。RUM是不是已經(jīng)解決了這些博弈?不幸的是,沒(méi)有。RUM所做的是,排除那些從一開(kāi)始或以這種方式消除一些可選項(xiàng)后仍占嚴(yán)格支配地位的可選項(xiàng)。例如,下面的博弈是通過(guò)RUM5來(lái)解決(當(dāng)然,它應(yīng)用 RUM4,…,RUM1):
因?yàn)镽UM1,露西堅(jiān)信查理永遠(yuǎn)不會(huì)做a4;因?yàn)镽UM2,查理堅(jiān)信露西堅(jiān)信這些并因此永遠(yuǎn)不會(huì)做b4;同樣,a3被RUM3排除,b3被RUM4排除(這解決了查理的問(wèn)題),最后a2被RUM5排除(這也解決了露西的問(wèn)題)。
一般化:如果RUMs能有效排除局中人的一個(gè)選項(xiàng)之外的所有其他可選項(xiàng),那么剩下的那個(gè)選項(xiàng)只能是他的均衡策略。不幸的是,RUM在其中有效的博弈是有具體特征的。例如,所有的RUM在以下類型的博弈中無(wú)能為力:
在這里,RUM1沒(méi)有排除任何東西,因此沒(méi)有RUM能解決問(wèn)題。
貝葉斯立場(chǎng)存在潛在困難。根據(jù)標(biāo)準(zhǔn)理論,第一部分的有點(diǎn)兒模糊的假設(shè)似乎以非??尚诺姆绞阶C明了對(duì)所有兩人零和博弈的均衡或極大極小策略的正當(dāng)性?,F(xiàn)在,在一種決策理論的精確化(exactification)之下,這些假設(shè)濃縮為RUMs;但RUMs不夠有力,只能否定極為特殊的個(gè)例。對(duì)非貝葉斯主義者而言這也解決了問(wèn)題,即使貝葉斯主義者在這一點(diǎn)上有所動(dòng)搖。但在我看來(lái),由于上面提到的理由,任何對(duì)決策理論道路的背離都會(huì)成為理論上的災(zāi)難。因此,正如均衡策略看來(lái)并且廣泛被認(rèn)為合理的那樣,這個(gè)工作只能是通過(guò)一些似乎合理的假設(shè)加強(qiáng)RUM,均衡策略也許可從這些假設(shè)來(lái)證明是理性的。我認(rèn)為,我打算陳述的假設(shè)是與標(biāo)準(zhǔn)博弈論的精神最為接近的假設(shè);事實(shí)上,它將是微不足道的改寫(xiě)以至于你會(huì)失望:
根據(jù)RUM,我們的第二個(gè)事例的麻煩是,查理和露西關(guān)于他人行動(dòng)的認(rèn)知狀態(tài)根本不受限制,他或她的每一個(gè)可選項(xiàng)相對(duì)于認(rèn)知狀態(tài)都是最優(yōu)的。因此,我們應(yīng)當(dāng)引進(jìn)一些關(guān)于這些認(rèn)知狀態(tài)的限制。做到這一點(diǎn)的一個(gè)方法是,加強(qiáng)從RUMn到RUEn,即以下假設(shè)是他們之間的n階共同知識(shí):不僅是查理和露西的理性及其效用,而且包括他們關(guān)于他人行動(dòng)的認(rèn)知狀態(tài)。
更正式一些來(lái)講,這實(shí)際上是下面的定理,它們實(shí)際上適用于所有標(biāo)準(zhǔn)形式的兩人博弈。用A1表示查理的一組可選項(xiàng),用A2表示露西的一組可選項(xiàng),我們來(lái)考慮以下命題:
(1) 查理是有理性的 。
(1′) 露西是有理性的。
(2) 他的 A1×A2的效用函數(shù)是 U1。
(2′) 她的 A1×A2的效用函數(shù)是 U2(不必然是 U1)。
(3) 他的A2的主觀概率函數(shù)是P1。
(3′) 她的 A1的主觀概率函數(shù)是 P2。
(4′)—(9′)是把(4)—(9)中查理和露西的角色互換。
(10) 查理的混合策略s1=P2和露西的混合策略s2=P1都是均衡的。
(11) 他選擇最反對(duì)s2=P1的純粹策略。
(11′) 她選擇最反對(duì) s1=P2的純粹策略。
那么,(從只是論及一個(gè)人的意義上講)我們有以下“個(gè)人內(nèi)心的”定理:(1)—(9)蘊(yùn)涵(10)和(11);以及“人際的”定理:(1)—(6)和(1′)—(6′)蘊(yùn)涵(10)( 11)和(11′)。
這個(gè)證明幾乎不應(yīng)該表述如下:讓BiA(ii=1,2)是所有純粹策略的集合,根據(jù)Ui,這些純粹策略最反對(duì)S(jj≠i)的。用M(Bi)表示Bi中所有策略混合的集合。那么當(dāng)然,M(Bi)中的每一個(gè)混合策略都最反對(duì)Sj?,F(xiàn)在,(3)—(6)蘊(yùn)涵s2M(B2)。同理,從(6)—(9)或(3′)—(6′)得出 s1M(B1)。因此,s1和 s2是均衡的;最后,(1)和(1′)分別蘊(yùn)含(11)和(11′)。
我得趕緊補(bǔ)充的是,我們剛剛把混合策略僅僅作為一種形式手段來(lái)使用(當(dāng)然,它們還是非常有用的);在這里,P1僅僅被認(rèn)為是查理所具有的東西,S2不是露西所具有的,盡管它們可能在形式上等同。讓我也補(bǔ)充一下,這些“定理”也許可非常容易地推廣到所有標(biāo)準(zhǔn)形式的n人博弈。①實(shí)際上,我對(duì)我們的瑣碎“定理”有點(diǎn)兒慚愧。我希望提出一些更為有益的東西;而事實(shí)上,有很多也許更弱也許更貌似真實(shí)的假設(shè)試圖取代RUE。然而,我沒(méi)有發(fā)現(xiàn)和RUE同樣有效的假設(shè)。但畢竟,數(shù)學(xué)上的新奇不是我這里的目標(biāo)。
對(duì)于陳述這些定理,我的理由是,我認(rèn)為它們的形式應(yīng)當(dāng)是博弈論定理的范式。它們通過(guò)完全決策模型刻畫(huà)局中人,在完全決策模型中,他的愿望和信念都是按需要的詳細(xì)程度來(lái)刻畫(huà);并且,他們堅(jiān)持把最大預(yù)期效用作為唯一的決策規(guī)則。因此,它們是嚴(yán)格的貝葉斯定理,并且正因如此,它們符合由先前部分中的批判產(chǎn)生的全部要求。
我認(rèn)為,它們不應(yīng)該為它們的結(jié)論(11)和(11′)而受責(zé)備,盡管這個(gè)結(jié)論對(duì)純粹策略中沒(méi)有均衡點(diǎn)的博弈而言是不完全確定的。標(biāo)準(zhǔn)博弈論對(duì)于純粹策略同樣沒(méi)有詳細(xì)說(shuō)明,并且已經(jīng)清楚的是,在貝葉斯式解釋之內(nèi)我們無(wú)法根據(jù)混合策略得出更具體的結(jié)果。因此,這么多非確定性是不可避免的,并且在這方面沒(méi)有理由失 望。
但是,可能你會(huì)因它們的前提而責(zé)備它們,盡管你肯定認(rèn)為前提符合標(biāo)準(zhǔn)博弈論的精神。提及“個(gè)人內(nèi)心的”定理,前提(1) (2) (4) (5) (7)和(8)都是RUM2的部分,不管如何這是博弈論中所承認(rèn)的;(3) (6)和(9)也與假設(shè)其假設(shè)的公共性這個(gè)一般趨勢(shì)相一致,尤其,博弈論歸咎于局中人的是,它們說(shuō)明了擔(dān)心對(duì)方太透 明。
然而,有人反駁說(shuō),把(3) (6) 和(9)作為前提——盡管理性的局中人是真的——根本不符合博弈論的精神,而不如說(shuō)是博弈論的一種諷刺,因?yàn)橥ㄟ^(guò)表明S1和S2分別是查理和露西要做的理性事情,從而斷然假定博弈論所要建立或努力建立的東西(由于所假設(shè)的理性共同知識(shí),從而蘊(yùn)含(3) (6)和(9))?,F(xiàn)在我要重申的是,像(3) (6)和(9)這樣的事物在標(biāo)準(zhǔn)博弈論中根本不是嚴(yán)格地建立的,而我們?cè)僖淮蝸?lái)到這里。這里的障礙在哪里?我認(rèn)為,即使人們同意到目前為止我所說(shuō)的,依然肯定存在這樣一種感覺(jué),即我沒(méi)有完全公正地對(duì)待標(biāo)準(zhǔn)博弈論。事實(shí)是,當(dāng)對(duì)標(biāo)準(zhǔn)理論的顯明目標(biāo)即建立理性行動(dòng)進(jìn)行表面判斷時(shí),就清楚地表明標(biāo)準(zhǔn)理論意在更多我們還未把握到的東西,貝葉斯式重述就會(huì)導(dǎo)致一種淺薄。但讓我們目前遵從這一殘酷的事實(shí);當(dāng)我們隨后從一個(gè)更抽象的水平來(lái)理解它時(shí),我們就會(huì)看得更加清楚。
另一種指責(zé)可能是,(3)( 6)和(9)是比其他假設(shè)更加難以置信的假設(shè)(盡管這與先前的指責(zé)即(3)( 6)和(9)是假定而非證明的相反)。下面是三個(gè)相關(guān)的評(píng)論 :
第一,所有(1)到(9)當(dāng)然都是理想化的。但是,根本沒(méi)有理由解釋為什么(3)( 6)和(9)應(yīng)該是比其他假設(shè)都更加嚴(yán)重的理想化。因此,這不可能是這個(gè)指責(zé)所指向的觀點(diǎn)(一般而言的懸而未決的理想化本質(zhì)不是我們需要討論的主題)。
第二,通常很難說(shuō)(5)還是(6),或(8)還是(9)是我們定理的更加關(guān)鍵的假設(shè),因?yàn)樵陉P(guān)于他人的信念或愿望是否更容易可知這個(gè)問(wèn)題上,似乎不可能有任何一般的、實(shí)質(zhì)的斷言;我認(rèn)為,這個(gè)問(wèn)題不需要爭(zhēng)論。
第三個(gè)要提的事情是,說(shuō)與RUM相對(duì)立的RUE的盈余包含在局中人的認(rèn)知狀態(tài)的共同知識(shí)中是欠妥當(dāng)?shù)模驗(yàn)橐恍┻@樣的東西常常已經(jīng)包含在RUM中。也就是說(shuō),如果博弈有機(jī)會(huì)變化,那么局中人關(guān)于這些變化的認(rèn)知狀態(tài)就通過(guò)RUM而眾所周知,因?yàn)槟菚r(shí)RUM需要預(yù)期效用被眾所周知。
盡管有這些辯護(hù)性評(píng)論,(6)和(9)依然看起來(lái)比(5)和(8)更有問(wèn)題——至少在兩人博弈的通常例子中(這不可能通過(guò)說(shuō)這些例子有偏見(jiàn)就可以不管)。這會(huì)被下面的考慮所支持。
首先,假設(shè)局中人相互知道關(guān)于機(jī)會(huì)變化的認(rèn)知狀況,這似乎在許多(盡管不是在所有)情景中都是無(wú)傷大雅的——例如像擲骰子的機(jī)會(huì)變化,而且,當(dāng)關(guān)于機(jī)會(huì)變化的主觀概率不是很容易被當(dāng)作反映那種機(jī)會(huì)變化的客觀概率的知識(shí)時(shí),即使當(dāng)問(wèn)題中的機(jī)會(huì)變化沒(méi)有客觀概率時(shí),也是如此。例如,機(jī)會(huì)變化也許是史努比是否正在找紅男爵,然后我們可以想象查理作如下推理:“史努比昨天就開(kāi)始尋找了,通常這要花費(fèi)他幾天時(shí)間。因此,非??赡?,比如說(shuō)90%的可能性,他仍然在尋找。現(xiàn)在,因?yàn)槁段骱臀乙黄鸢l(fā)現(xiàn)他昨天登上了他的雙翼飛機(jī),我知道她知道史努比是從昨天開(kāi)始的,她也知道我知道史努比是從昨天開(kāi)始的。更重要的是,她對(duì)他的了解和我對(duì)他的了解幾乎一樣多,并且她知道我有多了解他;因此,她會(huì)準(zhǔn)確地猜到我關(guān)于史努比的概率,并且她本人會(huì)有相同的概率?!泵慨?dāng)這樣的考慮適宜時(shí),就可以貌似合理地假定至少局中人關(guān)于機(jī)會(huì)變化的信念這樣的二階共同知識(shí)。①讓我順便指出,(1) (2) (4) (5) (7)和(8)是不如RUM2有力的查理RUM的一半,(1)到(9)是不如RUE2有力的查理RUE的一半。我認(rèn)為,這是可以令人滿意的,因?yàn)樗坪跷覀兣实堑腞UM或RUE的等級(jí)越高,我們就更加奇怪地喪失自我。
同樣地,共同的效用知識(shí)常??雌饋?lái)沒(méi)問(wèn)題。因此,想象一下查理和露西在玩相匹配的賭注;那么就有了查理為這個(gè)博弈建立(2) (5)和(8)的另外一個(gè)簡(jiǎn)單的推理:“我下了不到四分之一,我想贏。所以,我的效用堅(jiān)守不變。現(xiàn)在,露西非常了解人性,特別是我的人性。人人都追逐金錢(qián),畢竟我也不例外。所以,她將知道我的偏好。但是,她也沒(méi)什么不同,她已經(jīng)充分證明了這一點(diǎn)。所以,她的效用應(yīng)該與我的相對(duì)立?!?/p>
與這兩個(gè)推理相反,讓我們看看對(duì)于(3) (6)和(9)是否存在相似的推理。查理也許會(huì)作如下闡述:“露西的各種可選項(xiàng)的概率是怎樣的?為了找到答案,我應(yīng)該審查我關(guān)于她的證據(jù)?!薄獣和R幌隆昂冒?,不管我的證據(jù)是什么,我已把它與她知道的收集在一起;沒(méi)什么特殊的或神秘的東西。因此,(a)她大概知道我有關(guān)于她的哪些證據(jù)。但是,(b)她也因此將正確地猜到我的概率;畢竟,我們思考的方式并無(wú)不同。同樣,她將可能想到我正確地猜到她對(duì)我的概率?!薄獣和R幌隆翱纯?,按照RUM(確切地說(shuō)是RUM3)發(fā)展下去,(c)我的概率一定是Pl,她的是P2(假設(shè)這是唯一的均衡點(diǎn))。因此,(d)她也認(rèn)為我會(huì)有P1。那不是很聰明嗎?”
不,和先前兩個(gè)推理相比,它有點(diǎn)兒可疑。與史努比的情形相反,關(guān)于露西的證據(jù)依然不清楚。然而,真正糟糕的事情是,到(d)的推理有些弄巧成拙。因?yàn)?,(a)是(b)的根據(jù),但(b)導(dǎo)向(c)然后到(d)卻沒(méi)有提及任何證據(jù);因此,(a)變得根本不具有操作性,而這就使(b)喪失了它的根據(jù)。
使查理的第三個(gè)推理站得住腳的明顯方式似乎是,明確陳述一些查理貌似具有的證據(jù)和直接引起他擁有愿望P1的證據(jù);他到(d)的推理就行得通了。(需要注意的是,正如他的推理所表明的那樣,查理?yè)碛蠵1不是因?yàn)镻1是可與露西所知道的他的概率相一致的唯一概率函數(shù)。相反,他有P1是由于他擁有的證據(jù),然后P1被附加——盡管不是偶然——證明是非常一致的。)
然而,就像第六節(jié)中的討論使我們恰好得出相同的結(jié)論一樣,我會(huì)稍后更詳細(xì)地解釋。因此,目前我們不得不承認(rèn),我們對(duì)(3) (6)和(9)依然缺乏根據(jù),這就像對(duì)(2) (5)和(8)那樣自然,并因此對(duì)允許(3) (6)和(9)作為額外前提的兩個(gè)指責(zé)仍然沒(méi)有得到充分的回答。
迄今為止,我們已經(jīng)介紹并比較了標(biāo)準(zhǔn)理論和決策理論,我希望我已經(jīng)解釋清楚在我看來(lái)的貝葉斯理論的確切優(yōu)點(diǎn)之所在,以及為什么它們?cè)谀抢锎嬖凇5牵乙舱冒l(fā)現(xiàn)貝葉斯理論的一些尚待處理的問(wèn)題,為了使它們牢靠,似乎看起來(lái)我們不得不返回到公認(rèn)的理論。因此,讓我從一個(gè)更深一點(diǎn)兒的層次上再次闡釋整個(gè)理論,即通過(guò)考察作為不同觀點(diǎn)的基礎(chǔ)的理性觀念。首先讓我從標(biāo)準(zhǔn)理論入手。
事實(shí)上,在標(biāo)準(zhǔn)博弈論背后似乎并沒(méi)有一個(gè)非常明確的理性觀念。至少在20世紀(jì)五六十年代,另一個(gè)發(fā)展理性概念的方式在決策論和博弈論及相關(guān)領(lǐng)域中非常受歡迎。第一條規(guī)則,源自對(duì)任何宏偉畫(huà)卷的敏感式懷疑,是不以任何綜合性、而是以不考慮后果的理性觀念來(lái)對(duì)主題作出的預(yù)先判斷。更精確地說(shuō),正如羅爾斯稱作的那樣①J. Rawls, A Theory of Justice, Cambridge, Mass.: Harvard University Press, 1971, pp.48ff.,一種審慎的步進(jìn)式推理(step-by-step reasoning)應(yīng)該導(dǎo)向一種直觀而系統(tǒng)的論證的反思性均衡。因此,有人從一些直觀上非常令人信服的假設(shè)出發(fā),展示他們的演繹結(jié)果,詳細(xì)檢查這些結(jié)果是否在直觀上不合理,最終拋棄最弱的假設(shè),努力增添新的假設(shè),以相同的方式核實(shí)他們,區(qū)分基本的和派生的假設(shè),等等。通過(guò)這種方式,諸如偏好傳遞性原則和確鑿性原則等大量的基本原則(以及一些次基本原則,像那些作出修改以適應(yīng)更具體情景的極大極小變化)就出現(xiàn)了,然后它們會(huì)非常自信地聲稱能刻畫(huà)理性。雖然這些原則從沒(méi)有認(rèn)為應(yīng)該詳細(xì)討論理性概念,但它們被證明是十分有力的。的確,對(duì)處于確定性和風(fēng)險(xiǎn)性之下的決策而言,這種方式取得了完全成功;對(duì)處于不確定性之下的決策而言,盡管不是全體同意,但結(jié)果是可闡明的;并且,至少較為簡(jiǎn)單的博弈情景得到了滿意的解決。
我希望這不是一個(gè)對(duì)實(shí)際過(guò)程過(guò)于扭曲的描述,在我看來(lái),它的唯一缺點(diǎn)是看起來(lái)有點(diǎn)缺乏概念的清晰性;到底是什么推向一種反思性均衡,這并不完全透明。這在博弈論中尤感壓力,但至少我嘗試在后續(xù)中進(jìn)行論證。
為了更清楚些,我認(rèn)為,我們必須對(duì)關(guān)于理性的兩三個(gè)相當(dāng)明顯的事實(shí)進(jìn)行考察。首先,我們必須嚴(yán)格區(qū)分行動(dòng)理性、信念理性以及可能的愿望理性,并分別討論它 們。
讓我們首先考慮行動(dòng)理性,它是決策論和博弈論的公開(kāi)主題。這里重要的事情是,無(wú)論一個(gè)人的行動(dòng)是不是理性的,它只能由那個(gè)人相關(guān)的主觀愿望和信念決定。這從日常經(jīng)驗(yàn)看是顯而易見(jiàn)的;無(wú)論何時(shí)我們偶然遇到看起來(lái)不理性的行動(dòng),當(dāng)這個(gè)行動(dòng)者或其他很熟悉他的人,向我們解釋他這樣行動(dòng)的原因時(shí),我們可能就會(huì)放棄我們的判斷。并且,這從反復(fù)指出這一事實(shí)的哲學(xué)作品看也是顯而易見(jiàn)的。②例如,參見(jiàn)C. G. Hempel, “Rational Action”, Proceedings and Addresses of the American Philosophical Association,Vol.35, Yellow Springs, Ohio: The Antioch Press, 1962, pp.5—23,或者P. M. Churchland, “The Logical Character of Action-Explanations”, Philosophical Review, Vol.79, No.2, 1970, pp.214—236,以及其他關(guān)于理性解釋和行動(dòng)解釋的文獻(xiàn)?,F(xiàn)在,只有當(dāng)一個(gè)行動(dòng)與本身就理性的信念和愿望理性地關(guān)聯(lián)起來(lái)時(shí),我們才能稱這個(gè)行動(dòng)是理性的。但是,這只不過(guò)是個(gè)術(shù)語(yǔ)問(wèn)題。在兩個(gè)方面之間存在一定的關(guān)系,一方面是行動(dòng),另一方面是信念和愿望,而無(wú)論信念和愿望可能是什么。無(wú)論何時(shí)一個(gè)行動(dòng)把這種關(guān)系帶給既定的信念和愿望,更可取的做法并且也是我的做法,就是把這個(gè)行動(dòng)稱作是理性的。哪個(gè)行動(dòng)在這個(gè)意義上恰好是理性的,通常是權(quán)衡每一給定的信念和愿望在原則上相關(guān)的結(jié)果。當(dāng)然,這很模糊;但把它弄清楚卻是一個(gè)明確的任務(wù),并且,考察信念理性和愿望的理性是一項(xiàng)與眾不同的工作(這還不是我們的主題)。
對(duì)我們而言,這個(gè)考察有兩個(gè)結(jié)果。一個(gè)是,當(dāng)處理行動(dòng)理性時(shí),我們確實(shí)應(yīng)該考慮概率的主觀主義解釋。因?yàn)楠?dú)立于一個(gè)人的主觀信念時(shí),對(duì)行動(dòng)理性就沒(méi)有多少可以說(shuō)的。從這個(gè)觀點(diǎn)看,不確定性條件下的決策和標(biāo)準(zhǔn)理論中所描述的博弈情境一樣,只不過(guò)似乎是證據(jù)不足的問(wèn)題。但是,如果一個(gè)人的信念被明確地考慮,那我們就不得不使這些信念概念化;并且,微弱地說(shuō),概率衡量是一個(gè)這樣概念化的好方式。我認(rèn)為,這在哲學(xué)中并未提及,但奇怪的是,它似乎依然需要在博弈理論家和經(jīng)濟(jì)學(xué)家中強(qiáng)調(diào)。
事實(shí)上,在所有標(biāo)準(zhǔn)博弈論中都闡述過(guò)對(duì)主觀概率的反感。在機(jī)會(huì)變化的觀念和處理中這是顯而易見(jiàn)的,它說(shuō)明一個(gè)事實(shí),其他人的行動(dòng)并不是作為局中人的概率來(lái)考慮的,在對(duì)待局中人的整個(gè)認(rèn)知構(gòu)成時(shí)就像對(duì)待非親生子女一樣可以找到一般表述。毫無(wú)疑問(wèn),標(biāo)準(zhǔn)博弈論通過(guò)精彩的替代克服缺少不受歡迎的主觀概率,但我認(rèn)為同樣清楚的是,這種轉(zhuǎn)變是標(biāo)準(zhǔn)理論中不連貫闡述的主要原因。并且,它使前面勾勒的達(dá)至理性的“反思性均衡”方法變得更為含 混。
第二個(gè)結(jié)果是,如果我們?cè)敢庠跀?shù)學(xué)模型中捕捉行動(dòng)理性,我們就幾乎自動(dòng)地導(dǎo)向決策論。因?yàn)榉从澈饬恐饔^信念和愿望的最自然的方法是以某種量化的方式將它們概念化;當(dāng)然,對(duì)這樣一種量化的概念化而言,實(shí)踐上無(wú)可匹敵的候選項(xiàng)就是概率測(cè)度和效用函數(shù);因此,最大預(yù)期效用的貝葉斯規(guī)則是衡量過(guò)程及其產(chǎn)出的最為貌似合理并在數(shù)學(xué)上最為簡(jiǎn)單的模型。當(dāng)然,這個(gè)考量獨(dú)自不可能建立起決策論;但是,由于堅(jiān)實(shí)的“反思性均衡”基礎(chǔ)已經(jīng)盡一切力量支持這個(gè)數(shù)學(xué)模型,這就可能使之簡(jiǎn)單 些。
現(xiàn)在重要的是,這個(gè)模型給了我們一個(gè)關(guān)于行動(dòng)的完全解釋,這個(gè)行動(dòng)相對(duì)于給定的信念和愿望而言是理性的。這就是說(shuō),任何在可比較的概念化范圍之內(nèi)起作用的其他解釋,要么是由決策論的解釋引起,要么是與決策論的解釋相抵觸。(嚴(yán)格來(lái)講,這不是很對(duì);根據(jù)決策論,也許存在紐帶;而在這些情形中,也僅僅在這些情形中,可能有另外的解釋不是由決策論引起但可與決策論相比較。)
所有這些的結(jié)果是:我們也許是在為公認(rèn)的主觀信念和愿望的概念化而爭(zhēng)吵。但是,如果我們不爭(zhēng)吵,那么當(dāng)運(yùn)用小于完全的決策模型時(shí),我們就無(wú)法完全公正地對(duì)待行動(dòng)理性;當(dāng)運(yùn)用完全決策模型時(shí),我們就有了完整刻畫(huà)行動(dòng)理性所需要的一切。因此,也從總的角度來(lái)看,像理性行動(dòng)處于爭(zhēng)論之中的其他每個(gè)地方一樣,在博弈論中我們沒(méi)有好的選擇,只有保持一個(gè)嚴(yán)格的決策論過(guò)程。
現(xiàn)在最后一次提出這個(gè)猜測(cè),博弈論對(duì)剛才討論到的弱意義上的行動(dòng)理性不太感興趣,它感興趣的是建立在理性信念以及可能理性愿望基礎(chǔ)之上的強(qiáng)意義上的行動(dòng)理性。然而,愿望理性是一個(gè)非常模糊的主題。根據(jù)理性愿望是否可能通過(guò)理性信念從其他愿望推斷出來(lái),存在一個(gè)并非完全不清楚的愿望觀念,它相對(duì)于其他給定的愿望是理性的愿望。但是,是否也存在一些絕對(duì)地判斷愿望理性的方法——這是一個(gè)開(kāi)放式問(wèn)題,使人想起沉重的道德問(wèn)題,是否有客觀價(jià)值這樣的東西。在這種情景下,聰明的話就不要去假定絕對(duì)的理性愿望,當(dāng)然這也是所有決策理論家和博弈理論家通過(guò)把偏好和效用函數(shù)作為主觀上的既定項(xiàng)所做的事情。因此,我們只討論認(rèn)知理性,這也是最終我們要談的。
首先,我應(yīng)該簡(jiǎn)要提及一個(gè)熟悉的觀點(diǎn)(為了接下來(lái)別再想它),即行動(dòng)理性的決策論解釋已經(jīng)假定一個(gè)形式的認(rèn)知理性最小值,也就是說(shuō),主觀概率像數(shù)學(xué)概率那樣運(yùn)作。但這總是被認(rèn)為是理所應(yīng)當(dāng)?shù)?;?dāng)然,我們現(xiàn)在要考慮一個(gè)超越這點(diǎn)的實(shí)質(zhì)屬 性。
實(shí)際上,標(biāo)準(zhǔn)博弈論確實(shí)和認(rèn)知理性相關(guān)而不僅僅和行動(dòng)理性相關(guān),這一說(shuō)法并不非常清楚。至少,在標(biāo)準(zhǔn)參考資料(像馮·諾依曼、摩根斯坦①J. von Neumann ﹠ O. Morgenstern, Theory of Games and Economic Behavior.或盧斯、雷法②R. D. Luce ﹠ H. Raiffa, Games and Decisions.)中我無(wú)法為此找到好的證據(jù);也許還要不得不處理用以解釋理性的有點(diǎn)兒統(tǒng)一的“反思性均衡”方法。但是,來(lái)自第四節(jié)末尾的印象,即我們的貝葉斯理論并未完全公正地對(duì)待標(biāo)準(zhǔn)理論,也指出了這一憂慮。當(dāng)我們看到海薩尼所寫(xiě)的從他的貝葉斯式方法到博弈論的東西時(shí),議題就變得更加清楚。例如,他說(shuō):
在博弈情景中定義理性行為的基本困難是這樣一個(gè)事實(shí):通常每個(gè)局中人的策略都將依賴于他對(duì)其他局中人的策略的預(yù)期。如果我們能假定他的預(yù)期是給定的,那么他的策略選擇問(wèn)題就會(huì)變成一個(gè)普通的最大值問(wèn)題:基于其他局中人將會(huì)根據(jù)他的既定預(yù)期來(lái)行動(dòng)的假設(shè),他可以簡(jiǎn)單地選擇一個(gè)收益最大化的策略。但關(guān)鍵是,博弈論不可能把局中人關(guān)于彼此行為的預(yù)期看作是給定的;不如說(shuō),對(duì)博弈論而言,最重要的一個(gè)問(wèn)題恰恰是決定哪些預(yù)期是聰明的局中人對(duì)于其他聰明局中人的行為能理性地存有的。這可以被稱作相互“理性預(yù)期”問(wèn)題。③J. C. Harsanyi, “Bargaining and Conflict Situations in the Light of a New Approach to Game Theory”, The American Economic Review, Vol. 55, No. 1/2, 1965, pp.447—457.
為解決這一問(wèn)題,海薩尼不僅提出“狹義上的理性行為假設(shè)”,而且提出“理性預(yù)期假設(shè)”④J. C. Harsanyi, “A General Theory of Rational Behavior in Game Situations”, Econometrica, Vol.34, No.3,1966, pp.613—634.;然后他非常明確地表明這些假設(shè)意味著:
影響局中人的交易行為的僅有變量是:
(1) 與每個(gè)局中人的選擇結(jié)果相關(guān)的回報(bào);以及
(2) 每個(gè)局中人分派給被其他局中人接受或拒絕的不同結(jié)果的主觀概率。
在這些變量中,只有那些在(1)中被提及的是獨(dú)立的變量,而(2)中的變量本身都是由(1)中的變量來(lái)決定。①J. C. Harsanyi, “A General Theory of Rational Behavior in Game Situations”, Econometrica, Vol.34, No.3,1966, p.621.
這上一個(gè)斷言對(duì)海薩尼的方法以及對(duì)標(biāo)準(zhǔn)博弈論都是至關(guān)重要的。但是,我認(rèn)為它基本上就是錯(cuò)的。(事實(shí)上,如果我不這么認(rèn)為,我可能就容忍了這篇文章。)然而,我不可能?chē)?yán)格地論證這個(gè)問(wèn)題,因?yàn)闉榇宋冶仨毐砻?,?duì)認(rèn)知理性的每個(gè)原則而言,人們也許可以貌似有理地心存想法,認(rèn)為它不是從(1)導(dǎo)向(2),還因?yàn)椋紤]到一些基本原則的例外情況,人們并不一致同意這些理應(yīng)心存的原則。認(rèn)知理性的闡釋比行動(dòng)理性少得多。不用奇怪,它是在其完整的哲學(xué)概論中由來(lái)已久但仍然尖銳的歸納問(wèn)題。但是,我將努力講通為什么我認(rèn)為海薩尼的斷言是錯(cuò)的。讓我們從回顧一些關(guān)于認(rèn)知理性的事實(shí)開(kāi)始。
首先,很明顯人們無(wú)法完全說(shuō)信念是理性的或不是理性的。只有與一個(gè)人擁有的證據(jù)相關(guān)時(shí),這個(gè)人的信念才能被說(shuō)成是理性的。這種關(guān)系的一部分在演繹邏輯中被詳加闡明;無(wú)論從證據(jù)演繹地推出什么東西,它在理性上都應(yīng)當(dāng)是可信的。歸納邏輯和統(tǒng)計(jì)學(xué)也(兩者都是較有爭(zhēng)議的)試圖澄清這種關(guān)系。這里已經(jīng)變得明顯的是,某些認(rèn)知狀態(tài)的理性也依賴于先驗(yàn)的認(rèn)知狀態(tài),也就是說(shuō),應(yīng)從先驗(yàn)認(rèn)知狀態(tài)理性的評(píng)價(jià)問(wèn)題中區(qū)分出理性信念變化問(wèn)題——先驗(yàn)認(rèn)知狀態(tài)是如何理性地根據(jù)新證據(jù)改變的?——這是更加困難的問(wèn)題。實(shí)際上,認(rèn)知理性依然非常復(fù)雜;比如,它肯定還依賴于表達(dá)信念的語(yǔ)言。但是,如此深?yuàn)W復(fù)雜的問(wèn)題對(duì)我們的討論而言是無(wú)關(guān)的。②我認(rèn)為,這暗示一個(gè)瑣細(xì)但相關(guān)的評(píng)論,即必須嚴(yán)格區(qū)分理性信念和真實(shí)信念。盡管可能大多數(shù)理性信念是真實(shí)的,但現(xiàn)今大多數(shù)真理不能只是被非理性地相信(因?yàn)槲覀兊淖C據(jù)是如此不足),并且許多理性信念是錯(cuò)誤的(因?yàn)槲覀兊淖C據(jù)經(jīng)常具有誤導(dǎo)性)。這不是說(shuō)理性信念和真實(shí)信念不會(huì)相互關(guān)聯(lián),而是說(shuō)這種關(guān)聯(lián)的本質(zhì)是一個(gè)深入而開(kāi)放的哲學(xué)問(wèn)題。參見(jiàn)C. S. Peirce, Collected Papers, Vol.Ⅰ — Ⅳ, edited by C.Hartshorne ﹠ P. Weiss, Cambridge, Mass.: Harvard University Press, 1960, Vol. Ⅴ, §§ 384—385 ﹠ 405—408,或者H. Putnam, Meaning and the Moral Sciences, London: Routledge ﹠ Kegan Paul, 1978, pp.121—140?,F(xiàn)在,博弈理論家假設(shè)他的局中人具有許多真實(shí)信念,例如,如果他認(rèn)為局中人知道機(jī)會(huì)變動(dòng)的客觀概率,或者如果他假設(shè)一定的RUM(根據(jù)RUMn,所有通過(guò)RUMn輸入到露西的二階信念都為真);關(guān)鍵在于,只要他這樣做,他就引入一個(gè)真正的全新假設(shè),這個(gè)假設(shè)無(wú)法單靠局中人的認(rèn)知假設(shè)來(lái)解釋。似乎對(duì)我而言,標(biāo)準(zhǔn)理論在這一點(diǎn)上并不總是非常清晰;例如,當(dāng)僅僅假設(shè)關(guān)于理性的一階信念時(shí)(參見(jiàn)我們的標(biāo)準(zhǔn)理論第一部分),(錯(cuò)誤的)觀念也許就會(huì)是,更高階的信念通過(guò)所假設(shè)的理性以某種方式塌陷。
現(xiàn)在回到海薩尼的斷言,讓我們?cè)僭O(shè)想一下查理和露西已投入到某個(gè)標(biāo)準(zhǔn)形式的零和博弈之中,并假定某個(gè)RUM(這里的“R”依然只是代表行動(dòng)理性)。讓我們假設(shè)這仍然解決不了博弈問(wèn)題(也就是說(shuō),這個(gè)博弈像我們?cè)诘谒墓?jié)中的第二個(gè)例子)?,F(xiàn)在,我們附加假設(shè)查理在認(rèn)知上是理性的。這有什么幫助呢?我認(rèn)為,毫無(wú)幫助。我們?cè)诘谒牟糠种幸呀?jīng)看到,通過(guò)演繹邏輯RUM并沒(méi)有蘊(yùn)涵任何東西能夠縮小查理對(duì)露西的可能概率范圍。并且我知道,沒(méi)有貌似可信的歸納原則能在這方面做得更好。當(dāng)我們假設(shè)露西在認(rèn)知上是理性的時(shí)候,這同樣成立。但因此,它對(duì)查理相信露西在認(rèn)知上是理性的也沒(méi)有任何幫助。還有很多諸如此類的東西。這樣一來(lái),即使我們附加假設(shè)認(rèn)知理性是查理和露西之間的某階共同知識(shí),我們也不能由此得出他們具有博弈論使他們具有的主觀概率。并且,這與海薩尼的主張相抵觸:他以為我們能得出這一結(jié)論。也就是說(shuō),我們希望的效用和所有理性(以及所有這些的共同知識(shí))將共同決定主觀概率。當(dāng)然,當(dāng)查理和露西承認(rèn)其他或更多的證據(jù)而不僅僅是RUM時(shí),這個(gè)推理根本沒(méi)有排除認(rèn)知理性的假設(shè)可能非常有效。
但是,我們不是批評(píng)海薩尼的斷言,而是應(yīng)該最好看看他是如何支持它的。然而,在他的文章中①J. C. Harsanyi, “A General Theory of Rational Behavior in Game Situations”, pp.613—634.,從我所引用的他的斷言來(lái)看,我沒(méi)有發(fā)現(xiàn)這樣的支持。在文章中,他的理性假設(shè)的確非常明顯地蘊(yùn)涵局中人的行動(dòng)只依賴(1)和(2);但他對(duì)他的更強(qiáng)的論斷沒(méi)有作出進(jìn)一步的論述。不幸的是,用來(lái)解釋其所勾勒的計(jì)劃②Ibid.的其他文章同樣如此。③關(guān)于這些文章,參見(jiàn)下面兩篇文章的參考文獻(xiàn):J. C. Harsanyi, “Bargaining and Conflict Situations in the Light of a New Approach to Game Theory”, The American Economic Review, Vol.55, No.1/2, 1965, pp.447—457; J. C. Harsanyi, “A General Theory of Rational Behavior in Game Situations”。
也許我們的興趣可以由他最近和萊因哈德·澤爾騰(Reinhard Selten)共同發(fā)展的理論來(lái)回答,這個(gè)理論對(duì)解決n人非合作博弈提出了一個(gè)全新的兩階段程序④參見(jiàn)J. C. Harsanyi, “The Tracing Procedure: A Bayesian Approach to Defining a Solution for n-Persons Noncooperative Games”, International Journal of Game Theory, Vol.4, No.2, 1975, pp.61—94,以及J. C. Harsanyi, “A Solution Concept for n-Persons Noncooperative Games”, International Journal of Game Theory, Vol. 5, No.4, 1976, pp.211—225.:
首先,一個(gè)先驗(yàn)主觀概率分布pi被分派給每個(gè)局中人i的純粹策略,這意味著代表其他局中人對(duì)局中人i的可能策略選擇的最初預(yù)期。那么,被稱作追蹤程序的數(shù)學(xué)程序就被用來(lái)定義這些基于先驗(yàn)分布pi之上的解決辦法。追蹤程序意味著為求解過(guò)程提供一種數(shù)學(xué)表達(dá),通過(guò)理性局中人設(shè)法協(xié)調(diào)他們的策略計(jì)劃和他們的預(yù)期,并使他們趨于一個(gè)作為博弈解決方法的特定均衡點(diǎn)。⑤J. C. Harsanyi, “A Solution Concept for n-Persons Noncooperative Games”, International Journal of Game Theory, Vol.5, No.4, 1976, p.211.
這種——在它的具體細(xì)節(jié)上相當(dāng)復(fù)雜的——方法本該有一個(gè)較長(zhǎng)的討論。但是,指出為什么它似乎也沒(méi)有減少我們的麻煩就足夠了。如果我們把這種方法應(yīng)用到兩人零和博弈中,那么只有它的第二步即追蹤程序是相關(guān)的(因?yàn)樗偈姑總€(gè)先驗(yàn)概率分布連到相同的均衡點(diǎn),即到唯一存在的均衡點(diǎn))。現(xiàn)在,我們考慮只有一個(gè)局中人的情形;假設(shè)查理對(duì)露西的選擇集合擁有先驗(yàn)分布,但不是一個(gè)均衡分布。為什么查理應(yīng)該改變這些先驗(yàn)概率?根據(jù)一些新證據(jù)和幾乎不與理性信念變化的任何一般原則相關(guān)的追蹤程序,這種改變似乎并無(wú)必要。為什么不堅(jiān)持也許更為熟悉的先驗(yàn)概率呢?(盡管它們會(huì)表明查理不認(rèn)為露西知道它們——但他為什么應(yīng)該這樣想呢?)海薩尼對(duì)沉溺于追蹤程序給出的唯一理由就是這種先驗(yàn)分布不是均衡分布,而根據(jù)我們的標(biāo)準(zhǔn)理論第二部分中重述的理由,只有均衡點(diǎn)才能是非合作博弈的理性解決方案。①參見(jiàn)J. C. Harsanyi, “The Tracing Procedure: A Bayesian Approach to Defining a Solution for n-Persons Noncooperative Games”, pp.61—94。因此,他認(rèn)為理所應(yīng)當(dāng)?shù)臇|西,對(duì)我們而言依然是需要澄清的東 西。
讓我們依然來(lái)看看海薩尼②J. C. Harsanyi, “Games with Randomly Disturbed Payoffs: A New Rationale for Mixed-Strategy Equilibrium Points”, International Journal of Game Theory, Vol.2, No.1, 1973, pp.1—23.,在那里他非常接近我們的想法,即努力克服混合策略中均衡點(diǎn)的明顯不穩(wěn)定性,這種不穩(wěn)定性在我們對(duì)標(biāo)準(zhǔn)理論第四部分的評(píng)論中曾批判性地提到過(guò)。為此,他提出下面的模型:給出標(biāo)準(zhǔn)形式中的一個(gè)非合作n人博弈,即“原初博弈”,A1,…,An是n人的選擇集合,Vl,…,Vn是他們對(duì)A1×…×An的效用函數(shù)。海薩尼現(xiàn)在認(rèn)為,某個(gè)稍微不同的博弈即“干擾性博弈”可能更真實(shí)地描述了真正的博弈情景,在那里每個(gè)局中人i的真正效用并非固定地由Vi給出,而是圍繞Vi給出的值有一個(gè)小范圍的波動(dòng),這是由于“在其主觀和客觀條件中(例如在其情緒、品位、資源、社會(huì)情境等等之中)有微小的隨機(jī)波動(dòng)”③Ibid.。支配這些波動(dòng)的概率法則可能對(duì)不同的局中人是不同的,但每個(gè)局中人都被假定知道所有這些分布。然而,每個(gè)局中人在進(jìn)行選擇時(shí)僅僅知道他自己的波動(dòng)效用具體是怎樣的。因此,在標(biāo)準(zhǔn)形式的干擾性博弈中,局中人i的一個(gè)可能的純粹策略是一個(gè)函數(shù),它能告訴他,對(duì)真正效用函數(shù)的每一個(gè)可能版本而言,從Ai中選擇哪一個(gè)行動(dòng)。于是,局中人關(guān)于標(biāo)準(zhǔn)形式干擾性博弈的效用函數(shù)立即可從以上描述推斷出 來(lái)。
現(xiàn)在,海薩尼能夠基本證明:干擾性博弈有至少一個(gè)均衡點(diǎn);干擾性博弈的每個(gè)均衡點(diǎn)都在純粹策略中;如果局中人在干擾性博弈的均衡中選擇純粹策略,那么根據(jù)效用性的概率法則,這些選擇會(huì)降到近似處于均衡的原初博弈中的混合策略;并且,這個(gè)近似值越接近,圍繞Vi的波動(dòng)幅度就越小。這就解決了穩(wěn)定性問(wèn)題,因?yàn)樵诟蓴_性博弈中均衡因在純粹策略中而穩(wěn)定;并且因?yàn)樵诟蓴_性博弈中選擇一個(gè)純粹策略就意味著在原初博弈中選擇了一個(gè)隨機(jī)策略;更重要的是,這里出現(xiàn)的隨機(jī)性是因?yàn)樾в玫牟▌?dòng),不必由局中人有意執(zhí)行。
看起來(lái),似乎這個(gè)模型能夠?yàn)槲覀兊摹岸ɡ怼敝械恼J(rèn)知假設(shè)(3) (6)和(9)提供長(zhǎng)期尋找的正當(dāng)性證明。但是,它這樣做要以什么為代價(jià)呢?它有其他強(qiáng)的假設(shè)來(lái)替代。波動(dòng)效用的觀念使人想起瑟斯頓(L. L. Thurstone)把心理學(xué)變量看作隨機(jī)變量的方法。①參見(jiàn)L. L. Thurstone, “The Prediction of Choice”, Psychometrika, Vol. 10, No. 4, 1945, pp.237—253。這種方法是對(duì)數(shù)學(xué)心理學(xué)的一個(gè)重大貢獻(xiàn),但大體上,這種方法的一個(gè)公認(rèn)的嚴(yán)重困難是確定這些隨機(jī)變量的分布。②參見(jiàn) D. Laming, Mathematical Psychology, London: Academic Press, 1973, Ch. 2。因此,在一定意義上,海薩尼要求我們的局中人最好成為瑟斯頓式的心理學(xué)家,而不是能干的科學(xué)家。但是,人們并不需要把效用的波動(dòng)解釋為效用的客觀概率不確定性;人們可以把這些波動(dòng)的概率法則解釋為表達(dá)局中人對(duì)彼此的主觀不確定性。然而,接下來(lái)非常神秘的是,為什么關(guān)于局中人i的效用的不確定性對(duì)所有其他局中人而言有著完全相同的形式?,F(xiàn)在,上面的異議并不適用于兩人博弈(因?yàn)橹挥幸粋€(gè)其他局中人)。但是,即使再解釋也無(wú)濟(jì)于事,因?yàn)楦蓴_性博弈的效用函數(shù)被假定為那里的每個(gè)局中人都知道;這就要求對(duì)原初博弈中其他局中人的效用而言,每個(gè)局中人都知道每個(gè)人的概率分布。因此,不管如何解釋,人們很難對(duì)海薩尼的模型③J. C. Harsanyi, “Games with Randomly Disturbed Payoffs: A New Rationale for Mixed-Strategy Equilibrium Points”, pp.1—23.的假設(shè)感到滿意。除此之外,我們還理所當(dāng)然地認(rèn)為,只有在純粹策略下具有均衡點(diǎn)的博弈中,均衡行為才是理性的。
我們不得不絕望于為(3) (6)和(9)尋找某種正當(dāng)性證明嗎?如果我們?cè)谖宜Q的海薩尼斷言界定的領(lǐng)域內(nèi)尋找,即只是在即將到來(lái)的博弈情景中尋找,那我認(rèn)為我們確實(shí)不得不絕望。事實(shí)上,這一部分現(xiàn)在恰恰使我們導(dǎo)向第四節(jié)末尾的困境之中。并且,出口就隱藏在那里:我們沒(méi)必要將局中人的認(rèn)知理性起作用的證據(jù)限制在即將到來(lái)的博弈情境。畢竟,我們也要為假設(shè)(4) (5) (7)和(8)尋找某些支持或證據(jù),它們也是認(rèn)知假設(shè)(通過(guò)假設(shè)查理相信某些東西)。這里非常清楚的是,一個(gè)局中人對(duì)于他的同伴是理性的并且具有如此這般的效用的信念無(wú)法在給定的博弈情境中獨(dú)自得到證明;不如說(shuō)它只能通過(guò)長(zhǎng)期而豐富的人類經(jīng)驗(yàn)來(lái)獲得(細(xì)節(jié)并不清楚)。因此,這也許是對(duì)(3) (6)和(9)而言合適的證據(jù)領(lǐng)域;特別是一個(gè)局中人可能已經(jīng)處在博弈情境中很多很多次了,他由此可能已經(jīng)形成我們期望他所擁有的信念。實(shí)際上,布朗已經(jīng)通過(guò)虛構(gòu)的博弈提出這個(gè)想法④G. W. Brown, “Iterative Solution of Games by Fictitious Play”, in Activity Analysis of Production and Allocation,edited by T. C. Koopmans, New York: Wiley ﹠ Sons, 1951, pp.374—376.,它與接近兩人零和博弈的均衡點(diǎn)的迭代過(guò)程有關(guān),這也被稱作布朗—羅賓遜過(guò)程。⑤因?yàn)榱_賓遜已經(jīng)證明布朗的想法是可行的。參見(jiàn)J. Robinson, “An Iterative Method of Solving a Game”,Annals of Mathematics, Second Series, Vol.54, No.2, 1951, pp.296—301;亦 參 見(jiàn) R. D. Luce ﹠ H. Raiffa,Games and Decisions, New York: Wiley ﹠ Sons, 1957, pp.422ff。讓我們把這個(gè)過(guò)程修改成一個(gè)關(guān)于查理和露西的簡(jiǎn)單理論。
假設(shè)查理和露西開(kāi)展某個(gè)標(biāo)準(zhǔn)形式零和博弈,他們的選擇集合和效用函數(shù)分別由A1和A2、U1=U和U2=—U給定。他們博弈不是一次,而是很多次,甚至可能是無(wú)限多次。但是,他們頭腦簡(jiǎn)單,并不認(rèn)為這種情景是一個(gè)超級(jí)博弈,甚至想不到其他人是理性的并且有如此這般的效用。在每一次博弈中,他們僅僅使他們的預(yù)期效用最大化,而預(yù)期效用是由他們對(duì)他人行動(dòng)的效用函數(shù)和當(dāng)下的主觀概率決定的。盡管如此,他們?nèi)栽谝罁?jù)過(guò)去的經(jīng)驗(yàn)調(diào)整他們的概率,他們?cè)谡J(rèn)知上是理性的。
然而,我們不想如此嚴(yán)格以至于假設(shè)雙方都符合所謂的直接規(guī)則①例如,參見(jiàn) R. Carnap, The Continuum of Inductive Methods, Chicago: University Press, 1952, § 14。,即在n次博弈后他們?cè)趎+1次博弈中對(duì)其他人行動(dòng)的概率與在前n次博弈中他人行動(dòng)的相對(duì)頻率是相同的;通過(guò)假設(shè)這一點(diǎn),我們恰恰能復(fù)制原初的布朗—羅賓遜過(guò)程。為把正在討論的過(guò)程和建立認(rèn)知理性原則聯(lián)系起來(lái),我們想要更自由些。
首先,我們假設(shè)他們遵循條件化規(guī)則,就是說(shuō)某人對(duì)事件C在某一時(shí)間點(diǎn)t′的概率Pt′(c)應(yīng)等于他在某一更早時(shí)間點(diǎn)t對(duì)C的條件概率Pt(C/E),其中E是他在t和t′之間收集到的經(jīng)驗(yàn)。這是理性信念變化的最基本規(guī)則。②直接規(guī)則和條件化規(guī)則不相容,也就是說(shuō),通常沒(méi)有優(yōu)先概率來(lái)衡量是哪個(gè)條件化產(chǎn)生了直接規(guī)則所決定的后驗(yàn)概率。實(shí)際上,這是拒斥直接規(guī)則最強(qiáng)有力的理論根據(jù)。參見(jiàn)R. Carnap, The Continuum of Inductive Methods, § 14。舉例來(lái)說(shuō),對(duì)查理而言,這意味著經(jīng)過(guò)n次博弈之后,在第n+1次博弈中他對(duì)露西的行動(dòng)的概率是他關(guān)于這些被她在前n次中所作所為條件化的行動(dòng)的先驗(yàn)概率。
其次,為保留直接規(guī)則的優(yōu)點(diǎn),我們假設(shè)他們滿足所謂的收斂公理或賴欣巴哈公理。舉例來(lái)說(shuō),這就是說(shuō)對(duì)查理而言,他在第n+1次博弈中對(duì)露西的行動(dòng)的概率和前n次博弈中這些行動(dòng)的相對(duì)頻率之間的不同之處,無(wú)論它們是什么,都收斂到零(對(duì)于n→∞)。這樣一來(lái),有人可能會(huì)說(shuō)賴欣巴哈公理保證了最后經(jīng)驗(yàn)會(huì)比先驗(yàn)觀念更占優(yōu)勢(shì);它因此通常被看作認(rèn)知理性的一個(gè)最低要求。③參見(jiàn) W. Stegmüller, Probleme und Resultate der Wissenschaftstheorie und Analytischen Philosophie, Band Ⅳ, Personelle und Statistische Wahrscheinlichkeit, Berlin, Heidelberg: Springer, 1973, pp.502ff。有人可能發(fā)現(xiàn)這會(huì)引起異議:賴欣巴哈公理表達(dá)了主觀概率的極限性質(zhì)但沒(méi)有依此說(shuō)出關(guān)于它們的實(shí)際形式。然而,這里有概率的“實(shí)際”性質(zhì),眾所周知,最為著名的對(duì)稱性就隱含賴欣巴哈公理。參見(jiàn)R. Carnap ﹠ R. C. Jeffrey, (eds), Studies in Inductive Logic and Probability, Vol.Ⅰ, Berkeley: University of California Press, 1971, parts 4 and 5。
現(xiàn)在,如果查理和露西有這么多認(rèn)知理性和行動(dòng)理性,如果原初博弈恰好有一個(gè)均衡點(diǎn)包括查理的(混合的或純粹的)策略S1和露西的策略S2,那么我們有:對(duì)每個(gè)a∈A1,查理在所描述的博弈過(guò)程中選擇a的相對(duì)頻率收斂于a在S1中出現(xiàn)的概率。這同樣適用于露西。由此,查理也傾向于發(fā)展關(guān)于露西的適當(dāng)信念(3),反之對(duì)露西也是同樣。④所有這些都容易被證明;羅賓遜關(guān)于布朗—羅賓遜過(guò)程的證明只不過(guò)拓展了我們稍微自由化的版本。如果應(yīng)該有超過(guò)一個(gè)的均衡點(diǎn),那么一個(gè)更加復(fù)雜但相當(dāng)令人滿意的命題就是真的。參見(jiàn)J. Robinson, “An Iterative Method of Solving a Game”, pp.296—301。然而,與布朗—羅賓遜過(guò)程相反的是,這里關(guān)于收斂比率沒(méi)什么可說(shuō),因?yàn)橘囆腊凸黻P(guān)于收斂比率沒(méi)有假設(shè)任何東西。因此,在給定的具體情形中,這個(gè)理論滿足了我們?cè)谇懊嬗懻撝挟a(chǎn)生的所有要求。
再重復(fù)一遍,我關(guān)于這個(gè)(數(shù)學(xué)上簡(jiǎn)單明了的)布朗—羅賓遜過(guò)程的自由化版本中的觀點(diǎn),不是要提醒我們像布朗—羅賓遜觀點(diǎn)的直觀吸引力這樣的東西;那是多余的。相反,如果我們想要為(3)( 6)和(9)這樣的認(rèn)知前提找到合理的理論根據(jù),就必須要講一些這樣的理論;而如果這些前提是無(wú)懈可擊的,反過(guò)來(lái),它們就必定包含在博弈論的理論化之中。之所以是這樣,因?yàn)橹挥羞@些關(guān)于博弈學(xué)習(xí)過(guò)程的理論才能夠提供一種把認(rèn)知上理性的局中人導(dǎo)向(3)( 6)和(9)等信念證據(jù)的理論解釋——正如我論證過(guò)的那樣,這種證據(jù)不可能在給定的博弈情境中獨(dú)自發(fā)現(xiàn)。
有人可能反對(duì)說(shuō),有很多方式可以達(dá)到信念(3)( 6)和(9)——最簡(jiǎn)單的方式是一個(gè)顧問(wèn)式博弈理論家(也許通過(guò)敘述第三節(jié)的標(biāo)準(zhǔn)理論)告訴局中人要做什么和信什么,并且局中人也相信他。當(dāng)然,這是可能并且經(jīng)常走的一條路。但這對(duì)博弈理論家沒(méi)有絲毫幫助:首先,他不想要將他的理論限制在受他啟發(fā)的人們上;其次,它肯定根本沒(méi)有任何關(guān)于他和局中人之間交際的交流理論,即沒(méi)有關(guān)于這種達(dá)到信念(3)( 6)和(9)的方法的理論。
另一方面,必須承認(rèn)的是,博弈學(xué)習(xí)過(guò)程理論的前景還未成形。布朗—羅賓遜過(guò)程及其自由化是良好的典范,但它幾乎沒(méi)有擴(kuò)展到兩人零和博弈之外的范圍。①參見(jiàn)J. Rosenmüller, “über Periodizit?tseigenschaften spieltheoretischer Lernprozesse”, Zeitschrift für Wahrscheinlichkeitstheorie, Vol.17, No.4, 1971, pp.259—308。不過(guò),布朗—羅賓遜過(guò)程的假設(shè)卻相當(dāng)差;在那里我們的查理和露西甚至沒(méi)有被當(dāng)作真正的博弈論主體來(lái)看待,因?yàn)楦鶕?jù)這些假設(shè),他們每個(gè)人都必須把他人看作某種不規(guī)則的骰子,它以這面或那面朝上落地的傾向必須被發(fā)現(xiàn)。因此,自然的觀點(diǎn)是通過(guò)把查理和露西看作博弈論主體,即通過(guò)讓他們知道其他人的效用并讓他們對(duì)其他人的認(rèn)知狀態(tài)進(jìn)行理論化,來(lái)豐富博弈學(xué)習(xí)過(guò)程的假設(shè)。無(wú)論這樣的假設(shè)是否會(huì)在更一般的博弈而非僅僅兩人零和博弈中使博弈學(xué)習(xí)過(guò)程得到想要的結(jié)果,這都是一個(gè)非常開(kāi)放的問(wèn) 題。
總而言之,沒(méi)有更為具體的結(jié)果,但至少一般的寓意可從前面的討論中得出。嚴(yán)格區(qū)分行動(dòng)理性和認(rèn)知理性。如果你關(guān)心的是行動(dòng)理性,那么就為你的對(duì)象設(shè)計(jì)完全決策模型,并通過(guò)預(yù)期效用最大化規(guī)則來(lái)確定理性行動(dòng);如果僅僅這些不能使你滿意,如果你要尋找一些對(duì)寫(xiě)入決策模型的認(rèn)知假設(shè)的解釋,那就盡可能根本地并且盡可能廣泛可接受地嚴(yán)格堅(jiān)持認(rèn)知理性的一些規(guī)則。否則,就會(huì)有理論上和根基上混亂的危險(xiǎn)。②衷心感謝萊因哈德·澤爾騰教授的鼓勵(lì)和合理的懷疑態(tài)度,感謝烏爾里克·哈斯和安德雷斯·科莫林的促成和安排,感謝克拉拉·塞內(nèi)卡對(duì)我的英文的核對(duì),感謝《理論與決策》的全體成員,因?yàn)樗蛭冶砻鬟@篇文章對(duì)一些人而言可能是值得一讀的。