怎樣理解博弈論①

2019-06-24 12:37沃爾夫?qū)?/span>施波恩

哲學(xué)分析 2019年3期

［德］沃爾夫?qū)な┎ǘ?文

陳偉/譯

一、對(duì)現(xiàn)狀的不滿

博弈論和決策論具有同質(zhì)性。或者從它們具有相似的主題內(nèi)容、基本概念和方法來(lái)說(shuō)，人們至少可以有這樣的期待。并且，通過(guò)首先考察這些理論的標(biāo)準(zhǔn)解釋能證明這個(gè)期待是合理的：決策論研究的是孤立的單獨(dú)個(gè)體的理性行為；博弈論關(guān)涉的是多人相互依賴性決策的理性問(wèn)題。因此，博弈論是一種更具有包容性的理論；而決策論是特殊情形，是一個(gè)人的博弈，或者用一種不太恰當(dāng)?shù)恼f(shuō)法，是對(duì)自然的博弈。

然而，經(jīng)過(guò)更仔細(xì)的考察，博弈論的標(biāo)準(zhǔn)解釋及其與決策論的關(guān)系就顯得不盡如人意。當(dāng)然，決策論也被各種問(wèn)題所籠罩；但相較而言，我認(rèn)為博弈論又被三個(gè)相互關(guān)聯(lián)的問(wèn)題弄得大傷元?dú)猓赫f(shuō)嚴(yán)重點(diǎn)，它混淆了適用于它的理性概念，對(duì)其主體（局中人）的假定非常不清楚，并因此導(dǎo)致它所使用的決策規(guī)則含混不清。或者，用有些自相矛盾的話來(lái)說(shuō)：（從博弈論來(lái)看）決策論是博弈論的特殊化；但是，（從決策論來(lái)看）如今表達(dá)的博弈論不再是決策論的一般化。不如說(shuō)，由此可預(yù)料的是，博弈論應(yīng)被視作決策論的特殊化。

這就是我的不滿。我將在接下來(lái)的各節(jié)中具體闡述這一點(diǎn)，并解釋我認(rèn)為應(yīng)該采納的補(bǔ)救辦法。

讀者也許會(huì)懷疑這些異議將會(huì)使博弈論導(dǎo)向更為高深莫測(cè)的領(lǐng)域，諸如三人或更多人的博弈或具有特征函數(shù)形式的博弈，于是可能會(huì)自動(dòng)地放棄這些異議。但是，相反的是，這些異議處理的是那些看似清晰并且基礎(chǔ)穩(wěn)定的兩人零和博弈。為求簡(jiǎn)明，我將只處理標(biāo)準(zhǔn)形式的博弈。①澤爾騰所展示的標(biāo)準(zhǔn)形式問(wèn)題與我的考慮無(wú)關(guān)，因而這也適用于他改進(jìn)過(guò)的觀念。參見(jiàn)R.Selten，“Reexamination of the Perfectness Concept for Equilibrium Points in Extensive Games”， International Journal of Game Theory， Vol. 4， No.1， 1975， pp.25—55。

讀者也許還會(huì)懷疑這是為貝葉斯式博弈論所作的一個(gè)辯護(hù)，并且我也確實(shí)是從一個(gè)純粹的貝葉斯式立場(chǎng)進(jìn)行的論證。然而，“貝葉斯式博弈論”的標(biāo)簽已經(jīng)和約翰·C.海薩尼（John C.Harsanyi）的工作有極為顯著的聯(lián)系。在我看來(lái)，后者在精神上依然是博弈論的而非決策論的，因此，基于類似的理由，它和標(biāo)準(zhǔn)解釋一樣是可批評(píng)的。這樣一來(lái)，這里就存在一種區(qū)別，我們不得不在最后一節(jié)來(lái)討論這一點(diǎn)。

總之，我不是宣稱這里提出的立場(chǎng)及其論證將會(huì)是全新的（盡管有些手法會(huì)是全新的）。只是那些在同樣精神指導(dǎo)下的對(duì)博弈論的早期攻擊，顯然不能使已被接受的理論不再成立，并使博弈論走上一條根基更為穩(wěn)固的道路。正是這種情況，導(dǎo)致我作出另外的一種嘗試。

二、怎樣理解博弈論

在證實(shí)這種不滿之前，不妨先勾勒一下這種不滿所依據(jù)的基本確信（basic conviction）。這個(gè)基本確信是一種正統(tǒng)的貝葉斯式確信。

根據(jù)這種確信，人們有目標(biāo)和愿望，他們希望這個(gè)世界如此這般；他們有信念（belief），相信這個(gè)世界會(huì)如此這般；并且，如果合理的話，他們會(huì)根據(jù)自己的信念來(lái)行動(dòng)，以便最大程度地促進(jìn)他們的愿望的實(shí)現(xiàn)。為追求確定性，決策論用量化決策模型來(lái)使之公式化。在這樣一種模型中，一個(gè)人的決策情境被公式化，這個(gè)人被假定為具有數(shù)字上的主觀效用和概率；于是，理性行動(dòng)（rational action）就被定義為一種最大預(yù)期效用的行動(dòng)。并且，作為一種規(guī)范性理論，決策論建議理性行動(dòng)。而作為一種經(jīng)驗(yàn)理論，決策論假定了理性行動(dòng)；眾所周知，這就具有強(qiáng)烈的理想化色彩，最多只有近似的有效性。不過(guò)，這種模型宣稱在原則上適用于一切的人類行動(dòng)。［這個(gè)宣稱并不像它看起來(lái)的那樣有力，因?yàn)樗鼪](méi)有擴(kuò)展到所有的人類行為。我們必須看到，行動(dòng)（action）是一個(gè)比行為（behaviour）更加狹窄的概念；并且，即使撇開(kāi)其中的循環(huán)味道，我們也不能合理地說(shuō)，行動(dòng)只是決策論可適用的行為。①關(guān)于這個(gè)行動(dòng)理論的主題，舉例來(lái)說(shuō)，可參見(jiàn)P. M. Churchland， “The Logical Character of Action-Explanations”，Philosophical Review， Vol. 79， No. 2， 1970， pp.214—236。］

在這里，并非真的有必要走進(jìn)決策論公式化的具體細(xì)節(jié)。但是，讓我們假設(shè)，為求精確，公式化運(yùn)用了眾所周知的薩維奇（L. J. Savage）方式。在這種方式中，概率是對(duì)一組可能世界狀態(tài)的定義，效用是指可能的結(jié)果，每一個(gè)結(jié)果僅僅由一個(gè)世界狀態(tài)和一個(gè)行動(dòng)來(lái)決定，然后標(biāo)準(zhǔn)形式的兩人博弈中所出現(xiàn)的常見(jiàn)效用矩陣就隨之產(chǎn)生。對(duì)我們的討論而言，這是最合適的公式化。②盡管它不是唯一的，甚至在我看來(lái)不是最好的。參見(jiàn)W. Spohn， Grundlagen der Entscheidungstheorie，Kronberg/ Ts.： Scriptor， 1978， Ch. 2。

順便說(shuō)一句，努力使量化模型成為某種派生物，是更為審慎的情況，不太是常見(jiàn)的情況。薩維奇方式將理性行動(dòng)定義為根據(jù)理性偏好選擇最優(yōu)先之物的行動(dòng)。如果偏好能滿足一些相當(dāng)明顯的條件，諸如傳遞性等等，那么它就是理性的；然后，令人驚奇的是，這可以證明似乎是理性行動(dòng)最大化了預(yù)期效用。但是，這個(gè)“似乎”如同說(shuō)物體穿越空間是似乎它們有體積、似乎它們遵從牛頓第二定律等等一樣，是不合適的。不，根據(jù)牛頓力學(xué)，物體那樣移動(dòng)的方式是因?yàn)樗鼈冇腥绱诉@般的體積，有如此這般的外力加諸其上，等等。并且，根據(jù)決策論，人們之所以那樣行動(dòng)，是因?yàn)樗麄冇腥绱诉@般強(qiáng)烈的愿望，他們有如此這般堅(jiān)定的信念，等等?？梢钥隙ǖ氖?，這個(gè)問(wèn)題后面潛藏著大量的微妙之處，科學(xué)哲學(xué)家對(duì)此依然有分歧。但是，毫無(wú)疑問(wèn)的是，如同在物理學(xué)和其他任何領(lǐng)域中表達(dá)的“似乎”一樣，科學(xué)哲學(xué)家眼中的操作主義已經(jīng)過(guò)時(shí)了。③例如，參見(jiàn) W. Stegmüller， Probleme und Resultate der Wissenschaftstheorie und Analytischen Philosophie， Band Ⅱ，Theorie und Erfahrung， Halbband， Heidelberg： Springer， 1970， Ch.Ⅲ -Ⅴ，以及 W. Stegmüller， Probleme und Resultate der Wissenschaftstheorie und Analytischen Philosophie， Band Ⅱ， Theorie und Erfahrung， Halbband， Berlin，Heidelberg： Springer， 1973， Ch. Ⅷ；或者 H. Putnam， Mind， Language， and Reality， Philosophical Papers， Vol. 2，Cambridge： University Press， 1975， Ch. 11， 12 and 22。因此，人們應(yīng)把量化決策模型作為基礎(chǔ)。（這也許會(huì)改變所有支持“似乎”理論的、具有獨(dú)創(chuàng)性的可度量化定理的地位，但絲毫沒(méi)有降低它們的價(jià) 值。）

現(xiàn)在來(lái)看相互依賴性決策的博弈式情景，那么，上述決策情景的任何一般刻畫(huà)有什么被撤銷(xiāo)嗎？不，沒(méi)有任何東西。對(duì)我們而言，其他人及其行為僅僅與其他事物一樣都是外部世界的組成部分，盡管他們肯定相當(dāng)復(fù)雜，也常常非常珍貴。從形式上講，這意味著在任何局中人的決策模型中，其他局中人的可能行動(dòng)僅僅是可能世界狀態(tài)的組成部分。我們可以進(jìn)一步將這些可能行動(dòng)（在薩維奇的技術(shù)意義上①參見(jiàn) L. J. Savage， The Foundations of Statistics， New York： Wiley ﹠ Sons， 1954， sect. 5.5。）看作一個(gè)微觀世界的組成部分，并使這一模型縮小到這一微觀世界——實(shí)際上，這同將一個(gè)擴(kuò)展形式的博弈歸約到其標(biāo)準(zhǔn)形式一樣。因而，簡(jiǎn)化模型包含有這種標(biāo)準(zhǔn)形式的效用矩陣。并且，完善它的唯一正確的方式是為其可能世界狀態(tài)，即為其他局中人的行動(dòng)，增加局中人的主觀概率。畢竟，要做的理性事情總是要使預(yù)期效用最大化；這才是理性行動(dòng)。

事實(shí)上，更為常見(jiàn)的情況是，基本上不存在博弈式情景。在我們的眾多日常事務(wù)中，我們對(duì)待他人就像他們都是有規(guī)律的并且可靠的行為自動(dòng)機(jī)一樣，對(duì)于他們，我們有著非常明確的預(yù)期而不用多想；他們就像是交通或天氣狀況那樣被包括在我們的決策問(wèn)題之內(nèi)。（這個(gè)有點(diǎn)兒冷酷無(wú)情的說(shuō)辭不過(guò)是無(wú)害的“專業(yè)性畸變”；幸運(yùn)的是，我們確實(shí)能夠?qū)σ恍┤擞懈嗟呐d趣。）

但是，如果這一點(diǎn)被接受，那么還剩下什么是博弈論的獨(dú)特領(lǐng)域？當(dāng)我們將外部世界的其他人嚴(yán)肅地當(dāng)作個(gè)人來(lái)對(duì)待時(shí)，當(dāng)我們放棄僅僅觀察他們的行為并著手將他們理論化時(shí)，并且尤其當(dāng)我們發(fā)現(xiàn)決策論大約是關(guān)于他們的正確理論時(shí)，當(dāng)我們努力計(jì)算出他們可能的目標(biāo)和信念是什么時(shí)，假定他們理性地行動(dòng)，那么博弈論就開(kāi)始了。然而，需要注意的是，在這一論述中，博弈論并不包含決策論，而只不過(guò)是決策論的一種具體化。博弈論是關(guān)于具體決策者的決策論，也就是說(shuō)，那些決策者把其他人算入他們的決策情景，并根據(jù)決策理論對(duì)之進(jìn)行理論化。②同樣，對(duì)一個(gè)在策略上思考和行動(dòng)的人而言，一種恰當(dāng)而統(tǒng)一的觀點(diǎn)是把關(guān)于他或她自己未來(lái)行動(dòng)的理論決策進(jìn)行理論化。參見(jiàn) W. Spohn， Grundlagen der Entscheidungstheorie， Kronberg/ Ts.： Scriptor， 1978， Ch. 4。

所有這些可能聽(tīng)起來(lái)都非常熟悉。這正是正統(tǒng)的貝葉斯定理關(guān)于博弈論的主張，基本上就是海薩尼在20多年前反復(fù)告訴我們的東西。但奇怪的是，所有人——那些標(biāo)準(zhǔn)的博弈理論家和像海薩尼這樣的貝葉斯主義者（參見(jiàn)最后一節(jié)）——似乎都違背了那個(gè)純粹的原理，都在把博弈論推向它的結(jié)果的過(guò)程中退縮了。

然而，這種過(guò)失是有其原因的。因?yàn)槿绻⒎遣豢赡艿脑?，要在純粹的貝葉斯定理內(nèi)證明每個(gè)人所持有觀念的正當(dāng)性，即證明均衡點(diǎn)是兩人零和博弈或通常的非合作博弈的解決方法（參見(jiàn)第四節(jié)），看起來(lái)是困難的。這樣一來(lái)，我們必須仔細(xì)看一下在不背叛這個(gè)迄今為止的概略性原理的條件下用它能具體做些什么。但是，讓我先從這個(gè)貝葉斯主義視角來(lái)審視標(biāo)準(zhǔn)博弈論對(duì)兩人零和博弈的理論推理。

三、怎樣沒(méi)有理解博弈論

有鑒于此，我們應(yīng)該簡(jiǎn)要概括一下現(xiàn)有的推理。我希望每個(gè)人都同意盧斯、雷法①R. D. Luce ﹠ H. Raiffa， Games and Decisions， New York： Wiley ﹠ Sons， 1957， Ch.4.和馮·諾依曼、摩根斯坦②J. von Neumann ﹠ O. Morgenstern， Theory of Games and Economic Behavior， Princeton： University Press， 1944，Ch. Ⅲ.不僅是代表人物，而且還對(duì)這個(gè)推理提供了最徹底、最令人信服的敘述，以便于我可以在他們的基礎(chǔ)上進(jìn)行概述。這個(gè)概述包含四個(gè)部分。

（一）標(biāo)準(zhǔn)理論

第一部分（與所有標(biāo)準(zhǔn)形式的博弈相關(guān)）：賦予博弈以標(biāo)準(zhǔn)形式。非常含糊地說(shuō)，博弈論的基本問(wèn)題就是以某種方式為每個(gè)局中人找到對(duì)他而言哪個(gè)選擇是一個(gè)好選擇。然而，這是一個(gè)過(guò)于模糊的問(wèn)題，它需要具體說(shuō)明。因此，讓我們先假定，每個(gè)局中人是理性的，要么在寬泛的意義上（根據(jù)他的效用函數(shù)）盡可能地努力擺脫博弈，要么在更為嚴(yán)格的意義上，“在既有兩種選擇的情況下，他將總是選擇他所偏好的，也就是那個(gè)效用更大的選項(xiàng)”③R. D. Luce ﹠ H. Raiffa， Games and Decisions， New York： Wiley ﹠ Sons， 1957， p.55.。并且，讓我們接下來(lái)假定，每個(gè)局中人對(duì)標(biāo)準(zhǔn)形式的博弈都了如指掌，也就是說(shuō)，他知道每個(gè)局中人的可能選擇（策略），也知道每個(gè)局中人所有可能策略組合結(jié)果的效用（通常而言，關(guān)于博弈的機(jī)會(huì)步驟，這些就是已經(jīng)預(yù)期到的效用）。

如果沒(méi)有第一個(gè)假定，博弈論就根本不可能運(yùn)作。一般理論怎么可能是關(guān)于非理性行動(dòng)的呢？并且，第二種假定也是必要的；否則博弈理論家所處理的問(wèn)題就可能是錯(cuò)誤的，也就是說(shuō)，那個(gè)問(wèn)題不同于博弈理論家在主觀上所認(rèn)識(shí)到的局中人的問(wèn)題。然而，如果有這些假設(shè)，我們就有希望使我們的問(wèn)題具體到足以是可解決的。因此，讓我們?cè)囍鴣?lái)解決它。

第二部分（與所有標(biāo)準(zhǔn)形式的非合作博弈相關(guān)）：一個(gè)首要的考慮可使我們有比較大的進(jìn)展。這個(gè)考慮是，如果博弈論應(yīng)當(dāng)具有至少潛在的公共性——正如它無(wú)疑應(yīng)該是這樣的——那么它就能夠區(qū)分僅僅作為局中人理性選擇的均衡策略。（可以肯定的是，到目前為止，我只是在討論純粹策略；混合策略要到第四部分才會(huì)提出。）或者，更確切地說(shuō)：博弈論是要為每個(gè)局中人找到哪個(gè)選擇對(duì)他而言是更為理性的選擇。如果能做到這點(diǎn)，那么每個(gè)局中人也能像博弈理論家一樣，知道哪些選擇對(duì)其他局中人而言是理性的選擇（因?yàn)楦鶕?jù)上面的第二個(gè)假定，每個(gè)局中人是使用和博弈理論家一樣的方式看待博弈情景的）；并且，因?yàn)槊總€(gè)局中人被假定為是理性地行動(dòng)，這個(gè)假定對(duì)任何局中人而言就一定不能成為一個(gè)理由，讓他背離對(duì)他而言依據(jù)這個(gè)理論是理性的東西；于是，只有均衡點(diǎn)才是理性的策略組合，并且，只有均衡策略即導(dǎo)向某個(gè)這樣點(diǎn)的策略才是理性的選擇。

眾所周知，這個(gè)考量能發(fā)生變化。有些博弈在純粹策略中沒(méi)有均衡點(diǎn)，而有些有很多，在這些情形中其成功依然是不完備的。但是，對(duì)于純粹策略中具有均衡點(diǎn)的兩人零和博弈來(lái)說(shuō)，這是關(guān)鍵所在，因?yàn)樵谶@種博弈中的均衡點(diǎn)被證明在本質(zhì)上是獨(dú)一無(wú)二的。①參見(jiàn) R. D. Luce ﹠ H. Raiffa， Games and Decisions， New York： Wiley ﹠ Sons， 1957， sect. 4.5。這樣一來(lái)，在這個(gè)具體情形中，我們就已解決基本的博弈理論問(wèn)題。

第三部分（僅與純粹策略中具有均衡點(diǎn)的兩人零和博弈相關(guān)）：在這種具體情形中，還存在另一個(gè)有說(shuō)服力的考量，它具有相同的影響?？煞Q這兩個(gè)局中人為查理和露西。查理也許會(huì)根據(jù)直覺(jué)作如下推理：“露西這個(gè)理性的家伙，想盡可能地努力擺脫博弈。這與我的利益相抵觸。所以，我最好看看從我的每個(gè)選項(xiàng)中我最少能得到多少，然后努力使這個(gè)數(shù)量盡可能地大，也就是，正如我聽(tīng)到有人表述的那樣，我最好最大化我的安全等級(jí)。如果這是合理的，那么理性的露西將做相同的事情，也就是說(shuō)，最大化她的安全等級(jí)。哦，但是我的安全等級(jí)最大值是對(duì)她的安全等級(jí)最大值的最大抵觸，因此，我應(yīng)該更加堅(jiān)持我的選擇。”

或者，用馮·諾依曼的話來(lái)說(shuō)：考慮查理的弱函數(shù)博弈和強(qiáng)函數(shù)博弈。在弱函數(shù)博弈中，查理必須首先做出選擇，然后露西在已知他作了什么的情況下，再進(jìn)行選擇。在強(qiáng)函數(shù)博弈中，正好倒過(guò)來(lái)。顯然，在弱函數(shù)博弈中，查理最多和在實(shí)際博弈中的處境一樣好；而在強(qiáng)函數(shù)博弈中，他至少和在實(shí)際博弈中的處境一樣好。并且，同樣顯然的是，在弱函數(shù)博弈中，對(duì)他而言唯一可做的理性事情就是最大化他的安全等級(jí)；而在強(qiáng)函數(shù)博弈中，唯一可做的理性事情就是選擇那個(gè)最能抗衡露西的安全等級(jí)最大值（假使她已經(jīng)很理性地作出這一選擇）的選項(xiàng)。但是，這兩種情形得出相同的策略組合，并且對(duì)查理而言是相同的效用。這樣一來(lái)，對(duì)于處在弱函數(shù)與強(qiáng)函數(shù)博弈“之間的”實(shí)際博弈而言，恰恰只有這一點(diǎn)是理性的。

總結(jié)一下：從第一部分中的假定開(kāi)始，我們已經(jīng)給出了兩個(gè)完全獨(dú)立的推理。每個(gè)推理都單獨(dú)地在所考慮到的具體情形中展開(kāi)，并且兩者被證實(shí)可以得到相同的結(jié)果。還會(huì)有什么更好的理由呢？

第四部分（與所有的兩人零和博弈相關(guān)）：現(xiàn)在，馮·諾依曼告訴我們，如果我們?cè)敢庠试S一些小把戲，即允許每個(gè)局中人把他的純粹策略混合起來(lái)，那么我們就能夠把整個(gè)理論推廣到所有的兩人零和博弈。進(jìn)一步的論證被虛構(gòu)出來(lái)，用來(lái)給那些對(duì)這種小把戲感到不自在的人以最后的推力，比如說(shuō)，秘密論證、對(duì)重復(fù)博弈的考慮或者大量反復(fù)的論證。②參見(jiàn) Ibid.， p.75。但是，我們不需要在這里對(duì)這個(gè)附加的支持作詳細(xì)的闡述，因?yàn)槿绻麤](méi)有主要的推理這就都是無(wú)用的。并且，這個(gè)可以獨(dú)自成立。事實(shí)上，任何局中人都能自由地選擇一種混合策略；這樣一來(lái)，混合策略就在各種被考慮的選項(xiàng)之中，關(guān)于它們的上述推理和關(guān)于純粹策略的推理一樣有力。因此，這就是混合策略、最大最小值和均衡點(diǎn)是如何發(fā)現(xiàn)彼此并能一直愉快相處的原因。

不幸的是，這一理論并不像它聽(tīng)起來(lái)的那樣好。有必要作一番評(píng)論，批判的不是這個(gè)理論的結(jié)論，而是得到那些結(jié)論的方法。

（二）評(píng)論

對(duì)第一部分的評(píng)論：人們可能會(huì)認(rèn)為，第一部分的理性和知識(shí)假設(shè)過(guò)于限制博弈論的運(yùn)用。但是，實(shí)際上，它們不過(guò)是要么不太有力要么不夠清楚。假設(shè)局中人是理性的真的就足夠了嗎？看起來(lái)，當(dāng)然還要假設(shè)每個(gè)局中人都相信其他局中人是理性的。這在這個(gè)理論的第二部分中尤為清楚，在那里，我們非常松散地區(qū)分了博弈理論家假設(shè)一個(gè)局中人對(duì)其他局中人作出的假設(shè)和博弈理論家本人對(duì)其他局中人作出的假設(shè)。但是，這樣一來(lái)，大概還應(yīng)該假定每個(gè)局中人都相信其他局中人也認(rèn)為他們的同伴是理性的。在這一點(diǎn)上，有人可能會(huì)傾向于一個(gè)激進(jìn)的步驟，也就是，爬上迭代的相互理性假設(shè)的無(wú)窮階梯，就像有些人在意義理論中在一個(gè)類似情形下所做的那樣。①例如，參見(jiàn) D. K. Lewi， Convention. A Philosophical Study， Cambridge， Mass.： University Press， 1969；以及S. R. Schiffer， Meaning， Oxford： University Press， 1972。也就是說(shuō)，（在西菲爾的技術(shù)意義上②S. R. Schiffer， Meaning， p. 30f， or D. K. Lewi， Convention. A Philosophical Study， p. 56；也參見(jiàn)本文第四節(jié)。）博弈理論家可能會(huì)假設(shè)，在局中人之間，局中人的理性是相互的或者是常識(shí)。當(dāng)然，所有這些都同樣適用于第二個(gè)假設(shè)，即該理論第一部分中的知識(shí)假設(shè)。因此，博弈理論家應(yīng)該假設(shè)什么呢？人們覺(jué)得，關(guān)于局中人作多少假設(shè)確實(shí)是有不同影響的；但是，很難看出來(lái)這在被接受的理論中有怎樣的體現(xiàn)。

還存在另一個(gè)模糊性。在理性假設(shè)中所使用的“理性的”確切含義是什么？從盧斯和雷法援引而來(lái)的解釋沒(méi)有多大幫助，因?yàn)槠没蛐в脙H僅指的是策略組合；在標(biāo)準(zhǔn)博弈論中，不存在僅僅針對(duì)單個(gè)局中人的選擇的偏好次序甚或效用函數(shù)。因此，在“理性的”更有效用的意義上，一方會(huì)愿意截然地規(guī)定另一方。然而，按此推斷，這一問(wèn)題是錯(cuò)誤的。按此推斷，標(biāo)準(zhǔn)博弈論認(rèn)為，在保證后面會(huì)精確起來(lái)的前提下，在初始的假設(shè)和解釋中它更偏好或不能避免“理性的”含混。但在當(dāng)下，這只是說(shuō)“理性的”是有意的模糊，這就沒(méi)有什么實(shí)質(zhì)進(jìn)展。

這個(gè)問(wèn)題的難點(diǎn)在于：標(biāo)準(zhǔn)博弈論確實(shí)在任何地方都沒(méi)有以一種嚴(yán)格的方式從初始假設(shè)開(kāi)始推理；它們被排他性地使用在看似成立的論證之中。這里的態(tài)度似乎已經(jīng)是，最初直觀的根據(jù)被用來(lái)為一系列嚴(yán)格的理論化作準(zhǔn)備，人們就不需要掂量這個(gè)準(zhǔn)備中的每個(gè)詞。這樣一來(lái)，在直觀階段一些細(xì)微的區(qū)別就已經(jīng)模糊不清，沒(méi)有給艱難的理論化任何機(jī)會(huì)來(lái)消除這種不嚴(yán)謹(jǐn)。從貝葉斯定理的角度來(lái)看，這是邁向不可靠根基的第一個(gè)決定性滑坡。

對(duì)第二部分的評(píng)論：我們已經(jīng)提到過(guò)，為使局中人具有與博弈理論家一樣的方式來(lái)看待博弈情境，比第一部分中更強(qiáng)的關(guān)于局中人的假設(shè)就是必要的，于是第二部分有這一假設(shè)也是必要的。但是，還有另一個(gè)不足之處，這在純粹策略中具有一個(gè)均衡點(diǎn)的兩人零和博弈的情形中尤為明顯。在這種情形中，第二部分得出的結(jié)論是，每個(gè)局中人只能理性地選擇他的均衡策略。但是，這個(gè)結(jié)論下得太早；能夠得出的只是：如果博弈理論家成功地區(qū)分出一個(gè)理性的選擇，那么這一定是均衡策略。然而，并不保證以上的“如果”句是真的。也許博弈理論家的問(wèn)題是他能夠僅僅部分地縮小理性選擇的范圍，而不是將其縮小到一個(gè)。更一般地說(shuō)：第二部分所表明的是，博弈理論家并不能在均衡策略之外建立某個(gè)理性的選擇集合；但是，根據(jù)其他的理由仍然表明，一個(gè)選擇只有在均衡策略之中才能肯定地被確立是理性的。第三部分也許準(zhǔn)備了這樣的理由，因此，讓我們轉(zhuǎn)向第三部分。

對(duì)第三部分的評(píng)論：人們對(duì)最大最小化決策規(guī)則已經(jīng)有很多論述，并且我們知道了所有實(shí)質(zhì)上贊成或反對(duì)的觀點(diǎn)。我覺(jué)得，目前的討論狀態(tài)有一點(diǎn)兒順利。似乎通?？山邮艿氖牵畲笞钚』荒茏鳛橐粋€(gè)基本的決策規(guī)則被普遍應(yīng)用；它在許多情景中造成了荒謬的結(jié)果。不過(guò)，在某些類型的情景，尤其在兩人零和博弈中，而且對(duì)不確定性條件下的決策而言，在統(tǒng)計(jì)學(xué)的決策理論中，以及新近在羅爾斯的初始狀態(tài)①參見(jiàn) J. Rawls， A Theory of Justice， Cambridge， Mass.： Harvard University Press， 1971， sect. 26。中，最大最小化都被認(rèn)為是一個(gè)可討論的、還不錯(cuò)的甚至是可信的決策規(guī)則。

然而，從理論的角度來(lái)看，這種事態(tài)是完全不能讓人滿意的。從這個(gè)角度來(lái)看，沒(méi)有辦法很簡(jiǎn)單地做到，為不同類型的情景找到直觀上可信的決策規(guī)則，以通過(guò)某種系統(tǒng)的論證來(lái)支持直觀判斷，并且就此終止。不，如果不同的決策規(guī)則確實(shí)被不同類型的情景所接受，那么人們就想知道一些主導(dǎo)的或統(tǒng)一的原則，以解釋或至少準(zhǔn)確地描述在哪些條件下哪些決策規(guī)則在哪些情景中是適當(dāng)?shù)模换蛘?，更好的是，人們?cè)敢庥幸恍┗镜臎Q策規(guī)則，其他的規(guī)則可以從它們推導(dǎo)出來(lái)。但是，在試圖回答關(guān)于博弈論的這一要求時(shí)，我們很明顯直接陷入了在第一部分就發(fā)現(xiàn)的那種晦澀之中。

誠(chéng)然，我在這里所做的一切是訴諸理論意識(shí)。但是，我想通過(guò)接下來(lái)的論證使這個(gè)訴諸更為迫切。

這需要利用薩維奇的微觀世界理論。關(guān)于這個(gè)主題的理論重要性，我認(rèn)為沒(méi)有被充分認(rèn)識(shí)到。這個(gè)主題與對(duì)世界的描述相關(guān)，相似的決策情景可能是基于不同的世界。在這里，一個(gè)世界——寬泛講而不需要真的深入技術(shù)細(xì)節(jié)——是所有項(xiàng)目（item）的集合，這些項(xiàng)目應(yīng)當(dāng)在決策情景的描述中被明確地考慮到。薩維奇的評(píng)論是，現(xiàn)在似乎沒(méi)有一種好的方式來(lái)指明哪個(gè)是正確世界，并以之作為給定決策情景描述的基礎(chǔ)。從表面來(lái)看，將每個(gè)實(shí)際相關(guān)的項(xiàng)目放入一個(gè)世界之中，似乎是合情合理的，但通常這會(huì)產(chǎn)生很多難以處理的宏觀世界。因此，不是要尋找正確的世界，而是我們應(yīng)該努力發(fā)現(xiàn)何時(shí)兩個(gè)依據(jù)不同世界的描述可以被說(shuō)成是相同的。為此，薩維奇找到一個(gè)方法，可以將依據(jù)宏觀世界的描述還原為依據(jù)微觀世界的描述，并且可以保證這兩個(gè)世界相等。還原方法的實(shí)質(zhì)特征是，它如何能將效用歸因于包含在微觀世界描述中的可能結(jié)果。薩維奇采取以下方式：從宏觀世界描述的觀點(diǎn)來(lái)看，如果有確定概率pi，通過(guò)它，一個(gè)不甚詳細(xì)的微觀世界的結(jié)果，比如c，塑造出千變?nèi)f化的、更為詳細(xì)的宏觀世界結(jié)果ci，它具有確定效用ui；那么，微觀世界描述中的效用c應(yīng)當(dāng)是期望值∑piui。①關(guān)于所有的詳細(xì)說(shuō)明，參見(jiàn) L. J. Savage， The Foundations of Statistics， New York： Wiley ﹠ Sons， 1954， sect.5.5；以及 W. Spohn， Grundlagen der Entscheidungstheorie， Kronberg/ Ts.： Scriptor， 1978， sect. 2.3 and 3.6。

有人也許會(huì)想出另外一些還原方法（盡管我認(rèn)為這沒(méi)有必要）；但目前對(duì)我們重要的是，不管選擇什么樣的還原方法，一定要與所采用的決策規(guī)則相容。這意味著，當(dāng)決策規(guī)則被應(yīng)用于宏觀世界描述時(shí)，必須導(dǎo)致和決策規(guī)則被應(yīng)用于還原的微觀世界描述時(shí)相同的決策（實(shí)際上，是可選項(xiàng)中相同的偏好次序）。②由于薩維奇的決策規(guī)則是使預(yù)期效用最大化，他的還原方法和預(yù)期效用同樣起作用也就無(wú)足為奇了。參見(jiàn) L. J. Savage， The Foundations of Statistics， 1954。事實(shí)上，單說(shuō)還原方法與決策規(guī)則相容是有一點(diǎn)兒誤導(dǎo)的。不如說(shuō)，還原方法是被選定的基本東西，然后決策規(guī)則作為純粹的特例隨之而來(lái)。決策規(guī)則除了影響將最大描述還原為最小描述之外沒(méi)有其他作用，最小描述明確考慮的僅僅是決策者的可選項(xiàng)，而不涉及其他任何東西。

接下來(lái)要考察的是，作為最大最小化決策規(guī)則的自然推廣，還原方法事實(shí)上是一種不切實(shí)際的方法。根據(jù)這種方法，微觀世界結(jié)果的效用會(huì)是它所形成的宏觀世界結(jié)果效用的最小值；并且，不需要證明這將導(dǎo)致各種荒謬的和直觀上不可接受的結(jié)果。實(shí)際上，沒(méi)有人甚至是最大最小化策略的追隨者都不曾嚴(yán)肅地考慮過(guò)這種還原方法。也就是說(shuō)，最大最小化被認(rèn)為只對(duì)決策情景的微觀世界描述可合理應(yīng)用，這是已經(jīng)由形成預(yù)期效用的薩維奇的還原方法得到的結(jié)論?；蚋?jiǎn)潔地說(shuō)，最大最小化的東西總是（關(guān)于某個(gè)宏觀世界描述的）預(yù)期效用。這在博弈論中尤其明顯，其標(biāo)準(zhǔn)形式的效用就是派生自擴(kuò)展形式的預(yù)期效用。

因此，最大最小化決策規(guī)則所出現(xiàn)的理論混亂要比它看起來(lái)的意義更為深遠(yuǎn)。首先，這種混亂表現(xiàn)在各種決策規(guī)則似乎適合于不存在任何統(tǒng)一原則的各種決策情景。但現(xiàn)在，當(dāng)決策規(guī)則被看作還原方法的特例時(shí)，我們?cè)趩为?dú)決策情景中就有了混亂，因?yàn)閷?duì)最大最小化預(yù)期效用實(shí)際上在一個(gè)決策情景中應(yīng)用了兩個(gè)不同的還原方法。于是，就有一個(gè)迫切的問(wèn)題：哪種還原方法精確適合于決策情景中的哪些項(xiàng)目？又是為什么？為什么首先采用預(yù)期效用還原然后再考慮最小效用還原？為什么不是反過(guò)來(lái)？等等。（這有不同影響，這兩種方法不是可交換的。）所有這些都非常難辦，我們應(yīng)盡最大努力避免這種混亂。

結(jié)語(yǔ)：馮·諾依曼的第三種說(shuō)法，即“中間性”論證，比查理的直觀推理更具有嚴(yán)格性。但并非如此。在弱函數(shù)博弈中，查理知道露西將知道他要做的，在強(qiáng)函數(shù)博弈中他將知道露西要做的并且也知道露西知道這些，等等。在真實(shí)的博弈情境中他并不知道這些，也就是說(shuō)，他比在弱函數(shù)博弈和強(qiáng)函數(shù)博弈中的處境都更不利（然而，這也意味著按照預(yù)期效用他也許會(huì)比在其他兩種博弈中的處境更有利）。在這方面，真實(shí)的博弈并非處于弱函數(shù)博弈和強(qiáng)函數(shù)博弈之間，并且似乎沒(méi)機(jī)會(huì)導(dǎo)致“中間性”論證的正確性（正如麥克倫南也論證的那樣①E. F. McClennen， “Some Formal Problems with the von Neumann and Morgenstern Theory of Two-Person Zero-Sum Games， Ⅰ： The Direct Proof”， Theory and Decision， Vol. 7， No.1—2， 1976， pp.1—28.）。

對(duì)第四部分的評(píng)論：這部分公認(rèn)的理論在我看來(lái)依然有最清晰的癥狀，有些地方一定有問(wèn)題。莫名其妙的是，這些小小的錯(cuò)誤都會(huì)使我們徹底迷失方向?；旌喜呗圆豢赡芎?jiǎn)單地就是那個(gè)理性的或最佳的選擇。我認(rèn)為，這無(wú)須再爭(zhēng)論；像切諾夫②H. Chernoff， “Rational Selection of Decision Functions”， Econometrica， Vol. 22， No. 4， 1954， pp.422—443.的那種牽強(qiáng)推理的無(wú)效性，只能由標(biāo)準(zhǔn)理論（的其他部分）已深深占據(jù)人心這一事實(shí)來(lái)解釋。讓我來(lái)只是重復(fù)一下那個(gè)推理的簡(jiǎn)版：它從以下假設(shè)開(kāi)始，局中人在他們的可選項(xiàng)中有某種偏好排序。盡管博弈論并沒(méi)有建立這種排序，正如上面所提到的那樣，但否定其可能性或者只在博弈情景中才講得通確實(shí)會(huì)是一個(gè)奇怪的斷言?，F(xiàn)在，兩個(gè)可比較選項(xiàng)的混合明顯不比它們兩個(gè)好。并且，如果排序不應(yīng)該是完全的或相關(guān)的，如果應(yīng)該有兩個(gè)不可比選項(xiàng)，那么它們的混合就與它們兩個(gè)中的每一個(gè)都不具有可比性。因此，一種混合在任何情況下都不比組成混合的成分更有效，也就沒(méi)有必要考慮把混合策略作為局中人的選項(xiàng)。

實(shí)際上，是否任何人都已經(jīng)真的主張把混合均衡策略作為那個(gè)理性選擇，這是不清楚的，因?yàn)榇嬖谙旅孢@個(gè)固有的相反論證，這個(gè)論證是眾所周知的。如果一個(gè)局中人堅(jiān)信他的對(duì)手使用他的混合均衡策略，那么所有的混合在他自己的均衡策略中的純粹策略（以及所有的它們的其他混合）就會(huì)有相同的最大預(yù)期效用。也就是說(shuō)，如果其中一個(gè)局中人相信博弈論，另一個(gè)人就不需要這樣并被證明忽視混合策略；如果其中一個(gè)局中人不相信博弈論，那么無(wú)論如何博弈論馬上就會(huì)中止。海薩尼在他的文章③J. C. Harsanyi， “Games with Randomly Disturbed Payoffs： A New Rationale for Mixed-Strategy Equilibrium Points”， International Journal of Game Theory， Vol.2， No.1， 1973， pp.1—23.中也擔(dān)心混合策略中均衡點(diǎn)的這種不穩(wěn)定性（它表明，即使第二部分無(wú)可爭(zhēng)議，也不可能順利延續(xù)到第四部分），我們稍后回到那里。

在這里，通常附加的論證毫無(wú)用處。秘密論證，即隨機(jī)化有利于對(duì)付聰明的對(duì)手①例如，參見(jiàn) R. D. Luce ﹠ H. Raiffa， Games and Decisions， New York： Wiley ﹠ Sons， 1957， p.75。，是不切實(shí)際的。因?yàn)檎纾?biāo)準(zhǔn)形式）博弈情景所通常描述的那樣，局中人在他們作出選擇之前不可能知道或發(fā)現(xiàn)其他對(duì)手的做法，除非他們有通心術(shù)或相似的特異功能。他們也許多少對(duì)其他人有明顯的信念，但根據(jù)通常的描述，在目前情況下未發(fā)現(xiàn)的選擇過(guò)程不可能成為證據(jù)的一部分。多少帶有爭(zhēng)論性地講：博弈論中的有趣之處并不是害怕知識(shí)的出現(xiàn)，而是害怕知識(shí)所缺乏的確定性。

無(wú)論是出于解釋性理由還是證明性理由，在教科書(shū)中常常可以找到另一條線索。這條線索是，想象一個(gè)被玩了很多次或無(wú)數(shù)次的博弈。可是，如果它被當(dāng)成人們?cè)谕鏄?gòu)建自原初博弈的超級(jí)博弈，這條線索就無(wú)任何進(jìn)步，只是因?yàn)槲覀冊(cè)谠醪┺闹兴械睦碚撀闊?huì)再次出現(xiàn)在超級(jí)博弈中。但即使我們假定在統(tǒng)計(jì)上無(wú)法使用的（在適當(dāng)之處中顯示的）原初博弈純粹策略的隨機(jī)序列在超級(jí)博弈中是（當(dāng)然是）一個(gè)合理的選擇，并且會(huì)有一個(gè)理論上無(wú)可爭(zhēng)議的正當(dāng)理由，我們?nèi)詻](méi)有獲得成功。當(dāng)原初博弈只使用一次時(shí)，從那里到理性的東西之間并沒(méi)有嚴(yán)格的推理。②在這里，也許值得注意的是，根據(jù)長(zhǎng)期考慮來(lái)解釋個(gè)案概率的嘗試也被證明是得不到結(jié)果的；參見(jiàn)I. Hacking， Logic of Statistical Inference， Cambridge： University Press， 1965， Ch.4。

秘密論證在這種反復(fù)博弈的語(yǔ)境中更能講得通，因?yàn)樵缙诓┺闹械碾S機(jī)化可能在后期博弈中變得無(wú)法計(jì)算。但所有這些都忽視了這一點(diǎn)。這些考慮的可信性和實(shí)際價(jià)值是無(wú)可爭(zhēng)辯的。然而這一點(diǎn)就其本身而言，并沒(méi)有使它有助于基礎(chǔ)導(dǎo)向的理論化。并且，作為局中人可能選擇的混合策略就因上述理由而被放心地忽略掉。

四、怎樣理解博弈論（續(xù)）

我們可以通過(guò)嚴(yán)格堅(jiān)守決策論的立場(chǎng)來(lái)避開(kāi)所有這些麻煩。那我們將不得不為局中人詳細(xì)地說(shuō)明完全決策模型，這就促使我們要清晰地陳述所有我們關(guān)于局中人的假設(shè)，尤其是認(rèn)知假設(shè)，并從它們出發(fā)，依據(jù)最大預(yù)期效用規(guī)則而不是貌似可信的推理來(lái)嚴(yán)格地得出理性的選擇。因此，理論的第一部分應(yīng)盡可能地精確。第二部分盡管以其弱化的方式在評(píng)論中提到，但它依然有效。第三部分的混亂將會(huì)立即澄清。并且，我們將不會(huì)有采用混合策略的任何想法。

那非常好，但積極的貝葉斯理論看起來(lái)又怎樣呢？它沒(méi)有陷入新的麻煩嗎？讓我們看看。我們首先應(yīng)該介紹一些術(shù)語(yǔ)。在這一節(jié)中，理性的（rational）就是恰恰指最大預(yù)期效用而不是其他任何東西；這很重要。一個(gè)人堅(jiān)信p，就意味著其關(guān)于p的主觀概率是1。關(guān)于兩個(gè)人1和2，我們用遞歸方式定義：如果人i（i=1，2）堅(jiān)信p，那么其對(duì)p有一階信念；如果人i堅(jiān)信人j（j≠i）對(duì)p有n階信念，那么其對(duì)p有n+l階信念；當(dāng)且僅當(dāng)p為真并且兩個(gè)人對(duì)p的信念一直到n階，p是這兩個(gè)人之間的n階共同知識(shí)（盡管?chē)?yán)格來(lái)講，需要的不是他們所具有的知識(shí)，而只是真的信念）。

現(xiàn)在讓我們轉(zhuǎn)向最簡(jiǎn)單的情形，看看純粹策略中只有一個(gè)均衡點(diǎn)的標(biāo)準(zhǔn)形式的兩人零和博弈，在那里查理（橫向選擇者）和露西（縱向選擇者）是我們的兩個(gè)對(duì)手。公認(rèn)理論的第一部分和對(duì)它的評(píng)論都建議通過(guò)假設(shè)以下一點(diǎn)開(kāi)始分析：查理和露西的理性和他們由博弈矩陣得來(lái)的效用都是還須在它們之間詳加說(shuō)明的某階共同知識(shí)。如果是n階，我們可稱這個(gè)假設(shè)為RUMn。RUM是不是已經(jīng)解決了這些博弈？不幸的是，沒(méi)有。RUM所做的是，排除那些從一開(kāi)始或以這種方式消除一些可選項(xiàng)后仍占嚴(yán)格支配地位的可選項(xiàng)。例如，下面的博弈是通過(guò)RUM5來(lái)解決（當(dāng)然，它應(yīng)用 RUM4，…，RUM1）：

因?yàn)镽UM1，露西堅(jiān)信查理永遠(yuǎn)不會(huì)做a4；因?yàn)镽UM2，查理堅(jiān)信露西堅(jiān)信這些并因此永遠(yuǎn)不會(huì)做b4；同樣，a3被RUM3排除，b3被RUM4排除（這解決了查理的問(wèn)題），最后a2被RUM5排除（這也解決了露西的問(wèn)題）。

一般化：如果RUMs能有效排除局中人的一個(gè)選項(xiàng)之外的所有其他可選項(xiàng)，那么剩下的那個(gè)選項(xiàng)只能是他的均衡策略。不幸的是，RUM在其中有效的博弈是有具體特征的。例如，所有的RUM在以下類型的博弈中無(wú)能為力：

在這里，RUM1沒(méi)有排除任何東西，因此沒(méi)有RUM能解決問(wèn)題。

貝葉斯立場(chǎng)存在潛在困難。根據(jù)標(biāo)準(zhǔn)理論，第一部分的有點(diǎn)兒模糊的假設(shè)似乎以非?？尚诺姆绞阶C明了對(duì)所有兩人零和博弈的均衡或極大極小策略的正當(dāng)性?，F(xiàn)在，在一種決策理論的精確化（exactification）之下，這些假設(shè)濃縮為RUMs；但RUMs不夠有力，只能否定極為特殊的個(gè)例。對(duì)非貝葉斯主義者而言這也解決了問(wèn)題，即使貝葉斯主義者在這一點(diǎn)上有所動(dòng)搖。但在我看來(lái)，由于上面提到的理由，任何對(duì)決策理論道路的背離都會(huì)成為理論上的災(zāi)難。因此，正如均衡策略看來(lái)并且廣泛被認(rèn)為合理的那樣，這個(gè)工作只能是通過(guò)一些似乎合理的假設(shè)加強(qiáng)RUM，均衡策略也許可從這些假設(shè)來(lái)證明是理性的。我認(rèn)為，我打算陳述的假設(shè)是與標(biāo)準(zhǔn)博弈論的精神最為接近的假設(shè)；事實(shí)上，它將是微不足道的改寫(xiě)以至于你會(huì)失望：

根據(jù)RUM，我們的第二個(gè)事例的麻煩是，查理和露西關(guān)于他人行動(dòng)的認(rèn)知狀態(tài)根本不受限制，他或她的每一個(gè)可選項(xiàng)相對(duì)于認(rèn)知狀態(tài)都是最優(yōu)的。因此，我們應(yīng)當(dāng)引進(jìn)一些關(guān)于這些認(rèn)知狀態(tài)的限制。做到這一點(diǎn)的一個(gè)方法是，加強(qiáng)從RUMn到RUEn，即以下假設(shè)是他們之間的n階共同知識(shí)：不僅是查理和露西的理性及其效用，而且包括他們關(guān)于他人行動(dòng)的認(rèn)知狀態(tài)。

更正式一些來(lái)講，這實(shí)際上是下面的定理，它們實(shí)際上適用于所有標(biāo)準(zhǔn)形式的兩人博弈。用A1表示查理的一組可選項(xiàng)，用A2表示露西的一組可選項(xiàng)，我們來(lái)考慮以下命題：

（1）查理是有理性的。

（1′）露西是有理性的。

（2）他的 A1×A2的效用函數(shù)是 U1。

（2′）她的 A1×A2的效用函數(shù)是 U2（不必然是 U1）。

（3）他的A2的主觀概率函數(shù)是P1。

（3′）她的 A1的主觀概率函數(shù)是 P2。

（4′）—（9′）是把（4）—（9）中查理和露西的角色互換。

（10）查理的混合策略s1=P2和露西的混合策略s2=P1都是均衡的。

（11）他選擇最反對(duì)s2=P1的純粹策略。

（11′）她選擇最反對(duì) s1=P2的純粹策略。

那么，（從只是論及一個(gè)人的意義上講）我們有以下“個(gè)人內(nèi)心的”定理：（1）—（9）蘊(yùn)涵（10）和（11）；以及“人際的”定理：（1）—（6）和（1′）—（6′）蘊(yùn)涵（10）（ 11）和（11′）。

這個(gè)證明幾乎不應(yīng)該表述如下：讓BiA（ii=1，2）是所有純粹策略的集合，根據(jù)Ui，這些純粹策略最反對(duì)S（jj≠i）的。用M（Bi）表示Bi中所有策略混合的集合。那么當(dāng)然，M（Bi）中的每一個(gè)混合策略都最反對(duì)Sj?，F(xiàn)在，（3）—（6）蘊(yùn)涵s2M（B2）。同理，從（6）—（9）或（3′）—（6′）得出 s1M（B1）。因此，s1和 s2是均衡的；最后，（1）和（1′）分別蘊(yùn)含（11）和（11′）。

我得趕緊補(bǔ)充的是，我們剛剛把混合策略僅僅作為一種形式手段來(lái)使用（當(dāng)然，它們還是非常有用的）；在這里，P1僅僅被認(rèn)為是查理所具有的東西，S2不是露西所具有的，盡管它們可能在形式上等同。讓我也補(bǔ)充一下，這些“定理”也許可非常容易地推廣到所有標(biāo)準(zhǔn)形式的n人博弈。①實(shí)際上，我對(duì)我們的瑣碎“定理”有點(diǎn)兒慚愧。我希望提出一些更為有益的東西；而事實(shí)上，有很多也許更弱也許更貌似真實(shí)的假設(shè)試圖取代RUE。然而，我沒(méi)有發(fā)現(xiàn)和RUE同樣有效的假設(shè)。但畢竟，數(shù)學(xué)上的新奇不是我這里的目標(biāo)。

對(duì)于陳述這些定理，我的理由是，我認(rèn)為它們的形式應(yīng)當(dāng)是博弈論定理的范式。它們通過(guò)完全決策模型刻畫(huà)局中人，在完全決策模型中，他的愿望和信念都是按需要的詳細(xì)程度來(lái)刻畫(huà)；并且，他們堅(jiān)持把最大預(yù)期效用作為唯一的決策規(guī)則。因此，它們是嚴(yán)格的貝葉斯定理，并且正因如此，它們符合由先前部分中的批判產(chǎn)生的全部要求。

我認(rèn)為，它們不應(yīng)該為它們的結(jié)論（11）和（11′）而受責(zé)備，盡管這個(gè)結(jié)論對(duì)純粹策略中沒(méi)有均衡點(diǎn)的博弈而言是不完全確定的。標(biāo)準(zhǔn)博弈論對(duì)于純粹策略同樣沒(méi)有詳細(xì)說(shuō)明，并且已經(jīng)清楚的是，在貝葉斯式解釋之內(nèi)我們無(wú)法根據(jù)混合策略得出更具體的結(jié)果。因此，這么多非確定性是不可避免的，并且在這方面沒(méi)有理由失望。

但是，可能你會(huì)因它們的前提而責(zé)備它們，盡管你肯定認(rèn)為前提符合標(biāo)準(zhǔn)博弈論的精神。提及“個(gè)人內(nèi)心的”定理，前提（1）（2）（4）（5）（7）和（8）都是RUM2的部分，不管如何這是博弈論中所承認(rèn)的；（3）（6）和（9）也與假設(shè)其假設(shè)的公共性這個(gè)一般趨勢(shì)相一致，尤其，博弈論歸咎于局中人的是，它們說(shuō)明了擔(dān)心對(duì)方太透明。

然而，有人反駁說(shuō)，把（3）（6）和（9）作為前提——盡管理性的局中人是真的——根本不符合博弈論的精神，而不如說(shuō)是博弈論的一種諷刺，因?yàn)橥ㄟ^(guò)表明S1和S2分別是查理和露西要做的理性事情，從而斷然假定博弈論所要建立或努力建立的東西（由于所假設(shè)的理性共同知識(shí)，從而蘊(yùn)含（3）（6）和（9））?，F(xiàn)在我要重申的是，像（3）（6）和（9）這樣的事物在標(biāo)準(zhǔn)博弈論中根本不是嚴(yán)格地建立的，而我們?cè)僖淮蝸?lái)到這里。這里的障礙在哪里？我認(rèn)為，即使人們同意到目前為止我所說(shuō)的，依然肯定存在這樣一種感覺(jué)，即我沒(méi)有完全公正地對(duì)待標(biāo)準(zhǔn)博弈論。事實(shí)是，當(dāng)對(duì)標(biāo)準(zhǔn)理論的顯明目標(biāo)即建立理性行動(dòng)進(jìn)行表面判斷時(shí)，就清楚地表明標(biāo)準(zhǔn)理論意在更多我們還未把握到的東西，貝葉斯式重述就會(huì)導(dǎo)致一種淺薄。但讓我們目前遵從這一殘酷的事實(shí)；當(dāng)我們隨后從一個(gè)更抽象的水平來(lái)理解它時(shí)，我們就會(huì)看得更加清楚。

另一種指責(zé)可能是，（3）（ 6）和（9）是比其他假設(shè)更加難以置信的假設(shè)（盡管這與先前的指責(zé)即（3）（ 6）和（9）是假定而非證明的相反）。下面是三個(gè)相關(guān)的評(píng)論：

第一，所有（1）到（9）當(dāng)然都是理想化的。但是，根本沒(méi)有理由解釋為什么（3）（ 6）和（9）應(yīng)該是比其他假設(shè)都更加嚴(yán)重的理想化。因此，這不可能是這個(gè)指責(zé)所指向的觀點(diǎn)（一般而言的懸而未決的理想化本質(zhì)不是我們需要討論的主題）。

第二，通常很難說(shuō)（5）還是（6），或（8）還是（9）是我們定理的更加關(guān)鍵的假設(shè)，因?yàn)樵陉P(guān)于他人的信念或愿望是否更容易可知這個(gè)問(wèn)題上，似乎不可能有任何一般的、實(shí)質(zhì)的斷言；我認(rèn)為，這個(gè)問(wèn)題不需要爭(zhēng)論。

第三個(gè)要提的事情是，說(shuō)與RUM相對(duì)立的RUE的盈余包含在局中人的認(rèn)知狀態(tài)的共同知識(shí)中是欠妥當(dāng)?shù)模驗(yàn)橐恍┻@樣的東西常常已經(jīng)包含在RUM中。也就是說(shuō)，如果博弈有機(jī)會(huì)變化，那么局中人關(guān)于這些變化的認(rèn)知狀態(tài)就通過(guò)RUM而眾所周知，因?yàn)槟菚r(shí)RUM需要預(yù)期效用被眾所周知。

盡管有這些辯護(hù)性評(píng)論，（6）和（9）依然看起來(lái)比（5）和（8）更有問(wèn)題——至少在兩人博弈的通常例子中（這不可能通過(guò)說(shuō)這些例子有偏見(jiàn)就可以不管）。這會(huì)被下面的考慮所支持。

首先，假設(shè)局中人相互知道關(guān)于機(jī)會(huì)變化的認(rèn)知狀況，這似乎在許多（盡管不是在所有）情景中都是無(wú)傷大雅的——例如像擲骰子的機(jī)會(huì)變化，而且，當(dāng)關(guān)于機(jī)會(huì)變化的主觀概率不是很容易被當(dāng)作反映那種機(jī)會(huì)變化的客觀概率的知識(shí)時(shí)，即使當(dāng)問(wèn)題中的機(jī)會(huì)變化沒(méi)有客觀概率時(shí)，也是如此。例如，機(jī)會(huì)變化也許是史努比是否正在找紅男爵，然后我們可以想象查理作如下推理：“史努比昨天就開(kāi)始尋找了，通常這要花費(fèi)他幾天時(shí)間。因此，非?？赡?，比如說(shuō)90%的可能性，他仍然在尋找。現(xiàn)在，因?yàn)槁段骱臀乙黄鸢l(fā)現(xiàn)他昨天登上了他的雙翼飛機(jī)，我知道她知道史努比是從昨天開(kāi)始的，她也知道我知道史努比是從昨天開(kāi)始的。更重要的是，她對(duì)他的了解和我對(duì)他的了解幾乎一樣多，并且她知道我有多了解他；因此，她會(huì)準(zhǔn)確地猜到我關(guān)于史努比的概率，并且她本人會(huì)有相同的概率?！泵慨?dāng)這樣的考慮適宜時(shí)，就可以貌似合理地假定至少局中人關(guān)于機(jī)會(huì)變化的信念這樣的二階共同知識(shí)。①讓我順便指出，（1）（2）（4）（5）（7）和（8）是不如RUM2有力的查理RUM的一半，（1）到（9）是不如RUE2有力的查理RUE的一半。我認(rèn)為，這是可以令人滿意的，因?yàn)樗坪跷覀兣实堑腞UM或RUE的等級(jí)越高，我們就更加奇怪地喪失自我。

同樣地，共同的效用知識(shí)常?？雌饋?lái)沒(méi)問(wèn)題。因此，想象一下查理和露西在玩相匹配的賭注；那么就有了查理為這個(gè)博弈建立（2）（5）和（8）的另外一個(gè)簡(jiǎn)單的推理：“我下了不到四分之一，我想贏。所以，我的效用堅(jiān)守不變。現(xiàn)在，露西非常了解人性，特別是我的人性。人人都追逐金錢(qián)，畢竟我也不例外。所以，她將知道我的偏好。但是，她也沒(méi)什么不同，她已經(jīng)充分證明了這一點(diǎn)。所以，她的效用應(yīng)該與我的相對(duì)立?！?/p>

與這兩個(gè)推理相反，讓我們看看對(duì)于（3）（6）和（9）是否存在相似的推理。查理也許會(huì)作如下闡述：“露西的各種可選項(xiàng)的概率是怎樣的？為了找到答案，我應(yīng)該審查我關(guān)于她的證據(jù)?！薄獣和Ｒ幌隆昂冒?，不管我的證據(jù)是什么，我已把它與她知道的收集在一起；沒(méi)什么特殊的或神秘的東西。因此，（a）她大概知道我有關(guān)于她的哪些證據(jù)。但是，（b）她也因此將正確地猜到我的概率；畢竟，我們思考的方式并無(wú)不同。同樣，她將可能想到我正確地猜到她對(duì)我的概率?！薄獣和Ｒ幌隆翱纯?，按照RUM（確切地說(shuō)是RUM3）發(fā)展下去，（c）我的概率一定是Pl，她的是P2（假設(shè)這是唯一的均衡點(diǎn)）。因此，（d）她也認(rèn)為我會(huì)有P1。那不是很聰明嗎？”

不，和先前兩個(gè)推理相比，它有點(diǎn)兒可疑。與史努比的情形相反，關(guān)于露西的證據(jù)依然不清楚。然而，真正糟糕的事情是，到（d）的推理有些弄巧成拙。因?yàn)?，（a）是（b）的根據(jù)，但（b）導(dǎo)向（c）然后到（d）卻沒(méi)有提及任何證據(jù)；因此，（a）變得根本不具有操作性，而這就使（b）喪失了它的根據(jù)。

使查理的第三個(gè)推理站得住腳的明顯方式似乎是，明確陳述一些查理貌似具有的證據(jù)和直接引起他擁有愿望P1的證據(jù)；他到（d）的推理就行得通了。（需要注意的是，正如他的推理所表明的那樣，查理?yè)碛蠵1不是因?yàn)镻1是可與露西所知道的他的概率相一致的唯一概率函數(shù)。相反，他有P1是由于他擁有的證據(jù)，然后P1被附加——盡管不是偶然——證明是非常一致的。）

然而，就像第六節(jié)中的討論使我們恰好得出相同的結(jié)論一樣，我會(huì)稍后更詳細(xì)地解釋。因此，目前我們不得不承認(rèn)，我們對(duì)（3）（6）和（9）依然缺乏根據(jù)，這就像對(duì)（2）（5）和（8）那樣自然，并因此對(duì)允許（3）（6）和（9）作為額外前提的兩個(gè)指責(zé)仍然沒(méi)有得到充分的回答。

五、真正的議題：行動(dòng)理性和認(rèn)知理性

迄今為止，我們已經(jīng)介紹并比較了標(biāo)準(zhǔn)理論和決策理論，我希望我已經(jīng)解釋清楚在我看來(lái)的貝葉斯理論的確切優(yōu)點(diǎn)之所在，以及為什么它們?cè)谀抢锎嬖凇５牵乙舱冒l(fā)現(xiàn)貝葉斯理論的一些尚待處理的問(wèn)題，為了使它們牢靠，似乎看起來(lái)我們不得不返回到公認(rèn)的理論。因此，讓我從一個(gè)更深一點(diǎn)兒的層次上再次闡釋整個(gè)理論，即通過(guò)考察作為不同觀點(diǎn)的基礎(chǔ)的理性觀念。首先讓我從標(biāo)準(zhǔn)理論入手。

事實(shí)上，在標(biāo)準(zhǔn)博弈論背后似乎并沒(méi)有一個(gè)非常明確的理性觀念。至少在20世紀(jì)五六十年代，另一個(gè)發(fā)展理性概念的方式在決策論和博弈論及相關(guān)領(lǐng)域中非常受歡迎。第一條規(guī)則，源自對(duì)任何宏偉畫(huà)卷的敏感式懷疑，是不以任何綜合性、而是以不考慮后果的理性觀念來(lái)對(duì)主題作出的預(yù)先判斷。更精確地說(shuō)，正如羅爾斯稱作的那樣①J. Rawls， A Theory of Justice， Cambridge， Mass.： Harvard University Press， 1971， pp.48ff.，一種審慎的步進(jìn)式推理（step-by-step reasoning）應(yīng)該導(dǎo)向一種直觀而系統(tǒng)的論證的反思性均衡。因此，有人從一些直觀上非常令人信服的假設(shè)出發(fā)，展示他們的演繹結(jié)果，詳細(xì)檢查這些結(jié)果是否在直觀上不合理，最終拋棄最弱的假設(shè)，努力增添新的假設(shè)，以相同的方式核實(shí)他們，區(qū)分基本的和派生的假設(shè)，等等。通過(guò)這種方式，諸如偏好傳遞性原則和確鑿性原則等大量的基本原則（以及一些次基本原則，像那些作出修改以適應(yīng)更具體情景的極大極小變化）就出現(xiàn)了，然后它們會(huì)非常自信地聲稱能刻畫(huà)理性。雖然這些原則從沒(méi)有認(rèn)為應(yīng)該詳細(xì)討論理性概念，但它們被證明是十分有力的。的確，對(duì)處于確定性和風(fēng)險(xiǎn)性之下的決策而言，這種方式取得了完全成功；對(duì)處于不確定性之下的決策而言，盡管不是全體同意，但結(jié)果是可闡明的；并且，至少較為簡(jiǎn)單的博弈情景得到了滿意的解決。

我希望這不是一個(gè)對(duì)實(shí)際過(guò)程過(guò)于扭曲的描述，在我看來(lái)，它的唯一缺點(diǎn)是看起來(lái)有點(diǎn)缺乏概念的清晰性；到底是什么推向一種反思性均衡，這并不完全透明。這在博弈論中尤感壓力，但至少我嘗試在后續(xù)中進(jìn)行論證。

為了更清楚些，我認(rèn)為，我們必須對(duì)關(guān)于理性的兩三個(gè)相當(dāng)明顯的事實(shí)進(jìn)行考察。首先，我們必須嚴(yán)格區(qū)分行動(dòng)理性、信念理性以及可能的愿望理性，并分別討論它們。

讓我們首先考慮行動(dòng)理性，它是決策論和博弈論的公開(kāi)主題。這里重要的事情是，無(wú)論一個(gè)人的行動(dòng)是不是理性的，它只能由那個(gè)人相關(guān)的主觀愿望和信念決定。這從日常經(jīng)驗(yàn)看是顯而易見(jiàn)的；無(wú)論何時(shí)我們偶然遇到看起來(lái)不理性的行動(dòng)，當(dāng)這個(gè)行動(dòng)者或其他很熟悉他的人，向我們解釋他這樣行動(dòng)的原因時(shí)，我們可能就會(huì)放棄我們的判斷。并且，這從反復(fù)指出這一事實(shí)的哲學(xué)作品看也是顯而易見(jiàn)的。②例如，參見(jiàn)C. G. Hempel， “Rational Action”， Proceedings and Addresses of the American Philosophical Association，Vol.35， Yellow Springs， Ohio： The Antioch Press， 1962， pp.5—23，或者P. M. Churchland， “The Logical Character of Action-Explanations”， Philosophical Review， Vol.79， No.2， 1970， pp.214—236，以及其他關(guān)于理性解釋和行動(dòng)解釋的文獻(xiàn)?，F(xiàn)在，只有當(dāng)一個(gè)行動(dòng)與本身就理性的信念和愿望理性地關(guān)聯(lián)起來(lái)時(shí)，我們才能稱這個(gè)行動(dòng)是理性的。但是，這只不過(guò)是個(gè)術(shù)語(yǔ)問(wèn)題。在兩個(gè)方面之間存在一定的關(guān)系，一方面是行動(dòng)，另一方面是信念和愿望，而無(wú)論信念和愿望可能是什么。無(wú)論何時(shí)一個(gè)行動(dòng)把這種關(guān)系帶給既定的信念和愿望，更可取的做法并且也是我的做法，就是把這個(gè)行動(dòng)稱作是理性的。哪個(gè)行動(dòng)在這個(gè)意義上恰好是理性的，通常是權(quán)衡每一給定的信念和愿望在原則上相關(guān)的結(jié)果。當(dāng)然，這很模糊；但把它弄清楚卻是一個(gè)明確的任務(wù)，并且，考察信念理性和愿望的理性是一項(xiàng)與眾不同的工作（這還不是我們的主題）。

對(duì)我們而言，這個(gè)考察有兩個(gè)結(jié)果。一個(gè)是，當(dāng)處理行動(dòng)理性時(shí)，我們確實(shí)應(yīng)該考慮概率的主觀主義解釋。因?yàn)楠?dú)立于一個(gè)人的主觀信念時(shí)，對(duì)行動(dòng)理性就沒(méi)有多少可以說(shuō)的。從這個(gè)觀點(diǎn)看，不確定性條件下的決策和標(biāo)準(zhǔn)理論中所描述的博弈情境一樣，只不過(guò)似乎是證據(jù)不足的問(wèn)題。但是，如果一個(gè)人的信念被明確地考慮，那我們就不得不使這些信念概念化；并且，微弱地說(shuō)，概率衡量是一個(gè)這樣概念化的好方式。我認(rèn)為，這在哲學(xué)中并未提及，但奇怪的是，它似乎依然需要在博弈理論家和經(jīng)濟(jì)學(xué)家中強(qiáng)調(diào)。

事實(shí)上，在所有標(biāo)準(zhǔn)博弈論中都闡述過(guò)對(duì)主觀概率的反感。在機(jī)會(huì)變化的觀念和處理中這是顯而易見(jiàn)的，它說(shuō)明一個(gè)事實(shí)，其他人的行動(dòng)并不是作為局中人的概率來(lái)考慮的，在對(duì)待局中人的整個(gè)認(rèn)知構(gòu)成時(shí)就像對(duì)待非親生子女一樣可以找到一般表述。毫無(wú)疑問(wèn)，標(biāo)準(zhǔn)博弈論通過(guò)精彩的替代克服缺少不受歡迎的主觀概率，但我認(rèn)為同樣清楚的是，這種轉(zhuǎn)變是標(biāo)準(zhǔn)理論中不連貫闡述的主要原因。并且，它使前面勾勒的達(dá)至理性的“反思性均衡”方法變得更為含混。

第二個(gè)結(jié)果是，如果我們?cè)敢庠跀?shù)學(xué)模型中捕捉行動(dòng)理性，我們就幾乎自動(dòng)地導(dǎo)向決策論。因?yàn)榉从澈饬恐饔^信念和愿望的最自然的方法是以某種量化的方式將它們概念化；當(dāng)然，對(duì)這樣一種量化的概念化而言，實(shí)踐上無(wú)可匹敵的候選項(xiàng)就是概率測(cè)度和效用函數(shù)；因此，最大預(yù)期效用的貝葉斯規(guī)則是衡量過(guò)程及其產(chǎn)出的最為貌似合理并在數(shù)學(xué)上最為簡(jiǎn)單的模型。當(dāng)然，這個(gè)考量獨(dú)自不可能建立起決策論；但是，由于堅(jiān)實(shí)的“反思性均衡”基礎(chǔ)已經(jīng)盡一切力量支持這個(gè)數(shù)學(xué)模型，這就可能使之簡(jiǎn)單些。

現(xiàn)在重要的是，這個(gè)模型給了我們一個(gè)關(guān)于行動(dòng)的完全解釋，這個(gè)行動(dòng)相對(duì)于給定的信念和愿望而言是理性的。這就是說(shuō)，任何在可比較的概念化范圍之內(nèi)起作用的其他解釋，要么是由決策論的解釋引起，要么是與決策論的解釋相抵觸。（嚴(yán)格來(lái)講，這不是很對(duì)；根據(jù)決策論，也許存在紐帶；而在這些情形中，也僅僅在這些情形中，可能有另外的解釋不是由決策論引起但可與決策論相比較。）

所有這些的結(jié)果是：我們也許是在為公認(rèn)的主觀信念和愿望的概念化而爭(zhēng)吵。但是，如果我們不爭(zhēng)吵，那么當(dāng)運(yùn)用小于完全的決策模型時(shí)，我們就無(wú)法完全公正地對(duì)待行動(dòng)理性；當(dāng)運(yùn)用完全決策模型時(shí)，我們就有了完整刻畫(huà)行動(dòng)理性所需要的一切。因此，也從總的角度來(lái)看，像理性行動(dòng)處于爭(zhēng)論之中的其他每個(gè)地方一樣，在博弈論中我們沒(méi)有好的選擇，只有保持一個(gè)嚴(yán)格的決策論過(guò)程。

現(xiàn)在最后一次提出這個(gè)猜測(cè)，博弈論對(duì)剛才討論到的弱意義上的行動(dòng)理性不太感興趣，它感興趣的是建立在理性信念以及可能理性愿望基礎(chǔ)之上的強(qiáng)意義上的行動(dòng)理性。然而，愿望理性是一個(gè)非常模糊的主題。根據(jù)理性愿望是否可能通過(guò)理性信念從其他愿望推斷出來(lái)，存在一個(gè)并非完全不清楚的愿望觀念，它相對(duì)于其他給定的愿望是理性的愿望。但是，是否也存在一些絕對(duì)地判斷愿望理性的方法——這是一個(gè)開(kāi)放式問(wèn)題，使人想起沉重的道德問(wèn)題，是否有客觀價(jià)值這樣的東西。在這種情景下，聰明的話就不要去假定絕對(duì)的理性愿望，當(dāng)然這也是所有決策理論家和博弈理論家通過(guò)把偏好和效用函數(shù)作為主觀上的既定項(xiàng)所做的事情。因此，我們只討論認(rèn)知理性，這也是最終我們要談的。

六、真正的議題（續(xù)）

首先，我應(yīng)該簡(jiǎn)要提及一個(gè)熟悉的觀點(diǎn)（為了接下來(lái)別再想它），即行動(dòng)理性的決策論解釋已經(jīng)假定一個(gè)形式的認(rèn)知理性最小值，也就是說(shuō)，主觀概率像數(shù)學(xué)概率那樣運(yùn)作。但這總是被認(rèn)為是理所應(yīng)當(dāng)?shù)?；?dāng)然，我們現(xiàn)在要考慮一個(gè)超越這點(diǎn)的實(shí)質(zhì)屬性。

實(shí)際上，標(biāo)準(zhǔn)博弈論確實(shí)和認(rèn)知理性相關(guān)而不僅僅和行動(dòng)理性相關(guān)，這一說(shuō)法并不非常清楚。至少，在標(biāo)準(zhǔn)參考資料（像馮·諾依曼、摩根斯坦①J. von Neumann ﹠ O. Morgenstern， Theory of Games and Economic Behavior.或盧斯、雷法②R. D. Luce ﹠ H. Raiffa， Games and Decisions.）中我無(wú)法為此找到好的證據(jù)；也許還要不得不處理用以解釋理性的有點(diǎn)兒統(tǒng)一的“反思性均衡”方法。但是，來(lái)自第四節(jié)末尾的印象，即我們的貝葉斯理論并未完全公正地對(duì)待標(biāo)準(zhǔn)理論，也指出了這一憂慮。當(dāng)我們看到海薩尼所寫(xiě)的從他的貝葉斯式方法到博弈論的東西時(shí)，議題就變得更加清楚。例如，他說(shuō)：

在博弈情景中定義理性行為的基本困難是這樣一個(gè)事實(shí)：通常每個(gè)局中人的策略都將依賴于他對(duì)其他局中人的策略的預(yù)期。如果我們能假定他的預(yù)期是給定的，那么他的策略選擇問(wèn)題就會(huì)變成一個(gè)普通的最大值問(wèn)題：基于其他局中人將會(huì)根據(jù)他的既定預(yù)期來(lái)行動(dòng)的假設(shè)，他可以簡(jiǎn)單地選擇一個(gè)收益最大化的策略。但關(guān)鍵是，博弈論不可能把局中人關(guān)于彼此行為的預(yù)期看作是給定的；不如說(shuō)，對(duì)博弈論而言，最重要的一個(gè)問(wèn)題恰恰是決定哪些預(yù)期是聰明的局中人對(duì)于其他聰明局中人的行為能理性地存有的。這可以被稱作相互“理性預(yù)期”問(wèn)題。③J. C. Harsanyi， “Bargaining and Conflict Situations in the Light of a New Approach to Game Theory”， The American Economic Review， Vol. 55， No. 1/2， 1965， pp.447—457.

為解決這一問(wèn)題，海薩尼不僅提出“狹義上的理性行為假設(shè)”，而且提出“理性預(yù)期假設(shè)”④J. C. Harsanyi， “A General Theory of Rational Behavior in Game Situations”， Econometrica， Vol.34， No.3，1966， pp.613—634.；然后他非常明確地表明這些假設(shè)意味著：

影響局中人的交易行為的僅有變量是：

（1）與每個(gè)局中人的選擇結(jié)果相關(guān)的回報(bào)；以及

（2）每個(gè)局中人分派給被其他局中人接受或拒絕的不同結(jié)果的主觀概率。

在這些變量中，只有那些在（1）中被提及的是獨(dú)立的變量，而（2）中的變量本身都是由（1）中的變量來(lái)決定。①J. C. Harsanyi， “A General Theory of Rational Behavior in Game Situations”， Econometrica， Vol.34， No.3，1966， p.621.

這上一個(gè)斷言對(duì)海薩尼的方法以及對(duì)標(biāo)準(zhǔn)博弈論都是至關(guān)重要的。但是，我認(rèn)為它基本上就是錯(cuò)的。（事實(shí)上，如果我不這么認(rèn)為，我可能就容忍了這篇文章。）然而，我不可能?chē)?yán)格地論證這個(gè)問(wèn)題，因?yàn)闉榇宋冶仨毐砻?，?duì)認(rèn)知理性的每個(gè)原則而言，人們也許可以貌似有理地心存想法，認(rèn)為它不是從（1）導(dǎo)向（2），還因?yàn)椋紤]到一些基本原則的例外情況，人們并不一致同意這些理應(yīng)心存的原則。認(rèn)知理性的闡釋比行動(dòng)理性少得多。不用奇怪，它是在其完整的哲學(xué)概論中由來(lái)已久但仍然尖銳的歸納問(wèn)題。但是，我將努力講通為什么我認(rèn)為海薩尼的斷言是錯(cuò)的。讓我們從回顧一些關(guān)于認(rèn)知理性的事實(shí)開(kāi)始。

首先，很明顯人們無(wú)法完全說(shuō)信念是理性的或不是理性的。只有與一個(gè)人擁有的證據(jù)相關(guān)時(shí)，這個(gè)人的信念才能被說(shuō)成是理性的。這種關(guān)系的一部分在演繹邏輯中被詳加闡明；無(wú)論從證據(jù)演繹地推出什么東西，它在理性上都應(yīng)當(dāng)是可信的。歸納邏輯和統(tǒng)計(jì)學(xué)也（兩者都是較有爭(zhēng)議的）試圖澄清這種關(guān)系。這里已經(jīng)變得明顯的是，某些認(rèn)知狀態(tài)的理性也依賴于先驗(yàn)的認(rèn)知狀態(tài)，也就是說(shuō)，應(yīng)從先驗(yàn)認(rèn)知狀態(tài)理性的評(píng)價(jià)問(wèn)題中區(qū)分出理性信念變化問(wèn)題——先驗(yàn)認(rèn)知狀態(tài)是如何理性地根據(jù)新證據(jù)改變的？——這是更加困難的問(wèn)題。實(shí)際上，認(rèn)知理性依然非常復(fù)雜；比如，它肯定還依賴于表達(dá)信念的語(yǔ)言。但是，如此深?yuàn)W復(fù)雜的問(wèn)題對(duì)我們的討論而言是無(wú)關(guān)的。②我認(rèn)為，這暗示一個(gè)瑣細(xì)但相關(guān)的評(píng)論，即必須嚴(yán)格區(qū)分理性信念和真實(shí)信念。盡管可能大多數(shù)理性信念是真實(shí)的，但現(xiàn)今大多數(shù)真理不能只是被非理性地相信（因?yàn)槲覀兊淖C據(jù)是如此不足），并且許多理性信念是錯(cuò)誤的（因?yàn)槲覀兊淖C據(jù)經(jīng)常具有誤導(dǎo)性）。這不是說(shuō)理性信念和真實(shí)信念不會(huì)相互關(guān)聯(lián)，而是說(shuō)這種關(guān)聯(lián)的本質(zhì)是一個(gè)深入而開(kāi)放的哲學(xué)問(wèn)題。參見(jiàn)C. S. Peirce， Collected Papers， Vol.Ⅰ — Ⅳ， edited by C.Hartshorne ﹠ P. Weiss， Cambridge， Mass.： Harvard University Press， 1960， Vol. Ⅴ， §§ 384—385 ﹠ 405—408，或者H. Putnam， Meaning and the Moral Sciences， London： Routledge ﹠ Kegan Paul， 1978， pp.121—140?，F(xiàn)在，博弈理論家假設(shè)他的局中人具有許多真實(shí)信念，例如，如果他認(rèn)為局中人知道機(jī)會(huì)變動(dòng)的客觀概率，或者如果他假設(shè)一定的RUM（根據(jù)RUMn，所有通過(guò)RUMn輸入到露西的二階信念都為真）；關(guān)鍵在于，只要他這樣做，他就引入一個(gè)真正的全新假設(shè)，這個(gè)假設(shè)無(wú)法單靠局中人的認(rèn)知假設(shè)來(lái)解釋。似乎對(duì)我而言，標(biāo)準(zhǔn)理論在這一點(diǎn)上并不總是非常清晰；例如，當(dāng)僅僅假設(shè)關(guān)于理性的一階信念時(shí)（參見(jiàn)我們的標(biāo)準(zhǔn)理論第一部分），（錯(cuò)誤的）觀念也許就會(huì)是，更高階的信念通過(guò)所假設(shè)的理性以某種方式塌陷。

現(xiàn)在回到海薩尼的斷言，讓我們?cè)僭O(shè)想一下查理和露西已投入到某個(gè)標(biāo)準(zhǔn)形式的零和博弈之中，并假定某個(gè)RUM（這里的“R”依然只是代表行動(dòng)理性）。讓我們假設(shè)這仍然解決不了博弈問(wèn)題（也就是說(shuō)，這個(gè)博弈像我們?cè)诘谒墓?jié)中的第二個(gè)例子）?，F(xiàn)在，我們附加假設(shè)查理在認(rèn)知上是理性的。這有什么幫助呢？我認(rèn)為，毫無(wú)幫助。我們?cè)诘谒牟糠种幸呀?jīng)看到，通過(guò)演繹邏輯RUM并沒(méi)有蘊(yùn)涵任何東西能夠縮小查理對(duì)露西的可能概率范圍。并且我知道，沒(méi)有貌似可信的歸納原則能在這方面做得更好。當(dāng)我們假設(shè)露西在認(rèn)知上是理性的時(shí)候，這同樣成立。但因此，它對(duì)查理相信露西在認(rèn)知上是理性的也沒(méi)有任何幫助。還有很多諸如此類的東西。這樣一來(lái)，即使我們附加假設(shè)認(rèn)知理性是查理和露西之間的某階共同知識(shí)，我們也不能由此得出他們具有博弈論使他們具有的主觀概率。并且，這與海薩尼的主張相抵觸：他以為我們能得出這一結(jié)論。也就是說(shuō)，我們希望的效用和所有理性（以及所有這些的共同知識(shí)）將共同決定主觀概率。當(dāng)然，當(dāng)查理和露西承認(rèn)其他或更多的證據(jù)而不僅僅是RUM時(shí)，這個(gè)推理根本沒(méi)有排除認(rèn)知理性的假設(shè)可能非常有效。

但是，我們不是批評(píng)海薩尼的斷言，而是應(yīng)該最好看看他是如何支持它的。然而，在他的文章中①J. C. Harsanyi， “A General Theory of Rational Behavior in Game Situations”， pp.613—634.，從我所引用的他的斷言來(lái)看，我沒(méi)有發(fā)現(xiàn)這樣的支持。在文章中，他的理性假設(shè)的確非常明顯地蘊(yùn)涵局中人的行動(dòng)只依賴（1）和（2）；但他對(duì)他的更強(qiáng)的論斷沒(méi)有作出進(jìn)一步的論述。不幸的是，用來(lái)解釋其所勾勒的計(jì)劃②Ibid.的其他文章同樣如此。③關(guān)于這些文章，參見(jiàn)下面兩篇文章的參考文獻(xiàn)：J. C. Harsanyi， “Bargaining and Conflict Situations in the Light of a New Approach to Game Theory”， The American Economic Review， Vol.55， No.1/2， 1965， pp.447—457； J. C. Harsanyi， “A General Theory of Rational Behavior in Game Situations”。

也許我們的興趣可以由他最近和萊因哈德·澤爾騰（Reinhard Selten）共同發(fā)展的理論來(lái)回答，這個(gè)理論對(duì)解決n人非合作博弈提出了一個(gè)全新的兩階段程序④參見(jiàn)J. C. Harsanyi， “The Tracing Procedure： A Bayesian Approach to Defining a Solution for n-Persons Noncooperative Games”， International Journal of Game Theory， Vol.4， No.2， 1975， pp.61—94，以及J. C. Harsanyi， “A Solution Concept for n-Persons Noncooperative Games”， International Journal of Game Theory， Vol. 5， No.4， 1976， pp.211—225.：

首先，一個(gè)先驗(yàn)主觀概率分布pi被分派給每個(gè)局中人i的純粹策略，這意味著代表其他局中人對(duì)局中人i的可能策略選擇的最初預(yù)期。那么，被稱作追蹤程序的數(shù)學(xué)程序就被用來(lái)定義這些基于先驗(yàn)分布pi之上的解決辦法。追蹤程序意味著為求解過(guò)程提供一種數(shù)學(xué)表達(dá)，通過(guò)理性局中人設(shè)法協(xié)調(diào)他們的策略計(jì)劃和他們的預(yù)期，并使他們趨于一個(gè)作為博弈解決方法的特定均衡點(diǎn)。⑤J. C. Harsanyi， “A Solution Concept for n-Persons Noncooperative Games”， International Journal of Game Theory， Vol.5， No.4， 1976， p.211.

這種——在它的具體細(xì)節(jié)上相當(dāng)復(fù)雜的——方法本該有一個(gè)較長(zhǎng)的討論。但是，指出為什么它似乎也沒(méi)有減少我們的麻煩就足夠了。如果我們把這種方法應(yīng)用到兩人零和博弈中，那么只有它的第二步即追蹤程序是相關(guān)的（因?yàn)樗偈姑總€(gè)先驗(yàn)概率分布連到相同的均衡點(diǎn)，即到唯一存在的均衡點(diǎn)）。現(xiàn)在，我們考慮只有一個(gè)局中人的情形；假設(shè)查理對(duì)露西的選擇集合擁有先驗(yàn)分布，但不是一個(gè)均衡分布。為什么查理應(yīng)該改變這些先驗(yàn)概率？根據(jù)一些新證據(jù)和幾乎不與理性信念變化的任何一般原則相關(guān)的追蹤程序，這種改變似乎并無(wú)必要。為什么不堅(jiān)持也許更為熟悉的先驗(yàn)概率呢？（盡管它們會(huì)表明查理不認(rèn)為露西知道它們——但他為什么應(yīng)該這樣想呢？）海薩尼對(duì)沉溺于追蹤程序給出的唯一理由就是這種先驗(yàn)分布不是均衡分布，而根據(jù)我們的標(biāo)準(zhǔn)理論第二部分中重述的理由，只有均衡點(diǎn)才能是非合作博弈的理性解決方案。①參見(jiàn)J. C. Harsanyi， “The Tracing Procedure： A Bayesian Approach to Defining a Solution for n-Persons Noncooperative Games”， pp.61—94。因此，他認(rèn)為理所應(yīng)當(dāng)?shù)臇|西，對(duì)我們而言依然是需要澄清的東西。

讓我們依然來(lái)看看海薩尼②J. C. Harsanyi， “Games with Randomly Disturbed Payoffs： A New Rationale for Mixed-Strategy Equilibrium Points”， International Journal of Game Theory， Vol.2， No.1， 1973， pp.1—23.，在那里他非常接近我們的想法，即努力克服混合策略中均衡點(diǎn)的明顯不穩(wěn)定性，這種不穩(wěn)定性在我們對(duì)標(biāo)準(zhǔn)理論第四部分的評(píng)論中曾批判性地提到過(guò)。為此，他提出下面的模型：給出標(biāo)準(zhǔn)形式中的一個(gè)非合作n人博弈，即“原初博弈”，A1，…，An是n人的選擇集合，Vl，…，Vn是他們對(duì)A1×…×An的效用函數(shù)。海薩尼現(xiàn)在認(rèn)為，某個(gè)稍微不同的博弈即“干擾性博弈”可能更真實(shí)地描述了真正的博弈情景，在那里每個(gè)局中人i的真正效用并非固定地由Vi給出，而是圍繞Vi給出的值有一個(gè)小范圍的波動(dòng)，這是由于“在其主觀和客觀條件中（例如在其情緒、品位、資源、社會(huì)情境等等之中）有微小的隨機(jī)波動(dòng)”③Ibid.。支配這些波動(dòng)的概率法則可能對(duì)不同的局中人是不同的，但每個(gè)局中人都被假定知道所有這些分布。然而，每個(gè)局中人在進(jìn)行選擇時(shí)僅僅知道他自己的波動(dòng)效用具體是怎樣的。因此，在標(biāo)準(zhǔn)形式的干擾性博弈中，局中人i的一個(gè)可能的純粹策略是一個(gè)函數(shù)，它能告訴他，對(duì)真正效用函數(shù)的每一個(gè)可能版本而言，從Ai中選擇哪一個(gè)行動(dòng)。于是，局中人關(guān)于標(biāo)準(zhǔn)形式干擾性博弈的效用函數(shù)立即可從以上描述推斷出來(lái)。

現(xiàn)在，海薩尼能夠基本證明：干擾性博弈有至少一個(gè)均衡點(diǎn)；干擾性博弈的每個(gè)均衡點(diǎn)都在純粹策略中；如果局中人在干擾性博弈的均衡中選擇純粹策略，那么根據(jù)效用性的概率法則，這些選擇會(huì)降到近似處于均衡的原初博弈中的混合策略；并且，這個(gè)近似值越接近，圍繞Vi的波動(dòng)幅度就越小。這就解決了穩(wěn)定性問(wèn)題，因?yàn)樵诟蓴_性博弈中均衡因在純粹策略中而穩(wěn)定；并且因?yàn)樵诟蓴_性博弈中選擇一個(gè)純粹策略就意味著在原初博弈中選擇了一個(gè)隨機(jī)策略；更重要的是，這里出現(xiàn)的隨機(jī)性是因?yàn)樾в玫牟▌?dòng)，不必由局中人有意執(zhí)行。

看起來(lái)，似乎這個(gè)模型能夠?yàn)槲覀兊摹岸ɡ怼敝械恼J(rèn)知假設(shè)（3）（6）和（9）提供長(zhǎng)期尋找的正當(dāng)性證明。但是，它這樣做要以什么為代價(jià)呢？它有其他強(qiáng)的假設(shè)來(lái)替代。波動(dòng)效用的觀念使人想起瑟斯頓（L. L. Thurstone）把心理學(xué)變量看作隨機(jī)變量的方法。①參見(jiàn)L. L. Thurstone， “The Prediction of Choice”， Psychometrika， Vol. 10， No. 4， 1945， pp.237—253。這種方法是對(duì)數(shù)學(xué)心理學(xué)的一個(gè)重大貢獻(xiàn)，但大體上，這種方法的一個(gè)公認(rèn)的嚴(yán)重困難是確定這些隨機(jī)變量的分布。②參見(jiàn) D. Laming， Mathematical Psychology， London： Academic Press， 1973， Ch. 2。因此，在一定意義上，海薩尼要求我們的局中人最好成為瑟斯頓式的心理學(xué)家，而不是能干的科學(xué)家。但是，人們并不需要把效用的波動(dòng)解釋為效用的客觀概率不確定性；人們可以把這些波動(dòng)的概率法則解釋為表達(dá)局中人對(duì)彼此的主觀不確定性。然而，接下來(lái)非常神秘的是，為什么關(guān)于局中人i的效用的不確定性對(duì)所有其他局中人而言有著完全相同的形式?，F(xiàn)在，上面的異議并不適用于兩人博弈（因?yàn)橹挥幸粋€(gè)其他局中人）。但是，即使再解釋也無(wú)濟(jì)于事，因?yàn)楦蓴_性博弈的效用函數(shù)被假定為那里的每個(gè)局中人都知道；這就要求對(duì)原初博弈中其他局中人的效用而言，每個(gè)局中人都知道每個(gè)人的概率分布。因此，不管如何解釋，人們很難對(duì)海薩尼的模型③J. C. Harsanyi， “Games with Randomly Disturbed Payoffs： A New Rationale for Mixed-Strategy Equilibrium Points”， pp.1—23.的假設(shè)感到滿意。除此之外，我們還理所當(dāng)然地認(rèn)為，只有在純粹策略下具有均衡點(diǎn)的博弈中，均衡行為才是理性的。

我們不得不絕望于為（3）（6）和（9）尋找某種正當(dāng)性證明嗎？如果我們?cè)谖宜Q的海薩尼斷言界定的領(lǐng)域內(nèi)尋找，即只是在即將到來(lái)的博弈情景中尋找，那我認(rèn)為我們確實(shí)不得不絕望。事實(shí)上，這一部分現(xiàn)在恰恰使我們導(dǎo)向第四節(jié)末尾的困境之中。并且，出口就隱藏在那里：我們沒(méi)必要將局中人的認(rèn)知理性起作用的證據(jù)限制在即將到來(lái)的博弈情境。畢竟，我們也要為假設(shè)（4）（5）（7）和（8）尋找某些支持或證據(jù)，它們也是認(rèn)知假設(shè)（通過(guò)假設(shè)查理相信某些東西）。這里非常清楚的是，一個(gè)局中人對(duì)于他的同伴是理性的并且具有如此這般的效用的信念無(wú)法在給定的博弈情境中獨(dú)自得到證明；不如說(shuō)它只能通過(guò)長(zhǎng)期而豐富的人類經(jīng)驗(yàn)來(lái)獲得（細(xì)節(jié)并不清楚）。因此，這也許是對(duì)（3）（6）和（9）而言合適的證據(jù)領(lǐng)域；特別是一個(gè)局中人可能已經(jīng)處在博弈情境中很多很多次了，他由此可能已經(jīng)形成我們期望他所擁有的信念。實(shí)際上，布朗已經(jīng)通過(guò)虛構(gòu)的博弈提出這個(gè)想法④G. W. Brown， “Iterative Solution of Games by Fictitious Play”， in Activity Analysis of Production and Allocation，edited by T. C. Koopmans， New York： Wiley ﹠ Sons， 1951， pp.374—376.，它與接近兩人零和博弈的均衡點(diǎn)的迭代過(guò)程有關(guān)，這也被稱作布朗—羅賓遜過(guò)程。⑤因?yàn)榱_賓遜已經(jīng)證明布朗的想法是可行的。參見(jiàn)J. Robinson， “An Iterative Method of Solving a Game”，Annals of Mathematics， Second Series， Vol.54， No.2， 1951， pp.296—301；亦參見(jiàn) R. D. Luce ﹠ H. Raiffa，Games and Decisions， New York： Wiley ﹠ Sons， 1957， pp.422ff。讓我們把這個(gè)過(guò)程修改成一個(gè)關(guān)于查理和露西的簡(jiǎn)單理論。

假設(shè)查理和露西開(kāi)展某個(gè)標(biāo)準(zhǔn)形式零和博弈，他們的選擇集合和效用函數(shù)分別由A1和A2、U1=U和U2=—U給定。他們博弈不是一次，而是很多次，甚至可能是無(wú)限多次。但是，他們頭腦簡(jiǎn)單，并不認(rèn)為這種情景是一個(gè)超級(jí)博弈，甚至想不到其他人是理性的并且有如此這般的效用。在每一次博弈中，他們僅僅使他們的預(yù)期效用最大化，而預(yù)期效用是由他們對(duì)他人行動(dòng)的效用函數(shù)和當(dāng)下的主觀概率決定的。盡管如此，他們?nèi)栽谝罁?jù)過(guò)去的經(jīng)驗(yàn)調(diào)整他們的概率，他們?cè)谡J(rèn)知上是理性的。

然而，我們不想如此嚴(yán)格以至于假設(shè)雙方都符合所謂的直接規(guī)則①例如，參見(jiàn) R. Carnap， The Continuum of Inductive Methods， Chicago： University Press， 1952， § 14。，即在n次博弈后他們?cè)趎+1次博弈中對(duì)其他人行動(dòng)的概率與在前n次博弈中他人行動(dòng)的相對(duì)頻率是相同的；通過(guò)假設(shè)這一點(diǎn)，我們恰恰能復(fù)制原初的布朗—羅賓遜過(guò)程。為把正在討論的過(guò)程和建立認(rèn)知理性原則聯(lián)系起來(lái)，我們想要更自由些。

首先，我們假設(shè)他們遵循條件化規(guī)則，就是說(shuō)某人對(duì)事件C在某一時(shí)間點(diǎn)t′的概率Pt′（c）應(yīng)等于他在某一更早時(shí)間點(diǎn)t對(duì)C的條件概率Pt（C/E），其中E是他在t和t′之間收集到的經(jīng)驗(yàn)。這是理性信念變化的最基本規(guī)則。②直接規(guī)則和條件化規(guī)則不相容，也就是說(shuō)，通常沒(méi)有優(yōu)先概率來(lái)衡量是哪個(gè)條件化產(chǎn)生了直接規(guī)則所決定的后驗(yàn)概率。實(shí)際上，這是拒斥直接規(guī)則最強(qiáng)有力的理論根據(jù)。參見(jiàn)R. Carnap， The Continuum of Inductive Methods， § 14。舉例來(lái)說(shuō)，對(duì)查理而言，這意味著經(jīng)過(guò)n次博弈之后，在第n+1次博弈中他對(duì)露西的行動(dòng)的概率是他關(guān)于這些被她在前n次中所作所為條件化的行動(dòng)的先驗(yàn)概率。

其次，為保留直接規(guī)則的優(yōu)點(diǎn)，我們假設(shè)他們滿足所謂的收斂公理或賴欣巴哈公理。舉例來(lái)說(shuō)，這就是說(shuō)對(duì)查理而言，他在第n+1次博弈中對(duì)露西的行動(dòng)的概率和前n次博弈中這些行動(dòng)的相對(duì)頻率之間的不同之處，無(wú)論它們是什么，都收斂到零（對(duì)于n→∞）。這樣一來(lái)，有人可能會(huì)說(shuō)賴欣巴哈公理保證了最后經(jīng)驗(yàn)會(huì)比先驗(yàn)觀念更占優(yōu)勢(shì)；它因此通常被看作認(rèn)知理性的一個(gè)最低要求。③參見(jiàn) W. Stegmüller， Probleme und Resultate der Wissenschaftstheorie und Analytischen Philosophie， Band Ⅳ， Personelle und Statistische Wahrscheinlichkeit， Berlin， Heidelberg： Springer， 1973， pp.502ff。有人可能發(fā)現(xiàn)這會(huì)引起異議：賴欣巴哈公理表達(dá)了主觀概率的極限性質(zhì)但沒(méi)有依此說(shuō)出關(guān)于它們的實(shí)際形式。然而，這里有概率的“實(shí)際”性質(zhì)，眾所周知，最為著名的對(duì)稱性就隱含賴欣巴哈公理。參見(jiàn)R. Carnap ﹠ R. C. Jeffrey，（eds）， Studies in Inductive Logic and Probability， Vol.Ⅰ， Berkeley： University of California Press， 1971， parts 4 and 5。

現(xiàn)在，如果查理和露西有這么多認(rèn)知理性和行動(dòng)理性，如果原初博弈恰好有一個(gè)均衡點(diǎn)包括查理的（混合的或純粹的）策略S1和露西的策略S2，那么我們有：對(duì)每個(gè)a∈A1，查理在所描述的博弈過(guò)程中選擇a的相對(duì)頻率收斂于a在S1中出現(xiàn)的概率。這同樣適用于露西。由此，查理也傾向于發(fā)展關(guān)于露西的適當(dāng)信念（3），反之對(duì)露西也是同樣。④所有這些都容易被證明；羅賓遜關(guān)于布朗—羅賓遜過(guò)程的證明只不過(guò)拓展了我們稍微自由化的版本。如果應(yīng)該有超過(guò)一個(gè)的均衡點(diǎn)，那么一個(gè)更加復(fù)雜但相當(dāng)令人滿意的命題就是真的。參見(jiàn)J. Robinson， “An Iterative Method of Solving a Game”， pp.296—301。然而，與布朗—羅賓遜過(guò)程相反的是，這里關(guān)于收斂比率沒(méi)什么可說(shuō)，因?yàn)橘囆腊凸黻P(guān)于收斂比率沒(méi)有假設(shè)任何東西。因此，在給定的具體情形中，這個(gè)理論滿足了我們?cè)谇懊嬗懻撝挟a(chǎn)生的所有要求。

再重復(fù)一遍，我關(guān)于這個(gè)（數(shù)學(xué)上簡(jiǎn)單明了的）布朗—羅賓遜過(guò)程的自由化版本中的觀點(diǎn)，不是要提醒我們像布朗—羅賓遜觀點(diǎn)的直觀吸引力這樣的東西；那是多余的。相反，如果我們想要為（3）（ 6）和（9）這樣的認(rèn)知前提找到合理的理論根據(jù)，就必須要講一些這樣的理論；而如果這些前提是無(wú)懈可擊的，反過(guò)來(lái)，它們就必定包含在博弈論的理論化之中。之所以是這樣，因?yàn)橹挥羞@些關(guān)于博弈學(xué)習(xí)過(guò)程的理論才能夠提供一種把認(rèn)知上理性的局中人導(dǎo)向（3）（ 6）和（9）等信念證據(jù)的理論解釋——正如我論證過(guò)的那樣，這種證據(jù)不可能在給定的博弈情境中獨(dú)自發(fā)現(xiàn)。

有人可能反對(duì)說(shuō)，有很多方式可以達(dá)到信念（3）（ 6）和（9）——最簡(jiǎn)單的方式是一個(gè)顧問(wèn)式博弈理論家（也許通過(guò)敘述第三節(jié)的標(biāo)準(zhǔn)理論）告訴局中人要做什么和信什么，并且局中人也相信他。當(dāng)然，這是可能并且經(jīng)常走的一條路。但這對(duì)博弈理論家沒(méi)有絲毫幫助：首先，他不想要將他的理論限制在受他啟發(fā)的人們上；其次，它肯定根本沒(méi)有任何關(guān)于他和局中人之間交際的交流理論，即沒(méi)有關(guān)于這種達(dá)到信念（3）（ 6）和（9）的方法的理論。

另一方面，必須承認(rèn)的是，博弈學(xué)習(xí)過(guò)程理論的前景還未成形。布朗—羅賓遜過(guò)程及其自由化是良好的典范，但它幾乎沒(méi)有擴(kuò)展到兩人零和博弈之外的范圍。①參見(jiàn)J. Rosenmüller， “über Periodizit?tseigenschaften spieltheoretischer Lernprozesse”， Zeitschrift für Wahrscheinlichkeitstheorie， Vol.17， No.4， 1971， pp.259—308。不過(guò)，布朗—羅賓遜過(guò)程的假設(shè)卻相當(dāng)差；在那里我們的查理和露西甚至沒(méi)有被當(dāng)作真正的博弈論主體來(lái)看待，因?yàn)楦鶕?jù)這些假設(shè)，他們每個(gè)人都必須把他人看作某種不規(guī)則的骰子，它以這面或那面朝上落地的傾向必須被發(fā)現(xiàn)。因此，自然的觀點(diǎn)是通過(guò)把查理和露西看作博弈論主體，即通過(guò)讓他們知道其他人的效用并讓他們對(duì)其他人的認(rèn)知狀態(tài)進(jìn)行理論化，來(lái)豐富博弈學(xué)習(xí)過(guò)程的假設(shè)。無(wú)論這樣的假設(shè)是否會(huì)在更一般的博弈而非僅僅兩人零和博弈中使博弈學(xué)習(xí)過(guò)程得到想要的結(jié)果，這都是一個(gè)非常開(kāi)放的問(wèn) 題。

總而言之，沒(méi)有更為具體的結(jié)果，但至少一般的寓意可從前面的討論中得出。嚴(yán)格區(qū)分行動(dòng)理性和認(rèn)知理性。如果你關(guān)心的是行動(dòng)理性，那么就為你的對(duì)象設(shè)計(jì)完全決策模型，并通過(guò)預(yù)期效用最大化規(guī)則來(lái)確定理性行動(dòng)；如果僅僅這些不能使你滿意，如果你要尋找一些對(duì)寫(xiě)入決策模型的認(rèn)知假設(shè)的解釋，那就盡可能根本地并且盡可能廣泛可接受地嚴(yán)格堅(jiān)持認(rèn)知理性的一些規(guī)則。否則，就會(huì)有理論上和根基上混亂的危險(xiǎn)。②衷心感謝萊因哈德·澤爾騰教授的鼓勵(lì)和合理的懷疑態(tài)度，感謝烏爾里克·哈斯和安德雷斯·科莫林的促成和安排，感謝克拉拉·塞內(nèi)卡對(duì)我的英文的核對(duì)，感謝《理論與決策》的全體成員，因?yàn)樗蛭冶砻鬟@篇文章對(duì)一些人而言可能是值得一讀的。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

怎樣理解博弈論①

一、對(duì)現(xiàn)狀的不滿

二、怎樣理解博弈論