基于信念變化的蜈蚣博弈悖論解悖探析

2016-09-14 08:36張峰趙緒濤

深圳大學(xué)學(xué)報(bào)（人文社會(huì)科學(xué)版） 2016年2期

關(guān)鍵詞：局中人蜈蚣歸納法

張峰，趙緒濤

（1.北京理工大學(xué)，北京 100081；2.中國(guó)人民大學(xué)，北京 100872）

基于信念變化的蜈蚣博弈悖論解悖探析

張峰1，趙緒濤2

（1.北京理工大學(xué)，北京 100081；2.中國(guó)人民大學(xué)，北京 100872）

逆推歸納法是研究完美信息動(dòng)態(tài)博弈的常用方法，通過(guò)完全歸納得到必然結(jié)論，但用于分析蜈蚣博弈時(shí)理論預(yù)測(cè)與人們的實(shí)際博弈行為發(fā)生偏離，導(dǎo)致悖論。蜈蚣博弈的結(jié)構(gòu)精致而復(fù)雜，局中人對(duì)博弈收益情況的權(quán)衡以及局中人試圖在非合作的博弈機(jī)制中進(jìn)行合作的主觀傾向，影響了局中人決策時(shí)的信念變化?，F(xiàn)實(shí)中的主體并不具有絕對(duì)理性，伴隨信念變化的主觀感受是主體相信自己的決策合理的決定性因素。一種新的解悖思路是考察局中人信念變化并將主觀感受計(jì)入收益，進(jìn)而分析和預(yù)測(cè)博弈的結(jié)果。

逆推歸納法；蜈蚣博弈；悖論；信念

逆推歸納法是博弈論及博弈邏輯研究中的一種常用的方法，由策梅洛（E.Zermelo）在討論象棋博弈問(wèn)題時(shí)首先使用，后經(jīng)澤爾騰（R.Selten）完善及推廣。逆推歸納法主要用于求解完全且完美信息動(dòng)態(tài)博弈。完全且完美信息動(dòng)態(tài)博弈的特點(diǎn)是，兩個(gè)或多個(gè)局中人輪流博弈，局中人完全了解全部局中人任何決策可能導(dǎo)致的收益情況，并且局中人在進(jìn)行每一次決策時(shí)完全知道之前階段中自己和對(duì)手的策略。逆推歸納法從動(dòng)態(tài)博弈的最后一個(gè)階段開(kāi)始分析，向后推理、逐步倒推，直到博弈開(kāi)始階段局中人的決策。逆推歸納法是完全歸納推理，結(jié)論是必然的。然而這種邏輯嚴(yán)密的推理方法得到的預(yù)測(cè)或結(jié)果與現(xiàn)實(shí)中的博弈行為往往不一致，這就是“逆推歸納法悖論”的基本內(nèi)涵。

逆推歸納法悖論的典型案例有連鎖店悖論，有限重復(fù)囚徒困境、蜈蚣博弈悖論等。真正引起人們對(duì)逆推歸納法悖論極大關(guān)注的是羅森塔爾（R. Rosenthal）首先研究的蜈蚣博弈悖論[1]。逆推歸納法悖論是一種合理行為悖論，體現(xiàn)的是博弈論推理與人們實(shí)際行動(dòng)的矛盾，這種矛盾無(wú)疑對(duì)博弈理論的合理性提出了挑戰(zhàn)。

一、蜈蚣博弈的逆推歸納法分析及悖論

蜈蚣博弈悖論屬于典型的逆推歸納法悖論，運(yùn)用逆推歸納法分析博弈所得到的結(jié)果與人們的直覺(jué)不一致，并且與實(shí)驗(yàn)及現(xiàn)實(shí)博弈結(jié)果均發(fā)生了偏離[2]。

圖1　蜈蚣博弈的原始模型

羅森塔爾在1981年的文獻(xiàn)[3]中給出了3個(gè)完美信息動(dòng)態(tài)博弈的模型，其中之一便是蜈蚣博弈的原始模型，如圖1所示；后來(lái)賓默（K.Binmore）進(jìn)行了擴(kuò)展，研究了有100個(gè)博弈階段的情況，他將這種博弈形象地稱為“蜈蚣”博弈[4]。

蜈蚣博弈的原始模型是一個(gè)10階段的完美信息2人動(dòng)態(tài)博弈，兩個(gè)局中人輪流決策，并且都知道博弈結(jié)構(gòu)的信息，前一輪的決策可以在之后階段觀察到。局中人A、B在博弈中的決策為“獲取”或者“放棄”收益，本例中收益為錢。博弈由A開(kāi)始，如果A選擇獲取，博弈結(jié)束，A、B都得到0元。如果A選擇放棄，決策權(quán)就交到B手里。如果B選擇獲取，則博弈結(jié)束，A交出1元（收益為-1），B得到3元，等等，最后一個(gè)階段，無(wú)論B選擇放棄和獲得博弈都會(huì)結(jié)束，如果B選擇獲得，A得到7元，B得到11元；選擇放棄，A得到10元，B得到10元。

A、B會(huì)如何決策？運(yùn)用逆推歸納法進(jìn)行推理，在理性人假設(shè)的前提下，顯然B在最后階段會(huì)選擇獲得，他得到11元。但是要到達(dá)這個(gè)階段，需要A在第9階段選擇放棄。A在第9階段會(huì)怎么決策？A會(huì)選擇獲取。因?yàn)槿绻鸄不獲取，進(jìn)入第10階段由B決策，B肯定會(huì)選擇對(duì)自己有利的決策即“獲取”，這樣的結(jié)果是A的收益只有7元，而如果A選擇獲取的收益是8元，因此A在第9階段自然會(huì)選擇獲取。同樣道理，在博弈的每個(gè)階段，有決策權(quán)的一方都會(huì)為了防止下一個(gè)階段對(duì)方作出不利于自己的選擇而結(jié)束博弈。用逆推歸納法的結(jié)論就是，這個(gè)博弈不可能進(jìn)行，必然會(huì)在第1階段就結(jié)束。也就是A先決策，選擇獲取，得到0元，B得到0元。B并沒(méi)有作出決策。

然而，只要渡過(guò)第兩個(gè)階段，無(wú)論如何A得到的收益都會(huì)比第1階段結(jié)束博弈獲得的收益多。按照逆推歸納法的預(yù)測(cè)，A將無(wú)視第1階段之后可能得到的更大收益而直接結(jié)束博弈，雙方取得0收益。但是不論在直覺(jué)上，還是在實(shí)驗(yàn)或現(xiàn)實(shí)中的這種博弈，A大都不會(huì)立刻結(jié)束博弈，這與運(yùn)用逆推歸納法分析預(yù)測(cè)的第1階段結(jié)束博弈是不一致的[5]，嚴(yán)密的理論預(yù)測(cè)與實(shí)際情況不符，這就是蜈蚣博弈悖論。通過(guò)分析可知，蜈蚣博弈的特點(diǎn)是：2人（2個(gè)個(gè)體或2個(gè)集體，如伯恩斯坦（G.Bornstein）的6階段蜈蚣博弈[6]中即為2個(gè)集體）完美信息動(dòng)態(tài)博弈；局中人可選策略相同；博弈各階段收益按一定規(guī)律排列；運(yùn)用逆推歸納法分析得到的結(jié)果是第1階段博弈結(jié)束。

蜈蚣博弈收益的主要特點(diǎn)是：蜈蚣博弈的每?jī)蓚€(gè)階段上，當(dāng)前的階段有決策權(quán)局中人在當(dāng)前階段上的收益大于等于下一階段收益，而對(duì)手的收益小于等于下一階段的收益。如圖2所示：

圖2　蜈蚣博弈原始模型的單一階段分析

框圖I中，在A有決策權(quán)的第1階段，局中人收益為：A收益0，B收益0；下一階段A收益-1，B收益3。顯然，當(dāng)前階段有決策權(quán)的局中人（局中人的A）收益與下一階段的收益關(guān)系有：0>-1，對(duì)手（局中人B）兩個(gè)階段的收益關(guān)系有：0<3；框圖II中，當(dāng)前階段有決策權(quán)的局中人（局中人的B）收益與下一階段的收益關(guān)系有：3>2，對(duì)手（局中人A）兩個(gè)階段的收益關(guān)系有：-1<2；框圖III、IV中有類似關(guān)系。

這樣，顯然在某一個(gè)階段上，按照逆推歸納法推理，有決策權(quán)的局中人會(huì)選擇拿走收益。而著眼于整個(gè)博弈，雖然之后階段的收益可能遠(yuǎn)遠(yuǎn)大于第1階段。這恰是蜈蚣博弈收益規(guī)律的巧妙之處，將每一個(gè)階段的關(guān)系糾纏起來(lái)，從而增加了博弈理性分析的復(fù)雜程度。當(dāng)局中人面對(duì)蜈蚣博弈的時(shí)候，很可能無(wú)法將整個(gè)博弈機(jī)制分析透徹，博弈的復(fù)雜程度大大復(fù)雜化了局中人以對(duì)決策的分析，從而使得局中人在短時(shí)間內(nèi)無(wú)法得到合理的決策，或者主觀上不想進(jìn)行如此復(fù)雜的分析而僅僅作出能夠滿足當(dāng)前意愿的決策。可見(jiàn)，之前階段的高收益更多的只是假象，在此之間尚有許多無(wú)法逾越的決策階段，理性人假設(shè)確保了在每一個(gè)決策階段上局中人都會(huì)拿走收益使博弈結(jié)束。

A第1階段的決策決定了整個(gè)博弈。如果A在第1階段結(jié)束博弈，那么B沒(méi)有機(jī)會(huì)進(jìn)行決策。按照逆推歸納法進(jìn)行分析，蜈蚣博弈必然在第1階段結(jié)束。這樣，博弈就轉(zhuǎn)化為單人決策問(wèn)題，考察局中人A的決策如何作出，可以對(duì)為什么會(huì)出現(xiàn)蜈蚣博弈悖論找到可信的回答。

二、決策者的信念變化是蜈蚣博弈悖論的主要原因

蜈蚣博弈的逆推歸納法預(yù)測(cè)和現(xiàn)實(shí)不相符，其主要原因是由于局中人并不是完全理性人，博弈的收益信息和局中人身份為主的各種主觀信息會(huì)影響局中人做出決策時(shí)的信念，進(jìn)而影響了局中人的決策內(nèi)容，造成實(shí)際博弈的結(jié)果與理論預(yù)測(cè)的結(jié)果發(fā)生偏離。主體做出任何一個(gè)決策，無(wú)論其對(duì)所接受和理解的信息進(jìn)行了怎樣的處理，最終做出決策的時(shí)候，都可以歸結(jié)到這樣一種信念：由于這些原因，我將做出這種決策。決策是一個(gè)客觀的行為，扼要地說(shuō)，主體的思維的結(jié)果通過(guò)神經(jīng)系統(tǒng)和軀體反映到客觀世界。因此，主體做出決策的最終原因，是主體具有與這種決策相應(yīng)的主觀信念或主觀的認(rèn)知狀態(tài)。

所謂的信念影響決策，其實(shí)是完善理性人假設(shè)研究進(jìn)路的一種?，F(xiàn)實(shí)人畢竟不可能是完全理性人，支配其作出某種決策的不只是理性的分析，主觀信念的傾向有時(shí)候在決策影響因素中往往是決定性的。因?yàn)闆Q策這個(gè)行為，畢竟是主觀權(quán)衡后的客觀結(jié)果。

考察蜈蚣博弈中局中人決策時(shí)的信念狀態(tài)，無(wú)論是何種原因?qū)е戮种腥俗龀鰶Q策，在蜈蚣博弈的每個(gè)階段，局中人有兩個(gè)決策：“放棄”和“獲取”，局中人選擇“放棄”時(shí)，一定是因?yàn)樗J(rèn)為應(yīng)該選擇“放棄”（如果他徹底的執(zhí)行了他的決策計(jì)劃）。導(dǎo)致其產(chǎn)生這種信念的原因，包括利他主義、收益差距的不同、理性的分析、預(yù)期收益、信任的偏好、學(xué)習(xí)能力、對(duì)對(duì)手身份的考慮和權(quán)衡等。局中人在做出決策的時(shí)候，他有充分的理由來(lái)認(rèn)定所做出的決策，他具備了做出此種決策的信念。綜合所有的理由和原因，他原有的信念修正為此決策對(duì)應(yīng)的信念，這種信念進(jìn)而影響了他的實(shí)際決策。

蜈蚣博弈局中人的信念變化過(guò)程可用下圖表示：

圖3　局中人在蜈蚣博弈中的信念變化

將視角關(guān)注于與主體參與博弈這個(gè)事件過(guò)程上，主體在參與博弈之前，有一個(gè)初始的信念狀態(tài)，這個(gè)狀態(tài)表示的是主體信念的一種平衡狀態(tài)，其內(nèi)容包括的是主體在過(guò)去所獲得和積累的普遍知識(shí)，以及主體在處理事件時(shí)的一般偏好和傾向。在接受了博弈的相關(guān)信息之后，信念狀態(tài)發(fā)生了相應(yīng)變化，到達(dá)在博弈初始時(shí)的信念狀態(tài)，主體對(duì)博弈相關(guān)信息的接受和理解通過(guò)權(quán)衡和思考掌握和了解了博弈局勢(shì)，并對(duì)接下來(lái)的博弈做出了決策或行為的整體計(jì)劃。在博弈的過(guò)程中，與對(duì)手發(fā)生互動(dòng)，從而不斷地修正或更新自己的信念狀態(tài)，進(jìn)而調(diào)整后續(xù)的決策或行為的計(jì)劃。

而在理性人假設(shè)和公共知識(shí)假設(shè)下，局中人具有完全的理性，參與博弈的過(guò)程可以用圖4表示：

圖4　具有完全理性的主體的博弈過(guò)程

對(duì)比兩種思考，顯然，如果不考慮主體信念的變化過(guò)程，主體參與博弈將變成一個(gè)靜態(tài)的毫無(wú)變化的決策過(guò)程，這個(gè)過(guò)程由逆推歸納法在邏輯上得到了唯一的確定的結(jié)果。

三、將主體的主觀感受計(jì)入收益的一般性框架

主體的個(gè)性差別或稱異質(zhì)性導(dǎo)致主體的認(rèn)知水平或認(rèn)知狀態(tài)是不同的，顯然無(wú)法確保特定的認(rèn)知分析對(duì)所有主體具有一致性。將主體的主觀感受計(jì)入收益的一般性框架，為蜈蚣博弈悖論提供了一種新的解悖思路。

目前，有些學(xué)者將主體的主觀感受在某種前提假設(shè)下折算為收益，計(jì)入蜈蚣博弈的總收益，從而建立模型分析和預(yù)測(cè)博弈結(jié)果。

羅森塔爾提出“主觀概率”（subjective probability）概念來(lái)分析蜈蚣博弈[4]。博弈中局中人1應(yīng)該達(dá)到某種對(duì)局中人2的策略選擇的主觀概率分布，如果選擇繼續(xù)博弈所帶來(lái)的預(yù)期收益超過(guò)其選擇結(jié)束博弈的固定收益，那么局中人1將選擇繼續(xù)博弈。主觀概率是一個(gè)與收益差別有關(guān)的概念，D為局中人當(dāng)前階段和下階段的收益的差別，兩個(gè)選擇中較好的那個(gè)的概率為min（1，0.5+0.4D），其中0.4為羅森塔爾為解釋模型所提出的一個(gè)系數(shù)。在最后一個(gè)節(jié)點(diǎn)上，局中人2選擇向下的概率為1，但是按照主觀概率的預(yù)測(cè)方法，他選擇向下的概率為0.9，選擇向右為0.1。在倒數(shù)第兩個(gè)節(jié)點(diǎn)上，局中人1選向右得到的收益為，向下收益為8，向下的概率為，向右的概率為。在倒數(shù)第三個(gè)節(jié)點(diǎn)，局中人2向下為收益為9，向右的收益為兩種情況，如果局中人2認(rèn)為他自己不會(huì)犯錯(cuò)誤，那么收益為；如果他將錯(cuò)誤決策的產(chǎn)生歸因于他自己的行為，那么他的收益為。但是無(wú)論是哪種情況，向右的主觀概率隨著博弈階段的倒推逐漸增長(zhǎng)，在一個(gè)節(jié)點(diǎn)上增長(zhǎng)為1。如圖5所示。

圖5　蜈蚣博弈的主觀概率模型

然而，使用這個(gè)模型分析麥克凱文的4階段蜈蚣博弈實(shí)驗(yàn)數(shù)據(jù)[7]，所得到的概率與實(shí)驗(yàn)得到的數(shù)據(jù)是不相符的，并且大致的規(guī)律和趨勢(shì)也是不同的?？梢?jiàn)這種主觀概率模型并不具有較強(qiáng)的解釋力，其中的系數(shù)0.4更像是為了分析的而提出的。

國(guó)內(nèi)學(xué)者饒育蕾等沿著麥克凱文的利他主義偏好解釋進(jìn)一步研究，將異質(zhì)性利他偏好引入到博弈者的效應(yīng)函數(shù)中，構(gòu)建了基于心理效應(yīng)的隨機(jī)擾動(dòng)的異質(zhì)性利他模型來(lái)擬合蜈蚣博弈實(shí)驗(yàn)數(shù)據(jù)[8]，提出用表示在任意階段s上主體的心理效用。心理效應(yīng)反映了因?yàn)槔盟鶎?dǎo)致的不同策略選擇對(duì)主體效用的沖擊。這個(gè)模型中賦予了的意義是利他偏好的效應(yīng)，但這一項(xiàng)也可能具有其它含義，比如公平、信任、學(xué)習(xí)等行為動(dòng)機(jī)。

一般的博弈分析認(rèn)為，特定博弈所給出的固定收益的差距是導(dǎo)致局中人作出決策的主要原因。這在理性人假設(shè)的前提下是毫無(wú)疑問(wèn)的結(jié)論。但是，理性人假設(shè)并不能完全表述主體的博弈動(dòng)機(jī)。在理性人假設(shè)的基礎(chǔ)上，增加主觀條件，上述的兩個(gè)建模思路所代表的增加某些主觀條件來(lái)分析博弈的方法，正是完善理性人假設(shè)的研究進(jìn)路，但是并沒(méi)有明確的闡述和分析主體究竟為何做出了這樣一個(gè)決策，對(duì)逆推歸納法悖論產(chǎn)生的原因分析得不夠深刻和全面。另一個(gè)困難在于，將主觀感受計(jì)入收益進(jìn)行決策時(shí)，應(yīng)該如何解釋主體決策的合理性？

理解“合理”或判定怎樣是合理行為的原則主要有兩種，一種是“最大期望效益原則”，另一種是“優(yōu)勢(shì)原則”。前者是指，主體的行為應(yīng)獲得主體能從該行為中所期望的最大效益。而優(yōu)勢(shì)原則的含義是，要評(píng)價(jià)一個(gè)行為R是合理的，需要考察兩個(gè)條件：（1）無(wú)論之后發(fā)生什么，對(duì)主體而言采取行為R的結(jié)果不壞于當(dāng)前能夠選擇的其他任何行為；（2）至少有一種可能得到的結(jié)果使主體采取行動(dòng)R比當(dāng)前能選擇的其他行為的結(jié)果更好。

筆者認(rèn)為，作為將主觀感受計(jì)入收益的一般性框架，主體在博弈中的一個(gè)決策是否合理的評(píng)價(jià)標(biāo)準(zhǔn)應(yīng)當(dāng)結(jié)合上述兩種原則：無(wú)論此決策之后博弈的進(jìn)展如何，當(dāng)前階段主體選擇的決策所能得到的期望效應(yīng)不壞于他認(rèn)為是可能的決策得到的期望效應(yīng)，那么這一決策就是理性的。為便于表述，稱之為“期望效益優(yōu)勢(shì)原則”。根據(jù)信念修正的AGM理論，局中人在參與博弈時(shí)的信念狀態(tài)包含具體的命題集合[9]。對(duì)于一個(gè)能夠參與并完成蜈蚣博弈的主體，在參與博弈之前具有平衡的信念狀態(tài)，其信念集包括理解蜈蚣博弈規(guī)則的語(yǔ)言能力；對(duì)蜈蚣博弈中的收益數(shù)值的對(duì)比、計(jì)算能力；基本的推理能力；自我偏好?！巴评砟芰Α迸c“自我偏好”的意義在于，局中人具有期望并能經(jīng)由推理或推測(cè)作出符合期望效益優(yōu)勢(shì)原則的決策。

局中人在作出決策的時(shí)候，他有足夠充分的理由來(lái)認(rèn)定所作出的決策滿足了他的意愿，他具備了作出此種決策的信念。由于蜈蚣博弈的結(jié)構(gòu)和收益以及局中人的自我偏好和對(duì)對(duì)手偏好的推測(cè)，他原有的信念修正為此決策對(duì)應(yīng)的信念。這種信念進(jìn)而影響了他的實(shí)際決策。

信念修正的目的則是使每一個(gè)決策均符合期望效益優(yōu)勢(shì)原則，即做出合理的決策。

現(xiàn)實(shí)人是存在個(gè)體差異的，有著不同的心理情緒狀態(tài)、不同的習(xí)慣和偏好，研究單一個(gè)體的信念具體是如何修正的，不具有普遍意義，并且要做到定量研究極其困難。在蜈蚣博弈中，主體具體的心理變化和信念變化是無(wú)法確定的，唯一可以確定的就是，博弈的結(jié)構(gòu)對(duì)局中人造成了心理和信念的影響，使其對(duì)局勢(shì)有了了解和分析，并修正了自己的信念，作出他認(rèn)為合理的博弈計(jì)劃。可以引入一個(gè)參數(shù)表示各種因素導(dǎo)致的主體信念的修正作用所造成的可以折算為收益的影響。這樣，就可以不具體分析主體信念修正的過(guò)程，而重點(diǎn)考慮信念修正對(duì)博弈行為影響的結(jié)果。

這種分析思路可做如下表述：博弈的某個(gè)階段，局中人A、B收益為（n，m），A、B的信念改變對(duì)決策造成的影響折算為收益記為α，β，A的折合收益為n+α，在局中人A的信念對(duì)決策的影響結(jié)束要做出決策時(shí)，他有“選擇放棄”和“不選擇放棄”兩種信念，如果他認(rèn)為“必須選擇放棄”，則相當(dāng)于α=-∞，n+α將小于其后任何階段A的收益；如果A認(rèn)為“絕不選擇放棄”，則α=+∞，n+α將大于之后任何階段的收益。對(duì)于β可作出類似的分析。這樣，就可以把各種將主體主觀因素折算為收益的模型納入信念改變影響決策的這個(gè)假設(shè)中，只要考慮主觀因素最終使局中人在多大程度上認(rèn)為應(yīng)該“選擇Pass”即可確定α，β的范圍，并最終得出總的收益。這一思路中，需要對(duì)理性人假設(shè)做一些調(diào)整，主體在博弈中的一個(gè)決策是否合理的評(píng)價(jià)標(biāo)準(zhǔn)為：無(wú)論此決策之后博弈的進(jìn)展如何，當(dāng)前階段主體選擇的決策所能得到的期望效應(yīng)不壞于他認(rèn)為是可能的決策得到的期望效應(yīng)，那么這一決策就是理性的。

將主觀感受計(jì)入收益是對(duì)蜈蚣博弈悖論的一種有效解釋，信念修正的思路為這種解釋提供了一個(gè)一般性的探討框架。這一框架的基礎(chǔ)是調(diào)整了的理性人假設(shè)，即期望效益優(yōu)勢(shì)原則；對(duì)博弈過(guò)程的分析應(yīng)采取動(dòng)態(tài)的視角，以信念修正理論考察局中人在博弈不同階段的信念狀態(tài)及信念變化。

對(duì)于一個(gè)博弈，局中人博弈前、博弈開(kāi)始、博弈中的信念狀態(tài)是動(dòng)態(tài)變化的。而信念是構(gòu)成對(duì)理性理解的主要內(nèi)容。由于與博弈相關(guān)的信息持續(xù)的輸入主體的信念集中，主體對(duì)博弈局勢(shì)的分析和把握也是動(dòng)態(tài)變化的。信念的改變事實(shí)上決定了博弈策略，解決蜈蚣博弈悖論的一個(gè)新思路是將導(dǎo)致信念變化的主觀感受折算為收益，這較為符合人們進(jìn)行博弈的實(shí)際情況。

[1]Robert J.Aumann.On the Centipede Game[J].Games and Economic Behavior,1998，(23):97-105.

[2]謝識(shí)予.經(jīng)濟(jì)博弈論[M].上海:復(fù)旦大學(xué)出版社,2007.162-164.

[3]RobertW.Rosenthal.GamesofPerfectInformation, Predatory Pricing and the Chain-Store Paradox[J].Journal of Economic Theory,1981，(25):92-100.

[4]Ken Binmore.Game Theory and Social Contract[M].MIT Press，1993.20-29;230-134.

[5]張峰.逆推歸納法悖論探析[J].福建論壇(人文社會(huì)科學(xué)版)，2004，(12):78-81.

[6]GaryBornstein,TamarKugler,AnthonyZiegelmeyer. Individual and group Decisions in the centipede game:Are groups more“rational”players?[J].Journal of Experimental Social Psychology,2004,40(5):299-605.

[7]Richard D.McKelvey;Thomas R.Palfrey.An Experimental Study of the Centipede Game[J].Econometrica,1992，(60)4: 803-836.

[8]饒育蕾,張媛，彭疊峰.利他偏好是否導(dǎo)致博弈均衡的偏離——對(duì)蜈蚣博弈實(shí)驗(yàn)的解釋[J].系統(tǒng)管理學(xué)報(bào)，2010，19 (6):666-683.

[9]Alchourron,C.E.,Gardenfors,P,Makinson,D.On the logic of theory change:partial meet contraction and revision functions [J].Journal of Symbolic Logic,1985,50(2):510-530.

【責(zé)任編輯：來(lái)小喬】

Centipede Game Paradox Solution Based on Belief Changes

ZHANG Feng1,ZHAO Xu-tao2
(1.Beijing Institute of Technology，Beijing 100081;2.Renmin University of China，Beijing 100872)

Backward induction is a common method to analyze the dynamic game with perfect information and draw inevitable conclusions with complete induction.However,when used to analyze the centipede game,the theoretical prediction deviates from the actual behaviors in real games,resulting in paradox.The centipede game has an intricate and delicate structure.Players deliberate the payoffs and intend to cooperate in the noncooperative game,which influence their belief change when making decisions.Subjects do not have absolute rationality in reality,the subjective sensation along with belief change determines whether or not the subject believes his decision is rational.According to the theory of belief revision,a general analytical framework can be constructed to describe causes of the decision making in the centipede game.

backward induction;centipede game;paradox;belief

B 0

1000－260X（2016）02-0059-05

2016-01-10

國(guó)家社會(huì)科學(xué)基金項(xiàng)目“大數(shù)據(jù)視域下科學(xué)方法創(chuàng)新研究”（15BZX040）

張峰，哲學(xué)博士，北京理工大學(xué)副教授，主要從事現(xiàn)代邏輯、科學(xué)方法論研究；趙緒濤，中國(guó)人民大學(xué)博士研究生，主要從事科學(xué)哲學(xué)研究。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

基于信念變化的蜈蚣博弈悖論解悖探析

一、蜈蚣博弈的逆推歸納法分析及悖論

二、決策者的信念變化是蜈蚣博弈悖論的主要原因

三、將主體的主觀感受計(jì)入收益的一般性框架

三、將主體的主觀感受計(jì)入收益的一般性框架