重復(fù)博弈現(xiàn)象分析

2016-10-11 13:27段俞戎

科技視界 2016年24期

段俞戎

【摘要】囚徒困境這一現(xiàn)象在日常決策中越來越常見，這是一種博弈心理的體現(xiàn)，同時(shí)，為減弱囚徒困境的影響，在很多情況下人們采用重復(fù)博弈這一方法。為了確切證明博弈這種現(xiàn)象的真實(shí)存在并分析其發(fā)生機(jī)制，實(shí)驗(yàn)選取山東師范大學(xué)24名學(xué)生進(jìn)行相關(guān)實(shí)例的測(cè)驗(yàn)，并對(duì)數(shù)據(jù)進(jìn)行比較分析，得出結(jié)論：重復(fù)博弈中人們確實(shí)更傾向于選擇合作策略，但是在高收益面前，人們也有可能會(huì)選擇背叛。

【關(guān)鍵詞】囚徒困境；博弈；風(fēng)險(xiǎn)與收益

0 引言

決策中的博弈論與博弈心理在當(dāng)今時(shí)代越來越受到重視，對(duì)其的研究也有利于深入了解人們的決策心理并理解人們某些行為背后的實(shí)際意義。博弈是指在一定的游戲規(guī)則約束下，基于直接相互作用的環(huán)境條件，各參與人依靠所掌握的信息，選擇各自策略（行動(dòng)），以實(shí)現(xiàn)利益最大化和風(fēng)險(xiǎn)成本最小化并權(quán)衡不同決策主體之間決策的的過程。簡(jiǎn)單說就是人與人之間為了謀取利益而競(jìng)爭(zhēng)。在博弈論中，以“囚徒困境”博弈模型最為著名。該模型講述了一個(gè)警察與小偷的故事。兩個(gè)嫌疑犯作案后被警察抓住，分別關(guān)在不同的屋子里接受審訊。警察知道兩人有罪，但缺乏足夠的證據(jù)。警察告訴每個(gè)人：如果兩人都抵賴，各判刑一年；如果兩人都坦白，各判八年；如果兩人中一個(gè)坦白而另一個(gè)抵賴，坦白的放出去，抵賴的判十年。于是，每個(gè)囚徒都面臨兩種選擇：坦白或抵賴。然而，不管同伙選擇什么，每個(gè)囚徒的最優(yōu)選擇是坦白：如果同伙抵賴、自己坦白的話放出去，抵賴的話判一年，坦白比不坦白好；如果同伙坦白、自己坦白的話判八年，比起抵賴的判十年，坦白還是比抵賴的好。根據(jù)上述描述，我們可以知道兩人同時(shí)選擇抵賴對(duì)于共同利益來說是最好的。而在多項(xiàng)研究中都表明，很少有人會(huì)選擇抵賴而與對(duì)方達(dá)成合作并得到最優(yōu)效果。這就是囚徒困境的存在，為了自己的利益達(dá)到最大化，大多數(shù)人會(huì)選擇背叛而非合作。囚徒的兩難境地確實(shí)抓住了自己效益最大化、不信任和需要相互防范背叛這種真實(shí)的一面。

重復(fù)博弈是指同樣結(jié)構(gòu)的博弈重復(fù)多次，其中的每次博弈稱為階段博弈。以囚徒困境為例，如果囚徒的罪行較輕，每次判刑都不是很嚴(yán)重，那么兩個(gè)囚徒在刑滿釋放之后再作案，作案之后再判刑，釋放之后在作案，如此周而復(fù)始，他們之間進(jìn)行的就是重復(fù)博弈，其中每次作案和判刑是階段博弈（周厚虎，2008）。在重復(fù)的囚徒困境中，博弈被反復(fù)地進(jìn)行。因而每個(gè)參與者都有機(jī)會(huì)去“懲罰”另一個(gè)參與者前一回合的不合作行為。這時(shí)，合作可能會(huì)作為均衡的結(jié)果出現(xiàn)。欺騙的動(dòng)機(jī)這時(shí)可能被懲罰的威脅所克服，從而可能導(dǎo)向一個(gè)較好的、合作的結(jié)果。因此，可以抵消單次囚徒困境的影響。

根據(jù)以上敘述，本次研究旨在驗(yàn)證博弈論中囚徒困境的存在并分析其發(fā)生的心理機(jī)制并提出兩個(gè)假設(shè)。研究假設(shè)：重復(fù)博弈可以抵消單次囚徒困境的影響使人們的行為趨向合作并得到最優(yōu)的共贏結(jié)果。

1 方法

1.1 被試

24名山東師范大學(xué)心理學(xué)院2013級(jí)卓心本的學(xué)生，男生2名，占8.33%；女生22名，占91.67%。平均年齡21歲（SD=0.68），智力正常，心理狀況良好，雙耳聽力正常。

1.2 實(shí)驗(yàn)儀器與材料

問題情境：兩兩一組，共紅、藍(lán)兩種顏色可以選擇，同時(shí)選紅色兩隊(duì)各積3分，同時(shí)選藍(lán)色則各扣3分，當(dāng)顏色選擇不一致時(shí)，選紅色的扣6分，而選藍(lán)色的積6分。

實(shí)驗(yàn)記錄紙

1.3 實(shí)驗(yàn)設(shè)計(jì)

將24人分為4個(gè)小組（A、B、C、D），每小組6人，AB為對(duì)抗組，CD為對(duì)抗組。采用重復(fù)博弈，共進(jìn)行8次結(jié)構(gòu)相同的博弈，每四次結(jié)束后兩小組可選擇進(jìn)行討論或者不進(jìn)行討論。之后的2次博弈將獎(jiǎng)勵(lì)與懲罰分?jǐn)?shù)翻倍。

1.4 實(shí)驗(yàn)程序

首先將24名被試分為4個(gè)小組（A、B、C、D），每小組6人，AB為對(duì)抗組，CD為對(duì)抗組。其次，告知被試指導(dǎo)語：你們小組可以選取紅、藍(lán)其中一種顏色，當(dāng)兩組同時(shí)選紅色時(shí)兩隊(duì)各積3分，同時(shí)選藍(lán)色則各扣3分，當(dāng)顏色選擇不一致時(shí)，選紅色的扣6分，而選藍(lán)色的積6分，請(qǐng)小組討論后決定。再次，進(jìn)行重復(fù)實(shí)驗(yàn)8次，每階段實(shí)驗(yàn)結(jié)束后公布得分結(jié)果，每四次組間可選擇討論。然后，告知被試最后兩次實(shí)驗(yàn)獎(jiǎng)勵(lì)與懲罰分?jǐn)?shù)翻倍，按上述程序進(jìn)行實(shí)驗(yàn)。最后，宣布實(shí)驗(yàn)結(jié)束，公布最終實(shí)驗(yàn)結(jié)果，得分為0分以上判定為贏。

2 結(jié)果

根據(jù)得分統(tǒng)計(jì)匯總表（表2）可以看出，A組得分最高，為+9分；其次是B組與D組，為-3分；最后是C組，為-15分。而在四組之中，只有A組的成績(jī)?yōu)檎?，另外三組成績(jī)均為負(fù)值。AB對(duì)抗組獲勝的是A組，CD對(duì)抗組獲勝的是D組，四組中間獲勝的是A組。

由圖1可以看出，第1輪，兩組的決策結(jié)果對(duì)A組優(yōu)于B組，從第2輪開始，A、B兩組的選擇趨于納什平衡，在第4輪，兩組沒有進(jìn)行交流，得分也未出現(xiàn)變化，一直到第8輪打破這種平衡，兩組得分均趨向于不利方向。A、B兩組除最開始一次外，得分情況趨近一致，均為背叛1—合作6—背叛3。

由圖2可以看出，C、D兩組第1輪的決策結(jié)果對(duì)兩組均不利，第3輪兩組決策結(jié)果對(duì)D組優(yōu)于C組，第4輪趨于納什平衡，兩組選擇交流過后，第5輪仍處于平衡狀態(tài)，在第6輪時(shí)打破，決策結(jié)果利于C組，第七輪又達(dá)到平衡，第8輪決策結(jié)果利于D組，第9輪開始，兩組的決策結(jié)果均趨向于不利方向。C、D兩組選擇相差較大，得分情況一直處于起伏不定的狀態(tài)。

根據(jù)得分匯總表整理繪制折線圖如下：

3 討論

根據(jù)整個(gè)實(shí)驗(yàn)程序的設(shè)計(jì)，組間有討論機(jī)會(huì)，每次成績(jī)進(jìn)行公布，我認(rèn)為此次實(shí)驗(yàn)為重復(fù)博弈的一個(gè)實(shí)驗(yàn)。重復(fù)博弈是指同樣結(jié)構(gòu)的博弈重復(fù)多次，在重復(fù)的囚徒困境中，博弈被反復(fù)地進(jìn)行。因而每個(gè)參與者都有機(jī)會(huì)去“懲罰”另一個(gè)參與者前一回合的不合作行為，使對(duì)方失分。這時(shí)，合作可能會(huì)作為均衡的結(jié)果出現(xiàn)。欺騙的動(dòng)機(jī)這時(shí)可能被懲罰的威脅所克服，從而可能導(dǎo)向一個(gè)較好的、合作的結(jié)果。因此，可以抵消單次囚徒困境的影響。在此次實(shí)驗(yàn)中就有所體現(xiàn)，實(shí)驗(yàn)不是只進(jìn)行一次，而是連續(xù)進(jìn)行多次，中間還有兩個(gè)組之間的討論時(shí)間，也就是說，一次結(jié)果之后你可以知道對(duì)方組是否背叛了你（與小組討論不一致），因此，在下一次中你就可以對(duì)他給予懲罰，而由于這種方式，使得每個(gè)組不管是礙于面子還是為了贏，最終的選擇可能都是合作，以達(dá)到雙贏的局面。同時(shí)，Wedekind C（1998）的研究也證明重復(fù)多次的選擇通常會(huì)導(dǎo)致更多的合作。

由表2可以看出，在本次實(shí)驗(yàn)中，雖然沒有很明顯的體現(xiàn)出博弈達(dá)成雙贏的局面，但重復(fù)博弈仍起到了一定的作用，與假設(shè)大致相符。這種現(xiàn)象在AB、CD組中均有體現(xiàn)，前4次博弈中，第一次博弈時(shí)，A組為了自己的利益，同時(shí)又不信任B組，未選擇合作策略，而其發(fā)現(xiàn)B組選擇了合作策略，因?yàn)閼峙轮驜組的報(bào)復(fù)（背叛），又想繼續(xù)得分，于是在之后的三次中均選擇合作，這就是重復(fù)博弈優(yōu)勢(shì)的體現(xiàn)，因?yàn)楹ε聦?duì)方的懲罰，又發(fā)現(xiàn)對(duì)方第二次、第三次均未背叛自己（選藍(lán)色），因此，雙方形成共贏的局面。中間討論時(shí)間，兩組拒絕交流，但因?yàn)橛兄靶纬傻摹捌跫s”在，而且雙方均擔(dān)心過早背叛會(huì)收到對(duì)方懲罰，影響之后的分?jǐn)?shù)，所以雙方后四次博弈中，第一次仍然選擇了合作，這時(shí)雙方發(fā)現(xiàn)對(duì)方都沒有選擇背叛，因此不用擔(dān)心來自對(duì)方懲罰，達(dá)到雙贏，于是在之后的兩次博弈中也選擇了合作，但在第八次，兩組都想獲得更高的利益，同時(shí)A組也為懲罰之前B組的背叛信號(hào)（拒絕交流），均選擇了背叛。第二次中間討論時(shí)間兩組也并未進(jìn)行討論。最后兩次在發(fā)現(xiàn)上一次對(duì)方背叛之后，均不約而同的選擇了懲罰對(duì)方，繼續(xù)背叛，使得雙方最后兩次全為負(fù)分，得到“雙輸”的結(jié)果。

前4次博弈中，前兩次C、D均未選擇雙贏，一直是負(fù)分，而第三次中C組改變策略，選擇合作，雖然在第三次中D組仍然選擇背叛，但其看到了C組想要合作的內(nèi)心，又懼怕被C組懲罰，為了繼續(xù)得分，于是第四次雙方均選擇了合作。經(jīng)過中間交流，雙方達(dá)成共贏的想法，并且D組承諾說要讓C組一次。所以下一輪開始時(shí)，雙方都選擇了紅色，都未背叛，在第六次時(shí)，C組為了補(bǔ)償，選擇了背叛得到高分，接下來雙方都因?yàn)楹ε聦?duì)方對(duì)于自己背叛的懲罰，信守承諾，沒有背叛，雙方達(dá)成共贏，但在第八次，D組想獲得更高的利益趕超之前得分較高的A組，于是選擇了背叛。第二次中間討論時(shí)間兩組并未進(jìn)行談判。由于D組之前的背叛，使得C組要對(duì)D組進(jìn)行懲罰，而D組想繼續(xù)獲得高分，因此雙方都選擇背叛，使得雙方最后兩次全為負(fù)分，得到“雙輸”的結(jié)果。

盡管重復(fù)博弈確實(shí)能夠通過懲罰對(duì)方而使雙方由于對(duì)利益的追求以及“面子”問題不敢輕易選擇背叛，但是上述實(shí)驗(yàn)結(jié)果最終表明“雙輸”，也情有可原。首先，對(duì)于A與B、C與D兩組來說，對(duì)手并不只是對(duì)方，還有其他兩組，就像之前D組所描述的那樣，為了在四個(gè)組中間爭(zhēng)先，為了超過得分較高的A組，自然要選擇背叛而獲取更高的利益；其次，在這種四組之間容易形成對(duì)比的情況下，競(jìng)爭(zhēng)是非常強(qiáng)烈的，大家都不甘心屈居人后。孫昕怡等人（2009）的研究表明，成人平均合作率隨合作指數(shù)的升高而升高，但始終處于幾率水平之下，表現(xiàn)出競(jìng)爭(zhēng)傾向。成人本來就對(duì)競(jìng)爭(zhēng)比合作更為敏感，更愿意通過競(jìng)爭(zhēng)的方式贏過他人。而且博弈論預(yù)測(cè)：當(dāng)囚徒困境博弈是有限重復(fù)時(shí)，理性的玩家在每一回合中仍會(huì)背叛。所以說，盡管重復(fù)博弈對(duì)于雙贏局面起到了一定作用，但作用仍然有限。

4 結(jié)論

在博弈當(dāng)中，人們?yōu)榱俗约旱睦嫱鶗?huì)選擇背叛策略，而重復(fù)博弈確實(shí)能夠改變?nèi)说男袨?，讓其更傾向于選擇合作策略，在全球化的今天，為了社會(huì)不斷發(fā)展，多方合作越來越受到人們的重視，通過重復(fù)博弈而達(dá)到合作雙贏的效果是非常好的解決途徑。

[責(zé)任編輯：田吉捷]

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

重復(fù)博弈現(xiàn)象分析