陳思詩
(西南政法大學(xué) 政治與公共管理學(xué)院,重慶 401120)
重復(fù)博弈與機(jī)制設(shè)計(jì):基于紅黑博弈的思考與啟示
陳思詩
(西南政法大學(xué) 政治與公共管理學(xué)院,重慶 401120)
紅黑博弈體現(xiàn)了單方最大利益與合作最大利益之間的矛盾關(guān)系,反映了理性經(jīng)濟(jì)人在相互影響、相互制約的條件下如何決策的問題.本文通過對兩次紅黑博弈過程的分解和剖析,揭示了其中所蘊(yùn)涵的“雙贏”理念以及實(shí)現(xiàn)“雙贏”的一些技巧,探討了在重復(fù)博弈中理性經(jīng)濟(jì)人的策略選擇以及在獲取利益時(shí)應(yīng)處理好的利益關(guān)系,最后總結(jié)出設(shè)計(jì)合理利益兼容機(jī)制以推動(dòng)博弈雙方逐步建立機(jī)制化、制度化、模式化的穩(wěn)定合作關(guān)系,以此破解博弈困境.
重復(fù)博弈;機(jī)制設(shè)計(jì);紅黑博弈
由于人的特殊性和復(fù)雜性,不同的教育背景、出生環(huán)境、人生閱歷、性別、種族、性格等因素,往往使得博弈的結(jié)果出現(xiàn)多元化;而在多次博弈中,由于不斷地示好與謀略、合作與非合作、試探與勇氣等多方面行為選擇,使得博弈的結(jié)果更加難以預(yù)測.不可否認(rèn),當(dāng)多次博弈的次數(shù)趨向于無限時(shí),博弈雙方會最終采取合作策略以求得雙方的互惠共贏.①然而,次數(shù)有限的博弈過程卻因?yàn)椴豢善诖倪x擇及其相應(yīng)的結(jié)果而更加扣人心弦.本文基于兩次紅黑博弈實(shí)驗(yàn),通過觀察博弈雙方的心理活動(dòng)與策略選擇及其導(dǎo)致的結(jié)果,以此來豐富博弈理論的相關(guān)研究,以期給研究者更多的側(cè)面思考.
重復(fù)博弈就是指某些博弈多次 (兩次以上,有限次或無限次)重復(fù)進(jìn)行所構(gòu)成的博弈過程.在重復(fù)博弈中每次博弈的條件、規(guī)則和內(nèi)容都是相同的,但由于有一個(gè)長期利益的存在,因此各博弈方在當(dāng)前階段的博弈中都要考慮到不能引起其它博弈方在后面階段的對抗、報(bào)復(fù)或惡性競爭,即不能像在一次性靜態(tài)博弈中那樣毫不顧及其它博弈方的利益.有時(shí),一方做出一種合作的姿態(tài),可能會使其它博弈方在之后的階段采取合作的態(tài)度,從而實(shí)現(xiàn)共同的長期利益.
“紅黑博弈”源于著名的“囚徒困境”,即兩個(gè)罪犯同時(shí)被捕后,被警方分別關(guān)押,在不能互通信息的情況下,他們面臨著“兩個(gè)人都拒不交代、都交代和一個(gè)人拒不交代另一個(gè)人交代”三種結(jié)果,每種結(jié)果都將受到不同程度的法律制裁.按著這一博弈原理,人們設(shè)計(jì)了“紅黑博弈”游戲,以模擬“囚徒的困境”.對一次性囚徒困境博弈來說,無論對手的行動(dòng)可能是什么,最佳策略都是簡單地背叛;但是在重復(fù)的囚徒困境博弈中,博弈被反復(fù)地進(jìn)行,參與者最佳的策略就依賴于對方可能選取的策略,以及他們怎樣對背叛與合作作出反應(yīng),因此每一個(gè)參與者都有機(jī)會去“懲罰”另一個(gè)參與者在前一回合中的不合作行為,這時(shí)合作可能就會作為均衡的結(jié)果出現(xiàn).羅伯特·艾克斯羅德在其《合作的進(jìn)化》一書中用實(shí)驗(yàn)證明,在重復(fù)博弈條件下,一次性囚徒困境下背叛的占優(yōu)策略②將會被有條件合作的占優(yōu)策略所取代,換言之,在一次性囚徒困境中選擇不合作策略的博弈者,在“重復(fù)性囚徒困境”中將會采取合作策略以最大化個(gè)人利益,即“有條件合作”策略將是重復(fù)性囚徒困境下博弈者的占優(yōu)策略.
2.1 紅黑博弈的規(guī)則
紅黑博弈游戲規(guī)則就是把所有參與人員分為兩組,每組民主投票選出一名組長.每組選擇出示紅牌還是黑牌,一共進(jìn)行六輪.如果雙方都出示紅牌,雙方都減5分;一方出示黑牌,一方出示紅牌,則出示紅牌的得5分,出示黑牌的減5分;同時(shí)出示黑牌各得5分.第三輪得分乘以兩倍,第六輪得分乘以三倍.整個(gè)過程中,在每一輪小組投票結(jié)束之后由兩位通訊員分別公布兩個(gè)小組的投票結(jié)果和得分,期間不允許任何形式的交流溝通,正分之和最大者獲勝.對于20名接受過高等教育的人來說,這種博弈游戲及其原理都不陌生,然而當(dāng)其成為實(shí)驗(yàn)中的被試者,角色的迅速轉(zhuǎn)換及引起的心理轉(zhuǎn)變卻是大大令人吃驚的.
2.2 紅黑博弈的過程
表1 第一局得分情況
由表1關(guān)于第一局的得分情況可以看出,在博弈雙方?jīng)]有任何溝通的第1輪中,雙方都會從追求利益和回避風(fēng)險(xiǎn)的本能出發(fā)而選擇出黑牌,于是兩組各加5分.第2輪,A組出示紅牌,B組出示紅牌,雙方都選擇不合作,于是兩組各減5分,此時(shí),情況又回到第一輪的狀態(tài),比分歸零持平.第3輪,由于比分規(guī)則是得分乘以2倍,兩組開始明顯分化,A組基于賭徒心理出了紅牌,而B組基于前兩輪與A組的默契,在這一輪中也寄希望于對方能夠合作,于是較為保守地出了黑牌,結(jié)果大失所望,A組加10分,B組減10分.在接下來的第4輪、第5輪和第6輪中,B組基于之前A組的背信棄義抱著“要死一起死”的心態(tài),堅(jiān)持連續(xù)出紅牌;A組為了不讓B組得分,在第4輪、第5輪中也都選擇了出紅牌,而在最后第6輪時(shí),A組對B組仍抱有僥幸心理出了黑牌,若B組成全他們出黑牌,則A組最終就能以正分最大獲勝,但事與愿違.至此,第一局游戲結(jié)束,A組總分-15分,B組總分-5分,雙方均失敗告終.
表2 第二局得分情況
由表2關(guān)于第二局的得分情況可以看出,經(jīng)過第一局的博弈之后在第二局中大家更加有默契了.前2輪,雙方都選擇了合作,都出了黑牌,各加10分.第3輪,在得分翻倍的利益面前,A組希望繼續(xù)與B組保持合作出了黑牌,而B組由于在第一局中被A組背叛的陰影,這次不再天真并想著扳回一成于是出了紅牌,結(jié)果A組減10分,B組加10分.第4輪、第5輪,A組受到刺激,開始連續(xù)出紅,而B組這次在這兩輪中都暫時(shí)先放棄了自己的利益,很配合地出了黑牌,至此,兩組比分已經(jīng)持平均為10分.在最后的第6輪中,兩組也是出乎意料的默契,都同時(shí)出了黑牌,兩組各加15分.至此,第二局游戲結(jié)束,A組總分25分,B組總分25分,完美地實(shí)現(xiàn)了互利共贏,收到了皆大歡喜的結(jié)果.
2.3 紅黑博弈的理性分析
現(xiàn)代社會競爭無處不在,你可以把他當(dāng)做天使,也可以是魔鬼,例如雙紅就是魔鬼,雙黑就是天使,雙紅和雙黑都是競爭,但存在兩種不同的競爭觀念,也會導(dǎo)致兩種不同的競爭結(jié)果.從理性上,大家都接受“雙黑”的結(jié)果,但從情感上又導(dǎo)致了“雙紅”的結(jié)果選擇.在巨大的利益誘惑面前,所有理性經(jīng)濟(jì)人都追求個(gè)人效益最大化,根本不存在“熟人圈”與“生人圈”的區(qū)分.該游戲中原本是朝夕相處、互愛互助的同班同學(xué),隨機(jī)被分成兩組,就已經(jīng)產(chǎn)生了分裂與對抗,當(dāng)一個(gè)整體被劃分成為兩個(gè)陣營時(shí),對立、信息不對稱與利己主義也就隨之而來.隨著城鎮(zhèn)化進(jìn)程的加快和市場經(jīng)濟(jì)的急劇轉(zhuǎn)型,真正如熟人社會③里所建立的穩(wěn)定“熟人圈”早已淪陷失守,每個(gè)人都在追求自身利益最大化,然而是否能夠因此促進(jìn)整個(gè)社會的福利增加卻是一個(gè)值得商榷的問題.解決之道不在于盲目的合作,因?yàn)橹灰獩]有機(jī)制設(shè)計(jì)能防止談判達(dá)成協(xié)議之后違約的重懲,那么協(xié)議一套行動(dòng)一套的做法完全是有可能的.
個(gè)人理性與集體理性的沖突,這也是博弈論剛引進(jìn)中國時(shí)許多學(xué)者所持有的觀點(diǎn),即個(gè)人在作出最符合自己利益的選擇后,結(jié)果卻損害了集體利益.如紅黑博弈游戲第一局中B組為了制裁A組的不合作行為,選擇報(bào)復(fù),最后結(jié)果兩敗俱傷,整體利益損失最大.破解的關(guān)鍵在于設(shè)計(jì)一種合理的機(jī)制,這種機(jī)制可以使得個(gè)人追求自己利益的同時(shí)達(dá)成集體利益的最大化,即利益兼容機(jī)制.
囚徒困境的理想化前提在現(xiàn)實(shí)中并不存在.囚徒困境的前提有三個(gè)條件:一是完全知曉規(guī)則及其后果;二是理性人的理性選擇;三是兩者之間互不溝通.現(xiàn)實(shí)生活中,這種前提假設(shè)是不存在的.而任何一種前提的缺失,都會導(dǎo)致結(jié)果走向不可預(yù)知,這便加劇了問題的復(fù)雜性.例如,紅黑博弈中就存在兩組從一開始就沒有完全理解游戲規(guī)則,誤認(rèn)為只要一方比另一方分?jǐn)?shù)高則獲勝.而理性人在信息明顯不充分的情況下,也無法做出最有利的決策,即使信息完全,也會由于自身理解力和決斷力等特質(zhì)的差異而導(dǎo)致無法做出最優(yōu)選擇.
在這場紅黑博弈游戲中有三種人:第一種人,堅(jiān)決要求出紅牌,他們代表了人性深處的好斗、攻擊、自私和自我至上.他們的口號是:要么贏得整個(gè)世界,要么徹底失去,或者與對手同歸于盡!這是非常典型的賭徒心態(tài).或者說,這是狼的行為.第二種人,他們是溫和的,包容的,他們希望與競爭者共同把市場做大,達(dá)到雙贏.他們是理性的,但更多的是理想主義:他們憑什么認(rèn)為自己的寬容、讓步、與人為善,就一定能夠得到對方的相同回應(yīng)呢?他們怎么知道結(jié)果就一定能雙贏呢?他們的理想是有條件的,他們需要生活在適宜的環(huán)境里.或者說,這是羊的行為.第三種人,他們是盲目的,迷惑的,他們?nèi)狈ψ銐虻闹腔廴ッ鞅媸欠?,他們甚至不知道自己?yīng)該出什么牌,他們很容易受到誘導(dǎo),可以說,他們的心智基本是不成熟的,或者,是不負(fù)責(zé)任的,因此,他們要么隨大流,要么不表態(tài),要么干脆放棄.
反思我們在團(tuán)隊(duì)之中,有多少時(shí)候敢于頂住壓力,堅(jiān)持自己的原則,堅(jiān)定不移地向目標(biāo)邁進(jìn)而不是改變目標(biāo)呢.因?yàn)槲覀兲菀鬃屪约鹤兊渺`活,我們的理由是,這個(gè)世界是變化的,唯一不變的就是變化本身,因此,我們的目標(biāo)可以調(diào)整,方向可以改變,戰(zhàn)略可以重建.我們的理由是,人在江湖,身不由己啊.而有些時(shí)候,我們一意孤行,聽不進(jìn)任何反對和批評意見,我們認(rèn)為這是對的,就矢志不移地去做,最后我們也許成功,也許失敗,那我們?nèi)绾蝸矸此寄??難道僅僅自己說:這是天意,這是三分人事,七分天命?如果真是這樣,這些話根本無須我們說出來,因?yàn)榻^對的真理人人都知道.那么,什么才是我們?yōu)榕c不為的指導(dǎo)原則呢?首先是責(zé)任,既然成為團(tuán)隊(duì)的領(lǐng)導(dǎo),就要為這個(gè)團(tuán)隊(duì)付出一切;其次是智慧,是在責(zé)任基礎(chǔ)之上的智慧,或者說是在智慧基礎(chǔ)之上的責(zé)任,有智慧的責(zé)任可以避免我們犯方向性的錯(cuò)誤.
綜上所述,我們知道,在純粹的博弈論中是不存在道德因素的,而合作環(huán)境的營建更有利于推動(dòng)雙方往互利共贏的道路上發(fā)展,最終達(dá)成帕累托最優(yōu).紅黑博弈作為一種典型的重復(fù)博弈模型則能夠建立起一種密集的互動(dòng)關(guān)系并促使博弈策略選擇更加趨于合作而不是對抗,從而推動(dòng)博弈雙方逐步建立機(jī)制化、制度化、模式化的穩(wěn)定合作關(guān)系.這就要求我們在現(xiàn)實(shí)生活中就應(yīng)該立足長遠(yuǎn)著眼全局,社會發(fā)展到現(xiàn)在他們是相互緊密聯(lián)系在一起的,是一個(gè)系統(tǒng)、一個(gè)整體,如果你不把自己的利益放在大局里或大環(huán)境里面,最終是沒有利益的.美國商界有句名言:“如果你不能戰(zhàn)勝對手,那就加入到他們中間去”.畢竟,現(xiàn)代競爭,早已不再是“你死我活”,而是更高層次的競爭與合作.英國首相帕麥斯頓也曾說過:“沒有永遠(yuǎn)的敵人,也沒有永遠(yuǎn)的朋友,只有永恒的利益”,我們都是在競爭與合作中生存,只有在競爭中合作,在合作中競爭,才能收獲雙贏.因此,為破解博弈困境,我們就應(yīng)當(dāng)在承認(rèn)個(gè)人利益合法合理的前提下,通過設(shè)計(jì)合理利益兼容機(jī)制,使我們在追求個(gè)人利益的同時(shí)也能實(shí)現(xiàn)集體利益最大化.
注 釋:
①羅伯特·艾克斯羅德在 《合作的進(jìn)化》一書中寫到:在重復(fù)博弈條件下,一次性囚徒困境下背叛的占優(yōu)策略將會為有條件合作的占優(yōu)策略所取代.
②占優(yōu)策略是博弈論 (game theory)中的專業(yè)術(shù)語,所謂的占優(yōu)策略就是指無論競爭對手如何反應(yīng)都屬于本企業(yè)最佳選擇的競爭策略.
③熟人社會,費(fèi)孝通在《鄉(xiāng)土中國》中提出的概念,更通俗的講就是“小圈子”社會,一般是指人與人之間有著一種私人關(guān)系,人與人通過這種關(guān)系聯(lián)系起來,構(gòu)成一張張關(guān)系網(wǎng).
〔1〕羅伯特·艾克斯羅德.合作的進(jìn)化[M].上海:上海人民出版社,2007.
〔2〕張維迎.博弈論與信息經(jīng)濟(jì)學(xué)[M].上海:上海三聯(lián)出版社,1996.
〔3〕曲揚(yáng).競爭還是合作?——紅黑博弈揭示的商務(wù)談判思維[J].經(jīng)濟(jì)問題,2014(2).
〔4〕黃正,唐曉嘉.政治博弈論研究述評[J].重慶理工大學(xué)學(xué)報(bào)(社會科學(xué)),2011(1).
〔5〕陳建先.政府管理的博弈理念——合作·均衡·雙贏[C].中國行政管理學(xué)會2010年會暨“政府管理創(chuàng)新”研討會論文集,2010.
〔6〕王小錫.經(jīng)濟(jì)道德觀視閾中的“囚徒困境”博弈論批判[J].江蘇社會科學(xué),2009(1).
〔7〕楊懋,祁守成.囚徒困境:從單次博弈到重復(fù)博弈[J].商業(yè)時(shí)代,2009(2).
〔8〕賀繼紅,婁美珍.基于“紅黑博弈”的商務(wù)談判思考[J].商場現(xiàn)代化,2006(16).
F224.32
A
1673-260X(2017)06-0127-03
2017-03-18
西南政法大學(xué)2016年度研究生科研創(chuàng)新計(jì)劃項(xiàng)目(2016XZXS-082)
赤峰學(xué)院學(xué)報(bào)·自然科學(xué)版2017年11期