劉曉麗
(南京大學(xué)哲學(xué)系,江蘇南京210093)
從博弈實驗看博弈論作為社會科學(xué)方法論的局限性
劉曉麗
(南京大學(xué)哲學(xué)系,江蘇南京210093)
博弈論是社會科學(xué)的通用方法論,它通過構(gòu)建模型分析社會現(xiàn)象和社會規(guī)律。然而博弈論的理想主體的假定使得它的理論預(yù)測與實際現(xiàn)象存在偏離。本文設(shè)計并進行了一個博弈實驗,該實驗有176人參與。通過分析該博弈的實驗解與其理論解發(fā)生偏離的原因,本文指出博弈論的局限性,并提出了可能的改進路徑。
博弈論;理性人假定;公共知識;社會科學(xué)方法論
博弈論是研究理性人的互動的理論,或者說研究交互決策的理論。1928年,馮·諾依曼證明了博弈論的基本原理,宣告了博弈論的正式誕生。1944年,馮·諾依曼和摩根斯坦合著的《博弈論與經(jīng)濟行為》將二人博弈推廣到n人博弈結(jié)構(gòu)并將博弈論系統(tǒng)應(yīng)用于經(jīng)濟領(lǐng)域,奠定了這一學(xué)科的基礎(chǔ)和理論體系。1950-1951年,約翰·納什利用不動點定理證明了均衡點的存在,為博弈論的一般化奠定了堅定的基礎(chǔ)。塞爾頓、哈桑尼、謝林、奧曼等人的研究也大大推動了博弈論的發(fā)展。因此,盡管博弈論是一門新生的學(xué)科,但是它今天已經(jīng)發(fā)展成為有較完善的理論體系的科學(xué)。
今天,博弈論已經(jīng)成為社會科學(xué)的通用方法論。盡管它是演繹科學(xué),對社會現(xiàn)象有強大的解釋力,然而,由于其理想主體的假定使得其演繹出的理論解與實際博弈結(jié)果存在差異。許多實驗經(jīng)濟學(xué)家通過博弈實驗研究實際中人們的博弈過程,分析博弈論的演繹解與博弈實驗結(jié)果之間的差異。如2002年諾貝爾經(jīng)濟學(xué)獎就頒發(fā)給了丹尼爾·卡尼曼和邁農(nóng)·史密斯,他們是實驗經(jīng)濟學(xué)的先驅(qū)。今天在西方學(xué)術(shù)界通過實驗來驗證博弈的理論結(jié)果已經(jīng)成為一種潮流。本文下面設(shè)計并進行了一個博弈實驗,通過分析實驗結(jié)果與理論解的差異,分析博弈論作為社會科學(xué)方法論的局限性,并提出改進的可能路徑。
1.實驗描述
我們設(shè)計了如下的一個博弈實驗①該實驗是與“邏輯與科學(xué)方法基礎(chǔ)”的主講教師博士生導(dǎo)師潘天群教授共同完成的。。該實驗的參與人是南京大學(xué)選修文化素質(zhì)課“邏輯與科學(xué)方法基礎(chǔ)”的大學(xué)生,他們是二三年級的學(xué)生,文理科學(xué)生均有。
該實驗是以試題的形式進行的,該試題作為期末試卷中的最后一道題。該題目為:
在0-100之間選擇一個數(shù)字,規(guī)則是:若你選擇的數(shù)字“是或最接近”在座同學(xué)所選擇的數(shù)字的平均數(shù)的2/3(即在座同學(xué)所選數(shù)的總和除以總?cè)藬?shù)之后所得數(shù)字的2/3,如:若平均數(shù)為90,你應(yīng)當(dāng)選2/3x90=60),你將獲勝。請給出你選擇的理由。
實驗說明:
(1)實驗參與者即參加考試的學(xué)生,事前不知道這是一個實驗;
(2)該課程教師以講座的形式給實驗參與者傳授過博弈論知識,但沒有提到所進行的博弈;
(3)因為(2),他們中的大多數(shù)掌握“博弈”、“公共知識”等概念;
(4)試卷是保密的,沒有任何學(xué)生預(yù)先知道考試內(nèi)容,考試過程中學(xué)生間無任何交流;
(5)該博弈的理論解(即納什均衡)為0或1。
2.實驗結(jié)果
對于考試中的每個學(xué)生,在這個博弈實驗中他能夠獲勝的關(guān)鍵是,他要準(zhǔn)確猜測他人是如何選擇的,一旦他猜測正確,他將他猜測的平均數(shù)乘以2/3便是獲勝答案。
共有176人參加了考試。排除掉5個不明確的選擇,供分析的實際選擇數(shù)為171個(其中3個選擇非整數(shù))。實驗結(jié)果為(按照數(shù)字大小排序):
“0”:46人;“1”:14人;“5”:1人;“9”:1人;“10”:4人;“12”:1人;“15”:3人;“20”:3人;“22”:18人;“22.44”:1人;“24”:1人;“25”:3人;“28”:2人;“29”:1人;“30”:4人;“32”:2人;“33”:24人;“100/3”:1人;“34”:4人;“35”:1人;“36”:2人;“38”:3人;“39”:1人;“40”:6人;“43”:1人;“44”:5人,“45”:3人;“47”:1人;“50”:3人;“58”:1人;“59”:1人;“60”:2人;“66”:1人;“67”:3人;“”:1人;“72”:1人;“75”:1人。
3.結(jié)果分析
在這些所選擇的數(shù)字中,最大的數(shù)字為75,最小的數(shù)字為0。171個數(shù)字相加后的平均數(shù)為21.91,本博弈勝出解:21.84×2/3=14.61。
這個博弈中,0和1是均衡解(下一部分將分析),它們是“理論解”。在該實驗中,0是所選最多的數(shù)字,共有46人選擇,比例為26.9%;選1的為14人,比例為8.2%。兩者相加共有60人,比例為35.1%。
從上述數(shù)據(jù)可以看出,在這場博弈中,“實驗解”為14.61,最接近該數(shù)的是14或15,這和“理論解”的“0”或“1”不同。在本實驗中,沒有人選擇14,而選擇15的有3人,這3人是該實驗的勝出者。
若按照區(qū)間來統(tǒng)計,實驗結(jié)果的分布情況見表1。本博弈實驗的“實驗解”14.61落在11-20之間。若我們把11-20看成是勝出區(qū)間,則有7人勝出。
表1 實驗結(jié)果區(qū)間分布統(tǒng)計
對于這些選擇,有以下值得注意的幾點:
第一,67以上的選擇都是不理性的,因為參加考試的學(xué)生數(shù)為150-200之間,這是公共知識,即使所有的學(xué)生都選擇100,勝出的數(shù)字都不會超過67。但是還有3位學(xué)生選擇了大于67的數(shù)字,其中選擇的最大數(shù)為75。他們在給出這些選擇時沒有給出理由。
第三,有三個區(qū)間處的選擇比例較高:0-10間為38.6%,21-30間為17.6%,31-40間為25.7%。從所給理由可看出,不同區(qū)間的選擇者考慮群體的互動推理的步驟存在差別,如0-10區(qū)間的選擇者考慮他人的推理步驟比31-40區(qū)間的選擇者多些。
第四,值得注意的是,11-20區(qū)間里的選擇較少(事實上是,在這個博弈中所選擇的數(shù)字落在這個區(qū)間是最有可能勝出的)。原因可能是,一旦選擇者進行了多步的互動推理,他們便能夠?qū)⑦@樣的推理進行下去,從而將選擇向理論解0或1靠近。
第五,有一些“智慧的”選擇者,他們知道理論解,但他們知道存在不完全理性的選擇,因而他們沒有選擇理論解。盡管他們的選擇沒有勝出,他們的推理是有智慧的。這里,本文選擇了其中2個。一位選擇22的學(xué)生是這樣給出他所選擇的理由的:“作為理性人,我不會選擇大于2/3×100的數(shù),因為即使所有人都選擇最大數(shù),平均數(shù)的2/3也不會超過2/3×100。如果大家和我一樣理智,那么大家都不會選擇大于2/3×100,那么我不會選擇大于100×2/3×2/3。因為他們選擇最大的他們可能會選的數(shù),平均數(shù)的2/3也不會超過2/3×2/3× 100。依此類推,如果全班都充分理智,那么全班最終都會選擇1,然而我不認(rèn)為班里的人都是足夠理智,故平均數(shù)的2/3會大于1。根據(jù)兩次游戲,平均數(shù)的2/3在20~30。如果是我,我會選擇靠近20的數(shù),那我就22吧?!币粋€選擇10的學(xué)生的理由是:“如果其他人都是隨機選擇,那么平均數(shù)最后可能接近于50,50×2/3≈33。但是,如果所有人都選擇接近33的數(shù),那么33為平均數(shù),33×2/3≈22……如此推理應(yīng)該為1。但是并非所有人均是理性、均會如此計算。我對南大有信心,所以,我將數(shù)字選得接近1一點,選10?!?/p>
第六,有一些選擇是沒有考慮到他人的選擇。如有這樣一些理由:“大家都認(rèn)為60是及格分,所以我選擇59”,“58是我的幸運數(shù)字”,等等。
本實驗是一個多人完全信息靜態(tài)博弈:參與者同時選擇行動,然后根據(jù)所有參與者的選擇,每個參與者得到各自的結(jié)果,每一參與者的收益函數(shù)在所有參與者之間是公共知識①命題p是某個群體的公共知識指的是,該群體的每個人知道p,每個人知道知道每個人知道p……。
在這個實驗中,參加考試的176位學(xué)生是參與者,每個考生同時對0-100之間的數(shù)字進行選擇行動,即每個參與者的策略空間Si∈(0,100),即有101種可能的策略。根據(jù)所有考生的選擇,每個考生最后得出自己的結(jié)果,對每個考生來說,結(jié)果無非就是,自己的選擇是“大家所選數(shù)字的平均數(shù)的2/3”,勝出;要么與“大家所選數(shù)字的平均數(shù)的2/3”不一致,失敗。
我們假定該博弈的參與人都是絕對理性人(事實上,這個要求在實際中難以達(dá)到,這也是本文要得到的一個結(jié)論)。
我們來分析絕對理性人的推理過程。
要理解和把握“城鄉(xiāng)文化一體化”的涵義,不能僅僅就事論事,否則極有可能含糊其辭,甚至以訛傳訛。本文擬采取層級分離法,從三個依次遞進的層次逐一進行剖析,即先后解析“一體化”、“城鄉(xiāng)一體化”、“城鄉(xiāng)文化一體化”,以此來理解和把握“城鄉(xiāng)文化一體化”的涵義。
在這個博弈中策略組合有176×101種,每種策略組合下,每個人的收益是公共知識。如:如所有人都選100,平均數(shù)為100,此時每人都失敗,勝出結(jié)果是100× 2/3=67;如175人都選100,有一個人選擇了67,那么選100的人失敗,而選擇67的人勝出……所以這些是理性參與人的公共知識。
我們看到,任何人都不應(yīng)該選67或以上,或者選擇67或以上是非理性的,因為所選擇的數(shù)字的最大平均數(shù)為100,此時勝出的數(shù)字為67,因此選擇67以上而獲勝的可能性是沒有。因此,作為理性人他們都不會選擇67或以上。
每個人都不會選擇67或以上,這本身也是公共知識。在這樣的公共知識的前提下,45以上的選擇都是不合理的,因為對每個人而言,只有在他人都選擇67以上,我選擇45或以上才是合理的(67的2/3約為45)。
每個人都不會選擇45或以上,這本身也是公共知識。于是,每個人都認(rèn)為不應(yīng)該選擇30或以上。
……
結(jié)論是:每個人選擇0或1是合理的,它們是該博弈的理論解。
事實上,每個人選擇0或都選擇1是納什均衡:對每個人而言,在其他人不改變選擇的情況下,當(dāng)下的選擇是最優(yōu)的。
在所有人均選擇0的情況下,因為對于每個人而言,若所有人都選擇0的話,0便成為平均數(shù),該數(shù)的2/3還是0。這樣,他選擇0是最優(yōu)選擇:在他人不改變選擇的情況下,他改變選擇將失敗。因此這點構(gòu)成納什均衡。
在所有人均選擇1的情況下,同樣,對于每個人而言,在其他人選擇1的情況下,平均數(shù)1的2/3為0.67,此時1最接近該數(shù)。因此,他選擇1是最優(yōu)選擇,并且若他改變了他的選擇他將失敗。因此,這點也構(gòu)成納什均衡。
當(dāng)然,面對多個納什均衡,作為理性的參與人作何選擇才能勝出呢?具體到這個博弈中,每個人要考慮的是,他選擇0還是選擇1才能勝出呢?
他會這樣思考:沒有理由認(rèn)為其中一個比另外一個更有可能勝出,這樣,選擇0或1勝出的概率為50%,但是,他人能夠與我有同樣的想法。既然如此,期望平均數(shù)應(yīng)該為0.5×1+0.5×0=0.5。于是,0.5的2/3接近0。因此,選擇0是最優(yōu)選擇。
從上面的分析可見,盡管0和1是納什均衡點,但選擇0是最優(yōu)選擇。
本文已經(jīng)表明,上述博弈是一個完全信息靜態(tài)博弈,然而,本實驗的實驗解(14.61)與理論解(0或1)之間發(fā)生偏離。本文認(rèn)為,有兩個主要原因:
第一,博弈論中所假定的理想主體與實際中的決策主體不相符合。理想的博弈參與人是絕對理性人:他們能夠進行任何有窮步驟的推理,能夠分析所有有窮可能的情況,并且他們的推理、分析是在瞬時完成的,而實際博弈中人們是有界理性的。在我們的博弈實驗中若參與者是理想主體,他們能夠做本文上一部分那樣的分析,他們應(yīng)當(dāng)知道0和1是均衡解,也能夠預(yù)測0是最有可能實現(xiàn)的結(jié)果。本實驗表明,并不是所有人都能夠做出這樣分析的。并且,在實際中存在完全非理性的選擇,如本實驗中選擇大于67的3人,這不是完全偶然現(xiàn)象。
第二,博弈論假定了博弈中參與人是理性的是博弈參與人之間的公共知識,而在實際博弈中這一點不能保證,并且博弈參與人越多,理性人是公共知識越不能保證。本實驗參與人有近200人,這是實驗者之間的公共知識,這也使得選擇者對他人的理性沒有信心。上面本文給出一個選擇者選擇的理由,他對在座的同學(xué)“有信心”才將數(shù)字選得“接近1一點,選10”;若絕對有信心,應(yīng)當(dāng)選擇理論解0或1。
博弈論作為社會科學(xué)的方法論工具有其巨大的威力,然而由于其假定與現(xiàn)實的偏離使得其理論解與實驗解存在巨大偏離。根據(jù)上述兩點原因,我們可以通過修改博弈論的假定而改進博弈論。這個改進路徑有兩條:第一,弱化博弈論的理性人假定,引進西蒙的有界理性概念;第二,弱化理性人的公共知識假定,用公共p信念來替代公共知識假定[2]。通過這樣的改進,博弈論能夠更好地作為社會科學(xué)的方法論以解釋社會現(xiàn)象。
[1] Ken Binmore.Why Experiment in Economics?[J].The E-conomic Journal,1999(2).
[2] 周章買.從博弈論看公共P-信念對協(xié)同攻擊難題的解決[J].哲學(xué)動態(tài),2010(5).
[3] Martin Hollis,Robert Sugden.Rationality in Action[J].Mind.New Series,1993,102.
[4] 羅伯特·吉本斯.博弈論基礎(chǔ)[M].高峰 譯.北京:中國社會科學(xué)出版社,1999.
C3
A
1671-511X(2012)04-0020-03
2011-12-26
劉曉麗(1982-),女,河南許昌人,南京大學(xué)哲學(xué)系博士研究生,研究方向:科學(xué)邏輯。