從博弈實驗看博弈論作為社會科學(xué)方法論的局限性

2012-11-14 02:55:56劉曉麗

東南大學(xué)學(xué)報(哲學(xué)社會科學(xué)版) 2012年4期

關(guān)鍵詞：納什博弈論平均數(shù)

劉曉麗

（南京大學(xué)哲學(xué)系，江蘇南京210093）

從博弈實驗看博弈論作為社會科學(xué)方法論的局限性

劉曉麗

（南京大學(xué)哲學(xué)系，江蘇南京210093）

博弈論是社會科學(xué)的通用方法論，它通過構(gòu)建模型分析社會現(xiàn)象和社會規(guī)律。然而博弈論的理想主體的假定使得它的理論預(yù)測與實際現(xiàn)象存在偏離。本文設(shè)計并進行了一個博弈實驗，該實驗有176人參與。通過分析該博弈的實驗解與其理論解發(fā)生偏離的原因，本文指出博弈論的局限性，并提出了可能的改進路徑。

博弈論；理性人假定；公共知識；社會科學(xué)方法論

博弈論是研究理性人的互動的理論，或者說研究交互決策的理論。1928年，馮·諾依曼證明了博弈論的基本原理，宣告了博弈論的正式誕生。1944年，馮·諾依曼和摩根斯坦合著的《博弈論與經(jīng)濟行為》將二人博弈推廣到n人博弈結(jié)構(gòu)并將博弈論系統(tǒng)應(yīng)用于經(jīng)濟領(lǐng)域，奠定了這一學(xué)科的基礎(chǔ)和理論體系。1950－1951年，約翰·納什利用不動點定理證明了均衡點的存在，為博弈論的一般化奠定了堅定的基礎(chǔ)。塞爾頓、哈桑尼、謝林、奧曼等人的研究也大大推動了博弈論的發(fā)展。因此，盡管博弈論是一門新生的學(xué)科，但是它今天已經(jīng)發(fā)展成為有較完善的理論體系的科學(xué)。

今天，博弈論已經(jīng)成為社會科學(xué)的通用方法論。盡管它是演繹科學(xué)，對社會現(xiàn)象有強大的解釋力，然而，由于其理想主體的假定使得其演繹出的理論解與實際博弈結(jié)果存在差異。許多實驗經(jīng)濟學(xué)家通過博弈實驗研究實際中人們的博弈過程，分析博弈論的演繹解與博弈實驗結(jié)果之間的差異。如2002年諾貝爾經(jīng)濟學(xué)獎就頒發(fā)給了丹尼爾·卡尼曼和邁農(nóng)·史密斯，他們是實驗經(jīng)濟學(xué)的先驅(qū)。今天在西方學(xué)術(shù)界通過實驗來驗證博弈的理論結(jié)果已經(jīng)成為一種潮流。本文下面設(shè)計并進行了一個博弈實驗，通過分析實驗結(jié)果與理論解的差異，分析博弈論作為社會科學(xué)方法論的局限性，并提出改進的可能路徑。

一、博弈實驗及結(jié)果分析

1.實驗描述

我們設(shè)計了如下的一個博弈實驗①該實驗是與“邏輯與科學(xué)方法基礎(chǔ)”的主講教師博士生導(dǎo)師潘天群教授共同完成的。。該實驗的參與人是南京大學(xué)選修文化素質(zhì)課“邏輯與科學(xué)方法基礎(chǔ)”的大學(xué)生，他們是二三年級的學(xué)生，文理科學(xué)生均有。

該實驗是以試題的形式進行的，該試題作為期末試卷中的最后一道題。該題目為：

在0－100之間選擇一個數(shù)字，規(guī)則是：若你選擇的數(shù)字“是或最接近”在座同學(xué)所選擇的數(shù)字的平均數(shù)的2／3（即在座同學(xué)所選數(shù)的總和除以總?cè)藬?shù)之后所得數(shù)字的2／3，如：若平均數(shù)為90，你應(yīng)當(dāng)選2／3x90＝60），你將獲勝。請給出你選擇的理由。

實驗說明：

（1）實驗參與者即參加考試的學(xué)生，事前不知道這是一個實驗；

（2）該課程教師以講座的形式給實驗參與者傳授過博弈論知識，但沒有提到所進行的博弈；

（3）因為（2），他們中的大多數(shù)掌握“博弈”、“公共知識”等概念；

（4）試卷是保密的，沒有任何學(xué)生預(yù)先知道考試內(nèi)容，考試過程中學(xué)生間無任何交流；

（5）該博弈的理論解（即納什均衡）為0或1。

2.實驗結(jié)果

對于考試中的每個學(xué)生，在這個博弈實驗中他能夠獲勝的關(guān)鍵是，他要準(zhǔn)確猜測他人是如何選擇的，一旦他猜測正確，他將他猜測的平均數(shù)乘以2／3便是獲勝答案。

共有176人參加了考試。排除掉5個不明確的選擇，供分析的實際選擇數(shù)為171個（其中3個選擇非整數(shù)）。實驗結(jié)果為（按照數(shù)字大小排序）：

“0”：46人；“1”：14人；“5”：1人；“9”：1人；“10”：4人；“12”：1人；“15”：3人；“20”：3人；“22”：18人；“22.44”：1人；“24”：1人；“25”：3人；“28”：2人；“29”：1人；“30”：4人；“32”：2人；“33”：24人；“100／3”：1人；“34”：4人；“35”：1人；“36”：2人；“38”：3人；“39”：1人；“40”：6人；“43”：1人；“44”：5人，“45”：3人；“47”：1人；“50”：3人；“58”：1人；“59”：1人；“60”：2人；“66”：1人；“67”：3人；“”：1人；“72”：1人；“75”：1人。

3.結(jié)果分析

在這些所選擇的數(shù)字中，最大的數(shù)字為75，最小的數(shù)字為0。171個數(shù)字相加后的平均數(shù)為21.91，本博弈勝出解：21.84×2／3＝14.61。

這個博弈中，0和1是均衡解（下一部分將分析），它們是“理論解”。在該實驗中，0是所選最多的數(shù)字，共有46人選擇，比例為26.9%；選1的為14人，比例為8.2%。兩者相加共有60人，比例為35.1%。

從上述數(shù)據(jù)可以看出，在這場博弈中，“實驗解”為14.61，最接近該數(shù)的是14或15，這和“理論解”的“0”或“1”不同。在本實驗中，沒有人選擇14，而選擇15的有3人，這3人是該實驗的勝出者。

若按照區(qū)間來統(tǒng)計，實驗結(jié)果的分布情況見表1。本博弈實驗的“實驗解”14.61落在11－20之間。若我們把11－20看成是勝出區(qū)間，則有7人勝出。

表1 實驗結(jié)果區(qū)間分布統(tǒng)計

對于這些選擇，有以下值得注意的幾點：

第一，67以上的選擇都是不理性的，因為參加考試的學(xué)生數(shù)為150－200之間，這是公共知識，即使所有的學(xué)生都選擇100，勝出的數(shù)字都不會超過67。但是還有3位學(xué)生選擇了大于67的數(shù)字，其中選擇的最大數(shù)為75。他們在給出這些選擇時沒有給出理由。

第三，有三個區(qū)間處的選擇比例較高：0－10間為38.6%，21－30間為17.6%，31－40間為25.7%。從所給理由可看出，不同區(qū)間的選擇者考慮群體的互動推理的步驟存在差別，如0－10區(qū)間的選擇者考慮他人的推理步驟比31－40區(qū)間的選擇者多些。

第四，值得注意的是，11－20區(qū)間里的選擇較少（事實上是，在這個博弈中所選擇的數(shù)字落在這個區(qū)間是最有可能勝出的）。原因可能是，一旦選擇者進行了多步的互動推理，他們便能夠?qū)⑦@樣的推理進行下去，從而將選擇向理論解0或1靠近。

第五，有一些“智慧的”選擇者，他們知道理論解，但他們知道存在不完全理性的選擇，因而他們沒有選擇理論解。盡管他們的選擇沒有勝出，他們的推理是有智慧的。這里，本文選擇了其中2個。一位選擇22的學(xué)生是這樣給出他所選擇的理由的：“作為理性人，我不會選擇大于2／3×100的數(shù)，因為即使所有人都選擇最大數(shù)，平均數(shù)的2／3也不會超過2／3×100。如果大家和我一樣理智，那么大家都不會選擇大于2／3×100，那么我不會選擇大于100×2／3×2／3。因為他們選擇最大的他們可能會選的數(shù)，平均數(shù)的2／3也不會超過2／3×2／3× 100。依此類推，如果全班都充分理智，那么全班最終都會選擇1，然而我不認(rèn)為班里的人都是足夠理智，故平均數(shù)的2／3會大于1。根據(jù)兩次游戲，平均數(shù)的2／3在20～30。如果是我，我會選擇靠近20的數(shù)，那我就22吧?！币粋€選擇10的學(xué)生的理由是：“如果其他人都是隨機選擇，那么平均數(shù)最后可能接近于50，50×2／3≈33。但是，如果所有人都選擇接近33的數(shù)，那么33為平均數(shù)，33×2／3≈22……如此推理應(yīng)該為1。但是并非所有人均是理性、均會如此計算。我對南大有信心，所以，我將數(shù)字選得接近1一點，選10?！?/p>

第六，有一些選擇是沒有考慮到他人的選擇。如有這樣一些理由：“大家都認(rèn)為60是及格分，所以我選擇59”，“58是我的幸運數(shù)字”，等等。

二、博弈的理論解分析

本實驗是一個多人完全信息靜態(tài)博弈：參與者同時選擇行動，然后根據(jù)所有參與者的選擇，每個參與者得到各自的結(jié)果，每一參與者的收益函數(shù)在所有參與者之間是公共知識①命題p是某個群體的公共知識指的是，該群體的每個人知道p，每個人知道知道每個人知道p……。

在這個實驗中，參加考試的176位學(xué)生是參與者，每個考生同時對0－100之間的數(shù)字進行選擇行動，即每個參與者的策略空間Si∈（0，100），即有101種可能的策略。根據(jù)所有考生的選擇，每個考生最后得出自己的結(jié)果，對每個考生來說，結(jié)果無非就是，自己的選擇是“大家所選數(shù)字的平均數(shù)的2／3”，勝出；要么與“大家所選數(shù)字的平均數(shù)的2／3”不一致，失敗。

我們假定該博弈的參與人都是絕對理性人（事實上，這個要求在實際中難以達(dá)到，這也是本文要得到的一個結(jié)論）。

我們來分析絕對理性人的推理過程。

要理解和把握“城鄉(xiāng)文化一體化”的涵義，不能僅僅就事論事，否則極有可能含糊其辭，甚至以訛傳訛。本文擬采取層級分離法，從三個依次遞進的層次逐一進行剖析，即先后解析“一體化”、“城鄉(xiāng)一體化”、“城鄉(xiāng)文化一體化”，以此來理解和把握“城鄉(xiāng)文化一體化”的涵義。

在這個博弈中策略組合有176×101種，每種策略組合下，每個人的收益是公共知識。如：如所有人都選100，平均數(shù)為100，此時每人都失敗，勝出結(jié)果是100× 2／3＝67；如175人都選100，有一個人選擇了67，那么選100的人失敗，而選擇67的人勝出……所以這些是理性參與人的公共知識。

我們看到，任何人都不應(yīng)該選67或以上，或者選擇67或以上是非理性的，因為所選擇的數(shù)字的最大平均數(shù)為100，此時勝出的數(shù)字為67，因此選擇67以上而獲勝的可能性是沒有。因此，作為理性人他們都不會選擇67或以上。

每個人都不會選擇67或以上，這本身也是公共知識。在這樣的公共知識的前提下，45以上的選擇都是不合理的，因為對每個人而言，只有在他人都選擇67以上，我選擇45或以上才是合理的（67的2／3約為45）。

每個人都不會選擇45或以上，這本身也是公共知識。于是，每個人都認(rèn)為不應(yīng)該選擇30或以上。

……

結(jié)論是：每個人選擇0或1是合理的，它們是該博弈的理論解。

事實上，每個人選擇0或都選擇1是納什均衡：對每個人而言，在其他人不改變選擇的情況下，當(dāng)下的選擇是最優(yōu)的。

在所有人均選擇0的情況下，因為對于每個人而言，若所有人都選擇0的話，0便成為平均數(shù)，該數(shù)的2／3還是0。這樣，他選擇0是最優(yōu)選擇：在他人不改變選擇的情況下，他改變選擇將失敗。因此這點構(gòu)成納什均衡。

在所有人均選擇1的情況下，同樣，對于每個人而言，在其他人選擇1的情況下，平均數(shù)1的2／3為0.67，此時1最接近該數(shù)。因此，他選擇1是最優(yōu)選擇，并且若他改變了他的選擇他將失敗。因此，這點也構(gòu)成納什均衡。

當(dāng)然，面對多個納什均衡，作為理性的參與人作何選擇才能勝出呢？具體到這個博弈中，每個人要考慮的是，他選擇0還是選擇1才能勝出呢？

他會這樣思考：沒有理由認(rèn)為其中一個比另外一個更有可能勝出，這樣，選擇0或1勝出的概率為50%，但是，他人能夠與我有同樣的想法。既然如此，期望平均數(shù)應(yīng)該為0.5×1＋0.5×0＝0.5。于是，0.5的2／3接近0。因此，選擇0是最優(yōu)選擇。

從上面的分析可見，盡管0和1是納什均衡點，但選擇0是最優(yōu)選擇。

三、改進博弈論的可能路徑

本文已經(jīng)表明，上述博弈是一個完全信息靜態(tài)博弈，然而，本實驗的實驗解（14.61）與理論解（0或1）之間發(fā)生偏離。本文認(rèn)為，有兩個主要原因：

第一，博弈論中所假定的理想主體與實際中的決策主體不相符合。理想的博弈參與人是絕對理性人：他們能夠進行任何有窮步驟的推理，能夠分析所有有窮可能的情況，并且他們的推理、分析是在瞬時完成的，而實際博弈中人們是有界理性的。在我們的博弈實驗中若參與者是理想主體，他們能夠做本文上一部分那樣的分析，他們應(yīng)當(dāng)知道0和1是均衡解，也能夠預(yù)測0是最有可能實現(xiàn)的結(jié)果。本實驗表明，并不是所有人都能夠做出這樣分析的。并且，在實際中存在完全非理性的選擇，如本實驗中選擇大于67的3人，這不是完全偶然現(xiàn)象。

第二，博弈論假定了博弈中參與人是理性的是博弈參與人之間的公共知識，而在實際博弈中這一點不能保證，并且博弈參與人越多，理性人是公共知識越不能保證。本實驗參與人有近200人，這是實驗者之間的公共知識，這也使得選擇者對他人的理性沒有信心。上面本文給出一個選擇者選擇的理由，他對在座的同學(xué)“有信心”才將數(shù)字選得“接近1一點，選10”；若絕對有信心，應(yīng)當(dāng)選擇理論解0或1。

博弈論作為社會科學(xué)的方法論工具有其巨大的威力，然而由于其假定與現(xiàn)實的偏離使得其理論解與實驗解存在巨大偏離。根據(jù)上述兩點原因，我們可以通過修改博弈論的假定而改進博弈論。這個改進路徑有兩條：第一，弱化博弈論的理性人假定，引進西蒙的有界理性概念；第二，弱化理性人的公共知識假定，用公共p信念來替代公共知識假定［2］。通過這樣的改進，博弈論能夠更好地作為社會科學(xué)的方法論以解釋社會現(xiàn)象。

［1］ Ken Binmore.Why Experiment in Economics？［J］.The E－conomic Journal，1999（2）.

［2］周章買.從博弈論看公共P－信念對協(xié)同攻擊難題的解決［J］.哲學(xué)動態(tài)，2010（5）.

［3］ Martin Hollis，Robert Sugden.Rationality in Action［J］.Mind.New Series，1993，102.

［4］羅伯特·吉本斯.博弈論基礎(chǔ)［M］.高峰譯.北京：中國社會科學(xué)出版社，1999.

1671－511X（2012）04－0020－03

2011－12－26

劉曉麗（1982－），女，河南許昌人，南京大學(xué)哲學(xué)系博士研究生，研究方向：科學(xué)邏輯。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

從博弈實驗看博弈論作為社會科學(xué)方法論的局限性

一、博弈實驗及結(jié)果分析

二、博弈的理論解分析

三、改進博弈論的可能路徑

一、博弈實驗及結(jié)果分析

二、博弈的理論解分析