陳建先
(中共重慶市委黨校, 重慶 400041)
以“博弈”兩字在“百度”進(jìn)行檢索,會(huì)顯現(xiàn)出相關(guān)結(jié)果約667萬條,而以“博弈論理論體系”為關(guān)鍵詞在“中國知網(wǎng)(CNKI)”“萬方”“維普”等數(shù)據(jù)庫進(jìn)行檢索,只有2011年2月發(fā)表在《商業(yè)時(shí)代》的《博弈論理論體系及其應(yīng)用發(fā)展述評(píng)》①一文(但僅有幾百字闡述理論體系)。也就是說,包含“博弈”一詞的文章不計(jì)其數(shù),但是較為深入地研究博弈論理論體系的文章卻近乎為零。
諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者保羅·薩繆爾森(Paul Samuelson)曾說過:“要想在現(xiàn)代社會(huì)做一個(gè)有文化的人,你必須對(duì)博弈論有一個(gè)大致了解。”[1]現(xiàn)在,理論研究的內(nèi)生化[2]較為嚴(yán)重,我國最權(quán)威的博弈論專家、北京大學(xué)張維迎教授這樣描述博弈論的研究價(jià)值:如果對(duì)博弈論不了解的話,那么我們?cè)诮?jīng)濟(jì)學(xué)、法學(xué)、社會(huì)學(xué)、政治學(xué)等學(xué)科上都很難對(duì)前沿問題進(jìn)行研究[3]15。
(一)博弈論的研究價(jià)值
時(shí)間和空間是描述人類經(jīng)驗(yàn)的兩個(gè)基本維度[4]。不同歷史時(shí)期、不同地區(qū)的國家對(duì)博弈論的理解有較大差異。最初,博弈被視為“游戲”且與“賭博”相關(guān),而后成為數(shù)學(xué)的分支學(xué)科,博弈論被用于分析經(jīng)濟(jì)現(xiàn)象,隨后又被理解為策略互動(dòng)、思維方式和研究工具。
“博弈”(Game)是一種策略互動(dòng)。法國博弈論專家克里斯汀· 蒙特(Christian Montet)和丹尼爾·塞拉(Daniel Serre)在《博弈論與經(jīng)濟(jì)學(xué)》專著中這樣定義博弈:“博弈”這個(gè)詞應(yīng)理解為明智的、理性的個(gè)人或群體間沖突與合作的情形[5];1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者豪爾紹尼(John C.Harsanyi)在當(dāng)年獲獎(jiǎng)辭中是這樣定義的:博弈論是關(guān)于策略相互作用的理論,就是說,它是關(guān)于社會(huì)形勢(shì)中理性行為的理論,其中每個(gè)局中人對(duì)自己行為的選擇必須以他對(duì)其他局中人將如何反應(yīng)的判斷為基礎(chǔ)[6];2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者羅伯特·奧曼(Robert j.armann)將“博弈”定義為策略性的互動(dòng)決策[7]。其實(shí),博弈論的基本思想是立足最壞的情況、爭取最好的結(jié)果。
博弈論是一種思維方式。薩繆爾森曾說:“了解博弈論,將改變你整個(gè)一生的思維方式?!盵8]美國知名博弈論教授小約瑟夫·哈林頓(Joseph E.Harrington,Jr.)講:“無論在孔子、孫子的時(shí)代,還是現(xiàn)在,理解博弈論的思想都有助于人們分析戰(zhàn)略形勢(shì)。博弈論在競(jìng)爭、議價(jià)、社交和謀求合作等各種社會(huì)活動(dòng)中發(fā)揮了令人難以置信的作用?!盵9]法國著名經(jīng)濟(jì)學(xué)家吉恩·泰勒爾(Jean Tirole)曾說:“正如理性預(yù)期使宏觀經(jīng)濟(jì)學(xué)發(fā)生革命一樣,博弈論廣泛而深遠(yuǎn)地改變了經(jīng)濟(jì)學(xué)家的思維方式。”[10]著名經(jīng)濟(jì)學(xué)家鮑爾·魏瑞奇(Paul Weirich)也說道:“博弈論是思索者的樂園。”[11]12
博弈論是一種研究工具。許多人認(rèn)為博弈論是經(jīng)濟(jì)學(xué)的一個(gè)分支學(xué)科,但它并不涉及經(jīng)濟(jì)問題,只是一種分析工具而已;也有人認(rèn)為博弈論是經(jīng)濟(jì)學(xué)的范式,其實(shí)博弈論只是進(jìn)行人類行為研究的一種科學(xué)工具[2]14;還有學(xué)者認(rèn)為,馬克思主義非常注重現(xiàn)實(shí)社會(huì)問題的探討,而博弈論是描述和分析人類社會(huì)理性行為的最恰當(dāng)?shù)墓ぞ撸钥梢哉f博弈論是為馬克思主義發(fā)展“量身定做”的工具[11]3。張維迎曾講道:“正是由于能夠?yàn)樗械幕?dòng)情形提供一個(gè)統(tǒng)一的分析框架,博弈論現(xiàn)在已經(jīng)漸漸成為社會(huì)科學(xué)研究的一種基本方法。”[2]15實(shí)際上,所有的社會(huì)科學(xué)都可以看成是研究有關(guān)人的行為的科學(xué),即旨在揭示人的行為的規(guī)律特點(diǎn)和相互影響,而博弈論就是研究人的行為的一種分析工具。
(二)博弈論的研究現(xiàn)狀
1944年現(xiàn)代博弈論產(chǎn)生于西方,初期研究偏重于運(yùn)用數(shù)學(xué)方式探討經(jīng)濟(jì)現(xiàn)象,分析零和博弈到變和博弈、非合作均衡到合作均衡,其研究方式以數(shù)理為主、非數(shù)理*數(shù)理方式:一個(gè)博弈的結(jié)果,取決于參與人數(shù)量、策略數(shù)及博弈所得。非數(shù)理方式:一個(gè)博弈的結(jié)果,取決于“博弈的社會(huì)因素和心理因素”。關(guān)于博弈論的研究方式方法,為什么以數(shù)理方式和非數(shù)理方式進(jìn)行劃分(以前學(xué)界沒有這樣進(jìn)行分類劃分)?筆者以為,2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)之所以授予羅伯特·奧曼和托馬斯·謝林,前者是用數(shù)理方式研究博弈論,后者是用非數(shù)理方式研究博弈論,這就是很好的注釋。為輔;近期研究則側(cè)重于思維方式和思維理念的思考。國內(nèi)博弈論研究,無論是專著或教材,還是普及性讀物,更多的是國外博弈論的“翻版”。
1.國外博弈論的研究現(xiàn)狀(1944年至今)
博弈,先與游戲、賭博相聯(lián),后與概率、數(shù)學(xué)相關(guān);在現(xiàn)代社會(huì),則與經(jīng)濟(jì)、數(shù)學(xué)、管理、社會(huì)、心理和思維等聯(lián)系緊密。博弈論,從經(jīng)濟(jì)學(xué)研究到諸多學(xué)科探討,從數(shù)理分析到非數(shù)理演繹,從非合作均衡到合作均衡,從策略選擇到思維理念,在短短幾十年間,悄然地發(fā)生著變化。
1944年馮·諾伊曼(John von Neumann)和奧斯卡·摩根斯坦(Oskar Morgenstern)的《博弈論與經(jīng)濟(jì)行為》出版,標(biāo)志著現(xiàn)代博弈論的產(chǎn)生。它將二人博弈推廣到n人博弈,并將博弈論應(yīng)用于經(jīng)濟(jì)學(xué)研究,提出了博弈3種表述方式(擴(kuò)展式、正規(guī)式和特征函數(shù)式)和二種解(極小極大解和穩(wěn)定集解)的概念。
1950年艾伯特·塔克(Albert Tucker)提出博弈論經(jīng)典假設(shè)“囚徒困境”,成為了解、研究和探討博弈的“必讀”基礎(chǔ)理論。
1982年約翰·梅納德·史密斯(John Maynard Smith)的代表作《演化與博弈論》中,有一個(gè)經(jīng)典模型——鷹鴿博弈*鷹鴿博弈,即指鷹與鴿之間的博弈都有“戰(zhàn)斗”和“撤退”兩種策略,并且兩者之間的利益是對(duì)立的。它是博弈論中的一個(gè)基本模型,也為零和博弈提供了一個(gè)典型的模型假設(shè)。,對(duì)于如何分析零和博弈與變和博弈,給出了很好的范例。
1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者約翰·福布斯·納什(John Forbes Nash Jr)提出的“非合作均衡”(“納什均衡”)*納什均衡,是指給定你的策略,我的策略是最好的,給定我的策略,你的策略是最好的。在給定其他人策略的條件下,選擇自己優(yōu)勢(shì)策略,使其利益最大化。并且,在給定別人策略的情況下,沒有人有足夠理由打破這種均衡。,成為博弈論的核心內(nèi)容,幾乎所有領(lǐng)域都能找到其影子。此外,萊茵哈德·澤爾騰(Reimhard Selten)提出了多步博弈和子博弈*子博弈(subgame),即“博弈中的博弈”,它能夠自成一個(gè)博弈的某個(gè)動(dòng)態(tài)博弈的從其某個(gè)階段開始的后繼階段。子博弈是原始動(dòng)態(tài)博弈的一部分,能構(gòu)成一個(gè)獨(dú)立博弈。完全均衡概念;約翰·海薩尼(John Harsanyi)提出了不完全信息博弈。
2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者羅伯特·約翰·奧曼(Robert John Aumann)運(yùn)用數(shù)理方式破解了古猶太人的千古之謎(公平分配均衡),建立了“相關(guān)均衡”*相關(guān)均衡,是指參與者通過一個(gè)人們都能觀測(cè)到的共同信號(hào)來進(jìn)行選擇,由此確定博弈的均衡。理論;托馬斯·謝林(Thomas C.Schelling)運(yùn)用非數(shù)理方式分析社會(huì)中的沖突與合作,建立了“聚點(diǎn)均衡”*聚點(diǎn)均衡,是指在效率曲線中,博弈者的利益是對(duì)立的,沒有帕累托改進(jìn),這種對(duì)立只是一種邏輯上的可能性,在效率曲線中必然存在一點(diǎn),使得博弈者的利益是一致的。理論。
2012年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者羅伊德·夏普利(Lloyd S.Shapley)提出了博弈“核仁”理論*“核仁”理論,施麥德勒(Schmeidler,1969年)最早提出“核仁”(Nucleolus)概念。在博弈中,它是合作博弈的一個(gè)均衡解。《塔木德》中“三妻分產(chǎn)”的公平分配原則,就充分體現(xiàn)了“核仁”思想。、“夏普利值”*夏普利值(Shapley values),是指夏普利提出的一種博弈均衡解,而具有唯一均衡解的稱為值。即為如何決定一個(gè)n人討價(jià)還價(jià)博弈中每個(gè)參與人的所得的分配比例提供了一種很好的方法。按照參與人對(duì)于聯(lián)盟的貢獻(xiàn)來分配聯(lián)盟得到的總效用。如果說納什均衡是非合作博弈的核心概念,那么夏普利值就是合作博弈的核心概念。和“穩(wěn)定配置”(GS算法)*“穩(wěn)定配置”(GS算法),為分析穩(wěn)定性匹配的關(guān)鍵性問題,從合作博弈角度出發(fā),提出的求解穩(wěn)定配置的算法(GS算法)。采用GS算法完成的配置是穩(wěn)定配置,且在參與人數(shù)有限的配對(duì)情形中,經(jīng)過有限輪次的配對(duì)之后總能找到穩(wěn)定的配置,即所謂“穩(wěn)定配置存在性”。。
總之,以上更多是以數(shù)理方式進(jìn)行研究,而另一種則是以非數(shù)理方式進(jìn)行研究。托馬斯·謝林認(rèn)為,在博弈交互狀況下,博弈主體的期望和行為無法通過純粹的邏輯和數(shù)學(xué)推導(dǎo)(數(shù)學(xué)模型)進(jìn)行選擇,而更多的是依靠非數(shù)理因素進(jìn)行選擇。
受諸多諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者推崇的博弈論大師阿維納什·K·迪克西特(Avinash K.Dixit)與人合著的《策略思維》《策略博弈》和《妙趣橫生博弈論》中,經(jīng)典博弈“雙選游戲”*雙選游戲,即兩人(A和B)在1~100進(jìn)行選擇,如A和B所選的數(shù)相同,即獲成功。如何達(dá)到合作均衡?用數(shù)理分析,概率只有萬分之一。筆者在培訓(xùn)中曾做過200余次(具體分析見“行政論壇”《從零和博弈到變和博弈的裂變》2011.4)。就運(yùn)用了非數(shù)理方式進(jìn)行策略選擇。
美國耶魯大學(xué)博弈論專家本·波拉克(Ben Polak)在中國網(wǎng)易視頻公開課《博弈論》中,系統(tǒng)地研究、分析了博弈論的基礎(chǔ)理論,其經(jīng)典博弈選數(shù)游戲*選數(shù)游戲,即所有參與者不能溝通,從1~100選擇一個(gè)數(shù),誰選的數(shù)字最接近平均數(shù)的2/3的數(shù),誰就是贏家。筆者從2010年至2013年底,在146個(gè)培訓(xùn)班(總?cè)藬?shù)7 418)做過該博弈,效果非常好(具體分析見“領(lǐng)導(dǎo)科學(xué)”《現(xiàn)代領(lǐng)導(dǎo)的策略理念》2010.7)。運(yùn)用了非數(shù)理方式演繹策略選擇原則。
在世界性博弈論研討會(huì)——“合作及社會(huì)困境研討會(huì)”(荷蘭)上,與會(huì)專家曾體驗(yàn)“金幣游戲”*金幣游戲,即“合作及社會(huì)困境研討會(huì)”(荷蘭)中,主持人與參會(huì)博弈論專家(43位)進(jìn)行的博弈。規(guī)則:彼此不能溝通,如投幣總數(shù)達(dá)到250美元,每人可得到10美元,反之則無。筆者在10年里做過近500次(具體分析見《博弈的樂趣》中國言實(shí)出版社2013.6)。,詮釋了博弈概念、博弈要素和沖突與合作均衡解。
2.國內(nèi)博弈論的研究現(xiàn)狀(1960年至今)
“博弈”一詞,最早出現(xiàn)在中國古代《論語·陽貨》:“飽食終日,無所用心,難矣哉。不有博弈乎?”“石頭·剪子·布”、象棋圍棋、田忌賽馬、《孫子兵法》和《九宮算數(shù)》等都有許多博弈因子,然而具有現(xiàn)代意義的博弈論卻沒有產(chǎn)生在中國。
1960年,前蘇聯(lián)數(shù)學(xué)家尼·尼·沃羅比約夫(H·H.BopoobeB)教授在中國傳授博弈論,中國科學(xué)院數(shù)學(xué)研究所第二室將其講義稿編輯成冊(cè)并出版,命名為《對(duì)策論(博弈論)講義》。
20世紀(jì)八九十年代,北京大學(xué)張維迎在留學(xué)牛津大學(xué)時(shí)開始接觸博弈論,1996年出版了《博弈論與信息經(jīng)濟(jì)學(xué)》,后被列為“國家‘十二五’重點(diǎn)圖書”;中山大學(xué)王則柯訪學(xué)時(shí)與迪克西特認(rèn)識(shí),開始接觸博弈論,于2004年主編了《博弈論教程》一書,被列為“21世紀(jì)經(jīng)濟(jì)學(xué)系列教材”“普通高等教育‘十一五’國家級(jí)規(guī)劃教材”。
21世紀(jì)初,博弈論普及性讀物開始出現(xiàn),如潘天群的《博弈生存》、白波的《博弈游戲》、董志強(qiáng)的《身邊的博弈》和陳建先的《博弈的樂趣》等,多以非數(shù)理方式(假設(shè)、實(shí)驗(yàn)、案例、故事和游戲)演繹博弈論。目前,博弈論作為研究利益調(diào)整問題和理性行為主體相互作用的形式理論,已經(jīng)成為社會(huì)矛盾沖突問題研究“范式”的重要工具[12]。
我國著名博弈論專家王則柯在其翻譯的《妙趣橫生博弈論》一書“導(dǎo)讀”中講道:博弈論作為一門科學(xué)遠(yuǎn)非完備,大量的策略思維仍然是一門藝術(shù)[13]。不同學(xué)科背景的學(xué)者,往往從不同學(xué)科(經(jīng)濟(jì)學(xué)、政治學(xué)、管理學(xué)和決策學(xué))的視角來研究博弈論理論體系。
(一)國外博弈論理論體系
在國外博弈論專著及教材中,最為經(jīng)典的當(dāng)數(shù)《博弈論與經(jīng)濟(jì)行為》《哈林頓博弈論》《博弈論教程》《策略思維》《策略博弈》《妙趣橫生博弈論》,以及網(wǎng)易公開課《博弈論》教學(xué)視頻。
美國馮·諾伊曼和奧斯卡·摩根斯坦的《博弈論與經(jīng)濟(jì)行為》(生活·讀書·新知三聯(lián)書店,2004年),開創(chuàng)了現(xiàn)代博弈論的歷史。全書總共12章,66萬字,其主體結(jié)構(gòu)為:第一部分是“導(dǎo)言”(1章),第二部分是博弈類型分析(11章)。
美國知名博弈論教授小約瑟夫·哈林頓所著的《哈林頓博弈論》(中國人民大學(xué)出版社,2012年),被稱為美國最優(yōu)秀、最通用的博弈論本科教材,是美國斯坦福大學(xué)、賓夕法尼亞州立大學(xué)、佛羅里達(dá)州立大學(xué)、弗吉尼亞州立大學(xué)和達(dá)特茅斯學(xué)院等大學(xué)長期采用的教科書。全書總共17章,75萬字,其主體結(jié)構(gòu)為:第一部分是博弈論概述,第二部分是求解策略式博弈,第三部分是求解擴(kuò)展式博弈,第四部分是不完全信息博弈,第五部分是重復(fù)博弈,第六部分是演化博弈。這6個(gè)部分實(shí)際上分為三大塊:博弈論概述(2章)、策略的多元化探討(13章)和演化博弈(2章)。
英國科學(xué)院肯·賓默爾所著的《博弈論教程》(格致出版社,2010年)被英國稱為最適合高年級(jí)本科生或低年級(jí)研究生的博弈論教材,羅伯特·奧曼對(duì)他的評(píng)價(jià)很高:“賓默爾是博弈論的杰出倡導(dǎo)者。他的許多著作寫作風(fēng)格清新愉快,引人入勝,正如本書一樣?!盵14]封底該書21章,總共76萬字,其主體結(jié)構(gòu)為:博弈論做什么(1章)、博弈論如何應(yīng)用(14章)、博弈論為什么對(duì)(6章)[14]前言。
美國普林斯頓大學(xué)教授阿維納什·迪克西特所著的《策略思維》(中國人民大學(xué)出版社,2002年),全書總共15章,36萬字,其主體結(jié)構(gòu)為:第一部分是博弈論的基礎(chǔ)(3章),第二部分是策略博弈(4章),第三部分是策略案例(6章);《策略博弈》(中國人民大學(xué)出版社,2009年)全書總共18章,73萬字,其主體結(jié)構(gòu)為:第一部分是導(dǎo)論與一般性原理(2章),第二部分是概念及技巧(6章),第三部分是某些更為廣拓的博弈與策略類型(5章),第四部分是在特定策略情形下的應(yīng)用(5章);《妙趣橫生博弈論》(機(jī)械工業(yè)出版社,2009年)全書總共14章,40萬字,其主體結(jié)構(gòu)為:第一篇是基礎(chǔ)博弈(4章),第二篇是策略選擇(3章),第三篇是策略類型及案例(7章)。
美國耶魯大學(xué)本· 波拉克教授2007年在哈佛大學(xué)的網(wǎng)絡(luò)公開課教學(xué)視頻《博弈論》(后在中國網(wǎng)易公開課播放,共24集),從5個(gè)入門結(jié)論著手,較為系統(tǒng)地介紹了有關(guān)博弈論機(jī)理和戰(zhàn)略策略,如換位思考、支配思想、落后感應(yīng)、納什均衡、進(jìn)化穩(wěn)定性、承諾信譽(yù)、信息不對(duì)稱和逆向選擇等博弈要素。
(二)國內(nèi)博弈論理論體系
國內(nèi)博弈論專著及教材中,最為經(jīng)典的當(dāng)數(shù)《對(duì)策論(博弈論)講義》《博弈論與信息經(jīng)濟(jì)學(xué)》《博弈論教程》和《博弈論》。
《對(duì)策論(博弈論)講義》(人民教育出版社,1960年)是我國第一本博弈論專著,其特點(diǎn)包括:一是名稱具有不確定性(博弈論或?qū)Σ哒?;二是學(xué)科定位為數(shù)學(xué);三是性質(zhì)作為批評(píng)性觀點(diǎn)介紹。
北京大學(xué)博弈論專家張維迎教授1996年的博弈論專著《博弈論與信息經(jīng)濟(jì)學(xué)》(上海人民出版社,2004年),是1998—2002年中文社會(huì)科學(xué)引文索引(CSSCI)中被引用最多的50種中文圖書之一,位列1979年后出版的中文圖書第三名(第一名、第二名分別為《鄧小平文選》和《毛澤東文集》),后又被列為“國家‘十二五’重點(diǎn)圖書”。全書總共8章,47萬字,其主體結(jié)構(gòu)為:“導(dǎo)論”(1章);第一部分為“非合作博弈理論”(4章),即完全信息靜態(tài)博弈論、完全信息動(dòng)態(tài)博弈、不完全信息靜態(tài)博弈和不完全信息動(dòng)態(tài)博弈;第二部分為“信息經(jīng)濟(jì)學(xué)”(3章),即委托-代理理論(Ⅰ)、委托-代理(Ⅱ)和逆向選擇與信號(hào)傳遞。
中山大學(xué)博弈論專家王則柯教授主編的《博弈論教程》(中國人民大學(xué)出版社,2004年),全書總共9章,54萬字,其主體結(jié)構(gòu)為:第一部分是引論(1章),第二部分是策略博弈的各種類型分析(8章)。
南開大學(xué)博弈論專家姚國慶教授主編的《博弈論》(高等教育出版社,2007年)被列為“普通高等教育‘十一五’國家級(jí)規(guī)劃教材”。全書總共8章,34萬字,其主體結(jié)構(gòu)為:第一部分(5章)主要討論完全信息博弈理論;第二部分(2章)主要討論非完全信息博弈理論;第三部分(1章)主要介紹博弈理論的一些新的擴(kuò)展。
北京大學(xué)博弈論專家涂志勇教授主編的《博弈論》(北京大學(xué)出版社,2007年)被列為“21世紀(jì)經(jīng)濟(jì)學(xué)研究生規(guī)劃教材”。全書總共9章,22萬字,其主體結(jié)構(gòu)為:第一部分是博弈論基礎(chǔ)(4章);第二部分是博弈策略的方式分析(5章)。
綜上所述,無論是國內(nèi)外博弈論專著或教材,還是普及性讀物以及教學(xué)視頻,都為博弈論的發(fā)展、普及作出了巨大貢獻(xiàn)。其邏輯結(jié)構(gòu)和主體要素可概括為:第一,總體結(jié)構(gòu)分為3部分,探討博弈理論(博弈涵義、博弈要素、博弈理性和博弈演繹等)、策略類型(同時(shí)策略、相繼策略、邊界策略、概率策略和博弈均衡等)和案例運(yùn)用(導(dǎo)彈危機(jī)、田忌賽馬、書商策略和三妻分產(chǎn)等);第二,非常注重博弈分類研究,即從完全信息的靜態(tài)博弈到完全信息的動(dòng)態(tài)博弈,再到不完全信息的靜態(tài)博弈及不完全信息的動(dòng)態(tài)博弈,以及無限博弈與有限博弈、一次博弈與重復(fù)博弈、零和博弈與變和博弈、合作博弈與非合作博弈等;第三,分析博弈論主體要素的內(nèi)在聯(lián)系和邏輯結(jié)構(gòu)的甚少,尤其是缺乏對(duì)博弈論邏輯起點(diǎn)、結(jié)構(gòu)框架和理論體系進(jìn)行較為系統(tǒng)的探索探討、分析研究,更多的是在博弈要素的多少上進(jìn)行斟酌。并且,對(duì)于當(dāng)代博弈論研究的重點(diǎn)——博弈價(jià)值取向、觀念理念和均衡結(jié)果等問題的研究探討較少。
理論是從紛繁復(fù)雜的現(xiàn)實(shí)世界中總結(jié)、提煉出一些帶有規(guī)律性的關(guān)系。理論具有發(fā)現(xiàn)知識(shí)的空白、驗(yàn)證理論與事實(shí)是否相符的功能。如果通過經(jīng)驗(yàn)式研究發(fā)現(xiàn)理論與事實(shí)不符,則有可能彌補(bǔ)、完善其理論,甚至發(fā)現(xiàn)和建立新的理論[15]。探討博弈論理論體系,主要涉及兩個(gè)邏輯問題:一是博弈論的邏輯起點(diǎn)(邏輯可以理解為思維規(guī)律);二是博弈論的邏輯結(jié)構(gòu)(理論體系)[16]。
(一)博弈論的邏輯起點(diǎn)
馬克思撰寫的《資本論》所要探討的問題非常多,很難形成一個(gè)理論體系,但他卻找到了資本的邏輯起點(diǎn)——商品。從“商品”這個(gè)概念出發(fā),形成了一個(gè)嚴(yán)密的、科學(xué)的理論體系。經(jīng)濟(jì)學(xué)所要探討的問題也極其多,而其邏輯起點(diǎn)為“經(jīng)濟(jì)人”。博弈論所涉及的問題也特別多,其邏輯起點(diǎn)又是什么呢?
經(jīng)濟(jì)學(xué)認(rèn)為,博弈論研究的重點(diǎn)是:博弈靜態(tài)或動(dòng)態(tài)、信息完全或不完全(完全信息的靜態(tài)博弈和完全信息的動(dòng)態(tài)博弈,不完全信息的靜態(tài)博弈和不完全信息的動(dòng)態(tài)博弈),側(cè)重于博弈的分類研究。決策學(xué)認(rèn)為,博弈論研究的重點(diǎn)是:博弈策略是理性或非理性,是絕對(duì)理性或有限理性(優(yōu)勢(shì)策略、劣勢(shì)策略、最佳策略、滿意策略),側(cè)重于博弈的判斷和選擇。政治學(xué)認(rèn)為,博弈論研究的重點(diǎn)是:博弈是正義或非正義,側(cè)重于博弈的公平正義分析。管理學(xué)認(rèn)為,博弈論研究的重點(diǎn)是:博弈規(guī)則是合規(guī)或不合規(guī),側(cè)重于博弈的規(guī)則探討。
筆者認(rèn)為,博弈論研究的邏輯起點(diǎn)是博弈策略*策略,《哈林頓博弈論》的解釋:策略是規(guī)定參與者在博弈中如何采取行動(dòng)的決定。。為什么“博弈策略”是博弈論中的核心問題和邏輯起點(diǎn)呢?第一,博弈“Game”一詞,有游戲、規(guī)則、策略之義。從博弈論角度來理解,最為重要的是“博弈策略”之意。博弈,實(shí)際上就是研究探討策略價(jià)值、策略互動(dòng)和策略均衡。第二,研究“博弈策略”是認(rèn)識(shí)、理解博弈論的基本前提。羅伯特·奧曼認(rèn)為博弈是策略性的互動(dòng)決策。博弈論的精髓是交互的決策論。博弈的核心是“博弈策略”問題。所以,認(rèn)識(shí)理解博弈首先應(yīng)該從“博弈策略”開始。第三,博弈策略貫穿于整個(gè)博弈過程的始終,決定著博弈的主體內(nèi)容。在博弈論的研究中,如果離開了“博弈策略”這一核心內(nèi)容,就必然失去目標(biāo)和方向。
(二)博弈論的理論體系
中國科學(xué)院規(guī)劃教材《博弈論及其應(yīng)用》的作者汪賢裕和肖玉明在該書的前言中提到,博弈論體系可分為兩類:一類是以“對(duì)策論”冠名,著重于博弈論中的數(shù)學(xué)理論體系;另一類是以“博弈論”冠名,著重于非合作博弈及在經(jīng)濟(jì)學(xué)中的應(yīng)用[17]。學(xué)者江能在《博弈論理論體系及其應(yīng)用發(fā)展評(píng)述》中將博弈論劃分為靜態(tài)博弈、動(dòng)態(tài)博弈、完全信息博弈和不對(duì)稱信息博弈等幾大理論體系[18]。其實(shí),博弈論體系不僅僅局限于這4個(gè)方面的內(nèi)容,如博弈的基本理論是什么?博弈的策略原則和策略技巧是什么?博弈的目標(biāo)價(jià)值和觀念理念是什么?
創(chuàng)建博弈論理論體系應(yīng)該思考的幾個(gè)問題:一是確立博弈論理論體系的核心概念及邏輯起點(diǎn),并將其標(biāo)示在博弈論的理論體系之中;二是尋找博弈論的理論與實(shí)踐的互驗(yàn)關(guān)系,探尋理論選擇與現(xiàn)實(shí)實(shí)踐的互動(dòng)關(guān)系;三是從基礎(chǔ)層面拓寬博弈論理論與社會(huì)科學(xué)理論的視野,并將二者有機(jī)整合起來。
博弈論的“理論體系”研究,主要存在兩種不同的研究方法:一種側(cè)重于從要素的角度來研究博弈論問題,更多地注重博弈論有哪些要素,強(qiáng)調(diào)要素的組成,這種研究方法可稱為“要素體系”。這種理論體系無疑具有一定的借鑒意義,它使人們對(duì)博弈論的研究更深入、更全面,并對(duì)博弈論的發(fā)展和成熟產(chǎn)生重要的推動(dòng)作用。但是,“要素體系”也存在不足:要素的內(nèi)在邏輯聯(lián)系不夠緊密,雖然這些理論體系也注意到了要素與要素之間的聯(lián)系,但未能清楚地反映出要素與要素之間的本質(zhì)聯(lián)系和邏輯結(jié)構(gòu)。另一種側(cè)重于從邏輯的角度來研究博弈論問題,尋求一個(gè)貫穿于始終的邏輯要素,強(qiáng)調(diào)邏輯的起點(diǎn),這種研究方法可稱為“邏輯體系”(“理論體系”)。筆者認(rèn)為,要成為一門較為成熟的學(xué)科,首先應(yīng)從系統(tǒng)角度思考,分析歸納總結(jié),使其主體要素內(nèi)容構(gòu)成一個(gè)全面系統(tǒng)、前后銜接、邏輯一致的體系,而這個(gè)體系實(shí)質(zhì)上就構(gòu)成了一種理論體系。
通過對(duì)博弈論邏輯起點(diǎn)的確定、“理論體系”涵義的理解,筆者認(rèn)為,應(yīng)以“策略”為博弈論研究的邏輯起點(diǎn),以此演導(dǎo)出博弈論的邏輯結(jié)構(gòu)和主體要素,從而使博弈論研究的各個(gè)組成部分形成一個(gè)較為系統(tǒng)的、完整的、具有邏輯聯(lián)系的理論體系。具體來講,圍繞“策略”這一主脈,對(duì)博弈論進(jìn)行全方位梳理和歸納,演導(dǎo)出博弈論的邏輯結(jié)構(gòu)和主體要素,即沿著“策略”的內(nèi)在邏輯展開:“博弈機(jī)理”(涵義、特點(diǎn)、歷史、類型、方式和體系)——“博弈策略”(策略類型、策略原則和策略技巧)——“博弈均衡”(一般均衡到博弈均衡、非合作均衡到合作均衡和目標(biāo)價(jià)值與觀念理念)*《現(xiàn)代領(lǐng)導(dǎo)博弈思維》(陳建先,國家行政學(xué)院出版社,2013年),即按照“基礎(chǔ)篇”(博弈基礎(chǔ)、博弈特點(diǎn)、博弈歷史和研究方式)、“策略篇”(理論策略、實(shí)踐策略、規(guī)則策略和特例策略)和“均衡篇”(認(rèn)知信任、非合作均衡、合作均衡和均衡實(shí)例)等構(gòu)建理論體系。。博弈機(jī)理,是博弈策略和博弈均衡的基礎(chǔ);博弈策略,是博弈實(shí)現(xiàn)過程的拓展;博弈均衡,是博弈最終追求的結(jié)果。
博弈機(jī)理是博弈論的基礎(chǔ)部分,回答博弈論研究所涉及的基礎(chǔ)理論,主要包括:博弈的涵義(“Game”,東西方理解的博弈,“博弈”定義:策略性的互動(dòng)決策等);博弈論的歷史(古代中國、近代西方、現(xiàn)代西方等);博弈的要素(參與人、策略和得益等);博弈論的核心概念——理性(個(gè)體理性與集體理性、絕對(duì)理性與有限理性等);博弈的特點(diǎn)(互動(dòng)、依存、互驗(yàn),博弈論立足于最壞的情況、爭取最好的結(jié)果等);研究方式方法(擴(kuò)展式、規(guī)范式、倒推式、矩陣式、數(shù)理與非數(shù)理等);博弈論理論體系探討(博弈機(jī)理、博弈策略和博弈均衡等)。博弈機(jī)理是博弈策略的基礎(chǔ)理論,是博弈策略和博弈均衡的起點(diǎn)。
博弈策略是博弈論的重點(diǎn),回答策略分類、策略原則和策略原理,主要包括:博弈策略分類,總體可分為理論類和實(shí)踐類。理論類最為重要的是靜態(tài)博弈、動(dòng)態(tài)博弈、完全信息博弈和不對(duì)稱信息博弈等4種類型。除此之外,還有理性博弈與有限理性博弈、無限博弈與有限博弈、零和博弈與變和博弈、合作博弈與非合作博弈、一次性博弈與重復(fù)博弈、對(duì)稱性博弈與非對(duì)稱性博弈和非合作博弈均衡與合作博弈均衡等。實(shí)踐類分為同時(shí)策略與相繼策略、你先策略與他先策略、單向策略與雙向策略、最佳策略與滿意策略、優(yōu)勢(shì)策略與劣勢(shì)策略、公平策略與民主策略等。策略選擇原則包括選擇優(yōu)勢(shì)、淘汰劣勢(shì)等。策略選擇藝術(shù)包括邊界策略、少數(shù)派策略、規(guī)則策略、談判策略、選舉策略、拍賣策略、概率策略、旁觀者策略和權(quán)力指數(shù)策略等。博弈策略是博弈機(jī)理的實(shí)踐運(yùn)用,是博弈均衡的實(shí)現(xiàn)過程。
博弈均衡是博弈論的核心,回答博弈的價(jià)值取向、觀念理念和均衡結(jié)果,主要包括:博弈的價(jià)值取向(一般均衡到博弈均衡,零和博弈到變和博弈);博弈的觀念理念(信任認(rèn)同、競(jìng)爭合作和雙贏共贏);博弈的均衡結(jié)果(非合作博弈均衡[納什均衡]、合作博弈均衡[相關(guān)均衡和聚點(diǎn)均衡])。博弈均衡是博弈機(jī)理的終極目標(biāo),是博弈策略的最終結(jié)果。
通過對(duì)博弈論的邏輯起點(diǎn)、邏輯結(jié)構(gòu)和主體要素的描述,前后緊密聯(lián)系的3部分構(gòu)成了博弈論的邏輯結(jié)構(gòu)體系,明確回答:博弈依據(jù)——博弈機(jī)理,主要包含:策略涵義、策略概念、策略要素、策略理性、策略特點(diǎn)和策略互動(dòng);博弈運(yùn)行——博弈策略,主要包含:策略分類探討、策略選擇原則、策略選擇藝術(shù);博弈理念——博弈均衡,主要包含:一般均衡到博弈均衡、競(jìng)合關(guān)系與雙贏共贏、非合作均衡和合作均衡。這樣,博弈論的全部內(nèi)容和整體結(jié)構(gòu)就能由“策略”這一核心主線貫穿起來,從而形成心脈相通、血肉相聯(lián)、整體貫一的博弈論理論體系架構(gòu)。
[1] 阿維納什·K·迪克西特,巴里·J·奈爾伯夫.策略思維[M].王爾山,譯.北京:中國人民大學(xué)出版社,2002.
[2] 戚攻.對(duì)社會(huì)科學(xué)理論研究方法的一些思考[J].探索,2014(1):171-178.
[3] 張維迎.博弈與社會(huì)[M].北京:北京大學(xué)出版社,2013.
[4] 王志剛.空間正義:從宏觀結(jié)構(gòu)到日常生活[J].探索,2013(5):182-189.
[5] 克里斯汀·蒙特,丹尼爾·塞拉.博弈論與經(jīng)濟(jì)學(xué)[M].張琦,譯.北京:經(jīng)濟(jì)管理出版社,2005.
[6] 黃濤.博弈論教程[M].北京:首都經(jīng)濟(jì)貿(mào)易大學(xué)出版社,2004.
[7] 董志強(qiáng).身邊的博弈[M].北京:機(jī)械工業(yè)出版社,2007.
[8] 阿維納什·K·迪克西特,巴里·J·奈爾伯夫.策略思維[M].王爾山,譯.北京:中國人民大學(xué)出版社,2002.
[9] 小約瑟夫·哈林頓.哈林頓博弈論[M].韓玲,李強(qiáng),譯.北京:中國人民大學(xué)出版社,2012.
[10]張維迎.博弈論與信息經(jīng)濟(jì)學(xué)[M].上海:格致出版社,2012.
[11]熊義杰.現(xiàn)代博弈論基礎(chǔ)[M].北京:國防工業(yè)出版社,2010.
[12]彭小兵,鄭榮娟.利益博弈、制度公正與城市拆遷糾紛化解機(jī)制[J].重慶大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2010(1):39-46.
[13]阿維納什·K·迪克西特,巴里·J·奈爾伯夫.妙趣橫生博弈論[M].董志強(qiáng),譯.北京:機(jī)械工業(yè)出版社,2009.
[14]王則柯,李杰.博弈論教程[M].上海:格致出版社,2010.
[15]張夢(mèng)中.理論的建立與發(fā)展[J].中國行政管理,2001(12):48-56.
[16]胡象明.當(dāng)代中國政府與市場(chǎng)關(guān)系變遷的邏輯[J].行政論壇,2014(5):78-84.
[17]汪賢裕,肖玉明.博弈論及其應(yīng)用[M].北京:科學(xué)出版社,2008.
[18]江能.博弈論理論體系及其應(yīng)用發(fā)展評(píng)述[J].商業(yè)時(shí)代,2012(12):91-93.