納什均衡與我們的生活

2012-04-29 03:21:12劉亞婷

考試周刊 2012年25期

劉亞婷

摘要：納什均衡是博弈論的一個(gè)重要術(shù)語(yǔ)，以約翰·納什命名。納什均衡就是在人有限非合作博弈中的所有參與人的最優(yōu)策略組合。由于一個(gè)博弈的納什均衡解可能只有一個(gè)，也可能有多個(gè)，于是關(guān)于納什平衡點(diǎn)精煉的問(wèn)題逐漸被提出，而每一種精煉都是為了剔除某種不合理或者脆弱的納什平衡點(diǎn)，從而就產(chǎn)生了子博弈納什均衡、貝葉斯納什均衡、精煉貝葉斯納什均衡。

關(guān)鍵詞：博弈論納什均衡生活

納什均衡（Nash equilibrium），又稱(chēng)為非合作博弈均衡，是博弈論的一個(gè)重要術(shù)語(yǔ)，以約翰·納什命名。博弈論，又叫做游戲理論或?qū)Σ哒?，是一門(mén)以數(shù)學(xué)為基礎(chǔ)，研究對(duì)抗沖突中最優(yōu)解問(wèn)題的學(xué)科。雖然博弈論從本質(zhì)上來(lái)講是研究決策問(wèn)題，但與傳統(tǒng)的決策分析相比，博弈論更加關(guān)注的是博弈決策中博弈各方的互動(dòng)行為。博弈論思想最早源于中國(guó)古代，成書(shū)于春秋時(shí)期的《孫子兵法》中的軍事理論與治國(guó)策略就蘊(yùn)含了豐富深刻的對(duì)策思想。博弈論真正成為數(shù)學(xué)的一個(gè)分支始于1944年，Von Neumann和Morgenstern合作的《博弈論與經(jīng)濟(jì)行為》一書(shū)的出版，第一次給博弈（game）以明確的數(shù)學(xué)描述；對(duì)博弈現(xiàn)象最早用數(shù)學(xué)方法來(lái)研究的則是數(shù)學(xué)家E.Zermelo，始于國(guó)際象棋，體現(xiàn)于其論文《集合論在象棋對(duì)策中的應(yīng)用》（1912）；其后法國(guó)數(shù)學(xué)家Borel討論引入了“最優(yōu)策略”，并證明了其普遍存在性，同時(shí)預(yù)測(cè)了一些結(jié)論；在1950年和1951年，納什提出了非合作博弈的均衡解，并證明了均衡解的存在，自此博弈發(fā)展到了一個(gè)很重要的階段；到了二十世紀(jì)八九十年代，博弈論逐漸走向成熟，其發(fā)展已進(jìn)入前所未有的輝煌時(shí)期，博弈論重構(gòu)經(jīng)濟(jì)學(xué)大廈的趨勢(shì)正逐步變?yōu)楝F(xiàn)實(shí)，在經(jīng)濟(jì)學(xué)中的應(yīng)用越來(lái)越廣泛，并正以主流經(jīng)濟(jì)學(xué)的面貌出現(xiàn)。隨著博弈論的不斷成熟，它不僅僅在經(jīng)濟(jì)領(lǐng)域和數(shù)學(xué)領(lǐng)域被廣泛研究，我們發(fā)現(xiàn)博弈的思想在日常生活中無(wú)處不在，博弈就像空氣，時(shí)刻伴隨在我們身邊，例如有名的“囚徒困境”、“智豬博弈”、“性別大戰(zhàn)”等，還有小孩子們玩的“石頭剪刀布”、“擲硬幣”，大人們玩的“斗地主”、麻將、象棋、乒乓球等都是博弈論的應(yīng)用。如果將博弈論與生活結(jié)合起來(lái)，那么生活中每個(gè)人都如同棋手，其每一種行為如同在一張隱形的棋盤(pán)上布一個(gè)子，精明慎重的棋手們相互揣摩、相互牽制，人人爭(zhēng)贏，下出許多精彩紛呈、變化多端的棋局，而博弈論正是研究棋手們的策略與技巧，并將其系統(tǒng)化的一門(mén)科學(xué)。換句話(huà)說(shuō)，就是研究個(gè)體如何在錯(cuò)綜復(fù)雜的相互影響中找到最合理的策略。

一

在博弈論中，納什是完全信息靜態(tài)博弈的代表人物，他在1950年和1951年發(fā)表的兩篇論文中定義了非合作博弈及其均衡解，并給出了均衡解的證明，后來(lái)人們稱(chēng)它為納什均衡，即是假設(shè)有個(gè)參與人博弈，給定其他人戰(zhàn)略的情況下，每個(gè)人選擇自己的最優(yōu)策略（個(gè)人最優(yōu)策略可依賴(lài)于也可能不依賴(lài)于其他人的策略），所有參與人選擇的策略一起構(gòu)成一個(gè)策略組合。納什均衡指的就是所有參與人的最優(yōu)策略組合。為了清楚地了解納什均衡，我們就以“囚徒困境”為例。據(jù)說(shuō)有一位富翁家中財(cái)物被盜，警方通過(guò)此偵破此案，發(fā)現(xiàn)有兩個(gè)嫌疑人A和B，將他們抓獲后從他們的住處搜出受害人家中丟失的財(cái)物。但是，他們都矢口否認(rèn)，于是警方將兩人分開(kāi)審訊。為了擊垮他們的心理防線(xiàn)，警方告訴他們，如果主動(dòng)坦白，可以從輕處罰；如果頑抗到底，一旦同伙招供，就要受到嚴(yán)懲。當(dāng)然，如果兩人都坦白，就不存在“主動(dòng)交代”，兩人都要受到嚴(yán)懲，只不過(guò)比抵賴(lài)要處罰輕一些。在這種情形下，兩個(gè)囚犯都可以作出自己的選擇，或者招供，即與警察合作，從而背叛他的同伙；或者保持沉默，與警察對(duì)抗到底。這樣，就會(huì)出現(xiàn)以下幾種情況：

在這個(gè)例子里，納什均衡就是（坦白，坦白），在給定B坦白的情況下，A的最優(yōu)策略是坦白，同理，給定A坦白的情況下，B的最優(yōu)策略也是坦白。實(shí)際上，這里的（坦白，坦白）不僅是納什均衡，而且是一個(gè)占優(yōu)策略均衡，就是說(shuō)，不論對(duì)方如何選擇，個(gè)人的最優(yōu)選擇都是坦白。比如說(shuō)，若B抵賴(lài)，A坦白的話(huà)被放出來(lái)，抵賴(lài)的話(huà)被判1年，所以坦白比抵賴(lài)好；若B坦白，A坦白的話(huà)被判8年，抵賴(lài)的話(huà)被判10年，所以坦白還是比抵賴(lài)好，這樣坦白既是A的占優(yōu)策略，又是B的占優(yōu)策略，結(jié)果是每個(gè)人都選擇坦白，各判8年?！扒敉嚼Ь场狈从沉藗€(gè)人理性與集體理性的矛盾，雖然兩個(gè)都抵賴(lài)各判刑1年顯然比都坦白各判刑8年好，但是他不滿(mǎn)足個(gè)人理性要求，即（抵賴(lài)，抵賴(lài)）不是納什均衡。

“囚徒困境”的思想在我們的日常生活中有著廣泛的應(yīng)用，比如市場(chǎng)上的商家常常通過(guò)降價(jià)來(lái)爭(zhēng)奪市場(chǎng)，假設(shè)商家A和商家B是某市場(chǎng)上的兩個(gè)競(jìng)爭(zhēng)對(duì)手，他們?cè)瓉?lái)用同一種較高的價(jià)格銷(xiāo)售相同的產(chǎn)品，若這兩商家不滿(mǎn)足他們?cè)瓉?lái)的市場(chǎng)份額和利潤(rùn)，就都想通過(guò)降價(jià)來(lái)爭(zhēng)奪更大的市場(chǎng)份額和利潤(rùn)。但值得注意的是，當(dāng)自己的降價(jià)引起對(duì)手的報(bào)復(fù)時(shí)，這種目的就不一定達(dá)到。假設(shè)兩商家在原來(lái)的高價(jià)策略下各可以獲利200萬(wàn)元，若商家A單獨(dú)降價(jià)可以獲得250萬(wàn)元利潤(rùn)，此時(shí)商家B因?yàn)槭袌?chǎng)份額被商家A搶去利潤(rùn)將下降到80萬(wàn)元，此時(shí)商家B也采取了降價(jià)，則兩商家都只能得到120萬(wàn)元利潤(rùn)，此時(shí)博弈可以由下表表示：

由此表容易看出，假設(shè)商家B采用高價(jià)策略，那么商家A采用高價(jià)的200萬(wàn)，采用低價(jià)得250萬(wàn)，由于250大于200，商家A應(yīng)采用低價(jià)，假設(shè)商家B采用低價(jià)，那么商家A采用高價(jià)得益80萬(wàn)，采用低價(jià)得益120萬(wàn)，由于120大于80，因此商家A也采用低價(jià)，用同樣的方法分析商家B，商家B也應(yīng)選低價(jià)策略，因而這個(gè)博弈的最終結(jié)果就是兩商家都采用低價(jià)，最終各得120萬(wàn)元利潤(rùn)，即（120，120）就是納什均衡解。當(dāng)然囚徒困境思想的應(yīng)用不僅僅是這一個(gè)例子，它還應(yīng)用在公共產(chǎn)品的供給、軍備競(jìng)賽、股票市場(chǎng)等許多方面。

二

由于一個(gè)博弈的納什均衡解不止一個(gè)，有些博弈可能有無(wú)數(shù)個(gè)納什均衡解，于是澤爾騰在1965年通過(guò)對(duì)動(dòng)態(tài)博弈的分析完善了納什均衡的概念，定義了“子博弈精煉納什均衡”，這個(gè)概念的中心意義是將納什均衡中包含的不可置信的威脅戰(zhàn)略剔除去，使均衡戰(zhàn)略不再包含不可置信的威脅。他要求參與人的決策在任何時(shí)點(diǎn)上都是最優(yōu)的，決策者要隨機(jī)應(yīng)變，而不是固守舊略。由于剔除了不可置信的威脅，在許多情況下，精煉納什均衡也縮小了納什均衡的個(gè)數(shù)。當(dāng)然這里應(yīng)該指出的是一個(gè)精煉均衡首先必須是一個(gè)納什均衡，但納什均衡不一定是精煉均衡，只有那些不包含不可置信威脅的納什均衡才是精煉納什均衡。例如：假如有一個(gè)富家千金愛(ài)上了一個(gè)窮小子，可是姑娘的母親覺(jué)得并不門(mén)當(dāng)戶(hù)對(duì)，于是姑娘的母親堅(jiān)決不同意，并威脅說(shuō)，若女兒與小伙子不斷絕戀愛(ài)關(guān)系，她就與女兒斷絕母女關(guān)系。若女兒相信母親的話(huà)，女兒就會(huì)中斷與小伙子的戀愛(ài)關(guān)系，因?yàn)閼偃丝梢灾匦逻x擇，而母親則無(wú)法重新選擇。問(wèn)題是假設(shè)女兒堅(jiān)持到底最終與小伙子結(jié)婚，母親難道真的會(huì)去斷絕母女關(guān)系嗎？一般來(lái)說(shuō)是不會(huì)的，因?yàn)閿嘟^母女關(guān)系對(duì)母親的損害會(huì)更大，這就是說(shuō)，母親的威脅是不可置信的。聰明的女兒當(dāng)然會(huì)明白，一旦與男友生米煮成熟飯，母親只好妥協(xié)。結(jié)果是女兒會(huì)勇敢地堅(jiān)持戀愛(ài)并結(jié)婚，母親最終承認(rèn)那個(gè)她當(dāng)初并不喜歡的女婿。這就是此博弈中唯一的精煉納什均衡。

納什均衡和子博弈完美納什均衡所反映的博弈都包括了一個(gè)基本假設(shè)，即博弈的結(jié)構(gòu)、博弈的規(guī)則、所有局中人的策略空間和支付函數(shù)都是共同知道的，滿(mǎn)足這樣一個(gè)假設(shè)的博弈稱(chēng)為“完全信息博弈”，但在現(xiàn)實(shí)生活中這一假設(shè)往往得不到滿(mǎn)足。在非合作博弈中，局中人對(duì)博弈的結(jié)構(gòu)和其他局中人的特征并沒(méi)有準(zhǔn)確的了解的情況叫“不完全信息博弈”。在1967年以前，博弈論專(zhuān)家對(duì)不完全信息博弈是束手無(wú)策的，直到1967年至1968年海薩尼提出了不完全信息靜態(tài)博弈，并定義了貝葉斯納什均衡，即在不完全信息靜態(tài)博弈中，參與人同時(shí)行動(dòng)，沒(méi)有機(jī)會(huì)觀(guān)察到別人的選擇，給定別人的戰(zhàn)略選擇，每個(gè)參與人的最優(yōu)策略依賴(lài)于自己的類(lèi)型，由于每個(gè)參與人僅知道其他參與人的類(lèi)型的概率分布而不知道其真實(shí)類(lèi)型，他不可能準(zhǔn)確地知道其他參與人實(shí)際上會(huì)選擇什么策略，這樣他決策的目標(biāo)就是在給定自己的類(lèi)型和別人的類(lèi)型依從策略的情況下，最大化自己的期望效用。也就是說(shuō)，貝葉斯納什均衡就是給定自己的類(lèi)型和別人類(lèi)型的概率分布的情況下，每個(gè)參與人的期望效用達(dá)到了最大化。這種類(lèi)型的例子在生活中也是無(wú)處不在，例如：某交通局有一段柏油路要包出去，通過(guò)招投標(biāo)來(lái)進(jìn)行。假設(shè)招標(biāo)的辦法為一級(jí)密封投標(biāo)，讓每個(gè)投標(biāo)者將自己的標(biāo)價(jià)寫(xiě)下并裝入信封，一同交給交通局，信封打開(kāi)后交通局選擇標(biāo)價(jià)最低者為中標(biāo)者，此時(shí)不同的投標(biāo)者之間進(jìn)行的就是一場(chǎng)博弈。假定每個(gè)投標(biāo)者都不知道其他投標(biāo)者的真實(shí)生產(chǎn)成本而僅僅知道其概率分布，那么他在選擇自己的報(bào)價(jià)時(shí)就面臨著一種交替：一方面報(bào)價(jià)越低，中標(biāo)的可能性越大，但另一方面，給定中標(biāo)的情況，報(bào)價(jià)越低，利潤(rùn)就越小。分析證明，每個(gè)投標(biāo)人的標(biāo)價(jià)都依賴(lài)于他的生產(chǎn)成本，但一般來(lái)說(shuō)，生產(chǎn)成本會(huì)低于貝葉斯納什均衡標(biāo)價(jià)，二者之間的差異隨總投標(biāo)人數(shù)的增加而減少，也就是說(shuō)，投標(biāo)人越多，交通局越有利。

三

前面說(shuō)了靜態(tài)博弈，其實(shí)在生活中還有動(dòng)態(tài)博弈。在一個(gè)動(dòng)態(tài)博弈中，行動(dòng)是分先后次序的，后行動(dòng)者可以通過(guò)觀(guān)察先行動(dòng)者的行動(dòng)獲得有關(guān)后者偏好、戰(zhàn)略空間等方面的信息，修正自己的判斷。就像日常生活中通過(guò)觀(guān)察某人的行為表現(xiàn)來(lái)了解其品德一樣，顯然，先行動(dòng)者知道自己的行為有傳遞自己特征信息的作用，就會(huì)有意識(shí)地選擇某種行動(dòng)來(lái)掩飾自己的真實(shí)面目。當(dāng)然，在均衡狀態(tài)下，理性人是不會(huì)被蒙混的。1975年澤爾騰和克瑞普斯（1982年）等人相繼給出了不完全信息動(dòng)態(tài)博弈的精煉貝葉斯納什均衡的定義，即是當(dāng)事人根據(jù)所觀(guān)察到的他人的行為來(lái)修正自己有關(guān)后者類(lèi)型的主觀(guān)概率，并由此選擇自己的行動(dòng)。在我們的生活中，這樣的例子也很多，例如：“黔驢之技”的故事就是一個(gè)不完全信息動(dòng)態(tài)博弈：一頭毛驢被帶到貴州時(shí)，老虎從沒(méi)見(jiàn)過(guò)驢子見(jiàn)它威武高大，心想它的本領(lǐng)一定很大。老虎就很好奇，于是憑著這個(gè)判斷，老虎就躲在樹(shù)林里偷偷觀(guān)察毛驢，這是它的最優(yōu)選擇。過(guò)了一會(huì)兒，老虎走出樹(shù)林，逐漸靠近毛驢，就想獲得這個(gè)龐然大物的真實(shí)本領(lǐng)的信息。突然毛驢大叫一聲，老虎嚇了一跳，急忙逃走，這也是老虎的最優(yōu)選擇，因?yàn)槊H的叫聲是老虎意料之外的。過(guò)了兩天，老虎又來(lái)觀(guān)看，發(fā)現(xiàn)毛驢除了會(huì)大聲叫之外沒(méi)什么本領(lǐng)，可是仍然不敢吃毛驢，因?yàn)樗€是不完全了解毛驢的真實(shí)本領(lǐng)。后來(lái)，老虎逐漸靠近毛驢，并故意往毛驢身上擠，毛驢實(shí)在忍無(wú)可忍，就往老虎身上踢了一腳，這下老虎反倒高興了，因?yàn)樗懒嗣H不過(guò)就這點(diǎn)真實(shí)本領(lǐng)，此時(shí)，老虎對(duì)毛驢就有了全面的了解，于是撲過(guò)去就把毛驢吃掉了。在這個(gè)故事里，老虎通過(guò)觀(guān)察毛驢的行為逐漸修正了對(duì)毛驢的看法，直到看清它的真實(shí)本領(lǐng)，最后把它吃掉，就是一個(gè)精煉貝葉斯均衡，而老虎的每一步行動(dòng)都是給定它的判斷下最優(yōu)的。事實(shí)上，毛驢的行為也是理性的，它知道自己技能有限，不到萬(wàn)不得已它不會(huì)用僅有的一技，否則它早就被老虎吃掉了。這種博弈的思想在生活中也很多，比如：強(qiáng)者欺負(fù)弱者，信號(hào)傳遞模型，等等。

以上這些例子是我們?nèi)粘Ｉ钪薪?jīng)常碰到的，這些博弈的思想也不知不覺(jué)地被人們使用，雖然博弈的例子數(shù)不勝數(shù)，但有一個(gè)共同特點(diǎn)，即參與者都是在每一場(chǎng)博弈中尋求自己的最優(yōu)解。其實(shí)，人生就是一個(gè)不斷合作和競(jìng)爭(zhēng)的過(guò)程，在這些合作與競(jìng)爭(zhēng)中，每個(gè)人都想使自己的利益最大化，從而得到一個(gè)自己認(rèn)為滿(mǎn)意的結(jié)果。由此看來(lái)，學(xué)習(xí)博弈論的目的不在于解法而在于尋求巧妙的策略，學(xué)習(xí)博弈論不是為了享受分析博弈的過(guò)程，而在于贏得更好的結(jié)果。博弈的思想來(lái)自現(xiàn)實(shí)生活，它既可以高度抽象地用數(shù)學(xué)來(lái)表述，又可以用日常事例來(lái)說(shuō)明，并運(yùn)用到生活中去，沒(méi)有高深的數(shù)學(xué)知識(shí)，我們同樣可以學(xué)習(xí)博弈論并成為生活中的策略高手，就像孫臏沒(méi)有學(xué)過(guò)高數(shù)，但是這并不影響他通過(guò)最優(yōu)策略來(lái)幫助田忌贏得賽馬。

參考文獻(xiàn)：

［1］張維迎.博弈論與信息經(jīng)濟(jì)學(xué).上海人民出版社，2004.

［2］謝識(shí)予.經(jīng)濟(jì)博弈論，（第二版）.復(fù)旦大學(xué)出版社.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

納什均衡與我們的生活