競爭與協(xié)同的博弈策略

2013-04-29 15:22:59王亞楠

中外企業(yè)家 2013年5期

關(guān)鍵詞：策略思考

王亞楠

摘要：社會生活中充滿了競爭與協(xié)作，各種行為活動都可歸結(jié)為各類博弈，競爭行為與協(xié)作行為也是出于兩種不同博弈的策略應(yīng)對，即競爭博弈與協(xié)同博弈。競爭博弈與協(xié)同博弈是社會中非常普遍的博弈類型，在博弈目標(biāo)、博弈收益、博弈關(guān)系等方面存在很大區(qū)別，了解競爭博弈與協(xié)同博弈區(qū)別的實質(zhì)，可提高決策的理性程度，引導(dǎo)競爭向協(xié)同轉(zhuǎn)變，在博弈中做出正確的價值選擇。

關(guān)鍵詞：競爭博弈；協(xié)同博弈；策略思考

中圖分類號：C931 文獻標(biāo)志碼：A 文章編號：1000-8772（2013）12-0073-02

競爭博弈與協(xié)同博弈事實上是出于博弈方對博弈本身的分析，以及對對方策略選擇的判斷，采取的競爭或協(xié)同的策略過程。競爭的存在可以推動發(fā)展，但也可能會產(chǎn)生沖突，沖突就有可能導(dǎo)致利益受損，一方受損甚至兩敗俱傷。合作可以共享資源，依靠集體理性合力創(chuàng)造更大的利益，在此過程中也滿足自身的利益，互利共贏。競爭博弈與協(xié)同博弈之間存在區(qū)別和聯(lián)系，也存在相互轉(zhuǎn)化的潛在條件。

一、博弈策略目標(biāo)——沖突與合作

沖突是人類災(zāi)難的主要源泉，合作是社會繁榮的先決條件。2005年諾貝爾經(jīng)濟學(xué)獎授予了兩位博弈專家——羅伯特·奧曼和托馬斯·謝林，在頒獎時評委會主席講到：“為什么有些國家、團體和個人可以和平地解決沖突，而一些國家、團體和個人卻不斷地被沖突困擾呢？”社會科學(xué)一直試圖解釋沖突與合作的基本原因，且尋求其解決的路徑，然而累累不及，而博弈論重構(gòu)人類互動行為的分析研究，給人們一種新的方式方法，許多沖突與合作的問題將得到解決的路徑。

競爭博弈與協(xié)同博弈出現(xiàn)競爭與合作的原因，與博弈策略的目標(biāo)緊密相關(guān)。競爭博弈起于沖突，博弈策略是為了應(yīng)對沖突，沖突中各方保持獨立性，并思考自身利益最大化并在沖突中取得優(yōu)勢，為保證自己的利益，不惜損害他人利益。協(xié)同博弈起于合作，博弈各方存在共同利益，為了共同利益可以建立約束各方行為的契約關(guān)系，在這種關(guān)系下，各方追求集體利益最大化，間接滿足自身利益的最大化。僅從博弈策略目標(biāo)角度講，合作肯定是社會普遍承認價值觀。從政府管理社會的角度，講求多元治理，即多主體在形成的合作網(wǎng)絡(luò)中，共享資源，共同治理社會；從社會自治角度講，各自治主體在充分溝通，信息和資源共享前提下，實現(xiàn)合作自治；從個體角度講，取得成功不再是單打獨斗，而是團隊合作，借助優(yōu)勢整合的力量獲取集體利益，并完成自己的目標(biāo)。所以從合作出發(fā)的協(xié)同博弈，應(yīng)該是當(dāng)今社會的主流博弈。

二、博弈策略收益——零和與變和

博弈各方的博弈活動都圍繞著一個中心，就是收益。對收益的追求決定了博弈策略的選擇，但博弈結(jié)果的收益性往往存在偏差。在現(xiàn)實社會中，其本身就包含了沖突與合作兩種截然不同的博弈策略，在博弈過程中并不僅僅存在沖突，同時還包含著潛在的合作因素；同樣合作中也包含著潛在的沖突因素。人類的天性是驅(qū)利避害的，每個人為了自己的利益而產(chǎn)生的行為結(jié)果是一種囚徒困境，囚徒困境之下競爭的整體收益為零和甚至負和，合作的整體收益為正和。

最有說服力的是“公地悲劇”：某一村莊有六個農(nóng)夫，每個農(nóng)夫擁有一頭重1000磅的牛，在公共草地放牧，即總重量為6000磅（6頭牛）。如果公共草地每增加一頭牛，則每頭牛將減少100磅重量。如農(nóng)夫A增加第二頭牛，總數(shù)為7頭，每頭牛的重量為900磅。農(nóng)夫A擁有的重量為900×2=1800磅。如其他五位農(nóng)夫也都增加一頭牛，牧場將有12頭牛，每頭牛重400磅。每個農(nóng)夫?？傊亓繀s只有2×400=800磅。很顯然，如果人們從自身利益出發(fā)，肯定選擇后者，即出現(xiàn)囚徒困境現(xiàn)象。所以，人類社會競爭沖突，甚至不擇手段時有發(fā)生，最后從整體收益角度講是一種零和博弈，甚至出現(xiàn)損失，成為人類災(zāi)難的主要源泉。如果人們能夠采取合作，在合作中約束自己的行為，最終的收益型將為正和，是一種變和博弈。面對紛繁復(fù)雜的社會，傳統(tǒng)理論與實踐已無法應(yīng)對。而博弈論中的合作思維、目標(biāo)取向可以給人們一些啟示：在博弈過程中并不僅僅存在沖突，同時還包含著潛在的合作因素；同樣合作中也包含著潛在的沖突因素。從某種角度上講，博弈論就是研究理性決策者之間沖突與合作的理論。

三、博弈策略關(guān)系——對立與依賴

博弈過程中各方之間呈現(xiàn)為各種關(guān)系，競爭博弈與協(xié)同博弈體現(xiàn)出來的便是對立與依賴。競爭博弈起于沖突，沖突之下必然是緊張的對立關(guān)系，利益的相互對立，要求通過博弈來爭奪有限的資源和利益。收益的大小取決于所采取的博弈策略，所以博弈策略的制定往往維護自身利益，而在一定程度上影響他人的利益獲取，這會加劇對立關(guān)系。協(xié)同博弈起于對共同利益的追求，博弈方會通過合作來爭取更大的整體利益，再通過分配來增加自身的收益。合作越成功，他們的收益相應(yīng)越大，收益越大反過來又促進他們的合作，他們之間是一種相互依賴，合作共贏的關(guān)系。

在一個博弈中，對立與依賴是否會相互轉(zhuǎn)化，博弈方相互之間又如何影響這種關(guān)系。其實在以上的公地悲劇博弈中，存在兩個納什均衡：你進我退，你退我進。最后納什均衡會出現(xiàn)在哪一點？從博弈的角度來看，可以思考兩點：一是誰使用“強勢威懾”。博弈從某種角度上講，就是“博”誰更有威懾力。假設(shè)博弈雙方存在競爭沖突，雙方都可以采取不合作，或者合作。如果都不合作，利益都受損的可能性很大，而達成合作的可能性很??；如果雙方都合作，則沖突爆發(fā)的可能較小，而最終合作達成分配協(xié)議的可能性很大。在許多情況下，雙方是可以協(xié)調(diào)的。在這個博弈中，假設(shè)博弈甲可以先行承諾自己的策略，如博弈乙不合作則自己也不合作。然后博弈乙觀察博弈甲的行動而選擇自己的策略；二是誰使用“限制行為”。托馬斯·謝林在《沖突的策略》中引入一個新理念，認為主動約束自己隨意性和主動性反而會增強自我主動性，即通過限制己方的行為來向?qū)Ψ絺鬟f明確的信號，讓對方了解已方將如何進行選擇，以便實現(xiàn)雙方的合作。有時“主動限制自己的自由反而會獲得更加自由的空間”。在博弈各方中，參與人可以相互告知對方自己將要采取的行動，進而達成均衡。如果參與人自己不能溝通，第三方可以提議—個均衡解，這個均衡使得任何一方都沒有理由不去執(zhí)行。所以，對立和依賴關(guān)系不是絕對的，可以根據(jù)需要采取策略引導(dǎo)其轉(zhuǎn)變。

四、博弈策略理念——競爭與協(xié)同

市場經(jīng)濟條件下，必然存在競爭博弈，但從社會整體利益最大化的角度和避免競爭中資源浪費角度，協(xié)同博弈優(yōu)勢不言而喻，競爭博弈向協(xié)同博弈的轉(zhuǎn)變符合和諧社會建設(shè)的主流價值觀。羅伯特·奧曼認為，在“囚徒困境”博弈過程中，即使雙方存在短期利益沖突，只要博弈重復(fù)進行，就能達到“合作”的均衡解，這一重復(fù)博弈的結(jié)果稱為“無名氏定理”。合作的長期利益大于短期利益時，才會出現(xiàn)協(xié)同博弈，相反，則會出現(xiàn)非合作博弈。也就是說，博弈方為了獲得合作的長期利益，愿意抵制欺騙的一次性博弈（所獲利益）的誘惑。在博弈過程中，人們都為自己尋求利益最大化，其實合作是一種可以創(chuàng)造博弈各方“共贏”、利益最大化的有效的方式方法。一般來說，非合作博弈（強調(diào)個體理性）關(guān)注的是人們交互的短期關(guān)系，合作博奔（強調(diào)集體理性）關(guān)注的是人們交互的長期關(guān)系。而人們的交互方式更多是長期（重復(fù)）關(guān)系，也即合作關(guān)系。2005年諾貝爾評獎委員會在頒獎詞提到：“在現(xiàn)實世界，長期關(guān)系比短期關(guān)系更加容易合作，并且具有效率更高的博弈結(jié)果，因此一次性博弈往往有失偏頗。”

2005年諾貝爾評獎委員會提出：“重復(fù)博弈加強了我們對合作條件的理解。為什么在參與者越多、互動越不頻繁、關(guān)系越不牢固、時間越短、信息越不透明的背景下合作越難維持？”羅伯特·奧曼研究表明：在現(xiàn)實生活中，長期合作關(guān)系的維系遠比一次簡單的機遇來得容易。因為，只有重復(fù)博弈，人們才會從長計議，也才會避免人們的短期行為，避免追求個體理性最大化。并且這種重復(fù)博弈是無限重復(fù)博弈。因為，有限重復(fù)博弈并不能帶來合作。假設(shè)我們采取倒退方式：在第N次（倒數(shù)第一次），兩個人會選擇不合作（因為博弈即將結(jié)束），從而在第N一1次，兩個人也將選擇不合作；從而在第N-2次，兩個人還是會選擇不合作……從而第2次，兩個人會選擇不合作；從而第1次，兩個人選擇不合作。那么，可以得出，無論重復(fù)博弈多少次，只要是有限的博弈，理論上合作都不可能實現(xiàn)。如果重復(fù)博弈是無限的，倒退方式就不起作用，而只能使用順推方式來選擇策略，此時無限博弈才會起作用。

美國著名行為分析專家、科學(xué)院院士羅伯特·阿克謝羅德（Axelrod）在1980年做過一次競賽實驗。競賽實驗邀請了經(jīng)濟學(xué)、心理學(xué)、社會學(xué)、政治學(xué)和數(shù)學(xué)等專家14人參加。參與者都設(shè)計出自己的策略方案，一起進入計算機進行150次的博弈。博弈的計分：如雙方都合作各計2分，雙方都不合作各計O分，一方合作另一方不合作，合作計-1，不合作計4分。競賽最后獲勝者是加拿大多倫多心理學(xué)家阿納托·拉帕波特教授。他的策略方式是“先做好人，以牙還牙”，即與對方第一次博弈時選擇合作，如果對方上次選擇合作則自己本次選擇合作，如果對方上次選擇不合作，則自己本次選擇不合作。該策略試圖通過懲罰對方，迫使對方不能偏離合作的軌道。為了證實競賽實驗的結(jié)果的非偶然性，1984年阿克謝羅德進行第二次競賽實驗。第二次競賽收集了62個程序，但拉帕波特的“先做好人，以牙還牙”策略仍然是贏家。競賽實驗說明，在博弈過程中，你應(yīng)對不合作者給予懲罰，這樣試圖把對方拉回到合作的軌道。在現(xiàn)實中，你投之以桃，我就報之以李，明確你是一個有恨必雪、有恩必報的人，這是優(yōu)勢的合作策略。為何此有限重復(fù)博弈會帶來合作？其原因是，正如博弈專家克萊伯斯證明的：即使是有限博弈，只要次數(shù)足夠多（關(guān)系維持足夠長），那么人們有動力通過合作行為樹立起合作的聲譽來獲取長期的好處。所以，構(gòu)筑社會重復(fù)博弈關(guān)系，倡導(dǎo)協(xié)同博弈理念，建立“有恩必報，有恨必雪”的約束機制，促使競爭博弈到協(xié)同博弈的轉(zhuǎn)變。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

競爭與協(xié)同的博弈策略