国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

競爭與協(xié)同的博弈策略

2013-04-29 15:22:59王亞楠
中外企業(yè)家 2013年5期
關(guān)鍵詞:策略思考

王亞楠

摘要:社會生活中充滿了競爭與協(xié)作,各種行為活動都可歸結(jié)為各類博弈,競爭行為與協(xié)作行為也是出于兩種不同博弈的策略應(yīng)對,即競爭博弈與協(xié)同博弈。競爭博弈與協(xié)同博弈是社會中非常普遍的博弈類型,在博弈目標(biāo)、博弈收益、博弈關(guān)系等方面存在很大區(qū)別,了解競爭博弈與協(xié)同博弈區(qū)別的實質(zhì),可提高決策的理性程度,引導(dǎo)競爭向協(xié)同轉(zhuǎn)變,在博弈中做出正確的價值選擇。

關(guān)鍵詞:競爭博弈;協(xié)同博弈;策略思考

中圖分類號:C931 文獻標(biāo)志碼:A 文章編號:1000-8772(2013)12-0073-02

競爭博弈與協(xié)同博弈事實上是出于博弈方對博弈本身的分析,以及對對方策略選擇的判斷,采取的競爭或協(xié)同的策略過程。競爭的存在可以推動發(fā)展,但也可能會產(chǎn)生沖突,沖突就有可能導(dǎo)致利益受損,一方受損甚至兩敗俱傷。合作可以共享資源,依靠集體理性合力創(chuàng)造更大的利益,在此過程中也滿足自身的利益,互利共贏。競爭博弈與協(xié)同博弈之間存在區(qū)別和聯(lián)系,也存在相互轉(zhuǎn)化的潛在條件。

一、博弈策略目標(biāo)——沖突與合作

沖突是人類災(zāi)難的主要源泉,合作是社會繁榮的先決條件。2005年諾貝爾經(jīng)濟學(xué)獎授予了兩位博弈專家——羅伯特·奧曼和托馬斯·謝林,在頒獎時評委會主席講到:“為什么有些國家、團體和個人可以和平地解決沖突,而一些國家、團體和個人卻不斷地被沖突困擾呢?”社會科學(xué)一直試圖解釋沖突與合作的基本原因,且尋求其解決的路徑,然而累累不及,而博弈論重構(gòu)人類互動行為的分析研究,給人們一種新的方式方法,許多沖突與合作的問題將得到解決的路徑。

競爭博弈與協(xié)同博弈出現(xiàn)競爭與合作的原因,與博弈策略的目標(biāo)緊密相關(guān)。競爭博弈起于沖突,博弈策略是為了應(yīng)對沖突,沖突中各方保持獨立性,并思考自身利益最大化并在沖突中取得優(yōu)勢,為保證自己的利益,不惜損害他人利益。協(xié)同博弈起于合作,博弈各方存在共同利益,為了共同利益可以建立約束各方行為的契約關(guān)系,在這種關(guān)系下,各方追求集體利益最大化,間接滿足自身利益的最大化。僅從博弈策略目標(biāo)角度講,合作肯定是社會普遍承認價值觀。從政府管理社會的角度,講求多元治理,即多主體在形成的合作網(wǎng)絡(luò)中,共享資源,共同治理社會;從社會自治角度講,各自治主體在充分溝通,信息和資源共享前提下,實現(xiàn)合作自治;從個體角度講,取得成功不再是單打獨斗,而是團隊合作,借助優(yōu)勢整合的力量獲取集體利益,并完成自己的目標(biāo)。所以從合作出發(fā)的協(xié)同博弈,應(yīng)該是當(dāng)今社會的主流博弈。

二、博弈策略收益——零和與變和

博弈各方的博弈活動都圍繞著一個中心,就是收益。對收益的追求決定了博弈策略的選擇,但博弈結(jié)果的收益性往往存在偏差。在現(xiàn)實社會中,其本身就包含了沖突與合作兩種截然不同的博弈策略,在博弈過程中并不僅僅存在沖突,同時還包含著潛在的合作因素;同樣合作中也包含著潛在的沖突因素。人類的天性是驅(qū)利避害的,每個人為了自己的利益而產(chǎn)生的行為結(jié)果是一種囚徒困境,囚徒困境之下競爭的整體收益為零和甚至負和,合作的整體收益為正和。

最有說服力的是“公地悲劇”:某一村莊有六個農(nóng)夫,每個農(nóng)夫擁有一頭重1000磅的牛,在公共草地放牧,即總重量為6000磅(6頭牛)。如果公共草地每增加一頭牛,則每頭牛將減少100磅重量。如農(nóng)夫A增加第二頭牛,總數(shù)為7頭,每頭牛的重量為900磅。農(nóng)夫A擁有的重量為900×2=1800磅。如其他五位農(nóng)夫也都增加一頭牛,牧場將有12頭牛,每頭牛重400磅。每個農(nóng)夫??傊亓繀s只有2×400=800磅。很顯然,如果人們從自身利益出發(fā),肯定選擇后者,即出現(xiàn)囚徒困境現(xiàn)象。所以,人類社會競爭沖突,甚至不擇手段時有發(fā)生,最后從整體收益角度講是一種零和博弈,甚至出現(xiàn)損失,成為人類災(zāi)難的主要源泉。如果人們能夠采取合作,在合作中約束自己的行為,最終的收益型將為正和,是一種變和博弈。面對紛繁復(fù)雜的社會,傳統(tǒng)理論與實踐已無法應(yīng)對。而博弈論中的合作思維、目標(biāo)取向可以給人們一些啟示:在博弈過程中并不僅僅存在沖突,同時還包含著潛在的合作因素;同樣合作中也包含著潛在的沖突因素。從某種角度上講,博弈論就是研究理性決策者之間沖突與合作的理論。

三、博弈策略關(guān)系——對立與依賴

博弈過程中各方之間呈現(xiàn)為各種關(guān)系,競爭博弈與協(xié)同博弈體現(xiàn)出來的便是對立與依賴。競爭博弈起于沖突,沖突之下必然是緊張的對立關(guān)系,利益的相互對立,要求通過博弈來爭奪有限的資源和利益。收益的大小取決于所采取的博弈策略,所以博弈策略的制定往往維護自身利益,而在一定程度上影響他人的利益獲取,這會加劇對立關(guān)系。協(xié)同博弈起于對共同利益的追求,博弈方會通過合作來爭取更大的整體利益,再通過分配來增加自身的收益。合作越成功,他們的收益相應(yīng)越大,收益越大反過來又促進他們的合作,他們之間是一種相互依賴,合作共贏的關(guān)系。

在一個博弈中,對立與依賴是否會相互轉(zhuǎn)化,博弈方相互之間又如何影響這種關(guān)系。其實在以上的公地悲劇博弈中,存在兩個納什均衡:你進我退,你退我進。最后納什均衡會出現(xiàn)在哪一點?從博弈的角度來看,可以思考兩點:一是誰使用“強勢威懾”。博弈從某種角度上講,就是“博”誰更有威懾力。假設(shè)博弈雙方存在競爭沖突,雙方都可以采取不合作,或者合作。如果都不合作,利益都受損的可能性很大,而達成合作的可能性很??;如果雙方都合作,則沖突爆發(fā)的可能較小,而最終合作達成分配協(xié)議的可能性很大。在許多情況下,雙方是可以協(xié)調(diào)的。在這個博弈中,假設(shè)博弈甲可以先行承諾自己的策略,如博弈乙不合作則自己也不合作。然后博弈乙觀察博弈甲的行動而選擇自己的策略;二是誰使用“限制行為”。托馬斯·謝林在《沖突的策略》中引入一個新理念,認為主動約束自己隨意性和主動性反而會增強自我主動性,即通過限制己方的行為來向?qū)Ψ絺鬟f明確的信號,讓對方了解已方將如何進行選擇,以便實現(xiàn)雙方的合作。有時“主動限制自己的自由反而會獲得更加自由的空間”。在博弈各方中,參與人可以相互告知對方自己將要采取的行動,進而達成均衡。如果參與人自己不能溝通,第三方可以提議—個均衡解,這個均衡使得任何一方都沒有理由不去執(zhí)行。所以,對立和依賴關(guān)系不是絕對的,可以根據(jù)需要采取策略引導(dǎo)其轉(zhuǎn)變。

四、博弈策略理念——競爭與協(xié)同

市場經(jīng)濟條件下,必然存在競爭博弈,但從社會整體利益最大化的角度和避免競爭中資源浪費角度,協(xié)同博弈優(yōu)勢不言而喻,競爭博弈向協(xié)同博弈的轉(zhuǎn)變符合和諧社會建設(shè)的主流價值觀。羅伯特·奧曼認為,在“囚徒困境”博弈過程中,即使雙方存在短期利益沖突,只要博弈重復(fù)進行,就能達到“合作”的均衡解,這一重復(fù)博弈的結(jié)果稱為“無名氏定理”。合作的長期利益大于短期利益時,才會出現(xiàn)協(xié)同博弈,相反,則會出現(xiàn)非合作博弈。也就是說,博弈方為了獲得合作的長期利益,愿意抵制欺騙的一次性博弈(所獲利益)的誘惑。在博弈過程中,人們都為自己尋求利益最大化,其實合作是一種可以創(chuàng)造博弈各方“共贏”、利益最大化的有效的方式方法。一般來說,非合作博弈(強調(diào)個體理性)關(guān)注的是人們交互的短期關(guān)系,合作博奔(強調(diào)集體理性)關(guān)注的是人們交互的長期關(guān)系。而人們的交互方式更多是長期(重復(fù))關(guān)系,也即合作關(guān)系。2005年諾貝爾評獎委員會在頒獎詞提到:“在現(xiàn)實世界,長期關(guān)系比短期關(guān)系更加容易合作,并且具有效率更高的博弈結(jié)果,因此一次性博弈往往有失偏頗。”

2005年諾貝爾評獎委員會提出:“重復(fù)博弈加強了我們對合作條件的理解。為什么在參與者越多、互動越不頻繁、關(guān)系越不牢固、時間越短、信息越不透明的背景下合作越難維持?”羅伯特·奧曼研究表明:在現(xiàn)實生活中,長期合作關(guān)系的維系遠比一次簡單的機遇來得容易。因為,只有重復(fù)博弈,人們才會從長計議,也才會避免人們的短期行為,避免追求個體理性最大化。并且這種重復(fù)博弈是無限重復(fù)博弈。因為,有限重復(fù)博弈并不能帶來合作。假設(shè)我們采取倒退方式:在第N次(倒數(shù)第一次),兩個人會選擇不合作(因為博弈即將結(jié)束),從而在第N一1次,兩個人也將選擇不合作;從而在第N-2次,兩個人還是會選擇不合作……從而第2次,兩個人會選擇不合作;從而第1次,兩個人選擇不合作。那么,可以得出,無論重復(fù)博弈多少次,只要是有限的博弈,理論上合作都不可能實現(xiàn)。如果重復(fù)博弈是無限的,倒退方式就不起作用,而只能使用順推方式來選擇策略,此時無限博弈才會起作用。

美國著名行為分析專家、科學(xué)院院士羅伯特·阿克謝羅德(Axelrod)在1980年做過一次競賽實驗。競賽實驗邀請了經(jīng)濟學(xué)、心理學(xué)、社會學(xué)、政治學(xué)和數(shù)學(xué)等專家14人參加。參與者都設(shè)計出自己的策略方案,一起進入計算機進行150次的博弈。博弈的計分:如雙方都合作各計2分,雙方都不合作各計O分,一方合作另一方不合作,合作計-1,不合作計4分。競賽最后獲勝者是加拿大多倫多心理學(xué)家阿納托·拉帕波特教授。他的策略方式是“先做好人,以牙還牙”,即與對方第一次博弈時選擇合作,如果對方上次選擇合作則自己本次選擇合作,如果對方上次選擇不合作,則自己本次選擇不合作。該策略試圖通過懲罰對方,迫使對方不能偏離合作的軌道。為了證實競賽實驗的結(jié)果的非偶然性,1984年阿克謝羅德進行第二次競賽實驗。第二次競賽收集了62個程序,但拉帕波特的“先做好人,以牙還牙”策略仍然是贏家。競賽實驗說明,在博弈過程中,你應(yīng)對不合作者給予懲罰,這樣試圖把對方拉回到合作的軌道。在現(xiàn)實中,你投之以桃,我就報之以李,明確你是一個有恨必雪、有恩必報的人,這是優(yōu)勢的合作策略。為何此有限重復(fù)博弈會帶來合作?其原因是,正如博弈專家克萊伯斯證明的:即使是有限博弈,只要次數(shù)足夠多(關(guān)系維持足夠長),那么人們有動力通過合作行為樹立起合作的聲譽來獲取長期的好處。所以,構(gòu)筑社會重復(fù)博弈關(guān)系,倡導(dǎo)協(xié)同博弈理念,建立“有恩必報,有恨必雪”的約束機制,促使競爭博弈到協(xié)同博弈的轉(zhuǎn)變。

猜你喜歡
策略思考
語文教學(xué)學(xué)生創(chuàng)造性思維策略思考
考試周刊(2016年97期)2016-12-26 15:53:22
閱讀教學(xué)課堂學(xué)生激烈爭辯的思考
考試周刊(2016年97期)2016-12-26 15:51:57
淺談如何引導(dǎo)學(xué)生形成語文學(xué)習(xí)的智慧
運用思維突破語文教學(xué)難點
考試周刊(2016年96期)2016-12-22 22:56:43
英語教學(xué)中形成學(xué)生語感的思考
物理課堂中促進學(xué)生有效學(xué)習(xí)
祖國(2016年20期)2016-12-12 21:03:57
閱讀教學(xué)培養(yǎng)學(xué)生真實感悟
中文信息(2016年10期)2016-12-12 11:26:06
語文教學(xué)不讓學(xué)生生厭的思考
語文課堂讓學(xué)生獲得審美愉悅的思考
淺談測繪資料檔案的防護與保密工作
安图县| 新化县| 上杭县| 祁阳县| 汕尾市| 永嘉县| 广平县| 两当县| 唐河县| 肃宁县| 普定县| 镶黄旗| 罗定市| 永宁县| 保定市| 卢湾区| 遂川县| 益阳市| 乡城县| 万州区| 鲁山县| 郴州市| 沅陵县| 休宁县| 永济市| 塘沽区| 玉田县| 达州市| 喜德县| 郸城县| 潜山县| 孟连| 冷水江市| 象州县| 宁化县| 安泽县| 吴川市| 汉阴县| 涿州市| 教育| 山丹县|