博弈困境問題研究

2019-10-08 04:33:27徐欣

課程教育研究 2019年27期

徐欣

【摘要】在現(xiàn)實(shí)生活中，總是需要做大量的決策，而個(gè)人的決策收益往往不是孤立的，會(huì)受其他決策者的選擇影響。在完全理性的假設(shè)下，雖然每個(gè)決策者絕對(duì)理性地選擇對(duì)自己最優(yōu)的策略，但是最終卻陷入博弈困境，從群體角度看并不是最優(yōu)決策。本文從博弈論基礎(chǔ)出發(fā)，介紹了博弈標(biāo)準(zhǔn)式、嚴(yán)格劣策略、納什均衡的概念，推導(dǎo)了納什均衡點(diǎn)求解，最后通過案例進(jìn)行實(shí)際的分析。

【關(guān)鍵詞】博弈 ?博弈標(biāo)準(zhǔn)式 ?納什均衡

【中圖分類號(hào)】O29 ?【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】2095-3089（2019）27-0015-02

一、引言

在現(xiàn)實(shí)社會(huì)生活中，個(gè)體的決策總是受群體決策的影響，或者說給定個(gè)體的決策，該決策的收益會(huì)隨著其他個(gè)體決策的變化而變化。但是在其他個(gè)體不可控的情況下，個(gè)體理性的選擇往往不是群體最有利的選擇。

比如，有兩個(gè)商戶（商戶A、商戶B）銷售類似商品，屬于競爭關(guān)系。每個(gè)商戶都有兩種可選擇的策略：促銷或者不促銷。當(dāng)商戶A選擇促銷，若商戶B選擇不促銷，則商戶A收益為10，而商戶B因?yàn)闆]有任何優(yōu)惠活動(dòng)收益為0;若商戶B同樣選擇促銷，則商戶A和商戶B的收益都是2。當(dāng)商戶A選擇不促銷;若商戶B選擇促銷，則商戶A和商戶B的收益分別是0、10;若商戶B同樣選擇不促銷，則商戶A和商戶B都會(huì)收益9。具體博弈矩陣如表1所示，從表中可以看出，商戶A和商戶B都不促銷是群體最優(yōu)的決策。但是，在現(xiàn)實(shí)情況下，在每個(gè)商戶都是理性人的情況下，最終的結(jié)局一般都是商戶A和商戶B都選擇促銷[1]。

上述例子是一個(gè)典型的博弈困境，是博弈論中最經(jīng)典的博弈模型之一。對(duì)決策主體如何做出決策進(jìn)行建模，研究當(dāng)其行為在直接相互產(chǎn)生作用的時(shí)候，決策主題最終選擇的策略如何達(dá)到均衡。博弈論是應(yīng)用數(shù)學(xué)的一個(gè)分支，也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科，也是西方經(jīng)濟(jì)學(xué)理論的重要組成部分。博弈論通過嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)語言，標(biāo)準(zhǔn)化定義博弈的關(guān)鍵要素，考慮博弈過程中的個(gè)體的預(yù)測行為和實(shí)際行為，并研究他們的優(yōu)化策略。下面通過介紹博弈論的基本概念，定義博弈的標(biāo)準(zhǔn)表達(dá)式，引入納什均衡的概念來解釋現(xiàn)實(shí)生活中的博弈困境。

二、博弈論基礎(chǔ)

1.博弈的標(biāo)準(zhǔn)表達(dá)式

一個(gè)博弈問題需要明確該問題的參與者、每個(gè)參與者可以選擇的策略，以及當(dāng)確定所有參與者的決策后每個(gè)參與者的收益函數(shù)。所以，博弈的標(biāo)準(zhǔn)表達(dá)式由三個(gè)元素構(gòu)成：參與者、每人的可選擇戰(zhàn)略合集、每人可選擇戰(zhàn)略集合的收益[2]。

若有n個(gè)參與者，記每一個(gè)參與者為其序號(hào){1，2，…，n}，其中參與者i的戰(zhàn)略集合為Si，？襓Si？襓=mi，mi為參與者i的所有可能決策數(shù)，收益為ui（S1，S2，…，Sn）。所以，一個(gè)完整的博弈表達(dá)式可列為：

G={S1，S2，…，Sn;u1，u2，…，un}

以上文商家促銷為例，在該博弈問題中，參與者共2人（商戶A、商戶B）;二人的戰(zhàn)略合集S1=S2={促銷，不促銷}，收益函數(shù)u1，u2可以用雙變量矩陣來表式，表1即為博弈矩陣。

表1 商戶促銷博弈矩陣

博弈標(biāo)準(zhǔn)表達(dá)式概括論博弈問題中的三要素，已知博弈標(biāo)準(zhǔn)表達(dá)式就已知了博弈問題中的所有信息，博弈標(biāo)準(zhǔn)表達(dá)式是我們科學(xué)研究博弈問題的第一步。

2.嚴(yán)格劣戰(zhàn)略

當(dāng)我們通過博弈標(biāo)準(zhǔn)表達(dá)式明確了我們的決策環(huán)境之后，如何合理地在現(xiàn)有條件下做最有利于自己的合理決策呢？

在博弈標(biāo)準(zhǔn)式中，令Si'和Si"為決策者i的兩個(gè)可行策略，即Si'，Si"∈Si，如果對(duì)其他所有參與者的每一個(gè)可能的戰(zhàn)略組合，決策者i選擇Si'的收益都小于選擇Si"的收益，

ui（S1，…，Si-1，S'i，Si+1，…，Sn）

那么戰(zhàn)略Si'相對(duì)與戰(zhàn)略Si"為嚴(yán)格劣策略。

如定義，嚴(yán)格劣策略是一個(gè)相對(duì)的概念，是和另一個(gè)可行策略相比是劣的。理性的參與者會(huì)主動(dòng)拋棄嚴(yán)格劣策略，因?yàn)殡m然無法知道其他參與者的決策，但是不管其他參與者選擇什么決策，即不管在任何情況下，嚴(yán)格劣策略都不如另一個(gè)可行策略，所以理性參與者會(huì)提出這個(gè)策略。

以此類推，我們可以通過重復(fù)刪除不同參與者的嚴(yán)格劣策略，找到最終博弈問題的解，即所有參與者的最終決策。

3.納什均衡

在博弈問題中，若所有參與者自發(fā)通過理性選擇，最終得到一個(gè)唯一的狀態(tài)，由于是自動(dòng)實(shí)施的所以也是戰(zhàn)略穩(wěn)定的，這一狀態(tài)成為納什均衡。

由納什均衡的定義可知，我們可以通過重復(fù)刪除嚴(yán)格劣策略求得博弈問題的納什均衡點(diǎn)。

三、博弈問題求解

仍以上文商家促銷為例，站在商家B的角度考慮，無論商家A促銷還是不促銷，商家B選擇促銷的收益都要高于不促銷，故不促銷是此博弈問題的嚴(yán)格劣戰(zhàn)略。排除商家B的不促銷戰(zhàn)略，對(duì)于商家A而言，不促銷相對(duì)于促銷是嚴(yán)格劣策略。所以，通過兩次刪除嚴(yán)格劣策略，可以求得戰(zhàn)略組合{促銷，促銷}為該博弈問題的納什均衡點(diǎn)[3]。

四、實(shí)例分析

博弈困境模型雖然簡單抽象，但是現(xiàn)實(shí)中存在很多的應(yīng)用，比如最近很活躍的互聯(lián)網(wǎng)公司之間的競爭比拼：滴滴和快的兩家公司對(duì)打車市場的爭搶;美團(tuán)和餓了么之間補(bǔ)貼競賽，等等。

在這些博弈問題中，博弈雙方都使用的最簡單粗暴的競爭策略——低價(jià)補(bǔ)貼。低價(jià)補(bǔ)貼是一個(gè)惡性競爭，一旦開始，就會(huì)像裝備大戰(zhàn)一樣陷入膠著，也就是所謂的博弈困境。在博弈問題中，任何博弈方一旦停止補(bǔ)貼，而競爭對(duì)手如果繼續(xù)采取補(bǔ)貼策略，那么用戶就會(huì)選擇有補(bǔ)貼優(yōu)惠的平臺(tái)，這就勢必導(dǎo)致提前結(jié)束補(bǔ)貼的一方陷入被動(dòng)局面，甚至被競爭對(duì)手給徹底甩開。

所以，博弈中存在競爭關(guān)系的雙方不得不選擇低價(jià)補(bǔ)貼的策略，進(jìn)入僵持局面，陷入博弈困境。面對(duì)此困境，尋求合并線下商議，博弈參與者通過交流獲取更多信息，是一個(gè)比較好的打破僵局的方法。通過資本的撮合和雙方的協(xié)商，制定對(duì)雙方都有利的規(guī)則，從而獲得壟斷優(yōu)勢，走出困境，取得長遠(yuǎn)發(fā)展。但是，在不加入外界影響和干擾的情況下，就會(huì)自發(fā)地陷入博弈困境，無法達(dá)到對(duì)多方博弈者都有利的點(diǎn)。

五、總結(jié)

博弈論把現(xiàn)實(shí)問題進(jìn)行抽象，通過對(duì)博弈標(biāo)準(zhǔn)式、嚴(yán)格劣策略、納什均衡等概念的介紹，以一個(gè)簡單案例為例對(duì)其進(jìn)行求解，最后對(duì)實(shí)際問題進(jìn)行分析。通過對(duì)博弈困境的分析得出，個(gè)人的理性結(jié)果并不能導(dǎo)出團(tuán)體的最優(yōu)決策，是非合作的競爭[4]，只有通過博弈參與者以外的第三方制定規(guī)則和限制才能使合作下的良性競爭出現(xiàn)。

參考文獻(xiàn)：

[1]李元棟，劉慎軍，陳曉航.基于囚徒困境模型的高校員工幫助計(jì)劃實(shí)施策略博弈研究[J].黑龍江高教研究， 2017（7）.

[2]吉本斯，峰.博弈論基礎(chǔ)：A primer in game theory[M].中國社會(huì)科學(xué)出版社，1999.

[3]張峰.論博弈邏輯的分析方法——納什均衡分析法[J].北京理工大學(xué)學(xué)報(bào)（社會(huì)科學(xué)版），2008（2）：95-99.

[4]陶鋒，楊積成，劉金紅.“囚徒困境”視角下的企業(yè)間信息共享博弈分析[J].技術(shù)經(jīng)濟(jì)與管理研究，2013（7）：22-26.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

博弈困境問題研究