徐欣
【摘要】在現(xiàn)實(shí)生活中,總是需要做大量的決策,而個(gè)人的決策收益往往不是孤立的,會(huì)受其他決策者的選擇影響。在完全理性的假設(shè)下,雖然每個(gè)決策者絕對(duì)理性地選擇對(duì)自己最優(yōu)的策略,但是最終卻陷入博弈困境,從群體角度看并不是最優(yōu)決策。本文從博弈論基礎(chǔ)出發(fā),介紹了博弈標(biāo)準(zhǔn)式、嚴(yán)格劣策略、納什均衡的概念,推導(dǎo)了納什均衡點(diǎn)求解,最后通過案例進(jìn)行實(shí)際的分析。
【關(guān)鍵詞】博弈 ?博弈標(biāo)準(zhǔn)式 ?納什均衡
【中圖分類號(hào)】O29 ?【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】2095-3089(2019)27-0015-02
一、引言
在現(xiàn)實(shí)社會(huì)生活中,個(gè)體的決策總是受群體決策的影響,或者說給定個(gè)體的決策,該決策的收益會(huì)隨著其他個(gè)體決策的變化而變化。但是在其他個(gè)體不可控的情況下,個(gè)體理性的選擇往往不是群體最有利的選擇。
比如,有兩個(gè)商戶(商戶A、商戶B)銷售類似商品,屬于競爭關(guān)系。每個(gè)商戶都有兩種可選擇的策略:促銷或者不促銷。當(dāng)商戶A選擇促銷,若商戶B選擇不促銷,則商戶A收益為10,而商戶B因?yàn)闆]有任何優(yōu)惠活動(dòng)收益為0;若商戶B同樣選擇促銷,則商戶A和商戶B的收益都是2。當(dāng)商戶A選擇不促銷;若商戶B選擇促銷,則商戶A和商戶B的收益分別是0、10;若商戶B同樣選擇不促銷,則商戶A和商戶B都會(huì)收益9。具體博弈矩陣如表1所示,從表中可以看出,商戶A和商戶B都不促銷是群體最優(yōu)的決策。但是,在現(xiàn)實(shí)情況下,在每個(gè)商戶都是理性人的情況下,最終的結(jié)局一般都是商戶A和商戶B都選擇促銷[1]。
上述例子是一個(gè)典型的博弈困境,是博弈論中最經(jīng)典的博弈模型之一。對(duì)決策主體如何做出決策進(jìn)行建模,研究當(dāng)其行為在直接相互產(chǎn)生作用的時(shí)候,決策主題最終選擇的策略如何達(dá)到均衡。博弈論是應(yīng)用數(shù)學(xué)的一個(gè)分支,也是運(yùn)籌學(xué)的一個(gè)重要學(xué)科,也是西方經(jīng)濟(jì)學(xué)理論的重要組成部分。博弈論通過嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)語言,標(biāo)準(zhǔn)化定義博弈的關(guān)鍵要素,考慮博弈過程中的個(gè)體的預(yù)測行為和實(shí)際行為,并研究他們的優(yōu)化策略。下面通過介紹博弈論的基本概念,定義博弈的標(biāo)準(zhǔn)表達(dá)式,引入納什均衡的概念來解釋現(xiàn)實(shí)生活中的博弈困境。
二、博弈論基礎(chǔ)
1.博弈的標(biāo)準(zhǔn)表達(dá)式
一個(gè)博弈問題需要明確該問題的參與者、每個(gè)參與者可以選擇的策略,以及當(dāng)確定所有參與者的決策后每個(gè)參與者的收益函數(shù)。所以,博弈的標(biāo)準(zhǔn)表達(dá)式由三個(gè)元素構(gòu)成:參與者、每人的可選擇戰(zhàn)略合集、每人可選擇戰(zhàn)略集合的收益[2]。
若有n個(gè)參與者,記每一個(gè)參與者為其序號(hào){1,2,…,n},其中參與者i的戰(zhàn)略集合為Si,?襓Si?襓=mi,mi為參與者i的所有可能決策數(shù),收益為ui(S1,S2,…,Sn)。所以,一個(gè)完整的博弈表達(dá)式可列為:
G={S1,S2,…,Sn;u1,u2,…,un}
以上文商家促銷為例,在該博弈問題中,參與者共2人(商戶A、商戶B);二人的戰(zhàn)略合集S1=S2={促銷,不促銷},收益函數(shù)u1,u2可以用雙變量矩陣來表式,表1即為博弈矩陣。
表1 商戶促銷博弈矩陣
博弈標(biāo)準(zhǔn)表達(dá)式概括論博弈問題中的三要素,已知博弈標(biāo)準(zhǔn)表達(dá)式就已知了博弈問題中的所有信息,博弈標(biāo)準(zhǔn)表達(dá)式是我們科學(xué)研究博弈問題的第一步。
2.嚴(yán)格劣戰(zhàn)略
當(dāng)我們通過博弈標(biāo)準(zhǔn)表達(dá)式明確了我們的決策環(huán)境之后,如何合理地在現(xiàn)有條件下做最有利于自己的合理決策呢?
在博弈標(biāo)準(zhǔn)式中,令Si'和Si"為決策者i的兩個(gè)可行策略,即Si',Si"∈Si,如果對(duì)其他所有參與者的每一個(gè)可能的戰(zhàn)略組合,決策者i選擇Si'的收益都小于選擇Si"的收益,
ui(S1,…,Si-1,S'i,Si+1,…,Sn) 那么戰(zhàn)略Si'相對(duì)與戰(zhàn)略Si"為嚴(yán)格劣策略。 如定義,嚴(yán)格劣策略是一個(gè)相對(duì)的概念,是和另一個(gè)可行策略相比是劣的。理性的參與者會(huì)主動(dòng)拋棄嚴(yán)格劣策略,因?yàn)殡m然無法知道其他參與者的決策,但是不管其他參與者選擇什么決策,即不管在任何情況下,嚴(yán)格劣策略都不如另一個(gè)可行策略,所以理性參與者會(huì)提出這個(gè)策略。 以此類推,我們可以通過重復(fù)刪除不同參與者的嚴(yán)格劣策略,找到最終博弈問題的解,即所有參與者的最終決策。 3.納什均衡 在博弈問題中,若所有參與者自發(fā)通過理性選擇,最終得到一個(gè)唯一的狀態(tài),由于是自動(dòng)實(shí)施的所以也是戰(zhàn)略穩(wěn)定的,這一狀態(tài)成為納什均衡。 由納什均衡的定義可知,我們可以通過重復(fù)刪除嚴(yán)格劣策略求得博弈問題的納什均衡點(diǎn)。 三、博弈問題求解 仍以上文商家促銷為例,站在商家B的角度考慮,無論商家A促銷還是不促銷,商家B選擇促銷的收益都要高于不促銷,故不促銷是此博弈問題的嚴(yán)格劣戰(zhàn)略。排除商家B的不促銷戰(zhàn)略,對(duì)于商家A而言,不促銷相對(duì)于促銷是嚴(yán)格劣策略。所以,通過兩次刪除嚴(yán)格劣策略,可以求得戰(zhàn)略組合{促銷,促銷}為該博弈問題的納什均衡點(diǎn)[3]。 四、實(shí)例分析 博弈困境模型雖然簡單抽象,但是現(xiàn)實(shí)中存在很多的應(yīng)用,比如最近很活躍的互聯(lián)網(wǎng)公司之間的競爭比拼:滴滴和快的兩家公司對(duì)打車市場的爭搶;美團(tuán)和餓了么之間補(bǔ)貼競賽,等等。 在這些博弈問題中,博弈雙方都使用的最簡單粗暴的競爭策略——低價(jià)補(bǔ)貼。低價(jià)補(bǔ)貼是一個(gè)惡性競爭,一旦開始,就會(huì)像裝備大戰(zhàn)一樣陷入膠著,也就是所謂的博弈困境。在博弈問題中,任何博弈方一旦停止補(bǔ)貼,而競爭對(duì)手如果繼續(xù)采取補(bǔ)貼策略,那么用戶就會(huì)選擇有補(bǔ)貼優(yōu)惠的平臺(tái),這就勢必導(dǎo)致提前結(jié)束補(bǔ)貼的一方陷入被動(dòng)局面,甚至被競爭對(duì)手給徹底甩開。 所以,博弈中存在競爭關(guān)系的雙方不得不選擇低價(jià)補(bǔ)貼的策略,進(jìn)入僵持局面,陷入博弈困境。面對(duì)此困境,尋求合并線下商議,博弈參與者通過交流獲取更多信息,是一個(gè)比較好的打破僵局的方法。通過資本的撮合和雙方的協(xié)商,制定對(duì)雙方都有利的規(guī)則,從而獲得壟斷優(yōu)勢,走出困境,取得長遠(yuǎn)發(fā)展。但是,在不加入外界影響和干擾的情況下,就會(huì)自發(fā)地陷入博弈困境,無法達(dá)到對(duì)多方博弈者都有利的點(diǎn)。 五、總結(jié) 博弈論把現(xiàn)實(shí)問題進(jìn)行抽象,通過對(duì)博弈標(biāo)準(zhǔn)式、嚴(yán)格劣策略、納什均衡等概念的介紹,以一個(gè)簡單案例為例對(duì)其進(jìn)行求解,最后對(duì)實(shí)際問題進(jìn)行分析。通過對(duì)博弈困境的分析得出,個(gè)人的理性結(jié)果并不能導(dǎo)出團(tuán)體的最優(yōu)決策,是非合作的競爭[4],只有通過博弈參與者以外的第三方制定規(guī)則和限制才能使合作下的良性競爭出現(xiàn)。 參考文獻(xiàn): [1]李元棟,劉慎軍,陳曉航.基于囚徒困境模型的高校員工幫助計(jì)劃實(shí)施策略博弈研究[J].黑龍江高教研究, 2017(7). [2]吉本斯,峰.博弈論基礎(chǔ):A primer in game theory[M].中國社會(huì)科學(xué)出版社,1999. [3]張峰.論博弈邏輯的分析方法——納什均衡分析法[J].北京理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2008(2):95-99. [4]陶鋒,楊積成,劉金紅.“囚徒困境”視角下的企業(yè)間信息共享博弈分析[J].技術(shù)經(jīng)濟(jì)與管理研究,2013(7):22-26.