基于復(fù)制動態(tài)博弈的大學(xué)生上課選座位博弈分析

2018-06-02 15:32:34趙文強(qiáng)蔣菡

價值工程 2018年15期

關(guān)鍵詞：有限理性

趙文強(qiáng) 蔣菡

Game Analysis of College Students Selecting Seats in Class Based on Replicator Dynamic Game

摘要：運用大規(guī)模有限理性群體復(fù)制動態(tài)博弈模型，結(jié)合了大學(xué)生在上課時坐在教室前排和坐在教室后排時的收益情況，分析了大學(xué)生上課選座位的動態(tài)演化過程。結(jié)果表明：在教室座位有空缺的條件下，大學(xué)生會傾向于坐在教室后排而不是教室前排，最終全部坐在后排導(dǎo)致前排無人坐，即使少數(shù)學(xué)生偏離了該穩(wěn)定狀態(tài)，復(fù)制動態(tài)最終依然會收斂于上述穩(wěn)定狀態(tài)。

Abstract： This paper uses a large-scale finite rational group copy dynamic game model， combined with the income of college students sitting in the front row of the classroom and sitting in the back row of the classroom during the class， analyzes the dynamic evolution process of college students' seat selection. The results show that under the condition that there are vacancies in the classroom， college students tend to sit in the back row of the classroom rather than in front of the classroom. Eventually all sitting in the back row leads to no one sitting in the front row， even a small number of students from the steady state， dynamic replication will still converge to the final steady state.

關(guān)鍵詞：有限理性；復(fù)制動態(tài)博弈；選座位；穩(wěn)定狀態(tài)

Key words： bounded rationality；replicator dynamic game；seat selection；steady state

中圖分類號：F224.9 文獻(xiàn)標(biāo)識碼：A 文章編號：1006-4311（2018）15-0014-03

0 引言

大學(xué)教室里經(jīng)常出現(xiàn)這樣一種現(xiàn)象，代課老師在講臺上激情蓬勃地講課，但學(xué)生卻盡可能地遠(yuǎn)離老師的視線，例如，教室里一共有八排座位，座位的數(shù)量大于來上課的學(xué)生數(shù)量，上課時學(xué)生坐滿了后六排座位，最前面的兩排卻沒人坐，尤其是最后一排的座位“一票難求”，搶不到后排座位的學(xué)生，才會無奈的坐在靠前一些的座位。這樣的例子在如今的大學(xué)校園里比比皆是，無不讓人痛心。這種現(xiàn)象的出現(xiàn)與中小學(xué)生托關(guān)系坐到前排形成鮮明的對比，折射出老師和學(xué)校乃至大學(xué)教育的無奈[1]。

國內(nèi)社會對大學(xué)生選擇坐后排的現(xiàn)象進(jìn)行過一系列討論，討論的結(jié)果都是基于教育學(xué)和社會學(xué)的角度而對如今大學(xué)生的學(xué)習(xí)態(tài)度和人生觀進(jìn)行批評，并沒有從演化博弈論的角度出發(fā)而去論證這種現(xiàn)象產(chǎn)生的必然性。

演化博弈論以博弈方具有有限理性為基礎(chǔ)，研究博弈方組成的群體成員采用特定策略比例的變化趨勢和穩(wěn)定性，它對分析預(yù)測經(jīng)濟(jì)關(guān)系的長期趨勢和解釋各種普遍性社會現(xiàn)象有重要的作用[2]。謝識予對進(jìn)化博弈論的思想、方法、意義和發(fā)展前景進(jìn)行了討論[3]，王先甲等探討了演化博弈論中的各種學(xué)習(xí)模型，提出了有限理性的實質(zhì)是怎么去學(xué)習(xí)[4]，吳昊等探討了合作競爭博弈的演化模型，用“進(jìn)化穩(wěn)定策略”來描述合作競爭博弈的長期演化趨勢[5]，孫慶文等基于不完全信息假設(shè)，借鑒生物進(jìn)化過程中“復(fù)制動態(tài)”的思想，對非對稱2×2演化博弈均衡進(jìn)行漸近穩(wěn)定性分析，完整地給出了其定性行為的拓?fù)涞葍r分類[6]，劉德海等運用演化博弈理論建立了重大突發(fā)事件的疫情傳播方程[7]，王玉燕等采用演化博弈方法研究逆向供應(yīng)鏈在企業(yè)供應(yīng)鏈中的推廣應(yīng)用[8]。

本文運用演化博弈論，建立坐后排者和坐前排者的有限理性群體復(fù)制動態(tài)博弈模型，分析出均衡結(jié)果，給出一系列的結(jié)論。

1 有限理性和復(fù)制動態(tài)模型

1.1 有限理性

靜態(tài)博弈和動態(tài)博弈基本上是以博弈方的完全理性為基礎(chǔ)，但在現(xiàn)實中對決策者的完全理性假設(shè)是很難滿足的[9]。如果博弈的參與人不滿足完全理性假設(shè)，稱為“有限理性博弈方”，這時博弈可稱之為“有限理性博弈”[10]。有限理性意味著博弈方往往不會一開始就找到最優(yōu)策略，會在博弈過程中學(xué)習(xí)博弈，通過試錯尋找較好的策略。

1.2 演化博弈和復(fù)制動態(tài)模型

有限理性博弈方有不同的理性層次，學(xué)習(xí)速度差別很大。參與人的學(xué)習(xí)速度慢表現(xiàn)為向優(yōu)勢策略轉(zhuǎn)變是一個漸進(jìn)的過程，稱之為演化博弈。演化博弈的復(fù)制動態(tài)模型最早在1978年由Taylor和Jonker提出，復(fù)制動態(tài)模型來源于生物學(xué)中的進(jìn)化動態(tài)方程?！昂灢┺膮f(xié)議”的例子很好的說明了復(fù)制動態(tài)模型。

參與人A和參與人B要簽訂一個協(xié)議，兩個參與人都有“同意”和“不同意”兩種可選策略，他們的支付矩陣如表1所示。

帕累托最優(yōu)的納什均衡是（同意，同意）。

參與人往往不可能一開始就能找到最優(yōu)的策略[11]，有參與人會選擇“不同意”。假設(shè)“同意”類型的參與人占比為x，“不同意”類型的參與人占比為1-x（大群體中忽略參與人本身對其他類型參與人占比的影響），“同意”和“不同意”兩種類型的參與人各自的期望收益uy和un分別為：

uy=x·1+（1-x）·0=x un=x·0+（1-x）·0=0

群體成員的平均收益為：

只要“不同意”類型的參與人有基本的直覺和判斷能力，遲早會發(fā)現(xiàn)改變策略對自己是有利的，即x和1-x是隨時間變化的。博奔方策略類型比例動態(tài)變化是有限理性博奔分析的核心，動態(tài)變化的速度取決于兩個因素，一是模仿對象的數(shù)量大小，二是模仿對象的成功程度（可用模仿對象策略收益超過平均收益的幅度表示）。

以“同意”類型參與人比例為例，其動態(tài)變化速度可用微分方程（1）表示：

上述動態(tài)微分方程與生物進(jìn)化中描述特定性狀個體頻數(shù)自然變化選擇過程的“復(fù)制動態(tài)”方程是一致的，所以把它稱作“復(fù)制動態(tài)方程”。

當(dāng)x=0時，即初始時刻沒有參與人采用“同意”策略，變化速率為0，所有參與人都不會改變策略；

當(dāng)0

當(dāng)x=1時，變化速率為0，參與人全部采用“同意”策略。

復(fù)制動態(tài)過程收斂到x*=1時，學(xué)習(xí)過程停止，有限理性參與人找到了本博弈中效率較高的納什均衡，即x*=1是一個穩(wěn)定狀態(tài)。

2 大學(xué)生上課選座位的演化博弈分析

2.1 問題描述

研一的時候要上英語課，上課的教室一共有八排座位，來上課的學(xué)生一共只能坐滿六排座位，老師為了保證課堂教學(xué)質(zhì)量，鼓勵大家盡量坐在教室的前排，結(jié)果卻事與愿違，前兩周上課時還有學(xué)生坐在前兩排，后來大家就心照不宣的從第三排開始往后坐，前兩排徹底無人坐。老師發(fā)現(xiàn)了這種現(xiàn)象后對全班學(xué)生進(jìn)行了批評，并且強(qiáng)制大家坐滿前兩排座位，但隨著時間推移，大家又一次心照不宣的從第三排開始往后坐，一直到課程結(jié)束，前兩排座位都處于閑置狀態(tài)。

根據(jù)本人的切身體會以及與同學(xué)之間的交流，發(fā)現(xiàn)大家不愿意坐前排有以下幾個原因：

①避免被老師提問。老師一般會讓前排的同學(xué)來回答課堂問題，但大多數(shù)同學(xué)都不想被老師提問，所以選擇坐后排。

②方便做自己的事情。很多同學(xué)上課不認(rèn)真聽講卻在做其他的事情，例如：玩手機(jī)、看小說等等，他們認(rèn)為坐在后排不容易被老師發(fā)現(xiàn)。

③坐在后排比較有安全感。很多同學(xué)認(rèn)為，不管怎樣，有人坐在自己前排會讓自己覺得更有安全感，有一種被保護(hù)的感覺，所以他們希望更多的人坐在自己前排，而自己坐在后排。

2.2 模型建立與分析

我們假設(shè)教室里只有兩名學(xué)生：學(xué)生A和學(xué)生B，對他們之間的博弈做出如下假設(shè)：

①如果A和B都坐在教室的前排，兩人的收益都是1。這時兩人都認(rèn)真聽課，但很可能會被老師提問，并且不能在上課時做其他的事情。

②如果A坐在教室前排，B坐在教室后排，A只能選擇認(rèn)真聽課，不能做其他事情，而B可以認(rèn)真聽課，還可以做自己喜歡的其他事情，這時A的收益為0，B的收益為2。反之如果B坐在教室前排，A坐在教室后排，A的收益為2，B的收益為0。

③如果A和B都坐在教室的后排，兩人雖然都可以選擇聽課或者做其他的事情，但沒有人坐到前排，兩人都會遭到老師的批評，這時兩人的收益都為1。

在博弈中，A、B兩人的支付矩陣如表2所示。

根據(jù)該博奔的支付矩陣不難看出，它的純策略納什均衡是（后排，后排）。如果是在兩個滿足完全理性假設(shè)的博弈方之間進(jìn)行博弈，那么這個博弈的結(jié)果是A、B兩人都會選擇坐后排，但存在有博弈參與人理性層次很低的情況下，必然會有參與人選擇坐前排，這時就需要利用理性層次較低的大規(guī)模有限理性群體復(fù)制動態(tài)博弈模型來分析該博弈。

假設(shè)坐前排學(xué)生的比例是x，坐后排學(xué)生的比例是1-x，所有學(xué)生中隨機(jī)配對進(jìn)行該博弈時，每個參與人可能遇到“前排”的對手，也可能遇到“后排”的對手，前者的概率是x，后者的概率是1-x?！扒芭拧焙汀昂笈拧眱煞N類型參與人各自的期望收益uf和ub分別為：

uf=x·1+（1-x）·0=x ub=x·2+（1-x）·1=x+1

教室內(nèi)所有學(xué)生的平均收益為：

u=x·x+（1-x）·（x+1）=1

根據(jù)上述結(jié)果可以看出，“后排”類型參與人的期望收益高于“前排”類型參與人的期望收益，也高于教室內(nèi)所有學(xué)生的平均收益。當(dāng)收益較差的參與人，即“前排”類型參與人發(fā)現(xiàn)坐在“后排”對自己更有利時，他們就會改變策略，從而坐到教室“后排”。這種動態(tài)變化的速度可用微分方程（2）表示：

=（1-x）（ub-u）=（1-x）x=x-x2（0？燮x？燮1）（2）

當(dāng)x=0時，變化速度為0。即初始時刻沒有選擇坐前排的學(xué)生，那么選擇坐前排的學(xué)生就不會出現(xiàn)。

當(dāng)0

當(dāng)x=1時，變化速度為0，即所有學(xué)生都選擇坐后排，“后排”的學(xué)生數(shù)量不再變化。

微分方程（2）的相位圖如圖1所示。

根據(jù)微分方程（2）和相位圖1可知，除了x=0以外，該博弈從其他初始情況出發(fā)的復(fù)制動態(tài)過程，最終都會使所有博弈方趨向于選擇坐后排，即x=1。x*=0和x*=1是上述復(fù)制動態(tài)的兩個穩(wěn)定狀態(tài)，x*=1是現(xiàn)實中出現(xiàn)的穩(wěn)定狀態(tài)。

當(dāng)x*=1時，所有學(xué)生全部選擇坐在后排，有限理性參與人的學(xué)習(xí)過程停止，所有參與人都通過學(xué)習(xí)找到了最好的策略。

當(dāng)代課老師發(fā)現(xiàn)教室前兩排無人坐時，對全班同學(xué)進(jìn)行了批評教育，這時少數(shù)聽話的學(xué)生就按照老師的要求坐在了前兩排，我們假設(shè)比例為？著的學(xué)生坐在了前兩排（記為前排），比例為1-？著的學(xué)生依舊坐在后排。這時，選擇“前排”學(xué)生的期望收益為：

對比（3）（4）兩式可知，選擇坐前排學(xué)生的收益小于選擇坐后排學(xué)生的收益，同時也低于教室內(nèi)所有學(xué)生的平均收益，因此坐前排的學(xué)生會轉(zhuǎn)變策略，最終仍然會趨向于x*=1，即所有學(xué)生都選擇坐在后排，復(fù)制動態(tài)博弈最后依然收斂到x*=1，即x*=1是一個穩(wěn)定狀態(tài)。

對比可知，x*=1不是穩(wěn)定狀態(tài)。當(dāng)有少數(shù)學(xué)生選擇后排，即偏離0時，選擇后排的學(xué)生會越來越多，最終導(dǎo)致趨向于1。

3 結(jié)論

本文運用大規(guī)模有限理性群體復(fù)制動態(tài)博弈模型，結(jié)合了大學(xué)生在上課時坐在教室前排和坐在教室后排時的收益情況，分析了大學(xué)生上課選座位的動態(tài)演化過程。結(jié)果表明：在教室座位有空缺的條件下，大學(xué)生會傾向于坐在教室后排而不是教室前排，最終全部坐在后排導(dǎo)致前排無人坐，即使少數(shù)學(xué)生偏離了該穩(wěn)定狀態(tài)，復(fù)制動態(tài)最終依然會收斂于上述穩(wěn)定狀態(tài)。因此，要糾正大學(xué)生選擇坐后排而不坐前排的問題，僅僅依靠老師在課堂上的監(jiān)督與叮囑是遠(yuǎn)遠(yuǎn)不夠的，學(xué)校應(yīng)該考慮從教學(xué)方式、教學(xué)內(nèi)容和課程安排等角度另謀良策，才有可能根治這一問題。

參考文獻(xiàn)：

[1]閆建章，劉凌燕.大學(xué)生上課為何愛坐后排[J].中國教育報，2011-05-23（006）：23.

[2]盧方元.環(huán)境污染問題的演化博弈分析[J].系統(tǒng)工程理論與實踐，2011，9（9）：148-149.

[3]謝識予.有限理性條件下的進(jìn)化博弈理論[J].上海財經(jīng)大學(xué)學(xué)報，2001，3（5）：2-3.

[4]王先甲，全吉，劉偉兵.有限理性下的演化博弈與合作機(jī)制研究[J].系統(tǒng)工程理論與實踐，2011，31（1）：83-84.

[5]吳昊，楊梅英，陳良猷.合作競爭博弈中的復(fù)雜性與演化均衡的穩(wěn)定性分析[J].系統(tǒng)工程理論與實踐，2004，2（2）：91.

[6]孫慶文，陸柳，嚴(yán)廣樂，車宏安.不完全信息條件下演化博弈均衡的穩(wěn)定性分析[J].系統(tǒng)工程理論與實踐，2003，7（7）：11.

[7]劉德海，王維國，孫康.基于演化博弈的重大突發(fā)公共衛(wèi)生事件情景預(yù)測模型與防控措施[J].系統(tǒng)工程理論與實踐，2012，5（32）：937.

[8]王玉燕，李幫義，申亮.兩個生產(chǎn)商的逆向供應(yīng)鏈演化博弈分析[J].系統(tǒng)工程理論與實踐，2008，4（4）：43.

[9] 李樹祥，梁巧轉(zhuǎn)，伍勇.海關(guān)走私監(jiān)管的演化博弈分析[J].系統(tǒng)工程理論與實踐，2009，5（18）：29-30.

[10][11]謝識予.經(jīng)濟(jì)博弈論[M].上海：復(fù)旦大學(xué)出版社，2007.01.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

基于復(fù)制動態(tài)博弈的大學(xué)生上課選座位博弈分析