徐海鵬++李春燕++葉建柱
摘 要 隨著合作學(xué)習(xí)與博弈論研究的日益發(fā)展,在教育領(lǐng)域取得了一些富有成效的研究成果,但博弈論在合作學(xué)習(xí)模型的建立、收益的量化分析以及應(yīng)用評(píng)價(jià)研究等方面尚未有太多論及。本文試圖從博弈論角度,建立合作學(xué)習(xí)模型、分析量化收益并作應(yīng)用評(píng)價(jià)研究。
關(guān)鍵詞 合作學(xué)習(xí) 博弈論 模型 收益 評(píng)價(jià)
一、合作學(xué)習(xí)中博弈論相關(guān)模型的建立
1.個(gè)體學(xué)習(xí)策略模型
筆者創(chuàng)建了分析沖突行為的模型,描述了個(gè)體組織的學(xué)習(xí)策略(參考圖1)。將同一組內(nèi)的學(xué)習(xí)策略分成透明度和接受性兩方面。透明度指組織內(nèi)任何個(gè)體將自身獲得的信息知識(shí)透明化給其他人的程度;接受性指成員對(duì)信息知識(shí)的成功領(lǐng)悟被組織內(nèi)其他成員所理解的程度。通力性努力指成員完成一個(gè)總的目標(biāo)而全力合作,分配性努力指成員分別完成細(xì)分的目標(biāo)進(jìn)而組合成總目標(biāo)的合作模式。從圖中我們可以看出:如果個(gè)體的透明度與接受性都很高,那么該個(gè)體的趨勢(shì)是通過(guò)通力性的努力來(lái)進(jìn)行合作。如果接受性較高而透明度較低,便趨向于分配性努力從而產(chǎn)生競(jìng)爭(zhēng)。如果透明度與接受性都很低,那么便會(huì)趨于回避這個(gè)任務(wù)(個(gè)體并不能勝任這個(gè)任務(wù))。如果透明度高而接受性低,則需要調(diào)解以便促成合作來(lái)完成任務(wù)。他們通過(guò)競(jìng)爭(zhēng)的分配不同或合作可提供知識(shí)的透明度來(lái)進(jìn)行選擇性合作。分類研究小組透明度的學(xué)習(xí)策略,可以使小組成員成為獨(dú)立取得信息程度的個(gè)體及獲取知識(shí)的透明人,而本小組成員接受、消化的信息對(duì)其他小組來(lái)說(shuō)同樣是透明的。拉爾森等人基于沖突行為模型創(chuàng)建了分析這種困境的構(gòu)架[1]。結(jié)果表明競(jìng)爭(zhēng)策略因?yàn)椴还蚕碇R(shí)將會(huì)影響團(tuán)隊(duì)參與者并消減集體性知識(shí)發(fā)展的力量。無(wú)疑,參與者個(gè)人的學(xué)習(xí)策略將影響集體性知識(shí)發(fā)展[2]。
2.小組競(jìng)爭(zhēng)學(xué)習(xí)策略模型
若將組間相互競(jìng)爭(zhēng)和組內(nèi)內(nèi)部競(jìng)爭(zhēng)做區(qū)分:組內(nèi)競(jìng)爭(zhēng)強(qiáng)調(diào)競(jìng)爭(zhēng)環(huán)境,這種競(jìng)爭(zhēng)環(huán)境源于權(quán)力機(jī)構(gòu)對(duì)組內(nèi)個(gè)人進(jìn)行績(jī)效考核。組間競(jìng)爭(zhēng)被定義為一種情形——對(duì)整個(gè)組織而非組內(nèi)的個(gè)人表現(xiàn)進(jìn)行評(píng)估?;诖朔N組織層面上溝通的觀點(diǎn),圖2(見(jiàn)下頁(yè))表明了兩個(gè)六人組的可能性溝通模式。此圖中,實(shí)線代表群組成員的強(qiáng)溝通連接,虛線代表較弱的溝通連接。圖2左邊部分表明六個(gè)成員間一致性的較弱溝通連接模式,圖2右邊部分表明另一小組某些成員間互相交流的強(qiáng)度遠(yuǎn)高于其他剩余成員的溝通模式。當(dāng)強(qiáng)連接(實(shí)線部分)的成員組成合作小團(tuán)體(成員B、C和成員D、E、F)與同一個(gè)團(tuán)隊(duì)中的其他個(gè)體成員(A)競(jìng)爭(zhēng)時(shí),小組中的組內(nèi)競(jìng)爭(zhēng)就出現(xiàn)了。
二、合作學(xué)習(xí)中成員博弈與收益分析
1.合作學(xué)習(xí)小組成員組合與博弈分析
在典型的合作學(xué)習(xí)小組中,實(shí)行人員分配一般有兩種方式。其一是根據(jù)不同偏好,兩個(gè)或三個(gè)人為一組(有時(shí)可能是六個(gè)或者更多)被選派一起合力完成學(xué)習(xí)任務(wù)。小組要完成的任務(wù)比較多樣,如建立某種東西、進(jìn)行實(shí)驗(yàn)、做演講等。這種常見(jiàn)的人員分配被Barker形容作“把學(xué)生以小組形式組織起來(lái)以便于他們應(yīng)該有著總體上相同的能力,并且同時(shí)包含著能力范圍不同的個(gè)人”[3]。其二是小組成員隨機(jī)分配或自愿組合[4]。
2.合作學(xué)習(xí)中的收益分析
由于學(xué)習(xí)者的非理性,在學(xué)習(xí)的過(guò)程中有可能采取積極參與學(xué)習(xí)和不參與學(xué)習(xí)以及參與學(xué)習(xí)但不分享自己的信息、觀點(diǎn)等策略,我們可以將學(xué)習(xí)共同體的合作學(xué)習(xí)分為:合作學(xué)習(xí)、準(zhǔn)合作學(xué)習(xí)、非合作性學(xué)習(xí)[5]。合作學(xué)習(xí),是指學(xué)習(xí)者全神貫注地投入小組學(xué)習(xí)、樂(lè)于分享信息和幫助他人;準(zhǔn)合作學(xué)習(xí),是指學(xué)習(xí)者在學(xué)習(xí)的過(guò)程中不完全是全神貫注地投入學(xué)習(xí),但能分享信息,不樂(lè)于參與討論的小組學(xué)習(xí)方式;非合作學(xué)習(xí)指學(xué)習(xí)者在學(xué)習(xí)的過(guò)程中采取消極抵觸的態(tài)度,不參與信息交流與討論。因此,參與合作學(xué)習(xí)的個(gè)體有兩種策略選擇,即選擇參與學(xué)習(xí)分享與不參與學(xué)習(xí)分享。筆者建立了小組個(gè)體合作學(xué)習(xí)博弈收益矩陣(以兩個(gè)參與者為例),如表1。其中,R表示A、B兩位學(xué)習(xí)者都積極參與合作學(xué)習(xí)而得到的收益;當(dāng)A學(xué)習(xí)者選擇分享而B(niǎo)學(xué)習(xí)者選擇不分享時(shí),A學(xué)習(xí)者獲得的收益為S,B學(xué)習(xí)者獲得的收益為T;同理,當(dāng)B學(xué)習(xí)者選擇分享而A學(xué)習(xí)者選擇不分享時(shí),B學(xué)習(xí)者獲得的收益為S,A學(xué)習(xí)者獲得的收益為T;P為雙方都不選擇分享時(shí)的收益。根據(jù)博弈論原理,四種變量的關(guān)系為:T>R>P>S。這是因?yàn)楫?dāng)一位學(xué)習(xí)者在學(xué)習(xí)時(shí)將自己的信息分享給另一位學(xué)習(xí)者時(shí),另一位學(xué)習(xí)者在不付出任何學(xué)習(xí)代價(jià)的時(shí)候,所獲的收益一定會(huì)比分享信息的學(xué)習(xí)者收益多,對(duì)分享自己信息的學(xué)習(xí)者而言,在達(dá)到相同的學(xué)習(xí)目標(biāo)時(shí),要花費(fèi)更多的時(shí)間與精力,所獲收益小于不分享信息的學(xué)習(xí)者。當(dāng)學(xué)習(xí)者不參與合作學(xué)習(xí)時(shí),他們的對(duì)外付出為零,所獲收益為自己學(xué)習(xí)的收益。根據(jù)博弈論得出,該博弈的納什均衡為雙方都選擇參與合作學(xué)習(xí)時(shí),這種策略也是最佳的策略。但在現(xiàn)實(shí)學(xué)習(xí)狀態(tài)下,由于學(xué)習(xí)者并非完全理性及各方面因素影響,多數(shù)合作學(xué)習(xí)徘徊在合作學(xué)習(xí)與準(zhǔn)合作學(xué)習(xí)之間。
一個(gè)小組合作學(xué)習(xí)的循環(huán)次數(shù)與這小組學(xué)習(xí)目標(biāo)的成功率有著正相關(guān)的關(guān)系。所以,我們選取多次循環(huán)的小組學(xué)習(xí)為例進(jìn)行分析:在一個(gè)小組中,參與者可選擇的策略大致可以分為三類,即積極參與的學(xué)習(xí)策略、保守的學(xué)習(xí)策略及完全不參與的策略。我們采取量化的處理,對(duì)小組學(xué)習(xí)博弈模型中的T、R、P、S的評(píng)分為3、2、1、0,則收益見(jiàn)表2。
假設(shè)有位t同學(xué)在學(xué)習(xí)過(guò)程中采取積極參與的學(xué)習(xí)策略,經(jīng)過(guò)n次學(xué)習(xí)后,其所獲收益為2nt分,在同u位采取保守學(xué)習(xí)策略的學(xué)習(xí)者交流學(xué)習(xí)的過(guò)程中可以得到的收益是(n-1)u分;所以在整個(gè)學(xué)習(xí)過(guò)程中,積極參與學(xué)習(xí)的合作者得到的收益是:2nt+(n-1)u;對(duì)于u位采取保守與完全不參與策略的學(xué)習(xí)者而言,在其與積極參與的學(xué)習(xí)者交流學(xué)習(xí)過(guò)程中,其得到的收益是:(n+2)t;在與采取保守與完全不參與策略的學(xué)習(xí)者交流時(shí)可得的收益是nu,所以在整個(gè)學(xué)習(xí)過(guò)程中采取保守與完全不參與策略的學(xué)習(xí)者的收益是:(n+2)t+nu;在整個(gè)合作學(xué)習(xí)中小組總收入為:2nt+(n-1)u-[(n+2)t+nu];整理后得:(n-2)t-u。
根據(jù)整理后的公式我們可以得出,當(dāng)一個(gè)合作學(xué)習(xí)小組中小組成員選擇積極參與策略的人越多,學(xué)習(xí)者從中獲益人數(shù)就越多,整個(gè)小組的整體獲益就越大;反之,則恰恰相反。在(n-2)t=u時(shí),整個(gè)小組的整體收益為0,我們以此為關(guān)鍵點(diǎn)。當(dāng)選擇積極參與的策略人數(shù)大于(n-2)t=u時(shí),策略(合作,合作)是最佳的選擇,這種選擇減少了學(xué)習(xí)者學(xué)習(xí)所耗費(fèi)的時(shí)間和精力的同時(shí),也提高了學(xué)習(xí)效率;當(dāng)選擇積極參與的策略人數(shù)小于(n-2)t=u時(shí),策略(不合作,不合作)為最佳策略,因?yàn)橄鄬?duì)于合作小組來(lái)說(shuō),其收益并不可觀,而選擇不合作策略則會(huì)省去學(xué)習(xí)者的額外時(shí)間與精力。
接下來(lái)從循環(huán)次數(shù)來(lái)分析,當(dāng)n=3,選擇積極合作學(xué)習(xí)策略與不積極合作策略的人數(shù)相等時(shí),合作小組的整體收益為0;當(dāng)n>3,選擇積極合作學(xué)習(xí)策略人數(shù)小于不積極合作策略的人數(shù)時(shí),此時(shí)采取合作的策略是不可取的。
三、博弈論下合作學(xué)習(xí)的評(píng)價(jià)研究
1.設(shè)定的6人小組競(jìng)爭(zhēng)學(xué)習(xí)策略分析
設(shè)想有一個(gè)6人的小組,由教師安排,不隨學(xué)生意愿選擇,這個(gè)小組中分別有2個(gè)學(xué)優(yōu)生,2個(gè)一般水平學(xué)生,2個(gè)學(xué)困生。這些人是如何進(jìn)行博弈使他們的支付函數(shù)(并且在可能的情況下減少他們時(shí)間和努力的投資)最大化呢?
學(xué)困生在該小組的學(xué)習(xí)策略中接受性比較低,如果學(xué)困生有意愿進(jìn)行合作,那么他的透明度會(huì)比較高,反之則較低。由于學(xué)困生貢獻(xiàn)不出比其他學(xué)生做的更好的東西,所以在6人小組中對(duì)于他們最好的策略是什么也不做;如果其他4位學(xué)生無(wú)法完成任務(wù),則他們6人同時(shí)承受損失,而學(xué)困生可以節(jié)省出時(shí)間做其他的事。
一般水平學(xué)生在該組接受性居中但透明度高。他期待可以與學(xué)優(yōu)生合作完成任務(wù)從而獲得較高分?jǐn)?shù)。他可以幫忙處理一些力所能及的任務(wù),并且可以從學(xué)優(yōu)生那里學(xué)到一些知識(shí)。
學(xué)優(yōu)生的接受性和透明度都很高,他不僅從別人那里可以收獲知識(shí),并將以最好的策略做大部分工作(為了確保工作做得很好),把一些日常性事物交給一般水平的學(xué)生完成來(lái)節(jié)約時(shí)間。
在該小組中,最有可能出現(xiàn)的一種溝通模式為2名學(xué)困生組成一個(gè)小團(tuán)體,游離于其他4人之外,而其他4人組成有較強(qiáng)聯(lián)系與溝通的另一團(tuán)體。顯而易見(jiàn),在有2個(gè)學(xué)優(yōu)生,2個(gè)一般水平的學(xué)生和2個(gè)學(xué)困生的情況下,有些收獲是通過(guò)合作所得,但是并不多。學(xué)術(shù)上越差的學(xué)生越會(huì)有一個(gè)零貢獻(xiàn)策略。
2.合作學(xué)習(xí)小組中評(píng)價(jià)分析
(1)選擇小組和分配任務(wù)不論采取任意一個(gè)方法,不管是隨機(jī)的還是系統(tǒng)的,都通常會(huì)給小組帶來(lái)有利和不利的兩面。
(2)給所有的學(xué)生相同或相近的分?jǐn)?shù)意味著作為一個(gè)小組中比較弱的學(xué)生如果采取對(duì)自身最優(yōu)的策略時(shí),他的貢獻(xiàn)更少。
(3)盡管分?jǐn)?shù)的分配是一種激勵(lì)機(jī)制,但是像“團(tuán)隊(duì)合作”“對(duì)組的貢獻(xiàn)”這樣的因素是很難定義的,基本不可能達(dá)到公平。
(4)雖然任務(wù)的完成可能與學(xué)困生參與與否并無(wú)太大關(guān)系,但是為了教育的公平,我們應(yīng)使差生在合作學(xué)習(xí)中也同樣受益。
(5)一些評(píng)估因素可能最終導(dǎo)致不誠(chéng)信和惡性競(jìng)爭(zhēng)。
(6)現(xiàn)實(shí)的合作學(xué)習(xí)存在不穩(wěn)定的均衡點(diǎn),這就要求指導(dǎo)者選擇適當(dāng)?shù)牟┺牟呗?,抓住合作學(xué)習(xí)整體收益的狀態(tài)以達(dá)到效益最大化。
(7)一個(gè)合作小組普遍存在這三種類型的學(xué)習(xí)者,指導(dǎo)者要掌握好小組的的納什均衡點(diǎn)以保證合作學(xué)習(xí)成功進(jìn)行。
隨著近些年的發(fā)展,博弈論已經(jīng)不單純地被應(yīng)用于解釋數(shù)學(xué)及經(jīng)濟(jì)領(lǐng)域問(wèn)題,它的普遍性及理論性已經(jīng)成為了理解人類行為的有力工具。同樣,在合作學(xué)習(xí)中,有合作就有競(jìng)爭(zhēng),所以這為博弈論的引入提供了條件。小組合作學(xué)習(xí)最終是實(shí)現(xiàn)教育的公平化,而合作學(xué)習(xí)中采用的一些方法還有一定的不足。如果最終想達(dá)到公平、公正的評(píng)分辦法及教育經(jīng)驗(yàn),對(duì)于合作學(xué)習(xí)中成員的工作和進(jìn)行程序需要更多的研究。
————————
參考文獻(xiàn)
[1] Larsson R.and Bengtsson.The inter-organizational learning dilemma:Collective knowledge development in strategic alliances[J].Organization Science,1998(3).
[2] Maura Soekiad,Erik and Riessen.Conditions for knowledge sharing in competitive alliances[J].European Management Journal.2003(5).
[3]Barker R W J.Small-signal subthreshold model for i.g.f.e.t.s[J].Electronics Letters, 1976.
[4] Hounsell D E,McCulloch M E,Scott M E.The ASSHE Inventory:Changing Assessment Practices in Scottish Higher Education [J].Change,1996.
[5] Shen-Guan Shih,Tsung-Pao Hu and Ching-Nan Chen.A game theory-based approach to the analysis of cooperative learning in design studios.Department of Architecture,National Taiwan University of Science and Technology,No.43,Sec.4,Keelung Road,Taipei,106,Taiwan,Republic of China.
[作者:徐海鵬(1990-),男,黑龍江尚志人,哈爾濱商業(yè)大學(xué)能源與建筑工程學(xué)院助教,碩士;李春燕(1970-),女,黑龍江尚志人,黑龍江省尚志市沖河學(xué)校教師;葉建柱(1965-),男,浙江溫州人,溫州大學(xué)物理與電子信息工程學(xué)院教授,碩士。]
【責(zé)任編輯 鄭雪凌】