張銜 許清清
摘 要:針對國內(nèi)學(xué)者普遍運用“囚徒困境”范式分析勞資沖突,而忽略“囚徒困境” 模型是否符合我國勞資關(guān)系的研究現(xiàn)狀,本文研究了“囚徒困境”和重復(fù)博弈作為研究勞資關(guān)系的理論前提的局限性,修正了學(xué)術(shù)界套用這兩個模型而不考慮模型假設(shè)前提的做法;并用非對稱博弈模型分析了“資強勞弱”勞資關(guān)系的演化路徑。由于我國“資強勞弱”的勞資關(guān)系并不滿足“囚徒困境”模型的對稱性,因此,通過“重復(fù)博弈”手段來解決勞資沖突,期望達成勞資合作的結(jié)果存在嚴重的局限性。最后根據(jù)模型分析對政府干預(yù)勞資關(guān)系提出政策建議。
關(guān)鍵詞:“囚徒困境”;勞資關(guān)系;“資強勞弱”;重復(fù)博弈
中圖分類號:F241.3 文獻標識碼:A 文章編號:1000176X(2015)05012405
一、引言與文獻綜述
博弈理論提出重復(fù)博弈[1-2]可以達到合作秩序,因此,我國學(xué)者研究勞資沖突問題時,普遍流行用“囚徒困境”模型來構(gòu)造勞資沖突;用重復(fù)博弈手段來解決勞資“囚徒困境”, 認為解決勞資“囚徒困境”的途徑是運用長期合同下建立的重復(fù)博弈機制,從而實現(xiàn)勞資關(guān)系從沖突到合作轉(zhuǎn)化。在運用“囚徒困境”模型解決勞資沖突時,通常都有類似的敘述:勞資雙方由于考慮長期利益關(guān)系,單次沖突所帶來的短期利潤在無限次重復(fù)博弈中將變得微不足道,沖突不僅犧牲了對方的利益,同時也有損于己方的長期利益,從而有可能都選擇合作的策略,達到合作的成功。例如韋倩[3]使用了一個無限次重復(fù)博弈模型來解釋企業(yè)可以通過長期博弈效應(yīng)實現(xiàn)雇主和雇員之間的合作。崔曉麗和孫紹榮[4]通過對不同員工行為的轉(zhuǎn)變過程進行數(shù)學(xué)建模分析,構(gòu)建了無固定期限勞動合同制度勞資博弈模型。李玉燕[5]對我國私營企業(yè)勞資博弈的“囚徒困境”進行分析,認為建立長期合作機制是走出“囚徒困境”的解。
但是西方學(xué)者將重復(fù)博弈運用到勞資關(guān)系分析中, 卻并非單純依靠重復(fù)博弈來解決勞資沖突,而是運用集體談判制度來解決勞資沖突,重復(fù)博弈主要是納入集體談判框架下對談判過程的分析中。例如Espinosa和Rhee在分析有效談判模型如何讓雇主提高工資的同時又使雇主保持或者提高就業(yè)時,認為重復(fù)博弈中懲罰的可能性會加強有效談判的結(jié)果。Kahn認為,正如重復(fù)博弈所預(yù)測的那樣,美國工會更有可能簽署長期合作的勞動協(xié)定。
因此,西方學(xué)者運用重復(fù)博弈解決勞資沖突問題,主要是建立在集體談判制度之上的。集體談判制度是解決勞資問題的一項基本制度,重復(fù)博弈只是集體談判的一種方法。我國學(xué)者運用重復(fù)博弈解決勞資沖突的問題主要是建立在“囚徒困境”分析范式之上,由勞資雙方靠長期的重復(fù)博弈來解決。然而通過重復(fù)博弈來解決“囚徒困境”具有前提條件,如果現(xiàn)實的勞資關(guān)系不滿足這些前提條件,那么能否依靠勞資雙方的重復(fù)博弈自主解決勞資沖突的問題?因此,應(yīng)重新審視“囚徒困境”這個模型的假設(shè)前提以及用這一范式分析勞資沖突的一般性與特殊性。
二、“囚徒困境”模型分析勞資沖突的一般性與局限性
1.用“囚徒困境”模型分析勞資沖突的一般性
用“囚徒困境”分析勞資雙方博弈,雙方有兩個策略選擇:要么合作,要么沖突。博弈矩陣中的數(shù)字代表勞資雙方各自的得益,它的值不僅受一方策略選擇的影響,同時也受另一方策略選擇的影響。在這個矩陣中由于勞資雙方缺乏有效溝通途徑,因此分別做出決策,博弈是對稱的,即交換雙方的位置博弈矩陣中的數(shù)值是不會變化的,如圖1所示。
首先,分析資方的策略。如果勞方選擇合作策略,那么資方有兩個策略選擇:一是資方也選擇合作策略,則勞資雙方各自有5的得益;二是資方選擇沖突策略有6的得益,此時勞方有1的得益。由于資方選擇沖突策略的得益6比選擇合作策略得益1要高,因此在勞方選擇合作時,資方會選擇沖突。如果勞方選擇沖突策略,資方仍然有兩個策略選擇:一是資方?jīng)_突有3的得益,二是資方合作有1的得益,由此,在勞方選擇沖突策略時,資方仍然會選擇沖突。因此,資方的最優(yōu)選擇是沖突策略。
其次,分析勞方的策略。如果資方選擇合作策略,那么勞方有兩個策略選擇:一是勞方也選擇合作策略,則勞資雙方各自有5的得益;二是勞方選擇沖突策略有6的得益,此時資方有1的得益。由于勞方選擇沖突策略的得益6比選擇合作策略得益1要高,因此當(dāng)資方選擇合作時,勞方會選擇沖突。如果資方選擇沖突策略,勞方仍然有兩個策略選擇:一是勞方?jīng)_突有3的得益,二是勞方合作有1的得益,由此,在資方選擇沖突策略時,勞方仍然會選擇沖突。因此,勞方的最優(yōu)選擇是沖突策略。
由于勞資雙方都選擇沖突策略,因此模型最終的納什均衡是勞方低工資,資方低利潤(各得3)。“囚徒困境”博弈模型解釋了勞資雙方?jīng)_突的一般性過程。由于基于勞資博弈是零和博弈的思想,勞資雙方所得是此消彼長的關(guān)系,因此資本可以犧牲勞動的利益為代價來獲得好處,同理,勞動也可能通過侵占資本利益的手段來增加所得。但是“囚徒困境”博弈模型揭示了勞方與資方為了增加己方的利益卻不能實現(xiàn)雙方利益整體的增進,也不能實現(xiàn)個人最大利益,最終形成一個雙輸?shù)慕Y(jié)局;同時它也提示了勞資雙方存在著帕累托改進的可能,勞資雙方有可能從沖突轉(zhuǎn)向合作,從圖1的右下角到左上角轉(zhuǎn)變。
2.用“囚徒困境”模型分析勞資沖突的局限性
正是由于“囚徒困境”模型指出了勞資合作的可能性,使得學(xué)者們仿佛找到了一條解決勞資沖突通往勞資合作的路徑,并把“囚徒困境”模型作為勞資合作研究的理論支撐。但是用“囚徒困境” 分析勞資沖突與我國勞資沖突的真實情況相去甚遠,因此其局限性十分明顯。“囚徒困境”有一個理論前提為其是一個對稱博弈,即互換兩人位置對博弈結(jié)果沒有影響,可以理解成為兩個囚徒的實力相等,但這和我國“資強勞弱”的勞資現(xiàn)狀十分不同。由于學(xué)術(shù)界套用模型分析勞資關(guān)系卻沒有考慮模型假設(shè)前提,因此本文把“囚徒困境”用更一般的方式表達出來,來具體研究產(chǎn)生“囚徒困境”的條件,如圖2所示。
其中,T表示對背叛的誘惑,S表示給笨蛋的報酬,R表示對合作的獎勵,P表示對背叛的懲罰,產(chǎn)生囚徒困境的關(guān)鍵條件:(1)T>R>P>S,這個條件保證了參與人看到了T>R,以及P>S,將總會選擇第二行第二列,這不可避免地產(chǎn)生次優(yōu)的選擇;(2)(T+S)/2 我國的勞資沖突是否滿足以上的約束條件呢?“資強勞弱”的局面可理解為勞資博弈力量不均等,如果選用“囚徒困境”這個對稱模型來分析勞資沖突,勢必與我國的現(xiàn)狀不符。正如勞資的“囚徒困境”博弈(如圖1)所示,在“資強勞弱”的情況下,勞資雙方同時采用合作策略,勞資雙方能平分所得(5,5)嗎?勞資雙方同時采用沖突策略,勞資雙方又能平分所得(3,3)嗎?在“資強勞弱”的情況下,矩陣里的得益將不會滿足上述約束條件,弱勢一方不能通過背叛對方來改變自己的狀況,而強勢一方卻能通過背叛對方來提高自己的收益。因此,簡單套用“囚徒困境”這個對稱模型來分析我國勞資關(guān)系,存在嚴重的局限性。 三、重復(fù)博弈解決勞資“囚徒困境”的分析框架 1.分析框架 我國學(xué)術(shù)界基于重復(fù)博弈解決“囚徒困境” 達成“勞資合作解”時,通常沿用這樣的框架:勞方與資方在每一次的階段博弈中,出于維護自身利益的考慮,雙方都有沖突的沖動,因為沖突是自己在本次博弈中的占優(yōu)策略。但如果勞資雙方的壽命很長(幾近無限),并且進行無限次重復(fù)博弈。在不斷重復(fù)相同結(jié)構(gòu)的博弈之后,由于考慮長期利益關(guān)系,單次沖突所帶來的短期利潤在無限次重復(fù)博弈中將變得微不足道,沖突不僅犧牲了對方的利益,同時也有損于己方的長期利益,從而有可能都選擇合作的策略,達到合作的成功。所以勞資雙方的行為就可能表現(xiàn)出與一次性博弈中博弈方不惜欺騙、傷害對方的不同特點。因此,重復(fù)博弈有可能促進博弈雙方的合作,提高博弈效率。但是我國學(xué)術(shù)界在強調(diào)重復(fù)博弈解決“囚徒困境” 達成“勞資合作解”的可能性時,卻忽視了重復(fù)博弈達成“勞資合作解”的條件與局限性。 2.重復(fù)博弈達成“勞資合作解”的條件 第一,重復(fù)博弈能否提高合作效率在很大程度上取決于原博弈的具體情況。兩人零和博弈的無限次重復(fù)與有限次重復(fù)博弈的結(jié)果并不會有什么不同。因為重復(fù)次數(shù)的無限增加也不能改變原博弈中博弈雙方之間在利益上的對立關(guān)系,也不會創(chuàng)造出潛在的合作利益,因此在這種零和博弈的無限次重復(fù)博弈中,博弈雙方每次重復(fù)仍然都根據(jù)當(dāng)時的最大利益[7]。但從“囚徒困境”模型分析可知勞資雙方并非零和博弈,而是存在著帕累托的改進。因此,勞資博弈存在著重復(fù)博弈達成勞資合作的可能性。 第二,重復(fù)博弈能否提高合作效率依賴于可實施的策略。在重復(fù)博弈中最常使用的策略是觸發(fā)策略(Trigger Strategies),它是依存于其他對手的行動歷史而構(gòu)成的策略,并通過威嚇對手從而達成共同合作。而最著名的觸發(fā)策略則應(yīng)是冷酷策略(Grim Strategy)和針鋒相對策略(Tit for Tat Strategy)。在沒有約束力協(xié)議的情況下,每位參與者通過威嚇或其他手段,令各方同心合作,并逐步走向帕累托最優(yōu)。 具體到勞資重復(fù)博弈中,若勞方在第一階段被對方剝削,則在第二階段開始理性的勞方將不再與之合作,即使在背叛發(fā)生后它能挽回部分損失(畢竟長此以往可能遭受的損失巨大)。事實上,這已經(jīng)指出了一種勞方可能的策略選擇,即第一階段勞方單純合作或采取安全防范措施,若對方背叛,則在第二階段開始不與之博弈。若對方合作,則下一階段仍與之合作。不難想象,通過威嚇對手并懲罰任何偏離合作模式的行為的強硬手段,勞資合作在無限次重復(fù)博弈中是有可能出現(xiàn)的。 3.重復(fù)博弈達成“勞資合作解”的局限性 第一,重復(fù)博弈需要的時間長。如果期望勞資重復(fù)博弈來達到從沖突到合作的結(jié)果,是需要很長時間的,10年或者更長的時間;并且如果任由雙方經(jīng)過多次博弈,對他方背叛策略采取的報復(fù)行動,再接受合作,這樣的勞資沖突會不利于社會穩(wěn)定,因此這個途徑是低效率的。 第二,重復(fù)博弈中合作的可能機制是雙方可以采取退出的威脅策略。具體到勞資重復(fù)博弈中,第一階段勞方采取單純合作策略,若資方背叛,則在第二階段開始不與之博弈。若資方合作,則下一階段仍與之合作。不難想象,通過威嚇對手并懲罰任何偏離合作模式的強硬手段,勞資合作在無限次重復(fù)博弈中是有可能出現(xiàn)的。但在我國“資強勞弱”勞資博弈過程中,勞動者的博弈力量較小,對資方不合作行為的報復(fù)行動是否能夠真正實施成了不確定因素。因為弱勢勞方的威脅行為對資方的影響微小或者造成的損失為零,這樣就降低了威脅的必要性。鑒于威脅的高昂成本以及無果而終的可能性,弱勢勞方的威脅是不可置信的。在存在弱勢勞方威脅不可置信的情況下,對強勢資方而言,如果能夠準確判斷自己的優(yōu)勢,并對自己能夠預(yù)見的談判結(jié)果充滿信心,那么他就可以拒絕與勞方溝通[8]。因為勞資雙方之間根本不存在一個討價還價的空間。這也是為什么在我國勞資談判中,資方不出面或者出面也是拖延戰(zhàn)術(shù)的原因。因為他們是強勢的一方,由于弱勢一方的威脅不可置信,根本不存在討價還價的余地[8]。因此,用重復(fù)博弈分析勞資沖突的時候出現(xiàn)一個難題,即弱小的勞方與資方無論怎么重復(fù)博弈都達不到穩(wěn)定的合作狀態(tài)。 第三,在N人重復(fù)“囚徒困境”中的合作實際是幾乎不可能的。米勒[9]指出“針鋒相對”或者是“以牙還牙”策略在N人參與中遭遇到一個難題。由于任何人的小失誤都可能導(dǎo)致所有人合作的全部崩潰,在涉及10個行為主體的實驗中,略微超過半數(shù)的行為主體一開始采取了合作的策略,接下來合作的人數(shù)驟減。每個人都知道用自己的背叛去懲罰別人過去的背叛是理性的,于是背叛就不可避免地像滾雪球一樣愈演愈烈。因此,勞方單個個體眾多,勞方聯(lián)合形成緊密團體會因為勞方內(nèi)部的個別失誤變得困難重重,這將很難形成與資方抗衡的力量。
四、非對稱勞資博弈演化模型
重復(fù)博弈為解決“囚徒困境”提供了一種可能性,其可打破勞資雙方在低水平上的均衡(沖突,沖突),而形成在更高水平上的均衡(合作,合作)。但值得注意的是,由于“囚徒困境”是對稱博弈,因此暗含勞資博弈力量是平衡的這一前提。這顯然不符合我國“資強勞弱”的實際情況。如若勞資博弈力量不平衡,那么重復(fù)博弈將會產(chǎn)生怎樣的后果?因此,本文放棄“囚徒困境”模型, 用“非對稱模型”作為邏輯分析起點來描述勞資博弈,這樣更符合我國的勞資現(xiàn)狀;并同時借用演化博弈工具分析談判力不平衡的勞資談判的演化博弈路徑。演化博弈把博弈理論分析和動態(tài)演化過程分析結(jié)合起來,這種分析框架與人們在現(xiàn)實決策活動中的實際行為模式更為接近。許清清和張銜[10]運用“非對稱模型”分析了“資強勞弱”勞資大群體重復(fù)博弈的演化路徑。勞資雙方所爭奪的剩余份額是不同的。因為資強勞弱時,資方份額V1>勞方份額V2,C為勞資沖突的損失,μ為勞資雙方侵占對方利益的所得,如圖3所示。
圖6顯示,勞資雙方通過重復(fù)博弈過程不斷試錯、模仿、學(xué)習(xí)找到最優(yōu)策略并達到如下局部穩(wěn)定狀態(tài)。在A區(qū)域?qū)諗康劫Y方采用合作策略,勞方采取沖突策略(x*=0,y*=1);在B區(qū)域?qū)諗康劫Y方和勞方都采用合作策略(x*=0,y*=0);在C區(qū)域?qū)諗康劫Y方和勞方都采用沖突策略(x*=1,y*=1);在D區(qū)域?qū)諗康劫Y方采用沖突策略,勞方采取合作策略(x*=1,y*=0)。這個結(jié)果表明,只有在B這個較小的區(qū)域達成了勞資合作的境地,在A、C、D三個區(qū)域都存在勞資沖突,特別是在C區(qū)域存在勞資對抗。因此,非對稱勞資博弈模型證明了在“資強勞弱”的情況下,依靠勞資雙方的自然演進在大多數(shù)情況下存在勞資沖突并很難達成勞資合作。所以,在“資強勞弱”的環(huán)境中,依靠勞資雙方長期重復(fù)博弈來解決“囚徒困境”達成勞資合作的狀態(tài)不僅概率低,而且是一條充滿勞資沖突的路徑。
五、 政策建議
我國諸多學(xué)者注意到重復(fù)博弈為勞資合作提供了一個分析視角,因此提出了員工與企業(yè)簽定長期合同的政策建議,但是本文分析了重復(fù)博弈解決“囚徒困境”促進勞資合作的局限性:首先, 套用“囚徒困境”模型分析勞資問題忽視了其暗含的條件是勞資雙方博弈力量平衡,這與我國“資強勞弱”的現(xiàn)實狀況相去甚遠;其次,“資強勞弱”的勞資關(guān)系通過雙方長期博弈自然演化達到勞資合作的概率較小,或者說僅通過勞資雙方長期重復(fù)博弈自主演化來達成勞資合作是低效率的。這為我國政府作為第三方介入勞資關(guān)系提供了強有力的理論支持。政府的介入不僅可以縮短勞資長期博弈的時間,還可以減少勞資沖突的過程。但是從“富士康員工跳樓”到“裕元鞋廠集體罷工”等勞資沖突事件引發(fā)了對我國政府介入勞資關(guān)系行為的思考。
我國中央政府對勞資關(guān)系的管理主要集中在通過法律的手段介入勞資合同的具體標準以保護個體勞動者的基本權(quán)利,以行政命令建立自上而下的工會與強制推行勞資協(xié)商制度以促進勞方群體的結(jié)盟。各地方政府則充當(dāng)勞資沖突轉(zhuǎn)化為社會沖突時的調(diào)停者,注重沖突的事后解決。由于缺乏法律規(guī)章的引導(dǎo),各地方政府解決勞資沖突表現(xiàn)出的態(tài)度不一,解決勞資沖突的處理方式也不一,有些是注重用解散罷工等強硬手段來防止群體沖突的事態(tài)擴大;有些是滿足勞方的利益要求以求快速滅火;有些則是主持集體談判讓勞資雙方自由協(xié)商。因此,政府在勞資沖突到勞資合作的轉(zhuǎn)化過程中所起的作用與角色定位都不明確。由于我國政府沒能有效發(fā)揮勞資博弈第三方主體的作用,干預(yù)勞資關(guān)系的職能偏差造成了工會松散、為工人謀利益的目標模糊以及集體談判制度的形式化。這既不能改變勞資博弈力量不平衡狀況,也不能改變“資強勞弱”基本勞資關(guān)系格局。所以正如文中非對稱勞資博弈模型所示,“資強勞弱”的勞資博弈自主演化過程中勞資沖突是持久與激烈的。
那么,政府應(yīng)該怎樣發(fā)揮勞資博弈第三方主體的作用呢?筆者認為政府應(yīng)該通過出臺平衡勞資兩大集團間博弈力量的機制來促成勞資合作的目標。在勞資利益關(guān)系的發(fā)展過程中,政府一般不直接參與到具體勞資事務(wù)中來,而主要是通過系統(tǒng)的制度介入來調(diào)整、 監(jiān)督、干預(yù)勞資利益關(guān)系的運行,而這些制度的出臺都應(yīng)該圍繞促使勞方和資方的力量處于一種相對平衡狀態(tài)。
參考文獻:
[1]Friedman,J. A NonCooperative Equilibrium for Super Games[J].Review of Economic Studies,1971, 38(7):1-12.
[2]Fudenberg,D., Maskin,E.The Folk Theorem in Repeated Games with Discounting or with Incomplete Information[J].Econometrical,1986,54(8).
[3]韋倩.企業(yè)的性質(zhì):一個基于合作視角的分析框架[J].制度經(jīng)濟學(xué)研究,2008, (5):79-93.
[4]崔曉麗,孫紹榮. 無固定期限勞動合同制度下勞資博弈及臨界點研究[J].企業(yè)經(jīng)濟,2009,(6).
[5]李玉燕.我國私營企業(yè)勞資博弈的囚徒困境及其求解[J].西安財經(jīng)學(xué)院學(xué)報,2011,(5):15-18.
[6][7]奧利·阿申費爾特, 戴維·卡德. 勞動經(jīng)濟學(xué)手冊[C]. 北京: 經(jīng)濟科學(xué)出版社, 2011.126.
[6]鄧肯·J.瓦茨. 小小世界——有序與無序之間的網(wǎng)絡(luò)動力學(xué)[M].陳禹等譯,北京:中國人民大學(xué)出版社,2006.142.
[7]謝識予. 經(jīng)濟博弈論(第二版)[M]. 上海:復(fù)旦大學(xué)出版社, 2006.34-35.
[8]托馬斯·謝林. 沖突的戰(zhàn)略[M].趙華等譯,北京:華夏出版社, 2011.3.
[9]蓋瑞·J.米勒.管理困境——科層的政治經(jīng)濟學(xué)[M].王勇等譯,上海:上海三聯(lián)書店,2006.256.
[10]許清清,張銜.勞資談判博弈的演化路徑與穩(wěn)定策略[J].統(tǒng)計與決策,2014,(6):55-58.
(責(zé)任編輯:巴紅靜)