[摘要]交通行業(yè)人才開發(fā)主體之間的博弈行為,直接決定著交通行業(yè)人才開發(fā)平臺運行的效率與管理模式。文章引入博弈理論分析了各主體之間的相互關系,解析人才開發(fā)主體的機理,并提出了合作的管理思路。
[關鍵詞]博弈論;交通行業(yè)人才開發(fā);人才開發(fā)主體;人才開發(fā)平臺
[中圖分類號] F224.32[文獻標識碼] A
[文章編號] 1673-0461(2009)01-0062-08
※本文為中國博士后科學基金的資助項目《交通行政機關人才隊伍建設研究》(20080431003)。
一、競合博弈的內(nèi)涵
1.博弈論
博弈論(Game Theory)起源于20世紀初,其中最主要的概念是納什均衡(Nash Equilibrium)即這樣一組策略組合:如果每一個博弈方的策略相對于其他博弈策略來說都是最優(yōu)的話,那么這些策略組合就構成了納什均衡。一個標準的博弈應當包括參與人、行為、信息、策略、次序、收益、結(jié)果、均衡八個方面。
(1)博弈的參與人(Player),又稱“局中人”,也稱為“博弈方”,是指博弈中獨立決策、獨立承擔后果,以自身利益最大化來選擇行動的決策主體(可以是個人,也可以是團體,如廠商、政府、國家),局中人以最終實現(xiàn)自身利益最大化為目標。對我們來說,只要在一個博弈中統(tǒng)一決策、統(tǒng)一行動、統(tǒng)一承擔結(jié)果,不管一個組織有多大,哪怕是一個國家,甚至是由許多國家組成的聯(lián)合國,都可以作為博弈中的一個參與方。并且,在博弈的規(guī)則確定之后,各參與方都是平等的,大家都必須嚴格按照規(guī)則辦事。
(2)博弈行為(Action),是指參與人的所有可能的策略或行動的集合,如消費者效用最大化決策中的各種商品的購買量;廠商利潤最大化決策中的產(chǎn)量、價格等。根據(jù)該集合是有限還是無限,可分為有限博弈和無限博弈,后者表現(xiàn)為連續(xù)對策、重復博弈和微分對策等。
(3)博弈信息(Information),是指參與人在博弈過程中所掌握的對選擇策略有幫助的情報知識,特別是有關其他參與人(對手)的特征和行動的知識,即該參與人所掌握的其他參與人的、對其決策有影響的所有知識。
(4)博弈策略(Strategies),又稱戰(zhàn)略,是指參與人可選擇的全部行為(Actions)或策略的集合,也就是指參與人應該在什么條件下選擇什么樣的行動,即規(guī)定每個博弈方在進行決策時,可以選擇的方法、做法或經(jīng)濟活動水平、量值等,以保證自身利益最大化。在不同博弈中可供博弈方選擇的策略或行為的數(shù)量很不相同,在同一個博弈中,不同博弈方的可選策略或行為的內(nèi)容和數(shù)量也常不同,有時只有有限的幾種,甚至只有一種,而有時又可能有許多種,甚至無限多種可選策略或行為。
(5)博弈的次序(Order),即博弈參與者作出策略選擇的先后順序。在現(xiàn)實的各種決策活動中,當存在多個獨立決策方進行決策時,有時候需要這些博弈方同時作出選擇,因為這樣能保證公平合理,而很多時候各博弈方的決策又有先后之分,并且有時一個博弈方還要作不止一次的決策選擇。這就免不了有一個次序問題。因此界定一個博弈必須規(guī)定其中的次序,即時博弈的其他方面都相同,次序不同一般就是不同的博弈。
(6)博弈方的收益(Rayoff),又稱支付,是指參與人從博弈中作出決策選擇后的所得和所失,它是所有參與人策略或行為的函數(shù),是每個參與人真正關心的東西,如消費者最終所獲得的效用、廠商最終所獲得的利潤。由于我們對博弈的分析主要是通過數(shù)量關系的比較進行,因此我們研究的絕大多數(shù)博弈,本身都有數(shù)量關系的結(jié)果或可以量化為數(shù)量的結(jié)果,例如收入、利潤、損失、個人效用和社會效用、經(jīng)濟福利等,即“得益”。得益可以是正值,也可以是負值,它們是分析博弈模型的標準和基礎。
(7)結(jié)果(Outcome),是指博弈分析者感興趣的要素集合。
(8)均衡(Equilibrium),是指所有參與人的最優(yōu)策略或行動的組合。這里的“均衡”特指博弈中的均衡,一般稱為“納什均衡(Nash Equilibrium)”。
以上八個方面是定義一個博弈時必須首先設定的,確定了上述八個方面就確定了一個博弈。博弈論就是系統(tǒng)研究可以用上述方法定義的各種博弈問題,尋求在各博弈方具有充分或者有限理性(Full or Bounded Rationality)能力的條件下,合理的策略選擇和合理選擇策略時博弈的結(jié)果,并分析這些結(jié)果的經(jīng)濟意義、效率意義的理論和方法。
2.合作競爭
(1)合作競爭的涵義
競爭與合作,是交通行業(yè)人才開發(fā)平臺中各單位所面臨的實際問題,如同太極八卦中的陰陽兩極,相克相生。因此單純強調(diào)競爭與合作的任何一方面都是有害的。與競爭對手進行你死我活的競爭只會破壞市場,導致“雙輸”,甚至漁翁得利;為了合作而不考慮自身利益,創(chuàng)造一個自己不能有效控制的市場也不是明智之舉?;诓┺恼摶A上的競爭合作關系是運用博弈論對“游戲”規(guī)則進行系統(tǒng)分析,積極主動的參與游戲,并盡可能地改變“游戲”,以獲得良好的經(jīng)營業(yè)績。
(2)合作競爭的本質(zhì)
資源基礎理論指出,企業(yè)業(yè)績差異本質(zhì)上是由每家企業(yè)所擁有資源的異質(zhì)性決定的。能積累或獲取稀有、有價值、不可替代和很難模仿的資源和能力(即獨特資源和能力)的企業(yè)將獲得競爭優(yōu)勢,而一家企業(yè)擁有的獨特資源往往因為專用性、信息不對稱或企業(yè)依附等原因只有通過合作才能被另外一家企業(yè)獲取。戰(zhàn)略聯(lián)盟是為了充分發(fā)揮聯(lián)盟內(nèi)企業(yè)間競爭優(yōu)勢的協(xié)整和互補效應,為成員鞏固現(xiàn)有的優(yōu)勢和創(chuàng)造新的競爭優(yōu)勢。資源基礎理論解釋的是,不同企業(yè)競爭優(yōu)勢的最終來源是其擁有的稀有、有價值、不可替代和很難模仿的資源和能力,而企業(yè)間形成戰(zhàn)略聯(lián)盟展開合作競爭的本質(zhì)是為了實現(xiàn)這些資源的共享和互補,以提升各自的競爭優(yōu)勢和企業(yè)所屬價值鏈的整合競爭力。企業(yè)通過合作可以獲取別人的獨特資源,但前提是自己擁有獨特資源。與競爭對手合作存在風險。聯(lián)盟企業(yè)間關系的一個重要特征是合作與競爭之間的張力,暗示了合作不是無限制的。
(3)合作競爭的策略
如果說資源基礎理論解釋了聯(lián)盟合作競爭的動因和本質(zhì),那么博弈論為聯(lián)盟合作競爭行為選擇提供了巧妙的剖析工具。聯(lián)盟成員的合作競爭行為分析可從囚徒困境模型開始,但缺點是該模型建立在零和非重復博弈基礎上,而戰(zhàn)略聯(lián)盟因考慮合作而主要涉及非零和與重復博弈。在戰(zhàn)略聯(lián)盟中,背叛在一次性囚徒困境博弈中是短期占優(yōu)策略,但它卻不適合結(jié)果不確定的多重博弈。因為在重復博弈的條件下合作的可能性明顯增加。即使是一次性博弈,如果背叛的懲罰很高,或者合作各方都重視合作并且關心自己在商業(yè)圈子里的聲譽,背叛同樣不是占優(yōu)策略。
博弈論能幫助我們理解聯(lián)盟中的合作競爭現(xiàn)象,也能為聯(lián)盟成員合作競爭行為選擇提供依據(jù)。當我們將企業(yè)間一連串博弈看作一個整體或過程,博弈論便可以揭示合作與競爭的復雜聯(lián)系,也能證明合作競爭關系在戰(zhàn)略聯(lián)盟成員間是與生俱來,它們中任何一個都不可能從博弈中去掉。同時,戰(zhàn)略聯(lián)盟成員企業(yè)之間的博弈是一種自定規(guī)則的博弈,不同的規(guī)則可能產(chǎn)生不同的合作競爭效應,因此戰(zhàn)略聯(lián)盟失敗的原因并不是戰(zhàn)略聯(lián)盟本身的不合理,而是雙方或多方在戰(zhàn)略聯(lián)盟時規(guī)則制定的失誤。
二、交通行業(yè)人才開發(fā)主體的博弈關系
交通行業(yè)人才開發(fā)平臺主體中,交通干部管理學院作為牽頭單位,擁有最大的資源等優(yōu)勢,而32個地方主管部門及其培訓機構和單位彼此間資源、優(yōu)勢相似或互補,總體來說在區(qū)位、規(guī)模和優(yōu)勢上不相上下,各有千秋。平臺建設僅僅是一項基礎性工作,一切的目標都是為了推廣交通行業(yè)發(fā)展所需要的培訓項目[1]。平臺建立以后,通過資源共享,打破了原有的地方割據(jù),各地主管部門及其培訓機構作為人才開發(fā)的平行單位,面臨更大的競爭范圍和競爭強度,相互間如果通過激烈競爭優(yōu)勝劣汰,可能會導致現(xiàn)有各單位間的惡性競爭。平臺建立的本意并非于此,而在于將各地分散的資源整合起來,通過合作來達到1+1>2的效益,而各平行單位間的合作也存在理論上的可能性。交通行業(yè)人才開發(fā)主體共同組成了一個集體層面的結(jié)構。集體層面結(jié)構的類型是很重要的,因為結(jié)構的類型體現(xiàn)了結(jié)構的性質(zhì),而結(jié)構的性質(zhì)會影響其組合方式和測量方法[2]。
1.分工合作的比較優(yōu)勢分析
馬克思在論述分工、協(xié)作時指出,許多工人在空間上集合就獲得了勞動的社會性質(zhì)。這種勞動的社會性質(zhì)就是結(jié)合勞動具有的社會生產(chǎn)力,它在勞動者分散地、獨立地起作用時,是不可能產(chǎn)生出來的。這種結(jié)合勞動具有的社會生產(chǎn)力的存在是企業(yè)出現(xiàn)的先決條件。沿著馬克思的這一思路,我們進一步考察影響結(jié)合勞動的社會生產(chǎn)力大小的因素。從生產(chǎn)力與生產(chǎn)關系的關系看,企業(yè)成員的關系直接影響結(jié)合勞動的效率。
各人才開發(fā)(培訓)單位、獨立研究與開發(fā)機構以及高等學校等平臺構成因素,作為人才開發(fā)的直接輸出單位,如果它們能夠根據(jù)各自的比較優(yōu)勢,進行分工合作,做到優(yōu)勢互補、4資源共享將會增強其實力,通過融入平臺提高自身實力與產(chǎn)出水平。
假設在平臺構建的過程中(假設為X,Y產(chǎn)品)有需求,并假設平臺內(nèi)有兩個培訓單位(假設為甲、乙單位)具備承接這種人才開發(fā)項目的能力,但對于這兩種人才的開發(fā),兩單位的成本不同。甲單位培養(yǎng)X人才和Y人才的單位成本分別為5和50,乙單位培養(yǎng)X人才和Y人才的單位成本分別為12.5和300(見表1)。
表1. 交通人才開發(fā)主體博弈的成本博弈模型
從上表來看,對承接X、Y人才的開發(fā),甲單位都擁有絕對優(yōu)勢。因為它在培養(yǎng)X、Y人才時的成本都要小于乙單位培養(yǎng)X、Y人才時的成本。但根據(jù)對甲、乙兩單位X、Y人才的相對成本的比較,甲單位在Y人才開發(fā)上具有比較優(yōu)勢,乙單位在X人才開發(fā)上具有比較優(yōu)勢。如果根據(jù)大衛(wèi)·李嘉圖的比較優(yōu)勢理論來分析,甲乙兩單位在承接區(qū)域X、Y人才開發(fā)時會進行生產(chǎn)分工,甲單位專門開發(fā)Y人才,乙單位專門開發(fā)X人才。這是因為,分工不僅使雙方有利,而且從區(qū)域整體角度考慮,甲乙兩單位進行分工也是有利的。因為假設分工前甲乙兩單位對X、Y人才的培養(yǎng)項目都為5個。為滿足需求,兩單位的總成本為1837.5(見表2)。
表2. 交通行業(yè)人才開發(fā)主體博弈的成本比較模型
若分工后X、Y人才的開發(fā)成本由培訓單位確定,則X、Y人才的單位開發(fā)成本分別為12.5和50,于是兩區(qū)域承接10個X人才開發(fā)項目和10個Y人才開發(fā)項目的總成本降低(見表3)。
表3.交通行業(yè)人才開發(fā)主體博弈的成本下降模型
分工后,甲乙兩單位以625的投入滿足了原來1,837.5投入才能滿足的需求。這樣,分工使區(qū)域整體實現(xiàn)了低成本下的需求滿足。
2.協(xié)作的納什均衡分析
以上是根據(jù)比較優(yōu)勢理論得出的結(jié)論,下面再從博弈論方面進行分析。
根據(jù)博弈理論,企業(yè)的收益不僅取決于他自己的行為,還取決于與之交易的另一企業(yè)的行為。交通行業(yè)人才開發(fā)平臺中,同為人才直接輸出主體的培訓機構和單位往往具有各自的資源優(yōu)勢及資源互補性,他們之間的博弈可分為合作和不合作。為簡化分析,取兩單位作為博弈主體,合作是為了雙方的利益得到最大程度的保障,博弈雙方通過談判并按照有關協(xié)議在以后的交易中,雙方的行為都能為對方所接受。不合作指博弈雙方因利益沖突不能達成協(xié)議或達成協(xié)議后背叛協(xié)議。個體的利己主義傾向使得個體理性和集體理性存在矛盾與沖突,導致不合作選擇的出現(xiàn),如果博弈雙方都從個體理性出發(fā),決策時都以追求自身利益的最大化為目標,結(jié)果往往無法實現(xiàn)帕累托最優(yōu)。
(1)納什均衡理論在交通行業(yè)人才開發(fā)主體合作的博弈分析
假設博弈雙方的博弈方式分為合作和不合作。這兩種策略對應的收益情況(如表4)。
表4. 交通行業(yè)人才開發(fā)主體博弈的策略模型
對于單位甲而言,如果單位乙愿意與之合作,它獲得的利益分別為8,5,以利益最大化原則,它會選擇利益為8的策略,即不與對方合作。如果單位乙不愿意合作,單位甲獲得的利益分別為2,1,以利益最大化原則,單位甲會選擇利益為2的策略,即不與對方合作??梢缘玫?,無論單位乙選擇何種策略,理性的單位甲都會選擇不與對方合作的策略。同理,單位乙也會選擇不與對方合作的策略。因而該博弈的納什均衡解為(不合作,不合作)。而由表4可看出,雙方最理想的選擇為都選擇與對方合作,此時雙方獲得的利益均為5,但雙方從自身利益出發(fā)陷入了“囚徒困境”之中。在一次交易中,單位甲和單位乙均采取不合作時達到納什均衡,此時雙方得益各為2,并沒達到帕累托最優(yōu),博弈組合(合作,合作)才是帕累托最優(yōu),該結(jié)果優(yōu)于(不合作,不合作)的結(jié)果,但博弈組合(合作,合作)在策略上是不穩(wěn)定的。若單位乙認為對手合作,則他選擇不合作的可能性很大,反之亦然。這反映了一個很深刻的問題,即個人理性和集體理性是相互沖突的,在一次囚徒困境博弈中,不可能產(chǎn)生合作,納什均衡并不一定導致帕累托最優(yōu)。
下面我們考慮委托人參與管理。為了實現(xiàn)人才開發(fā)平臺良性運作,使整體收益最大化,管理者希望平臺參與單位實現(xiàn)資源共享、優(yōu)勢互補的合作,對不合作者將采取一定的懲罰措施,比如罰款。假定管理者對不合作者處以重罰——不僅沒收其不合作的額外所得,而且另外處以一定程度的罰款,使其不合作所得必定小于合作所得,并把處罰所得用以對合作者的獎勵;針對上述模型中的利益假定,懲罰不合作者至少拿出4單位利益作為罰金,并把它獎給合作者,那么其收益矩陣將改變,如表5所示。該博弈的惟一納什均衡將是(合作,合作),實現(xiàn)利益向量(5,5),培訓單位走出困境。
表5. 交通行業(yè)人才開發(fā)主體博弈的結(jié)果模型
(2)交通行業(yè)人才開發(fā)主體合作的重復博弈分析
要使人才開發(fā)平臺長期良性運作下去,平臺參與企業(yè)間應結(jié)成長期穩(wěn)定的戰(zhàn)略合作伙伴關系,平臺中企業(yè)間的博弈就具有無限次重復博弈的特征。假設雙方都采用“觸發(fā)器”策略:開始階段每個博弈者都想樹立良好的信譽形象(即使他在本質(zhì)上不一定想合作),雙方都先試圖合作,第一次無條件選合作策略,在第t階段,如果前t-1次對方都合作,則繼續(xù)采用合作策略,否則永遠采用不合作策略給予報復并迫使對方只能選不合作策略,大家都得到較小的利益。這是一個子博弈完美納什均衡。
首先證明上述的觸發(fā)策略是一個納什均衡。假定單位乙已經(jīng)選擇了上述的觸發(fā)策略,并令δ為貼現(xiàn)因子(假定兩人的貼現(xiàn)因子相同)。如果單位甲在博弈的某個階段首先選擇了不合作,他在該階段得到8單位利益,而不是5單位,他在當期能多得3單位。但他的這種機會主義行為將觸發(fā)單位乙的“永遠不合作”的懲罰,單位甲在隨后的所有階段的收益都是2單位利益。因此如果下列條件滿足,給定單位乙不會選擇不合作,單位甲也不會選擇不合作:
8+2δ+2δ^2+…≤5+5δ+5δ^2+…
或:
8+2δ/(1-δ)≤5+5δ/(1-δ)
解上述條件得:δ*≥1/2;就是說,如果δ≥1/2,給定單位乙堅持觸發(fā)策略并不會首先不合作,單位甲也不會首先不合作。觸發(fā)策略是一個納什均衡,這是子博弈完美的。因為是無限次重復博弈,從任何下一個階段開始的子博弈與這個子博弈的結(jié)構完全相同。在觸發(fā)策略納什均衡下,子博弈可以劃分為兩類:一類為沒有任何單位曾經(jīng)不合作的子博弈;另一類為至少有一單位曾經(jīng)不合作的子博弈。而在后一類子博弈中,根據(jù)觸發(fā)策略,培訓單位只是重復原博弈的納什均衡,它自然也是整個子博弈的納什均衡。因此,當δ≥1/2,觸發(fā)策略是無限次不合作博弈的一個子博弈完美納什均衡,帕累托最優(yōu)(合作,合作)是相應均衡路徑上每一個階段的策略組合。
(3)機制設計理論和對培訓單位有效激勵的條件
從委托——代理理論的角度來看,平臺構建因素中的人才需求單位和人才開發(fā)單位可以充當委托人和代理人的角色。其中,委托人包括地方交通主管部門和企事業(yè)單位,它們既是平臺的使用者也是交通人才的需求者,并將人才開發(fā)任務委托給代理人;代理人包括人才開發(fā)(培訓)單位、獨立研究與開發(fā)機構以及高等職業(yè)學校,它們接受委托人的委托,完成代理人才開發(fā)任務。
從上述納什均衡分析中,我們可以得出:如果委托方能長期提供具有吸引力的項目而且培訓代理單位有足夠的耐心,那么,代理人任何短期的機會主義行為所得都是微不足道的,他們都會有積極性為自己建立一個樂于合作的美譽,同時也有積極性懲罰對方的機會主義行為,從而產(chǎn)生了培訓單位之間的自覺合作。
從博弈論的觀點看,由于委托人和代理人是兩個相互獨立的法人,它們都有追求自身利益的權利,代理人并沒有責任和義務犧牲自己的利益來配合委托人利益目標的必要,所以目標的沖突是必然的。問題的關鍵在于委托人應如何設計一個激勵機制(博弈規(guī)則)使得代理人有積極性來配合自己的意圖和目標。
機制設計理論中,存在一個“委托人”和一個或多個“代理人”;委托人的支付函數(shù)是共同知識,代理人的支付函數(shù)只有代理人自己知道,委托人和其他代理人不知道;委托人可以直接要求代理人報告自己的類型,但代理人可能不會說實話,除非委托人能提供給代理人足夠的激勵(貨幣的或非貨幣的);因為提供激勵是有成本的,因此,委托人面臨著成本和收益的權衡。委托人將設計一個機制或者說一個激勵方案,其目的是使自己的期望效用函數(shù)最大化,但這樣會面臨兩個約束:第一個約束是參與約束,即如果要一個理性的代理人有任何積極性接受委托人所設計的機制(從而參與博弈)的話,代理人在該機制下得到的期望效用必須不小于他在不接受這個機制時得到的最大期望效用(即機會成本)。因為代理人在參與該博弈時就失去了博弈之外的其它取得期望效用的機會。當然,如果代理人沒有其他選擇,那么參與約束就無須考慮了。第二個約束是激勵相容約束,即給定委托人不知道代理人類型的情況下,代理人在委托人所設計的機制下必須有積極性選擇委托人希望他選擇的行動。顯然,只有當代理人選擇委托人希望他選擇的行動時得到的期望效用不小于他選擇其他行動時得到的期望效用,代理人才有積極性選擇委托人所希望的行動。也只有滿足激勵相容的機制才是激勵有效的機制。
在交通行業(yè)人才開發(fā)環(huán)節(jié)中,委托人的問題是選擇一個滿足激勵相容機制以最大化自己的期望效用。由于存在以下兩個原因使得激勵相容約束的滿足非常不容易:①在交通產(chǎn)業(yè)迅速發(fā)展的形勢下,交通人才的需求單位不斷增加,需求水平也不斷提高,對于有限的人才開發(fā)資源的競爭將非常激烈,這個事實會使委托人已提供給代理人的優(yōu)惠條件隨時可能受到挑戰(zhàn),因為如果其他需求單位提供的優(yōu)惠更大,代理人就會把重點移向其它項目;②代理人(人才開發(fā)單位)的市場力量會隨著經(jīng)驗的積累而壯大,他們的談判地位會逐漸提高,這時原先能滿足的激勵相容約束的激勵程度就會顯得不足。
另外,交通人才結(jié)構調(diào)整是一個動態(tài)的過程,隨著經(jīng)濟和社會結(jié)構的變化而變化。[3]交通人才需求單位不僅在平臺合作關系建立時應提供一定的激勵因素以吸引人才開發(fā)單位的參與,而且在平臺建立后,為維護平臺的合作與穩(wěn)定,還必須經(jīng)常不斷地鼓勵開發(fā)單位,而激勵的有效性取決于激勵相容約束條件的滿足。
三、交通行業(yè)人才開發(fā)主體的合作博弈
博弈論里有一個很經(jīng)典的模型,即智豬博弈?!爸秦i博弈”源自這樣一種假設:大豬小豬喂養(yǎng)在同一個豬圈中,豬圈一頭安裝有一個杠桿,只要踩杠桿,豬圈另一頭固有的食物槽里就會流出飼料。設食物槽一次流出的飼料共6份,踩杠桿需要花費相當于半份飼料的能量。如果兩頭豬都不踩的話,它們什么也吃不到;若小豬踩杠桿,等它跑到食物槽前,發(fā)現(xiàn)大豬已經(jīng)吃光了6份飼料;若大豬踩杠桿,等它跑回來時,發(fā)現(xiàn)只能分享到1份飼料;倘若兩頭豬一起踩杠桿,大豬可得4份飼料,小豬可得2份飼料。由此建立如下一個盈利矩陣(如表6)。
表6. 交通人才開發(fā)主體博弈的智豬博弈模型
根據(jù)累次嚴優(yōu)的定義,顯然小豬具有嚴優(yōu)策略——不踩杠桿而坐享其成,因此該博弈的納什均衡解是惟一的,即(大豬踩,小豬不踩),因為考慮到小豬的獲益得到了增加,大豬也有所得,并且沒有造成浪費,所以一般介紹博弈論的書中都將此模型描述為“個別理性與集體理性的完美統(tǒng)一”。那么大豬的最佳策略是什么呢?在小豬選擇去踩的情況下,如果大豬也跟著去踩,它能得3.5單位凈利,結(jié)果并不算太好;這時如果大豬不踩,就能得6單位凈利。所以,這時大豬等待反而比踩的結(jié)果好。在小豬選擇等待的情況下,大豬踩,則可得0.5單位凈利;如果等待就什么都沒有。這時大豬踩比等待的結(jié)果好。這樣,對于大豬來講,有時踩能獲得好結(jié)果,有時等待能獲得好結(jié)果,這需要看小豬采取什么樣的策略,進而自己再采取相應的對策。因此,在這個博弈的過程中,小豬始終握有主動權,大豬則是被動的,沒有先機的。
然而,相對于小豬“坐享其成”獲得的收益(5單位)要比大豬耗費能量而獲得的收益(0.5單位)高得多,雖然確實沒有集體利益和個人利益之間的嚴重沖突,但個人利益和個人利益之間存在著沖突。對應于這種機制,選擇做小豬要比做大豬合理的多。但是現(xiàn)實生活中既要有人做大豬,也要有人做小豬,這才是真正的智豬博弈。同時,即使默認大豬在一次博弈中會這樣選擇,在重復性博弈中也會改變策略,出現(xiàn)“反理性”的報復行為,即寧可忍受“無所得”,而不愿接受小豬不踩而盈利是自己的10倍的結(jié)局,除非博弈的條件發(fā)生改變。
大豬和小豬的策略選擇問題其實也是交通行業(yè)人才開發(fā)平臺中大單位(交通干部管理學院)與各地方主管部門及其培訓單位(小單位)如何做到共同良性發(fā)展該思考的問題。智豬博弈關鍵點有三個:一是兩豬必有一方放棄部分利益,不可能兩全其美;二是小豬不可能消耗掉所有利益;三是理性是豬的固有屬性。前兩點是環(huán)境構成的客觀條件,不容更改;第三點則是解決問題的關鍵,而且大豬的“正”理性行為尤為重要。如果小豬是大公無私的,那么結(jié)果必須遭受厄運,這說明小豬的大公無私是非理性的;大豬如果是自私的,那么結(jié)果是兩豬都無法生存。
由此,不妨將交通干部管理學院隱喻為“大豬”,各地方主管部門及其培訓單位喻為“小豬”。交通干部管理學院歷來是交通行業(yè)最大的培訓中心,具有突出的區(qū)位、人才、資源和科教優(yōu)勢,也有著雄厚的培訓基礎,其整體實力和發(fā)展能力在交通行業(yè)中始終名列首位,是交通行業(yè)人才開發(fā)的主基地。在資源投入與開發(fā)創(chuàng)新上,學院無疑擔當了大豬的角色。根據(jù)“智豬博弈”案例,假設有以下策略供選擇:一是兩豬都不踩踏板,維持現(xiàn)狀;二是小豬踩踏板,大豬得食,即損失地方單位的部分利益;三是大豬踩踏板,小豬吃飽,即割讓部分利益,讓地方各單位也發(fā)展起來。三種策略的結(jié)果是:第一種策略導致交通行業(yè)人才開發(fā)平臺維持相對滯后,資源整合利用效率不高;第二種策略結(jié)果是地方單位發(fā)展滯后繼續(xù)惡化;第三種策略可能改變地方滯后狀況,而交通干部管理學院繼續(xù)保持增長態(tài)勢。所以,我們判斷采用第三種策略應該是理性的選擇,這也是符合(1+32)平臺建設的初步構想。
然而,充當大豬的單位如果一味處于被動選擇收益與付出不相等的地位,將不利于平臺的長期發(fā)展,因此,基于公平和效率的經(jīng)濟哲學,我們提出智豬博弈的模型改進:
1.外部改進:激勵“踩”者
“智豬博弈”中大豬與小豬在重復博弈中的結(jié)果必然導致雙方利益都受到損害,因此對“踩”者進行激勵是一種可行的方法。
(1)假定對踩者激勵3份食物,則盈利矩陣變化如下(如表7)。
表7. 交通行業(yè)人才開發(fā)主體博弈的盈利模型
此種條件下,顯然大豬具有嚴優(yōu)策略——踩杠桿,小豬還會繼續(xù)不踩杠桿的策略,此時有效的Nash均衡解為(大豬踩,小豬不踩)。雖然在這個有效解里小豬獲利還是比大豬多,但是大豬是在自覺的選擇嚴優(yōu)策略,而不是被動的接受一種無奈的理性。
(2)假定加大對“踩”者的激勵程度——對踩者激勵5份食物(實際上只要獎勵多于3.5份食物,結(jié)果就基本相同),博弈矩陣變化為(如表8)。
表8.交通行業(yè)人才開發(fā)主體博弈的激勵效應模型
此種條件下,顯然兩頭豬的嚴優(yōu)策略均為“踩杠桿”,有效策略組合為(大豬踩,小豬踩),即隨著激勵的增加,大豬和小豬都會趨向于踩杠桿,而所獲收益大小取決于兩頭豬的進食速度(相對而言,對大豬的激勵有加強的趨勢),但我們注意到,由于兩頭豬都去踩,能量發(fā)生了多余損耗,降低了效率,而此時外部的獎勵成本則大大提高,甚至可能出現(xiàn)劣于“分槽吃食”的結(jié)局。
具體而言,能否出現(xiàn)大豬比小豬獲利大的結(jié)局,很大程度上取決于兩頭豬的進食速度,但至少可以得出這樣一個結(jié)論:通過外部設置一些激勵,可以使大豬更為主動地選擇“踩”的行動。
2.內(nèi)部改進:訂立契約
假設兩頭豬都具有一定的體能儲備(假定大豬為5單位,小豬2單位),同時假定“踩杠桿”的困難度增加(需要消耗的能量為兩單位,如表9),此種情況下顯然小豬更加不會去踩杠桿(因為可能承受負的收益)。
表9. 交通行業(yè)人才開發(fā)主體博弈的消耗效應模型
但隨著踩杠桿的難度增加,我們注意到,雖然小豬不會去踩杠桿,但它會越來越意識到必須依靠大豬去踩(依賴度增加),此時如果它謀求達成一份契約,減少進食量,以此來激勵大豬(否則大豬極可能出現(xiàn)反理性行為),或許能增進大家共同的收益。這份契約最初可能被認為是不可信的承諾,但只要大豬采用相應的懲罰措施,在重復博弈中一定可以實現(xiàn)。那么極有可能實現(xiàn)由模型四向模型五的轉(zhuǎn)變:小豬將所得5單位中4單位送于大豬(如表10)。
表10.交通行業(yè)人才開發(fā)主體博弈的懲罰效應模型
通過以上分析,我們可以得到一些啟示以指導平臺建設與管理。同在一個屋檐下的大小兩頭智豬,既存在利益的沖突(每次流出的食物有限,你吃多了,我就得少吃),又存在合作的必要性(總得有人去踩踩鈕,否則,誰都沒得吃)。在博弈雙方力量懸殊的情況下,力量強的一方的正確策略是主動出擊,力量弱的一方的正確策略是等待,搭強者的便車。交通行業(yè)人才開發(fā)平臺中大單位與小單位之間的這種關系也是一種競合關系。首先,平臺中的單位必須認識到合作的必要性。合作是平臺存在的基礎和目標,只有合作才能充分發(fā)揮平臺的整體優(yōu)勢和集聚效應。平臺中的大單位應該認識到自己是平臺的核心和骨架,居于支配地位,起主導作用,具有信息和資金優(yōu)勢,而且風險承受能力強,能夠獲得技術創(chuàng)新帶來的超額利潤。因此,應承擔起開發(fā)新技術、投入多數(shù)資源的重任,進行重大項目的投資和風險投資。其次,要充分利用大單位的規(guī)模經(jīng)濟優(yōu)勢,增強大單位的輻射功能,從資金、技術、人才等方面對平臺進行資源投入,對中小單位進行扶持、改造,使之成為自己的協(xié)作單位,并且通過充分發(fā)揮大單位的集聚經(jīng)濟效應和乘數(shù)擴張效應,以帶動整個區(qū)域的發(fā)展。再次,小單位則因勢單力薄不宜于進行大規(guī)模的項目投資和風險投資,也不適宜進行風險很大的新技術研發(fā),而應該和大單位進行合作,圍繞優(yōu)勢大單位,主動調(diào)整發(fā)展方向,充分利用集聚優(yōu)勢和大單位的優(yōu)勢,通過深層次的專業(yè)化分工協(xié)作,以其小而專、小而精的優(yōu)勢為大單位提供配套服務。最后,要通過增強地方小單位對中央單位先進技術和資源的吸納能力,促使信息、資源等要素在它們之間的相互傳遞與流動,使大單位的發(fā)展得到強有力的支持,從而最終達成一種和平共處、相互促進、共生共榮的生存模式——共同生存。中小單位雖然最優(yōu)選擇策略是“搭便車”,等待大單位的資源投入,但是,一味地等待、模仿與執(zhí)行并不是長期發(fā)展目標,中小單位要在分享大單位資源優(yōu)勢的同時,努力發(fā)掘自身的創(chuàng)新機會和優(yōu)勢,當遇到可行的項目方案與創(chuàng)新機會時,利用平臺共享資源,發(fā)展核心競爭力,并推動平臺的良性發(fā)展。
四、交通行業(yè)人才開發(fā)主體的團隊協(xié)作
1.團隊以及項目的特點
(1)團隊的特點。團隊是一組成員,他們獨立地選擇努力水平,但創(chuàng)造一個共同的產(chǎn)出,每個成員對產(chǎn)出的邊際貢獻依賴于其他成員的努力,不可獨立觀測。從以上團隊定義可以看出,團隊具有兩個顯著的特征:①團隊生產(chǎn)的外部性。在團隊中,一個人付出的努力越多,則該團隊的其他成員生產(chǎn)效率越高,存在著專業(yè)化分工的優(yōu)勢。每個成員的邊際生產(chǎn)力依賴于團隊其他成員的努力。團隊成員的共同努力能夠產(chǎn)生積極的協(xié)同作用,使團隊的績效水平遠大于個體成員績效的總和,即能產(chǎn)生“1+1>2”的效應。②團隊成員的報酬基于團隊總體績效。團隊產(chǎn)出是團隊成員共同努力的結(jié)果,所以單個代理人的績效常常無法被精確的度量,難以實施準確的個人績效考核,在實踐中往往采用團隊激勵方案,使個人報酬與團隊總體績效掛鉤。
(2)項目的特點。①項目實質(zhì)上是一系列的工作,盡管項目是有組織地進行的,但它并不是組織本身;盡管項目的結(jié)果可能是一系列的產(chǎn)品,但項目也不是產(chǎn)品本身。②項目是必須完成的。臨時性的,一次性的,有限的任務,這是項目任務區(qū)別于其他常規(guī)的活動活、任務的基本標志,也是識別項目的主要的依據(jù)。③項目都有一個特定的目標,或稱獨特的產(chǎn)品或服務。④項目具有時間、資金、資源等許多的約束條件,只能在一定的約束條件下進行。
2.研究假定及均衡分析
(1)研究假定。依據(jù)以上的分析本文提出了以下的研究假定:
假定一:參與整個項目的人具有兩種類型,一種是合作型,它的人數(shù)為m(以下簡稱合作者);另一種是不合作型,它的人數(shù)為n(以下簡稱不合作者)。
假定二:參與者是完全理性的,并且在整個博弈的過程中,信息是完全的,每個參與者都知道自己的類型,知道其他的參與者的類型,也知道其他參與者知道自己的類型。
假定三:完成一個項目的總收益是一定的,為s;總成本也是一定的,為c。并且項目具有一次性和不可重復性。
假定四:整個項目過程中不存在剩余索取者。
(2)均衡分析
整個博弈的支付矩陣(如表11)。
表11. 交通行業(yè)人才開發(fā)主體博弈的支付模型
這是一個完全信息的靜態(tài)博弈,整個博弈的均衡解取決于s/(m+n)-c/m以及s/(m+n)-c/n的大小與0的比較。我們將s/(m+n)-c/m>0進行一下轉(zhuǎn)化,得到以下結(jié)果m/(m+n)>c/s,也即合作者的人數(shù)比例大于整個項目的成本收益率;同樣將s/(m+n)-c/n>0進行一下轉(zhuǎn)化,得到結(jié)果n/(m+n)>c/s,也即不合作者的人數(shù)比例大于整個項目的成本收益率。
上面支付矩陣的均衡可以理解為:
①對于不合作者而言,當不合作者知道合作者采取的是合作行為m/(m+n)>c/s,即合作者的人數(shù)比例大于整個項目的成本收益率時,不合作者將選擇不合作行為。當不合作者知道合作者采取的是不合作行為m/(m+n)
②對于合作者而言,當合作者知道不合作者采取的是合作行為n/(m+n)>c/s,即不合作者的人數(shù)比例大于整個項目的成本收益率時,合作者將選擇不合作行為。當合作者知道不合作者采取的是不合作行為m/(m+n)
③當m/(m+n) 這一分析結(jié)果驗證了在一個項目團隊中,都不合作并不一定是每個人的最優(yōu)選擇。這樣的一種博弈類似于智豬博弈,但是與智豬博弈又有不同之處。當一個項目有兩種不同類型的多個參與者來完成的時候,數(shù)量上處于絕對優(yōu)勢的參與者類型更傾向與合作,而數(shù)量上處于絕對劣勢的參與者則更傾向于不合作。這與現(xiàn)實中項目管理實施過程中我們所觀察到的現(xiàn)象是一致的,當一個項目的參與者中大多數(shù)人是合作的而有少數(shù)人在偷懶,整個項目仍然會進行下去,而不會出現(xiàn)所有的人都罷工的情形;當一個項目的參與者中只有很少的人是合作的而大多數(shù)人都想偷懶,那么合作的人也將不會合作,偷懶的人觀察到合作的人也偷懶,大家都不合作的時候,整個項目就要進行不下去了,那么偷懶的人也會起來把項目完成下去。 因此,一個項目團隊中的參與者的選擇同時取決于兩個因素:一個是不同類型的參與者在項目團隊中所占的比例,另一個就是整個項目的成本收益率。 3.重復博弈分析 在重復博弈的情況下,可能有以下的準則的存在: (1)每一個項目完成以后團隊會自動解散,在有新的項目的時候再重新組合團隊。 (2)每一個成員可以自由地決定自己是否要加入或退出一個團隊。 那么,當團隊中合作的成員發(fā)現(xiàn)團隊中存在不合作的團隊成員的時候,他就會選擇不加入或退出團隊來懲罰不合作者,那么在重復博弈中,如果第一次合作中不合作者采取偷懶行為,那么,以后就沒有人與其合作,他以后各期的收益都將是0。假設折現(xiàn)率為α,博弈的次數(shù)為t,那么當(s-c)/(m+n) (1+α)^(-t)>s/(m+n)+0時,即本期偷懶所得到的支付小于各期均合作的支付的折現(xiàn)的時候,對不合作者而言,合作會是他們的最優(yōu)選擇。因此,只要博弈的次數(shù)足夠多,合作解有可能會出現(xiàn)。 在重復博弈的條件下,偷懶問題有可能得到解決。只要博弈重復的次數(shù)足夠多,并對違約行為的懲罰足夠嚴厲,且懲罰是置信威脅,那么團隊成員從自身的長遠利益出發(fā)會形成互惠得愿,如果能互相預期到這種互惠意愿,則相互合作的結(jié)果能為納什均衡出現(xiàn)。但此時的合作不是占優(yōu)戰(zhàn)略,這種合作是基于互惠的共同知識,即如果有人在本期背叛,每個人可以(通過未來的不合作)來懲罰他。在這種情況下更容易實現(xiàn)合作,減少偷懶。 因此,要提高平臺運行后人才開發(fā)主體的工作效率,對合作理念的培養(yǎng)很重要。通過塑造合作的文化氛圍,同時用項目的遠景、目標激勵成員,用團隊的價值理念引導成員,用考核獎懲規(guī)范成員,用教育培訓提升成員,用溝通、參與鼓勵成員,這樣,在健康向上的文化中創(chuàng)造出一種奮發(fā)、進取、和諧、平等的協(xié)作氛圍和精神,促使各人才開發(fā)主體自發(fā)選擇合作行為,將大大提高交通行業(yè)人才開發(fā)主體的整體效益,達到平臺資源整合的效果。 [參考文獻] [1]趙光輝.交通人才開發(fā)研究[M].武漢:湖北人民出版社,2008:45. [2]趙光輝.交通行業(yè)人才開發(fā)的主體、結(jié)構與協(xié)調(diào)[J].人才資源開發(fā),2007,(11):9. [3]趙光輝,丘建華,趙 艷.交通運輸產(chǎn)業(yè)結(jié)構調(diào)整與人才需求及供給選擇[J].中國科技論壇,2008,(9):42. The Game Study of the Main Talent Development of Transportation Industry Zhao Guanghui1,2 (1.School of Economics and Management of Wuhan University, ,postdoctoral center ,Wuhan 430070, China;2. Transport Management Institute Ministry of Transport of the People's Republic of China, Beijing101601, China) Abstract:The game between the main talent development of transportation industry , directly determines the operation efficiency and management model of the talent development platform for transportation industry . In this paper, it analyzes the interrelationship between the main talent development with the game theory, the mechanism of the main talent development, and gives some corresponding management ideas. Key words: game theory, talent development of transportation industry, the main talent development, talent development platform (責任編輯:張改蘭)