張成科,植璟涵,朱懷念
(廣東工業(yè)大學1.經(jīng)濟與貿(mào)易學院;2.管理學院,廣東廣州,510520)
2012年10月15日瑞典皇家科學院宣布,將2012年諾貝爾經(jīng)濟學獎授予美國哈佛大學哈佛商學院教授阿爾文·羅思(Alvin E.Roth)與美國加利福尼亞大學洛杉磯分校教授羅伊德·沙普利(Lloyd S.Shapley),以此嘉獎兩位教授在合作博弈理論、穩(wěn)定匹配理論與市場設計實踐上的成就。
合作博弈理論主要研究個人集合團體(“聯(lián)盟”)如何通過合作擴大自己的利益,因此,合作分析的出發(fā)點是對每個聯(lián)盟所能達成的結(jié)果進行分析。對合作博弈理論的發(fā)展做出主要貢獻的是羅伊德·沙普利。
2012年獲得諾貝爾經(jīng)濟學獎的成就主要還包括一個用于分析資源配置的理論框架,以及對現(xiàn)實世界中的體系(如勞動力市場交流中心和學校招生程序)進行的實證研究和真實再設計。經(jīng)濟學家在研究社會資源如何分配的問題時發(fā)現(xiàn),一些分配問題可以在價格體系中獲得解決,例如,某一職位用高工資吸引勞動者,高能源價格引導消費者去節(jié)約能源。但在許多情況下,使用價格體系會遭致法律和道德上的異議,如人體器官在需要移植的病人中的分配。并且,許多市場中雖然存在價格體系運作,但傳統(tǒng)上假設的完全競爭仍未接近于實現(xiàn)。尤其是許多商品是由不同的商品組成且是不可分割的,而每一分類商品的市場十分稀薄。這些稀薄的市場如何配置資源取決于管理這些交易的體系。解決這一問題的理論框架的基礎是1962年戴維·蓋爾(David Gale)和羅伊德·沙普利建立的對特定一類分配問題進行的數(shù)學探討。自1984年始,羅思和他的同事利用這個理論框架,結(jié)合實證研究、對照實驗室實驗和計算機模擬,對其他市場的運作進行了研究。這些研究以及實證分析已經(jīng)促使一門被稱作“市場設計”的新興經(jīng)濟學分支的出現(xiàn)。那么它對于中國經(jīng)濟問題的研究以及對解決中國現(xiàn)今發(fā)展中出現(xiàn)的問題將有哪些啟示和借鑒作用呢?
以下,將首先簡要介紹羅伊德·沙普利和阿爾文·羅思這兩位諾獎得主的主要研究貢獻。隨后對這兩位經(jīng)濟學家的主要理論——合作博弈理論、穩(wěn)定匹配理論與市場設計實踐成果的學術(shù)價值和實踐意義進行簡單回顧和梳理。在此基礎上討論這些理論的政策啟示。
羅伊德·沙普利,1923年6月2日生于美國,1953年在普林斯頓大學獲得博士學位,目前仍是加州大學洛杉磯分校數(shù)學及經(jīng)濟學名譽退休教師。他對數(shù)理經(jīng)濟學,特別是合作博弈理論做出過杰出貢獻,被很多專家認為是合作博弈論的化身。
1.合作博弈的基石——沙普利(Shapley)值
與非合作博弈著重個人理性不同,合作博弈強調(diào)的是集體主義、團體理性,故而合作博弈也稱為聯(lián)盟博弈。理性主體往往為了利益與其他理性主體訂立協(xié)議,形成聯(lián)盟。這個聯(lián)盟形成后,能夠使博弈雙方的利益都有所增加,或者至少是一方的利益增加,而另一方的利益不受損害,因而整個社會的利益有所增加,所以這是一種正和博弈。若不帶來更大的利益,聯(lián)盟是不可能形成的。但聯(lián)盟形成后如何分配獲得的收益呢?這是合作博弈所關(guān)心的核心問題。
收益分配,取決于博弈各方的力量對比和技巧運用。因此,妥協(xié)必須經(jīng)過博弈各方的討價還價,達成共識,進行合作。在這里,合作剩余的分配既是妥協(xié)的結(jié)果,又是達成妥協(xié)的條件。長期以來,經(jīng)濟學家對求解這種多重理性手足無措,只能避而遠之。合作博弈在理論上的重要突破及其以后的發(fā)展在很大程度上起源于沙普利的研究及其公理化刻畫。
沙普利將“核(core)”發(fā)展為合作博弈的一般利益分配集合,即它是一種所有成員均無法提升自身效用的穩(wěn)定聯(lián)盟狀態(tài)。由于“核”這個概念不能給出聯(lián)盟內(nèi)成員效用分配的唯一預測,沙普利進一步在合作博弈框架中加入了一些著眼于“公平”分配合作利益的公理。沙普利首先對“公平”、“合理”等概念給予了嚴格的公理化描述,然后尋求是否有滿足人們想要的那些公理的解。當然,如果對一個解的性質(zhì)或公理要求太多,則這樣的解可能不存在;另一方面,如果這些性質(zhì)或公理要求得少,則又可能有許多解,即解存在但不唯一。
沙普利證明,在這些公理的約束下,存在唯一的效用分配方案,這就是沙普利值。沙普利值是根據(jù)各人給聯(lián)盟帶來的增值來分配,在直觀上是所有邊際貢獻的平均值。沙普利值計算方法簡單,而且能得到合作博弈的唯一解,使用較為廣泛。到目前為止,這個解仍然是合作博弈領域內(nèi)最重要的結(jié)果之一。不僅如此,沙普利的工作具有方法論上的重要意義,他的公理化方法使我們可以研究討論合作博弈中其他各種各樣的解。[1,2,3]
2.穩(wěn)定匹配理論——蓋爾和沙普利的雙邊匹配算法
在許多市場中,商品是私人的,但是由不同的商品組成且是不可分割的,傳統(tǒng)上假設的完全競爭是無法維持的。在這樣的市場中,參與者必須適當匹配才能相互交易。例如,考慮到一個市場有兩個不相交的對象集(如買家和賣家,勞動者和公司,學生和學校)必須互相匹配以進行交易。蓋爾和沙普利研究的就是這種雙邊匹配市場。
(1)穩(wěn)定匹配(stable matchings)
為了說明何謂穩(wěn)定匹配,本文先介紹“改進”這個概念。若某個聯(lián)盟的成員可以利用自己的資源讓自身的境況更好,那么就可以說這個聯(lián)盟能夠“改進”支付向量。一般來說,一個匹配如果不能被任何聯(lián)盟“改進”,那么它就是穩(wěn)定的匹配。事實上,沒有聯(lián)盟能夠通過利用自己的資源,帶來令所有成員更青睞的結(jié)果,就是所謂的穩(wěn)定匹配。具體而言,假設市場的一方為醫(yī)學院學生,另一方為醫(yī)療機構(gòu),每個機構(gòu)需要一名實習生,每個醫(yī)學院學生都想獲得一個實習職位。很自然,學生和醫(yī)療機構(gòu)對對方都有偏好的選擇(為了方便起見,我們假設偏好是嚴格的)。對于雙方的任何一個對象來說,如果匹配之后不如未匹配之前,那么這個匹配就是“不可接受的”。如此穩(wěn)定的匹配必須滿足以下兩個條件:一是沒有一個對象認為匹配不可接受;二是沒有任何一對機構(gòu)和學生希望是他們之間匹配,而不是各自目前的匹配。條件1即“個體理性”(individual rationality),條件2則是“成對穩(wěn)定性”(pairwise stability)。兩個條件意味著沒有一個聯(lián)盟、沒有一對機構(gòu)和學生能對目前的配對進行改進。
(2)蓋爾-沙普利算法(the Gale-Shapley algorithm)
蓋爾和沙普利為了尋找一個穩(wěn)定匹配,設計出了“延遲接受算法”(deferred-acceptance algorithm)。市場一方中的對象(醫(yī)療機構(gòu))向另一方中的對象(醫(yī)學院學生)提出要約,每個學生會對自己接到的要約進行考慮,然后抓住自己青睞的(認為它是可接受的),拒絕其他的。該算法的一個關(guān)鍵之處在于,合意的要約不會立即被接受,而只是被“抓住”(hold on to),也就是“延遲接受”。要約被拒絕后,醫(yī)療機構(gòu)才可以向另一名學生發(fā)出新的要約。整個程序一直持續(xù)到?jīng)]有機構(gòu)再希望發(fā)出新的要約為止,到那個時候,學生們才最終接受各自“抓住”的要約。在這個過程中,每個醫(yī)療機構(gòu)首先向被自己列為第一位的求職者發(fā)出要約,也就是最想接收為實習生的那個醫(yī)學院學生。如果這個要約被拒絕,這家機構(gòu)才能向被自己列為第二位的學生發(fā)出要約,依次類推。因此,在該算法的操作中,醫(yī)療機構(gòu)的預期隨著要約對象所處偏好排序降低而下調(diào)(當然,醫(yī)療機構(gòu)不會對不可接受的求職者發(fā)出要約)。反過來說,由于學生總是抓著所接收要約中最合意的那個,且要約不能被撤回,因此,每個學生的滿意度在該算法的操作中是單調(diào)遞增的。當醫(yī)療機構(gòu)下降的預期與學生提高的志向變得相一致時,該算法停止。
蓋爾和沙普利證明,延遲接受算法是穩(wěn)定的,也就是說,它總能產(chǎn)生一個穩(wěn)定的匹配。該算法為這種類型的雙邊匹配問題提供了一個存在性證明:既然它總會終止于一個穩(wěn)定匹配,那么穩(wěn)定匹配是存在的。這些方法同時也限制了市場主體操縱匹配過程的動機。[4]
沙普利的其他重要貢獻還包括沙普利-舒貝克(the Shapley-Shubik)權(quán)利指數(shù)、奧曼-沙普利定價(Aumann-Shapley pricing)、海薩尼-沙普利解(the Harsanyi-Shapley solution)、沙普利-??寺ɡ?the Shapley-theorem)以及對隨機博弈理論的研究成果,等等。
阿爾文·羅思1951年12月19日出生于美國,1971年本科畢業(yè)于哥倫比亞大學,獲得運籌學學士學位,1973年獲斯坦福大學運籌學碩士學位,1974年獲斯坦福大學運籌學博士學位,目前在哈佛商學院擔任經(jīng)濟及工商管理教授。羅斯主要在博弈論、市場設計和實驗經(jīng)濟學等領域進行研究,并做出顯著貢獻。從1995年應用理論改革美國醫(yī)學院畢業(yè)生分配體系開始,他一直著手于解決現(xiàn)實問題,是少見的既有精深理論貢獻,又非“紙上談兵”的經(jīng)濟學家。
1.市場設計理論與微觀經(jīng)濟工程學
“市場設計理論”最早由美國經(jīng)濟學家赫維奇提出,馬斯金和邁爾森則進一步發(fā)展了這一理論,他們因此共同摘得了2007年諾貝爾經(jīng)濟學獎。該理論研究的核心問題是,在信息不完全、決策分散化、自愿選擇和交換的條件下,如何設計出一套經(jīng)濟機制,以實現(xiàn)資源的最優(yōu)化利用。
羅斯2002年發(fā)表的一篇題為“經(jīng)濟學家作為工程師:博弈論、實驗法、計算作為設計經(jīng)濟學的工具”的文章中提出,經(jīng)濟環(huán)境不僅是“演化”出來的,一定程度上也是“設計”出來的,一門新學科——設計經(jīng)濟學正在誕生。而市場的設計,僅靠高度簡化的理論模型是不夠的,須考慮到現(xiàn)實生活中種種細節(jié)的復雜。為此,羅斯認為,有必要使用實驗經(jīng)濟學和計算經(jīng)濟學作為博弈論的補充,因此,該新興學科也被一些學者稱為微觀經(jīng)濟工程學。[5]
2.匹配和市場設計的應用
雖然匹配理論的研究在20世紀60、70代就得到了學界的重視,但是它的實際應用卻一直到80年代才逐漸為人們所重視。匹配和市場設計的應用主要歸功于羅思,他在1984年的研究中清楚地表明類似于GS的算法是美國住院醫(yī)生制度得到改善的根本原因。[6]
在1940年代,美國的住院醫(yī)生制度是非常糟糕的。醫(yī)院為了競爭優(yōu)秀的醫(yī)學院學生,不斷將給學生提供崗位的日期提前,甚至提前到學生畢業(yè)前幾年,而且為了讓自己心儀的學生和醫(yī)院簽約,醫(yī)院給學生考慮的時間日漸縮短,這樣做的惡果很多:一是這個匹配結(jié)果本身未必是有效的;二是學生在壓力下的簽約通常會導致后悔;三是醫(yī)院在被學生拒絕的情況下,不能給其他合適的學生提供更多的機會。
羅思在1984年發(fā)表的研究文章中發(fā)現(xiàn),美國的新醫(yī)生市場長久以來受到一系列市場失靈因素的影響,但一家集中的交流中心由于采用了本質(zhì)上相當于蓋爾和沙普利的延遲接受的程序而大大改善了當時的情況。羅思的這篇文章闡明了市場所執(zhí)行的任務,并說明這個穩(wěn)定概念如何提供了一個組織原則,幫助我們理解為何市場有時運轉(zhuǎn)正常,有時不正常。[7]
羅思關(guān)于匹配和市場設計實踐的第二個著名例子是美國的腎臟交換項目。每年等待腎臟捐贈的患者名單上有8.5萬人,而每年有約4 000名患者因器官短缺而死亡,一個重要原因是捐贈匹配系統(tǒng)的效率太低。2003年,羅思開始負責設計新系統(tǒng)。對于想捐腎給親人,但由于血型不匹配無法實現(xiàn)的案例,該系統(tǒng)可以幫助他們與其他不匹配的捐贈組交換器官。目前,雖然利用這一系統(tǒng)進行腎臟移植的患者還不多,2009年只有不到1 000例,但是它的前景仍為許多人看好。而這個成功在很大程度上要歸功于研究匹配和市場設計的學者們,特別是羅斯教授這樣的人。[8]
諾貝爾經(jīng)濟學獎不僅可以為我們解決現(xiàn)實經(jīng)濟問題提供思路和方法,而且能夠為經(jīng)濟學研究在方法、手段、分析工具等方面提供最有價值的理論模型,同時還能激勵人們不斷創(chuàng)新,加深人們對經(jīng)濟學理論和經(jīng)濟系統(tǒng)本身的認識與理解。
1.沙普利值的理論價值和實踐意義
“沙普利值”提出了一個好的方法和機制,可以幫助企業(yè)根據(jù)邊際貢獻進行分配。由于“沙普利值”強烈的直觀吸引力及數(shù)學上的易處理,它已成為很多研究的應用焦點,尤其是在大型經(jīng)濟模型中?!吧称绽怠痹诮?jīng)濟理論上的其他應用包括稅收模型,其中,政治權(quán)力結(jié)構(gòu)建立在交換經(jīng)濟或生產(chǎn)經(jīng)濟的基礎之上。此外,確定“沙普利值”的那些公理可以方便地轉(zhuǎn)換為適合于解決諸如以一種“公平”的方式考察配置聯(lián)合成本的問題。[9]
2.羅斯的市場設計理論與實踐開創(chuàng)經(jīng)濟研究新領域——經(jīng)濟工程學
市場設計的核心問題是市場如何運作。對于競爭的商品市場,經(jīng)濟學家已經(jīng)掌握了其中的一些基本要素。當價格發(fā)現(xiàn)和價格調(diào)整順利進行時,經(jīng)濟主體根據(jù)他們看到的價格來選擇自己想要的東西。但是許多市場要復雜得多,價格所起的作用似乎和商品市場有所不同。另外一些市場之所以未能獲得有效的結(jié)果,是因為市場參與者不能安全地透露必要的私人信息。羅斯的系列市場設計理論與實踐已經(jīng)逐漸了解了市場為何失靈以及如何對其進行修復。沙普利的基本理論與羅斯的實證實驗相互結(jié)合,各類實驗和實際設計產(chǎn)生了一個研究和改善眾多市場性能的研究領域。對于經(jīng)濟學學科而言,市場設計對最基礎的經(jīng)濟學問題,包括市場如何運作以及當市場失靈時如何修復,提出了新的理論問題,提供了新的經(jīng)驗數(shù)據(jù)。隨著市場設計的不斷發(fā)展,它將越來越像一門工程學科,既需要設計知識,也需要在特定領域應用的知識。[5,10]
隨著2012年11月黨的十八大順利召開,我國將進一步推進社會主義市場經(jīng)濟體制改革,在許多體制和制度方面將發(fā)生重大變革。要解決改革中出現(xiàn)的問題,成功實現(xiàn)制度轉(zhuǎn)型和資源有效配置,今年的諾獎理論無疑具有重要的借鑒和指導意義。因為獲獎者觀察問題的方式、思考問題的角度以及解決問題的建議可以給我們一些借鑒和啟示。
1.合作博弈和穩(wěn)定匹配理論引導公平合理分配機制設計
分配是任何時代、任何社會的重要問題。當前中國正向和諧社會邁進。一個和諧社會不僅要具有建立在完善法制基礎上的公平競爭機制,同時也要建立各種各樣的公平合理的分配機制。沙普利的公理化方法提供了討論“公平”或“合理”的分配機制的一個理論框架。公平的并不是平均的,盡管有時是平均的。一個公平的分配遵循的原則是:所得與自己的貢獻相等。合作博弈最大的價值在于其作為一個研究公平或合理分配機制的有效理論工具。匹配理論的一項重要功能,即把市場一方的代理人與另一方的代理人匹配起來。在經(jīng)濟體系中,代理人之間通常形成“對”或“集團”:工人和企業(yè)、醫(yī)生和醫(yī)院、學校和學生。這種劃分本身就蘊涵合作。[11]
從經(jīng)濟學的角度看,當下全球的經(jīng)濟環(huán)境仍然十分復雜、變幻莫測,金融危機的影響尚未完全消除,世界經(jīng)濟走向如何?人們期待著能夠?qū)崿F(xiàn)經(jīng)濟穩(wěn)定均衡發(fā)展。穩(wěn)定配置是經(jīng)濟社會發(fā)展的一種最佳狀態(tài),也是人們所期待的一個目標。而通過市場設計是實現(xiàn)這種狀態(tài)的一種手段或者方法,它是人們對經(jīng)濟均衡的一種構(gòu)想。目前,中國尚且缺乏這種市場設計機制,因此,在一些關(guān)鍵市場建設中不妨借鑒該思路。如目前反復探討的實體經(jīng)濟與金融業(yè)的匹配關(guān)系。中國已經(jīng)步入自主性經(jīng)濟周期階段。中國實體經(jīng)濟的要務已從“輸血”轉(zhuǎn)向“造血”。中國金融業(yè)一樣處于增長的十字路口,要從助力實體經(jīng)濟中重新獲取動能。只有為實體經(jīng)濟的長期均衡增長奠定堅實的基礎,才能更大程度地保證金融資源的安全和收益。具體到銀行信貸市場,匹配理論也大有用場。信貸市場的功能是把作為信貸需要方的企業(yè)和作為信貸供給方的商業(yè)銀行匹配起來。[12]當前,我國銀行信貸市場出現(xiàn)了二元結(jié)構(gòu)——大企業(yè)客戶信貸市場和中小企業(yè)客戶信貸市場。這兩個市場有著不同的運行機制。大企業(yè)客戶信貸市場的分散化議價過程存在一個企業(yè)“求婚”的遞延接受程序,市場的匹配結(jié)果穩(wěn)定。中小企業(yè)客戶信貸市場的分散化議價過程不存在導致穩(wěn)定結(jié)果的匹配程序,市場效率低下,并且存在大量的策略行為。這種二元性導致信貸資金從中小企業(yè)客戶信貸市場不斷流向大企業(yè)客戶信貸市場。根據(jù)GS算法,把中小企業(yè)客戶信貸市場中的分散化議價過程變成中央化的匹配過程,有助于提高中小企業(yè)客戶信貸市場的穩(wěn)定性和運行效率。這需要政府管理層供給更多的機制建設。[13]
2.要重視通過市場機制設計來提高特定市場的效率
2012年諾獎得主的研究表明:很多市場失靈的問題,不能簡單都歸納為“價格破壞”帶來的后果,相反,卻是因為市場存在“不匹配”的摩擦所致。羅斯通過一系列實驗,發(fā)現(xiàn)“穩(wěn)定”是了解特定市場機制成功的關(guān)鍵因素。因此,為修復資產(chǎn)價格、創(chuàng)造就業(yè)空間而采取的量化寬松的貨幣政策,不僅沒有效果,反而會產(chǎn)生更大的未來通脹和資產(chǎn)泡沫的后遺癥。不如采取針對性的“機制設計”,比如,引導“合作博弈”的模式,緩解至為關(guān)鍵的“供求不一致”的矛盾,效果可能會更好。具體到中國的房地產(chǎn)市場而言,房價一路飆升,引發(fā)了政府對房地產(chǎn)市場的多次宏觀調(diào)控。其實,房價不單是一個價格問題,而是經(jīng)濟增長方式和收入分配方式等體制性障礙在房地產(chǎn)市場的集中體現(xiàn)。在住房已成為居民財產(chǎn)結(jié)構(gòu)中最重要資產(chǎn)的背景下,調(diào)控房價不是遏制房地產(chǎn)業(yè)的發(fā)展,而是要通過適當?shù)摹皺C制設計”引導社會財富分配,縮小收入分配差距。[10,14]
當然,基于西方價值體系的合作博弈、匹配理論與市場設計實踐要在中國得到有效應用,尚需對中國社會的一些典型因素進行分析。理論不必然成為解決問題的靈丹妙藥,但它畢竟為中國的經(jīng)濟改革與實踐推開了另一扇門。[9,15]
[1]LLOYD S SHAPLEY.“A Value for n-Person Games,”in Contributions to the Theory of Games:Vol.Ⅱ[M]//H W KUHN,A W TUCKER.Ann.Math.Studies 28.New Jersey:Princeton U-niversity Press,1953:307—317.
[2]LLOYD S SHAPLEY.Additive and Non-Additive Set Functions[D].Princeton:Department of Mathematics,Princeton University,1953:12—59.
[3]史晨昱.用合作博弈理論設計有效匹配方案——2012年諾貝爾經(jīng)濟學獎思想評述[EB/OL].(2012-10-17).http://www.chinavalue.net/.2012
[4]D GALE,SHAPLEY L.College admissions and the stability of marriage[J].Am.Math.Mon,1962,69:9—15.
[5]ALVIN E ROTH.The Economist as Engineer:Game Theory,Exerimentation,and Computation as Tools for Design Economics[J].Econometrica,1990,58:1475—1480.
[6]ALVIN E ROTH.The evolution of the labor market for medical interns and residents:A case study in game theory[J].J PolitEcon,1984,92:991—1016.
[7]ALVIN E ROTH.Misrepresentation and stability in the marriage problem[J].J Econ Theory,1984,34,383—387
[8]ALVIN E ROTH.Two-Sided Matching:A Study in Game-Theoretic Modeling and Analysis[M].Cambridge:Cambridge University Press,1990:49—121.
[9]杜麗群.穩(wěn)定配置與市場設計實踐理論為什么會獲諾貝爾經(jīng)濟學獎[EB/OL].(2012-10-23).http://www.dfdaily.com/html/8762/2012/10/23/882465.shtml.
[10]張鑫.諾貝爾經(jīng)濟學獎越來越注重實踐意義[EB/OL].(2012 - 10 - 17).http://business.sohu.com/20121017/n355012536.shtml.
[11]蘭曉萌.羅思與沙普利的穩(wěn)定分配理論[EB/OL].(2012-10 - 17).http://finance.sina.com.cn/roll/20121017/224313399251.shtml.
[12]姚樹潔.2012年經(jīng)濟學諾獎關(guān)注資源分配[EB/OL].(2012 - 10 - 16).http://finance.qq.com/a/20121016/001600.htm.
[13]孫立堅.“機制設計”比“修復價格”更重要——看2012年經(jīng)濟學諾獎的政策意義[EB/OL].(2012-10-17).http://district.ce.cn/zg/201210/17/t20121017_23763130.shtml.
[14]鐘鴻鈞.2012諾貝爾經(jīng)濟學獎成果及其現(xiàn)實應用[EB/OL].(2012 -10 -17).http://finance.sina.com.cn/review/jcgc/20121022/101713435627.shtml.
[15]史晨昱.匹配理論引導公平合理分配機制設計[EB/OL].(2012 -10 -17).http://www.21cbh.com/2012/shzjb_1017/489272.html.