王 云
黨的十九大報(bào)告指出,我國(guó)經(jīng)濟(jì)已由高速增長(zhǎng)階段轉(zhuǎn)向高質(zhì)量發(fā)展階段。經(jīng)濟(jì)的高質(zhì)量發(fā)展依托于市場(chǎng)有效運(yùn)行的微觀基礎(chǔ),政策制定者需要深刻理解市場(chǎng)主體的行為、選擇與動(dòng)因,亦需要在實(shí)證證據(jù)的支撐之下進(jìn)行恰當(dāng)?shù)募?lì)機(jī)制設(shè)計(jì)和政策評(píng)估。近五十年來(lái)逐漸成熟和興盛的實(shí)驗(yàn)經(jīng)濟(jì)學(xué)通過(guò)拓展經(jīng)典微觀理論和利用隨機(jī)可控實(shí)驗(yàn)方法,為政策制定者提供了重要的分析工具和決策輔助。隨著數(shù)字經(jīng)濟(jì)的興起與發(fā)展,基于人工智能技術(shù)、互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的經(jīng)濟(jì)活動(dòng)及其所產(chǎn)生的大數(shù)據(jù),為經(jīng)濟(jì)學(xué)各領(lǐng)域的研究都帶來(lái)了新的機(jī)遇與挑戰(zhàn),也為政策制定者和監(jiān)管部門觀測(cè)和分析微觀市場(chǎng)主體的行為提供了更為完善的數(shù)據(jù)支持。在近年的文獻(xiàn)中,大數(shù)據(jù)和機(jī)器學(xué)習(xí)算法對(duì)經(jīng)濟(jì)學(xué)、統(tǒng)計(jì)學(xué)等相關(guān)學(xué)科的影響亦得到了學(xué)者們的關(guān)注,首當(dāng)其沖的是關(guān)注方法上的改進(jìn)與數(shù)據(jù)科學(xué)的變革。aSendhil Mullainathan,Jann Spiess,“Machine Learning:An Applied Econometric Approach”,The Journal of Economic Perspectives,vol.31,no.2,2017,pp.87-106;洪永淼、汪壽陽(yáng):《大數(shù)據(jù)、機(jī)器學(xué)習(xí)與統(tǒng)計(jì)學(xué):挑戰(zhàn)與機(jī)遇》,《計(jì)量經(jīng)濟(jì)學(xué)報(bào)》2021 年第1 期。同時(shí),人工智能技術(shù)的廣泛運(yùn)用也對(duì)金融決策、產(chǎn)業(yè)組織、創(chuàng)新與生產(chǎn)力變革、勞動(dòng)力市場(chǎng)與就業(yè)、收入分配與不平等、經(jīng)濟(jì)增長(zhǎng)等領(lǐng)域的研究產(chǎn)生了深刻的影響。bAjay Agrawal,Joshua S.Gans,Avi Goldfarb,“Artificial Intelligence:The Ambiguous Labor Market Impact of Automating Prediction”,The Journal of Economic Perspectives,vol.33,no.2,2019,pp.31-50;Aaron Chalfin,Oren Danieli,Andrew Hillis,Zubin Jelveh,Michael Luca,Jens Ludwig,Sendhil Mullainathan,“Productivity and Selection of Human Capital with Machine Learning”,The American Economic Review,vol.106,no.5,2016,pp.124-127;Isil Erel,Léa H.Stern,Chenhao Tan,Michael S.Weisbach,“Selecting Directors Using Machine Learning”,The Review of Financial Studies,vol.34,no.7,2021,pp.3226-3264.Camerer(2019)總結(jié)并討論了人工智能對(duì)行為經(jīng)濟(jì)學(xué)研究的影響,aColin F.Camerer,“Artificial Intelligence and Behavioral Economics”,In Avi Goldfarb,Joshua Gans and Ajay Agrawal,The Economics of Artificial Intelligence:An Agenda,University of Chicago Press,2019,pp.587-608.但隨著人工智能技術(shù)更廣泛地被應(yīng)用,相關(guān)的實(shí)驗(yàn)經(jīng)濟(jì)學(xué)研究有了更多進(jìn)展,需要更為系統(tǒng)性的討論。國(guó)內(nèi)文獻(xiàn)對(duì)這一前沿問(wèn)題的討論方興未艾,本文擬立足于實(shí)驗(yàn)經(jīng)濟(jì)學(xué)形成與發(fā)展中的核心要點(diǎn),評(píng)述近年來(lái)運(yùn)用機(jī)器學(xué)習(xí)算法或人工智能技術(shù)的相關(guān)實(shí)驗(yàn)研究。
在20 世紀(jì)70 年代前后,微觀經(jīng)濟(jì)學(xué)研究開(kāi)始系統(tǒng)性地將心理、認(rèn)知、情緒等因素引入決策論的分析框架中,實(shí)驗(yàn)經(jīng)濟(jì)學(xué)則緊隨其后,提供了可控環(huán)境下關(guān)于個(gè)人選擇的大量實(shí)證證據(jù)。在此后幾十年間的發(fā)展過(guò)程中,實(shí)驗(yàn)經(jīng)濟(jì)學(xué)幫助微觀經(jīng)濟(jì)學(xué)者檢驗(yàn)和拓展理論模型,使其能更全面地解釋人們的真實(shí)行為尤其是人在經(jīng)濟(jì)或者其他形式的激勵(lì)之下的選擇模式。它也幫助應(yīng)用經(jīng)濟(jì)學(xué)家和政策制定者觀察人們對(duì)于經(jīng)濟(jì)社會(huì)政策的反應(yīng),促進(jìn)有效的政策評(píng)估、市場(chǎng)設(shè)計(jì)和行為干預(yù)。
實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的核心要點(diǎn)之一,是為經(jīng)濟(jì)理論提供實(shí)證檢驗(yàn)和理論拓展。早期的實(shí)驗(yàn)主要是對(duì)新古典微觀框架無(wú)法解釋的行為偏離進(jìn)行現(xiàn)象性的描述,學(xué)者們稱之為“異象”(anomalies)。b那藝、賀京同:《行為經(jīng)濟(jì)學(xué)的興起及其與新古典經(jīng)濟(jì)學(xué)關(guān)系的演變》,《中國(guó)社會(huì)科學(xué)》2019 年第5 期。而隨著實(shí)驗(yàn)研究范式逐漸成熟,學(xué)者們更側(cè)重從實(shí)驗(yàn)中觀察到的系統(tǒng)性偏離中總結(jié)規(guī)律,并形成新的行為理論基礎(chǔ)。在實(shí)驗(yàn)設(shè)計(jì)中,他們不是簡(jiǎn)單利用經(jīng)典模型,而是根據(jù)所關(guān)注的問(wèn)題來(lái)設(shè)定實(shí)驗(yàn)環(huán)境和激勵(lì)方式,并依具體問(wèn)題來(lái)分析處置效應(yīng)。c包特、王國(guó)成、戴蕓:《面向未來(lái)的實(shí)驗(yàn)經(jīng)濟(jì)學(xué):文獻(xiàn)述評(píng)與前景展望》,《管理世界》2020 年第7 期。比如,Kahneman 和Tversky 的一系列關(guān)于不確定性下個(gè)體選擇與其系統(tǒng)性偏誤的研究,開(kāi)啟了學(xué)界對(duì)于非期望效用函數(shù)(non-expected utility)的討論,啟發(fā)了決策論中包含參照依賴的個(gè)人損失厭惡偏好和以概率加權(quán)函數(shù)來(lái)描述的主觀概率偏誤,并最終成為前景理論的兩個(gè)主要組成部分。dAmos Tversky,Daniel Kahneman,“Judgment under Uncertainty:Heuristics and Biases”,Science,vol.185,no.4157,1974,pp.1124-1131;Amos Tversky,Daniel Kahneman,“Prospect Theory:An Analysis of Decision under Risk”,Econometrica,vol.47,no.2,1979,pp.263-291.又比如,在大量博弈實(shí)驗(yàn)中研究者發(fā)現(xiàn),基于“理性人”假設(shè)的個(gè)人收益最大化框架無(wú)法解釋實(shí)驗(yàn)室數(shù)據(jù)中所觀察到的偏離均衡的選擇,如最后通牒博弈中被試拒絕收益不平等的分配方案、eWerner Güth,Reinhard Tietz,“Ultimatum Bargaining Behavior:A Survey and Comparison of Experimental Results”,Journal of Economic Psychology,vol.11,no.3,1990,pp.417-449.獨(dú)裁者實(shí)驗(yàn)中獨(dú)裁者往往選擇不獨(dú)占全部收益、fRobert Forsythe,Joel L.Horowitz,N.E.Savin,Martin Sefton,“Fairness in Simple Bargaining Experiments”,Games and Economic Behavior,vol.6,no.3,1994,pp.347-369;Elizabeth Hoffman,Kevin McCabe,Keith Shachat,Vernon Smith,“Preferences,Property Rights,and Anonymity in Bargaining Games”,Games and Economic Behavior,vol.7,no.3,1994,pp.346-380.信任博弈中雙方更傾向于促進(jìn)社會(huì)效益且更為公平分配的投資和回報(bào)行為、gJoyce Berg,John Dickhaut,Kevin McCabe,“Trust,Reciprocity,and Social History”,Games and Economic Behavior,vol.10,no.1,1995,pp.122-142;Ben-Ner Avner,Freyr Halldorsson,“Trusting and Trustworthiness:What Are They,How to Measure Them,and What Affects Them”,Journal of Economic Psychology,vol.31,no.1,2010,pp.64-79.線性公共物品博弈中成員的貢獻(xiàn)值普遍性地高于均衡水平等。hMark R.Isaac,James M.Walker,“Group Size Effects in Public Goods Provision:The Voluntary Contributions Mechanism”,The Quarterly Journal of Economics,vol.103,no.1,1988,pp.179-199;James Andreoni,“Why Free Ride?:Strategies and Learning in Public Goods Experiments”,Journal of Public Economics,vol.37,no.3,1988,pp.291-304.這催生了社會(huì)偏好理論(social preferences)。學(xué)者們?cè)趥鹘y(tǒng)微觀理論的效用最大化框架中引入了表示親社會(huì)性偏好的效用形式,涵蓋了公平、友善、互利互損、不平等厭惡偏好、社會(huì)福利偏好等更為廣泛的人們的社會(huì)性動(dòng)機(jī)。i陳葉烽、葉航、汪丁丁:《超越經(jīng)濟(jì)人的社會(huì)偏好理論:一個(gè)基于實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的綜述》,《南開(kāi)經(jīng)濟(jì)研究》2012 年第1 期;David J.Cooper,John H.Kagel,“Other-Regarding Preferences:A Selective Survey of Experimental Results”,In Alvin E.Roth,John H.Kagel,The Handbook of Experimental Economics,Elsevier,2017.這些理論拓展也為應(yīng)用微觀經(jīng)濟(jì)學(xué)的研究者們提供了理解市場(chǎng)主體行為、解釋實(shí)證數(shù)據(jù)的實(shí)用性工具。
實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的第二個(gè)核心要點(diǎn),在于其對(duì)政策評(píng)估、政策設(shè)計(jì)和行為干預(yù)的輔助。這與20 世紀(jì)90年代以來(lái)實(shí)地實(shí)驗(yàn)(field experiment)的興起與廣泛應(yīng)用密不可分,也為發(fā)展經(jīng)濟(jì)學(xué)的政策效果評(píng)估提供了重要的方法論革新。a羅俊、汪丁丁、葉航、陳葉烽:《走向真實(shí)世界的實(shí)驗(yàn)經(jīng)濟(jì)學(xué)——田野實(shí)驗(yàn)研究綜述》,《經(jīng)濟(jì)學(xué)(季刊)》2015年第3 期;陸方文:《隨機(jī)實(shí)地實(shí)驗(yàn):方法、趨勢(shì)和展望》,《經(jīng)濟(jì)評(píng)論》2017 年第4 期;Esther Duflo,Abhijit Banerjee,Handbook of Field Experiments Volume 2,Elsevier,2017。政策評(píng)估困難的一個(gè)原因在于參與者的自我選擇導(dǎo)致的內(nèi)生性。而通過(guò)隨機(jī)控制實(shí)驗(yàn)(randomized controlled trial)得到的數(shù)據(jù)干凈、可控,能夠很好地避免內(nèi)生性問(wèn)題,有助于作出因果關(guān)系的科學(xué)推斷。實(shí)地實(shí)驗(yàn)的范圍和規(guī)模都可控,能夠以較小的社會(huì)成本,與其他經(jīng)濟(jì)學(xué)實(shí)證方法相輔相成,在事前、事中、事后評(píng)估等政策評(píng)估的不同階段有機(jī)結(jié)合并發(fā)揮作用。b洪永淼:《運(yùn)用經(jīng)濟(jì)學(xué)新成果促進(jìn)政策優(yōu)化》,《人民日?qǐng)?bào)》2019 年2 月25 日。除了政策評(píng)估,實(shí)地實(shí)驗(yàn)對(duì)政策設(shè)計(jì)和行為干預(yù)的作用也同等重要?,F(xiàn)實(shí)中人們的決策受到認(rèn)知、情緒、社會(huì)文化等因素影響而偏離“理性”選擇,同時(shí)這些因素復(fù)雜多變,要衡量一項(xiàng)政策干預(yù)能否長(zhǎng)期有效,則需要實(shí)地實(shí)驗(yàn)的幫助來(lái)觀察重復(fù)性、系統(tǒng)性的行為和選擇偏誤,有針對(duì)性地進(jìn)行助推(nudge)。cRichard H.Thaler,Cass R.Sunstein,Nudge:Improving Decisions about Health,Wealth,and Happiness.New Haven,CT:Yale University Press,2004;Michael Kremer,Gautam Rao,Frank Schilbach,“Behavioral Development Economics”,In B.Douglas Bernheim,Stefano DellaVigna,David Laibson (eds.).Handbook of Behavioral Economics:Foundations and Applications 1,vol.2,Amsterdam:Elsevier,2019,pp.345-458.比如,美國(guó)麻省理工學(xué)院的3 位經(jīng)濟(jì)學(xué)教授2003 年創(chuàng)建的貧困行動(dòng)實(shí)驗(yàn)室(Abdul Latif Jameel Poverty Action Lab),是利用實(shí)地實(shí)驗(yàn)方法進(jìn)行政策設(shè)計(jì)的一個(gè)典范。該實(shí)驗(yàn)室與政府機(jī)構(gòu)和非盈利組織合作,圍繞科學(xué)研究、研究成果向政策的轉(zhuǎn)化、教育與培訓(xùn)等,采用隨機(jī)可控實(shí)驗(yàn)的方法尋求不發(fā)達(dá)地區(qū)貧困問(wèn)題的解決方案。再比如,Abhijit Banerjee 等研究者的一系列在發(fā)展中國(guó)家鄉(xiāng)村的實(shí)地實(shí)驗(yàn)就通過(guò)改變物質(zhì)激勵(lì)的形式、大小、補(bǔ)貼模式等,來(lái)鼓勵(lì)疾病防控和免疫性接種,鼓勵(lì)村民通過(guò)小額信貸來(lái)經(jīng)營(yíng)生意。dAbhijit Banerjee,Rukmini Banerji,James Berry,Esther Duflo,Harini Kannan,Shobhini Mukerji,Marc Shotland,Michael Walton,“From Proof of Concept to Scalable Policies:Challenges and Solutions,with an Application”,The Journal of Economic Perspectives,vol.31,no.4,2017,pp.73-102;Abhijit Banerjee,Esther Duflo,Richard Hornbeck,“How Much Do Existing Borrowers Value Microfinance? Evidence from an Experiment on Bundling Microcredit and Insurance”,Economica,vol.85,no.340,2018,pp.671-700.這些實(shí)地實(shí)驗(yàn)為經(jīng)濟(jì)學(xué)家合理干預(yù)微觀個(gè)體行為選擇、改進(jìn)激勵(lì)機(jī)制設(shè)計(jì)提供了可信的實(shí)證數(shù)據(jù),也為政策制定者從教育、健康、小微金融等方面有針對(duì)性地對(duì)特定收入群體進(jìn)行精準(zhǔn)扶貧提供了科學(xué)的方法論支撐。
隨著實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的繁榮,其關(guān)注點(diǎn)從一開(kāi)始側(cè)重理論拓展,發(fā)展到近年來(lái)對(duì)應(yīng)用微觀、發(fā)展經(jīng)濟(jì)學(xué)等領(lǐng)域的廣泛滲透。但Thaler(2016)認(rèn)為,目前的實(shí)驗(yàn)經(jīng)濟(jì)學(xué)仍存在困境,研究者寄希望于只采用一種分析范式,即傳統(tǒng)微觀的“最優(yōu)化分析”框架,去達(dá)到“刻畫人們最優(yōu)的選擇”和“預(yù)測(cè)人們真實(shí)的行為”這兩個(gè)截然不同的目的?!邦A(yù)測(cè)”這一目的本應(yīng)通過(guò)對(duì)實(shí)證研究中觀察到的行為數(shù)據(jù)進(jìn)行統(tǒng)計(jì)學(xué)的假設(shè)檢驗(yàn)而達(dá)到。eRichard H.Thaler,“Behavioral Economics:Past,Present,and Future”,The American Economic Review,vol.106,no.7,2016,pp.1577-1600.因此,如何關(guān)注影響行為的變量、所關(guān)注變量的穩(wěn)定性與其效果的可復(fù)制性、大規(guī)模數(shù)據(jù)的可控性與噪音等問(wèn)題,成為了研究者需要尋求突破的幾個(gè)方面。
第一個(gè)問(wèn)題是實(shí)驗(yàn)經(jīng)濟(jì)學(xué)家應(yīng)如何處理心理、認(rèn)知、情緒等因素并分析其對(duì)行為的影響,而不僅僅是將這些因素雜糅在一起,籠統(tǒng)地將之放入心理學(xué)因素的“黑箱”之中。fMagda Osman,“Behavioral Economics:Where Is It Heading?”Psychology,vol.6,no.9,2015,pp.1114-1124.在所謂的非均衡、非理性的選擇背后起作用的心理和認(rèn)知層面的內(nèi)在機(jī)制需要得到研究者更細(xì)致的分析,而近年來(lái)興起和發(fā)展的認(rèn)知經(jīng)濟(jì)學(xué)(cognitive economics)和神經(jīng)元經(jīng)濟(jì)學(xué)(neuroeconomics)關(guān)注人類決策過(guò)程的神經(jīng)科學(xué)基礎(chǔ),就是在此方向上的一個(gè)成功的嘗試。aColin F.Camerer,George Loewenstein,Drazen Prelec,“Neuroeconomics:How Neuroscience Can Inform Economics”,Journal of Economic Literature,vol.43,no.1,2005,pp.9-64;葉航、汪丁丁、賈擁民:《科學(xué)與實(shí)證——一個(gè)基于“神經(jīng)元經(jīng)濟(jì)學(xué)”的綜述》,《經(jīng)濟(jì)研究》2007 年第1 期。如通過(guò)大腦磁共振成像(fMRI)、經(jīng)顱直流電刺激(tDCS)、經(jīng)顱磁刺激(TMS)等技術(shù),發(fā)現(xiàn)人腦神經(jīng)系統(tǒng)對(duì)收益和損失的信息處理是非對(duì)稱性的,揭示了損失厭惡和稟賦效應(yīng)發(fā)生的腦神經(jīng)學(xué)機(jī)理。b賈擁民、黃達(dá)強(qiáng)、鄭昊力、羅俊、葉航:《偏好的異質(zhì)性與一致性——基于損失厭惡和腦刺激的神經(jīng)經(jīng)濟(jì)學(xué)研究》,《南方經(jīng)濟(jì)》2015 年第5 期;郭文敏、楊思佳、羅俊、葉航:《作為異質(zhì)性偏好的稟賦效應(yīng):來(lái)自神經(jīng)經(jīng)濟(jì)學(xué)的證據(jù)》,《南方經(jīng)濟(jì)》2017 年第4 期。又如應(yīng)用電刺激和磁刺激技術(shù),發(fā)現(xiàn)人腦的特定區(qū)域在處理社會(huì)互動(dòng)中的信任與可信任行為、信念的形成、推斷他人意圖動(dòng)機(jī)、道德判斷時(shí)都發(fā)揮了關(guān)鍵作用。c葉航、鄭昊力:《信任的偏好與信念及其神經(jīng)基礎(chǔ)》,《社會(huì)科學(xué)戰(zhàn)線》2016 年第6 期;羅俊、葉航、鄭昊力、賈擁民、陳姝、黃達(dá)強(qiáng):《左右側(cè)顳頂聯(lián)合區(qū)對(duì)道德意圖信息加工能力的共同作用——基于經(jīng)顱直流電刺激技術(shù)》,《心理學(xué)報(bào)》2017 年第2 期。
第二個(gè)問(wèn)題則涉及研究中發(fā)現(xiàn)的影響行為因素的穩(wěn)定性與實(shí)驗(yàn)結(jié)果的可重復(fù)性。實(shí)驗(yàn)方法越來(lái)越多地被政策設(shè)計(jì)者使用,并成為干預(yù)和促進(jìn)人們采用合意的行為方式的一種工具,干預(yù)效果的可靠性則決定了其是否真正值得推廣。Sunstein(2014)將借助實(shí)驗(yàn)的助推政策稱為“自由家長(zhǎng)主義”(libertarian paternalism),即個(gè)人行為中表現(xiàn)出的“非理性偏離”如果需要被特定的政策干預(yù),其前提是這些偏離具有系統(tǒng)性,影響它們的變量是清晰且有明確作用機(jī)制的。dCass R.Sunstein,Why Nudge:The Politics of Libertarian Paternalism.New Haven,CT:Yale University Press,2014.如果研究者不清楚個(gè)體選擇是否受到特定環(huán)境或暫時(shí)性經(jīng)濟(jì)因素的影響,而僅僅將其決策偏差歸結(jié)為個(gè)人“無(wú)意識(shí)的非理性”,那么這種實(shí)驗(yàn)并不能有效地解釋行為,只是一種“辯解和敷衍”(Thaler,2016)。一個(gè)可行的解決方案是,通過(guò)大數(shù)據(jù)及相應(yīng)的數(shù)據(jù)挖掘和建模技術(shù)來(lái)幫助研究者們更有效地利用大規(guī)模數(shù)據(jù)集,對(duì)不同時(shí)間、各類人群中的信念、偏好、概率判斷、情緒等因素的影響進(jìn)行分析,以此來(lái)提高對(duì)行為預(yù)測(cè)的穩(wěn)定性。ePatrick J.Wolfe,“Making Sense of Big Data”,Proceedings of the National Academy of Sciences of the United States of America,vol.110,2013,pp.18031-18032;Einav Liran,Jonathan Levin,“Economics in the Age of Big Data”,Science,vol.346,no.6210,2014,p.715.
第三個(gè)問(wèn)題是關(guān)于大規(guī)模線上實(shí)驗(yàn)的廣泛應(yīng)用后樣本行為的可控性和實(shí)驗(yàn)結(jié)果的噪音。隨著云端服務(wù)器的普及,以亞馬遜MTurk(Amazon Mechanical Turk)為代表的線上實(shí)驗(yàn)平臺(tái)為實(shí)驗(yàn)經(jīng)濟(jì)學(xué)研究者們提供了極大的便利,每個(gè)觀測(cè)值所需要的成本也更低,但這種便利也帶來(lái)了一些副作用。Fréchette 等(2021)分析了2010—2019 年間發(fā)表在經(jīng)濟(jì)學(xué)五大頂級(jí)期刊的164 篇實(shí)驗(yàn)文章,發(fā)現(xiàn)在2014 年之前僅有5%的文章涉及線上實(shí)驗(yàn),而在2015—2019 年這個(gè)比例達(dá)到了23%。fGuillaume R.Fréchette,Kim Sarnoff,Leeat Yariv,“Experimental Economics:Past and Future”,Working Paper,2021.涉及線上實(shí)驗(yàn)的文章樣本量成倍地高于線下實(shí)驗(yàn)的樣本量,平均參加人數(shù)在2000—10000 之間。與之相應(yīng)的是對(duì)實(shí)驗(yàn)設(shè)計(jì)的簡(jiǎn)化,線上實(shí)驗(yàn)的研究話題更多涉及非博弈互動(dòng)的決策問(wèn)題,同時(shí)實(shí)驗(yàn)中通過(guò)逐輪的反饋信息來(lái)探討學(xué)習(xí)效應(yīng)的文章也越來(lái)越少。實(shí)驗(yàn)形式和技術(shù)的改進(jìn)也帶來(lái)了被試群體異質(zhì)性增大、被試對(duì)實(shí)驗(yàn)任務(wù)的注意力降低等問(wèn)題,乃至影響到了實(shí)驗(yàn)結(jié)果的穩(wěn)定性。雖然在一些不需要金錢激勵(lì)的個(gè)人決策實(shí)驗(yàn)和最基本的博弈實(shí)驗(yàn)中,大學(xué)生被試和MTurk 上招募的被試表現(xiàn)沒(méi)有顯著差別,gDavid Hauser,Gabriele Paolacci,Jesse Chandler,“Common Concerns with MTurk as a Participant Pool:Evidence and Solutions”,In Handbook of Research Methods in Consumer Psychology.Routledge/Taylor &Francis Group,2019,pp.319-337.但新近的、更大規(guī)模的對(duì)比實(shí)驗(yàn)則發(fā)現(xiàn),當(dāng)存在金錢激勵(lì)時(shí),線下實(shí)驗(yàn)室的大學(xué)生被試、有代表性的美國(guó)公民被試和MTurk 上的被試的表現(xiàn)存在顯著的差異,非學(xué)生群體的行為噪音較大。hEric Snowberg,Leeat Yariv,“Testing the Waters:Behavior across Participant Pools”,American Economic Review,vol.111,no.2,2021,pp.687-719.這種噪音被歸因于線上被試的注意力不集中,在利用MTurk 的線上實(shí)驗(yàn)中,不同實(shí)驗(yàn)參數(shù)下的實(shí)驗(yàn)處置效應(yīng)幾乎完全不顯著,而傳統(tǒng)的實(shí)驗(yàn)室被試群體的行為則更容易隨時(shí)間收斂到理論的均衡。aDrew Fudenberg,Alexander Peysakhovich,“Recency,Records,and Recaps:Learning and Nonequilibrium Behavior in a Simple Decision Problem”,ACM Transactions on Economics and Computation(TEAC),vol.4,no.4,2016,pp.1-18;Nearaja Gupta,Luca Rigotti,Alistair Wilson,“The Experimenters’ Dilemma:Inferential Preferences over Populations”,Working Paper,2021.因此,在進(jìn)行更低成本的線上實(shí)驗(yàn)時(shí),研究者往往面臨著收集到噪音更大的大樣本、被試注意力不集中而導(dǎo)致的實(shí)驗(yàn)結(jié)果更不穩(wěn)定的現(xiàn)實(shí)難題。最近幾年應(yīng)用于實(shí)驗(yàn)大數(shù)據(jù)的機(jī)器學(xué)習(xí)算法,在處理隨機(jī)性較大、噪音較大的數(shù)據(jù)樣本時(shí),能夠提高對(duì)行為的預(yù)測(cè)精度,也被認(rèn)為是一種可行的解決途徑(Mullainathan 和Spiess,2017;Camerer,2019)。
將人工智能技術(shù)引入實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的研究話題是學(xué)界最近五年逐漸興起的熱點(diǎn)。人工智能(AI)的概念非常寬泛,廣義使用時(shí)不僅包括了機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等算法,而且還包括了對(duì)各類大數(shù)據(jù)的處理。其對(duì)經(jīng)濟(jì)學(xué)實(shí)驗(yàn)研究的影響主要可以分為兩點(diǎn)。一是相比于傳統(tǒng)的以因果推斷為目的的實(shí)驗(yàn)設(shè)計(jì)和數(shù)據(jù)分析,利用大數(shù)據(jù)和機(jī)器學(xué)習(xí)算法進(jìn)行數(shù)據(jù)挖掘和建模的方法更側(cè)重對(duì)個(gè)體行為的預(yù)測(cè);二是人工智能輔助下的決策問(wèn)題,比如基于個(gè)人特征而設(shè)計(jì)的推薦系統(tǒng)、幫助企業(yè)和金融機(jī)構(gòu)進(jìn)行的對(duì)特定人群的識(shí)別、幫助政府等公共管理機(jī)構(gòu)進(jìn)行的公共決策和政策執(zhí)行等等。
Camerer(2019)認(rèn)為,機(jī)器學(xué)習(xí)算法對(duì)實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的首要貢獻(xiàn)是幫助尋找和挖掘影響個(gè)人選擇的行為變量,以更好理解和預(yù)測(cè)現(xiàn)實(shí)中個(gè)體的決策過(guò)程。這些被找到的“新”的行為變量很有可能是尚未被微觀或是行為理論的數(shù)理化模型刻畫過(guò)的,因此機(jī)器學(xué)習(xí)應(yīng)用下的實(shí)驗(yàn)研究也更加“基于證據(jù)”(evidence-based)且有“預(yù)測(cè)導(dǎo)向”(prediction-oriented)。機(jī)器學(xué)習(xí)模型對(duì)噪音較大的數(shù)據(jù)集往往有更高的預(yù)測(cè)精度,對(duì)數(shù)據(jù)變異度有更強(qiáng)的解釋能力。Peysakhovich 和Naecker(2017)提出,同樣是解釋10%的變異度,如果針對(duì)的是一個(gè)較為干凈的數(shù)據(jù)集,那么說(shuō)明模型的解釋能力相當(dāng)差,但如果在有大量噪音的情況下能夠解釋10%的變異度,那么說(shuō)明模型已經(jīng)表現(xiàn)非常好了。bAlexander Peysakhovich,Jeffrey Naecker,“Using Methods from Machine Learning to Evaluate Behavioral Models of Choice under Risk and Ambiguity”, Journal of Economic Behavior &Organization,vol.133,2017,pp.373-384.
在對(duì)線上實(shí)驗(yàn)的數(shù)據(jù)處理中,機(jī)器學(xué)習(xí)模型的表現(xiàn)優(yōu)于以往文獻(xiàn)常用的行為經(jīng)濟(jì)模型。Epstein 等(2016)對(duì)在Amazon MTurk 平臺(tái)收集的1067 位美國(guó)公民每人20 次獨(dú)裁者實(shí)驗(yàn)的選擇數(shù)據(jù),利用邏輯嶺回歸方法(logistic ridge regression)對(duì)社會(huì)偏好模型的參數(shù)進(jìn)行估計(jì),并評(píng)估了經(jīng)濟(jì)學(xué)實(shí)驗(yàn)中常用的社會(huì)經(jīng)濟(jì)背景變量的樣本外預(yù)測(cè)(out-of-sample prediction)的精度。cZiv Epstein,Alexander Peysakhovich,David G.Rand,“The Good,the Bad,and the Unflinchingly Selfish:Cooperative Decision-Making Can Be Predicted with High Accuracy When Using Only Three Behavioral Types”,Proceedings of the 2016 ACM Conference on Economics and Computation,2016,pp.547-559.估計(jì)結(jié)果表明,如果采用“代表性個(gè)體模型”(representative agent model),即所有被試共用一套社會(huì)偏好參數(shù),估計(jì)結(jié)果的預(yù)測(cè)精度僅比完全隨機(jī)猜測(cè)略好(AUC=0.69)。dAUC 是“觀測(cè)者操作特性曲線以下的面積”(“area under the receiver operating characteristic curve”)的簡(jiǎn)寫,用于評(píng)估機(jī)器學(xué)習(xí)算法的預(yù)測(cè)精度:Andrew P.Bradley,“The Use of the Area under the ROC Curve in the Evaluation of Machine Learning Algorithms”,Pattern Recognition,vol.30,no.7,1997,pp.1145-1159.而用每個(gè)個(gè)體各自有一套行為參數(shù)的完全異質(zhì)性模型,或者先將所有被試分類為三種“行為類型”,再分別估計(jì)三套參數(shù)的聚類異質(zhì)性模型,估計(jì)的精度都可以大幅提升(AUC=0.89,0.88),其中后者的復(fù)雜度顯著降低。Epstein 等(2016)還利用個(gè)人背景變量來(lái)預(yù)測(cè)個(gè)人屬于不同行為類型的概率,得到的精度也較低,這一結(jié)果也對(duì)實(shí)驗(yàn)問(wèn)卷中所慣常使用的經(jīng)濟(jì)、社會(huì)、心理等測(cè)度是否具有行為上的預(yù)測(cè)性提出了質(zhì)疑。
Peysakhovich 和Naecker(2017)基于在Amazon MTurk 平臺(tái)收集的600 位被試的6000 次選擇數(shù)據(jù),將機(jī)器學(xué)習(xí)算法用于個(gè)人決策中風(fēng)險(xiǎn)偏好和模糊性偏好的分析和行為預(yù)測(cè),并與幾類常用的不確定性下的決策模型進(jìn)行了比較。機(jī)器學(xué)習(xí)算法的特點(diǎn)是能夠包含所有的決策相關(guān)的變量以及它們與個(gè)人虛擬變量的交乘效應(yīng),能夠?qū)Τ^(guò)55000 個(gè)參數(shù)進(jìn)行估計(jì),同時(shí)采用交叉校驗(yàn)和正則化回歸的方法來(lái)避免過(guò)度擬合。估計(jì)結(jié)果顯示,在針對(duì)風(fēng)險(xiǎn)偏好的估計(jì)中,所有個(gè)體共用同一套參數(shù)的“代表性個(gè)體”期望效用模型的精度較低,而如果考慮參數(shù)的個(gè)體異質(zhì)性并引入非線性概率加權(quán)的期望效用模型,則其估計(jì)精度與機(jī)器學(xué)習(xí)算法相差無(wú)幾。然而,在針對(duì)模糊性偏好的估計(jì)中,不論是考慮個(gè)體異質(zhì)性的二階期望效用模型還是極大極小偏好模型,其樣本外預(yù)測(cè)的表現(xiàn)都不如機(jī)器學(xué)習(xí)算法。因此,Peysakhovich和Naecker 認(rèn)為機(jī)器學(xué)習(xí)可以被用作實(shí)驗(yàn)數(shù)據(jù)中可解釋的數(shù)據(jù)變異性的上限,尤其是更適用于噪音較大的線上實(shí)驗(yàn)數(shù)據(jù)集。Bourgin 等(2019)在上述方法的基礎(chǔ)上更進(jìn)一步利用已有的認(rèn)知模型合成的數(shù)據(jù)集來(lái)預(yù)測(cè)訓(xùn)練神經(jīng)網(wǎng)絡(luò)(neutral networks),構(gòu)造算法的“認(rèn)知模型先驗(yàn)”(cognitive model priors),對(duì)13000 個(gè)彩票選擇問(wèn)題中240000 人次的行為進(jìn)行預(yù)測(cè)。aDavid D.Bourgin,Joshua C.Peterson,Daniel Reichman,Stuart J.Russell,Thomas L.Griffiths,“Cognitive Model Priors for Predicting Human Decisions”,International Conference on Machine Learning,PMLR,2019,vol.97,pp.5133-5141.研究結(jié)果顯示,利用已有的認(rèn)知心理學(xué)理論來(lái)作為神經(jīng)網(wǎng)絡(luò)的先驗(yàn)概率,可以提升訓(xùn)練有效性和減少預(yù)測(cè)誤差,進(jìn)一步提升機(jī)器學(xué)習(xí)算法對(duì)行為的預(yù)測(cè)能力。
機(jī)器學(xué)習(xí)算法在分析更為復(fù)雜的博弈互動(dòng)實(shí)驗(yàn)并預(yù)測(cè)博弈雙方的策略時(shí)也有很大的優(yōu)勢(shì)。Hartford 等(2016)針對(duì)雙人的矩陣博弈,提出利用多層次的深度學(xué)習(xí)網(wǎng)絡(luò)(deep learning networks),基于收益結(jié)構(gòu)對(duì)個(gè)人行為反應(yīng)層級(jí)中的策略概率分布進(jìn)行預(yù)測(cè)。bJason S.Hartford,James R.Wright,Kevin Leyton-Brown,“Deep Learning for Predicting Human Strategic Behavior”,Discussion Paper,University of British Columbia,2016.Vazifedan 和Izadi(2021)則進(jìn)一步提出了一種采用深卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural networks),基于不同維度博弈矩陣的收益結(jié)構(gòu)和博弈中的歷史策略,對(duì)重復(fù)博弈中個(gè)人的策略選擇進(jìn)行預(yù)測(cè)的方法。cAfrooz Vazifedan,Mohammad Izadi,“Predicting Human Behavior in Size-Variant Repeated Games through Deep Convolutional Neural Networks”,Progress in Artificial Intelligence,vol.11,no.1,2021,pp.15-28.Camerer 等(2019)分析了Caltech 和UCLA 兩所學(xué)校的線下實(shí)驗(yàn)室進(jìn)行的110 位大學(xué)生每人120 輪的討價(jià)還價(jià)博弈實(shí)驗(yàn),利用機(jī)器學(xué)習(xí)算法預(yù)測(cè)了不對(duì)稱信息下有期限的動(dòng)態(tài)非結(jié)構(gòu)性談判中談判陷入分歧和最終不能達(dá)成協(xié)議的可能性。dColin F.Camerer,Gideon Nave,Alec Smith,“Dynamic Unstructured Bargaining with Private Information:Theory,Experiment,and Outcome Prediction via Machine Learning”,Management Science,vol.65,no.4,2019,pp.1867-1890.無(wú)法達(dá)成協(xié)議這種無(wú)效率的結(jié)果不符合理論分析中的任何一種均衡,在實(shí)際的選擇中卻經(jīng)常發(fā)生,甚至在總收益金額很大、多輪互動(dòng)的談判之后也仍然很常見(jiàn),被試間對(duì)于收益的劃分也并不符合理論均衡的刻畫。與舊有的實(shí)驗(yàn)文獻(xiàn)對(duì)這種現(xiàn)象背后的原因用行為偏好等理論解釋不同,Camerer 等(2019)利用被試在談判中的過(guò)程數(shù)據(jù)(process data)直接對(duì)談判失敗是否會(huì)發(fā)生、何時(shí)發(fā)生作出了預(yù)測(cè)。通過(guò)對(duì)過(guò)程數(shù)據(jù)中出價(jià)先后、間隔時(shí)長(zhǎng)、變化模式等特定行為模式構(gòu)造的34 個(gè)特征變量進(jìn)行的邏輯LASSO 罰函數(shù)回歸(logistic regression with LASSO penalty)發(fā)現(xiàn),具有信息優(yōu)勢(shì)的談判方的當(dāng)前出價(jià)、談判雙方地位的差距、初始談判地位等變量對(duì)最終能否達(dá)成協(xié)議的預(yù)測(cè)力最強(qiáng)。機(jī)器學(xué)習(xí)能夠量化地估計(jì)出這些影響因素對(duì)于談判結(jié)果貢獻(xiàn)的大小,這些是質(zhì)化的博弈論均衡分析所無(wú)法做到的。據(jù)此,Camerer 等(2019)建議,機(jī)器學(xué)習(xí)算法可以用于更多類型的過(guò)程數(shù)據(jù),如談判中的溝通模式、動(dòng)作和手勢(shì)、眼動(dòng)和其他生理反應(yīng)等的處理,從而進(jìn)一步提升預(yù)測(cè)的準(zhǔn)確性。
機(jī)器學(xué)習(xí)算法在處理高維大數(shù)據(jù)中的優(yōu)勢(shì)也為研究者們提供了更方便的工具來(lái)對(duì)實(shí)驗(yàn)中產(chǎn)生的大量非選擇數(shù)據(jù)(non-choice data)進(jìn)行分析,并對(duì)行為作出預(yù)測(cè)。Halko 等(2021)利用被試在自然狀態(tài)下由可穿戴設(shè)備產(chǎn)生的生物學(xué)特征數(shù)據(jù),尤其是衡量心臟功能的心率變異性數(shù)據(jù),對(duì)被試在薪酬實(shí)驗(yàn)中會(huì)選擇計(jì)件工資、競(jìng)爭(zhēng)性激勵(lì)還是基于團(tuán)隊(duì)競(jìng)爭(zhēng)的薪酬激勵(lì)方式進(jìn)行預(yù)測(cè)。eMarja-Liisa Halko,Olli Lappalainen,Lauri S??ksvuori,“Do Non-Choice Data Reveal Economic Preferences? Evidence from Biometric Data and Compensation-Scheme Choice”,Journal of Economic Behavior &Organization,vol.188,2021,pp.87-104.Halko 等(2021)利用線性LASSO 回歸和嵌套交叉校驗(yàn)(nested cross validation)的結(jié)果顯示,采用非選擇數(shù)據(jù)的樣本外預(yù)測(cè)和利用性別與過(guò)往決策數(shù)據(jù)的預(yù)測(cè),其對(duì)個(gè)體選擇行為的預(yù)測(cè)能力相差無(wú)幾。Li 和Camerer(2021)則利用圖像的倒置視覺(jué)突出性特征(bottom-up visual salience),來(lái)預(yù)測(cè)被試在摘水果游戲、地點(diǎn)匹配游戲和矩陣博弈中的選擇。aXiaomin Li,Colin Camerer,“Predictable Effects of Bottom-up Visual Salience in Experimental Decisions and Games”,Working Paper,2021.該研究使用了預(yù)訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò),并引入視覺(jué)突出的注意力模型(salience attentive model algorithm)算法,發(fā)現(xiàn)視覺(jué)突出性在合作型的地點(diǎn)匹配游戲中的預(yù)測(cè)能力較強(qiáng),而在其他決策的預(yù)測(cè)上則精度一般。同樣地,機(jī)器學(xué)習(xí)模型能夠處理的人體生物學(xué)特征數(shù)據(jù)還包括大腦磁共振圖像、腦電波等高維數(shù)據(jù)集,通過(guò)正則化回歸、卷積神經(jīng)網(wǎng)絡(luò)等算法,在大量的候選變量中尋找對(duì)人的風(fēng)險(xiǎn)選擇、博弈互動(dòng)、道德行為等最有預(yù)測(cè)性的特征變量,為傳統(tǒng)的神經(jīng)元經(jīng)濟(jì)學(xué)提供精度更高、預(yù)測(cè)能力更強(qiáng)的分析工具。
當(dāng)然,學(xué)者們也指出,不能完全依賴機(jī)器學(xué)習(xí)的數(shù)據(jù)挖掘算法來(lái)預(yù)測(cè)行為,而應(yīng)與現(xiàn)存的微觀經(jīng)濟(jì)理論相結(jié)合,促進(jìn)理論建模更加完善。Fudenberg 和Liang(2019)使用袋裝決策樹(shù)算法(bagged decision tree algorithm)對(duì)被試在矩陣博弈中的初始策略進(jìn)行預(yù)測(cè)發(fā)現(xiàn),基于算法的一層策略模型與傳統(tǒng)博弈論中帕累托占優(yōu)的納什均衡模型結(jié)合而成的混合模型的預(yù)測(cè)能力最強(qiáng)。bDrew Fudenberg,Annie Liang,“Predicting and Understanding Initial Play”,American Economic Review,vol.109,no.12,2019,pp.4112-4141.Fudenberg 和Karreskog(2021)也提出了一個(gè)基于初始決策的學(xué)習(xí)模型,并利用17 篇已有的無(wú)限次重復(fù)囚徒困境博弈實(shí)驗(yàn)的文章數(shù)據(jù)進(jìn)行估計(jì)發(fā)現(xiàn),預(yù)測(cè)的精度并不比幾種機(jī)器學(xué)習(xí)模型差。cDrew Fudenberg,Gustav Karreskog,“Predicting Cooperation with Learning Models”,Working Paper,2021.因此,以Drew Fudenberg 為代表的行為經(jīng)濟(jì)學(xué)家認(rèn)為,采用“擁有算法結(jié)構(gòu)”(algorithmically structured)的微觀行為理論模型,才能夠避免機(jī)器學(xué)習(xí)模型復(fù)雜度高、變量過(guò)多、難以解釋的問(wèn)題,使預(yù)測(cè)結(jié)果更具有經(jīng)濟(jì)學(xué)含義。
很多重要的個(gè)人、企業(yè)和公共決策都建立在精準(zhǔn)的預(yù)測(cè)基礎(chǔ)上。Kleinberg 等(2015)提出,傳統(tǒng)微觀經(jīng)濟(jì)學(xué)的因果推斷方法面臨重大變革,經(jīng)濟(jì)學(xué)家應(yīng)充分利用機(jī)器學(xué)習(xí)算法的預(yù)測(cè)能力來(lái)輔助微觀主體和公共部門的政策設(shè)計(jì),關(guān)注直接基于大數(shù)據(jù)分析提出政策建議的“預(yù)測(cè)政策問(wèn)題”(prediction policy problems)。dJon Kleinberg,Jens Ludwig,Sendhil Mullainathan,Ziad Obermeyer,“Prediction Policy Problems”,The American Economic Review,vol.105,no.5,2015,pp.491-495.而應(yīng)用于大數(shù)據(jù)的算法也為經(jīng)濟(jì)學(xué)家們帶來(lái)了新的對(duì)微觀個(gè)體決策偏誤的理解。在經(jīng)濟(jì)、政治和社會(huì)活動(dòng)中,好的算法能夠客觀中立地作出預(yù)測(cè),幫助人們對(duì)現(xiàn)實(shí)市場(chǎng)作出更準(zhǔn)確的判斷、對(duì)海量的信息作出更有效的鑒別,從而提高決策質(zhì)量。不同群體間的異質(zhì)性使得對(duì)算法的接納和信任、從算法輔助中的獲益都因人而異,因此設(shè)計(jì)有針對(duì)性、透明且易于理解的算法,進(jìn)行個(gè)性化的行為干預(yù),也有著重要的現(xiàn)實(shí)意義與應(yīng)用價(jià)值。
首先,以機(jī)器學(xué)習(xí)算法為核心的人工智能技術(shù)在理論問(wèn)題上的高預(yù)測(cè)精度,是否能夠幫助現(xiàn)實(shí)中的企業(yè)和金融機(jī)構(gòu)在經(jīng)營(yíng)中作出更準(zhǔn)確的決定?Chen 等(2021)的實(shí)驗(yàn)研究了真人被試和人工智能在利用借貸人的面部信息對(duì)是否應(yīng)批準(zhǔn)其放款申請(qǐng)時(shí)的準(zhǔn)確度差異。eZeyang Chen,Yu-Jane Liu,Juanjuan Meng,Zeng Wang,“What's in a Face? An Experiment on Facial Information and Loan Approval Decision”,Working Paper,2021.該研究基于一個(gè)現(xiàn)金借貸公司的借貸人償還貸款的歷史數(shù)據(jù),在給真人被試提供借貸人基本財(cái)務(wù)背景、月賬單和申請(qǐng)貸款期限等信息的基礎(chǔ)上,改變所提供的借貸人面部信息的詳細(xì)程度。Chen 等(2021)發(fā)現(xiàn),提供面部信息對(duì)真人被試放款決策的正確率影響不大,但如果用上述面部信息和歷史還貸數(shù)據(jù)訓(xùn)練一個(gè)多層神經(jīng)網(wǎng)絡(luò)(multilayer neural network)來(lái)對(duì)每個(gè)借貸人能否按時(shí)償還貸款進(jìn)行預(yù)測(cè),那么其樣本外預(yù)測(cè)的精度可以達(dá)到80.5%。進(jìn)一步的分析表明,面部信息無(wú)法幫助真人被試提高決策質(zhì)量,是由于其在觀看和評(píng)價(jià)借貸人照片時(shí)存有各類偏見(jiàn),又過(guò)度依賴自己從照片中得到的有偏印象,忽略了借貸人的基本財(cái)務(wù)信息和過(guò)往償還貸款記錄等背景數(shù)據(jù)。機(jī)器學(xué)習(xí)算法則能夠客觀和全面地利用這些數(shù)據(jù),大幅提高了決策準(zhǔn)確性。Bertomeu 等(2020)基于包含了財(cái)務(wù)狀況、資本市場(chǎng)、公司治理狀況和審計(jì)分析等多變量的會(huì)計(jì)數(shù)據(jù)庫(kù),利用梯度提升回歸樹(shù)(gradient boosted regression tree)算法來(lái)調(diào)查公司會(huì)計(jì)信息的不實(shí)披露情況,并提前一到兩年對(duì)未來(lái)有更大風(fēng)險(xiǎn)出現(xiàn)不實(shí)披露的公司進(jìn)行預(yù)警。aJeremy Bertomeu,Edwige Cheynel,Eric Floyd,Wenqiang Pan,“Using Machine Learning to Detect Misstatements”,Review of Accounting Studies,vol.26,no.2,2020,pp.468-519.Erel 等(2021)則采用LASSO、嶺回歸、神經(jīng)網(wǎng)絡(luò)和梯度提升回歸樹(shù)等幾種算法對(duì)公司經(jīng)理人的表現(xiàn)進(jìn)行評(píng)估和預(yù)測(cè),并據(jù)此識(shí)別了表現(xiàn)不佳的經(jīng)理人的特征變量,為公司應(yīng)如何選擇經(jīng)理人提出建議。bIsil Erel,Léa H.Stern,Chenhao Tan,Michael S.Weisbach,“Selecting Directors Using Machine Learning”, The Review of Financial Studies,vol.34,no.7,2021,pp.3226-3264.
人工智能輔助決策的優(yōu)點(diǎn)也被用于稅收、司法等公共管理事務(wù)中的決策評(píng)估和建議,從而幫助政策制定者達(dá)到更有效率的政策目標(biāo)。Andini 等(2018)分析了意大利當(dāng)局2014 年起開(kāi)展的一項(xiàng)應(yīng)對(duì)經(jīng)濟(jì)蕭條、促進(jìn)消費(fèi)的大規(guī)模退稅政策,提出如果利用機(jī)器學(xué)習(xí)算法來(lái)挑選該政策的目標(biāo)受益人群并進(jìn)行有針對(duì)性的退稅,那么政策的有效性可以得到顯著提高。cMonica Andini,Emanuele Ciani,Guido de Blasio,Alessio D'Ignazio,Viola Salvestrini,“Targeting with Machine Learning:An Application to a Tax Rebate Program in Italy”,Journal of Economic Behavior &Organization,vol.156,2018,pp.86-102.該研究基于意大利銀行的家庭收入和財(cái)富調(diào)查,采用決策樹(shù)算法(decision tree)識(shí)別退稅政策所應(yīng)針對(duì)的“消費(fèi)受限”的人群,發(fā)現(xiàn)實(shí)際上29.5%的退稅被分配給了并不需要這項(xiàng)政策幫助(即消費(fèi)并未受限)的人群。而相比于該政策的實(shí)際受益群體,如果退稅被分配給算法挑選出的受益人群,那么食品消費(fèi)的增加會(huì)比實(shí)際的政策效果高出41.8%。Andini等(2018)還發(fā)現(xiàn),采用K-最鄰近分類(k-Nearest Neighbors,kNN)和隨機(jī)森林(random forest)算法的預(yù)測(cè)效果差異不大,但決策樹(shù)算法變量更少、更加透明,方便政策制定者簡(jiǎn)單明了地向公眾解釋其選定目標(biāo)人群的原則,是更好地輔助政策實(shí)施的工具。Kleinberg 等(2018)則討論了利用機(jī)器學(xué)習(xí)算法提高法官判決質(zhì)量的可能性。dJon Kleinberg,Himabindu Lakkaraju,Jure Leskovec,Jens Ludwig,Sendhil Mullainathan,“Human Decisions and Machine Predictions”,The Quarterly Journal of Economics,vol.133,no.1,2018,pp.237-293.該研究利用紐約市2008—2013 年間的犯罪、逮捕和司法判決數(shù)據(jù),采用梯度提升決策樹(shù)算法,對(duì)被捕者的再犯概率進(jìn)行預(yù)測(cè),并與實(shí)際中的判決做對(duì)比。結(jié)果顯示,在收監(jiān)率不變的情況下,以算法輔助判決,犯罪率能降低24.7%;如果保持再犯率不變,那么收監(jiān)率可以下降41.9%。因此,Kleinberg 等(2018)認(rèn)為,算法輔助在司法等公共管理領(lǐng)域的應(yīng)用,是“預(yù)測(cè)政策問(wèn)題”的一個(gè)典型例子,有著重要的現(xiàn)實(shí)意義。
其次,既然利用人工智能技術(shù)進(jìn)行決策具有更高精確度和效率,那么在現(xiàn)實(shí)中人們是否愿意接受這樣的決策輔助?哪些人群更樂(lè)于接受?算法應(yīng)如何改進(jìn)才更有可能被理解和接受?Chen 等(2021)的實(shí)驗(yàn)比較了基于歷史貸款數(shù)據(jù)來(lái)作出放款決定時(shí)真人被試和人工智能的決策質(zhì)量,發(fā)現(xiàn)真人被試在人工智能輔助下的決策準(zhǔn)確性仍低于算法的預(yù)測(cè)精度,真人被試表現(xiàn)出“算法厭惡”(algorithm aversion),對(duì)自身判斷力過(guò)度自信而輕視算法的建議。eZeyang Chen,Yu-Jane Liu,Juanjuan Meng,Zeng Wang,“Can All Humans Benefit from AI Assistance? Algorithm Aversion and Overconfidence”,Working Paper,2021.Grgi?-Hla?a 等(2019)研究了普通人被試在評(píng)估犯罪嫌疑人再犯的概率并作出監(jiān)禁與否的決策時(shí),是否能聽(tīng)從機(jī)器學(xué)習(xí)算法給出的建議。結(jié)果發(fā)現(xiàn),算法的預(yù)測(cè)并不能顯著改變被試的決策,且不隨實(shí)驗(yàn)的金錢激勵(lì)增加而改變。fNina Grgi?-Hla?a,Christoph Engel,Krishna P.Gummadi,“Human Decision Making with Machine Assistance:An Experiment on Bailing and Jailing”,Proceedings of the ACM on Human-Computer Interaction,vol.3,no.178,2019,pp.1-25.Horne 等(2019)則通過(guò)實(shí)驗(yàn)室實(shí)驗(yàn)探討了人工智能輔助下人們是否能夠判斷虛假新聞,以及具有哪些特征的群體更樂(lè)于接受算法的建議。aBenjamin D.Horne,Dorit Nevo,John O’Donovan,Jin-Hee Cho,Sibel Adali,“Rating Reliability and Bias in News Articles:Does AI Assistance Help Everyone?”,Proceedings of the International AAAI Conference on Web and Social Media,vol.13,2019.該研究使用包含了主流媒體和不可靠來(lái)源的2017 年新聞報(bào)道數(shù)據(jù)庫(kù),并應(yīng)用隨機(jī)森林分類算法對(duì)每條新聞的可信性和偏向性做了概率預(yù)測(cè)。通過(guò)向在Amazon MTurk 上招募的654 位被試展示僅有文字的新聞、在新聞下方顯示算法預(yù)測(cè)或同時(shí)給出算法預(yù)測(cè)背后所基于的對(duì)新聞特征的解釋,Horne 等(2019)發(fā)現(xiàn)附有解釋的算法預(yù)測(cè)能夠顯著改變被試對(duì)虛假新聞的認(rèn)知,提高其判斷假新聞和媒體偏向的準(zhǔn)確率。同時(shí),即使有人工智能的幫助,那些經(jīng)常閱讀主流報(bào)刊和對(duì)政治議題熟悉的被試更容易識(shí)別出虛假和有偏的新聞,而那些經(jīng)常在社交媒體上閱讀和分享貼子的被試則更不容易鑒別新聞的可信度和偏向性。
由于算法輔助對(duì)個(gè)人決策的幫助效果因人、因算法的呈現(xiàn)形式而異,故而設(shè)計(jì)更易于理解和操作的、針對(duì)個(gè)人特征的個(gè)性化輔助成為了使人們更愿意接受算法建議來(lái)提高自身決策質(zhì)量的有效途徑。Hamsa 等(2021)借鑒行為經(jīng)濟(jì)理論中“強(qiáng)化學(xué)習(xí)模型”的框架,構(gòu)建了一個(gè)將人工智能的預(yù)測(cè)轉(zhuǎn)化為人們可以接受的“小建議”的算法,并設(shè)計(jì)了一個(gè)線上“虛擬餐廳”游戲來(lái)檢驗(yàn)這種設(shè)計(jì)的有效性。bBastani Hamsa,Osbert Bastani,Wichinpong Park Sinchaisri,“Improving Human Decision-Making with Machine Learning”,Working Paper,2021.該算法首先訓(xùn)練一個(gè)高性能的神經(jīng)網(wǎng)絡(luò)以強(qiáng)化學(xué)習(xí)模型為框架生成決策規(guī)則,繼而將這種規(guī)則以易于理解的方式呈現(xiàn)給被試,以指導(dǎo)被試在需要較為復(fù)雜的人力配置序貫決策中的行為。研究結(jié)果表明,這一算法能夠很顯著提高被試在決策中有效配置人工的表現(xiàn),隨著游戲輪數(shù)增加,經(jīng)驗(yàn)越豐富的被試越能夠理解算法建議的重要性,并能結(jié)合算法的建議來(lái)嘗試一些新策略。Poursabzi-Sangdeh 等(2021)通過(guò)一個(gè)預(yù)測(cè)紐約市公寓售價(jià)的實(shí)驗(yàn)考察了模型的“可解釋性”(interpretability)對(duì)人們遵循不同的算法模型建議的影響,發(fā)現(xiàn)人們更愿意接納特征變量更少、預(yù)測(cè)的原理更透明的模型所給出的建議。cForough Poursabzi-Sangdeh,Daniel G.Goldstein,Jake Hofman,Jennifer Wortman Vaughan,Hanna Wallach,“Manipulating and Measuring Model Interpretability”,Proceedings of the 2021 CHI Conference on Human Factors in Computing Systems,2021.Chen和Yeckehzaare(2020)則研究了利用算法針對(duì)不同被試進(jìn)行的個(gè)性化推薦是否更易于被接受,并用以促進(jìn)特定的行為。dYan Chen,Iman Yeckehzaare,“Motivating Experts to Contribute to Digital Public Goods:A Personalized Field Experiment on Wikipedia”,Working Paper,2020.該研究選取了3974 位在RePEc 發(fā)文5 篇以上的經(jīng)濟(jì)學(xué)家,計(jì)算他們的文章摘要與維基百科上的經(jīng)濟(jì)學(xué)文章的相似度并進(jìn)行匹配,邀請(qǐng)他們對(duì)這些文章作出評(píng)論,并告知維基的閱讀量、本人文章被引用、貢獻(xiàn)被廣泛認(rèn)可等潛在益處,進(jìn)而采用隨機(jī)森林的算法對(duì)收集到的評(píng)論長(zhǎng)度和質(zhì)量進(jìn)行預(yù)測(cè)。結(jié)果發(fā)現(xiàn),專家們的領(lǐng)域與推薦給他們以供評(píng)論的詞條內(nèi)容越接近,專家本人業(yè)內(nèi)聲望越高,回答后被引用的可能性越大,他們給出的評(píng)論質(zhì)量就越高。Chen 和Yeckehzaare(2020)由此提出,機(jī)器學(xué)習(xí)算法的積極作用之一在于可以個(gè)性化地設(shè)計(jì)匹配和推薦系統(tǒng),鼓勵(lì)人們?cè)诨ヂ?lián)網(wǎng)上對(duì)數(shù)字公益有所貢獻(xiàn)。
實(shí)驗(yàn)經(jīng)濟(jì)學(xué)通過(guò)借鑒心理學(xué)的研究發(fā)現(xiàn)和方法,尤其是利用可控的實(shí)驗(yàn)室對(duì)照實(shí)驗(yàn)方式來(lái)觀測(cè)微觀個(gè)體的行為,幫助理論經(jīng)濟(jì)學(xué)家們更全面地刻畫人的偏好、風(fēng)險(xiǎn)決策、信念和合作互動(dòng)等,提出包含了認(rèn)知、行為和心理因素的新經(jīng)濟(jì)模型,并以此來(lái)重新認(rèn)識(shí)人們?cè)诂F(xiàn)實(shí)市場(chǎng)中的行為。實(shí)地實(shí)驗(yàn)中的應(yīng)用則通過(guò)隨機(jī)對(duì)照實(shí)驗(yàn)來(lái)觀察人們的對(duì)經(jīng)濟(jì)或社會(huì)政策的反應(yīng),為政策制定者提供了重要的分析工具和決策參考。但與此同時(shí),實(shí)證導(dǎo)向的行為實(shí)驗(yàn)方法也面臨著對(duì)影響行為的變量缺乏心理和認(rèn)知層面的內(nèi)在機(jī)制的探討、行為干預(yù)措施的外部有效性不明確、干預(yù)結(jié)果的可重復(fù)性存疑、大規(guī)模線上實(shí)驗(yàn)中個(gè)體行為的可控性較差、數(shù)據(jù)存在較多噪音等需要進(jìn)一步探討和解決的問(wèn)題。
近年來(lái),隨著數(shù)字經(jīng)濟(jì)的興起與發(fā)展,基于互聯(lián)網(wǎng)和移動(dòng)互聯(lián)網(wǎng)的大數(shù)據(jù)、用于分析大數(shù)據(jù)的機(jī)器學(xué)習(xí)算法和人工智能技術(shù)的應(yīng)用,給微觀和實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的研究對(duì)象和分析方法都帶來(lái)了巨大的沖擊。大數(shù)據(jù)與人工智能的作用也越來(lái)越被政策制定者所關(guān)注和倚重。李克強(qiáng)總理在2021 年的政府工作報(bào)告中指出,要“大力促進(jìn)科技創(chuàng)新,推動(dòng)產(chǎn)業(yè)數(shù)字化智能化改造”。經(jīng)濟(jì)的高質(zhì)量發(fā)展依托于市場(chǎng)有效運(yùn)行的微觀基礎(chǔ),而大數(shù)據(jù)與人工智能在經(jīng)濟(jì)學(xué)領(lǐng)域的應(yīng)用為政策制定提供了這樣的微觀基礎(chǔ)和實(shí)證數(shù)據(jù)。高維大數(shù)據(jù)集為觀察個(gè)人的決策影響因素提供了海量的素材,機(jī)器學(xué)習(xí)方法則為數(shù)據(jù)挖掘、模型選擇和預(yù)測(cè)提供了非常便捷的工具,極大地提升了實(shí)證研究對(duì)現(xiàn)實(shí)中經(jīng)濟(jì)行為的預(yù)測(cè)能力。人工智能和大數(shù)據(jù)技術(shù)的應(yīng)用拓展了實(shí)驗(yàn)經(jīng)濟(jì)學(xué)的技術(shù)可能,如基于機(jī)器學(xué)習(xí)個(gè)性化匹配與推薦算法、高維統(tǒng)計(jì)方法在分析非選擇性數(shù)據(jù)時(shí)的應(yīng)用、大規(guī)模線上實(shí)地實(shí)驗(yàn)的普及等,a翁茜、李棟:《在線實(shí)地實(shí)驗(yàn)研究進(jìn)展》,《經(jīng)濟(jì)學(xué)動(dòng)態(tài)》2020 年第5 期。但同時(shí)也對(duì)部分以因果關(guān)系識(shí)別為目的、為了解決實(shí)證數(shù)據(jù)的內(nèi)生性問(wèn)題而倚仗可控實(shí)驗(yàn)進(jìn)行因果分析的應(yīng)用性研究的基本邏輯構(gòu)成了前所未有的挑戰(zhàn)。如Kleinberg(2015)就提出了取代傳統(tǒng)微觀經(jīng)濟(jì)學(xué)的因果推斷方法、直接基于大數(shù)據(jù)分析提出政策建議的“預(yù)測(cè)政策問(wèn)題”。與此同時(shí),人工智能對(duì)個(gè)體行為的指導(dǎo)性和預(yù)測(cè)性顯著優(yōu)于現(xiàn)實(shí)中的經(jīng)濟(jì)人決策者,這為我們帶來(lái)了校正微觀個(gè)體決策偏誤的新手段。如何設(shè)計(jì)有針對(duì)性、透明且易于理解的算法,輔助微觀主體對(duì)現(xiàn)實(shí)市場(chǎng)作出更準(zhǔn)確的判斷、對(duì)海量的信息作出更有效的甄別,幫助公共管理部門提高決策質(zhì)量,達(dá)到更有效率的政策目標(biāo),成為了實(shí)驗(yàn)經(jīng)濟(jì)學(xué)所面臨的新課題。
本文中所討論的人工智能技術(shù)也有其局限性,并不能解決當(dāng)前實(shí)驗(yàn)經(jīng)濟(jì)學(xué)研究中存在的全部問(wèn)題。比如關(guān)于在行為發(fā)展經(jīng)濟(jì)學(xué)(behavioral development economics)中,隨機(jī)對(duì)照實(shí)驗(yàn)的外部有效性問(wèn)題也是近年來(lái)學(xué)者們關(guān)注的重要議題。b周業(yè)安、孫玙凡:《實(shí)驗(yàn)發(fā)展經(jīng)濟(jì)學(xué):理論、方法和困局》,《中國(guó)人民大學(xué)學(xué)報(bào)》2021 年第2 期。其中一個(gè)比較典型的爭(zhēng)議是,具體的助推措施只適合在小范圍的實(shí)驗(yàn)地區(qū)試用,尤其是在不同的發(fā)展中國(guó)家/地區(qū)運(yùn)用的某些具體激勵(lì)政策未必在廣泛的第三世界地區(qū)都具有促進(jìn)公共健康、改善教育質(zhì)量或減輕貧困的效果。這些助推政策所固有的問(wèn)題,可能需要在目前人工智能技術(shù)的基礎(chǔ)上,結(jié)合發(fā)展中國(guó)家具體地區(qū)不同的經(jīng)濟(jì)狀況、社會(huì)文化習(xí)俗等,謀求更為有效的解決方案。