府際關(guān)系視角下區(qū)域環(huán)境政策執(zhí)行偏差研究
——基于博弈模型的分析

2019-09-16 08:13陳宇閆倩倩王洛忠

北京理工大學(xué)學(xué)報（社會科學(xué)版） 2019年5期

陳宇，閆倩倩，王洛忠

（北京師范大學(xué) 政府管理學(xué)院，北京 100875）

改革開放40年來，中國工業(yè)化和城鎮(zhèn)化快速發(fā)展，然而生態(tài)環(huán)境卻為此付出了巨大代價。從整體上看，中國生態(tài)環(huán)境處于“局部改善、總體惡化、前景堪憂”的尷尬境地。與此同時，公民權(quán)利意識日益覺醒，環(huán)境與環(huán)保問題逐漸進(jìn)入大眾視野并提上政府的政策議程。十八大以來，國務(wù)院相繼出臺《生態(tài)文明體制改革總體方案》《“十三五”生態(tài)環(huán)境保護(hù)規(guī)劃》等政策法規(guī)以加強(qiáng)生態(tài)文明建設(shè)，習(xí)近平總書記指出，“歷史地看，生態(tài)興則文明興，生態(tài)衰則文明衰。生態(tài)文明建設(shè)是全國建成小康社會的突出短板，必須從根本上扭轉(zhuǎn)中國生態(tài)環(huán)境惡化的趨勢”[1]，將生態(tài)文明建設(shè)提升至治國理政的戰(zhàn)略高度。

環(huán)境作為公共物品，溢出效應(yīng)明顯，其治理專業(yè)、復(fù)雜，治理難度和風(fēng)險巨大，以單一行政區(qū)為中心的傳統(tǒng)治理模式效果甚微，日益被強(qiáng)調(diào)咨詢、互動、協(xié)商和網(wǎng)絡(luò)的現(xiàn)代治理模式所替代，區(qū)域合作成為化解治理風(fēng)險的有效途徑[2]。盡管區(qū)域性公共問題涉及政府、企業(yè)、專業(yè)學(xué)者、社會公眾等多元利益主體，但相較于其他治理主體，政府憑借其資源優(yōu)勢和環(huán)境治理責(zé)任仍承擔(dān)著“元治理”的角色[3]。世界各國經(jīng)驗也表明，政府在環(huán)境保護(hù)中發(fā)揮著主導(dǎo)作用，政府間合作機(jī)制是環(huán)境保護(hù)的重要基礎(chǔ)，政府有效地執(zhí)行區(qū)域環(huán)境政策是保障環(huán)境治理效果的基石。在中國科層制管理體制下，區(qū)域環(huán)境政策執(zhí)行不僅涉及到橫向同級政府間的討價還價，還涉及到縱向中央政府與地方政府間的利益博弈，政策執(zhí)行活動在錯綜復(fù)雜的府際關(guān)系中完成，故而府際關(guān)系是影響中國區(qū)域環(huán)境政策執(zhí)行的重要因素。

府際關(guān)系（Intergovernmental Relation，IGR）即政府間關(guān)系，指各級政府間的一種互動機(jī)制，其本質(zhì)是權(quán)力配置和利益分配[4]。府際關(guān)系主要呈現(xiàn)出五種形態(tài)，包括橫向府際關(guān)系、縱向府際關(guān)系[5]、斜向府際關(guān)系[6]、十字型府際關(guān)系[7]和網(wǎng)絡(luò)型府際關(guān)系[8]，此外，楊宏山[9]還開拓了主權(quán)國家府際關(guān)系的新領(lǐng)域。其中，縱向府際關(guān)系和橫向府際關(guān)系是學(xué)者研究的重點。

最早從府際關(guān)系視角研究政策執(zhí)行的是馬爾科姆·戈金，他在總結(jié)第一代和第二代政策執(zhí)行的基礎(chǔ)上，從府際關(guān)系的視角提出了“府際政策執(zhí)行溝通模型”[10]，認(rèn)為中央政府做出決定啟動政策執(zhí)行過程后，這一決定會約束政策執(zhí)行人員的選擇和行為，地方政府對這一約束的回應(yīng)取決于地方政府偏好的性質(zhì)和強(qiáng)度以及地方政府行為的能力。Ripley和Franklin指出[11]，“典型的公共政策執(zhí)行是發(fā)生在一個復(fù)雜府際關(guān)系網(wǎng)絡(luò)上，其中多元參與者經(jīng)常抱持分歧而且沖突的目標(biāo)與期望，因此各層次間的府際關(guān)系運作能否順暢，自然與政策執(zhí)行的效果息息相關(guān)。”施柏莉認(rèn)為，政策是否能夠有效執(zhí)行，關(guān)鍵在于培養(yǎng)正面的府際間運作關(guān)系，她還根據(jù)聯(lián)邦與地方官員彼此互信程度以及上級機(jī)構(gòu)的監(jiān)督介入情形，將府際的運作關(guān)系分為“合作共事型”“合作但維持地方自主型”“逃避式各自為政型”和“爭斗式各自為政型”[12]。

近年來，區(qū)域環(huán)境政策成為新的研究熱點，府際關(guān)系的視角[13-14]、政策網(wǎng)絡(luò)的視角[15-16]、公共選擇理論的視角[17-18]是當(dāng)前研究的三種主要視角。但無論采取哪一研究視角，學(xué)者的基本共識是：“利益”是影響區(qū)域環(huán)境政策的重要因素，不同主體間的利益博弈是影響環(huán)境政策有效執(zhí)行的關(guān)鍵變量。但是，從現(xiàn)有文獻(xiàn)來看，學(xué)者并未將“利益”作為一種獨立要素進(jìn)行分析，也未對不同主體間如何開展利益博弈進(jìn)行深入分析。本文從府際關(guān)系的視角，運用博弈模型分析政府在區(qū)域環(huán)境政策執(zhí)行過程中的利益博弈和行為偏差的產(chǎn)生機(jī)制，以期為化解區(qū)域環(huán)境治理的困境提供新的思路。

一、區(qū)域環(huán)境政策執(zhí)行偏差的實證分析——完全理性的靜態(tài)博弈

（一）橫向府際關(guān)系：薄弱環(huán)節(jié)協(xié)調(diào)博弈模型

公共選擇理論認(rèn)為，政治決策者與市場決策者一樣是追求自身利益最大化的理性“經(jīng)濟(jì)人”，地方政府“經(jīng)濟(jì)人”理性引發(fā)的直接后果就是最大化本地區(qū)的特殊利益。在區(qū)域環(huán)境治理中，環(huán)境作為一種公共物品，具有極強(qiáng)的外部性，一個區(qū)域內(nèi)環(huán)境污染的成本由本區(qū)域內(nèi)的所有地方政府承擔(dān)，治理效果也為本區(qū)域所有地方政府所共享，溢出效應(yīng)明顯，因此在區(qū)域環(huán)境治理中，理性的地方政府之間存在著利益博弈關(guān)系。從環(huán)境治理的現(xiàn)實看，區(qū)域環(huán)境治理的效果并非由某一單個地方政府的政策執(zhí)行所決定，而是取決于政策執(zhí)行的最薄弱環(huán)節(jié)，即區(qū)域環(huán)境治理遵循“木桶法則”。因此從橫向府際關(guān)系來看，如果有一個地方政府的政策執(zhí)行出現(xiàn)偏差，那么這個地方政府的環(huán)境治理效果將決定整個區(qū)域的環(huán)境治理效果。以中國大氣環(huán)境治理為例，鑒于大氣跨域污染的嚴(yán)峻形勢，一些地方政府已經(jīng)開展了區(qū)域協(xié)同治理的相關(guān)實踐，例如，京津冀地區(qū)、長三角地區(qū)、珠三角地區(qū)等。其中，京津冀地區(qū)既是中國大氣污染連片排放和跨域疊加傳輸最為嚴(yán)重的地區(qū)，也是中國較早開展區(qū)域環(huán)境協(xié)同治理的地區(qū)。2013年10月23日，為貫徹執(zhí)行《關(guān)于推進(jìn)大氣污染聯(lián)防聯(lián)控工作改善區(qū)域空氣質(zhì)量的指導(dǎo)意見》《大氣污染防治行動計劃》《京津冀及周邊地區(qū)落實大氣污染防治行動計劃實施細(xì)則》等政策文件中關(guān)于大氣污染協(xié)作機(jī)制的相關(guān)規(guī)定，北京市、天津市、河北省政府在京召開首次工作會議，并成立了京津冀及周邊地區(qū)大氣污染防治協(xié)作小組，協(xié)調(diào)區(qū)域環(huán)境政策執(zhí)行。但從京津冀霧霾治理的效果來看，政策執(zhí)行的整體效果不佳。根據(jù)中國環(huán)境監(jiān)測總站公布的74城市月度空氣質(zhì)量報告顯示，從2013年10月建制到2018年10月，京津冀地區(qū)大氣環(huán)境質(zhì)量雖有所改善，但改善幅度不大，只是在一些重大活動舉辦期間大氣質(zhì)量明顯好轉(zhuǎn)，如2014年的“APEC藍(lán)”和2015年的“閱兵藍(lán)”，而這一現(xiàn)象產(chǎn)生的根源則在于地方政府所采取的一致行動[19]?；诶碚摰姆治龊同F(xiàn)實的觀察，本研究構(gòu)建了一個薄弱環(huán)節(jié)協(xié)調(diào)博弈模型，分析區(qū)域環(huán)境政策執(zhí)行過程中橫向地方政府間的利益博弈過程。

假設(shè)在單個區(qū)域環(huán)境政策執(zhí)行的參與主體中，地方政府?dāng)?shù)量為n個（n≥2），且每個地方政府都是理性的決策主體，同時理性成為每個地方政府的共同知識。每個地方政府的策略集合是{1，2，3，4，5，6，7}，該集合中的每個數(shù)字代表單個地方政府執(zhí)行環(huán)境治理的投入，數(shù)字越大表示投入越多。地方政府越是嚴(yán)格地執(zhí)行環(huán)境政策，本區(qū)域的環(huán)境治理效果越好，執(zhí)行成本也越高。令Si表示地方政府i所選的策略，并假設(shè)與政策執(zhí)行相關(guān)的成本為10×Si。

雖然政策執(zhí)行的成本由地方政府支付，但是環(huán)境治理的效果卻可以為所有的地方政府所共享，假定整個區(qū)域環(huán)境治理的效果由薄弱環(huán)節(jié)決定，即可以由100+20×min{S1，…，Sn}決定，其中min{S1，…，Sn}是指n個數(shù)中的最小值。地方政府i的支付是這一公共利益減去個人成本，即100+20×min{S1，…，Sn}-10×Si。假定Si＞min{S1，…，Sn}，這樣地方政府i沒有選擇最低政策執(zhí)行投入。若地方政府i減少一個單位的投入，即從Si降至Si-1，則整個區(qū)域的環(huán)境治理效果將不會受到影響，因為min{S1，…，Sn}是不變的（地方政府i沒有選擇最低政策執(zhí)行投入）。然而，地方政府的成本減少了10個單位，從10×Si到10×（Si-1），意味著地方政府的支付增加了10個單位。所以，在一個地方政府沒有最低政策執(zhí)行支出時候，總是可以通過減少一個單位的投入來增加它的支付。這樣做可以在不影響區(qū)域既有環(huán)境治理效果的前提下降低自己的成本。從這一原則出發(fā)，可以推斷出一個地方政府不選擇最低政策執(zhí)行投入而選擇最高政策執(zhí)行投入不是一個最佳策略。因而，在一個納什均衡中，所有的地方政府必須采用最低政策執(zhí)行投入。

如果存在納什均衡，則一定是對稱的，因此本文集中討論對稱策略組合。假設(shè)每個地方政府選擇相同的環(huán)境政策執(zhí)行投入，用S′來表示，鑒于所有的地方政府面臨的決策問題相同，故本文只需關(guān)注地方政府1。地方政府 1 所選策略 S′對其他所有地方政府所選策略 S′產(chǎn)生的支付是：100+20×min{S′，…，S′}-10×S′=100+20S′-10×S′=100+10S′，問題是地方政府1是否可以通過采取更嚴(yán)格或更寬松的政策執(zhí)行來獲得更高的收益。假設(shè)地方政府1會選擇更嚴(yán)格的政策執(zhí)行，用S″來表示，且S″＞S′。那么所有地方政府的最低政策執(zhí)行投入仍是 S′，地方政府 1 的支付是：100+20×min{S″，S′…，S′}-10×S″=100+20S′-10S″=100+10S′-10（S″-S′），這一結(jié)果就必定低于100+10S′，這就印證了在區(qū)域環(huán)境政策執(zhí)行的過程中，一個地方政府不會想比其他地方政府投入更多，因為這么做不僅不會提高區(qū)域環(huán)境治理的效果，反而會增加自己的成本。假設(shè)地方政府1選擇較為寬松的政策執(zhí)行，用S0表示且S0＜S′，區(qū)域環(huán)境治理的效果從S′降至S0，那么地方政府1的支付是：100+20×min{S0，S′，…，S′}-10×S0=100+20S0-10S0=100+10S0，這一支付小于 100+10S′，即地方政府選擇策略S′，因而地方政府沒有讓自己的政策執(zhí)行投入低于其他地方政府的動機(jī)。

因此，可以推斷所有的地方政府選擇策略S′是一個納什均衡。一個地方政府采用比策略S′更嚴(yán)格的政策執(zhí)行措施只能增加成本而不會提高區(qū)域環(huán)境治理的效果，而采取比策略S′更寬松的政策執(zhí)行將使得實際的區(qū)域環(huán)境治理的效果低于S′，抵消掉節(jié)省下來的投入。因此S′是一個地方政府策略組合中的一個策略，共有7個納什均衡，對應(yīng)7個可選策略中的每個策略。

這一納什均衡的結(jié)果表明，所有的地方政府要么都采取嚴(yán)格的環(huán)境政策執(zhí)行，要么都采用寬松的環(huán)境政策執(zhí)行，這也就意味著在區(qū)域環(huán)境政策執(zhí)行的過程中存在著地方政府間的“共謀行為”?！肮仓\行為”原是經(jīng)濟(jì)學(xué)概念，意指幾家大公司協(xié)商定價、瓜分市場的壟斷經(jīng)濟(jì)行為，周雪光[20]將這種描述平行組織間的關(guān)系引入到政府部門，分析科層組織內(nèi)部上下級之間的互動關(guān)系。他認(rèn)為“共謀行為”是一個中性概念，是基層政府執(zhí)行政策時所表現(xiàn)的靈活性和適應(yīng)性，是制度創(chuàng)新的一個重要源泉。然而地方政府一旦出現(xiàn)負(fù)面的共謀行為，即在執(zhí)行來自中央政府的指令時地方上下級政府共同謀劃，采取共同行動，變相執(zhí)行政策要求，就會導(dǎo)致政策在實際執(zhí)行過程中偏離原來的政策初衷，出現(xiàn)政策執(zhí)行偏差。薄弱環(huán)節(jié)協(xié)調(diào)博弈模型表明，在區(qū)域環(huán)境政策執(zhí)行的過程中，橫向地方政府間出于自身利益考量，采用與其他政府相同的策略是其最優(yōu)選擇，也就是地方政府間存在類似于市場主體的“共同定價”行為。因而，從橫向府際關(guān)系看，地方政府間在區(qū)域環(huán)境政策執(zhí)行過程中存在“共謀行為”，負(fù)面“共謀行為”的產(chǎn)生會影響區(qū)域環(huán)境治理的效果，產(chǎn)生政策執(zhí)行偏差。經(jīng)濟(jì)學(xué)認(rèn)為，激勵和管制是打破“共謀行為”的有效手段和機(jī)制，這就需要中央政府創(chuàng)新激勵機(jī)制、約束機(jī)制、責(zé)任機(jī)制和協(xié)調(diào)機(jī)制，打破地方政府間的負(fù)面“共謀行為”，確保政策執(zhí)行的效果。因此，縱向府際關(guān)系就成為分析區(qū)域環(huán)境政策執(zhí)行偏差的另一維度。

（二）縱向府際關(guān)系：行政發(fā)包制博弈模型

研究中國公共政策執(zhí)行需要考慮中國政府縱向府際關(guān)系的運行邏輯，在現(xiàn)行中央集權(quán)—地方分權(quán)的體制下，“行政發(fā)包制”[21-22]是一種典型的政策執(zhí)行機(jī)制，即中央政府作為“發(fā)包方”制定總體目標(biāo)和計劃，然后逐級發(fā)包給“承包方”各級地方政府，其基本特征為：（1）中央擁有絕對權(quán)威，地方擁有一定的自由裁量權(quán)和自主性；（2）中央在事權(quán)發(fā)包的同時并未給予相應(yīng)的財權(quán)，常常是“中央請客，地方買單”；（3）監(jiān)管方式多采用突擊檢查和專項整治。這種執(zhí)行機(jī)制最為理想的狀態(tài)是地方政府能夠不折不扣地執(zhí)行中央政府所設(shè)定的各項任務(wù)目標(biāo)，然而實際政策執(zhí)行的效果取決于中央與地方的博弈。區(qū)域環(huán)境政策執(zhí)行是典型的“行政發(fā)包制”模式，中央政府制定環(huán)境治理的目標(biāo)，而后層層發(fā)包給地方政府。例如，在節(jié)能減排政策執(zhí)行過程中，中央政府首先制定了節(jié)能減排的五年計劃，而后將量化的節(jié)能減排目標(biāo)以及整體的規(guī)劃和方案通過行政發(fā)包的方式發(fā)給各省、直轄市、自治區(qū)地方政府，地方政府將政策打包后轉(zhuǎn)發(fā)給下轄的次級地方政府。次級地方政府將節(jié)能減排工作列入黨委及政府的重要議題進(jìn)行研究部署，與相關(guān)負(fù)責(zé)人、鄉(xiāng)鎮(zhèn)街道負(fù)責(zé)人、重點企事業(yè)單位負(fù)責(zé)人簽訂目標(biāo)責(zé)任書，明確各項目目標(biāo)及獎懲，下一級鄉(xiāng)（鎮(zhèn)）、街道則會與轄區(qū)內(nèi)的重點企業(yè)簽訂目標(biāo)責(zé)任書，將壓力傳遞給各責(zé)任主體，最終形成條塊結(jié)合和縱橫交錯的節(jié)能減排目標(biāo)行政發(fā)包體系?；诖?，本研究構(gòu)建了行政發(fā)包制博弈模型，分析縱向中央政府與地方政府之間的利益博弈過程。

縱向府際關(guān)系中，區(qū)域環(huán)境治理的執(zhí)行主體是中央政府和多個地方政府，由于在區(qū)域環(huán)境政策執(zhí)行過程中，各地方政府所面臨的情況大致相同，因此可將參與人簡化為中央政府和地方政府。在中央政府環(huán)境治理目標(biāo)既定的情況下，中央政府可以選擇對地方政府的環(huán)境政策執(zhí)行情況進(jìn)行監(jiān)管，也可以選擇不監(jiān)管，其策略集合是Sc={監(jiān)管，不監(jiān)管}；地方政府可以選擇執(zhí)行中央政府的環(huán)境政策，也可以選擇不執(zhí)行，其策略集合是Sl={執(zhí)行，不執(zhí)行}。假設(shè)地方政府執(zhí)行環(huán)境政策的投入為c1（c1＞0），地方政府執(zhí)行環(huán)境政策的收益為 r1，不執(zhí)行環(huán)境政策的收益為r2，雖然地方政府嚴(yán)格執(zhí)行環(huán)境政策能夠提高環(huán)境治理的效果，但同時會造成當(dāng)?shù)仄髽I(yè)的成本升高、利潤下降，導(dǎo)致地方政府財政收入減少，因此r1＜r2。假設(shè)中央政府的正常收益為r3，監(jiān)管地方政府的成本為c2，且c2＞0。同時如果中央政府不對地方政府的環(huán)境政策執(zhí)行進(jìn)行監(jiān)管，將造成整個社會環(huán)境的損失，損害社會公共利益，本文用中央政府來代表社會公共利益，用i來表示。根據(jù)以上假設(shè)，中央政府和地方政府的支付矩陣如表1所示。

表1 中央政府與地方政府的支付矩陣

由于理性是中央政府和地方政府的共同知識，這也就意味著，地方政府完全了解中央政府的政策偏好，中央政府也完全了解地方政府的政策偏好。分析其純策略的納什均衡：（1）如果納什均衡是策略組合{執(zhí)行，監(jiān)管}，即地方政府選擇執(zhí)行環(huán)境政策，中央政府對其進(jìn)行監(jiān)管，根據(jù)納什均衡的定義，則需滿足條件r1-c1≥r2且 r3-c2≥r3。將兩個不等式整理可得 c1≤r1-r2≤0（r1＜r2）且 c2≤0，這也就意味著，只有地方政府的執(zhí)行成本和中央政府的監(jiān)管成本同時為0時，策略組合{執(zhí)行，監(jiān)管}才會成為地方政府和中央政府的最優(yōu)選擇，然而事實是執(zhí)行環(huán)境政策并對其進(jìn)行監(jiān)管都需要付出成本，因此地方政府和中央都沒有動力采取這一策略組合。（2）如果納什均衡是策略組合{執(zhí)行，不監(jiān)管}，即地方政府選擇執(zhí)行環(huán)境政策，中央政府不對其進(jìn)行監(jiān)管，根據(jù)納什均衡的定義，則需滿足條件r1-c≥r21且r3≥r3-c2，將其進(jìn)行整理可得c1≤r1-r2≤0且c2≥0，同樣意味著地方政府的環(huán)境政策執(zhí)行成本和中央政府的監(jiān)督成本為0時，這一策略組合才能成為地方政府和中央政府的最優(yōu)選擇。（3）如果納什均衡是策略組合{不執(zhí)行，監(jiān)管}，即地方政府選擇不執(zhí)行環(huán)境政策，中央政府對其進(jìn)行監(jiān)管，根據(jù)納什均衡的定義，則需滿足條件r2≥r1-c1且r3-c2-i≥r3-i，將其進(jìn)行整理可得，c1≥r1-r2且c2≤0，這一策略組合也不可能成為現(xiàn)實中的納什均衡。（4）如果納什均衡是策略組合{不執(zhí)行，不監(jiān)管}，即地方政府選擇不執(zhí)行環(huán)境政策，中央政府對其進(jìn)行監(jiān)管，根據(jù)納什均衡的定義，則需滿足條件r2≥r1-c1且r3-i≥r3-c2-i，將不等式進(jìn)行整理可得c1≥r1-r2且c2≥0，此不等式恒成立，因此策略組合{不執(zhí)行，不監(jiān)管}是地方政府和中央政府的最優(yōu)選擇。

這一納什均衡的結(jié)果表明，在區(qū)域環(huán)境治理過程中，行政發(fā)包制的政策執(zhí)行機(jī)制顯得捉襟見肘。在中國現(xiàn)代化治理過程中，行政發(fā)包制曾為推動公共政策的執(zhí)行發(fā)揮了重要作用，它與以經(jīng)濟(jì)增長為中心的政治競標(biāo)賽相互配合，極大地激發(fā)了中央政府和地方政府的執(zhí)行動力，推動了公共政策的有效執(zhí)行。然而，正如行政發(fā)包制博弈模型所分析，在執(zhí)行區(qū)域環(huán)境政策時，行政發(fā)包制的積極作用受到了抑制并出現(xiàn)了中央政府和地方政府各自理性導(dǎo)致的集體非理性的“囚徒困境”，致使政策執(zhí)行出現(xiàn)了偏差。究其原因：一方面是作為發(fā)包方的中央政府將執(zhí)行環(huán)境政策的成本發(fā)包給了地方政府，加大地方政府的政策執(zhí)行成本，與此同時考核方式仍采用經(jīng)濟(jì)增長為中心的“硬指標(biāo)”GDP，制度設(shè)計上地方政府的自由裁量權(quán)和自主性給予了“理性經(jīng)濟(jì)人”的地方政府將地方的特殊利益置于公共利益之上而選擇不執(zhí)行環(huán)境政策的空間。另一方面，對環(huán)境政策執(zhí)行進(jìn)行監(jiān)管通常需要嚴(yán)格的規(guī)則、長期持續(xù)的監(jiān)管，行政發(fā)包制典型的監(jiān)管模式是突擊檢查和專項整治，這種簡單的資源動員和短期聚焦對環(huán)境治理難以有實質(zhì)性的監(jiān)管效果，理性的中央政府，當(dāng)公眾壓力較小時，選擇不監(jiān)管是其最優(yōu)的策略選擇。

二、區(qū)域環(huán)境政策執(zhí)行偏差的實證分析——有限理性的演化博弈

完全理性的靜態(tài)博弈分析，雖然有助于理解中央政府和地方政府在區(qū)域環(huán)境政策執(zhí)行過程中的偏差行為，但對現(xiàn)實的解釋仍然有限。事實上，中央政府和地方政府并非完全理性的博弈主體，加之信息的不對稱，博弈主體的策略選擇往往表現(xiàn)為具有試探性的學(xué)習(xí)過程，需經(jīng)過多次博弈才能尋找到均衡狀態(tài)。因此，區(qū)域環(huán)境政策執(zhí)行本質(zhì)上是一個多階段討價還價的過程，政策制定本身和地方政府的執(zhí)行策略都是一個動態(tài)性均衡[23]。演化博弈是對有限理性主體博弈過程更為現(xiàn)實的描述，因此本文構(gòu)建了中央政府和地方政府的演化博弈模型。

在歷時多階段博弈過程中，中央政府和地方政府并非是只考慮政策執(zhí)行成本和收益的短視行為主體，作為公共利益的代表者，他們會考慮行政作為和不作為所帶來的聲譽損益，同時中央政府也會根據(jù)地方政府的政策執(zhí)行情況作出獎懲安排。因此，有必要對行政發(fā)包制博弈模型設(shè)定進(jìn)行調(diào)整，參與人依然是中央政府和地方政府，其策略選擇不變，假設(shè)地方政府執(zhí)行環(huán)境政策的投入為c1，中央政府對其獎勵為f1，地方政府不執(zhí)行環(huán)境政策中央政府對其進(jìn)行懲罰為f2，聲譽受損為h2。地方政府執(zhí)行環(huán)境政策的收益為r1，不執(zhí)行環(huán)境政策的收益為r2。假設(shè)中央政府的正常收益為r3，監(jiān)管地方政府的成本為c2，不監(jiān)管地方政府的負(fù)面政治影響為h1（如公眾的關(guān)注、社會輿論的壓力、國際社會的壓力等）。同時如果中央政府不對地方政府的環(huán)境政策執(zhí)行進(jìn)行監(jiān)管，將造成整個社會環(huán)境的損失，用i來表示。地方政府執(zhí)行執(zhí)行環(huán)境政策的概率為p，則不執(zhí)行環(huán)境政策的概率為1-p，中央政府對地方政府政策執(zhí)行進(jìn)行監(jiān)管的概率為q，則不進(jìn)行監(jiān)管的概率為1-q。根據(jù)以上假設(shè)中央政府和地方政府的支付矩陣，具體如表2所示。

表2 中央政府與地方政府的演化博弈支付矩陣

根據(jù)表2可得，地方政府執(zhí)行環(huán)境政策的適應(yīng)度函數(shù)u1為

地方政府不執(zhí)行環(huán)境政策的適應(yīng)度函數(shù)u2為

地方政府的平均適應(yīng)度函數(shù)為

中央政府對地方政府環(huán)境政策執(zhí)行進(jìn)行監(jiān)管的適應(yīng)度函數(shù)e1為

中央政府對地方政府不進(jìn)行監(jiān)管的適應(yīng)度函數(shù)e2為

中央政府的平均適應(yīng)度函數(shù)為

演化穩(wěn)定策略（ESS）和復(fù)制者動態(tài)是演化博弈的兩個核心概念，其中演化穩(wěn)定策略的基本思想是：突變?nèi)后w如果在混合群體中博弈所得支付大于原群體中個體支付，突變?nèi)后w就有能力入侵原群體，反之，突變?nèi)后w則不能入侵原群體，在演化過程中逐漸消失，演化穩(wěn)定策略就表示一個群體能夠抵抗突變?nèi)后w而保持穩(wěn)定。若策略p是ESS則必須滿足下列兩個條件之一：其一，F(xiàn)（p，p）＞F（p，q），p≠q，此時策略p為強(qiáng)演化穩(wěn)定策略；其二，F(xiàn)（p，p）=F（p，q），p≠q 且 F（p，q）＞F（q，q），此時策略 p 為弱演化穩(wěn)定策略（q 為群體中突變?nèi)后w的策略）。根據(jù)演化穩(wěn)定策略的定義和特征，嚴(yán)格納什均衡一定是演化穩(wěn)定策略。

演化博弈的演化過程主要依賴于選擇機(jī)制，復(fù)制者動態(tài)是一種典型的基于選擇機(jī)制的確定性和非線性的演化博弈模型，在此模型的基礎(chǔ)上加入了策略的隨機(jī)變動行為，構(gòu)成了一個包括選擇機(jī)制和變異機(jī)制的綜合演化博弈模型，通常稱為復(fù)制者——變異者模型[25]，其基本思想是群體中采用某項策略的適應(yīng)度如果大于群體的平均適應(yīng)度，則采用該策略的個體在群體所占比例將會擴(kuò)大；反之，采用該策略的個體在群體所占比例將會縮小，通俗的講就是“優(yōu)勝劣汰”。在區(qū)域環(huán)境政策執(zhí)行這一博弈模型中，中央政府和地方政府兩個參與群體共同演化，根據(jù)式（1）～式（6），若p代表t時間采用環(huán)境政策執(zhí)行的地方政府比例，p代表采用監(jiān)管的中央政府的比例（現(xiàn)實中可理解為中央政府在t時間采取監(jiān)管策略的概率），依據(jù)復(fù)制者動態(tài)的定義，可得地方政府的復(fù)制者動態(tài)方程為

中央政府的復(fù)制者動態(tài)方程為

將5個均衡點帶入，可得各均衡點的行列式和跡，如表3所示。

表3 各均衡點的行列式和跡

根據(jù)表3的結(jié)果和判定ESS的方法，（p*，q*）一定不是 ESS，因而只需討論其他4個均衡點的情況，具體如下：

情景 1.當(dāng) 0＜c1＜r1-r2+h2，0＜c2＜h1-f1時，復(fù)制者動態(tài)共有4個均衡點，其中（0，0）是不穩(wěn)定點，（1，0）和（0，1）是鞍點，（1，1）是 ESS。即地方政府選擇執(zhí)行環(huán)境政策，中央政府選擇監(jiān)管。該ESS產(chǎn)生的原因是，地方政府執(zhí)行環(huán)境政策的成本很低，基本不會給當(dāng)?shù)刎斦韷毫?，地方政府還會因為區(qū)域環(huán)境的改善而受到中央政府的獎勵，同時贏得良好的社會贊譽；對于中央政府而言，監(jiān)管的成本很低，監(jiān)管還能帶來良好的政治影響。并且，即便是地方政府執(zhí)行環(huán)境政策的成本和中央政府監(jiān)管的成本都有所上升，但仍小于選擇不執(zhí)行和不監(jiān)管的機(jī)會收益，因此{(lán)執(zhí)行，監(jiān)管}對于兩級政府而言都是最優(yōu)的選擇。其演化相位圖如圖1a所示。

情景 2.當(dāng) r1-r2+h2＜c1＜r1+f1-r2+h2+f2，0＜c2＜h1-f1時，復(fù)制者動態(tài)共有 5 個均衡點，（1，0）是不穩(wěn)定點，（0，0）和（0，1）是鞍點，（1，1）是ESS。這種情況下，地方政府選擇執(zhí)行環(huán)境的政策成本雖然很高，但仍小于不執(zhí)行的機(jī)會收益，此時中央政府監(jiān)管成本仍然較小，選擇監(jiān)管不僅能進(jìn)一步強(qiáng)化地方的政策執(zhí)行，還能帶來良好的政治影響，因此選擇監(jiān)管成為其最優(yōu)策略。其演化相位圖如圖1a所示。

情景 3.當(dāng) r1+f1-r2+h2+f2＜c1，0＜c2＜h1-f1時，復(fù)制者動態(tài)有 5 個均衡點，其中（0，1）是 ESS。也就是地方政府會選擇不執(zhí)行環(huán)境政策，而中央政府會選擇監(jiān)管。地方政府執(zhí)行環(huán)境政策成本很高，不僅超過了中央政府的處罰和本地的聲譽損失，同時也超過了執(zhí)行環(huán)境政策所獲得的中央政府獎勵和社會公眾正面評價的機(jī)會收益，而中央政府更看重監(jiān)管所帶來的良好的政治影響，而此時監(jiān)管的成本較低，中央政府必定會對地方政府進(jìn)行監(jiān)管，因此{(lán)不執(zhí)行，監(jiān)管}是ESS。其演化相位圖如圖1b所示。

情景 4.當(dāng) r1+f1-r2+h2+f2＜c1，h1-f1＜c2＜h1+f2時，復(fù)制者動態(tài)共有 5 個均衡點，其中（0，1）是 ESS，此時地方政府選擇不執(zhí)行環(huán)境政策的動機(jī)與情景3相同，而中央的監(jiān)管成本雖然上升，但由于中央政府面臨公眾和社會輿論壓力，必須對地方政府的行為進(jìn)行必要的約束，因而選擇監(jiān)管。其演化相位圖如圖1b所示。

情景 5.當(dāng) 0＜c1＜r1-r2+h2，h1-f1＜c2＜h1+f2時，復(fù)制者動態(tài)共有 5 個均衡點，其中（1，0）是 ESS，也就是地方政府傾向于執(zhí)行環(huán)境政策，中央政府傾向于不監(jiān)管。地方政府執(zhí)行環(huán)境政策的成本很低，同時能夠贏得良好的社會聲譽，因此策執(zhí)行的自覺性很高，留給中央政府的監(jiān)管空間不大。中央政府是否監(jiān)管則取決于其監(jiān)管的成本，而此時中央政府監(jiān)管成本上升，因此選擇不監(jiān)管。其演化相位圖如圖1c所示。

圖1 地方政府和中央政府的演化相位圖

情景 6.當(dāng) 0＜c1＜r1-r2+h2，h1+f2＜c2時，復(fù)制者動態(tài)共有 4 個均衡點，其中（1，0）是穩(wěn)定點。該 ESS 產(chǎn)生的原因是，地方政府執(zhí)行環(huán)境政策的成本很低，基本不會給當(dāng)?shù)刎斦韷毫?，地方政府還會因為區(qū)域環(huán)境的改善而受到中央政府的獎勵，同時贏得良好的社會贊譽，因此執(zhí)行的自覺性較高。中央政府監(jiān)管的成本很高，已經(jīng)超過了監(jiān)管所帶來的機(jī)會收益，而選擇放棄監(jiān)管。其演化相位圖如圖1c所示。

情景 7.當(dāng) r1-r2+h2＜c1＜r1+f1-r2+h2+f2，h1+f2＜c2時，復(fù)制者動態(tài)共有 5 個均衡點，其中（0，0）是 ESS。在這種情景下，中央政府因為監(jiān)管成本過高，超過了監(jiān)管所帶來的機(jī)會收益，而選擇放棄監(jiān)管。而地方政府由于不論是否執(zhí)行環(huán)境政策都不會受到中央的獎懲約束，此外，地方政府執(zhí)行環(huán)境政的成本處于中等水平，故可以選擇不執(zhí)行降低成本而增加收益。其演化相位圖如圖1d所示。

情景 8.當(dāng) r1+f1-r2+h2+f2＜c1，h1+f2＜c2時，復(fù)制者動態(tài)共有五個均衡點，其中（0，0）是 ESS。即地方政府不執(zhí)行環(huán)境政策，中央政府不監(jiān)管，原因是執(zhí)行環(huán)境政策成本和監(jiān)管的成本都很高，因此不執(zhí)行和不監(jiān)管是地方政府和中央政府的最優(yōu)策略選擇。其演化相位圖如圖1d所示。

通過以上對演化穩(wěn)定策略和復(fù)制者動態(tài)方程的分析可以發(fā)現(xiàn)，5個均衡點中有4個可能會成為演化穩(wěn)定策略，究竟哪一個會成為現(xiàn)實的ESS則取決于初始狀態(tài)與政策執(zhí)行過程中各要素的實際取值。對于地方政府而言，政策執(zhí)行的成本收益、中央政府的獎懲機(jī)制與社會輿論的壓力是影響其是否會產(chǎn)生偏差行為的重要因素。從演化博弈模型可以看出，只有當(dāng)執(zhí)行環(huán)境政策的成本較低時，地方政府才有動力自覺的進(jìn)行環(huán)境治理，當(dāng)政策執(zhí)行成本較高時，其執(zhí)行環(huán)境政策的動力不足，中央政府的監(jiān)管舉措成為約束地方偏差行為的必要條件。對于中央政府而言，是否選擇監(jiān)管不僅受監(jiān)管成本的影響，更受社會公眾輿論與國際壓力的影響。從目前現(xiàn)實的情況來看，在區(qū)域環(huán)境政策執(zhí)行過程中，地方政府執(zhí)行成本很高，不僅超過了中央政府的處罰，同時也超過了執(zhí)行環(huán)境政策所獲得中央政府獎勵的機(jī)會收益，因此選擇不執(zhí)行是地方政府的最優(yōu)選擇，由此產(chǎn)生了政策執(zhí)行偏差，其狀況與情景3、情景 4類似。

三、結(jié)論和建議

環(huán)境問題事關(guān)人類的未來和長遠(yuǎn)發(fā)展，區(qū)域環(huán)境政策執(zhí)行對改善環(huán)境質(zhì)量和有序推進(jìn)生態(tài)文明建設(shè)意義重大。本文從府際關(guān)系視角，通過構(gòu)建靜態(tài)博弈、動態(tài)博弈模型，深入探討區(qū)域環(huán)境政策執(zhí)行過程中府際之間的利益博弈及執(zhí)行偏差的產(chǎn)生機(jī)制，得出以下結(jié)論：

1.從橫向府際關(guān)系看，在區(qū)域環(huán)境政策執(zhí)行的過程中，地方政府之間存在“共謀行為”，負(fù)面的“共謀行為”會導(dǎo)致政策執(zhí)行出現(xiàn)偏差。傳統(tǒng)觀點認(rèn)為“共謀行為”只存在于科層制內(nèi)部上下級之間，它們?yōu)楣餐睦娌扇∫恢滦缘男袆?，但由于環(huán)境作為一種屬性特殊的公共物品，其外溢效應(yīng)明顯，政策執(zhí)行的實際效果取決于最薄弱的環(huán)節(jié)，“理性人”的地方政府出于自身利益的考量，使得橫向平行關(guān)系的地方政府之間也存在“共謀行為”，負(fù)面共謀行為將會導(dǎo)致環(huán)境政策執(zhí)行偏離政策本來的初衷，導(dǎo)致政策執(zhí)行偏差。

2.從縱向府際關(guān)系看，在區(qū)域環(huán)境政策執(zhí)行的過程中，行政發(fā)包制的政策執(zhí)行機(jī)制，在以經(jīng)濟(jì)增長為中心的政治錦標(biāo)賽背景下，會造成政策執(zhí)行的“囚徒困境”。改革開放四十年的現(xiàn)代化進(jìn)程中，行政發(fā)包制曾與政治錦標(biāo)賽相互配合、相互補(bǔ)充，極大的釋放了中央政府和地方政府政策執(zhí)行的積極性，保障了政策執(zhí)行的效果。然而，在區(qū)域環(huán)境政策執(zhí)行過程中，行政發(fā)包制的政策執(zhí)行機(jī)制和政治錦標(biāo)賽的積極作用雙雙被抑制。究其原因則是在區(qū)域環(huán)境政策執(zhí)行領(lǐng)域，行政發(fā)包制與政治錦標(biāo)賽從互補(bǔ)關(guān)系變成了互斥關(guān)系。

3.從時間維度上看，中央政府的監(jiān)管舉措是約束地方政府政策執(zhí)行偏差的必要條件。政策執(zhí)行的成本、中央政府的獎懲機(jī)制和社會輿論的壓力是影響地方政府執(zhí)行環(huán)境政策與否的關(guān)鍵變量，監(jiān)管成本和社會公眾利益是中央政府是否履行監(jiān)管義務(wù)的重要因素。從現(xiàn)實情況看，對于地方政府而言，環(huán)境政策執(zhí)行成本較高，加之中國市民社會羸弱，并未對地方政府形成有效約束，就短期發(fā)展而言選擇不執(zhí)行環(huán)境政策是其最優(yōu)選擇。從時間維度來看，環(huán)境質(zhì)量的惡化與公眾利益矛盾的激化，將倒逼中央政府加強(qiáng)對地方政府的監(jiān)管，因此中央政府的監(jiān)管就成為約束地方政府偏差行為的必要條件。

綜上所述，環(huán)境問題的外溢效應(yīng)，使得區(qū)域內(nèi)府際合作治理成為生態(tài)保護(hù)的必然選擇，其實際的治理效果取決于府際關(guān)系主體之間的博弈。位于橫向府際關(guān)系網(wǎng)絡(luò)中的地方政府間，基于利益驅(qū)動所產(chǎn)生的“共謀行為”在使得環(huán)境保護(hù)政策得已落實的同時，也帶來了政策執(zhí)行偏差的巨大風(fēng)險。與此同時中央政府采取的行政發(fā)包制的政策執(zhí)行機(jī)制進(jìn)一步增加地方政府間采取負(fù)面 “共謀行為”的風(fēng)險，最終導(dǎo)致區(qū)域環(huán)境政策執(zhí)行產(chǎn)生偏差。但也應(yīng)看到，中央政府的監(jiān)管行為依然是重要的糾偏機(jī)制，如圖2所示。

圖2 府際關(guān)系視角下區(qū)域環(huán)境政策執(zhí)行偏差機(jī)制圖

據(jù)此，為有效約束地方政府的偏差行為，保障環(huán)境治理的效果，提出以下政策建議：

一是地方政府間應(yīng)增強(qiáng)互信與信息共享。在區(qū)域環(huán)境政策執(zhí)行過程中，地方政府不僅是本行政區(qū)環(huán)境治理的責(zé)任主體，還承擔(dān)著區(qū)域環(huán)境合作治理的責(zé)任。作為合作中的行動者必須依賴其他主體才能實現(xiàn)自己的目標(biāo)。因此，各地方政府必須打破自家“一畝三分地”的思維定式，堅持區(qū)域利益優(yōu)于地方利益、環(huán)境利益優(yōu)于經(jīng)濟(jì)利益的原則，防止地方政府間負(fù)面“共謀行為”的發(fā)生。信任資源和信息資源是合作者之間的核心資源，信任既是合作的前提，也是影響合作效果的重要變量，而順暢的信息溝通可以促進(jìn)地方政府之間相互了解，增進(jìn)互信，提升效率。更為重要的是在信任尚未建立之前，有效的信息共享和溝通可以避免追求自身利益最大的化的地方政府因違背承諾而陷入集體行動的困境。具體而言，一是考慮設(shè)置專門的常態(tài)區(qū)域環(huán)境協(xié)調(diào)治理機(jī)構(gòu)，幫助解決區(qū)域內(nèi)地方政府間因聯(lián)防聯(lián)控產(chǎn)生的糾紛，推動建立良好的府際信任關(guān)系，防范負(fù)面負(fù)面共謀行為的出現(xiàn)；二是落實構(gòu)建區(qū)域環(huán)境信息共享平臺，明確信息發(fā)布要求、標(biāo)準(zhǔn)、時效和程序的規(guī)范性。

二是中央政府必須創(chuàng)新政策執(zhí)行機(jī)制、政績考核機(jī)制、激勵機(jī)制、問責(zé)機(jī)制和協(xié)調(diào)機(jī)制。通過博弈模型分析發(fā)現(xiàn)，地方政府在區(qū)域環(huán)境政策執(zhí)行過程中動力不足，中央政府的監(jiān)管舉措是防止地方政府偏差行為的必要條件，而行政發(fā)包制的政策執(zhí)行機(jī)制與政治錦標(biāo)賽的考核方式的積極作用在環(huán)境治理過程中被抑制。因此，中央政府必須要創(chuàng)新政策執(zhí)行機(jī)制，選擇合理恰當(dāng)?shù)恼邎?zhí)行工具，轉(zhuǎn)變以GDP增長為中心的政績考核方式，完善獎懲機(jī)制，扮演好利益協(xié)調(diào)者的角色。堅持“共同有區(qū)別”的原則設(shè)計政策方案：一方面明確各級政府的責(zé)任，合理有效銜接中央政府與地方政府間、區(qū)域政策與地方政策間不同的環(huán)境目標(biāo)和措施；二是建立健全利益補(bǔ)償機(jī)制和問責(zé)機(jī)制，激發(fā)各級政府執(zhí)行環(huán)境政策的內(nèi)生動力。

三是建立健全社會監(jiān)督體系。環(huán)境與公眾的生活息息相關(guān)，公民權(quán)利意識的覺醒，對環(huán)境質(zhì)量的要求日益提高，建立社會監(jiān)督體系能夠有效對政府的偏差行為形成約束。通過演化博弈模型發(fā)現(xiàn)，初始狀態(tài)是影響演化穩(wěn)定策略的重要因素，而社會和公眾的輿論壓力是一種重要初始狀態(tài)資源，在其基礎(chǔ)上建立社會監(jiān)督體系，能夠倒逼政府有效推進(jìn)區(qū)域環(huán)境治理。為此，一方面要加強(qiáng)完善環(huán)境信息公開制度，保證公眾的知情權(quán)；另一方面要充分發(fā)揮網(wǎng)絡(luò)監(jiān)督和環(huán)保NGO的監(jiān)管作用。

四是需要推進(jìn)區(qū)域環(huán)境治理的技術(shù)創(chuàng)新。數(shù)字治理時代，信息技術(shù)創(chuàng)新是社會發(fā)展的主要推動力[26]。在區(qū)域環(huán)境治理過程中，技術(shù)創(chuàng)新尤為重要，一方面環(huán)境作為一種脆弱的公共物品，其保護(hù)專業(yè)技術(shù)要求高，受損后恢復(fù)難度大，推動環(huán)境治理的技術(shù)創(chuàng)新，能夠提高環(huán)境保護(hù)和治理的效果；另一方面，技術(shù)創(chuàng)新能夠有效降低地方政府執(zhí)行環(huán)境政策的成本、中央政府的監(jiān)管成本，增強(qiáng)地方政府和中央政府政策執(zhí)行的積極性，防止政策執(zhí)行偏差行為的發(fā)生。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

府際關(guān)系視角下區(qū)域環(huán)境政策執(zhí)行偏差研究——基于博弈模型的分析