付 湘,談廣鳴,黃 莎,劉雙郡
(1.武漢大學 水資源與水電工程科學國家重點實驗室,湖北 武漢 430072;2.武漢大學 海綿城市建設水系統(tǒng)科學湖北省重點實驗室,湖北 武漢 430074)
社會經(jīng)濟用水后的污染排放量對水生態(tài)環(huán)境施加壓力負荷,帶來水資源短缺、水環(huán)境污染、水生態(tài)破壞等諸多問題,而水生態(tài)環(huán)境的破壞反過來制約著水資源利用[1]?!吨泄仓醒腙P于制定國民經(jīng)濟和社會發(fā)展第十四個五年規(guī)劃和二〇三五年遠景目標的建議》指出:綠水青山就是金山銀山,堅持尊重自然、保護優(yōu)先,主要污染物排放總量持續(xù)減少,完善環(huán)境保護約束性指標管理。”這明確了生態(tài)環(huán)境具有重要的經(jīng)濟價值,良好的生態(tài)環(huán)境是經(jīng)濟可持續(xù)發(fā)展的基礎,過度開發(fā)利用水資源、破壞水生態(tài)環(huán)境必然會影響社會經(jīng)濟發(fā)展質量。
水資源開發(fā)利用與水環(huán)境保護等多目標之間相互矛盾、相互競爭的情況下,利益相關主體進行的決策,常使用多目標決策方法[2-4],該方法以系統(tǒng)科學為理論基礎,運用最優(yōu)化理論求解水資源安全的社會、經(jīng)濟與環(huán)境目標,這是一種自上而下的理想方法。該方法假定存在權威的決策者,不存在滿足各個目標的同時最優(yōu)解,而是非劣解集,不是唯一的解而是一組解。在非劣解處,改善一個目標函數(shù)的效益,必以犧牲其他目標函數(shù)的利益為代價,在解決實際問題中,被選中的解只是非劣解集中權威決策者的偏好解[5-6]。由于多目標優(yōu)化決策方法強調最優(yōu)化整體利益而忽視個體利益,引發(fā)個體利益與整體利益沖突[7],出現(xiàn)整體效率與個體公平困境,使水資源利用安全面臨挑戰(zhàn)。
博弈論方法突破了傳統(tǒng)多目標優(yōu)化決策的效率和公平困境,能更好地模擬多個主體相互作用的利益沖突問題[8]。博弈根據(jù)是否可以達成具有約束力的協(xié)議分為合作博弈和非合作博弈,合作博弈著重研究集體行為特點,關心合作得到的收益并能夠分配各方的收益[9];非合作博弈側重個體行為特征研究,各博弈方通過理性競爭方式實現(xiàn)各自目標效益最大化[10]。在有約束力的合作協(xié)議難以達成的情況下,非合作博弈方法將成為博弈研究的重要方向[11-12]。
非合作博弈中的討價還價方法是指博弈參與者通過協(xié)商方式解決利益分配的問題,討價還價的納什均衡解為博弈參與者在給定約束條件下,最大化自身的效用函數(shù)的均衡解。如:Lee[13]針對臺灣省曾文水庫的庫區(qū)土地利用優(yōu)化問題,建立了多目標非合作博弈模型,該模型描述了庫區(qū)土地利用的污染負荷-總磷最小目標與土地利用經(jīng)濟效益最大目標函數(shù),詳細介紹了兩個目標之間的討價還價直至達成納什均衡的過程。Nasiri-Gheidari 等[14]構建了農(nóng)作物生產(chǎn)中的排水污染負荷-總溶解固體最小與農(nóng)作物收入最大為目標的優(yōu)化模型,將討價還價方法應用于伊朗的跨流域水資源配置問題。
非合作博弈中的主從博弈方法是一種由于雙方地位不平等而出現(xiàn)先后決策的動態(tài)博弈行為,博弈雙方一個處于領導者地位,而另一個處于跟從者地位,領導者在制定策略時需要充分考慮跟從者的響應模型。Chen 等[15]將總污染物排放量最小視為上層領導者的目標,將總用水凈效益最大視為下層跟從者的目標,建立水資源管理的主從博弈模型,并以北京市豐臺區(qū)為例開展模型的應用研究。Sedghamiz 等[16]建立了以水資源管理者為領導者、農(nóng)業(yè)用水部門為跟從者的主從博弈模型。Mooselu 等[17]將污水輸送費用和總缺水率最小視為上層領導者的目標、各地區(qū)缺水率最小視為下層跟從者的目標,建立了主從博弈優(yōu)化模型,解決伊朗德黑蘭地區(qū)的污水分配問題。
盡管非合作博弈方法在水資源配置中的研究文獻比較豐富,但這些文獻大多側重于通過非合作博弈模型達到納什均衡。對于追求自身利益的平等關系與不平等關系博弈主體獲得納什均衡解的協(xié)商過程與交互過程,以及非合作博弈的均衡解與多目標優(yōu)化的非劣解之間的關系與內涵,還需要從理論方法研究深入到具體問題分析。本文針對決策沖突主體之間難以達成有約束力的合作協(xié)議情況,提出水資源利用與排污控制的討價還價博弈方法與主從博弈方法,并對比分析納什均衡解與非劣解之間的關系,解決先行用水給后續(xù)排污帶來的負外部性問題,實現(xiàn)水環(huán)境保護優(yōu)先的前提下發(fā)展水經(jīng)濟。
非合作博弈方法強調決策主體的個體理性,個體決策最優(yōu)。為實現(xiàn)水環(huán)境保護優(yōu)先的前提下保障水資源持續(xù)利用,本文研究的非合作博弈方法假定水環(huán)境保護主體為生態(tài)環(huán)境保護部門,水資源經(jīng)濟利用主體為用水部門。根據(jù)決策主體之間的平等協(xié)商關系與不同地位的遞階結構,研究水資源利用與排污控制的討價還價博弈方法與主從博弈方法。
2.1 水資源利用與排污控制的討價還價博弈方法討價還價博弈方法著重于強調博弈主體的決策行為和協(xié)調過程,針對水資源利用與排污控制的沖突問題,本節(jié)運用討價還價博弈方法,假定水環(huán)境保護主體(生態(tài)環(huán)境保護部門)和水資源經(jīng)濟利用主體(用水部門)是具有平等地位的博弈決策主體,構建討價還價博弈模型并進行求解。
水環(huán)境保護主體的目標描述為排污總量最小,目標函數(shù)式為:
水資源經(jīng)濟利用主體的目標描述為經(jīng)濟效益最大,目標函數(shù)式為:
式(1)與(2)表示水環(huán)境保護主體與水資源經(jīng)濟利用主體的討價還價博弈過程,水資源經(jīng)濟利用主體的目標值約束B(x)≥BT寫在式(1)約束條件下,是為了體現(xiàn)水環(huán)境保護主體的優(yōu)化模型中與水資源經(jīng)濟利用主體的協(xié)商過程;同理,水環(huán)境保護主體的目標值約束E(x)≤ET寫在式(2)約束條件下,是為了體現(xiàn)水資源經(jīng)濟利用主體的優(yōu)化模型中與水環(huán)境保護主體的協(xié)商過程;有別于傳統(tǒng)的單目標優(yōu)化模型。
在博弈主體的討價還價過程中,當水環(huán)境保護主體達到最優(yōu)策略時,水資源經(jīng)濟利用主體的效益值低于其最優(yōu)目標值,同樣地,當水資源經(jīng)濟利用主體達到最優(yōu)策略時,水環(huán)境保護的排污總量高于其最優(yōu)目標值,某一博弈主體的最優(yōu)策略并不能滿足對方的最優(yōu)策略,需要重復地進行談判直到?jīng)]有任何一方愿意偏離這種策略為止,其表達式如下:
式中E *(x)與B *(x)分別為水環(huán)境保護主體與水資源利用主體的最優(yōu)策略。
同時滿足式(3)與(4)的解即為討價還價博弈的納什均衡解。根據(jù)上述討價還價博弈的納什均衡解概念,本文運用一致后退討價還價法對模型進行求解[18]。一致后退討價還價法是后退式討價還價法的重要分支,各博弈主體根據(jù)個體理性要求將所有可行性策略進行降序排列,在第一輪討價還價中每個博弈主體均提出自身的最優(yōu)策略,如果每個博弈方提出的最優(yōu)策略一致,則沒有任何一方主動提出背離該策略,進而討價還價過程結束,獲得各博弈主體的最優(yōu)策略。如果每個博弈方提出的最優(yōu)策略不一致,并且若執(zhí)行一方的最優(yōu)策略將大幅度犧牲另一方的利益,在實際中無法實現(xiàn)該策略,則進入第二輪討價還價。在第二輪討價還價中每個博弈方根據(jù)第一輪討價還價的目標策略進行調整提出次優(yōu)策略,對于前兩輪討價還價提出的所有策略,如果有至少一個策略被所有博弈主體所接受,則討價還價結束。如果前兩回合沒有達到一致,則進入下一輪討價還價,直至最優(yōu)策略集合首次非空:
式中:d*為討價還價停止的回合數(shù);k為非劣策略總數(shù);n為博弈方的總數(shù);|CS|為最優(yōu)策略集合中的策略數(shù)目。
2.2 水資源利用與排污控制的主從博弈方法主從博弈方法是一個上下級層次結構的系統(tǒng)優(yōu)化問題[8],上層領導者先行動,下層跟從者隨后行動,跟從者的決策依賴于領導者的決策,領導者也會基于跟從者的反饋進行策略調整,體現(xiàn)出水資源利用沖突中主體的復雜關系與行為次序,更好地展現(xiàn)了各方策略協(xié)調過程的交互特性。
水資源利用與排污控制的主從博弈方法假定水環(huán)境保護主體為上層領導者,水資源經(jīng)濟利用主體為下層跟從者,他們是具有主從關系的博弈決策主體。上層領導者的目標為排污總量最小,下層跟從者的目標為經(jīng)濟效益最大,主從博弈模型的表達式如下:
式中:fU(x)為上層水環(huán)境保護主體的排污總量,萬t;fL(x)為下層水資源經(jīng)濟利用主體的經(jīng)濟效益,億元。
主從博弈模型(6)采用雙層模糊優(yōu)化方法求解[19-20]??紤]在上、下層決策相互影響的主從博弈模型中,上層領導者直接用上層最優(yōu)解對下層跟從者進行控制并不符合實際,因此,將上層領導者與下層跟從者的目標函數(shù)描述為隸屬度函數(shù),以反映上層目標與下層目標的滿意度;并引入上層決策變量范圍的隸屬度函數(shù),允許下層跟從者在該容許范圍內尋找最優(yōu)解,相對減少了尋優(yōu)時間。
主從博弈模型的目標函數(shù)轉化為上、下層隸屬度函數(shù)的公式如下:
對于上層隸屬度函數(shù)式(7),上層領導者希望排污總量目標越小越好,當時,表示上層目標函數(shù)值小于等于其單獨優(yōu)化值,上層目標函數(shù)隸屬度為1,表示達到了上層領導者的目標;當時,表示當上層目標函數(shù)值大于下層最優(yōu)解代入上層目標函數(shù)所得到的值,上層目標函數(shù)隸屬度為0,表示上層領導者拒絕下層反饋的解。說明在主從博弈中,上層領導者希望最優(yōu)決策變量使得上層目標函數(shù)越接近其單獨求解的最優(yōu)值越好。
對于下層隸屬度函數(shù)式(8),下層跟從者希望經(jīng)濟效益目標越大越好,當時,表示下層目標函數(shù)值大于等于其單獨優(yōu)化值,下層目標函數(shù)隸屬度為1,表示達到了下層領導者的目標;當時,表示當下層目標函數(shù)值小于上層最優(yōu)解代入下層目標函數(shù)所得到的值,下層目標函數(shù)隸屬度為0,表示下層跟從者不接受上層提供的解。說明在主從博弈中,下層跟從者希望最優(yōu)決策變量使得下層目標函數(shù)越接近其單獨求解的最優(yōu)值越好。
在上層領導者與下層跟從者的交互過程中,上層領導者給下層跟從者一個可接受的決策變量范圍,上層決策變量的隸屬度函數(shù)的公式如下:
式中:xu為上層決策變量;d為上層最優(yōu)決策解周邊的最大容忍范圍,說明在在主從博弈中,上層領導者希望其最優(yōu)決策變量越接近上層目標函數(shù)單獨求解的最優(yōu)值越好。
綜合隸屬度函數(shù)(7)、(8)與(9),主從博弈模型(6)的求解公式轉換為:
式中:θ、θU分別為主從博弈模型的整體滿意度、上層領導者的滿意度;θU1為上層領導者可接受的決策變量最小隸屬度;θU2為上層領導者可接受的目標函數(shù)最小隸屬度;θL為下層跟從者的滿意度; I 為元素為1 的列向量。
雙層模糊規(guī)劃問題(10)中,上層領導者與下層跟從者的滿意度用隸屬度表示,若達到上層和下層決策問題的滿意程度,則得到最終結果;否則,上層決策問題會向下層決策問題提供新的隸屬度函數(shù)作為控制變量和目標,直至得到主從博弈模型最優(yōu)解。
本文的研究區(qū)域為洞庭湖四口河系的7 個水資源分區(qū),分別為華容河區(qū)(Ⅰ)、藕池東區(qū)(Ⅱ)、藕池中區(qū)(Ⅲ)、荊江區(qū)(Ⅳ)、松滋中區(qū)(Ⅴ)、松滋西區(qū)(Ⅵ)和松滋區(qū)(Ⅶ),如圖1所示。洞庭湖四口河系隨著社會經(jīng)濟快速發(fā)展,用水及其污染物排放量迅速增加,導致水資源緊缺與水質污染的雙重危機。
圖1 洞庭湖四口河系的7 個水資源分區(qū)
水資源利用與排污控制的討價還價博弈模型求解需要的各用水部門排污系數(shù),COD、TN、TP 和NH3-N的濃度,各水資源分區(qū)各用水部門需水量,用水效益系數(shù),可供水量等數(shù)據(jù),根據(jù)《湖南省第一次全國污染源普查公報》《湖南年鑒》《湖南水資源公報》等收集整理得到。本文實例研究為簡化計算,假定用水效益系數(shù)、排污系數(shù)、污染物排放濃度在計算期內保持不變,該實例研究是針對區(qū)域案例開展的,如果應用到其他區(qū)域,相應的模型參數(shù)需要根據(jù)具體情況做出調整。
水資源利用與排污控制的討價還價博弈模型求解過程見表1,在第一輪討價還價中水資源經(jīng)濟利用主體目標值為580 億元,水環(huán)境保護主體目標值為0.4 萬t,運用式(1)求解出來的排污總量為10.63萬t,不能滿足水環(huán)境保護主體的目標值,運用式(2)求解出來的經(jīng)濟效益為216.99 億元,不能滿足水資源經(jīng)濟利用主體的目標值。從而進入第二輪討價還價,經(jīng)濟效益主體逐漸降低其目標值為560 億元,水環(huán)境保護主體目標值也降低其目標值,由于水環(huán)境保護主體希望目標值越小越好,排污總量目標值為0.8 萬t,第二輪中運用式(1)求解的排污總量為9.24 萬t,不能滿足水環(huán)境保護主體調整的次優(yōu)目標值,運用式(2)求解的經(jīng)濟效益為317.75 億元,不能滿足水資源經(jīng)濟利用主體的目標值。從而進入第三輪討價還價,依次類推,直至第五輪討價還價,運用式(1)—(5)求解,經(jīng)濟效益主體的目標值為460 億元,此時排污總量最小為3.41 萬t,排污總量主體的目標值為3.5 萬t,此時經(jīng)濟效益最大為461.69 億元,均滿足兩個主體的目標值,得到納什均衡解為(460 億元, 3.41 萬t)~(461.69 億元,3.5 萬t)。通過模擬博弈主體間的討價還價過程,體現(xiàn)了策略選擇的動態(tài)交互過程。
水資源利用與排污控制的主從博弈模型運用式(7)—(10)求解,上層目標滿意度θU與下層目標滿意度θL的變化過程見圖2。在主從博弈過程中,上層領導者的滿意度為0.95 時,上層目標排污總量為0.67 萬t;下層跟從者根據(jù)此決策,得出最優(yōu)解為285.37 億元,對應的目標滿意度僅為0.47。上層領導者根據(jù)下層跟從者的反饋調整自己的決策,將置信水平從0.95 逐漸減少,按等距離Δ= 0.05 選取上層領導者的滿意度θU=0.9,0.85,0.8,0.75,對應得到下層目標滿意度為θL=0.6、0.659、0.713、0.752;當θU=0.75 時,整體滿意度θ最大,上、下層目標滿意度相等,各自的策略不再改變,此時各博弈主體均不能通過單獨改變策略而獲取更大的利益,其解為(457 億元,3.24 萬t),即主從博弈的納什均衡解。
圖2 水資源利用與排污控制的主從博弈過程
為比較非合作博弈方法與傳統(tǒng)多目標優(yōu)化方法在水資源利用與排污控制的結果差別,本文構建了以排污量最小和經(jīng)濟效益最大為目標函數(shù)的多目標優(yōu)化模型并進行求解,得到多目標模型的Pareto解。討價還價博弈模型、主從博弈模型與多目標優(yōu)化模型的結果比較見圖3,主從博弈模型和討價還價博弈的納什均衡解均在多目標模型的Pareto 前沿上。相比于多目標模型,討價還價博弈通過模擬博弈主體考慮個體理性的策略選擇過程,得到的納什均衡解極大地縮減了多目標模型的策略空間。討價還價博弈的納什均衡解為(460 億元,3.41 萬t)~(461.69 億元,3.5 萬t),主從博弈的納什均衡解為(457 億元,3.24 萬t),主從博弈模型的納什均衡解與討價還價博弈模型的納什均衡解很接近,相比于討價還價博弈模型,主從博弈模型通過上層和下層之間的決策互動過程,得到唯一的納什均衡解,也是最優(yōu)解。并且,主從博弈的納什均衡解在討價還價博弈的納什均衡解右下方,表明了主從博弈的排污總量主體作為上層領導者更有效地控制了污染物排放量,在優(yōu)先保護水環(huán)境的前提下最大化水資源利用效益。
圖3 討價還價博弈模型、主從博弈模型與多目標模型的結果比較
本文針對決策沖突主體之間難以達成有約束力的合作協(xié)議情況,提出水資源利用與排污控制的非合作博弈方法,從博弈模型方法上深入分析博弈主體獲得納什均衡解的協(xié)商過程與交互過程,研究討價還價博弈與主從博弈的均衡解、多目標優(yōu)化的非劣解之間的關系與內涵。解決先行用水給后續(xù)排污帶來的負外部性問題,實現(xiàn)水環(huán)境保護優(yōu)先的前提下發(fā)展水資源經(jīng)濟。主要研究結論如下:(1)建立水資源利用與排污控制的討價還價博弈模型,結合一致后退討價還價法方法求解模型,求解過程清晰高效,通過平等的協(xié)商方式體現(xiàn)了博弈主體的協(xié)調過程與決策行為。(2)構建水環(huán)境保護主體與水資源利用主體的上下級層次結構,建立主從博弈模型,采用雙層模糊優(yōu)化方法求解模型,通過控制-響應-協(xié)調方式體現(xiàn)分層次利益主體之間的行為次序與交互特性。(3)對比分析了討價還價博弈、主從博弈與傳統(tǒng)多目標優(yōu)化模型解的內涵與關系。討價還價博弈與主從博弈模型的均衡解都在多目標優(yōu)化模型的非劣解前沿上,說明非合作博弈方法不僅強調了個體利益,還兼顧了整體利益。而且討價還價博弈的均衡解有效縮減了非劣解范圍,主從博弈的唯一均衡解更有效地控制了污染物排放量。
非合作博弈方法為我們了解水資源利用中行為主體之間的互動行為、沖突與合作提供了一個強有力的解釋和分析工具。文中非合作博弈方法中博弈主體具有一定主觀能動性、在解決實際問題中博弈主體的策略選擇偏好,模型參數(shù)的動態(tài)變化、可供水量與需水的不確定性影響,需要進一步深入探討和研究。