李圓圓,孫李傲,袁文燕,吳 軍
(1.北京化工大學(xué) 經(jīng)濟(jì)管理學(xué)院,北京 100029;2.北京化工大學(xué) 數(shù)理學(xué)院,北京 100029)
危險(xiǎn)品運(yùn)輸量的快速增長(zhǎng)一方面標(biāo)志著化工行業(yè)的迅猛發(fā)展,為社會(huì)經(jīng)濟(jì)發(fā)展保駕護(hù)航;另一方面,危險(xiǎn)品運(yùn)輸事故對(duì)人民生命財(cái)產(chǎn)安全也可能造成嚴(yán)重的后果。為了保障人民生命財(cái)產(chǎn)安全,我國(guó)政府頒布了多項(xiàng)政策法規(guī)文件,例如國(guó)務(wù)院安全生產(chǎn)委員會(huì)2020年印發(fā)的《全國(guó)危險(xiǎn)化學(xué)品道路運(yùn)輸安全集中整治方案》。但近些年發(fā)生的多起相關(guān)事故的事故原因表明,危險(xiǎn)品運(yùn)輸監(jiān)管過(guò)程仍存在漏洞,部分危險(xiǎn)品運(yùn)輸企業(yè)仍存在安全意識(shí)薄弱的現(xiàn)象。
更值得注意的是,恐怖襲擊自20世紀(jì)90年代以來(lái)成為一個(gè)世界矚目的現(xiàn)象。諸如“東京地鐵沙林毒氣事件”、“9·11恐怖襲擊事件”等恐怖攻擊造成的歷史悲劇已給各國(guó)政府敲響警鐘,恐怖襲擊是一個(gè)不可忽視的重要因素。由于政府部門(mén)加強(qiáng)了對(duì)設(shè)施的防護(hù),襲擊者將攻擊對(duì)象轉(zhuǎn)向地面交通[1-2]。鑒于危險(xiǎn)品事故具有危害性強(qiáng)等特點(diǎn),在途危險(xiǎn)品可能成為攻擊者的新目標(biāo)[3-4]?;诖?,本文重點(diǎn)考慮潛在恐怖襲擊和企業(yè)安全意識(shí)薄弱情況下,政府對(duì)企業(yè)的安全監(jiān)管問(wèn)題,旨在為政府的安全監(jiān)管提供解決方案。
目前,政府安全監(jiān)管已在環(huán)保、醫(yī)療和煤礦等行業(yè)[5-8]得到廣泛研究。對(duì)于危險(xiǎn)品運(yùn)輸領(lǐng)域的政府監(jiān)管問(wèn)題,李健等[9]研究了政府、企業(yè)和危險(xiǎn)品托運(yùn)人的運(yùn)輸博弈問(wèn)題;劉家國(guó)等[10]探討了港口運(yùn)輸中政府監(jiān)管部門(mén)的監(jiān)管機(jī)理;韓震等[11]構(gòu)建了政府、資源提供商和物流服務(wù)商的演化博弈模型,采用系統(tǒng)動(dòng)力學(xué)進(jìn)行仿真分析;Reilly等[12]研究了恐怖攻擊下政府對(duì)路段使用限制策略的監(jiān)管決策問(wèn)題??梢?jiàn),學(xué)者們已經(jīng)研究了道路運(yùn)輸或港口運(yùn)輸中的政府監(jiān)管問(wèn)題,但其中很少考慮恐怖襲擊因素。
有關(guān)危險(xiǎn)品運(yùn)輸?shù)难芯枯^為豐富[13]。對(duì)于考慮恐怖襲擊背景的危險(xiǎn)品運(yùn)輸問(wèn)題的研究,胡小依等[3]研究了恐怖襲擊下網(wǎng)絡(luò)的定量風(fēng)險(xiǎn)問(wèn)題;宋偉程等[4]構(gòu)建了恐怖襲擊事件中的人員疏散模型;黃麗達(dá)等[14]采用攻防博弈模型對(duì)天然氣管網(wǎng)的恐怖襲擊進(jìn)行研究。也有學(xué)者研究了恐怖襲擊背景下諸如脆弱性分析、人員疏散和道路網(wǎng)絡(luò)規(guī)劃等問(wèn)題[15-16]。由此可見(jiàn),學(xué)者已經(jīng)采用運(yùn)籌優(yōu)化等方法研究了恐怖襲擊情況下的運(yùn)輸問(wèn)題,但少有采用演化博弈進(jìn)行三方博弈的研究。
綜上發(fā)現(xiàn):1)危險(xiǎn)品運(yùn)輸監(jiān)管問(wèn)題備受學(xué)者關(guān)注,但同時(shí)考慮恐怖襲擊的研究很少;2)結(jié)合演化博弈與系統(tǒng)動(dòng)力學(xué)的方法可解決均衡解的穩(wěn)定性分析困難問(wèn)題;3)以往多是關(guān)于政府和企業(yè)2方的監(jiān)管博弈研究,研究政府-企業(yè)-襲擊者3方的成果很少。鑒于此,本文在考慮恐怖襲擊背景下,研究政府安全監(jiān)管問(wèn)題,采用演化博弈理論分析三方博弈的內(nèi)在機(jī)理,采用系統(tǒng)動(dòng)力學(xué)方法探究政府監(jiān)管的動(dòng)態(tài)機(jī)制,對(duì)提高危險(xiǎn)品運(yùn)輸?shù)陌踩骄哂兄匾默F(xiàn)實(shí)意義。
恐怖襲擊背景下危險(xiǎn)品運(yùn)輸監(jiān)管問(wèn)題中的主體及其之間的博弈關(guān)系如圖1所示。
圖1 危險(xiǎn)品運(yùn)輸監(jiān)管博弈分析Fig.1 Game analysis on supervision of dangerous goods transportation
局中人包括:政府監(jiān)管部門(mén),簡(jiǎn)稱政府(G);危險(xiǎn)品運(yùn)輸企業(yè),簡(jiǎn)稱企業(yè)(H);恐怖襲擊者,簡(jiǎn)稱襲擊者(T)。政府(G)是指為保障危險(xiǎn)品車(chē)輛運(yùn)輸安全,通過(guò)人員和技術(shù)設(shè)備對(duì)在途危險(xiǎn)品運(yùn)輸車(chē)輛進(jìn)行檢查和監(jiān)管的部門(mén);企業(yè)(H)是指企業(yè)的危險(xiǎn)品運(yùn)輸車(chē)輛;襲擊者(T)是指以造成社會(huì)損失或負(fù)面影響為目標(biāo),對(duì)企業(yè)運(yùn)輸車(chē)輛進(jìn)行惡意攻擊,以期造成嚴(yán)重的攻擊后果的個(gè)人或組織。
設(shè)政府的策略空間Sg={嚴(yán)監(jiān)管,弱監(jiān)管},采用2種策略的概率分別為x和1-x。企業(yè)對(duì)危險(xiǎn)品運(yùn)輸車(chē)輛的策略分別是升級(jí)安全保障技術(shù)(簡(jiǎn)稱升級(jí))和不升級(jí)安全保障技術(shù)(簡(jiǎn)稱不升級(jí)),策略空間Sh={升級(jí),不升級(jí)},采用2種策略的概率分別為y和1-y。襲擊者的策略空間St={攻擊,不攻擊},采用2種策略的概率分別為z和1-z。
模型假設(shè):1)在政府嚴(yán)監(jiān)管且企業(yè)升級(jí)的策略下,攻擊的結(jié)果為失??;在政府弱監(jiān)管且企業(yè)不升級(jí)的策略下,攻擊的結(jié)果為成功;其余情況下,襲擊者以一定概率攻擊成功。2)無(wú)論政府策略如何,企業(yè)升級(jí)后發(fā)生事故的概率為零;企業(yè)不升級(jí)時(shí),在政府嚴(yán)監(jiān)管下發(fā)生事故的概率小于在政府弱監(jiān)管下的概率。3)一般運(yùn)輸事故造成社會(huì)損失由企業(yè)承擔(dān)。4)攻擊事件造成的社會(huì)損失由政府承擔(dān)。5)若車(chē)輛已經(jīng)發(fā)生運(yùn)輸事故,襲擊者取消行動(dòng),此時(shí)會(huì)產(chǎn)生攻擊沉默成本但沒(méi)有暴露懲罰成本。
設(shè)政府執(zhí)行嚴(yán)監(jiān)管策略比弱監(jiān)管策略需要額外付出的成本為Cg;嚴(yán)監(jiān)管策略下可提升的政府公信力為Rg1;襲擊者攻擊成功時(shí),直接造成的社會(huì)損失屬于政府的損失為Cp。
設(shè)企業(yè)進(jìn)行升級(jí)所需成本為Ch1;進(jìn)行升級(jí)后,運(yùn)輸安全性能提高,給企業(yè)帶來(lái)良好聲譽(yù)的同時(shí)獲得更多收益Rh;政府對(duì)升級(jí)企業(yè)給予一定補(bǔ)貼Rv;但是,對(duì)不升級(jí)的企業(yè)會(huì)給予一定的懲罰Rgh;在政府嚴(yán)監(jiān)管而企業(yè)不升級(jí)策略時(shí),企業(yè)發(fā)生交通事故概率為ph1,在弱監(jiān)管策略和企業(yè)不升級(jí)時(shí)的事故概率為ph2;襲擊者對(duì)企業(yè)攻擊造成的損失為Ch2。
設(shè)襲擊者實(shí)施攻擊的成本為Ct2;對(duì)企業(yè)進(jìn)行攻擊且成功的概率為pt;對(duì)社會(huì)造成的損失包括直接損失和政府公信力,為(Cp+Rg1)2;暴露時(shí)受到政府的懲罰為Ct3。
不同策略組合下,局中人的得益矩陣見(jiàn)表1。
表1 局中人的得益矩陣Table 1 Benefit matrix of players
(1)
同理可得,企業(yè)進(jìn)行升級(jí)意愿的變化量為式(2):
(2)
襲擊者攻擊意愿的變化量為式(3):
(3)
通過(guò)聯(lián)立式(1)~(3)組成政府、企業(yè)和襲擊者三方博弈的復(fù)制動(dòng)態(tài)方程組,可得9個(gè)均衡點(diǎn),計(jì)算各均衡點(diǎn)的特征值及符號(hào)見(jiàn)表2。
各個(gè)均衡點(diǎn)的特征值符號(hào)的判斷見(jiàn)表2。其中,“/”表示待定。由Lyapunov第一法則[17]判斷,在9個(gè)穩(wěn)定點(diǎn)中,除了E7(1,1,1)不是組合策略的演化穩(wěn)定策略,其他8個(gè)均衡點(diǎn)的穩(wěn)定性無(wú)法直接判斷,需要對(duì)相應(yīng)的19個(gè)特征值的符號(hào)進(jìn)行反復(fù)討論。由于討論情形過(guò)于復(fù)雜,下面采用系統(tǒng)動(dòng)力學(xué)方法進(jìn)行研究。
表2 均衡點(diǎn)及相應(yīng)的特征值Table 2 Equilibrium points and corresponding characteristic values
根據(jù)已建立的三方演化博弈模型,構(gòu)建政府、企業(yè)和襲擊者3方的系統(tǒng)動(dòng)力學(xué)模型。設(shè)系統(tǒng)初始時(shí)間為0,終止時(shí)間為500,時(shí)間步長(zhǎng)為1。根據(jù)Erkut等[18]和梁雁茹[6]等文獻(xiàn)和模擬實(shí)驗(yàn),設(shè)Cg=0.3,Rg1=0.36,Rgh=0.5,Cp=0.65,Ch1=0.515,Ct2=0.2,Ct3=0.6,Ch2=0.245,ph=0.000 3,pt=0.5,Rv=0.15,Rh=0.26。對(duì)于G(x),G(y)和G(z),令G(x)=0時(shí)可解得該博弈問(wèn)題的8個(gè)純策略,即E0(0,0,0),E1(0,0,1),E2(0,1,0),E3(1,0,0),E4(0,1,1),E5(1,0,1),E6(1,1,0),E7(1,1,1)。給定參數(shù)下,該演化博弈的8個(gè)均衡解、特征根及狀態(tài)的結(jié)果見(jiàn)表3。同樣,由Lyapunov第一法則[15]易知,8個(gè)純策略均不是三方博弈的演化穩(wěn)定策略。
表3 演化博弈的結(jié)果Table 3 Results of evolutionary game
有效的懲罰措施能提高監(jiān)管效果,本文借鑒文獻(xiàn)[6]的優(yōu)化原理,設(shè)計(jì)政府動(dòng)態(tài)懲罰機(jī)制。在監(jiān)管問(wèn)題中,企業(yè)升級(jí)的意愿與政府的嚴(yán)監(jiān)管策略緊密相關(guān)。企業(yè)升級(jí)的意愿越高,政府對(duì)其懲罰力度越小,反之,懲罰力度越大。設(shè)Rgh′=Rgh(1-y)+θ1,其中,θ1是參數(shù)。
在給定情況下,假設(shè)3方的初始意愿為E′(0.5,0.5,0.5),令θ1=0.32,將終止時(shí)間延長(zhǎng)至2 000,得到穩(wěn)定策略E*(0.461 833,0.836 83,0),仿真演化結(jié)果如圖2所示。相同條件下,改變初始意愿為E″(0.2,0.2,0.8),可得到相同的混合穩(wěn)定策略E*(0.461 833,0.836 83,0),仿真演化結(jié)果如圖3所示。
圖2 動(dòng)態(tài)懲罰機(jī)制下E′(0.5,0.5,0.5)的演化結(jié)果Fig.2 Evolution results of E′(0.5,0.5,0.5) under dynamic penalty mechanism
圖3 動(dòng)態(tài)懲罰機(jī)制下E″(0.2,0.2,0.8)的演化結(jié)果Fig.3 Evolution results of E″(0.2,0.2,0.8) under dynamic penalty mechanism
命題1:政府動(dòng)態(tài)懲罰機(jī)制下,三方博弈主體的演化穩(wěn)定策略為E*(0.461 833,0.836 83,0)。
證:對(duì)初始政府監(jiān)管下的懲罰措施Rgh進(jìn)行動(dòng)態(tài)優(yōu)化,設(shè)計(jì)動(dòng)態(tài)懲罰機(jī)制Rgh′=Rgh(1-y)+θ1,將其代入式(1)~(3)中,可得復(fù)制動(dòng)態(tài)方程式(4)~(6):
(4)
(5)
(6)
聯(lián)立式(4)~(6)可得新的均衡策略和雅克比矩陣J′,其中混合策略為E8′(0.461 833,0.836 83,0)。計(jì)算得只有策略E8′的特征值(實(shí)部)均小于0,特征值λ1′=-0.015 8+0.107 7i,λ2′=-0.015 8-0.107 7i和λ3′=-0.391。因此,政府動(dòng)態(tài)懲罰機(jī)制下,演化穩(wěn)定策略為E*(0.4618 33,0.836 83,0)。但是企業(yè)進(jìn)行升級(jí)的意愿小于1,即企業(yè)還有一定的可能性采取不升級(jí)策略。因此,繼續(xù)設(shè)計(jì)動(dòng)態(tài)的補(bǔ)貼機(jī)制,促進(jìn)企業(yè)采取升級(jí)意愿。
設(shè)計(jì)政府對(duì)升級(jí)企業(yè)給予動(dòng)態(tài)補(bǔ)貼的機(jī)制。企業(yè)采取升級(jí)策略的意愿越高,政府給予的補(bǔ)貼越高,但不會(huì)無(wú)限升高。設(shè)政府的動(dòng)態(tài)補(bǔ)貼機(jī)制Rv′=αy2+βy+θ2,其中,α,β,θ2是參數(shù),且α<0。在動(dòng)態(tài)懲罰機(jī)制的仿真參數(shù)下,假設(shè)3方的初始意愿為E′(0.5,0.5,0.5),令α=-0.1,β=0.2和θ2=-0.104,將終止時(shí)間延長(zhǎng)至200,可得到穩(wěn)定策略E**(1,1,0),仿真演化結(jié)果如圖4所示。相同條件下,改變初始意愿為E″(0.2,0.2,0.8),得到相同的穩(wěn)定策略E**(1,1,0),仿真演化結(jié)果見(jiàn)圖5。
圖4 動(dòng)態(tài)懲罰-補(bǔ)貼機(jī)制下E′(0.5,0.5,0.5)的演化結(jié)果Fig.4 Evolution results of E′(0.5,0.5,0.5) under dynamic penalty-subsidy mechanism
圖5 動(dòng)態(tài)懲罰-補(bǔ)貼機(jī)制下E″(0.2,0.2,0.8)的演化結(jié)果Fig.5 Evolution results of E″(0.2,0.2,0.8) under dynamic penalty-subsidy mechanism
命題2:政府動(dòng)態(tài)懲罰-補(bǔ)貼機(jī)制下,三方博弈主體的演化穩(wěn)定策略為E**(1,1,0)。
證:對(duì)動(dòng)態(tài)懲罰政府監(jiān)管下的補(bǔ)貼措施Rv進(jìn)行動(dòng)態(tài)優(yōu)化,設(shè)動(dòng)態(tài)補(bǔ)貼機(jī)制Rv′=αy2+βy+θ2,其中,α,β,θ2是參數(shù),且α<0。將其代入式(4)~(6)中,可得復(fù)制動(dòng)態(tài)方程式(7)~(9):
(7)
(8)
(9)
聯(lián)立式(7)~(9),可得動(dòng)態(tài)懲罰-補(bǔ)貼機(jī)制下新的均衡策略和相應(yīng)的雅克比矩陣J″。計(jì)算得純策略E6″的特征值全為負(fù),分別為λ1″=-0.064,λ2″=-0.061 2和λ3″=-0.8。因此,政府動(dòng)態(tài)懲罰-補(bǔ)貼機(jī)制下,三方博弈主體的演化穩(wěn)定策略為E**(1,1,0)。
1)給定情形下,構(gòu)建的政府-企業(yè)-襲擊者博弈模型的均衡點(diǎn)均不穩(wěn)定。通過(guò)系統(tǒng)動(dòng)力學(xué)軟件進(jìn)行驗(yàn)證后發(fā)現(xiàn),均衡解均為鞍點(diǎn),表明該情形下不存在演化穩(wěn)定策略。
2)相同情形下,引入政府動(dòng)態(tài)懲罰機(jī)制的博弈模型能夠演化出1個(gè)穩(wěn)定的混合策略,即E*(0.461 833,0.836 83,0);在該混合策略中,由于政府很可能采取弱監(jiān)管策略,企業(yè)也有采取不升級(jí)策略的可能,發(fā)生危險(xiǎn)品運(yùn)輸事故仍有較大的可能性,需要繼續(xù)對(duì)模型進(jìn)行優(yōu)化。
3)相同情形下,引入政府動(dòng)態(tài)懲罰-補(bǔ)貼機(jī)制的博弈模型能夠演化出1個(gè)穩(wěn)定的純策略,即E**(1,1,0);對(duì)應(yīng)策略組合為{嚴(yán)監(jiān)管,升級(jí),不攻擊}。在該動(dòng)態(tài)懲罰-補(bǔ)貼機(jī)制下,政府監(jiān)管部門(mén)應(yīng)嚴(yán)格對(duì)照有關(guān)法律法規(guī)和標(biāo)準(zhǔn)的要求對(duì)運(yùn)輸過(guò)程進(jìn)行規(guī)范監(jiān)督,企業(yè)主動(dòng)升級(jí)運(yùn)輸車(chē)輛的安全保障技術(shù),并且政府視企業(yè)升級(jí)的意愿高低進(jìn)行動(dòng)態(tài)懲罰或補(bǔ)貼,可以有效遏制襲擊者的攻擊行為。
中國(guó)安全生產(chǎn)科學(xué)技術(shù)2022年5期