劉紀(jì)坤,黃 杰
(西安科技大學(xué) 安全科學(xué)與工程學(xué)院,陜西 西安 710054)
煤炭行業(yè)是我國能源支柱產(chǎn)業(yè),煤礦資源不斷開采利用的同時也伴隨著諸多生產(chǎn)事故。如何有效構(gòu)建安全監(jiān)管體系,落實安全監(jiān)管工作,是解決安全管理工作問題的首要途徑[1-2]。近年來,國內(nèi)外學(xué)者[3-7]從經(jīng)典博弈論角度出發(fā)研究了煤礦安全監(jiān)管的相關(guān)問題,但經(jīng)典博弈論存在固有缺陷:假設(shè)中的“完全理性”和“共同知識”,在實際情況中無法達(dá)到;經(jīng)典博弈論缺乏動態(tài)變化調(diào)整。因此,有必要采取更為嚴(yán)謹(jǐn)?shù)姆椒ㄑ芯棵旱V安全監(jiān)管問題。
演化博弈論是Smith等[8]對生物進化過程進行分析時提出的,在經(jīng)典博弈論的基礎(chǔ)上引入了時間變量,研究對象是群體行為,并且假設(shè)研究對象都具有“有限理性”;Taylor等[9]在此基礎(chǔ)上,提出了復(fù)制動態(tài)方程的概念,進一步完善了演化博弈論中的基本概念。如今演化博弈論作為一種更完善的研究方法已被廣泛應(yīng)用于解決煤礦安全監(jiān)管問題[10-11]及工程項目的安全監(jiān)管問題[12-13]。我國學(xué)者付茂林等[7]從監(jiān)察機構(gòu)的角度分析了存在監(jiān)察變異時煤礦安全監(jiān)察行為的進化穩(wěn)定狀態(tài),提出監(jiān)察成本、上級領(lǐng)導(dǎo)監(jiān)督概率、認(rèn)真監(jiān)察的激勵獎勵是影響其穩(wěn)定狀態(tài)的主要因素;劉全龍[10]通過構(gòu)建國家、地方政府、企業(yè)之間單邊博弈、雙邊博弈和多方博弈探討了我國煤礦安全監(jiān)察監(jiān)管的博弈變化與控制問題。
據(jù)上述相關(guān)研究發(fā)現(xiàn),由于我國學(xué)者在工程管理領(lǐng)域引入演化博弈論理論時間較晚,且多數(shù)分析的都是宏觀層面(國家與地方政府、政府與企業(yè)等),部分學(xué)者從企業(yè)內(nèi)部入手進行研究(管理者與基層人員、人員自我博弈等),缺少對于企業(yè)領(lǐng)導(dǎo)決策者與監(jiān)督管理者的博弈研究。為完善企業(yè)內(nèi)部微觀層次的演化博弈規(guī)律,本文基于有限理性的企業(yè)決策者和監(jiān)督管理者,構(gòu)建演化博弈模型,得到演化穩(wěn)定策略(Evolutionary Stability Strategy,ESS)并分析討論,進行數(shù)值模擬仿真進行驗證,針對相關(guān)問題提出建議,為企業(yè)安全管理工作提供理論指導(dǎo)。
基于我國煤礦行業(yè)安全監(jiān)察體制“國家監(jiān)察、地方監(jiān)管、企業(yè)負(fù)責(zé)”的垂直管理模式,對于演化博弈模型設(shè)定如下:
1)博弈雙方主體均為大量群體,具有有限理性,且雙方主體之間存在非對稱博弈。領(lǐng)導(dǎo)決策者進行安全投入的概率為x,不進行安全投入的概率為1-x,x∈[0,1];監(jiān)督管理者嚴(yán)格監(jiān)管的概率為y,放松監(jiān)管的概率為1-y,y∈[0,1]。
2)煤礦企業(yè)領(lǐng)導(dǎo)決策者進行安全投入所得到的收益為G1;監(jiān)督管理者嚴(yán)格監(jiān)管得到的收益為G2。領(lǐng)導(dǎo)決策者進行安全投入的費用為S;監(jiān)督管理者可支配的安全項目款為s。事故發(fā)生率為γ,γ∈[0,1]。發(fā)生事故后對領(lǐng)導(dǎo)決策者和監(jiān)督管理者的處罰分別為C1,C2。
3)由于煤礦企業(yè)受到多主體管理部門之間的相互影響作用,引入外部監(jiān)管和輿論聲譽的影響。監(jiān)管部門對領(lǐng)導(dǎo)者不進行安全投入的處罰款為E;監(jiān)管部門對監(jiān)督者放松監(jiān)管的處罰款為e。發(fā)生事故后,煤礦企業(yè)的財產(chǎn)損失和聲譽損失總和為B。
據(jù)以上分析,構(gòu)建博弈雙方收益矩陣見表1。
表1 企業(yè)領(lǐng)導(dǎo)決策者和監(jiān)督管理者的博弈收益矩陣Table 1 Game profit matrix of enterprise leading decision-maker and supervisor
對企業(yè)領(lǐng)導(dǎo)決策者,進行安全投入的期望收益UA如式(1)所示:
UA=G1y+G1(1-y)=G1
(1)
式中:G1為領(lǐng)導(dǎo)決策者進行安全投入所得到的收益;y為監(jiān)督管理者嚴(yán)格監(jiān)管的概率,y∈[0,1]。
不進行安全投入的期望收益UB如式(2)所示:
(2)
式中:S為領(lǐng)導(dǎo)決策者進行安全投入的費用;E為對領(lǐng)導(dǎo)決策者的外部監(jiān)管處罰;γ為事故發(fā)生率γ∈[0,1];B為發(fā)生事故后財產(chǎn)損失和聲譽損失總和。
(3)
式中:x為領(lǐng)導(dǎo)決策者進行安全投入的概率,x∈[0,1]。
根據(jù)Malthusian動態(tài)方程[9]可知,策略的增長率等于該策略的相對適應(yīng)性,設(shè)時間參數(shù)t,可得領(lǐng)導(dǎo)決策者在企業(yè)安全管理過程中選擇進行安全投入策略的復(fù)制動態(tài)方程如式(4)所示:
(4)
同理對企業(yè)監(jiān)督管理者,采取嚴(yán)格監(jiān)管措施的期望收益ua如式(5)所示:
ua=G2x+(G2-s)(1-x)=G2-s+sx
(5)
式中:G2為監(jiān)督管理者嚴(yán)格監(jiān)管得到的收益;s為監(jiān)督管理者可支配的安全項目款。
放松監(jiān)管的期望收益ub如式(6)所示:
(6)
(7)
可得監(jiān)督管理者在企業(yè)安全管理過程中選擇嚴(yán)格監(jiān)管策略的復(fù)制動態(tài)方程如式(8)所示:
(8)
由此可得復(fù)制動態(tài)方程的4個無條件均衡點O1(0,0),O2(0,1),O3(1,0),O4(1,1)。
根據(jù)微分方程的穩(wěn)定性定理可知,要使某一策略處于穩(wěn)定狀態(tài),即演化穩(wěn)定策略ESS[14],對于群體選擇策略概率x和y需滿足式(9):
(9)
由前文分析可得,當(dāng)x=0,x=1并且y=y0時,根據(jù)穩(wěn)定性定理,當(dāng)F(x)=0,F′(x)≤0,x為ESS。
當(dāng)y=y0時,對于所有的x,都可得F(x)=0,F′(x)=0,領(lǐng)導(dǎo)決策者的任何決策都是穩(wěn)定策略。
當(dāng)y≠y0時,進行如下分析:
1)E>S
γ(G1+C1+B+S-E)(1-y)+E-S>0,對方程的2個解x=0,x=1,可得F′(x)|x=0>0,F(xiàn)′(x)|x=1<0。因此,x=1是唯一的ESS,即有限理性的領(lǐng)導(dǎo)決策者選擇進行安全投入。
2)E
①當(dāng)S>γ(G1+C1+B+S-E)+E時,則γ(G1+C1+B+S-E)(1-y)+E-S<0,對方程的2個解x=0,x=1,可得F′(x)|x=0<0,F(xiàn)′(x)|x=1>0。因此,x=0是唯一的ESS,即有限理性的領(lǐng)導(dǎo)決策者選擇不進行安全投入。
②當(dāng)S<γ(G1+C1+B+S-E)+E時,存在以下2種狀況:
由前文分析可得,當(dāng)y=0,y=1并且x=x0時,根據(jù)穩(wěn)定性定理,當(dāng)F(y)=0,F′(y)≤0,y為ESS。
當(dāng)x=x0時,對于所有的y,都可得F(y)=0,F′(y)=0,監(jiān)督管理者的任何決策都是穩(wěn)定策略。
當(dāng)x≠x0時,進行如下分析:
1)e>s
則有γ(G2+C2-e)(1-x)+e-s>0,對方程的2個解y=0,y=1,可得F′(y)|y=0>0,F(xiàn)′(y)|y=1<0。因此,可知y=1是唯一的ESS,即有限理性的監(jiān)督管理者會選擇嚴(yán)格監(jiān)管策略。
2)e
①當(dāng)s>γ(G2+C2-e)(1-x)+e時,則有γ(G2+C2-e)(1-x)+e-s<0,對于方程的2個解y=0,y=1,可得F′(y)|y=0<0,F′(y)|y=1>0。因此,可知y=0是唯一的ESS,即有限理性的監(jiān)督管理者選擇放松監(jiān)管策略。
②當(dāng)s<γ(G2+C2-e)(1-x)+e時,存在2種情況:
根據(jù)Friedman[15]提出的觀點,一個由微分方程系統(tǒng)描述的群體動態(tài),其穩(wěn)定策略可由雅可比矩陣的局部穩(wěn)定性分析得出。此系統(tǒng)的雅可比矩陣如式(10):
(10)
根據(jù)局部穩(wěn)定分析法對5個均衡點進行穩(wěn)定性分析,結(jié)果見表2。
由表2可知,領(lǐng)導(dǎo)決策者和監(jiān)督管理者的博弈系統(tǒng)中存在4個局部穩(wěn)定點:(0,0)(不進行安全投入,放松監(jiān)管);(0,1)(不進行安全投入,嚴(yán)格監(jiān)管);(1,0)(進行安全投入,放松監(jiān)管);(1,1)(進行安全投入,嚴(yán)格監(jiān)管)。
表2 局部穩(wěn)定性分析結(jié)果Table 2 Results of local stability analysis
令:
以x-y坐標(biāo)系畫圖表示領(lǐng)導(dǎo)決策者和監(jiān)督管理者選擇策略的動態(tài)演化趨勢,共存在8種博弈類型,如圖1所示。
根據(jù)圖1(a)~(d)可知,存在4種特殊情況,博弈雙方的行為決策并不受對方的影響和制約,僅取決于自己的獲利與處罰。
根據(jù)圖1(e),當(dāng)S
圖1 演化博弈相位圖Fig.1 Phase diagram of evolutionary game
根據(jù)圖1(g),當(dāng)存在情況如:S<γ(G1+C1+B+S-E)+E,s
為更直觀地體現(xiàn)本文關(guān)于煤礦安全管理中領(lǐng)導(dǎo)決策人員和監(jiān)督管理人員的行為策略演化穩(wěn)定性分析結(jié)果,以下對①:E>S,e
①G1=100,C1=80,G2=50,C2=40,B=10,E=40,S=30,e=10,s=15,γ=0.2。
②G1=100,C1=80,G2=50,C2=40,B=10,E=25,S=35,e=10,s=15,γ=0.2。
本文繪制了不同情況下煤礦領(lǐng)導(dǎo)決策者和監(jiān)督管理者的策略演化博弈圖,如圖2和圖3所示。
圖2 情形①下系統(tǒng)策略演化博弈Fig.2 Evolutionary game of system strategy under case 1
圖3 情形②下系統(tǒng)策略演化博弈Fig.3 Evolutionary game of system strategy under case 2
1)圖2中,圖2(a)表示博弈雙方?jīng)Q策隨時間變化,由于高額處罰的存在,隨時間變化領(lǐng)導(dǎo)決策者逐漸趨向于選擇進行安全投入,而對于監(jiān)督管理者,轉(zhuǎn)移安全經(jīng)費帶來的利益大于承擔(dān)的損失和處罰,因此,逐漸趨向于選擇放松監(jiān)管;圖2(b)表示博弈雙方?jīng)Q策相互影響演化,此博弈系統(tǒng)只存在1個均衡狀態(tài),最終收斂于(1,0),即領(lǐng)導(dǎo)決策者選擇進行安全投入,監(jiān)督管理者放松監(jiān)管。
2)圖3中,圖3(a)表示博弈雙方?jīng)Q策隨時間變化,當(dāng)領(lǐng)導(dǎo)決策者的進行安全投入的概率低于x′時,具有較高初始概率的監(jiān)督管理者傾向于嚴(yán)格監(jiān)管,反之,具有較低初始概率的監(jiān)督管理者傾向于選擇放松監(jiān)管。而當(dāng)領(lǐng)導(dǎo)監(jiān)督者的進行安全投入概率高于x′時,具有較低初始概率的監(jiān)督管理者越傾向于選擇放松監(jiān)管,反之,具有較高初始概率的監(jiān)督管理者傾向于嚴(yán)格監(jiān)管;圖3(b)表示博弈雙方?jīng)Q策相互影響演化,博弈系統(tǒng)收斂于2個穩(wěn)定點(0,1)和(1,0),即穩(wěn)定均衡策略有2個:領(lǐng)導(dǎo)決策者進行安全投入,監(jiān)督管理者放松監(jiān)管;領(lǐng)導(dǎo)決策者不進行安全投入,監(jiān)督管理者嚴(yán)格監(jiān)管。
1)安全投入對于領(lǐng)導(dǎo)決策者、監(jiān)督管理者的安全監(jiān)管策略選擇具有顯著影響。缺少專項安全投入經(jīng)費或安全經(jīng)費過少時,企業(yè)決策者和監(jiān)督管理者往往都會選擇不安全的生產(chǎn)策略。因此,企業(yè)應(yīng)當(dāng)設(shè)立安全專項經(jīng)費并嚴(yán)格落實,將安全投入納入企業(yè)考核指標(biāo),強調(diào)安全管理工作的重要性。
2)事故發(fā)生率、事故損失等因素對于博弈系統(tǒng)具有一定影響。事故發(fā)生頻率與事故損失的嚴(yán)重程度越大,決策者和監(jiān)督者越傾向于進行安全投入和嚴(yán)格監(jiān)管。因此,可以將企業(yè)的不安全行為納入社會信用體系,通過加大對企業(yè)聲譽的影響力,從側(cè)面引導(dǎo)企業(yè)進行安全管理工作,減少事故的發(fā)生。
3)當(dāng)違規(guī)生產(chǎn)或是違規(guī)監(jiān)管的處罰高于企業(yè)安全投入經(jīng)費時,企業(yè)決策者會積極進行安全投入,監(jiān)督管理者實施嚴(yán)格監(jiān)管。因此,應(yīng)當(dāng)加強建設(shè)生產(chǎn)行業(yè)內(nèi)外部監(jiān)督機制。在企業(yè)內(nèi)部,擴大安全監(jiān)管隊伍,鼓勵員工自我監(jiān)督、相互監(jiān)督,實施動態(tài)獎懲機制;在外部,政府協(xié)同監(jiān)管部門開展定期檢查,提高檢查標(biāo)準(zhǔn),加大檢查力度。