谷 月,楊 力
安徽理工大學 1.經(jīng)濟與管理學院,2.人文社會學學院,淮南,232001
隨著我國煤礦行業(yè)改革的不斷深化,煤礦安全事故有所下降,但仍不容樂觀。與國外發(fā)達國家相比,我國煤礦事故量偏大。煤礦事故致因理論認為,事故的發(fā)生不是孤立的,是多元素的共同作用結果。導致事故發(fā)生的根本原因是管理的失誤,如安全管理組織結構不合理,職責不清晰,管理理念和模式陳舊;煤礦安監(jiān)部門安全制度不健全、監(jiān)管不到位、執(zhí)法力度不大等[1]。面對當前嚴峻的煤礦安全管理形勢,要想真正實現(xiàn)煤礦安全本質(zhì)化、精細化管理,必須對安全管理中存在的風險進行充分的識別與評價,建立科學、完整的煤礦安全管理評價模型,有效減少和避免安全事故的發(fā)生。
近年來,國內(nèi)外學者對煤礦安全風險評價作了大量研究,取得豐碩成果。在國外,煤礦安全風險評價大都以概率評價為主,Poplin[2]通過收集1996—2003年美國和澳大利亞煤礦員工傷亡數(shù)據(jù),運用廣義估計方程對煤礦安全風險進行評價。在國內(nèi),學者對煤礦安全風險評價方法研究多集中于BP神經(jīng)網(wǎng)絡法、ANP、模糊綜合評價法、事故分析法等。如王爽英[3]將煤礦安全生產(chǎn)系統(tǒng)分為過程維、因素維和功能維,構建了煤礦安全生產(chǎn)風險集成管理層次結構,應用模糊層次法(Fuzzy-AHP)對其進行實證分析;曹樹剛等人[4]根據(jù)危險源理論建立瓦斯爆炸危險源風險評價模型,利用模糊數(shù)學綜合評價法對礦井瓦斯爆炸進行動態(tài)評價,確定事故危險等級,有效預警預控瓦斯爆炸;曾麗君[5]將事故樹分析法運用到風險評價中,該方法可以定性、定量分析系統(tǒng)的安全性。但在煤礦安全管理方面,由于煤礦安全管理具有復雜性、非線性、小樣本等特點,上述傳統(tǒng)的風險評價方法在實施中存在一定局限。本文提出基于熵值法和支持向量機的煤礦安全管理風險評價。首先運用熵值法求出指標權重,然后運用具有很好泛化能力的支持向量機進行綜合評價。
煤礦安全管理評價是一個復雜的系統(tǒng)工程,受多方面因素影響。因此,構建指標時要遵循科學性與系統(tǒng)性、穩(wěn)定性與動態(tài)性、實用性與簡明性等原則,設計科學合理的煤礦安全管理風險評價指標[6]。在總結國內(nèi)外相關研究文獻,并結合我國煤礦安全管理現(xiàn)狀以及大量的實地調(diào)研基礎上,確定了包括4個一級指標,13個二級指標的煤礦安全管理風險評價指標體系。具體內(nèi)容見表1。
表1 煤礦安全管理風險評價指標體系
熵值法[7-8]是一種客觀賦權法,根據(jù)各項評價指標觀測值所提供的信息量的大小來確定指標權重。在信息論中,熵是對不確定性的一種度量。信息量越大,不確定性就越小,熵也相應就越?。环粗嗳?。設有n個評價方案,m項評價指標,形成原始指標數(shù)據(jù)矩陣X=(xij)n×m,對于給定某項指標xj,指標值xij的差距越大,則該指標在綜合評價中所起的作用越大。在具體的使用過程中,熵值法根據(jù)各指標的變異程度,利用信息熵計算出各指標的熵值。再通過熵值對各指標的權重進行修正,從而得出較為客觀的指標權重。具體步驟如下:
(1)建立數(shù)據(jù)矩陣。
(1)
其中xij為第i個評價方案中的第j項指標的數(shù)值。
(2)指標的標準化處理。
正向指標:
(2)
負向指標:
(3)
(3)計算第j項指標下第i個方案占該指標的比重。
(4)
(4)計算第j項指標的熵值。
(5)
式中,k>0,ej>0,常數(shù)k與樣本數(shù)m有關,一般令k=1/lnm,則0≤e≤1。
(5)計算第j項指標的差異系數(shù)。
對于第j項指標,指標值xij的差異越大,對方案評價作用越大,熵值就越小。因此,gj=1-ej,gj越大該指標越重要。
(6)確定權數(shù)。
(6)
(7)計算各方案的綜合得分。
(7)
支持向量機[9-10]是Vapnik于20世紀90年代提出,以統(tǒng)計學中VC理論和結構風險最小化為基礎,借助于最優(yōu)化方法解決小樣本機器學習的一種新工具,能夠較好解決非線性、多維度等問題,具有很好的范化能力和魯棒性。目前在風險評價、數(shù)據(jù)挖掘、樣本分析、文本及圖像識別等領域有廣泛應用。
設已知訓練集T={(x1,y1)…,(xl,yl)}∈(X×Y)l,其中xi∈X=Rn,yi∈Y={1,-1},i=1,…,l。試據(jù)此Rn空間尋找一個實值函數(shù)g(x),以便用決策函數(shù)f(x)=sgn(g(x))來推斷任一輸入x對應的輸出y。由此可見,求解分類問題,實質(zhì)上就是找到一個把Rn空間分成兩部分規(guī)則。
2.2.1 線性問題
對于線性問題,支持向量分類機可以用一個超平面將訓練集正確劃分。其最優(yōu)原始問題如下:
s.tyi((w·xi)+b)≥1-εi,i=1,…,l
εi≥0,i=1,…l,
(8)
其中ε=(ε1,…,εl)T,εi是一個松弛變量,C>0是一個懲罰參數(shù)。
引入Lagrange函數(shù),求出原始問題的對偶問題:
(9)
(10)
2.2.2 非線性問題
對于非線性分類問題,引入核函數(shù)K(xi,xj),通過映射將輸入空間轉化為一個高維空間,將非線性問題轉變?yōu)榫€性問題,求解最優(yōu)超平面。其相應的對偶問題:
0≤ai≤C,i=1,…,l,
(11)
(12)
求得決策函數(shù):
(13)
從安全管理模式、安全管理監(jiān)控、安全管理組織、安全管理要素四個方面構建的煤礦安全管理風險評價指標,共4個一級指標,13個二級指標。以安徽省淮南、淮北礦業(yè)集團下煤礦為研究對象,運用熵值法和支持向量機進行實證研究。
選取安徽省淮南9個煤礦,淮北5個煤礦,共14個煤礦作為本文的研究樣本,采用定性和定量相結合的方法,實地調(diào)研、考察2013—2015年這14個煤礦相關的數(shù)據(jù)資料,并請煤礦高校的教授和煤礦企業(yè)安全管理人員對不可定量化、缺失數(shù)據(jù)進行打分[11-12],以百分制為基準,進行加權平均,得樣本數(shù)據(jù)如表2所示。
表2 樣本數(shù)據(jù)
由于各評價指標之間各自的量綱及量級不同而存在不可公度性,需要對指標進行標準化處理。對表2中的數(shù)據(jù)按公式(2)進行歸一化處理。結果見表3。
表3 數(shù)據(jù)歸一化結果
用EXCEL表格按照熵值法的求解步驟求出指標的特征權重、熵值、差異系數(shù),得出指標的權重。熵值法計算結果見表4。
表4 熵值法計算結果
從表4中可知,運用熵值法計算出的指標權重分別為0.247、0.262、0.238、0.254,根據(jù)公式(7)得到各樣本總評分,并對其進行歸一化處理,處理結果見表5。
表5 樣本評價結果
將表5中14組樣本數(shù)據(jù)作為支持向量機的輸入,隨機將14組樣本數(shù)據(jù)分為3類,1—8為建模的訓練樣本,9—11為優(yōu)化參數(shù)的實驗樣本,12—14為檢驗模型的檢驗樣本。同時設煤礦安全管理風險輸出y=±1,y=1表示無風險,y=-1表示有風險?;贑MSVM2.0軟件,選擇徑向基核函數(shù),通過網(wǎng)絡搜索得最優(yōu)C=3.3,g=1,然后將C和g帶入軟件進行運算得出基于熵值法和支持向量機預測結果。保持參數(shù)不變,將表3中的數(shù)據(jù)沒有經(jīng)過評價指標權重設計代入軟件運算,對比預測結果(表6)。
表6 預測結果對比表
從表6中可知,基于熵值法和支持向量機的煤礦安全管理評價模型與SVM評價相比,具有更高的準確度,與表5歸一化的總評分的實際情況也更接近。
(1)本文在相關文獻、專家建議、實地調(diào)研的基礎上,構建了煤礦安全管理風險評價指標體系,包括4個一級指標,13個二級指標。較為全面地涵蓋了煤礦安全管理的各方面,為煤礦安全管理風險評價奠定了基礎。
(2)運用熵值法和支持向量機進行評價,結果表明,與SVM模型相比,基于熵值法與支持向量機的評價模型具有更高的精確度,也與實際情況相符。