韓紅桂, 王 遠, 甄 琪
(1.北京工業(yè)大學信息學部, 北京 100124; 2.北京工業(yè)大學計算智能與智能系統(tǒng)北京市重點實驗室, 北京 100124)
在化學實驗室運行過程中,易燃、易爆、有毒、有害的危險化學品是廣泛存在的,其存取與使用存在諸多安全隱患,威脅著師生的生命與財產安全. 科學有效的化學實驗室安全風險評估是加強實驗室安全管理的重要措施[1]. 然而,由于化學實驗室藥品種類繁多、理化特性復雜、實驗室消防規(guī)定繁縟、實驗操作流程復雜,難以對化學實驗室安全進行有效評估. 因此,如何建立科學、可量化且具有廣泛適用性的實驗室安全狀況評估體系,提供客觀準確的化學實驗室安全評估方案,已得到越來越多研究者的關注.
為了對化學實驗室安全狀況進行評估,陽富強等[2]提出使用數(shù)理統(tǒng)計方法對實驗室安全進行分析和評估. Zhu等[3]建立了一種化學實驗室安全評估方法,該方法通過結合故障樹分析法和二元決策圖分析化學實驗室中的“人”“機”“環(huán)境”和“管理”4個關鍵因素,實現(xiàn)對實驗室中易爆氣瓶、壓力裝置和危險化學品的評估. 吳立榮等[4]建立了一種基于重要性加權的高校實驗室安全評價方法,該方法通過層次分析法和專家咨詢法確定評價指標并對其加權,并利用模糊綜合評價法對高校實驗室安全狀況進行評價. 張永利等[5]構建了基于D-S證據(jù)理論的安全評估方法,通過使用組合規(guī)則法和證據(jù)信息修正法改變信息的分配方式,實現(xiàn)了對安全風險的評估. 上述評價方法可以利用專家經(jīng)驗實現(xiàn)化學實驗室安全風險的評估,但專家經(jīng)驗是一種主觀的信息,會影響評估的準確性. 此外,在缺少專家指導的情況下將無法進行評估.
近年來,一些機器學習方法被引入到實驗室安全風險評估中. 機器學習以統(tǒng)計學為基礎,對獲取的訓練數(shù)據(jù)進行統(tǒng)計分析并獲得其規(guī)律,再運用獲取的規(guī)律對未知數(shù)據(jù)進行評估分析. 作為機器學習方法,人工神經(jīng)網(wǎng)絡不僅具有聯(lián)想存儲、自學習和高速尋找優(yōu)化解的功能,而且在建模過程中不依賴主觀信息,具有科學性和客觀性. 因此,一些學者在研究中引入人工神經(jīng)網(wǎng)絡方法對客觀事物狀況進行評估[6-9]. 韓紅桂等[10]建立了基于模糊神經(jīng)網(wǎng)絡的廢舊手機價值評估方法,該方法利用基于最大類差異的邊緣檢測算法解析手機圖像的區(qū)域特征,將區(qū)域特征作為評價指標,實現(xiàn)了對廢舊手機價值的準確評估. 王宗杰等[11]提出一種基于BP神經(jīng)網(wǎng)絡(back propagation neural network, BPNN)的醫(yī)患關系風險評估模型,并通過粒子群算法優(yōu)化風險評估模型,仿真結果表明該模型可以以較高的精度評估醫(yī)患關系風險. 韓紅桂等[12]提出了一種基于遞歸徑向基神經(jīng)網(wǎng)絡的膜透水率檢測方法,該方法利用主成分分析法提取評估指標,實現(xiàn)了對膜透水率的準確預測. 在安全預警方面,也有學者運用神經(jīng)網(wǎng)絡方法進行研究[13-14]. 上述神經(jīng)網(wǎng)絡通過大量訓練樣本進行建模學習時,能夠在仿真時取得較高的精確度,但是,在用于對高校化學實驗室安全狀況進行評估時會遇到訓練樣本數(shù)量較少、訓練樣本數(shù)據(jù)不全面等問題,導致神經(jīng)網(wǎng)絡無法通過訓練輸出正確的評估結果.
離散Hopfield神經(jīng)網(wǎng)絡(discrete Hopfield neural network,DHNN)具有良好的動力學特性以及聯(lián)想記憶功能,在缺少訓練樣本的情況下,能夠通過記憶學習模式代替大量訓練樣本,提高網(wǎng)絡輸出精度[15]. 多項研究表明,DHNN可以廣泛地應用于能力評估[16-17]、圖像分類[18]、混合光譜分解[19]、最大切割問題[20]、信號檢測[21]、模式識別[22]等領域. 王勁松等[23]構建了一種基于DHNN的網(wǎng)絡空間信息防御能力評估模型,實驗結果表明,該方法能夠對網(wǎng)絡空間信息防御能力直觀、快速、準確地評估且誤差較小. 上述研究表明,DHNN可以應用于能力和性能評估且泛用性較強. 因此,文中構造一種基于DHNN的實驗室安全狀況評估模型,并且引入學習率和調整率對網(wǎng)絡的學習過程進行優(yōu)化,實現(xiàn)在缺少訓練樣本的情況下完成對實驗室安全狀況的完整評估. 本文主要從以下幾個方面進行研究:首先,分析化學實驗室中與安全風險相關的指標,建立化學實驗室安全風險多指標評估體系;然后,利用模糊綜合評價法對評估體系中各項二級指標進行分析量化,得到編碼后的待評估數(shù)據(jù);最后,構建一種基于DHNN的安全狀況評估模型,對網(wǎng)絡的學習過程進行優(yōu)化,并且對網(wǎng)絡的泛化能力進行驗證.
為了對化學實驗室安全狀況進行全面評估,建立化學實驗室多指標評估體系及評語體系,并為每個指標編碼. 構建基于DHNN的實驗室安全狀況定性評估模型,流程如圖1所示.
圖1 基于DHNN的實驗室安全狀況定性評估模型Fig.1 Qualitative evaluation model of laboratory safety status based on DHNN
遵循全面性、科學性、代表性與可比性的原則,通過查閱化學實驗室安全事故事件資料、現(xiàn)場考察北京某大學實驗室實際情況、查閱法律法規(guī)以及國內外高校實驗室安全管理手冊,并參考專家意見,設立5個一級指標[4,24]:人員安全狀況、儀器設備安全狀況、環(huán)境安全狀況、管理制度安全狀況和應急響應安全狀況. 這5項一級指標涵蓋了實驗室實驗活動的主體和客體,并且考慮了管理和應急層面的因素,具有代表性. 利用層次分析法,以實驗室安全狀況評估作為目標層,以人員安全狀況、儀器設備安全狀況、環(huán)境安全狀況、管理制度安全狀況和應急響應安全狀況作為因素層,建立化學實驗室安全狀況評估體系,即
I(t)=[A(t),B(t),C(t),D(t),E(t)]
(1)
式中:I(t)為評估指標體系矩陣;A(t)為人員安全狀況一級指標向量;B(t)為儀器設備安全狀況一級指標向量;C(t)為環(huán)境安全狀況一級指標向量;D(t)為管理制度安全狀況一級指標向量;E(t)為應急響應安全狀況一級指標向量. 對5個一級指標進行細化,得到每個一級指標下的二級指標.
1.1.1 人員安全狀況評估指標
人員是進行實驗操作的主體,實驗人員的主觀能動性影響其他參與實驗的客體,人員的綜合素質與實驗室安全狀況直接相關. 以人員安全狀況為因素層一級指標,其包括的二級指標為
A(t)=[a1(t),a2(t),…,a8(t)]
(2)
式中:a1(t)為人員身體狀況;a2(t)為人員安全意識狀況;a3(t)人員實驗水平;a4(t)為人員實驗經(jīng)驗;a5(t)為人員心理素質;a6(t)為人員安全知識掌握情況;a7(t)為人員應急反應水平;a8(t)為人員應急反應知識掌握情況.
1.1.2 儀器設備安全狀況評估指標
儀器設備為人員提供了進行實驗操作的平臺,通過分析儀器設備的各方面狀況,能夠確定實驗室發(fā)生危險狀況的概率. 以儀器設備安全狀況為因素層一級指標,其包括的二級指標為
B(t)=[b1(t),b2(t),…,b8(t)]
(3)
式中:b1(t)為實驗儀器保養(yǎng)狀況;b2(t)為實驗儀器存放狀況;b3(t)為實驗儀器安全檢查狀況;b4(t)為實驗儀器使用時遵守安全規(guī)范狀況;b5(t)為實驗儀器安全運行狀況;b6(t)為安全指示標志狀況;b7(t)為安全警報狀況;b8(t)為安全防護設施狀況.
1.1.3 環(huán)境安全狀況評估指標
環(huán)境指的是實驗操作所處的空間,對環(huán)境安全狀況中包含的各個因素進行分析,能幫助維護實驗室的安全運行. 以環(huán)境安全狀況為因素層一級指標,其包括的二級指標為
C(t)=[c1(t),c2(t),…,c7(t)]
(4)
式中:c1(t)為通風照明設備運行狀況;c2(t)為三廢處理狀況;c3(t)為三廢排放狀況;c4(t)為控溫控濕設備運行狀況;c5(t)為防火防爆設備運行狀況;c6(t)為實驗環(huán)境衛(wèi)生狀況;c7(t)為電路與水氣管道設備運行狀況.
1.1.4 管理制度安全狀況評估指標
依靠管理制度對危險化學品進行細致的管理,能夠降低實驗室發(fā)生危險狀況的概率. 以管理制度安全狀況為因素層一級指標,其包括的二級指標為
D(t)=[d1(t),d2(t),…,d7(t)]
(5)
式中:d1(t)為危險化學品存放狀況;d2(t)為危險化學品化學性質穩(wěn)定狀況;d3(t)為危險化學品領用記錄情況;d4(t)為危險化學品取用報備清單填寫情況;d5(t)為危險化學品管理人員負責情況;d6(t)為安全設備管理人員負責情況;d7(t)為定期安全檢查運行情況.
1.1.5 應急響應安全狀況評估指標
應急響應指的是在實驗室發(fā)生險情時,利用應急設備、應急預案、應急資源,通過應急通道和定期應急培訓與演習保護人員的生命安全,降低財產損失的能力. 以應急響應安全狀況為因素層一級指標,其包括的二級指標為
E(t)=[e1(t),e2(t),…,e5(t)]
(6)
式中:e1(t)為應急設備狀況;e2(t)為應急預案狀況;e3(t)為急救資源狀況;e4(t)為應急疏散通道狀況;e5(t)為定期應急培訓和演練執(zhí)行情況.
通過建立一個合理的安全事故風險等級評語體系,實現(xiàn)對每一項二級指標賦予風險等級評語,完成對該項二級指標風險狀況的直觀描述.
合理的安全事故風險等級評語體系需要綜合考慮安全事故發(fā)生概率與發(fā)生安全事故時造成的危害程度. 通過專家咨詢法將安全事故發(fā)生概率從低到高進行排序,完成對安全事故產生概率和危害程度的層次劃分,如表1所示.
表1 安全事故產生概率及危害等級評估
對每個安全事故的危害等級與安全事故發(fā)生概率進行綜合考慮,得到每個危害等級在不同概率下的安全事故風險程度,將安全事故風險程度劃分為5個等級,得到的5個安全事故風險等級評語為理想、可容忍、不理想、很差和無法接受. 使用這些評價結果構建的評價集為
P(t)=[p1(t),p2(t),…,p5(t)]
(7)
式中:p1(t)表示理想;p2(t)表示可容忍;p3(t)表示不理想;p4(t)表示很差;p5(t)表示無法接受. 根據(jù)風險等級評語構建安全狀況評語體系,如表2所示. 表中:p1表示安全事故等級評語為理想,代表危害造成影響較小,損失較小且發(fā)生概率低于中等概率;p2表示安全事故等級評語為可容忍,代表危害造成輕微影響且發(fā)生概率低于稍高概率;p3表示安全事故等級評語為不理想,代表危害造成一定程度影響且發(fā)生概率低于較高概率;p4表示安全事故等級評語為很差,代表危害造成嚴重影響,損失很大且發(fā)生概率低于較高概率;p5表示安全事故等級評語為無法接受,代表危害造成嚴重影響且發(fā)生概率接近較高概率.
表2 安全事故風險等級評語集矩陣
模糊綜合評價法是應用模糊數(shù)學理論的綜合評估方法,運用多指標評價來獲得事物的隸屬度信息,具有系統(tǒng)性強、結論清晰等特點. 由于對實驗室安全狀況的評估是一個多層次、多因素的復雜綜合評價問題,可以使用劃分層次的風險等級評語體系定性描述一級和二級指標,故可以使用模糊綜合評價法對實驗室安全狀況進行量化描述.
以人員安全狀況為例,模糊綜合評價法的執(zhí)行步驟[25]如下.
1) 建立因素集和評價集
因素集是以人員安全狀況影響因素為元素所組成的一個普通集合,與前述A(t)相同. 評價集是評價者對人員安全狀況做出的評價結果集合,用P(t)表示.
2) 建立模糊綜合評價矩陣
因素集的評價矩陣為
(8)
3) 確定因素權值
評價工作中各因素的重要程度有所不同,為此,建立因素權向量
VA(t)=[v1(t),v2(t),…,v8(t)]
(9)
式中vq(t)為A(t)中第q個因素的權值.
4) 建立綜合評價模型
評價結果為
BA(t)=VA(t)RA(t)
(10)
式中BA(t)表示因素集的得分矩陣. 對于BA(t)中包含的各項二級指標,使用高斯型隸屬度函數(shù)將評價集P(t)中5個安全事故風險等級評語的得分區(qū)間劃分為(95,100]、(85,95]、(75,85]、(65,75]、(55,65],根據(jù)最大隸屬度原則,確定人員安全狀況中各項二級指標的評價等級.
創(chuàng)建用于評估人員安全狀況、儀器設備安全狀況、環(huán)境安全狀況、管理制度安全狀況、應急響應安全狀況的神經(jīng)網(wǎng)絡評估模型輸入矩陣. 以人員安全狀況為例,輸入矩陣的行數(shù)為8,分別表示1.1.1中設計的8個二級指標:a1(t)、a2(t)、a3(t)、a4(t)、a5(t)、a6(t)、a7(t)、a8(t),輸入矩陣的列數(shù)為5,分別表示1.2中設計的5個評語:理想、可容忍、不理想、很差和無法接受.
根據(jù)2.1中提出的方法,得到對人員安全狀況、儀器設備安全狀況、環(huán)境安全狀況、管理制度安全狀況與應急響應安全狀況中每一項二級指標的評語,根據(jù)以上評語為每個輸入矩陣編碼[26]. 當某二級指標評語為理想時,該二級指標所在行的第1列編碼為1,其余列為-1;當某二級指標評語為可容忍時,該二級指標所在行的第2列編碼為1,其余列為-1;當某二級指標評語為不理想時,該二級指標所在行的第3列編碼為1,其余列為-1;當某二級指標評語為很差時,該二級指標所在行的第4列編碼為1,其余列為-1;當某二級指標評語為無法接受時,該二級指標所在行的第5列編碼為1,其余列為-1. 以人員安全狀況為例,其輸入編碼矩陣為
(11)
為了對化學實驗室安全狀況進行客觀評估,建立用于評價人員安全狀況、儀器設備安全狀況、環(huán)境安全狀況、管理制度安全狀況、應急響應安全狀況的DHNN評估模型. 這里以人員安全狀況為例建立評估模型.
1) 神經(jīng)元輸入
DHNN在第t次迭代時,某一神經(jīng)元的輸入為其他神經(jīng)元的加權輸出,第1行第1列神經(jīng)元的輸入為
(12)
(13)
2) 神經(jīng)元的輸出
DHNN神經(jīng)元的輸出由二值函數(shù)計算,第1行第1列神經(jīng)元的輸出為
(14)
由式(14)得到HA神經(jīng)網(wǎng)絡的輸出矩陣為
(15)
在對高校化學實驗室安全狀況進行評估時,會遇到訓練樣本數(shù)量較少、訓練樣本數(shù)據(jù)不全面等問題,可以通過對樣本進行記憶以替代大量訓練樣本,同時提高網(wǎng)絡輸出精度,從而提高評估的準確性. DHNN進行記憶的過程本質上是建立權值矩陣的過程[28],因為網(wǎng)絡依次將待記憶樣本加入權值矩陣,所以有可能出現(xiàn)遺忘已記憶樣本的情況,無法在仿真階段對某些樣本實現(xiàn)正確回憶. 本文使用以下方法來修正DHNN在記憶多個樣本時無法準確回憶的問題.
設網(wǎng)絡具有m個輸入模式的記憶樣本為Km,當網(wǎng)絡經(jīng)過多次迭代達到穩(wěn)態(tài)后,此時的輸出矩陣YA(t)也應為某一輸入模式Km,即
(16)
(17)
(18)
(19)
式中δ為調整率.
采用以上學習方式,將具有m個模式的記憶樣本Km中每個模式依次進行學習,通過對它們的反復學習不斷修正權值矩陣,使得DHNN可以對任意記憶的模式進行正確回憶,增強了網(wǎng)絡的記憶性能,從而提高評估時的識別率.
利用因素層的二級指標建立各個一級指標的評估模型,并利用一級指標建立目標層的評估模型. 具體運行步驟如下.
步驟1利用因素層的二級指標A(t)、B(t)、C(t)、D(t)、E(t)建立因素層中各個一級指標的評估模型,確定每個評估模型的初始結構和連接權值.
步驟2計算一級指標的評估模型中每個神經(jīng)元在第t次迭代時的狀態(tài).
步驟3判斷一級指標的評估模型是否處于穩(wěn)定狀態(tài):若未達到穩(wěn)定狀態(tài),則返回步驟2,重新執(zhí)行步驟2、3;若達到穩(wěn)定狀態(tài),則到步驟4.
步驟4利用一級指標I(t)建立目標層的評估模型,確定目標層評估模型的初始結構和連接權值.
步驟5計算目標層評估模型中每個神經(jīng)元在第t次迭代時的狀態(tài).
步驟6判斷目標層評估模型是否處于穩(wěn)定狀態(tài):若未達到穩(wěn)定狀態(tài),則返回步驟5,重新執(zhí)行步驟5、6;若達到穩(wěn)定狀態(tài),則輸出評估結果.
以完成編碼的實驗室安全狀況評估數(shù)據(jù)為輸入,以DHNN對這些信息的評估結果為輸出. 創(chuàng)建5個DHNN,分別對人員安全狀況、儀器設備安全狀況、環(huán)境安全狀況、管理制度安全狀況和應急響應安全狀況進行評估.
將5個完成打分的實驗室數(shù)據(jù)根據(jù)前文規(guī)則進行編碼,把編碼后的數(shù)據(jù)輸入對應的DHNN中,以神經(jīng)網(wǎng)絡最終的輸出狀態(tài)作為安全狀況評估結果. 此處以人員安全狀況評估結果為例,見圖2.
為了增強數(shù)據(jù)的可讀性,使用●代表神經(jīng)元處于激活狀態(tài),使用○代表神經(jīng)元未激活. 圖2(a)為5個評語標準值的編碼;圖2(b)為5個待評估對象的編碼;圖2(c)為通過DHNN得到的仿真評估結果. 5個評估對象的結果分別為:B、B、A、A和D.
在獲得全部5個一級指標的評估結果后,將每個一級指標的評估結果作為新的輸入變量輸入到DHNN中,經(jīng)過多次迭代DHNN處于穩(wěn)態(tài),即可獲得綜合全部一級指標狀況評估的全因素安全狀況評估結果,見圖3.
通過DHNN進行評估,得到綜合全因素指標的實驗室安全狀況評估結果分別為B、B、B、A和D,將評估結果與通過數(shù)理統(tǒng)計方法得到的結果進行對比,發(fā)現(xiàn)評估結果一致. 這說明DHNN成功在樣本數(shù)量較少、數(shù)據(jù)不全面的情況下通過回憶將輸入的評估數(shù)據(jù)正確分類,證明DHNN可以客觀、方便、有效地對實驗室安全狀況進行分類與評估.
圖3 實驗室整體安全狀況的等級指標、輸入的 評估數(shù)據(jù)和DHNN評估結果Fig.3 Level indexes, input data and DHNN evaluation results of laboratory overall safety status
為了驗證DHNN實驗室安全狀況評估模型的評估能力,證明其科學性與有效性,利用收集到的35份實驗室人員安全狀況數(shù)據(jù),經(jīng)過編碼后將其輸入至構建的DHNN評估模型中. 同時,將相同數(shù)據(jù)作為分類對象,輸入至K最近鄰算法(K-nearest neighbor, KNN)、BPNN和支持向量機(support vector machine, SVM)評估方法中進行對比實驗[29],結果如表3所示. 結果表明,DHNN評估模型可以很好地進行實驗室安全狀況評估,與其他幾種典型的分類方法相比,克服了在訓練樣本較少以及訓練樣本維度缺失的情況下評估結果不可靠的問題,仍然保持很高的準確度以及收斂速度,驗證了DHNN的泛用性以及準確性.
表3 DHNN以及其他評估方法對實驗室人員安全 狀況的評估準確率
1) 構建的化學實驗室安全風險多指標評估體系全面包括了影響實驗室安全的因素.
2) 基于DHNN的化學實驗室安全評估方法可以實現(xiàn)在訓練樣本較少的情況下對實驗室安全進行有效評估.
3) 將所提出的評估方法應用于實際實驗室的評估中,并與其他4種評估方法進行對比實驗,結果表明所提出的方法具有較高的評估精度.