潘 燕
(福建農(nóng)業(yè)職業(yè)技術(shù)學(xué)院,福建 福州 350007)
煤礦開采是我國一項(xiàng)基本工業(yè)生產(chǎn)活動(dòng),但由于工作環(huán)境惡劣,被劃分為高危行業(yè)。近年來,國內(nèi)外礦難事故頻發(fā),不僅造成巨大經(jīng)濟(jì)損失,也為工作人員的生命安全帶來威脅。因此,煤礦能源安全問題引起社會(huì)關(guān)注,政府等相關(guān)部門對(duì)該行業(yè)進(jìn)行大力整頓與規(guī)范,通過制定嚴(yán)格的管理措施將礦難風(fēng)險(xiǎn)降到最低。但針對(duì)煤礦能源而言,除了加大管理力度外,還需利用先進(jìn)技術(shù)和設(shè)備做好礦難預(yù)防和及時(shí)救援等工作。國外的煤礦監(jiān)測技術(shù)起步較早,在開采過程中布置大量監(jiān)測點(diǎn),采集海量相關(guān)信息,將這些信息作為監(jiān)測依據(jù)[1],但是方法沒有深層次挖掘信息,無法發(fā)現(xiàn)隱藏的危險(xiǎn)因子。目前,國內(nèi)一些學(xué)者也紛紛投入到此項(xiàng)研究中。借鑒了國外的監(jiān)測經(jīng)驗(yàn),再利用數(shù)據(jù)挖掘算法預(yù)測可能發(fā)生的事故。有關(guān)學(xué)者將互聯(lián)網(wǎng)和云計(jì)算技術(shù)相結(jié)合,采集并儲(chǔ)存海量數(shù)據(jù),利用數(shù)據(jù)挖掘和視頻分析技術(shù)發(fā)現(xiàn)現(xiàn)場生產(chǎn)規(guī)律,挖掘出潛在的安全風(fēng)險(xiǎn)和隱患[2]。還有相關(guān)學(xué)者設(shè)計(jì)一種數(shù)據(jù)分析模型。利用小波分析、偏離均值分析、軌跡相似性分析等多種模型,建立監(jiān)測大數(shù)據(jù)分析架構(gòu);采用數(shù)據(jù)挖掘技術(shù)選取價(jià)值較高的數(shù)據(jù),構(gòu)建遠(yuǎn)程監(jiān)管大數(shù)據(jù)分析系統(tǒng),通過散點(diǎn)圖等多種可視化工具展示出挖掘分析結(jié)果[3]。
煤礦能源監(jiān)管數(shù)據(jù)主要包括有關(guān)空間定位等類型的地理數(shù)據(jù),這些數(shù)據(jù)通常存在空間性、抽象性和非線性特征。通過數(shù)據(jù)挖掘算法在海量信息中找出隱含細(xì)節(jié),其中關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘的重要部分,能很好地滿足非線性數(shù)據(jù)處理要求[4],通過實(shí)時(shí)監(jiān)測數(shù)據(jù)樣本,達(dá)到煤礦能源監(jiān)管目的。本文將粗糙集和神經(jīng)網(wǎng)絡(luò)算法相結(jié)合構(gòu)建數(shù)據(jù)挖掘模型[5],將該模型應(yīng)用在煤礦能源保護(hù)監(jiān)管中,根據(jù)關(guān)聯(lián)規(guī)則,獲得煤礦安全和瓦斯?jié)舛扰c日生產(chǎn)量有關(guān)的結(jié)論[6]。該方法能夠提供更加有效的措施確保煤礦安全生產(chǎn),提高經(jīng)濟(jì)與社會(huì)效益。
監(jiān)測系統(tǒng)主要監(jiān)測煤礦瓦斯?jié)舛?、溫度等信息[7],需結(jié)合煤礦實(shí)際情況,布置各監(jiān)測點(diǎn),每個(gè)監(jiān)測點(diǎn)之間距離應(yīng)適當(dāng)。由于監(jiān)測的數(shù)據(jù)需從井下發(fā)送到地面,易受環(huán)境干擾,所以監(jiān)測系統(tǒng)必須具備超強(qiáng)的抗干擾性能。監(jiān)測系統(tǒng)結(jié)構(gòu)如圖1所示。
由圖1可以看出,監(jiān)測系統(tǒng)包括信息層、控制層、設(shè)備層。①信息層[8]:負(fù)責(zé)煤礦所有職能部門的數(shù)據(jù)共享,利用資源管理平臺(tái),充分調(diào)用各方面資源,實(shí)時(shí)全面地掌握作業(yè)過程。②控制層[9]:處理煤礦開采過程中系統(tǒng)和站點(diǎn)間的全部數(shù)據(jù),是連接信息層與設(shè)備層的橋梁??刂茖佑挚煞譃橹鞲删W(wǎng)與子網(wǎng)[10],為提高通信效果,在總線中安裝中繼器提高信號(hào)質(zhì)量。③設(shè)備層:是監(jiān)測系統(tǒng)最底層的處理單元,包括傳感器和執(zhí)行器等設(shè)備[11],這些設(shè)備安裝成本低,工作效率高,可達(dá)到減少開支的目的。
圖1 監(jiān)測系統(tǒng)結(jié)構(gòu)Fig.1 Structure of monitoring system
1.2.1 模型整體結(jié)構(gòu)
根據(jù)煤礦監(jiān)測系統(tǒng)結(jié)構(gòu)和特點(diǎn),利用空間數(shù)據(jù)挖掘技術(shù)設(shè)計(jì)一種適用于該系統(tǒng)的保護(hù)監(jiān)管模型。
為快速、準(zhǔn)確地處理煤礦能源相關(guān)信息,采用粗糙集和神經(jīng)網(wǎng)絡(luò)相結(jié)合的關(guān)聯(lián)規(guī)則挖掘算法深度挖掘信息,發(fā)現(xiàn)不同因素之間的關(guān)聯(lián)[12],確定保護(hù)監(jiān)管方案。結(jié)合數(shù)據(jù)挖掘結(jié)構(gòu),該模型由數(shù)據(jù)采集、處理、挖掘等模塊構(gòu)成,模型整體結(jié)構(gòu)如圖2所示。
圖2 數(shù)據(jù)挖掘模型整體結(jié)構(gòu)設(shè)計(jì)Fig.2 Overall structure design diagram of data mining model
1.2.2 粗糙集和神經(jīng)網(wǎng)絡(luò)算法的融合
龐大的數(shù)據(jù)量會(huì)給數(shù)據(jù)庫帶來很多問題,例如數(shù)據(jù)冗余、失真等現(xiàn)象,嚴(yán)重影響數(shù)據(jù)挖掘的精準(zhǔn)度。而粗糙集理論比較擅長處理這些冗余數(shù)據(jù),將處理后的數(shù)據(jù)輸入到神經(jīng)網(wǎng)絡(luò)中,網(wǎng)絡(luò)模型的訓(xùn)練時(shí)間大大縮短,提高網(wǎng)絡(luò)泛化能力[13]。
粗糙集和神經(jīng)網(wǎng)絡(luò)相結(jié)合的數(shù)據(jù)挖掘核心是屬性約簡,主要難點(diǎn)是確定粗糙集約簡的停止條件,也可以說成是神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本數(shù)量的確定問題。
訓(xùn)練樣本數(shù)量影響著神經(jīng)網(wǎng)絡(luò)精度,通常利用均方根誤差表示學(xué)習(xí)能力[14],表達(dá)式如下:
(1)
式中,m、n分別為訓(xùn)練樣本和神經(jīng)網(wǎng)絡(luò)輸出單元數(shù)量;i為第i個(gè)樣本;j為第j個(gè)輸出單元;x為系數(shù);y為代價(jià)指標(biāo)。
通過公式可知,若樣本數(shù)量增加,則誤差減少,但如果樣本數(shù)量過大,網(wǎng)絡(luò)訓(xùn)練時(shí)間也會(huì)增多?;谶@一矛盾,引入代價(jià)函數(shù)概念[15],則誤差函數(shù)改寫為:
(2)
能夠看出公式中增加了自變量U,若U=1則函數(shù)為原來形式。通過代價(jià)函數(shù)形式為:
(3)
利用上述方法,設(shè)定理想誤差閾值,當(dāng)滿足粗糙集約簡條件時(shí),停止迭代,確定了神經(jīng)網(wǎng)絡(luò)輸入樣本數(shù)量。
1.2.3 挖掘過程分析
計(jì)算出代價(jià)函數(shù),就確定了訓(xùn)練樣本的選取依據(jù),基于粗糙集和神經(jīng)網(wǎng)絡(luò)的空間數(shù)據(jù)挖掘算法在煤礦能源監(jiān)管中的應(yīng)用過程如下。
第一步:采集數(shù)據(jù),確定挖掘條件和目標(biāo)[16]。
第二步:結(jié)合粗糙集相關(guān)理論,去除冗余屬性,完成數(shù)據(jù)的離散、約簡處理。
第三步:若當(dāng)前約簡表為屬性最少,選擇訓(xùn)練樣本集合,反之結(jié)合代價(jià)函數(shù)與約簡屬性計(jì)算全部樣本,如果結(jié)果遠(yuǎn)低于約簡后的數(shù)量,則返回步驟二繼續(xù)處理,反之根據(jù)推薦代價(jià)范圍選擇訓(xùn)練樣本集合。
第四步:按照訓(xùn)練樣本數(shù)量設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)。本文建立BP形式的神經(jīng)網(wǎng)絡(luò),在數(shù)據(jù)挖掘過程中,輸入神經(jīng)元數(shù)量必須低于數(shù)據(jù)表中的屬性數(shù)量。使用粗糙集預(yù)處理采集到的瓦斯?jié)舛?、溫度等?shù)據(jù),數(shù)據(jù)種類決定了輸入層神經(jīng)元數(shù)量;結(jié)合煤礦能源監(jiān)管要求,將輸出神經(jīng)元數(shù)量設(shè)置為3個(gè),包括低安全、中安全和高安全。
隱含層設(shè)計(jì)包括隱含層數(shù)量與神經(jīng)元數(shù)量確定,確定過程一般依賴專家經(jīng)驗(yàn)[17],神經(jīng)元數(shù)量確定方式如下:
(4)
(5)
式中,k為訓(xùn)練樣本數(shù)量;u和u′分別為輸入神經(jīng)元和隱含層神經(jīng)元數(shù)量[18-20];h為輸出神經(jīng)元神經(jīng)元數(shù)量;a為一個(gè)常數(shù)取值范圍,[1,10]。
第五步:通過神經(jīng)網(wǎng)絡(luò)訓(xùn)練得到空間數(shù)據(jù)挖掘規(guī)則。算法整體流程如圖3所示。
圖3 挖掘過程Fig.3 Mining process
本文將某地區(qū)監(jiān)控分站和所有傳感器采集的信息作為初始數(shù)據(jù)。選用Tip DM數(shù)據(jù)挖掘平臺(tái),將Java作為開發(fā)語言,支持上述挖掘模型的實(shí)現(xiàn)。該平臺(tái)能夠完成數(shù)據(jù)挖掘的所有流程,同時(shí)可提供應(yīng)用接口,滿足不同類型應(yīng)用需求。平臺(tái)在煤礦井內(nèi)的具體應(yīng)用現(xiàn)場如圖4和圖5所示。
圖4 安裝在煤礦井內(nèi)安全監(jiān)管系統(tǒng)Fig.4 Safety supervision system installed in coal mine well
圖5 煤礦內(nèi)基于空間數(shù)據(jù)的無線監(jiān)控傳輸設(shè)備Fig.5 Wireless monitoring and transmission equipment based on space data in a coal mine
根據(jù)各監(jiān)測信息類型,構(gòu)建的監(jiān)管數(shù)據(jù)庫如圖6所示。
圖6 某煤礦安全監(jiān)管數(shù)據(jù)庫Fig.6 A coal mine safety supervision database
(1)應(yīng)用步驟。將本文建立的數(shù)據(jù)挖掘模型應(yīng)用在煤礦能源保護(hù)監(jiān)管中的主要過程如圖7所示。
圖7 應(yīng)用過程Fig.7 Application process
(2)模型參數(shù)輸入。參數(shù)輸入包括原始采集數(shù)據(jù)和建模參數(shù)2部分。其中采集的數(shù)據(jù)是有關(guān)煤礦資源安全的預(yù)警數(shù)據(jù),例如瓦斯?jié)舛?、一氧化碳濃度、溫度等,分析這些數(shù)據(jù)能夠?yàn)槊旱V安全監(jiān)管提供輔助信息。將2020年12月某日的監(jiān)測信息作為初始數(shù)據(jù),每隔2 h監(jiān)測1次,構(gòu)建初始數(shù)據(jù)庫,初始監(jiān)測數(shù)據(jù)信息見表1。
表1 初始監(jiān)測數(shù)據(jù)信息Tab.1 Initial monitoring data information
建模參數(shù)見表2。
表2 建模參數(shù)Tab.2 Modeling parameters
(3)數(shù)據(jù)預(yù)處理。由輸入到模型中的初始數(shù)據(jù)可知,這些數(shù)據(jù)都是多維的、隨機(jī)的,來自不同監(jiān)測站和傳感器。因此,在數(shù)據(jù)挖掘前,需做預(yù)處理,處理結(jié)果見表3。
根據(jù)表3所示的數(shù)據(jù)預(yù)處理結(jié)果針對(duì)初始數(shù)據(jù)做事務(wù)轉(zhuǎn)換,將轉(zhuǎn)換后的數(shù)據(jù)輸入到本文建立的數(shù)據(jù)挖掘模型中,將初始支持度閾值和置信度閾值分別設(shè)置為50%和45%,獲得的關(guān)聯(lián)規(guī)則見表4。
表3 數(shù)據(jù)預(yù)處理結(jié)果Tab.3 Data preprocessing results
由表4可以看出,當(dāng)瓦斯?jié)舛群烷_采量二者同時(shí)較高時(shí),關(guān)聯(lián)規(guī)則的支持度高達(dá)78.9%;當(dāng)瓦斯?jié)舛群烷_采量之間有一個(gè)指標(biāo)較高時(shí),支持度較高;關(guān)聯(lián)規(guī)則中如果沒有出現(xiàn)這2個(gè)指標(biāo),此時(shí)支持度普遍偏低。因此能夠得出,要想保證煤礦能源安全,必須掌握每日開采量和瓦斯?jié)舛?。管理人員應(yīng)結(jié)合挖掘結(jié)果,當(dāng)瓦斯?jié)舛然蜷_采量較高時(shí)及時(shí)對(duì)現(xiàn)場進(jìn)行控制,將安全隱患在源頭消滅。
表4 關(guān)聯(lián)規(guī)則生成Tab.4 Association rules generate
安全生產(chǎn)是現(xiàn)代工業(yè)管理中尤為關(guān)鍵的內(nèi)容,為了減少經(jīng)濟(jì)損失,保障工人生命安全,本文將空間數(shù)據(jù)挖掘技術(shù)應(yīng)用在煤礦能源保護(hù)監(jiān)管中。將粗糙集和神經(jīng)網(wǎng)絡(luò)算法相結(jié)合,建立空間數(shù)據(jù)挖掘模型,確定挖掘過程,并將該模型應(yīng)用到實(shí)際場景中,通過數(shù)據(jù)采集、處理等過程生成關(guān)聯(lián)規(guī)則,通過關(guān)聯(lián)規(guī)則得出影響煤礦能源安全的主要因素。該方法滿足了現(xiàn)代工業(yè)管理需求,為煤炭企業(yè)決策提供可行依據(jù),不僅提高了生產(chǎn)效率,也為工人安全提供了保障。