徐平安,張若楠,周小雨,趙琦琦
(平安煤炭開采工程技術(shù)研究院有限責(zé)任公司,安徽 淮南 232000)
煤礦在正常生產(chǎn)過程中,需嚴(yán)格控制采掘工作面瓦斯?jié)舛仍?%以下,然而在遇到構(gòu)造、風(fēng)量不足、區(qū)域瓦斯含量增高等情況時(shí),采掘工作面瓦斯?jié)舛确浅H菀壮蕖C旱V發(fā)生瓦斯災(zāi)害前,往往伴隨瓦斯?jié)舛犬惓?因此準(zhǔn)確判斷瓦斯?jié)舛仁沁M(jìn)行瓦斯突出預(yù)測(cè)、通風(fēng)設(shè)計(jì)等工作的基礎(chǔ)。
煤炭資源是中國(guó)重要的基礎(chǔ)能源資源,伴隨著煤礦開采深度加深,瓦斯災(zāi)害越來越成為影響開采安全性的重要因素。周明[1]提出一種基于ELM的煤礦瓦斯?jié)舛阮A(yù)測(cè)方法,并對(duì)其進(jìn)行深入研究,并通過實(shí)驗(yàn)驗(yàn)證其對(duì)于煤礦瓦斯預(yù)測(cè)的可行性;劉鋒[2]提出一種基于PCA-RVM的煤礦瓦斯?jié)舛阮A(yù)測(cè)方法,其通過在PCA的基礎(chǔ)上進(jìn)行改進(jìn)達(dá)到相較于使用PCA方法預(yù)測(cè)瓦斯?jié)舛雀玫念A(yù)測(cè)結(jié)果;蔡亞東[3]提出一種基于概率密度機(jī)的瓦斯?jié)舛阮A(yù)測(cè)方法,通過深入研究與瓦斯?jié)舛认嚓P(guān)的概率模型,實(shí)現(xiàn)對(duì)煤礦瓦斯?jié)舛鹊念A(yù)測(cè);戚昱[4]通過研究信息融合與GA-BA 2種模型方法相互結(jié)合,實(shí)現(xiàn)精確預(yù)測(cè)煤礦瓦斯?jié)舛?馬莉等[5]深度結(jié)合PSO、Adam、GRU方法提出PSO-Adam-GRU方法并將該方法應(yīng)用到煤礦瓦斯預(yù)測(cè)中;王勇哲[6]通過研究信息融合技術(shù)與瓦斯?jié)舛鹊臄?shù)值關(guān)系,實(shí)現(xiàn)煤礦瓦斯的濃度預(yù)測(cè)以及安全評(píng)估。綜上所述,通過數(shù)學(xué)方法建模煤礦瓦斯?jié)舛阮A(yù)測(cè)模型是具有一定可行性的,但目前的方法仍存在無法擬合實(shí)時(shí)煤礦瓦斯數(shù)據(jù),并需要考慮影響煤礦瓦斯?jié)舛鹊亩喾N因素的問題。
近年來隨著神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展,如何將神經(jīng)網(wǎng)絡(luò)方法與煤炭瓦斯監(jiān)測(cè)相結(jié)合成為學(xué)術(shù)研究的重要課題。李旭等[7]提出一種基于長(zhǎng)短期記憶-門控循環(huán)單元的神經(jīng)網(wǎng)絡(luò)瓦斯?jié)舛刃蛄蓄A(yù)測(cè)算法,并通過使用吉林八連城南11902上順工作面一年的實(shí)驗(yàn)數(shù)據(jù)驗(yàn)證該方法的可行性;謝謙等[8]在針對(duì)LSTM算法的反向傳播過程中使用的Adam算法進(jìn)行改進(jìn),并結(jié)合Attention機(jī)制提出Attention-aLSTM算法,實(shí)現(xiàn)在LSTM算法的基礎(chǔ)上針對(duì)預(yù)測(cè)性能提升14.2%;王德忠等[9]利用GA算法優(yōu)化LSTM網(wǎng)絡(luò)參數(shù),以解決LSTM網(wǎng)絡(luò)預(yù)測(cè)不平衡和易陷入局部極值的問題,提出GA-LSTM瓦斯?jié)舛阮A(yù)測(cè)模型,相較于RNN和BP方法得到了更加準(zhǔn)確的瓦斯?jié)舛阮A(yù)測(cè)結(jié)果;蘭海平等[10]基于LSTM方法研究針對(duì)瓦斯超限和煤與瓦斯突出事故的超前預(yù)測(cè)模型,并驗(yàn)證其子樣本長(zhǎng)度和超前預(yù)測(cè)時(shí)長(zhǎng)的關(guān)系;李鋮翔[11]通過分析GRNN神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)及原理,驗(yàn)證其在瓦斯?jié)舛阮A(yù)警方面的可應(yīng)用性;劉超等[12]通過運(yùn)行皮爾遜系數(shù)對(duì)瓦斯?jié)舛葦?shù)據(jù)進(jìn)行特征選擇,提出Pearson-LSTM預(yù)測(cè)模型,并在玉華煤礦2409工作面進(jìn)行實(shí)驗(yàn)驗(yàn)證其預(yù)測(cè)的準(zhǔn)確性。上述方法均驗(yàn)證了神經(jīng)網(wǎng)絡(luò)在煤礦瓦斯?jié)舛阮A(yù)測(cè)方面的可行性。
采煤面瓦斯的多源特征和瓦斯混合氣體的運(yùn)移特征使得瓦斯?jié)舛燃染哂幸欢ǖ囊?guī)律性,又具有一定的復(fù)雜性,是典型的非線性時(shí)間序列預(yù)測(cè)問題。首先,礦井瓦斯?jié)舛仁堑湫偷臅r(shí)間序列數(shù)據(jù),單個(gè)瓦斯監(jiān)測(cè)點(diǎn)的瓦斯?jié)舛扰c該測(cè)點(diǎn)歷史瓦斯?jié)舛染哂袝r(shí)間相關(guān)性。其次,巷道內(nèi)瓦斯同樣受到煤層厚度、瓦斯抽采量、巷道內(nèi)瓦斯風(fēng)排量的影響,因此在預(yù)測(cè)瓦斯?jié)舛葧r(shí),應(yīng)將這些影響因素納入模型之中。采煤工作面回風(fēng)巷瓦斯較為穩(wěn)定,基本能夠反映整個(gè)巷道的瓦斯情況,旨在實(shí)現(xiàn)對(duì)采煤工作面回風(fēng)巷的瓦斯?jié)舛冗M(jìn)行主動(dòng)預(yù)測(cè)。
瓦斯?jié)舛阮A(yù)測(cè)研究采用“廣義線性回歸”算法,廣義線性模型是線性模型的擴(kuò)展,其在一般線性回歸模型的基礎(chǔ)上,將模型的假設(shè)進(jìn)行推廣而得到應(yīng)用范圍更廣更實(shí)用的回歸模型。通過聯(lián)結(jié)函數(shù)建立響應(yīng)變量的數(shù)學(xué)期望值與線性組合的預(yù)測(cè)變量之間的關(guān)系。其特點(diǎn)是不強(qiáng)行改變數(shù)據(jù)的自然度量,數(shù)據(jù)可以具有非線性和非恒定方差結(jié)構(gòu),符合瓦斯?jié)舛阮A(yù)測(cè)的特征。
機(jī)器學(xué)習(xí)是一種實(shí)現(xiàn)人工智能的方法,而線性回歸是機(jī)器學(xué)習(xí)中的一種重要方法,其理論依據(jù)是將訓(xùn)練數(shù)據(jù)傳輸給計(jì)算機(jī),計(jì)算機(jī)自動(dòng)求解數(shù)據(jù)關(guān)系,在新的數(shù)據(jù)上做出預(yù)測(cè)或給出建議。從數(shù)據(jù)中尋找規(guī)律、建立關(guān)系,根據(jù)建立的關(guān)系去解決問題,滿足文中所研究的瓦斯?jié)舛阮A(yù)測(cè)的需求。
線性回歸算法中單變量線性回歸需要經(jīng)過已知的數(shù)據(jù)計(jì)算出平方誤差代價(jià)函數(shù)(代價(jià)函數(shù)/損失函數(shù)),然后使用梯度下降法把大量數(shù)據(jù)之間的平方誤差代價(jià)函數(shù)的常數(shù)部分降低到最小,使得線性回歸方程可以擬合現(xiàn)有的所有數(shù)據(jù),多變量線性回歸的時(shí)候,因?yàn)樽兞康膫€(gè)數(shù)較多并且之間的數(shù)量級(jí)差距較大,所以在縮小平方誤差代價(jià)函數(shù)的時(shí)候不能直接使用梯度下降法,要在所有的變量進(jìn)行特征縮放(均值歸一化或者正規(guī)方程法)之后再進(jìn)行梯度下降,最終得出多變量線性回歸的擬合方程。
該算法基于煤礦工作面采集的多種影響到采煤工作面回風(fēng)巷T2瓦斯?jié)舛鹊囊蛩?包括回風(fēng)巷上隅角T0甲烷傳感器歷史數(shù)據(jù)、采煤工作面產(chǎn)量數(shù)據(jù)、工作面瓦斯抽采量數(shù)據(jù)、工作面煤層厚度數(shù)據(jù)、回風(fēng)巷道風(fēng)速數(shù)據(jù),以此建立基礎(chǔ)數(shù)據(jù)集。在基礎(chǔ)數(shù)據(jù)集的基礎(chǔ)上,基于時(shí)間關(guān)聯(lián)性將基礎(chǔ)數(shù)據(jù)集中的數(shù)據(jù)整理形成瓦斯?jié)舛扔绊懸蛩財(cái)?shù)據(jù)集,其中數(shù)據(jù)元組格式見表1。處理完成后,得到數(shù)據(jù)集。
表1 數(shù)據(jù)對(duì)應(yīng)名稱
上述步驟數(shù)據(jù)分析建立的基礎(chǔ)數(shù)據(jù)元組仍需進(jìn)一步處理得到用于預(yù)測(cè)T2位置瓦斯?jié)舛鹊乃惴P?。首?步驟1中的數(shù)據(jù)元組提供了影響T2位置瓦斯?jié)舛鹊挠绊懸蛩?其主要用處是用于預(yù)測(cè)下一數(shù)據(jù)采集時(shí)刻的T2位置瓦斯?jié)舛?因此將數(shù)據(jù)元組格式化為(T0_MAX,EXTRACT_COUT,COAL_PRODUCTION,COAL_THINKNESS,WIN_SPEED_AVG)格式。
為保證數(shù)據(jù)的可用性,對(duì)數(shù)據(jù)元組的每一列進(jìn)行標(biāo)準(zhǔn)化處理首先對(duì)每一列數(shù)據(jù)進(jìn)行平均值求解,其公式為
(1)
式中,xi為單個(gè)樣本數(shù)據(jù)的值;N為每列數(shù)據(jù)的樣本總數(shù);μ為平均值。
求得平均后,再進(jìn)行標(biāo)準(zhǔn)差求解,其公式為
(2)
式中,σ為標(biāo)準(zhǔn)差。最后對(duì)元組中每列數(shù)據(jù)的單個(gè)數(shù)據(jù)進(jìn)行z-score標(biāo)準(zhǔn)化,其公式為
(3)
通過上述得到標(biāo)準(zhǔn)化后的數(shù)據(jù)集。
將經(jīng)由特征工程產(chǎn)生的數(shù)據(jù)集進(jìn)行切分,將數(shù)據(jù)集的70%數(shù)據(jù)用于模型訓(xùn)練,20%的數(shù)據(jù)進(jìn)行評(píng)估,10%做瓦斯?jié)舛阮A(yù)測(cè)校對(duì)使用,根據(jù)訓(xùn)練的模型規(guī)律進(jìn)行評(píng)估調(diào)整。
采用線性回歸的第一準(zhǔn)則,因變量Y需要是“定量變量”,即數(shù)值變量,這里預(yù)測(cè)的T2甲烷傳感器濃度符合第一條件。煤層厚度決定了瓦斯的總量;日產(chǎn)量影響了每天大概的瓦斯涌出量,對(duì)工作面之中的瓦斯?jié)舛鹊挠绊懼饕浅椴闪亢惋L(fēng)排量,風(fēng)排瓦斯中,瓦斯會(huì)跟隨風(fēng)流經(jīng)過工作面和回風(fēng)巷至采區(qū)回風(fēng)巷中,因此,煤層厚度、瓦斯抽采量、日產(chǎn)量、風(fēng)速與T0瓦斯?jié)舛葌鞲衅骱蚑2瓦斯?jié)舛葌鞲衅鞯臄?shù)值是一元回歸或者高階回歸的關(guān)系,本身的一元回歸或者高階回歸的關(guān)系并未改變,所以本次模型建立采用廣義線性回歸的算法進(jìn)行數(shù)據(jù)擬合,同時(shí)數(shù)據(jù)也服從高斯分布。建立多因素的廣義線性回歸模型,其計(jì)算公式為
θT2=ωDD+ωCC+ωQQ+ωSS+ωθT1θT1+b
(4)
式中,D為煤層厚度,m;C為瓦斯抽采量,m3;Q為日產(chǎn)量,t;S為風(fēng)速,m/s;θT1為T0瓦斯?jié)舛?θT2為T2預(yù)測(cè)瓦斯?jié)舛?ω為各影響因素對(duì)于T2瓦斯?jié)舛扔绊懙钠茩?quán)重;b為公式整體相對(duì)于T2瓦斯?jié)舛鹊钠屏俊?/p>
將影響T2瓦斯?jié)舛鹊挠绊懸蜃优c相應(yīng)的權(quán)重用向量方式表示ρ=[D,C,Q,SθT1],ω=[ωD,ωC,ωQ,ωS,ωθT1],則可將公式簡(jiǎn)化為
θT2=ωTρ+b
(5)
上述步驟中基于影響T2位置瓦斯?jié)舛鹊亩喾N因素之間的線性關(guān)系建立了相應(yīng)的多因素廣義線性回歸模型為θT2=ωTρ+b。
為了實(shí)現(xiàn)該模型對(duì)于實(shí)際預(yù)測(cè)值的擬合,通過最小二乘法對(duì)上述模型中的影響因素進(jìn)行相應(yīng)訓(xùn)練,其計(jì)算公式為
(6)
式中,y為訓(xùn)練集中原始的T2位置瓦斯?jié)舛?θT2為通過多因素廣義線性回歸模型預(yù)測(cè)的T2位置瓦斯?jié)舛取?/p>
通過上述采樣方法,劃分訓(xùn)練集與測(cè)試集,使用凱明正態(tài)分布方法對(duì)模型權(quán)重賦予符合正態(tài)分布的處置,進(jìn)行13輪模型訓(xùn)練,得到訓(xùn)練損失結(jié)果如圖1所示。
圖1 訓(xùn)練損失結(jié)果Fig.1 Training loss results
從圖1可以看出,隨著訓(xùn)練輪次的加深,算法的損失逐漸減小,模型學(xué)習(xí)到的內(nèi)容逐漸增多。
試點(diǎn)礦井?dāng)?shù)據(jù)選取的是淮南礦業(yè)集團(tuán)顧橋礦1126(3)采煤工作面的相關(guān)數(shù)據(jù),該礦井為瓦斯突出礦井,因此采用大數(shù)據(jù)預(yù)測(cè)的方式能提高礦井的生產(chǎn)安全可靠性。通過分析,此次實(shí)驗(yàn)選取的T0甲烷傳感器數(shù)據(jù)、風(fēng)速數(shù)據(jù)、抽采量數(shù)據(jù)、日產(chǎn)量數(shù)據(jù)、煤層厚度數(shù)據(jù)等均與采煤工作面環(huán)境中瓦斯?jié)舛却笮∠⑾⑾嚓P(guān)。T0甲烷傳感器反映的是本采煤工作面回風(fēng)上隅角的瓦斯積聚情況,若數(shù)值較大,可能造成回風(fēng)巷瓦斯?jié)舛茸兇?風(fēng)速影響風(fēng)排瓦斯含量,若風(fēng)速變小,容易造成瓦斯積聚,造成瓦斯?jié)舛壬仙?抽采累積量為本采煤工作面煤層中賦存的瓦斯抽采量,當(dāng)抽采量提高時(shí),說明正在回采的本煤層噸煤瓦斯含量較高,抽采充分后,則在回采過程中空氣中的瓦斯含量會(huì)降低,抽采不充分,則空氣中瓦斯含量會(huì)升高;日產(chǎn)量數(shù)據(jù)能夠反映本采煤工作面回采的速度,當(dāng)回采速度過快時(shí),煤層中釋放至空氣的瓦斯含量就會(huì)提高,所以當(dāng)空氣環(huán)境中瓦斯?jié)舛容^高時(shí),必須停止回采。通過上述分析,可以看出,想要科學(xué)準(zhǔn)確地預(yù)測(cè)出回風(fēng)巷瓦斯?jié)舛?必須將這些相關(guān)因素納入模型之中,進(jìn)行權(quán)衡學(xué)習(xí)。
甲烷傳感器濃度數(shù)據(jù)、風(fēng)速數(shù)據(jù)、抽采量數(shù)據(jù)是通過安全監(jiān)控系統(tǒng)進(jìn)行實(shí)時(shí)獲取,由數(shù)據(jù)庫中得到相關(guān)數(shù)據(jù)集,工作面產(chǎn)量數(shù)據(jù)是由生產(chǎn)調(diào)度系統(tǒng)所獲取的相關(guān)數(shù)據(jù),在建模過程中選取1個(gè)月的數(shù)據(jù)量,并根據(jù)數(shù)據(jù)集劃分,將數(shù)據(jù)集的70%數(shù)據(jù)用于模型訓(xùn)練,20%的數(shù)據(jù)進(jìn)行評(píng)估,10%做瓦斯?jié)舛阮A(yù)測(cè)校對(duì)使用,本次模型的建立、訓(xùn)練以及校對(duì)工作依托大數(shù)據(jù)搭建的數(shù)據(jù)科學(xué)平臺(tái)進(jìn)行完成,將數(shù)據(jù)集按照數(shù)據(jù)解析、特征工程提取、切分?jǐn)?shù)據(jù)集、訓(xùn)練模型、校對(duì)模型等步驟依次進(jìn)行,最終能夠得到相關(guān)的預(yù)測(cè)結(jié)果對(duì)比。
選擇數(shù)據(jù)集中的20%數(shù)據(jù)進(jìn)行預(yù)測(cè)評(píng)估,見表2數(shù)據(jù),其中mae為平均絕對(duì)誤差,即預(yù)測(cè)值和實(shí)際值的絕對(duì)差值(差值和的平均值),mse為均值方差,rmse為均方根誤差。
表2 評(píng)估結(jié)果
圖2所示為一段時(shí)間的數(shù)據(jù)集對(duì)應(yīng)的預(yù)測(cè)評(píng)估結(jié)果predict曲線為預(yù)測(cè)值曲線,T2_max曲線為真實(shí)值曲線。
圖2 預(yù)測(cè)結(jié)果對(duì)比Fig.2 Comparison of predicted results
預(yù)測(cè)實(shí)驗(yàn)在較為理想的情況下進(jìn)行,歷史數(shù)據(jù)較為穩(wěn)定,且現(xiàn)場(chǎng)無偶然突發(fā)情況,如圖2所示,在模型迭代13次之后,能夠在變化趨勢(shì)上進(jìn)行較為準(zhǔn)確的預(yù)測(cè),達(dá)到了本次研究的要求與目的。
瓦斯災(zāi)害是煤礦領(lǐng)域的重大安全問題,隨著煤礦智能化水平的不斷提高,探索深度機(jī)器學(xué)習(xí)對(duì)煤礦瓦斯?jié)舛冗M(jìn)行預(yù)測(cè)具有現(xiàn)實(shí)意義,通過深度學(xué)習(xí),能夠掌握瓦斯?jié)舛茸兓囊?guī)律,對(duì)日后瓦斯預(yù)測(cè)預(yù)報(bào),防范瓦斯災(zāi)害的發(fā)生具有重要意義,能夠?yàn)槊旱V的回采與掘進(jìn)工藝提供更為精準(zhǔn)的風(fēng)險(xiǎn)預(yù)判依據(jù)。同時(shí),將大數(shù)據(jù)、深度學(xué)習(xí)等智能化技術(shù)引入煤礦瓦斯治理工作中,具有較高的使用價(jià)值。在今后的研究工作中,將會(huì)在此成果的基礎(chǔ)上,對(duì)模型進(jìn)行推廣,以求更好適用于礦井生產(chǎn)。