梁運(yùn)培,栗小雨,李全貴,毛樹(shù)人,鄭夢(mèng)浩,李建波
(1.煤礦災(zāi)害動(dòng)力學(xué)與控制國(guó)家重點(diǎn)實(shí)驗(yàn)室,重慶 400044;2.重慶大學(xué) 資源與安全學(xué)院,重慶 400044)
智能化礦山建設(shè)是一個(gè)多系統(tǒng)、多層次、多技術(shù)、多專(zhuān)業(yè)相互融合的復(fù)雜的系統(tǒng)工程,是保障煤炭行業(yè)安全快速高質(zhì)量發(fā)展的必由之路[1]。礦井瓦斯?jié)舛缺O(jiān)測(cè)是瓦斯事故預(yù)防的重要手段之一。瓦斯?jié)舛仁且环N隨時(shí)間變化的時(shí)序數(shù)據(jù),在時(shí)間上具有天然的連續(xù)性[2],挖掘其時(shí)變規(guī)律,預(yù)測(cè)其變化趨勢(shì),對(duì)煤礦瓦斯事故的預(yù)防具有重要意義[3]。
目前,瓦斯?jié)舛鹊念A(yù)測(cè)方法主要包括兩類(lèi):
1)基于統(tǒng)計(jì)學(xué)的預(yù)測(cè)方法,如支持向量機(jī)模型(SVM)[4]、支持向量回歸算法(SVR)[5]、最小二乘支持向量機(jī)模型(LS-SVM)[6]、自回歸積分滑動(dòng)平均模型(ARIMA)[7-8]、灰色預(yù)測(cè)模型[9],以及統(tǒng)計(jì)學(xué)方法集成學(xué)習(xí)的預(yù)測(cè)模型[10]。該類(lèi)模型結(jié)構(gòu)簡(jiǎn)單、構(gòu)建方便,但由于瓦斯?jié)舛葦?shù)據(jù)具有動(dòng)態(tài)、高度非線(xiàn)性的特點(diǎn),該類(lèi)方法難以充分挖掘其隱含特征。
2)基于深度學(xué)習(xí)的預(yù)測(cè)方法,如基于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的預(yù)測(cè)模型[11]、基于LSTM的預(yù)測(cè)模型[12-13]、基于門(mén)控遞歸單元(GRU)的預(yù)測(cè)模型[14]、基于雙向門(mén)控遞歸單元神經(jīng)網(wǎng)絡(luò)(Adamax-BiGRU)的預(yù)測(cè)模型[15],以及與全連接神經(jīng)網(wǎng)絡(luò)(FC)相結(jié)合構(gòu)建的LSTM-FC瓦斯?jié)舛阮A(yù)測(cè)模型等[16]。
基于深度學(xué)習(xí)的預(yù)測(cè)模型可對(duì)瓦斯?jié)舛葧r(shí)序數(shù)據(jù)進(jìn)行更深入的挖掘?qū)W習(xí),但存在模型最佳參數(shù)需依靠經(jīng)驗(yàn)調(diào)整的弊端,無(wú)法確保預(yù)測(cè)精度。針對(duì)這一問(wèn)題,MA X L等[17]提出了基于GA優(yōu)化灰色神經(jīng)網(wǎng)絡(luò)(GNN)參數(shù)的瓦斯?jié)舛阮A(yù)測(cè)方法;賈澎濤等[18]利用粒子群優(yōu)化算法(PSO)對(duì)卷積神經(jīng)網(wǎng)絡(luò)(CNN)和Adamax優(yōu)化的BiGRU相結(jié)合的瓦斯?jié)舛阮A(yù)測(cè)方法。前人的研究提高了瓦斯?jié)舛鹊念A(yù)測(cè)精度,但尚未取得令人滿(mǎn)意的結(jié)果。究其原因,在于優(yōu)化算法的選擇,部分優(yōu)化算法存在易陷入局部最優(yōu)的缺點(diǎn),難以確保尋優(yōu)的有效性。而CS算法與GA、PSO算法相比,具有參數(shù)少、易實(shí)現(xiàn)、搜索路徑優(yōu)、尋優(yōu)能力強(qiáng)的特點(diǎn)。目前基于CS算法優(yōu)化的模型已應(yīng)用于電力系統(tǒng)優(yōu)化調(diào)度[19]、短期電力負(fù)荷預(yù)測(cè)[20]等電力領(lǐng)域,此外,在心電圖心電信號(hào)識(shí)別分類(lèi)[21]、發(fā)動(dòng)機(jī)故障診斷[22]等方面也有應(yīng)用研究。上述應(yīng)用研究證明CS搜索算法是一種有效的模型尋優(yōu)算法,但其在瓦斯?jié)舛阮A(yù)測(cè)方面的應(yīng)用鮮見(jiàn)報(bào)道。
筆者針對(duì)瓦斯?jié)舛缺O(jiān)測(cè)數(shù)據(jù)在時(shí)間維度上存在的變化特性,通過(guò)CS搜索算法對(duì)LSTM模型超參數(shù)進(jìn)行尋優(yōu),構(gòu)建出最優(yōu)的CS-LSTM瓦斯?jié)舛阮A(yù)測(cè)模型,提高了瓦斯?jié)舛鹊念A(yù)測(cè)精度,旨在提高煤礦瓦斯安全態(tài)勢(shì)的預(yù)判能力。
瓦斯?jié)舛瓤芍庇^反映工作面的瓦斯情況[23],其井下獲取過(guò)程及用途如圖1所示。
圖1 工作面瓦斯?jié)舛葦?shù)據(jù)獲取過(guò)程及用途
由煤礦開(kāi)采環(huán)境及作業(yè)工序的復(fù)雜性分析可知,工作面瓦斯?jié)舛鹊淖兓哂幸韵绿卣鳎?/p>
1)周期性。瓦斯?jié)舛仁艿骄露喾N因素的影響,存在著周期性的變化規(guī)律,且在大多數(shù)周期內(nèi),其變化幅度相似。通過(guò)機(jī)器學(xué)習(xí)瓦斯?jié)舛戎芷谧兓卣?,可用于預(yù)測(cè)其在下一周期的變化情況[24]。
2)趨勢(shì)性。瓦斯?jié)舛葦?shù)據(jù)是一組隨時(shí)間變化的時(shí)間序列,其變化在時(shí)間上具有趨勢(shì)性,包括水平、上升和下降趨勢(shì)。趨勢(shì)性變化是預(yù)測(cè)的重要依據(jù)之一[25]。
3)波動(dòng)性及高度非線(xiàn)性。井下復(fù)雜的開(kāi)采條件,使瓦斯?jié)舛缺O(jiān)測(cè)數(shù)據(jù)具有較大的起伏波動(dòng),同時(shí)使其具備了高度非線(xiàn)性的特征。
瓦斯?jié)舛鹊纳鲜鎏卣魇沟猛ㄟ^(guò)傳統(tǒng)統(tǒng)計(jì)學(xué)方法或簡(jiǎn)單機(jī)器學(xué)習(xí)搭建的模型無(wú)法很好地學(xué)習(xí)其隱含規(guī)律,因此需要搭建合適的深度學(xué)習(xí)模型,以深入挖掘?qū)W習(xí)瓦斯?jié)舛葦?shù)據(jù)中存在的周期性及趨勢(shì)性,分析其波動(dòng)性特征,進(jìn)而有效預(yù)測(cè)未來(lái)某段時(shí)間內(nèi)的瓦斯?jié)舛茸兓岣呙旱V瓦斯安全態(tài)勢(shì)的預(yù)判能力,為工作面日常瓦斯監(jiān)控監(jiān)管工作提供決策支持。
根據(jù)瓦斯?jié)舛葧r(shí)序性特征,以及監(jiān)測(cè)數(shù)據(jù)的質(zhì)量,利用樣條插值法對(duì)瓦斯?jié)舛鹊娜笔е颠M(jìn)行插補(bǔ),以獲得具有均勻時(shí)間間隔的監(jiān)測(cè)數(shù)據(jù)。利用LSTM對(duì)瓦斯?jié)舛冗M(jìn)行預(yù)測(cè),并利用CS對(duì)LSTM模型的層數(shù)、每層神經(jīng)元的個(gè)數(shù),以及全連接(Dense)層層數(shù)、Dense層神經(jīng)元個(gè)數(shù)4個(gè)超參數(shù)進(jìn)行尋優(yōu),從而探究具有最佳網(wǎng)格結(jié)構(gòu)的LSTM預(yù)測(cè)模型,提升瓦斯?jié)舛阮A(yù)測(cè)精度。
由于井下復(fù)雜的環(huán)境條件,以及設(shè)備故障、通信故障等原因,瓦斯?jié)舛葘?shí)際記錄數(shù)據(jù)常會(huì)存在缺失值,從而導(dǎo)致預(yù)測(cè)出現(xiàn)困難?;跇訔l插值法在對(duì)點(diǎn)源時(shí)間序列數(shù)據(jù)缺失值插補(bǔ)方面具備的優(yōu)越性[26],通過(guò)樣條插值法可對(duì)瓦斯?jié)舛葧r(shí)間序列數(shù)據(jù)缺失值進(jìn)行補(bǔ)充。
樣條插值法是通過(guò)可變樣條做出1條經(jīng)過(guò)一系列點(diǎn)的光滑曲線(xiàn),從而將m個(gè)數(shù)據(jù)點(diǎn)劃分為m-1個(gè)區(qū)間,之后求解每個(gè)區(qū)間段的多項(xiàng)式,以此求出位于區(qū)間內(nèi)部的缺失值[27],其求解過(guò)程基于以下原則:
1)曲線(xiàn)方程在節(jié)點(diǎn)處的值必須相等,即位于區(qū)間內(nèi)部的點(diǎn)的值必須符合左右2個(gè)方程;
2)節(jié)點(diǎn)處的一階導(dǎo)數(shù)的值必須相等;
3)第一個(gè)端點(diǎn)和最后一個(gè)端點(diǎn)必須過(guò)第一個(gè)和最后一個(gè)方程。
LSTM網(wǎng)絡(luò)通過(guò)門(mén)控制將短期記憶與長(zhǎng)期記憶相結(jié)合,具備良好的長(zhǎng)時(shí)序列數(shù)據(jù)處理能力。LSTM由多個(gè)重復(fù)的結(jié)構(gòu)模塊組成,每個(gè)結(jié)構(gòu)模塊均包含3個(gè)門(mén):遺忘門(mén)、輸入門(mén)及輸出門(mén)。LSTM結(jié)構(gòu)模塊如圖2所示。LSTM網(wǎng)絡(luò)通過(guò)激活函數(shù)σ實(shí)現(xiàn)對(duì)3個(gè)門(mén)的控制,從而實(shí)現(xiàn)對(duì)歷史信息的保留和遺忘。
圖2 LSTM結(jié)構(gòu)模塊
LSTM預(yù)測(cè)模型主要包括三步:
1)由Sigmoid函數(shù)層決定的遺忘門(mén)層ft,計(jì)算公式如下:
ft=σ(Wf[ht-1,xt]+bf)
(1)
式中:σ為Sigmoid激活函數(shù);Wf為遺忘門(mén)權(quán)重矩陣;h為神經(jīng)元輸出;x為神經(jīng)元輸入;t為當(dāng)前時(shí)刻;t-1為上一時(shí)刻;b為偏置項(xiàng)。
2)增加狀態(tài)量的輸入門(mén)層it,可選擇更新。計(jì)算公式見(jiàn)式(2)、(3)、(4):
it=σ(Wf[ht-1,xt]+bi)
(2)
(3)
(4)
3)輸出層Ot計(jì)算公式如下:
Ot=σ(Wo[ht-1,xt]+bo)
(5)
ht=OttanhCt
(6)
式中Wo為輸出門(mén)權(quán)重矩陣。
CS算法是模擬布谷鳥(niǎo)尋巢產(chǎn)卵行為的一種尋求目標(biāo)函數(shù)最優(yōu)化問(wèn)題的仿生算法,為了簡(jiǎn)化自然界中布谷鳥(niǎo)的繁衍習(xí)性,YANG X S等[28]將布谷鳥(niǎo)的產(chǎn)卵行為假設(shè)為3個(gè)理想狀態(tài):
1)布谷鳥(niǎo)1次只產(chǎn)1個(gè)卵,并隨機(jī)選擇鳥(niǎo)窩位置來(lái)孵化它;
2)在隨機(jī)選擇的1組鳥(niǎo)窩中,最好的鳥(niǎo)窩將會(huì)被保留到下一代;
3)可選擇的寄生巢的數(shù)量是固定的,寄生巢主人發(fā)現(xiàn)外來(lái)鳥(niǎo)蛋的概率為P(0
CS搜索尋優(yōu)過(guò)程中,布谷鳥(niǎo)根據(jù)Levy飛行規(guī)則進(jìn)行巢穴的選擇與更新。Levy飛行是一類(lèi)非高斯隨機(jī)過(guò)程,由長(zhǎng)時(shí)間的短步長(zhǎng)和短時(shí)間的長(zhǎng)步長(zhǎng)組成,其平穩(wěn)增量服從Levy穩(wěn)定分布。在飛行過(guò)程中,步長(zhǎng)較小的短距離行走與偶爾較大步長(zhǎng)的長(zhǎng)距離行走相互交替,有利于增加種群多樣性、擴(kuò)大搜索范圍,不至于陷入局部最優(yōu)。
根據(jù)Levy飛行的巢穴更新公式如下:
Xt+1=Xt+α·L(λ)
(7)
式中:Xt、Xt+1分別為時(shí)刻t、t+1的巢穴位置;α為步長(zhǎng)縮放因子;L(λ)為L(zhǎng)evy隨機(jī)路徑;λ為步長(zhǎng)規(guī)模參數(shù)。
采用Mantegna方法,生成服從Levy飛行的隨機(jī)步長(zhǎng),如式(8)所示:
(8)
CS-LSTM預(yù)測(cè)模型通過(guò)t-1時(shí)刻的瓦斯?jié)舛葦?shù)據(jù),實(shí)現(xiàn)對(duì)t時(shí)刻瓦斯?jié)舛鹊念A(yù)測(cè)。CS-LSTM模型結(jié)構(gòu)及預(yù)測(cè)流程如圖3所示。
圖3 CS-LSTM模型結(jié)構(gòu)及預(yù)測(cè)流程
CS-LSTM瓦斯?jié)舛阮A(yù)測(cè)步驟如下:
1)搜集整理原始數(shù)據(jù),判斷數(shù)據(jù)是否存在缺失值。若存在缺失值,則利用樣條插值法對(duì)缺失值進(jìn)行插補(bǔ),然后利用最大—最小歸一化法對(duì)數(shù)據(jù)進(jìn)行無(wú)量綱化處理(見(jiàn)式(9)),之后得到一維瓦斯?jié)舛葧r(shí)間序列。
(9)
式中:x*為歸一化后的瓦斯?jié)舛?;x為單個(gè)瓦斯?jié)舛取?/p>
2)搭建LSTM模型基礎(chǔ)框架,設(shè)置LSTM預(yù)測(cè)模型評(píng)價(jià)指標(biāo)為均方誤差ems(MSE)。ems越小,表明預(yù)測(cè)模型準(zhǔn)確度越高。ems計(jì)算公式如下:
(10)
3)利用CS算法對(duì)LSTM結(jié)構(gòu)進(jìn)行尋優(yōu)。設(shè)置CS算法適應(yīng)度函數(shù)F:
F=1/ems
(11)
設(shè)置CS算法的搜索參數(shù)、迭代次數(shù)等。
4)將CS算法最優(yōu)參數(shù)組合輸入LSTM模型中,完成預(yù)測(cè)并輸出預(yù)測(cè)結(jié)果。
選擇平均絕對(duì)誤差ema(MAE)、均方根誤差erms(RMSE)與模型運(yùn)行時(shí)間t作為預(yù)測(cè)模型的評(píng)估指標(biāo)。其中,ema和erms越小,表明預(yù)測(cè)結(jié)果的精度越高;t越小,模型的預(yù)測(cè)速度越快。ema及erms的計(jì)算公式如下:
(12)
(13)
研究數(shù)據(jù)取自松藻礦區(qū)打通一礦采煤工作面生產(chǎn)數(shù)據(jù),該工作面平均開(kāi)采深度450 m,煤層厚度2.9 m,采用綜采的方式沿傾向仰采,絕對(duì)瓦斯涌出量為5.44 m3/min?;诿块g隔1 min取樣、同一分鐘取最大值的原則,共選取該工作面5 760組瓦斯?jié)舛?CH4體積分?jǐn)?shù),下同)監(jiān)測(cè)數(shù)據(jù)為原始樣本。預(yù)處理過(guò)程如下:
1)根據(jù)實(shí)際開(kāi)采情況,剔除未進(jìn)行開(kāi)采活動(dòng)時(shí)的記錄數(shù)據(jù),將剩余共2 990組瓦斯?jié)舛葰v史監(jiān)測(cè)數(shù)據(jù)作為樣本進(jìn)行CS-LSTM模型的訓(xùn)練與預(yù)測(cè)。
2)利用箱線(xiàn)圖方法對(duì)原始數(shù)據(jù)進(jìn)行異常值識(shí)別。識(shí)別效果如圖4所示,異常值識(shí)別結(jié)果見(jiàn)表1。
圖4 箱線(xiàn)圖異常值檢測(cè)結(jié)果
表1 箱線(xiàn)圖檢測(cè)異常值
3)為驗(yàn)證樣條插值法對(duì)于缺失值插補(bǔ)的有效性,假設(shè)第x個(gè)數(shù)據(jù)采集點(diǎn)為缺失值x=200i(i=1,2,…,14),構(gòu)造生成一個(gè)預(yù)處理數(shù)據(jù)序列,然后利用樣條插值法對(duì)缺失值進(jìn)行插補(bǔ)。插補(bǔ)后的數(shù)據(jù)與真實(shí)數(shù)據(jù)的ema為0.006 8、erms為0.008 7,驗(yàn)證結(jié)果表明樣條插值法滿(mǎn)足本文數(shù)據(jù)處理的需求。
將步驟2)中檢測(cè)出的異常值視為缺失值并利用樣條插值法進(jìn)行插補(bǔ),最后將數(shù)據(jù)按照8∶2的比例劃分為訓(xùn)練集與測(cè)試集。
4)缺失值填充后,利用式(9)對(duì)數(shù)據(jù)進(jìn)行無(wú)量綱化處理。
將搭建好的LSTM基礎(chǔ)框架[i,j,nk,ml]輸入CS算法中進(jìn)行尋優(yōu)。設(shè)置CS算法搜索空間維度最低為4,最高為8。設(shè)置種群規(guī)模為10,巢穴丟棄(發(fā)現(xiàn))率P=0.25,L(λ)隨機(jī)路徑中β=1.5,步長(zhǎng)縮放因子α=0.1,適應(yīng)度函數(shù)為F=1/ems。
CS尋優(yōu)最終結(jié)果為F=1 831.232 34,最優(yōu)巢穴位置為[2,1,58,63,188],即最佳LSTM模型網(wǎng)格結(jié)構(gòu)為2層,其對(duì)應(yīng)神經(jīng)元個(gè)數(shù)分別為58、63,全連接層為1層,其對(duì)應(yīng)神經(jīng)元個(gè)數(shù)為188。
4.3.1 優(yōu)化效果分析
對(duì)比CS算法優(yōu)化結(jié)果與GA算法尋優(yōu)結(jié)果,以驗(yàn)證CS算法尋優(yōu)的優(yōu)勢(shì),結(jié)果如圖5所示。
圖5 CS-LSTM、GA-LSTM尋優(yōu)結(jié)果
由圖5可知,在相同的搜索步數(shù)下,CS算法搜索區(qū)間范圍為[297.955 675,1 831.232 340],GA算法搜索區(qū)間范圍為[375.222 092,702.368 742],即CS算法的搜索范圍相較于GA算法更廣,搜索區(qū)間更大。
GA算法的搜索結(jié)果區(qū)間變化小,數(shù)據(jù)分布比較均勻,其原因可能是陷入局部最優(yōu),而CS算法可以更好地避免這種現(xiàn)象。因此,基于Levy飛行CS算法具有更好的尋優(yōu)性能。
4.3.2 預(yù)測(cè)效果分析
將最優(yōu)超參數(shù)組合輸入到LSTM模型中,對(duì)未來(lái)12 h的瓦斯?jié)舛冗M(jìn)行預(yù)測(cè)。應(yīng)用CS-LSTM模型預(yù)測(cè)瓦斯?jié)舛冉Y(jié)果如圖6所示。
圖6 CS-LSTM模型瓦斯?jié)舛戎悄茴A(yù)測(cè)結(jié)果
由圖6可知,瓦斯?jié)舛阮A(yù)測(cè)數(shù)據(jù)的擬合效果整體較好,但在極值點(diǎn)的擬合效果略差。原因可能是在極值點(diǎn)左右數(shù)值變化較大,存在突變的情況,因此其規(guī)律及特征更難以學(xué)習(xí)。未來(lái)需對(duì)極值點(diǎn)的預(yù)測(cè)精度進(jìn)行改進(jìn)。
將LSTM、GA-LSTM、CS-LSTM模型的預(yù)測(cè)結(jié)果進(jìn)行比較,對(duì)比情況如表2所示。
表2 LSTM、GA-LSTM、CS-LSTM預(yù)測(cè)結(jié)果對(duì)比
3種模型的損失(Loss)曲線(xiàn)如圖7所示。
圖7 LSTM、GA-LSTM、CS-LSTM模型Loss曲線(xiàn)
由表2可知,在預(yù)測(cè)精度上,LSTM效果最差,GA-LSTM次之,CS-LSTM最佳。結(jié)合圖7中3個(gè)預(yù)測(cè)模型的Loss曲線(xiàn),LSTM模型損失函數(shù)值下降速度明顯低于優(yōu)化后的LSTM模型。CS-LSTM與GA-LSTM相比,Loss曲線(xiàn)下降速度稍快,但相差并不明顯。結(jié)合表2和圖7結(jié)果來(lái)看,CS-LSTM模型更勝一籌。
瓦斯?jié)舛仁敲旱V安全監(jiān)測(cè)監(jiān)控系統(tǒng)的主要監(jiān)測(cè)參數(shù)之一。在監(jiān)測(cè)數(shù)據(jù)上傳至地面中心站之后,可以利用CS-LSTM預(yù)測(cè)模型對(duì)下一階段的瓦斯?jié)舛茸兓€(xiàn)進(jìn)行預(yù)測(cè)。隨著監(jiān)測(cè)數(shù)據(jù)的持續(xù)上傳與分析預(yù)測(cè),模型不斷得到更新,若模型多次預(yù)測(cè)均顯示某時(shí)間段瓦斯?jié)舛茸兓嬖诋惓?,則系統(tǒng)提示異常信息并發(fā)出報(bào)警信號(hào),同時(shí)結(jié)合生產(chǎn)實(shí)際提供可能的異常原因及解決方案,達(dá)到瓦斯智能治理的目的。
1)提出了一種CS-LSTM的瓦斯?jié)舛戎悄茴A(yù)測(cè)模型。通過(guò)對(duì)瓦斯?jié)舛葘?shí)時(shí)監(jiān)測(cè)數(shù)據(jù)隱含規(guī)律的分析,預(yù)測(cè)工作面未來(lái)12 h的瓦斯?jié)舛茸兓?,?shí)現(xiàn)了對(duì)工作面瓦斯?jié)舛鹊闹悄茴A(yù)測(cè)。
2)針對(duì)高度非線(xiàn)性的瓦斯?jié)舛缺O(jiān)測(cè)數(shù)據(jù),利用CS算法對(duì)LSTM預(yù)測(cè)模型的網(wǎng)格結(jié)構(gòu)進(jìn)行優(yōu)化,以L(fǎng)evy飛行的方式更新巢穴位置,避免陷入局部最優(yōu)的情況,相較于GA算法具有更好的優(yōu)化效果。
3)CS-LSTM模型相對(duì)于LSTM及GA-LSTM模型,RMSE為0.023,其值最小,預(yù)測(cè)效果較好,能夠滿(mǎn)足礦井工作面瓦斯?jié)舛戎悄茴A(yù)測(cè)的需求。