曹亞利,李振雷,劉旭東,何學(xué)秋,宋大釗,王洪磊
(1.北京科技大學(xué) 金屬礦山高效開采與安全教育部重點(diǎn)實(shí)驗(yàn)室,北京 100083;2.北京科技大學(xué) 土木與資源工程學(xué)院,北京 100083;3.北京科技大學(xué) 大安全科學(xué)研究院,北京 100083;4.國家能源集團(tuán)新疆能源有限責(zé)任公司,新疆 烏魯木齊 830084)
沖擊地壓是煤礦開采中1種常見的動力災(zāi)害,是指煤(巖)體聚積的彈性變形能瞬時釋放而產(chǎn)生的1種動力現(xiàn)象,常造成巷道破壞、設(shè)備損毀以及人員傷亡等[1-4]。沖擊地壓預(yù)警技術(shù)在礦山災(zāi)害防治方面有重要作用,是提高沖擊地壓防治水平的關(guān)鍵[5]。目前,越來越多的先進(jìn)設(shè)備被用于礦山開采中,以微震、地音、電磁輻射為代表的監(jiān)測手段得到普及[2,6],針對這些監(jiān)測手段的沖擊地壓預(yù)警方法眾多。Cai等[7]提出了1種基于模糊綜合評價模型的沖擊地壓預(yù)測方法,利用混淆矩陣的績效指標(biāo)F確定預(yù)警指標(biāo)的權(quán)重,可以對沖擊地壓發(fā)生的可能性進(jìn)行定量預(yù)測;田向輝等[2]通過分析沖擊地壓微震前兆信息規(guī)律,提出了1種基于每日微震最大能量和微震能量/頻次偏差高值總數(shù)的定量-趨勢的沖擊危險預(yù)警方法;殷欣等[8]從巖石物理力學(xué)性質(zhì)、巖體完整性和地應(yīng)力3個方面選取巖爆的評價指標(biāo),提出1種基于離差平方和的最優(yōu)組合賦權(quán)規(guī)則,建立了巖爆烈度分級預(yù)測識別模型?,F(xiàn)有的沖擊地壓預(yù)警常采用經(jīng)驗(yàn)類比或數(shù)理統(tǒng)計的方法確定預(yù)警指標(biāo)和判別準(zhǔn)則,以此對沖擊地壓危險進(jìn)行預(yù)測[3,9]。但采用指標(biāo)法進(jìn)行沖擊地壓危險預(yù)警對監(jiān)測數(shù)據(jù)的挖掘并不夠充分,有待進(jìn)一步提升。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的1個重要分支[10],依附于大量的數(shù)據(jù)來訓(xùn)練模型[7],擁有較強(qiáng)的自適應(yīng)特征學(xué)習(xí)能力,適用于大數(shù)據(jù)背景下沖擊地壓監(jiān)測數(shù)據(jù)的分析需求。卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)的代表算法之一,在煤巖動力災(zāi)害方面得到了廣泛的研究和應(yīng)用。荀曉玉等[11]將卷積神經(jīng)網(wǎng)絡(luò)與長短時期記憶網(wǎng)絡(luò)結(jié)合,從時間序列的角度對采煤工作面瓦斯?jié)舛冗M(jìn)行預(yù)測;董隴軍等[12]根據(jù)微震事件和爆破事件的波形的不同特征,建立了1種基于卷積神經(jīng)網(wǎng)絡(luò)的波形辨識模型;裴艷宇等[13]建立一維卷積神經(jīng)網(wǎng)絡(luò)微震能級時序預(yù)測模型,以前若干次微震的能量級別作為輸入來預(yù)測下1次微震事件的能量級別。卷積神經(jīng)網(wǎng)絡(luò)在異常信號辨識、時序數(shù)據(jù)特征提取和預(yù)測方面展現(xiàn)了較強(qiáng)的能力。
本文利用一維卷積神經(jīng)網(wǎng)絡(luò)具有對時序數(shù)據(jù)特征提取的能力,以礦山現(xiàn)場主要使用的微震監(jiān)測為對象,建立沖擊地壓預(yù)警模型,能夠結(jié)合專家經(jīng)驗(yàn)挖掘定性信息,與定量信息相結(jié)合,充分獲取微震監(jiān)測數(shù)據(jù)的潛在特征信息,可為沖擊地壓監(jiān)測預(yù)警提供新的嘗試,也可為地音、電磁輻射等其他監(jiān)測手段智能化預(yù)警提供參考。
一維卷積神經(jīng)網(wǎng)絡(luò)常用于序列類的數(shù)據(jù)處理,將著名的卷積運(yùn)算和神經(jīng)網(wǎng)絡(luò)結(jié)合在一起,通過反向傳播算法更新網(wǎng)絡(luò)參數(shù)。如圖1所示,其結(jié)構(gòu)主要包括輸入層、卷積層、池化層、全連接層和輸出層[14-17]。
圖1 典型的一維卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 Typical structure of one-dimensional convolutional neural network
卷積層類似于前饋神經(jīng)網(wǎng)絡(luò)的神經(jīng)元,能對輸入的數(shù)據(jù)進(jìn)行特征提取[16-17],其中包含多個卷積核,卷積核對輸入的特征矢量進(jìn)行卷積運(yùn)算,并用非線性激活函數(shù)構(gòu)建輸出特征矢量[18-19],如式(1)所示:
(1)
常用的激活函數(shù)有ReLU函數(shù),sigmoid函數(shù),如式(2)~(3)所示:
ReLU:f1(x)=max(0,x)
(2)
(3)
池化層能進(jìn)行特征提取和信息過濾,避免模型過擬合,常用最大池化,池化層一般放置在卷積層的后面。全連接層用來實(shí)現(xiàn)對特征的“展平”,即將所有特征矢量首尾連接形成一維向量[19]。最終由輸出層輸出目標(biāo)結(jié)果。
礦山微震數(shù)據(jù)是離散的一維時序數(shù)據(jù),而一維卷積神經(jīng)網(wǎng)絡(luò)對時序數(shù)據(jù)具有較強(qiáng)的特征提取能力,能最大限度地提取數(shù)據(jù)特征[15-19],本文利用微震監(jiān)測數(shù)據(jù)和一維卷積神經(jīng)網(wǎng)絡(luò)來建立沖擊地壓預(yù)警模型,模型建立過程包括以下步驟:1)建立打分系統(tǒng),制作微震監(jiān)測數(shù)據(jù)標(biāo)簽;2)生成數(shù)據(jù)集;3)構(gòu)建一維卷積神經(jīng)網(wǎng)絡(luò)模型,并將數(shù)據(jù)集輸入模型中進(jìn)行訓(xùn)練;4)完成訓(xùn)練,確定模型結(jié)構(gòu)和參數(shù)。具體流程如圖2所示。
圖2 沖擊地壓預(yù)警模型構(gòu)建流程Fig.2 Construction flow chart of rockburst early-warning model
由于對礦山生產(chǎn)安全高度重視,礦山?jīng)_擊地壓事故發(fā)生次數(shù)驟減,將實(shí)際發(fā)生的沖擊地壓作為預(yù)警標(biāo)簽建立深度學(xué)習(xí)模型并不可觀。為了解決深度學(xué)習(xí)訓(xùn)練數(shù)據(jù)缺少標(biāo)簽的問題,本文建立打分系統(tǒng),采用專家評判方法制作微震監(jiān)測數(shù)據(jù)標(biāo)簽,以便于生成數(shù)據(jù)集。打分系統(tǒng)包含微震監(jiān)測數(shù)據(jù)庫,該系統(tǒng)可隨機(jī)選擇歷史時刻t,并展示出該時刻歷史微震監(jiān)測數(shù)據(jù)及其特征參數(shù)的圖像,如圖3(a)~圖3(c)所示,分別為t時刻前n天的微震事件能量柱狀圖、t時刻前m天的日總能量柱狀圖、t時刻前m天的日頻次折線圖,這里取n=3,m=20。打分系統(tǒng)的使用步驟為:將微震監(jiān)測數(shù)據(jù)導(dǎo)入打分系統(tǒng),并首次輸入歷史時刻t,生成t時刻可視化圖像,專家對t時刻沖擊地壓危險進(jìn)行評判,評判完成后保存,即可自動轉(zhuǎn)換為下一時刻,這里時刻t的間隔為3 h。
圖3 專家打分系統(tǒng)中微震監(jiān)測數(shù)據(jù)及其特征參數(shù)示例Fig.3 Examples of MS monitoring data and its characteristic parameters in expert scoring system
專家依據(jù)自身經(jīng)驗(yàn)通過打分系統(tǒng)對某時刻t沖擊地壓危險進(jìn)行分析評判,得到?jīng)_擊地壓危險評判值,即為樣本標(biāo)簽。專家評判分值的范圍是0~100,分值越高越危險,參照沖擊地壓危險常用的4個等級,其中,0~25為無沖擊危險,25~50為弱沖擊危險,50~75為中等沖擊危險,75~100為強(qiáng)沖擊危險。
本文以新疆某沖擊地壓煤礦為研究背景,煤層傾角87°~89°,是典型的急傾斜煤層,已開采+450水平B1+2和B3+6煤層,現(xiàn)開采+425水平B3+6煤層,采用水平分段放頂煤的采煤方法如圖4所示。該礦采用ARMIS M/E微震監(jiān)測系統(tǒng),可對微震事件進(jìn)行實(shí)時監(jiān)測,自動記錄微震活動,并對微震進(jìn)行震源定位和能量計算,其微震探頭和拾震器的布置方案隨著回采面推進(jìn)位置的變化而變化。
圖4 新疆煤礦采掘平面Fig.4 Mining plane of a coal mine in Xinjiang
本文選用該礦+450水平B3+6工作面(2018.08—2019.07)和+425水平B3+6工作面(2019.08—2020.05)的微震數(shù)據(jù),總采樣區(qū)間為2018年8月—2020年5月,采樣時刻t可由打分系統(tǒng)在采樣區(qū)間內(nèi)自動轉(zhuǎn)換,時間跨度較長,能夠克服樣本類型單一問題。
沖擊地壓預(yù)警方法采用有監(jiān)督學(xué)習(xí)方式,需要同時具備特征和標(biāo)簽信息。樣本特征X為t時刻對應(yīng)的微震監(jiān)測數(shù)據(jù)及其特征參數(shù),可視化后即圖3(a)~圖3(c),分別為t時刻前3 d的微震事件能量柱狀圖、t時刻前20 d的微震日總能量柱狀圖、t時刻前20 d的微震日頻次折線圖;樣本標(biāo)簽Y由現(xiàn)場沖擊地壓監(jiān)測技術(shù)人員、防沖副總及科研院所沖擊地壓研究人員共計8人組成,通過打分系統(tǒng)對t時刻的沖擊地壓危險進(jìn)行分析評判,獲取t時刻樣本標(biāo)簽,共生成2 360個不同時刻的樣本。
根據(jù)細(xì)化的專家評判標(biāo)準(zhǔn)計算樣本分布,4個等級的樣本數(shù)分別為624,525,755,456,樣本類別分布不平衡,為提高卷積神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練效果,使用SMOTE算法對少數(shù)類樣本進(jìn)行過采樣,增加少數(shù)類樣本數(shù)量。SMOTE算法在過采樣時并不是簡單地復(fù)制樣本,而是通過K近鄰插值的方法在2個少數(shù)類樣本間合成新的樣本,原理如圖5所示,該方法可以降低模型過擬合風(fēng)險[20-21]。最終生成3 000個類別平衡的樣本集。如表1所示,每個樣本提取出特征760個,其中,t時刻前3 d的微震事件720個(時間窗為6 min,若某個時間窗內(nèi)無微震事件,則為0),t時刻前20 d微震事件日總能量20個,t時刻前20 d微震事件日頻次20個,即Xi={x1,x2,…,x760},其中i=1,2,…,3 000,表示樣本個數(shù)。將數(shù)據(jù)集中全部樣本按照時間順序進(jìn)行排序,取前85%的數(shù)據(jù)作為訓(xùn)練集,共2 550個,后15%數(shù)據(jù)作為測試集,共450個。
圖5 SMOTE算法原理Fig.5 Principle of SMOTE algorithm
表1 部分?jǐn)?shù)據(jù)集Table 1 Part of data set
相比于傳統(tǒng)神經(jīng)網(wǎng)絡(luò),卷積層和池化層是卷積神經(jīng)網(wǎng)絡(luò)特有結(jié)構(gòu),卷積層中的卷積核包含權(quán)重系數(shù)和偏置,可通過反向傳播算法進(jìn)行更新[13]。
構(gòu)建沖擊地壓預(yù)警的一維卷積神經(jīng)網(wǎng)絡(luò)模型,輸入層是將訓(xùn)練集單個樣本的760個特征作為輸入,并對輸入數(shù)據(jù)進(jìn)行Z-score標(biāo)準(zhǔn)化,消除特征之間量綱及取值范圍差異的影響;設(shè)置5層卷積層,每層卷積層使用數(shù)量不等的卷積核,采用等寬卷積方式;使用非限制單元(Rectified Linear Unit,ReLU)作為激活函數(shù),增強(qiáng)模型的非線性表達(dá),ReLU可解決sigmoid、tanh中常見的梯度消失問題,計算速度也最快;設(shè)置3層池化層,采用最大池化(Max Pooling),通過池化操作降低卷積層輸出的特征向量的維度,大大降低輸入到全連接層的網(wǎng)絡(luò)模型參數(shù),降低訓(xùn)練難度和時間[13,22-23];并在全連接層之前添加dropout層,系數(shù)為0.4,防止過擬合[16];最后由輸出層(回歸層),輸出沖擊地壓危險預(yù)測值。具體模型結(jié)構(gòu)如圖6所示。
圖6 沖擊地壓預(yù)警的一維卷積神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)Fig.6 Structure of one-dimensional convolutional neural network model for rockburst early-warning
本文借助Python語言運(yùn)用Keras深度學(xué)習(xí)框架實(shí)現(xiàn)沖擊地壓預(yù)警模型的搭建和訓(xùn)練,選用Nadam優(yōu)化器來訓(xùn)練網(wǎng)絡(luò),初始學(xué)習(xí)率為0.001,最大訓(xùn)練次數(shù)為70,小批量大小為64,L2正則化系數(shù)為0.000 1。如圖7所示,用損失函數(shù)以及平均絕對誤差MAE來反映模型的訓(xùn)練過程,平均絕對誤差是性能度量的指標(biāo),損失函數(shù)為均方誤差MSE,如式(4)~(5)所示:
(4)
(5)
用決定系數(shù)R2評估模型的泛化能力,如式(6)所示:
(6)
用L2正則化來限制權(quán)重大小,以避免模型過擬合,如式(7)~(8)所示:
J=J(θ)+λR(ω)
(7)
(8)
式中:J(θ)為原始損失函數(shù);λ為正則化系數(shù);R(ω)為模型復(fù)雜度;ω為權(quán)重。
圖7 沖擊地壓預(yù)警模型訓(xùn)練過程Fig.7 Training process of rockburst early-warning model
基于上文搭建的一維卷積神經(jīng)網(wǎng)絡(luò)模型,用450個測試集數(shù)據(jù)進(jìn)行模型測試,4個等級的樣本數(shù)分別為122,103,133,92。如圖8和圖9分別展示訓(xùn)練迭代次數(shù)對測試集沖擊地壓危險預(yù)測結(jié)果的影響、測試集平均絕對誤差的變化情況。由圖8~9可知,20次迭代后,MAE迅速下降,MAE為12.5,測試集沖擊地壓危險的預(yù)測結(jié)果與專家評判結(jié)果擬合效果良好;迭代30次后,MAE為8.9,較迭代20次弱沖擊危險、強(qiáng)沖擊危險值擬合效果更好;之后隨著迭代次數(shù)的增加,部分危險值擬合效果明顯變差,且MAE無明顯變化,甚至出現(xiàn)小幅度提升,有過擬合風(fēng)險。從模型預(yù)測效果和訓(xùn)練速度考慮,訓(xùn)練次數(shù)為30時最佳,此時,沖擊地壓危險預(yù)測結(jié)果和專家評判結(jié)果的波動趨勢基本吻合,平均絕對誤差MAE最小,且83%的樣本絕對值誤差小于15,其中誤差小于10的占80%,只有極小部分樣本絕對值誤差在15~20之間。由于人的主觀意識的影響,誤差結(jié)果在可接受范圍之內(nèi)。
圖8 訓(xùn)練迭代次數(shù)對測試集沖擊地壓危險預(yù)測結(jié)果的影響Fig.8 Influence of training iteration times on prediction results of rockburst risk by test set
圖9 訓(xùn)練迭代次數(shù)的增加對測試集預(yù)測結(jié)果的平均絕對誤差的影響Fig.9 Influence of increase of training iteration times on MAE of prediction results by test set
運(yùn)用平均絕對誤差MAE、均方根誤差RMSE、決定系數(shù)R2對模型性能進(jìn)行評估[24],如表2所示,3個評估指標(biāo)在訓(xùn)練集的結(jié)果比測試集稍好,但二者相差極小,這是符合實(shí)際的,說明并未出現(xiàn)過擬合;且測試集決定系數(shù)R2為0.78,說明模型的可解釋性強(qiáng),泛化性能較好。
表2 模型性能評估Table 2 Model performance evaluation
選取該礦2020年8月1日—2020年9月18日的微震監(jiān)測數(shù)據(jù)進(jìn)行現(xiàn)場驗(yàn)證,因礦井沒有發(fā)生沖擊地壓,而大能量礦震與沖擊地壓的發(fā)生密切相關(guān)[22,25],故將大能量礦震作為預(yù)警目標(biāo),以該礦歷年礦震事件為參考,結(jié)合礦井生產(chǎn)實(shí)際,將大能量礦震定義為震動能量大于105的微震事件。將本模型的預(yù)警結(jié)果由0~100映射到0~1,與該礦井實(shí)際使用的算法模型的預(yù)警結(jié)果進(jìn)行對比,如圖10所示。
圖10 本文模型與礦井原有模型預(yù)警結(jié)果對比Fig.10 Comparison of early-warning results between this model and original model of mine
由圖10可知,在研究時段內(nèi)共發(fā)生5次大能量礦震事件,在每次大能量礦震發(fā)生前5 d內(nèi),本文模型均進(jìn)行沖擊地壓危險預(yù)警,預(yù)警中等沖擊危險等級4次、弱沖擊危險等級1次;而礦井原有使用的預(yù)警模型預(yù)警了4次,預(yù)警中等沖擊危險等級2次,弱沖擊危險等級2次,有1次沒有給出預(yù)警??梢?,本文提出的預(yù)警模型準(zhǔn)確度更高,具有一定的實(shí)際意義。
同時,由圖10可知,本文模型預(yù)警結(jié)果整體上較礦井原有模型預(yù)警結(jié)果的危險程度更高,且本文模型可以較好對專家打分進(jìn)行預(yù)測,這也說明,本文模型現(xiàn)場應(yīng)用時預(yù)警結(jié)果整體偏高與專家打分較高有關(guān),下一步需增加打分專家的人數(shù)和樣本集的數(shù)量,對模型進(jìn)行進(jìn)一步訓(xùn)練和完善。
1)建立基于一維卷積神經(jīng)網(wǎng)絡(luò)的沖擊地壓預(yù)警模型,模型預(yù)測結(jié)果并不隨訓(xùn)練迭代次數(shù)的增加而逐漸最優(yōu),存在最優(yōu)迭代次數(shù),本文模型為30次,此時,測試集的平均絕對誤差MAE為8.9,沖擊地壓危險預(yù)測結(jié)果與專家評判結(jié)果的波動趨勢基本吻合,誤差結(jié)果在可接受范圍內(nèi)。
2)將本文提出的預(yù)警模型與礦井原有使用的預(yù)警模型進(jìn)行對比,本文模型對研究時段內(nèi)發(fā)生的5次大能量礦震事件均進(jìn)行預(yù)警,而礦井原有模型僅預(yù)警4次,本文模型具有現(xiàn)場實(shí)際應(yīng)用價值。
3)通過微震數(shù)據(jù)分析與深度學(xué)習(xí)相結(jié)合構(gòu)建沖擊地壓預(yù)警模型,與傳統(tǒng)的基于機(jī)理分析和工程經(jīng)驗(yàn)的預(yù)警模型有顯著不同,主要為沖擊地壓監(jiān)測預(yù)警提供1種新的嘗試,也為地音、電磁輻射等其他監(jiān)測手段提供參考。