劉 暢,李冬嵬
(北京工業(yè)職業(yè)技術(shù)學(xué)院,北京 100042)
瓦斯作為煤礦開(kāi)采工程中重要的研究領(lǐng)域,也是導(dǎo)致煤礦安全事故發(fā)生的主要危險(xiǎn)因素[1]。瓦斯涌出是煤礦瓦斯主要來(lái)源之一,瓦斯涌出量通過(guò)瓦斯監(jiān)測(cè)獲得,同時(shí)瓦斯監(jiān)測(cè)數(shù)據(jù)攜帶誘使事故發(fā)生的規(guī)律信息[2]。依據(jù)瓦斯監(jiān)測(cè)監(jiān)控?cái)?shù)據(jù),從深層次挖掘工作面絕對(duì)瓦斯涌出量致災(zāi)規(guī)律出發(fā),掌握致災(zāi)變化規(guī)律,實(shí)現(xiàn)對(duì)將來(lái)時(shí)刻發(fā)展變化的準(zhǔn)確預(yù)測(cè),助力煤礦安全生產(chǎn),對(duì)于煤礦瓦斯災(zāi)害的預(yù)警預(yù)控具有重要現(xiàn)實(shí)意義。
對(duì)于瓦斯涌出量致災(zāi)變化預(yù)測(cè),國(guó)內(nèi)外專家學(xué)者進(jìn)行大量研究,成果豐碩。熊祖強(qiáng)等[3]應(yīng)用無(wú)偏灰色GM(1,1)耦合馬爾科夫建立預(yù)測(cè)模型,在相對(duì)瓦斯涌出量的變化趨勢(shì)基礎(chǔ)上對(duì)其進(jìn)行預(yù)測(cè);單亞峰等[4]通過(guò)結(jié)合改進(jìn)的極端學(xué)習(xí)機(jī)(IELM)和混沌時(shí)間序列,對(duì)瓦斯涌出量進(jìn)行了預(yù)測(cè);王永文[5]基于希爾伯特-黃變換(HHT)方法、布谷鳥(niǎo)搜索算法(CS)和極限學(xué)習(xí)機(jī)(ELM)基本理論,構(gòu)建了瓦斯涌出量的HHT-CSELM動(dòng)態(tài)預(yù)測(cè)模型;李勝等[6]提出構(gòu)建基于PCA-MFOA-SVM的耦合模型,進(jìn)行回采工作面絕對(duì)瓦斯涌出量預(yù)測(cè);Fu Hua等[7]采用改進(jìn)的蟻群算法優(yōu)化徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù),構(gòu)建工作面瓦斯涌出量預(yù)測(cè)的混合型最大最小螞蟻系統(tǒng)。以上模型從一定程度上遵循了瓦斯涌出量的非線性特征,提高了對(duì)煤礦瓦斯災(zāi)害的預(yù)控能力。然而,在多種非線性因素的綜合作用下,瓦斯涌出量時(shí)序樣本可看成一組隨機(jī)變化的非平穩(wěn)信號(hào),而現(xiàn)有模型較多定位在正態(tài)分布基礎(chǔ)上,但是尚未從監(jiān)測(cè)數(shù)據(jù)樣本自身考慮更深一步的物理機(jī)制。預(yù)測(cè)結(jié)果由于受到模型固有缺陷、因素維數(shù)、時(shí)間因素等約束存在一定誤差,因此,在涌出量非線性本質(zhì)分析、仿真精度、運(yùn)算效率維度可進(jìn)行進(jìn)一步挖掘。綜上,作者將FastICA(fast independent component analysis)和BA-ELM(extreme learning machine)相結(jié)合,搭建基于FastICA-BA-ELM的瓦斯涌出量多尺度時(shí)變預(yù)測(cè)模型。采用FastICA方法對(duì)瓦斯涌出量時(shí)變序列進(jìn)行預(yù)處理,獲取若干個(gè)服從非高斯分布特性且不相關(guān)的獨(dú)立分量,并以此為基礎(chǔ)進(jìn)行多尺度特征分析;對(duì)分解出來(lái)的時(shí)變分量進(jìn)行單個(gè)BA-ELM預(yù)測(cè),將預(yù)測(cè)值等權(quán)疊加重構(gòu)最終預(yù)測(cè)結(jié)果,并根據(jù)屯蘭礦瓦斯涌出量實(shí)例進(jìn)行仿真,根據(jù)誤差評(píng)價(jià)指標(biāo)驗(yàn)證模型的有效性。
ICA是依據(jù)統(tǒng)計(jì)獨(dú)立的原則從多源線性混合信號(hào)中分離出若干獨(dú)立分量的技術(shù),將混合信號(hào)線性分解為非高斯分布且相互依賴性最小的統(tǒng)計(jì)獨(dú)立分量。利用獨(dú)立分量修正原始樣本數(shù)據(jù)的局部特征,進(jìn)行樣本數(shù)據(jù)潛在規(guī)律的挖掘[8]。
ICA基本原則是將時(shí)變序列變換到相互獨(dú)立的方向上,進(jìn)而產(chǎn)生若干正交且相互獨(dú)立的分量[9]。一般線性模型為:
y(t)=As(t)+n(t)
(1)
式中,y(t)為由時(shí)變時(shí)刻t的多源線性混合信號(hào)觀測(cè)值構(gòu)成的矢量;s(t)為原始混合信號(hào)矢量;n(t)為隨機(jī)噪聲矢量;A為m×n的滿秩混合矩陣。
ICA的目的是在s(t)和A未知的情況下,從觀測(cè)矢量x(t)中恢復(fù)出源信號(hào)矢量s(t),搜尋到一個(gè)分離矩陣W:
W=[w1,w2,…,wN]T
(2)
式中,wi為m×1的權(quán)矢量,通過(guò)y(t)=W(t)x(t)產(chǎn)生源信號(hào)的估計(jì)y(t)=[y1(t),y2(t),…,yN(t)]T,其中各分量統(tǒng)計(jì)獨(dú)立。
JyEGy-EGygauss
(3)
式中,G(·)是非線性二次函數(shù)。
極限學(xué)習(xí)機(jī)ELM(Extreme Learning Machine)是一種針對(duì)單隱層前饋神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法,該模型構(gòu)造簡(jiǎn)單、學(xué)習(xí)效率高、泛化能力強(qiáng),對(duì)于非線性結(jié)構(gòu)具有很好的逼近能力,能夠全面的挖掘出瓦斯涌出量時(shí)變序列的非平穩(wěn)演變[12]。
其中,ωj=[ωj1,ωj2,…,ωjτ]T為輸入層與隱含層的連接權(quán)值向量;aj=[aj1,aj2,…,ajΨ]T為隱含層與輸出層的連接權(quán)值向量;bl為隱含層神經(jīng)元節(jié)點(diǎn)中第l個(gè)節(jié)點(diǎn)的偏置,fj=[fj1,fj2,…,fjΨ]T為輸出向量;φ(·)為激活函數(shù)。
根據(jù)零誤差逼近原理[13],設(shè)置aj、bj、ωj使得標(biāo)準(zhǔn)形式可簡(jiǎn)化如下:
Hα=Y
(6)
若隨機(jī)給定輸出閥值和權(quán)值,則H為確定的輸出矩陣,利用求解最小二乘解方法求出輸出權(quán)值矩陣a,則標(biāo)準(zhǔn)形式可轉(zhuǎn)化成a′=H+Y′求解,其中H+為隱含層輸出矩陣H的Moore-Penrose廣義逆[14]。
蝙蝠算法(Bat Algorithm,BA)是仿真蝙蝠利用回聲定位捕食行為而提出的一種新興群體智能優(yōu)化算法[15]。通過(guò)模擬蝙蝠超聲波回聲定位動(dòng)態(tài)行為,將搜尋優(yōu)化與回聲定位過(guò)程有機(jī)耦合,利用蝙蝠回聲定位位置代替目標(biāo)優(yōu)化問(wèn)題。
ELM模型隨機(jī)對(duì)輸入權(quán)值矩陣ω和隱含層閾值b進(jìn)行賦值,由于這種計(jì)算過(guò)程隨機(jī)性,會(huì)對(duì)仿真預(yù)測(cè)結(jié)果產(chǎn)生嚴(yán)重影響。鑒于此,構(gòu)建BA-ELM模型,利用BA算法優(yōu)化隨機(jī)賦值的ω和b,探尋ω和b最佳賦值,從而提升模型運(yùn)算的穩(wěn)定性。BA優(yōu)化ELM步驟如下:
1) 步驟1 :初始化BA基礎(chǔ)參數(shù),蝙蝠群體數(shù)量設(shè)定為N,其中第q只蝙蝠的位置和速度分別為Sq、Vq,回聲定位發(fā)射脈沖頻率為[λmin,λmax],脈沖速率為r0,其增強(qiáng)系數(shù)為γ,響度范圍為[A0,Amin],其衰減系數(shù)為δ,迭代次數(shù)為H,在樣本空間中,訓(xùn)練集為U,測(cè)試集為V,ELM模型的隱含層節(jié)點(diǎn)數(shù)設(shè)為P,令蝙蝠群體中個(gè)體都攜帶參數(shù)ω和b,則第q只蝙蝠參數(shù)表達(dá)式為:
Nq=[w11,…,w1U,…,wP1,…wPU,b1,…bP]
(7)
其中,j=1,2,…,Z,Z為中間變量。
3)步驟3:蝙蝠與食物的距離是動(dòng)態(tài)變化的,則經(jīng)過(guò)υ次迭代后個(gè)體q的各項(xiàng)參數(shù)更新為:
式中,υ為當(dāng)前迭代次數(shù);隨機(jī)變量σ∈[0,1]。
式中,μ∈[-1,1]的隨機(jī)數(shù);Aυ為當(dāng)前迭代次數(shù)所有bat的脈沖響度的平均值;O為搜索空間維數(shù)。
5)步驟5:在迭代過(guò)程中若蝙蝠q的適應(yīng)度F(SqO)較全局最優(yōu)S*的適應(yīng)度F(S*)優(yōu)越,則更新蝙蝠q的基本參數(shù)。若迭代達(dá)到搜索終止條件時(shí),求出最優(yōu)解為S*,相應(yīng)的適應(yīng)度函數(shù)為F(S*),則對(duì)應(yīng)的參數(shù)ω和b為最優(yōu)參數(shù)值。
首先利用FastICA算法分離出時(shí)序變量,然后與BA-ELM模型進(jìn)行耦合,最終構(gòu)建出FastICA-BA-ELM多尺度時(shí)變預(yù)測(cè)模型,模型的整體預(yù)測(cè)流程如圖1所示。
圖1 基于FastICA-BA-ELM耦合模型預(yù)測(cè)流程
一般將煤礦瓦斯涌出量時(shí)變序列記作為x(t),(t=1,2,…,m),考慮煤礦實(shí)際瓦斯涌出量受開(kāi)采情況影響,在樣本序列中存在前m個(gè)時(shí)變值對(duì)第m+1個(gè)有著某種影響,因此將時(shí)變序列x(t)劃分為訓(xùn)練集和測(cè)試集,模型預(yù)測(cè)流程如下:
1)利用FastICA-ELM預(yù)測(cè)模型對(duì)初始涌出量時(shí)變序列樣本進(jìn)行預(yù)處理,通過(guò)模型將樣本序列x(t)分解獲得n個(gè)分離信號(hào)Si(t)(t=1,2,…,n)。
2)以每個(gè)分離信號(hào)的前m次瓦斯涌出數(shù)據(jù)作為輸入樣本xi(j)=[ci(1),ci(2),…,ci(m)],以第m+1次瓦斯涌出數(shù)據(jù)作為輸出樣本yi(j)=[c(m+1)]。
3)初始化BA-ELM模型的基礎(chǔ)參數(shù),采用相空間重構(gòu)方法將各分離信號(hào)的訓(xùn)練集序列進(jìn)行空間重構(gòu),利用BA-ELM網(wǎng)絡(luò)模型學(xué)習(xí)能力,學(xué)習(xí)記憶重構(gòu)后的訓(xùn)練集,找到模型最優(yōu)參數(shù),構(gòu)建最優(yōu)BA-ELM模型,并利用其預(yù)測(cè)各分量的測(cè)試集。
4)最后等權(quán)疊加各分離信號(hào)預(yù)測(cè)結(jié)果,得到涌出量樣本序列的最終預(yù)測(cè)結(jié)果。
2018年8月,對(duì)屯蘭礦12507回采工作面瓦斯涌出量監(jiān)測(cè)數(shù)據(jù)進(jìn)行仿真預(yù)測(cè),初始樣本序列如圖2所示。對(duì)初始樣本做FastICA算法預(yù)處理,分離后信號(hào)序列如圖3所示。
圖2 原始瓦斯涌出量時(shí)變序列
圖3 瓦斯涌出量FastICA分解
根據(jù)圖3可以看出,初始涌出量時(shí)變樣本序列經(jīng)過(guò)FastICA分解后得到5個(gè)分離信號(hào),其中,分離信號(hào)S1和S2為低頻時(shí)變,S3、S4、和S5都是高頻時(shí)變。瓦斯涌出量影響因素眾多,導(dǎo)致監(jiān)測(cè)數(shù)據(jù)自身攜帶誘使瓦斯涌出量變化的大量信息,很難描述出造成非平穩(wěn)性的主因素,但FastICA能夠?qū)ν咚褂砍隽繒r(shí)序樣本進(jìn)行多層深度分解,獲取多尺度且相互獨(dú)立的分量,瓦斯涌出的本質(zhì)結(jié)構(gòu)被5個(gè)分量共同描述。利用互信息法結(jié)合虛假鄰點(diǎn)法獲取每一分量(τ、m)參數(shù),對(duì)5個(gè)分量進(jìn)行空間重構(gòu),利用重構(gòu)后的時(shí)變序列進(jìn)行訓(xùn)練和預(yù)測(cè)得到各分量的預(yù)測(cè)結(jié)果,根據(jù)等權(quán)重求和原則將各預(yù)測(cè)結(jié)果疊加,得到最終預(yù)測(cè)結(jié)果。
工作面采用“三八”工作制,三班可以看作為一個(gè)瓦斯涌出量采集循環(huán),假設(shè)前一天的瓦斯涌出量對(duì)第二天的數(shù)據(jù)采集存在某種影響。現(xiàn)取樣本序列前696 h瓦斯涌出量作為訓(xùn)練集進(jìn)行BA-ELM網(wǎng)絡(luò)訓(xùn)練,后24h的瓦斯涌出量作為測(cè)試集進(jìn)行預(yù)測(cè),模型預(yù)測(cè)結(jié)果如圖4所示。
圖4 瓦斯涌出量的FastICA-BA-ELM多尺度時(shí)變預(yù)測(cè)
為驗(yàn)證FastICA算法預(yù)處理時(shí)變序列的優(yōu)越性,將原始瓦斯涌出量時(shí)變序列進(jìn)行經(jīng)驗(yàn)?zāi)J椒纸釫MD(Empirical Mode Decomposition),分解得到7個(gè)IMF分量(PF1-PF7)和1個(gè)余量,如圖5所示,然后對(duì)IMF分量和余量分別進(jìn)行相空間重構(gòu),利用BA-ELM模型對(duì)重構(gòu)后的IMF分量和余量進(jìn)行預(yù)測(cè),將各預(yù)測(cè)結(jié)果等權(quán)重求和,得到EMD-BA-ELM模型的最終預(yù)測(cè)結(jié)果,如圖6所示。
圖5 瓦斯涌出量EMD分解
圖6 基于EMD-BA-ELM的瓦斯涌出量預(yù)測(cè)
一般選擇平均絕對(duì)誤差(MAE)、平均相對(duì)誤差(MRSE)和均方根誤差(RMSE)作為評(píng)價(jià)指標(biāo),校驗(yàn)各模型性能(預(yù)測(cè)結(jié)果)。最終結(jié)果見(jiàn)表1,由表1中可知,基于FastICA-BA-ELM模型的評(píng)價(jià)指標(biāo)(MAE、MRSE、RMSE)為(0.1124m3/min、1.577%、0.1244m3/min),均明顯小于其他兩種模型。因此,F(xiàn)astICA算法能夠多層深度地詮釋瓦斯涌出量的非平穩(wěn)性,多尺度且相互獨(dú)立的分量可以減小樣本數(shù)據(jù)非平穩(wěn)特性影響,詮釋出致災(zāi)變化規(guī)律,提升模型的預(yù)測(cè)精度與穩(wěn)定性,為分析礦井瓦斯涌出特性提供理論依據(jù)。
表1 3種模型的預(yù)測(cè)誤差
1)在多種非線性因素的綜合作用下,瓦斯涌出量時(shí)序樣本可看成一組隨機(jī)變化的非平穩(wěn)信號(hào),F(xiàn)astICA算法從信號(hào)統(tǒng)計(jì)特征出發(fā),將瓦斯涌出量時(shí)序樣本解成5個(gè)獨(dú)立分量,運(yùn)用BA優(yōu)化后的ELM模型對(duì)各分量預(yù)測(cè),等權(quán)疊加各預(yù)測(cè)值,重構(gòu)最終預(yù)測(cè)結(jié)果。模型簡(jiǎn)化了各個(gè)特征信息之間的干涉和耦合,更加準(zhǔn)確描述出瓦斯涌出的本質(zhì)結(jié)構(gòu),提高泛化能力和預(yù)測(cè)精度。
2)利用FastICA-BA-ELM模型對(duì)屯蘭礦12507回采工作面進(jìn)行瓦斯涌出量仿真預(yù)測(cè),將模型結(jié)果的MAE、MRSE和RMSE作為評(píng)價(jià)指標(biāo),F(xiàn)astICA-ELM模型的平均絕對(duì)誤差為0.1124m3/min,平均相對(duì)誤差為1.577%,均方根誤差為0.1244m3/min;EMD-BA-ELM模型的平均絕對(duì)誤差為0.3357m3/min,平均相對(duì)誤差為4.887%,均方根誤差為0.3603m3/min。FastICA-BA-ELM模型預(yù)測(cè)精度明顯高于EMD-BA-ELM模型,預(yù)測(cè)值與實(shí)際瓦斯涌出量基本一致。
3)基于FastICA-BA-ELM的多尺度時(shí)變預(yù)測(cè)模型能深層次地凸顯瓦斯涌出量時(shí)變序列的非平穩(wěn)性,更加精準(zhǔn)的預(yù)測(cè)瓦斯涌出量,提升煤礦瓦斯安全管理水平,減少因瓦斯涌出而引發(fā)的災(zāi)害事故,為瓦斯涌出量管理提供理論依據(jù),具有重要研究?jī)r(jià)值。