謝國民,單敏柱,付 華
(遼寧工程技術(shù)大學(xué)電氣與控制工程學(xué)院,遼寧葫蘆島125105)
基于IsoMap和MBFO-SVR的瓦斯涌出量動態(tài)預(yù)測研究*
謝國民*,單敏柱,付華
(遼寧工程技術(shù)大學(xué)電氣與控制工程學(xué)院,遼寧葫蘆島125105)
為了能夠?qū)崿F(xiàn)高精度與實時性的動態(tài)預(yù)測煤礦絕對瓦斯涌出量,本文提出了等容特征映射IsoMap(Isometric feature Mapping)與改進(jìn)細(xì)菌覓食優(yōu)化算法MBFO(Modified Bacteria Foraging Optimization)優(yōu)化支持向量回歸機SVR(Support Vector Regression)相結(jié)合的預(yù)測方法。瓦斯涌出是在多種影響因子共同作用下的結(jié)果,并且這些因素之間是復(fù)雜的非線性關(guān)系,因此本文中提出采用流形學(xué)習(xí)方法IsoMap對其進(jìn)行降維特征提取,該方法用測地距離(geodesic distace)取代了普遍采用的歐氏距離,有利于對高維特征內(nèi)在關(guān)系的挖掘,取得了優(yōu)于傳統(tǒng)的主成分分析(PCA)的結(jié)果;將MBFO算法對SVR的相關(guān)參數(shù)進(jìn)行尋優(yōu);將IsoMap分析結(jié)果輸入預(yù)測模型。仿真表明,與PSO算法比較,本文提出的預(yù)測方法預(yù)測精度較高,更加有利于對瓦斯涌出量預(yù)測。
瓦斯涌出量;等容特征映射;細(xì)菌覓食優(yōu)化算法;支持向量回歸機
EEACC:7230doi:10.3969/j.issn.1004-1699.2016.07.027
瓦斯涌出是造成礦井災(zāi)害的重要因素之一[1]。瓦斯涌出量是煤礦開采過程中由煤層中涌出的瓦斯的量[2]。實現(xiàn)高精準(zhǔn)、快速的動態(tài)瓦斯涌出量預(yù)測顯得尤為重要,這對防止瓦斯災(zāi)害事故和避免人員財產(chǎn)的損失具有重要作用。近幾年來,隨著無線傳感器的發(fā)展,為采集回采工作面的數(shù)據(jù)提供了平臺。對瓦斯涌出量的預(yù)測已經(jīng)有相關(guān)學(xué)者專家進(jìn)行許多研究,為防治瓦斯災(zāi)害做出了貢獻(xiàn)。例如神經(jīng)網(wǎng)絡(luò)預(yù)測[3-4]、灰色理論預(yù)測[5]、主成分回歸預(yù)測[6-7]、時間序列與混沌理論預(yù)測[8]、卡爾曼濾波預(yù)測[9]、支持向量機預(yù)測[10]等預(yù)測方法,雖然這些方法各有優(yōu)點,但是還存在一些不足,如神經(jīng)網(wǎng)絡(luò)只有在大量訓(xùn)練樣本的前提下,系統(tǒng)的預(yù)測精度才可以提高,然而瓦斯涌出量的樣本數(shù)據(jù)不但有限同時呈現(xiàn)不均勻的狀態(tài),使得神經(jīng)網(wǎng)絡(luò)在預(yù)測瓦斯涌出量方面受到制約;而采用主成分分析的方法來處理樣本會降低樣本數(shù)據(jù)所含的信息量,因為影響瓦斯涌出量的因素之間是非線性的關(guān)系,采用線性處理方法勢必會降低系統(tǒng)的預(yù)測精度。
針對上述預(yù)測模型的不足,本文提出了基于IsoMap和MBFO-SVR結(jié)合的瓦斯涌出量動態(tài)預(yù)測模型,預(yù)測采掘工作面的瓦斯涌出量。
IsoMap算法是Tenenbaum等人[11]于2000年提出的一種基于流形的方法,基本思想是在保證每個數(shù)據(jù)點之間的內(nèi)在幾何空間屬性變化最小的情況下,以測地距離度量表示在高維空間中各樣本之間的距離。該算法與多維尺度分析方法(Multidimensional Scaling,MDS)相比,對樣本數(shù)據(jù)的降維效率高,所需參數(shù)少[12-13]。首先將傳感器采集到的數(shù)據(jù)用IsoMap方法進(jìn)行分析,在樣本間測地距離不變的前提下獲得低維流序,消除數(shù)據(jù)采集時的干擾信號,為預(yù)測模型提供最接近實際數(shù)據(jù)的輸入信號;對細(xì)菌覓食優(yōu)化算法改進(jìn),以此搜索SVR的最佳參數(shù),提高預(yù)測模型準(zhǔn)確性與魯棒性,并且通過仿真來驗證此動態(tài)預(yù)測模型。
IsoMap算法使樣本特征的內(nèi)在幾何特性保持不變,同時挖掘出在高維樣本中的復(fù)雜非線性流形,通過創(chuàng)建原數(shù)據(jù)間測地距離和降維數(shù)據(jù)間空間距離的映射關(guān)系從而約減樣本的維數(shù)[14-15]。其基本步驟如下:
步驟1構(gòu)建鄰域圖G。對原始樣本X中的所有特征向量xi,i=1,2,…,n,xi∈RD,D為特征向量的原始維數(shù),n為樣本數(shù)量,計算樣本間的歐式距離 dE(xi,xj)。在確定 k個鄰近點個數(shù)后,以dE(xi,xj)作為測量指標(biāo),如果xj是xi的近鄰點,那么將這兩個樣本點連接起來,其距離為dE(xi,xj)。對每一個樣本點都如此操作,就得到鄰域圖G。圖G中的節(jié)點和高維數(shù)據(jù)集中的點一一對應(yīng),連接邊表示鄰近關(guān)系。
步驟2計算測地距離矩陣DM。用鄰域圖G中xi和xj兩點間的最短路徑dG(xi,xj)近似流形M上的測地距離dM(xi,xj),以此得到距離矩陣DM。
步驟3計算d維輸出。把測地距離矩陣DM代入度量型MDS算法[16-17]計算低維嵌入
式中,I為n階單位陣;e為元素均為1的n維列向量。
對H進(jìn)行譜分解,并從大到小排列,取前d(d?D)個最大特征值,構(gòu)成對角矩陣
計算其本征向量
計算降維輸出結(jié)果,即得到低維嵌入流形
2.1改進(jìn)細(xì)菌覓食優(yōu)化算法
細(xì)菌覓食優(yōu)化算法(BFO)是Passino提出的一種優(yōu)化算法,該算法不僅并行搜索,而且易跳出局部極小值,有利于尋找最優(yōu)值[18-19]。本文中將BFO算法做了一些改進(jìn),BFO算法由內(nèi)到外分為如下3個模式:
①趨向操作設(shè)θi(j,k,l)是菌體i現(xiàn)在的位置,j代表第 j代趨向性操作,k代表第k代復(fù)制操作,l代表第l代遷移操作。那么菌體的方向由式(5)確定
其中,V(j,k,l)為隨機方向矢量,ci(j,k,l)為前進(jìn)的步長。
②復(fù)制操作標(biāo)準(zhǔn)BFO算法是按照如下方式復(fù)制的:設(shè)定菌體數(shù)量為S,先將種群中的細(xì)菌按照其適應(yīng)度由強到弱排序,則需要淘汰的細(xì)菌數(shù)量為Sr=S/2,保留前個Sr個體,并復(fù)制出與其完全相同的子代。本文中對復(fù)制操作做了一些改進(jìn),在淘汰后Sr個體后,不是將前Sr個體進(jìn)行直接復(fù)制,而是將這Sr個體相互交叉,得出每一個菌體的適應(yīng)度大小,按降序排序,前Sr個體代替BFO算法中淘汰的個體。
③遷移操作標(biāo)準(zhǔn)BFO算法可能會將種群中覓食能力強的個體淘汰掉,不利于優(yōu)化算法的快速收斂。本文中為了避免種群無法跳出局部最優(yōu)值,如果在多次尋優(yōu)的過程中適應(yīng)度的偏移量一直比所設(shè)定的偏差值小,那么久對第 j個細(xì)菌個體的位置加入隨機干擾,得到新的個體,如果這個新的個體的適應(yīng)度值有所變化,將剔除原第 j個細(xì)菌個體,并用新產(chǎn)生的個體代替它。擾動設(shè)置[20]可為
2.2支持向量回歸機
支持向量回歸機是用于函數(shù)估計的支持向量機,基本思想為經(jīng)過尋求最優(yōu)超平面,使得樣本距離該超平面誤差最小,以此完成回歸預(yù)測[21-22]。設(shè)樣本集為:
式中,ω為權(quán)向量,b為偏置量。
選擇ε-不敏感損失函數(shù)作為SVR的損失函數(shù),其定義如下:
式中,f(x)是回歸函數(shù)的預(yù)測值,y是對應(yīng)的實際值。
系數(shù)ω和b可以通過最小化目標(biāo)函數(shù)就得,具體為:
式中,懲罰因子C越大則表示對預(yù)測誤差的懲罰越大,ξi和是松弛變量,ε為精度。
現(xiàn)通過引入拉格朗日乘子,將此問題變?yōu)榍蠼馄鋵ε紗栴},如下:
式中,αi和是拉格朗日乘子,K(xi,xj)是核函數(shù),本文選取高斯函數(shù)為核函數(shù)。
通過求解對偶問題,得到其回歸函數(shù)為:
2.3MBFO優(yōu)化SVR
基于MBFO的ε-SVR參數(shù)尋優(yōu)步驟如下:
步驟1初始化各參數(shù),設(shè)定NC、Nr、Ne和細(xì)菌種群的規(guī)模S。
步驟2在每一代參數(shù)尋優(yōu)過程中,選擇細(xì)菌個體的極值作為當(dāng)前位置,根據(jù)式(14)與式(15)(均方差函數(shù)MES),求取單個細(xì)菌的適應(yīng)度值(式(16)),選擇適應(yīng)度值最好的細(xì)菌對應(yīng)的個體極值,作為種群極值。
式中,y′為樣本對應(yīng)的預(yù)測值。
步驟3根據(jù)圖1迭代更新細(xì)菌個體的位置。
步驟4將更新后的細(xì)菌中適應(yīng)度最好的個體與全局極值比較,如果優(yōu),則更新全局極值,否則全局極值保持。
步驟5判斷達(dá)到停止條件與否,否則返回步驟3。
3.1具體步驟
步驟1通過傳感器獲取瓦斯絕對涌出量特征數(shù)據(jù),經(jīng)查閱相關(guān)資料與文獻(xiàn),選取如下特征作為預(yù)測系統(tǒng)的原始輸入樣本向量:煤層瓦斯含量(g1,m3/t)、煤層巖性(g2)、鄰近煤層厚度(g3,m)、煤層深度(g4,m)、煤體傾角(g5)、回采面出采率(g6,%)、頂板管理(g7)。本文中選取了25組河南某煤礦2014年上半年瓦斯絕對涌出量影響因素相關(guān)數(shù)據(jù),如表1所示。
步驟2數(shù)據(jù)歸一化。使用MATLAB 2014b歸一化函數(shù) mapminmax,對樣本數(shù)據(jù)進(jìn)行歸一化處理。
步驟3利用MATLAB和降維工具箱編寫Iso-Map相關(guān)程序,對測得的數(shù)據(jù)做降維處理與分析,其中可變參數(shù)有近鄰點數(shù)k,低維空間維數(shù)。
近鄰點個數(shù)k是IsoMap算法中兩個關(guān)鍵因素之一,如果其值選取偏大會降低預(yù)測模型的運行時間,相反,如果取值過小,那么正常的數(shù)據(jù)極有可能被當(dāng)做為異常值而被算法舍去。本文中通過交叉驗證的方法來確定,以殘差最小選擇參數(shù)k的值。圖1為k與殘差的關(guān)系圖(d=3),隨著k的增大,殘差總體呈現(xiàn)先減小后平穩(wěn)的趨勢,在6<k<10處有殘差<0.01,綜合上述分析取k=8。
圖1 近鄰點k與殘差的趨勢圖
參數(shù)d嵌入的變量應(yīng)使其可以對原特征向量有足夠的表達(dá),其表達(dá)能力以ρ來衡量,ρ為DM與Y在低維空間歐氏距離矩陣的相關(guān)系數(shù),ρ越大則d嵌入的變量對原特征向量的解釋越多。圖2為k=8時,d與 ρ的關(guān)系,當(dāng)d=3時,已經(jīng)較大,對原始樣本表達(dá)充分,d繼續(xù)增大ρ的變化已經(jīng)很小。因此取d=3。
步驟4用MATLAB和LIBSVM工具箱編寫MBFO-SVR預(yù)測模型相關(guān)程序。
圖2 維數(shù)d與ρ的關(guān)系圖
3.2預(yù)測模型訓(xùn)練分析
設(shè)定細(xì)菌種群數(shù)量S為100,迭代次數(shù)為100次,趨向次數(shù)Ne為20次,最大游動步長為4,復(fù)制次數(shù)Nr為4,遷移次數(shù)Nc為2,遷移概率為0.25。損失參數(shù)ε取值設(shè)置為0.1,選取樣本數(shù)據(jù)中的15組數(shù)據(jù)作為訓(xùn)練樣本,用于對預(yù)測模型的參數(shù)進(jìn)行尋優(yōu),獲取最優(yōu)參數(shù)組合。采用MBFO算法搜索預(yù)測模型的最優(yōu)參數(shù)組合,尋優(yōu)算法搜索SVR的最優(yōu)參數(shù)如表2所示。
表2 預(yù)測模型尋找的最優(yōu)參數(shù)
圖3為預(yù)測模型在訓(xùn)練時迭代次數(shù)與訓(xùn)練誤差的收斂圖。從圖3中可以看出,MBFO-SVR模型的收斂速度較快,符合對預(yù)測實時性的要求,與標(biāo)準(zhǔn)BFO算法相比,誤差更小。
圖3 預(yù)測模型尋優(yōu)收斂圖
3.3預(yù)測分析
選取后10組數(shù)據(jù)作為測試樣本,用于驗證預(yù)測模型的預(yù)測精度,仿真結(jié)果如圖4所示。并且將本文提出的預(yù)測方法與其他預(yù)測方法進(jìn)行對比,預(yù)測結(jié)果如表3所示。
圖4 瓦斯涌出量實際值和預(yù)測值對比
表3中對PSO-SVR和MBFO預(yù)測模型在經(jīng)過PCA和IsoMap算法處理后的預(yù)測精度做了橫向和縱向的對比,PCA降維數(shù)為3。從表中可看出,采用IsoMap對樣本降維的效果優(yōu)于PCA降維的效果,這是因為,PCA為線性降維,而瓦斯涌出量的影響因子本身為高度非線性關(guān)系,所以采用IsoMap的方法的降維效果更加優(yōu)越;從橫向?qū)Ρ瓤梢园l(fā)現(xiàn),MBFO-SVR模型的預(yù)測精度優(yōu)于PSO-SVR預(yù)測模型。因此,將 IsoMap與 MBFOSVR相結(jié)合對瓦斯涌出量進(jìn)行預(yù)測的方法是可行的。
表3 預(yù)測模型預(yù)測結(jié)果的對比
本文中將IsoMap、MBFO和SVR三者相融合,提出了IsoMap-MFO-SVR優(yōu)化算法。IsoMap算法對樣本數(shù)據(jù)進(jìn)行非線性降維,符合瓦斯涌出量影響因子自身非線性關(guān)系,使得預(yù)測模型運行速度得以提升;將MBFO算法用于對SVR的參數(shù)尋優(yōu),加快了SVR的收斂速度,并且提高了預(yù)測的精度。通過采集的數(shù)據(jù)對本文提出的預(yù)測方法進(jìn)行仿真,結(jié)果表明,IsoMap的效果優(yōu)于常用的PCA處理,MBFO算法的預(yù)測相對誤差比常用的粒子群算法預(yù)測誤差小??傮w分析知,本文提出的方法具有預(yù)測精度高的特點,同時對其他領(lǐng)域也具有相關(guān)借鑒之處。
[1] 王濤,王洋洋,郭長娜,等.QGA-RBF神經(jīng)網(wǎng)絡(luò)在礦井瓦斯涌出量預(yù)測中的應(yīng)用[J].傳感技術(shù)學(xué)報,2012,25(1):119-123.
[2] 付華,許凡,徐耀松,等.礦井CH4和煤塵的光聲復(fù)合檢測方法研究[J].傳感技術(shù)學(xué)報,2013,26(7):922-926.
[3] 朱志杰,張宏偉,韓軍,等.基于PCA-BP神經(jīng)網(wǎng)絡(luò)的煤與瓦斯突出預(yù)測研究[J].中國安全科學(xué)學(xué)報,2013,23(4):45-50.
[4] 付華,王福嬌,陳子春.基于分?jǐn)?shù)階神經(jīng)網(wǎng)絡(luò)的瓦斯涌出量預(yù)測[J].傳感器與微系統(tǒng),2013,32(5):31-34.
[5] 呂貴春,馬云東.礦井瓦斯涌出量預(yù)測的灰色建模法[J].中國安全科學(xué)學(xué)報,2004,14(10):22-25.
[6] 呂伏,梁冰,孫維吉,等.基于主成分回歸分析法的回采工作面瓦斯涌出量預(yù)測[J].煤炭學(xué)報,2012,37(1):113-116.
[7] 皮子坤,賈寶山,賈廷貴,等.煤礦瓦斯涌出量動態(tài)預(yù)測的PCA-MFOA-GRNN模型及應(yīng)用[J].傳感技術(shù)學(xué)報,2015,28(11):1676-1681.
[8] 何利文,施式亮,宋譯,等.基于支持向量機(SVM)的回采工作面瓦斯涌出量混沌預(yù)測方法研究[J].中國安全科學(xué)學(xué)報,2009,19(9):42-46.
[9] 王曉路,劉健,盧建軍.基于虛擬狀態(tài)變量的卡爾曼濾波瓦斯涌出量預(yù)測[J].煤炭學(xué)報,2011,36(1):80-85.
[10]付華,王馨蕊,楊本臣,等.基于MPSO-CWLS-SVM的瓦斯涌出量預(yù)測[J].傳感技術(shù)學(xué)報,2014,27(11):1568-1572.
[11]Tenenbaum J B,de Silva V,Langford J C.A Global Geometric Framework for Nonlinear Dimensionality Reduction[J].Science,2000,290(5500),2319-2323.
[12]孫斌,薛廣鑫.基于等距特征映射和支持矢量機的轉(zhuǎn)子故障診斷方法[J].機械工程學(xué)報,2012,48(9):129-135.
[13]劉杏芳,鄭曉東,徐光成,等.基于流形學(xué)習(xí)的地震屬性特征提取方法應(yīng)用[C]//2010年國際地球物理技術(shù)交流會,2010,7月23-24,中國,蘭州.2010:144-146.
[14]陳法法,湯寶平,蘇祖強.基于等距離映射與加權(quán)KNN的旋轉(zhuǎn)機械故障診斷[J].儀器儀表學(xué)報,2013,34(1):215-220.
[15]倪志偉,薛永堅,倪麗萍,等.基于流形學(xué)習(xí)的多核SVM財務(wù)預(yù)警方法研究[J].系統(tǒng)工程理論與實踐,2104,34(10):2666-2674.
[16]丁英強,孫雨耕,李婷雪.基于多維校正的無線傳感網(wǎng)絡(luò)多維標(biāo)度定位算法[J].儀器儀表學(xué)報,2009,30(5):1002-1008.
[17]屈太國,蔡自興.基于分而治之的多維標(biāo)度算法[J].模式識別與人工智能,2014,27(11):961-968.
[18]Passino K M.Biomimicry of Bacterial Foraging for Distributed Optimization and Control[J].IEEE Control Systems Magazine,2002,22:52-67.
[19]楊大煉,劉義倫,李學(xué)軍,等.基于細(xì)菌覓食優(yōu)化決策的齒輪箱故障診斷[J].中南大學(xué)學(xué)報(自然科學(xué)版),2015,46(4):1224-1230.
[20]姜建國,周佳薇,周潤生,等.一種采用改進(jìn)細(xì)菌覓食優(yōu)化算法的圖像增強方法[J].控制與決策,2015,30(3):461-466.
[21]陳同俊,王新,管用偉.基于SVR和地震屬性的構(gòu)造煤厚度定量預(yù)測[J].煤炭學(xué)報,2015,40(5):1103-1108.
[22]辛菁,劉丁,徐慶坤.基于LS-SVR的機器人空間4DOF無標(biāo)定視覺定位[J].控制理論與應(yīng)用,2010,27(1):77-85.
謝國民(1969-),男,遼寧阜新人,博士,副教授,研究生導(dǎo)師。主要從事工業(yè)自動化和智能檢測及控制方面的研究工作,Lngdxgm@163.com;
單敏柱(1989-),男,河北張家口人,碩士研究生。主要研究控制理論與控制工程,shanminzhushr@163.com。
Based on the IsoMap with MBFO-SVR Gas Emission Dynamic Prediction Research*
XIE Guomin*,SHAN Minzhu,F(xiàn)U Hua
(College of Electrical and Control Engineering,Liaoning Technical University,Huludao Liaoning 125105,China)
In order to realize the dynamic prediction of absolute gas emission with high precision and real time in coal mine,this paper puts forward a forecasting method by combining the Isometric feature Mapping(IsoMap)and Support Vector Regression machine(SVR)optimized byModified Bacteria Foraging algorithm(MBFO).Gas emission is an emergent property resulting from various interactions,and these factors are complex nonlinear relationship.Therefore,using the IsoMap,a manifold learning method,is to reduce the dimension of feature extraction in this article.This methodis advantageous to excavate the high dimensioneigenvectorinner relationship by using geodesic distanceto replace the Euclidean distanceand superior to the traditional principal component analysis(PCA);By using MBFO to optimizing parameters of SVR,results analysised by IsoMap are the input of prediction model. Simulation shows that compared with PSO algorithm,the proposed prediction method forecasting accuracy is higher,more conducive to the quantity of gas emission prediction.
gas emission;Isometric feature mapping;bacteria foraging optimization;support vector regression machine
TP183;TP212
A
1004-1699(2016)07-1115-06
項目來源:國家自然科學(xué)基金項目(51274118);遼寧省教育廳基金項目(UPRP20140464)
2016-01-09修改日期:2016-02-22