彭 程,劉永濤,尤文強(qiáng),馬紅梅
(1.華北科技學(xué)院電子信息工程學(xué)院,河北 三河 065201;2.應(yīng)急管理部煤炭安全監(jiān)測(cè)監(jiān)控技術(shù)安全生產(chǎn)重點(diǎn)實(shí)驗(yàn)室,河北 三河 065201)
礦井突水是煤礦生產(chǎn)安全的主要威脅之一,一旦發(fā)生突水事故,快速準(zhǔn)確判斷水源對(duì)及時(shí)處置事故、減小損失有重要意義。利用礦井突水的化學(xué)成分識(shí)別水源是其中一類重要方法。針對(duì)突水化學(xué)數(shù)據(jù),學(xué)者們采用了數(shù)量化理論[1]、聚類分析[2]、多組逐步Bayes判別[3]、熵權(quán)模糊綜合評(píng)價(jià)[4]、動(dòng)態(tài)自適應(yīng)模板[5]、可拓識(shí)別[6]等方法,建立了突水水源識(shí)別模型。
神經(jīng)網(wǎng)絡(luò)因其具有學(xué)習(xí)能力也被用于礦井突水水源識(shí)別,當(dāng)前應(yīng)用較多的神經(jīng)網(wǎng)絡(luò)模型有:BP神經(jīng)網(wǎng)絡(luò)[7]、Elman神經(jīng)網(wǎng)絡(luò)[8]和RBF神經(jīng)網(wǎng)絡(luò)[9]等。上述文獻(xiàn)使用神經(jīng)網(wǎng)絡(luò)分類器均取得了較好的識(shí)別效果,但是也存在兩個(gè)缺點(diǎn):一是神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法較為復(fù)雜且收斂性缺乏理論保證,訓(xùn)練時(shí)有可能陷入局部極小點(diǎn);二是在構(gòu)造神經(jīng)網(wǎng)絡(luò)進(jìn)行突水水源識(shí)別時(shí),使用了多種類型的水化學(xué)數(shù)據(jù),造成網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,也增大了水化學(xué)數(shù)據(jù)測(cè)量的工作量。感知器是一種線性神經(jīng)網(wǎng)絡(luò)分類器,具有訓(xùn)練簡(jiǎn)單可靠的優(yōu)點(diǎn)。能否構(gòu)造盡可能簡(jiǎn)單的感知器模型識(shí)別礦井突水水源,是本文研究的問題。
感知器結(jié)構(gòu)見圖1,其輸入輸出關(guān)系可以表示為式(1)。
y=f(wx-θ)
(1)
式中:x=[x1,x2,…,xm]T∈Rm、y=[y1,y2,…,yn]T∈Rn分別為感知器的輸入向量和輸出向量;w=[w1,w2,…,wm]∈Rn×m為權(quán)值矩陣;w的第k(k=1,2,…,m)列wk=[w1k,w2k,…,wnk]T∈Rn;θ=[θ1,θ2,…,θn]T∈Rn為閾值向量;激活函數(shù)f(·)定義為式(2)。
(2)
式中,z∈R。
圖1 感知器結(jié)構(gòu)圖Fig.1 Architecture of perceptron
式(1)中激活函數(shù)f(·)的運(yùn)算應(yīng)理解成對(duì)列向量wx-θ的每個(gè)分量分別按式(2)進(jìn)行計(jì)算。如果在感知器模型中將與閾值向量θ對(duì)應(yīng)的“-1”作為輸入向量的一部分,則感知器模型也可以表示為式(3)。
(3)
式中,W=[wθ]∈Rn×(m+1)為增廣后的權(quán)值矩陣。由式(3)和圖1可知,感知器模型不含有隱含層,結(jié)構(gòu)上比BP、RBF、Elman等多層神經(jīng)網(wǎng)絡(luò)簡(jiǎn)單。
感知器的訓(xùn)練(也稱為學(xué)習(xí))即為利用若干組訓(xùn)練用輸入向量x1、x2、…、xD及其對(duì)應(yīng)的期望輸出向量t1,t2、…、tD確定權(quán)值矩陣W的過程,可以按照式(4)定義的方式依次利用每一組輸入、輸出向量更新權(quán)值矩陣,見式(4)。
(4)
式中:Wold和Wnew分別為更新前后的權(quán)值矩陣;η>0為學(xué)習(xí)率;感知器輸出誤差向量見式(5)。
(5)
每組訓(xùn)練用輸入、輸出向量均使用過一次之后,稱為訓(xùn)練完成了一代,此時(shí)得到的感知器通常無法達(dá)到使用的要求,訓(xùn)練需要重復(fù)若干代。在訓(xùn)練過程的第g代,利用在權(quán)值矩陣更新過程中求得的誤差向量ei,計(jì)算第g代的總誤差見式(6)。
(6)
若Eg=0,說明在訓(xùn)練過程的第g代,權(quán)值矩陣W沒有更新,并且對(duì)于所有訓(xùn)練用輸入向量而言,感知器輸出向量與期望輸出向量均一致,即此時(shí)感知器正確地對(duì)訓(xùn)練樣本進(jìn)行了分類。故對(duì)于可以用感知器進(jìn)行分類的問題,可以用Eg=0作為訓(xùn)練結(jié)束的判斷條件。
對(duì)于不能用感知器分類的問題,總誤差Eg永遠(yuǎn)不會(huì)等于0,為了防止此種情況導(dǎo)致的訓(xùn)練不收斂,感知器學(xué)習(xí)算法中需要設(shè)置一個(gè)參數(shù):最大訓(xùn)練代數(shù)G,作為訓(xùn)練結(jié)束的條件,G應(yīng)取一充分大的自然數(shù)。
本文實(shí)現(xiàn)的感知器在訓(xùn)練開始之前進(jìn)行了歸一化處理,設(shè)原始的輸入向量為u1、u2、…、uD,則訓(xùn)練用輸入可以由
(7)
得到,其中
(8)
容易知道,歸一化操作后訓(xùn)練用輸入向量x1、x2、…、xD的各分量均位于區(qū)間[0,1]之內(nèi)。
綜上所述,使用感知器進(jìn)行突水水源識(shí)別的算法流程如下所述。
步驟1:按照式(7)對(duì)原始輸入向量u1、u2、…、uD進(jìn)行歸一化處理,得到訓(xùn)練用輸入向量x1、x2、…、xD;確定x1、x2、…、xD各自對(duì)應(yīng)的期望輸出向量t1、t2、…、tD;由輸入向量和期望輸出向量的維數(shù)確定感知器權(quán)值矩陣W的維數(shù)。
步驟2:設(shè)置訓(xùn)練參數(shù),包括學(xué)習(xí)率η和最大訓(xùn)練代數(shù)G。
步驟3:隨機(jī)生成初始權(quán)值矩陣W;由式(5)計(jì)算初始權(quán)值下各輸入向量對(duì)應(yīng)的輸出誤差向量,由式(6)計(jì)算初始權(quán)值下的總誤差E0;令當(dāng)前訓(xùn)練代數(shù)g=0。
步驟4:若Eg=0,訓(xùn)練成功,結(jié)束訓(xùn)練過程,轉(zhuǎn)到步驟8。
步驟5:令g=g+1;若g>G,訓(xùn)練失敗,退出程序;否則,令訓(xùn)練數(shù)據(jù)組數(shù)i=1。
步驟6:以xi為輸入向量、ti為期望輸出向量,按照式(5)計(jì)算輸出誤差向量ei,按照式(4)更新權(quán)值矩陣W。
步驟7:令i=i+1;若i>D,由式(6)計(jì)算第g代的總誤差Eg,返回步驟4;否則返回步驟6。
表1 測(cè)試樣本Table 1 Testing samples
為了能夠簡(jiǎn)化感知器模型的結(jié)構(gòu),在不損失訓(xùn)練和識(shí)別精度的情況下,應(yīng)盡可能減少感知器輸入的維數(shù)。能夠獲取的離子濃度信息共有六種,若使用其中的m(1≤m≤6)種離子的濃度作為感知器輸入,則可以構(gòu)造一個(gè)具有(m+1)個(gè)輸入的感知器進(jìn)行水源識(shí)別,前m個(gè)輸入分別對(duì)應(yīng)于一種離子的濃度(需按照式(7)進(jìn)行歸一化處理),最后1個(gè)輸入為與閾值向量θ對(duì)應(yīng)的-1。容易知道,感知器模型的輸入組合共有26-1=63種,本文采用枚舉法對(duì)這63種情況下的感知器逐一進(jìn)行訓(xùn)練。水樣共有4類,將其表示為四個(gè)列向量:[1 0 0 0]T(類型Ⅰ)、[0 1 0 0]T(類型Ⅱ)、[0 0 1 0]T(類型Ⅲ)和[0 0 0 1]T(類型Ⅳ),作為感知器的期望輸出向量。
式(6)定義的總誤差Eg隨訓(xùn)練代數(shù)g的變化過程見圖2。由圖2可知,感知器訓(xùn)練過程中,總誤差Eg并不總是隨著訓(xùn)練代數(shù)g逐漸下降,而是具有波動(dòng)性,但是經(jīng)過一定代數(shù)的訓(xùn)練之后總誤差Eg能夠收斂到0。
利用式(7)的方式處理表1中4組測(cè)試數(shù)據(jù),將結(jié)果輸入訓(xùn)練得到的感知器,得到的識(shí)別結(jié)果見表2,可知感知器正確識(shí)別了測(cè)試水樣的類型。根據(jù)感知器訓(xùn)練和識(shí)別的結(jié)果可以知道焦作礦區(qū)突水水源識(shí)別問題是線性可分的。
圖2 感知器總誤差收斂曲線Fig.2 Convergence curve of total error of perceptron
表2 感知器識(shí)別結(jié)果Table 2 Recognition results of perceptron
編號(hào)期望輸出感知器輸出實(shí)際類型識(shí)別類型1[1 0 0 0]T[1 0 0 0]TⅠⅠ2[0 1 0 0]T[0 1 0 0]TⅡⅡ3[0 0 1 0]T[0 0 1 0]TⅢⅢ4[0 0 0 1]T[0 0 0 1]TⅣⅣ
由于初始權(quán)值矩陣是隨機(jī)生成的,同時(shí)學(xué)習(xí)率η也是根據(jù)經(jīng)驗(yàn)選取的,需要考察使用不同的初始權(quán)值矩陣和學(xué)習(xí)率是否都能得到正確的識(shí)別結(jié)果。為此,設(shè)最大訓(xùn)練代數(shù)G=2 000,隨機(jī)生成1 000組不同的初始權(quán)值矩陣,在不同的學(xué)習(xí)率之下分別進(jìn)行感知器訓(xùn)練和測(cè)試樣本識(shí)別,得到的結(jié)果見表3。從表3中結(jié)果可以知道,對(duì)于不同的學(xué)習(xí)率和初始權(quán)值矩陣,2 000代之內(nèi)感知器訓(xùn)練均能收斂,并且得到的感知器均能正確判斷測(cè)試水樣的類型。這與感知器理論中的經(jīng)典結(jié)論[15]:線性可分問題總能在有限次訓(xùn)練之后收斂到一個(gè)穩(wěn)定的權(quán)值矩陣,該權(quán)值矩陣確定的感知器能夠?qū)崿F(xiàn)正確的分類,是吻合的;但是從計(jì)算效率的角度考慮,學(xué)習(xí)率η取值過大或者過小,都會(huì)增大訓(xùn)練代數(shù),增加計(jì)算量,故對(duì)焦作礦區(qū)突水水源識(shí)別問題而言,建議學(xué)習(xí)率η在區(qū)間[0.050,0.200]內(nèi)選取。
表3 不同學(xué)習(xí)率之下訓(xùn)練和識(shí)別的統(tǒng)計(jì)結(jié)果Table 3 Statistical results of training and recognitionunder different learning rates
構(gòu)建了感知器模型進(jìn)行焦作礦區(qū)礦井突水水源識(shí)別,應(yīng)用結(jié)果表明,該水源識(shí)別問題是線性可分的,訓(xùn)練后的感知器能夠正確判斷突水水源;并且識(shí)別突水水源時(shí)不需要使用Na+和K+離子的濃度信息,這樣處理在簡(jiǎn)化感知器模型結(jié)構(gòu)的同時(shí),有助于減小離子濃度檢測(cè)的工作量,加快水源識(shí)別的速度。
與BP神經(jīng)網(wǎng)絡(luò)等更復(fù)雜的神經(jīng)網(wǎng)絡(luò)相比,感知器在結(jié)構(gòu)上更簡(jiǎn)單,訓(xùn)練算法更容易實(shí)現(xiàn),對(duì)于線性可分問題而言訓(xùn)練過程的收斂性有保證。為此在進(jìn)行突水水源識(shí)別時(shí),建議首先嘗試使用感知器,并且在不損失識(shí)別能力的情況下應(yīng)盡可能減少使用的水化學(xué)信息的種類;在感知器無法進(jìn)行正確識(shí)別的情況下,再考慮使用更復(fù)雜的神經(jīng)網(wǎng)絡(luò)。