張自川,張進春
(河南理工大學 能源科學與工程學院,河南 焦作 454000)
氣化過程是煤、生物質、焦炭乃至生活垃圾等固體燃料在氣化爐中進行氣化反應,轉化為氣體產(chǎn)物,以用于化工生產(chǎn)、聯(lián)合循環(huán)發(fā)電、燃料電池發(fā)電等[1-2]熱加工轉化過程。氣化爐的性能受多種因素影響,如儀表精度、燃料特性(組分、粒徑、水分、灰分和能量含量)、燃料進給量、空氣流量、氣化爐結構設計、反應時間、溫度和壓力分布等[3],因此在正常生產(chǎn)過程中,氣化爐很難保持理想的穩(wěn)定狀態(tài),氣化過程參數(shù)往往呈波動狀態(tài),這些過程參數(shù)波動呈現(xiàn)的一些異常模式極有可能導致超限停車及其他事故發(fā)生,嚴重影響氣化生產(chǎn)的穩(wěn)定性。因此,對氣化過程參數(shù)(溫度、壓強以及轉化氣中H2,CO2,CO,O2等體積分數(shù))的動態(tài)變化,尤其是對可能出現(xiàn)的某種模式進行有效監(jiān)控和識別十分必要。
當前,研究者通過建立數(shù)學模型對氣化過程開展了大量研究。總體而言,已有數(shù)學模型可分為熱力學平衡模型和動力學模型[4]。熱力學平衡模型基于熱量守恒和質量守恒等定律考察氣化過程特性[5-8],從而預測輸出氣體的組成成分。熱力學平衡模型主要探討宏觀反應過程,因此,它適合對無法實現(xiàn)實時動態(tài)特性考察的過程進行研究。動力學模型主要基于動力學方程考察氣化過程的動態(tài)變化,可以預測氣化爐內氣體成分和溫度的分布情況等[9-12]。動力學模型依然屬于基于機理的理論性研究,達不到實際生產(chǎn)過程的參數(shù)實時動態(tài)性監(jiān)控和識別精度?,F(xiàn)有氣化爐模型的研究促進了對氣化爐內反應過程的認識,但對于氣化爐過程參數(shù)動態(tài)變化的實時監(jiān)控與特殊模式識別顯然是不夠的。
近些年來,支持向量機(support vector machine,SVM)、模糊系統(tǒng)(fuzzy systems)和人工神經(jīng)網(wǎng)絡(artificial neural networks,ANNs)等機器學習算法被用來實現(xiàn)高效的控制圖模式識別。然而,支持向量機的準確性取決于核函數(shù)和參數(shù)的選擇,而且運算成本很高。模糊系統(tǒng)有一個強大的推理引擎,可以識別出專家看不到的隱藏關系,但出錯率高,而且需要大量數(shù)據(jù)進行訓練。神經(jīng)網(wǎng)絡具有處理測量數(shù)據(jù)噪聲的能力,無需對監(jiān)測數(shù)據(jù)進行分布假設,許多學者對神經(jīng)網(wǎng)絡模型進行了優(yōu)化研究。神經(jīng)網(wǎng)絡模型優(yōu)化途徑可以分為兩種:一種是對神經(jīng)網(wǎng)絡輸入數(shù)據(jù)進行優(yōu)化;一種是對神經(jīng)網(wǎng)絡分類器進行優(yōu)化。對分類器優(yōu)化的研究有:R.S.Guh等[13]使用反向傳播神經(jīng)網(wǎng)絡(back-propagation neural network)對控制圖模式進行識別;R.S.Guh[14]提出一種基于learning-based model的神經(jīng)網(wǎng)絡和決策樹模型,檢測和識別控制圖模式;YANG J等[15]采用統(tǒng)計相關系數(shù)法,確定了6種常見的控制圖模式;WANG C H等[16]提出一種結合小波濾波和自適應共振理論(adaptive resonance theory,ART)的混合系統(tǒng),識別控制圖模式;S.K.Gauri等[17]提出一種基于分類與回歸樹(classification and regression trees,CART)以及人工神經(jīng)網(wǎng)絡技術的控制圖模式識別方案;G.S.M.T.Fatemi等[18]提出兩種神經(jīng)網(wǎng)絡混合模型,用于檢測和識別單一模式和并發(fā)模式的控制圖模式,確定主要的對應參數(shù),估計異常模式的起始點。對數(shù)據(jù)預處理的方法增快了識別模型的速度,但對識別模型的識別精度也會造成一定影響。對輸入數(shù)據(jù)進行預處理,以優(yōu)化控制圖模式識別模型的研究有:WANG C H等[19]結合獨立成分分析(independent component analysis,ICA)和決策樹(decision tree,DT)來識別控制圖模式;LU C等[20]提出一種集成ICA、工程過程控制(engineering process control,EPC)和反向傳播神經(jīng)網(wǎng)絡的混合方案,用于識別相關過程中的移動和趨勢模式;LU C[21]提出一種基于ICA的擾動分離方案(ICA-based disturbance separation scheme),用于診斷相關過程中不同移動幅度的移動模式;D.T.Pham等[22]提出9維的形狀特征,作為輸入數(shù)據(jù)的ANN-MLP識別模型;A.Hassan等[23]提出6維統(tǒng)計特征,作為輸入數(shù)據(jù)的ANN-MLP識別模型;Y.AI-Assaf[24]提出32維的頻率特征,作為輸入數(shù)據(jù)的ANN-MLP識別模型;V.Ranaee等[25]提出6維歐氏距離,作為輸入數(shù)據(jù)的ANN-RBF識別模型。對模型進行優(yōu)化的方法無形中增加了模型的復雜度,雖然提高了模型的精度,但一定程度上影響了訓練的速度。
然而,當前圍繞氣化過程參數(shù)動態(tài)變化的模式識別研究較少,而基于ANN模式識別的控制圖模式識別,則是實現(xiàn)過程參數(shù)動態(tài)變化監(jiān)控的有效工具。神經(jīng)網(wǎng)絡的性能在很大程度上取決于構成網(wǎng)絡隱含層的基函數(shù)數(shù)目和位置,且隨著輸入維度增加,隱含層基函數(shù)增加,訓練速度變慢。本文針對該問題,構建基于蜜蜂算法的徑向基函數(shù)神經(jīng)網(wǎng)絡(BA-RBFNN)模型,對模型進行訓練,減少輸入?yún)?shù)的維度和隱含層基函數(shù)的數(shù)量,以期提高訓練速度和識別模型性能。
氣化過程參數(shù)失穩(wěn)監(jiān)控模型主要包括數(shù)據(jù)輸入、特征提取、分類器識別、結果輸出。下文從氣化過程存在的失穩(wěn)模式類別、描述數(shù)據(jù)的特征類別、特征提取方法、分類器結構和分類器訓練方法等方面進行詳細說明。
氣化爐的運行模式分為正常模式(NOR)和3種異常模式。異常模式包括趨勢模式、偏移模式和循環(huán)模式。異常模式具體描述如下。
(1)趨勢模式:趨勢可定義為正向或負向的連續(xù)運動,據(jù)此,趨勢模式又可細分為遞增趨勢模式(UT)和遞降趨勢模式(DT)。造成氣化過程參數(shù)出現(xiàn)趨勢模式的原因可能有氣化設備磨損、操作人員疲勞和設備老化。用公式表示為
y(t)=μ+d×t+V,
(1)
式中:y(t)為t時刻的樣本值;μ為監(jiān)控變量的平均值;V為過程參數(shù)的白噪聲;d為傾斜度。
當d取正值時為遞增趨勢模式,如圖1(b)所示;當d取負值時為遞降趨勢模式,如圖1(c)所示。d取值為0.1δ≤|d|≤0.3δ,δ為數(shù)據(jù)的標準差。
(2)偏移模式:偏移模式又可細分為向上偏移模式(US)和向下偏移模式(DS)。造成氣化過程參數(shù)出現(xiàn)偏移模式的原因可能有進給料的更換或新工人的引進。用公式表示為
y(t)=μ+b×s+V,
(2)
式中,b決定偏移位置,b=0時不發(fā)生偏移,b=1時向上發(fā)生偏移,如圖1(d)所示,b=-1時向下發(fā)生偏移,如圖1(e)所示,其他字母含義同式(1)。
(3)循環(huán)模式:循環(huán)模式(CYC)表現(xiàn)為氣化過程參數(shù)呈現(xiàn)周期性波動,如圖1(f)所示,造成這種異常模式的原因一般是操作人員的周期性輪換或環(huán)境周期性變化。用公式表示為
y(t)=μ+a×sin(2πt/T)+V,
(3)
式中:a為振幅;T為變化周期,模擬結果如圖1(f)所示;t為氣化時間。其他字母含義同式(1)。
圖1 氣化爐運行模式類別
氣化過程參數(shù)失穩(wěn)模式不同,其參數(shù)特征也不同。模式識別過程本質上是區(qū)分參數(shù)的特征。在模式識別領域,好的特征集不僅可以提高分類器的識別精度,而且還可以降低分類器的復雜度,提高訓練效率。近年來,人們提出了不同特征對數(shù)據(jù)進行描述,如形狀特征、統(tǒng)計特征、頻率特征和歐式距離等。該文運用形狀特征和統(tǒng)計特征對數(shù)據(jù)進行描述。
1.2.1 形狀特征
參數(shù)的形狀識別是模式識別的重要研究方向,形狀特征描述有助于氣化過程的模式識別。氣化爐過程參數(shù)的形狀特征主要從表1中的幾種類型進行描述[26]。
表1 氣化過程參數(shù)形狀特征類型
1.2.2 統(tǒng)計特征
統(tǒng)計特征主要從數(shù)據(jù)存在的屬性特征和數(shù)量特征對數(shù)據(jù)進行描述。研究表明,參數(shù)均值(mean)、標準差(standard deviation)、偏度(skewness)、峰度(kurtosis statistical)等統(tǒng)計特征能有效提高識別精度。
正常模式和循環(huán)模式參數(shù)的平均值波動很小,可近似看作常數(shù),其余模式參數(shù)的平均值存在
圖2 氣化過程參數(shù)形狀特征圖(1)
NOR為正常模式;STR為分層模式;SYS為系統(tǒng)模式;CYC為循環(huán)模式;UT為遞增趨勢模式;DT為下降趨勢模式;US為向上偏移模式;DS為向下偏移模式
較大波動。因此,這一特征可將正常模式、循環(huán)模式和其他模式區(qū)分開。偏度反映了數(shù)據(jù)不對稱程度的信息,而峰度反映了數(shù)據(jù)分布的平緩程度。這些特征對應訓練數(shù)據(jù)的值如圖4所示。
圖4 氣化過程參數(shù)統(tǒng)計特征圖
1.2.3 特征的選擇方法
特征集的復雜度直接影響神經(jīng)網(wǎng)絡訓練的效果和識別精度。特征選擇實質上是計算每個特征的重要性,挑選出最具有鑒別作用的特征子集。
Apriori是一種關聯(lián)規(guī)則挖掘算法。這種算法可以從數(shù)據(jù)集中找到出現(xiàn)頻率最高的項集,刪除出現(xiàn)頻率最低的項集,從而減少不必要的搜索。度量特征集優(yōu)劣的兩個參數(shù)是置信度(Confidence)和支持度(Support):
Support(A→B)=P(A∩B),
(4)
圖3 氣化過程參數(shù)形狀特征圖(2)
(5)
該文提出的識別模型運用的分類器方法是徑向基函數(shù)神經(jīng)網(wǎng)絡模型,分類器的訓練方法選用蜜蜂算法。
1.3.1 徑向基函數(shù)神經(jīng)網(wǎng)絡模型
徑向基函數(shù)神經(jīng)網(wǎng)絡(RBFNN)是一種廣泛應用于模式識別、非線性函數(shù)逼近等領域的神經(jīng)網(wǎng)絡模型。它是一個具有單隱含層的前饋式神經(jīng)網(wǎng)絡。RBF在其中心點時,輸出值最大,當輸入偏離中心點時輸出值減小,并以高斯函數(shù)作為激活函數(shù)。RBFNN由3層構成,即輸入層、隱含層和輸出層,如圖5所示。
圖5 RBFNN結構
設Hj為第j個RBF。各RBF的輸出為
(6)
式中:x=(x1,x2,…,xd)T,為輸出向量;cj=(c1j,c2j,…,cdj)T,為第j個中心向量;σj為寬度參數(shù)。
RBFNN的y輸出為RBF的線性和,即
(7)
式中:wi=[wi1,wi2,…,wim]T,i=1,2,…,o,為第i個輸出神經(jīng)元的網(wǎng)絡權重向量;y為RBFNN的輸出;H=[H1,H2,…,Hm]T,為基函數(shù)向量;o為神經(jīng)網(wǎng)絡輸出層的神經(jīng)元個數(shù)。
1.3.2 分類器的訓練方法——蜜蜂算法(BA)
BA是一種基于群智能的全局優(yōu)化算法,受蜜蜂采蜜行為啟發(fā),根據(jù)蜜蜂不同分工情況,實現(xiàn)蜜蜂群信息共享,從而更快找到問題最優(yōu)解。結合BEE對模型進行訓練,縮小訓練范圍,縮短訓練時間。該算法首先將n只偵察蜂隨機放入搜索空間,偵察蜂在各搜索區(qū)域對搜索站點進行適合度評估。站點招募的蜜蜂越多,代表這個方案越有可能成為最優(yōu)方案。搜索區(qū)域大小的初始值a={a1,a2,…,ak}會被設置一個較大的值,k為變量數(shù)量。用公式表示為
ai(t)=ngh(t)×(maxi-mini),
(8)
ngh(0)=1.0,
式中,t為BEE主循環(huán)的迭代次數(shù)。當搜索過程不再出現(xiàn)更合適的點時,搜索區(qū)域a的大小將縮小。更新搜索區(qū)域大小的公式為
ngh(t+1)=0.8×ngh(t)。
(9)
根據(jù)以上算法,對搜索范圍進行搜索,隨著算法循環(huán)進行,搜索區(qū)域縮小,區(qū)域選擇也趨向最優(yōu)。區(qū)域中適合度高的蜜蜂將被留下,形成下一批蜜蜂種群,其余的蜜蜂將被隨機分配到搜索空間,用來尋找具有潛力的解決方案。重復以上迭代過程,直到滿足停止搜索條件為止。
利用蜜蜂算法,可以快速找到RBF神經(jīng)網(wǎng)絡中參數(shù)的最優(yōu)值,提高RBFNN的訓練速度。
氣化過程參數(shù)模式識別問題涉及處理復雜的高維數(shù)據(jù)集。而神經(jīng)網(wǎng)絡識別模型通常在低維度空間中表現(xiàn)更好,因此,將模型轉換成低維度空間非常重要。
對輸入數(shù)據(jù)進行形狀特征和統(tǒng)計特征提取,可以減少輸入維度。使用Apriori算法(AR)對特征集進行優(yōu)化選取,降低了問題的復雜性。
利用上文介紹的BA訓練RBFNN,RBFNN的訓練周期將會縮短。圖6給出了氣化爐模式識別模型的主要結構。圖6中,Inputi(i=1,2,…,60)為第i個輸入數(shù)據(jù);Fei(i=1,2,…,12)為提取的第i個特征;Fsi(i=1,2,…,M)為選中的第i個特征;Pi(i=1,2,…,6)為第i個模式。
圖6 氣化爐模式識別結構
為檢驗基于BA-RBFNN的氣化過程參數(shù)失穩(wěn)監(jiān)控方法的正確性,開展了數(shù)值模擬試驗研究。
數(shù)值模擬試驗設置不同的模式,這些模式均由60個數(shù)據(jù)點組成。首先根據(jù)式(10)將t處的點進行歸一化處理,使其落在[0,1]內。
(10)
運用式(1)~(3),通過仿真共生成1 500組模式數(shù)據(jù),6個模式各250組數(shù)據(jù)。其中,μ=80,a=15,d=0.5,s=20,t取(0,59),T=12。
仿真生成的1 500組模式數(shù)據(jù)中,用1 002組模式數(shù)據(jù)(每類167組數(shù)據(jù))訓練分類器,剩余的498組模式數(shù)據(jù)(每類83組)測試訓練的分類器性能。
RBFNN配置包括3層,即輸入層、隱含層和輸出層。輸入層有6個神經(jīng)元,每個神經(jīng)元代表一個特征(通過關聯(lián)規(guī)則算法篩選出的6個形狀特征和統(tǒng)計特征)。隱含層由35個神經(jīng)元組成。輸出層由6個神經(jīng)元組成,每個神經(jīng)元分別對應6個模式,如表2所示。
表2 輸出模式類別
表3是蜜蜂算法的參數(shù)設置。
表3 蜜蜂算法參數(shù)設置
表4給出了10次BEE的訓練結果。
表4 蜜蜂算法訓練結果
圖7為訓練過程中模式識別精度變化曲線。
圖7 訓練過程中模式識別精度變化曲線
表5給出了通過MATLAB軟件分別對傳統(tǒng)RBFNN和基于BEE的RBFNN進行訓練的結果。當傳統(tǒng)RBFNN要達到相對比較理想的識別效果時,隱含層神經(jīng)元需要498個。當傳統(tǒng)RBFNN與BA-RBFNN具有相同隱含層神經(jīng)元個數(shù)35時,傳統(tǒng)RBFNN的識別效果遠遠差于BA-RBFNN的。若要與BA-RBFNN達到相同的識別效果,傳統(tǒng)神經(jīng)網(wǎng)絡方法需要隱含層神經(jīng)元個數(shù)為175個。此時傳統(tǒng)神經(jīng)元個數(shù)是BEE-RBF神經(jīng)網(wǎng)絡方法的5倍。
表5 RBFNN訓練精度對比
針對現(xiàn)場數(shù)據(jù),運用BA-RBFNN識別模型對生物質氣化合成氣數(shù)據(jù)進行模式識別。
數(shù)據(jù)來源于德國Schwarze Pumpe地區(qū)的氣化爐(Combi-gasifier)[27],氣化爐示意圖如圖8所示[33]。剛啟動氣化爐時容易出現(xiàn)參數(shù)不穩(wěn)定現(xiàn)象,對合成氣H2在3種不同啟動情況下體積分數(shù)的波動分別進行模式識別。第1組是氣化爐從加熱工況啟動時合成氣H2體積分數(shù),第2組是氣化爐從預熱工況啟動時合成氣H2體積分數(shù),第3組是氣化爐從非預熱工況啟動時合成氣H2體積分數(shù),如圖9所示。
圖8 德國黑泵電廠的組合氧化爐(左)和德國皮爾納的并流固定床氧化爐(右)
圖9 不同工況下合成氣中H2的體積分數(shù)
BA-RBFNN識別模型參數(shù)如下。BEE:蜜蜂集群數(shù)n=200,選定區(qū)域數(shù)m=10,選取最優(yōu)區(qū)域數(shù)e=2,初始區(qū)域ngh=0.1,最佳站點招募的蜜蜂數(shù)nep=80,其他區(qū)域蜜蜂數(shù)nsp=20;RBFNN:輸入層神經(jīng)元X個數(shù)為6,隱含層神經(jīng)元P個數(shù)為35,輸出層神經(jīng)元Y個數(shù)為6。使用1 002組模式數(shù)據(jù)(每類167組數(shù)據(jù))訓練分類器,498組模式數(shù)據(jù)(每類83組)測試訓練的分類器性能。測試結果:訓練精度為99.6%。
分別運用不同模型對氣化爐數(shù)據(jù)模式進行識別監(jiān)控,識別結果如表6所示。
表6 不同模型對氣化爐數(shù)據(jù)模式識別結果
綜合比較可知,盡管模型分類器類別、輸入數(shù)據(jù)類別和輸入數(shù)據(jù)維度與模型性能沒有直接線性關系,但提出的BA-RBFNN模型卻對氣化爐合成氣的模式識別表現(xiàn)出較高的識別率。
在模擬試驗中,當傳統(tǒng)RBFNN要達到相對比較理想的識別效果時,隱含層神經(jīng)元需要498個。當傳統(tǒng)RBFNN與BA-RBFNN具有相同隱含層神經(jīng)元個數(shù)35時,傳統(tǒng)RBFNN的識別效果遠遠差于BA-RBFNN的。若要與BA-RBFNN達到相同的識別效果,傳統(tǒng)RBFNN需要隱含層神經(jīng)元175個。此時傳統(tǒng)神經(jīng)元個數(shù)是BA-RBFNN的5倍。試驗結果表明構建的基于BEE算法的分類器訓練方法,相較于傳統(tǒng)訓練方法速度更快,效果更好。
在對氣化爐模式識別試驗中,通過運用不同模式識別模型對氣化爐參數(shù)進行識別,不同的模式類別數(shù)、輸入數(shù)據(jù)類型、分類器類型、如輸入數(shù)據(jù)維度,對氣化爐參數(shù)的模式識別效果不同,而該文方法表現(xiàn)出較好的識別效果。
綜合比較,提出的氣化爐運行模式識別方法具有結構簡單、訓練速度快、識別率高等優(yōu)勢。