楊 晉 芳
(1.煤科院節(jié)能技術(shù)有限公司,北京 100013; 2.煤炭資源高效開(kāi)采與潔凈利用國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100013;3.國(guó)家能源煤炭高效利用與節(jié)能減排技術(shù)裝備重點(diǎn)實(shí)驗(yàn)室,北京 100013)
煤粉工業(yè)鍋爐是近十年來(lái)發(fā)展起來(lái)的1種新型工業(yè)鍋爐,以其高效、節(jié)能、環(huán)保等優(yōu)點(diǎn)代替鏈條爐并迅速進(jìn)入市場(chǎng)。煙氣氧含量是燃煤鍋爐的重要指標(biāo)之一[1],其對(duì)鍋爐的效率和排放有著重要的影響[2-3],很多學(xué)者致力于鍋爐氧含量?jī)?yōu)化的相關(guān)研究[4-6]。
目前煤粉工業(yè)鍋爐煙氣氧含量的測(cè)量主要通過(guò)直接測(cè)量方式,借助氧化鋯傳感器或熱磁式傳感器測(cè)量煙氣氧含量[7],以上儀器可直接顯示氧含量的百分比,其反應(yīng)速度快、測(cè)量精度較高,然而也存在以下3個(gè)問(wèn)題:① 價(jià)格成本高;② 氧化鋯探頭在長(zhǎng)期使用中會(huì)被粉塵堵塞而出現(xiàn)老化現(xiàn)象,嚴(yán)重影響儀器的穩(wěn)定性和準(zhǔn)確性;③ 氧量?jī)x還需定期進(jìn)行效驗(yàn)。因此,此次研究考慮采用間接測(cè)量技術(shù)對(duì)煙氣氧含量進(jìn)行檢測(cè)。
間接測(cè)量采用軟測(cè)量的方法[8],即利用易于測(cè)量的一些輔助變量以估計(jì)主要變量,已在電站鍋爐上推廣應(yīng)用并取得較好的效果。采用軟測(cè)量方法間接獲得煙氣氧含量,可與儀器測(cè)量值比較并對(duì)其進(jìn)行修正,同時(shí)可實(shí)現(xiàn)對(duì)氧含量的實(shí)時(shí)監(jiān)控,從而提高鍋爐的燃燒效率[9]。
軟測(cè)量的建模方法主要分為以下4種[10],分別基于工藝機(jī)理分析方法、模式識(shí)別方法、人工神經(jīng)網(wǎng)絡(luò)方法和支持向量機(jī)方法?;诠に嚈C(jī)理分析方法存在滯后,很難符合實(shí)際工業(yè)現(xiàn)場(chǎng)對(duì)監(jiān)測(cè)數(shù)據(jù)實(shí)時(shí)性的需求;基于模式識(shí)別方法通常與人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等方法相結(jié)合,并應(yīng)用至實(shí)際生產(chǎn)中;基于人工神經(jīng)網(wǎng)絡(luò)方法易形成局部極小而得不到全局最優(yōu),很多學(xué)者針對(duì)此項(xiàng)缺點(diǎn)對(duì)其進(jìn)行改進(jìn)?;诨貧w支持向量機(jī)方法應(yīng)用于回歸估計(jì)問(wèn)題中,得到很好的效果,此方法預(yù)測(cè)精度很高且泛化能力強(qiáng)。目前已有較多基于此方法進(jìn)行軟測(cè)量模型的建立,并已應(yīng)用至工程實(shí)際。但該方法對(duì)于大規(guī)模訓(xùn)練樣本難以實(shí)施,建模精度不高。至目前為止,最常用的軟測(cè)量方法主要包括基于人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的方法。
針對(duì)基于人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)方法的煙氣氧含量間接預(yù)測(cè)技術(shù),已有大量研究并成功應(yīng)用于電站鍋爐。胡世廣[11]利用神經(jīng)網(wǎng)絡(luò)進(jìn)行火電廠煙氣含氧量的測(cè)量并進(jìn)行建模研究,為火電廠的氧量測(cè)量技術(shù)提供新手段。馬良玉[12]等基于L-M算法改進(jìn)神經(jīng)網(wǎng)絡(luò)模型以更準(zhǔn)確地預(yù)測(cè)煙氣含氧量,為實(shí)現(xiàn)鍋爐的燃燒優(yōu)化調(diào)整、節(jié)煤降耗奠定基礎(chǔ)。Zhenghao Tang[13]等使用DBN深度學(xué)習(xí)模型對(duì)電廠鍋爐氧含量進(jìn)行預(yù)測(cè),結(jié)果顯示可準(zhǔn)確地預(yù)測(cè)結(jié)果。Ma Liangyu[14]等基于ANN對(duì)1000MW電廠煙氣氧含量進(jìn)行預(yù)測(cè),結(jié)果顯示此模型可精確預(yù)測(cè)煙氣氧含量,對(duì)電廠改善鍋爐燃燒、節(jié)約能源和減少煤耗具有指導(dǎo)作用。楊秀等[15]采用1種基于粒子群改進(jìn)的支持向量機(jī)算法對(duì)氧含量軟測(cè)量進(jìn)行建模研究,仿真結(jié)果表明預(yù)測(cè)精度較高、泛化能力良好。任錦等[16]提出改進(jìn)最小二乘支持向量機(jī)模型PSO-LSSVM并對(duì)氧含量進(jìn)行預(yù)測(cè),最終仿真結(jié)果顯示:改進(jìn)的軟測(cè)量模型預(yù)測(cè)精度更高且泛化性更好、模型可靠性更高。Changliang Liu等[17]使用LS-SVM對(duì)煙氣氧含量進(jìn)行預(yù)測(cè),通過(guò)預(yù)測(cè)值和實(shí)際值比較可知,其提出的模型可較準(zhǔn)確地預(yù)測(cè)電廠煙氣氧含量。
以上研究均針對(duì)電站鍋爐,而目前對(duì)煤粉工業(yè)鍋爐氧含量的預(yù)測(cè)仍很稀少,由此筆者提出煤粉工業(yè)鍋爐氧含量預(yù)測(cè)模型,以期為工業(yè)煤粉鍋爐燃燒系統(tǒng)優(yōu)化提供指導(dǎo)。
現(xiàn)場(chǎng)數(shù)據(jù)采集基于煤粉工業(yè)鍋爐系統(tǒng)的以下工藝流程:煤粉由供料器均勻送入鍋爐燃燒器并在爐膛內(nèi)燃燒,煙氣經(jīng)爐膛內(nèi)的SNCR(Selective Non-Catalytic Reduction)選擇性非催化還原脫硝和尾部的SCR(Selective Catalytic Reduction)選擇性催化還原脫硝后,進(jìn)入NGD(No Gap Desulfurization)半干法脫硫除塵一體化裝置進(jìn)行脫硫除塵,潔凈煙氣排至煙囪進(jìn)入大氣,鍋爐飛灰經(jīng)倉(cāng)泵輸送至密閉灰塔排出,經(jīng)封閉罐車(chē)運(yùn)輸出廠。
煤粉鍋爐DCS(Distributed Control System)分布式控制系統(tǒng)中的歷史數(shù)據(jù)是整個(gè)鍋爐工藝過(guò)程的所有設(shè)備測(cè)點(diǎn)數(shù)據(jù),而氧含量的預(yù)測(cè)只與部分工藝相關(guān),即進(jìn)料、燃燒和煙氣排放3個(gè)過(guò)程,因此采集數(shù)據(jù)時(shí)只需篩選出關(guān)于3個(gè)過(guò)程的相關(guān)變量即可。
以某礦20 t/h煤粉工業(yè)鍋爐為研究對(duì)象,以20 min為采樣時(shí)間,采集了采暖高峰期2個(gè)月的數(shù)據(jù)。根據(jù)系統(tǒng)機(jī)理和工藝流程對(duì)變量進(jìn)行初選,選擇了給料頻率、引風(fēng)機(jī)頻率、爐膛負(fù)壓、前爐膛溫度、省煤器出口煙溫等20個(gè)變量。以上變量分為控制變量和狀態(tài)變量?jī)纱箢?lèi)??刂谱兞繛榧夹g(shù)操作可控制的變量,采集的控制變量為6個(gè),分別為給料頻率、補(bǔ)水閥開(kāi)度、引風(fēng)機(jī)頻率、二次風(fēng)閥開(kāi)度、進(jìn)風(fēng)閥1開(kāi)度、進(jìn)風(fēng)閥2開(kāi)度。狀態(tài)變量是反應(yīng)鍋爐狀態(tài)的一些變量,不能直接控制,初篩包括狀態(tài)變量14個(gè),分別為蒸汽流量、前爐膛溫度、后爐膛溫度、一次風(fēng)壓、省煤器入口煙溫、省煤器入口水溫、省煤器出口煙溫、省煤器出口水溫、蒸汽壓力、二次風(fēng)流量、爐膛負(fù)壓、蒸汽溫度、爐尾負(fù)壓、汽包水位。
從現(xiàn)場(chǎng)運(yùn)行的歷史數(shù)據(jù)庫(kù)中所采集的數(shù)據(jù)一般情況下都含有異常數(shù)據(jù)及干擾數(shù)據(jù),其會(huì)影響模型的訓(xùn)練,因此需對(duì)歷史數(shù)據(jù)進(jìn)行預(yù)處理[18]。此次研究刪除異常值和缺失值后,最終得到2 598條數(shù)據(jù)。
輸入的變量直接影響模型的預(yù)測(cè)準(zhǔn)確性,太多的輸入變量將會(huì)降低預(yù)測(cè)精度并增加模型的計(jì)算時(shí)間,因此有必要將冗余數(shù)據(jù)去除。通過(guò)歷史數(shù)據(jù)集的相關(guān)性選擇,使用F檢驗(yàn)判斷每個(gè)輸入變量和煙氣氧含量的關(guān)系。F檢驗(yàn)、方差齊性檢驗(yàn)是用來(lái)捕捉每個(gè)特征與標(biāo)簽之間線性關(guān)系的過(guò)濾方法。使用F檢驗(yàn)將篩選出與氧含量有著顯著關(guān)系的變量。通過(guò)以下公式(1)和公式(2)計(jì)算F值,F(xiàn)值越大則輸入變量與氧含量之間的相關(guān)性就越大。
(1)
(2)
式中,Xi代表所有樣本在i號(hào)特征上取值的n維列向量,y是氧含量;ri是樣本的相關(guān)系數(shù)。
經(jīng)過(guò)F檢驗(yàn),從上述20個(gè)變量中選取與氧含量關(guān)系顯著的變量:蒸汽流量、給料頻率、后爐膛溫度、一次風(fēng)壓、二次風(fēng)閥開(kāi)度、進(jìn)風(fēng)閥1開(kāi)度、進(jìn)風(fēng)閥2開(kāi)度、省煤器入口煙溫、引風(fēng)機(jī)頻率、蒸汽壓力、爐膛負(fù)壓、二次風(fēng)流量、爐尾負(fù)壓、蒸汽溫度14個(gè)變量,其中控制變量5個(gè),狀態(tài)變量9個(gè)。
從DCS中采集的歷史數(shù)據(jù),其各變量有著不同的單位,一些變量大小在數(shù)值上相差很大,有的甚至達(dá)到幾個(gè)數(shù)量級(jí)。為了不影響模型的精度,需要將采集到的數(shù)據(jù)進(jìn)行Z-score 標(biāo)準(zhǔn)化,以消除因?yàn)閿?shù)據(jù)數(shù)量級(jí)相差大造成的變量對(duì)模型作用差異大。
Z-score標(biāo)準(zhǔn)化公式詳見(jiàn)如下公式(3):
(3)
經(jīng)過(guò)Z-score標(biāo)準(zhǔn)化的所有數(shù)據(jù)都聚集在0附近,方差為1,經(jīng)過(guò)處理后的數(shù)據(jù)不會(huì)造成因數(shù)據(jù)的數(shù)量級(jí)差異而影響模型精度等問(wèn)題。
支持向量機(jī)是用于分類(lèi)的算法,支持向量也可用于回歸,稱之為支持向量回歸(SVR)。支持向量機(jī)可分為支持向量分類(lèi)和支持向量回歸[19],支持向量回歸因其優(yōu)越的學(xué)習(xí)性能,使其在系統(tǒng)辨識(shí)、預(yù)測(cè)估計(jì)等領(lǐng)域被廣泛研究應(yīng)用。文中預(yù)測(cè)氧含量值,采用支持向量回歸算法。
給定數(shù)據(jù)集:D={(x1,y1),(x2,y2),……,(xn,yn)},yn∈R,且令:
f(x)=wTx+b
(4)
w和b是待確定的模型參數(shù),T為轉(zhuǎn)置符號(hào),希望學(xué)得1個(gè)回歸模型,使得f(x)與y盡可能接近。假設(shè)能容忍f(x)與y之間最多有ε的偏差,如圖1所示。
圖1 支持向量回歸模型原理圖Fig.1 Schematic diagram of support vector regression model
即僅當(dāng)f(x)與y之間的差別絕對(duì)值大于ε時(shí)才計(jì)算損失。于是,SVR問(wèn)題可形式化為:
(5)
式中,C為正則化常數(shù);lε是圖1中所示的ε-不敏感損失函數(shù):
(6)
引入松弛變量和拉格朗日乘子,最終可解得SVR為:
(7)
上文經(jīng)過(guò)F檢驗(yàn)已篩選出14個(gè)變量,其中控制變量5個(gè)、狀態(tài)變量9個(gè)。模型中的變量見(jiàn)表1??紤]到輸入變量的性質(zhì),將模型訓(xùn)練分為控制變量、狀態(tài)變量以及兩者合并3種方式,并分別對(duì)3個(gè)訓(xùn)練的模型依次進(jìn)行測(cè)試。
表1 模型中的變量詳情T(mén)able 1 Variables details in model
將經(jīng)過(guò)處理的2 598條數(shù)據(jù)的70%作為訓(xùn)練集,建立控制變量、狀態(tài)變量以及兩者合并的支持向量回歸模型并進(jìn)行訓(xùn)練,30%作為測(cè)試集測(cè)試模型的性能。3種情況下煙氣氧含量軟測(cè)量模型的預(yù)測(cè)結(jié)果分別如圖2、圖3和圖4所示,藍(lán)色實(shí)線代表直接測(cè)量所得的真實(shí)值,桔色虛線代表預(yù)測(cè)值。
從圖2~圖4可看出,3種軟測(cè)量模型的煙氣氧含量預(yù)測(cè)值均能較為準(zhǔn)確地反映真實(shí)值的變化趨勢(shì)。
將圖2與圖3和圖4分析比較可知,圖2預(yù)測(cè)值與真實(shí)值差距偏大,控制變量調(diào)節(jié)后可即時(shí)反饋到從DCS中取得的數(shù)據(jù)上,例如給料頻率從20調(diào)整為10,取得的歷史數(shù)據(jù)顯示為10,而實(shí)際鍋爐工況需要一定的時(shí)間才能基本穩(wěn)定地運(yùn)行在給料頻率為10的工況。因此若取到此組數(shù)據(jù),瞬時(shí)取到的氧含量值有一定的誤差。故若只基于控制變量來(lái)預(yù)測(cè)模型,結(jié)果和直接測(cè)量之間的誤差較大。而基于狀態(tài)變量的預(yù)測(cè)結(jié)果符合最佳,出現(xiàn)以上現(xiàn)象是由于狀態(tài)變量較控制變量有一定的延遲,和直接測(cè)量得到的氧含量較為同步。對(duì)于基于控制變量和狀態(tài)變量?jī)烧吆喜⒌腟VR模型,其準(zhǔn)確度介于兩者之間。
圖2 基于控制變量的預(yù)測(cè)值與真實(shí)值比較Fig.2 Comparison of prediction values and real values based on control variables
圖3 基于狀態(tài)變量的預(yù)測(cè)值與真實(shí)值比較Fig.3 Comparison of prediction values and real values based on state variables
圖4 控制變量和狀態(tài)變量合并的預(yù)測(cè)值與真實(shí)值比較Fig.4 Comparison of prediction values and real values based on both control and state variables
為了評(píng)價(jià)預(yù)測(cè)模型,使用均方誤差(MSE)、平均絕對(duì)誤差(MAE)和決定系數(shù)(R-Square)來(lái)衡量預(yù)測(cè)模型的性能[20],其計(jì)算見(jiàn)公式(8)~公式(10):
(8)
(9)
(10)
式中m——測(cè)試數(shù)據(jù)的樣本數(shù)量,個(gè);
yi——煙氣氧含量真實(shí)值,%;
對(duì)測(cè)試結(jié)果分析詳見(jiàn)表2,MSE和MAE的值越小,說(shuō)明模型精度越高。而R2取值范圍為[0,1],R-Squared越大,表示模型擬合效果越好。評(píng)價(jià)指標(biāo)進(jìn)一步說(shuō)明基于狀態(tài)變量的SVR模型效果最佳。
表2 模型評(píng)價(jià)指標(biāo)Table 2 Model evaluation indicators
煤粉工業(yè)鍋爐的燃燒工況較為復(fù)雜,而直接測(cè)量氧含量?jī)x器成本高,還受到鍋爐運(yùn)行積灰等影響,因此軟測(cè)量越來(lái)越受到人們的重視,也逐漸應(yīng)用至實(shí)際工業(yè)生產(chǎn)中。煙氣氧含量預(yù)測(cè)技術(shù)已在電站鍋爐上得以推廣應(yīng)用,對(duì)在工業(yè)鍋爐上的應(yīng)用具有借鑒意義。
為了解決工業(yè)鍋爐的氧含量軟測(cè)量問(wèn)題,筆者提出了支持向量回歸模型對(duì)工業(yè)鍋爐的煙氣進(jìn)行氧含量測(cè)量。整個(gè)預(yù)測(cè)模型分為以下3個(gè)部分:
(1)選取煙氣氧含量的主要影響變量并將其對(duì)應(yīng)的數(shù)據(jù)標(biāo)準(zhǔn)化,使用了F檢驗(yàn)篩選出對(duì)氧含量有顯著影響的變量,最終選取14個(gè)變量作為輸入,為了防止因不同的變量數(shù)值上數(shù)量級(jí)相差較大進(jìn)而造成訓(xùn)練模型時(shí)各變量作用相差巨大,對(duì)輸入數(shù)據(jù)進(jìn)行Z-score標(biāo)準(zhǔn)化。
(2)建立模型。將第一步選出來(lái)的變量分為控制變量和狀態(tài)變量,并運(yùn)用SVR理論構(gòu)建分別基于控制變量、狀態(tài)變量和兩者合并的氧含量預(yù)測(cè)模型,結(jié)果表明3種模型的趨勢(shì)與測(cè)量值一致,基于狀態(tài)變量SVR模型優(yōu)于其它兩者,基于狀態(tài)變量的模擬結(jié)果能較好地預(yù)測(cè)實(shí)際值的趨勢(shì),為工業(yè)煤粉鍋爐燃燒系統(tǒng)優(yōu)化提供指導(dǎo)。
(3)模型評(píng)價(jià)。為了評(píng)價(jià)預(yù)測(cè)模型,使用均方誤差、平均絕對(duì)誤差和決定系數(shù)來(lái)衡量預(yù)測(cè)模型的性能,進(jìn)一步證明了基于狀態(tài)變量的SVR模型效果最佳。