劉 岳,于 靜,金秀章
(華北電力大學(xué)控制與計(jì)算機(jī)工程學(xué)院,河北 保定 071003)
隨著大氣污染問(wèn)題日益嚴(yán)重,我國(guó)對(duì)燃煤機(jī)組NOx的排放要求也日益嚴(yán)格[1]。目前火電廠常用的煙氣脫硝技術(shù)是選擇性催化還原(SCR)脫硝技術(shù),該技術(shù)設(shè)備結(jié)構(gòu)簡(jiǎn)單,脫硝效率高。但電廠運(yùn)行工況復(fù)雜多變,SCR設(shè)備入口煙氣NOx含量波動(dòng)頻繁,使得脫硝過(guò)程噴氨量難以控制。當(dāng)噴氨量過(guò)少時(shí),NOx排放超標(biāo);噴氨量過(guò)多時(shí)不僅影響脫硝效率,還會(huì)腐蝕設(shè)備影響鍋爐正常運(yùn)行。因此,建立精準(zhǔn)有效的入口NOx排放量預(yù)測(cè)模型,可為噴氨量的優(yōu)化控制提供理論基礎(chǔ),對(duì)提高SCR煙氣脫硝系統(tǒng)控制品質(zhì)、減少電廠脫硝成本具有重要意義[2]。
燃煤機(jī)組NOx的產(chǎn)生受到多種因素如燃燒溫度、一次風(fēng)量、總煤量等影響,這些變量相互耦合,導(dǎo)致難以建立準(zhǔn)確的 NOx排放量的預(yù)測(cè)模型。近年來(lái),隨著機(jī)器學(xué)習(xí)發(fā)展,許多建模方法被提出并應(yīng)用于NOx排放量的預(yù)測(cè)。Zhou等人[3]采用支持向量機(jī)(SVM)建立了鍋爐NOx排放量的預(yù)測(cè)模型。王博等[4]在SVM的基礎(chǔ)上提出了一種基于支持向量回歸(SVR)的預(yù)測(cè)模型,提升了模型的穩(wěn)定性。Li等人[5]利用改進(jìn)的粒子群(PSO)算法對(duì)SVM模型進(jìn)行參數(shù)優(yōu)化,提高了NOx排放量預(yù)測(cè)模型的精度。此外,神經(jīng)網(wǎng)絡(luò)也被廣泛應(yīng)用于NOx預(yù)測(cè)模型建立。谷麗景等[6]利用人工神經(jīng)網(wǎng)絡(luò)對(duì)NOx的排放進(jìn)行了建模預(yù)測(cè)。李忠鵬等[7]利用尋優(yōu)算法優(yōu)化了BP神經(jīng)網(wǎng)絡(luò)參數(shù),建立了更加精確的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型。周洪煜等[8]對(duì)傳統(tǒng)的RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行了改進(jìn),通過(guò)引入混結(jié)構(gòu)隱含層,改善了傳統(tǒng)RBF神經(jīng)網(wǎng)絡(luò)變工況控制時(shí)的非線性和擾動(dòng)適應(yīng)能力。雖然人工神經(jīng)網(wǎng)絡(luò)擬合能力較強(qiáng),但仍存在結(jié)構(gòu)復(fù)雜、易陷入局部收斂等問(wèn)題。長(zhǎng)短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)是近年來(lái)新興的一種循環(huán)神經(jīng)網(wǎng)絡(luò),能夠?qū)?shù)據(jù)進(jìn)行長(zhǎng)期記憶,在時(shí)序數(shù)據(jù)處理上具有獨(dú)特優(yōu)勢(shì)。楊國(guó)田等[9]利用LSTM神經(jīng)網(wǎng)絡(luò)對(duì)NOx的排放建立了預(yù)測(cè)模型,錢虹等[10]將LSTM神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)相結(jié)合,提高了預(yù)測(cè)模型的泛化能力和收斂速度。
除建模方法外,輸入變量的選取也直接影響預(yù)測(cè)模型的精度。呂游等[11]采用偏最小二乘方法對(duì)輸入變量進(jìn)行特征提取以降低維數(shù)和消除相關(guān)性,唐振浩等[12]采用LASSO選擇算法分析變量的重要性,并利用經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)對(duì)信息進(jìn)行特征提取,防止模型過(guò)擬合。Peng等人[13]將基于概率密度的互信息法引入非線性建模中,用于估計(jì)輸入變量與輸出變量的時(shí)延,提高了模型泛化能力。上述方法均從輸入側(cè)進(jìn)行分析處理,并未考慮輸出側(cè)歷史數(shù)據(jù)的影響。
綜上所述,本文提出了一種基于特征優(yōu)化和改進(jìn)LSTM神經(jīng)網(wǎng)絡(luò)的SCR脫銷入口NOx質(zhì)量濃度預(yù)測(cè)模型。通過(guò)互信息算法確定變量之間的最佳延遲時(shí)間。通過(guò)mRMR算法對(duì)各個(gè)輸入變量進(jìn)行選擇,以模型的精度作為評(píng)價(jià)函數(shù),確定預(yù)測(cè)模型的最優(yōu)輸入變量。通過(guò)網(wǎng)格搜索算法和改進(jìn)粒子群算法對(duì)LSTM神經(jīng)網(wǎng)絡(luò)進(jìn)行參數(shù)尋優(yōu),建立SCR脫硝入口NOx質(zhì)量濃度的預(yù)測(cè)模型,并加入出口NOx質(zhì)量濃度歷史數(shù)據(jù)。經(jīng)實(shí)驗(yàn)證明,改進(jìn)后的預(yù)測(cè)模型與經(jīng)典預(yù)測(cè)模型相比預(yù)測(cè)精度更高,能夠滿足實(shí)際生產(chǎn)的需求。
在建模時(shí),選取合適的數(shù)據(jù)可以體現(xiàn)輸入和輸出之間的關(guān)系,提高預(yù)測(cè)模型的精度。一般情況下都是選取與輸出變量之間具有強(qiáng)相關(guān)性的變量,但是不同的輸入變量之間可能也具有強(qiáng)相關(guān)性,此時(shí)輸入集就產(chǎn)生了冗余變量,冗余變量會(huì)增加模型的復(fù)雜度,降低建模效率[14]。為此,提出了一種基于互信息的最大相關(guān)最小冗余特征選擇算法。
互信息可以描述2個(gè)變量是否有關(guān)系,以及關(guān)系的強(qiáng)弱[15]。2個(gè)變量x、y互信息I(x;y)的公式為
式中,p(x)和p(y)分別是x和y的邊緣概率分布函數(shù),p(x,y)表示x和y的聯(lián)合概率密度函數(shù)。
mRMR算法是一種filter特征選擇算法,在保證特征子集最大相關(guān)性的同時(shí)又去除了冗余特征。其評(píng)價(jià)函數(shù)為
式中,fi為待選的輸入變量,c為輸出變量,Sj為已選變量,β為懲罰因子。
當(dāng)懲罰因子較大時(shí)特征集的冗余性會(huì)降低,但會(huì)影響輸入特征集對(duì)輸出變量的相關(guān)性。文獻(xiàn)[15]提出采用已選特征集的特征數(shù)量作為懲罰因子,充分考慮了已選變量集對(duì)候選變量的影響。此時(shí)mRMR的評(píng)價(jià)函數(shù)為
輸入變量特征選擇的算法流程如下:
1)初始化已選輸入變量集合S(此時(shí)為空集),初始化待選輸入變量集f(包含全部的變量)。
2)采用序列前向選擇算法,首先從集合f中選出與輸出變量相關(guān)性最大的變量作為初始變量加入S中,從剩下的變量中依次選取1個(gè)變量加入集合S中,通過(guò)式(2)計(jì)算評(píng)價(jià)函數(shù)J,選取J最大時(shí)對(duì)應(yīng)特征變量為第2個(gè)加入集合S的特征變量。
3)通過(guò)上述方法依次確定各個(gè)特征加入集合的順序,從而完成對(duì)初始變量的重要性排序。
4)在對(duì)各個(gè)變量進(jìn)行重要性排序后,還需要確定輸入變量的具體個(gè)數(shù)。由于RBF神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的非線性映射能力,能夠反映不同的輸入變量對(duì)輸出的影響。因此,通過(guò)將不同特征子集輸入RBF神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練并預(yù)測(cè),將預(yù)測(cè)結(jié)果作為評(píng)價(jià)函數(shù),進(jìn)而確定一組最佳的輸入變量。
長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)是一種特殊的循環(huán) 神 經(jīng) 網(wǎng) 絡(luò)(RNN),它 由Hochreiter &Schmidhuber[16]1997年提出,并由Alex Graves[17]進(jìn)行了改良和推廣。RNN是一類能夠處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),它通過(guò)在神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中增加循環(huán)鏈接,因而具有短期記憶能力,可以用來(lái)處理序列數(shù)據(jù)。但RNN在處理長(zhǎng)期依賴(即時(shí)間序列上距離較遠(yuǎn)的節(jié)點(diǎn))時(shí)會(huì)遇到巨大的困難,會(huì)產(chǎn)生梯度消失或者梯度爆炸的問(wèn)題,LSTM神經(jīng)網(wǎng)絡(luò)在RNN的基礎(chǔ)上增加了輸入門限、遺忘門限和輸出門限,使得不同時(shí)刻的積分尺度可以動(dòng)態(tài)改變,避免了梯度消失或者梯度爆炸問(wèn)題。LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意Fig.1 Schematic diagram of the LSTM structure
LSTM神經(jīng)網(wǎng)絡(luò)由多個(gè)圖1這樣的模塊組成,圖1中ht–1為上一個(gè)細(xì)胞層的細(xì)胞狀態(tài),yt–1為上一個(gè)細(xì)胞層的輸出,xt為外部輸入,3個(gè)σ表示sigmod函數(shù),分別對(duì)應(yīng)于LSTM神經(jīng)網(wǎng)絡(luò)的遺忘門、輸入門和輸出門,3個(gè)門共同合作,控制和保護(hù)細(xì)胞的狀態(tài),tanh層用來(lái)產(chǎn)生新的細(xì)胞狀態(tài)值[18]。
LSTM神經(jīng)網(wǎng)絡(luò)的細(xì)胞單元更新過(guò)程如下:
1)細(xì)胞中第1個(gè)σ對(duì)應(yīng)LSTM神經(jīng)網(wǎng)絡(luò)中的遺忘門,它決定了從細(xì)胞狀態(tài)中丟棄的信息,遺忘門的計(jì)算公式為
2)第2個(gè)σ對(duì)應(yīng)LSTM神經(jīng)網(wǎng)絡(luò)輸入門,其對(duì)細(xì)胞狀態(tài)中的信息進(jìn)行更新,輸出門計(jì)算為:
3)輸出門輸出細(xì)胞狀態(tài)值,其計(jì)算公式為:
式中,W為各個(gè)門的權(quán)重系數(shù),b為偏差。
為了提高預(yù)測(cè)模型的精度,需要對(duì)LSTM神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行優(yōu)化,PSO算法是一種應(yīng)用較廣的群體智能算法,該算法源自對(duì)鳥(niǎo)類捕食問(wèn)題的研究。它采用速度-位置搜索模型。每個(gè)粒子代表解空間的1個(gè)候選解,解的優(yōu)劣程度由適應(yīng)度函數(shù)決定,而適應(yīng)度函數(shù)根據(jù)優(yōu)化目標(biāo)定義。PSO算法中粒子更新自身的速度和位置的計(jì)算公式為:
式中,V為速度,c1和c2為學(xué)習(xí)因子,r1、r2為隨機(jī)數(shù),w為慣性權(quán)重,X為粒子的位置[19]。
目前PSO算法主要存在以下問(wèn)題:
1)在迭代早期可能出現(xiàn)最優(yōu)解導(dǎo)致種群陷入局部最優(yōu),降低粒子的多樣性。
2)由于慣性權(quán)重w固定不變,導(dǎo)致粒子種群的全局和局部的搜索能力不平衡,降低算法的搜索效率。
基于上述問(wèn)題,本文提出了一種改進(jìn)的PSO(MPSO)算法。根據(jù)文獻(xiàn)[20-22]可知,慣性因子w較大時(shí)算法的全局搜索能力強(qiáng),有利于增加種群的多樣性;w較小時(shí),算法的局部搜索能力強(qiáng),能夠加快算法的收斂。因此將w設(shè)置為隨迭代次數(shù)遞減,遞減函數(shù)通過(guò)比較效果得出。最終得到慣性因子的計(jì)算公式為
式中:t為當(dāng)前迭代次數(shù),tmax為最大迭代次數(shù),w的上下限分別設(shè)置為0.9和0.4。
MPSO算法流程如下:
1)對(duì)種群中每一個(gè)粒子進(jìn)行位置和速度的初始化,計(jì)算每個(gè)粒子的適應(yīng)度值,并初始化Pbest和
gbest。
2)在迭代過(guò)程中,通過(guò)計(jì)算適應(yīng)度值,對(duì)粒子種群的個(gè)體最優(yōu)Pbest和總體最優(yōu)gbest進(jìn)行更新。
3)當(dāng)?shù)儆谝欢ù螖?shù)時(shí),判斷每個(gè)粒子是否滿足Pbest<pbest,若滿足,則對(duì)粒子進(jìn)行變異操作,重置粒子的速度和位置,對(duì)其他粒子則按式(10)和式(11)進(jìn)行更新。
將特征優(yōu)化后的數(shù)據(jù)作為模型輸入變量,改進(jìn)LSTM網(wǎng)絡(luò)作為預(yù)測(cè)模型,圖2為總體算法流程。
圖2 基于MPSO-LSTM網(wǎng)絡(luò)的預(yù)測(cè)模型算法流程Fig.2 Flow chart of the algorithm for MPSO-LSTM pridiction
本文采用保定某600 MW電廠所提供的現(xiàn)場(chǎng)運(yùn)行數(shù)據(jù)。該電廠采用選擇性非催化還原(SNCR)和SCR聯(lián)合脫硝的方式,通過(guò)向鍋爐與SCR反應(yīng)器之間的煙氣管道噴灑尿素溶液,對(duì)煙氣中NOx進(jìn)行初步脫硝處理。
為驗(yàn)證模型的有效性,在負(fù)荷420~510 MW工況下,選取包括穩(wěn)定工況和變工況數(shù)據(jù)共6 000組,其采樣周期為5 s。其中前5 000組用來(lái)對(duì)預(yù)測(cè)模型做訓(xùn)練,后1 000組作為測(cè)試集檢驗(yàn)?zāi)P偷念A(yù)測(cè)精度與泛化能力。通過(guò)分析NOx的生成機(jī)理確定包括機(jī)組負(fù)荷、總煤量、總風(fēng)量、管道尿素流量、二次風(fēng)量、給煤機(jī)電流等24個(gè)初始輔助變量。
由于鍋爐燃燒具有大遲延的特性,采集到的數(shù)據(jù)與入口NOx質(zhì)量濃度具有時(shí)間延遲,因此設(shè)計(jì)了一種基于最大互信息的時(shí)延分析方法。由于鍋爐燃燒時(shí)間約10 min,所以設(shè)計(jì)時(shí)間延遲最大為10 min。通過(guò)計(jì)算輔助變量前10 min內(nèi)各個(gè)時(shí)刻與輸出變量NOx質(zhì)量濃度的互信息,進(jìn)而選取與入口NOx質(zhì)量濃度相關(guān)性最大的時(shí)刻作為時(shí)間延遲補(bǔ)償值,實(shí)現(xiàn)輸入變量與輸出變量的時(shí)序統(tǒng)一。表1為輔助變量與輸出變量之間的最佳延遲及其互信息值。
表1 輔助變量的時(shí)間最佳延遲及其互信息值Tab.1 The time delay and maximum mutual information of auxiliary variables
在確定時(shí)間延遲后,還要對(duì)選取的輔助變量進(jìn)行篩選。首先通過(guò)mRMR算法尋找不同輸入變量的最優(yōu)組合,再利用RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型分別對(duì)不同的最優(yōu)特征組合進(jìn)行訓(xùn)練和預(yù)測(cè)。通過(guò)比較預(yù)測(cè)誤差,確定了11個(gè)輔助變量為模型的輸入變量。
經(jīng)過(guò)文獻(xiàn)[23]證明,在輸入變量中加入歷史入口NOx質(zhì)量濃度,可以顯著提高LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的精度。為了確定最佳歷史時(shí)間,分別選取前5、10、15、20 s的入口NOx質(zhì)量濃度作為輸入變量,與上述11個(gè)輔助變量共同加入預(yù)測(cè)模型中進(jìn)行訓(xùn)練和預(yù)測(cè),其預(yù)測(cè)結(jié)果見(jiàn)表2。
表2 不同輸入變量下的模型預(yù)測(cè)誤差Tab.2 The model prediction errors with different input variables
通過(guò)比較預(yù)測(cè)效果,最終確定將前5 s的入口NOx質(zhì)量濃度作為最終的輸入變量。
利用LSTM神經(jīng)網(wǎng)絡(luò)搭建預(yù)測(cè)模型,網(wǎng)絡(luò)的超參數(shù)通過(guò)尋優(yōu)算法確定。由文獻(xiàn)[23]可知,影響LSTM神經(jīng)網(wǎng)絡(luò)的重要參數(shù)主要為隱含層神經(jīng)元數(shù)、最大迭代次數(shù)和初始學(xué)習(xí)率。對(duì)于隱含層神經(jīng)元數(shù)和最大迭代次數(shù),經(jīng)實(shí)驗(yàn)證明,當(dāng)?shù)螖?shù)和隱含層神經(jīng)元數(shù)過(guò)大時(shí),預(yù)測(cè)模型的精度反而會(huì)降低,因此利用網(wǎng)格搜索算法進(jìn)行參數(shù)尋優(yōu)。對(duì)于初始學(xué)習(xí)率則通過(guò)2.2節(jié)的MPSO算法進(jìn)行參數(shù)尋優(yōu),并以LSTM神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)誤差作為適應(yīng)度函數(shù),最終確定LSTM神經(jīng)網(wǎng)絡(luò)的隱含層神經(jīng)元數(shù)55,最大迭代次數(shù)250,初始學(xué)習(xí)率0.004 4。
本文采用的模型評(píng)價(jià)指標(biāo)為均方根誤差δRMSE、平均相對(duì)誤差δMAPE和皮爾遜性關(guān)系R,其計(jì)算公式為:
式中,yi為實(shí)際值,為預(yù)測(cè)值,n為測(cè)試集樣本數(shù)量,σ表示方差,cov表示協(xié)方差。
3.4.1 不同預(yù)測(cè)模型對(duì)實(shí)驗(yàn)結(jié)果的影響
為了比較LSTM神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)特點(diǎn),分別利用RBF神經(jīng)網(wǎng)絡(luò)和LSSVM搭建了預(yù)測(cè)模型。RBF神經(jīng)網(wǎng)絡(luò)是一種擬合能力很強(qiáng)的前饋神經(jīng)網(wǎng)絡(luò),LSSVM是一種基于SVM的改進(jìn)算法,這2種方法在建模方面具有代表性,將LSTM神經(jīng)網(wǎng)絡(luò)模型與它們對(duì)比可以體現(xiàn)LSTM預(yù)測(cè)模型的特點(diǎn)。
本次實(shí)驗(yàn)通過(guò)MPSO算法確定了RBF神經(jīng)網(wǎng)絡(luò)和LSSVM預(yù)測(cè)模型的最優(yōu)超參數(shù),在輸入變量和其他條件保持一致條件下,3種模型預(yù)測(cè)結(jié)果如圖3所示,3種模型各評(píng)價(jià)指標(biāo)結(jié)果見(jiàn)表3。由圖3和表3可見(jiàn):LSTM神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型均方根誤差比LSSVM模型降低了18%,比RBF神經(jīng)網(wǎng)絡(luò)模型降低了29%;LSTM神經(jīng)網(wǎng)絡(luò)平均相對(duì)誤差比LSSVM模型降低了25%,比RBF神經(jīng)網(wǎng)絡(luò)模型降低了24%。在相關(guān)性方面,LSTM神經(jīng)網(wǎng)絡(luò)模型與真實(shí)值的相關(guān)系數(shù)最大,LSSVM模型次之,RBF神經(jīng)網(wǎng)絡(luò)模型最低。
圖3 3種模型預(yù)測(cè)效果對(duì)比Fig.3 The prediction results of each model
表3 3種模型評(píng)價(jià)指標(biāo)Tab.3 The evaluation indexes of different models
為了更好地比較3種預(yù)測(cè)模型的特點(diǎn),分別挑選不同時(shí)段進(jìn)行放大,放大后測(cè)試集1和測(cè)試集2預(yù)測(cè)結(jié)果分別如圖4和圖5所示。
由圖4和圖5可見(jiàn),在其他條件一致的情況下,RBF神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)結(jié)果震蕩嚴(yán)重,LSSVM模型預(yù)測(cè)效果穩(wěn)定,但都沒(méi)有LSTM神經(jīng)網(wǎng)絡(luò)模型接近實(shí)際值,充分證明了LSTM神經(jīng)網(wǎng)絡(luò)在建立NOx質(zhì)量濃度預(yù)測(cè)模型上具有更高的精準(zhǔn)度和更好的預(yù)測(cè)能力。
圖4 測(cè)試集1預(yù)測(cè)結(jié)果Fig.4 Prediction results of test set 1
圖5 測(cè)試集2預(yù)測(cè)結(jié)果Fig.5 Prediction results of test set 2
3.4.2 特征優(yōu)化對(duì)實(shí)驗(yàn)結(jié)果的影響
本文通過(guò)對(duì)數(shù)據(jù)進(jìn)行時(shí)延分析,確定了輸入變量與輸出變量之間的最佳延遲時(shí)間。通過(guò)特征選擇算法選出最優(yōu)特征子集。為了研究特征優(yōu)化對(duì)LSTM神經(jīng)網(wǎng)絡(luò)模型的影響,分別利用不加時(shí)延和包含所有輔助變量的特征集數(shù)據(jù)對(duì)LSTM神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練和預(yù)測(cè),其他條件保持不變,得到對(duì)不同特征選擇下的預(yù)測(cè)結(jié)果和不同特征訓(xùn)練集評(píng)價(jià)指標(biāo)對(duì)比如圖6和表4所示。
圖6 不同特征選擇下的預(yù)測(cè)結(jié)果Fig.6 Prediction results with different feature selections
表4 不同特征訓(xùn)練集評(píng)價(jià)指標(biāo)比較Tab.4 The evaluation indexes of different feature training sets
由圖表6和表4可見(jiàn):經(jīng)過(guò)時(shí)延分析的數(shù)據(jù)比未經(jīng)過(guò)時(shí)延分析的數(shù)據(jù)均方根誤差降低了26%,時(shí)延分析可以提升模型的精度。經(jīng)過(guò)特征優(yōu)化的數(shù)據(jù)比未經(jīng)特征優(yōu)化的變量均方根誤差降低了50%,說(shuō)明當(dāng)輸入變量較多時(shí),由于冗余變量的存在,降低了模型的泛化能力,導(dǎo)致模型在測(cè)試集上的效果較差。時(shí)延分析和特征優(yōu)化有效提升了預(yù)測(cè)模型的精度和泛化能力。
3.4.3 歷史入口NOx質(zhì)量濃度對(duì)實(shí)驗(yàn)結(jié)果的影響
為了研究歷史入口NOx質(zhì)量濃度對(duì)不同預(yù)測(cè)模型的影響,分別在輸入變量中加入和去除前5 s的歷史入口NOx質(zhì)量濃度數(shù)據(jù),利用LSTM神經(jīng)網(wǎng)絡(luò)、LSSVM和RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型進(jìn)行實(shí)驗(yàn),歷史數(shù)據(jù)對(duì)3種預(yù)測(cè)模型結(jié)果對(duì)比及其評(píng)價(jià)指標(biāo)如圖7和表5所示。
圖7 歷史數(shù)據(jù)對(duì)3種預(yù)測(cè)模型影響結(jié)果對(duì)比Fig.7 Effect of historical data on prediction results of the above three models
表5 歷史數(shù)據(jù)對(duì)3種預(yù)測(cè)模型影響評(píng)價(jià)指標(biāo)Tab.5 The prediction results of the above three models when considering the historical data
由圖7和表5可見(jiàn):LSTM神經(jīng)網(wǎng)絡(luò)模型加入1個(gè)前5 s的NOx質(zhì)量濃度其均方根誤差降低84%,而常用的RBF神經(jīng)網(wǎng)絡(luò)模型只能降低15%,說(shuō)明LSTM神經(jīng)網(wǎng)絡(luò)能夠?qū)v史數(shù)據(jù)進(jìn)行記憶。由于電廠NOx質(zhì)量濃度數(shù)據(jù)在時(shí)間前后上具有一定的重復(fù)性,通過(guò)LSTM神經(jīng)網(wǎng)絡(luò)獨(dú)特的記憶功能,可以從數(shù)據(jù)中挖掘出更多的信息,從而構(gòu)造出精確的NOx質(zhì)量濃度預(yù)測(cè)模型,相比于常見(jiàn)的預(yù)測(cè)模型,LSTM神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)時(shí)間序列數(shù)據(jù)時(shí)具有明顯的優(yōu)勢(shì)。
本文針對(duì)SCR反應(yīng)器入口處NOx質(zhì)量濃度波動(dòng)頻繁、難以準(zhǔn)確測(cè)量的問(wèn)題,提出了一種基于特征優(yōu)化和改進(jìn)LSTM神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型。基于現(xiàn)場(chǎng)運(yùn)行數(shù)據(jù)的實(shí)驗(yàn)結(jié)果表明,經(jīng)特征優(yōu)化后的輸入變量,去除了冗余變量,提高了模型的泛化能力。基于互信息的時(shí)延分析,加強(qiáng)了輸入變量與輸出變量間的對(duì)應(yīng)關(guān)系,有效提升了模型精度。采用LSTM神經(jīng)網(wǎng)絡(luò)建立預(yù)測(cè)模型,由于LSTM神經(jīng)網(wǎng)絡(luò)具有長(zhǎng)期記憶的功能,在輸入變量中加入歷史入口NOx質(zhì)量濃度,可以進(jìn)一步提升模型的預(yù)測(cè)精度,最終在入口NOx質(zhì)量濃度預(yù)測(cè)上取得較好效果,為以后建立預(yù)測(cè)模型提供了一種新的思路。此外,由于在輸入變量中加入了前一時(shí)刻的NOx質(zhì)量濃度,所以限制了預(yù)測(cè)模型在實(shí)際生產(chǎn)中的應(yīng)用,下一階段需考慮將模型預(yù)測(cè)輸出作為下一次預(yù)測(cè)的輸入變量,以滿足實(shí)際生產(chǎn)的需求。