李 健,王 東,王 瑞,尚星宇
(國家能源集團(tuán)科學(xué)技術(shù)研究院有限公司銀川分公司,寧夏 銀川 75001)
隨著經(jīng)濟(jì)社會的發(fā)展,火電行業(yè)面臨著增加供應(yīng)和減少碳排放的雙重挑戰(zhàn),“雙碳”目標(biāo)下,煤電改造迫在眉睫[1-2]。煤在我國能源結(jié)構(gòu)中占據(jù)著主要地位,由于其燃燒時(shí)會釋放出大量的SO2氣體,對大氣環(huán)境造成污染,因此需要對燃煤產(chǎn)生的煙氣進(jìn)行凈化處理[3]?!叭穆?lián)動”背景下,針對煤電排放改造提出更高要求,新型電力系統(tǒng)下燃煤機(jī)組脫硫方法仍然是研究熱點(diǎn)。
燃煤機(jī)組目前主要采用的煙氣脫硫方法為石灰石-石膏濕法脫硫,該方法具有脫硫效率高,使用成本低等優(yōu)點(diǎn)[4-5]。但在實(shí)際生產(chǎn)中,由于脫硫系統(tǒng)受機(jī)組負(fù)荷波動影響較大,其內(nèi)部反應(yīng)也較為復(fù)雜,因此很難實(shí)現(xiàn)對出口SO2濃度的穩(wěn)定控制[6-7]。建立關(guān)于出口SO2濃度的預(yù)測模型,不僅可以幫助運(yùn)行人員及時(shí)調(diào)整脫硫系統(tǒng)相關(guān)參數(shù),提高脫硫效率,還可以提高整個(gè)脫硫系統(tǒng)的控制水平,降低脫硫的成本。
隨著人工智能的快速發(fā)展,越來越多的機(jī)器學(xué)習(xí)算法被廣泛應(yīng)用于煙氣濃度預(yù)測。崔仕文等[8]利用最小二乘回歸對輸入變量進(jìn)行分析,將影響較大的因素作為輸入變量,利用支持向量機(jī)(Support Vector Machines, SVM)建立了關(guān)于脫硫效率的預(yù)測模型,取得了良好的預(yù)測效果。蘇翔鵬等[9]利用徑向基函數(shù)(Radial Basis Function, RBF)神經(jīng)網(wǎng)絡(luò)對SO2排放量進(jìn)行建模,通過與誤差反饋 (Back Propagation, BP)神經(jīng)網(wǎng)絡(luò)進(jìn)行對比,突出了RBF建模的優(yōu)勢。雖然淺層神經(jīng)網(wǎng)絡(luò)能夠部分對象進(jìn)行建模預(yù)測,但受其結(jié)構(gòu)限制,模型預(yù)測精度難以進(jìn)一步提升。深層神經(jīng)網(wǎng)絡(luò)由于其強(qiáng)大的學(xué)習(xí)能力和非線性擬合能力,近年來吸引了眾多學(xué)者的關(guān)注。金秀章等[10]利用套索(Least Absolute Shrinkage and Selection Operator, LASSO)算法對初始輔助變量進(jìn)行了篩選,利用長短期記憶(Long Short-Term Memory, LSTM)神經(jīng)網(wǎng)絡(luò)搭建了出口SO2濃度預(yù)測模型。馬雙忱等[11]將LSTM與線性整流函數(shù)層(Rectified Linear Unit, ReLU)相結(jié)合,搭建了關(guān)于脫硫系統(tǒng)漿液PH值、脫硫效率的深度神經(jīng)網(wǎng)絡(luò)預(yù)測模型,探究了濕法脫硫系統(tǒng)各個(gè)參數(shù)指標(biāo)對脫硫效果的影響。雖然深層神經(jīng)網(wǎng)絡(luò)模型具有很高的預(yù)測精度,但考慮到其計(jì)算量大,訓(xùn)練時(shí)間長等缺點(diǎn),很難應(yīng)用于實(shí)際生產(chǎn)中。極限學(xué)習(xí)機(jī)(Extreme Learning Machine, ELM)是在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上改進(jìn)而成的一種前饋神經(jīng)網(wǎng)絡(luò),它具有擬合能力強(qiáng),泛化精度高、訓(xùn)練速度快等優(yōu)點(diǎn)。Wang等[12]利用深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Networks,DNN)從數(shù)據(jù)中提取有效信息,利用ELM建立預(yù)測模型,實(shí)現(xiàn)對脫硫系統(tǒng)出口SO2濃度的有效預(yù)測。程琳等[13]利用遺傳算法對ELM相關(guān)參數(shù)進(jìn)行優(yōu)化,建立了SCR脫硝系統(tǒng)預(yù)測模型,有效預(yù)測了SCR出口NOx質(zhì)量濃度變化。
由于濕法脫硫系統(tǒng)內(nèi)部反應(yīng)需要一定的時(shí)間,因此從DCS上采集的數(shù)據(jù)其輸入與輸出變量間存在著時(shí)間延遲,為了保證模型的合理性,需要對輸入變量進(jìn)行時(shí)延補(bǔ)償。目前時(shí)延分析最常用的方法為滑動窗口法,即通過比較不同時(shí)刻內(nèi)輸入變量與當(dāng)前確定好的輸出變量之間的相關(guān)性,從而確定最佳的遲延時(shí)間,進(jìn)而對輸入變量進(jìn)行時(shí)序上的調(diào)整,實(shí)現(xiàn)時(shí)延補(bǔ)償。用于衡量兩組變量間相關(guān)性大小的指標(biāo)有:皮爾遜相關(guān)系數(shù)[14]( Pearson correlation coefficient)、互信息[15](Mutual Information,MI)、最大信息系數(shù)[16]等。但上述方法只考慮到了系統(tǒng)由于內(nèi)部自身原因?qū)е碌臅r(shí)間延遲,沒有考慮到不同工況下煙氣流速變化可能導(dǎo)致延遲時(shí)間產(chǎn)生變化。
綜上所述,提出了一種基于時(shí)延分析和蜉蝣算法優(yōu)化極限學(xué)習(xí)機(jī)的出口SO2濃度預(yù)測模型。首先利用互信息計(jì)算不同時(shí)刻內(nèi)輸入變量與輸出變量間的相關(guān)性大小,從而確定最佳延遲時(shí)間,考慮到工況變化可能會導(dǎo)致延遲時(shí)間發(fā)生變化,因此設(shè)計(jì)了一種可以實(shí)時(shí)更新的時(shí)延補(bǔ)償方法。利用蜉蝣算法對原始輸入變量進(jìn)行尋優(yōu),從而確定與ELM模型相匹配的最優(yōu)特征子集。最后利用蜉蝣算法優(yōu)化ELM模型的相關(guān)參數(shù),通過與其他機(jī)器學(xué)習(xí)建模方法進(jìn)行比較,證明了ELM模型預(yù)測精度最高,能夠?qū)Τ隹赟O2濃度進(jìn)行準(zhǔn)確預(yù)測。
極限學(xué)習(xí)機(jī)是2004年南洋理工大學(xué)黃廣斌提出的一種前饋神經(jīng)網(wǎng)絡(luò)[17]。
ELM的網(wǎng)絡(luò)結(jié)構(gòu)主要由輸入層、隱含層和輸出層組成。輸入層的神經(jīng)元個(gè)數(shù)根據(jù)模型輸入變量的個(gè)數(shù)來確定,隱含層神經(jīng)元個(gè)數(shù)可由優(yōu)化算法得出。輸入層與輸出層的連接權(quán)值為w,隱含層節(jié)點(diǎn)上的偏差為b、w和b可以通過隨機(jī)產(chǎn)生獲得,也可以通過尋優(yōu)確定。隱含層與輸出層的連接權(quán)值為β,如果設(shè)隱藏層的輸出為H(x),則可以得到H(x)的計(jì)算公式如下所示:
H(x)=[h1(x),…,hm(x)]
(1)
式中:hi(x)表示隱含層第i個(gè)結(jié)點(diǎn)的輸出,其計(jì)算公式如下;
hi(x)=g(wix+bi)
(2)
式中:g表示激活函數(shù)。
輸出層通過連接權(quán)值β最終得到整個(gè)ELM的輸出值f(x):
(3)
輸出層的權(quán)值β可以通過求取最小化訓(xùn)練誤差得到,因此ELM的訓(xùn)練過程其實(shí)就是對輸出層權(quán)值β的求解過程,其目標(biāo)函數(shù)如下:
min||Hβ-T||2
(4)
式中:T為目標(biāo)矩陣。
蜉蝣算法是2020年最新提出的一種群智能優(yōu)化算法,它通過模仿蜉蝣種群中的求偶和交配行為使得算法最終收斂于全局最優(yōu)值[18]。在原始蜉蝣算法中,初始種群個(gè)體主要通過隨機(jī)產(chǎn)生,但這種隨機(jī)得到的個(gè)體由于其自身的不確定性,使得算法在迭代的過程中種群的多樣性不斷下降,最終陷入局部收斂。針對這一問題,本文提出了一種基于反向?qū)W習(xí)的初始化種群策略[19]。具體流程如下:
(1)首先隨機(jī)產(chǎn)生一個(gè)初始種群,然后根據(jù)這個(gè)初始種群生成它的反向種群。
(2)計(jì)算兩個(gè)種群每個(gè)個(gè)體的適應(yīng)度并排序,分別從兩個(gè)種群中挑選一半適應(yīng)度較高的個(gè)體,組成新的種群。
(3)將得到的兩個(gè)新種群分別作為雄性蜉蝣和雌性蜉蝣的初始種群并應(yīng)用于尋優(yōu)算法中。
通過這種反向?qū)W習(xí)可以使得種群個(gè)體均勻地從全局產(chǎn)生,避免了算法在迭代過程中陷入局部收斂。同時(shí)通過選取適應(yīng)度較高的個(gè)體,減少了種群與最優(yōu)解之間的距離,加快了算法的收斂速度。
由于濕法脫硫系統(tǒng)內(nèi)部反應(yīng)需要一定時(shí)間,因此采集的數(shù)據(jù)中輸入變量與輸出變量間存在著時(shí)間延遲。通過時(shí)延分析可以對輸入變量進(jìn)行時(shí)序上的調(diào)整,從而提高輸入變量與輸出變量間的對應(yīng)關(guān)系,保證所建模型的合理性。傳統(tǒng)時(shí)延分析方法主要通過計(jì)算不同時(shí)刻內(nèi)輸入變量與輸出變量間的相關(guān)性大小來確定延遲時(shí)間[20],但由于濕法脫硫系統(tǒng)的特殊性,傳統(tǒng)方法存在以下兩個(gè)缺點(diǎn):一是在濕法脫硫系統(tǒng)中單個(gè)輸入變量不僅與輸出變量相關(guān),也會收到其他的輸入變量以及設(shè)備和人為控制等影響。二是不同工況下煙氣流速不同,可能會導(dǎo)致相關(guān)變量的延遲時(shí)間發(fā)生改變。針對上述缺點(diǎn),提出了一種基于互信息的改進(jìn)時(shí)延分析方法:
(1)首先選定一組輸入變量與輸出變量,計(jì)算兩組變量間的互信息?;バ畔⒖梢苑从硟山M變量間非線性相關(guān)性的大小,對于描述兩組變量間整體變化趨勢是否一致也更加準(zhǔn)確可靠。
(2)由于脫硫塔內(nèi)最大反應(yīng)時(shí)間不超過十分鐘,因此設(shè)置時(shí)延上限為600s,分別計(jì)算輸入變量在前600s時(shí)刻內(nèi)與輸出變量互信息的最大值,以及此時(shí)所對應(yīng)的時(shí)刻。
(3)在確定延遲時(shí)間后,將輸入變量的時(shí)序向前調(diào)整,重構(gòu)輸入變量,實(shí)現(xiàn)與輸出變量的對應(yīng)。
(4)由于延遲時(shí)間可能隨工況發(fā)生改變,因此當(dāng)數(shù)據(jù)變化時(shí)需要對確定好的延遲時(shí)間前后一定范圍內(nèi)輸入變量與輸出變量的互信息進(jìn)行計(jì)算,并從中選出最大值對延遲時(shí)間進(jìn)行更新。
本文基于脫硫系統(tǒng)的工作原理[21],從DCS測點(diǎn)上選取了與出口SO2濃度相關(guān)的八個(gè)初始輸入變量,通過上述時(shí)延分析方法對篩選好的初始輔助變量進(jìn)行時(shí)延分析,得到結(jié)果如表1所示。
表1 各初始輸入變量時(shí)間延遲和最大互信息Tab.1 The time delay and maximum mutual information for each initial input variable
上文通過機(jī)理分析得到了初始的輸入變量,但這些變量中可能存在著部分無用變量和冗余變量。本文提出了一種基于改進(jìn)蜉蝣算法(IMA)的輸入變量選擇方法,將變量選擇與優(yōu)化算法、預(yù)測模型相結(jié)合,在簡化變量選擇流程的同時(shí)又能夠快速地尋找出與預(yù)測模型匹配的最優(yōu)特征子集?;贗MA的變量選擇方法流程如下:
(1)分別在各個(gè)變量前乘以0或者1的系數(shù),并將處理后的變量用于模型預(yù)測,將預(yù)測誤差作為蜉蝣算法的適應(yīng)度函數(shù);
(2)由于ELM隱含層神經(jīng)元需要尋優(yōu)確定,而最優(yōu)神經(jīng)元個(gè)數(shù)又與輸入變量的數(shù)目相關(guān),因此在上述算法中再添加一個(gè)ELM隱含層神經(jīng)元個(gè)數(shù),與各個(gè)變量前的系數(shù)共同進(jìn)行尋優(yōu);
(3)通過多次迭代,蜉蝣算法最終可以找出ELM模型的最低預(yù)測誤差,以及此時(shí)對應(yīng)的最優(yōu)特征子集、最佳隱含層神經(jīng)元個(gè)數(shù)和正則化系數(shù)C。
通過上述尋優(yōu)算法,最終確定模型的輸入變量分別為:吸收塔PH值、入口煙氣流量、入口SO2濃度、機(jī)組負(fù)荷和石灰石漿液量,ELM的最優(yōu)隱含層神經(jīng)元個(gè)數(shù)確定為6。
將時(shí)延分析和變量選擇后的數(shù)據(jù)作為最終模型的輸入變量,利用ELM建立模型進(jìn)行預(yù)測實(shí)驗(yàn),總結(jié)算法的流程如下。
圖1 實(shí)驗(yàn)流程圖Fig.1 Experimental flowchart
本次研究采用的模型評價(jià)指標(biāo)為均方根誤差RMSE和平均相對誤差MAPE,其公式如下:
(5)
(6)
式中:yi為實(shí)際值,yi為預(yù)測值,n代表測試集樣本數(shù)量。RMSE反映了總體預(yù)測值與真實(shí)值之間的誤差,而MAPE則側(cè)重反映預(yù)測值偏離真實(shí)值的程度,兩者相互結(jié)合,從而對預(yù)測曲線進(jìn)行合理有效的評估。
本次實(shí)驗(yàn)采用山西某600MW燃煤電廠所提供的歷史數(shù)據(jù)。通過數(shù)據(jù)清洗和預(yù)處理,最終選取了2500組代表性數(shù)據(jù),其中前1000組作為訓(xùn)練集對模型進(jìn)行訓(xùn)練,后500組作為測試集檢驗(yàn)?zāi)P偷姆夯芰?,?shù)據(jù)間的采用周期為10s。
3.1.1 不同預(yù)測模型對實(shí)驗(yàn)結(jié)果的影響
本文在建立ELM預(yù)測模型時(shí)首先通過IMA算法對隱含層神經(jīng)元個(gè)數(shù)進(jìn)行優(yōu)化,隱含層權(quán)值和偏差則通過隨機(jī)產(chǎn)生。經(jīng)文獻(xiàn)[22]證明,通過對ELM隱含層權(quán)值和偏差進(jìn)行優(yōu)化,可以使得ELM模型的預(yù)測精度進(jìn)一步提升。因此本文分別對隱含層權(quán)值和偏差優(yōu)化前后的ELM進(jìn)行了預(yù)測實(shí)驗(yàn),最終得到的預(yù)測結(jié)果如表2所示。隱含層權(quán)值和偏差優(yōu)化前后ELM的預(yù)測曲線如圖2所示。
圖2 不同模型預(yù)測結(jié)果圖Fig.2 Plot of prediction results for different models
表2 隱含層權(quán)值和偏差優(yōu)化前后ELM預(yù)測結(jié)果Tab.2 ELM prediction results before and after implicit layer weight and bias optimization
上述結(jié)果表明對于ELM的隱含層權(quán)值和偏差進(jìn)行優(yōu)化可以使得最終ELM的預(yù)測精度進(jìn)一步提升,隱含層權(quán)值和偏差優(yōu)化后的ELM其RMSE降低了12%,MAPE降低了11%。
為了進(jìn)一步探究ELM在預(yù)測建模方面所具有的優(yōu)勢,本文選取了兩種具有代表性的機(jī)器學(xué)習(xí)算法如LSSVM[23]和LSTM[24]建立對比模型。三種模型在測試集上的預(yù)測結(jié)果如表3所示。
表3 三種模型在測試集上預(yù)測結(jié)果Tab.3 Three models predict results on the test set
三種模型在測試集上的預(yù)測曲線如圖3所示。
圖3 三種模型在測試集上預(yù)測結(jié)果圖Fig.3 Three models predict the outcome graph on the test set
從三種模型的預(yù)測結(jié)果可以看出,LSSVM的預(yù)測誤差最高,模型的擬合能力最弱。LSTM具有較高的預(yù)測精度,但模型結(jié)構(gòu)較為復(fù)雜,訓(xùn)練過程計(jì)算量極大,難以應(yīng)用于實(shí)際生產(chǎn)中。ELM模型的預(yù)測誤差最低,并且由于其特殊的前饋網(wǎng)絡(luò)結(jié)構(gòu),ELM的訓(xùn)練效率較快,模型的穩(wěn)定性很強(qiáng)。與其他兩種典型機(jī)器學(xué)習(xí)建模方法相比,ELM在建立關(guān)于出口SO2濃度預(yù)測模型上具有一定的優(yōu)勢。
3.1.2 時(shí)延分析對實(shí)驗(yàn)結(jié)果的影響
為了體現(xiàn)改進(jìn)時(shí)延分析方法對預(yù)測結(jié)果的影響,本文分別利用傳統(tǒng)時(shí)延分析方法和改進(jìn)時(shí)延分析方法對輸入變量進(jìn)行了時(shí)延補(bǔ)償。得到的結(jié)果如表4所示。不同時(shí)延分析方法在測試集上的預(yù)測曲線如圖4所示。
表4 不同時(shí)延分析方法預(yù)測結(jié)果比較Tab.4 Comparison of prediction results by different time-delay analysis methods set
3.1.3 不同優(yōu)化算法對實(shí)驗(yàn)結(jié)果的影響
為了進(jìn)一步體現(xiàn)改進(jìn)蜉蝣算法在尋優(yōu)精度上的優(yōu)勢,本文分別選取了原蜉蝣算法(MA)和粒子群算法[25](PSO)進(jìn)行了對比預(yù)測實(shí)驗(yàn):分別選取相同的訓(xùn)練集和測試集,設(shè)置各算法迭代次數(shù)為1000次,種群規(guī)模為30,分別對ELM模型的超參數(shù)進(jìn)行優(yōu)化,最終得到各ELM模型在測試集上預(yù)測結(jié)果如表5所示。不同尋優(yōu)算法下ELM模型的預(yù)測結(jié)果如圖5所示。
圖5 不同尋優(yōu)算法下ELM預(yù)測結(jié)果圖Fig.5 Under different optimization algorithms ELM predicts the result graph
從表5可以看出,IMA-ELM在三種模型中的預(yù)測誤差最低,MA-ELM次之,PSO-ELM最高。與PSO算法相比,MA算法由于其獨(dú)特的聚集和交配行為,使得算法在收斂速度和尋優(yōu)精度上都有了進(jìn)一步提升。
表5 不同尋優(yōu)算法下ELM預(yù)測結(jié)果比較Tab.5 Comparison of ELM prediction results under different optimization algorithms
本文針對濕法脫硫系統(tǒng)受機(jī)組負(fù)荷波動影響較大,難以穩(wěn)定控制等問題,設(shè)計(jì)了一種基于時(shí)延分析和改進(jìn)蜉蝣算法優(yōu)化極限學(xué)習(xí)機(jī)的出口SO2濃度預(yù)測模型。基于IMA的變量選擇方法,通過將尋優(yōu)算法與變量選擇相結(jié)合,從而能夠快速有效的找出與ELM模型最為匹配的特征子集。利用ELM建立了相關(guān)仿真模型,實(shí)驗(yàn)結(jié)果表明,在對ELM隱含層權(quán)值和偏差進(jìn)行優(yōu)化后,模型的均方根誤差從1.4775下降到1.3014,模型誤差下降了12%;利用互信息算法對輸入變量進(jìn)行時(shí)延分析并補(bǔ)償,模型精度提升了5%;利用IMA算法對模型參數(shù)進(jìn)行優(yōu)化,相比于PSO、MA優(yōu)化后的模型,IMA-ELM模型的預(yù)測誤差分別下降了0.0914和0.0396?;趯?shí)際運(yùn)行數(shù)據(jù)的仿真實(shí)驗(yàn)表明,IMA-ELM預(yù)測模型可以對出口SO2濃度變化趨勢進(jìn)行準(zhǔn)確預(yù)測,進(jìn)而為運(yùn)行人員控制脫硫系統(tǒng)平穩(wěn)運(yùn)行提供參考,對于提高脫硫效率和節(jié)約脫硫成本具有重要意義[26]。