摘 要:本文旨在利用堆疊自編碼器(SAE)預(yù)測(cè)工業(yè)排放中的NOx濃度,探索其在環(huán)境監(jiān)測(cè)與控制中的應(yīng)用潛力。研究人員通過(guò)篩選關(guān)鍵影響參數(shù),確定對(duì)出口NOx濃度影響顯著的因素,使用SAE建立了一個(gè)有效的出口NOx濃度預(yù)測(cè)模型,具備較高的預(yù)測(cè)精度。此外,本文還提出了基于在線學(xué)習(xí)的模型參數(shù)自更新方法,實(shí)現(xiàn)了模型的動(dòng)態(tài)調(diào)整以及適應(yīng)性?xún)?yōu)化。對(duì)模型自適應(yīng)更新效果進(jìn)行分析,驗(yàn)證了其在不斷變化的環(huán)境條件下的有效性。本文不僅為環(huán)境管理決策提供了科學(xué)依據(jù),還在工業(yè)生產(chǎn)過(guò)程中提供了一種新的智能化預(yù)測(cè)方法,具有重要的理論及實(shí)際價(jià)值。
關(guān)鍵詞:堆疊自編碼器;NOx濃度預(yù)測(cè);SAE網(wǎng)絡(luò)結(jié)構(gòu)
中圖分類(lèi)號(hào):X 734 " 文獻(xiàn)標(biāo)志碼:A
在環(huán)境保護(hù)需求下,準(zhǔn)確預(yù)測(cè)并有效控制工業(yè)排放中的NOx濃度顯得尤為重要。傳統(tǒng)的監(jiān)測(cè)方法通常依賴(lài)物理化學(xué)分析以及經(jīng)驗(yàn)?zāi)P?,但這些方法往往受限于實(shí)時(shí)性以及數(shù)據(jù)處理復(fù)雜性,難以滿足復(fù)雜工業(yè)環(huán)境下的實(shí)時(shí)監(jiān)測(cè)需求。而機(jī)器學(xué)習(xí)以及深度學(xué)習(xí)技術(shù)的發(fā)展為環(huán)境監(jiān)測(cè)與預(yù)測(cè)提供了新的解決方案。堆疊自編碼器在特征學(xué)習(xí)以及非線性建模方面表現(xiàn)出色,被廣泛應(yīng)用于各種數(shù)據(jù)預(yù)測(cè)以及處理任務(wù)中。其能夠通過(guò)無(wú)監(jiān)督學(xué)習(xí)自動(dòng)從數(shù)據(jù)中學(xué)習(xí)特征表示,具備較強(qiáng)的數(shù)據(jù)抽象能力與泛化能力,適用于復(fù)雜的工業(yè)過(guò)程數(shù)據(jù)分析。
1 出口NOx濃度關(guān)鍵影響參數(shù)篩選
在燃煤機(jī)組的SCR系統(tǒng)中,運(yùn)行參數(shù)數(shù)據(jù)量巨大,涵蓋了進(jìn)料氨水流量、煙氣溫度、催化劑層厚度等多個(gè)方面。由于參數(shù)眾多,如果不加篩選地全部納入模型,不僅會(huì)導(dǎo)致模型復(fù)雜化,還會(huì)大幅提升計(jì)算成本以及操作難度。因此,本文采用敏感變量?jī)?yōu)選法,旨在篩選與SCR系統(tǒng)出口NOx濃度關(guān)聯(lián)性最強(qiáng)的關(guān)鍵影響參數(shù)。在篩選過(guò)程中,研究人員利用Spearman相關(guān)系數(shù)來(lái)量化每個(gè)運(yùn)行參數(shù)與出口NOx濃度的相關(guān)性。Spearman相關(guān)系數(shù)的優(yōu)勢(shì)在于,它不依賴(lài)變量的線性關(guān)系,能夠更好地捕捉變量間的非線性關(guān)系,這對(duì)SCR系統(tǒng)這類(lèi)復(fù)雜系統(tǒng)的參數(shù)分析尤為重要。通過(guò)計(jì)算各運(yùn)行參數(shù)的Spearman相關(guān)系數(shù),研究人員得出了每個(gè)參數(shù)與出口NOx濃度的敏感運(yùn)行參數(shù)因子[1]。通過(guò)這種敏感運(yùn)行參數(shù)因子的對(duì)比分析,研究人員能夠更精確地識(shí)別對(duì)NOx濃度影響最顯著的參數(shù),從而構(gòu)建出一個(gè)更高效、簡(jiǎn)潔的SCR系統(tǒng)預(yù)測(cè)模型(如圖1所示)。
2 基于堆疊自編碼器的出口NOx濃度預(yù)測(cè)建模
2.1 堆疊自編碼器介紹
自編碼器是一種神經(jīng)網(wǎng)絡(luò)模型,將輸入數(shù)據(jù)壓縮到潛在空間(編碼),然后再重建原始輸入(解碼)來(lái)學(xué)習(xí)數(shù)據(jù)。其主要由2個(gè)部分組成。1)編碼器。將輸入數(shù)據(jù)映射到潛在空間中的表示。編碼器網(wǎng)絡(luò)層的輸出被稱(chēng)為編碼(或隱藏)層。2)解碼器。將編碼后的表示映射回重建的輸入空間,盡可能還原原始輸入,自編碼器的訓(xùn)練目標(biāo)是最小化輸入與重建輸出之間的重建誤差。堆疊自編碼器通過(guò)堆疊多個(gè)自編碼器層來(lái)增加模型的深度。每個(gè)自編碼器層都被訓(xùn)練,以學(xué)習(xí)數(shù)據(jù)的不同層次的表示,每一層的編碼器輸出成為下一層的輸入。本次研究中,研究人員為了預(yù)測(cè)出口NOx濃度,使用堆疊自編碼器。每一層都負(fù)責(zé)學(xué)習(xí)數(shù)據(jù)的不同抽象層次的特征表示,與編碼器對(duì)應(yīng)的解碼器層,負(fù)責(zé)將編碼的數(shù)據(jù)逐層解碼還原為原始輸入,如公式(1)所示。
=fNN(g2(g1(x;θ1);θ2)) (1)
式中:為預(yù)測(cè)的出口NOx濃度;x為輸入的運(yùn)行參數(shù)向量,包括上述8種用于預(yù)測(cè)的特征;g1(;θ1)為第一層堆疊自編碼器的編碼器部分,用于將輸入向量x映射到第一層特征空間;g2(;θ2)為第二層堆疊自編碼器的編碼器部分,接收第一層特征空間的輸出作為輸入,并將其映射到第二層特征空間;fNN(?)為神經(jīng)網(wǎng)絡(luò)模型,用于預(yù)測(cè)最終編碼后的特征[2]。
具體實(shí)踐中,工作人員輸入x的具體參數(shù),此時(shí)第一層自編碼器開(kāi)始運(yùn)行,將x映射到第一層的特征空間。第二層自編碼器接收第一層的編碼特征作為輸入,將其進(jìn)一步映射到第二層的特征空間,通過(guò)這種方式獲得最終編碼特征(見(jiàn)表1)。
2.2 基于SAE的出口NOx濃度預(yù)測(cè)模型建立
當(dāng)研究人員建立基于SAE的出口NOx濃度預(yù)測(cè)模型時(shí),全面考慮每個(gè)步驟的細(xì)節(jié),以確保最終模型的準(zhǔn)確性與可靠性。研究人員嘗試構(gòu)建一個(gè)能夠精確預(yù)測(cè)火電機(jī)組出口NOx濃度的模型。此模型旨在通過(guò)應(yīng)用先進(jìn)算法,為燃煤火電機(jī)組的環(huán)保與高效運(yùn)行提供有力支持。研究人員從多個(gè)運(yùn)行中的火電機(jī)組中收集了足夠的數(shù)據(jù),確保模型能夠廣泛適用于不同條件下的燃煤火電機(jī)組。數(shù)據(jù)包括800組實(shí)際運(yùn)行數(shù)據(jù),涵蓋了各種運(yùn)行參數(shù)以及環(huán)境條件,主要的輸入變量包括總風(fēng)量、機(jī)組負(fù)荷、入口煙氣溫度、噴氨量、入口NOx濃度。當(dāng)構(gòu)建SAE模型時(shí),研究人員設(shè)計(jì)一整套完整的網(wǎng)絡(luò)結(jié)構(gòu),包括輸入層、多個(gè)隱層以及輸出層的層次結(jié)構(gòu)[3]。每個(gè)自編碼器層都經(jīng)過(guò)精心設(shè)計(jì),以最大化模型對(duì)數(shù)據(jù)復(fù)雜關(guān)系的捕捉能力。
本文中,為了評(píng)估SAE模型的預(yù)測(cè)能力,研究人員引入了2個(gè)主要的評(píng)估指標(biāo),即均方根誤差(RMSE)以及確定系數(shù)R2?;谶@2項(xiàng)指標(biāo)幫助研究人員量化模型預(yù)測(cè)值與實(shí)際觀測(cè)值之間的差異,并評(píng)估模型的擬合程度以及泛化能力(見(jiàn)表2)。
3 基于在線學(xué)習(xí)的模型參數(shù)自更新
具體實(shí)踐中,SCR系統(tǒng)的運(yùn)行條件容易在外部環(huán)境的影響下發(fā)生改變,影響其工作狀態(tài)。針對(duì)這一問(wèn)題,研究人員嘗試搭建基于在線學(xué)習(xí)模型的參數(shù)自適應(yīng)更新框架,通過(guò)分析歷史數(shù)據(jù)與實(shí)時(shí)反饋數(shù)據(jù),使模型能夠持續(xù)改進(jìn)優(yōu)化,從而更好地應(yīng)對(duì)復(fù)雜的數(shù)據(jù)環(huán)境。研究人員先進(jìn)行離線訓(xùn)練,從數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)或?qū)崟r(shí)數(shù)據(jù)流等多個(gè)來(lái)源收集數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行清洗、歸一化處理,以確保數(shù)據(jù)質(zhì)量。根據(jù)任務(wù)需求,選擇合適的模型架構(gòu)與算法。在離線訓(xùn)練的初始階段,模型參數(shù)通常會(huì)使用初始值進(jìn)行初始化。在此基礎(chǔ)上,通過(guò)優(yōu)化損失函數(shù),模型調(diào)整其參數(shù),以最大程度地?cái)M合歷史數(shù)據(jù)集,利用反向傳播算法等優(yōu)化技術(shù)來(lái)更新模型的權(quán)重與偏差,過(guò)程如公式(2)所示。
(2)
式中:θ為模型參數(shù)集合;α為學(xué)習(xí)率;J(θ)為損失函數(shù),用于衡量模型預(yù)測(cè)值與真實(shí)值之間的差異;L(y,hθ(x))為單個(gè)樣本的損失函數(shù);m為訓(xùn)練樣本的數(shù)量;δ(i)為第i個(gè)樣本的誤差項(xiàng);z(i) 為第i個(gè)樣本的線性組合;x(i) 為第i個(gè)樣本的特征向量;y(i) 為第i個(gè)樣本的真實(shí)標(biāo)簽;hθ(x)為模型的預(yù)測(cè)函數(shù)。
在訓(xùn)練開(kāi)始之前,需要初始化模型參數(shù)θ,包括權(quán)重W與偏差b,在前向傳播階段,輸入數(shù)據(jù)通過(guò)神經(jīng)網(wǎng)絡(luò)各層進(jìn)行計(jì)算,得到輸出預(yù)測(cè)值。針對(duì)每個(gè)訓(xùn)練樣本i,計(jì)算線性組合z(i)=θTx(i)+b ,應(yīng)用激活函數(shù)hθ(x(i))得到預(yù)測(cè)值。在此基礎(chǔ)上,利用反向傳播算法計(jì)算損失函數(shù)關(guān)于模型參數(shù)的梯度(見(jiàn)表3)。
4 模型自適應(yīng)更新效果分析
本次研究中,為了驗(yàn)證自適應(yīng)更新策略對(duì)模型性能的改善程度,確保模型能夠持續(xù)適應(yīng)新的數(shù)據(jù)特征以及環(huán)境變化,提高預(yù)測(cè)的準(zhǔn)確性與魯棒性。研究人員進(jìn)行模型自適應(yīng)更新效果分析。研究人員采用了2種不同的預(yù)測(cè)模型。第一種是傳統(tǒng)的基于棧式自編碼器的出口NOx預(yù)測(cè)模型,該模型依賴(lài)固定的網(wǎng)絡(luò)結(jié)構(gòu)與參數(shù)。第二種是采用自適應(yīng)更新策略的SAE模型,該模型能夠在運(yùn)行過(guò)程中動(dòng)態(tài)調(diào)整網(wǎng)絡(luò)結(jié)構(gòu)與參數(shù),以適應(yīng)數(shù)據(jù)變化。在訓(xùn)練階段,為了保證對(duì)比的公平性,自適應(yīng)更新SAE模型的離線版本在訓(xùn)練集大小、數(shù)據(jù)分布以及網(wǎng)絡(luò)超參數(shù)等方面與原始SAE模型保持一致[4]。通過(guò)這種方式確保2種模型在相同條件下進(jìn)行訓(xùn)練,從而更準(zhǔn)確地評(píng)估自適應(yīng)更新策略的效果。實(shí)際測(cè)試后,研究人員采用了1組未參與訓(xùn)練的數(shù)據(jù)集對(duì)2種模型進(jìn)行效果評(píng)估。通過(guò)比較預(yù)測(cè)結(jié)果與實(shí)際測(cè)量值,分析2種模型的優(yōu)缺點(diǎn),見(jiàn)表4。
分析表4可以發(fā)現(xiàn),原始SAE模型預(yù)測(cè)值與實(shí)際值之間的平均誤差為0.0678,而自適應(yīng)更新SAE模型的RMSE為0.0455,這說(shuō)明自適應(yīng)更新后的模型預(yù)測(cè)值與實(shí)際值之間的平均誤差縮小了。通過(guò)比較2個(gè)RMSE值可以發(fā)現(xiàn),自適應(yīng)更新SAE模型的RMSE比原始SAE模型降低了約33.1%((0.0678-0.0455)/0.0678≈0.331),即自適應(yīng)更新策略顯著降低了預(yù)測(cè)誤差。
在預(yù)測(cè)精度分析方面,原始SAE模型的R2值為0.8672,說(shuō)明模型能夠解釋大約86.72%的變量間相關(guān)性。自適應(yīng)更新SAE模型的R2值為0.9403,即自適應(yīng)更新后的模型能夠解釋大約94.03%的變量間相關(guān)性。通過(guò)比較2個(gè)R2值可以得出,自適應(yīng)更新SAE模型的R2值比原始SAE模型提高了約7.81%((0.9403-0.8672)/0.8672≈0.081),說(shuō)明自適應(yīng)更新策略提高了模型在解釋變量間相關(guān)性方面的表現(xiàn),從而提升了預(yù)測(cè)精度。因此,研究人員得出結(jié)論,自適應(yīng)更新策略在降低預(yù)測(cè)誤差方面具有顯著優(yōu)勢(shì),因?yàn)樽赃m應(yīng)更新SAE模型的RMSE值比原始SAE模型小。而R2值的提高說(shuō)明自適應(yīng)更新模型在解釋變量間的相關(guān)性方面表現(xiàn)更優(yōu),預(yù)測(cè)精度得到了提升[5]。自適應(yīng)更新策略有效地改善了模型的預(yù)測(cè)性能。此外,研究人員還對(duì)測(cè)試集上的原始SAE與自適應(yīng)更新SAE之間的誤差進(jìn)行對(duì)比,如圖2所示。
分析圖2可以發(fā)現(xiàn),自適應(yīng)更新能夠根據(jù)模型的實(shí)際表現(xiàn)動(dòng)態(tài)調(diào)整更新頻率與更新量。當(dāng)應(yīng)用于自編碼器模型時(shí),這種策略能夠使AE模型的誤差曲線具有更平穩(wěn)的特性,同時(shí)波動(dòng)幅度也相應(yīng)減小。這種變化說(shuō)明了預(yù)測(cè)誤差得到了有效控制,模型的預(yù)測(cè)效果因此變得更穩(wěn)定。具體來(lái)說(shuō),自適應(yīng)更新通過(guò)實(shí)時(shí)監(jiān)測(cè)模型的預(yù)測(cè)性能,只在必要時(shí)進(jìn)行更新,從而減少了不必要的模型調(diào)整,使模型能夠在較長(zhǎng)時(shí)間內(nèi)保持良好的預(yù)測(cè)性能,不易受到隨機(jī)噪聲的影響。
5 結(jié)語(yǔ)
本文成功地構(gòu)建并優(yōu)化了預(yù)測(cè)模型,驗(yàn)證了其在實(shí)際應(yīng)用中的有效性與可行性。通過(guò)深入探討關(guān)鍵影響參數(shù)篩選、模型建立及自適應(yīng)更新策略,不僅為出口NOx濃度預(yù)測(cè)提供了新的技術(shù)方法,也為環(huán)境保護(hù)以及工業(yè)生產(chǎn)優(yōu)化提供了有力支持。通過(guò)本次研究,研究人員得出以下結(jié)論。1)堆疊自編碼器(SAE)作為一種深度學(xué)習(xí)模型,具有強(qiáng)大的特征提取能力。在本文中,SAE的應(yīng)用為出口NOx濃度預(yù)測(cè)提供了新的技術(shù)途徑。此外,研究人員還構(gòu)建了一個(gè)基于SAE的預(yù)測(cè)模型,該模型能夠有效地從輸入數(shù)據(jù)中學(xué)習(xí)復(fù)雜的特征,并用于預(yù)測(cè)出口NOx濃度。2)為了適應(yīng)不斷變化的數(shù)據(jù)環(huán)境,研究人員采用了在線學(xué)習(xí)策略對(duì)模型參數(shù)進(jìn)行自更新。這種策略使模型能夠?qū)崟r(shí)調(diào)整,以保持最佳的預(yù)測(cè)性能。3)通過(guò)試驗(yàn)分析,研究人員發(fā)現(xiàn)自適應(yīng)更新策略有效地改善了模型的預(yù)測(cè)性能,使其在出口NOx濃度預(yù)測(cè)方面具有更高的可靠性。
參考文獻(xiàn)
[1]李影,卓建坤,吳逸凡,等.可解釋的變負(fù)荷下燃煤機(jī)組SCR反應(yīng)器入口NOx質(zhì)量濃度預(yù)測(cè)模型[J].熱力發(fā)電,2024,53(7):119-128.
[2]張瑞方,張揚(yáng),張海.氨燃料在燃燒設(shè)備中的應(yīng)用及展望[J].潔凈煤技術(shù),2024,30(5):46-55.
[3]金秀章,暢晗,趙大勇,等.基于蜣螂優(yōu)化-集成加權(quán)融合的NO_x濃度動(dòng)態(tài)預(yù)測(cè)[J].計(jì)量學(xué)報(bào),2024,45(4):600-608.
[4]何德峰,劉明裕,孫芷菲,等.基于LSTM-SAFCN模型的生物質(zhì)鍋爐NOx排放濃度預(yù)測(cè)[J].高技術(shù)通訊,2024,34(1):92-100.
[5]劉樹(shù)成,張曉,劉加昂,等.重型柴油車(chē)NOx排放因子與其濃度相關(guān)性研究[J].環(huán)境科學(xué)研究,2024,37(3):545-553.