梁小姣,馬春玲,馬傳國,辛少菲,程 林,史玉良,3
(1. 國網(wǎng)山東省電力公司東營供電公司,山東 東營 257100; 2. 山東大學軟件學院,山東 濟南 250101;3. 山大地緯軟件股份有限公司,山東 濟南 250200)
當前企業(yè)環(huán)保監(jiān)測多依賴于環(huán)保監(jiān)測設(shè)備采樣進行離線分析/在線監(jiān)測,故不可避免由于多重因素干擾(如設(shè)備老化、設(shè)備故障、采集點環(huán)境因素等)而影響監(jiān)測精準度,甚至存在監(jiān)測數(shù)據(jù)造假、故意破壞監(jiān)測設(shè)備等惡劣事件。電力作為工業(yè)生產(chǎn)活動中必不可少的能源,尤其在“雙碳”目標推動下,作為公認的清潔能源[1],工業(yè)生產(chǎn)電氣化水平必然將進一步提高,而電力數(shù)據(jù)高實時性、高滲透性和高覆蓋性等特點,可及時、準確、全方位地反映企業(yè)生產(chǎn)狀況和環(huán)保設(shè)備使用狀況[2],進而可對相應(yīng)環(huán)保指標監(jiān)測數(shù)據(jù)進行監(jiān)測/校正。故本文基于重點排污監(jiān)測企業(yè)用電數(shù)據(jù),實現(xiàn)企業(yè)排污量的監(jiān)測,輔助完善環(huán)保指標檢測。當前有關(guān)機構(gòu)已開展電能產(chǎn)出/消耗與排污量間關(guān)聯(lián)性的研究。如楊訓政等[3]基于歷史污染物排放數(shù)據(jù)與發(fā)電機組輸出功率間的關(guān)系,采用遞歸網(wǎng)絡(luò)+批規(guī)范化等算法,實現(xiàn)對發(fā)電機組污染物排放量的預測,但當前工業(yè)企業(yè)未實現(xiàn)針對運行機組的用電量監(jiān)測,且僅部分企業(yè)實現(xiàn)排污量日監(jiān)測;安軍等[4]針對雙高企業(yè)建立“企業(yè)甄別-污染預警-配合停/限電-用電監(jiān)測-異常糾正-恢復生產(chǎn)”的限時工作響應(yīng)流程,通過電力綠色調(diào)度降低大氣污染排放量,然而并未量化計量企業(yè)用電量與排污量的關(guān)聯(lián);劉忠輝[5]通過改進智能電表實現(xiàn)對治污設(shè)備啟停的實時在線監(jiān)測,旨在細化監(jiān)測目標提升對企業(yè)氣體污染物排放的監(jiān)測,但硬件改進及運維成本高,不利于推廣應(yīng)用。上述文獻均表明,電力數(shù)據(jù)與環(huán)保數(shù)據(jù)之間存在關(guān)聯(lián)性,但均未實現(xiàn)二者的跨域量化關(guān)聯(lián)。在當前算法研究中,GAN[6]在跨領(lǐng)域?qū)W習中表現(xiàn)優(yōu)異,其基于博弈論的領(lǐng)域?qū)褂柧殻蓪崿F(xiàn)不同領(lǐng)域的自適應(yīng)學習。本文基于已有的研究基礎(chǔ)及技術(shù)開展企業(yè)排污量監(jiān)測,主要改進內(nèi)容如下:
1)為實現(xiàn)企業(yè)用電負荷與環(huán)保特征的關(guān)聯(lián)分析,并保留不同企業(yè)及設(shè)備間的細節(jié)差異信息[7],本文采用對比學習實現(xiàn)用電-環(huán)保特征的跨域動態(tài)關(guān)聯(lián)映射,通過在投影空間中拉近相似實例,推遠不相似實例,實現(xiàn)在企業(yè)缺乏排污數(shù)據(jù)時,也可根據(jù)充足的相似樣本及自身用電負荷做出合理排污預測。
2)為提高生成數(shù)據(jù)與實際數(shù)據(jù)的全局相似度與一致性,監(jiān)測數(shù)據(jù)生成是以相似企業(yè)歷史排污均值數(shù)據(jù)為基礎(chǔ),結(jié)合映射編碼數(shù)據(jù)提取數(shù)據(jù)分布間的差異和動態(tài)的變化量信息進行的數(shù)據(jù)復現(xiàn),故并采用Wasserstein距離構(gòu)建損失函數(shù),有效避免生成數(shù)據(jù)失真。
3)鑒于GAN生成數(shù)據(jù)存在不穩(wěn)定性,故采用模型預測控制(model predictive control, MPC)構(gòu)建最小化控制目標函數(shù),通過多目標及多約束條件限制,保證生成數(shù)據(jù)的穩(wěn)定性及動態(tài)跟蹤性能,且在后期離線模型產(chǎn)生偏移時,其滾動優(yōu)化可參數(shù)微調(diào)保證模型監(jiān)測的準確性。
本文通過用電信息采集系統(tǒng)、煙氣連續(xù)排放監(jiān)測系統(tǒng)獲取用電負荷數(shù)據(jù)和煙氣環(huán)保指標監(jiān)測數(shù)據(jù),對獲取的各類采集數(shù)據(jù)基于行業(yè)、生產(chǎn)規(guī)模、監(jiān)測方式及監(jiān)測設(shè)備進行階梯級分類,并完成數(shù)據(jù)預處理后,構(gòu)成可用樣本集。整體數(shù)據(jù)處理流程如圖1所示。
圖1 整體模型數(shù)據(jù)處理流程圖
本文針對樣本分類分別開展建模訓練及測試,并以某區(qū)域某類重點排污監(jiān)測企業(yè)的用電數(shù)據(jù)與氮氧化物監(jiān)測指標作為背景。首先企業(yè)將基于時間窗口的用電負荷差值數(shù)據(jù)作為輸入數(shù)據(jù),通過用電-環(huán)保動態(tài)關(guān)聯(lián)映射模型,即以對比學習算法實現(xiàn)用電負荷差值數(shù)據(jù)與環(huán)保指標監(jiān)測差值數(shù)據(jù)的關(guān)聯(lián)映射及聚類分類,實現(xiàn)不同企業(yè)的差異化動態(tài)特征提取,輸出排污監(jiān)測數(shù)據(jù)的Encoder編碼數(shù)據(jù);隨后,Encoder編碼[8]數(shù)據(jù)結(jié)合相似企業(yè)歷史排污均值數(shù)據(jù)輸入企業(yè)排污監(jiān)測模型,該模型通過GAN生成器生成排污監(jiān)測數(shù)據(jù),判別器保證生成數(shù)據(jù)符合真實樣本數(shù)據(jù)分布規(guī)律,并采用Wasserstein距離構(gòu)建的損失函數(shù),完成模型的初步參數(shù)調(diào)節(jié);最后,以模型預測控制(model predictive control, MPC)構(gòu)建以誤差最小為目標的控制函數(shù),并基于數(shù)據(jù)預測趨勢進行企業(yè)排污監(jiān)測模型微調(diào),保證輸出企業(yè)排污量監(jiān)測數(shù)據(jù)的精準度與穩(wěn)定性。
本文基于實際用電數(shù)據(jù)與實際環(huán)保數(shù)據(jù)開展用電-環(huán)保動態(tài)關(guān)聯(lián)映射模型訓練,具體過程如圖2所示。以小時級為時間窗口,通過時間窗口滑動分別獲取企業(yè)的歷史用電負荷差值數(shù)據(jù)[9]和歷史排污監(jiān)測差值數(shù)據(jù),共同構(gòu)成訓練數(shù)據(jù)集合 τ,隨機從訓練數(shù)據(jù)集合抽取M個企業(yè)樣本數(shù)據(jù)構(gòu)成一個分枝訓練集合A,共計生成作用于上下2個分枝的兩個訓練集合,分別為歷史排污監(jiān)測差值數(shù)據(jù)集合A1、歷史用電負荷差值數(shù)據(jù)A2,每個分枝中包含M個企業(yè)的樣本數(shù)據(jù),其中,上分枝樣本數(shù)據(jù)固定,下分枝數(shù)據(jù)動態(tài)更新。隨機抽取某一企業(yè)的歷史某類排污監(jiān)測差值數(shù)據(jù)輸入上分枝,并將對應(yīng)時刻的用電負荷差值數(shù)據(jù)輸入下分枝,t表示采樣時間窗口,為采樣時序同維列向量,n表示某一企業(yè)的日監(jiān)測采樣數(shù)量,兩者互為正例,i,j∈ (1,2,···,n)。訓練時,上枝與下枝內(nèi)的其他任意輸入同企業(yè)或不同企業(yè)的樣本數(shù)據(jù)Pj與Xj,均為的負例。
圖2 用電-環(huán)保動態(tài)關(guān)聯(lián)映射訓練過程
然后,構(gòu)造一個表示學習架構(gòu),通過該架構(gòu)將訓練數(shù)據(jù)投影到一個超平面表示空間內(nèi)。為使正例距離能夠拉近,負例距離推遠,上下分枝采用雙塔非對稱結(jié)構(gòu),內(nèi)部層級和神經(jīng)元數(shù)均不同。歷史排污監(jiān)測數(shù)據(jù)集合Pt數(shù)據(jù)進入上分枝,經(jīng)特征編碼器Encoder,Encoder模塊共計4層,每層包含多注意力機制+求和歸一化處理+前饋神經(jīng)網(wǎng)絡(luò)(采用兩層全連接層+層級規(guī)范化(layer normalization,LN)+ReLU激活函數(shù)+線性激活函數(shù))+求和歸一化處理[10],從而將輸入樣本數(shù)據(jù)映射為超平面表示空間中的向量zp。下分枝前一部分架構(gòu)與上分枝架構(gòu)相同,但中間各層的神經(jīng)元個數(shù)不同,且參數(shù)不共享,輸出表示為hx=fθ′(x),接著輸入非線性變換結(jié)構(gòu)Projector(采用兩層全連接層+ LN+ReLU),輸出為zx=gθ′(hx)。向量zx和zp矩陣內(nèi)部結(jié)構(gòu)與數(shù)量一致。在表示空間中,為實現(xiàn)電量數(shù)據(jù)與環(huán)保指標的關(guān)聯(lián)分析,需使表示正例電量差值數(shù)據(jù)和排污監(jiān)測差值數(shù)據(jù)映射后的表示向量z重合或者距離盡可能相近,距離負例樣本較遠,故采用表示向量L2正則后的點積作為距離度量標準,以表示空間向量間的相似性:
為在表示空間中使正例距離近,同時任意負例之間的距離遠,故采用如下?lián)p失函數(shù):
上分枝損失函數(shù):
下分枝損失函數(shù):
式中:τ——溫度超參,表示難度識別懲罰系數(shù),用以拉開正例樣本與相似度高的負例樣本的距離,避免模型基于高難度負樣本進行參數(shù)調(diào)整導致模型崩潰;
M——企業(yè)個數(shù);
n——某一企業(yè)的日監(jiān)測采樣數(shù)量;
上分枝基于損失函數(shù)loss反向傳播進行梯度更新模型參數(shù) θ,由于企業(yè)用電負荷數(shù)據(jù)的樣本數(shù)據(jù)量相對排污監(jiān)測數(shù)據(jù)多,故下分枝歷史用電負荷數(shù)據(jù)A2的負例樣本是不斷更新的,即不斷有新的負例樣本進入A2,并按照先進先出更新負樣本隊列,上下分枝參數(shù)不共享。下分枝采用動量更新機制,參數(shù)更新方式如下:
式中:θ′——下分枝的模型參數(shù);
m——權(quán)重調(diào)節(jié)系數(shù)。
當開始進行模型訓練時,隨機初始化模型參數(shù)θ′,當一個批次的訓練數(shù)據(jù)集計算完成后,上分枝模型參數(shù)θ經(jīng)反向傳播進行梯度更新,同時,使用式(4)更新下分枝對應(yīng)的參數(shù)θ′,m取較大數(shù)值0.9~0.99。相對上分枝參數(shù)更新,下分枝為維護更大的負樣本隊列,故參數(shù)變動緩慢而穩(wěn)定,從隨機數(shù)值小步而緩慢地向最優(yōu)值迭代。故模型整體表示空間分布會根據(jù)排污監(jiān)測樣本的相似度與距離實現(xiàn)上枝的映射分布,用電負荷差值數(shù)據(jù)跟隨排污監(jiān)測差值數(shù)據(jù)映射空間移動并結(jié)合用電負荷數(shù)據(jù)樣本間距離進行映射分布。
通過損失函數(shù)反向調(diào)節(jié)模型參數(shù)完成模型訓練,輸出為表示數(shù)據(jù)分布映射的Encoder數(shù)據(jù)。對比學習使相似企業(yè)相似的用電負荷差值數(shù)據(jù)分布和排污監(jiān)測差值數(shù)據(jù)分布經(jīng)過上下分枝的生成器編碼后,可獲取對應(yīng)的動態(tài)數(shù)據(jù)分布空間映射,而不同的企業(yè)或不同時間段的樣本數(shù)據(jù)在空間映射中相離,從而在實現(xiàn)關(guān)聯(lián)分析的同時保持樣本數(shù)據(jù)的個體差異。
基于用電-環(huán)保動態(tài)關(guān)聯(lián)映射模型獲取訓練數(shù)據(jù)集的Encoder輸出編碼[11],即企業(yè)歷史電量數(shù)據(jù)和歷史排污監(jiān)測數(shù)據(jù)經(jīng)過Encoder/Encoder+Projector的輸出編碼,由于在對比學習過程中,相似企業(yè)相似樣本的歷史電量數(shù)據(jù)和歷史排污監(jiān)測數(shù)據(jù)在表示空間是近鄰關(guān)系,故二者的Encoder輸出編碼距離是相近的,本文旨在通過用電量數(shù)據(jù)監(jiān)測企業(yè)排污量。故在企業(yè)排污監(jiān)測模型訓練階段,輸入樣本的Encoder數(shù)據(jù)提取的為企業(yè)排污動態(tài)變量信息,基于對比學習聚類分類后的均值排污數(shù)據(jù)基礎(chǔ)進行數(shù)據(jù)生成。此部分的訓練過程如圖3所示。
圖3 排污監(jiān)測數(shù)據(jù)生成訓練過程
本文借鑒基于自動編碼器的GAN算法構(gòu)建監(jiān)測模型,并在此基礎(chǔ)上進行算法適應(yīng)性改進。企業(yè)排污監(jiān)測模型輸入數(shù)據(jù)為Encoder排污編碼+相似企業(yè)歷史排污均值數(shù)據(jù),生成器[12]架構(gòu)與Encoder層級相同,均為4層,每層為多注意力機制+求和歸一化處理+編碼器-生成器注意力機制+求和歸一化處理+前饋神經(jīng)網(wǎng)絡(luò)(采用兩層全連接層+層級規(guī)范化+ReLU激活函數(shù)+線性激活函數(shù))+求和歸一化處理,4層輸出末端為單層全連接神經(jīng)網(wǎng)絡(luò)+ReLU激活函數(shù),輸出生成排污數(shù)據(jù);判別器為3層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),為卷積層+求和歸一化處理+卷積層+求和歸一化處理+全連接層,輸出損失函數(shù)。對生成排污數(shù)據(jù)與對應(yīng)輸入數(shù)據(jù)的真實排污監(jiān)測數(shù)據(jù)計算Wasserstein距離,結(jié)合相似樣本生成的損失函數(shù)loss如下:
式中:Pg——生成數(shù)據(jù)的集合;
Pr——實際數(shù)據(jù)的集合;
——生成數(shù)據(jù)樣本;
p——實際數(shù)據(jù)樣本;
用以保證生成數(shù)據(jù)靠近真實樣本數(shù)據(jù),但不會超過真實樣本數(shù)據(jù);
——生成數(shù)據(jù)與真實數(shù)據(jù)間的抽樣構(gòu)成數(shù)據(jù),通過對抽樣構(gòu)成數(shù)據(jù)加梯度懲罰來穩(wěn)定梯度變化;
λ——權(quán)重;
D(p,)——生成樣本與實際樣本的Wasserstein距離,表示點從曲線移動到pi曲線的最短距離集合,計算公式如下:
式中:pi——t時刻的實際排污監(jiān)測數(shù)據(jù);
——生成數(shù)據(jù);
σ(t)——t時刻的真實數(shù)據(jù)映射到生成數(shù)據(jù)的σ(t)時刻的生成排污監(jiān)測數(shù)據(jù),由于實際數(shù)據(jù)與生成數(shù)據(jù)的元素個數(shù)相同,且數(shù)據(jù)測度相同,故Wasserstein距離采用二次差值衡量;
ΣN——N個元素的所有排序排列構(gòu)成的集合。
訓練過程如下:
1)初始化生成器參數(shù) θg和 判別器 θd。
2)迭代訓練過程中,生成器訓練一次,而判別器需進行多次訓練。主要過程包括訓練判別器,固定生成器參數(shù),更新最大化判別器損失函數(shù)。判別器損失函數(shù)公式如下:
其中,為實現(xiàn)基于相似樣本數(shù)據(jù)實現(xiàn)曲線擬合生成,加入歷史相似樣本的均方誤差判別條件。
訓練生成器,固定判別器參數(shù),更新最小化生成器損失函數(shù):
其中,δ為可學習參數(shù)。
3)在基于上述獲取的生成器基礎(chǔ)上,進行生成器參數(shù)微調(diào),即采用MPC建立目標函數(shù),從而保證生成樣本數(shù)據(jù)的穩(wěn)定性。定義控制目標為:在連續(xù)時間步內(nèi),生成排污數(shù)據(jù)與實際排污數(shù)據(jù)總量誤差盡可能小,從而保證生成排污數(shù)據(jù)的連續(xù)性與穩(wěn)定性;在用電數(shù)據(jù)產(chǎn)生變量時,生成排污數(shù)據(jù)與實際排污數(shù)據(jù)變化時間點誤差盡可能小,從而保證生成數(shù)據(jù)可以有效捕獲用電數(shù)據(jù)變動量而非僅擬合排污數(shù)據(jù)值;用電數(shù)據(jù)變動量生成的監(jiān)測輸出變動量與實際排污變動量誤差盡可能小,從而約束生成排污數(shù)據(jù)產(chǎn)生不必要的跳變??刂颇繕巳缦拢?/p>
滿足約束如下:
式中:J——目標函數(shù);
p(t+1)——在t+1時間步內(nèi)的實際排污數(shù)據(jù);
Δt′——指在用電數(shù)據(jù)發(fā)生百分比超過20%的跳變時,生成排污數(shù)據(jù)與實際排污數(shù)據(jù)變化時間點誤差;
?!磥?Γ個時間步;
隨后,隨機o次微調(diào)生成器參數(shù) θd,并求解未來Γ個時間步的控制目標函數(shù)值,得到o組控制序列并排序,獲取最小控制目標函數(shù)值J,并將其第一個微調(diào)控制量 θd作用于生成器,并進入下一個時刻,重復上述過程直至J小于設(shè)定閾值或者其梯度值接近于0,固定參數(shù),輸出模型?;陬A測跟蹤控制可有效提高生成器生成數(shù)據(jù)的穩(wěn)定性,并在輸入數(shù)據(jù)發(fā)生變化時可動態(tài)跟蹤其變化軌跡,從而保證企業(yè)設(shè)備在不同運行狀態(tài)切換時,生成排污監(jiān)測數(shù)據(jù)接近實際排污數(shù)據(jù)。
訓練完成后,用電-環(huán)保動態(tài)關(guān)聯(lián)映射模型輸入電量數(shù)據(jù)及部分排污采樣點數(shù)據(jù),輸出Encoder編碼,編碼輸入企業(yè)排污監(jiān)測模型,輸出企業(yè)排污量監(jiān)測數(shù)據(jù),由于Encoder編碼關(guān)注數(shù)據(jù)的差異性、動態(tài)性和泛化性,而并不是數(shù)據(jù)本身,故監(jiān)測數(shù)據(jù)是基于聚類獲取的相似企業(yè)的歷史排污均值數(shù)據(jù)基礎(chǔ),并結(jié)合用電數(shù)據(jù)變化量進行的數(shù)據(jù)復現(xiàn),保證基于企業(yè)用電量數(shù)據(jù)實現(xiàn)其排污量的監(jiān)測。尤其隨著該類企業(yè)的排污監(jiān)測數(shù)據(jù)樣本的增加與更新,可基于預測跟蹤控制模塊不斷微調(diào)模型參數(shù),從而提高監(jiān)測精準度。
本文以國網(wǎng)某市公司建設(shè)的黃河流域污染防止監(jiān)測系統(tǒng)作為實驗數(shù)據(jù)源,系統(tǒng)界面如圖4所示。
圖4 黃河流域污染防止監(jiān)測系統(tǒng)界面圖示
其中,用電數(shù)據(jù)、環(huán)保數(shù)據(jù)的數(shù)據(jù)采集頻率為24點/日,電力采集數(shù)據(jù)為用電負荷數(shù)據(jù),環(huán)保監(jiān)測指標為大氣污染指標中的氮氧化物濃度,結(jié)合網(wǎng)絡(luò)爬取氣象及節(jié)假日數(shù)據(jù)。對獲取的采集數(shù)據(jù)進行數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)標準化、異常值刪除等預處理操作后,獲取可用樣本數(shù)據(jù)。對2 385家重點排污監(jiān)測企業(yè)基于行業(yè)進行分類建模,選擇2020年1月-2021年12月的歷史數(shù)據(jù)為模型訓練樣本集,2022年1月-2022年4月的歷史數(shù)據(jù)為模型驗證樣本集,為避免樣本類別不均衡,僅選取企業(yè)正常生產(chǎn)的1/5的歷史樣本參與訓練與驗證,以2022年5月歷史數(shù)據(jù)為模型測試數(shù)據(jù)樣本集,實現(xiàn)企業(yè)排污量監(jiān)測效果評估。
在訓練階段用電負荷數(shù)據(jù)與氮氧化物監(jiān)測數(shù)據(jù)輸入用電-環(huán)保動態(tài)關(guān)聯(lián)映射模型后,于上下分枝獲取企業(yè)排污監(jiān)測模型的Encoder編碼。為可視化展現(xiàn)用電負荷數(shù)據(jù)通過對比學習跟蹤氮氧化物監(jiān)測數(shù)據(jù)的空間分布規(guī)律,在保留企業(yè)排污細節(jié)信息的前提下,實現(xiàn)相似樣本數(shù)據(jù)聚類與不相似樣本在表示空間的相對均勻分布,為展示上下分枝分別生成的氮氧化物監(jiān)測數(shù)據(jù)與用電數(shù)據(jù)的Encoder編碼數(shù)據(jù),采用極坐標進行展示,如圖5所示。
圖5 編碼數(shù)據(jù)在極坐標中的對比圖
由圖5展現(xiàn)了“雙塔”結(jié)構(gòu)生成用電數(shù)據(jù)Encoder編碼和排污數(shù)據(jù)Encoder編碼在空間中的對稱分布與關(guān)聯(lián)性,其中,極坐標中的氣泡的大小代表樣本數(shù)據(jù)量,氣泡數(shù)量代表樣本聚類數(shù)量,氣泡間的距離代表樣本的相似度與差異距離。由于當前僅部分重點排污企業(yè)可實現(xiàn)氮氧化物的小時級采集監(jiān)測,采集監(jiān)測數(shù)據(jù)受限于有限量氮氧化物監(jiān)測數(shù)據(jù),故在訓練過程中,上分枝氮氧化物監(jiān)測數(shù)據(jù)樣本不變,下分枝歷史電量數(shù)據(jù)A2的負例樣本是不斷更新的,即不斷有新的負例樣本進入A2,并按照先進先出更新負樣本隊列,故下分枝映射后獲取的左側(cè)用電數(shù)據(jù)氣泡樣本量較大。從圖中可以看出,二者的聚類中心基本重合,在訓練過程中用電數(shù)據(jù)是根據(jù)氮氧化物監(jiān)測數(shù)據(jù)的分布進行跟蹤,故可基于用電數(shù)據(jù)提取氮氧化物監(jiān)測數(shù)據(jù)的變量信息。同時對比學習使電量數(shù)據(jù)分布和排污監(jiān)測數(shù)據(jù)分布經(jīng)過上下分枝的生成器編碼后,相似樣本數(shù)據(jù)聚集到較近區(qū)域,在實現(xiàn)特征相關(guān)性分析的同時,可基于樣本數(shù)據(jù)的個體差異進行聚類劃分。受限于有限量氮氧化物監(jiān)測數(shù)據(jù),導致下分枝基于用電量數(shù)據(jù)擬合排污數(shù)據(jù)的編碼產(chǎn)生偏差,如圖5(b)的左側(cè)三個樣本集數(shù)據(jù),此部分區(qū)域企業(yè)的氮氧化物平均單位電量排放氮氧化物指數(shù)低于5.89,排放氮氧化物的日監(jiān)測數(shù)據(jù)采集樣本數(shù)據(jù)未實現(xiàn)小時級,導致用電數(shù)據(jù)對應(yīng)排污數(shù)據(jù)映射出現(xiàn)偏差。但在排污監(jiān)測數(shù)據(jù)充分時,用電-環(huán)保動態(tài)關(guān)聯(lián)映射模型能夠忽略數(shù)據(jù)分布的淺層因素,可基于用電數(shù)據(jù)提取其排污指標數(shù)據(jù)的變化分布規(guī)律。
本文在模型數(shù)據(jù)處理過程中,主要從以下3點內(nèi)容進行改進:
1)企業(yè)排污監(jiān)測模型生成器的輸入編碼為用電數(shù)據(jù)與氮氧化物監(jiān)測數(shù)據(jù)對比學習獲取的氮氧化物動態(tài)編碼數(shù)據(jù)[13]。
2)在企業(yè)排污監(jiān)測模型訓練階段,生成器生成的檢測數(shù)據(jù)是根據(jù)企業(yè)S用電數(shù)據(jù)獲取的動態(tài)編碼結(jié)合相似企業(yè)歷史排污均值數(shù)據(jù)復現(xiàn)企業(yè)S排污數(shù)據(jù),同時損失函數(shù)采用Wasserstein距離計算生成排污數(shù)據(jù)與真實排污監(jiān)測數(shù)據(jù)差值。
3)在模型初步訓練完成的基礎(chǔ)上,采用MPC建立以曲線誤差最小為目標的控制函數(shù),從而進行模型的二次微調(diào)。
本文通過消融實驗,對上述內(nèi)容以企業(yè)S為例進行生成曲線展示,如圖6所示,為用電-環(huán)保動態(tài)關(guān)聯(lián)映射模型、企業(yè)排污監(jiān)測模型訓練完成后,將用電數(shù)據(jù)輸入用電-環(huán)保動態(tài)關(guān)聯(lián)映射模型后,輸出Encoder數(shù)據(jù),隨后Encoder數(shù)據(jù)輸入企業(yè)排污監(jiān)測模型,輸出企業(yè)S氮氧化物排放量監(jiān)測數(shù)據(jù)。示例企業(yè)S為某鋼鐵制品加工企業(yè),企業(yè)S基于生產(chǎn)計劃進行,小時級氮氧化物排放監(jiān)測樣本數(shù)據(jù)充分。對比實驗方法如下:
圖6 氮氧化物生成曲線數(shù)據(jù)對比圖
方法1:本文方法,即用電負荷數(shù)據(jù)作為用電-環(huán)保動態(tài)關(guān)聯(lián)映射模型輸入,采用對比學習獲取Encoder排污編碼,結(jié)合相似企業(yè)歷史排污均值數(shù)據(jù)作為企業(yè)排污監(jiān)測模型的輸入數(shù)據(jù),監(jiān)測模型采用GAN生成器(生成監(jiān)測數(shù)據(jù))+判別器(判別曲線真假),采用MPC進行二次微調(diào),輸出氮氧化物監(jiān)測數(shù)據(jù)。
方法2:在方法1的基礎(chǔ)上,將企業(yè)S真實排污監(jiān)測數(shù)據(jù)作為映射模型輸入(即不采用對比學習獲取Encoder排污編碼),其他一致。
方法3:在方法1的基礎(chǔ)上,將企業(yè)S排污監(jiān)測設(shè)備故障時獲取的排污監(jiān)測數(shù)據(jù)作為映射模型輸入(即不采用對比學習獲取Encoder排污編碼),其他一致。
方法4:在方法1的基礎(chǔ)上,采用對比學習獲取Encoder排污編碼作為企業(yè)排污監(jiān)測模型的輸入數(shù)據(jù)(未結(jié)合相似企業(yè)歷史排污均值數(shù)據(jù)),其他一致。
方法5:在方法1的基礎(chǔ)上,不采用MPC進行二次微調(diào),其他一致。
如圖6所示,采用文中方法的方法1,與實際排污的真實曲線擬合度較高,小時級均值誤差為1.89%,標準差為0.02,方法2直接將企業(yè)S真實排污監(jiān)測數(shù)據(jù)作為映射模型輸入,基本復現(xiàn)實際排污曲線,小時級均值誤差為1.39%,標準差為0.02,由方法1和方法2可以說明,采用對比學習方法,用電數(shù)據(jù)可以捕獲排污數(shù)據(jù)的動態(tài)變化信息,并通過本文方法實現(xiàn)排污曲線復現(xiàn);方法3為企業(yè)S排污監(jiān)測設(shè)備故障時獲取的排污監(jiān)測數(shù)據(jù),并將其直接作為映射模型輸入,由曲線可以看出其更多地基于相似企業(yè)排污數(shù)據(jù)均值進行變化,進一步說明采用用電數(shù)據(jù)提取動態(tài)特征,可以在排污監(jiān)測設(shè)備故障時進行預警并復現(xiàn)實際排污數(shù)據(jù);方法4為GAN生成器未結(jié)合相似企業(yè)歷史排污均值數(shù)據(jù)進行數(shù)據(jù)生成,小時級均值誤差為9.88%,標準差為0.1,由此可以看出僅基于GAN生成數(shù)據(jù)存在不穩(wěn)定性及數(shù)據(jù)分散,難以擬合實際排污數(shù)據(jù);方法5為不采用MPC進行二次微調(diào),由曲線可以看出,生成曲線與實際曲線不僅誤差較大,且由于其數(shù)據(jù)監(jiān)測缺乏前瞻連續(xù)性,故導致其未捕獲排污數(shù)據(jù)滯后于用電數(shù)據(jù)這一實際狀態(tài)。
此外,本文選取29家重點排污企業(yè)進行5日氮氧化物排放濃度監(jiān)測,采用均方根誤差(root mean squared error,RMSE)對 12次實驗結(jié)果進行排放濃度監(jiān)測效果評價,并采用KL散度[14]衡量一個監(jiān)測曲線數(shù)據(jù)分布相比實際數(shù)據(jù)分布的信息損失,二者均為數(shù)據(jù)越小,曲線擬合度越高,并對擬合曲線進行積分運算,從而獲取企業(yè)累計排污量監(jiān)測值,以平均絕對百分比誤差(mean absolute percentage error,MAPE)對監(jiān)測值與實際排污量進行監(jiān)測精準度評價,如表1所示。
表1 曲線相似度評價表
由RMSE和KL散度可得,采用本文所述方法可對企業(yè)排污量進行相對準確的監(jiān)測,可有效實現(xiàn)基于用電數(shù)據(jù)實現(xiàn)對排污監(jiān)測數(shù)據(jù)的監(jiān)測與預警。
為進一步說明本文采用MPC對模型監(jiān)測數(shù)據(jù)的穩(wěn)定性與連續(xù)性影響,以實際排污數(shù)據(jù)為基線,分別以本文采用MPC的排污監(jiān)測數(shù)據(jù)曲線、本文不采用MPC的排污監(jiān)測數(shù)據(jù)曲線、采用GAN生成器(此處無相似企業(yè)排污歷史均值數(shù)據(jù)輔助輸入)與實際排污數(shù)據(jù)計算誤差進行對比分析,如圖7所示。
圖7 12 h排污監(jiān)測數(shù)據(jù)誤差對比圖
由圖可以看出,本文所述方法為代表的采用MPC的排污監(jiān)測生成數(shù)據(jù)曲線,與實際曲線誤差較小,數(shù)據(jù)波動性較小,其通過定義控制目標為總量誤差、時間點誤差和變動量誤差的降低,在模型二次微調(diào)階段,基于該控制目標在實現(xiàn)時域預測追蹤控制,從而提高了生成排污數(shù)據(jù)的連續(xù)性、穩(wěn)定性與實時性;對比不采用MPC的排污監(jiān)測生成數(shù)據(jù)曲線,其跟蹤連續(xù)性與穩(wěn)定性明顯降低,表明模型二次微調(diào)階段的可行性與有效性;而不依賴基礎(chǔ)數(shù)據(jù)的GAN生成曲線,由于未基于歷史數(shù)據(jù)基礎(chǔ)進行數(shù)據(jù)生成,GAN生成數(shù)據(jù)的不穩(wěn)定性,即使模型加入采用MPC的二次微調(diào),其生成監(jiān)測數(shù)據(jù)仍然與實際數(shù)據(jù)誤差較大,表明本文采用相似企業(yè)排污歷史均值數(shù)據(jù)輔助輸入生成排污監(jiān)測數(shù)據(jù)曲線可有效保障監(jiān)測數(shù)據(jù)的穩(wěn)定性,即在實際歷史排污數(shù)據(jù)的基礎(chǔ)上,通過用電數(shù)據(jù)捕獲排污動態(tài)變量信息,從而生成排污監(jiān)測數(shù)據(jù)。
3種方法的監(jiān)測誤差數(shù)據(jù)如表2 所示。通過對比分析可知,本文方法排污監(jiān)測數(shù)據(jù)準確率均值能夠達到98.92%,相較于不采用MPC,模型監(jiān)測數(shù)據(jù)準確率均值提升2.36%,相較于不依賴基礎(chǔ)數(shù)據(jù)的GAN生成曲線,模型監(jiān)測數(shù)據(jù)準確率均值提升5.85%,對比分析可知采用MPC可提高生成數(shù)據(jù)準確率。通過對比分析3種方法的標準差可知,采用MPC生成的監(jiān)測曲線相對的穩(wěn)定性。與此同時, 本文方法監(jiān)測誤差跨度不高于5%,說明模型可有效捕獲用電數(shù)據(jù)中的表現(xiàn)排污量的動態(tài)信息,模型趨勢監(jiān)測準確率明顯提升。綜上所述,仿真實驗表明,本文方法不僅可基于用電數(shù)據(jù)監(jiān)測排污量,且模型監(jiān)測準確度與穩(wěn)定性均較好,可輔助實現(xiàn)環(huán)保指標監(jiān)測預警。
表2 12 h排污監(jiān)測數(shù)據(jù)誤差對比表
本文通過對比學習算法實現(xiàn)用電數(shù)據(jù)與環(huán)保指標的差值數(shù)據(jù)關(guān)聯(lián)映射,作為上分枝環(huán)保差值數(shù)據(jù)的正例增強樣本的下分枝用電負荷差值數(shù)據(jù),與對應(yīng)正例映射數(shù)據(jù)分布相擬合,并實現(xiàn)了“正例相吸,
負例相斥”樣本數(shù)據(jù)聚類分類;基于排污編碼數(shù)據(jù)結(jié)合相似樣本排污均值數(shù)據(jù),采用GAN算法生成企業(yè)排污監(jiān)測數(shù)據(jù),并以模型預測控制構(gòu)建符合預測趨勢發(fā)展的目標控制函數(shù),進一步保證生成數(shù)據(jù)的穩(wěn)定性與連續(xù)性。
由于根據(jù)用電數(shù)據(jù)實現(xiàn)企業(yè)的排污量監(jiān)測尚處于初期探索階段,故本文僅對某類型企業(yè)充足樣本的氮氧化物24 點指標數(shù)據(jù)進行了研究與測試,后續(xù)隨著點源排放監(jiān)測數(shù)據(jù)的增多,可探索在樣本不充分的情況下的多類指標的預測,從而為環(huán)保監(jiān)測提供技術(shù)研究參考。