佟敏,史昌明,馬善為,崔亞茹,李凱
(1. 國(guó)網(wǎng)內(nèi)蒙古東部電力有限公司電力科學(xué)研究院,呼和浩特市,010020;2. 華北電力大學(xué)新能源發(fā)電國(guó)家工程研究中心,北京市,102206)
二氧化碳排放引起環(huán)境污染、溫室效應(yīng)等問(wèn)題日益嚴(yán)重,嚴(yán)格限制二氧化碳等溫室氣體排放受到世界各國(guó)的普遍重視[1]。化石能源發(fā)電是二氧化碳排放的重要來(lái)源。與化石能源相比,生物質(zhì)能是唯一具有負(fù)碳屬性的可再生能源。以生物質(zhì)發(fā)電替代燃煤發(fā)電被視為一種行之有效的碳減排方法,受到學(xué)者們的普遍推崇[2-3]。據(jù)統(tǒng)計(jì),我國(guó)生物質(zhì)發(fā)電的裝機(jī)容量處于持續(xù)增長(zhǎng)階段[4],截至2021年,生物質(zhì)發(fā)電裝機(jī)容量達(dá) 3 319 萬(wàn)千瓦,但遺憾的是,目前生物質(zhì)的利用率仍不到其總可利用量的13%[5]。
生物質(zhì)發(fā)電作為現(xiàn)有應(yīng)用最廣、規(guī)模最大的生物質(zhì)能利用方式,在清潔電能替代方面具有極大潛力。與風(fēng)能[6]、太陽(yáng)能[7-8]等其它可再生能源發(fā)電相比,生物質(zhì)發(fā)電受氣候影響小,發(fā)電量穩(wěn)定,而且可以參與電力調(diào)度、電網(wǎng)調(diào)荷,維持電網(wǎng)的穩(wěn)定運(yùn)行。然而,實(shí)現(xiàn)這一目標(biāo)的前提是準(zhǔn)確預(yù)測(cè)生物質(zhì)發(fā)電量。相比燃煤發(fā)電[9-10],生物質(zhì)發(fā)電發(fā)展較晚,目前生物質(zhì)發(fā)電研究更多地關(guān)注于發(fā)電模式和發(fā)電機(jī)組優(yōu)化,鮮有研究注重生物質(zhì)發(fā)電量的預(yù)測(cè)。
現(xiàn)階段,關(guān)于發(fā)電量預(yù)測(cè)的研究主要集中于傳統(tǒng)化石能源發(fā)電或者風(fēng)能和太陽(yáng)能等不穩(wěn)定可再生能源發(fā)電,學(xué)者們開(kāi)發(fā)了眾多的發(fā)電量預(yù)測(cè)方法,包括基于能量守恒的“以熱定電”發(fā)電量計(jì)算[11]、BP神經(jīng)網(wǎng)絡(luò)[12-13]、支持向量機(jī)(SVM)[8]、長(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò)(LSTM)[14]、Elman神經(jīng)網(wǎng)絡(luò)[9]、主成分分析(PCA)優(yōu)化神經(jīng)網(wǎng)絡(luò)[15]等。其中,神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型作為目前研究最廣、發(fā)展最為迅速、智能化程度最高的模型算法,在發(fā)電量預(yù)測(cè)的準(zhǔn)確性、精度、穩(wěn)定性等方面都表現(xiàn)出較大優(yōu)勢(shì)。
相比燃煤等化石能源發(fā)電,生物質(zhì)發(fā)電發(fā)展仍不成熟,生物質(zhì)發(fā)電的關(guān)鍵影響因素尚不清晰,包括物料參數(shù)、鍋爐參數(shù)、汽機(jī)參數(shù)、煙氣參數(shù)等眾多參數(shù)均能影響發(fā)電過(guò)程?;谏窠?jīng)網(wǎng)絡(luò)的生物質(zhì)發(fā)電模型缺乏理論指導(dǎo),如果參數(shù)選擇不當(dāng),神經(jīng)網(wǎng)絡(luò)容易學(xué)習(xí)干擾信息,不僅會(huì)降低神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的準(zhǔn)確性,而且會(huì)增加神經(jīng)網(wǎng)絡(luò)計(jì)算量。值得慶幸的是,在其它應(yīng)用領(lǐng)域,眾多學(xué)者們提出了大量的參數(shù)優(yōu)化方法,包括Pearson相關(guān)分析[16]、Spearman相關(guān)分析[17]、平均影響值(MIV)分析[18]、互信息(MI)分析[19]、灰色關(guān)聯(lián)度分析[20]等。其中,Pearson和Spearman是目前最為普遍的線性相關(guān)性分析方法,而互信息分析對(duì)于參數(shù)之間的非線性相關(guān)性具有較好的鑒別效果,MIV則可直接反應(yīng)參數(shù)變化對(duì)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)結(jié)果的影響程度。基于此,本文提出采用了Pearson相關(guān)分析、Spearman相關(guān)分析、平均影響值(MIV)分析和互信息分析對(duì)生物質(zhì)發(fā)電量關(guān)鍵影響參數(shù)進(jìn)行優(yōu)選,以期建立參數(shù)優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)模型,從而實(shí)現(xiàn)生物質(zhì)發(fā)電量的準(zhǔn)確預(yù)測(cè)。
BP神經(jīng)網(wǎng)絡(luò)作為目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)模型,是一種按照誤差反向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò)。通常而言,BP神經(jīng)網(wǎng)絡(luò)至少包括輸入層、隱含層和輸出層三種網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)。隱含層也可設(shè)置為多層,每層神經(jīng)網(wǎng)絡(luò)設(shè)有數(shù)量不等的神經(jīng)元,理論上只要隱含層設(shè)置足夠多的神經(jīng)元數(shù),即可建立任意非線性映射模型。一般而言,神經(jīng)網(wǎng)絡(luò)輸出層設(shè)置為目標(biāo)變量,輸入層設(shè)置為目標(biāo)變量的影響因素,二者的神經(jīng)元節(jié)點(diǎn)數(shù)由訓(xùn)練樣本決定,隱含層節(jié)點(diǎn)數(shù)沒(méi)有通用的設(shè)置方法,可以采用如下經(jīng)驗(yàn)公式確定。
(1)
式中:l——隱含層節(jié)點(diǎn)數(shù);
m——輸出層節(jié)點(diǎn)數(shù);
n——輸入層節(jié)點(diǎn)數(shù);
v——常數(shù),一般取1≤v≤10。
本研究以某生物質(zhì)直燃發(fā)電廠為研究對(duì)象,對(duì)電廠實(shí)際運(yùn)行過(guò)程中的發(fā)電量進(jìn)行建模預(yù)測(cè)。通常,影響生物質(zhì)直燃發(fā)電量的因素主要包括燃料參數(shù)、鍋爐參數(shù)、汽輪機(jī)參數(shù)、環(huán)境參數(shù)等。因此,本文從該電廠收集了發(fā)電量以及相關(guān)影響因素參數(shù),包括變壓器損耗X1(kW·h)、電廠用電量X2(kW·h)、秸稈消耗量X3(t)、鍋爐蒸汽產(chǎn)量X4(t)、發(fā)電補(bǔ)水量X5(t)、秸稈熱值X6(kJ/kg)、收到基水分X7(%)、收到基灰分X8(%)、鍋爐主汽壓力X9(MPa)、鍋爐主汽溫度X10(℃)、送風(fēng)機(jī)入口溫度X11(℃)、排煙溫度X12(℃)、飛灰含碳量X13(%)、爐渣含碳量X14(%)、汽輪機(jī)主汽壓力X15(MPa)、汽輪機(jī)主汽溫度X16(℃)、給水溫度X17(℃)、排汽溫度X18(℃)、凝結(jié)水溫度X19(℃)、真空度X20(kPa)、循環(huán)水入口溫度X21(℃)、循環(huán)水出水溫度X22(℃)、當(dāng)?shù)卮髿鈮篨23(kPa)共計(jì)23個(gè)參數(shù)。
相關(guān)系數(shù)是目前最常用的判斷變量之間相關(guān)程度的統(tǒng)計(jì)指標(biāo),根據(jù)研究對(duì)象的不同,相關(guān)系數(shù)具有多種定義方式,最常用的相關(guān)系數(shù)主要有Pearson相關(guān)系數(shù)和Spearman相關(guān)系數(shù)。
Pearson相關(guān)系數(shù)又稱(chēng)線性相關(guān)系數(shù),一般用于衡量參數(shù)之間的線性相關(guān)程度,其定義式如下
(2)
式中:μX——參數(shù)X的平均值;
μY——參數(shù)Y的平均值。
一般而言,Pearson相關(guān)系數(shù)的絕對(duì)值越接近1,表示參數(shù)之間的線性相關(guān)程度越高;絕對(duì)值越趨向于0,表示參數(shù)之間的相關(guān)程度越差。
Spearman相對(duì)系數(shù)又稱(chēng)秩相關(guān)系數(shù),其不關(guān)注參數(shù)之間具體值大小,通過(guò)對(duì)參數(shù)值進(jìn)行排序,進(jìn)而統(tǒng)計(jì)數(shù)據(jù)排序之間的相關(guān)程度,定義式如式(3)所示。
(3)
式中:di——參數(shù)之間的排序差值。
與Pearson相關(guān)系數(shù)類(lèi)似,Spearman相關(guān)系數(shù)的值域同樣在-1和1之間,其絕對(duì)值的大小表示參數(shù)的相關(guān)程度。不同的是,Spearman相關(guān)系數(shù)不考慮參數(shù)的真實(shí)值的大小,也能在一定程度表示參數(shù)之間的非線性相關(guān)性。
互信息(MI)是信息論中提出的信息度量方法,它可以看成一個(gè)隨機(jī)變量包含另一個(gè)隨機(jī)變量的信息大小。當(dāng)變量之間具有某種關(guān)聯(lián)關(guān)系,變量之間的隨機(jī)性越小,互信息就越大?;バ畔⒍x式如式(4)所示。
(4)
式中:p(x,y)——參數(shù)X、Y的聯(lián)合密度分布函數(shù);
p(x)、p(y)——X、Y的邊緣密度分布函數(shù)。
一般而言,互信息滿足對(duì)稱(chēng)性和正定性,即I(X,Y)=I(Y,X),I(X,Y)≥0;當(dāng)且僅當(dāng)X、Y獨(dú)立,I(X,Y)=0。
平均影響值(MIV)被認(rèn)為評(píng)價(jià)參數(shù)的最佳指標(biāo)之一,其核心思想是利用神經(jīng)網(wǎng)絡(luò)模型測(cè)試參數(shù)變動(dòng)對(duì)目標(biāo)參數(shù)的影響。具體計(jì)算過(guò)程是:首先利用原始數(shù)據(jù)訓(xùn)練獲得一個(gè)神經(jīng)網(wǎng)絡(luò)模型,然后利用所獲得的神經(jīng)網(wǎng)絡(luò)依次對(duì)待評(píng)價(jià)變量變動(dòng)±10%時(shí),計(jì)算目標(biāo)參數(shù)的差值,最后取平均值,即為MIV值。
本文從國(guó)內(nèi)某生物質(zhì)電廠采集了35組不同時(shí)間段的生物質(zhì)發(fā)電量及其影響因素的樣本數(shù)據(jù),部分?jǐn)?shù)據(jù)如表1所示。
表1 電廠實(shí)際運(yùn)行數(shù)據(jù)Tab. 1 Actual operation data of power plants
對(duì)原始數(shù)據(jù)進(jìn)行直接分析,可以發(fā)現(xiàn)不同時(shí)間段生物質(zhì)燃料特性、燃燒參數(shù)、鍋爐參數(shù)、汽機(jī)參數(shù)等均存在一定的波動(dòng)性且不同參數(shù)的波動(dòng)情況差異較大,相應(yīng)的生物質(zhì)直燃發(fā)電量也存在一定波動(dòng)性,很難直接看出參數(shù)之間的關(guān)聯(lián)性?;诖?,首先采用相關(guān)分析、互信息分析和MIV分析對(duì)發(fā)電量與其影響因素的關(guān)聯(lián)性進(jìn)行分析。需要指出的是,進(jìn)行MIV分析時(shí),需要先建立神經(jīng)網(wǎng)絡(luò)模型,再通過(guò)所建立的神經(jīng)網(wǎng)絡(luò)模型對(duì)影響因素一一測(cè)試??紤]到現(xiàn)階段缺乏生物質(zhì)發(fā)電量的關(guān)鍵影響因素的研究指導(dǎo),因此本研究將全部采集參數(shù)均用于神經(jīng)網(wǎng)絡(luò)建模研究,分析結(jié)果如表2所示。
表2 發(fā)電量與影響參數(shù)的關(guān)聯(lián)分析Tab. 2 Correlation analysis between power generation and influencing parameters
從表1、表2可以看出不同優(yōu)化方法所得的結(jié)果差異較大,以相關(guān)性大于0.5為發(fā)電量關(guān)鍵影響因素判定標(biāo)準(zhǔn)。Pearson相關(guān)分析所得關(guān)鍵參數(shù)為鍋爐蒸汽產(chǎn)量、發(fā)電補(bǔ)水量、鍋爐主汽壓力、汽輪機(jī)主汽壓力;與Pearson相關(guān)分析相比,Spearman相關(guān)分析則僅僅多了變壓器損耗一個(gè)關(guān)鍵參數(shù),這可能是因?yàn)檫@兩種相關(guān)系數(shù)的原理基本相同導(dǎo)致的分析結(jié)果較為相近;MI分析認(rèn)為秸稈消耗量、鍋爐蒸汽產(chǎn)量和汽輪機(jī)排氣溫度為影響發(fā)電量的關(guān)鍵因素;MIV分析則獲得了8個(gè)關(guān)鍵影響因素,分別為電廠用電量、鍋爐蒸汽產(chǎn)量、鍋爐主汽壓力、鍋爐主汽溫度、汽輪機(jī)主汽壓力、汽輪機(jī)主汽溫度、真空度和當(dāng)?shù)卮髿鈮骸?/p>
隨機(jī)選取25組樣本作為訓(xùn)練樣本,分別利用上述優(yōu)化參數(shù)建立并訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,同時(shí)利用未優(yōu)化樣本建立神經(jīng)網(wǎng)絡(luò)模型作為對(duì)比,利用所建立的神經(jīng)網(wǎng)絡(luò)模型對(duì)剩余10組樣本進(jìn)行分析測(cè)試,結(jié)果如圖1所示。從圖1中可以明顯看出,未優(yōu)化神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)誤差明顯大于優(yōu)化樣本建立的神經(jīng)網(wǎng)絡(luò),不同優(yōu)化方法的預(yù)測(cè)效果也相同,整體而言MI優(yōu)化方法獲得誤差最小。對(duì)未優(yōu)化神經(jīng)網(wǎng)絡(luò)、Pearson優(yōu)化神經(jīng)網(wǎng)絡(luò)、Spearman優(yōu)化神經(jīng)網(wǎng)絡(luò)、MI優(yōu)化神經(jīng)網(wǎng)絡(luò)和MIV優(yōu)化神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的平均相對(duì)誤差進(jìn)行計(jì)算,如表3所示,可以看出五種方法預(yù)測(cè)的平均相對(duì)誤差分別為4.59%、2.07%、1.72%、0.66%和3.87%,這進(jìn)一步證實(shí)了MI優(yōu)化效果最佳。
圖1 不同方法建立神經(jīng)網(wǎng)絡(luò)模型的發(fā)電量預(yù)測(cè)測(cè)試
表3 不同方法建立神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)發(fā)電量的相對(duì)誤差Tab. 3 Relative error of power generation by neural networks with different methods %
從樣本優(yōu)化分析上看,Pearson和Spearman相關(guān)分析主要認(rèn)為鍋爐蒸汽產(chǎn)量、鍋爐主汽壓力、汽輪機(jī)主汽壓力對(duì)發(fā)電量影響較大,即發(fā)電量主要取決于鍋爐參數(shù)和汽輪機(jī)參數(shù);MI分析則認(rèn)為秸稈消耗量、鍋爐蒸汽產(chǎn)量和汽輪機(jī)排氣溫度對(duì)發(fā)電量影響最大,即MI充分考慮到了原料因素、鍋爐因素和汽輪機(jī)因素對(duì)發(fā)電量的影響,這也和實(shí)際情況較為相符,因此MI獲得優(yōu)化效果最佳。相比而言,MIV被認(rèn)為是參數(shù)評(píng)價(jià)的最佳指標(biāo)之一,但其優(yōu)化效果最差,這是因?yàn)楸狙芯恐蠱IV計(jì)算采用的神經(jīng)網(wǎng)絡(luò)選擇了全部參數(shù)作為輸入變量,而實(shí)際上這些參數(shù)存在一定的干擾因素,使得神經(jīng)網(wǎng)絡(luò)建模效果較差。這也證實(shí)神經(jīng)網(wǎng)絡(luò)過(guò)多學(xué)習(xí)干擾信息,會(huì)降低其預(yù)測(cè)準(zhǔn)確度。
基于MI樣本優(yōu)化結(jié)果,重新構(gòu)建并優(yōu)化訓(xùn)練神經(jīng)網(wǎng)絡(luò),探究隱含層節(jié)點(diǎn)數(shù)對(duì)預(yù)測(cè)誤差的影響。隨機(jī)選取25組樣本作為訓(xùn)練樣本,其余10組樣本作為測(cè)試樣本,結(jié)果如圖2所示。
圖2 優(yōu)化樣本的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)
從圖2可以看出,對(duì)神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),即隱含層節(jié)點(diǎn)數(shù)進(jìn)行優(yōu)化設(shè)置,對(duì)神經(jīng)網(wǎng)絡(luò)平均預(yù)測(cè)誤差在5%以內(nèi)波動(dòng)變化,當(dāng)隱含層節(jié)點(diǎn)數(shù)為9時(shí),神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)誤差可以進(jìn)一步降低至為0.50%。
基于上述神經(jīng)網(wǎng)絡(luò),進(jìn)一步對(duì)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)效果進(jìn)行測(cè)試,分別探究秸稈消耗量、蒸汽產(chǎn)量和排氣溫度對(duì)發(fā)電量的影響特性。測(cè)試方法如下:探究秸稈消耗量對(duì)發(fā)電量影響時(shí),控制蒸汽產(chǎn)量和排氣溫度為定值,秸稈消耗量在實(shí)際運(yùn)行的最小值與最大值之間變化,對(duì)發(fā)電量進(jìn)行預(yù)測(cè);其它兩個(gè)參數(shù)也同樣采用相同的測(cè)試方法,測(cè)試結(jié)果如圖3~圖5所示??梢钥闯觯斩捪牧?、蒸汽產(chǎn)量與發(fā)電量基本呈非線性正相關(guān)關(guān)系,排氣溫度與發(fā)電量呈非線性負(fù)相關(guān)關(guān)系,這與電廠實(shí)際運(yùn)行結(jié)果基本一致。
圖3 秸稈消耗量對(duì)發(fā)電量影響的預(yù)測(cè)曲線
對(duì)發(fā)電量預(yù)測(cè)值進(jìn)行曲線擬合,發(fā)現(xiàn)秸稈消耗量和蒸汽產(chǎn)量與發(fā)電量的關(guān)系符合BidoseResp函數(shù)模型,排氣溫度與發(fā)電量的關(guān)系符合指數(shù)下降模型,三者的擬合度均在0.95以上。對(duì)生物質(zhì)直燃發(fā)電過(guò)程分析發(fā)現(xiàn),秸稈消耗量決定了系統(tǒng)的總輸入能量,蒸汽產(chǎn)量反映了系統(tǒng)的有效吸收能量,這兩個(gè)參數(shù)間接反映了生物質(zhì)的燃燒效率和鍋爐效率;而排氣溫度表征了乏汽能量損失,一定可以表征蒸汽輪機(jī)的發(fā)電效率。因此,這三個(gè)因素共同決定了最終的發(fā)電效率。
圖4 蒸汽產(chǎn)量對(duì)發(fā)電量影響的預(yù)測(cè)曲線
圖5 排氣溫度對(duì)發(fā)電量影響的預(yù)測(cè)曲線
本文提出了一種基于互信息參數(shù)優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的生物質(zhì)發(fā)電量預(yù)測(cè)方法。生物質(zhì)直燃發(fā)電量影響因素眾多且關(guān)鍵影響因素尚不清晰,通過(guò)相關(guān)系數(shù)分析、MI分析和MIV分析對(duì)影響因素進(jìn)行優(yōu)選分析發(fā)現(xiàn),雖然不同方法獲得的特征關(guān)鍵參數(shù)均不相同,但基于優(yōu)化樣本建立的神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)誤差均有所降低,其中MI分析優(yōu)化效果最佳,可使神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)相對(duì)誤差從4.59%降至0.66%;通過(guò)進(jìn)一步優(yōu)化神經(jīng)網(wǎng)絡(luò)參數(shù),預(yù)測(cè)相對(duì)誤差可降低至0.50%?;趦?yōu)化神經(jīng)網(wǎng)絡(luò)模型分析了所篩選關(guān)鍵參數(shù)對(duì)發(fā)電量的影響規(guī)律,結(jié)果表明,秸稈消耗量和蒸汽產(chǎn)量與發(fā)電量呈非線性正相關(guān)關(guān)系,排氣溫度與發(fā)電量呈非線性負(fù)相關(guān)關(guān)系,這與實(shí)際發(fā)電結(jié)果一致。