楊瀚欽,申曉留,王默玉,喬 鑫,劉瑞雪,孫楊博
(華北電力大學(xué) 控制與計算機工程學(xué)院, 北京102206)
基于大數(shù)據(jù)的火電廠能耗評估模型的研究
楊瀚欽,申曉留,王默玉,喬 鑫,劉瑞雪,孫楊博
(華北電力大學(xué) 控制與計算機工程學(xué)院, 北京102206)
為了順利開展節(jié)能降耗工作,火電廠需要準(zhǔn)確評估自身能耗指標(biāo)?,F(xiàn)階段能耗指標(biāo)評估主要使用傳統(tǒng)數(shù)理統(tǒng)計方法,這些方法難以挖掘數(shù)據(jù)深層次的信息。使用大數(shù)據(jù)分析方法中的多元線性回歸方法,得出了一套煤耗指標(biāo)評估模型,對某電廠600 MW發(fā)電機組實際運行數(shù)據(jù)進行了大數(shù)據(jù)分析,解決了傳統(tǒng)能耗指標(biāo)評估方法的缺陷。使用殘差分析法對模型準(zhǔn)確性進行了驗證,得出了模型滿足實際需要的結(jié)論。
大數(shù)據(jù);多元線性回歸;能耗評估;SPSS
現(xiàn)階段能耗評估主要運用數(shù)學(xué)模型對數(shù)據(jù)進行復(fù)雜運算,得出結(jié)果對數(shù)據(jù)進行評價;或者對數(shù)據(jù)進行比較,通過比較結(jié)果評價數(shù)據(jù)。使用的分析方法包括:指標(biāo)權(quán)重法和密切值法[3];層次-灰色關(guān)聯(lián)度分析理論[4];多級模糊綜合評價方法等[5]。
傳統(tǒng)的數(shù)據(jù)分析方法在處理大量數(shù)據(jù)時具有局限性:數(shù)據(jù)缺乏可比性,不同工作狀況下的數(shù)據(jù)進行直接比較意義不大;數(shù)據(jù)之間關(guān)聯(lián)性考慮不全,難以對數(shù)據(jù)進行深層次的挖掘。運用大數(shù)據(jù)分析方法可以有效解決這些問題。
本文使用SPSS軟件,采用多元線性回歸方法,對某火電廠600 MW機組測點數(shù)據(jù)進行數(shù)據(jù)挖掘。得出了發(fā)電機輸出功率、燃煤熱值、環(huán)境溫度3個影響因子與煤耗指標(biāo)之間的關(guān)聯(lián)關(guān)系。使用殘差分析法對模型進行了評價。
本文使用“影響因子”代表抽象的影響因素。機組正常運行時,影響因子與能耗指標(biāo)的比例關(guān)系總是在一個值上下浮動。在找到這一關(guān)聯(lián)關(guān)系的基礎(chǔ)上,可計算出一組給定影響因子對應(yīng)的最低能耗指標(biāo)。最低能耗可以作為評估機組節(jié)能潛力的標(biāo)準(zhǔn)。
多元線性回歸能有效地挖掘多個自變量與單個因變量之間的聯(lián)系,并考慮到了幾乎所有的歷史數(shù)據(jù)。使用多元線性回歸方法挖掘數(shù)據(jù)間關(guān)聯(lián)關(guān)系,能夠獲得比使用傳統(tǒng)的數(shù)據(jù)對比方法更好的結(jié)果。常采用的曲線擬合方法是最小二乘法[6-8],常使用的軟件是SPSS和MATLAB[9-10]。
模型的建立方法分為4個步驟:數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、模型學(xué)習(xí)、輸出結(jié)果。將這4個步驟總結(jié)可得出如圖1所示的流程圖。
圖1 煤耗理論值計算模型流程圖
2.1 數(shù)據(jù)預(yù)處理
2.3 社會因素 涇河川道是彬州梨原主產(chǎn)區(qū),但近年來隨著城鎮(zhèn)開發(fā)、交通路網(wǎng)建設(shè)及產(chǎn)業(yè)結(jié)構(gòu)調(diào)整,梨園面積不斷縮減,從東邊新民鎮(zhèn)早飯頭村至西邊涇河西區(qū)大佛寺村,沿涇河川道梨園已難得一見。煤礦周邊群眾多選擇進礦務(wù)工,收入相當(dāng)可觀,遂逐漸放棄梨園管理。還有一些鎮(zhèn)為增加群眾收入,推廣坡臺地中藥材種植,收益近2 000元/畝,且管理、采收方便,相比之下梨園生產(chǎn)費時費工,效益還低,群眾自然不愿栽梨。
為了得到準(zhǔn)確結(jié)果,需要對原始數(shù)據(jù)進行處理。本文進行的數(shù)據(jù)預(yù)處理工作包括:去除空數(shù)據(jù)、數(shù)據(jù)對齊。
電廠機組在運行時會出現(xiàn)停機、檢修等狀態(tài),而機組處于這些狀態(tài)時設(shè)備測點不會對機組運行數(shù)據(jù)進行采集,轉(zhuǎn)而生成空數(shù)據(jù)。這些空數(shù)據(jù)會使模型分析產(chǎn)生偏差,需要去除這些空數(shù)據(jù)。
不同數(shù)據(jù)由不同測點進行采集,不可能在同一時刻進行采集,需要進行對齊處理。時刻對齊是指將采集時刻最靠近的數(shù)據(jù)條目看作是同一時刻產(chǎn)生的數(shù)據(jù),并將其合并為一條數(shù)據(jù)[11]。不同測點數(shù)據(jù)采集時間間隔不同。本文采用1 h作為標(biāo)準(zhǔn)的時間間隔。對數(shù)據(jù)采集時間間隔小于1 h的數(shù)據(jù)點進行合并;對于數(shù)據(jù)采集時間大于1 h的數(shù)據(jù)點進行拆分。
2.2 建立模型
本文選用的影響因子為:發(fā)電機出力、燃煤熱值、環(huán)境溫度;被評估的能耗指標(biāo)為:煤耗指標(biāo)。使用SPSS軟件進行多元線性回歸,將2015—2016年間的機組運行數(shù)據(jù)作為輸入進行分析。總數(shù)據(jù)條目數(shù)為4 847條,得出的結(jié)果為:
y=-0.008 8x1+0.515x2-0.001x3
式中:y表示煤耗;x1表示發(fā)電機出力;x2表示環(huán)境溫度;x3表示燃煤熱值。
2.3 結(jié)果運用與展示
固定了3個影響因子中的任意2個之后,可以找到第3個影響因子對煤耗指標(biāo)的影響程度。利用這一模型建立如圖2所示的分析系統(tǒng)。圖中環(huán)境溫度增量為20 ℃,出力增量為500 MW時,煤耗增量為-33.9 g/kW·h。
圖2 煤耗因子靈敏度分析系統(tǒng)
3.1 模型自身評價
根據(jù)模型分析結(jié)果,對模型預(yù)測值與實際值的偏差進行計算,計算出R、R平方、調(diào)整后R平方、標(biāo)準(zhǔn)偏斜度錯誤,結(jié)果如表1。
R表示復(fù)相關(guān)系數(shù),R越大,線性關(guān)系越密切。表1顯示R=0.743,可認(rèn)為環(huán)境溫度、發(fā)電機出力、燃煤熱值這3個量與煤耗指標(biāo)的關(guān)系較為密切。
表1 模型預(yù)測值與實際值偏差
表2展示了模型的系數(shù)及顯著性檢驗結(jié)果,可以發(fā)現(xiàn)各個系數(shù)(常數(shù)、出力的系數(shù)、環(huán)境溫度的系數(shù)、燃煤熱值的系數(shù))的顯著性都為0,明顯低于0.05??烧J(rèn)為模型系數(shù)與樣本之間的差異為純機會變異;之前的假設(shè)與真實情況是一致的。
表2 模型系數(shù)
表3展示了模型的殘差估計結(jié)果:在4 395個正誤差之中,最大值是45.923,中位數(shù)是7.024,說明大部分正誤差維持在一個比較小的水平。正誤差的方差為5.33,為一個較小的值。結(jié)合平均值、中位數(shù)以及方差可以認(rèn)為正誤差較小,模型精度較大,同理可以分析負(fù)誤差,可以得到負(fù)誤差較小,模型精度較大??紤]絕對誤差,發(fā)現(xiàn)與正負(fù)誤差比較,其中位數(shù)無太大變化。
模型標(biāo)準(zhǔn)差較小,說明了模型正負(fù)離散程度較小,模型得出的數(shù)據(jù)較為穩(wěn)定。
這一結(jié)果證明了整個模型的殘差整體集中在較小的一個區(qū)間內(nèi),多元線性擬合結(jié)果較符合實際情況。
表3 殘差估計結(jié)果
3.2 模型與預(yù)處理前數(shù)據(jù)分析結(jié)果比較
將預(yù)處理前的數(shù)據(jù)作為對照組。使用SPSS分析預(yù)處理前的數(shù)據(jù),得到如表4所示的模型摘要。將表4與表1對比可以發(fā)現(xiàn),不經(jīng)過預(yù)處理,R值更大,煤耗指標(biāo)與影響因子之間的線性回歸關(guān)系密切程度較大。標(biāo)準(zhǔn)偏斜度錯誤達(dá)到了60以上,這說明未經(jīng)過預(yù)處理,線性回歸得出的模型誤差更大,預(yù)處理之后線性回歸得到的模型更加精確。
表4 預(yù)處理前分析結(jié)果偏差
對預(yù)處理前的數(shù)據(jù)回歸得到的模型進行殘差分析,可以得到如表5的分析結(jié)果。由表5可以得出:未經(jīng)過預(yù)處理的數(shù)據(jù)回歸得出的模型殘差很大,其中位數(shù)大于平均值,即超過一半的由模型計算出的煤耗指標(biāo)評估標(biāo)準(zhǔn)與煤耗指標(biāo)實際值偏差過大。對于電廠實際數(shù)據(jù),這種情況不可能出現(xiàn),即未經(jīng)過預(yù)處理的數(shù)據(jù)回歸得到的模型不能運用到生產(chǎn)實際中。
表5 預(yù)處理前分析結(jié)果殘差估計
3.3 分析結(jié)果與傳統(tǒng)分析方法對比
火電廠在進行數(shù)據(jù)分析時,采用傳統(tǒng)的同比、環(huán)比等數(shù)據(jù)分析方法將不同時間段的能耗變化趨勢進行對比,分析結(jié)果如圖3所示。圖3展示了12月份煤耗指標(biāo)變化趨勢的環(huán)比分析結(jié)果,可以發(fā)現(xiàn)2015年的變化趨勢與2014年的變化趨勢相似。但這種分析方案缺少一個標(biāo)準(zhǔn)值對數(shù)據(jù)進行評估,無法判斷這2個煤耗變化趨勢哪一個比較正常。本文采用的大數(shù)據(jù)分析方法計算出了某一工作狀況下的標(biāo)準(zhǔn)煤耗指標(biāo),這一指標(biāo)可以用于評估這一工況下實際煤耗指標(biāo)是否正常,解決了傳統(tǒng)數(shù)據(jù)分析方法的缺陷。
圖3 煤耗年環(huán)比分析示意圖
火電廠能耗評估模型全面地考慮了環(huán)境溫度、燃煤熱值、發(fā)電機出力等影響能耗指標(biāo)的多個影響因子??朔送群铜h(huán)比分析方法的缺陷,有助于火電廠更加全面、細(xì)致地了解自身節(jié)能降耗措施的不足,為實施節(jié)能改造指明了方向。
[1]劉建華.多變煤質(zhì)條件下火電廠負(fù)荷優(yōu)化分配方法研究[D].保定: 華北電力大學(xué), 2011.
[2]荊百林,李明,李敏. 火電廠能耗評估方法的應(yīng)用[J]. 電力設(shè)備,2008,9(3):31-33.
[3]李娜,王蕾,劉宏志,等. 基于均方根—密切值的火電廠節(jié)能降耗潛力評價研究[J]. 華東電力,2012,40(8):1296-1298.
[4]劉劍. 燃煤機組濕法脫硫系統(tǒng)能效評估方法研究[J]. 電氣應(yīng)用,2013,(S2):91-94.
[5]王志勇,邱澤晶,王振宇,等. 高耗能企業(yè)能效水平的多級模糊綜合評估方法[J]. 冶金能源,2013,32(6):12-16.
[6]緱新科,崔樂樂,巨圓圓,等. 火電廠機組煤耗特性曲線擬合算法研究[J]. 電力系統(tǒng)保護與控制,2014,42(10):84-89.
[7]陳嵐峰,楊靜瑜,崔崧,等. 基于MATLAB的最小二乘曲線擬合仿真研究[J]. 沈陽師范大學(xué)學(xué)報(自然科學(xué)版),2014,32(1):75-79.
[8]李蓓蕾. 多次自適應(yīng)最小二乘曲線擬合方法及其應(yīng)用[D].荊州:長江大學(xué),2014.
[9]史春薇,田強,葛騫,等. 基于SPSS統(tǒng)計軟件在多元線性回歸校驗數(shù)據(jù)中的應(yīng)用[J]. 當(dāng)代化工,2014,43(6):1112-1113.
[10]錢寧波,李寒旭,劉銘,等. 基于MATLAB的煤炭成漿濃度的多元線性回歸研究[J]. 煤炭技術(shù),2015,34(5):322-323.
[11]董林. 時空關(guān)聯(lián)規(guī)則挖掘研究[D].武漢:武漢大學(xué),2014.
Research on Energy Consumption Evaluation Model of Thermal Power Plant Based on Large Data
YANG Hanqin, SHEN Xiaoliu, WANG Moyu, QIAO Xin, LIU Ruixue, SUN Yangbo
(School of Control and Computer Engineering, North China Electric Power University, Beijing 102206, China)
In order to carry out energy saving and consumption reduction, the thermal power plant needs to accurately assess its energy consumption index. The method of mathematical statistics is the most commonly used traditional evaluation of energy consumption indicators, but it cannot dig out the deep layers of information. Big data analysis method in the multivariate linear regression method is used in this paper to analyse the actual operation data of generating set. This paper puts forward a set of evaluation model of coal consumption, solves the defects of the traditional energy consumption index evaluation method. The model was evaluated by the method of residual error analysis, and the conclusion that the model can meet the requirements of the actual production was made.
big data; multiple linear regression; energy consumption evaluation; SPSS
2016-08-10。
國家自然科學(xué)基金(71071053);北京市自然科學(xué)基金(9122021)。
楊瀚欽(1992-),男,碩士研究生,研究方向為計算機應(yīng)用技術(shù),E-mail:yanghanqinyhq@163.com。
TP391
A
10.3969/j.issn.1672-0792.2016.12.001