国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于隨機森林的風力發(fā)電預測

2018-12-06 06:17中國礦業(yè)大學吳東劍張龍港朱大君高鵬超
電子世界 2018年22期
關(guān)鍵詞:決策樹風力發(fā)電

中國礦業(yè)大學 吳東劍 張龍港 朱大君 高鵬超

1.背景

隨著科技的進步,社會的發(fā)展,對電力的需求會越來越大,工廠、家庭等方方面面都需要電力的供應(yīng),對電力的需求是一沉不變的么?顯然不是的,像家庭用電,在每天的波動中,晚上是絕對的用電高峰期,而白天和夜里則相對較少。如果按照每月負荷來考慮,某些地方在夏天會達到用電高峰期,但是在另一些地方,冬天所帶來的燈具照明時間的增加,會使用電量高于夏天的用電量。工廠用電則與家庭用電完全不同。根據(jù)實際工廠的生產(chǎn)制度不同,三班倒、二班倒和全天不停工生產(chǎn)的日負荷波動是不相同的。同樣的,月負荷會根據(jù)生產(chǎn)不同的產(chǎn)品、不同的經(jīng)營策略都有所不同。既然所需要的電力供應(yīng)在不同的時間段是不同的,那么我們就需要對電網(wǎng)內(nèi)所提供的電力供應(yīng)進行調(diào)整,使其滿足實時電力需求。火力發(fā)電作為現(xiàn)階段我國的主要供電手段,其發(fā)電量無法快速根據(jù)需求進行調(diào)整。因此,調(diào)節(jié)的重任就落在了可再生能源的頭上,可再生能源又叫做清潔能源,主要生產(chǎn)是靠著風機(風能)、和輪機(水電站)來實現(xiàn)的。

2.國內(nèi)外現(xiàn)狀

2015 年上半年能源局統(tǒng)計數(shù)據(jù):2015 年上半年風力發(fā)電后無用電量為 175 億千瓦時,電能無用率為15.2%,其中甘肅(無用電量為 31億千瓦時、電能無用率達到 31%)、新疆(無用電量達到了29.7 億千瓦時、電能無用率為 28.82%)、蒙西(無用電量 33 億千瓦時、電能無用率 20%)、吉林(無用電量 22.9億千瓦時、電能無用率 43%)等地區(qū)。因此需要一種切實有效的方法來防止可再生能源發(fā)電的浪費,實現(xiàn)與電力需求的匹配。

在國外也是相同的情況,早在19世紀末,丹麥人就首先研制了風力發(fā)電機。而在1891年,丹麥就建成了世界第一座風力發(fā)電站?,F(xiàn)在丹麥已擁有風力發(fā)電機3000多座,年發(fā)電100億度。但是風力發(fā)電量與負荷量不匹配問題依然大量存在。

發(fā)電量大帶來的不僅僅是能源充足,更多的是機械損耗和浪費能源地區(qū)不匹配帶來的能源浪費。中國棄風率最大的吉林省,半年棄風達22.9億千瓦時,這些能源如果輸送到電力缺乏的地區(qū)將帶來巨大的收益。同時,生產(chǎn)這些電力所造成的風機老化、磨損導致的經(jīng)濟損失,我們不能忽略不計。因此,必須使用一種方法來預測接下來的地區(qū)負荷情況,若負荷降低。在基礎(chǔ)發(fā)電(火力發(fā)電)基本不變的情況下,使可再生能源(風能,海洋能)發(fā)電設(shè)備停運,這可以降低設(shè)備運轉(zhuǎn)所產(chǎn)生的磨損,減少維護費用,同時減少能源浪費。當負荷過大,或者與本地區(qū)的電網(wǎng)相連的其他區(qū)域發(fā)生電力供應(yīng)不足的情況下,我們可以使更多的可再生能源發(fā)電設(shè)備運行,甚至滿負荷運行,在電力系統(tǒng)能承受的負荷下,最大程度的滿足地區(qū)電力需要和實現(xiàn)電力的區(qū)域性匹配。

3.方法介紹

我們所采用的方法就是負荷預測。負荷預測是根據(jù)系統(tǒng)的運行方式、決策方式、本身條件與對社會的影響等諸多因數(shù),在滿足一定精度要求的條件下,確定未來某特定時刻的負荷數(shù)據(jù),其中負荷是指電力需求量或用電量。由于電力負荷是一個非周期,規(guī)律不明顯的變化數(shù)值,因此,傳統(tǒng)的預測方法對負荷預測效果不佳。目前短期負荷預測理論已趨于成熟,可分為經(jīng)典預測方法、傳統(tǒng)預測方法與智能預測方法三類。傳統(tǒng)預測方法對于波動性大,規(guī)律不明顯干擾大的地區(qū)不適用。但其結(jié)構(gòu)原理簡單,易于實現(xiàn)。在智能預測方法里,人工神經(jīng)網(wǎng)絡(luò)算得上是一大熱門,它具有很強的自主學習能力,能模仿人的思考方式,對于非結(jié)構(gòu)、非精確性具有極強的適應(yīng)能力,能夠擬合非線性曲線,得出接近于實際情況的模型結(jié)構(gòu)。但是基礎(chǔ)的數(shù)學模型依賴于主觀經(jīng)驗,泛化誤差大,由于它需要不斷的學習,它的收斂速度很慢,要達到實際可用的狀態(tài)需要進行大量的計算和學習。

本文將基于隨機森林回歸算法對某個區(qū)域的負荷進行預測,從而對可再生能源的出力情況給出建議。隨機森林回歸算法具有精度高、收斂速度快、調(diào)節(jié)參數(shù)少和不會產(chǎn)生過度擬合的問題。最后實驗結(jié)果表明,該方法可有效的預測地區(qū)負荷波動情況,準確度較高。

4.風力發(fā)電

為什么要集中對風力發(fā)電進行預測。眾所周知,風電作為清潔能源中最大的出力部分,在電網(wǎng)供電系統(tǒng)中具有重要作用。風力發(fā)電有他獨特的有利因素:首先是政策支持,我國現(xiàn)如今需要將傳統(tǒng)的火力發(fā)電等污染型發(fā)電方式轉(zhuǎn)換為清潔的發(fā)電方式,風力發(fā)電是最成熟、可靠的一種,國家會對風力發(fā)電進行大量扶持和幫助,在未來風力發(fā)電裝機容量會大幅度上升。其次是發(fā)展?jié)摿Υ?,風在自然界中廣泛存在,不會消失和停止,經(jīng)過建造的風力發(fā)電設(shè)施可以出力很長時間,實際的產(chǎn)生價值遠大于本身建造成本。最后就是互聯(lián)網(wǎng)+,隨著科技和社會的發(fā)展,通過網(wǎng)絡(luò)實現(xiàn)對設(shè)備的控制變得越來越流行,由于風力發(fā)電常常位于偏遠或者人煙稀少的地區(qū),以往對于發(fā)電機組的控制是很復雜的,從最近互聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展以來,對風力發(fā)電的控制變得很容易和精確。如果電力供應(yīng)不足,可以使更多的風機轉(zhuǎn)動,當供應(yīng)富余時,可以使部分風機停止轉(zhuǎn)動,減少發(fā)電量同時減少機械磨損。要想實現(xiàn)精準、可靠、高效的發(fā)電-用電匹配,就要進行負荷的預測。

5.決策樹,隨機森林原理

隨機森林算法是Leo Breiman結(jié)合bagging集成學習和隨機屬性子空間理論提出的監(jiān)督學習算法。算法通過bootsrap重采樣方法對原始樣本進行采樣,每個樣本大小與原始樣本相同;為每個bootsrap樣本建立CATR決策樹模型;最后,將多個CATR決策樹組合為隨機森林,森林中每個決策樹的投票結(jié)果是最終的預測結(jié)果。

5.1 CATR決策樹

1970年末到1980年初,Quinlan提出了ID3決策樹算法,后來改進了ID3決策樹算法,提出了C4.5決策樹算法。1984年,Breiman和其他統(tǒng)計學家提出了CATR決策樹算法。CATR是一種二元遞歸分割技術(shù),每個非葉節(jié)點被劃分為兩個葉節(jié)點。三種算法都使用自頂向下的貪心方法來構(gòu)造決策樹,但不同的是屬性選擇度量。在每個決策樹的生長過程中,選擇某一屬性作為分裂節(jié)點,根據(jù)屬性選擇度量選擇最優(yōu)屬性,這就決定了節(jié)點屬性分裂的條件。其中,ID3決策樹算法采用信息增益作為屬性選擇度量,C4.5決策樹算法選擇增益率作為屬性選擇度量,CATR決策樹算法使用gini index作為屬性選擇度量,CATR決策樹算法使用gini index作為屬性選擇度量。采用最小二乘偏差作為回歸樹的屬性度量。

5.2 隨機森林算法

隨機森林回歸是由很多回歸決策樹模型組成的組合分類模型,且參數(shù)集是獨立同分布的隨機向量,在給定自變量 X 下,每個決策樹回歸模型都會有一個預測結(jié)果。它的基本思想與流程如圖1所示:

圖1

首先,利用 Bootstrap 抽樣從原始訓練集抽取 k 個樣本,這 k 個樣本的樣本容量都與原始訓練集一樣,如上圖1所示。然后,對這些樣本分別建立 k 個決策樹模型,得到 k 個回歸結(jié)果;最后,對這 k 個結(jié)果取均值,得到最終預測結(jié)果,具體的結(jié)構(gòu)圖如圖2所示:

圖2

隨機森林算法的基本數(shù)學流程如下:

(1)首先利用bootstrap 重抽樣的方法采取訓練集并隨機產(chǎn)生k 個訓練集θ1,θ2,…,θk這每個訓練集可以生成對應(yīng)的決策樹也即是隨機森林中樹的個數(shù)。

(2)已知樣本的維數(shù)為M,在節(jié)點分裂的過程中,就從M 維特征中隨機抽取 m 個特征作為此節(jié)點的分裂特征集,m 值根據(jù)樣本量的大小設(shè)定,在不進行其他改進方法下,一般 m 的值在整個隨機森林形成過程中維持不變,在 R 語言中的 Random forest 包中就是M 的大小確定。

(3)對每個決策樹都不進行剪枝處理,使其得到最大程度的生長。

(4)當有一個新的數(shù)據(jù)X=x,單棵決策樹T()的預測可以通過葉節(jié)點的觀測值取平均獲得。假如一個觀測值Xi屬于葉節(jié)點且不為0,則權(quán)重向量為:

(5)在給定自變量 X=x下,單棵決策樹的預測值就通過因變量預測值加權(quán)平均得到。單棵決策樹的預測值由下式得到:

因此,在給定X=x的條件下,所有因變量觀測值的加權(quán)和就是所得的預測均值。權(quán)重隨自變量X=x的變化而變化,且當給定下 Y的條件分布與X=x下Y的條件分布越相似,其權(quán)重越大。

6.在隨機森林回歸算法上進行短期負荷預測實際應(yīng)用分析

在電力系統(tǒng)中,進行負荷預測時,我們主要是根據(jù)已經(jīng)有的一些數(shù)據(jù),去建立相應(yīng)的模型,進而對負荷進行預測,從而進一步描述其發(fā)展規(guī)律。作為現(xiàn)代社會中的一種新型算法,隨機森林回歸算法在于支持向量機等算法在各方面進行比較時,對于不同的研究者來說,每個人的觀點都是不一樣的,一般在用這兩種算法進行負荷預測時,主要是從精度與性能兩方面進行比較。從算法的性質(zhì)上來說,這兩種算法都是智能的,所以,在對二者的結(jié)果進行分析時,除了對應(yīng)選擇的特征量不同進行比較是,還應(yīng)對所選取的樣本量大小進行一定的分析,較大或較小時,對預測的準確程度進行分析。在本篇文章中,所用數(shù)據(jù)為2016年1月到2017年12月的樣本集。

本篇文章中,所用的數(shù)據(jù)全部來源于山東省某地區(qū)所提供的電力負荷信息,電力負荷數(shù)據(jù)包括發(fā)電類型,同時還有每個月的具體發(fā)電量,以及各種不同的負荷的用電比例。

6.1 負荷預測結(jié)果的評估標準

(1)平均絕對誤差

回歸預測所預測的是負荷的具體值,當我們對一個模型的效果進行評估時,一般來說,我們常常通過與實際值之間的差值來評判好壞。在預測類的文章中,常用平均絕對誤差(MAPE)進行分析與評估。平均絕對誤差是所有單個觀測值與算術(shù)平均值的偏差的絕對值的平均。與平均誤差相比,平均絕對誤差由于離差被絕對值化,不會出現(xiàn)正負相抵消的情況,因而,平均絕對誤差能更好地反映預測值誤差的實際情況。

在對具體的模型進行分析時,平均絕對誤差越小,說明我們所使用的算法及模型的準確率越高,預測的結(jié)果也就越好。其中:Ri是實際的負荷值,Xi是利用模型得到的預測值,n是預測的數(shù)量。

(2)單個變量分析

在本篇文章中,對單個變量進行分析,來判定在單個變量的情況下,預測效果的不同,根據(jù)p的值,其實并不能說明預測結(jié)果究竟是怎樣的, 只是可以從統(tǒng)計學的角度上來說明結(jié)果差距的大小。

P值的大小對于二者之間的預測差異率有著很大的指導意義,一般來說,P 值越大,說明存在的差異就越小,相反的,P值越小,差異越大。而當P小于某一個確定值時,二者間就可以看成是完全不同的,這個值一般取0.05。

6.2 實際數(shù)據(jù)分析

從前文中,通過對變量以及一些相關(guān)性的分析,我們可以得到,對于電力負荷來講,很多因素對于負荷的預測都有著很大的影響,最典型的就是溫度、濕度以及季節(jié)的不同。本部分將在這些因素的基礎(chǔ)上,進行電力負荷的預測,另外處于嚴謹以及全面性的考慮,我們選取的數(shù)據(jù)橫跨四個季節(jié)兩年,基本上可以滿足預測的要求。

在進行預測時,我們根據(jù)隨機森林回歸算法進行了模型的建立,并且進行了仿真程序的編寫,并在調(diào)試后進行檢驗,在誤差允許的范圍內(nèi),我們發(fā)現(xiàn),該仿真程序基本可以正常預測電力負荷,具體程序如下:

在將我們所取得的兩年的真實數(shù)據(jù)代入到程序中進行運行以后,我們變可以得到具體的預測結(jié)果。如圖3所示:

圖3

對預測所得圖形進行分析,我們可以得出,樣本中采集了24個月的風力發(fā)電數(shù)據(jù),并且數(shù)據(jù)分為訓練集和測試集,比例為0.7:0.3。建立回歸隨機森林模型后,通過上圖我們可以發(fā)現(xiàn),樹木數(shù)量對于隨機訓練結(jié)果存在影響,隨著樹木數(shù)量增加,正確率有所上升,但是當樹木數(shù)量超過40時,正確率就基本保持不變了。并且通過最終的分析計算,我們可以得出該模型用于預測本文中的電力負荷時,回歸正確率為0.81。

7.綜述

由上述分析可以得知,采用隨機森林的預測模型可以對某地區(qū)短期負荷進行比較準確和有效的預測,得出的結(jié)果可以幫助當?shù)毓╇娬緦︼L力發(fā)電機組的運行狀態(tài)進行調(diào)整,以便于實現(xiàn)更精確的電力供需匹配和降低機械損耗。

猜你喜歡
決策樹風力發(fā)電
“發(fā)電”
海上漂浮式風力發(fā)電機關(guān)鍵技術(shù)研究
檸檬亦能發(fā)電?
一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
決策樹和隨機森林方法在管理決策中的應(yīng)用
搖晃發(fā)電小圓球
摩擦發(fā)電
大型風力發(fā)電設(shè)備潤滑概要
基于決策樹的出租車乘客出行目的識別
基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
枣庄市| 三河市| 双流县| 阿坝县| 阜南县| 准格尔旗| 南木林县| 东安县| 玛纳斯县| 常熟市| 独山县| 本溪市| 乐陵市| 柳州市| 乌鲁木齐县| 虞城县| 东明县| 华安县| 浦东新区| 铜山县| 榆社县| 阳原县| 拜城县| 水城县| 余庆县| 章丘市| 寻甸| 大余县| 安塞县| 普格县| 和龙市| 砚山县| 鞍山市| 宜城市| 安塞县| 西藏| 新民市| 吕梁市| 江山市| 吉安市| 庆元县|