蔡佳成 徐佳寧
摘 要 隨著經濟和信息技術的飛速發(fā)展,海量數據已經成為當今信息社會的一個重要的特點。本文提出了將海量數據應用于電廠運行參數分析當中,再基于隨機森林算法對燃機電廠天然氣用量預測的一種新思路,并對其實際意義進行了有效的分析。
關鍵詞 天然氣;隨機森林算法;預測;燃料
引言
隨著21世紀信息時代的到來,各種類型的數據信息也跟著飛速增長,而如何對這些海量數據加以利用便成了隨之而來的問題。越來越多的領域研究利用這些數據進行分析、預測以此來跟上時代發(fā)展的腳步。例如,工業(yè)、管理機構、企業(yè)、研究單位等眾多領域都產生并積累了眾多的、各種形式的信息數據。根據相關部門的統(tǒng)計,2015年大量的數據增長量將給IT領域在全球帶來670億美元的支出額,并且預測在這些數據增長量全球的總支出將達到2320億美元截止到2016年[1]。本文提出了將海量數據應用于電廠運行參數分析當中,再基于隨機森林算法對燃機電廠天然氣用量預測的一種新思路。
1 隨機森林算法概念及其基本原理
隨機森林算法(Random Forest)是常用集成學習算法中的一種,2001年統(tǒng)計學領域的專家Leo Breiman提出了隨機森林算法的概念。隨機森林算法是由多棵分類回歸樹所構成,且樹與樹之間保持互相獨立的狀態(tài),隨機森林算法特點是引入了兩個隨機變量,分別為隨機向量和隨機選取數據樣本集,由此來提高預測的準確度。與決策樹算法相比,隨機森林算法由于隨機變量的引入使其具有較強的泛化能力,這也證明了隨機理論在回歸預測當中的成功性。由于隨機森林算法具備高效、多分類和對噪聲不敏感等很多優(yōu)點,近年來,不同的領域都廣泛研究隨機森林算法并對其應用。
隨機森林算法中涉及的相關量定義:
泛化誤差:經過對樣本集合的訓練學習之后模型測試數據集合當中的表現,即模型的學習能力或模型對測試集合的預測能力。泛化性能越好則泛化誤差越小反之則表示模型的泛化性能較差。
值越小則表示隨機森林的強度越大其隨機森林中樹的獨立性越好,說明了該模型具有比較好的分類回歸性能。這也再一次表明了模型的強度和相關性對模型效果的重要性。具有良好性能的模型同時也能夠表明隨機森林中的單個樹具有不錯的分類回歸效果,即預測輸出的精度高。但是當樣本集合不具備多樣性時,既是隨機森林中的成員樹再多也無法改善模型的性能效果。假設隨機森林中的成員樹的輸出結果全部一致,這時再對成員樹的輸出結果進行集成就顯得沒有作用了,隨機森林的預測輸出不會得到改善。因此只有具有較小的值,才能夠得到理想的模型效果。由此看來,這個比率因素也是影響模型的重要因素之一。一方面,考慮如何對成員樹集合才能使隨機森林的輸出效果更好;另一方面討論模型本身如何可以根據數據特征具備較好效果的分類輸出。
2 隨機森林算法在燃機電廠中應用的意義
中國天然氣工業(yè)在改善我國能源結構、大力推動低碳經濟發(fā)展過程中獲得了前所未有的大發(fā)展。我國天然氣資源豐富,目前已建成了鄂爾多斯、新疆兩大油氣區(qū)和四川、南海西部兩大氣區(qū),天然氣骨干管網逐步形成,天然氣市場不斷拓展,天然氣工業(yè)體系初步形成。我國天然氣資源分布具有明顯的不均衡性,剩余資源量主要分布在巖性地層、前陸盆地沖斷帶、疊合盆地深層、成熟探區(qū)深層以及海洋等領域[2]。燃機電廠就是使用燃氣輪機發(fā)電機組的發(fā)電廠。目前根據國家環(huán)境要求,以煤炭為主要燃料的燃煤電廠逐步會被清潔能源所取替,而目前的清潔能源電廠主要包括天然氣、核能、風能、太陽能、潮汐能等。目前這些清潔能源電廠中則以燃機電廠為主要發(fā)電力量。所以天然氣在電廠方面的消耗量較大,這也是由于我國的人口數量較大,用電量需求量大所導致的。而如今的燃機電廠也已經實現了數據信息化,每個影響到運行參數的環(huán)節(jié)都有可能對其節(jié)能效果造成影響,由此可見火電廠存在著巨大的節(jié)能潛力。尤其在天然氣使用量方面存在著很大的節(jié)約空間,電廠中的燃料量直接影響著機組的發(fā)電效率和整體發(fā)電的經濟性。而天然氣的消耗量存在著眾多的影響因素,包括汽輪機熱效率、廠用電率、外界環(huán)境、操作人員水平等多方面原因。由于電廠內多項運行參數的改變會影響發(fā)電效率、廠用電率等方面發(fā)生改變,從而導天然氣消耗量發(fā)生變動;同樣由于外界環(huán)境的變化和操作水平也會對煤耗量造成不小的影響,因此我們現在可以利用眾多的歷史運行參數結合隨機森林算法著重對天然氣的消耗量、機組負荷等參數進行預測,從而根據預測輸出可以對操作人員的水平進行有效的評估,并對操作人員形成一定的指導作用,以達到節(jié)約天然氣消耗量,提高發(fā)電效率的目的。
3 結束語
目前國內的發(fā)電廠仍以煤炭發(fā)電為主,其主要原因還是由于燃煤電廠發(fā)電成本低廉所造成的。但是,根據環(huán)境要求和能源行業(yè)的發(fā)展趨勢,煤炭發(fā)電遲早會被清潔能源發(fā)電取代。天然氣發(fā)電廠具有熱效率高、調峰速度快、占地面積小等優(yōu)點,但其仍然受制于發(fā)電成本高的制約,所以節(jié)約發(fā)電成本,提高發(fā)電效率對加快燃機等清潔能源電廠的建設有著重要的理論意義和實際意義?;诒姸嗟倪\行數據應用于隨機森林算法當中,對燃機電廠中的天然氣用量等重要參數進行預測,以此對操作人員形成一定的運行指導,以達到節(jié)約天然氣消耗量,提高發(fā)電效率的目的,對加快燃機電廠的發(fā)展有著尤為重要的意義。
參考文獻
[1] 劉小剛.國外大數據產業(yè)的發(fā)展及啟示[J]. 金融經濟,2013,(18):224-226.
[2] 喻思成.大數據需要全面、集成、開放的解決方案[J].軟件和信息服務,2013,(06):9.
作者簡介
蔡佳成(1990-),男,廣東珠海人;畢業(yè)院校:東北電力大學,專業(yè):控制工程,學歷:研究生,熱控點檢員,現就職單位:廣東粵電新會發(fā)電有限公司,研究方向:電廠應用。