国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于聚類(lèi)和隨機(jī)森林回歸的超大型建筑能耗負(fù)荷預(yù)測(cè)模型研究

2022-10-18 03:35葉從周,肖朋林,秦俊
綠色建筑 2022年5期
關(guān)鍵詞:決策樹(shù)能耗聚類(lèi)

我國(guó)隨著節(jié)能減排工作的推進(jìn),碳達(dá)峰和碳中和概念的提出,對(duì)公共建筑能耗約束和能效等級(jí)提出了更高的要求,低碳城區(qū)與綠色建筑的建設(shè)進(jìn)程將以更快的速度推進(jìn)。超高層超大型建筑是城市能耗大戶(hù),為了實(shí)現(xiàn)低碳目標(biāo),在其建設(shè)與運(yùn)行過(guò)程中,將會(huì)使用更多類(lèi)型的分布式能源,這使得多種能源的調(diào)度與控制,尤其是對(duì)于空調(diào)的控制,將成為一大難題。

根據(jù)《2020 年上海市國(guó)家機(jī)關(guān)辦公建筑和大型公共建筑能耗監(jiān)測(cè)及分析報(bào)告》,主要類(lèi)型建筑 2020 年分項(xiàng)用電占比來(lái)看,照明與插座用電、空調(diào)用電為主要用電分項(xiàng),各類(lèi)型建筑這兩項(xiàng)之和均超過(guò) 70%。在超高層超大型建筑中,空調(diào)用電也是主要耗能之一。所以通過(guò)預(yù)測(cè)供暖空調(diào)負(fù)荷,指導(dǎo)冷熱源的優(yōu)化運(yùn)行,從而提高空調(diào)運(yùn)行效率,能夠有效節(jié)約能源、降低運(yùn)行成本。

本文主要研究如何通過(guò)混合多種機(jī)器學(xué)習(xí)算法,包括聚類(lèi)與回歸算法等,提高建筑能耗預(yù)測(cè)建模準(zhǔn)確性和有效性,并對(duì)能耗預(yù)測(cè)的實(shí)際應(yīng)用提供幫助。

1 能耗預(yù)測(cè)模型研究現(xiàn)狀

目前,能耗預(yù)測(cè)主要有 2 種方式,即物理模擬和數(shù)據(jù)驅(qū)動(dòng)。數(shù)據(jù)驅(qū)動(dòng)建模是本文研究的重點(diǎn)。數(shù)據(jù)驅(qū)動(dòng),一般指的是將收集到的建筑數(shù)據(jù)作為輸入,對(duì)應(yīng)的歷史能耗數(shù)據(jù)作為輸出,訓(xùn)練得到能耗預(yù)測(cè)模型[1]。數(shù)據(jù)驅(qū)動(dòng)建模的方式主要有回歸模型、時(shí)間序列模型、機(jī)器學(xué)習(xí)算法模型等[2]。其中,機(jī)器學(xué)習(xí)算法在建筑能耗建模的應(yīng)用主要包括支持向量機(jī)(SVM)、人工神經(jīng)網(wǎng)絡(luò)(ANN)、決策樹(shù)和其他統(tǒng)計(jì)算法[3]。如肖冉等[4]提出一種基于支持向量機(jī)的辦公建筑逐時(shí)能耗預(yù)測(cè)方法,并引入了網(wǎng)格搜索方法優(yōu)化模型超參數(shù),體現(xiàn)了建筑的運(yùn)行波動(dòng)。楊麗娜等[5]提出一種結(jié)合神經(jīng)網(wǎng)絡(luò)(artificial neural network)和GRU的網(wǎng)絡(luò)模型(ANNGRU)來(lái)預(yù)測(cè)數(shù)據(jù)中心能耗,具有很高的精度。

除了在不同算法上有各種研究以外,針對(duì)不同的建筑類(lèi)型以及不同的時(shí)間粒度也有各類(lèi)研究。如周芮錦等[6]基于時(shí)間序列分析,將建筑逐月能耗的 4 個(gè)主要影響因子:逐月積溫值、逐月相對(duì)濕度平均值、逐月工作日天數(shù)及逐月非工作日天數(shù)引入建筑能耗預(yù)測(cè)模型,對(duì)逐月數(shù)據(jù)進(jìn)行預(yù)測(cè)。高英博等[7]利用 LSTM 模型對(duì)上海某酒店建筑逐時(shí)能耗數(shù)據(jù)進(jìn)行預(yù)測(cè),并以此為依據(jù)對(duì)能耗數(shù)據(jù)進(jìn)行異常識(shí)別。

以上種種在建筑能耗領(lǐng)域目前已得到廣泛的研究,通過(guò)結(jié)合建筑運(yùn)行數(shù)據(jù)和天氣數(shù)據(jù),預(yù)測(cè)建筑未來(lái)的能耗數(shù)據(jù),有一定的預(yù)測(cè)準(zhǔn)確性。但是,許多算法當(dāng)建筑處于運(yùn)行模式切換時(shí),預(yù)測(cè)的準(zhǔn)確性會(huì)下降,同時(shí)對(duì)于不同維度的數(shù)據(jù)需要做多步預(yù)處理和超參設(shè)置,而在超大型建筑中,往往存在不同區(qū)域的空調(diào)設(shè)備運(yùn)行模式不同,造成了工程化的復(fù)雜性。本文為了解決該問(wèn)題進(jìn)行了以下幾個(gè)試驗(yàn)。

2 基于隨機(jī)森林回歸的能耗預(yù)測(cè)模型

隨機(jī)森林回歸是一種基于決策樹(shù)的集成學(xué)習(xí)算法。其核心思想是一個(gè)由多顆隨機(jī)生成的決策樹(shù)組成的森林,每一個(gè)數(shù)據(jù)輸入后,由各個(gè)不相關(guān)的決策樹(shù)做分類(lèi)或者回歸,并投票決定該數(shù)據(jù)該如何分類(lèi)或者回歸。

隨機(jī)森林回歸主要用到的決策樹(shù)算法是 C A R T (classification and regression tree)算法。單獨(dú)的決策樹(shù)算法往往會(huì)在訓(xùn)練數(shù)據(jù)上表現(xiàn)良好,但在訓(xùn)練數(shù)據(jù)和實(shí)際應(yīng)用中效果很差,其由于過(guò)擬合的缺點(diǎn),使得模型不具有普遍性和工程上的應(yīng)用能力。

為了彌補(bǔ)決策樹(shù)的不足,隨機(jī)森林引入了隨機(jī)采樣的概念,即在森林中的決策樹(shù)在訓(xùn)練中得到的數(shù)據(jù)都是全局樣本中的一部分,從而避免了過(guò)擬合,并且可以通過(guò)算法本身進(jìn)行特征選擇,不需要對(duì)數(shù)據(jù)進(jìn)行規(guī)范化,相比于 SVM、ANN 等算法,工程化更簡(jiǎn)單,容易并行化,處理更大量的數(shù)據(jù)。

選取溫度、濕度、是否為工作日以及小時(shí)點(diǎn)和相同工作狀態(tài)下前一天同一時(shí)間點(diǎn)的能耗值作為輸入變量,該時(shí)間點(diǎn)的能耗值作為輸出變量,并對(duì)比不同的超參構(gòu)建模型,試驗(yàn)不同大小和深度的隨機(jī)森林對(duì)能耗預(yù)測(cè)模型的影響。

試驗(yàn)設(shè)置決策樹(shù)深度分別為n=3、5 以及 7,對(duì)比不同超參數(shù)下,評(píng)估參數(shù)的值。評(píng)估參數(shù)選取R2與 mse(均方誤差)。R2是用來(lái)評(píng)價(jià)預(yù)測(cè)值與真實(shí)值的擬合程度好壞,越接近 1 表示擬合度越高;均方誤差 mse 是預(yù)測(cè)值與真實(shí)值之差的平方和的平均值,值越小代表預(yù)測(cè)值與真實(shí)值差距越小。

同時(shí)將連續(xù)的能耗數(shù)據(jù)分段截取一部分作為訓(xùn)練數(shù)據(jù),另外一部分作為測(cè)試數(shù)據(jù),比例為 7∶3。

評(píng)估參數(shù)選取R2與 mse,測(cè)試樣本整體R2與 mse 見(jiàn)表 1 。

表1 預(yù)測(cè)值與真實(shí)值的擬合度及均方誤差

由試驗(yàn)結(jié)果可知,隨機(jī)森林越復(fù)雜,預(yù)測(cè)效果越佳。然而,仔細(xì)觀察換季時(shí)的預(yù)測(cè)準(zhǔn)確性,當(dāng)數(shù)據(jù)處于不同季度之間時(shí),誤差較大。

季度交錯(cuò)時(shí)間段內(nèi)的預(yù)測(cè)準(zhǔn)確率明顯下降。當(dāng)決策樹(shù)深度為 7 時(shí),取 8 月、9 月數(shù)據(jù)計(jì)算R2與 mse 值,分別為 0.898 6 和 2.849 0,與整體相比,下降了 0.065 與 62%,有明顯差距。

考慮原因,不同季度的相同時(shí)間段能耗消耗規(guī)律不同,當(dāng)處于同一模型下訓(xùn)練時(shí),隨機(jī)森林無(wú)法及時(shí)分辨不同的空調(diào)運(yùn)行模式,為此需要引入聚類(lèi)對(duì)不同季度的能耗曲線進(jìn)行分類(lèi)和建模。

3 基于聚類(lèi)的能耗曲線建模

聚類(lèi)算法在建筑能耗建模中的應(yīng)用主要指的是時(shí)間序列聚類(lèi),時(shí)間序列聚類(lèi)在建筑節(jié)能領(lǐng)域的主要應(yīng)用有 3 種:識(shí)別時(shí)間序列數(shù)據(jù)中的動(dòng)態(tài)變化、預(yù)測(cè)與推薦以及模式識(shí)別。在建筑用能建模領(lǐng)域,基于時(shí)間序列聚類(lèi)分析的主要研究有:建筑用能的模式識(shí)別、需求側(cè)管理、建筑用能預(yù)測(cè)、建筑用能異常數(shù)據(jù)檢測(cè)。

K-means 聚類(lèi)作為最著名的聚類(lèi)算法之一,在時(shí)間序列領(lǐng)域應(yīng)用廣泛。其原理為通過(guò)將數(shù)據(jù)分為K個(gè)簇中,使得簇內(nèi)的各個(gè)數(shù)據(jù)到中心點(diǎn)的距離差平方和最小。在能耗數(shù)據(jù)的聚類(lèi)中計(jì)算距離的方式,在本研究中主要采用歐幾里得距離,K值設(shè)置為 6,理由如下。

(1)空調(diào)用電受季節(jié)因素的影響較大,可以分為過(guò)渡季,供熱季,供冷季,同時(shí)工作日和節(jié)假日時(shí)的空調(diào)運(yùn)行同樣有很大的區(qū)分。所以,試驗(yàn)中將K設(shè)置為 6,即(過(guò)渡季,供熱季,供冷季)×(工作日,節(jié)假日)。

(2)超大型建筑空調(diào)能耗時(shí)序數(shù)據(jù)與空調(diào)設(shè)備的啟停時(shí)間有著強(qiáng)相關(guān)性。因此,在計(jì)算相似性時(shí)需要考慮建筑能耗曲線在相同時(shí)間點(diǎn)的實(shí)際物理意義,計(jì)算各條由 24 個(gè)點(diǎn)/d 組成的能耗曲線相互之間相似度,得到每個(gè)簇的中心,使得簇心曲線上的每個(gè)點(diǎn)有其實(shí)際的物理意義,為設(shè)備運(yùn)行策略?xún)?yōu)化提供統(tǒng)計(jì)學(xué)意義上的支撐。

研究中混合了 K-means 和 DBSCAN 2 個(gè)聚類(lèi)算法,對(duì)能耗曲線進(jìn)行清洗以及分類(lèi)。試驗(yàn)中,將某電表一整年的小時(shí)總能耗數(shù)據(jù)劃分為一個(gè) 365×24 的矩陣,以天為單位,一天 24 h 組成一條時(shí)間序列曲線;通過(guò)混合多種聚類(lèi)算法清洗數(shù)據(jù),剔除異常曲線;將清洗后數(shù)據(jù)進(jìn)行二次聚類(lèi)。聚類(lèi)結(jié)果如圖1 所示。

圖1 某空調(diào)回路聚類(lèi)簇中心曲線

從表2 統(tǒng)計(jì)結(jié)果可知,表2 的運(yùn)行結(jié)果與季度相關(guān)性高,而與是否為工作日、節(jié)假日相關(guān)性低。為了能夠更好區(qū)分出空調(diào)運(yùn)行的能耗規(guī)律,將能耗數(shù)據(jù)按照工作日、節(jié)假日重新聚類(lèi),得出結(jié)果如圖2 所示。

表2 各類(lèi)別天數(shù)所處月份及所處工作日雙休日天數(shù)統(tǒng)計(jì)表 單位:d

圖2 某空調(diào)回路工作日、節(jié)假日聚類(lèi)簇中心曲線

從統(tǒng)計(jì)結(jié)果表3,可以發(fā)現(xiàn)每一類(lèi)簇中心曲線都分別代表了過(guò)渡季、制冷季和供熱季在 0:00-6:00 時(shí)的非工作時(shí)間段以及 6:00-18:00 時(shí)的工作時(shí)間段上用能規(guī)律。由此可知該空調(diào)在不同季度大致的用能規(guī)律,并以此為根據(jù)對(duì)不同季度的能耗數(shù)據(jù)進(jìn)行分類(lèi)。

表3 工作日各類(lèi)別天數(shù)所處月份及所處工作日雙休日天數(shù)統(tǒng)計(jì)表 單位:d

4 混合聚類(lèi)與隨機(jī)森林回歸的能耗預(yù)測(cè)模型

混合 K-means 聚類(lèi)與隨機(jī)森林回歸兩種算法,該思想主要針對(duì)超大型建筑不同區(qū)域和季節(jié)運(yùn)行規(guī)律區(qū)別很大,需要針對(duì)不同時(shí)間段和用能區(qū)域來(lái)進(jìn)行建模的困難,找到不同區(qū)域和時(shí)間段建模的理論依據(jù)。

經(jīng)過(guò)以上聚類(lèi)算法對(duì)能耗數(shù)據(jù)處理的試驗(yàn),可以得知聚類(lèi)算法能夠?qū)Σ煌径鹊哪芎臄?shù)據(jù)進(jìn)行分類(lèi),并在分類(lèi)之后可以統(tǒng)計(jì)各個(gè)分類(lèi)的所處于的季節(jié)及相關(guān)時(shí)間段,從而找到不同區(qū)域的空調(diào)設(shè)備切換啟停時(shí)間和運(yùn)行模式的時(shí)間節(jié)點(diǎn),以此作為劃分預(yù)測(cè)模型的分割點(diǎn),即不同區(qū)域空調(diào)設(shè)備該依據(jù)哪個(gè)時(shí)間段作為一種運(yùn)行模式的訓(xùn)練數(shù)據(jù),形成預(yù)測(cè)模型,并在一年中不同區(qū)域空調(diào)設(shè)備在不同季節(jié)中何時(shí)采用何種預(yù)測(cè)模型進(jìn)行預(yù)測(cè)的理論依據(jù)。

首先嘗試對(duì)該樓宇不同區(qū)域的空調(diào)設(shè)備能耗進(jìn)行建模。試驗(yàn)結(jié)果見(jiàn)表4。

表4 不同區(qū)域的空調(diào)設(shè)備能耗預(yù)測(cè)值與真實(shí)值的擬合度及均方誤差

由試驗(yàn)可知,即使設(shè)置相同超參,不同區(qū)域空調(diào)設(shè)備能耗數(shù)據(jù)對(duì)隨機(jī)森林回歸的性能依然表現(xiàn)良好,具有普適性,且不需要做任何的預(yù)處理。

之后,對(duì)某電表一整年的小時(shí)總能耗數(shù)據(jù)進(jìn)行聚類(lèi),然后統(tǒng)計(jì)其各類(lèi)曲線在各月分布情況,發(fā)現(xiàn)其空調(diào)運(yùn)行模式切換主要在工作日 8月底9月初,符合之前試驗(yàn)準(zhǔn)確率下降的數(shù)據(jù)段范圍。找到時(shí)間劃分點(diǎn)后,對(duì)不同的空調(diào)運(yùn)行模式下的能耗建模,即7~8月底,采用一個(gè)訓(xùn)練模型,8~9 月采用第二個(gè)訓(xùn)練模型,混合模型后得到新的預(yù)測(cè)。

具體對(duì)應(yīng)月份數(shù)據(jù)(7~9月)預(yù)測(cè)效果對(duì)比見(jiàn)表 。

表5 隨機(jī)森林與混合算法的擬合度及均方誤差對(duì)比

可見(jiàn)經(jīng)過(guò)多步處理后季節(jié)交換時(shí)段的能耗預(yù)測(cè)準(zhǔn)確性顯著提高,較之前整體分別提高了 0.05 和 23.5%。

5 結(jié) 語(yǔ)

超大型建筑能耗的預(yù)測(cè)準(zhǔn)確性的提高對(duì)相應(yīng)國(guó)家的節(jié)能減排能夠起重要的作用。尤其是換季時(shí)期的能耗預(yù)測(cè)準(zhǔn)確性的提高能夠幫助業(yè)主及時(shí)發(fā)現(xiàn)空調(diào)運(yùn)行的異常。

本文采用了隨機(jī)森林回歸和 K-means 聚類(lèi) 2 種算法,對(duì)超大型建筑的空調(diào)能耗預(yù)測(cè)進(jìn)行了研究。本文主要結(jié)論如下。

(1)隨機(jī)森林回歸相較于 SVR、ANN 等算法主要優(yōu)點(diǎn)在于不需要作特別的數(shù)據(jù)預(yù)處理,一樣能得到較高的預(yù)測(cè)準(zhǔn)確性,因此具有很好的工程化優(yōu)勢(shì)。在面對(duì)不同設(shè)備的模型訓(xùn)練時(shí),不需要做任何的超參設(shè)置,預(yù)測(cè)性能不受影響。因此,不必為每一個(gè)設(shè)備做單獨(dú)的算法模型的調(diào)試,能夠極大地發(fā)揮出數(shù)據(jù)驅(qū)動(dòng)建模時(shí)的便利性,并保證預(yù)測(cè)準(zhǔn)確性。

(2)同時(shí),與大部分?jǐn)M合算法一樣,無(wú)法應(yīng)對(duì)換季時(shí)期的預(yù)測(cè)性能下降的問(wèn)題,一旦空調(diào)運(yùn)行規(guī)律改變,將會(huì)對(duì)預(yù)測(cè)的準(zhǔn)確性有很大的負(fù)面影響。

(3)為了能夠讓模型及時(shí)相應(yīng)天氣和節(jié)假日造成的空調(diào)運(yùn)行規(guī)律改變,研究通過(guò)對(duì)設(shè)備能耗的歷史數(shù)據(jù)進(jìn)行聚類(lèi),對(duì)聚類(lèi)結(jié)果進(jìn)行統(tǒng)計(jì)分析,可以發(fā)現(xiàn)不同季度空調(diào)設(shè)備運(yùn)行規(guī)律區(qū)分度高,因此可以對(duì)不同季度空調(diào)設(shè)備能耗進(jìn)行分別建模。

(4)在對(duì)設(shè)備能耗的歷史數(shù)據(jù)進(jìn)行聚類(lèi),從而合理劃分運(yùn)行規(guī)律改變的時(shí)間點(diǎn),對(duì)不同運(yùn)行規(guī)律采取不同的模型來(lái)進(jìn)行訓(xùn)練和測(cè)試,有效地提高了換季時(shí)期整體模型的預(yù)測(cè)準(zhǔn)確率。

猜你喜歡
決策樹(shù)能耗聚類(lèi)
120t轉(zhuǎn)爐降低工序能耗生產(chǎn)實(shí)踐
能耗雙控下,漲價(jià)潮再度來(lái)襲!
探討如何設(shè)計(jì)零能耗住宅
基于K-means聚類(lèi)的車(chē)-地?zé)o線通信場(chǎng)強(qiáng)研究
一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹(shù)算法
日本先進(jìn)的“零能耗住宅”
決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
基于高斯混合聚類(lèi)的陣列干涉SAR三維成像
基于決策樹(shù)的出租車(chē)乘客出行目的識(shí)別
基于Spark平臺(tái)的K-means聚類(lèi)算法改進(jìn)及并行化實(shí)現(xiàn)