張 超,封智博,穆洪波,魏子清,肖 冉,翟曉強(qiáng)(.北京金茂綠建科技有限公司, 北京 000; .上海交通大學(xué)制冷與低溫工程研究所, 上海 0040)
我國(guó)建筑運(yùn)行能耗約占能源總量的 30%,其中,一半以上為暖通空調(diào)能耗。挖掘空調(diào)系統(tǒng)的節(jié)能潛力首先要得到準(zhǔn)確的建筑負(fù)荷規(guī)律。傳統(tǒng)物理建模過(guò)程面臨模型復(fù)雜等問(wèn)題,正逐漸被新興的以大數(shù)據(jù)及人工智能為代表的數(shù)據(jù)驅(qū)動(dòng)技術(shù)所代替[1]。
人工智能技術(shù)的開(kāi)發(fā)主要是針對(duì)模型構(gòu)建與特征選擇兩方面。目前,樹(shù)模型、核模型和神經(jīng)網(wǎng)絡(luò)模型在回歸預(yù)測(cè)領(lǐng)域均得到了長(zhǎng)足的發(fā)展,每種模型都有自己的特點(diǎn)與擅長(zhǎng)的數(shù)據(jù)集類型,通過(guò)比較可選擇出適合具體應(yīng)用情景的模型[2-3]。調(diào)參手段的開(kāi)發(fā)又進(jìn)一步提升了模型性能。在特征選擇方面,采用相關(guān)性分析、主成分分析等[4-5]方式可以保證減少多輸入特征數(shù)量與模型性能之間的平衡,使得計(jì)算開(kāi)銷大幅下降,降低了工業(yè)部署的要求。此外,實(shí)現(xiàn)智能預(yù)測(cè)系統(tǒng)的工業(yè)部署,需要整合底層數(shù)據(jù)讀取與網(wǎng)絡(luò)IO 存儲(chǔ)等技術(shù)。
本文提出一種面向集中式空調(diào)住宅負(fù)荷預(yù)測(cè)的系統(tǒng)框架,包括數(shù)據(jù)采集儲(chǔ)存等硬件系統(tǒng)以及相應(yīng)的負(fù)荷預(yù)測(cè)軟件系統(tǒng),開(kāi)發(fā)了 4 種機(jī)器學(xué)習(xí)算法預(yù)測(cè)系統(tǒng)的逐時(shí)負(fù)荷量。機(jī)器學(xué)習(xí)算法利用了相關(guān)系數(shù)分析與網(wǎng)格搜索進(jìn)行了優(yōu)化,并基于某住宅小區(qū)進(jìn)行了該系統(tǒng)的開(kāi)發(fā)實(shí)踐。
某住宅區(qū)包括 10 棟建筑,總建筑面積為 25 350 m2。該住宅區(qū)內(nèi)空調(diào)冷/熱量由地下機(jī)房?jī)?nèi) 2 臺(tái)地源熱泵機(jī)組(額定制冷量 1 747.0 kW,額定制熱量 1 556.0 kW)和 1 臺(tái)螺桿式制冷機(jī)組(額定制冷量 1 448.2 kW)提供,并通過(guò)循環(huán)管網(wǎng)將冷/熱量輸送至各個(gè)樓棟。
數(shù)據(jù)采集工作基于物理傳感器與互聯(lián)網(wǎng)通信進(jìn)行。本硬件框架內(nèi)所測(cè)量的數(shù)據(jù)如表1 所示。同時(shí),為避免對(duì)已運(yùn)行的供能系統(tǒng)造成干擾,傳感器采用了非接觸式傳感器(貼片式溫度傳感器、超聲式流量計(jì))。所訂閱的傳感器通過(guò) 12 V 模擬信號(hào)接口或者 Modbus 接口將數(shù)據(jù)上傳至上位機(jī),上位機(jī)之間采用令牌傳遞方式查詢數(shù)據(jù),頻率設(shè)定為 5 min/次。上位機(jī)通過(guò)互聯(lián)網(wǎng)將數(shù)據(jù)傳輸至指定服務(wù)器,完成全部流程。
表1 傳感器測(cè)量數(shù)據(jù)及位置
讀取得到的原始數(shù)據(jù)后,進(jìn)行如下數(shù)據(jù)預(yù)處理工作。
(1)加入負(fù)荷值標(biāo)簽:本項(xiàng)目采用循環(huán)管網(wǎng)供回水溫差與流量的小時(shí)平均值計(jì)算得到每小時(shí)負(fù)荷,同時(shí)將其他數(shù)據(jù)采樣也降到每小時(shí)頻率。
(2)異常值篩查:通過(guò)數(shù)據(jù)分析手段判斷異常值,主要將有悖物理意義的數(shù)值剔除,并采用線性函數(shù)填充替換該異常值。
(3)移動(dòng)平均:移動(dòng)平均可以過(guò)濾掉時(shí)間序列中的高頻擾動(dòng),保留有用的低頻趨勢(shì),同時(shí)為了不產(chǎn)生影響模型性能的滯后性,移動(dòng)平均的寬度設(shè)置為 24 h。
(1)特征工程。數(shù)據(jù)輸入特征主要分為三類:氣候特征、歷史特征與時(shí)間特征。氣候特征主要包括預(yù)測(cè)時(shí)刻的室外干球溫度、相對(duì)濕度。歷史特征主要包括過(guò)去由硬件框架傳感器采集得到的歷史值,每個(gè)樣本歷史特征維度為 5 040維。時(shí)間特征主要包括全天 24 h 的獨(dú)熱編碼,是否周末的獨(dú)熱編碼以及月份數(shù)的獨(dú)熱編碼等共 26 維。其中,歷史特征由于其龐大的數(shù)據(jù)維度,所以會(huì)導(dǎo)致模型訓(xùn)練效率低下。為此,本項(xiàng)目利用主成分分析對(duì)歷史特征進(jìn)行降維,對(duì)數(shù)據(jù)進(jìn)行比例縮放, 映射到 0 到 1 的區(qū)間進(jìn)行數(shù)據(jù)歸一化處理,采用 Scikit-learn軟件包[6]decomposition.PCA 模塊將數(shù)據(jù)降維至 25 維以加速計(jì)算。
(2)模型選擇與調(diào)優(yōu)。本項(xiàng)目采用 4 種機(jī)器學(xué)習(xí)算法,分別為支持向量回歸(SVR)、多層感知機(jī)(MLP)、隨機(jī)森林(RF)、k 近鄰(KNN)。采用網(wǎng)格搜索方式(Grid Search)對(duì)以上 4 種算法的超參數(shù)進(jìn)行調(diào)優(yōu)。網(wǎng)格搜索調(diào)優(yōu)參數(shù)范圍如表2 所示。采用 5 重 Cross-validation選取各個(gè)模型泛化性能最高的參數(shù)。最終模型輸出值由逆向區(qū)間縮放得到預(yù)測(cè)值。
表2 模型超參數(shù)選擇范圍
采用 2019 年 11 月至 2020 年 3 月的數(shù)據(jù)為樣本。由于數(shù)據(jù)依靠傳感器獲得,考慮傳感器帶來(lái)的測(cè)量誤差,繪制實(shí)際負(fù)荷值的 95% 置信區(qū)間,如圖1 所示。落在置信區(qū)間內(nèi)的預(yù)測(cè)值認(rèn)為預(yù)測(cè)準(zhǔn)確,其誤差不計(jì)入總誤差計(jì)算[7]。為了合理訓(xùn)練整個(gè)供暖季數(shù)據(jù),在特征工程結(jié)束后采用隨機(jī)選擇方式選取 80% 的數(shù)據(jù)用于模型訓(xùn)練,剩余 20% 數(shù)據(jù)用于模擬線上預(yù)測(cè)進(jìn)行模型驗(yàn)證。
圖1 逐時(shí)供暖負(fù)荷變化曲線
模型的評(píng)價(jià)采用平均絕對(duì)百分比誤差 MAPE 按式(1)計(jì)算。
式中:n—樣本個(gè)數(shù);
yi—樣本i真實(shí)值;
i—樣本編號(hào)。
模型性能如表3 所示。由表3 可以看出,訓(xùn)練階段各個(gè)模型 MAPE 均在 10% 以內(nèi)。在訓(xùn)練集表現(xiàn)上,SVR 和 KNN的性能最好,MAPE<5%。在測(cè)試集上,MLP 與 RF 的模型過(guò)擬合問(wèn)題較為嚴(yán)重,預(yù)測(cè)性能有所下降。由于目前采集的數(shù)據(jù)集樣本數(shù)量較少,而 SVR 模型對(duì)于小數(shù)據(jù)集通常具有較好的性能表現(xiàn),因此,其擬合性能與預(yù)測(cè)性能均較好。結(jié)合各個(gè)模型的訓(xùn)練時(shí)長(zhǎng),可以看出針對(duì)該數(shù)據(jù)集 SVR 的綜合表現(xiàn)性能最優(yōu)。
表3 模型性能對(duì)比
進(jìn)一步選取表現(xiàn)最好的 SVR 和 KNN 模型的測(cè)試集數(shù)據(jù)按時(shí)間序列排布,如圖2 所示。通過(guò)分析模型預(yù)測(cè)值落在置信區(qū)間內(nèi)的情況,可以發(fā)現(xiàn) KNN 模型在整個(gè)供熱季的預(yù)測(cè)性能都較為穩(wěn)定,而 SVR 模型在三個(gè)典型空調(diào)供暖月(12月、1 月和 2月 )的預(yù)測(cè)曲線更為穩(wěn)定。
圖2 SVR 與 KNN 逐時(shí)負(fù)荷預(yù)測(cè)曲線
(1)本文以某集中式空調(diào)住宅區(qū)為對(duì)象,搭建了從原始數(shù)據(jù)采集到負(fù)荷預(yù)測(cè)的數(shù)字系統(tǒng)框架。
(2)采用支持向量回歸、多層感知機(jī)、隨機(jī)森林、k近鄰等 4 種機(jī)器學(xué)習(xí)算法,結(jié)合主成分分析降維與網(wǎng)格搜索優(yōu)化搭建了負(fù)荷預(yù)測(cè)模型。
(3)支持向量回歸模型的預(yù)測(cè)性能 MAPE 為 4%,模型訓(xùn)練時(shí)間最短,且在典型空調(diào)時(shí)段的預(yù)測(cè)性能穩(wěn)定。綜合考慮為最優(yōu)模型。