楊勝維 吳利瑞 劉東
同濟(jì)大學(xué)機(jī)械與能源工程學(xué)院
航站樓作為典型的公共交通建筑,每平方米耗電量遠(yuǎn)遠(yuǎn)高于普通公共建筑,其中空調(diào)系統(tǒng)運(yùn)行電耗占比最大,為61%[1]。航站樓空調(diào)負(fù)荷中新風(fēng)負(fù)荷和人員負(fù)荷之和占比為45%~60%[2],客流量的變化對(duì)實(shí)際負(fù)荷需求的有顯著的影響[3]。而航站樓區(qū)域供冷系統(tǒng)水力半徑大,長(zhǎng)距離的冷凍水輸送會(huì)導(dǎo)致冷源供應(yīng)側(cè)和需求側(cè)的延遲較大,傳統(tǒng)反饋調(diào)節(jié)的控制方式不能反映系統(tǒng)的實(shí)時(shí)負(fù)荷變化[4]。通過(guò)準(zhǔn)確的負(fù)荷預(yù)測(cè)建立前饋的控制策略是應(yīng)對(duì)這一問(wèn)題的有效方法。本文針對(duì)航站樓空調(diào)負(fù)荷特點(diǎn),建立了隨機(jī)森林負(fù)荷預(yù)測(cè)模型,并分析了不同的輸入特征選擇對(duì)模型預(yù)測(cè)準(zhǔn)確性及效率的影響,為空調(diào)設(shè)備實(shí)際運(yùn)行調(diào)控及優(yōu)化提供指導(dǎo)依據(jù)。
隨機(jī)森林是一種并行式集成學(xué)習(xí)算法,在以分類(lèi)回歸決策樹(shù)(CART)為基學(xué)習(xí)器構(gòu)建 Bagging 集成的基礎(chǔ)上,進(jìn)一步在決策樹(shù)的訓(xùn)練過(guò)程中引入了隨機(jī)屬性選擇,由森林中所有決策樹(shù)投票得出結(jié)果。隨機(jī)森林的泛化性能強(qiáng)、簡(jiǎn)單易實(shí)現(xiàn)、計(jì)算開(kāi)銷(xiāo)小,在很多分類(lèi)、回歸任務(wù)當(dāng)中具有較高的準(zhǔn)確度[5]。
決策樹(shù)是 Breiman L 等人于 1984 年提出的一種決策樹(shù)學(xué)習(xí)算法,使用“基尼指數(shù)”來(lái)選擇劃分屬性。假設(shè)數(shù)據(jù)集D包含m個(gè)類(lèi)別,則其基尼指數(shù)GD的計(jì)算公式為:
式中:pj為j類(lèi)元素出現(xiàn)的頻率。
基尼指數(shù)反映了從數(shù)據(jù)集D中隨機(jī)抽取兩個(gè)樣本,其類(lèi)別標(biāo)記不一致的概率,基尼指數(shù)越小,數(shù)據(jù)集D的純度越高。因此,在m個(gè)類(lèi)別中,挑選基尼指數(shù)最小的類(lèi)別作為最優(yōu)劃分屬性。
隨機(jī)森林在 CART 決策樹(shù)的基礎(chǔ)上引入了Bagging 方法提高基學(xué)習(xí)器的泛化能力并增強(qiáng)單棵決策樹(shù)的性能,同時(shí)降低泛化誤差[6]。此外,隨機(jī)森林還有袋外估計(jì)的特點(diǎn),不需要額外挑選訓(xùn)練集。隨機(jī)森林的算法流程可分為以下幾步:
1)隨機(jī)抽取樣本:通過(guò)Bootstrap 重抽樣方法從原始數(shù)據(jù)樣本中抽取n個(gè)樣本作為訓(xùn)練集,理論上往往會(huì)有大約1/3 的原始數(shù)據(jù)沒(méi)有被選中,這部分?jǐn)?shù)據(jù)則會(huì)作為測(cè)試集,評(píng)估其泛化誤差。
2)隨機(jī)抽取特征:對(duì)于每一個(gè)Bootstrap 樣本集進(jìn)行決策樹(shù)建模,假設(shè)其中有d個(gè)特征,則隨機(jī)抽取k個(gè)特征(k≤d),從k個(gè)特征中選擇最佳分割特征作為節(jié)點(diǎn)建立CART 決策樹(shù)。
3)建立森林:重復(fù)以上步驟m次,建立m課CART 決策樹(shù)組成隨機(jī)森林。
4)對(duì)于測(cè)試集的樣本,通過(guò)森林中所有決策樹(shù)的投票結(jié)果(對(duì)于分類(lèi)問(wèn)題)或算術(shù)平均值(對(duì)于回歸問(wèn)題)得到最終預(yù)測(cè)值作為輸出。
本文以華東某機(jī)場(chǎng)衛(wèi)星廳為負(fù)荷預(yù)測(cè)對(duì)象,通過(guò)空調(diào)系統(tǒng)實(shí)際運(yùn)行的歷史數(shù)據(jù),該機(jī)場(chǎng)航站樓總建筑面積約為 62 萬(wàn)m2,設(shè)計(jì)總冷負(fù)荷為 93577 kW,分為S1 和S2 兩部分。主要功能區(qū)包括值機(jī)大廳、安檢區(qū)、候機(jī)區(qū)、旅客到達(dá)走廊、行李提取大廳、接待大廳等,并根據(jù)功能特點(diǎn)設(shè)置相應(yīng)的商業(yè)店鋪,以滿足旅客餐飲、購(gòu)物等需求。航站樓的空調(diào)負(fù)荷由能源中心的區(qū)域供冷系統(tǒng)承擔(dān),空調(diào)水系統(tǒng)為三級(jí)泵冷水直供系統(tǒng),從能源中心產(chǎn)生的冷水,經(jīng)二級(jí)泵系統(tǒng)輸送至航站樓內(nèi)三個(gè)熱力站內(nèi),再通過(guò)設(shè)置在熱力站的三級(jí)泵輸送至航站樓內(nèi)各個(gè)空調(diào)末端。該空調(diào)系統(tǒng)間歇運(yùn)行,每日凌晨2:30~4:30 停止供冷。
采集的原始數(shù)據(jù)包括室外干球溫度、室外相對(duì)濕度、進(jìn)出人數(shù)、系統(tǒng)總供回水溫度、冷凍水流量。各項(xiàng)數(shù)據(jù)的時(shí)間范圍為7 月1 日至10 月1 日,涵蓋整個(gè)制冷季節(jié),時(shí)間間隔為 30 min,原始數(shù)據(jù)集共包含 4416組數(shù)據(jù)樣本。由于數(shù)據(jù)傳感器故障或干擾信號(hào)等因素,原始數(shù)據(jù)集中存在數(shù)據(jù)缺失、數(shù)據(jù)異常、數(shù)據(jù)波動(dòng)等現(xiàn)象。這些異常數(shù)據(jù)的存在會(huì)使機(jī)器學(xué)習(xí)模型的性能降低,因此數(shù)據(jù)預(yù)處理是必不可少的一步。通過(guò)數(shù)據(jù)清洗、缺失值補(bǔ)充、離群點(diǎn)剔除等手段,可以提高數(shù)據(jù)的質(zhì)量、提升模型的準(zhǔn)確性、縮短計(jì)算過(guò)程。
缺失值處理:對(duì)于室外溫濕度的缺失值,則根據(jù)Wunder Ground 全球氣象數(shù)據(jù)庫(kù)中當(dāng)?shù)貙?duì)應(yīng)時(shí)刻的室外溫濕度數(shù)據(jù)進(jìn)行補(bǔ)全。對(duì)于進(jìn)出人數(shù)、系統(tǒng)總供回水溫度、冷凍水流量等參數(shù)的缺失值,采用插值補(bǔ)全,用相鄰時(shí)間點(diǎn)的數(shù)據(jù)平均值代替。
離群點(diǎn)處理:由系統(tǒng)總供回水溫度與冷凍水流量計(jì)算可以得到各個(gè)時(shí)刻對(duì)應(yīng)的冷負(fù)荷,冷負(fù)荷的概率分布圖如圖1 所示,可以看到冷負(fù)荷服從正態(tài)分布。通過(guò)判斷冷負(fù)荷數(shù)據(jù)是否滿足拉依達(dá)準(zhǔn)則(3σ準(zhǔn)則)來(lái)剔除離群點(diǎn):冷負(fù)荷數(shù)據(jù)落在(μ- 3σ,μ+3σ)區(qū)間之外的被認(rèn)為是異常數(shù)據(jù),將剔除該冷負(fù)荷對(duì)應(yīng)時(shí)間點(diǎn)的數(shù)據(jù)。其中冷負(fù)荷在0 MW~5 MW 區(qū)間概率分布較高是因?yàn)榭照{(diào)系統(tǒng)間歇運(yùn)行導(dǎo)致,因此拉依達(dá)準(zhǔn)則對(duì)于低負(fù)荷離群點(diǎn)的剔除較為局限,需要結(jié)合間歇運(yùn)行的時(shí)間判斷低負(fù)荷數(shù)值是否為離群點(diǎn):若低負(fù)荷數(shù)值出現(xiàn)在凌晨2:30~4:30 則認(rèn)為是正常數(shù)據(jù),反之則作為異常數(shù)據(jù)剔除。
圖1 冷負(fù)荷分布圖
噪聲處理:即使對(duì)應(yīng)的冷負(fù)荷落在置信區(qū)間內(nèi),對(duì)于進(jìn)出人數(shù)、室外溫濕度等數(shù)據(jù),仍然不可避免地存在數(shù)據(jù)噪聲,如圖2 所示為每日進(jìn)出累計(jì)人數(shù),這是由傳感器高頻測(cè)量的物理變量的隨機(jī)誤差導(dǎo)致的。因此,為了降低噪聲干擾,需要對(duì)曲線進(jìn)行濾波,讓曲線過(guò)渡更平滑。本文采用 Savitzky-Golay 濾波器對(duì)數(shù)據(jù)進(jìn)行平滑處理,其核心思想:是對(duì)一定長(zhǎng)度窗口內(nèi)的數(shù)據(jù)點(diǎn)進(jìn)行k階多項(xiàng)式擬合,從而得到擬合后的結(jié)果。這種濾波器的最大特點(diǎn):在濾除噪聲的同時(shí)可以確保信號(hào)的形狀、寬度不變。平滑處理后得到的每日進(jìn)出累計(jì)人數(shù)的曲線如圖3 所示。
圖2 去噪前每日進(jìn)出累計(jì)人數(shù)
圖3 去噪后每日進(jìn)出累計(jì)人數(shù)
正確構(gòu)建的特征可以在不犧牲預(yù)測(cè)精度的情況下減少數(shù)據(jù)驅(qū)動(dòng)模型的計(jì)算時(shí)間[7],對(duì)于航站樓空調(diào)負(fù)荷預(yù)測(cè),本文挑選了室外干球溫度,室外相對(duì)濕度,進(jìn)出人數(shù),時(shí)間及歷史負(fù)荷作為原始特征,并進(jìn)一步處理得到更能反映航站樓空調(diào)負(fù)荷變化規(guī)律的輸入特征。
2.2.1 時(shí)間特征
原始數(shù)據(jù)中時(shí)間的數(shù)據(jù)是以日期的格式儲(chǔ)存的,如2020 年7 月1 日12:00:00。在目前研究的負(fù)荷預(yù)測(cè)模型中,一般將其轉(zhuǎn)化為時(shí)間戳格式或 24 h 格式。前者代表了從1970 年 1 月1 日00:00:00(UTC/GMT 的午夜)開(kāi)始到當(dāng)前時(shí)間所經(jīng)過(guò)的秒數(shù),后者則是日期格式中對(duì)應(yīng)的小時(shí)數(shù)。因此,時(shí)間戳格式表示的時(shí)間數(shù)據(jù)是單調(diào)遞增的,而24 h 格式表示的時(shí)間數(shù)據(jù)是以24為周期的鋸齒狀周期函數(shù)。而航站樓的空調(diào)負(fù)荷存在明顯的24 h 特征與星期特征,如圖 4 和圖5 所示。
圖4 顯示了 2020 年 7 月 30 日 00:00:00~2020 年8 月 1 日 00:00:00 航站樓的 48 h 內(nèi)每 30 min 的冷負(fù)荷變化,可以看到冷負(fù)荷表現(xiàn)出明顯的 24 h 特征。由于空調(diào)系統(tǒng)間歇運(yùn)行,在每日系統(tǒng)重新開(kāi)始運(yùn)行的 1 h內(nèi),系統(tǒng)需要處理停機(jī)期間的蓄熱,此時(shí)的冷負(fù)荷達(dá)到峰值。圖5 顯示了2020 年8 月3 日~2020 年 8 月 16日航站樓的日負(fù)荷變化情況,在兩周內(nèi)室外平均溫度基本穩(wěn)定在30 ℃左右的條件下,冷負(fù)荷表現(xiàn)出明顯的星期特征。整體趨勢(shì)為一周內(nèi)冷負(fù)荷隨星期數(shù)上升,在星期五達(dá)到峰值后回落。
圖4 冷負(fù)荷24 h 特征
圖5 冷負(fù)荷星期特征
通過(guò)上述分析,將時(shí)間拆分為 24 h 特征和星期特征更能反映冷負(fù)荷的變化規(guī)律。因此,通過(guò)式(2)和式(3)將數(shù)據(jù)樣本的時(shí)間轉(zhuǎn)化為兩組特征。
式中:timestamp為數(shù)據(jù)樣本對(duì)應(yīng)的時(shí)間戳。
2.2.2 客流特征
人員數(shù)量是影響航站樓實(shí)際負(fù)荷需求的重要因素,航站樓人員密度實(shí)際運(yùn)行階段的真實(shí)值顯著低于設(shè)計(jì)值,導(dǎo)致空調(diào)系統(tǒng)新風(fēng)負(fù)荷與人員負(fù)荷供需不匹配[8]。目前對(duì)于航站樓客流特征常用的數(shù)據(jù)一般是主要出入口的客流量——進(jìn)出人數(shù)隨時(shí)間的變化,而某一時(shí)刻的客流量并不能直接反映航站樓內(nèi)對(duì)應(yīng)的人員數(shù)量。因此,本文擬通過(guò)式(4)計(jì)算某一時(shí)刻航站樓內(nèi)的逗留的人員數(shù)量。
式中:Nt為t時(shí)刻航站樓內(nèi)逗留的人員數(shù)量;At為t時(shí)刻進(jìn)入航站樓的人數(shù);Bt為t時(shí)刻離開(kāi)航站樓的人數(shù);Ct為t時(shí)刻從該機(jī)場(chǎng)飛離的人數(shù);Dt為t時(shí)刻降落到該機(jī)場(chǎng)的人數(shù)。
圖6 為航站樓內(nèi)逗留人員數(shù)量示意圖。其中,At和Ct可以通過(guò)航站樓主要出入口的客流統(tǒng)計(jì)攝像頭得到,而B(niǎo)t和Dt則與航班動(dòng)態(tài)相關(guān),較難直接獲取相關(guān)數(shù)據(jù)。但后兩者與前兩者存在時(shí)間上的關(guān)聯(lián),從該機(jī)場(chǎng)飛離的人在先前的時(shí)間會(huì)被入口客流統(tǒng)計(jì)捕捉到,而降落到該機(jī)場(chǎng)的人則在后續(xù)的時(shí)間會(huì)被出口客流統(tǒng)計(jì)捕捉到。同時(shí),將迎接旅客和送別旅客的人群考慮在內(nèi),可以將式(4)改寫(xiě)為式(5)。
圖6 航站樓內(nèi)逗留人員數(shù)量示意圖
式中:k為迎送比,國(guó)內(nèi)迎送比 0.3,國(guó)際迎送比 0.5[9],取平均值0.4;t1 為出發(fā)過(guò)程停留時(shí)間;t2 為到達(dá)過(guò)程停留時(shí)間。
Liu 等人[10]的研究表明:乘客在航站樓出發(fā)過(guò)程中花費(fèi)的時(shí)間較長(zhǎng),而到達(dá)過(guò)程往往很快,通過(guò)現(xiàn)場(chǎng)調(diào)研得到的平均停留時(shí)間分別為132 分鐘和34 分鐘。因此,結(jié)合數(shù)據(jù)集的時(shí)間步長(zhǎng),t1 和t2 分別取 120 min和30 min。通過(guò)式5 計(jì)算得到的航站樓人員數(shù)量部分曲線如圖7 所示??梢钥吹?,航站樓的逗留人員數(shù)量在每日8:00 和16:00 兩個(gè)時(shí)刻達(dá)到峰值,這與上下班高峰期的時(shí)間吻合。
圖7 航站樓內(nèi)逗留人員數(shù)量曲線
2.2.3 氣象特征
室外溫濕度數(shù)據(jù)反映了室外空氣的狀態(tài)點(diǎn),而室外空氣焓值代表了空調(diào)系統(tǒng)將新風(fēng)處理到送風(fēng)狀態(tài)需要提供的冷量。因此,在室內(nèi)要求的溫濕度不變的條件下,室外空氣的焓值更能反映空調(diào)冷負(fù)荷的變化規(guī)律。已知室外溫濕度數(shù)據(jù),可通過(guò)式(6)計(jì)算對(duì)應(yīng)焓值h。
式中:t為室外干球溫度,℃ ;RH為室外相對(duì)濕度,% ;Ps為水蒸氣飽和分壓力,可 查水蒸氣表,和 溫度一一對(duì)應(yīng),P a;B為大氣壓,取 101325 Pa。
綜合上述分析,將時(shí)間 24 h 特征、時(shí)間星期特征、人員數(shù)量、室外干球溫度、室外相對(duì)濕度、室外空氣焓值、歷史負(fù)荷作為隨機(jī)森林算法的輸入特征進(jìn)行模型訓(xùn)練。在采用隨機(jī)森林進(jìn)行回歸任務(wù)時(shí),需要對(duì)模型參數(shù)進(jìn)行定義,主要參數(shù)包括:決策樹(shù)的數(shù)量(n_estimators)、樹(shù)的最大生長(zhǎng)深度(max_depth)、葉子的最小樣本數(shù)量(min_samples_leaf)、分支節(jié)點(diǎn)的最小樣本數(shù)量(min_samples_split)。對(duì)隨機(jī)森林模型來(lái)說(shuō),樹(shù)越茂盛,深度越深,枝葉越多,模型就越復(fù)雜。模型過(guò)于復(fù)雜會(huì)導(dǎo)致過(guò)擬合且計(jì)算效率低,而過(guò)于簡(jiǎn)單則會(huì)導(dǎo)致欠擬合且預(yù)測(cè)精度低,兩者都會(huì)讓泛化誤差高。因此需要尋找最優(yōu)的參數(shù)組合建立模型,目前常用的參數(shù)優(yōu)化方法包括網(wǎng)格搜索法和隨機(jī)搜索法。
其中網(wǎng)格搜索法是指定參數(shù)值的一種窮舉搜索方法,遍歷所有的參數(shù)組合通過(guò)交叉驗(yàn)證的方法進(jìn)行優(yōu)化來(lái)得到最優(yōu)的學(xué)習(xí)算法。但對(duì)于隨機(jī)森林算法來(lái)說(shuō),需要調(diào)整的參數(shù)很多,如果采用網(wǎng)格搜索法則需要大量的搜索時(shí)間。而隨機(jī)搜索法對(duì)于多參數(shù)的機(jī)器學(xué)習(xí)算法適用性更強(qiáng)[11],這種方法通過(guò)在給定參數(shù)范圍內(nèi)隨機(jī)選擇參數(shù)值進(jìn)行指定次數(shù)的參數(shù)組合,然后找出泛化誤差最小的一組參數(shù)組合。因此,本文采用隨機(jī)搜索法對(duì)隨機(jī)森林模型進(jìn)行參數(shù)調(diào)優(yōu),并以最優(yōu)參數(shù)組合進(jìn)行模型訓(xùn)練。
對(duì)于模型的預(yù)測(cè)性能,根據(jù) ASHRAE 指南14-2014[12]選取了三個(gè)指標(biāo)評(píng)估預(yù)測(cè)結(jié)果的準(zhǔn)確性:歸一化平均絕對(duì)誤差(NMAE)、累積均方根誤差(CVRMSE)以及擬合優(yōu)度(R2),各項(xiàng)指標(biāo)的計(jì)算公式見(jiàn)式(7)~(9)。
式中:Esi為第i組數(shù)據(jù)的預(yù)測(cè)冷負(fù)荷,k W;Emi為第i組數(shù)據(jù)的實(shí)際冷負(fù)荷,kW;Em為實(shí)際冷負(fù)荷平均值,kW;n為數(shù)據(jù)樣本數(shù)量。
ASHRAE 指南 14-2014 中指出,在使用小時(shí)負(fù)荷預(yù)測(cè)值時(shí),負(fù)荷預(yù)測(cè)模型的NMAE 和CVRMSE 應(yīng)分別保證小于 10%和 30%,此時(shí)模型預(yù)測(cè)的結(jié)果是可接受的。
為分析不同輸入特征組合對(duì)負(fù)荷預(yù)測(cè)模型性能的影響,建立了五組模型,其中時(shí)間特征均包括24 h特征與星期特征。對(duì)于歷史負(fù)荷,考慮到模型的可用性,時(shí)間窗口不宜選擇過(guò)長(zhǎng),故每組模型的歷史負(fù)荷時(shí)間窗口取值范圍為1~4,即采用前1~4 個(gè)時(shí)刻對(duì)應(yīng)的負(fù)荷數(shù)據(jù)作為歷史負(fù)荷特征。每組模型挑選出預(yù)測(cè)性能表現(xiàn)最好的模型進(jìn)行對(duì)比,各組模型性能對(duì)比如表1 所示,各組模型參數(shù)及訓(xùn)練時(shí)間如表2 所示,冷負(fù)荷預(yù)測(cè)準(zhǔn)確度的情況如圖 8 所示,其中黑色虛線為10%誤差線。
表1 各組模型性能對(duì)比情況
表2 各組模型參數(shù)及訓(xùn)練時(shí)間
圖8 冷負(fù)荷預(yù)測(cè)值與實(shí)際值對(duì)比圖
表 1 和表 2 顯示:除模型 1 外,其余模型均能滿足ASHRAE 指南14-2014 要求的性能,且五組模型的訓(xùn)練時(shí)間均不超過(guò)100 s。由表1 的模型2 與模型4 可以看出,在室外溫濕度、時(shí)間、歷史負(fù)荷的基礎(chǔ)上,增加焓值或逗留人數(shù)作為輸入特征均可以提升航站樓負(fù)荷預(yù)測(cè)模型的性能。在模型 3 中,增加原始客流特征——進(jìn)出人數(shù)作為輸入特征并不能提升模型性能,這說(shuō)明進(jìn)出人數(shù)與冷負(fù)荷的相關(guān)性較弱,不能準(zhǔn)確反映冷負(fù)荷的變化規(guī)律。在正確選擇輸入特征的條件下,隨著輸入特征維度的增加,隨機(jī)森林模型的復(fù)雜度反而下降,歷史負(fù)荷的最佳時(shí)間窗口相應(yīng)下降,且由表2 可知,模型訓(xùn)練的效率也相應(yīng)提高。
圖8 顯示了不同模型的預(yù)測(cè)準(zhǔn)確度,各個(gè)模型在低負(fù)荷區(qū)域(0 kW~10000 kW)的準(zhǔn)確度較差,這是由于間歇運(yùn)行系統(tǒng)停機(jī)時(shí)間存在人為操作的隨機(jī)性導(dǎo)致的。隨著輸入特征被正確選取,預(yù)測(cè)值與實(shí)際值的誤差逐漸減小。模型5 在15000 kW~35000 kW 負(fù)荷范圍的預(yù)測(cè)誤差基本控制在10%以?xún)?nèi)。對(duì)模型5 進(jìn)一步分析,各個(gè)輸入特征的貢獻(xiàn)度如圖9 所示。
圖9 模型5 輸入特征貢獻(xiàn)度
由圖 9 可知:負(fù)荷預(yù)測(cè)模型各個(gè)輸入特征中對(duì)預(yù)測(cè)結(jié)果貢獻(xiàn)最大的特征是歷史負(fù)荷,尤其是前 1 h 內(nèi)的負(fù)荷數(shù)據(jù),而時(shí)間間隔超過(guò)1 h 的負(fù)荷數(shù)據(jù)對(duì)預(yù)測(cè)結(jié)果的貢獻(xiàn)較小。需要注意的是:客流特征對(duì)于負(fù)荷預(yù)測(cè)的相關(guān)性?xún)H次于歷史負(fù)荷,甚至高于常用的室外溫濕度特征,這說(shuō)明航站樓等公共交通建筑中客流特征對(duì)于負(fù)荷變化有顯著的影響。此外,氣象特征、時(shí)間特征對(duì)于負(fù)荷預(yù)測(cè)的貢獻(xiàn)相當(dāng),氣象特征中焓值的貢獻(xiàn)度遠(yuǎn)高于溫濕度。這說(shuō)明相比于溫濕度,室外空氣焓值是對(duì)負(fù)荷預(yù)測(cè)更有效的氣象特征。
本文基于隨機(jī)森林建立負(fù)荷預(yù)測(cè)模型,結(jié)合航站樓空調(diào)負(fù)荷特點(diǎn),對(duì)模型輸入特征進(jìn)一步拆分細(xì)化,引入客流特征、室外空氣焓值、時(shí)間 24 h 及星期特征作為輸入特征,利用實(shí)際運(yùn)行數(shù)據(jù)進(jìn)行訓(xùn)練,并對(duì)不同特征組合進(jìn)行分析研究,得到以下結(jié)論:
1)對(duì)于航站樓空調(diào)負(fù)荷,各輸入特征對(duì)預(yù)測(cè)結(jié)果的貢獻(xiàn)度大小排序依次為:前 30 min 負(fù)荷>前 1 h 負(fù)荷 >逗留人數(shù) >室外空氣焓值 >時(shí)間 >室外干球溫度>前1.5 h 負(fù)荷>室外相對(duì)濕度。
2)對(duì)于輸入特征的選擇,客流特征是航站樓等公共交通建筑空調(diào)負(fù)荷的重要影響因素,逗留人數(shù)相比于進(jìn)出人數(shù)更能反映負(fù)荷的變化規(guī)律;前 1 h 內(nèi)的歷史負(fù)荷對(duì)負(fù)荷預(yù)測(cè)的相關(guān)性較高,超過(guò) 1 h 的歷史負(fù)荷對(duì)預(yù)測(cè)結(jié)果的貢獻(xiàn)較小;室外空氣焓值對(duì)于空調(diào)負(fù)荷預(yù)測(cè)結(jié)果的影響比室外溫濕度更加顯著。
3)隨機(jī)森林算法在航站樓負(fù)荷預(yù)測(cè)方面對(duì)多維度輸入特征的適用性較強(qiáng),在正確選擇相關(guān)性較高的輸入特征的前提下,隨著輸入特征維度增加,模型的復(fù)雜度訓(xùn)練效率更高,預(yù)測(cè)性能更好。