張?jiān)评?李子昂,馬驤堯,李冬艷
(1.華北科技學(xué)院 計(jì)算機(jī)學(xué)院,北京 東燕郊 065201 2.河北省物聯(lián)網(wǎng)監(jiān)控技術(shù)創(chuàng)新中心,北京 東燕郊 065201)
由于高校宿舍的特殊性,其用電安全是高校安全管理工作的關(guān)鍵部分。而空調(diào)用電在高校宿舍用電占比較大。因此,準(zhǔn)確預(yù)測(cè)空調(diào)用電量對(duì)于用電安全防范、預(yù)防電路過(guò)載導(dǎo)致安全隱患變得尤為重要。對(duì)于高校宿舍而言,如何短期預(yù)測(cè)空調(diào)用電并合理規(guī)劃用電計(jì)劃,避免用電安全隱患,具有極為重要的經(jīng)濟(jì)價(jià)值。在實(shí)際運(yùn)行中,預(yù)測(cè)準(zhǔn)確度和穩(wěn)定性往往是決定預(yù)測(cè)方法好壞的重要因素。
隨著深度學(xué)習(xí)的發(fā)展,循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)[1]在時(shí)間序列數(shù)據(jù)預(yù)測(cè)方面已經(jīng)展現(xiàn)出卓越的性能。RNN是一類以序列數(shù)據(jù)為輸入,在序列的演進(jìn)方向進(jìn)行遞歸且所有節(jié)點(diǎn)(循環(huán)單元)按鏈?zhǔn)竭B接的神經(jīng)網(wǎng)絡(luò),其在時(shí)間維度上進(jìn)行展開(kāi),處理的是序列結(jié)構(gòu)信息。RNN處理時(shí)序信息,若信息之間的依賴關(guān)系時(shí)間跨度過(guò)長(zhǎng),則造成學(xué)習(xí)能力下降,從而造成梯度消失或梯度爆炸[2]問(wèn)題。
為了解決由于信息之間的依賴關(guān)系時(shí)間跨度過(guò)長(zhǎng)造成的梯度消失或梯度爆炸問(wèn)題,長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)[3]對(duì)循環(huán)神經(jīng)網(wǎng)絡(luò)的隱藏層做了改進(jìn),使其能處理長(zhǎng)期依賴關(guān)系信息,LSTM在序列預(yù)測(cè)任務(wù)中表現(xiàn)出優(yōu)異的效果[4]。該網(wǎng)絡(luò)通過(guò)使用門結(jié)構(gòu)控制記憶單元的讀寫操作,可以有效地捕捉時(shí)間序列數(shù)據(jù)中的長(zhǎng)程依賴關(guān)系,具有良好的建模能力。然而,由于LSTM網(wǎng)絡(luò)結(jié)構(gòu)本身的限制,傳統(tǒng)的單向LSTM網(wǎng)絡(luò)在處理時(shí)間序列數(shù)據(jù)時(shí),只能考慮到歷史信息或者未來(lái)的信息。因此,單向LSTM網(wǎng)絡(luò)可能會(huì)遇到一些問(wèn)題,例如在預(yù)測(cè)時(shí)只能考慮到已知?dú)v史數(shù)據(jù),不能很好地預(yù)測(cè)未來(lái)的數(shù)據(jù)。為了解決上述問(wèn)題,提出了雙向LSTM網(wǎng)絡(luò)(Bi-directional LSTM,Bi-LSTM)[5]。Bi-LSTM網(wǎng)絡(luò)由兩個(gè)單向LSTM網(wǎng)絡(luò)組成,分別從正向和反向處理輸入序列。這樣可以在每個(gè)時(shí)間步驟上同時(shí)考慮歷史和未來(lái)的信息,從而提高模型對(duì)時(shí)間序列數(shù)據(jù)的建模能力。在預(yù)測(cè)時(shí),Bi-LSTM網(wǎng)絡(luò)能夠綜合利用歷史和未來(lái)信息,使得模型在進(jìn)行特征提取和擬合時(shí)具有更強(qiáng)的魯棒性和可解釋性,提高了模型的預(yù)測(cè)精度和穩(wěn)定性。該方法能夠有效幫助高校宿舍等公共場(chǎng)所管理部門更準(zhǔn)確地預(yù)測(cè)空調(diào)用電量,提高用電計(jì)劃的制定效率。同時(shí),該方法還有助于優(yōu)化能源使用結(jié)構(gòu),提高用電安全防范,預(yù)防電路過(guò)載導(dǎo)致安全隱患。本文的研究成果對(duì)于推動(dòng)能源智能化和建設(shè)智慧高校具有重要的意義。
本文的主要貢獻(xiàn)在于通過(guò)采集高校宿舍空調(diào)用電數(shù)據(jù),建立了一個(gè)用于短期用電預(yù)測(cè)的數(shù)據(jù)集并使用Bi-LSTM網(wǎng)絡(luò)提取用電量樣本中的時(shí)序信息,并在模型中加入正則化避免出現(xiàn)網(wǎng)絡(luò)退化問(wèn)題。在此基礎(chǔ)上利用該模型對(duì)未來(lái)一天的用電量進(jìn)行預(yù)測(cè),提高了模型的預(yù)測(cè)準(zhǔn)確度和穩(wěn)定性,同時(shí)為短期用電預(yù)測(cè)提供了一種新的思路和方法。在實(shí)際運(yùn)用中,可以根據(jù)具體場(chǎng)景進(jìn)行模型的參數(shù)調(diào)整和結(jié)構(gòu)優(yōu)化,以進(jìn)一步提高模型的性能表現(xiàn)。
本文收集了高校宿舍空調(diào)用電數(shù)據(jù),同時(shí)涵蓋了室外環(huán)境因素的測(cè)量數(shù)據(jù)。這些測(cè)量數(shù)據(jù)包括房間標(biāo)識(shí)、當(dāng)日空調(diào)用電量、最高氣溫、最低氣溫、濕度和降水量等,總共收集了24萬(wàn)條原始數(shù)據(jù)。所有數(shù)據(jù)都是通過(guò)空調(diào)用電監(jiān)測(cè)傳感器和天氣網(wǎng)接口獲取,記錄頻率為1天。但由于實(shí)際采集數(shù)據(jù)中存在噪聲和異常值(見(jiàn)圖1),因此需要進(jìn)行數(shù)據(jù)預(yù)處理和特征提取。本文首先對(duì)數(shù)據(jù)進(jìn)行了負(fù)值的剔除,并對(duì)數(shù)據(jù)分布進(jìn)行了判斷,清除了存在異常值的數(shù)據(jù)。接著使用聚類算法對(duì)宿舍進(jìn)行分類,并為了將數(shù)據(jù)規(guī)范化到相同的范圍內(nèi),對(duì)數(shù)據(jù)進(jìn)行了歸一化處理。
圖1 所有宿舍的每日用電量
圖2 負(fù)數(shù)剔除后的用電量數(shù)據(jù)
在圖1中可以看到,電量數(shù)據(jù)集中存在負(fù)值。在實(shí)際數(shù)據(jù)處理中,這些負(fù)值可能會(huì)導(dǎo)致不便或產(chǎn)生錯(cuò)誤的結(jié)果。因此,一種常見(jiàn)的預(yù)處理方法是剔除負(fù)值并使用0進(jìn)行填充,只考慮數(shù)據(jù)集中的非負(fù)部分。這種方法可以使數(shù)據(jù)處理更加便捷,同時(shí)避免錯(cuò)誤結(jié)果的產(chǎn)生。在本數(shù)據(jù)集中,負(fù)數(shù)代表空調(diào)電費(fèi)充值,由于充值行為由用戶隨機(jī)發(fā)起,且充值電量遠(yuǎn)遠(yuǎn)大于用電量,這些異常值會(huì)影響預(yù)測(cè)效果。因此,需要忽略這些數(shù)據(jù),只關(guān)注實(shí)際消耗的電量,而不考慮損耗和電費(fèi)充值。這種處理方法可以提高模型的穩(wěn)定性和可靠性。
宿舍每日用電量情況如圖3所示。通過(guò)觀察該圖,可以發(fā)現(xiàn)每日用電量在2度以內(nèi)宿舍數(shù)量最多。進(jìn)一步觀察每日用電量0度至0.5度范圍內(nèi)的宿舍數(shù)量分布直方圖,如圖4所示,可以看到每日用電量小于0.05度宿舍數(shù)量極高,這是由于傳感器計(jì)量誤差所導(dǎo)致的。因此,為消除誤差,本文將0.05度內(nèi)的電量視為0度。此外,注意到圖3中每日用電量大于24度的數(shù)據(jù)點(diǎn)分布過(guò)于稀疏,本文將其視為異常值,使用0值將其覆蓋。
圖3 宿舍用電量分布直方圖
圖4 宿舍用電量在0度至0.5度的分布直方圖
即使在相同的氣象條件下,由于不同的課程安排、寢室位置和寢室成員用電行為習(xí)慣的不同,導(dǎo)致不同宿舍的用電量也會(huì)有很大的差異。僅當(dāng)模型學(xué)習(xí)到不同寢室的用電行為習(xí)慣時(shí),才能做出較為準(zhǔn)確的預(yù)測(cè)。如果直接把宿舍編號(hào)輸入模型,模型會(huì)難以學(xué)習(xí)寢室號(hào)與具體用電行為習(xí)慣的對(duì)應(yīng)關(guān)系。因此,本文首先使用聚類算法提取用電行為習(xí)慣,再以one-hot編碼的形式添加到數(shù)據(jù)集中。
聚類算法對(duì)無(wú)標(biāo)簽的樣本數(shù)據(jù)根據(jù)數(shù)據(jù)及其信息關(guān)系,對(duì)數(shù)據(jù)對(duì)象進(jìn)行分組[6]。聚類的最終目的是使組內(nèi)的對(duì)象之間相似,不同組中的對(duì)象之間有區(qū)別[7]。由于不同寢室的用電習(xí)慣各不相同,本文通過(guò)將宿舍109天內(nèi)的用電量數(shù)據(jù)視為其用電習(xí)慣高維表示,并利用PCA[8-9]與t-SNE[10]將其從109維降至2維,之后使用KMeans將它們分為8個(gè)簇,如圖5所示。
圖5 用電行為習(xí)慣聚類
數(shù)據(jù)標(biāo)準(zhǔn)化處理是指將數(shù)據(jù)按照一定的比例縮放到某個(gè)特定區(qū)間內(nèi),使得不同量級(jí)的數(shù)據(jù)能夠具備可比性。這一過(guò)程在數(shù)據(jù)處理和機(jī)器學(xué)習(xí)領(lǐng)域中被廣泛應(yīng)用,原因在于數(shù)據(jù)的量綱和范圍差異大會(huì)影響到算法的性能,而數(shù)據(jù)標(biāo)準(zhǔn)化可以消除這些影響。
首先,不同特征之間的取值范圍不同會(huì)對(duì)機(jī)器學(xué)習(xí)算法的訓(xùn)練產(chǎn)生負(fù)面影響。如果特征之間的取值范圍不同,則不同特征對(duì)距離計(jì)算的貢獻(xiàn)大小也不同,這會(huì)導(dǎo)致算法對(duì)某些特征過(guò)度依賴,從而影響其分類或回歸的準(zhǔn)確性。通過(guò)將不同特征的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,可以使得不同特征對(duì)算法的影響程度相等,使得算法能夠更好地利用所有特征信息進(jìn)行訓(xùn)練。
其次,數(shù)據(jù)標(biāo)準(zhǔn)化還有助于提高模型的收斂速度和穩(wěn)定性。在模型的訓(xùn)練過(guò)程中,模型需要通過(guò)梯度下降等優(yōu)化算法不斷更新模型參數(shù),如果特征之間的取值范圍不同,優(yōu)化算法就可能需要進(jìn)行更多的迭代才能找到最優(yōu)解。如果數(shù)據(jù)集中存在異常值或者極端值,這些值可能會(huì)對(duì)優(yōu)化算法產(chǎn)生過(guò)大的影響,從而導(dǎo)致模型不穩(wěn)定。通過(guò)將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,可以使得優(yōu)化算法更快速地找到最優(yōu)解,并且減少極端值對(duì)模型的影響,從而提高模型的收斂速度和穩(wěn)定性。
由于數(shù)據(jù)集中的特定數(shù)據(jù),如聚類后的類別數(shù)據(jù),標(biāo)準(zhǔn)化會(huì)破壞掉原始信息的語(yǔ)義。因此,本文對(duì)聚類信息使用One-Hot編碼,并且只對(duì)特定數(shù)據(jù),如天氣數(shù)據(jù)以及用電量數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。標(biāo)準(zhǔn)化后的數(shù)據(jù)為:
(1)
式中,μ和σ分別是數(shù)據(jù)集的均值和標(biāo)準(zhǔn)差。
為了構(gòu)建可用于短期用電預(yù)測(cè)的訓(xùn)練數(shù)據(jù)集,我們首先將單條數(shù)據(jù)所對(duì)應(yīng)的各項(xiàng)特征拼接成一個(gè)向量,再將多條數(shù)據(jù)組成一個(gè)時(shí)間序列。本文采用時(shí)間步長(zhǎng)為7的窗口進(jìn)行訓(xùn)練。由于不同寢室的數(shù)據(jù)會(huì)相互干擾,因此需要確保在同一時(shí)間窗口中只包含同一寢室的數(shù)據(jù)。在每個(gè)窗口中,將第7個(gè)時(shí)間步中的用電量使用0進(jìn)行遮蓋,并將真實(shí)值放入訓(xùn)練標(biāo)簽中。此外,本文會(huì)檢測(cè)在前6天中填充標(biāo)記的數(shù)量,如果數(shù)量大于2,則該窗口被判定為有效信息含量過(guò)低,會(huì)被剔除出訓(xùn)練數(shù)據(jù)。
經(jīng)過(guò)上述的負(fù)值剔除、異常值剔除、聚類以及剔除信息含量較低窗口這些數(shù)據(jù)預(yù)處理步驟后,我們得到了一個(gè)包含33551條數(shù)據(jù)的數(shù)據(jù)集。這些數(shù)據(jù)將用于訓(xùn)練和測(cè)試后續(xù)模型的效果。為了驗(yàn)證不同形式的數(shù)據(jù)集對(duì)訓(xùn)練效果的影響,我們?cè)谠紨?shù)據(jù)集基礎(chǔ)上準(zhǔn)備了四種變體,分別命名為數(shù)據(jù)集1、數(shù)據(jù)集2、數(shù)據(jù)集3和數(shù)據(jù)集4(詳情見(jiàn)表1),并使用Bi-LSTM模型進(jìn)行對(duì)比試驗(yàn)。
表1 四種數(shù)據(jù)集的結(jié)構(gòu)
本文將每個(gè)數(shù)據(jù)集根據(jù)寢室進(jìn)行劃分,其中90%的數(shù)據(jù)用作訓(xùn)練集,剩余10%的數(shù)據(jù)則用作測(cè)試集。在訓(xùn)練過(guò)程中,采用時(shí)間滑動(dòng)窗口進(jìn)行訓(xùn)練,每個(gè)批次使用128個(gè)樣本數(shù)據(jù)。
本文首先構(gòu)建了Bi-LSTM模型并進(jìn)行訓(xùn)練,使用Adam優(yōu)化器和均方誤差損失函數(shù)(MSE)對(duì)每個(gè)模型進(jìn)行了80個(gè)輪次的訓(xùn)練。隨后使用基于平均絕對(duì)誤差(MAE)和MSE以及均方根誤差(RMSE)的評(píng)估指標(biāo),評(píng)估了模型在測(cè)試集上的性能,并與其他模型進(jìn)行了比較。計(jì)算式如下:
(2)
(3)
(4)
在圖6中,xt為當(dāng)前時(shí)刻t的輸入,xt-1為前一個(gè)時(shí)刻的輸入,ht和Ct都為隱藏層狀態(tài),其中Ct一般被稱為細(xì)胞狀態(tài)。LSTM隱藏層的三種門控結(jié)構(gòu)可以幫助LSTM模型解決梯度消失問(wèn)題,即遺忘門、輸入門、輸出門[11]。
圖6 LSTM模型結(jié)構(gòu)
(1) 遺忘門
遺忘門以一定的概率選擇是否將先前的細(xì)胞狀態(tài)遺忘,圖6中遺忘門的輸入為時(shí)刻t-1的隱藏狀態(tài)ht-1和時(shí)刻t的輸入xt,輸出ft為遺忘上一個(gè)時(shí)刻細(xì)胞狀態(tài)的概率。公式表示見(jiàn)式(5)。
ft=σ(Wf·[ht-1,xt]+bf)
(5)
(2) 輸入門
it=σ(Wi·[ht-1,xt]+bi)
(6)
(7)
(8)
(3)輸出門
輸出門確定時(shí)刻t需要輸出的值,圖6中Ot可選擇細(xì)胞狀態(tài)的輸出信息,ht則為輸出門的輸出。其公式表示見(jiàn)式(9)、式(10)。
Ot=σ(Wt·[ht-1,xt]+b0)
(9)
ht=Ot·tanh(ct)
(10)
Bi-LSTM模型不僅關(guān)注數(shù)據(jù)的正向特性,還考慮了數(shù)據(jù)的反向特性,因?yàn)橛秒姅?shù)據(jù)具有非常明顯的周期性和季節(jié)性。該模型由正向LSTM和反向LSTM組成,如圖7所示。
圖7 Bi-LSTM模型結(jié)構(gòu)
Bi-LSTM的預(yù)測(cè)結(jié)果由兩個(gè)LSTM的預(yù)測(cè)結(jié)果共同決定,正向LSTM從t時(shí)刻到t+n時(shí)刻正向計(jì)算一遍,并保存正向LSTM每個(gè)隱藏層的輸出,反向LSTM從t+n時(shí)刻到t時(shí)刻反向計(jì)算一遍,并保存反向LSTM每個(gè)隱藏層的輸出,Bi-LSTM模型的輸出結(jié)合正向LSTM和反向LSTM相應(yīng)時(shí)刻的輸出得到最終的輸出結(jié)果。
在進(jìn)行用電量預(yù)測(cè)時(shí),數(shù)據(jù)之間可能存在非線性關(guān)系,同時(shí)預(yù)測(cè)結(jié)果需要保證為正值??紤]這兩個(gè)限制條件,本文使用ReLU(Rectified Linear Unit)作為最后一層的激活函數(shù),參見(jiàn)式(11)。
ReLU激活函數(shù)的優(yōu)點(diǎn)在于它簡(jiǎn)單高效。相較于Sigmoid和Tanh等其他激活函數(shù),ReLU能夠更快地計(jì)算和收斂,從而更好地?cái)M合非線性數(shù)據(jù),提高預(yù)測(cè)的準(zhǔn)確性。在電力需求預(yù)測(cè)任務(wù)中,ReLU截取輸入信號(hào)的負(fù)值記為零,只保留正值,符合預(yù)測(cè)結(jié)果必須為正的要求。
(11)
為了找到最佳的數(shù)據(jù)集和相應(yīng)的最優(yōu)Bi-LSTM模型,本文預(yù)先定義了模型超參數(shù)的搜索空間,見(jiàn)表2。為了確保模型的表示能力逐層遞增,本文規(guī)定每一層的隱藏單元數(shù)量不得少于下一層的隱藏單元數(shù)。這樣做能夠避免網(wǎng)絡(luò)中信息流動(dòng)時(shí)產(chǎn)生較大噪聲,同時(shí)使搜索空間更加合理,并減少不必要的模型超參數(shù)組合的數(shù)量,從而避免了不必要的超參數(shù)搜索。
表2 Bi-LSTM模型的超參數(shù)搜索空間
超參數(shù)搜索空間各自組合成唯一的模型架構(gòu),模型的其他參數(shù)見(jiàn)表3。
表3 模型其他參數(shù)/環(huán)境
在數(shù)據(jù)集1、2、3和4上,對(duì)上述模型分別訓(xùn)練80輪次,并測(cè)量每一種模型的測(cè)試最小MSE、最小MAE和最小RMSE。圖8、圖9和圖10展示了不同數(shù)據(jù)集對(duì)于不同模型的測(cè)試最小MSE、最小MAE和最小RMSE的變化趨勢(shì)。
圖8 四種數(shù)據(jù)集在不同模型上的最小MSE變化趨勢(shì)圖
圖9 四種數(shù)據(jù)集在不同模型上的最小MAE變化趨勢(shì)圖
可以觀察到,在所研究的四個(gè)數(shù)據(jù)集中,數(shù)據(jù)集2和數(shù)據(jù)集4與數(shù)據(jù)集1和數(shù)據(jù)集3之間差異明顯,表明當(dāng)日用電量為零時(shí)將當(dāng)日天氣因素全部置零可以使模型抽取到更多的信息,從而降低模型損失。而數(shù)據(jù)集2與數(shù)據(jù)集4之間差異顯著,這表明當(dāng)日用電量為零時(shí)增加填充可以使模型學(xué)習(xí)到更多的信息。
數(shù)據(jù)集1與數(shù)據(jù)集3之間的差別較小,但數(shù)據(jù)集3相較于數(shù)據(jù)集1表現(xiàn)出更低的最小MSE、最小MAE和最小RMSE指標(biāo)。這表明模型在當(dāng)日用電量為零時(shí)將當(dāng)日天氣因素全部置零并增加填充標(biāo)志的數(shù)據(jù)集3上整體具有更好的預(yù)測(cè)性能。
在數(shù)據(jù)集3中,表4所示模型在最小MSE、最小MAE和最小RMSE方面表現(xiàn)最優(yōu)。該Bi-LSTM模型共包含3層網(wǎng)絡(luò),其中包括2層Bi-LSTM和1層Dense,Bi-LSTM分別包含了128個(gè)和64個(gè)Cell單元。樣本從輸入層進(jìn)入網(wǎng)絡(luò)后,通過(guò)2層Bi-LSTM和1層Dense后得到樣本的回歸值。為了防止過(guò)擬合,在每個(gè)Bi-LSTM中都設(shè)計(jì)了Dropout層,并以0.2的概率隨機(jī)對(duì)權(quán)值進(jìn)行丟棄。
表4 最優(yōu)Bi-LSTM模型架構(gòu)
尋找到合適的數(shù)據(jù)集以及模型后,接下來(lái)將使用最佳數(shù)據(jù)集3和最優(yōu)模型(表4)進(jìn)行模型訓(xùn)練、消融實(shí)驗(yàn)以及多模型對(duì)比。
使用最優(yōu)模型對(duì)最佳數(shù)據(jù)集3進(jìn)行80個(gè)輪次的迭代訓(xùn)練后,圖11展示了訓(xùn)練損失和測(cè)試損失的結(jié)果。在50個(gè)輪次的訓(xùn)練之后,測(cè)試集上的平均平方誤差MSE下降至2.14,平均絕對(duì)值誤差MAE下降至0.79,均方根誤差RMSE下降至1.46。與此相比,本文通過(guò)使用前一日結(jié)果作為預(yù)測(cè)值的基準(zhǔn)線得到的MSE為16.5,MAE為2.22,RMSE為4.06。
圖11 使用最優(yōu)Bi-LSTM模型在數(shù)據(jù)集3上各損失曲線
經(jīng)過(guò)測(cè)試,發(fā)現(xiàn)該模型相比基準(zhǔn)值,MSE下降了87%,MAE下降了64.4%,RMSE下降了64%。這表明該模型具有較強(qiáng)的泛化能力,能夠有效地預(yù)測(cè)宿舍的能耗情況。
消融實(shí)驗(yàn)?zāi)康氖峭ㄟ^(guò)針對(duì)某個(gè)研究變量或因素進(jìn)行系統(tǒng)性排除或削減,從而驗(yàn)證其對(duì)實(shí)驗(yàn)結(jié)果的貢獻(xiàn)或作用。為此,本文采用與表4所示架構(gòu)相同的Bi-LSTM模型進(jìn)行訓(xùn)練。
本文準(zhǔn)備三組消融實(shí)驗(yàn):①組1將使用去除天氣因素(最高溫、最低溫、降水、濕度)后的數(shù)據(jù)集進(jìn)行訓(xùn)練;②組2將使用去除聚類類別數(shù)據(jù)后的數(shù)據(jù)集進(jìn)行訓(xùn)練;③組3將使用1.4節(jié)的數(shù)據(jù)標(biāo)準(zhǔn)化流程來(lái)處理數(shù)據(jù)集進(jìn)行訓(xùn)練。并將三組消融實(shí)驗(yàn)的模型與使用正常數(shù)據(jù)集進(jìn)行訓(xùn)練的模型進(jìn)行對(duì)比。其中MSE、MAE與RMSE如圖12、圖13、圖14所示。
圖12 消融實(shí)驗(yàn)測(cè)試MSE對(duì)比
圖13 消融實(shí)驗(yàn)測(cè)試MAE對(duì)比
圖14 消融實(shí)驗(yàn)測(cè)試RMSE對(duì)比
結(jié)果顯示,在對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化之后最小損失相對(duì)正常數(shù)據(jù)集變化較小,且仍不如正常數(shù)據(jù)集。這是因?yàn)樵摂?shù)據(jù)集并非正態(tài)分布,使用Z-Score后并沒(méi)有帶來(lái)更好的效果。去除天氣因素和聚類類別因素后,效果變差的程度比較明顯。這表明天氣因素和類別因素在該研究中對(duì)實(shí)驗(yàn)結(jié)果有顯著的影響,而聚類因素對(duì)實(shí)驗(yàn)結(jié)果的影響更大,比天氣因素更加顯著。
消除天氣因素后,實(shí)驗(yàn)結(jié)果變差可能是由于天氣對(duì)空調(diào)電量的影響很大。人們會(huì)根據(jù)氣溫變化使用空調(diào),這會(huì)對(duì)實(shí)驗(yàn)結(jié)果產(chǎn)生重要的解釋作用,因此不能忽略它的影響。同時(shí),去除聚類類別因素后,實(shí)驗(yàn)結(jié)果變差也許是由于該因素對(duì)實(shí)驗(yàn)結(jié)果有明顯的影響,去除后可能會(huì)導(dǎo)致實(shí)驗(yàn)結(jié)果誤差增加。因此,在數(shù)據(jù)預(yù)處理中加入天氣因素并進(jìn)行用電聚類,會(huì)大大保證預(yù)測(cè)結(jié)果的準(zhǔn)確性和可靠性。
除此之外本文還訓(xùn)練了決策樹(shù)回歸預(yù)測(cè)模型[13]、XGBoost樹(shù)模型[14]、GRU模型[15]、SimpleRNN[16]模型、單向LSTM模型、全連接網(wǎng)絡(luò)模型以及Transformer模型[17]。其中,GRU模型、SimpleRNN模型、單向LSTM模型以及全連接網(wǎng)絡(luò)模型,都采用了與上文中尋找最優(yōu)Bi-LSTM模型相同的方法和搜索空間分別進(jìn)行最優(yōu)架構(gòu)搜索。Transformer模型則是使用逐參數(shù)搜索來(lái)尋找最優(yōu)架構(gòu),并根據(jù)訓(xùn)練經(jīng)驗(yàn)確定搜索空間,以模型的訓(xùn)練代價(jià)為準(zhǔn)則確定超參數(shù)搜索順序,具體搜索空間見(jiàn)表5。
表5 Transformer模型的超參數(shù)搜索空間
所有模型對(duì)比效果如圖15所示。圖15中Bi-LSTM即本文選用的和表4架構(gòu)相同的模型。觀察結(jié)果表明,通過(guò)Bi-LSTM模型進(jìn)行預(yù)測(cè)所得到的損失值最低,且該模型的泛化能力最強(qiáng)。圖16 展示了使用最優(yōu)模型——Bi-LSTM進(jìn)行的一次宿舍電量預(yù)測(cè)。從圖中可以看到,模型的預(yù)測(cè)和真實(shí)用電趨勢(shì)基本相同,兩者的精度相差不大。因此,該模型表現(xiàn)良好。
圖15 多種模型對(duì)比
圖16 用電量預(yù)測(cè)示意圖
(1) 通過(guò)對(duì)高校空調(diào)用電的數(shù)據(jù)進(jìn)行預(yù)處理和特征提取,進(jìn)一步使用Bi-LSTM循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練和預(yù)測(cè),該方法在預(yù)測(cè)準(zhǔn)確度和穩(wěn)定性方面都表現(xiàn)出顯著的提升。在實(shí)際應(yīng)用中,該方法可以幫助高校宿舍管理部門更精確地預(yù)測(cè)未來(lái)一天的空調(diào)用電量,進(jìn)而有效管理用電計(jì)劃和設(shè)備狀態(tài),實(shí)現(xiàn)安全管理和優(yōu)化設(shè)備使用效率的目標(biāo)。
(2) 本文提出的數(shù)據(jù)預(yù)處理方法和模型在預(yù)測(cè)高校宿舍能源消耗方面具有強(qiáng)大的能力,即使在數(shù)據(jù)較為有限的前提下也表現(xiàn)出了良好的效果,充分證明了該方法在實(shí)際應(yīng)用中可行可靠,并具有廣泛的應(yīng)用前景。未來(lái)將進(jìn)一步研究:如何將該模型方法應(yīng)用于更廣泛的場(chǎng)景,并結(jié)合其他方法進(jìn)行更準(zhǔn)確的電力預(yù)測(cè);擴(kuò)大數(shù)據(jù)集規(guī)模并優(yōu)化模型參數(shù)和結(jié)構(gòu),以提高模型的預(yù)測(cè)能力和性能。