潘世英, 丁 鑫, 崔 玥, 呂昊正, 王 童, 馬樂志
(1.濟(jì)南熱力集團(tuán)有限公司, 山東 濟(jì)南 250014; 2.山東睿冠電能熱力有限公司,山東 濟(jì)南 250101; 3.山東魯恒節(jié)能服務(wù)有限公司, 山東 濟(jì)南 250001)
影響建筑物室內(nèi)溫度的因素有地理位置、供熱面積、墻體絕熱性能、用戶用熱習(xí)慣、窗墻比、室外溫度及太陽(yáng)輻射量等,這使得求解變得復(fù)雜[1]。本文將濟(jì)南市供熱用戶作為研究對(duì)象,將供熱介質(zhì)流量、供水溫度、回水溫度、室外溫度作為輸入?yún)?shù),利用SPSS MODELER軟件建立基于MLP神經(jīng)網(wǎng)絡(luò)的室內(nèi)溫度預(yù)測(cè)模型。室內(nèi)溫度預(yù)測(cè)模型可實(shí)現(xiàn)在一定室外溫度和熱網(wǎng)運(yùn)行參數(shù)下,預(yù)測(cè)用戶室內(nèi)溫度,為滿足用戶用熱需求、調(diào)整熱源負(fù)荷提供一個(gè)有效的分析工具。
① MLP神經(jīng)網(wǎng)絡(luò)
MLP多層感知器是一種在單層感知器基礎(chǔ)上增加隱藏層而形成的一種多層前饋網(wǎng)絡(luò),一般由輸入層、隱藏層和輸出層構(gòu)成,每一層全連接到下一層,除了輸入層,每個(gè)層都是一個(gè)帶有非線性激活函數(shù)的神經(jīng)元,多層感知器是一種通用的可擬合復(fù)雜函數(shù)的近似方法[2]。
選定供熱介質(zhì)流量x1、供水溫度x2、回水溫度x3、室外溫度x4作為MLP神經(jīng)網(wǎng)絡(luò)的輸入?yún)?shù),室內(nèi)溫度y作為輸出參數(shù)。MLP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)見圖1,為提高預(yù)測(cè)精度,本文將隱含層設(shè)定為兩層。
圖1 MLP神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
② SPSS Modeler軟件
SPSS Modeler是一款以可視化數(shù)據(jù)為用戶界面的數(shù)據(jù)挖掘軟件,擁有豐富的數(shù)據(jù)挖掘算法,可提供數(shù)據(jù)挖掘相關(guān)的數(shù)據(jù)源、數(shù)據(jù)預(yù)處理(包括數(shù)據(jù)審核、數(shù)據(jù)抽取、數(shù)據(jù)轉(zhuǎn)換)、建模、模型評(píng)估、模型部署等功能,將需要操作的各個(gè)環(huán)節(jié)表示成若干個(gè)節(jié)點(diǎn),數(shù)據(jù)通過圖形化的方式在各個(gè)節(jié)點(diǎn)流動(dòng)形成數(shù)據(jù)流,可以和其他數(shù)據(jù)庫(kù)軟件比較好地兼容、連接[3]。
① 數(shù)據(jù)預(yù)處理
濟(jì)南熱力集團(tuán)有限公司已經(jīng)采集逾3×108組數(shù)據(jù),每一組數(shù)據(jù)均包含供熱介質(zhì)流量、供水溫度、回水溫度、室外溫度。除室外溫度來源于中國(guó)天氣網(wǎng)外,其他數(shù)據(jù)均來自遠(yuǎn)程抄表系統(tǒng)、室內(nèi)溫度采集系統(tǒng)。本文選取含有室內(nèi)溫度的40 000組數(shù)據(jù)(室內(nèi)溫度由室內(nèi)溫度采集系統(tǒng)獲得),按照1∶1比例隨機(jī)分配,分別作為建模數(shù)據(jù)集和驗(yàn)證分析數(shù)據(jù)集,進(jìn)行預(yù)測(cè)模型建模和室內(nèi)溫度預(yù)測(cè)效果后評(píng)價(jià)。
從數(shù)據(jù)源讀取建模數(shù)據(jù)(隨機(jī)選取20 000組數(shù)據(jù)),將供熱介質(zhì)流量、供水溫度、回水溫度、室外溫度設(shè)置為輸入?yún)?shù),將室內(nèi)溫度設(shè)置為輸出參數(shù)。然后對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,主要進(jìn)行缺失值、離群值和極值處理,數(shù)據(jù)預(yù)處理中的參數(shù)設(shè)置見圖2。由預(yù)處理結(jié)果可知,符合要求的數(shù)據(jù)為19 358 組。
圖2 數(shù)據(jù)預(yù)處理中的參數(shù)設(shè)置
② 預(yù)測(cè)模型參數(shù)選擇
建模數(shù)據(jù)集分區(qū)界面見圖3。將建模數(shù)據(jù)集隨機(jī)按5∶3∶2分為訓(xùn)練集、測(cè)試集、驗(yàn)證集。訓(xùn)練集用于訓(xùn)練預(yù)測(cè)模型,測(cè)試集用于測(cè)試已訓(xùn)練好的預(yù)測(cè)模型的泛化能力,驗(yàn)證集用于驗(yàn)證由不同數(shù)量組件組成的預(yù)測(cè)模型精度。
筆者采用便于提高預(yù)測(cè)結(jié)果準(zhǔn)確性的增強(qiáng)方式(boosting)構(gòu)建預(yù)測(cè)模型,預(yù)測(cè)模型構(gòu)建的目標(biāo)選項(xiàng)見圖4。預(yù)測(cè)模型可由多個(gè)組件構(gòu)成,筆者選取了由1~10個(gè)組件構(gòu)成的預(yù)測(cè)模型,對(duì)訓(xùn)練完成的10個(gè)預(yù)測(cè)模型分別進(jìn)行精度驗(yàn)證。
圖3 建模數(shù)據(jù)集分區(qū)界面
圖4 預(yù)測(cè)模型構(gòu)建的目標(biāo)選項(xiàng)
在預(yù)測(cè)模型構(gòu)建的基本選項(xiàng)中(見圖5),將神經(jīng)網(wǎng)絡(luò)模型設(shè)為MLP,兩個(gè)隱藏層,每個(gè)隱藏層的神經(jīng)元數(shù)均為66。在預(yù)測(cè)模型構(gòu)建的終止規(guī)則中,將每個(gè)組件的最大訓(xùn)練時(shí)間設(shè)定為25 min。
③ 模型預(yù)測(cè)結(jié)果驗(yàn)證
經(jīng)過訓(xùn)練,并通過模型泛化能力測(cè)試后,我們對(duì)分別由1~10個(gè)組件組成的預(yù)測(cè)模型進(jìn)行精度驗(yàn)證。在進(jìn)行精度驗(yàn)證時(shí),我們采用平均絕對(duì)誤差作為考核指標(biāo)。平均絕對(duì)誤差越小說明預(yù)測(cè)模型的精度越高,反之精度越低。由精度驗(yàn)證結(jié)果可知,當(dāng)預(yù)測(cè)模型由10個(gè)組件構(gòu)成時(shí),預(yù)測(cè)模型的精度最高。因此,我們采用由10個(gè)組件構(gòu)成的預(yù)測(cè)模型對(duì)室內(nèi)溫度進(jìn)行預(yù)測(cè)。
圖5 預(yù)測(cè)模型構(gòu)建的基本選項(xiàng)
筆者從驗(yàn)證分析數(shù)據(jù)集的20 000組數(shù)據(jù)中隨機(jī)抽取了19組,進(jìn)行預(yù)測(cè)效果驗(yàn)證。預(yù)測(cè)效果驗(yàn)證結(jié)果顯示,預(yù)測(cè)室內(nèi)溫度與實(shí)測(cè)室內(nèi)溫度的平均相對(duì)誤差為-2.27%,基本符合要求。
將濟(jì)南市供熱用戶作為研究對(duì)象,將供熱介質(zhì)流量、供水溫度、回水溫度、室外溫度作為輸入?yún)?shù),利用SPSS MODELER軟件建立基于MLP神經(jīng)網(wǎng)絡(luò)的室內(nèi)溫度預(yù)測(cè)模型,對(duì)預(yù)測(cè)模型的構(gòu)建及預(yù)測(cè)效果后評(píng)價(jià)結(jié)果進(jìn)行分析。預(yù)測(cè)效果驗(yàn)證結(jié)果顯示,預(yù)測(cè)室內(nèi)溫度與實(shí)測(cè)室內(nèi)溫度的平均相對(duì)誤差為-2.27%,基本符合要求。