張新生,任明月,陳章政,
(1.西安建筑科技大學(xué) 管理學(xué)院,陜西 西安 710055;2.陜西省新型城鎮(zhèn)化和人居環(huán)境研究院,陜西 西安 710055)
過量排放二氧化碳造成的溫室效應(yīng)對當(dāng)前人類社會(huì)發(fā)展造成了嚴(yán)峻挑戰(zhàn)[1]。2020年,我國提出二氧化碳排放力爭于2030年前達(dá)到峰值,努力爭取2060年前實(shí)現(xiàn)碳中和。2021年,我國為盡早實(shí)現(xiàn)“雙碳”目標(biāo),提出了碳達(dá)峰碳中和“1+N”政策體系,其中“N”為各行業(yè)碳達(dá)峰細(xì)化方案[2]。建筑業(yè)作為我國經(jīng)濟(jì)增長的主要貢獻(xiàn)力量之一,其碳排放也占我國整體碳排放總量的三分之一[3]。隨著我國城鎮(zhèn)化進(jìn)程的腳步逐漸加快,建筑業(yè)碳排放和能源消耗也呈現(xiàn)出穩(wěn)定增長的趨勢,由于其自身較大的減碳潛力和較低的減碳成本使其成為“雙碳”目標(biāo)的關(guān)鍵環(huán)節(jié)。因此,為了更好地實(shí)現(xiàn)“雙碳”目標(biāo),必須對未來建筑業(yè)碳排放進(jìn)行科學(xué)合理的預(yù)測。
由于氣候變暖問題的嚴(yán)重性和迫切性,關(guān)于碳排放的研究已經(jīng)有了長足進(jìn)展,碳排放預(yù)測領(lǐng)域受到了重點(diǎn)關(guān)注[3-4]。
根據(jù)影響因素的不同,分別從單因素預(yù)測、多因素預(yù)測方面進(jìn)行了研究。YANG等[5]以上海客運(yùn)航班的碳排放為研究對象,通過自回歸綜合移動(dòng)平均(ARIMA)線性模型預(yù)測了2017—2022年航空運(yùn)輸燃料消耗量和途中二氧化碳排放量。王陽等[6]以采礦過程中電機(jī)的碳排放研究對象,結(jié)合灰色理論并通過改進(jìn)協(xié)方差函數(shù)的選擇以提高預(yù)測準(zhǔn)確度。雖然單因素預(yù)測取得了較好的效果,但該類方法主要是根據(jù)碳排放自身數(shù)據(jù)的變化結(jié)合預(yù)測方法的創(chuàng)新,不能將外界環(huán)境對其產(chǎn)生的作用考慮在內(nèi),導(dǎo)致預(yù)測結(jié)果過于片面。
在考慮人口、經(jīng)濟(jì)、能源、科技等不同因素對碳排放影響下,國內(nèi)外學(xué)者對其進(jìn)行了相關(guān)研究。HEYDARI等[7]提出了一種結(jié)合灰狼優(yōu)化算法與廣義回歸神經(jīng)網(wǎng)絡(luò)(GRNN)的二氧化碳排放預(yù)測智能方法,研究了伊朗、加拿大和意大利的二氧化碳排放趨勢,但是GRNN自身空間復(fù)雜度較高,計(jì)算較為繁瑣復(fù)雜。QIAO等[8]以具有代表性的部分發(fā)達(dá)國家及發(fā)展中國家為研究對象,結(jié)合獅群算法(LSO)和遺傳算法(GA)優(yōu)化最小二乘支持向量機(jī)(SVM)計(jì)算未來二氧化碳的排放趨勢,但SVM算法的參數(shù)存在強(qiáng)隨機(jī)性,預(yù)測結(jié)果存在較大波動(dòng)性。WEN等[9]利用隨機(jī)森林算法(RF)對商務(wù)部門碳排放的影響因素進(jìn)行分析,并利用離散粒子群算法(DPSO)優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的權(quán)重與偏置,但是BP算法的精度依賴于大量數(shù)據(jù)的訓(xùn)練,對于小樣本問題適用度不高。LI等[10]使用廣義迪氏分解法(GDIM)對建筑業(yè)碳排放進(jìn)行因子分解,并使用STIRPAT模型結(jié)合情景分析法對我國建筑業(yè)碳排放趨勢進(jìn)行預(yù)測,由于碳排放的影響因素間關(guān)聯(lián)程度較大,容易存在多重共線性問題,易產(chǎn)生“偽回歸”現(xiàn)象。MA等[11]首先使用灰色關(guān)聯(lián)法分析與我國碳排放相關(guān)的影響因素,然后構(gòu)建螢火蟲算法優(yōu)化的GM(1, 1)預(yù)測模型。GAO等[12]首先驗(yàn)證美國碳排放數(shù)據(jù)的Gompertz規(guī)律,并利用混沌鯨魚優(yōu)化算法優(yōu)化的GM(1, 1)對美國碳排放進(jìn)行了預(yù)測,雖然灰色模型適用于小樣本問題,但該算法難以保證長時(shí)期的預(yù)測性能。回顧國內(nèi)研究,蘇凱等[13]、張國興等[14]和趙慈等[15]通過環(huán)境經(jīng)濟(jì)學(xué)中的STIRPAT模型分別對黃河流域的交通運(yùn)輸業(yè)、福建省和浙江省的碳排放總量進(jìn)行了分解預(yù)測。胡振等[16]構(gòu)建了基于BP神經(jīng)網(wǎng)絡(luò)的西部城市家庭消費(fèi)碳排放預(yù)測模型,并以西安市為例驗(yàn)證了模型的可行性。徐勇戈等[17]提出了一種模糊布谷鳥算法優(yōu)化支持向量機(jī)(FCS-SVM)的建筑業(yè)碳排放預(yù)測模型。
結(jié)合上述兩點(diǎn)可知,現(xiàn)有研究主要集中于影響因素的更新和預(yù)測方法的改進(jìn),少有研究進(jìn)行碳排放數(shù)據(jù)的預(yù)處理。2021年,張雯等[18]以12個(gè)不同國家為研究對象,結(jié)合LSSVM算法最先將EMD應(yīng)用在碳排放預(yù)測領(lǐng)域并有效提高了預(yù)測精度,但該方法難以處理模態(tài)混疊現(xiàn)象。又由于碳排放數(shù)據(jù)自身的非線性和波動(dòng)性[19-20],單純依靠影響因素的改進(jìn)或預(yù)測方法的改進(jìn)很難完全解決這個(gè)問題。
為了解決上述問題,本文提出了一種集合互補(bǔ)經(jīng)驗(yàn)?zāi)B(tài)分解(complementary ensemble empirical mode decomposition,CEEMD)、麻雀優(yōu)化算法(sparrow search algorithm,SSA)和極限學(xué)習(xí)機(jī)(extreme learning machine,ELM)相結(jié)合的碳排放預(yù)測方法。本文首先運(yùn)用灰色關(guān)聯(lián)分析法(grey relation analysis,GRA)選取與建筑業(yè)碳排放關(guān)聯(lián)程度較大的因素,在ELM預(yù)測的基礎(chǔ)上,通過SSA優(yōu)化ELM的參數(shù)后對我國建筑業(yè)碳排放數(shù)據(jù)進(jìn)行初步預(yù)測,采用CEEMD將原始碳排放數(shù)據(jù)分解為多個(gè)不同振幅的頻率項(xiàng)和一個(gè)殘差項(xiàng),將分解得到的平穩(wěn)信號作為SSA-ELM的最終輸入,最后驗(yàn)證模型的可行性,以期為我國建筑業(yè)碳排放提供一種切實(shí)可行的預(yù)測方法。
根據(jù)住房和城鄉(xiāng)建設(shè)部發(fā)布的《建筑碳排放計(jì)算標(biāo)準(zhǔn)》,建筑碳排放包括但不限于建材的生產(chǎn)運(yùn)輸、建造、拆除等環(huán)節(jié)所產(chǎn)生的溫室氣體總和。建筑業(yè)碳排放可以分為直接碳排放和間接碳排放兩部分[21]。直接碳排放由建筑業(yè)本身消耗的一次能源所產(chǎn)生;間接碳排放與建筑業(yè)上下游企業(yè)高度關(guān)聯(lián),主要是指建筑材料生產(chǎn)制造、運(yùn)輸過程中所產(chǎn)生碳排放。結(jié)合張智慧等[21]、馮博等[22]的研究思路,在充分考慮數(shù)據(jù)獲取可能性的前提下,本文將直接消耗的煤炭、石油、原油等12種能源和其他行業(yè)生產(chǎn)的水泥、鋼材等5種建筑材料所產(chǎn)生的碳排放確定為建筑業(yè)碳排放源,并根據(jù)其研究結(jié)果確定碳排放系數(shù)和建筑材料回收系數(shù)。建筑業(yè)碳排放的測算模型為:
式中:E為建筑業(yè)碳排放總量,ED為直接碳排放,EI為間接碳排放,Ci為第i種能源消耗量,ai為碳排放系數(shù),Gi為第i種建筑材料的使用量,βi為第i種建筑材料的碳排放系數(shù),εi為建筑材料的可回收系數(shù)。記1重量箱玻璃為50千克;鋼材的回收系數(shù)為0.8,鋁材的回收系數(shù)為0.85[22]。選取IPCC為標(biāo)準(zhǔn),能源碳排放系數(shù)見表1。建筑材料碳排放系數(shù)見表2。
表1 能源碳排放系數(shù)表
表2 建筑材料碳排放系數(shù)表
GRA是根據(jù)序列曲線幾何性質(zhì)的相似程度來判斷其聯(lián)系的緊密情況,曲線越接近就證明序列間關(guān)聯(lián)度越大,反之就越小。設(shè)建筑業(yè)碳排放量的時(shí)間序列為X0={y(k)|k=1, 2,…,m},與建筑業(yè)碳排放的相關(guān)的影響因素為Xi={xi(k)|i=1, 2,…,n;k=1, 2,…,m}。則各因素與碳排放的關(guān)聯(lián)度為:
式中:ρ為分辨系數(shù),按慣例取值為0.5;Pi(K)表示各因素與碳排放量的關(guān)聯(lián)系數(shù)。
經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)是HUANG等[23]于1998年首次提出的一種可以有效將非線性序列轉(zhuǎn)化為平穩(wěn)時(shí)序的方法,分解結(jié)果由多個(gè)本征模函數(shù)(IMF)和一個(gè)殘差項(xiàng)(res)組成。WU等[24]提出的集合經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD)改善了EMD容易模態(tài)混疊的問題,但該方法是通過白噪聲與原始時(shí)間序列多次混合,將每個(gè)噪聲序列分解后的IMF的平均值作為最終的IMF,分解的最終結(jié)果易受所添加噪聲的影響。為了解決該問題,YEH等[25]提出了互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解,將白噪聲以正負(fù)對的形式加入原始時(shí)間序列中,以減少分解過程中信息的損失。CEEMD的流程如下:
向原始信號添加N對正高斯白噪聲和負(fù)高斯白噪聲:
其中,S為原始信號,N為高斯白噪聲,M1、M2分別為原始信號與正高斯白噪聲和負(fù)高斯白噪聲之和。然后對目標(biāo)信號進(jìn)行EMD分解,每個(gè)信號得到一組IMF分量,其中第j個(gè)IMF的第i個(gè)分量表示為imfj;最后對整體進(jìn)行平均,獲得每個(gè)IMF的結(jié)果,可以表示為:
因此,CEEMD的最終分解結(jié)果x(t)可表示為:
2005年,HUANG等[26]首次提出的ELM算法是一種新型前饋神經(jīng)網(wǎng)絡(luò),對比傳統(tǒng)前饋型神經(jīng)網(wǎng)絡(luò)模型具有參數(shù)少、速度快、泛化性能好的特點(diǎn)。ELM由輸入層、輸出層和隱藏層組成,通過輸入層與隱藏層之間隨機(jī)生成的連接權(quán)重及閾值建立模型間的聯(lián)系。因此,在模型的訓(xùn)練過程中只需要設(shè)置隱藏層的激活函數(shù)和隱藏層的節(jié)點(diǎn)個(gè)數(shù),便可得到唯一的最優(yōu)解,已經(jīng)被廣泛應(yīng)用在各類預(yù)測及分類問題。其網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 極限學(xué)習(xí)機(jī)網(wǎng)絡(luò)結(jié)構(gòu)圖
對于n個(gè)不同的訓(xùn)練數(shù)據(jù)(Xi,Yi),且Xi=[xi1,xi2,…,xin]T與Yi=[yi1,yi2,…,yin]T。l表示隱藏層中的節(jié)點(diǎn)數(shù),h(x)是激活函數(shù),ELM的輸出可以描述為:
式中:wi是連接輸入層節(jié)點(diǎn)和第i個(gè)隱藏層節(jié)點(diǎn)的權(quán)重,βi是連接第i個(gè)隱藏層節(jié)點(diǎn)和輸出層節(jié)點(diǎn)的權(quán)重,bi是隱藏層中第i個(gè)節(jié)點(diǎn)的閾值層,Qi是ELM網(wǎng)絡(luò)的輸出。將ELM的隱層輸出矩陣設(shè)置為H,則模型的訓(xùn)練結(jié)果在經(jīng)過一定的訓(xùn)練時(shí)間后可以零誤差接近實(shí)際訓(xùn)練數(shù)據(jù):
也可以表示為:
通過最小化近似平方差的方法對連接隱藏層和輸出層權(quán)重β進(jìn)行求解:
ELM中,隱藏層的輸出矩陣H與輸入權(quán)重wi和隱層節(jié)點(diǎn)的偏置bi唯一對應(yīng),那么便可以通過公式(10)獲得最優(yōu)解β*:
式中:β*為輸出權(quán)重,H+為矩陣H的Moore-Penrose廣義逆。
麻雀搜索算法是XUE等[27]受麻雀種群覓食及反捕食啟發(fā)所提出的一種新型智能優(yōu)化算法。SSA可以理解為“發(fā)現(xiàn)者—加入者”模型,并加入了偵查預(yù)警機(jī)制以提高搜索效率,加快模型的收斂速度。相較于其他搜索算法,該算法具有更高效的收斂速度和精度,能夠簡單快速地求解數(shù)值計(jì)算問題。
發(fā)現(xiàn)者作為覓食行為的引領(lǐng)者,遍歷范圍更廣,占整個(gè)種群的10%~20%。在每次進(jìn)行迭代的過程中,發(fā)現(xiàn)者坐標(biāo)的更新方式如式(11)所示。
除發(fā)現(xiàn)者外,剩余麻雀種類皆為加入者,根據(jù)公式(12)更新當(dāng)前位置。
與發(fā)現(xiàn)者的比例相同,具有預(yù)警機(jī)制的麻雀也占整個(gè)種群的10%~20%,其位置更新公式如下所示:
α~N(μ,σ2)是控制步長的參數(shù),K∈[-1, 1]表示麻雀移動(dòng)的方向;為避免出現(xiàn)分母為0的無意義情況,添加一個(gè)極小常數(shù)μ;gi為當(dāng)前麻雀個(gè)體的適應(yīng)度;gb和gw表示全局最優(yōu)適應(yīng)度和全局最差適應(yīng)度。當(dāng)gi≠gw時(shí),表明該麻雀正處于種群的邊緣,極易受到捕食者攻擊;當(dāng)gi=gw時(shí),表明種群中間的麻雀也意識到了危險(xiǎn),需要靠近其他麻雀減少被捕食的概率。
碳排放數(shù)據(jù)的非線性和波動(dòng)性特征使得其在傳統(tǒng)模型的預(yù)測中存在一定的局限性?;贑EEMD技術(shù)、SSA-ELM優(yōu)化模型,本文建立了CEEMD-SSA-ELM的建筑業(yè)碳排放組合預(yù)測模型。首先在對我國建筑業(yè)碳排放進(jìn)行測算的基礎(chǔ)上,通過GRA分析高關(guān)聯(lián)度的影響因素,對建筑業(yè)碳排放量的時(shí)間序列進(jìn)行CEEMD分解,生成一系列不同尺度的IMF分量,實(shí)現(xiàn)碳排放序列的平穩(wěn)化。然后針對不同分量分別選取合適的模型參數(shù),建立SSA-ELM預(yù)測模型,最終將各分量的預(yù)測結(jié)果疊加得到建筑業(yè)碳排放量預(yù)測值?;玖鞒倘鐖D2所示。
圖2 基于CEEMD-SSA-ELM建筑業(yè)碳排放預(yù)測模型
(1)根據(jù)公式(1)計(jì)算我國建筑業(yè)碳排放總量E。
(2)利用灰色關(guān)聯(lián)分析計(jì)算各影響因素與建筑業(yè)碳排放的關(guān)聯(lián)度,并將其排序。
(3)利用CEEMD對原始碳排放數(shù)據(jù)進(jìn)行分解,得到IMF各分量imfj和殘差res。
(4)初始化SSA和ELM模型參數(shù),并根據(jù)公式(11)~(13)更新麻雀種群位置。
(5)分別對各imfj和殘差res建立SSA-ELM回歸模型,選取最佳參數(shù),獲得各分解序列的預(yù)測值。
(6)將各分解序列的預(yù)測結(jié)果疊加獲得建筑業(yè)碳排放預(yù)測值。
(7)與實(shí)際數(shù)據(jù)對比,計(jì)算誤差指標(biāo)并進(jìn)行誤差分析。
為驗(yàn)證模型預(yù)測效果,本文選取均方根誤差(RMSE)、平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)、絕對相關(guān)系數(shù)(R2)作為評價(jià)指標(biāo)。RMSE對于數(shù)據(jù)中的極大、極小值具有較高的敏感性,可有效衡量預(yù)測模型的精度,MAE由于自身絕對值化的離差不會(huì)產(chǎn)生正負(fù)抵消的效果,可有效衡量預(yù)測模型誤差的實(shí)際情況,MAPE可以有效評估每個(gè)數(shù)據(jù)點(diǎn)的平均預(yù)測,R2表示預(yù)測值對于實(shí)際值的擬合優(yōu)劣程度。RMSE、MAE、MAPE三者的值越小,表示模型預(yù)測性能越好,R2的取值范圍為(-∞, 1],計(jì)算結(jié)果越接近于1表示模型擬合效果越好。
式中:yi為樣本i的實(shí)際值,為樣本i的預(yù)測值,為測試集的平均值,n為樣本總個(gè)數(shù)。
由表3可知,本文選取年末總?cè)丝跀?shù)、GDP、城鎮(zhèn)化率、建筑業(yè)總產(chǎn)值、房屋竣工面積、建筑業(yè)勞動(dòng)生產(chǎn)率、建筑企業(yè)從業(yè)人數(shù)、建筑業(yè)一次能源消耗量8個(gè)指標(biāo)作為我國建筑業(yè)碳排放評價(jià)指標(biāo)。本文數(shù)據(jù)來自國家統(tǒng)計(jì)局網(wǎng)站及1995—2021年的《中國統(tǒng)計(jì)年鑒》《中國建筑業(yè)統(tǒng)計(jì)年鑒》《中國能源統(tǒng)計(jì)年鑒》。
表3 碳排放影響因素梳理
將上述影響因素視為比較數(shù)列,我國建筑業(yè)碳排放總量視為參考數(shù)列,通過GRA分析結(jié)果可知,各影響因素與我國建筑業(yè)碳排放關(guān)聯(lián)度最小值為0.928,可視為上述因素與建筑業(yè)碳排放具有較強(qiáng)關(guān)聯(lián)性,關(guān)聯(lián)度計(jì)算結(jié)果見表4。各影響因素按關(guān)聯(lián)程度大小依次排序:建筑業(yè)總產(chǎn)值、GDP、城鎮(zhèn)化率、建筑業(yè)從業(yè)人數(shù)、建筑業(yè)勞動(dòng)生產(chǎn)率、房屋竣工面積、一次能源消耗量、年末總?cè)丝跀?shù)。
表4 灰色關(guān)聯(lián)分析結(jié)果
由圖3可知,1995—2020年,建筑業(yè)碳排放量呈現(xiàn)出“緩慢上升—快速上升—快速下降—波動(dòng)上升”的趨勢,且絕大部分碳排放由間接碳排放產(chǎn)生。換言之,我國建筑業(yè)二氧化碳的主要來源是建筑材料的生產(chǎn)階段。1995—2008年,呈現(xiàn)出上升趨勢,但該階段增速較緩;2008—2012年,我國建筑業(yè)進(jìn)入大力發(fā)展階段,由于城鎮(zhèn)化進(jìn)程的不斷加快,碳排放量也呈現(xiàn)出爆發(fā)式增長,2012年達(dá)到了31萬噸碳排放高峰;隨后建筑業(yè)的高碳趨勢開始回落,2015年碳排放量重新回到16萬噸;2015—2020年,隨著城鎮(zhèn)化腳步的加快,每年的竣工面積隨之增加,2019年的建筑業(yè)碳排放又重新回到了20萬噸。
圖3 1995—2020年建筑業(yè)碳排放量趨勢
通過數(shù)據(jù)分解技術(shù),我國建筑業(yè)碳排放被分解為從高到低的不同頻率模塊,圖4為我國建筑業(yè)碳排放原始數(shù)據(jù)及分解后的具體數(shù)據(jù)情況。最上方的圖為建筑業(yè)碳排放的原始數(shù)列,最下方的圖為分解后的殘差res,剩余各數(shù)列皆為本征模函數(shù)imfj。
圖4 CEEMD分解結(jié)果
根據(jù)圖4可知,我國建筑業(yè)原始碳排放數(shù)據(jù)仍然存在明顯的波動(dòng)性和非線性。imf1和imf2存在較強(qiáng)的波動(dòng)性且波動(dòng)幅度較大,而imf3和殘差項(xiàng)res波動(dòng)則較為平緩且波動(dòng)周期較長。分解后的imfj表現(xiàn)出原始數(shù)據(jù)中的波動(dòng)情況,是數(shù)據(jù)不穩(wěn)定的主要原因,res是數(shù)據(jù)的主要組成部分,與原數(shù)據(jù)中碳排放的發(fā)展趨勢更相符合,也更加平滑穩(wěn)定。
將1995—2020年碳排放數(shù)據(jù)以4∶1的比例分成兩組,選取前20年數(shù)據(jù)作為SSA-ELM的訓(xùn)練集,剩余6組數(shù)據(jù)作為檢驗(yàn)?zāi)P皖A(yù)測能力的測試集。根據(jù)年末總?cè)丝跀?shù)、GDP、城鎮(zhèn)化率、建筑業(yè)總產(chǎn)值、房屋竣工面積、建筑業(yè)勞動(dòng)生產(chǎn)率、建筑企業(yè)從業(yè)人數(shù)、建筑業(yè)一次能源消耗量8個(gè)建筑業(yè)碳排放評價(jià)指標(biāo),分別對每個(gè)imfj和殘差項(xiàng)res建立ELM、SSA-ELM預(yù)測模型,并對碳排放源數(shù)據(jù)建立ELM和SSA-ELM預(yù)測模型,將擬合預(yù)測結(jié)果對比分析,以驗(yàn)證CEEMD-SSA-ELM建筑業(yè)碳排放預(yù)測模型的性能。為消除實(shí)驗(yàn)中其他外在條件的影響,各模型的實(shí)驗(yàn)數(shù)據(jù)均采取最大最小歸一化進(jìn)行標(biāo)準(zhǔn)化,激活函數(shù)選擇Sigmoid函數(shù)。選取麻雀種群數(shù)為40,預(yù)警值設(shè)為0.7,發(fā)現(xiàn)者和偵察者比例均設(shè)置為0.15。由上述分析可知,本文建立模型的設(shè)置輸入層節(jié)點(diǎn)為8,輸出層節(jié)點(diǎn)為1,隱藏層節(jié)點(diǎn)根據(jù)經(jīng)驗(yàn)公式進(jìn)行計(jì)算,公式如下:
式中:M為隱層節(jié)點(diǎn)個(gè)數(shù),m為輸入節(jié)點(diǎn)個(gè)數(shù),n為輸出節(jié)點(diǎn)個(gè)數(shù),a為0~10之間的任意常數(shù)。通過計(jì)算可知,隱層節(jié)點(diǎn)個(gè)數(shù)在3~13為宜,對每個(gè)所建立模型重復(fù)訓(xùn)練15次,保留預(yù)測結(jié)果并計(jì)算平均相對誤差,選取平均相對誤差最小的模型為最終預(yù)測模型。
按照上述步驟設(shè)置模型參數(shù),輸入預(yù)處理數(shù)據(jù)并模型訓(xùn)練,將輸出數(shù)據(jù)逆歸一化并對各模型預(yù)測結(jié)果進(jìn)行分析,各模型預(yù)測結(jié)果對比見圖5,相對誤差圖見圖6。
圖5 預(yù)測結(jié)果對比圖
由圖5可知,在測試及樣本數(shù)據(jù)中,利用CEEMDSSA-ELM模型的擬合曲線進(jìn)行建筑業(yè)二氧化碳排放預(yù)測的效果優(yōu)于其他模型。SSA-ELM與CEEMD-ELM擬合度稍差,而單一的ELM模型在此次模型對比過程中,擬合效果最差,與真實(shí)值存在較大偏差。結(jié)合圖6和表5的分析結(jié)果可知,CEEMD-SSA-ELM的預(yù)測相對誤差均小于其他預(yù)測模型。通過對比各模型相對誤差的平均值可知,ELM、CEEMD-ELM、SSA-ELM、CEEMDSSA-ELM的平均相對誤差分別為:2.41%、1.85%、1.57%、1.16%,CEEMD-SSA-ELM的平均相對誤差明顯低于其他預(yù)測模型且該模型的最大相對誤差為2.7%,再次證明該模型的預(yù)測精度最高。
表5 2015—2020年各模型相對誤差對比
為進(jìn)一步對比模型預(yù)測性能,選用3.2節(jié)的四個(gè)統(tǒng)計(jì)學(xué)指標(biāo)進(jìn)行評價(jià),分析結(jié)果見表6。CEEMD-SSAELM的均方根誤差比CEEMD-ELM、SSA-ELM及單一的ELM模型分別低了1 490.06噸、1 395.43噸、2 253.63噸二氧化碳排放量,且其決定系數(shù)為0.948,高于三個(gè)對照模型,另外本文所選MAE、MAPE指標(biāo)遠(yuǎn)低于其他模型。分別對比CEEMD-ELM和ELM、CEEMDSSA-ELM和SSA-ELM可知,經(jīng)過互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解建立的模型大幅提高了預(yù)測精度,預(yù)測趨勢更優(yōu),預(yù)測值與真實(shí)值的偏離更小。因此,CEEMD-ELM相較于單一的ELM和經(jīng)過單一優(yōu)化過的SSA-ELM和CEEMD-ELM預(yù)測模型預(yù)測精度更高,結(jié)果更穩(wěn)定,模型泛化能力更強(qiáng)。
表6 模型性能評價(jià)指標(biāo)對比
建筑業(yè)作為我國碳減排的重點(diǎn)行業(yè)之一,其預(yù)測結(jié)果的精準(zhǔn)對我國“3060”目標(biāo)實(shí)現(xiàn)及節(jié)能減排有著重要意義。本文首先采取灰色關(guān)聯(lián)分析驗(yàn)證與建筑業(yè)碳排放高度關(guān)聯(lián)的因素,使用CEEMD將建筑業(yè)原數(shù)據(jù)分解為多個(gè)時(shí)間序列,使用SSA-ELM對每個(gè)序列進(jìn)行分別建模,最后將所有分解序列進(jìn)行集成匯總獲得最終建筑業(yè)碳排放預(yù)測數(shù)據(jù)。本文的主要結(jié)論如下:
(1)采用SSA對ELM的權(quán)重及偏置進(jìn)行優(yōu)化,解決了ELM算法自身參數(shù)選擇的強(qiáng)隨機(jī)性問題,有效提高了模型的預(yù)測精度。相較于單一的ELM算法,SSAELM的RMSE降低了1 440.23噸,MAE降低了858.2噸,MAPE降低了0.833%,R2提高了0.087,說明SSAELM具有更好的全局尋優(yōu)能力和泛化能力。
(2)將CEEMD引入到建筑業(yè)碳排放量預(yù)測領(lǐng)域,有效緩解了碳排放數(shù)據(jù)的波動(dòng)性與非線性,大幅度提高了模型的擬合效果。通過CEEMD將建筑業(yè)碳排放源數(shù)據(jù)分解為3個(gè)更平穩(wěn)的IMF和一個(gè)殘差項(xiàng),其中imf1和imf2反映了數(shù)據(jù)的波動(dòng)特點(diǎn),imf3和res則表示建筑業(yè)碳排放的長期趨勢,分別對其建立SSA-ELM預(yù)測模型,成功驗(yàn)證該模型可以有效應(yīng)用在碳排放預(yù)測領(lǐng)域。
(3)由于建筑業(yè)碳排放的影響因素眾多,且間接碳排放占建筑業(yè)碳排放的絕大部分,后續(xù)研究可以進(jìn)一步考慮更多影響因素,如建筑業(yè)上下游的行業(yè)發(fā)展?fàn)顩r、綠色清潔能源的使用或其他建筑業(yè)發(fā)展指標(biāo)等。