周小琳
(東北電力大學 經(jīng)濟管理學院,吉林 吉林 132012)
用電量需求預測是規(guī)劃電力發(fā)展、指導電力建設的重要依據(jù).準確地預測全社會用電量需求是有效避免電力短缺和電力浪費、保障國家或地區(qū)社會經(jīng)濟系統(tǒng)平穩(wěn)運行的關(guān)鍵.國內(nèi)學者使用多種方法進行用電量需求預測,這些方法各有利弊,但總體上來說,用電量需求預測的方法體系并不完善.時間序列方法,如線性回歸模型、指數(shù)平滑預測模型和趨勢移動平均法、自回歸模型[1]等,其優(yōu)點是參數(shù)少、模型簡單易操作,但是模型的預測精度較低、無法體現(xiàn)天氣等因素引起的非線性變化;支持向量機算法[2~3]能夠最小化結(jié)構(gòu)風險,小樣本情況下泛化能力較強、適用于非線性和高維度問題的短期預測;灰色關(guān)聯(lián)法[4~5]的優(yōu)點是模型算法簡單、參數(shù)少、容易實現(xiàn),但該方法對模型參數(shù)具有較大的敏感性、模型預測精度不高;隨機森林算法[6]和分位數(shù)法[7~8]不僅能夠給予預測對象的確定性預測,還能夠在出現(xiàn)天氣變化等極端事件時保持較高的預測精度,但其缺點是算法復雜、輸入變量多、難以實現(xiàn);神經(jīng)網(wǎng)絡法[9~10]學習能力強、在極端天氣情況下仍然保持較高的預測精度,但模型算法結(jié)構(gòu)復雜、運算量大、容易發(fā)生過擬合,導致泛化能力不足.
假設某一地區(qū)用電量的時間序列為{Yt},如果服從ARMA(n,n)模型,用算子形式可以寫成φ(B)Yt=θ(B)θt.在實際應用中,序列{Yt}除了受自身和白噪聲(εt)滯后的影響外,有時還要受到控制變量{Xt}的滯后影響,從而使模型變成:φ(B)Yt=ρ(B)Xt+θ(B)εt.則此模型稱為受控的自回歸滑動平均模型,簡記為CARMA(n)模型.CARMA(n)模型不僅能夠反映事物發(fā)展的自身運用規(guī)律,還能夠體現(xiàn)復雜系統(tǒng)的動態(tài)特征,具有結(jié)構(gòu)風險最小、適用于小樣本、非線性、有效克服過擬合、泛化推廣能力強、預測精度高的優(yōu)點,但由于辨識CARMA(n)模型比較復雜,實踐中通常假設θ(B)=1,即用一個充分高階的多變量自回歸模型(CAR模型)來逼近并替代CARMA(n)模型,而CAR(n)模型計算簡單、且可以自動辨識.國內(nèi)文獻關(guān)于CAR(n)模型的研究較少,本文試圖把CAR(n)模型應用到用電量需求預測領(lǐng)域,以期找到更加精準的用電量需求預測方法.
CAR(n)模型參數(shù)估計的方法主要包括最小二乘法、遞推最小二乘法、廣義最小二乘法和遞推增廣最小二乘法等.在總干擾的均值為零且相互獨立的條件下,采用最小二乘法或者遞推最小二乘法進行參數(shù)估計.當系統(tǒng)的總干擾是相關(guān)序列時,最小二乘估計和遞推最小二乘估計是非一致估計量,廣義最小二乘法、遞推增廣最小二乘法通過引進一個白色濾波器,把具有相關(guān)性的總干擾轉(zhuǎn)化為白噪聲,從而使得參數(shù)估計保持一致性.P維輸入向量、1維輸出向量的CAR模型可以表述為
(1)
令:B=[φ1,…,φn,ρ10,ρ11,…,ρ1n,…,ρp0,ρp1,…,ρpn]T=[β1,…,βn+(n+1)n]T
置t=n+1,n+2,…,N,并記
YN=(Yn+1,Yn+2,…,YN)T,
EN=(εn+1,εn+2,…,εN)T,
則公式(1)可以寫成:
YN=WNB+EN,
(2)
因此,可用最小二乘法求得N時刻參數(shù)B的最小二乘估計為
(3)
若有新增觀測數(shù)據(jù)(YN+1,XN+1),則從t=1,2,…,N,到時刻N+1時參數(shù)B的遞推最小二乘估計為
(4)
CAR模型可以用F檢驗的方法來確定階數(shù).在給定的觀測數(shù)據(jù)(Xt,Yt),t=1,2,…,N下,可相繼地建立模型CAR(n),n=1,2,…,并比較CAR(n)和CAR(n+1),F(xiàn)統(tǒng)計量為
在給定的顯著性水平α下,當F≥Fα時,拒絕CAR(n),否則接受CAR(n)模型,從而可確定階數(shù)n.
用電需求量與一國的經(jīng)濟規(guī)模、產(chǎn)業(yè)結(jié)構(gòu)和城鎮(zhèn)化率密切相關(guān).本文選取平均每天電力消費量(億千瓦時)代表用電量需求,用elec表示;以國內(nèi)生產(chǎn)總值(億元)代表經(jīng)濟規(guī)模,用GDP表示;以國內(nèi)生產(chǎn)總值中第二產(chǎn)業(yè)產(chǎn)值所占比重和第三產(chǎn)業(yè)產(chǎn)值所占比重代表產(chǎn)業(yè)結(jié)構(gòu),分別用sindrt和tindrt表示;城鎮(zhèn)化率為城鎮(zhèn)人口數(shù)占總?cè)丝跀?shù)的比重,用urbanrt表示.本文全部數(shù)據(jù)均來源于國研網(wǎng)數(shù)據(jù)庫.
為克服異方差性,本文中所有變量均采用對數(shù)形式,選用lnelec作為輸出變量,lnGDP、lnsindrt、lntindrt和lnurbanrt作為輸入變量,構(gòu)建如式(1)所示的1維輸出向量、4維輸入向量的CAR模型.建模所用F檢驗的顯著性水平為0.05,遞推最小二乘法的遺忘因子為1.0,檢驗結(jié)果為F=2.81.定階檢驗中CAR(n)模型和CAR(n+1模型的殘差平方和分別為0.00016和0.00021,定階檢驗的F值為0.07.選定階次全參數(shù)時和剔除不顯著因素后模型的殘差平方和分別為0.00021和0.00023,是否為不顯著因子檢驗的F值為0.45,F(xiàn)(a=0.05)=4.46.剔除不顯著項后的CAR模型為
lnelect= 0.67lnelect-1+0.13lnGDPt+0.25lnsindrts-0.38lnsindrtt-1
0.71lntindrtt+0.51lnurbanrtt+0.32lnurbanrtt-1,
(5)
表1 列出了2001年~2016年我國平均每天電力消費量對數(shù)值的實際值和根據(jù)式(5)計算的擬合值,2001年~2016年,所有年份電力消費量擬合值與觀測值之間的相對誤差均不超過1%,平均誤差僅為0.35%,可以看出,式(5)的整體擬合效果很好,誤差偏離程度非常小,可以用該模型預測我國平均每天電力消費情況.
表1 2001年~2016年中國日均電力消費量對數(shù)值的實際值與擬合值
數(shù)據(jù)來源:作者整理。
本文通過推導1維輸出向量、p維輸入向量的CAR模型,建立日均用電量需求的預測模型,并采用2001年~2016年我國國內(nèi)生產(chǎn)總值、第二產(chǎn)業(yè)產(chǎn)值比重、第三產(chǎn)業(yè)產(chǎn)值比重和城鎮(zhèn)化率的數(shù)據(jù)對模型進行檢驗.結(jié)果顯示,本文構(gòu)建的預測模型中,所有年份電力需求擬合值與觀測值之間的相對誤差均不超過1%,模型預測精度高、擬合效果好,可以用該模型對中國日均用電需求進行預測.