魏 欣, 郝江鋒, 陳華友, 朱家明
(1.安徽大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,安徽 合肥 230601; 2.巢湖學(xué)院 數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,安徽 合肥 238000; 3.安徽大學(xué) 互聯(lián)網(wǎng)學(xué)院,安徽 合肥 230039)
由于傳統(tǒng)的單項(xiàng)預(yù)測(cè)方法所利用的信息較少,一旦單項(xiàng)預(yù)測(cè)方法選擇錯(cuò)誤,就會(huì)給預(yù)測(cè)帶來(lái)較大誤差。因此文獻(xiàn)[1]在1969年首次提出了組合預(yù)測(cè)方法。所謂組合預(yù)測(cè)就是將不同的單項(xiàng)預(yù)測(cè)模型的預(yù)測(cè)結(jié)果,利用加權(quán)算術(shù)平均、加權(quán)幾何平均或加權(quán)調(diào)和平均等加權(quán)平均形式進(jìn)行組合,在一定的優(yōu)化準(zhǔn)則下構(gòu)建相應(yīng)的數(shù)學(xué)模型,其目的是綜合利用各種單項(xiàng)預(yù)測(cè)模型所提供的有效信息。組合預(yù)測(cè)方法逐漸得到學(xué)者們的關(guān)注,而前期對(duì)組合預(yù)測(cè)的研究大多是對(duì)單點(diǎn)值的研究,然而在現(xiàn)實(shí)世界中,會(huì)出現(xiàn)很多不確定的信息,此時(shí)若只考慮一個(gè)數(shù)值,則會(huì)引起較大的誤差。文獻(xiàn)[2]給出了區(qū)間數(shù)的運(yùn)算法則;文獻(xiàn)[3]通過(guò)區(qū)間數(shù)的形式描述了組合預(yù)測(cè)模型,建立了相應(yīng)的區(qū)間型組合預(yù)測(cè)模型,結(jié)果表明,該模型具有更好的預(yù)測(cè)效果。
一些傳統(tǒng)的組合預(yù)測(cè)方法往往對(duì)不同的單項(xiàng)預(yù)測(cè)方法賦予固定的權(quán)系數(shù),這種賦權(quán)方法是默認(rèn)不同的單項(xiàng)預(yù)測(cè)方法在各個(gè)時(shí)刻的表現(xiàn)大體相同,實(shí)際上不同的單項(xiàng)預(yù)測(cè)方法在不同時(shí)刻的預(yù)測(cè)精度并不相同,因此傳統(tǒng)的固定權(quán)系數(shù)的組合預(yù)測(cè)模型存在賦權(quán)缺陷。
文獻(xiàn)[4]提出了誘導(dǎo)有序加權(quán)平均(induced ordered weighted averaging,IOWA)算子的概念;在此基礎(chǔ)上,文獻(xiàn)[5]對(duì)區(qū)間數(shù)的組合預(yù)測(cè)進(jìn)行了初步的研究,建立了基于IOWA算子的區(qū)間預(yù)測(cè)模型,該模型考慮了不同時(shí)點(diǎn)的預(yù)測(cè)精度,將預(yù)測(cè)精度作為誘導(dǎo)變量對(duì)各種單項(xiàng)預(yù)測(cè)方法進(jìn)行有序加權(quán)平均,提高了預(yù)測(cè)精度;文獻(xiàn)[6]則將誘導(dǎo)有序加權(quán)平均(IOWA)算子和連續(xù)有序加權(quán)平均(continuous ordered weighted averaging,COWA)算子結(jié)合,提出了誘導(dǎo)連續(xù)有序加權(quán)平均(induced continuous ordered weighted averaging,ICOWA)算子,并進(jìn)行了相應(yīng)的實(shí)例分析,提高了預(yù)測(cè)的精度。
現(xiàn)有的組合預(yù)測(cè)方法有關(guān)權(quán)系數(shù)的計(jì)算中,實(shí)際應(yīng)用較多的是最小方差法,并且大部分是用絕對(duì)誤差作為準(zhǔn)則來(lái)計(jì)算組合預(yù)測(cè)方法的權(quán)系數(shù),這些方法大多是為了改善某種擬合的誤差而建立起來(lái)的。文獻(xiàn)[7]詳細(xì)分析了組合預(yù)測(cè)模型權(quán)重的計(jì)算方法,實(shí)際上預(yù)測(cè)有效度也是反映預(yù)測(cè)精度的有效指標(biāo)之一;文獻(xiàn)[8]提出基于預(yù)測(cè)有效度的組合預(yù)測(cè)模型。預(yù)測(cè)有效度分為一階預(yù)測(cè)有效度和二階預(yù)測(cè)有效度。一階預(yù)測(cè)有效度主要考慮預(yù)測(cè)模型的精度,但一個(gè)好的預(yù)測(cè)方法,不但要求在預(yù)測(cè)精度上有良好的表現(xiàn),而且要求在預(yù)測(cè)精度的穩(wěn)定性上表現(xiàn)良好,為此提出二階預(yù)測(cè)有效度的概念[7]。
本文是在不確定信息的背景下,將二階預(yù)測(cè)有效度指標(biāo)和ICOWA算子相結(jié)合,以各模型的預(yù)測(cè)精度作為誘導(dǎo)值進(jìn)行集結(jié),建立了基于二階預(yù)測(cè)有效度的ICOWA算子的區(qū)間組合預(yù)測(cè)模型。該模型將二階預(yù)測(cè)有效度的極大化作為目標(biāo)函數(shù),最后通過(guò)實(shí)例驗(yàn)證了該模型的可行性。
定義1[9]設(shè)a=[aL,aU]={x|aL≤x≤aU},其中aL,aU為實(shí)數(shù),則稱(chēng)a為一個(gè)區(qū)間數(shù)。
記m=(aL+aU)/2,r=(aU-aL)/2,則稱(chēng)m為區(qū)間的中心r為區(qū)間的半徑,區(qū)間數(shù)可記為a=[aL,aU]=(m;r)。
若有2個(gè)區(qū)間數(shù):
a=[aL,aU]=(m1;r1),
b=[bL,bU]=(m2;r2),λ∈R,
則它們之間的運(yùn)算法則如下。
加法運(yùn)算:
a+b=[aL+bL,aU+bU]=
(m1+m2;r1+r2);
減法運(yùn)算:
a-b=[aL-bU,aU-bL]=
(m1-m2;r1-r2);
數(shù)乘運(yùn)算:
定義2[10]設(shè)[a,b]為區(qū)間數(shù),令
(1)
則稱(chēng)FQ為連續(xù)有序加權(quán)平均(COWA)算子。其中函數(shù)Q: [0, 1]→[0, 1]為基本單位區(qū)間單調(diào)(basic unit monotonous,BUM)函數(shù),滿足Q(0)=0、Q(1)=1;且若x>y,則Q(x)≥Q(y)。
FQ([a,b])=λb+(1-λ)a。
定義3[9]設(shè)f:Ω+→R+,其中,Ω+={[a,b]|,a∈R+,b∈R+,a
f(〈u1,[a1,b1]〉,〈u2,[a2,b2]〉,…,
(2)
則稱(chēng)[ai,bi](i=1,2,…,n)為誘導(dǎo)連續(xù)區(qū)間有序加權(quán)平均(ICOWA)算子。其中,l=(l1,l2,…,ln)是與[ai,bi](i=1,2,…,n)有關(guān)的加權(quán)向量,滿足非負(fù)性和歸一化;[ai,bi](i=1,2,…,n)稱(chēng)為誘導(dǎo)變量;u-index(i)是u1,u2,…,un中第i大數(shù)所對(duì)應(yīng)的下標(biāo)。
ICOWA算子的基本特征是利用COWA算子對(duì)區(qū)間數(shù)據(jù)[ai,bi](i=1,2,…,n)進(jìn)行集成之后,再對(duì)集成的結(jié)果利用IOWA算子進(jìn)行誘導(dǎo)有序加權(quán)平均。
設(shè)某社會(huì)經(jīng)濟(jì)現(xiàn)象的時(shí)間序列指標(biāo)觀察值為{xt|t=1,2,…,N},其中xt=[at,bt]=(mt;rt),有m種單項(xiàng)預(yù)測(cè)方法對(duì)其進(jìn)行預(yù)測(cè)。xit=[ait,bit]=(mit;rit)為第i種預(yù)測(cè)方法在第t時(shí)刻上的區(qū)間預(yù)測(cè)值,i=1,2,…,m;t=1,2,…,N。eit為第i種預(yù)測(cè)方法在第t時(shí)刻的預(yù)測(cè)相對(duì)誤差,Ait=1-|eit|為第i種預(yù)測(cè)方法在第t時(shí)刻的預(yù)測(cè)精度。
定義4[11]稱(chēng)Mi=E(Ai)(1-σ(Ai))為第i種預(yù)測(cè)方法的二階預(yù)測(cè)有效度,i=1,2,…,m,其中
(3)
定義5[12]令
(4)
則稱(chēng)uit為第i種單項(xiàng)預(yù)測(cè)方法在第t時(shí)刻的預(yù)測(cè)精度,i=1,2,…,m;t=1,2,…,N。
顯然uit∈[0,1],可以把uit當(dāng)作預(yù)測(cè)值[ait,bit]的誘導(dǎo)值,即根據(jù)每一個(gè)uit與之相應(yīng)的預(yù)測(cè)值[ait,bit],構(gòu)成m個(gè)二維數(shù)組〈u1t,[a1t,b1t]〉, 〈u2t,[a2t,b2t]〉, …,〈umt,[amt,bmt]〉。
由定義2可以得到,由實(shí)際區(qū)間值及COWA算子生成的t時(shí)刻的實(shí)際集結(jié)值FQ(xt)=FQ([at,bt])和各單項(xiàng)預(yù)測(cè)方法在t時(shí)刻預(yù)測(cè)值的集結(jié)值FQ(xit)=FQ([ait,bit]);再由定義3,可以得到ICOWA算子生成的t時(shí)刻的組合預(yù)測(cè)值,計(jì)算公式為:
(5)
定義6[13]令
i=1,2,…,m;t=1,2,…,N
(6)
則稱(chēng)eit為第i種單項(xiàng)預(yù)測(cè)方法在第t時(shí)刻基于連續(xù)有序加權(quán)平均(COWM)算子的區(qū)間預(yù)測(cè)的相對(duì)誤差。
i=1,2,…,m;t=1,2,…,N
(7)
則稱(chēng)eu-index(it)為由區(qū)間預(yù)測(cè)精度序列u1t,u2t,…,umt作為誘導(dǎo)變量所產(chǎn)生的第i大的基于ICOWA算子的預(yù)測(cè)相對(duì)誤差。
由(5)~(7)式可得組合預(yù)測(cè)的相對(duì)誤差為:
(8)
設(shè)At為第t時(shí)刻的組合預(yù)測(cè)精度,則有:
At=1-|et|=
根據(jù)定義4,基于ICOWA算子的組合預(yù)測(cè)的二階預(yù)測(cè)有效度M為:
M=E(A)(1-σ(A))=
其中,E(A)為組合預(yù)測(cè)方法的預(yù)測(cè)精度序列的數(shù)學(xué)期望;σ(A)為預(yù)測(cè)精度序列的標(biāo)準(zhǔn)差。顯然,E(A)和σ(A)是各種單項(xiàng)預(yù)測(cè)方法加權(quán)系數(shù)l1,l2,…,lm的函數(shù),因此M也是l1,l2,…,lm的函數(shù),記為M(l1,l2,…,lm)。
一般地,M(l1,l2,…,lm)越大表示組合預(yù)測(cè)方法越有效,因此基于二階預(yù)測(cè)有效度的ICOWA算子的區(qū)間組合預(yù)測(cè)模型可表示為:
(9)
文獻(xiàn)[14]針對(duì)實(shí)數(shù)型預(yù)測(cè)有效度的組合預(yù)測(cè)模型探討了其近似求解算法。本文建立的模型(9) 式也是關(guān)于權(quán)系數(shù)的非線性規(guī)劃問(wèn)題,且目標(biāo)函數(shù)是非光滑的。在文獻(xiàn)[14]的基礎(chǔ)上,可以得到基于二階預(yù)測(cè)有效度的ICOWA算子的區(qū)間組合預(yù)測(cè)模型預(yù)測(cè)精度序列的一個(gè)性質(zhì)。
定理1 模型(9)式組合預(yù)測(cè)方法的預(yù)測(cè)精度序列{At|t=1,2,…,N}的數(shù)學(xué)期望E(A)和標(biāo)準(zhǔn)差σ(A)滿足:
(10)
其中,Aa-index(it)=1-|ea-index(it)|為ICOWA算子在第t時(shí)刻的預(yù)測(cè)精度。
證明設(shè)ea-index(it)為ICOWA算子的預(yù)測(cè)相對(duì)誤差,i=1,2,…,m;t=1,2,…,N,則有:
因此
(11)
(12)
考慮到雙重求和符號(hào)的可交換性,則有:
(13)
從而由(12)式、(13)式得:
注意到(11)式,存在α0∈[0,1],使得:
因此有:
(14)
將(14)式代入到標(biāo)準(zhǔn)差σ(A),則有:
(15)
其中
[Aa-index(jt)-E(Aa-index(jt))]}
(16)
即pij為ICOWA算子預(yù)測(cè)精度序列的相關(guān)系數(shù)。因?yàn)閜ij∈[-1,1],所以有:
(17)
綜上,定理1證畢。
按照定理1,組合預(yù)測(cè)模型可以表示為如下新的非線性規(guī)劃模型:
(18)
其中,α0∈[0,1]為常數(shù)。模型(18)式比模型(9)式更加簡(jiǎn)潔,易于求解。
為了說(shuō)明本文提出的基于二階預(yù)測(cè)有效度的ICOWA算子的組合預(yù)測(cè)模型的有效性,引用文獻(xiàn)[9]中的數(shù)據(jù)進(jìn)行實(shí)例分析,實(shí)例分析數(shù)據(jù)見(jiàn)表1所列。
表1 實(shí)際區(qū)間值和單項(xiàng)預(yù)測(cè)方法的預(yù)測(cè)區(qū)間值
以下就實(shí)例分析計(jì)算步驟進(jìn)行簡(jiǎn)要說(shuō)明。
根據(jù)(4)式,計(jì)算出各單項(xiàng)預(yù)測(cè)方法在各個(gè)時(shí)刻點(diǎn)處的預(yù)測(cè)精度值序列,見(jiàn)表2所列。
表2 單項(xiàng)預(yù)測(cè)方法的預(yù)測(cè)精度值序列
根據(jù)各單項(xiàng)預(yù)測(cè)方法在某一時(shí)刻的預(yù)測(cè)精度,將預(yù)測(cè)精度按照從小到大排序,進(jìn)而可以得到預(yù)測(cè)精度所對(duì)應(yīng)的預(yù)測(cè)區(qū)間[au-index(it),bu-index(it)]的數(shù)據(jù),見(jiàn)表3所列。
根據(jù)(5)式,計(jì)算出各單項(xiàng)預(yù)測(cè)方法的預(yù)測(cè)相對(duì)誤差和預(yù)測(cè)精度序列,見(jiàn)表4所列,再根據(jù)所得到的預(yù)測(cè)區(qū)間的排序值,計(jì)算出預(yù)測(cè)相對(duì)誤差和預(yù)測(cè)精度序列的排序值,見(jiàn)表5所列。
表3 由預(yù)測(cè)精度排序所得到的預(yù)測(cè)區(qū)間值的排序
表4 各單項(xiàng)預(yù)測(cè)方法的相對(duì)誤差和預(yù)測(cè)精度序列
表5 由預(yù)測(cè)精度排序得到的相對(duì)誤差和預(yù)測(cè)精度序列
由(3)式和(16)式計(jì)算可得:
p12=p21=0.411 2;p13=p31=-0.265 5;
p23=p32=-0.256 6。
將上述值代入模型(18)式可得最優(yōu)模型如下:
2l1l2×1.28 86×10-3+2l1l3×
(-5.043×10-4)+
其中,l1+l2+l3=1;l1≥0,l2≥0,l3≥0。
取α0=0.1,利用lingo優(yōu)化軟件計(jì)算得到組合預(yù)測(cè)的權(quán)系數(shù)為:
l1=1,l2=0,l3=0,M=0.995 0。
由此可以發(fā)現(xiàn),l2=0,l3=0并不代表它是冗余預(yù)測(cè)模型,而是表明未來(lái)的組合預(yù)測(cè)是把這3種單項(xiàng)預(yù)測(cè)方法的預(yù)測(cè)值中精度高的作為其新的預(yù)測(cè)值。
為了更好地評(píng)定模型效果,根據(jù)預(yù)測(cè)的評(píng)價(jià)原則,分別計(jì)算模型1、模型2、模型3以及本文預(yù)測(cè)方法的各預(yù)測(cè)精度指標(biāo)[15]。
平均區(qū)間位置誤差平方和:
平均區(qū)間長(zhǎng)度誤差平方和:
平均區(qū)間誤差平方和:
MSEI=MSEP+MSEL=
平均區(qū)間相對(duì)誤差和:
計(jì)算結(jié)果見(jiàn)表6所列。
表6 各模型精度比較
從表6可以看出,本文所提出的組合預(yù)測(cè)方法預(yù)測(cè)誤差指標(biāo)值除了MSEL均低于另外3種單項(xiàng)預(yù)測(cè)方法,說(shuō)明本文提出的方法的預(yù)測(cè)效果更好。
為了進(jìn)一步說(shuō)明本文提出的組合預(yù)測(cè)模型的有效性,引用合肥市2018年12月空氣質(zhì)量指數(shù)作為原始數(shù)據(jù),運(yùn)用支持向量回歸(support vectaregression,SVR)、平滑轉(zhuǎn)移自回歸(smoothtransition autoregression,STAR)、Holt指數(shù)平滑法作為單項(xiàng)預(yù)測(cè)方法對(duì)原始數(shù)據(jù)進(jìn)行預(yù)測(cè),結(jié)果見(jiàn)表7所列。
按照上例所示方法進(jìn)行同樣計(jì)算,可得組合預(yù)測(cè)結(jié)果,將各單項(xiàng)預(yù)測(cè)方法和組合預(yù)測(cè)方法的誤差進(jìn)行比較分析,見(jiàn)表8所列。
表7 實(shí)際區(qū)間值和單項(xiàng)預(yù)測(cè)方法的預(yù)測(cè)區(qū)間值
表8 各模型精度比較
從表8可以看出,本文所提出的組合預(yù)測(cè)方法預(yù)測(cè)誤差指標(biāo)值除了MSEL均明顯低于另外3種單項(xiàng)預(yù)測(cè)方法,進(jìn)一步說(shuō)明本文提出方法的預(yù)測(cè)效果更好。
本文將二階預(yù)測(cè)有效度和ICOWA算子相結(jié)合,構(gòu)建了一個(gè)新的變權(quán)組合預(yù)測(cè)模型;將二階預(yù)測(cè)有效度引入到區(qū)間組合預(yù)測(cè),并用實(shí)例進(jìn)行了分析,驗(yàn)證了本文提出的組合預(yù)測(cè)模型的有效性。實(shí)驗(yàn)結(jié)果表明,本文方法能夠綜合利用各單項(xiàng)預(yù)測(cè)方法所提供的有效信息,是優(yōu)性組合預(yù)測(cè)模型。