吳正鵬,陳見(jiàn)柯,柴劍平
(中國(guó)傳媒大學(xué)數(shù)據(jù)科學(xué)與智能媒體學(xué)院,北京 100024)
自古以來(lái),人們就關(guān)注著基于現(xiàn)有記錄的對(duì)即將到來(lái)事情的預(yù)測(cè)。隨著科學(xué)技術(shù)的發(fā)展,人們現(xiàn)在生活在一個(gè)“大數(shù)據(jù)”時(shí)代。盡管如此,馬鑫最近發(fā)布的一篇論文聲稱,基于小樣本的高效學(xué)習(xí)仍有可能訓(xùn)練智能AI,大數(shù)據(jù)不應(yīng)該是高效AI 的唯一途徑[12]。此外,由于這些高速的發(fā)展,自然會(huì)出現(xiàn)新的現(xiàn)象和問(wèn)題(例如,二氧化碳排放標(biāo)準(zhǔn)、網(wǎng)絡(luò)突發(fā)輿論、能源消耗等),應(yīng)該有快速且高效的應(yīng)急設(shè)施。就像可怕的自然災(zāi)害一樣,相關(guān)的靜態(tài)結(jié)果可能是不完整的,或者是不充分的。因此,關(guān)于小信息量的預(yù)測(cè)問(wèn)題仍然存在很多情況。
20 世紀(jì)80 年代,鄧聚龍?zhí)岢隽嘶疑到y(tǒng)理論[3,4],為解決信息貧乏情況下的小樣本預(yù)測(cè)問(wèn)題提供了一種新的方法。GM(1,1)模型,即一元一階灰色模型,在整個(gè)理論中起著至關(guān)重要的作用。鄧還給出了原始GM(1,1)模型的幾種不同形式。此后,許多學(xué)者繼續(xù)為這一理論發(fā)展不同的模型[9,10]。到目前為止,在理論修改(例如,尋找更好的模擬和預(yù)測(cè)結(jié)果[25])和優(yōu)化算法(灰狼優(yōu)化、粒子群優(yōu)化[13])方面,朝著這個(gè)方向取得了許多進(jìn)展。對(duì)原始GM(1,1)模型進(jìn)行了不同形式的修正,以適應(yīng)不同的預(yù)測(cè)情況,例如抗拉強(qiáng)度[16]、二氧化碳排放[21]、冰塞災(zāi)害[11]等的間接度量。對(duì)于給定的時(shí)間序列,為了在未來(lái)的預(yù)測(cè)中引入定性分析(即強(qiáng)度或弱化Γ,劉思峰提出了(包括加強(qiáng)和弱化)緩沖算子的思想[10]。這些算子滿足3個(gè)公理:不動(dòng)點(diǎn)、充分利用信息、解析性和正規(guī)性。許多學(xué)者開(kāi)發(fā)了這類工具,將緩沖運(yùn)算符應(yīng)用于不同類型的模型預(yù)測(cè)[24]。
萊布尼茨提出的分?jǐn)?shù)階微積分思想對(duì)灰色系統(tǒng)也有很大的影響。吳立峰、劉思峰等人[23]首次考慮了分?jǐn)?shù)階累加的灰色模型。該公式將整數(shù)階累加的經(jīng)典灰色模型推廣到分?jǐn)?shù)階灰色模型。這一創(chuàng)新在理論和實(shí)踐上都對(duì)灰色系統(tǒng)進(jìn)行了巨大的改進(jìn)。從那時(shí)起,分?jǐn)?shù)階累加成為灰色系統(tǒng)中一種流行而有效的工具[14,22]。為了在舊信息和新信息之間保持平衡,李沖、英杰、昂英杰等人提出了自己的觀點(diǎn),開(kāi)發(fā)了新的序列運(yùn)算符[8]。
目前,Matlab 軟件已取代Visual C#,成為大多數(shù)研究灰色系統(tǒng)的學(xué)者的主要計(jì)算機(jī)編程工具,他們大量使用Matlab 語(yǔ)言中嵌入的伽馬函數(shù)。但Matlab 語(yǔ)言中插入的伽馬函數(shù)不能直接編譯出一般的復(fù)數(shù)值(例如Γ(1+i))。本文利用冪零矩陣和泰勒級(jí)數(shù),給出了復(fù)數(shù)累加的灰色模型的一種新的、直接的表述。由于復(fù)數(shù)域X 是代數(shù)閉域,也是拓?fù)渫耆騕7],這個(gè)公式將經(jīng)典的整數(shù)累加的灰色模型[3]和分?jǐn)?shù)累加的灰色模型[23]推廣到其最一般的形式。正如我們將看到的,復(fù)雜積累的灰色模型將會(huì)得到更好的模擬結(jié)果和預(yù)測(cè)結(jié)果。
本文組織如下。第二節(jié)討論了經(jīng)典的整數(shù)(分?jǐn)?shù))階累加生成算子和一階一元GM(1,1)微分方程的灰色模型。我們將分?jǐn)?shù)累加生成運(yùn)算符(因此,自動(dòng)包含整數(shù)的情況)推廣到復(fù)數(shù)累加生成運(yùn)算符??紤]所有復(fù)數(shù)累加生成算子的集合,我們將證明該集合具有一維復(fù)李群結(jié)構(gòu)。在第三節(jié)中,我們建立了復(fù)數(shù)累加的灰色模型(對(duì)于某些z∈X,用CAGMz(1,1)表示),并確定了它的解。由于我們可以將實(shí)數(shù)P 看作X 的一維子空間,即我們?cè)谝粋€(gè)更大的區(qū)域上工作,自然會(huì)期望CAGMz(1,1)模型產(chǎn)生比類似模型更低的平均絕對(duì)百分比誤差MAPE 和均方根百分比誤差RMSPE(其定義將在稍后給出)。在第四節(jié)中,通過(guò)幾個(gè)具體的例子討論了CAGMz(1,1)模型相對(duì)于類似模型的優(yōu)勢(shì)。第五節(jié)介紹了對(duì)本研究的一些期望。
設(shè)X(0)= (x(0)1,x(0)2,…x(0)n)是原始數(shù)據(jù)序列。對(duì)于1≤k≤n,設(shè)x(0)k∈X為時(shí)間k時(shí)的值,數(shù)據(jù)序列是列序列還是行序列,只是轉(zhuǎn)置不同而已。為方便起見(jiàn),我們將在以下結(jié)構(gòu)中使用行序列。設(shè)n=dim(X)是行數(shù)據(jù)序列空間的維數(shù)。對(duì)于實(shí)際問(wèn)題和具體問(wèn)題,應(yīng)該注意到數(shù)據(jù)序列中的條目是鐵的生產(chǎn)量、用電量、某一地區(qū)的GDP、二氧化碳排放量等,所以一般地這些x(0)i∈Θ。但我們想以最一般的形式來(lái)構(gòu)建這個(gè)行動(dòng)。
一階累加生成算子和一階逆累加生成算子在灰色系統(tǒng)理論中占有重要地位。基于這些運(yùn)算,GM(1,1)模型是灰色系統(tǒng)理論中的一個(gè)基本模型[9,10]。
定義1設(shè)X(0)= (x(0)1,x(0)2,…x(0)n)是原始數(shù)據(jù)序列。設(shè)X(1)= (x(1)1,x(1)2,…x(1)n)是數(shù)據(jù)序列,如果我們對(duì)X(0)應(yīng)用一階累加生成算子,X(0)的坐標(biāo)由下式給出
X(0)的一階逆累加生成算子表示為X(-1),其坐標(biāo)由下式給出
很容易驗(yàn)證一階累加生成算子和一階逆累加生成算子是對(duì)數(shù)據(jù)序列的逆運(yùn)算。
對(duì)于2 ≤k≤n,設(shè)w(1)k=。那么方程
稱為GM(1,1)模型的原始形式。a,b為GM(1,1)模型的參數(shù)。a,b的最小二乘估計(jì)由下式給出
其中
在初始值x(1)1=x(0)1的情況下,白化方程
的時(shí)間響應(yīng)序列由下式給出
其中1≤k≤n。最后,如果對(duì)序列(x(1)1,x(1)2,…x(1)n)應(yīng)用一階逆累加生成算子,則模擬序列滿足
其中2≤k≤n.
定義2[23]設(shè)原非負(fù)序列X(0)的r(r∈P>0) 階累加生成算子為X(r)。然后
與傳統(tǒng)的整數(shù)階累加灰色模型相比,分?jǐn)?shù)階累加灰色模型在實(shí)際應(yīng)用中(無(wú)論是理論基礎(chǔ)還是模型仿真)都會(huì)得到更好的結(jié)果。分?jǐn)?shù)階灰色模型在許多不同的場(chǎng)合得到了廣泛的應(yīng)用。許多學(xué)者提出了建立這一理論的新方法[13,14,15]。
為了將現(xiàn)有的理論推廣到復(fù)累加生成算子的情形,我們將使用代數(shù)公式[6,7]。
設(shè)x是冪零不定式,使得xn= 0,則顯然
分別設(shè)f(x) =(1+x+x2+ …+xn-1)和g(x) =(1-x).設(shè)
即I是n×n單位矩陣,E1是冪零矩陣。對(duì)于1≤k≤n,設(shè)Ek:=Ek1.直接計(jì)算如下
En=En1=On×n,其中On×n為零矩陣。然后,對(duì)于一階累加生成算子A和一階逆累加生成算子A-1,存在
或者等價(jià)地f(E1)g(E1)=I。歸納地,第二累加生成算子A2等價(jià)于f2(E1)。通過(guò)為z∈X設(shè)置A(z):=f z(E1),我們將給出以下定義:
定義3設(shè)X(0)為原始數(shù)據(jù)序列并且z∈X,則第z次復(fù)數(shù)累加生成算子由A(z)定義。如果我們用X(z)表示第z個(gè)累加數(shù)據(jù)序列,那么
其中符號(hào)· 表示通常意義上的矩陣乘法。
定理1所有z∈X 的第z個(gè)累加生成算子集構(gòu)成一個(gè)1維交換加性李群,它與X同構(gòu)。
設(shè)X(0)=是原始數(shù)據(jù)序列,z∈X使得Im(z) ≠0 是復(fù)數(shù)。如上所述,對(duì)于1≤k≤n,一般地∈P。設(shè)是第z個(gè)復(fù)數(shù)累加生成序列。在第z次復(fù)數(shù)累加生成運(yùn)算 之 后,對(duì) 于 1≤k≤n,有∈X。 設(shè)W(0)=(w(0)2,…,w(0)n)是X(z)的連續(xù)鄰域序列的平均生成,即對(duì)于2≤k≤n,w(z)k=.我們給出以下定義:
定義3 對(duì)于2≤k≤n,方程式
將被稱為第z個(gè)復(fù)數(shù)累加生成運(yùn)算的灰色模型的原始形式,其將被表示為CAGMz(1,1)。常數(shù)a稱為灰色發(fā)展系數(shù),b稱為灰色控制參數(shù)。
注1如果z= 1,這是經(jīng)典的GM(1,1)模型。對(duì)于復(fù)累加情況的灰色系統(tǒng)模型,應(yīng)該注意到這兩個(gè)參數(shù),即a和b,一般都是復(fù)數(shù)。
CAGMz(1,1)模型的普通最小二乘估計(jì)序列滿足
其中
定義4設(shè)B,Y,a,b如上所述,微分方程
將稱為CAGMz(1,1)模型的白化方程。
在初始值x(z)1=x(0)1的情況下,很容易得出時(shí)間響應(yīng)序列具有以下形式
對(duì) 于 2≤k≤n.最后,如果我們對(duì)序列應(yīng)用第(-z)次復(fù)數(shù)累加生成A(-z)(或者等價(jià)地,第z次復(fù)數(shù)累加生成操作的逆運(yùn)算),我們將得到模擬序列,即
設(shè)X(0)=是原始數(shù)據(jù)序列,我們可以假設(shè)x(0)k=αk+iβk,其中αk,βk∈P.將CAGMz(1,1)模型應(yīng)用于X(0),并設(shè)為仿真數(shù)據(jù)序列(0)=。一般地,由于(0)k∈X,我們可以假設(shè)?,其中,設(shè)ε=(ε1,ε2,…,εn)是剩余序列,則
為了對(duì)CAGMz(1,1)進(jìn)行誤差分析,同時(shí)對(duì)已有的理論進(jìn)行推廣,我們將利用復(fù)數(shù)的模來(lái)對(duì)其進(jìn)行誤差分析。更準(zhǔn)確地說(shuō),設(shè)Δ =(Δ1,Δ2,…,Δn)為相對(duì)誤差序列,則
綜上所述,給定一個(gè)原始數(shù)據(jù)序列X(0)=(x(0)1,x(0)2,…x(0)n),建立第z個(gè)CAGMz(1,1)模型的步驟如下:
步驟1:選擇復(fù)數(shù)z∈X,使得Im(z) ≠0,并計(jì)算第z個(gè)累加生成數(shù)據(jù)序列,即X(z)=X(0)·A(z);
步驟2:計(jì)算X(z)的連續(xù)鄰域序列W(z)的平均生成量;
步驟3:通過(guò)對(duì)復(fù)矩陣的最小二乘估計(jì),給出了參數(shù)a,b的估計(jì),即=(BHB)-1BHY,其中B,Y由方程(x(z)k-x(z)k-1)+aw(z)k=b給出,BH為B的復(fù)共軛轉(zhuǎn)置矩陣;
步驟5:通過(guò)經(jīng)由A(-z)將第(-z)復(fù)數(shù)累加生成運(yùn)算(第z個(gè)累加生成運(yùn)算的逆運(yùn)算)應(yīng)用于(z)來(lái)計(jì)算模擬值(0),即(0):=(z)·A(-z);
步驟6:計(jì)算殘差數(shù)據(jù)序列ε 和相對(duì)誤差數(shù)據(jù)序列Δ,進(jìn)行誤差分析。
對(duì)于具體問(wèn)題,通過(guò)選擇一個(gè)有理數(shù)作為累加生成順序,即z∈Θ,則A(z)中累加生成算子的條目和模擬值(0)都是有理數(shù),即A(z)i,j∈Θ,1≤i,j≤n和,1≤k≤n。由于大多數(shù)預(yù)測(cè)模型的模擬值仍為正有理數(shù),即取模數(shù)與模擬值相同,即,1≤k≤n。由于累加生成階數(shù)可以從所有復(fù)數(shù)中選擇,因此可以認(rèn)為CAGM模型是分?jǐn)?shù)累加灰色預(yù)測(cè)模型的推廣。
案例1
我們考慮的第一個(gè)例子是瀝青混合料,它廣泛應(yīng)用于道路建設(shè)中。在一定的條件下(例如,激振頻率、材料溫度等),瀝青混合料的變形緩慢(粘性),一旦變形力消失(彈性),瀝青及其混合料的這種性質(zhì)稱為粘彈性。瀝青混合料的復(fù)模量E*(=E′+iE″,一個(gè)復(fù)數(shù))由兩部分組成,其中E′表示混合料的儲(chǔ)能能力(彈性行為),E″表示耗能能力(粘性行為)。動(dòng)態(tài)模量E*被定義為模量[27]。
早期對(duì)E*的研究主要集中在動(dòng)態(tài)模量主曲線[19],忽略了E*的θ相位角,而后者也是瀝青和瀝青混合料的一個(gè)重要影響因素,例如,最近的一項(xiàng)研究發(fā)現(xiàn),相位角是區(qū)分瀝青混合料噪聲特性的一個(gè)很好的實(shí)驗(yàn)室參數(shù)[1]。近年來(lái),研究人員試圖開(kāi)發(fā)相角的主曲線[2,26],曾鳴等人提出的廣義CAM 模型由復(fù)模量主曲線、相角主曲線[28]組成。Venudharan 等人發(fā)展了儲(chǔ)能模量和損耗模量的預(yù)測(cè)模型[17]??梢酝瑫r(shí)考慮動(dòng)模量E*和相位角θ。表1和表2列出了AC-20C 70#型瀝青混合料的實(shí)驗(yàn)值[2]。
表1 AC-20C 70#瀝青混合料的動(dòng)模量(MPa)
表2 AC-20C 70#瀝青混合料的相角(°)
通過(guò)歐拉公式eiθ= cosθ+isinθ,任意復(fù)數(shù)z=a+bi可以重寫(xiě)為z=|z|·eiθ,其中是模數(shù),θ是相位角(tanθ=,a≠0)。以溫度4.4°C 為例,原始復(fù)數(shù)數(shù)據(jù)序列(取決于頻率)為
作為比較,我們選擇3 個(gè)累積生成階z= 0.9 + 0.12i,z= 1 和z= 0.5 來(lái)構(gòu)建CAGMz(1,1)模型。第0.9 +0.12i個(gè)累加生成算子A(0.9 + 0.12i)為
z= 1和z= 0.5的累積生成算子與一階和分?jǐn)?shù)階的累積生成算子相同。
應(yīng)用這些運(yùn)算符,我們將得到第0.9+0.12i個(gè)累加生成數(shù)據(jù)序列
一階累加生成數(shù)據(jù)序列為
0.5階累加生成數(shù)據(jù)序列為
當(dāng)z= 0.9 + 0.12i時(shí),a= 0.074 - 0.025i,b= 14211.04 + 4390.87i,時(shí)間響應(yīng)方程(對(duì)于k= 2,3,…,6)
當(dāng)z= 1時(shí),a= -0.098+ 0.007i,b= 15558.57+3579.62i,時(shí)間響應(yīng)方程(對(duì)于k= 2,3,…,6)
當(dāng)z= 0.5時(shí),a= 0.043- 0.0087i,b= 11072.99+2088.93i,時(shí)間響應(yīng)方程(對(duì)于k= 2,3,…,6)
由于原始數(shù)據(jù)序列X0和模擬數(shù)據(jù)序列0都是復(fù)數(shù),為了進(jìn)行誤差分析,我們將使用復(fù)數(shù)的模來(lái)進(jìn)行誤差分析。以第(0.9 + 0.12i)次復(fù)數(shù)累加的相對(duì)誤差Δ6為例,
表3列出了復(fù)模量數(shù)據(jù)序列CAGMz(1,1)模型的三種不同的模擬值和誤差。
表3 CAGMz(1,1)模型的模擬值和誤差
案例2
下面的例子描述了1994-2000年間美國(guó)的旅游需求[18,22]?;谶@些實(shí)際值建立了四個(gè)不同的灰色模型(我們考慮了CAGMz(1,1)模型的三個(gè)不同參數(shù)),并以來(lái)年(2001年,樣本外)為預(yù)測(cè)對(duì)象。所有結(jié)果都列在表4中。
如上所述,承認(rèn)了關(guān)于預(yù)測(cè)的MAPE 建模的MAPE。為了使預(yù)測(cè)MAPE 取一個(gè)較低的值,可以取z1= 1.232 - 0.506i,CAGMz1(1,1) 模 型 給 出 的 預(yù) 測(cè)MAPE最低(≈0.00116%)。對(duì)于這種情況,雖然模型的MAPE 高于其他三種模型,但這兩種MAPE 的總和仍然很低(≈3.13%,而GM1.2(1,1)模型為3.7%)。設(shè)置z2=1.176-0.13i,則建模的MAPE 為1.33%,這是表4所列結(jié)果中的最低值。出于另一個(gè)考慮,我們可以選擇z3= 1.23- 0.5i,這仍然是一個(gè)更好的模擬。
表4 四種不同模型的擬合值和MAPE
本文將整數(shù)、分?jǐn)?shù)累加生成算子推廣到復(fù)數(shù)累加生成算子。結(jié)合所有的復(fù)數(shù)累加生成算子,我們得到了一個(gè)自然的一維可加復(fù)李群結(jié)構(gòu),它與X同構(gòu)。與以前關(guān)于實(shí)數(shù)(整數(shù)或有理數(shù))的討論相比,我們的工作是在整個(gè)復(fù)平面上進(jìn)行的。復(fù)數(shù)階累加生成算子可以同時(shí)調(diào)整新舊信息之間、實(shí)部和虛部之間的權(quán)重,可以得到更好的仿真和預(yù)測(cè)結(jié)果。通過(guò)幾個(gè)實(shí)例,討論了復(fù)數(shù)累加灰色模型與常用方法相比的優(yōu)越性。
為了進(jìn)一步研究,我們將列出幾個(gè)可能的問(wèn)題:
(1) 灰色理論中的一些技術(shù),例如光滑比ρ、區(qū)間灰數(shù)、灰色關(guān)聯(lián)算子等都依賴于P中的階關(guān)系,但復(fù)數(shù)域X不存在階關(guān)系。如何將這種技術(shù)擴(kuò)展到復(fù)數(shù)數(shù)據(jù)序列的情況;
(2) 將分?jǐn)?shù)階微積分的思想引入灰色理論,提出了分?jǐn)?shù)階累加生成算子。根據(jù)我們的構(gòu)造,將累加生成階推廣到復(fù)數(shù),人們可能會(huì)問(wèn):是否存在復(fù)數(shù)階演算?
(3) 尋找涉及復(fù)雜數(shù)據(jù)序列的復(fù)雜灰色模型的應(yīng)用,例如復(fù)信號(hào)分析、瀝青及其混合料的粘彈性等。