魏岳嵩
(淮北師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院,安徽淮北 235000)
由觀測數(shù)據(jù)確定系統(tǒng)變量間的因果關(guān)系是系統(tǒng)辨識的重要內(nèi)容.自從1969年Granger[1]提出Granger因果性概念以來,Granger因果性已經(jīng)成為衡量系統(tǒng)變量間動態(tài)關(guān)系的重要依據(jù),在神經(jīng)網(wǎng)絡(luò)、金融經(jīng)濟(jì)等眾多領(lǐng)域都有著廣泛應(yīng)用[2,3].近年來,利用圖模型方法研究系統(tǒng)變量間的Granger因果性得到了諸多學(xué)者的關(guān)注.利用圖模型方法研究變量間的Granger因果性首先由Dahlhaus和Eichler[4]提出,Eichler[5,6]對其作了進(jìn)一步的研究,建立了Granger因果圖,并討論了Granger因果圖的Markov性.魏岳嵩等[7]給出了一種基于信息論的多維時(shí)間序列Granger因果圖結(jié)構(gòu)的辨識方法.本文以此為基礎(chǔ),進(jìn)一步討論該方法中所涉及的統(tǒng)計(jì)量的漸近分布及估計(jì)問題,并利用該方法分析國際主要股市之間的因果關(guān)系.
設(shè)X(t)=(X1(t),X2(t),···,Xn(t))T,t∈Z,是定義在概率空間(?,F,P)上的n維隨機(jī)過程,V={1,2,···,n}為相應(yīng)的指標(biāo)集.對V的任意子集A,以XA={Xa,a∈A}表示XV=X(t)的多變量子過程,(t)={X(s),s<t}表示在時(shí)刻t之前該隨機(jī)過程的信息集.G=(V,Ed,Eu)表示頂點(diǎn)集為V的混合圖,其中Ed?{(u,v)∈V×V|u/=v}為有向邊集,而Eu?{(u,v)∈V×V|u/=v}為無向邊集.
定義1(Granger因果性)[7]設(shè)A和B是V的不相交子集,XA和XB是XV的相應(yīng)子過程,XV(t)表示在時(shí)刻t的所有有關(guān)V的信息集:
1)如果XB(t)⊥,則稱XA是XB關(guān)于XV的非Granger原因(符號⊥表示獨(dú)立關(guān)系);
2)如果XB(t)⊥XA(t)(t),XV{A,B}(t),則稱XA和XB關(guān)于XV是非即時(shí)因果的.
定義2(Granger因果圖)[7]設(shè)X(t)=(X1(t),X2(t),···,Xn(t))T,t∈Z,是定義在概率空間(?,F,P)上的n維平穩(wěn)隨機(jī)過程,如果以下條件成立,則以{X(t)}各分量序列為頂點(diǎn)集V={1,2,···,n}的混合圖G=(V,Ed,Eu)稱為Granger因果圖:
1)對任意i,j∈V且i/=j,有
2)對任意i,j∈V且i/=j,有
對于以上所定義的Granger因果圖G,要判斷變量A和B之間是否存在相應(yīng)的有向邊A→B,只需判斷XB(t)和關(guān)于是否條件獨(dú)立,這里考慮利用信息論中的條件互信息來度量變量間的條件獨(dú)立性.
設(shè)(X,Y,Z)是連續(xù)型隨機(jī)向量,隨機(jī)變量X的熵H(X)以及X和Y的聯(lián)合熵H(X,Y)分別為
其中fX,Y(x,y)為聯(lián)合概率密度,fX(x)為相應(yīng)的邊際概率密度函數(shù).在已知隨機(jī)變量Z的條件下,隨機(jī)變量X和Y之間的條件互信息為
其中fX,Y|Z(x,y|z),fX|Z(x|z)和fY|Z(y|z)分別為相應(yīng)的條件密度.
由定義易知,對于隨機(jī)向量(X,Y,Z),有
由定義2和條件互信息的定義可直接得出:
定理1若G=(V,Ed,Eu)是Granger因果圖,則
定理1從理論上說明可以借助條件互信息來判斷時(shí)序變量之間是否存在Granger因果關(guān)系或即時(shí)因果關(guān)系.由于條件互信息是條件獨(dú)立的一個無界度量,在實(shí)際應(yīng)用中設(shè)定合適的門限值相對比較困難,因此考慮條件互信息的一個變化形式.
定理2若G=(V,Ed,Eu)是Granger因果圖,則
證明 由定理1及δij和μij的定義直接可得.
利用信息論方法確定變量間的因果關(guān)系涉及條件互信息的估計(jì)問題.估計(jì)互信息和條件互信息的方法有很多種,如插件估計(jì)法、計(jì)算距離估計(jì)法、極大似然估計(jì)法等.當(dāng)前最直接并被廣泛使用的是基于對觀測空間的分割來進(jìn)行的非參數(shù)估計(jì)法.Butte和Kohane[8]通過由觀測空間的分割所得到的直方圖來估計(jì)相應(yīng)的概率分布,然而該方法對于高維空間的估計(jì)效果不好.在此基礎(chǔ)上,Daub等[9]提出了一個廣義的直方圖估計(jì)方法,利用B-樣條函數(shù)去分配數(shù)據(jù)點(diǎn)到分割區(qū)間中.
本文采用非參數(shù)方法估計(jì)條件互信息.在混沌系統(tǒng)分析中,關(guān)聯(lián)積分C(X,ε)是表征確定性過程動態(tài)特征的重要手段,它的估計(jì)相對直接.隨機(jī)變量X的關(guān)聯(lián)積分定義為
其中ε為選擇的帶寬,1(·)為示性函數(shù),|是上確界范數(shù).由于關(guān)聯(lián)積分是核函數(shù)的期望值,即E(1‖X?X′‖≤ε),因此,可由U-統(tǒng)計(jì)量得到它的估計(jì)為
Prichard和Thdiler[10]指出:對較小的ε值,關(guān)聯(lián)積分和熵之間存在關(guān)系H(X)≈?ln[C(X,ε)],因此,若以分別表示關(guān)聯(lián)積分
和的簡寫形式,以分別表示關(guān)聯(lián)積分
的簡寫形式,則相應(yīng)的條件互信息估計(jì)為
于是δij和μij的估計(jì)為
定理3設(shè)X1t,X2t,···,Xnt,t∈Z,為獨(dú)立同分布序列,則δij(?)和ij(?)的漸近分布為
其中n為序列長度,表示依分布收斂,Vδ和Vμ為漸近方差
其中K(ε)是由下式給出的標(biāo)準(zhǔn)化因數(shù),
證明 先證.同理可證.
對于U統(tǒng)計(jì)量
令
則g(ε)和都是U統(tǒng)計(jì)量函數(shù).由于關(guān)聯(lián)積分中核函數(shù)1(Xt,Xs)是有界的,且其值在0和1之間,滿足Denker和Keller[11]中定理1的矩條件.另外,在平穩(wěn)性和條件獨(dú)立假設(shè)下,弱相依條件也總是滿足.因此當(dāng)n→∞時(shí),分別依概率收斂到和Cd(ε),從而當(dāng)n→∞時(shí),g(ε)和δij(ε)依概率收斂到0.
令Dk,Gk,k=1,2,3,4分別表示D和G的k階偏導(dǎo)數(shù)在樣本值Cd(ε))上的取值.對于任意滿足=0的光滑函數(shù)H,由Denker和Keller[11]定理1,將H在處泰勒展開并取極限可得
其中所有的偏導(dǎo)數(shù)Hi,i=1,2,3,4,在上計(jì)算,表示依分布收斂.令H分別取D和G,并記
則由式(12)有,其中
式(15)中的極限可以直接求期望得到.結(jié)合式(13)有
其中
因此
利用關(guān)聯(lián)積分估計(jì)信息論變量涉及到如何選取帶寬ε,這里以Gauss變量為例,分析帶寬ε對估計(jì)準(zhǔn)確性的影響.為了比較,也利用B-樣條估計(jì)法估計(jì)條件互信息的大?。?/p>
假設(shè)(X,Y,Z)是零均值的三維Gauss隨機(jī)變量,且分別滿足以下的協(xié)方差陣
對于每一個Gauss分布,分別生成樣本容量為100,200,300,400,500,1000的樣本,并按上述方法計(jì)算各種樣本容量下的條件互信息的估計(jì)值N(X,Y|Z).在每一種樣本容量下重復(fù)進(jìn)行實(shí)驗(yàn)1000次,在該樣本容量下的條件互信息的估計(jì)值N(X,Y|Z)取其平均值.表1給出的是不同方法的估計(jì)結(jié)果.
表1:選取不同帶寬所得條件互信息估計(jì)值
這里在計(jì)算?C(·)時(shí),事實(shí)上利用的核密度估計(jì)方法,其中使用Heaviside函數(shù)作為核函數(shù),在實(shí)際應(yīng)用中也可考慮選取其它不同的核函數(shù),如Gauss核、多項(xiàng)式核函數(shù)、Epanechnikov核等.根據(jù)核方法中帶寬選擇的經(jīng)驗(yàn)法則,選取了常用的幾種帶寬:0.1,0.5,1.0,1.5及2.0.從實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn),即使這種比較粗略形式的核密度估計(jì)法也明顯優(yōu)于B-樣條估計(jì)法,利用關(guān)聯(lián)積分方法得到的條件互信息的估計(jì)值明顯更接近于真實(shí)值.從表1中結(jié)果可以發(fā)現(xiàn),整體而言,帶寬選取為0.5和1.0的結(jié)果明顯優(yōu)于其它帶寬選擇所得結(jié)果.當(dāng)樣本量較小時(shí),應(yīng)選取較大的帶寬,當(dāng)樣本量較大時(shí),可適當(dāng)選取較小的帶寬.模擬結(jié)果顯示,當(dāng)帶寬選取較大(如1.5和2.0)時(shí),估計(jì)量增加負(fù)的偏差.當(dāng)帶寬選取較小(如0.1)時(shí),由于樣本的稀疏所造成估計(jì)量的方差較大,此時(shí)估計(jì)的結(jié)果不好.此外,隨著樣本容量的增加,估計(jì)值更加接近于真實(shí)值.
定理3給出了估計(jì)量的極限分布,但在實(shí)際中為了避免得到統(tǒng)計(jì)量近似分布所需的一些復(fù)雜計(jì)算,可以利用置換檢驗(yàn)法來判定原假設(shè)?δij(?)=0和?μij(?)=0是否成立.選取置換檢驗(yàn)法也源于它的檢驗(yàn)過程簡單易行,且關(guān)聯(lián)積分的估計(jì)量?C是次序統(tǒng)計(jì)量的函數(shù),對置換后的時(shí)間序列保持相同的極限分布.該檢驗(yàn)過程可由以下步驟形成:
步驟1計(jì)算時(shí)間序列的檢驗(yàn)統(tǒng)計(jì)量,i,j∈{1,2,···,n},i/=j;
步驟2隨機(jī)置換時(shí)間序列得置換序列;
步驟3計(jì)算置換序列的檢驗(yàn)統(tǒng)計(jì)量;
步驟4重復(fù)步驟2和步驟3B次;
步驟5計(jì)算單邊p值
步驟6對于選定的顯著性水平α,如果,則拒絕Granger非因果性的原假設(shè);如果,則拒絕非即時(shí)因果性的原假設(shè).
考慮美國道瓊斯工業(yè)平均指數(shù)(The Dow Jones Industrial Average,簡記為DJI)、英國金融時(shí)報(bào)普通股指數(shù)(The Financial Times Ordinary Shares Index,簡記為FTSE)、日經(jīng)225股票指數(shù)(The Nikkei 225 Stock Index,簡記為N225)、香港恒生股票指數(shù)(The Hang Seng Stock Index,簡記為HSI)、上海證券交易股票指數(shù)(The Shanghai Stock Exchange Composite Index,簡記為SSEC)之間的因果關(guān)系.這里使用的是2001年12月4日至2006年7月11號之間每日調(diào)整后的收盤價(jià),數(shù)據(jù)源自雅虎金融數(shù)據(jù)庫.以Pi(t),i=1,2,3,4,5,表示t日第i個股票指標(biāo)的收盤價(jià),股市收益率
所分析的變量為r(t)=(r1(t),r2(t),r3(t),r4(t),r5(t))T.利用所給的信息論方法分析它們之間的因果關(guān)系,所得到的Granger因果圖,見圖1.
圖1:DJI、FTSE、N225、HIS和SSEC每日收益率Granger因果圖
從圖1中可以得到一些有趣的結(jié)論.首先,可以發(fā)現(xiàn)DJI是FTSE、N225、HSI和SSEC的共同原因,這和當(dāng)前對全球股市間關(guān)系—美國股市對其它股市有著深刻的影響這一常識性理解相吻合.其次,雖然SSEC受DJI、FTSE和HSI變化的直接影響,但是它僅僅對HSI產(chǎn)生直接影響,這說明隨著中國經(jīng)濟(jì)的發(fā)展,中國股市和世界主要股市間的關(guān)系越來越緊密,受世界其它主要股市的直接影響也越來越大.然而,由于我國股市形成的較晚,因此它對除香港股市之外的其它股市的直接影響較小.此外,令人驚異的是,作為亞洲的主要股票市場,SSEC和N225之間不存在直接的因果關(guān)系.和SSEC相比,HSI和其它主要股票市場間的關(guān)系更加緊密,HSI對DJI、FTSE、SSEC和N225都有著直接影響,而且HSI對其它股票市場的變化也更加敏感,甚至N225的變化也對其產(chǎn)生直接影響,出現(xiàn)這種現(xiàn)象的主要原因可能與香港股市形成較早而且相對比較健全有關(guān).
參考文獻(xiàn):
[1]Grange C.Investigating causal relations by econometric models and cross-spectral methods[J].Econometrica,1969,37(3):424-438
[2]Puente-Ajovín M,Sanso-Navarro M.Granger causality between debt and growth:evidence from OECD countries[J].International Review of Economics&Finance,2015,35(1):66-77
[3]Montalto A,Stramaglia S,Faes L,et al.Neural networks with non-uniform embedding and explicit validation phase to assess Granger causality[J].Neural Networks,2015,71(3):159-171
[4]Dahlhaus R,Eichler M.Causality and graphical models in time series analysis[C]//In Highly Structured Stochastic Systems,Oxford:University Press,2003:115-137
[5]Eichler M.Granger causality and path diagrams for multivariate time series[J].Journal of Econometrics,2007,137(2):334-353
[6]Eichler M.Graphical modelling of multivariate time series[J].Probability Theory and Related Fields,2012,153(2):233-268
[7]魏岳嵩,田錚,陳占壽.向量自回歸模型Granger因果圖的條件互信息辨識與應(yīng)用[J].控制理論與應(yīng)用,2011,28(7):979-986 Wei Y S,Tian Z,Chen Z S.Identification and application about Granger causality graph of vector autoregressive model using conditional mutual information[J].Control Theory&Application,2011,28(7):979-986
[8]Butte A J,Kohane I S.Mutual information relevance networks:functional genomic clustering using pairwise entropy measurements[J].Pacific Symposium on Biocomputing,2000,6(12):418-429
[9]Daub C O,Steuer R,Selbig J,et al.Estimating mutual information using B-spline functions-an improved similarity measure for analysing gene expression data[J].BMC Bioinformatics,2004,5(12):1-12
[10]Prichard D,Theiler J.Generalized redundancies for time series analysis[J].Physica D,1995,84(3):476-493[11]Denker M,Keller G.On U-statistics and von-Mises statistics for weakly dependent processes[J].Probability Theory&Related Fields,1983,64(4):505-522
工程數(shù)學(xué)學(xué)報(bào)2016年3期