基于圖模型方法的Granger因果性檢驗(yàn)?

2016-05-25 06:33:34魏岳嵩

工程數(shù)學(xué)學(xué)報(bào) 2016年3期

魏岳嵩

(淮北師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院，安徽淮北 235000)

1 引言

由觀測數(shù)據(jù)確定系統(tǒng)變量間的因果關(guān)系是系統(tǒng)辨識的重要內(nèi)容．自從1969年Granger[1]提出Granger因果性概念以來，Granger因果性已經(jīng)成為衡量系統(tǒng)變量間動態(tài)關(guān)系的重要依據(jù)，在神經(jīng)網(wǎng)絡(luò)、金融經(jīng)濟(jì)等眾多領(lǐng)域都有著廣泛應(yīng)用[2,3]．近年來，利用圖模型方法研究系統(tǒng)變量間的Granger因果性得到了諸多學(xué)者的關(guān)注．利用圖模型方法研究變量間的Granger因果性首先由Dahlhaus和Eichler[4]提出，Eichler[5,6]對其作了進(jìn)一步的研究，建立了Granger因果圖，并討論了Granger因果圖的Markov性．魏岳嵩等[7]給出了一種基于信息論的多維時(shí)間序列Granger因果圖結(jié)構(gòu)的辨識方法．本文以此為基礎(chǔ)，進(jìn)一步討論該方法中所涉及的統(tǒng)計(jì)量的漸近分布及估計(jì)問題，并利用該方法分析國際主要股市之間的因果關(guān)系．

2 多維時(shí)間序列Granger因果圖

設(shè)X(t)=(X1(t),X2(t),···,Xn(t))T,t∈Z，是定義在概率空間(?,F,P)上的n維隨機(jī)過程，V={1,2,···,n}為相應(yīng)的指標(biāo)集．對V的任意子集A，以XA={Xa,a∈A}表示XV=X(t)的多變量子過程，(t)={X(s),s＜t}表示在時(shí)刻t之前該隨機(jī)過程的信息集．G=(V,Ed,Eu)表示頂點(diǎn)集為V的混合圖，其中Ed?{(u,v)∈V×V|u/=v}為有向邊集，而Eu?{(u,v)∈V×V|u/=v}為無向邊集．

定義1(Granger因果性)[7]設(shè)A和B是V的不相交子集，XA和XB是XV的相應(yīng)子過程，XV(t)表示在時(shí)刻t的所有有關(guān)V的信息集：

1)如果XB(t)⊥，則稱XA是XB關(guān)于XV的非Granger原因(符號⊥表示獨(dú)立關(guān)系)；

2)如果XB(t)⊥XA(t)(t),XV{A,B}(t)，則稱XA和XB關(guān)于XV是非即時(shí)因果的．

定義2(Granger因果圖)[7]設(shè)X(t)=(X1(t),X2(t),···,Xn(t))T,t∈Z，是定義在概率空間(?,F,P)上的n維平穩(wěn)隨機(jī)過程，如果以下條件成立，則以{X(t)}各分量序列為頂點(diǎn)集V={1,2,···,n}的混合圖G=(V,Ed,Eu)稱為Granger因果圖：

1)對任意i,j∈V且i/=j，有

2)對任意i,j∈V且i/=j，有

對于以上所定義的Granger因果圖G，要判斷變量A和B之間是否存在相應(yīng)的有向邊A→B，只需判斷XB(t)和關(guān)于是否條件獨(dú)立，這里考慮利用信息論中的條件互信息來度量變量間的條件獨(dú)立性．

設(shè)(X,Y,Z)是連續(xù)型隨機(jī)向量，隨機(jī)變量X的熵H(X)以及X和Y的聯(lián)合熵H(X,Y)分別為

其中fX,Y(x,y)為聯(lián)合概率密度，fX(x)為相應(yīng)的邊際概率密度函數(shù)．在已知隨機(jī)變量Z的條件下，隨機(jī)變量X和Y之間的條件互信息為

其中fX,Y|Z(x,y|z),fX|Z(x|z)和fY|Z(y|z)分別為相應(yīng)的條件密度．

由定義易知，對于隨機(jī)向量(X,Y,Z)，有

由定義2和條件互信息的定義可直接得出：

定理1若G=(V,Ed,Eu)是Granger因果圖，則

定理1從理論上說明可以借助條件互信息來判斷時(shí)序變量之間是否存在Granger因果關(guān)系或即時(shí)因果關(guān)系．由于條件互信息是條件獨(dú)立的一個無界度量，在實(shí)際應(yīng)用中設(shè)定合適的門限值相對比較困難，因此考慮條件互信息的一個變化形式．

定理2若G=(V,Ed,Eu)是Granger因果圖，則

證明由定理1及δij和μij的定義直接可得．

3 條件互信息的估計(jì)

利用信息論方法確定變量間的因果關(guān)系涉及條件互信息的估計(jì)問題．估計(jì)互信息和條件互信息的方法有很多種，如插件估計(jì)法、計(jì)算距離估計(jì)法、極大似然估計(jì)法等．當(dāng)前最直接并被廣泛使用的是基于對觀測空間的分割來進(jìn)行的非參數(shù)估計(jì)法．Butte和Kohane[8]通過由觀測空間的分割所得到的直方圖來估計(jì)相應(yīng)的概率分布，然而該方法對于高維空間的估計(jì)效果不好．在此基礎(chǔ)上，Daub等[9]提出了一個廣義的直方圖估計(jì)方法，利用B-樣條函數(shù)去分配數(shù)據(jù)點(diǎn)到分割區(qū)間中．

本文采用非參數(shù)方法估計(jì)條件互信息．在混沌系統(tǒng)分析中，關(guān)聯(lián)積分C(X,ε)是表征確定性過程動態(tài)特征的重要手段，它的估計(jì)相對直接．隨機(jī)變量X的關(guān)聯(lián)積分定義為

其中ε為選擇的帶寬，1(·)為示性函數(shù)，|是上確界范數(shù)．由于關(guān)聯(lián)積分是核函數(shù)的期望值，即E(1‖X?X′‖≤ε)，因此，可由U-統(tǒng)計(jì)量得到它的估計(jì)為

Prichard和Thdiler[10]指出：對較小的ε值，關(guān)聯(lián)積分和熵之間存在關(guān)系H(X)≈?ln[C(X,ε)]，因此，若以分別表示關(guān)聯(lián)積分

和的簡寫形式，以分別表示關(guān)聯(lián)積分

的簡寫形式，則相應(yīng)的條件互信息估計(jì)為

于是δij和μij的估計(jì)為

定理3設(shè)X1t,X2t,···,Xnt,t∈Z，為獨(dú)立同分布序列，則δij(?)和ij(?)的漸近分布為

其中n為序列長度，表示依分布收斂，Vδ和Vμ為漸近方差

其中K(ε)是由下式給出的標(biāo)準(zhǔn)化因數(shù)，

證明先證．同理可證．

對于U統(tǒng)計(jì)量

令

則g(ε)和都是U統(tǒng)計(jì)量函數(shù)．由于關(guān)聯(lián)積分中核函數(shù)1(Xt,Xs)是有界的，且其值在0和1之間，滿足Denker和Keller[11]中定理1的矩條件．另外，在平穩(wěn)性和條件獨(dú)立假設(shè)下，弱相依條件也總是滿足．因此當(dāng)n→∞時(shí)，分別依概率收斂到和Cd(ε)，從而當(dāng)n→∞時(shí)，g(ε)和δij(ε)依概率收斂到0．

令Dk,Gk,k=1,2,3,4分別表示D和G的k階偏導(dǎo)數(shù)在樣本值Cd(ε))上的取值．對于任意滿足=0的光滑函數(shù)H，由Denker和Keller[11]定理1，將H在處泰勒展開并取極限可得

其中所有的偏導(dǎo)數(shù)Hi,i=1,2,3,4，在上計(jì)算，表示依分布收斂．令H分別取D和G，并記

則由式(12)有，其中

式(15)中的極限可以直接求期望得到．結(jié)合式(13)有

其中

因此

利用關(guān)聯(lián)積分估計(jì)信息論變量涉及到如何選取帶寬ε，這里以Gauss變量為例，分析帶寬ε對估計(jì)準(zhǔn)確性的影響．為了比較，也利用B-樣條估計(jì)法估計(jì)條件互信息的大?。?/p>

假設(shè)(X,Y,Z)是零均值的三維Gauss隨機(jī)變量，且分別滿足以下的協(xié)方差陣

對于每一個Gauss分布，分別生成樣本容量為100,200,300,400,500,1000的樣本，并按上述方法計(jì)算各種樣本容量下的條件互信息的估計(jì)值N(X,Y|Z)．在每一種樣本容量下重復(fù)進(jìn)行實(shí)驗(yàn)1000次，在該樣本容量下的條件互信息的估計(jì)值N(X,Y|Z)取其平均值．表1給出的是不同方法的估計(jì)結(jié)果．

表1:選取不同帶寬所得條件互信息估計(jì)值

這里在計(jì)算?C(·)時(shí)，事實(shí)上利用的核密度估計(jì)方法，其中使用Heaviside函數(shù)作為核函數(shù)，在實(shí)際應(yīng)用中也可考慮選取其它不同的核函數(shù)，如Gauss核、多項(xiàng)式核函數(shù)、Epanechnikov核等．根據(jù)核方法中帶寬選擇的經(jīng)驗(yàn)法則，選取了常用的幾種帶寬：0.1,0.5,1.0,1.5及2.0．從實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn)，即使這種比較粗略形式的核密度估計(jì)法也明顯優(yōu)于B-樣條估計(jì)法，利用關(guān)聯(lián)積分方法得到的條件互信息的估計(jì)值明顯更接近于真實(shí)值．從表1中結(jié)果可以發(fā)現(xiàn)，整體而言，帶寬選取為0.5和1.0的結(jié)果明顯優(yōu)于其它帶寬選擇所得結(jié)果．當(dāng)樣本量較小時(shí)，應(yīng)選取較大的帶寬，當(dāng)樣本量較大時(shí)，可適當(dāng)選取較小的帶寬．模擬結(jié)果顯示，當(dāng)帶寬選取較大(如1.5和2.0)時(shí)，估計(jì)量增加負(fù)的偏差．當(dāng)帶寬選取較小(如0.1)時(shí)，由于樣本的稀疏所造成估計(jì)量的方差較大，此時(shí)估計(jì)的結(jié)果不好．此外，隨著樣本容量的增加，估計(jì)值更加接近于真實(shí)值．

4 Granger因果圖結(jié)構(gòu)的辨識

定理3給出了估計(jì)量的極限分布，但在實(shí)際中為了避免得到統(tǒng)計(jì)量近似分布所需的一些復(fù)雜計(jì)算，可以利用置換檢驗(yàn)法來判定原假設(shè)?δij(?)=0和?μij(?)=0是否成立．選取置換檢驗(yàn)法也源于它的檢驗(yàn)過程簡單易行，且關(guān)聯(lián)積分的估計(jì)量?C是次序統(tǒng)計(jì)量的函數(shù)，對置換后的時(shí)間序列保持相同的極限分布．該檢驗(yàn)過程可由以下步驟形成：

步驟1計(jì)算時(shí)間序列的檢驗(yàn)統(tǒng)計(jì)量,i,j∈{1,2,···,n},i/=j；

步驟2隨機(jī)置換時(shí)間序列得置換序列；

步驟3計(jì)算置換序列的檢驗(yàn)統(tǒng)計(jì)量；

步驟4重復(fù)步驟2和步驟3B次；

步驟5計(jì)算單邊p值

步驟6對于選定的顯著性水平α，如果，則拒絕Granger非因果性的原假設(shè)；如果，則拒絕非即時(shí)因果性的原假設(shè)．

5 國際主要股市Granger因果性分析

考慮美國道瓊斯工業(yè)平均指數(shù)(The Dow Jones Industrial Average,簡記為DJI)、英國金融時(shí)報(bào)普通股指數(shù)(The Financial Times Ordinary Shares Index,簡記為FTSE)、日經(jīng)225股票指數(shù)(The Nikkei 225 Stock Index,簡記為N225)、香港恒生股票指數(shù)(The Hang Seng Stock Index,簡記為HSI)、上海證券交易股票指數(shù)(The Shanghai Stock Exchange Composite Index,簡記為SSEC)之間的因果關(guān)系．這里使用的是2001年12月4日至2006年7月11號之間每日調(diào)整后的收盤價(jià)，數(shù)據(jù)源自雅虎金融數(shù)據(jù)庫．以Pi(t),i=1,2,3,4,5，表示t日第i個股票指標(biāo)的收盤價(jià)，股市收益率

所分析的變量為r(t)=(r1(t),r2(t),r3(t),r4(t),r5(t))T．利用所給的信息論方法分析它們之間的因果關(guān)系，所得到的Granger因果圖，見圖1．

圖1:DJI、FTSE、N225、HIS和SSEC每日收益率Granger因果圖

從圖1中可以得到一些有趣的結(jié)論．首先，可以發(fā)現(xiàn)DJI是FTSE、N225、HSI和SSEC的共同原因，這和當(dāng)前對全球股市間關(guān)系—美國股市對其它股市有著深刻的影響這一常識性理解相吻合．其次，雖然SSEC受DJI、FTSE和HSI變化的直接影響，但是它僅僅對HSI產(chǎn)生直接影響，這說明隨著中國經(jīng)濟(jì)的發(fā)展，中國股市和世界主要股市間的關(guān)系越來越緊密，受世界其它主要股市的直接影響也越來越大．然而，由于我國股市形成的較晚，因此它對除香港股市之外的其它股市的直接影響較小．此外，令人驚異的是，作為亞洲的主要股票市場，SSEC和N225之間不存在直接的因果關(guān)系．和SSEC相比，HSI和其它主要股票市場間的關(guān)系更加緊密，HSI對DJI、FTSE、SSEC和N225都有著直接影響，而且HSI對其它股票市場的變化也更加敏感，甚至N225的變化也對其產(chǎn)生直接影響，出現(xiàn)這種現(xiàn)象的主要原因可能與香港股市形成較早而且相對比較健全有關(guān)．

參考文獻(xiàn)：

[1]Grange C.Investigating causal relations by econometric models and cross-spectral methods[J].Econometrica,1969,37(3):424-438

[2]Puente-Ajovín M,Sanso-Navarro M.Granger causality between debt and growth:evidence from OECD countries[J].International Review of Economics&Finance,2015,35(1):66-77

[3]Montalto A,Stramaglia S,Faes L,et al.Neural networks with non-uniform embedding and explicit validation phase to assess Granger causality[J].Neural Networks,2015,71(3):159-171

[4]Dahlhaus R,Eichler M.Causality and graphical models in time series analysis[C]//In Highly Structured Stochastic Systems,Oxford:University Press,2003:115-137

[5]Eichler M.Granger causality and path diagrams for multivariate time series[J].Journal of Econometrics,2007,137(2):334-353

[6]Eichler M.Graphical modelling of multivariate time series[J].Probability Theory and Related Fields,2012,153(2):233-268

[7]魏岳嵩，田錚，陳占壽.向量自回歸模型Granger因果圖的條件互信息辨識與應(yīng)用[J].控制理論與應(yīng)用，2011,28(7):979-986 Wei Y S,Tian Z,Chen Z S.Identification and application about Granger causality graph of vector autoregressive model using conditional mutual information[J].Control Theory&Application,2011,28(7):979-986

[8]Butte A J,Kohane I S.Mutual information relevance networks:functional genomic clustering using pairwise entropy measurements[J].Pacific Symposium on Biocomputing,2000,6(12):418-429

[9]Daub C O,Steuer R,Selbig J,et al.Estimating mutual information using B-spline functions-an improved similarity measure for analysing gene expression data[J].BMC Bioinformatics,2004,5(12):1-12