国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于圖模型方法的Granger因果性檢驗(yàn)?

2016-05-25 06:33:34魏岳嵩
關(guān)鍵詞:因果性互信息因果關(guān)系

魏岳嵩

(淮北師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院,安徽淮北 235000)

1 引言

由觀測數(shù)據(jù)確定系統(tǒng)變量間的因果關(guān)系是系統(tǒng)辨識的重要內(nèi)容.自從1969年Granger[1]提出Granger因果性概念以來,Granger因果性已經(jīng)成為衡量系統(tǒng)變量間動態(tài)關(guān)系的重要依據(jù),在神經(jīng)網(wǎng)絡(luò)、金融經(jīng)濟(jì)等眾多領(lǐng)域都有著廣泛應(yīng)用[2,3].近年來,利用圖模型方法研究系統(tǒng)變量間的Granger因果性得到了諸多學(xué)者的關(guān)注.利用圖模型方法研究變量間的Granger因果性首先由Dahlhaus和Eichler[4]提出,Eichler[5,6]對其作了進(jìn)一步的研究,建立了Granger因果圖,并討論了Granger因果圖的Markov性.魏岳嵩等[7]給出了一種基于信息論的多維時(shí)間序列Granger因果圖結(jié)構(gòu)的辨識方法.本文以此為基礎(chǔ),進(jìn)一步討論該方法中所涉及的統(tǒng)計(jì)量的漸近分布及估計(jì)問題,并利用該方法分析國際主要股市之間的因果關(guān)系.

2 多維時(shí)間序列Granger因果圖

設(shè)X(t)=(X1(t),X2(t),···,Xn(t))T,t∈Z,是定義在概率空間(?,F,P)上的n維隨機(jī)過程,V={1,2,···,n}為相應(yīng)的指標(biāo)集.對V的任意子集A,以XA={Xa,a∈A}表示XV=X(t)的多變量子過程,(t)={X(s),s<t}表示在時(shí)刻t之前該隨機(jī)過程的信息集.G=(V,Ed,Eu)表示頂點(diǎn)集為V的混合圖,其中Ed?{(u,v)∈V×V|u/=v}為有向邊集,而Eu?{(u,v)∈V×V|u/=v}為無向邊集.

定義1(Granger因果性)[7]設(shè)A和B是V的不相交子集,XA和XB是XV的相應(yīng)子過程,XV(t)表示在時(shí)刻t的所有有關(guān)V的信息集:

1)如果XB(t)⊥,則稱XA是XB關(guān)于XV的非Granger原因(符號⊥表示獨(dú)立關(guān)系);

2)如果XB(t)⊥XA(t)(t),XV{A,B}(t),則稱XA和XB關(guān)于XV是非即時(shí)因果的.

定義2(Granger因果圖)[7]設(shè)X(t)=(X1(t),X2(t),···,Xn(t))T,t∈Z,是定義在概率空間(?,F,P)上的n維平穩(wěn)隨機(jī)過程,如果以下條件成立,則以{X(t)}各分量序列為頂點(diǎn)集V={1,2,···,n}的混合圖G=(V,Ed,Eu)稱為Granger因果圖:

1)對任意i,j∈V且i/=j,有

2)對任意i,j∈V且i/=j,有

對于以上所定義的Granger因果圖G,要判斷變量A和B之間是否存在相應(yīng)的有向邊A→B,只需判斷XB(t)和關(guān)于是否條件獨(dú)立,這里考慮利用信息論中的條件互信息來度量變量間的條件獨(dú)立性.

設(shè)(X,Y,Z)是連續(xù)型隨機(jī)向量,隨機(jī)變量X的熵H(X)以及X和Y的聯(lián)合熵H(X,Y)分別為

其中fX,Y(x,y)為聯(lián)合概率密度,fX(x)為相應(yīng)的邊際概率密度函數(shù).在已知隨機(jī)變量Z的條件下,隨機(jī)變量X和Y之間的條件互信息為

其中fX,Y|Z(x,y|z),fX|Z(x|z)和fY|Z(y|z)分別為相應(yīng)的條件密度.

由定義易知,對于隨機(jī)向量(X,Y,Z),有

由定義2和條件互信息的定義可直接得出:

定理1若G=(V,Ed,Eu)是Granger因果圖,則

定理1從理論上說明可以借助條件互信息來判斷時(shí)序變量之間是否存在Granger因果關(guān)系或即時(shí)因果關(guān)系.由于條件互信息是條件獨(dú)立的一個無界度量,在實(shí)際應(yīng)用中設(shè)定合適的門限值相對比較困難,因此考慮條件互信息的一個變化形式.

定理2若G=(V,Ed,Eu)是Granger因果圖,則

證明 由定理1及δij和μij的定義直接可得.

3 條件互信息的估計(jì)

利用信息論方法確定變量間的因果關(guān)系涉及條件互信息的估計(jì)問題.估計(jì)互信息和條件互信息的方法有很多種,如插件估計(jì)法、計(jì)算距離估計(jì)法、極大似然估計(jì)法等.當(dāng)前最直接并被廣泛使用的是基于對觀測空間的分割來進(jìn)行的非參數(shù)估計(jì)法.Butte和Kohane[8]通過由觀測空間的分割所得到的直方圖來估計(jì)相應(yīng)的概率分布,然而該方法對于高維空間的估計(jì)效果不好.在此基礎(chǔ)上,Daub等[9]提出了一個廣義的直方圖估計(jì)方法,利用B-樣條函數(shù)去分配數(shù)據(jù)點(diǎn)到分割區(qū)間中.

本文采用非參數(shù)方法估計(jì)條件互信息.在混沌系統(tǒng)分析中,關(guān)聯(lián)積分C(X,ε)是表征確定性過程動態(tài)特征的重要手段,它的估計(jì)相對直接.隨機(jī)變量X的關(guān)聯(lián)積分定義為

其中ε為選擇的帶寬,1(·)為示性函數(shù),|是上確界范數(shù).由于關(guān)聯(lián)積分是核函數(shù)的期望值,即E(1‖X?X′‖≤ε),因此,可由U-統(tǒng)計(jì)量得到它的估計(jì)為

Prichard和Thdiler[10]指出:對較小的ε值,關(guān)聯(lián)積分和熵之間存在關(guān)系H(X)≈?ln[C(X,ε)],因此,若以分別表示關(guān)聯(lián)積分

和的簡寫形式,以分別表示關(guān)聯(lián)積分

的簡寫形式,則相應(yīng)的條件互信息估計(jì)為

于是δij和μij的估計(jì)為

定理3設(shè)X1t,X2t,···,Xnt,t∈Z,為獨(dú)立同分布序列,則δij(?)和ij(?)的漸近分布為

其中n為序列長度,表示依分布收斂,Vδ和Vμ為漸近方差

其中K(ε)是由下式給出的標(biāo)準(zhǔn)化因數(shù),

證明 先證.同理可證.

對于U統(tǒng)計(jì)量

則g(ε)和都是U統(tǒng)計(jì)量函數(shù).由于關(guān)聯(lián)積分中核函數(shù)1(Xt,Xs)是有界的,且其值在0和1之間,滿足Denker和Keller[11]中定理1的矩條件.另外,在平穩(wěn)性和條件獨(dú)立假設(shè)下,弱相依條件也總是滿足.因此當(dāng)n→∞時(shí),分別依概率收斂到和Cd(ε),從而當(dāng)n→∞時(shí),g(ε)和δij(ε)依概率收斂到0.

令Dk,Gk,k=1,2,3,4分別表示D和G的k階偏導(dǎo)數(shù)在樣本值Cd(ε))上的取值.對于任意滿足=0的光滑函數(shù)H,由Denker和Keller[11]定理1,將H在處泰勒展開并取極限可得

其中所有的偏導(dǎo)數(shù)Hi,i=1,2,3,4,在上計(jì)算,表示依分布收斂.令H分別取D和G,并記

則由式(12)有,其中

式(15)中的極限可以直接求期望得到.結(jié)合式(13)有

其中

因此

利用關(guān)聯(lián)積分估計(jì)信息論變量涉及到如何選取帶寬ε,這里以Gauss變量為例,分析帶寬ε對估計(jì)準(zhǔn)確性的影響.為了比較,也利用B-樣條估計(jì)法估計(jì)條件互信息的大?。?/p>

假設(shè)(X,Y,Z)是零均值的三維Gauss隨機(jī)變量,且分別滿足以下的協(xié)方差陣

對于每一個Gauss分布,分別生成樣本容量為100,200,300,400,500,1000的樣本,并按上述方法計(jì)算各種樣本容量下的條件互信息的估計(jì)值N(X,Y|Z).在每一種樣本容量下重復(fù)進(jìn)行實(shí)驗(yàn)1000次,在該樣本容量下的條件互信息的估計(jì)值N(X,Y|Z)取其平均值.表1給出的是不同方法的估計(jì)結(jié)果.

表1:選取不同帶寬所得條件互信息估計(jì)值

這里在計(jì)算?C(·)時(shí),事實(shí)上利用的核密度估計(jì)方法,其中使用Heaviside函數(shù)作為核函數(shù),在實(shí)際應(yīng)用中也可考慮選取其它不同的核函數(shù),如Gauss核、多項(xiàng)式核函數(shù)、Epanechnikov核等.根據(jù)核方法中帶寬選擇的經(jīng)驗(yàn)法則,選取了常用的幾種帶寬:0.1,0.5,1.0,1.5及2.0.從實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn),即使這種比較粗略形式的核密度估計(jì)法也明顯優(yōu)于B-樣條估計(jì)法,利用關(guān)聯(lián)積分方法得到的條件互信息的估計(jì)值明顯更接近于真實(shí)值.從表1中結(jié)果可以發(fā)現(xiàn),整體而言,帶寬選取為0.5和1.0的結(jié)果明顯優(yōu)于其它帶寬選擇所得結(jié)果.當(dāng)樣本量較小時(shí),應(yīng)選取較大的帶寬,當(dāng)樣本量較大時(shí),可適當(dāng)選取較小的帶寬.模擬結(jié)果顯示,當(dāng)帶寬選取較大(如1.5和2.0)時(shí),估計(jì)量增加負(fù)的偏差.當(dāng)帶寬選取較小(如0.1)時(shí),由于樣本的稀疏所造成估計(jì)量的方差較大,此時(shí)估計(jì)的結(jié)果不好.此外,隨著樣本容量的增加,估計(jì)值更加接近于真實(shí)值.

4 Granger因果圖結(jié)構(gòu)的辨識

定理3給出了估計(jì)量的極限分布,但在實(shí)際中為了避免得到統(tǒng)計(jì)量近似分布所需的一些復(fù)雜計(jì)算,可以利用置換檢驗(yàn)法來判定原假設(shè)?δij(?)=0和?μij(?)=0是否成立.選取置換檢驗(yàn)法也源于它的檢驗(yàn)過程簡單易行,且關(guān)聯(lián)積分的估計(jì)量?C是次序統(tǒng)計(jì)量的函數(shù),對置換后的時(shí)間序列保持相同的極限分布.該檢驗(yàn)過程可由以下步驟形成:

步驟1計(jì)算時(shí)間序列的檢驗(yàn)統(tǒng)計(jì)量,i,j∈{1,2,···,n},i/=j;

步驟2隨機(jī)置換時(shí)間序列得置換序列;

步驟3計(jì)算置換序列的檢驗(yàn)統(tǒng)計(jì)量;

步驟4重復(fù)步驟2和步驟3B次;

步驟5計(jì)算單邊p值

步驟6對于選定的顯著性水平α,如果,則拒絕Granger非因果性的原假設(shè);如果,則拒絕非即時(shí)因果性的原假設(shè).

5 國際主要股市Granger因果性分析

考慮美國道瓊斯工業(yè)平均指數(shù)(The Dow Jones Industrial Average,簡記為DJI)、英國金融時(shí)報(bào)普通股指數(shù)(The Financial Times Ordinary Shares Index,簡記為FTSE)、日經(jīng)225股票指數(shù)(The Nikkei 225 Stock Index,簡記為N225)、香港恒生股票指數(shù)(The Hang Seng Stock Index,簡記為HSI)、上海證券交易股票指數(shù)(The Shanghai Stock Exchange Composite Index,簡記為SSEC)之間的因果關(guān)系.這里使用的是2001年12月4日至2006年7月11號之間每日調(diào)整后的收盤價(jià),數(shù)據(jù)源自雅虎金融數(shù)據(jù)庫.以Pi(t),i=1,2,3,4,5,表示t日第i個股票指標(biāo)的收盤價(jià),股市收益率

所分析的變量為r(t)=(r1(t),r2(t),r3(t),r4(t),r5(t))T.利用所給的信息論方法分析它們之間的因果關(guān)系,所得到的Granger因果圖,見圖1.

圖1:DJI、FTSE、N225、HIS和SSEC每日收益率Granger因果圖

從圖1中可以得到一些有趣的結(jié)論.首先,可以發(fā)現(xiàn)DJI是FTSE、N225、HSI和SSEC的共同原因,這和當(dāng)前對全球股市間關(guān)系—美國股市對其它股市有著深刻的影響這一常識性理解相吻合.其次,雖然SSEC受DJI、FTSE和HSI變化的直接影響,但是它僅僅對HSI產(chǎn)生直接影響,這說明隨著中國經(jīng)濟(jì)的發(fā)展,中國股市和世界主要股市間的關(guān)系越來越緊密,受世界其它主要股市的直接影響也越來越大.然而,由于我國股市形成的較晚,因此它對除香港股市之外的其它股市的直接影響較小.此外,令人驚異的是,作為亞洲的主要股票市場,SSEC和N225之間不存在直接的因果關(guān)系.和SSEC相比,HSI和其它主要股票市場間的關(guān)系更加緊密,HSI對DJI、FTSE、SSEC和N225都有著直接影響,而且HSI對其它股票市場的變化也更加敏感,甚至N225的變化也對其產(chǎn)生直接影響,出現(xiàn)這種現(xiàn)象的主要原因可能與香港股市形成較早而且相對比較健全有關(guān).

參考文獻(xiàn):

[1]Grange C.Investigating causal relations by econometric models and cross-spectral methods[J].Econometrica,1969,37(3):424-438

[2]Puente-Ajovín M,Sanso-Navarro M.Granger causality between debt and growth:evidence from OECD countries[J].International Review of Economics&Finance,2015,35(1):66-77

[3]Montalto A,Stramaglia S,Faes L,et al.Neural networks with non-uniform embedding and explicit validation phase to assess Granger causality[J].Neural Networks,2015,71(3):159-171

[4]Dahlhaus R,Eichler M.Causality and graphical models in time series analysis[C]//In Highly Structured Stochastic Systems,Oxford:University Press,2003:115-137

[5]Eichler M.Granger causality and path diagrams for multivariate time series[J].Journal of Econometrics,2007,137(2):334-353

[6]Eichler M.Graphical modelling of multivariate time series[J].Probability Theory and Related Fields,2012,153(2):233-268

[7]魏岳嵩,田錚,陳占壽.向量自回歸模型Granger因果圖的條件互信息辨識與應(yīng)用[J].控制理論與應(yīng)用,2011,28(7):979-986 Wei Y S,Tian Z,Chen Z S.Identification and application about Granger causality graph of vector autoregressive model using conditional mutual information[J].Control Theory&Application,2011,28(7):979-986

[8]Butte A J,Kohane I S.Mutual information relevance networks:functional genomic clustering using pairwise entropy measurements[J].Pacific Symposium on Biocomputing,2000,6(12):418-429

[9]Daub C O,Steuer R,Selbig J,et al.Estimating mutual information using B-spline functions-an improved similarity measure for analysing gene expression data[J].BMC Bioinformatics,2004,5(12):1-12

[10]Prichard D,Theiler J.Generalized redundancies for time series analysis[J].Physica D,1995,84(3):476-493[11]Denker M,Keller G.On U-statistics and von-Mises statistics for weakly dependent processes[J].Probability Theory&Related Fields,1983,64(4):505-522

猜你喜歡
因果性互信息因果關(guān)系
阿爾茨海默癥三網(wǎng)動力學(xué)因果性分析
玩忽職守型瀆職罪中嚴(yán)重不負(fù)責(zé)任與重大損害后果的因果關(guān)系
做完形填空題,需考慮的邏輯關(guān)系
論培根對古代哲學(xué)中目的因的批判和改造
論培根對古代哲學(xué)中目的因的批判和改造
幫助犯因果關(guān)系芻議
基于互信息的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)
聯(lián)合互信息水下目標(biāo)特征選擇算法
改進(jìn)的互信息最小化非線性盲源分離算法
電測與儀表(2015年9期)2015-04-09 11:59:22
基于增量式互信息的圖像快速匹配方法
岳阳市| 芮城县| 射洪县| 林周县| 湘潭市| 海伦市| 云龙县| 桐城市| 从江县| 荆门市| 三河市| 兴宁市| 镇巴县| 同江市| 曲阜市| 台南市| 临汾市| 桦南县| 尤溪县| 汶川县| 蒙山县| 麻城市| 鹰潭市| 吴江市| 交口县| 屏东市| 堆龙德庆县| 肥乡县| 伊川县| 庆城县| 龙门县| 扶风县| 辽中县| 田林县| 满城县| 柳州市| 卓尼县| 徐汇区| 塔河县| 沙雅县| 抚顺县|