李小勝
(安徽財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)系,安徽 蚌埠 233030)
隨著貝葉斯理論的發(fā)展和計(jì)算機(jī)模擬等數(shù)值計(jì)算技術(shù)的提高,貝葉斯技術(shù)已大量應(yīng)用在各門(mén)科學(xué)當(dāng)中,而把貝葉斯理論應(yīng)用到計(jì)量經(jīng)濟(jì)學(xué),是上世紀(jì)60年代以來(lái)在一大批統(tǒng)計(jì)學(xué)家和計(jì)量經(jīng)濟(jì)學(xué)家的共同努力下,迅速發(fā)展起來(lái)的。貝葉斯計(jì)量經(jīng)濟(jì)學(xué)的發(fā)展主要得益于60年代的Jacques Dréze,Tom Rothenberg,Walter Fisher,Albert Ando,Gordon Kaufman,Arnold Zellner等人。其中 Zellner的《An Introduction to Bayesian Analysis in Econometrics》一書(shū)的出版標(biāo)志著貝葉斯計(jì)量經(jīng)濟(jì)學(xué)的真正誕生。該書(shū)較為全面地闡述了貝葉斯計(jì)量經(jīng)濟(jì)學(xué)的大多數(shù)專題。
隨后出版的大多數(shù)計(jì)量經(jīng)濟(jì)學(xué)的教科書(shū)也都含有貝葉斯計(jì)量經(jīng)濟(jì)學(xué)的章或節(jié),例如Maddala(1978),Intriligator(1978),Malinvaud(1980),Judge et al(1985),Chow(1983)的計(jì)量經(jīng)濟(jì)學(xué)教課書(shū)。相比60年代以前人們應(yīng)用的非貝葉斯計(jì)量經(jīng)濟(jì)學(xué)的方法,這個(gè)方面的文獻(xiàn)和書(shū)籍多了起來(lái)。Zellner(1985)對(duì)貝葉斯計(jì)量經(jīng)濟(jì)學(xué)理論發(fā)展進(jìn)行了回顧,秦朵(Qin,1996)從另一個(gè)角度也進(jìn)行了回顧。Poirier,D.J.(2006)更是對(duì)國(guó)外(1970~2000)幾種重要的期刊使用貝葉斯方法在經(jīng)濟(jì)和計(jì)量經(jīng)濟(jì)學(xué)文章中的數(shù)量的發(fā)展速度進(jìn)行了回顧。當(dāng)代許多杰出的計(jì)量經(jīng)濟(jì)學(xué)家如Geweke,Litterman,Dempster,Sims,Maddala,Chib等都應(yīng)用貝葉斯計(jì)量經(jīng)濟(jì)學(xué)。華人計(jì)量經(jīng)濟(jì)學(xué)家秦朵(1994)就應(yīng)用貝葉斯計(jì)量經(jīng)濟(jì)學(xué),李宏毅(1997)把貝葉斯計(jì)量經(jīng)濟(jì)學(xué)應(yīng)用到面板數(shù)據(jù)分析當(dāng)中。周?chē)?guó)富(1990)把貝葉斯計(jì)量經(jīng)濟(jì)學(xué)應(yīng)用到資產(chǎn)定價(jià)和資產(chǎn)組合中。而國(guó)內(nèi)研究貝葉斯理論的人員很多,但是研究貝葉斯計(jì)量經(jīng)濟(jì)學(xué)的文獻(xiàn)并不是很多,只有朱慧明(2006)研究了貝葉斯計(jì)量經(jīng)濟(jì)學(xué)的幾個(gè)重要專題,并深入地進(jìn)行了討論。本文將首先比較經(jīng)典學(xué)派與貝葉斯學(xué)派的異同;然后,給出面板數(shù)據(jù)中應(yīng)用貝葉斯方法的一些優(yōu)勢(shì)與結(jié)果。
貝葉斯學(xué)派與經(jīng)典學(xué)派之間主要差異是明顯的。首先,兩個(gè)學(xué)派的核心差別是對(duì)于概率的不同定義。經(jīng)典學(xué)派認(rèn)為概率可以用頻率來(lái)進(jìn)行解釋,估計(jì)和假設(shè)檢驗(yàn)可以通過(guò)重復(fù)抽樣來(lái)加以實(shí)現(xiàn)。而貝葉斯學(xué)派認(rèn)為概率是一種信念。結(jié)合這種信念加以假設(shè)檢驗(yàn)(先驗(yàn)機(jī)會(huì)比),當(dāng)數(shù)據(jù)出現(xiàn)以后就產(chǎn)生后驗(yàn)機(jī)會(huì)比。這種方法結(jié)合了先驗(yàn)和樣本信息輔助假設(shè)檢驗(yàn)。其次,兩者差異體現(xiàn)在使用信息不同,經(jīng)典學(xué)派使用了總體信息和樣本信息,總體信息即總體分布或總體所屬分布族的信息,樣本信息即抽取樣本(數(shù)據(jù))提供給我們的信息。而貝葉斯學(xué)派除利用上述兩種信息外,還利用了一種先驗(yàn)信息,即總體分布中未知參數(shù)的分布信息。兩者在使用樣本信息也有差異,經(jīng)典統(tǒng)計(jì)對(duì)某個(gè)參數(shù)的估計(jì)θ^說(shuō)是無(wú)偏的,其實(shí)是利用了所有可能的樣本信息,貝葉斯學(xué)派只關(guān)心出現(xiàn)了的樣本的信息。而且貝葉斯學(xué)派將未知參數(shù)看作是一個(gè)隨機(jī)變量,用分布來(lái)刻劃,即抽樣之前就有有關(guān)參數(shù)問(wèn)題的一些信息,先驗(yàn)信息主要來(lái)自經(jīng)驗(yàn)和歷史資料。而經(jīng)典統(tǒng)計(jì)把樣本看成是來(lái)自具有一定概率分布的總體,所研究的對(duì)象還是總體,而不局限于數(shù)據(jù)本身,將未知參數(shù)看作常量。
貝葉斯分析方法的優(yōu)點(diǎn)也很多,與頻率方法比較貝葉斯方法充分利用了樣本信息和參數(shù)的先驗(yàn)信息,在進(jìn)行參數(shù)估計(jì)時(shí),通常貝葉斯估計(jì)量具有更小的方差或平方誤差,能夠得到更精確的預(yù)測(cè)結(jié)果;貝葉斯HPD(最大后驗(yàn))置信區(qū)間比不考慮參數(shù)先驗(yàn)信息的頻率置信區(qū)間短;貝葉斯方法能對(duì)假設(shè)檢驗(yàn)或估計(jì)問(wèn)題所做出的判斷結(jié)果進(jìn)行量化評(píng)價(jià),而不是頻率統(tǒng)計(jì)理論中的接受,拒絕的簡(jiǎn)單判斷;在基于無(wú)失效數(shù)據(jù)的分析工作,貝葉斯統(tǒng)計(jì)有著重要優(yōu)點(diǎn)(韓明,2005),一批產(chǎn)品中抽出10進(jìn)行檢驗(yàn),若無(wú)不合格品時(shí),經(jīng)典統(tǒng)計(jì)認(rèn)為次品率為0而貝葉斯統(tǒng)計(jì)得到的是1/12,可見(jiàn)貝葉斯估計(jì)更謹(jǐn)慎。
面板數(shù)據(jù)是用來(lái)描述一個(gè)總體中給定樣本在一段時(shí)間內(nèi)的情況,并對(duì)樣本中每一個(gè)樣本單元都進(jìn)行多重觀察。這樣的數(shù)據(jù)在計(jì)量經(jīng)濟(jì)學(xué)中稱為Panel Data,而統(tǒng)計(jì)學(xué)中稱為L(zhǎng)ongitudinal Data。面板數(shù)據(jù)常用雙下標(biāo)變量表示。例如
yit,i=1,2,…,N;t=1,2,…,T
N表示面板數(shù)據(jù)中含有N個(gè)個(gè)體。T表示時(shí)間序列的最大長(zhǎng)度。若固定t不變,yi.,(i=1,2,…,N)是橫截面上的N個(gè)隨機(jī)變量;若固定i不變,y.t,(t=1,2,…,T)是縱剖面上的一個(gè)時(shí)間序列(個(gè)體)。 Mundlak(1961)、Balestra 和 Nerlove(1966)最早把Panel Data引入到經(jīng)濟(jì)計(jì)量中。從此以后,大量關(guān)于Panel Data的分析方法、研究文章如雨后春筍般出現(xiàn)在經(jīng)濟(jì)學(xué)、管理學(xué)、社會(huì)學(xué)、心理學(xué)等領(lǐng)域。面板數(shù)據(jù)分析的文章可謂是浩如煙海,Baltagi與Hisao各自的書(shū)中都進(jìn)行了回顧。
而上面的文章和書(shū)籍中的面板數(shù)據(jù)分析都是在頻率學(xué)派的觀點(diǎn)下闡述的,但是把Bayes方法融入面板數(shù)據(jù)的文章不是很多,且大多數(shù)文章只給出了在二次損失函數(shù)下的貝葉斯后驗(yàn)的均值和后驗(yàn)方差,并沒(méi)有給出怎么得來(lái)的。本文就用貝葉斯方法來(lái)分析面板數(shù)據(jù)看其優(yōu)勢(shì)所在。面板數(shù)據(jù)的模型常用下式表示:
yit=ait+xitβit+εit(i=1,2……N;t=1,2,……T)
其中,Xit=(x1it,x2it,xkit)'是 k×1 的外生變量向量;βit=(β1it,β2it,βkit) 是 k×1 的參數(shù)向量;ait是截距項(xiàng),k 為解釋變量的個(gè)數(shù)ε;εit是k×1的誤差擾動(dòng)項(xiàng)(標(biāo)量)。下標(biāo)it表示第i個(gè)單位(個(gè)人、家庭、公司和國(guó)家等)在第t期的情況。
通常我們的假定是截距項(xiàng)和斜率項(xiàng)不隨時(shí)間變化,而且斜率項(xiàng)通常又假定是不變的,截距項(xiàng)隨個(gè)體不同而不同。有式:yit=ai+Xitβ+εit。 上式我們可以用一個(gè)向量來(lái)表示:y=Xβ+ε。其中我們假設(shè)ε~N(0,Ω),那么這個(gè)面板數(shù)據(jù)模型的y服從均值為Xβ,方差為Ω的正態(tài)分布y~N(Xβ,Ω)。在Ω已知的條件下我們可以應(yīng)用廣義最小二乘法的均值和方差的估計(jì)量,分別為:
β^=(X'Ω-1X)-1X'Ω-1y,Var(β^)=(X'Ω-1X)-1
由于ε到y(tǒng)的雅可比變換是一一對(duì)應(yīng)的變換,所以似然函數(shù)為:
f(y|β,Ω)=(2π)-NT/2|Ω|-1/2exp{-(1/2)(y-Xβ)'Ω-1(y-Xβ)}
記 L(β,Ω)=(2π)-NT/2|Ω|-1/2exp{-(1/2)(y-Xβ)'Ω-1(y-Xβ)}=(2π)-NT/2|Ω|-1/2exp{-(1/2)(y-Xβ^)'Ω-1(y-Xβ^)+(β-β^)1X'Ω-1X(β-β^)}
由于:(y-Xβ)'Ω-1(y-Xβ)=(y-Xβ^)'Ω-1(y-Xβ^)+(β-β^)1X'Ω-1X(β-β^),貝葉斯分析中上述這個(gè)模型的先驗(yàn)假設(shè)大致可以分為四種:①已知 Ω 而 β 未知,我們假設(shè) β 服從 π(β|Ω)~N(β0,Ω0);②Ω和β都未知,我們假設(shè)其服從模糊先驗(yàn)(Jeffreys先驗(yàn))分布為:π(Ω)∝|Ω|-(p+1)/2;③已知 β 而 Ω 未知,我們假設(shè)其服從 π(Ω)~I(xiàn)Wp(n,Ω0),IW 表示逆 Wishart分布。 維度為 p,自由度為n,Ω0為已知陣,又叫超參數(shù);④Ω和β都未知,我們假設(shè)其服從共軛先驗(yàn)分布為:π(β|Ω)∝π(β|Ω)π(Ω),即 π(Ω)服從逆Wishart分布,π(β|Ω)表示給定Ω下的正態(tài)分布。本文只討論第一種情況,第二種情況得到的后驗(yàn)估計(jì)與廣義最小二乘法相同。第三種一般很少出現(xiàn),方差信息都已知而參數(shù)還未知,一般不用。第四種情況由于超參數(shù)太多,一般只有理論上探討的意義。所以若我們?nèi)ˇ碌南闰?yàn)分布為β~N(β0,H),那么先驗(yàn)密度函數(shù)為:
π(β)=(2π)-K/2|H|-1/2exp{-(1/2)(β-β0)'H-1(β-β0)
根據(jù)貝葉斯定理。后驗(yàn)密度似然函數(shù)先驗(yàn)密度。即π(β|y)=π(β)Lπ(β,Ω)。 有:
π(β|y)∝exp{-(1/2)[(β-β^)'X'Ω-1X(β-β^)+(β-β0)'H-1(β-β0)]}
上面的公式中我們已略去與β無(wú)關(guān)的項(xiàng),[……]中可以表示為:
C*中不含有 β,那么最終后驗(yàn)密度為:π(β|y)∝exp{-(1/2)(β-b)'V-1(β-b)]},即 β~N(b,V),在二次損失函數(shù)下后驗(yàn)均值就是關(guān)于后驗(yàn)分布的期望值:
后驗(yàn)方差為:var(β|y)=V=(X'Ω-1X+H-1)-1
從上面的均值和方差可以看出,面板數(shù)據(jù)的貝葉斯計(jì)量經(jīng)濟(jì)學(xué)的后驗(yàn)均值是廣義最小二乘法和先驗(yàn)均值的加權(quán),后驗(yàn)方差是先驗(yàn)方差和樣本方差的加權(quán);貝葉斯方法得到的均值和方差綜合了先驗(yàn)信息、樣本信息,使推斷更為科學(xué)合理。
正如Zellner(1997)所說(shuō):在計(jì)量經(jīng)濟(jì)學(xué)中,經(jīng)典學(xué)派不用先驗(yàn)信息是很難讓讓人相信的,他們常在想誤差項(xiàng)是個(gè)什么分布,有無(wú)自相關(guān),建立怎樣的模型(是參數(shù)的,還是非參數(shù)模型),選擇一個(gè)什么樣的顯著性水平,檢驗(yàn)的勢(shì)如何?例如經(jīng)典學(xué)派在假設(shè)隨機(jī)系數(shù)模型和時(shí)變參數(shù)模型,那么他們對(duì)參數(shù)分布作出的假定就相當(dāng)于貝葉斯學(xué)派,給出參數(shù)的具體分布一樣。當(dāng)然貝葉斯學(xué)派的先驗(yàn)信息有時(shí)也是有很大局限性的,受個(gè)人知識(shí)和經(jīng)驗(yàn)的影響,先驗(yàn)分布選擇的帶人為的主觀性等,這也是經(jīng)典學(xué)派不用貝葉斯方法的原因??傊瑥纳鲜龇治隹梢钥闯?,如果貝葉斯方法使用的恰當(dāng)會(huì)使推斷更為精確。
[1]劉樂(lè)平,袁衛(wèi).現(xiàn)代Bayes方法在精算中的應(yīng)用及展望[J].統(tǒng)計(jì)研究,2002,(2).
[2]茆詩(shī)松.貝葉斯統(tǒng)計(jì)[M].北京:中國(guó)統(tǒng)計(jì)出版社,1999.
[3](美)普雷斯(S.James Press).貝葉斯統(tǒng)計(jì)學(xué):原理、模型及應(yīng)用[M].廖文等譯.北京:中國(guó)統(tǒng)計(jì)出版社,1992.
[4]朱慧明,韓玉啟.貝葉斯多元統(tǒng)計(jì)推斷理論[M].北京:科學(xué)出版社,2006.
[5]方開(kāi)泰.實(shí)用多元統(tǒng)計(jì)分析[M].上海:華東師范大學(xué)出版社,1989.
[6]韓明.基于無(wú)失效數(shù)據(jù)的可靠性參數(shù)估計(jì)[M].北京:中國(guó)統(tǒng)計(jì)出版社,2005.
[7]Balestra,P.,M.Nerlove.Pooling Cross-Section and Time-Series Data in the Estimation of a Dynamic Economic Model:The Demand for Natural Gas[J].Econometric,1966,34.
[8]Mundlak,Y.Empirical Productions Free of Management Bias[J].Journal of Farm Economics,1961,(43).
[9]Zellner,A.An Introduction to Bayesian Inference in Econometrics[M].Chichester:John&Wiley,1971.
[10]Press,J.S.Applied Multivariate Analysis:Using Bayesian and Frequentist Methods of Inference[M].Nelbourne:Krieger Publishing,1982.