范紅崗, 侯 軒
(1. 中國人民大學(xué) 信息學(xué)院, 北京 100872; 2. 北方自動(dòng)控制技術(shù)研究所, 山西 太原 030006)
實(shí)證研究時(shí), 為估計(jì)部分信息不可觀測模型(即模型中有部分變量的數(shù)據(jù)不可觀測), 計(jì)量經(jīng)濟(jì)學(xué)家通常采用邊際極大似然估計(jì)法或矩估計(jì)法進(jìn)行估計(jì). 然而, 由于在不同的假設(shè)下, 邊際極大似然函數(shù)和矩條件的復(fù)雜程度不同, 理論上難以明確兩者的有限樣本性質(zhì), 進(jìn)而無法比較兩者優(yōu)劣. 本文將基于Bootstrap抽樣方法[1-4]重點(diǎn)分析兩種估計(jì)的有限樣本性質(zhì), 并給出了實(shí)踐中選擇這兩種方法的具體建議.
目前, Bootstrap抽樣技術(shù)在計(jì)量經(jīng)濟(jì)和統(tǒng)計(jì)方法的研究中, 主要應(yīng)用集中于假設(shè)檢驗(yàn)和參數(shù)或方差難以估計(jì)的問題研究中: Dufour et al.與Davidson et al.把該技術(shù)應(yīng)用于異方差和ARCH效應(yīng)的檢驗(yàn)中[5-6]. Hong和Li把數(shù)值Bootstrap技術(shù)應(yīng)用于參數(shù)不可微問題的推斷中, 這是對(duì)數(shù)值Bootstrap技術(shù)應(yīng)用的一個(gè)有意義的探索[7]. Lubke et al. 把Bootstrap技術(shù)應(yīng)用于評(píng)價(jià)模型選擇不確定性問題中, 證明了Bootstrap選擇率可以為AIC和BIC選擇標(biāo)準(zhǔn)提供額外的有意補(bǔ)充[8]. Trucíos et al.把Bootstrap 技術(shù)應(yīng)用到GARCH收益和波動(dòng)率的密度估計(jì)中, 具體而言, 該文借助穩(wěn)健的參數(shù)估計(jì)量構(gòu)造了GARCH收益和波動(dòng)率的Bootstrap密度, 從而使得對(duì)這類模型估計(jì)更加穩(wěn)健[9]. 但是鮮有文獻(xiàn)把Bootstrap抽樣技術(shù)應(yīng)用于對(duì)部分信息不可觀測模型估計(jì)量的小樣本性質(zhì)的分析中. 因此, 本文的分析是一個(gè)有意義的探索.
本文在一個(gè)經(jīng)典的部分信息模型框架下, 首先推導(dǎo)出估計(jì)該模型的邊際極大似然估計(jì)量或矩估計(jì)量, 然后使用Bootstrap抽樣技術(shù)生成樣本, 并在此基礎(chǔ)上分析兩個(gè)估計(jì)量的小樣本性質(zhì).
假設(shè)Xt為二元時(shí)間序列 (取0或1),Yt為連續(xù)時(shí)間序列Yt,t=1,2,…,T, 且滿足條件:
ii)P(Xt=j|Xt-1=i,Xt-2…)=P(Xt=j|Xt-1=i)=Pij, 其中i,j取0或1, 且P00=P11=θ;P01=P10-1-θ,θ∈[0,1];
當(dāng)Xt和Yt均可觀測時(shí), 我們稱上述模型是完全信息模型; 當(dāng)Yt可觀測而Xt不可觀測時(shí), 我們稱上述模型是部分信息不可觀測模型.
下面, 本文以(y2,y1,y0)的聯(lián)立密度函數(shù)為例說明其似然函數(shù)復(fù)雜原因.
由全期望公式, 可得
f(y2,y1,y0)=f(y2,y1,y0,Z1=1)+f(y2,y1,y0,Z1=0)=f(y2|y1,y0,Z1=1)·
f(Z1=1|y1,y0)f(y1y0)+f(y2|y1,y0,Z1=0)f(Z1=0|y1,y0)f(y1,y0).
根據(jù)全期望公式以及分布函數(shù)與密度函數(shù)間的關(guān)系, 可得
易知f(Z1=0|y1,y0)有相似表達(dá)式. 當(dāng)T較大時(shí),f(yT,yT-1,…,y2,y1,y0)非常復(fù)雜, 不易獲得參數(shù)的極大似然估計(jì)值. 本文將討論部分信息不可觀測模型兩種可行的估計(jì)方法, 并基于Bootstrap抽樣重點(diǎn)分析兩種估計(jì)方法的優(yōu)缺點(diǎn).
本節(jié)討論部分信息不可觀測模型兩種可行的估計(jì)方法: 邊際極大似然估計(jì)法和矩估計(jì)法.
由上節(jié)討論, 可知由于f(yT,yT-1,…,y2,y1,y0)的公式比較復(fù)雜, 故難以使用極大似然估計(jì), 因此, 本文將推導(dǎo)其他有關(guān)Yt的密度函數(shù)來獲得三個(gè)未知參數(shù)的估計(jì)值. 通過推導(dǎo), 本文發(fā)現(xiàn)
對(duì)應(yīng)的極大似然函數(shù)為
(2)
可通過對(duì)式(2)求最大值來獲得參數(shù)估計(jì)值, 這一方法稱為邊際極大似然估計(jì)法[10-12].
矩估計(jì)法的關(guān)鍵在于找到合適的矩條件. 由期望的線性和伽馬分布的數(shù)字特征值可得
由此, 可獲得三個(gè)矩條件
(3)
通過求解矩條件獲得參數(shù)估計(jì)值的方法稱為矩估計(jì)法. 通過求解(3)來獲得參數(shù)的矩估計(jì)值的方法就是本文所使用的矩估計(jì)方法.
基于大樣本, 容易證明上節(jié)所討論的邊際極大似然估計(jì)值和矩估計(jì)值均收斂于真實(shí)值, 即兩種估計(jì)均是一致的. 由于在不同的假設(shè)下, 邊際極大似然函數(shù)和矩條件的復(fù)雜程度不同, 故從理論上難以明確兩者的有限樣本性質(zhì), 進(jìn)而無法比較兩者優(yōu)劣. 下面, 本文基于Bootstrap抽樣方法重點(diǎn)分析兩種估計(jì)的有限樣本性質(zhì), 并討論兩者的優(yōu)缺點(diǎn).
步驟一, 使用上述樣本生成B個(gè)Bootstrap樣本(本文中B=100);
步驟三, 計(jì)算參數(shù)估計(jì)值的樣本偏差和樣本方差.
通過比較, 可以發(fā)現(xiàn):
1) 邊際極大似然估計(jì)量的樣本偏差和方差在數(shù)值上, 均小于矩估計(jì)量的樣本偏差和方差, 表明邊際極大似然估計(jì)量的有限樣本精度高于矩估計(jì)量.
表 1 兩個(gè)估計(jì)量的方差
2) 從計(jì)算耗時(shí)來看, 邊際極大似然法遠(yuǎn)高于矩估計(jì)法. 在我們的計(jì)算過程中, 矩估計(jì)法的計(jì)算過程耗時(shí)僅2分鐘, 而邊際極大似然估計(jì)法耗時(shí)達(dá)7小時(shí);
3) 圖 1為兩個(gè)估計(jì)量的直方圖和經(jīng)驗(yàn)CDF, 通過比較可發(fā)現(xiàn)三個(gè)參數(shù)的極大似然估計(jì)量更集中于真實(shí)值. 這一結(jié)果表現(xiàn)為: 極大似然估計(jì)量的直方圖更窄, 經(jīng)驗(yàn)CDF圖橫坐標(biāo)值的跨度范圍更小.
圖 1 直方圖和經(jīng)驗(yàn)CDFFig.1 Histogram and empirical CDF
基于Bootstrap抽樣的有限樣本性質(zhì)表明: 相對(duì)于矩估計(jì), 邊際極大似然估計(jì)法的精度更高, 但耗時(shí)較長. 因此, 對(duì)于擁有高性能計(jì)算機(jī)的研究人員, 邊際極大似然估計(jì)法是一個(gè)較好的選擇; 而在時(shí)間或計(jì)算設(shè)備有限的情況下, 矩估計(jì)法也是一個(gè)可以選擇的方法.
[1] Efron B. Bootstrap methods: another look at the Jackknife[J]. Annals of Statistics, 1979, 7: l-26.
[2] Efron B. Estimating the error rate of a prediction rule: improvement on cross-validation[J]. Journal of the American Statistical Association, 1983, 78: 316-331.
[3] Horowitz J L. Bootstrap-based critical values for the information matrix test[J]. Journal of Econometrics, 1994, 61(2): 395-411.
[4] Horowitz J L. The Bootstrap[C]∥Heckman J J, Leámer E E. In Handbook of Econometrics. The Netherlands: North-Holland Publishing Co, 2001.
[5] Dufour J M, Lynda K, Jean-Thomas B. Simulation-based finite-sample tests for heteroskedasticity and ARCH effects[J]. Journal of Econometrics, 2004, 122(2): 317-347.
[6] Davidson R, Flachaire E. The wild bootstrap, tamed at last[J]. Journal of Econometrics, 2008, 146(1): 162-169.
[7] Han Hong, Jessie Li. The numerical delta method and bootstrap[EB/OL]. https:∥economics.stanford.edu/sites/default/files/jobmarketpaperli.pdf, 2016-01-83.
[8] Lubke G H, Campbell I, Dan M A, e al. Assessing model selection uncertainty using a bootstrap approach: an update[J]. Structural Equation Modeling A Multidisciplinary Journal, 2017, 24(2): 230.
[9] Trucíos C, Hotta L K, Ruiz E. Robust bootstrap forecast densities for GARCH returns and volatilities[J]. Journal of Statistical Computation & Simulation, 2017, 87(16): 3152-3174.
[10] Amemiya Takeshi. Advanced econometrics[M]. Cambridge: Harvard University Press, 1985.
[11] Gourieroux C, Trognon A. A general approach to serial correlation[J]. Econometric Theory, 1985, 1(45): 315-340.
[12] Hamilton J D. A new approach to the economic analysis of nonstationary time series and the business cycle[J]. Econometrica, 1989, 57(2): 357-84.