羅登菊 戴家佳 羅興甸
摘 要:在縱向數(shù)據(jù)處理中,隨機效應模型是使用頻率非常高的模型之一。本文主要采用復合分位數(shù)回歸估計的方法,在對其參數(shù)進行估計的同時,證明了此估計漸近正態(tài)性。經(jīng)模擬研究,比對了中位數(shù)回歸估計、傳統(tǒng)最小二乘估計和復合分位數(shù)回歸估計三種估計的精度,模擬結果顯示,在樣本有限的情況下,本文所提出的方法對隨機效應模型的參數(shù)估計是有效的,尤其當模型誤差項不遵循高斯分布時,復合分位數(shù)回歸估計的實用性是明顯的。
關鍵詞:隨機效應模型; 復合分位數(shù)回歸估計; 最小二乘估計; 分位數(shù)回歸估計
中圖分類號:U491
文獻標識碼: A
隨機效應模型的一般形式為:
yit=xTitβ+αi+εit(1)
其中xit=(xit,1,xit,2,…,xit,p)T為p維協(xié)變量,β=(β1,β2,…,βp)為回歸系數(shù)向量,yit為響應變量,αi稱為隨機效應,是用來刻畫一些不可觀測的因素引起的個體間差異,εit是隨機誤差。在隨機效應模型中,一般假設E(αi)=0,Var(αi)=σ2α相互獨立的同時,與εit相互獨立;E(εit)=0,Var(εit)=σ2ε,且相互獨立。
模型(1)的主要優(yōu)點在于,在一定條件下提供了對個體進行統(tǒng)計推斷的可能性。為了解決此模型估計的參數(shù)估計問題,大部分的文獻通過普通最小二乘和加權最小二乘等方式來解決此問題,舉例說,最小二乘估計計算簡單,其得到的結果擁有令人滿意的表達式,尤其是在誤差項遵循常態(tài)分布的前提下,最小二乘估計是有效的,而且是一致最小方差無偏估計。但是實際數(shù)據(jù)往往不滿足方差相等、獨立并服從正態(tài)分布等嚴苛條件。隨著互聯(lián)網(wǎng)的高速發(fā)展以及各種行業(yè)之間相互影響,我們所面臨的數(shù)據(jù)維度不僅大還結構復雜,通過最小二乘估計無法滿足現(xiàn)階段所需理想的統(tǒng)計結果。
于是,加拿大學者KOENKER提出了一種回歸估計,就是分位數(shù)回歸估計,目的是為了擺脫最小二乘估計的局限性,更廣泛的將中位數(shù)回歸應用于所有的分位數(shù)中。使用條件分位數(shù)來進行建模,使最小二乘估計最小化平方誤差的思想變?yōu)樽钚』訖嗟慕^對誤差,該方法可以刻畫解釋變量隨響應變量變動的大體特征,呈現(xiàn)響應變量在不同分位點下的條件分布函數(shù)。分位數(shù)回歸有眾多優(yōu)勢,它既不需要誤差項服從正態(tài)分布,也對異常值不敏感,甚至可以擬合響應變量任何分位點的回歸方程,因此具有很好的穩(wěn)健性,在各個模型的估計中被廣泛運用,例如,WU[1]在研究單指標模型的估計問題時,使用了分位數(shù)回歸估計;YANG[2]應用分位數(shù)回歸研究了變系數(shù)單指標模型的參數(shù)估計和變量選擇問題;KONEKER[3]更是史無前例的將分位數(shù)回歸方法應用到縱向數(shù)據(jù)中,并指出對于固定效應模型,在進行分位數(shù)回歸時,將L1懲罰項加入到目標函數(shù)中,并在估計未知參數(shù)時使用懲罰函數(shù)法;WANG[4]在探究面板數(shù)據(jù)中固定效應模型的經(jīng)驗似然估計值的過程中,分位數(shù)得分函數(shù)被平滑經(jīng)驗似然估計過程所替代,從而得到經(jīng)驗對數(shù)似然率和極大經(jīng)驗似然函數(shù)。CANAY[5]在去除面板數(shù)據(jù)模型中的固定效應時,采用了一種簡潔的數(shù)據(jù)轉換,之后利用分位數(shù)回歸預估模型中的參數(shù),同時還驗證了該估計量的一致性和漸進正態(tài)性;KATO[6]以與非線性面板數(shù)據(jù)的研究相似為前提,研究面板數(shù)據(jù)下固定效應分位數(shù)回歸模型估計的一致性和漸進正態(tài)性條件,得出一個結論,即參數(shù)估計量的一致性;何曉霞等[7]利用分位數(shù)回歸研究了縱向數(shù)據(jù)下回歸模型的參數(shù)估計和變量選擇問題。根據(jù)以上文獻得知,即便分位數(shù)回歸可以融合多條曲線,但在實際問題中卻存在部分分位點偏離過大的問題,因此,ZOU和YUAN[8]通過綜合考慮將多個分位點,第一次提出了復合分位數(shù)回歸估計,得到了回歸系數(shù)β一個精度更高的估計。王琪鋒[9]將復合分位數(shù)回歸應用到線性時間序列數(shù)據(jù)中;王江峰[10]在左截斷數(shù)據(jù)下研究了非參數(shù)模型的復合分位數(shù)回歸估計;呂亞召[11]利用復合分位數(shù)回歸研究了部分線性單指標模型的變量選擇問題;JIANG[12]將復合分位數(shù)回歸應用到DTARCH模型中;JIANG[13]將復合分位數(shù)回歸應用到具有重尾自相關誤差的線性模型中;CHEN[14]利用復合分位數(shù)回歸估計半?yún)?shù)模型中的未知函數(shù)與參數(shù);JIANG[15]將加權復合分位數(shù)回歸估計引入到部分線性變系數(shù)模型中;徐潔和楊宜平[16]首次將復合分位回歸應用到縱向數(shù)據(jù)中,研究了固定效應模型的復合分位數(shù)回歸估計,在一定正則條件的前提下,證明了該估計的大樣本漸近正態(tài)性質。
本文基于復合分位數(shù)回歸方法研究了縱向數(shù)據(jù)下隨機效應模型的參數(shù)估計,首先,給出該估計的定義與在該模型下的目標函數(shù);再次,證明了在隨機效應模型下的復合分位數(shù)回歸估計的大樣本漸近正態(tài)性質;最后,通過模擬研究了該估計量的有限樣本性質,同時,與最小二乘估計、中位數(shù)估計結果的精度做比較。
4 結論
本文通過引入了復合分位數(shù)回歸方法來估計隨機效應模型的未知參數(shù),得出的結論如下:
(1)在隨機效應模型中,利用復合分位數(shù)回歸估計來估計未知參數(shù),滿足大樣本性質。
(2)在樣本量相同的情況下,復合分位數(shù)回歸比中位數(shù)回歸和均值回歸的精度高,效果優(yōu)。隨著樣本量的增加,所有估計的精度均增加,但是復合分位數(shù)回歸效果最好。隨著復合分位點的增加,復合分位數(shù)回歸的精度也隨著增加。
參考文獻:
[1]WU ?T ?Z, YU ?K, YU ?Y. Single-index quantile regression. Journal of Multivariate Analysis, 2010, 101(3): 1607-1621.
[2]YANG J, YANG H. Quantile regression and variable selection for single-index varying-coefficient models[J]. Communications in Statistics-Theory and Methods, 2016, 3(8): 1532-1543.
[3]KOENKER R. Quantile Regression for Longitudinal Data[J]. Journal of Multivariate Analysis.2004,91(2):74-89.
[4]WANG H X, ZHU Z Y. Empirical likelihood for quantile regression models with longitudinal data[J]. Journal of Statistical Planning and Inference, 2011, 141(4):1603-1615.
[5]CANAY A. A simple approach to quantile regression for panel data[J].The Econometrics Journal, 2011,14(3):368-386.
[6]KATO K, GALVAO A F, MONTES-ROJAS G V. Asymptotics for panel quantile regression models with individual effects[J]. Journal of Econometrics, 2012,170(1):76-91.
[7]何曉霞, 徐偉, 李緩, 等. 面板數(shù)據(jù)分位數(shù)回歸模型的參數(shù)估計與變量選擇[J]. 數(shù)學雜志, 2017,37(5):1101-1110.
[8]ZOU H, YUAN M. Composite quantile regression and the oracle model selection theory[J]. The annals of statistics, 2008,36(3):1108-1126.
[9]王琪鋒. 復合分位數(shù)回歸在線性時間序列下的應用[D]. 大連:大連理工大學,2015.
[10]王江峰, 田曉敏, 張慧增, 等. 左截斷數(shù)據(jù)下非參數(shù)回歸模型的復合分位數(shù)回歸估計[J]. 高校應用數(shù)學學報A輯, 2015, 30(1):71-83.
[11]呂亞召, 張日權, 趙為華, 等. 部分線性單指標模型的復合分位數(shù)回歸及變量選擇[J]. 中國科學:數(shù)學, 2014,28(12):1299-1322.
[12]JIANG J, JIANG X, SONG X. Weighted composite quantile regression estimation of DTARCH models[J]. Econometrics Journal, 2014, 17(1):1-23.
[13]JIANG Y, LI H . Penalized weighted composite quantile regression in the linear regression model with heavy-tailed autocorrelated errors[J]. Journal of the Korean Statistical Society, 2014, 43(4):531-543.
[14]CHEN Y, TANG M L, TIAN M. Semiparametric hierarchical composite quantile regression[J]. Communications in Statistics, 2015, 44(5):996-1012.
[15]JIANG R, QIAN W M, ZHOU Z R. Weighted composite quantile regression for partially linear varying coefficient models[J]. Communications in Statistics-Simulation and Computation, 2017, 3(5): 1532-1543.
[16]徐潔, 楊宜平. 面板數(shù)據(jù)復合分位數(shù)回歸模型的估計[J]. 統(tǒng)計與決策, 2018,34(5):19-21.
[17]Knight, Keith. Limiting distributions for L1 regression estimators under general conditions[J]. The Annals of Statistics, 1998, 26(2):755-770.
(責任編輯:于慧梅)