尹長明,付聃,田凱
(廣西大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院,廣西南寧530004)
高維縱向?qū)傩詳?shù)據(jù)的懲罰廣義估計(jì)方程分析
尹長明,付聃,田凱
(廣西大學(xué)數(shù)學(xué)與信息科學(xué)學(xué)院,廣西南寧530004)
文章證明了分析高維縱向二值屬性數(shù)據(jù)的懲罰廣義估計(jì)方程估計(jì)的漸近存在性,相合性與漸近正態(tài)性.
屬性數(shù)據(jù);懲罰廣義估計(jì)方程;高維縱向數(shù)據(jù);漸近正態(tài)性
二值屬性數(shù)據(jù)在生物學(xué)、醫(yī)學(xué),經(jīng)濟(jì)和社會科學(xué)等領(lǐng)域中都有廣泛的應(yīng)用.已有大量的文獻(xiàn)報(bào)道有關(guān)連續(xù)性的高維縱向數(shù)據(jù)的研究[1-2],而研究高維縱向二值屬性數(shù)據(jù)的報(bào)道比較少.
設(shè)在試驗(yàn)中,對于第i個(gè)個(gè)體第j次觀測,得到響應(yīng)變量Yij和pn×1維協(xié)變量Xij,其中i=1,2,…,n,j=1,2,…,m.設(shè)來自不同個(gè)體的觀測值是相互獨(dú)立的,來自相同個(gè)體則是相關(guān)的.令Yij的分布為
其中βn是未知的回歸參數(shù),真值,T表示轉(zhuǎn)置,則易Yij知的期望
定義懲罰廣義估計(jì)函數(shù)為
這里
表示它們按分量逐個(gè)作出的乘積.
在本文中,C,C1,C2…在不同的位置代表不同的正常數(shù),對矩陣A=(aij),F(xiàn)robenius范數(shù)為
Wang、Zhou和Qu[3]用懲罰廣義估計(jì)方程研究了高維縱向數(shù)據(jù),在較復(fù)雜條件得到了估計(jì)的漸近性質(zhì).本文簡化了條件,得到了如下結(jié)果:
定理假設(shè)以下條件成立:
下面證明(7)式.
通過證以下兩式來證明(10)式:
由假定(A1),(A3),(A5)和(A6)可知Wang[4]中的(3.4)式成立,即
由假定(A1),(A5),(A6),(13)式和Markov不等式,可得(11)式左邊小于
因而(11)式成立.
下面先證(12)式.由Taylor展開式得
由Berstein’s inequality[5]得
其中,Hnk1=(Hnk1,…,Hnksn)T表示的是由Hnk的前sn個(gè)元素組成的子向量,Enk1,Gnk1的定義類似.為了證In21,注意到:
同理可以證得In22=o(1),In23=o(1)從而In2=o(1).
最后,我們證In3=o(1),由假定(A1),(A4),(A5),(A6)和(16)式,可得
本文是在比文獻(xiàn)[3]弱的條件下證明了高維縱向二值屬性數(shù)據(jù)的懲罰廣義估計(jì)方程估計(jì)的存在性,相合性與漸近正態(tài)性.雖然在應(yīng)用上這些條件可以滿足,但在理論上顯得不夠完美,比如條件A1、A3比不帶懲罰廣義估計(jì)方程強(qiáng),有待理論上進(jìn)一步研究.
[1]Mc Cullngh P,Nelder J A.Generalized Linear Models[R].London:Chapman and Hall,1983.
[2]Xu P,Wu P,Wang Y,et al.A GEE based shrinkage estimation for the generalized linear model in longitudinal data analysis[R]. Hong Kong:Hong Kong Baptist University,2010.
[3]Wang L,Zhou J,Qu A.Penalized Generalized Estimating Equations for High-Dimensional Longitudinal Data Analysis[J].Bio?metrics,2012,68(2):353-360.
[4]Wang L.GEE annalsis of clustered binary data with diverging number of covariates[J].The Annals of Statistics,2011,39(1):389-417.
[5]Bennett G.Probability inequality for sums of independent random variables[J].Journal of the American Statistical Association,1962, 57(297):33-45.
[6]Liang K-Y,Zerger S L.Longitudinal data analysis using generalized linear models[J].Biometrika,1986,73(1):13-22.
責(zé)任編輯:劉紅
Analysis of Penalized Generalized Estimating Equations for High-Dimensional Longitudinal Attribute Data
YIN Changming,F(xiàn)U Dan,TIAN Kai
(School of Mathematics and Information Science,Guangxi University,Nanning 530004,China)
This paper proves the asymptotic existence,consistency and asymptotic normality of the estimators of the penal?ized generalized estimatingequations for the high-dimensional longitudinal two-value attribute data.
attribute data;penalized generalized estimating equations;high-dimensional longitudinal data;asymptotic nor?mality
O 212.1
A
1674-4942(2016)01-0006-05
2015-09-17
廣西自然科學(xué)基金(2015GXNSFAA139006);國家自然科學(xué)基金(11061002)