国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

廣義線性模型的大樣本理論及其研究進(jìn)展

2016-06-20 09:34:47夏,

陳 夏, 閆 莉

(陜西師范大學(xué) 數(shù)學(xué)與信息科學(xué)學(xué)院, 陜西 西安 710119)

?

廣義線性模型的大樣本理論及其研究進(jìn)展

陳夏, 閆莉*

(陜西師范大學(xué) 數(shù)學(xué)與信息科學(xué)學(xué)院, 陜西 西安 710119)

摘要:系統(tǒng)介紹廣義線性模型的研究概況和最新進(jìn)展,主要包括廣義線性模型的極大似然估計理論和擬似然估計理論、廣義線性模型在復(fù)雜數(shù)據(jù)中的應(yīng)用以及廣義線性模型的經(jīng)驗似然和變量選擇問題。并指出了廣義線性模型將會在高維數(shù)據(jù)的理論和應(yīng)用研究方面有所發(fā)展。關(guān)鍵詞: 廣義線性模型;大樣本理論;擬似然方法

MR subject classification: 62J12

廣義線性模型(generalized linear models, 簡記為GLMs)的理論是對線性模型經(jīng)典理論的重要推廣,是分析不同類型數(shù)據(jù)的工具。它既適應(yīng)于連續(xù)數(shù)據(jù),也適應(yīng)于離散數(shù)據(jù),特別是后者,如計數(shù)數(shù)據(jù)和屬性數(shù)據(jù)等。這在應(yīng)用上,尤其是在醫(yī)學(xué)、生物、經(jīng)濟(jì)、社會等數(shù)據(jù)的統(tǒng)計分析上,有重要的意義。

記Y為一維或多維的響應(yīng)變量(因變量),x為協(xié)變量(自變量),Z=Z(x)是依賴于協(xié)變量的設(shè)計向量或設(shè)計矩陣。廣義線性模型從線性回歸模型的特點出發(fā),從以下幾個方面進(jìn)行推廣:

(1) E(Y)=μ=h(ZTβ),h為一嚴(yán)格單調(diào)且充分光滑的函數(shù),β為未知的回歸參數(shù)。g=h-1稱為聯(lián)系函數(shù)(link function)滿足g(μ)=ZTβ。

(2) x,Z(x),y一般可取連續(xù)或離散值,應(yīng)用上更常見的是取離散值的情形。

(3) Y的分布屬于指數(shù)型,正態(tài)分布是其特例。

GLMs的起源可追溯到20世紀(jì)20年代。英國著名統(tǒng)計學(xué)家Fisher曾在1919年使用過它。而作為GLMs最重要特例之一的Logistic模型,Berkson、Dyke和Patterson等人在20世紀(jì)40年代就曾使用過。1972年,Nelder與Wedderburn正式引入了GLMs的概念[1]。1974年,Wedderburn研究了GLMs的擬似然方法[2]。此后,研究工作逐漸增加,GLMs成為實際數(shù)據(jù)建模的重要工具,研究成果數(shù)以萬計。1983年,McCullagh和Nelder出版了系統(tǒng)論述GLMs的專著《Generalized linear models》并于1989年再版[3]。該書以介紹基本理論和基本方法為主,應(yīng)用色彩較淡,內(nèi)容廣度稍顯不足。1994年,F(xiàn)ahrmeir和Tutz出版了專著《Multivariate statistical modeling based on generalized linear models》,并于2001年再版[4]。該專著重點在于建模應(yīng)用,內(nèi)容面廣,但較缺乏深度。兩本書在理論上都著力不夠,所有結(jié)果均未給出嚴(yán)格證明。1985年,F(xiàn)ahrmeir和Kaufman給出了GLMs大樣本理論結(jié)果的嚴(yán)格證明,詳細(xì)討論了GLMs未知參數(shù)的極大似然估計的相合性和漸近正態(tài)性[5]。

筆者在武漢大學(xué)攻讀博士學(xué)位期間,跟隨恩師陳希孺先生系統(tǒng)而深入地學(xué)習(xí)了GLMs的大樣本理論,并在相應(yīng)的研究方向上取得了一定的進(jìn)展。從2001年開始,陳先生在武漢大學(xué)主持舉辦了多次關(guān)于GLMs的討論班,取得了豐富的成果。自那以后,GLMs在國內(nèi)迎來了一個新的研究高潮。2002—2004年,陳希孺先生以專題講座的形式,介紹了傳統(tǒng)GLMs的一般理論和方法,但未給出結(jié)果的嚴(yán)格證明[6]。本文給出了最近30年來GLMs的研究概況和最新進(jìn)展,并指出了今后可能的發(fā)展方向。

1GLMs的極大似然估計理論

(1)

(2)

的根稱為參數(shù) 的極大似然估計(maximum likelihood estimate, 簡記為MLE),這里

特別地,自然聯(lián)系函數(shù)下的對數(shù)似然方程為

(3)

Fahrmeir和Kaufman分別在自然聯(lián)系與非自然聯(lián)系情形下,建立了廣義線性模型參數(shù)MLE的強(qiáng)弱相合性和漸近正態(tài)性的一般條件,并討論了協(xié)變量與響應(yīng)變量有界的特殊情形[5]。尹長明和趙林城在去掉協(xié)變量有界的條件下,討論了Logit模型、Probit模型和分組Cox模型等廣義線性模型中MLE的相合性和漸近正態(tài)性[7]。丁潔麗和陳希孺把非自然聯(lián)系和自然聯(lián)系下的條件統(tǒng)一,研究了參數(shù)MLE的強(qiáng)弱相合性。另外,還研究了協(xié)變量獨立但不同分布以及模型拓展的情形,對一些問題進(jìn)行了理論上的完善和推廣,建立了廣義線性模型參數(shù)MLE大樣本性質(zhì)的一般理論[8-9]。Qian和Wu研究了Logistic模型下,未知參數(shù)MLE的重對數(shù)律和模型選擇問題[10]。

2GLMs的極大擬似然估計理論

關(guān)于經(jīng)典GLMs的統(tǒng)計分析,一個基本的假定是響應(yīng)變量服從指數(shù)型分布。其依據(jù)是:我們的主要目的是進(jìn)行離散數(shù)據(jù)的統(tǒng)計分析,在一些重要的情形下,這種數(shù)據(jù)的分布是二項分布、多項分布和Poisson分布等指數(shù)型分布。另外,除指數(shù)型的假定外,往往均值結(jié)構(gòu)μ=h(ZTβ)的選擇意味著方差有一定結(jié)構(gòu)[6]。但是,在有些情況下,指數(shù)型假定不一定切合實際,且在建模時,我們往往著眼于變量的均值與方差。Wedderburn注意到在經(jīng)典的GLMs中,若均值函數(shù)和方差函數(shù)已知,則很多基于似然的方法依然有效[2]。因此,擬似然方法被引入到GLMs的研究中。

注意到,一般聯(lián)系函數(shù)下的似然方程(2)僅含有響應(yīng)變量yi的均值函數(shù)和協(xié)方差陣(一維情形為方差函數(shù)),而自然聯(lián)系函數(shù)下的似然方程(1)僅含有yi的均值函數(shù)。這使得在不知道yi的分布是否屬于指數(shù)型分布族的情形下或者總體均值和方差是否具有指數(shù)型分布族均值和方差結(jié)構(gòu)的情況下,依然可以仿照標(biāo)準(zhǔn)GLMs建立擬似然方程。一般聯(lián)系函數(shù)和自然聯(lián)系函數(shù)下的擬似然方程分別與(2)式和(3)式有相同的形式,但不再有指數(shù)型分布的假定。基于擬似然方程(2)或(3)的解稱為極大擬似然估計(maximumquasi-likelihoodestimate, 簡記為MQLE)。

我們知道,與均值函數(shù)相比,有關(guān)協(xié)方差陣的確切知識更難獲得。因此,Liang和Zeger為擬似然方法引入了一種更普遍的研究方法。他們提出,只要均值函數(shù)假定正確,可以預(yù)先假定響應(yīng)變量的“工作分布”,進(jìn)而可用“工作方差”Λ-1(·)代替真實的方差∑(·),得到擬似然方程或廣義估計方程(generalizedestimatingequation, 簡記為GEE)[11]

(4)

此方法的靈活性表現(xiàn)在若錯誤地假定密度函數(shù)的形式或聯(lián)系函數(shù),還可以選擇“工作分布”,且不限制響應(yīng)變量的維數(shù)。而Wedderburn的擬似然方法僅適用于一維響應(yīng)變量的GLMs,且選定了均值的同時也選定了“工作方差”,這可能會失去利用某些關(guān)于方差有用信息的機(jī)會。關(guān)于擬似然估計的大樣本性質(zhì)可參見Fahrmeir的工作[12]。

對于自然聯(lián)系函數(shù)下擬似然方程(3)的研究,Chen等首次在很弱的條件下,給出了固定設(shè)計和自適應(yīng)設(shè)計下,擬似然方程(3)定義的MQLE的強(qiáng)相合性[13]。但是,其證明的一個關(guān)鍵步驟有一個漏洞。據(jù)此,高啟兵和吳耀華在比當(dāng)前文獻(xiàn)條件弱的情況下,利用不同的思路,分別研究了固定設(shè)計下,該MQLE的強(qiáng)相合性和漸近正態(tài)性[14-15]。尹長明等討論了自適應(yīng)情形下,該MQLE的漸近性質(zhì)[16]。張三國和廖源以及朱春華和高啟兵在較弱條件下,分別討論了固定設(shè)計和自適應(yīng)設(shè)計下MQLE的漸近存在性、弱相合性、收斂速度以及漸近正態(tài)性[17-18]。

則MQLE是強(qiáng)相合的,進(jìn)一步加上相應(yīng)的矩條件,MQLE也是漸近正態(tài)的[23]。Xiao和Liu討論了GLMs中MQLE的重對數(shù)律問題[24]。

在估計方程(4)中,一般要指定一個函數(shù)充當(dāng)協(xié)差陣或方差函數(shù)的角色,這在一定程度上擴(kuò)大了應(yīng)用范圍,但若選擇不當(dāng)可能會造成效率的降低。因此,Chiou和Müller利用非參數(shù)方法對方差函數(shù)進(jìn)行估計,證明所得MQLE有相合性和漸近正態(tài)性,且其極限分布的協(xié)差陣與使用正確方差函數(shù)所得估計的極限分布的協(xié)差陣相同,即可能達(dá)到了最好的情況[25]。該結(jié)果是一個實質(zhì)的進(jìn)展,它提供了一種方法,可以在方差函數(shù)完全未知的情形下給出參數(shù)的估計,其效果與方差函數(shù)已知時所能達(dá)到的效果相同。但是,文獻(xiàn)[24]在定義MQLE時存在一定的問題,導(dǎo)致后續(xù)的證明及結(jié)論尚存可疑之處。陳夏和陳希孺對其定義的估計進(jìn)行了修改,對修改后的估計量證明了上述結(jié)果[26]。另外,Chiou和Müller利用局部線性加權(quán)的方差函數(shù)估計方法,得到了GLMs中方差函數(shù)估計的收斂速度,其至多達(dá)到Op(n-1/3)[25]。陳夏利用局部多項式加權(quán)的方法以及細(xì)節(jié)上的處理,改進(jìn)了收斂區(qū)間,并把收斂速度提高為可任意接近Op(n-1/2)[27]。

3基于復(fù)雜數(shù)據(jù)的GLMs研究

在實際應(yīng)用中,我們經(jīng)常見到諸如縱向數(shù)據(jù)和缺失數(shù)據(jù)等復(fù)雜數(shù)據(jù)類型?;趶?fù)雜數(shù)據(jù)的GLMs建模,在生物醫(yī)學(xué)、經(jīng)濟(jì)金融等領(lǐng)域的應(yīng)用也很廣泛。例如,Liang和Zeger提出了基于縱向數(shù)據(jù)的GLMs中的廣義估計方程研究方法[11]。在數(shù)據(jù)缺失時,Wang等結(jié)合逆概率加權(quán)方法研究了GLMs中的局部線性回歸估計[28]。Ibrahim等研究了標(biāo)準(zhǔn)GLMs(響應(yīng)變量服從指數(shù)型分布)中處理數(shù)據(jù)缺失的幾種方法[29]。Chen等考慮了非參數(shù)形式下GLMs中的響應(yīng)變量均值的局部擬似然借補(bǔ)估計[30]。閆莉和陳夏討論了響應(yīng)變量隨機(jī)缺失時,GLMs擬似然估計的漸近存在性、強(qiáng)相合性和收斂速度[31]。趙晶晶等討論了協(xié)變量缺失時,GLMs擬似然估計的相合性和漸近正態(tài)性[32]。肖枝洪和劉祿勤研究了不完全信息隨機(jī)截尾的GLMs的極大似然估計的漸近性質(zhì)[33-34]。下面我們以缺失數(shù)據(jù)為例,簡單討論一下GLMs的建模過程和研究方法。

考慮以h為聯(lián)系函數(shù)的廣義線性模型,即響應(yīng)變量yi∈R和設(shè)計向量Zi∈Rp滿足

(5)

在響應(yīng)變量yi有缺失的情形下,即在模型(5)中得到了不完全樣本{(yi,Zi,δi):1≤i≤n},其中Zi可以觀測,若yi缺失,則δi=0,否則δi=1。這里假定yi是隨機(jī)缺失(missing at random, 簡記為MAR)的情形,即選擇概率為

P(δi=1|yi,Zi)=P(δi=1|Zi)=p(Zi)。

(6)

仿照擬似然方程(3),可以建立基于完全數(shù)據(jù)(complete case, 簡記為CC)方法的擬似然方程

(7)

另外,還可構(gòu)造基于加權(quán)方法的擬似然方程為

(8)

作為yi的完全數(shù)據(jù)集。若p(·)未知,可用其估計量代替?;诖送耆珨?shù)據(jù)集的擬似然方程為

(9)

4GLMs的經(jīng)驗似然與變量選擇

基于經(jīng)驗似然的統(tǒng)計分析是近年統(tǒng)計學(xué)的熱點研究課題。自經(jīng)驗似然方法由Owen提出以來[35],因其在構(gòu)造參數(shù)置信域方面有眾多突出的優(yōu)點,例如,無需對漸近方差進(jìn)行估計、置信域的形狀由數(shù)據(jù)自行決定、域保持性、Bartlett糾偏性等,被許多研究者應(yīng)用到處理各種數(shù)據(jù)的問題。變量選擇問題也是近年統(tǒng)計學(xué)的前沿和熱點研究方向。在實際問題中,如在基因?qū)W中,實驗者可能只有幾百人,而觀測到的基因位點(變量)可能有幾千上萬個。研究者要通過較少的樣本選取與某種疾病相關(guān)的基因。因此,變量選擇在高維數(shù)據(jù)分析中發(fā)揮著重要作用。

基于模型(5)和擬似然方程(3),引入輔助隨機(jī)向量

(10)

由拉格朗日乘數(shù)法,知

(11)

ln(β)可表示為

(12)

這里λ=λ(β)滿足

(13)

在適當(dāng)?shù)臈l件下,可證明經(jīng)驗對數(shù)似然比函數(shù)ln(β0)漸近于標(biāo)準(zhǔn)卡方分布,因此該統(tǒng)計量可用于構(gòu)造未知參數(shù)的置信區(qū)域和假設(shè)檢驗等問題。在GLMs的經(jīng)驗似然研究方面,Kolaczyk基于擬似然函數(shù)方法中的得分函數(shù),把經(jīng)驗似然方法引入到廣義線性模型中[36]。Chen和Cui利用廣義線性模型中方差函數(shù)的結(jié)構(gòu)提出了一種改進(jìn)的經(jīng)驗似然方法[37]。閆莉和陳夏在固定和自適應(yīng)設(shè)計情形下,利用擬似然方法研究了GLMs的經(jīng)驗似然推斷問題,證明了經(jīng)驗對數(shù)似然比統(tǒng)計量ln(β0)漸近于標(biāo)準(zhǔn)卡方分布,因此可直接用于統(tǒng)計推斷[38]。Xue等在數(shù)據(jù)缺失下,利用擬似然函數(shù)方法,研究了方差函數(shù)已知時,GLMs的經(jīng)驗似然推斷,但未涉及方差函數(shù)未知或研究擬似然方程的情況[39]。閆莉和陳夏在響應(yīng)變量隨機(jī)缺失下,利用完全數(shù)據(jù)方法、加權(quán)方法和借補(bǔ)方法結(jié)合擬似然方程法討論了GLMs的經(jīng)驗似然推斷[40-41]。

基于懲罰函數(shù)的變量選擇方法,是當(dāng)前較為流行的可以較好處理高維模型選擇的方法。它可以同時實現(xiàn)變量選擇和參數(shù)估計,這大大提高了計算速度。該方法通過最小化懲罰目標(biāo)函數(shù)來進(jìn)行變量選擇,目標(biāo)函數(shù)由損失函數(shù)和懲罰項構(gòu)成。

在GLMs的變量選擇研究方面,Meier等討論了高維Logistic回歸下的Group LASSO方法[42]。van de Geer基于Lipschitz損失和LASSO懲罰,研究了GLMs中估計的預(yù)測誤差[43]。Fan和Song基于極大邊際似然估計提出了超高維GLMs的獨立篩選方法[44]。Friedman等基于Elastic Net懲罰討論了GLMs中估計的快速算法問題[45]。Fan和Lv在超高維情形下研究了GLMs基于非凹懲罰似然的變量選擇方法[46]。Wang等利用Adaptive LASSO方法,研究了高維GLMs的變量選擇和參數(shù)估計問題,并得到了估計的Oracle性質(zhì)[47]。Jiang和Huang基于凹懲罰似然,討論了高維GLMs中的MMCD算法[48]。

5結(jié)論

本文從GLMs的大樣本理論出發(fā),給出了近年來國內(nèi)外關(guān)于GLMs極大似然估計理論、極大擬似然估計理論、經(jīng)驗似然、變量選擇以及GLMs在復(fù)雜數(shù)據(jù)中的應(yīng)用等問題的研究現(xiàn)狀和研究進(jìn)展。

近年來,高維數(shù)據(jù)的統(tǒng)計分析極大地推進(jìn)了統(tǒng)計思想的改革與發(fā)展,成為當(dāng)代統(tǒng)計的研究熱點,出現(xiàn)了一大批令人矚目的研究成果[49-50]。因此,今后GLMs的發(fā)展方向,將會集中在高維數(shù)據(jù)的理論和應(yīng)用研究方面。例如,研究高維GLMs的降維、模型和變量選擇、經(jīng)驗似然推斷以及假設(shè)檢驗等問題。

2015年正值恩師陳希孺先生逝世十周年,先生的諄諄教誨和殷切希望猶在耳邊。作者謹(jǐn)以此文紀(jì)念先生,表達(dá)我們深切的緬懷之情。

參考文獻(xiàn):

[1] NELDER J A, WEDDERBURN R W M. Generalized linear models[J]. Journal of the Royal Statistical Society: Series A, 1972, 135(3): 370-384.

[2] WEDDERBURN R W M. Quasi-likelihood functions, generalized linear models and Gauss-Newton method[J]. Biometrika, 1974, 61(3): 439-447.

[3] McCULLAGH P, NELDER J A. Generalized linear models[M].2nd ed. London:Chapman & Hall,1989.

[4] FAHRMEIR L, TUTZ G. Multivariate statistical modelling based on generalized linear models[M]. 2nd ed.New York:Springer-Verlag, 2001.

[5] FAHRMEIR L, KAUFMANN H. Consistency and asymptotic normality of the maximum likelihood estimator in generalized linear models[J]. The Annals of Statistics, 1985, 13: 342-368.

[6] 陳希孺. 廣義線性模型(一)[J].數(shù)理統(tǒng)計與管理, 2002,21(5):54-61.

[7] 尹長明, 趙林城. 廣義線性模型極大似然估計的強(qiáng)相合性與漸近正態(tài)性[J]. 應(yīng)用概率統(tǒng)計, 2005, 21(3): 249-260.

[8] DING J L, CHEN X R. Asymptotic properties of the maximum likelihood estimate in generalized linear models with stochastic regressors[J]. Acta Mathematica Sinica: English Series, 2006, 22(6): 1679-1686.

[9] 丁潔麗, 陳希孺. 廣義線性回歸極大似然估計的強(qiáng)相合性[J]. 數(shù)學(xué)物理學(xué)報, 2006, 26A(2): 168-173.

[10] QIAN W, WU Y H. Strong limit theorems on model selection in generalized linear regression with binomial responses[J]. Statistica Sinica, 2006, 16: 1335-1365.

[11] LIANG K Y, ZEGER S. Longitudinal data analysis using generalized linear models[J]. Biometrika, 1986, 73: 13-22.

[12] FAHRMEIR L. Maximum likelihood estimation in misspecified generalized linear models[J]. Statistics, 1990, 21: 487-502.

[13] CHEN K, HU Y, YING Z. Strong consistency of maximum quasi-likelihood estimators in generalized linear models with fixed and adaptive designs[J]. The Annals of Statistics, 1999, 27(4): 1155-1163.

[14] 高啟兵, 吳耀華. 廣義線性回歸擬似然估計的強(qiáng)相合性[J]. 數(shù)學(xué)年刊, 2004, 25A(6):705-710.

[15] 高啟兵, 吳耀華. 廣義線性回歸擬似然估計的漸近正態(tài)性[J] . 系統(tǒng)科學(xué)與數(shù)學(xué), 2005,25(6):738-745.

[16] 尹長明, 韋程東, 劉小紅.自適應(yīng)設(shè)計廣義線性模型極大擬似然估計的漸近性[J]. 高校應(yīng)用數(shù)學(xué)學(xué)報, 2008, 23(2): 207-212.

[17] ZHANG S G, LIAO Y. On some problems of weak consistency of quasi-maximum likelihood estimates in generalized linear models[J]. Science China Mathematics, 2008, 51(7): 1287-1296.

[18] ZHU C H, GAO Q B. Asymptotic properties in generalized linear models with natural link function and adaptive designs[J]. Adavances in Mathematics, 2013, 42(1): 121-127.

[19] 岳麗, 陳希孺. 廣義線性模型中擬極大似然估計的強(qiáng)相合性及收斂速度[J]. 中國科學(xué)(A輯), 2004, 34 (2): 203-214.

[20] 趙林城, 尹長明. 廣義線性模型中極大擬似然估計的強(qiáng)相合性[J]. 中國科學(xué)(A輯), 2005, 35 (3): 312-317.

[21] CHANG Y I. Strong consistency of maximum quasi-likelihood estimate in generalized linear models via a last time[J]. Statistics and Probability Letters, 1999, 45: 237-246.

[22] YUE L, CHEN X R. Asymptotic normality of quasi-maximum likelihood estimate in generalized linear models[J]. Chinese Annals of Mathematics, 2005, 26(3): 467-474.

[23] 尹長明, 趙林城. 廣義線性模型中極大擬似然估計的漸近正態(tài)性和強(qiáng)相合性[J]. 中國科學(xué)(A輯), 2005, 35(11): 1236-1250.

[24] XIAO Z H, LIU L Q. Laws of iterated logarithm for quasi-maximum likelihood estimator in generalized Linear model[J]. Journal of Statistical Planning and Inference, 2008, 138(3): 611-617.

[25] CHIOU J M , MüLLER H G. Nonparametric quasi-likelihood[J]. The Annals of Statistics, 1999, 27,36-64.

[26] 陳夏, 陳希孺. 廣義線性模型參數(shù)的自適應(yīng)擬似然估計[J]. 中國科學(xué)(A輯), 2005, 35(4): 463-480.

[27] 陳夏. 廣義線性模型中方差函數(shù)的非參數(shù)估計[J]. 應(yīng)用概率統(tǒng)計, 2006, 22(4): 337-346.

[28] WANG C Y, WANG S, GUTIERREZ R G, et al. Local linear regression for generalized linear models with missing data[J]. The Annals of Statistics, 1998, 26: 1028-1050.

[29] IBRAHIM J G, CHEN M H, LIPSITZ S R, et al. Missing-data methods for generalized linear models: a comparative review[J]. Journal of the American Statistical Association, 2005, 100(469): 332-346.

[30] CHEN J W, FAN J, LI K H, et al. Local quasi-likelihood estimation with data missing at random[J]. Statistica Sinica, 2006, 16: 1071-1100.

[31] 閆莉, 陳夏. 缺失數(shù)據(jù)下廣義線性回歸擬似然估計的強(qiáng)相合性[J]. 陜西師范大學(xué)學(xué)報(自然科學(xué)版), 2010, 38(2): 15-17.

[32] 趙晶晶, 張曉冉, 徐玉民.缺失數(shù)據(jù)下廣義線性回歸擬似然估計的相合性和漸近正態(tài)性[J]. 鄭州大學(xué)學(xué)報(理學(xué)版), 2011, 43(3): 43-47.

[33] 肖枝洪, 劉祿勤. 不完全信息隨機(jī)截尾廣義線性模型的極大似然估計[J]. 數(shù)學(xué)物理學(xué)報, 2008, 28A(3): 553-564.

[34] XIAO Z H, LIU L Q. Laws of iterated logarithm for MLE of generalized linear model randomly censored with incomplete information[J]. Statistics and Probability Letters, 2009, 79(6): 789-796.

[35] OWEN A B. Empirical likelihood ratio confidence intervals for a single function[J]. Biometrika, 1988, 75: 237-325.

[36] KOLACZYK E D. Empirical likelihood for generalized linear models[J]. Statistica Sinica, 1994, 4: 199-218.

[37] CHEN S X, CUI H J. An extended empirical likelihood for generalized linear models[J]. Statistica Sinica, 2003, 13: 69-81.

[38] YAN L, CHEN X. Empirical likelihood for generalized linear models with fixed and adaptive designs[J]. Statistics, 2015, 49(5): 978-988.

[39] XUE D, XUE L G, CHENG W H. Empirical likelihood for generalized linear models with missing responses[J]. Journal of Statistical Planning and Inference, 2011, 141: 2007-2020.

[40] 閆莉, 陳夏. 缺失數(shù)據(jù)下廣義線性模型的經(jīng)驗似然推斷[J]. 統(tǒng)計與信息論壇, 2013, 28(2): 14-17.

[41] 閆莉, 陳夏. 響應(yīng)變量隨機(jī)缺失下廣義線性模型的經(jīng)驗似然[J]. 陜西師范大學(xué)學(xué)報(自然科學(xué)版), 2015, 43(3): 1-5.

[42] MEIER L, van de GEER S, BüHLMANN P. The group LASSO for logistic regression[J]. Journal of the Royal Statistical Society: Series B, 2008, 70: 53-71.

[43] van de GEER S. High-dimensional generalized linear models and the LASSO[J]. The Annals of Statistics, 2008, 36: 614-645.

[44]FANJ,SONGR.SureindependencescreeningingeneralizedlinearmodelswithNP-dimensionality[J].TheAnnalsofStatistics, 2010, 38: 3567-3604.

[45]FRIEDMANJ,HASTIET,TIBSHIRANIR.Regularizationpathsforgeneralizedlinearmodelsviacoordinatedescent[J].JournalofStatisticalSoftware, 2010, 33(1): 1-22.

[46]FANJ,LVJ.Non-concavepenalizedlikelihoodwithNPdimensionality[J].IEEETransactionsonInformationTheory, 2011, 57: 5467-5484.

[47]WANGMQ,WANGXL.AdaptiveLassoestimatorsforultrahighdimensionalgeneralizedlinearmodels[J].StatisticsandProbabilityLetters, 2014, 89: 41-50.

[48]JIANGDF,HUANGJ.Majorizationminimizationbycoordinatedescentforconcavepenalizedgeneralizedlinearmodels[J].StatisticsandComputing, 2014, 24: 871-883.

[49]FANJ,HANF,LIUH.Challengesofbigdataanalysis[J].NationalScienceReview, 2014, 1: 293-314.

[50]BüHLMANNP,vandeGEERS.Statisticsforhigh-dimensionaldata:methods,theoryandapplications[M].Heidelberg:Springer, 2011.

〔責(zé)任編輯宋軼文〕

Progress and large sample theory of generalized linear models

CHEN Xia, YAN Li*

(School of Mathematics and Information Science, Shaanxi Normal University,Xi′an 710119, Shaanxi, China)

Keywords:generalized linear models; large sample theory; quasi-likelihood method

Abstract:A comprehensive review and the latest progress of the generalized linear models is studied, including the maximum likelihood estimate theory and the maximum quasi-likelihood estimate theory of generalized linear models, its application with complicated data, the empirical likelihood and variable selection in generalized linear models. At last, it is noted that the future possible research areas will be in the theory and application of high dimension data.

文章編號:1672-4291(2016)03-0001-06

doi:10.15983/j.cnki.jsnu.2016.03.131

收稿日期:2015-07-04

基金項目:國家自然科學(xué)基金(11201276);陜西省自然科學(xué)基礎(chǔ)研究計劃(2014JQ1042);中央高?;究蒲袠I(yè)務(wù)費(fèi)專項資金(GK201503012, GK201503015)

*通信作者:閆莉,女,講師,博士。E-mail:lyan@snnu.edu.cn

中圖分類號:O212.1

文獻(xiàn)標(biāo)志碼:A

青田县| 湘潭市| 汝城县| 邵阳县| 南康市| 辉南县| 伽师县| 筠连县| 宁海县| 区。| 达拉特旗| 南岸区| 长岭县| 德州市| 沿河| 扬中市| 万年县| 荆州市| 雷山县| 榆中县| 高雄市| 类乌齐县| 芒康县| 长武县| 阳朔县| 柳江县| 静安区| 凌海市| 乌苏市| 江油市| 枣庄市| 西和县| 潜江市| 玉屏| 平度市| 武功县| 鸡东县| 屏山县| 昂仁县| 靖边县| 元谋县|