王越等
1.似然距離
為了對廣義部分線性模型作統(tǒng)計推斷,假設(shè):對于響應(yīng)變量Y密度函數(shù)的積分,可以關(guān)于參數(shù)β在積分號下求倒數(shù)。可進一步得到響應(yīng)變量Y關(guān)于興趣參數(shù)β的得分函數(shù)(β)、觀察信息陣-(β)和Fisher信息陣J(β)的表達(dá)式。
又l()在處的Taylor展開可得:
l()≈l()+()(-)+(-)()(-)
≈2{()(-)+(-){-()}(-)}。從而可得到()=0,-()≈J()。因此似然距離可近似地表示為LDi(β)≈(-)()(-)
2.曲率
設(shè)原模型為M受到擾動變?yōu)镸(ω)。l(θ)為模型M中隨機變量 Y的對數(shù)似然函數(shù)。模型M(ω)相應(yīng)的對數(shù)似然函數(shù)為l(θ/ω)。根據(jù)Cook(1986),可取LD(ω)=2[l()-l()]
容易得出LD(ω0)=0,并且LD(ω)在ω0處的一階導(dǎo)數(shù)也為0,因此 LD(ω)在ω0附近的變化情況應(yīng)取決于二階導(dǎo)數(shù),即曲率。為了定義曲率,我們把方程z=LD(ω)改寫為如形式:π:α=,α在ω0處沿k方向(k=1)的影響曲率可表示為C(θ)=-2kk,=△。其中=,為l(θ)關(guān)于θ的二階導(dǎo)數(shù),且以上各量均在 (,ω0)處計值。易見,Ck大的值有較強的局部影響。記kmax為使得Ck達(dá)到最大的方向,由于很難判斷Cmax為多大才表示模型的擾動影響很大,而kmax的意義比較明確,并且通過散點圖(i,(kmax)i)可以很明顯的看出影響最大的分量,從而識別出是否從在異常值。
3.擾動模型
②單個解釋變量擾動模型:對于廣義部分線性模型考慮只有一個解釋變量擾動的情形。
假設(shè)只擾動矩陣X=(x1,...,xn)T的第t列Xt,即Xt擾動為Xtω=Xt+stω,其中st為Xt的某種模。ω0=(0,...0)T表示模型沒有擾動。 [科]