国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

半變系數(shù)模型的幾乎無偏嶺估計探討

2018-10-09 05:53曹連英徐文科
統(tǒng)計與決策 2018年17期
關(guān)鍵詞:常值共線性殘差

曹連英,王 蕾,張 博,徐文科

(東北林業(yè)大學(xué) 理學(xué)院,哈爾濱 150040)

0 引言

考慮如下的半變系數(shù)模型:

其中,y是響應(yīng)變量,(xT,zT,u)是相應(yīng)的協(xié)變量,xT=(x1,x2,…,xp),zT=(z1,z2,…,zq),u為時間變量或空間變量,為研究方便,本文假定u為一維變量;β=(β1,β2,…,βp)T為未知常值參數(shù),α(·)=(α1(·),α2(·),…,αq(·))T為未知函數(shù)。ε為隨機誤差,滿足E(ε|xT,zT,u)=0和Var(ε|xT,zT,u)=σ2。

半變系數(shù)模型,因其含有部分線性模型,使之與非參數(shù)回歸模型比較具有更好地外延性;又因其變系數(shù)部分能充分體現(xiàn)協(xié)變量對響應(yīng)變量在時間或空間上影響的差異性,使之與線性回歸模型相比有更強的靈活性。使半變系數(shù)模型受到相關(guān)學(xué)者的廣泛關(guān)注,已經(jīng)提出了大量有價值的估計方法[1-5],如:小波估計法[1]、局部多項式擬合方法[2]、一般級數(shù)方法[4]、輪廓最小二乘估計法[5]等。然而已有研究中直接或間接假設(shè)協(xié)變量xT=(x1,x2,…,xp)的系數(shù)矩陣列滿秩,即不具有復(fù)共線性。而實際問題中會遇到多重共線性問題,即xT的系數(shù)矩陣是病態(tài)矩陣,或者是非列滿秩的,這時利用一般的方法所得到估計結(jié)果的某些分量方差很大,使得估計值的精確度變差,甚至可能導(dǎo)致某些變量系數(shù)的估值正負符號與實際問題意義不符。對于病態(tài)或秩虧的線性回歸模型已經(jīng)開展了深入研究[6,7],其中嶺估計方法是有效解決這一問題并且使用廣泛的一種有偏估計方法。近幾年來,嶺估計方法被逐步應(yīng)用到非線性回歸模型中。本文基于輪廓最小二乘方法給出半變系數(shù)模型的嶺估計和幾乎無偏嶺估計。

1 半變系數(shù)模型的嶺估計和幾乎無偏嶺估計

假定模型(2)中p維待估參數(shù)β已知 ,記,則模型(2)可寫成如下的變系數(shù)模型:

利用局部多項式擬合方法來估計變系數(shù)未知函數(shù){αj(·),j=1,2,…,q}。對給定u0附近的一點u,對αj(u)利用Taylor展開有:

應(yīng)用局部加權(quán)最小二乘極小化:

其中Kh(·)為給定的核函數(shù),Kh(·)=K(·/h)/h,h為帶寬。即可得到的估計。

為便于敘述,本文引入一些記號:

則模型(3)的矩陣形式為:

利用輪廓最小二乘估計方法可得α1(u0),…,αq(u0),的估計為:

取u=u,得未知系數(shù)函數(shù)α(u)=(α(u),…,α(u))T的

0i10q0估計:

若模型(1)中協(xié)變量xT存在復(fù)共線性問題,會導(dǎo)致模型(5)中的接近奇異,從而β的輪廓最小二乘估計不能很好地解釋實際問題。為此本文引入半變系數(shù)模型的嶺估計方法[8],并將嶺估計方法進行改進。

為研究方便,令Φ=(Φ1,Φ2,…,Φp)為正交矩陣,滿足即有偏強的復(fù)共線性性。記,模型(5)為:

將模型(6)的嶺估計修正為:

則模型(5)的參數(shù)部分系數(shù)的幾乎無偏嶺估計為:

變系數(shù)函數(shù)在ui處的估計α(ui)為:

2 幾乎無偏嶺估計的性質(zhì)

定理2:存在c*>0,使得下面的式子成立:

此估計方法中涉及的兩個參數(shù):光滑參數(shù)h和嶺參數(shù)c。參數(shù)h的選取可采用交叉確認等方法確定,嶺參數(shù)c的選取應(yīng)使下式達到最小,即:

3 模擬實驗

模擬如下半變系數(shù)模型:

假定樣本數(shù)為n,協(xié)變量x1的觀測值x11,x21,…,xn1為從均勻分布U(-1,1)中獨立抽取的n個隨機數(shù),變量x2與x1具有偏強復(fù)共線性性,條件數(shù),不妨令xi2=2xi1+d,i=1,2,…,n(d的大小可以影響條件數(shù)k,一般地,d越小k越大),協(xié)變量z的觀測值z1,z2,…,zn為從區(qū)間(-1,1)上的均勻分布U(-1,1)中獨立抽取的n個隨機數(shù);u為區(qū)間[-1,1]上的n個等分點;ε1,ε2,…,εn為從正態(tài)分布N(0,σ2)中獨立抽取的n個隨機數(shù)。yi由公式(7)得到。對n組樣本數(shù)據(jù) (yi,xi1,xi2,zi,ui),i=1,2,…,n基于本文方法利用matlab編程,重復(fù)抽樣N=50次比較嶺估計和幾乎無偏嶺估計的優(yōu)劣。

半變系數(shù)模型的實驗結(jié)果(兩種模型參數(shù)實驗,每種模型參數(shù)記錄3組實驗結(jié)果)如表1所示,變系數(shù)函數(shù)的擬合曲線見圖1,以及嶺參數(shù)c與均殘差平方和SSE的關(guān)系見下頁圖2。

表1 不同估計的均偏差方(BIAS2)與均殘差平方和(SSE)的比較

圖1模型中變系數(shù)函數(shù)在方差為0.5下的擬合圖

數(shù)值結(jié)果表明,在同一個模型參數(shù)下,幾乎無偏嶺估計的常值參數(shù)βj的BIAS2與模型的SSE均小于嶺估計的BIAS2與模型的SSE。圖1也表明了幾乎無偏嶺估計的變系數(shù)函數(shù)的估值最接近于真值,擬合程度更好。圖2表明光滑參數(shù)相同時條件數(shù)不同下,模型的幾乎無偏嶺估計殘差總是明顯小于嶺估計的殘差,且隨著嶺參數(shù)的增大而幾乎無偏嶺估計的殘差趨于穩(wěn)定。

4 結(jié)束語

圖2兩種模型參數(shù)中嶺參數(shù)c與均殘差平方和SSE的關(guān)系(K為條件數(shù))

本文針對半變系數(shù)模型存在的多重共線性問題,提出了幾乎無偏嶺估計。雖然本文得到的幾乎無偏嶺估計是有偏估計,但相比較嶺估計而言幾乎無偏嶺估計的偏要更小。模擬實驗的結(jié)果表明,在相同條件下,幾乎無偏嶺估計的常值參數(shù)βj的均偏差和模型的殘差都更小,變系數(shù)函數(shù)的擬合結(jié)果也優(yōu)于嶺估計結(jié)果。

猜你喜歡
常值共線性殘差
巧借常值數(shù)列 妙破數(shù)列問題
基于雙向GRU與殘差擬合的車輛跟馳建模
南瓜SWEET蛋白家族的全基因組鑒定與進化分析
銀行不良貸款額影響因素分析
基于殘差學(xué)習的自適應(yīng)無人機目標跟蹤算法
基于遞歸殘差網(wǎng)絡(luò)的圖像超分辨率重建
不完全多重共線性定義存在的問題及其修正建議
基于分段常值推力的水滴懸停構(gòu)型控制策略
我國壽險需求影響因素的嶺回歸分析
常值推力下面內(nèi)軌道優(yōu)化的一種改進間接法