李 騰,蘇宇楠,魏傳華
(中央民族大學 理學院,北京 100081)
考慮如下的部分線性變系數(shù)測量誤差模型:
其中,Y為因變量,Z、X和U為自變量,β=(β1,β2,…βp)T為未知待估參數(shù),α(·)=(α1(·),α2(·),…αq(·))T為未知非參數(shù)函數(shù)系數(shù)。ε是均值為零的模型誤差,測量誤差ξ與(Y,X,Z,U)獨立,滿足Eξ=0,Cov(ξ)=Σξ.,其中 Σξ已知。
對于模型(1),參數(shù)分量β的估計和檢驗一直是研究的重點。You和Chen(2006)[1]提出了校正profile最小二乘估計,并給出了所提估計量的漸近性質。實際數(shù)據(jù)分析中,除了樣本數(shù)據(jù)本身,有時還能從其他途徑得到額外信息,這些信息的加入能夠提高估計的效率。這些額外信息的常見表現(xiàn)形式有兩種:精確的線性約束條件和隨機約束條件。對于經(jīng)典線性回歸模型,在含有精確線性約束條件時,考慮了約束條件的約束最小二乘估計優(yōu)于沒有考慮約束條件的普通最小二乘估計。當模型系數(shù)含有隨機約束時,Durbin(1953)[2],Theil和 Goldberger(1961)[3]以及 Theil(1963)[4]將樣本數(shù)據(jù)信息和附加的隨機約束條件聯(lián)合起來,提出了混合估計方法。關于線性回歸模型約束估計的詳細討論可參考 Toutenburg(1982)[5]和 Rao等(2008)[6]。近年來,關于各類復雜模型的約束估計得到了關注。Shalabh 等(2010)[7]以及Li和Yang(2013)[8]討論了線性測量誤差模型的隨機約束問題。對于模型(1),Wei(2012)[9]討論了當參數(shù)分量附加有精確的線性約束條件時的估計和檢驗問題。本文將研究模型(1)的隨機約束估計,考慮如下的隨機約束條件:
其中矩陣A為k×p行滿秩,η為均值為0,協(xié)方差矩陣為σ2Ω的隨機向量,其中 Ω為一已知正定矩陣,b是k×1的已知向量,針對模型(1)和模型(2),下文將重點研究未知參數(shù)分量β的估計問題。
首先假設自變量X可以精確觀測,令為來自模型(1)的樣本數(shù)據(jù),從而有:
假設β已知,則模型(3)可記為:
顯然,模型(4)是一個標準的變系數(shù)模型,下面采用局部線性方法對該模型進行估計。假設{ }αj(·),j=1,2,…q二階連續(xù)可導,對于u0附近的點u,由Taylor展開可得:
令:
其中Iq和0q分別為q維單位陣和元素全為零的矩陣。用α(Ui)代替模型(3)中α(Ui),經(jīng)過簡單計算可得:
利用Theil和Goldberger(1961)[3]的方法,將樣本數(shù)據(jù)信息和隨機約束條件結合起來構造如下關于未知參數(shù)β的函數(shù):
將F(β)關于β求偏導,并令其等于零,得:
從而,由式(11)和式(12),可寫為如下形式:
其中為式(8)中β的校正profile最小二乘估計。
下面給出所提估計量的漸近性質。定義表示AAT,
以及
定理1:若假設A1—A6成立,
首先,給出證明定理所需要的一些假設,這些條件You和Chen(2006)[1]也采用過。
(A1)隨機變量U具有有界支撐Π,其密度函數(shù)f(·)在其支撐上滿足Lipschitz連續(xù),且不為0。
從界面設計的角度上來說,信息傳播是建立在人與人之間的一種社會活動,作為信息發(fā)布者和傳播媒介的參與者,就需要融入群體中,了解歷史文化景區(qū)形象傳播活動的目的性和創(chuàng)造性,其中,目的性是指人類意識受信息傳播控制的一種行為,具有較為明確的目標和對象作為規(guī)劃的主題,在信息傳播的全過程中具備一定的動機和方向。比如通過媒介廣告對旅游景區(qū)藝術形象進行傳播,經(jīng)過策劃獲取宣傳效果。在信息化視域下的旅游景區(qū)需要利用科學技術的傳播方式,用最簡單的語言和文字進行傳播,在彼此的影響和相互作用下完成整個形象的信息傳遞[3]。
(A2)對于任一U∈Ω,矩陣E(zzT|U)為非奇異,E(zzT|U),E(zzT|U)-1和E(zxT|U)都是Lipschitz連續(xù)的。
(A3)存在s>2 使得E‖x‖2s<∞ 和E‖z‖2s<∞,對于ε<2-s-1使得n2ε-1h→∞
(A4){αj(·),j=1,…,q} 二階連續(xù)可導。
(A5)函數(shù)K(·)為對稱密度函數(shù),具有緊支撐。
(A6)nh8→0和
由 You和Chen(2006)[1]中的引理 A3 和 A4,可得:
再由式(19)和式(20),利用Slutsky定理,可得:
該結論表明校正profile混合估計的漸近性質與profile最小二乘估計的相同,這個結論在Shalabh等(2010)[7]以及Li和Yang(2013)[8]關于線性測量誤差模型的討論中也得到過。值得注意的是,雖然二者的漸近性質相同,但校正profile混合估計利用了附加的隨機約束條件,二者在有限樣本情況下的表現(xiàn)應該有所不同,下文將通過數(shù)值模擬來考察。
下面通過數(shù)值模擬來考察所提估計方法的有效性。假設數(shù)據(jù)來自于如下部分線性變系數(shù)測量誤差模型:
其 中x1i~N(0,1),x2i~N(1,2),x3i~U(-2,2),x4i~U(-1,1),zi~N(1,1),ui~U(0,1),α(ui)=sin(2πui), 測 量誤 差
為了考察誤差分布對估計結果的影響,將誤差設定為如下三種分布形式,都滿足均值為零,方差為1,(1)εi~N。核函數(shù)為K(x)為了計算方便,窗寬設定為h=n-1/5。參數(shù)分量 (β1,β2,β3,β4)=(2,1,3,3),樣本量n=80,120,150,隨機約束設定為β1+β2=3+η1和β3-β4=η2,其中Eη1=Eη2, 從 而有:
對于上述每次設定,重復500次,每次求出β的校正profile最小二乘估計和校正profile混合估計。這兩類估計將基于估計的均方誤差(estimated mean squared error,EMSE)這一指標來進行比較。EMSE定義如下:
表1 兩類估計的EMSE值比較
從模擬結果不難看出,隨著樣本量的增加,兩類估計的EMSE都在變小。對于每種設定,βm的EMSE都要小于β的對應值,即在 EMSE 標準下,βm要優(yōu)于β。
近年來,部分線性變系數(shù)模型的估計問題已經(jīng)得到了廣泛的研究,本文主要研究了該模型在線性部分自變量不能精確觀測且參數(shù)分量附加有隨機約束條件時的估計問題。給出了所提估計的漸近性質,并且通過數(shù)值模擬驗證了所提方法的有效性。