溫美沙,王曉光,劉曉潔,楊 靜,李珍珍,屈文歡
(1.河北北方學(xué)院 理學(xué)院 統(tǒng)計(jì)系,河北 張家口 075031;2.大連理工大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,遼寧 大連 116024)
在目前快速發(fā)展的大數(shù)據(jù)時(shí)代中,現(xiàn)有的數(shù)據(jù)模型已經(jīng)無法滿足實(shí)踐中遇到的一些測量問題,限制了現(xiàn)代科學(xué)技術(shù)在數(shù)據(jù)模型上的應(yīng)用和發(fā)展。數(shù)據(jù)的可得性和多樣性使得樣本量無限增大,變量個(gè)數(shù)無限增多,從而對分析大數(shù)據(jù)特點(diǎn)有了新要求。例如說克服“維數(shù)災(zāi)難”,即解釋變量的個(gè)數(shù)增多時(shí),可以消除迅速增加的誤差導(dǎo)致模型的擬合效果大大降低的現(xiàn)象。統(tǒng)計(jì)學(xué)家在尋找既能達(dá)到數(shù)據(jù)降維,又能保留非參數(shù)光滑優(yōu)點(diǎn)的方法上,提出了多種降維的方法,把半?yún)?shù)可加模型中的非參數(shù)部分寫成加法結(jié)構(gòu)就是降維的一種方法。學(xué)者對半?yún)?shù)回歸模型已有全面的研究,如:柴根象[1]給出了半?yún)?shù)可加回歸模型中參數(shù)α和非參函數(shù)g的估計(jì),薛留根[2]研究了半?yún)?shù)回歸模型的兩階段估計(jì)的漸近性質(zhì),代金輝[3]在范數(shù)約束下給出了半?yún)?shù)回歸模型參數(shù)估計(jì)及性質(zhì)等。
半?yún)?shù)可加回歸模型:
(1)
其中Z=(1,Z1,……,Zd)′和X=(X1,…,XJ)′分別是參數(shù)部分和非參數(shù)部分的隨機(jī)向量,m1(·),m2(·),…,mJ(·)是未知光滑的單調(diào)遞增函數(shù),β=(β0,β1,…,βd)′是未知參數(shù)向量且屬于某個(gè)凸集β∈d+1,E(ε|Z,X)=0和Var(ε)=σ2。 對于模型(1),當(dāng)J=1時(shí),Huang[4]通過使用最小二乘的方法給出了參數(shù)部分的估計(jì)量是漸近正態(tài)的,且非參數(shù)函數(shù)的估計(jì)量在隨機(jī)向量X取某個(gè)固定值時(shí)是相合,其中保序估計(jì)量的性質(zhì)不受參數(shù)項(xiàng)引進(jìn)的影響。當(dāng)J>1時(shí),Cheng[5]基于池相鄰懲罰準(zhǔn)則研究了模型(1)的非參數(shù)函數(shù)的估計(jì)量也是相合。這篇文章對模型(1)的非參數(shù)部分使用帶有保序約束條件的Bernstein-Schoenberg(B-S)樣條[6]來逼近,從而估計(jì)其樣條的系數(shù)來對非參函數(shù)進(jìn)行估計(jì),然后再用最小二乘法估計(jì)參數(shù)部分。
(2)
對于某個(gè)xj,可以寫成
其中αj是L+k+1維的向量,bj(xj)=(b-k,j(xj),…,bL,j(xj))′是B-S樣條基函數(shù)。存在1個(gè)對B-S樣條的保序約束,在這樣的約束下,對于任意的l=-k+1,…,L,對系數(shù)向量αj進(jìn)行限制約束,使函數(shù)mj(xj)是單調(diào)遞增的,即找到1個(gè)(L+k)×(L+k+1)的矩陣A,使得Aαj≥0,其中
因此,在Aαj≥0的條件下,式(2)的極小化問題等價(jià)于找β和αj的值,使得式(3)
(3)
(S1)E(Z-E(Z|X))?2恒為正定陣,對任意的向量V∈Rd, 我們定義外積V?2為VV′。
(S2)E(exp(γ|ε|))
(S3)函數(shù)mj滿足
C1、α恒為正數(shù)。
(S4)假設(shè)Xj的密度函數(shù)PXj是有界的且滿足Lipschitz條件
C2、ρ是常數(shù)。
(S5)函數(shù)ζj(Xj)=E(Z|Xj=x)滿足條件
‖ζj(x)-ζj(x′)‖2≤C3|x-x′|
C3是常數(shù)。
基于上述6條假設(shè),可以得到定理1和定理2。
定理1假設(shè)條件(S1)和(S2)成立,給定歐式范數(shù)‖.‖2,則有
證明令xj(i)是Xj(i)的觀察值,且Xj(i)是順序統(tǒng)計(jì)量,即
Xj(i)={Xj∈[0,1]:mj(Xj(i))=(mj(Xj))i}
第一步,我們要證明(4)式成立。
(4)
聯(lián)合
bj(xj)=(b-k,j(xj),…,bL,j(xj))′,j=1,…,J
其中h是常數(shù)。因此,我們給出了下列不等式
其中C5,C6為有限正數(shù)。因此,證明式(4)成立。
第二步,我們要證明下面不等式成立。
(5)
(6)
式(5)的右邊
(7)
(8)
由式(6)、(7)和(8),證明式(5)成立。
第三步,給出一個(gè)函數(shù)族
=-P[rn(ε+z′(β0-β)+(M0-M)(x))]2+P(rnε)2
=-P[rn(z′(β0-β)+(M0-M)(x))]2
=-P(θ-θn)2>-δ2
(9)
(10)
所決定。根據(jù)式子(5),我們知道
P[rn(z′(β0-β)+(M0-M)(x))]2≤δ2
(11)
最后,就L2(P)范數(shù),研究Fn的δ-括號熵。因?yàn)镕n中的函數(shù)是關(guān)于(β,G(·))的二次方程,則Fn的δ-括號熵與G的一樣。由參考文獻(xiàn)[10]的推論1.3,我們知道G的δ-括號熵與1/ε同階,因此Fn的δ-括號熵也與1/ε同階。所以不等式(9)存在某個(gè)最小值,使得其等號成立,并且通過計(jì)算得到δ~n1/3。根據(jù)熵的變化,得到
(12)
其中β0是初始值,m0j(·)是初始函數(shù)。由于Z的有界性,不等式(4)進(jìn)一步得到
(13)
結(jié)合式子(13)的下界,有
(14)
和
(15)
式子(15)暗示了
由此,推出
假設(shè)X的密度函數(shù)是小于無窮且有界的。因此就證明了定理1。
定理2如果條件S2-S6成立且向量X是兩兩相互獨(dú)立的,就有
(16)
由于上述的等式及ε的獨(dú)立性,我們就能推出
(17)
(18)
其中
和
最后,通過參考文獻(xiàn)[10]的引理5.13給出∏n的討論。與本文定理1的證明類似,先給出函數(shù)族
其中rn=(logn)-1,g由上述所定義。
結(jié)合上述∑n,Δn和Πn的分析,首先對等式(18)的右端第一項(xiàng)應(yīng)用中心極限定理,證得它是服從正態(tài)分布的。然后再對整個(gè)等式(18)應(yīng)用Slutsky定理。證得定理2成立。