王愛(ài)民,金 浩,宋雪麗
(西安科技大學(xué) 理學(xué)院,西安 710054)
近年來(lái),Ratio 統(tǒng)計(jì)量是一種流行的檢驗(yàn)時(shí)間序列變點(diǎn)問(wèn)題的方法,其與傳統(tǒng)的累計(jì)和方法相比不需要方差的估計(jì)。Horváth 等(2008)[1]運(yùn)用Ratio 統(tǒng)計(jì)量檢驗(yàn)短記憶的均值變點(diǎn)問(wèn)題;Shao(2011)[2]、Kai 等(2018)[3]和Wingert 等(2020)[4]進(jìn)一步研究了長(zhǎng)記憶變點(diǎn)問(wèn)題;Chen 等(2016)[5]運(yùn)用Ratio統(tǒng)計(jì)量檢驗(yàn)從短記憶到長(zhǎng)記憶的變點(diǎn)問(wèn)題。
實(shí)際上,上述文獻(xiàn)大多考慮方差有限的情形。然而,方差無(wú)窮序列的大部分信息滯留在尾部,不能用傳統(tǒng)高斯序列來(lái)刻畫,所以本文針對(duì)方差無(wú)窮AR(p)序列檢驗(yàn)結(jié)構(gòu)變點(diǎn)。假設(shè)yt由下列模型產(chǎn)生:
其中,xt=(1,t,…,tp)T,β=(β0,β1,…,βp)T,p是大于等于0 的整數(shù)。εt是p階自回歸序列,新息過(guò)程ηt位于穩(wěn)定吸收域。有:
參數(shù)κ(尾指數(shù))控制尾部分布的厚度是未知的。式(3)和式(4)表明存在aT和bT使得:
先假設(shè)bT=0,κ>1,此時(shí)E(ηt)=0。特別地,當(dāng)ηt是獨(dú)立同分布的序列時(shí),Kokoszka和Wol(f2004)[6]已證明:
本文拓展了Jin等(2009)[7]和Wang等(2016)[8]的理論,把獨(dú)立同分布的新息過(guò)程延伸到弱相依的AR(p)情形;探索用ηt新息替代εt從而獲得準(zhǔn)確的臨界值。雖然Perron和Zhu(2005)[9]以及Yang(2017)[10]提出了對(duì)趨勢(shì)變點(diǎn)位置的估計(jì),但是少有學(xué)者關(guān)注其檢驗(yàn)問(wèn)題,為此,本文考慮了厚尾AR(p)相依序列趨勢(shì)變點(diǎn)的檢驗(yàn)問(wèn)題。
假設(shè)y1,…,yT滿足模型(1)和模型(2)。考慮p=1,即xt=(1,t)T。當(dāng)p=0 時(shí),模型退化成含有常數(shù)項(xiàng)的均值變點(diǎn)模型,本文不做研究。對(duì)于更一般的情況,xt=(1,t,…,tp)T,p≥2 仍然有效。在引入變點(diǎn)模型之前,為滿足漸近有效性需提出如下假設(shè):
假設(shè)1:假設(shè)1-ρ1z-…-ρpzp=0 所有的特征根都在單位圓外。
假設(shè)2:新息過(guò)程ηt是獨(dú)立同分布的,在吸收域κ?(1,2)且E(ηt)=0。
假設(shè)1 說(shuō)明AR(p)過(guò)程可以表示為無(wú)限階移動(dòng)平均過(guò)程。假設(shè)2保證式(6)的中心極限定理存在,從而下列的Ratio 統(tǒng)計(jì)量有準(zhǔn)確的極限分布。考慮新息過(guò)程為AR(p)的趨勢(shì)變點(diǎn)模型:
其中,εt是厚尾AR(p)序列,1{?}是示性函數(shù),k*是趨勢(shì)變點(diǎn)位置。ρi=0,i=1,…,p,模型退化為文獻(xiàn)[8]及文獻(xiàn)[11]的模型。原假設(shè)和備擇假設(shè)下的檢驗(yàn)問(wèn)題為:
本文給出檢驗(yàn)趨勢(shì)變點(diǎn)在原假設(shè)下的極限分布和備擇假設(shè)下的一致性。為了方便起見(jiàn),令v=k/T,s=i/T,v*=k*/T。
定理1:假設(shè)yt由式(8)生成,εt是厚尾AR(p)序列。若原假設(shè)H0、假設(shè)1和假設(shè)2成立,則當(dāng)T→∞時(shí),有:
證明:計(jì)算yt(t=1,…,k)對(duì)μ和β回歸的最小二乘估計(jì)殘差:
結(jié)合式(13)至式(15),得到統(tǒng)計(jì)量原假設(shè)下的極限分布為:
定理2:假設(shè)yt由式(8)生成,εt是厚尾AR(p)序列。若備擇假設(shè)H1、假設(shè)1 和假設(shè)2 成立,當(dāng)T→∞時(shí),Ξ=R(k*),有:
證明:若k 從而得到分母第二項(xiàng)的發(fā)散速度: 因?yàn)橼厔?shì)變點(diǎn)的極限分布依賴于尾指數(shù)κ,目前已有一些關(guān)于尾指數(shù)估計(jì)的文獻(xiàn),比如Koedijk 等(1990)[12]和Resnick(2007)[13]的研究,但其準(zhǔn)確性不是很好。當(dāng)使用Subsampling 抽樣方法的時(shí)候就能避免參數(shù)κ的估計(jì)。具體步驟如下: 第一步,計(jì)算yt對(duì)μ和β回歸的最小二乘估計(jì)殘差:=yt--,t=1,2,…,T。 第二步,計(jì)算對(duì)ρ回歸的最小二乘估計(jì)殘差: 構(gòu)造如下檢驗(yàn)統(tǒng)計(jì)量: 為驗(yàn)證Subsampling 抽樣方法的Ratio 檢驗(yàn)有效性,下面給出原假設(shè)下的相合性。 定理3:當(dāng)T→∞,b→∞時(shí),滿足b/T→0。若假設(shè)1和假設(shè)2同時(shí)成立,則對(duì)任意x>0,有。 在開發(fā)房地產(chǎn)之前,必須要考慮好供求關(guān)系,這對(duì)于房?jī)r(jià)、成本計(jì)算以及開發(fā)時(shí)間和房屋的數(shù)量等起到了重要的價(jià)值,也可以促進(jìn)房地產(chǎn)行業(yè)的發(fā)展。可以促進(jìn)城市的建設(shè),在規(guī)劃當(dāng)中,還需要控制風(fēng)險(xiǎn)來(lái)讓規(guī)劃變得更具有可行性。 定理3:證明可參考文獻(xiàn)[11]。 通過(guò)經(jīng)驗(yàn)水平和經(jīng)驗(yàn)勢(shì)的模擬結(jié)果來(lái)說(shuō)明上述基于Subsampling 抽樣Ratio 檢驗(yàn)趨勢(shì)變點(diǎn)的合理性。以下是樣本數(shù)據(jù)yt的產(chǎn)生過(guò)程: 考慮εt是一個(gè)AR(1)過(guò)程,εt=ρεt-1+ηt,ηt是獨(dú)立同分布的厚尾序列。尾指數(shù)κ?{1.1,1.2,…,1.9}。不失一般性,設(shè)置μ=0,β=0??紤]跳躍幅度??{0,0.2,0.6,1},自回歸系數(shù)ρ?{-0.9,-0.5,0,0.5,0.9},變點(diǎn)位置v*?{0.3,0.5,0.7},置信水平α=5%,樣本量T?{300,500,1000},進(jìn)行3000次循環(huán)。 因經(jīng)驗(yàn)水平都在5%的置信水平波動(dòng),所以經(jīng)驗(yàn)水平的扭曲可以忽略。數(shù)值模擬結(jié)果(見(jiàn)表1 至表3)表明,首先,經(jīng)驗(yàn)水平不依賴于自回歸系數(shù)ρ,這和定理1 是一致的;其次,經(jīng)驗(yàn)水平對(duì)尾指數(shù)的變化是敏感的;最后,隨著T的增大,經(jīng)驗(yàn)水平波動(dòng)性減小。所以在原假設(shè)下,基于Subsampling 抽樣的Ratio 檢驗(yàn)?zāi)芎芎玫乜刂平?jīng)驗(yàn)水平。 表1 Subsampling抽樣的Ratio檢驗(yàn)的經(jīng)驗(yàn)水平和經(jīng)驗(yàn)勢(shì)(T=300) 表2 Subsampling抽樣的Ratio檢驗(yàn)的經(jīng)驗(yàn)水平和經(jīng)驗(yàn)勢(shì)(T=500) 表3 Subsampling抽樣的Ratio檢驗(yàn)的經(jīng)驗(yàn)水平和經(jīng)驗(yàn)勢(shì)(T=1000) Subsampling抽樣的Ratio檢驗(yàn)在備擇假設(shè)下的經(jīng)驗(yàn)勢(shì)受到樣本量、跳躍幅度、變點(diǎn)位置、自回歸系數(shù)和尾指數(shù)的影響,純模擬結(jié)果表明: (1)隨著樣本容量T=300,500,1000 的增加,統(tǒng)計(jì)量的經(jīng)驗(yàn)勢(shì)隨之增加。這與定理2 是一致的,即在存在趨勢(shì)變點(diǎn)的情況下,樣本量越大,統(tǒng)計(jì)量越發(fā)散。 (3)統(tǒng)計(jì)量在后端的經(jīng)驗(yàn)勢(shì)大于在前端的經(jīng)驗(yàn)勢(shì),即變點(diǎn)在后端時(shí)更易檢驗(yàn)。例如當(dāng)T=300,?=0.6,ρ=0.5,κ=1.7 時(shí),對(duì)于v*=0.3,0.5,0.7,經(jīng)驗(yàn)勢(shì)分別是0.4805、0.8535和0.9420。 (4)在一階自回歸過(guò)程中,ρ≤0 的經(jīng)驗(yàn)勢(shì)大于ρ>0的經(jīng)驗(yàn)勢(shì),這和定理2 是一致的。除ρ=-0.9 之外,其余自回歸系數(shù)的經(jīng)驗(yàn)勢(shì)近似重合。例如當(dāng)T=500,?=0.6,v*=0.7,κ=1.7 時(shí),對(duì)于ρ=-0.5,ρ=0 和ρ=0.5,經(jīng)驗(yàn)勢(shì)分別為0.9680、0.9640和0.9560。 (5)當(dāng)?=0.2,κ≤1.6 時(shí),即使T很大,經(jīng)驗(yàn)勢(shì)也比較低,所以很難檢驗(yàn)出趨勢(shì)變點(diǎn)。但當(dāng)κ>1.6 時(shí),經(jīng)驗(yàn)勢(shì)就比較高。因趨勢(shì)變點(diǎn)的發(fā)散速度為T3-2/κ,所以κ較大時(shí)有更快的發(fā)散速度。以上的數(shù)值模擬結(jié)論說(shuō)明Subsampling抽樣的Ratio統(tǒng)計(jì)量能夠檢驗(yàn)厚尾序列的趨勢(shì)變點(diǎn)。 為通過(guò)實(shí)際應(yīng)用說(shuō)明Subsampling 抽樣的Ratio 統(tǒng)計(jì)量能夠檢驗(yàn)趨勢(shì)變點(diǎn),選取2016 年8 月19 日至2018 年1月18 日谷歌股票收盤價(jià)的356 次觀察數(shù)據(jù)(見(jiàn)圖1)進(jìn)行實(shí)證。首先,根據(jù)Perron 和Zhu(2005)[9]提出的方法估計(jì)趨勢(shì)變點(diǎn)=173,把整個(gè)樣本序列分成兩段[1,173] 和[1 74,356],修正后的序列定義為,t=1,…,356,,其 中,=783.4415,=0.4282,=0.3605;其次,使用貝葉斯信息準(zhǔn)則,判定為AR(1)模型并計(jì)算臨界值Ξb(0.05)=0.8406,其中,α=0.05,b=45;然后,用原始序列zt代替vt代入Ratio 統(tǒng)計(jì)量,得到Ξ=0.9047>0.8406,說(shuō)明序列確實(shí)存在趨勢(shì)變點(diǎn);最后,由于序列若存在持久性變點(diǎn),也會(huì)出現(xiàn)上述現(xiàn)象,因此應(yīng)用Kim(2000)[14]提供的Ratio統(tǒng)計(jì)量檢驗(yàn)此變點(diǎn),并未發(fā)現(xiàn)持久性變點(diǎn)。所以,該序列存在趨勢(shì)變點(diǎn)。 圖1 Google股票收盤價(jià) 本文提出基于Subsampling 抽樣的Ratio 統(tǒng)計(jì)量來(lái)檢驗(yàn)厚尾AR(p)序列趨勢(shì)變點(diǎn)。在原假設(shè)下推導(dǎo)出統(tǒng)計(jì)量的極限分布是列維過(guò)程的泛函,在備擇假設(shè)下得到統(tǒng)計(jì)量的一致性。同時(shí),Subsampling抽樣對(duì)于厚尾AR(p)序列有比較精確的臨界值。蒙特卡洛數(shù)值模擬結(jié)果表明該抽樣的Ratio檢驗(yàn)實(shí)現(xiàn)了較好的經(jīng)驗(yàn)水平和經(jīng)驗(yàn)勢(shì)。最后,通過(guò)一組數(shù)據(jù)闡明了理論的可行性和有效性。總之,基于Subsampling 抽樣的Ratio 檢驗(yàn)是判斷厚尾序列有趨勢(shì)變點(diǎn)的有效工具。3 Subsampling抽樣
4 數(shù)值模擬
5 谷歌股票價(jià)格分析
6 結(jié)束語(yǔ)