摘 要: 使用經(jīng)典回歸分析對信號處理時通常假定噪聲服從高斯過程,然而現(xiàn)實(shí)中許多信號呈現(xiàn)噪聲自相關(guān)等非平穩(wěn)特性。常用的廣義差分法對噪聲自相關(guān)做差分處理時,固定了連續(xù)兩個樣本間的相關(guān)系數(shù),但是現(xiàn)實(shí)中相鄰兩個時間點(diǎn)樣本的相關(guān)程度往往不是確定的。將矢量三角形加減法法則與廣義差分相結(jié)合,開創(chuàng)性地提出具有無機(jī)自適應(yīng)性的矢量差分算法,其相關(guān)系數(shù)根據(jù)信號自身的規(guī)律自動調(diào)整。最后,將該方法應(yīng)用于噪聲自相關(guān)實(shí)例,結(jié)果表明矢量差分算法比廣義差分法的無機(jī)自適應(yīng)能力更強(qiáng),能夠更好地刻畫信號的變化規(guī)律。
關(guān)鍵詞: 無機(jī)自適應(yīng)算法; 噪聲自相關(guān); 矢量差分; 系數(shù)自動調(diào)整
中圖分類號: TN911?34; TP18 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2015)14?0016?04
一個離散的時間序列就是一個離散的時間信號。在兩個時間序列數(shù)據(jù)的回歸分析中,通常假設(shè)殘差噪聲在不同時點(diǎn)之間是不相關(guān)的。然而在現(xiàn)實(shí)問題的研究中,不少時間序列隨著時間的推移有一種長期趨勢,呈現(xiàn)信號不平穩(wěn)的特性。對這樣的兩列信號建立回歸模型時,殘差之間的相互獨(dú)立性就會遭到破壞,噪聲之間存在依賴性,用此模型進(jìn)行預(yù)測和結(jié)構(gòu)分析就會有較大的誤差。這時就需要用一定的方法對其進(jìn)行補(bǔ)救,國內(nèi)外學(xué)者對噪聲自相關(guān)問題的處理和研究主要是差分法。當(dāng)自相關(guān)系數(shù)已知時,通常采用廣義差分法對信號進(jìn)行處理,消除噪聲序列的自相關(guān)性。但在實(shí)際數(shù)據(jù)中,自相關(guān)系數(shù)一般是未知的,所以需要對其進(jìn)行估計(jì)。Cochrane和Orcutt于1949年提出了Cochrane?Orcutt迭代法,通過逐步迭代,提高自相關(guān)系數(shù)的近似估計(jì)精度直到滿意為止,再采用廣義差分法[1]。1960年Durbin提出了Durbin兩步法,即將數(shù)據(jù)進(jìn)行兩次廣義差分變換處理,再使用OLS法估計(jì)參數(shù),其優(yōu)點(diǎn)是只要樣本容許,可以修正任意階自相關(guān)[2]。張荷觀提出根據(jù)自回歸分布滯后模型直接建立樣本回歸方程的方法[3?4],并給出自相關(guān)系數(shù)的估計(jì),改進(jìn)了估計(jì)量的統(tǒng)計(jì)性質(zhì)并提高了擬合優(yōu)度。無論是差分法還是迭代法,它們都將信號樣本點(diǎn)間的相關(guān)系數(shù)固定,然而現(xiàn)實(shí)中相鄰兩期樣本點(diǎn)的相關(guān)程度往往不是固定的。為克服廣義差分法固定相關(guān)系導(dǎo)致構(gòu)建的模型泛化能力較弱的缺點(diǎn),本文將矢量三角形加減法法則與廣義差分方法相結(jié)合,開創(chuàng)性地提出了基于相關(guān)系數(shù)可自動調(diào)整的無機(jī)自適應(yīng)算法——矢量差分方法。這種無機(jī)自適應(yīng)算法與有機(jī)智能算法是不同的,現(xiàn)有的智能算法處理的大多是多變量、非線性的復(fù)雜系統(tǒng),對單變量、線性信號系統(tǒng)的建模效果較差[5]。智能算法在對目標(biāo)函數(shù)進(jìn)行優(yōu)化搜索時強(qiáng)調(diào)整體最優(yōu),這樣就會造成瞻前顧后,不能保證預(yù)測效果最優(yōu),而人們往往希望用于預(yù)測和分析的后期時間點(diǎn)最優(yōu)。本文提出的矢量差分算法是對輸入信號進(jìn)行優(yōu)化搜索,在強(qiáng)調(diào)當(dāng)期對近期依賴性的同時保證了當(dāng)期與遠(yuǎn)期的相互關(guān)聯(lián)性。
本文介紹了矢量差分的方法原理、矢量差分的一般公式和矢量差分算法的無機(jī)自適應(yīng)性;最后用噪聲自相關(guān)的離散時間序列做實(shí)驗(yàn),結(jié)果表明矢量差分算法模型比廣義差分法的無機(jī)自適應(yīng)能力更強(qiáng),能夠更好地刻畫信號的變化規(guī)律。
1 矢量差分的方法原理
矢量差分是按照三角形減法法則進(jìn)行的。在圓里面將矢量由最低點(diǎn)出發(fā)依次排列,連續(xù)兩期樣本點(diǎn)之間根據(jù)矢量模的大小就形成了不同的夾角。這樣在圓里面就實(shí)現(xiàn)了信號樣本點(diǎn)自相關(guān)系數(shù)在各點(diǎn)的自動調(diào)整。
1.1 矢量差分的原理
在三角形[OA1A2]中,矢量減法法則為:[A1A2=OA2-OA1],其中[A1A2]反映了矢量差,如圖1所示。
圖1 圓中三角形的矢量差分方法
下面按照張昴等提出的在直徑為1的圓中進(jìn)行矢量差分推導(dǎo)的方法,給出矢量差分[A1A2]的數(shù)值[6]。在圓[M]中,取直徑[OO′=1],令從點(diǎn)[O]出發(fā)任意一條弦[OA]的弦切角(與水平線的夾角)為[α]。根據(jù)弦切角定理:弦所對的圓周角的大小等于弦切角,則有[∠OO′A=α];即可得出,在直角[ΔOO′A]中,[OA=sin α],即任意圓周角[α]對應(yīng)弦的弦長為[sinα]。于是標(biāo)準(zhǔn)化轉(zhuǎn)換到[0,1]區(qū)間兩期數(shù)據(jù)間的矢量差為[A1A2=sin(α2-α1)]。下面結(jié)合廣義差分法給出矢量差分的一般形式。
1.2 矢量差分公式推導(dǎo)
在消除殘差噪聲自相關(guān)時,由于廣義差分法將相關(guān)系數(shù)固定,所以扭曲了信號的變化規(guī)律。本文將矢量差分算法可以自動調(diào)整相關(guān)系數(shù)的特性運(yùn)用到廣義差分法上,從而實(shí)現(xiàn)兩個連續(xù)樣本點(diǎn)相關(guān)系數(shù)的調(diào)整。
在圓里的矢量差分的代數(shù)形式為:
[At-1At=sin(αt-αt-1)]
而廣義差分的代數(shù)本質(zhì)如下式所示:
[xt-ρxt-1=sinαt-ρsinαt-1 =sin(arcsinxt)-ρsin(arcsinxt-1)]
本文提出一般矢量差分公式:
[xt-xt-1=sin(arcsinxt)-sin(ρ(arcsinxt-1))]
比較廣義差分法[xt-ρxt-1],矢量差分的一般公式為:
[xt-ρsin(arcsinxt-1)=xt-ρtxt-1]
進(jìn)而,在實(shí)現(xiàn)廣義差分的同時,保證了相關(guān)系數(shù)的自動調(diào)整。根據(jù)線性系統(tǒng)輸入輸出信號響應(yīng)分析的一般步驟[7],其原理圖如圖2所示。
圖2 矢量差分處理器
1.3 矢量差分的優(yōu)點(diǎn):相關(guān)系數(shù)的自適應(yīng)調(diào)整
由于[xn-ρxn-1=OAn-ρOAn-1=An-1An],則有[ρ=OAn-An-1AnOAn-1=sinαn-sinΔαnsinαn-1],其幾何形式見圖3。
圖3 自相關(guān)系數(shù)的自適應(yīng)調(diào)整
首先,對其進(jìn)行極限分析。當(dāng)兩期指標(biāo)非常接近時,[limΔαn→0ρ=sinαnsinαn-1=1]。 然后,任取[OAn-1=][sinαn-1,][ρ∝OAn-An-1An=sinαn-sinΔαn=sinαn-][sinαn-αn-1]。令[OAn]增大角度[θ],則有[ρ′∝sin(αn+θ)-sin[(αn+θ)-αn-1]=sin(αn+θ)-][sin[(αn-αn-1)+θ]]。注意到,正弦函數(shù)[y=sinx]在區(qū)間[(0,π2)]的二階導(dǎo)數(shù)小于0,隨著自變量[x]的增加[y]的增加越來越緩慢。那么當(dāng)角[αn]和[(αn-αn-1)]同時增加[θ]時,[(αn-αn-1)]對應(yīng)的函數(shù)值增加的更大,即有[sin(αn+θ)-sinαn 2 實(shí)驗(yàn)研究 2.1 一階殘差噪聲自相關(guān) 例1:在研究我國城鎮(zhèn)人均支出和人均收入兩列離散信號之間關(guān)系的問題中,記輸出信號城鎮(zhèn)家庭平均每人全年消費(fèi)性支出(元)為y,輸入信號城鎮(zhèn)家庭平均每人可支配收入(元)為x。 這里收集到1990—2009年20年的信號樣本點(diǎn)[8]如表1所示,試檢驗(yàn)殘差噪聲是否存在一階自相關(guān),建立相應(yīng)的線性映射方程并做響應(yīng)分析。 表1 我國城鎮(zhèn)人均收支表 2.1.1 直接對輸入信號和輸出信號做線性映射回歸 根據(jù)歸一化公式: [x′=x-xminxmax-xmin] (1) 將兩列信號樣本數(shù)據(jù)映射到[0,1]區(qū)間進(jìn)行標(biāo)準(zhǔn)化處理。將輸入信號x和輸出信號y進(jìn)行線性映射回歸擬合,得映射回歸為:[y=0.021+0.996x]。 此方程的調(diào)整R2為0.998。經(jīng)檢驗(yàn)[DW=0.300],[dL=1.200],[dU=1.410],[0.300 2.1.2 對輸入信號和輸出信號做廣義差分處理 分別對輸入信號x和輸出信號y的原始樣本點(diǎn)進(jìn)行轉(zhuǎn)換,即[xt′=xt-0.85xt-1],[yt′=yt-0.85yt-1]。再次進(jìn)行回歸擬合,得到:[yt′=0.009+0.954xt′]。 新回歸方程的調(diào)整R2為0.990,殘差的[DW=2.327],[dL=1.18],[dU=1.40],[dU<2.327<4-dU],因而[DW]落入無自相關(guān)區(qū)域[10]。 2.1.3 對輸入信號和輸出信號做矢量差分處理 對輸入信號x和輸出信號y分別進(jìn)行矢量差分,差分得到的信號分別表示為[x*]和[y*],則為[y*]對[x*]的線性映射為:[y*t=0.007+0.975x*t]。此時調(diào)整R2為0.996,殘差的[DW=2.301],[dU<2.301<4-dU],殘差噪聲已經(jīng)消除了自相關(guān)。 2.1.4 信號間響應(yīng)分析 經(jīng)過一階廣義差分法處理后有效數(shù)據(jù)樣本點(diǎn)是19個,基于[DW]檢驗(yàn)要求數(shù)據(jù)樣本量大于15,對信號進(jìn)行4步預(yù)測,并作響應(yīng)分析。以用前16個樣本值構(gòu)線性映射,預(yù)測第17個樣本值為例進(jìn)行詳細(xì)說明。本文使用[w=y-yy]作為預(yù)測誤差計(jì)算公式。 (1) 用前16個樣本量進(jìn)行廣義差分構(gòu)建的滯后回歸方程為: [yt-0.624 0yt-1=0.005 8+1.038 9(xt-0.624 0xt-1)] 還原線性映射為: [yt-0.624 0yt-1=130.731+0.728 6(xt-0.624 0xt-1)] 帶入樣本預(yù)測2006年城鎮(zhèn)家庭平均每人全年消費(fèi)性支出為8 884.42 726元,實(shí)際值為8 696.55元,誤差[w]為2.16%。 (2) 用前16個樣本量進(jìn)行矢量差分構(gòu)建的滯后回歸方程為: [sin(arcsinyt-0.624 0arcsinyt-1)=0.005 3+ 1.048 9sin(arcsinxt-0.624 0arcsinxt-1)] 還原線性映射為: [sin(arcsiny-yminΔy-0.624 0arcsinyt-1-yminΔy)=0.005 3+1.048 9sin(arcsinx-xminΔx-0.624 0arcsinxt-1-xminΔx)] 輸入信號x在2006年的數(shù)值,輸出2006年城鎮(zhèn)家庭平均每人全年消費(fèi)性支出為8 858.609 67元,實(shí)際為8 696.55元,誤差[w]為1.86%。按照這種方法,2007年,2008年和2009年的城鎮(zhèn)家庭平均每人全年消費(fèi)性輸出值可以依次求得,誤差結(jié)果見表2。 表2 一階噪聲自相關(guān)預(yù)測誤差 % 可見矢量差分算法的預(yù)測值全部顯著高于廣義差分法,凸顯其具有可自動調(diào)整的無機(jī)適應(yīng)性的優(yōu)越性,較好地刻畫了信號變化規(guī)律。 2.2 高階殘差噪聲自相關(guān) 例2:在研究我國人均消費(fèi)水平的問題中,記輸出信號全國人均消費(fèi)金額(元)為y,輸入信號人均國民收入(元)為x。收集到1980—1998年19年間的信號樣本點(diǎn)[8]如表3所示,試檢驗(yàn)殘差噪聲是否存在一階殘差噪聲自相關(guān),建立相應(yīng)的線性映射方程并做響應(yīng)分析。
表3 全國人均收支表
2.2.1 直接對輸入信號和輸出信號做線性映射回歸
將兩列信號樣本數(shù)據(jù)按照式(1)標(biāo)準(zhǔn)化到[0,1]區(qū)間。建立映射回歸如下所示:
[y=0.013+0.984x]
調(diào)整R2為0.999。計(jì)算出[DW=0.873,][dL=1.18 , 0.873
2.2.2 對輸入信號和輸出信號做廣義差分處理
對輸入信號x和輸出信號y廣義差分法處理后進(jìn)行回歸擬合,新回歸方程殘差的[DW=1.372]。此時[dL=1.16],[dU=1.39],[dL<1.372 [y″=0.001+0.995x″] 2.2.3 對輸入信號和輸出信號做矢量差分處理 一階矢量差分處理[DW]值為1.400,發(fā)現(xiàn)[dL<1.400 [y**]對[x**]的映射回歸如下: [y**=0.04+1.005x**] 由此可見矢量差分算法改進(jìn)估計(jì)量的統(tǒng)計(jì)性質(zhì),提高映射回歸的擬合優(yōu)度及系數(shù)檢驗(yàn)的顯著性。 2.2.4 信號間響應(yīng)分析 二次差分處理后有效數(shù)據(jù)樣本量是17,基于[DW]檢驗(yàn)要求數(shù)據(jù)樣本量大于15,對模型進(jìn)行2步預(yù)測,并做相應(yīng)分析,誤差結(jié)果如表4所示。 表4 高階噪聲自相關(guān)預(yù)測誤差 % 由表4可以看出兩年的矢量差分預(yù)測誤差均明顯低于廣義差分。進(jìn)一步論證了矢量差分在高階殘差噪聲自相關(guān)無機(jī)適應(yīng)性能力的優(yōu)越性,較好地刻畫了信號變化規(guī)律。 2.3 結(jié)果分析 通過一階殘差噪聲自相關(guān)和高階殘差噪聲自相關(guān)實(shí)例,分別利用廣義差分法和矢量差分法消除序列自相關(guān)并進(jìn)行響應(yīng)分析??梢园l(fā)現(xiàn),無論是在擬合優(yōu)度,還是在預(yù)測效果上,矢量差分方法都遠(yuǎn)遠(yuǎn)好于一般的廣義差分方法。從而論證了相關(guān)系數(shù)可以自動調(diào)整這一無機(jī)適應(yīng)性能力的優(yōu)越性。 3 結(jié) 語 本文提出將矢量三角形加減法法則與差分相結(jié)合所構(gòu)建的矢量差分方法在處理殘差噪聲自相關(guān)異常問題時,基于其自相關(guān)系數(shù)可以自動調(diào)整的無機(jī)適應(yīng)性,對輸入信號數(shù)值間進(jìn)行優(yōu)化搜索,在強(qiáng)調(diào)當(dāng)期對近期依賴性的同時滿足當(dāng)期與遠(yuǎn)期的關(guān)聯(lián)關(guān)系。對單變量、線性信號系統(tǒng)的實(shí)驗(yàn)表明通過矢量差分算法得出的映射回歸方程,其統(tǒng)計(jì)特性更加優(yōu)良,比廣義差分法泛化能力更強(qiáng),在響應(yīng)分析時凸顯了預(yù)測最優(yōu)的特性,能夠更好地刻畫信號的變化規(guī)律。 參考文獻(xiàn) [1] COCHRANE D, ORCUTT G H. Application of least squares regression to relationships containing auto?correlated error terms [J]. Journal of the American Statistical Association, 1949, 44 (245): 32?61. [2] DURBIN J. Estimation of parameters in time?series regression models [J]. Journal of the Royal Statistical Society B, 1960, 22(1): 139?153. [3] 張荷觀.存在自相關(guān)時檢驗(yàn)和估計(jì)方法的改進(jìn)—基于自回歸分布滯后模型的自相關(guān)檢驗(yàn)和參數(shù)估計(jì)[J].統(tǒng)計(jì)與信息論壇,2012,27(4):44?49. [4] 張荷觀.存在自相關(guān)時估計(jì)方法的改進(jìn)[J].數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2010(11):155?160. [5] 徐守時.信號與系統(tǒng):理論、方法和應(yīng)用[M].合肥:中國科技大學(xué)出版社,2003. [6] 張昴,郭琨.基于等時圓矢量差分的ARVMA模型及其實(shí)證研究[J].系統(tǒng)科學(xué)與數(shù)學(xué),2015,35(2):193?205. [7] 崔本亮.線性時不變(LTI)系統(tǒng)分析方法討論[J].現(xiàn)代電子技術(shù),2009,32(3):127?129. [8] 何曉群,劉文卿.應(yīng)用回歸分析[M].北京:中國人民大學(xué)出版社,2011. [9] WOOLDRIDGE J. Introductory econometrics: A modern approach [M]. USA: South Western, Division of Thomson Learning, 2012. [10] 高鐵梅.計(jì)量經(jīng)濟(jì)分析方法與建模[M].北京:清華大學(xué)出版社,2006.