劉佳,趙慧文,劉光榮
(空軍工程大學(xué)理學(xué)院,陜西西安710051)
基于SAS的非平穩(wěn)時(shí)間序列分析及實(shí)證研究
劉佳,趙慧文,劉光榮
(空軍工程大學(xué)理學(xué)院,陜西西安710051)
采用季節(jié)指數(shù)趨勢(shì)法,對(duì)具有季節(jié)變動(dòng)的非平穩(wěn)時(shí)間序列(以某電腦公司的實(shí)際季度銷售記錄為例),利用統(tǒng)計(jì)分析系統(tǒng)SAS進(jìn)行分析,并對(duì)該公司2009年的銷售情況進(jìn)行了預(yù)測(cè).與公司2009年度前三個(gè)季度的實(shí)際銷售數(shù)據(jù)進(jìn)行對(duì)比,擬合效果令人滿意,證明該方法實(shí)用有效.
時(shí)間序列;SAS;非平穩(wěn)時(shí)間序列;季節(jié)指數(shù)趨勢(shì)法
在自然現(xiàn)象和經(jīng)濟(jì)現(xiàn)象中,人們?yōu)榱颂剿髂承┦挛锘蛳到y(tǒng)的運(yùn)行規(guī)律,需要觀測(cè)所要研究的某種現(xiàn)象,從而得到一定順序的數(shù)據(jù)資料,通過(guò)分析這些數(shù)據(jù)資料,對(duì)事物或系統(tǒng)的未來(lái)發(fā)展進(jìn)行預(yù)測(cè)或控制,這種方法稱為時(shí)間序列分析.從數(shù)學(xué)意義上講,對(duì)某一過(guò)程中的某一變量或一組變量X(t)進(jìn)行觀察測(cè)量,在一系列時(shí)刻t1,t2,…,tN(t1<t2<…<tN)得到的有序數(shù)據(jù)集合X(t1),X(t2),…,X(tN),稱為時(shí)間序列[1].時(shí)間序列分析作為數(shù)理統(tǒng)計(jì)的一個(gè)分支,是一種利用具有“時(shí)間特性”的觀測(cè)數(shù)據(jù),根據(jù)研究對(duì)象的特征,發(fā)掘內(nèi)在規(guī)律,建立動(dòng)態(tài)模型,并對(duì)之進(jìn)行模式識(shí)別、參數(shù)估計(jì),然后以此為依據(jù),對(duì)未來(lái)的行為進(jìn)行科學(xué)的預(yù)測(cè)和控制的統(tǒng)計(jì)方法,在工程技術(shù)、經(jīng)濟(jì)管理、氣象學(xué)、地球物理學(xué)等方面有著廣泛的應(yīng)用.面對(duì)實(shí)際問(wèn)題,當(dāng)數(shù)據(jù)很多時(shí),如果沒有計(jì)算機(jī)程序,人們很難完成工作.SAS作為國(guó)際上最流行的統(tǒng)計(jì)分析系統(tǒng),在統(tǒng)計(jì)分析領(lǐng)域具有最權(quán)威的統(tǒng)計(jì)分析能力[2].本文利用SAS系統(tǒng)對(duì)電腦零售業(yè)時(shí)間序列數(shù)據(jù)進(jìn)行建模.
電腦零售業(yè)是一個(gè)競(jìng)爭(zhēng)非常激烈的產(chǎn)業(yè),其銷售量一方面決定于零售企業(yè)的產(chǎn)品供給能力,另一方面,買方市場(chǎng)的形成更大程度上受到消費(fèi)市場(chǎng)的影響,由此可見零售業(yè)銷售量是由多種因素決定的[3].本文利用季節(jié)指數(shù)趨勢(shì)法,結(jié)合山東省泰安市某電腦公司的季度銷售數(shù)據(jù),建立模型,并運(yùn)用該模型對(duì)該公司2009年銷售量進(jìn)行預(yù)測(cè).
時(shí)間序列分析是一種動(dòng)態(tài)的數(shù)列分析,其目的在于掌握統(tǒng)計(jì)數(shù)據(jù)隨時(shí)間變化的規(guī)律.時(shí)間序列中每一時(shí)期的數(shù)值都是由許多不同的因素同時(shí)發(fā)生作用后的綜合結(jié)果.在進(jìn)行時(shí)間序列分析時(shí),人們通常將各種可能發(fā)生影響的因素按其性質(zhì)不同分成4大類:長(zhǎng)期趨勢(shì)、季節(jié)變動(dòng)、循環(huán)變動(dòng)和不規(guī)則變動(dòng).根據(jù)時(shí)間序列所研究的依據(jù)不同,有如下分類[4-5]:
1)按所研究對(duì)象的多少,可分為一元時(shí)間序列和多元時(shí)間序列;
2)按時(shí)間的連續(xù)性,可分為離散時(shí)間序列和連續(xù)時(shí)間序列;
3)按序列的統(tǒng)計(jì)特性,可分為平穩(wěn)時(shí)間序列和非平穩(wěn)時(shí)間序列;
4)按序列的分布規(guī)律,可分為Gauss時(shí)間和Non-Gauss時(shí)間序列.
非平穩(wěn)時(shí)間序列是指時(shí)間序列呈現(xiàn)出明顯的趨勢(shì)性或周期性,此時(shí)就不能認(rèn)為該序列是均值和方差不變的平穩(wěn)過(guò)程,而是非平穩(wěn)過(guò)程.研究這一非平穩(wěn)過(guò)程的主要理論基礎(chǔ)是Cramer分解定理[4-5].
Cramer分解定理任何一個(gè)時(shí)間序列{Xt}都可以分解為疊加的兩部分,其中一部分是由多項(xiàng)式?jīng)Q定的確定性趨勢(shì)成分,另一部分是平穩(wěn)的零均值誤差成分,即:
其中d<∞,β1,β2,…,βd為常數(shù)系數(shù),{εt}為一個(gè)零均值白噪聲序列,B為延遲算子,且有:
其中,E為數(shù)學(xué)期望,Θ(B)為自回歸系數(shù)多項(xiàng)式,εt為 t時(shí)刻對(duì)系統(tǒng)的隨機(jī)擾動(dòng)(或噪聲).即,均值序列反映了{(lán)Xt}受到的確定性影響,而受到的隨機(jī)影響.
Cramer分解定理說(shuō)明了任何一個(gè)序列的波動(dòng)都可以視為同時(shí)受到了確定性影響和隨機(jī)影響的綜合作用.平穩(wěn)序列要求這兩方面的影響都是穩(wěn)定的,而非平穩(wěn)序列產(chǎn)生的機(jī)理則在于它所受到的這兩方面的影響至少有一方面是不平穩(wěn)的.
我們把因季節(jié)影響而出現(xiàn)變動(dòng)的時(shí)間序列稱為具有季節(jié)變動(dòng)的時(shí)間序列[4].季節(jié)變動(dòng)是一種由于自然條件、消費(fèi)習(xí)慣等因素的作用,使研究對(duì)象以一定時(shí)期為一周期呈現(xiàn)較有規(guī)律的上升、下降交替運(yùn)動(dòng),通常表現(xiàn)為現(xiàn)象在一年內(nèi)隨著季節(jié)的更替而發(fā)生有規(guī)律的增減變化.季節(jié)變動(dòng)分析就是為了確定季節(jié)變動(dòng)指數(shù),將其影響消去,從而比較科學(xué)地對(duì)序列的發(fā)展做出預(yù)測(cè).具有季節(jié)變動(dòng)的時(shí)間序列,有水平趨勢(shì)和升降趨勢(shì)兩種情形.季節(jié)變動(dòng)分析包括季節(jié)指數(shù)水平法和季節(jié)指數(shù)趨勢(shì)法兩種,剔除季節(jié)影響的時(shí)間序列稱為消除季節(jié)影響的時(shí)間序列.剔除季節(jié)影響后,一期與另一期的對(duì)比將更有意義,而且可以幫助我們確定時(shí)間序列是否存在趨勢(shì)[6].
如果時(shí)間序列{Xt}既存在季節(jié)變動(dòng),同時(shí)各年水平或同月(或季)水平呈現(xiàn)上升或下降趨勢(shì),這時(shí)不能采用指數(shù)水平法,而應(yīng)該采用季節(jié)指數(shù)趨勢(shì)法[7],其預(yù)測(cè)模型為:
其中,Tt是時(shí)間序列{Xt} 所測(cè)量出的長(zhǎng)期趨勢(shì),S代表季節(jié)因素,I代表不規(guī)則因素,St和It成分由相應(yīng)的項(xiàng)目測(cè)量,其數(shù)值大于1表示它們的影響在趨勢(shì)之上,小于1則表示它們的影響在趨勢(shì)之下.
季節(jié)指數(shù)趨勢(shì)法的基本思路是:先分離出不含季節(jié)周期變動(dòng)的長(zhǎng)期趨勢(shì),再計(jì)算季節(jié)指數(shù),最后建立預(yù)測(cè)模型[8].基本步驟如下.
1)以一年的季度數(shù)4或者月數(shù)12為k,對(duì)觀測(cè)值時(shí)間序列進(jìn)行k項(xiàng)中心移動(dòng)平均,形成新的序列{At} ,它體現(xiàn)出原始序列的長(zhǎng)期趨勢(shì)Tt.這是因?yàn)橹行囊苿?dòng)平均消去了季節(jié)影響和短期內(nèi)不規(guī)則因素影響,所以中心移動(dòng)平均得到的數(shù)據(jù)可以看做趨勢(shì)項(xiàng).
2)將各期觀測(cè)值除以同期移動(dòng)均值得到季節(jié)比率Dt(Dt=St· It),即:Dt=Xt/At.
3)將各年同季(或月)的季節(jié)比率平均,即得其季節(jié)指數(shù)St.季節(jié)比率平均可以消除不規(guī)則因素的變動(dòng).如有必要?jiǎng)t還需規(guī)范化處理,所謂規(guī)范化是指季節(jié)之和要等于4,月份指數(shù)之和要等于12.
4)用時(shí)間序列{Xt} 的每個(gè)觀察值除以相應(yīng)的季節(jié)指數(shù),消除時(shí)間序列的季節(jié)影響,得到時(shí)間序列的非季節(jié)影響序列{Tt} ,即:Tt=Xt/St.
表1 2004~2008年季度銷售數(shù)據(jù)
5)利用消除季節(jié)影響的線性趨勢(shì)預(yù)測(cè)值建立回歸模型:Tt=a+bt,進(jìn)行回歸分析和白噪聲檢驗(yàn).
表1為山東省泰安市某電腦公司2004~2008年的實(shí)際銷售數(shù)據(jù),我們以此數(shù)據(jù)為基礎(chǔ),對(duì)該時(shí)間序列進(jìn)行分析預(yù)測(cè).
首先編寫SAS程序,畫出該銷售量的散點(diǎn),如圖1.程序如下所示:
由圖1知,該時(shí)間序列受長(zhǎng)期趨勢(shì)和以年為周期的季節(jié)波動(dòng)共同影響,因此要先考慮剔除趨勢(shì),再分析季節(jié)特征.具體步驟如下.
1)對(duì)時(shí)間序列觀測(cè)值進(jìn)行k項(xiàng)中心移動(dòng)平均.由圖1所顯示的特征可知,應(yīng)該選擇4項(xiàng)進(jìn)行中心移動(dòng)平均,得到中心化的移動(dòng)平均數(shù)At,在“消除”了時(shí)間序列的季節(jié)和不規(guī)則波動(dòng)之后,有非常明顯的趨勢(shì).
2)將各期觀測(cè)值除以同期移動(dòng)均值,得到季節(jié)比率Dt.數(shù)據(jù)的中心化移動(dòng)平均值和季節(jié)比率如表2所示.
圖1 銷售量散點(diǎn)圖
3)將各年同季度的季節(jié)比率平均,得其季節(jié)指數(shù)St, 如表3.由表3中的數(shù)據(jù)可以看出:電腦銷售較好的季度在第二、三季度,季度指數(shù)分別為1.08和1.36;最差為第一季度,季度指數(shù)僅為0.77.
表2 季度銷售數(shù)據(jù)的中心化移動(dòng)平均值和季節(jié)比率
表3 季度銷售數(shù)據(jù)的季節(jié)指數(shù)
4)用時(shí)間序列的每個(gè)觀察值除以相應(yīng)的季節(jié)指數(shù),得到消除季節(jié)影響后的數(shù)據(jù),
即:Tt=Xt/St,如表2最后一列.
5)利用消除季節(jié)影響的數(shù)據(jù)建立回歸模型:Tt=a+bt,然后進(jìn)行回歸分析和白噪聲檢驗(yàn),其SAS語(yǔ)句為:
由SAS進(jìn)行回歸分析和白噪聲檢驗(yàn)得到表4中所示的結(jié)果,由于P值小于0.001,可以看出模型是顯著的,利用上述參數(shù)估計(jì)得到回歸模型:
表4 回歸分析和白噪聲檢驗(yàn)
利用SAS語(yǔ)句畫出消除季節(jié)影響后的季度銷售量折線圖,如圖2所示,由圖2中的趨勢(shì)得出趨勢(shì)模型(1)是適應(yīng)的.SAS語(yǔ)句為:
6)進(jìn)行預(yù)測(cè)和季節(jié)調(diào)整.
對(duì)同時(shí)具有趨勢(shì)和季節(jié)成分的時(shí)間序列進(jìn)行預(yù)測(cè)的最后一步,是利用季節(jié)指數(shù)調(diào)整趨勢(shì)預(yù)測(cè)值.經(jīng)過(guò)回歸分析和白噪聲檢驗(yàn),過(guò)去20個(gè)季度的銷售資料對(duì)未來(lái)趨勢(shì)非常合適,則這個(gè)回歸模型方程可以用來(lái)推測(cè)未來(lái)季度時(shí)間序列的趨勢(shì)成分.分別將t=21,22,23,24帶入模型(1),得到2009年的電腦銷售量,這是未來(lái)4個(gè)季度的趨勢(shì)預(yù)測(cè)值,要想得到最終的預(yù)測(cè)值,必須用季節(jié)影響調(diào)整預(yù)測(cè)值,即:用預(yù)測(cè)值乘以季節(jié)指數(shù),如表5所示.
圖2 消除季節(jié)影響后的銷售量折線圖
表5 2009年季度銷售量預(yù)測(cè)
最后,通過(guò)繼續(xù)跟蹤2009年該公司前三個(gè)季度的實(shí)際銷售量發(fā)現(xiàn):第一季度的銷售量為132臺(tái),第二季度的銷售量為161臺(tái),第三個(gè)季度為242臺(tái),實(shí)際結(jié)果與預(yù)期的相比,其誤差分別為4.35%、21.7%、3.2%.雖然第二個(gè)季度的差距相對(duì)較大,但是考慮受到經(jīng)濟(jì)危機(jī)這一特殊因素的影響,整個(gè)實(shí)證分析的結(jié)果還是令人滿意的.事實(shí)證明,該方法具有很好的實(shí)用性.
本文利用統(tǒng)計(jì)分析系統(tǒng)SAS中的REG和ARIMA過(guò)程,分別建立了季度銷售數(shù)據(jù)的預(yù)測(cè)模型,并得到了較好的預(yù)測(cè)效果.但銷售市場(chǎng)經(jīng)常會(huì)受到各種外界因素的影響,我們的預(yù)測(cè)數(shù)據(jù)只提供一種發(fā)展趨勢(shì),不可能與實(shí)際銷量完全一致,誤差的存在是必然的,這也正反映了銷售市場(chǎng)的隨機(jī)性.
[1] Falk M.A first course on time series analysis:examples with SAS[M].Chair of Statistics,University of Würzburg,2006.
[2] 阮桂海.SAS統(tǒng)計(jì)分析大全[M].北京:清華大學(xué)出版社,2003.
[3] 黨姬男.ARMA時(shí)間序列模型在銷售預(yù)測(cè)中的應(yīng)用[J].應(yīng)用技術(shù)與研究,2009(4):55-57.
[4] 何書元.應(yīng)用時(shí)間序列分析[M].北京:北京大學(xué)出版社,2003.
[6] 鮑爾曼,奧康奈爾.預(yù)測(cè)與時(shí)間序列[M].3版.北京:機(jī)械工業(yè)出版社,2003.
[7] 郭秀英,尹興國(guó),張艷云.季節(jié)性波動(dòng)時(shí)間序列預(yù)測(cè)的分解季節(jié)指數(shù)法[J].數(shù)理統(tǒng)計(jì)與管理,2000,19(6):60-65.
[8] 彭威,孫潔.基于季節(jié)指數(shù)趨勢(shì)法預(yù)測(cè)10086話務(wù)量[J].郵電設(shè)計(jì)技術(shù),2009(6):62-65.
Nonstationary Time Series Analysis and Case Study Based on SAS
LIU Jia,ZHAO Hui-wen,LIU Guang-rong
(College of Science,Air Force Engineering University,Xi’an 710051,Shaanxi,China)
Seasonal index trend method is used to analyze the nonstationary time series with the seasonal variation(a co mputer company’s actual quarterly sales record)by the statistical analysis system,and its sales in 2009 is forecasted.Up to now,compared with the actual sales data of the year in the first three quarters,the fitting results are satisfactory,and the method is shown to be practical and effective.
time series;SAS;nonstationary time series;seasonal index trend method
F 830.9
A
1001-4217(2010)01-0048-06
2009-09-23
劉佳(1984-),女,山東濟(jì)寧人,教師,碩士.研究方向:數(shù)理統(tǒng)計(jì).E-mail:liujia840229@163.com