陳 浩,蘭燕鴻,何郁波
(懷化學(xué)院數(shù)學(xué)與計算科學(xué)學(xué)院,湖南 懷化 418000)
金融市場存在很多時間序列數(shù)據(jù),如不斷變動的股價、利率等.不同于截面數(shù)據(jù),時間序列數(shù)據(jù)揭示了系統(tǒng)的運(yùn)行規(guī)律,通過探究其中的規(guī)律,可以對未來的走勢做出預(yù)測,這對投資者來說是十分必要的.目前,購買股票是一種經(jīng)常性的投資方式,股票市場的波動是國家經(jīng)濟(jì)的直接反映,無論是對投資者還是政府來說,股價預(yù)測都具有重要意義[1].
傳統(tǒng)的股票分析方法有基本分析、演化分析和技術(shù)分析等,這些方法只能對股票的走勢進(jìn)行分析和預(yù)測,無法預(yù)測股票的價格.自回歸移動平均(Autoregressive Moving Average,ARMA)模型經(jīng)過不斷的發(fā)展,其理論體系非常成熟,在統(tǒng)計分析和數(shù)據(jù)處理中表現(xiàn)出很好的便利性,且在股票預(yù)測過程中不僅考慮了市場指標(biāo)在時間序列上的相關(guān)性,還考慮了隨機(jī)擾動的干擾性,可以很好地對短期變動趨勢做出預(yù)測[2].目前,國內(nèi)學(xué)者在時間序列預(yù)測方面進(jìn)行了大量的研究,而ARMA模型作為一類較理想的預(yù)測模型,其有效性和適用性自然是研究的重點.有學(xué)者選取具有代表性的股指指數(shù)或者股票價格作為研究對象,分析其序列值并建立模型,再對未來的趨勢進(jìn)行預(yù)測,得到的預(yù)測結(jié)果與真實值誤差較小,進(jìn)一步證明了ARMA模型在股價預(yù)測方面的有效性和適用性[1-4].受這些研究的啟發(fā),筆者擬針對具有顯著非平穩(wěn)性的一類時間序列,通過差分方法對原始序列進(jìn)行平穩(wěn)化處理,采用最小信息準(zhǔn)則確定原始序列所滿足的模型,并利用模型對建設(shè)銀行短期的股票開盤價進(jìn)行預(yù)測,以期為投資者提供合理的投資策略.
時間序列是記錄系統(tǒng)歷史行為的一系列數(shù)據(jù),對這些歷史數(shù)據(jù)進(jìn)行觀察、研究,尋找系統(tǒng)的運(yùn)行規(guī)律和結(jié)構(gòu)特征,進(jìn)而對其未來某一個時刻的行為進(jìn)行預(yù)測,這種分析方法稱為時間序列分析[5-7].將具有如下結(jié)構(gòu)的模型稱為ARMA模型(簡記為ARMA(p,q)):
其中φk(1≤k≤p)和θk(1≤k≤q)為實參數(shù),εt為滿足條件的純隨機(jī)序列.ARMA模型是平穩(wěn)時間序列分析中的經(jīng)典模型,但在經(jīng)濟(jì)生活中遇到的時間序列基本上是非平穩(wěn)序列,因此需要采用一定的方法將其變?yōu)槠椒€(wěn)序列.一般采用差分的方法對目標(biāo)序列進(jìn)行平穩(wěn)化處理,然后對得到的平穩(wěn)序列建立ARIMA(p,d,q)模型,其中d為差分階數(shù).
從網(wǎng)易財經(jīng)選取建設(shè)銀行(股票代碼601939)2018年1月2日至2019年12月26日的每個股票交易日開盤價作為樣本數(shù)據(jù),將樣本記為{PRICE},共計484個樣本數(shù)據(jù).表1示出了部分樣本數(shù)據(jù).
表1 部分樣本數(shù)據(jù)
首先對序列{PRICE}進(jìn)行預(yù)處理,即平穩(wěn)性檢驗和純隨機(jī)性檢驗.若{PRICE}是非平穩(wěn)序列,則需要采取一定的方法使其平穩(wěn)化;若{PRICE}是純隨機(jī)序列,則表明它的序列值之間沒有任何聯(lián)系,換言之,該序列沒有任何研究價值.
(1)平穩(wěn)性檢驗.由于股市受到許多不確定性因素的影響,市場波動較大,因此股票價格序列一般為非平穩(wěn)時間序列.對原始序列的平穩(wěn)性檢驗,可以采用原始序列的時序圖和自相關(guān)圖相結(jié)合的方法來進(jìn)行識別.利用EViews軟件[8]繪出序列{PRICE}的時序圖,如圖1所示.從圖1可以看出,{PRICE}具有明顯的趨勢性,從而初步判斷{PRICE}是非平穩(wěn)序列.一個具有長期趨勢的非平穩(wěn)序列,它的一個顯著特征是隨著延遲期數(shù)的增加,自相關(guān)系數(shù)會緩慢衰減至0.從圖2所示的滯后24期的序列自相關(guān)圖可以看出,自相關(guān)系數(shù)一直在零軸的右邊,其值都位于2倍標(biāo)準(zhǔn)差外并呈現(xiàn)緩慢減小的趨勢.由此可知,選取的建設(shè)銀行股票價格序列是一個非平穩(wěn)時間序列.
圖1 序列{PRICE}的時序圖
圖2 {PRICE}序列自相關(guān)圖
(2)數(shù)據(jù)平穩(wěn)化處理.差分運(yùn)算是平穩(wěn)化處理常用的方法,對序列{PRICE}做一階差分運(yùn)算,得到新的序列為{D(PRICE)},且滿足D(PRICE)t=PRICEt-PRICEt-1.繪出序列{D(PRICE)}的時序圖,如圖3所示.
圖3 一階差分{D(PRICE)}時序圖
從圖3可以看出,序列{PRICE}通過一階差分運(yùn)算之后不再具有趨勢性.差分后序列值始終在0值上下振動,且振幅有界,從而初步判斷序列{D(PRICE)}是平穩(wěn)的.為了驗證初步判斷的正確性,對序列{D(PRICE)}進(jìn)行平穩(wěn)性ADF檢驗.若序列拒絕原假設(shè),則說明此序列平穩(wěn).ADF檢驗結(jié)果見表2,從表2可知,1%顯著水平下的臨界值為-3.443 691,ADF的t統(tǒng)計量的值為-19.711 47.顯然,1%的顯著水平下的臨界值要遠(yuǎn)大于ADF檢驗值,說明在99%的置信水平下拒絕原假設(shè),即該序列不存在單位根,所以序列{D(PRICE)}是平穩(wěn)的.
表2 一階差分序列ADF檢驗結(jié)果
(3)純隨機(jī)性檢驗.利用EViews軟件對序列{D(PRICE)}進(jìn)行純隨機(jī)性檢驗,結(jié)果見表3.從表3可知,滯后6,12,18期的P值都明顯小于0.05,說明殘差序列的Q值全都大于檢驗水平為0.05的χ2分布臨界值,所以{D(PRICE)}不是純隨機(jī)序列,具有相關(guān)性.
表3 白噪聲檢驗結(jié)果
序列{PRICE}通過差分運(yùn)算之后變?yōu)槠椒€(wěn)時間序列{D(PRICE)},現(xiàn)可以通過{D(PRICE)}的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)的衰減方式確定模型的類型.由一階差分后序列的自相關(guān)圖(圖4)和偏自相關(guān)圖(圖5)可以看出,序列{D(PRICE)}僅有不超過5%的樣本的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)落在2倍標(biāo)準(zhǔn)差之外,因此AFC和PAFC都可視為拖尾.根據(jù)ARMA模型的識別原則,可以嘗試使用ARMA模型進(jìn)行擬合.
圖4 {D(PRICE)}序列自相關(guān)圖
圖5 {D(PRICE)}序列偏自相關(guān)圖
確定對序列{D(PRICE)}采用ARMA模型擬合之后,還需要確定ARMA模型滯后項p和q的值.根據(jù)圖4建立所有p,q≤5的ARMA模型,利用AIC,SB,HQ準(zhǔn)則和t統(tǒng)計量顯著性來具體確定模型的階數(shù).由于數(shù)據(jù)較多,表4僅給出包含信息準(zhǔn)則最小的模型在內(nèi)的部分模型數(shù)據(jù),從中可知ARIMA(5,1,4)模型的AIC和HQ的值最小,所以選擇ARIMA(5,1,4)建立模型.
表4 部分ARIMA模型的AIC,SC,HQ檢驗值
表4(續(xù))
對ARIMA(5,1,4)模型進(jìn)行估計,確定AR(5)項(即D(PRICE)t-5)和常數(shù)項的系數(shù)不顯著,因此需要剔除AR(5)項和常數(shù)項.繼續(xù)利用最小AIC準(zhǔn)則和SBC準(zhǔn)則進(jìn)行擬合估計,識別出最優(yōu)模型為ARIMA(4,1,4).通過檢驗,ARIMA(4,1,4)模型的所有系數(shù)都十分顯著,于是采用該模型對序列{D(PRICE)}進(jìn)行擬合.
最小二乘估計法計算模型的參數(shù)值具有較高的精度,因此采用最小二乘法對ARIMA(4,1,4)模型的參數(shù)進(jìn)行估計,即估計方程組
中的參數(shù)φ1,φ2,φ3,φ4,θ1,θ2,θ3,θ4,得到ARIMA(4,1,4)模型的口徑為
其中εt為殘差序列.模型的特征根都在單位圓內(nèi),故平穩(wěn)可逆.
模型建立后,需要檢驗?zāi)P偷挠行?一個最優(yōu)的擬合模型應(yīng)將樣本中的全部相關(guān)信息提取完畢,因此對模型的殘差序列進(jìn)行純隨機(jī)性檢驗.若殘差序列不是純隨機(jī)序列,即殘差序列中還包含未被充分提取的信息,則需要對模型進(jìn)行優(yōu)化;若殘差序列純隨機(jī),即擬合殘差項中不含有可以被提取的有效信息,則模型顯著有效.利用EViews軟件對殘差進(jìn)行檢驗,ARIMA(4,1,4)模型的殘差序列無任何趨勢,為一平穩(wěn)序列.Q統(tǒng)計量檢驗的結(jié)果顯示,所有的P值都大于0.05,說明擬合模型的殘差序列是一個純隨機(jī)序列,因此該模型是顯著有效的.
股票市場受多方面因素的影響,其價格浮動較大.隨著時間的延長,這些不確定因素對模型預(yù)測效果產(chǎn)生的影響會進(jìn)行疊加,因此長期預(yù)測的誤差一般較大,而短期預(yù)測的效果較好.采用ARIMA(4,1,4)模型預(yù)測建設(shè)銀行2019-12-27,2019-12-30,2019-12-31這3個交易日的股票開盤價,結(jié)果見表5.
表5 建設(shè)銀行股票開盤價短期預(yù)測結(jié)果
從表5可知,開盤價的預(yù)測值與實際值之間的相對誤差均小于1.5%,說明ARIMA(4,1,4)模型對于短期預(yù)測具有較高的吻合度,股票日的開盤價預(yù)測95%的置信區(qū)間很好地包含了實際值.利用ARIMA(4,1,4)模型對484個交易日的開盤價進(jìn)行預(yù)測,結(jié)果如圖6所示,圖中虛線所夾部分為置信水平95%的置信區(qū)間,中間實線表示預(yù)測值.
圖6 建設(shè)銀行股票開盤價預(yù)測的95%置信區(qū)間結(jié)果
通過EViews軟件結(jié)合ARMA模型對建設(shè)銀行的股票開盤價序列進(jìn)行分析,得到符合股價的模型口徑.采用ARIMA(4,1,4)模型進(jìn)行預(yù)測,結(jié)果顯示,該模型對建設(shè)銀行股票開盤價的短期預(yù)測效果較好,且擬合模型充分提取了建設(shè)銀行股票開盤價序列中包含的有用信息.當(dāng)然,本研究存在一定的局限性,如在對原始序列和差分后序列的分析過程中帶有一定的主觀性和經(jīng)驗性,尤其是對序列的自相關(guān)函數(shù)及偏自相關(guān)函數(shù)的分析;另外,在序列分析的過程中,應(yīng)該考慮國家宏觀經(jīng)濟(jì)政策等其他因素對序列的影響,因此可以參考選用序列的條件異方差模型.