沈小欣 趙亞玲 朱海江
(浙江師范大學 數(shù)理信息學院,浙江 金華321004)
集成模型ARIMAX-GARCH及其在股票預測中的應用
沈小欣 趙亞玲 朱海江
(浙江師范大學 數(shù)理信息學院,浙江 金華321004)
在分析ARIMAX模型與GARCH模型的預測特性和優(yōu)劣的基礎上,建立了基于兩者集成的ARIMAX-GARCH模型,其基本思想是充分發(fā)揮兩種模型在回歸與序列波動性因素提取方面的優(yōu)勢.對從5大行業(yè)中隨機抽取的10只只股票的實證分析表明,該集成模型在股票預測中的準確率與穩(wěn)定性顯著優(yōu)于兩個單一模型.
時間序列;ARIMAX模型;GARCH模型;ARIMAX-GARCH模型;股票預測
近幾十年來,很多學者開始利用時間序列模型研究數(shù)據(jù)的變化規(guī)律.1976年George E.P.Box和Gwilym M.Jenkins在研究CO2的輸出濃度時開始運用多元時間序列分析方法[1],這就是早期的ARIMAX模型.1987年Engle和Granger又提出協(xié)整的概念[2],進一步完善了ARIMAX模型.ARIMAX模型并沒有廣泛運用于金融時間序列,其原因是很多金融時間序列的殘差序列具有異方差性,而ARIMAX模型并不能很好地刻畫金融時間序列的波動性.1982年Engle提出了條件異方差模型[3],Bollerslevb于1986對文獻[3]的模型作了修正[4],提出廣義自回歸條件異方差模型,即GARCH模型.我國學者唐齊鳴與陳健利用ARCH模型對中國股市的波動性進行了檢驗,發(fā)現(xiàn)其具有較明顯的ARCH效應[5].
股票預測一直是經(jīng)濟統(tǒng)計的一個熱點.常用的股票預測模型中均使用股票收盤價這一單一變量,然而華爾街有句名言,“價走量先行”,說明股票價格與成交量之間有一種必然的聯(lián)系,故比較好的股票預測模型應該包含收盤價和成交量這兩個指標,因而是一個多元時間序列模型,且其具有金融時間序列的異方差性,故前面介紹的幾種模型都不能很好地適用于股票預測.通過分析,本文將建立由ARIMAX模型和GARCH模型集成的ARIMAX-GARCH模型,該集成模型的主要思想是加入交易率序列為輸入變量序列,建立多元時間序列模型(ARIMAX)來擬合回歸部分,再利用GARCH模型提取殘差序列中的異方差因素,最后利用集成模型進行股票預測.
集成模型的具體表達式如下:
我們隨機抽取中國5大行業(yè)中的10只股票作為研究對象,由于歷史數(shù)據(jù)獲取有限,故10只股票的截取時間并不能達成一致.其中洋河股份截取時間自2010-07-13至2013-11-07,湯臣倍健截取時間自2011-05-25至2013-11-07,其余8只股票數(shù)據(jù)的截取時間均為自2006-02-06至2013-12-06,數(shù)據(jù)來源于雅虎財經(jīng)網(wǎng)站.
本文以洋河股份(002304)為例,首先詳細介紹了采用3種模型建模的過程及Eviews[6]實現(xiàn);其次分別預測現(xiàn)有樣本數(shù)據(jù)中最后7天的收盤價;最后采用均方根誤差和平均絕對百分比誤差這兩個指標對3種模型的預測結果進行比較.其余9只股票的具體建模過程省略,10只股票的預測結果將在后文呈現(xiàn).
2.1數(shù)據(jù)整理
為方便論述,記上述時期日收盤價序列為C,日交易量序列為V,時間序列中的時間點編號為1到797.首先來看洋河股份(002304)收盤價和交易量的時序圖,見圖1.
很明顯,收盤價C和日交易量V都為不平穩(wěn)的時間序列,我們定義序列C的收益率為:
RCi+1=100(lnCi+1-lnCi),
相應地,定義交易率為
RVi+1=100(lnVi+1-lnVi).
2.2平穩(wěn)性檢驗
對序列RC和序列RV做單位根檢驗(ADF檢驗),結果表明在3種顯著性水平下都拒絕原假設,故可認為序列RC和序列RV都平穩(wěn).
2.3 3種模型參數(shù)估計以及預測效果比較
2.3.1 ARIMAX模型
由交易率與收益率的相關性圖及響應序列(收益率序列)的自相關性與偏相關性圖可初步選出4個較優(yōu)化的模型,為了進一步選出最優(yōu)模型,借助Eviews軟件,對這4個模型進行分析,見表1.
表1 4個模型的R2和定階值(AIC)的比較
根據(jù)最小信息準則(AIC),最終確定的模型為ARIMAX((5,6,7),0,(7)).
2.3.2 GARCH模型
在給GARCH模型定階時,可供選擇的有如下兩個模型:
為了選出最優(yōu)模型,根據(jù)最小信息準則(AIC),對這兩個模型進行分析,計算它們的定階值(AIC).計算結果如下:模型一的定階值為4.467 908,模型二的定階值為4.468 258.因此最終確定模型一為最優(yōu)模型.
2.3.3 ARIMAX-GARCH模型
ARIMAX-GARCH集成模型參數(shù)擬合后如下式:
對此時的殘差做ARCH-LM檢驗[6],結果顯示殘差不再具有ARCH效應.
2.3.4 3種模型預測效果的比較
為了更加全面地描述3個模型對股票的預測效果,本文采用均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)兩個指標來衡量模型預測效果的好壞(第一個指標是絕對指標,第二個指標是相對指標)[7].兩個指標分別定義為:
表2 各模型預測效果比較
如表2所示,以上10只股票中有6只顯示ARIMAX-GARCH模型的預測誤差明顯小于其它兩個模型,而表明其他兩個模型預測效果較優(yōu)的分別有兩只股票.仔細觀察發(fā)現(xiàn),在ARIMAX模型預測效果最好的兩只股票中,GARCH模型的預測效果最差,且差距很大,而在GARCH模型預測效果最好的兩只股票中,ARIMAX模型的預測效果最差,這充分說明兩個單一模型的預測效果不穩(wěn)定.以上實證分析表明ARIMAX-GARCH模型在股票預測中比兩個單一模型更穩(wěn)定,且效果更佳.
股票作為金融市場最主要的金融產(chǎn)品,其價格能否被預測,以及用何種方法進行預測,一直以來都是金融領域研究的焦點問題.ARIMAX模型與GARCH模型是預測模型中的典型代表,兩者在預測上均具有自己獨特的優(yōu)勢.分析ARIMAX模型與GARCH模型的特性可知,兩者具有極強的互補性,于是我們想到構造ARIMAX模型與GARCH模型的集成模型(ARIMAX-GARCH)來取長補短.在實證分析中,我們對10只股票收盤價在3個模型中預測效果的比較表明,ARIMAX-GARCH模型在股票預測中比兩個單一模型更穩(wěn)定,且效果更佳.
我們知道很多因素都會影響股票的收盤價,故輸入變量序列中除交易量外還可以有很多其他變量,如何篩選變量,多變量間如何確定相互關系都有待于進一步研究.
[1]George EP Box,Gwilym M Jenkins.Time Series Analysis:Forecasting and Control[M].California:Holden-Day,1976.
[2]Robert F Engle,CWJ Granger.Co-Integration and Error Correction:Representation,Estimation and Testing[J].Econometrica,1987,55(2):251-276.
[3]Robert F Engle,Autoregressive Conditional Heteroscedasticity with Estimates of the Variance of United Kingdom Inflation[J].Econometrica,1982,50(4):987-1007.
[4]Tim Bollerslev.Generalized Autoregressive Conditional Heteroskedasticity[J].Journal of Econometrics,1986,31(3):307-327.
[5]唐齊鳴,陳健.中國股市的ARCH效應分析[J].世界經(jīng)濟,2001(3):29-36.
[6]高鐵梅.計量經(jīng)濟分析方法與建?!狤views應用及實例[M].北京:清華大學出版社,2006.
[7]熊志斌.基于ARIMAX與神經(jīng)網(wǎng)絡集成的GDP時間序列預測研究[J].數(shù)理統(tǒng)計與管理,2011,30(02):306-314.
Integrated Model ARIMAX GARCH and Its Applications in Stock Forecast
Shen Xiaoxin Zhao Yaling Zhu Haijiang
(Department of Statistics, Zhejiang Normal University, Jinhua, Zhejiang 321004)
Based on the analysis of the performance of multiple stationary time series of ARIMAX and GARCH models, this paper sets up a new model which integrates ARIMAX with GARCH. The new model has the advantage of regression in ARIMAX and the superiority of extracting volatility in GARCH. The result of empirical analysis about ten shares from five industries which are grabbed at random shows that the proposed model has better accuracy and stability in stock forecast than every single model.
time series; ARIMAX; GARCH; ARIMAX-GARCH; stock forecast
2014-08-22
沈小欣(1989-),女,江蘇泰州人.研究方向:數(shù)理統(tǒng)計.
F224.9;O213.9
A
1008-293X(2014)09-0060-04
(責任編輯鄧穎)