陳小玲
摘 要 了解并掌握股價(jià)運(yùn)行的規(guī)律是許多投資者和學(xué)者所關(guān)注的領(lǐng)域,采用了ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)對(duì)百度、阿里巴巴兩支股票的收盤價(jià)進(jìn)行建模與預(yù)測,并對(duì)比了兩模型的預(yù)測精度,結(jié)果表明兩種預(yù)測模型都達(dá)到比較理想的預(yù)測精度和短期預(yù)測可行的效果.
關(guān)鍵詞 股票價(jià)格;ARIMA模型;BP神經(jīng)網(wǎng)絡(luò);預(yù)測
中圖分類號(hào) F832 文獻(xiàn)標(biāo)識(shí)碼 A
Abstract Understanding and mastering the regular pattern of stock operation is an area concerned by many investors and scholars. This paper adopted the ARIMA model and BP neural network to modeling and prediction armed on closing price of the BIDU and BABA. Besides comparing them according to the prediction accuracy, the results show that the two forecasting models can achieve the ideal prediction precision and the effect of short-term forecasting is feasible.
Key words stock-price; ARIMA model; BP neural network; prediction
1 引 言
目前,股票投資成為許多人理財(cái)?shù)姆绞街唬灿性絹碓蕉嗟膶W(xué)者投入到股市的分析與股價(jià)的預(yù)測中.股票數(shù)據(jù)通常具有時(shí)間的先后性,可以認(rèn)為是一種時(shí)間序列數(shù)據(jù),具有顯著的非線性、時(shí)變性特征,人們對(duì)于股市的預(yù)測研究已經(jīng)進(jìn)行若干年,并提出許多的預(yù)測算法[1].
時(shí)間序列分析方法有很多,其中,目前應(yīng)用最廣泛的最常見的時(shí)間序列模型之一是ARIMA模型,這是由于它的簡單性、可行性和靈活性 [2,3].另外,神經(jīng)網(wǎng)絡(luò)模型分析也是現(xiàn)代金融時(shí)間序列分析的一個(gè)常見方法.目前,有關(guān)分別建立ARIMA模型和神經(jīng)網(wǎng)絡(luò)模型對(duì)時(shí)間序列進(jìn)行預(yù)測分析的文獻(xiàn)并不少.熊志斌(2011)先利用ARIMA模型預(yù)測線性主體,再結(jié)合神經(jīng)網(wǎng)絡(luò)預(yù)測主體的殘差部分,并以人民幣匯率序列為例,證實(shí)其模型預(yù)測的有效性[4].蔣燕(2006)采用ARIMA模型對(duì)廣西全社會(huì)固定資產(chǎn)投資額數(shù)據(jù)進(jìn)行預(yù)測分析,得到較準(zhǔn)確的預(yù)測結(jié)果[5].馬法堯(2014)通過以我國家電行業(yè)某企業(yè)年銷售額為實(shí)例構(gòu)建預(yù)測模型,表明BP神經(jīng)網(wǎng)絡(luò)比ARMA模型的預(yù)測精度更高 [6].樊重俊和樊鴻飛(2008)通過談?wù)摿松窠?jīng)網(wǎng)絡(luò)方法和傳統(tǒng)的統(tǒng)計(jì)預(yù)測方法的對(duì)比,說明了神經(jīng)網(wǎng)絡(luò)方法有助于提高精度[7].郝勇和劉繼洲(2006)運(yùn)用BP神經(jīng)網(wǎng)絡(luò),對(duì)公用事業(yè)指數(shù)波動(dòng)規(guī)律進(jìn)行預(yù)測和分析,達(dá)到預(yù)測精度較理想的效果[8].
本文先探討了ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)模型在時(shí)間序列分析中的預(yù)測原理與應(yīng)用,再以百度(BIDU)、阿里巴巴(BABA)的收盤價(jià)作為股價(jià)的時(shí)間序列為實(shí)證,分別建立了ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測,并比較兩種模型預(yù)測的精度,檢驗(yàn)?zāi)P偷挠行?
2 ARIMA與BP神經(jīng)網(wǎng)絡(luò)模型簡介
2.1 ARIMA模型原理
將自回歸模型的差分形式與移動(dòng)平均模型結(jié)合,所得結(jié)果是一個(gè)ARIMA模型.它先對(duì)非平穩(wěn)的時(shí)間序列進(jìn)行d階差分來構(gòu)造一個(gè)平穩(wěn)的新序列,再對(duì)新序列進(jìn)行自回歸和移動(dòng)平均擬合,確定模型的階數(shù)p和q,即對(duì)新序列建立ARMA(p,q)模型,通過模型診斷后進(jìn)行預(yù)測.ARIMA(p,d,q)模型的方程表示為:
2.2 BP神經(jīng)網(wǎng)絡(luò)模型原理
BP神經(jīng)網(wǎng)絡(luò),它是目前應(yīng)用于經(jīng)濟(jì)和金融領(lǐng)域預(yù)測的比較廣泛的神經(jīng)網(wǎng)絡(luò).它將原始信息輸入到由一個(gè)或幾個(gè)神經(jīng)元構(gòu)成的輸入層,而這些神經(jīng)元向前連接到下一層,直到到達(dá)輸出層.圖1網(wǎng)絡(luò)是一個(gè)2-3-1的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖.
假定現(xiàn)有時(shí)間序列Xt,若網(wǎng)絡(luò)輸入N個(gè)歷史數(shù)據(jù),輸出是下一時(shí)刻的預(yù)測值,則稱為叫單步預(yù)測法.若網(wǎng)絡(luò)輸入N個(gè)歷史數(shù)據(jù),輸出是下M個(gè)時(shí)刻的預(yù)測值,則稱為多步預(yù)測法[9].本文采用的是單步預(yù)測法.
為了構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型,首先,確定網(wǎng)絡(luò)模型的輸入和輸出數(shù)據(jù).接著便是確定網(wǎng)絡(luò)的結(jié)構(gòu),即把輸入層、輸出層和隱含層的神經(jīng)元個(gè)數(shù)給確定下來.輸入層的神經(jīng)元個(gè)數(shù)由輸入數(shù)據(jù)確定,輸出層神經(jīng)元個(gè)數(shù)由輸出數(shù)據(jù)個(gè)數(shù)確定,而隱含層中神經(jīng)元個(gè)數(shù)的選擇也是比較重要的[10],它對(duì)神經(jīng)網(wǎng)絡(luò)預(yù)測的精確度有較大的影響,常用的確定最佳隱含層神經(jīng)元個(gè)數(shù)的經(jīng)驗(yàn)公式為:
下一步,便是確定節(jié)點(diǎn)激活函數(shù).只要激活函數(shù)是非線性函數(shù),那么它對(duì)網(wǎng)絡(luò)的性能影響不大.神經(jīng)網(wǎng)絡(luò)性能的重要點(diǎn)在于隱含層的數(shù)量和隱含層節(jié)點(diǎn)數(shù).確定好后,訓(xùn)練BP網(wǎng)絡(luò),并運(yùn)用網(wǎng)絡(luò)進(jìn)行仿真,計(jì)算仿真誤差,來判斷網(wǎng)絡(luò)的預(yù)測精度,返回樣本的預(yù)測值.
3 基于百度和阿里巴巴的股價(jià)
預(yù)測模型的實(shí)證分析
3.1 樣本數(shù)據(jù)的選取
本文選取了2014年9月1日~2017年8月14日的百度股票(BIDU)和阿里巴巴(BABA)的收盤價(jià)來進(jìn)行時(shí)間序列分析.數(shù)據(jù)來自于雅虎財(cái)經(jīng)網(wǎng).本文實(shí)證部分圖形以百度為例.
3.2 模型的構(gòu)建
3.2.1 ARIMA模型的建立與預(yù)測
1)平穩(wěn)化處理與檢驗(yàn)
利用時(shí)間序列分析進(jìn)行建模,首要條件是要求序列必須滿足平衡的要求,即對(duì)數(shù)據(jù)平穩(wěn)化.觀察原始數(shù)據(jù)的時(shí)序圖,發(fā)現(xiàn)該時(shí)間序列具有一定的波動(dòng)性.再對(duì)該序列進(jìn)行單位根ADF檢驗(yàn),結(jié)果如表1所示.endprint
由表1可知,ADF檢驗(yàn)的P值0.6大于0.05,說明原序列存在單位根,更進(jìn)一步證明了該序列并不是平穩(wěn)序列.于是進(jìn)行差分處理,同樣地,先觀察一階差分后的新序列的時(shí)序圖,發(fā)現(xiàn)其呈現(xiàn)平穩(wěn)狀態(tài),再對(duì)新序列進(jìn)行單位根檢驗(yàn),結(jié)果如表1,ADF檢驗(yàn)的P值遠(yuǎn)小于0.01,即新序列不存在單位根,從而說明一階差分后的新序列是平穩(wěn)序列,因此d=1,可以建立ARIMA(p,1,q)模型.
2)ARIMA模型擬合與參數(shù)估計(jì)
對(duì)模型進(jìn)行擬合與估計(jì),利用偏相關(guān)系數(shù)和自相關(guān)系數(shù)進(jìn)行判斷和選擇,然后采用AIC準(zhǔn)則,即AIC值越小其精度越高,擬合得較好,擇優(yōu)選擇模型.圖2為一階差分序列自相關(guān)圖(ACF)和偏自相關(guān)函數(shù)圖(PACF),從中可發(fā)現(xiàn)自相關(guān)系數(shù)和偏相關(guān)系數(shù)都基本落在置信區(qū)間內(nèi),且自相關(guān)圖和偏相關(guān)圖都在K=3處落在2倍標(biāo)準(zhǔn)差的置信帶邊緣,則p,q可能取值都可為1或2.為進(jìn)一步確定模型,比較各模型的AIC檢驗(yàn)統(tǒng)計(jì)量和對(duì)數(shù)似然值,結(jié)果如表2所示,顯然ARIMA(2,1,2)模型優(yōu)于其他3個(gè)模型,于是對(duì)該序列選擇ARIMA(2,1,2)模型較為合適.
3)模型診斷檢驗(yàn)及預(yù)測
對(duì)模型ARIMA(2,1,2)的殘差序列進(jìn)行診斷,從殘差圖、自相關(guān)圖和Ljung-Box上可以看出,該殘差序列為純隨機(jī)的白噪聲序列,從而建模有效,模型建立是合理的.因而,利用ARIMA(2,1,2)模型進(jìn)行預(yù)測,其結(jié)果如表3所示.
3.2.2 BP神經(jīng)網(wǎng)絡(luò)模型的建立與預(yù)測
1)數(shù)據(jù)處理
本文選用2014年9月1日~2017年8月14日的百度股票數(shù)據(jù)的收盤價(jià)序列做神經(jīng)網(wǎng)絡(luò)的實(shí)證分析,其中共有740個(gè)數(shù)據(jù),如同前文ARIMA模型后10個(gè)數(shù)據(jù)作為預(yù)測樣本,訓(xùn)練樣本數(shù)為734.
2)構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型
本文采用BP三層網(wǎng)絡(luò),首先輸入樣本為前4天的收盤價(jià),即輸入層神經(jīng)元有4個(gè),當(dāng)天的收盤價(jià)作為網(wǎng)絡(luò)輸出,即輸出層神經(jīng)元為1.其次是確定隱含層神經(jīng)元的個(gè)數(shù),根據(jù)公式(2),隱含層神經(jīng)元個(gè)數(shù)在3~13之間.本文根據(jù)循環(huán)語句實(shí)驗(yàn),并根據(jù)模型的預(yù)測均方誤差最小原則,確定隱層的神經(jīng)元個(gè)數(shù)為3,所以本文的網(wǎng)絡(luò)結(jié)構(gòu)為4-3-1.
3)神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練與預(yù)測
對(duì)網(wǎng)絡(luò)進(jìn)行仿真,并將預(yù)測值與預(yù)測相對(duì)誤差輸出,如表3所示.
用以上同樣的ARIMA模型與BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測阿里巴巴的收盤價(jià),可以得到結(jié)果如表4所示.
從表3可以得到,ARIMA模型對(duì)百度股票的開盤價(jià)做短期預(yù)測是有效的,從相對(duì)誤差上來看,其預(yù)測效果比較好,比較小的相對(duì)誤差為0.002 22,比較大的相對(duì)誤差也只有0.023 01.從相對(duì)誤差看,BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測效果也比較理想,比較小的相對(duì)誤差為0.001 84,比較大的相對(duì)誤差也只有0.027 39.從表4可知,ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)模型同樣適用于對(duì)阿里巴巴的股價(jià)預(yù)測.即可以得到結(jié)論,ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)模型一定程度上可以預(yù)測未來的股票價(jià)格,且預(yù)測值與真實(shí)值的相對(duì)誤差比較小,說明股票價(jià)格具有一定的規(guī)律性,運(yùn)用ARIMA和BP神經(jīng)網(wǎng)絡(luò)模型對(duì)股票價(jià)格進(jìn)行短期預(yù)測是可行有效的.
3.3 模型的優(yōu)劣評(píng)價(jià)
為了更加全面地描述不同模型對(duì)股票開盤價(jià)的預(yù)測結(jié)果,本文采用均方誤差(MSE)和平均絕對(duì)誤差(MAE)2個(gè)指標(biāo)來衡量模型預(yù)測效果的好壞[11].這2指標(biāo)反映預(yù)測值與實(shí)際值之間的誤差大小,其定義分別為:
式中,yi∧表示預(yù)測值,yi表示實(shí)際值,N表示預(yù)測樣本數(shù).對(duì)于不同的模型,若預(yù)測的MSE和MAE越小,則說明預(yù)測精度越高.根據(jù)各模型對(duì)股票價(jià)格開盤價(jià)測試集的預(yù)測,計(jì)算了各模型的均方誤差、平均絕對(duì)誤差和預(yù)測值,下面給出各預(yù)測模型的預(yù)測精度對(duì)比表(見表5).
從表5的對(duì)比結(jié)果可知,BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測精度并不見得比ARIMA模型的預(yù)測精度要高,許多學(xué)者研究股票預(yù)測的方法,并得出結(jié)論,BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測精度比ARIMA模型的預(yù)測精度要高,顯然,這并不是一定成立.對(duì)于百度股票,ARIMA模型的MSE和MAE相對(duì)神經(jīng)網(wǎng)絡(luò)模型的高一點(diǎn),但對(duì)于阿里巴巴股票卻是相反的結(jié)論.這兩種模型的預(yù)測能力誰更強(qiáng)并沒有唯一的結(jié)論,只是適用于部分股票,這也說明股票價(jià)格的波動(dòng)具有一定的隨機(jī)性.
4 結(jié) 論
關(guān)于股價(jià)預(yù)測的問題,許多學(xué)者仍在這方面不斷研究,用時(shí)間序列的預(yù)測理論對(duì)股票價(jià)格預(yù)測是可行有效的.正如本文運(yùn)用ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)模型對(duì)股票收盤價(jià)進(jìn)行預(yù)測,實(shí)證結(jié)果表明,這兩種模型都能夠比較準(zhǔn)確的預(yù)測未來的股票價(jià)格,且說明對(duì)股票價(jià)格進(jìn)行短期預(yù)測是可行有效的.但本文也存在不足之處,一是僅用了靜態(tài)預(yù)測的方法,而且還是單步預(yù)測,實(shí)際上時(shí)間序列方法和神經(jīng)網(wǎng)絡(luò)都可以實(shí)現(xiàn)多步預(yù)測,且股票價(jià)格是個(gè)動(dòng)態(tài)連續(xù)的.二是本文僅從相對(duì)誤差上評(píng)價(jià)預(yù)測模型的擬合效果,若能結(jié)合未來股價(jià)的變動(dòng)趨勢來預(yù)測評(píng)價(jià)將更優(yōu).當(dāng)然,股價(jià)預(yù)測自身并不能形成一個(gè)完整的投資決策,至少還需要對(duì)風(fēng)險(xiǎn)的評(píng)估和相應(yīng)的風(fēng)控方法.
總之,本文利用股票歷史收盤價(jià)作為時(shí)間序列數(shù)據(jù),構(gòu)建了ARIMA模型和BP神經(jīng)網(wǎng)絡(luò)模型,對(duì)未來股票開盤價(jià)進(jìn)行了短期預(yù)測,其預(yù)測效果比較理想,兩種模型對(duì)股票價(jià)格數(shù)據(jù)作短期預(yù)測是可行有效的.
參考文獻(xiàn)
[1] 李美,干曉蓉,劉新樂.ARIMA模型在股價(jià)預(yù)測上的應(yīng)用及其傅里葉修正[J].云南師范大學(xué)學(xué)報(bào),2011,31(5):50-55.
[2] 范劍青,姚琦偉著,陳敏譯.非線性時(shí)間序列—建模、預(yù)報(bào)及應(yīng)用[M],北京:高等教育出版社,2005.
[3] 熊志斌.基于ARIMA與神經(jīng)網(wǎng)絡(luò)集成的GDP時(shí)間序列預(yù)測研究[J].數(shù)理統(tǒng)計(jì)與管理,2011,30(2):306-314.
[4] 熊志斌.ARIMA融合神經(jīng)網(wǎng)絡(luò)的人民幣匯率預(yù)測模型研究[J],數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究,2011,28(6):64-76.
[5] 蔣燕.ARIMA模型在廣西全社會(huì)固定資產(chǎn)投資預(yù)測中的應(yīng)用[J],數(shù)理統(tǒng)計(jì)與管理,2006,25(5):588-592.
[6] 馬法堯.基于BP神經(jīng)網(wǎng)絡(luò)模型與ARMA模型的庫存預(yù)測比較[J/OL].統(tǒng)計(jì)與決策,2014(19):34-37.
[7] 樊重俊,樊鴻飛. 非線性經(jīng)濟(jì)預(yù)測中的神經(jīng)網(wǎng)絡(luò)模型與應(yīng)用[J]. 統(tǒng)計(jì)與決策,2008(16):158-160.
[8] 郝勇,劉繼洲. 基于神經(jīng)網(wǎng)絡(luò)的股票分類指數(shù)預(yù)測模型[J]. 統(tǒng)計(jì)與決策,2006(8):14-17.
[9] 吳玉霞,溫欣.基于ARIMA模型的短期股票價(jià)格預(yù)測[J/OL]. 統(tǒng)計(jì)與決策,2016(23):83-86.
[10]周寧.基于神經(jīng)網(wǎng)絡(luò)和馬爾可夫組合模型的股票價(jià)格預(yù)測[C]//中國自動(dòng)化學(xué)會(huì)控制理論專業(yè)委員會(huì).第36屆中國控制會(huì)議論文集.大連:中國自動(dòng)化學(xué)會(huì)控制理論專業(yè)委員會(huì),2017:26-28.
[11]王斌會(huì).計(jì)量經(jīng)濟(jì)學(xué)模型及R語言應(yīng)用[M],廣州:暨南大學(xué)出版社,2015.endprint