俞國紅,楊德志,叢佩麗
1.健雄職業(yè)技術(shù)學(xué)院 軟件與服務(wù)外包學(xué)院,江蘇 太倉 215411
2.遼東學(xué)院 經(jīng)濟(jì)學(xué)院,遼寧 丹東 118001
3.遼寧機(jī)電職業(yè)技術(shù)學(xué)院 信息工程系,遼寧 丹東 118009
ARIMA和RBF神經(jīng)網(wǎng)絡(luò)相融合的股票價(jià)格預(yù)測研究
俞國紅1,楊德志2,叢佩麗3
1.健雄職業(yè)技術(shù)學(xué)院 軟件與服務(wù)外包學(xué)院,江蘇 太倉 215411
2.遼東學(xué)院 經(jīng)濟(jì)學(xué)院,遼寧 丹東 118001
3.遼寧機(jī)電職業(yè)技術(shù)學(xué)院 信息工程系,遼寧 丹東 118009
股票投資成為一種重要理財(cái)方式,然而股票價(jià)格受各種經(jīng)濟(jì)的、政治的、社會(huì)的因素相互作用、相互影響,其變化有著很強(qiáng)的無序性,其數(shù)學(xué)模型往往復(fù)雜難以準(zhǔn)確確定或者包含混沌性,從而增加了預(yù)測的難度[1]。
股票數(shù)據(jù)一般是按時(shí)間的先后順序收集的,可以認(rèn)為是一種時(shí)間序列數(shù)據(jù),具有顯著的非線性、時(shí)變性特征,人們對于股市的預(yù)測研究已經(jīng)進(jìn)行若干年,并提出許多的預(yù)測算法[2]。常用股票預(yù)測方法有線性回歸、時(shí)間序列分析、灰色預(yù)測算法、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等[3-5],其中時(shí)間序列分析中的差分自回歸移動(dòng)平均(Autoregressive Integrating Moving Average,ARIMA)相當(dāng)靈活,融合了時(shí)間序列和回歸分析優(yōu)點(diǎn),在股票應(yīng)用中最為廣泛。ARIMA假定股票價(jià)格是一種確定、線性變化系統(tǒng),然而實(shí)際上股票價(jià)格是一種非線性、時(shí)變的時(shí)間序列數(shù)據(jù),因此ARIMA預(yù)測結(jié)果不理想[6]。單一預(yù)測模型只能反映股票價(jià)格片斷信息,難以全面挖掘股票價(jià)格數(shù)據(jù)中隱藏的變化規(guī)律,預(yù)測結(jié)果與股民、投資人的要求有一定的差距,組合模型較大限度地綜合利用各種模型所提供的信息,盡可能提高預(yù)測精度,尤其在經(jīng)濟(jì)、管理和統(tǒng)計(jì)研究領(lǐng)域,各種組合預(yù)測方法已成為改進(jìn)和提高預(yù)報(bào)精度的重要途徑[7]。
為進(jìn)一步提高股票價(jià)格預(yù)測精度,為股民、投資人提供有價(jià)值參考信息,提出一種股票價(jià)格組合預(yù)測模型(ARIMA-RBF),并通過對股票收盤價(jià)進(jìn)行預(yù)測,檢驗(yàn)?zāi)P推溆行浴?/p>
1.1 ARIMA-RBF構(gòu)造思想
股市是一個(gè)包含許多不確定因素的復(fù)雜系統(tǒng),它受各種經(jīng)濟(jì)的、政治的、社會(huì)的因素相互作用、相互影響,其變化有著很強(qiáng)的無序性,很難確切地說它是一個(gè)單純線性或者非線性系統(tǒng)[8]。股市系統(tǒng)包含一些線性因素的特征,也包含著一些非線性因素的特征,由此需要建立一個(gè)包含有線性和非線性特征的模型,傳統(tǒng)的回歸模型具有提取線性特征,而神經(jīng)網(wǎng)絡(luò)模型對非線性有很強(qiáng)映射特性,因此本研究將線性時(shí)間序列預(yù)測算法ARIMA和非線性預(yù)測算法RBF神經(jīng)網(wǎng)絡(luò)結(jié)合在一起用于股票價(jià)格預(yù)測。ARIMA-RBF具體結(jié)構(gòu)如圖1所示。
圖1 股票價(jià)格組合預(yù)測模型結(jié)構(gòu)圖
1.2 股票價(jià)格的預(yù)處理
股票價(jià)格歷史數(shù)據(jù)是一種非平穩(wěn)數(shù)據(jù),漲跌幅度比較大,數(shù)據(jù)差異過大對模型訓(xùn)練速度產(chǎn)生不利影響[9]。為消除這種不利影響,對股票價(jià)格原始數(shù)據(jù)進(jìn)行預(yù)處理,使其范圍縮放到[0 1],具體預(yù)處理公式如下:
式中,x表示股票價(jià)格原始序列,x′表示預(yù)處理后的股票價(jià)格序列,xmax和xmin分別表示股票價(jià)格最大值和最小值。最后將預(yù)測的結(jié)果進(jìn)行反歸一化,其歸一化公式為:
1.3 ARIMA模型
設(shè)股票價(jià)格歷史數(shù)據(jù)為:{xt,t=1,2,…,n},ARIMA建模過程為:
(1)由于股票價(jià)格是一種非平穩(wěn)時(shí)間序列,首先對它進(jìn)行差分處理,即
式中,d表示差分階數(shù),?=1-B為差分算子,B為后移算子。
經(jīng)過多次差分后,股票價(jià)格數(shù)據(jù)變成是一種平穩(wěn)時(shí)間序列,可以得到:
那么股票價(jià)格的ARIMA(p,q,d)模型為:
式中,{αt}為白噪聲序列。
(2)模型識別。p、q選擇ARIMA建模關(guān)鍵,本研究首先采用自相關(guān)和偏自相關(guān)圖來決定p、q可能取值,然后采用最小信息準(zhǔn)則(AIC)和相合性準(zhǔn)則(SBC)確定出最佳的模型階數(shù)。
(3)參數(shù)估計(jì)和模型診斷。模型中所有參數(shù)采用極大似然估計(jì)得到,然后對參數(shù)在模型中進(jìn)行檢驗(yàn),對其合理性進(jìn)行判定,如果不適合就重新估計(jì)參數(shù)。
(4)采用最合參數(shù)建立股票價(jià)格預(yù)測模型。
1.4 RBF神經(jīng)網(wǎng)絡(luò)模型
1.4.1 RBF神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)樣本重構(gòu)
對于一維股票價(jià)格時(shí)間序列,首先需要對數(shù)據(jù)進(jìn)行拓階重構(gòu)將其轉(zhuǎn)換成為多維時(shí)間序列,然后采用RBF神經(jīng)網(wǎng)絡(luò)對其建模和預(yù)測[10]。設(shè)最優(yōu)階數(shù)為m,得到的時(shí)間序列輸入為:
1.4.2 RBF神經(jīng)網(wǎng)絡(luò)算法
徑向基函數(shù)(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)克服了BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速度慢,調(diào)節(jié)參數(shù)多等缺點(diǎn),是一種較理想的非線性計(jì)算工具,其結(jié)構(gòu)如圖2所示。
圖2 RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
網(wǎng)絡(luò)輸出為一維向量f(X′),對應(yīng)著神經(jīng)網(wǎng)絡(luò)的最終預(yù)測值,其輸出為:
式中,Ri(X′)表示隱層中的徑向基函數(shù);i表示隱層的節(jié)點(diǎn)數(shù)目,i=1,2,…,l;s表示輸出神經(jīng)元的個(gè)數(shù),i=1,2,…,h;Wis表示第i個(gè)隱層單元到輸出單元的權(quán)值。
隱層作用函數(shù)采用徑向基函數(shù),本研究采用高斯核函數(shù)(Gaussian kernel function),實(shí)現(xiàn)對輸入層信息的非線性變換,公式如下:
式中,ci表示第i個(gè)隱層單元對應(yīng)的徑向基函數(shù)的中心;σi表示第i個(gè)隱層單元對應(yīng)的被感知器中心點(diǎn)寬度;‖X′-ci‖表示X′與ci的歐幾里德距離。
確定RBF中心和寬度的過程是無導(dǎo)師學(xué)習(xí)過程,設(shè)有n組樣本數(shù)據(jù),選取第j組輸入向量,計(jì)算歐幾里德范數(shù):σi(j)=‖X′(j)-ci(j-1)‖2,找出與輸入樣本距離最小的中心cmin,調(diào)整中心為:
式中,α表示學(xué)習(xí)速率,每學(xué)習(xí)一次,調(diào)小一次α,其他各中心向量維持不變,然后計(jì)算調(diào)整后的歐幾里德范數(shù):
重復(fù)RBF中心和寬度的確定過程,使得訓(xùn)練樣本距離該中心的距離最小,此時(shí)的c(j)即為RBF的中心向量。
1.5 股票價(jià)格的組合預(yù)測步驟
對復(fù)雜、非線性股票時(shí)間序列Y,其可以表示為:
式中,Lt為表示規(guī)律、趨勢部分,即線性部分,Nt為隨機(jī)、非線性部分,基于ARIMA-RBF的股票預(yù)測步驟為:
(1)用ARIMA模型對Yt進(jìn)行建模預(yù)測。設(shè)預(yù)測結(jié)果為為t點(diǎn)時(shí)預(yù)測值,et為原序列與ARIMA模型預(yù)測結(jié)果的殘差,即
序列{et}隱含了原序列中的非線性關(guān)系,即
式中,Δt為一隨機(jī)誤差。
(2)對股票原始序列進(jìn)行模型定階,根據(jù)確定的階數(shù)重構(gòu)RBF神經(jīng)網(wǎng)絡(luò)的樣本集,樣本集中,期望輸出為et,輸入為重構(gòu)的股票序列,利用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測,得到預(yù)測結(jié)果。
2.1 數(shù)據(jù)來源
仿真數(shù)據(jù)來源于包鋼股份(600010)股票2007年1月4日到2007年12月28日的收盤價(jià),共收集到211個(gè)數(shù)據(jù)樣本,其中前161個(gè)數(shù)據(jù)作為訓(xùn)練集,對股票收盤價(jià)進(jìn)行建模。為避免單個(gè)樣本預(yù)測的偶然性,采用最后50個(gè)樣本作為測試集,來檢驗(yàn)?zāi)P偷姆夯芰Α?00010的收盤價(jià)格如圖3所示。
圖3 600010的收盤價(jià)
2.2 股票價(jià)格的線性變化規(guī)律預(yù)測
2.2.1 數(shù)據(jù)平穩(wěn)化處理
對股票價(jià)格的原始數(shù)據(jù)首先進(jìn)行歸一化處理,然后將211個(gè)數(shù)據(jù)樣本輸入到DPS 6.5軟件中,采用ARIMA模塊的數(shù)據(jù)分析功能,得到股票價(jià)格偏相關(guān)和自相關(guān)圖,如圖4所示。
圖4 原始偏相關(guān)和自相關(guān)圖
從圖4可知,該股票價(jià)格序列自我相關(guān)性極高,自相關(guān)性呈下降趨勢,有拖尾現(xiàn)象,對其進(jìn)行差分處理,使其變成平穩(wěn)時(shí)間序列,在進(jìn)行一階差分后,股票價(jià)格序列基本平先,最佳差分階數(shù)d=1。其1階偏相關(guān)和自相關(guān)圖如圖5所示。
圖5 1階偏相關(guān)和自相關(guān)圖
2.2.2 ARIMA參數(shù)辯識
采用從低階到高階采用逐步試探法來識別模型的參數(shù),得到600010收盤價(jià)格最優(yōu)預(yù)測模模型為ARIMA(2,2,1),采用ARIMA(2,2,1)對測試集進(jìn)行預(yù)測,采用一步預(yù)測。一步預(yù)測法具體為:在預(yù)測第i時(shí)刻的股票價(jià)格時(shí),前i-1個(gè)數(shù)據(jù)作為學(xué)習(xí)樣本參與建模訓(xùn)練,其后續(xù)數(shù)據(jù)不得參與建模訓(xùn)練;在預(yù)測第i+1個(gè)樣本時(shí),將第i個(gè)樣本加入到訓(xùn)練樣本中。ARIMA模型的預(yù)測結(jié)果如圖6所示。從圖6可知,ARIMA模型對股票價(jià)格的預(yù)測精度不高,但是能夠很好地把握股票價(jià)格變化趨勢,即獲得了股票價(jià)格線性部分信息。
圖6 ARIMA模型的預(yù)測結(jié)果
2.3 股票價(jià)格的非線性變化規(guī)律預(yù)測
根據(jù)ARIMA(2,2,1)預(yù)測結(jié)果和股票價(jià)格實(shí)際值得到股票價(jià)格的殘差序列,其作為用RBF神經(jīng)網(wǎng)絡(luò)的期望輸出,然后對原始數(shù)據(jù)相空間重構(gòu),延遲時(shí)間為1,最后確定最優(yōu)價(jià)數(shù)為7,然后采用最優(yōu)階數(shù)重構(gòu)后數(shù)據(jù)作為RBF輸入,然后將訓(xùn)練本輸入到RBF神經(jīng)網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí)建模,并對殘差序列測試集進(jìn)行預(yù)測,得到ARIMA(2,2,1)殘差序列預(yù)測值。同時(shí)采用單一的RBF神經(jīng)網(wǎng)絡(luò)對股票價(jià)格進(jìn)行預(yù)測,得到的預(yù)測結(jié)果如圖7所示。從圖7可知,單一RBF神經(jīng)網(wǎng)絡(luò)模型對股票價(jià)格的預(yù)測精度不高,難以全面、準(zhǔn)確描述股票價(jià)格變化規(guī)律。
圖7 RBF神經(jīng)網(wǎng)絡(luò)模型的預(yù)測結(jié)果
2.4 獲得股票價(jià)格的最終預(yù)測結(jié)果
將ARIMA(2,1,1)和RBF神經(jīng)網(wǎng)絡(luò)模型預(yù)測結(jié)果進(jìn)行相加,得到股票價(jià)格的最終預(yù)測結(jié)果。預(yù)測結(jié)果如圖8所示。
2.5 模型預(yù)測性能對比分析
圖8 ARIMA-RBF模型的預(yù)測結(jié)果
為了驗(yàn)證基于ARIMA-RBF的股票價(jià)格預(yù)測模型的優(yōu)越性,采用均方根誤差(Root Mean Squared Error,RMSE)和平均絕對相對誤差(Mean Absolute Percent Error,MAPE)作為模型性能評價(jià)指標(biāo)。單一ARIMA模型、RBF神經(jīng)網(wǎng)絡(luò)模型以及ARIMA-RBF模型對股票價(jià)格測試集的預(yù)測結(jié)果RMSE和MAPE如表1所示。
表1 不同模型對600010的預(yù)測性能對比
從表1的對比結(jié)果可知,ARIMA-RBF的股票價(jià)格預(yù)測精度要遠(yuǎn)遠(yuǎn)高于單一的ARIMA和RBF神經(jīng)網(wǎng)絡(luò)模型預(yù)測精度,預(yù)測誤差大大降低,對比結(jié)果表明ARIMA-RBF綜合利用了ARIMA和RBF神經(jīng)網(wǎng)絡(luò)優(yōu)勢,達(dá)到優(yōu)勢互補(bǔ),克服兩者缺陷,更加全面地刻畫了股票價(jià)格的變化規(guī)律,RIMA-RBF是一種有效股票價(jià)格預(yù)測方法。
用ARIMA-RBF模型進(jìn)行股票價(jià)格預(yù)測,只需利用股票價(jià)格本身歷史狀態(tài)的演變特點(diǎn),就能對它未來的發(fā)展趨勢進(jìn)行預(yù)測,相對于傳統(tǒng)數(shù)理統(tǒng)計(jì)方法,ARIMA-RBF具有簡便、可靠等特點(diǎn)。主要原因是,股票價(jià)格歷史變化狀態(tài)是它本身特性及多種因素綜合作用結(jié)果,每一個(gè)時(shí)刻點(diǎn)股票價(jià)格處于一定變化狀態(tài)之中,并隱含于整個(gè)歷史過程的時(shí)間序列之中,前一時(shí)刻股票價(jià)格下一時(shí)刻點(diǎn)消長的基礎(chǔ),兩者保持著密切的關(guān)系,維持著整個(gè)股票價(jià)格演變的連續(xù)性,ARIMA-RBF正是揭示了股票價(jià)格變動(dòng)的這種內(nèi)在規(guī)律,因此,利用ARIMA-BRF預(yù)測股票價(jià)格變化是切實(shí)可行的、有效的。股票價(jià)格變化與政治、經(jīng)濟(jì)、投資者心理、企業(yè)經(jīng)營狀況等等多種因子密切相關(guān),尤其是受經(jīng)濟(jì)影響極其顯著,造成不同時(shí)刻間價(jià)格差異具有較大的隨機(jī)性和偶然性,有時(shí)甚至是無規(guī)律可循的,這給股票價(jià)格預(yù)測帶來很大的困難,但ARIMA-BRF模型能給出的股票價(jià)格變化,尤其是對于股票價(jià)格短期預(yù)測具有一定的參考意義。
復(fù)雜的股票市場面臨一個(gè)變化迅速的外界環(huán)境,由于預(yù)測的不確定性因素顯著增加,利用單個(gè)預(yù)測模型進(jìn)行預(yù)測的缺陷表現(xiàn)為信息源的不廣泛性以及對模型設(shè)定形式的敏感性等,采用單純線性或者非線性系模型很難達(dá)到理想的預(yù)測效果。為了全面、準(zhǔn)確描述股票價(jià)格變化規(guī)律,提出一種ARIMA和RBF神經(jīng)網(wǎng)絡(luò)相結(jié)合的股票價(jià)格組合預(yù)測模型。實(shí)例計(jì)算結(jié)果表明,ARIMA-RBF顯著提高了系統(tǒng)的預(yù)測能力和預(yù)測精度,能夠很好地反映股市漲跌趨勢,可以為投資者提供更有建設(shè)性的投資建議。由于股票價(jià)格是受政治、經(jīng)濟(jì)、投資者心理、企業(yè)經(jīng)營狀況等多種因子的影響,本研究只考慮股票價(jià)格歷史時(shí)間序列數(shù)據(jù),沒有考慮到這些因素的影響,綜合考慮多種因子對票價(jià)格的影響,這有待進(jìn)一步研究。
[1]Hu Xiaotian,Wang Hong,Xu Li,et al.Predicting stock index increments by neural networks:the role of trading volume under different horizons[J].Expert Systems with Applications,2008,34(4):3043-3054.
[2]李美,干曉蓉,劉新樂.ARIMA模型在股價(jià)預(yù)測上的應(yīng)用及其傅里葉修正[J].云南師范大學(xué)學(xué)報(bào),2011,31(5):50-55.
[3]何樹紅,陳浩.基于非參數(shù)模型對上海股市收益率的實(shí)證分析[J].云南民族大學(xué)學(xué)報(bào):自然科學(xué)版,2010,19(3):162-165.
[4]郭寧,向鳳紅.灰色理論和神經(jīng)元網(wǎng)絡(luò)在證券市場中的應(yīng)用[J].自動(dòng)化技術(shù)與應(yīng)用,2008,27(10):1-3.
[5]董春勝,馬玲.基于變維分形的股票指數(shù)預(yù)測模型[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào):自然科學(xué)版,2011,30(5):774-777.
[6]孫彬,李鐵克,張文學(xué).基于結(jié)構(gòu)修剪神經(jīng)網(wǎng)絡(luò)的股票指數(shù)預(yù)測模型[J].計(jì)算機(jī)應(yīng)用研究,2011,28(8):2840-2843.
[7]智晶,張冬梅,姜鵬飛.基于主成分的遺傳神經(jīng)網(wǎng)絡(luò)股票指數(shù)預(yù)測研究[J].計(jì)算機(jī)工程與應(yīng)用,2009,45(26):210-212.
[8]Vanstone B,F(xiàn)innie G.An empirical methodology for developing stock market trading systems using artificial neural networks[J].Expert Systems with Applications,2009,36(3):6668-6680.
[9]張坤,郁湧,李彤.基于小波和神經(jīng)網(wǎng)絡(luò)相結(jié)合的股票價(jià)格模型[J].計(jì)算機(jī)工程與設(shè)計(jì),2009,30(23):5496-5498.
[10]吳朝陽.小波變換和GM-ARMA組合模型的股指預(yù)測[J].智能系統(tǒng)學(xué)報(bào),2011,6(3):279-283.
YU Guohong1,YANG Dezhi2,CONG Peili3
1.School of Software&Service Outsourcing,Chien-shiung Institute of Technology,Taicang,Jiangsu 215411,China
2.School of Economics,Eastern Liaoning University,Dandong,Liaoning 118001,China
3.Department of Information Engineering,Liaoning Jidian Vocational College,Dandong,Liaoning 118009,China
The stock price is mutant,nonlinear and random.Single prediction methods can only describe the stock price segment information defect.This paper proposes a stock price combination forecasting model.Autoregressive moving average is used to forecast the stock price’s linear trend,and then the RBF neural network is used to capture the nonlinear part.The two results are combined to form the stock price forecasting results.The simulation experiment is carried out on Baotou Steel shares(600010).The results show that,compared with single forecast model,the proposed combination forecasting model can describe stock price change rules more comprehensively and accurately.It improves the forecasting precision of stock price.
stock price;combination forecasting;neural network;autoregressive integrating moving average
針對股票價(jià)格的突變性、非線性和隨機(jī)性,單一預(yù)測方法僅能描述股票價(jià)格片斷信息等缺陷,提出一種股票價(jià)格組合預(yù)測模型。采用自回歸移動(dòng)平均模型(ARIMA)對股票價(jià)格進(jìn)行預(yù)測,捕捉股票價(jià)格線性變化趨勢。采用RBF神經(jīng)網(wǎng)絡(luò)對非線性、隨機(jī)變化規(guī)律進(jìn)行預(yù)測。將兩者結(jié)果組合得到股票價(jià)格預(yù)測結(jié)果。采用組合模型對包鋼股份(600010)股票收盤價(jià)進(jìn)行仿真實(shí)驗(yàn),結(jié)果表明,相對于單一預(yù)測模型,組合預(yù)測模型更加全面、準(zhǔn)確刻畫了股票價(jià)格的變化規(guī)律,提高了股票價(jià)格預(yù)測精度。
股票價(jià)格;組合預(yù)測;神經(jīng)網(wǎng)絡(luò);自回歸移動(dòng)差分模型
A
TP311
10.3778/j.issn.1002-8331.1112-0126
YU Guohong,YANG Dezhi,CONG Peili.Study of stock price forecasting based on combination of ARIMA and RBF neural network.Computer Engineering and Applications,2013,49(18):245-248.
俞國紅(1969—),男,副教授,CCF會(huì)員,主要從事智能計(jì)算與數(shù)據(jù)挖掘的研究;楊德志(1976—),男,講師,主要從事數(shù)學(xué)模型及統(tǒng)計(jì)優(yōu)化計(jì)算的研究;叢佩麗(1977—),女,講師,主要從事網(wǎng)絡(luò)技術(shù)與信息安全的研究。E-mail:yuguohong_2010@126.com
2011-12-08
2012-02-13
1002-8331(2013)18-0245-04
CNKI出版日期:2012-06-04 http://www.cnki.net/kcms/detail/11.2127.TP.20120604.1433.001.html