盧茜妍,盧洪斌
(1.浦發(fā)銀行廣州分行,廣東 廣州 510623;2.百色學(xué)院,廣西 百色 533000)
通過人工智能對(duì)股票價(jià)格進(jìn)行預(yù)測受到廣泛的關(guān)注,傳統(tǒng)的機(jī)器學(xué)習(xí)預(yù)測方法已經(jīng)有大量的研究;基于深度學(xué)習(xí)的循環(huán)神經(jīng)網(wǎng)絡(luò)及長短時(shí)記憶網(wǎng)絡(luò)也有不少研究成果。研究表明對(duì)股票價(jià)格的準(zhǔn)確預(yù)測還有很長的路要走,這是由于導(dǎo)致股票價(jià)格波動(dòng)的主客觀因素極其復(fù)雜,目前沒有一種理論和預(yù)測方法能兼顧所有的價(jià)格波動(dòng)因素,因而股價(jià)預(yù)測研究中應(yīng)重點(diǎn)考慮模型結(jié)構(gòu)及股價(jià)影響因素如何數(shù)據(jù)化并引入模型中[1]。
當(dāng)前深度學(xué)習(xí)模型用于股票價(jià)格預(yù)測的研究主要采用RNN(Recurrent Neural Network,循環(huán)神經(jīng)網(wǎng)絡(luò))模型和LSTM(Long Short Term Memory,長短時(shí)循環(huán)神經(jīng)網(wǎng)絡(luò))模型,RNN模型的輸入序列過長會(huì)導(dǎo)致相隔時(shí)間較遠(yuǎn)的數(shù)據(jù)之間相關(guān)性快速下降為0,使得影響股價(jià)變化的序列數(shù)據(jù)限制在有限的時(shí)間間隔內(nèi),忽視了長時(shí)間相關(guān)性的一些數(shù)據(jù)對(duì)當(dāng)前預(yù)測值的影響。為解決這一問題引入了LSTM模型,利用LSTM的記憶能力改善了股價(jià)的預(yù)測準(zhǔn)確性。但是這兩種深度學(xué)習(xí)模型的訓(xùn)練效率比較低,不適用于線上實(shí)時(shí)系統(tǒng)的應(yīng)用[2]。另外,已有的深度學(xué)習(xí)模型股價(jià)預(yù)測研究中,通常輸入序列僅僅采用股票價(jià)格序列,很少考慮其它股票技術(shù)參數(shù)變化帶來的影響,必然導(dǎo)致預(yù)測結(jié)果偏離實(shí)際情況。
為解決上述股票價(jià)格預(yù)測研究中存在的問題,本文將GRU(Gated Recurrent Unit,門控循環(huán)單元)模型應(yīng)用到股票價(jià)格預(yù)測中,GRU模型是對(duì)LSTM模型的優(yōu)化,GRU將LSTM 中遺忘門與輸入門合二為一為更新門,使得GRU模型的參數(shù)總量比 LSTM 模型大幅減少,降低了模型訓(xùn)練的難度,利于用于實(shí)時(shí)在線系統(tǒng)[3]。導(dǎo)致股票價(jià)格波動(dòng)的主客觀因素很多,以往通過價(jià)格時(shí)間序列作為模型唯一輸入特征的做法是無法訓(xùn)練得到更準(zhǔn)確的模型權(quán)重矩陣的。本文把影響股價(jià)波動(dòng)的幾種股票技術(shù)指標(biāo)用到預(yù)測模型中,在輸入序列中引入三種特征的數(shù)據(jù),這些特征數(shù)據(jù)除了價(jià)格之外,還有成交量、平滑異同移動(dòng)平均指標(biāo)。測試結(jié)果說明本文提出的方法明顯提高了預(yù)測系統(tǒng)運(yùn)行的性能和股價(jià)預(yù)測的準(zhǔn)確度,這為今后進(jìn)一步探索股價(jià)預(yù)測的新模型和新方法提供了有益的參考。
圖1 GRU股價(jià)預(yù)測模型
本文的GRU股價(jià)預(yù)測模型是這樣搭建的:輸入層3個(gè)節(jié)點(diǎn),第一隱藏層包含80個(gè)節(jié)點(diǎn),第二隱藏層包含100個(gè)節(jié)點(diǎn);輸出層1個(gè)節(jié)點(diǎn),損失函數(shù)采用ADAM優(yōu)化算法。以真實(shí)的股票歷史數(shù)據(jù)作為訓(xùn)練樣本,循環(huán)核時(shí)間展開步為30步,每個(gè)時(shí)間步輸入特征個(gè)數(shù)為3。以股票歷史數(shù)據(jù)為模型訓(xùn)練數(shù)據(jù),數(shù)據(jù)中包含時(shí)間、開盤價(jià)、最高價(jià)、最低價(jià)、收盤價(jià)、成交量、平滑異同移動(dòng)平均指標(biāo),訓(xùn)練標(biāo)簽為股票收盤格,訓(xùn)練完成后得到模型中優(yōu)化的4個(gè)權(quán)重矩陣和偏置參數(shù),這樣即可使用GRU股票價(jià)格預(yù)測系統(tǒng)進(jìn)行在線測試。
為說明GRU模型降低了模型訓(xùn)練的難度,LSTM模型與搭建的GRU模型的隱藏層數(shù)及節(jié)點(diǎn)數(shù)一致、訓(xùn)練參數(shù)相同,檢測得到GRU模型比LSTM模型的參數(shù)少2萬4千多個(gè),GRU模型訓(xùn)練時(shí)間相應(yīng)程度的縮短,說明相同訓(xùn)練條件下GRU模型的效率更高。
為研究影響模型預(yù)測準(zhǔn)確度的因素,對(duì)輸入序列只有一個(gè)股票價(jià)格參數(shù)和同時(shí)具有價(jià)格、成交量、平滑異同移動(dòng)平均數(shù)三個(gè)參數(shù)的情況分別進(jìn)行實(shí)驗(yàn),圖2為股價(jià)預(yù)測結(jié)果,是對(duì)北方華創(chuàng)(股票代碼002371)日線收盤價(jià)的預(yù)測結(jié)果和實(shí)際收盤價(jià)的對(duì)比曲線,輸入單個(gè)特征參數(shù)的最大預(yù)測偏差為29%,輸入三個(gè)特征參數(shù)的最大預(yù)測偏差為12%。從圖可見,輸入序列有三個(gè)特征參數(shù)時(shí)的預(yù)測結(jié)果明顯好于只有股價(jià)一個(gè)特征參數(shù)時(shí)的預(yù)測結(jié)果。
圖2 股價(jià)預(yù)測結(jié)果
圖3為股價(jià)預(yù)測曲線和實(shí)際股價(jià)曲線對(duì)比圖,為輸入序列有三個(gè)特征參數(shù)時(shí),在相同訓(xùn)練參數(shù)下,中芯國際(股票代碼688981)日線和5 min線收盤價(jià)的預(yù)測結(jié)果和實(shí)際收盤價(jià)的對(duì)比曲線。對(duì)比輸入序列為日線時(shí)的股價(jià)預(yù)測曲線和實(shí)際股價(jià)曲線,其最大預(yù)測偏差為8%、均方根誤差為1.535 779、平均絕對(duì)誤差為1.107 465。對(duì)比輸入序列為5 min線時(shí)的股價(jià)預(yù)測曲線和實(shí)際股價(jià)曲線,其最大預(yù)測偏差為2%、均方根誤差為0.197 348、平均絕對(duì)誤差為0.126 712。
圖3 股價(jià)預(yù)測曲線和實(shí)際股價(jià)曲線對(duì)比圖
圖3的結(jié)果可看出GRU模型在輸入三個(gè)特征參數(shù)情況下,預(yù)測效果良好,且對(duì)5 min線的預(yù)測結(jié)果要好于日線的預(yù)測結(jié)果,這與輸入的具體股票技術(shù)指標(biāo)有一定關(guān)系。以上實(shí)驗(yàn)結(jié)果說明基于GRU模型的股價(jià)預(yù)測系統(tǒng)在預(yù)測準(zhǔn)確性和系統(tǒng)運(yùn)行效率方面具備一定優(yōu)勢。
GRU模型應(yīng)用到股票價(jià)格預(yù)測中,由于GRU模型的參數(shù)總量比LSTM模型大幅減少,提高了股票價(jià)格預(yù)測系統(tǒng)的時(shí)間效率。在輸入序列中引入價(jià)格、成交量、平滑異同移動(dòng)平均數(shù)三種特征的數(shù)據(jù),明顯提高了GRU模型股價(jià)預(yù)測的準(zhǔn)確度。
當(dāng)前股價(jià)預(yù)測只能作為一種股票投資的輔助手段,還沒有一種理論和模型能夠充分地考慮導(dǎo)致股價(jià)波動(dòng)的主客觀因素。隨著人工智能和大數(shù)據(jù)技術(shù)的不斷發(fā)展和應(yīng)用推廣,算法和算力的提升,特別是有關(guān)股票價(jià)格波動(dòng)因素相關(guān)海量數(shù)據(jù)的產(chǎn)生和不斷完善,在這些反映股價(jià)波動(dòng)的海量數(shù)據(jù)的支撐下,對(duì)股票價(jià)格進(jìn)行預(yù)測會(huì)越來越準(zhǔn)確,股價(jià)預(yù)測將會(huì)越來越接近投資實(shí)戰(zhàn)的要求。