劉 銘,單玉瑩
(長春工業(yè)大學 數學與統(tǒng)計學院,長春 130012)
隨著經濟水平的提高,人民的物質生活極大豐富,越來越多的人選擇投資股票進行理財。由于股票價格走勢復雜,沒有明確的規(guī)律,因此如何預測股指的走勢成為投資者的一大難題,能夠更好地預測股指的走勢非常重要。
鑒于股價指數的波動性,如何透過復雜的現象了解股市的走勢和資產價格的變動,從而使投資者獲得理想的投資收益,是股票投資者特別是機構投資者非常關心的一個重要課題,也是一個需要深入研究的課題。要想選擇合適的買入賣出期貨的時機來產生超額收益,就必須選擇一個合適的模型來有效地預測股價走勢或預測未來價值。股市受很多經濟和社會因素的影響,是一個復雜的非線性系統(tǒng)。傳統(tǒng)的股票投資模型一般假設預測序列是線性或近似線性的,難以高效、準確地預測股指的價格走勢,難以提供足夠的信息支持股票預測優(yōu)化投資決策。眾所周知,深度學習算法能夠從大量的原始時間序列數據中提取特征,無需依賴先驗知識,非常適合金融時間序列預測,尤其是LSTM網絡由于其循環(huán)性結構,具有長期記憶性。但股市是一個隨著外部環(huán)境變化而變化的環(huán)境,隨機性強,不同現象之間存在復雜的內在非線性關系,而目前的時間序列預測模型依靠單一的方法直接識別序列,不能充分提取復雜的序列變化信息,所以組合預測方法被提出。
通過現有文獻發(fā)現國內外學者們較為關注股指金融問題[1-4],傳統(tǒng)預測金融數據的模型有例如ARMA模型、ARIMA模型和GARCH模型[5-10],隨著機器學習的興起,研究者們發(fā)現對于時序數據的預測LSTM模型具有較好的效果[11-14],后來對于單模型的不足,學者們發(fā)現可以在機器學習模型中加入優(yōu)化算法使預測效果變好[15-18]。賀毅岳等[19]對滬深300的5個具有代表性股指用CEEMDAN與LSTM模型進行組合預測,結果表明模型具有較低的誤差和滯后性。閆洪舉[20]對于上證指數運用CNN與GRU模型進行組合預測,結果表明模型預測結果高于深度學習、機器學習算法。于家斌等[21]用GF優(yōu)化算法搭建GF-LSTM網絡的藍藻水華預測模型,預測了水華發(fā)生。崔昊楊等[22]利用對遺忘門加權的方式改進LSTM模型,運用ARIMA模型和改進的LSTM對2018年國內某市區(qū)歷史負荷電力數據進行預測,在數據缺失情況下的預測準確率分別提高了44%和57%。而經驗模態(tài)分解(EMD)與機器學習模型相結合具有較好的預測效果[23-26]:Bao等[27]主要貢獻在于首次嘗試引入SAEs方法提取金融時間序列的深度不變日特征,構建WSAEs-LSTM、WLSTM、LSTM、RNN,其中WSAEs-LSTM具有最好的可預測性。Wang等[28]對紐約證券交易所、紐約證券交易所、富時指數和恒生指數構建了EMD-STNN模型,與STNN、BPNN和SVM摸型相比,EMD-STNN模型對訓練集和測試集的預測具有明顯的優(yōu)勢。
梳理已有文獻發(fā)現:對于股指預測方面國內外學者已有一定研究成果,但鮮有提出股指波動對模型預測效果影響的文章?;诖吮疚奶岢隽私鹑跁r序數據波動大小對于EMD-LSTM模型與LSTM模型預測效果的對應關系。數據波動越大,EMD-LSTM模型的預測效果越好。本文主要研究EMD-LSTM模型、EEMD-LSTM模型、LSTM模型和傳統(tǒng)的時間序列模型在滬深300、上證指數和深證成指的收盤價預測中的應用并對其預測效果進行對比,然后在股指波動性不同的情形下分析EMD-LSTM模型和LSTM模型的適用情形。
在構建EMD-LSTM模型對股指數據進行預測研究之前,需對模型組合的各組成部分:EMD分解技術及LSTM長短期記憶神經網絡進行簡要介紹。
長短期記憶網絡(long short term memory,LSTM),最早由Hochreiter和Schmidhuber(1997)引入,發(fā)展到后期有許多學者進行了改進。LSTM的結構如圖1。
圖1 LSTM結構示意圖
LSTM具有鏈式結構,典型的LSTM網絡由輸入門、遺忘門和輸出門構成。在t時刻時,輸入數據xt以及之前時間步傳遞下來的更新,得到新的隱藏狀態(tài)和記憶狀態(tài),并繼續(xù)傳遞下去,利用這樣的方式完成長期記憶。具體的數學描述如下:
輸入數據xt和隱層輸出ht-1經過“忘記門”,得到狀態(tài)ft,表達式為:
ft=σ[Wf·(ht-1,xt)+bf]
(1)
其中:σ為sigmod函數,Wf為“忘記門”的權值向量,bf為“忘記門”的偏置值。
(2)
it=σ[Wi·(ht-1,xt)+bi]
(3)
輸入數據xt和隱藏狀態(tài)ht-1經過輸出門,計算出待輸出結果ot,再經過t時刻的細胞狀態(tài)Ct篩選ot中的信息作為最后輸出ht,表達式為:
ot=σ[Wo·(ht-1,xt)+bo]
(4)
ht=ot*tanh(Ct)
(5)
ot、Wo和bo分別為輸出向量、權值向量和偏置值。ht為t時刻LSTM模型的輸出值。
經驗模態(tài)分解(empirical mode decomposition,EMD),是由黃鍔與其他學者提出的一種自適應信號時頻處理方法。
對于任意的時間序列數據x(t),EMD分解的計算流程如下:
步驟1 找出x(t)中所有局部極大值與極小值的大小和位置。
步驟2 極大值和極小值用上和下包絡線進行擬合,并分別設U(t)和L(t)。
步驟3 計算上下兩條包絡線在每個時間點的均值:
m(t)=[U(t)+L(t)]/2
(6)
步驟4 令h1(t)=x(t)-m(t),如果h1(t)滿足IMF的判斷條件,則得到了一條IMF。否則,令x(t)=h1(t),將以上的步驟重復進行。
步驟5 上述步驟的運算可以逐步分解出第1,2,…,n個本特征模量即IMFi(t),i=1,…,n,和一個殘差r(t)。
此時,原始信號x(t)可以表示為:
(7)
同一個模量態(tài)函數包含多個周期特征。
在以上的討論基礎上,本文提出了基于EMD-LSTM算法的中國3個主要股指預測模型。該模型由2個部分組成,第一個部分是EMD算法,目的是將股指的日收盤價分解成IMF序列和殘差序列。接著將IMF序列和殘差序列分別構建LSTM模型,最后相加求和。EMD-LSTM模型結構如圖2。
圖2 EMD-LSTM模型結構框圖
從圖2可以看出,EMD-LSTM預測模型所采用的EMD分解算法可以滿足金融數據的非線性、非平穩(wěn)的特征。經過EMD分解后的數據輸入LSTM模型訓練。EMD算法和LSTM模型的優(yōu)點在EMD-LSTM模型中體現。
本文神經網絡模型采用滑動時間窗來構建樣本,滑動窗口的寬度為50,預測未來一天的收盤價。通過不斷后移,每次移動一個數據單位長度,形成一系列相互覆蓋的樣本數據,這樣的方法在有效利用數據時序信息的同時降低了時變性。輸入數據t與預測數據t+1的滑動窗口結構如圖3。
圖3 滑動窗口結構示意圖
2.2.1數據獲取
本文主要研究對象為中國具有代表性的3支股票:滬深300股指期貨、上證指數和深證成指2015年1月5日至2019年3月14日的日收盤價數據,共1 022個數據。來自Market Point。選取的中國3個股指收盤價數據如圖4所示(其中橫軸為時間,縱軸為股指收盤價價格),收盤價數據的描述性統(tǒng)計如表1所示。
圖4 股指收盤價數據
表1 3個股指收盤價的描述性統(tǒng)計
對3個股指的ADF檢驗得到的結果是序列不平穩(wěn),因此不能直接使用多元線性回歸的方法。本文使用EMD算法可以去除收盤價數據的不平穩(wěn)性,從而可以將不平穩(wěn)數據分解為一些平穩(wěn)時間序列和趨勢項后,再將其作為輸入。其中3個股指的方差相差較大,而方差是衡量數據波動性大小的指標,由表1可以看出上證指數的波動性遠小于滬深300和深證成指的波動性。
2.2.2應用EMD算法對數據進行分解
從圖5~7中可以看出:應用EMD算法將不同的股指,分別按其波動的數據類型劃分為不同多個IMF序列和一個殘差序列。
圖5 滬深300EMD分解結果,IMF1-5序列和殘差序列
2.2.3數據歸一化
圖6 上證指數EMD分解結果,IMF1-6序列和殘差序列
圖7 深證成指EMD分解結果,IMF1-7序列和殘差序列
在經EMD算法分解后的數據首先需要進行歸一化處理,公式如下:
xnew=(xold-min(xi))/(max(xi)-min(xi))
(8)
式(8)中,xold為原始數據,xnew為歸一化后的數據。
為了還原數據,還需要對預測的輸出進行反歸一化處理,公式為:
(9)
本文選取的評價指標為均方根誤差(RMSE)、平均絕對百分比誤差(MAPE)、平均絕對誤差(MAE)和確定系數(R2)。計算公式如下:
(10)
(11)
(12)
(13)
本章采用滬深300、上證指數和深證成指的收盤價數據,通過ARIMA、SVR、LSTM、EMD-LSTM、EMD-ARIMA、EMD-SVR和EEMD-LSTM這7種模型來測試股票收盤價的預測效果。
本文的預測方式是利用前50 d的數據預測第51 d的收盤價數據。訓練的方式主要是取前67%作為訓練集,后33%為測試集。
本文使用的軟件為Python,本文的其他對比模型:在SVR模型中,選取的是sklearn庫,核函數為rbf以及其他默認參數;在ARIMA模型中,選取的是statsmodels庫,選取模型為ARIMA(1,1,1);而LSTM模型中,選取的是keras庫,LSTM的神經元個數為100,優(yōu)化算法為adam,誤差的計算方式使用均方誤差,模型訓練的epoch為650,batch size為100,Dropout為0.4;在EEMD-LSTM模型中,EEMD為集成經驗模態(tài)分解,是將正態(tài)分布的白噪聲加入原始數據后,再進行EMD分解,分解后的數據輸入LSTM模型訓練。
接著本文通過以上幾種傳統(tǒng)時序模型和EMD-LSTM模型對股指收盤價數據進行實證分析。
2.5.1滬深300股指基于各模型的預測結果
通過比較7種模型中的RMSE、MAPE、MAE和R2值可以看出:EMD-LSTM模型的RMSE、MAPE和MAE值最小,R2值最大,可以認為EMD-LSTM模型預測效果最好(表2)。預測結果如圖8所示。
表2 滬深300基于各模型預測結果
圖8 滬深300收盤價-EMD-LSTM模型預測曲線
數據波動的大小對于模型的預測效果有一定的影響,滬深300的方差相對較大,波動較大,EMD-LSTM的預測效果最好,這也能體現出EMD對非平穩(wěn)波動大的數據預測效果良好。
2.5.2上證指數基于各模型的預測結果
通過比較7種模型的RMSE、MAPE、MAE和R2值可以看出,LSTM模型的RMSE、MAPE和MAE值最小,R2值最大,可以認為LSTM模型預測效果最好(見表3)。預測結果如圖9所示。
圖9 上證指數收盤價-LSTM模型預測曲線
基于上述,上證指數的方差相對較小,波動較小,LSTM的預測效果最好,這也能體現出LSTM對于非平穩(wěn)波動小的數據預測效果良好(表3)。
表3 上證指數基于各模型預測結果
2.5.3深證成指基于各模型的預測結果
通過比較7種模型的RMSE、MAPE、MAE和R2值可以看出,EMD-LSTM模型的RMSE和MAE值最小,R2值最大,只有MAPE值比ARIMA模型稍大,以多數服從少數原則可以認為EMD-LSTM模型預測效果最好(見表4)。預測結果如圖10所示。
圖10 深證成指收盤價-EMD-LSTM模型預測曲線
基于上述,深證成指的方差相對較大,波動較大,EMD-LSTM的預測效果最好(表4)。
表4 深證成指基于各模型預測結果
金融時間序列所具有的不平穩(wěn)特性對其預測效果造成了極大的影響。為了緩解這種不利影響,本研究采用了EMD與LSTM相結合的模型。本文以歷史50 d數據預測第51 d的數據,在滬深300股指和深證成指的預測中,數據波動較大,EMD-LSTM神經網絡具有較好的效果;在上證指數的預測中,數據波動較小,LSTM模型具有較好的效果??梢钥闯鰯祿▌拥拇笮τ谀P偷念A測效果有一定的影響,在非平穩(wěn)序列中方差越大,波動越大,方差大的數據EMD-LSTM的預測效果最好,而方差相對較小的數據LSTM的預測效果最好,這也能體現出EMD對非平穩(wěn)數據的處理的效果良好。該研究針對方差所體現的波動性,為未來深入研究找到確定的臨界值去選擇更合適的模型,從而進一步對國內外股指進行有效預測提供了思路。