摘 要:針對(duì)國(guó)家對(duì)證券市場(chǎng)的監(jiān)管和投資人對(duì)證券市場(chǎng)的決策而言,一個(gè)精確度更高的時(shí)間序列預(yù)測(cè)模型是很重要的。本文在吸取前人利用神經(jīng)網(wǎng)絡(luò)模型進(jìn)行證券價(jià)格趨勢(shì)預(yù)測(cè)中的經(jīng)驗(yàn),基于長(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò)搭建時(shí)間序列,提出利用指數(shù)移動(dòng)平均值均線對(duì)數(shù)據(jù)進(jìn)行采樣,以提高時(shí)間序列對(duì)證券價(jià)格趨勢(shì)預(yù)測(cè)的準(zhǔn)確性。本文采用的時(shí)間序列數(shù)據(jù)為上證指數(shù)日線收盤價(jià),實(shí)驗(yàn)結(jié)果表明預(yù)測(cè)精確度提高70%,采用指數(shù)移動(dòng)平均值均線對(duì)數(shù)據(jù)進(jìn)行采樣輸入時(shí)間序列分析模型的預(yù)測(cè)效果優(yōu)于傳統(tǒng)方法進(jìn)行數(shù)據(jù)采樣。本文的實(shí)驗(yàn)結(jié)果為國(guó)家對(duì)市場(chǎng)的監(jiān)督和投資者的決策提供了一定參考。
關(guān)鍵詞:時(shí)間序列;指數(shù)移動(dòng)平均值;神經(jīng)網(wǎng)絡(luò);LSTM;深度學(xué)習(xí)
本文索引:陳騰勁 .<變量 2>[J].中國(guó)商論,2021(20):-094.
中圖分類號(hào):F832.0 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-0298(2021)10(b)--03
時(shí)間序列分析是以已有的歷史數(shù)據(jù)為根據(jù),通過數(shù)學(xué)建模進(jìn)行分析和判斷未來(lái)發(fā)展趨勢(shì)的一種手段,被廣泛地運(yùn)用在證券走勢(shì)的預(yù)測(cè)當(dāng)中。自20世紀(jì)80年代開始,在人工智能(Artificial Intelligence, AI)領(lǐng)域,人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks, ANN)受到越來(lái)越多的關(guān)注。得益于最近十多年來(lái)科技的進(jìn)步,人們?cè)诎雽?dǎo)體領(lǐng)域的探索不斷深入,ANN的研究工作也不斷向前邁進(jìn),已經(jīng)取得了很大的進(jìn)展。傳統(tǒng)的時(shí)間序列分析方法因其對(duì)高噪聲序列分析的效果不佳,又因證券價(jià)格為高噪聲序列,故難以對(duì)證券價(jià)格趨勢(shì)的變動(dòng)做出科學(xué)的、嚴(yán)謹(jǐn)?shù)呐袛啵鳤NN容易處理不完整的、模糊不確定或規(guī)律性不明顯、高噪聲的數(shù)據(jù),所以用ANN進(jìn)行價(jià)格預(yù)測(cè)的優(yōu)勢(shì)是傳統(tǒng)時(shí)間序列模型無(wú)法相提并論的。
長(zhǎng)短期記憶人工神經(jīng)網(wǎng)絡(luò)(Long-Short Term Memory, LSTM)是人工神經(jīng)網(wǎng)絡(luò)的一種,衍生于循環(huán)人工神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN),因其具有負(fù)責(zé)計(jì)算時(shí)間序列中各個(gè)觀測(cè)值之間依賴性的能力,所以,LSTM通常被用于預(yù)測(cè)目的[1]。又因其具有快速適應(yīng)趨勢(shì)中急劇變化的固有能力,所以,LSTM可以在波動(dòng)的時(shí)間序列中很好地工作。傳統(tǒng)的時(shí)間序列分析模型,如差分整合移動(dòng)平均自回歸模型 (Autoregressive Integrated Moving Average Model, ARIMA)則無(wú)法盡快適應(yīng)證券價(jià)格的突然劇烈變動(dòng)。
一個(gè)精確度高的時(shí)間序列分析模型對(duì)證券市場(chǎng)的價(jià)格進(jìn)行分析和預(yù)測(cè),將有助于國(guó)家對(duì)宏觀經(jīng)濟(jì)政策的把控,也能為投資者帶來(lái)極大的利潤(rùn)。本文將運(yùn)用LSTM模型對(duì)證券價(jià)格進(jìn)行時(shí)間序列分析,并分別以收盤價(jià)和以指數(shù)移動(dòng)平均值均線 (Exponential Moving Average, EMA)價(jià)格進(jìn)行采樣,對(duì)比兩個(gè)不同采樣方式的誤差率,評(píng)估兩種采樣方式的預(yù)測(cè)效果,為國(guó)家對(duì)市場(chǎng)的監(jiān)督和投資者的決策提供參考。
1 LSTM模型原理
由于RNN模型沒有長(zhǎng)期記憶能力和會(huì)出現(xiàn)梯度爆炸或者梯度消失等弊端,在RNN模型的基礎(chǔ)之上,Juergen Schmidhuber提出了LSTM模型。
LSTM除了RNN結(jié)構(gòu)外,還具有閥門節(jié)點(diǎn)層。有三種類型的閥門:忘記門,輸入門和輸出門。這些閥門可以被打開或關(guān)閉,用于確定模型網(wǎng)絡(luò)的內(nèi)存狀態(tài)(前一個(gè)網(wǎng)絡(luò)的狀態(tài))的輸出是否達(dá)到閾值,從而添加到該層的當(dāng)前計(jì)算中。
ft,it,ot和Ct分別表示在t時(shí)刻對(duì)應(yīng)的三種門結(jié)構(gòu)和細(xì)胞狀態(tài);Wf,Wi,Wo和Wc表示循環(huán)層的權(quán)重矩陣;σ表示激活函數(shù),一般為sigmoid函數(shù)或者tanh函數(shù);bf,bi,bo和bc表示偏置向量,LSTM模型的計(jì)算公式如下[2]:
2 EMA均線原理
EMA均線是一種趨向類指標(biāo),其構(gòu)造的原理是對(duì)收盤價(jià)進(jìn)行算術(shù)平均,并且把不同時(shí)間的平均值連接成一條平滑的曲線,用于判斷證券價(jià)格未來(lái)走勢(shì)的變動(dòng)趨勢(shì)。對(duì)序列{xn}定義其截至第n項(xiàng)的周期為N的指數(shù)移動(dòng)平均 EMAN(xn)的計(jì)算公式:
由于x1之前沒有數(shù)據(jù),一般都會(huì)補(bǔ)充定義x0=x-1=x-2=…=x1。這樣自然就能給出EMAN(x1)=x1的結(jié)果。從定義式中,我們可以看出EMA均線加權(quán)平均的特性。在EMA均線指標(biāo)中,時(shí)間越靠近當(dāng)天(當(dāng)期)時(shí)刻,該證券價(jià)格所獲得的權(quán)重越大。這說明EMA函數(shù)對(duì)近期的證券價(jià)格逐步增加權(quán)重比,更能及時(shí)反映近期的證券價(jià)格的波動(dòng)情況[3]。
3 模型構(gòu)建
本文基于Python3.8和Tensorflow環(huán)境下的Keras API進(jìn)行LSTM模型的搭建。
本文搭建的LSTM模型共有1層隱藏層,該隱藏層內(nèi)含有的神經(jīng)元數(shù)量為128個(gè)。
人工神經(jīng)網(wǎng)絡(luò)運(yùn)用梯度下降法在反向傳播過程中,迭代出最佳的損失殘差,能更好地基于訓(xùn)練數(shù)據(jù)迭代地更新神經(jīng)網(wǎng)絡(luò)權(quán)重[4]。本文選用的梯度下降迭代器為Adam優(yōu)化算法。
本文中選擇用于衡量訓(xùn)練誤差的損失函數(shù)為均方誤差(Mean Squared Error, MSE)。訓(xùn)練過程中,隨著迭代次數(shù)不斷增加,MSE的值會(huì)不斷縮小,當(dāng)MSE的值越來(lái)越接近于0,說明LSTM模型擬合的效果越來(lái)越好[5]。
在對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行多次訓(xùn)練之后,發(fā)現(xiàn)Epochs次數(shù)為1000時(shí),模型對(duì)數(shù)據(jù)擬合的損失函數(shù)MSE的值最小,即擬合的精確度最高,故本文所選用的Epochs次數(shù)為1000次,選用的輸入數(shù)據(jù)批次大小 (Batch Size)為128,數(shù)據(jù)采樣的滑動(dòng)窗口設(shè)置為1。
本文利用LSTM神經(jīng)網(wǎng)絡(luò)建立了兩個(gè)不同的模型來(lái)進(jìn)行證券價(jià)格的預(yù)測(cè),具體模型描述如下:
模型一:利用連續(xù)采樣單純的歷史收盤價(jià)作為模型的輸入數(shù)據(jù);
模型二:利用連續(xù)采用的歷史收盤價(jià)的EMA價(jià)格作為模型的輸入數(shù)據(jù)。