李新堯
摘要:利用SSA降噪技術(shù)對(duì)滬深 300 指數(shù)股票價(jià)格進(jìn)行降噪并建立 LSTM 模型,發(fā)現(xiàn)在預(yù)測(cè)性能方面,奇異譜分析能夠進(jìn)一步提高模型預(yù)測(cè)的精度,優(yōu)化算法對(duì)于模型的優(yōu)化或許也能間接提高模型的預(yù)測(cè)性能。通過將原始時(shí)間序列構(gòu)建軌跡矩陣,將軌跡矩陣進(jìn)行奇異值分解、重構(gòu),由此提取出時(shí)間序列中代表不同成分的信號(hào),有效、準(zhǔn)確地運(yùn)用數(shù)學(xué)模型預(yù)測(cè)股票價(jià)格。
關(guān)鍵詞:SSA-LSTM;股票;預(yù)測(cè)
一、前言
股票市場(chǎng)作為市場(chǎng)經(jīng)濟(jì)的重要組成部分,在市場(chǎng)經(jīng)濟(jì)中始終發(fā)揮著經(jīng)濟(jì)狀況“晴雨表”的作用。如何有效、準(zhǔn)確地運(yùn)用數(shù)學(xué)模型預(yù)測(cè)股票價(jià)格早已成為當(dāng)下國(guó)內(nèi)外學(xué)者們研究的熱點(diǎn)話題,采用傳統(tǒng)的時(shí)間序列方法很難描述股票的非線性特征并準(zhǔn)確預(yù)測(cè)出價(jià)格的變動(dòng)趨勢(shì)。伴隨著神經(jīng)網(wǎng)絡(luò)的發(fā)展,更多的研究學(xué)者把視線轉(zhuǎn)移到機(jī)器學(xué)習(xí)上。如楊小平[1]基于主成分和BP神經(jīng)網(wǎng)絡(luò)的方法對(duì)股票價(jià)格進(jìn)行了預(yù)測(cè)分析;耿晶晶等[2]基于CNN-LSTM組合模型預(yù)測(cè)股票指數(shù)變動(dòng);張杰[3]對(duì)具有馬氏鏈的股票價(jià)格預(yù)測(cè)提出了長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)LSTM預(yù)測(cè)模型。
本文考慮對(duì)原始數(shù)據(jù)進(jìn)行降噪處理。奇異譜分析(SSA)是一種非常適合研究非線性時(shí)間序列數(shù)據(jù)的降噪分解方法。該方法通過將原始時(shí)間序列構(gòu)建軌跡矩陣,將軌跡矩陣進(jìn)行奇異值分解、重構(gòu),由此提取出時(shí)間序列中代表不同成分的信號(hào),比如噪聲信號(hào)、周期信號(hào)、整體趨勢(shì)信號(hào)。
二、方法介紹
(一)奇異譜分析
奇異譜分析是由Colebrook[4]于1978年提出的一種方法,該算法的目的是將原始序列分解為少量獨(dú)立的可解釋分量的和[5]。奇異譜分析包含了分解和重構(gòu)兩個(gè)階段,具體見下文。同時(shí),本文將綜合考慮奇異值的奇異熵和累計(jì)貢獻(xiàn)率,由此準(zhǔn)確提取出含有主要趨勢(shì)信號(hào)的部分。
1.分解
2.重組
三、實(shí)證分析
(一)數(shù)據(jù)來源及預(yù)處理
實(shí)驗(yàn)數(shù)據(jù)來源于investing(https://cn.investing.com)網(wǎng)站,數(shù)據(jù)包括2012年8月1日至2022年7月31日期間滬深300指數(shù)股票價(jià)格的收盤價(jià)(Close)、開盤價(jià)(Open)、最高價(jià)(High)、最低價(jià)(Low)、出售量(Volume)和漲跌幅(Chg)。部分?jǐn)?shù)據(jù)展示如表1所示。
(二)實(shí)驗(yàn)結(jié)果及分析
結(jié)合數(shù)據(jù)的周期性和奇異譜分析的嵌入過程中的參數(shù)的原則,選取窗口長(zhǎng)度為720。根據(jù)奇異熵和累計(jì)貢獻(xiàn)率決定奇異值的提取階數(shù)并作為原始時(shí)間序列的主要信息,奇異熵增量和累計(jì)貢獻(xiàn)率的變化情況如下:
結(jié)合圖2,考慮選擇前250階奇異值重構(gòu)序列。歸一化處理的部分結(jié)果展示如表2所示。
實(shí)驗(yàn)將數(shù)據(jù)按照9∶1進(jìn)行訓(xùn)練集和測(cè)試集的劃分,模型參數(shù)學(xué)習(xí)率設(shè)置為0.01,batch_size為32,epoches為100。評(píng)價(jià)指標(biāo)結(jié)果如表3所示。
圖3為整體模型圖,結(jié)合評(píng)價(jià)指標(biāo)可看出LSTM模型對(duì)于股票數(shù)據(jù)的預(yù)測(cè)具有不錯(cuò)的效果,同時(shí)奇異譜分析能一定程度上提高模型預(yù)測(cè)的精準(zhǔn)度。
四、總結(jié)與展望
本文利用SSA降噪技術(shù)對(duì)滬深300指數(shù)股票價(jià)格進(jìn)行降噪并建立LSTM模型。結(jié)果表明,在預(yù)測(cè)性能方面,奇異譜分析能夠進(jìn)一步提高模型預(yù)測(cè)的精度。股票會(huì)持續(xù)成為學(xué)者們關(guān)注的熱點(diǎn),運(yùn)用更為科學(xué)且復(fù)雜的組合模型對(duì)其進(jìn)行預(yù)測(cè),或許可以進(jìn)一步提高預(yù)測(cè)精度,同時(shí),更為精準(zhǔn)的。優(yōu)化算法對(duì)于模型的優(yōu)化或許也能間接提高模型的預(yù)測(cè)性能。
參考文獻(xiàn)
[1]楊小平.基于主成分與BP神經(jīng)網(wǎng)絡(luò)的股票價(jià)格預(yù)測(cè)分析[J].統(tǒng)計(jì)與決策,2004(12):42-43.
[2]耿晶晶,劉玉敏,李洋,等.基于CNN-LSTM的股票指數(shù)預(yù)測(cè)模型[J].統(tǒng)計(jì)與決策,2021,37(05):134-138.
[3]張杰.基于LSTM的股票預(yù)測(cè)實(shí)證分析[D].濟(jì)南:山東大學(xué),2020.
[4]Colebrook J M.Continuous plankton records:Zooplankton and environment.North Atlanticand North-Sea,Oceanologica Acta,1978,1(1):9-23.
[5]Hassani H.Singular spectrum analysis:methodology and comparison[J].Journal of Data Science,2007,5(2):239-257.
[6]楊文獻(xiàn),任興民,姜節(jié)勝.基于奇異熵的信號(hào)降噪技術(shù)研究[J].西北工業(yè)大學(xué)學(xué)報(bào),2001(03):368-371.
作者單位:南京審計(jì)大學(xué)統(tǒng)計(jì)與數(shù)據(jù)科學(xué)學(xué)院