摘 要:針對(duì)傳統(tǒng)股價(jià)預(yù)測(cè)模型未考慮市場(chǎng)投資者情緒對(duì)股票價(jià)格的影響以及難以較好的處理股價(jià)預(yù)測(cè)任務(wù)的問題,提出融合情感特征的時(shí)序深度學(xué)習(xí)模型BERT-TCN-LSTM。首先,對(duì)從股吧爬取投資者的評(píng)論信息進(jìn)行情緒分析,提取出每日情緒的平均值作為模型的輸入;其次,將每日情感均值與股票價(jià)格數(shù)據(jù)、技術(shù)指標(biāo)輸入構(gòu)建的TCN-LSTM模型中進(jìn)行訓(xùn)練;最后,在滬深300以及四只個(gè)股股票數(shù)據(jù)的數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)。結(jié)果表明,相較于時(shí)間卷積網(wǎng)絡(luò)(TCN)、LSTM和CNN-LSTM,BERT-TCN-LSTM在滬深300數(shù)據(jù)集上的平均絕對(duì)誤差(MAE)平均降低了54%。BERT-TCN-LSTM模型可以有效提升股票價(jià)格預(yù)測(cè)的精度。
關(guān)鍵詞:時(shí)間序列預(yù)測(cè);情緒分析;時(shí)間卷積網(wǎng)絡(luò);長(zhǎng)短期記憶網(wǎng)絡(luò)
中圖分類號(hào):TP183 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2024)17-0068-05
0 引 言
準(zhǔn)確的股價(jià)預(yù)測(cè)一直是廣大投資者和學(xué)者關(guān)注和研究的課題,然而股票市場(chǎng)是一個(gè)錯(cuò)綜復(fù)雜且規(guī)模龐大的體系,影響股票價(jià)格的因素眾多,如市場(chǎng)因素、經(jīng)濟(jì)因素、企業(yè)因素等。隨著互聯(lián)網(wǎng)技術(shù)日益革新,信息交流渠道日益呈現(xiàn)多元化和豐富化的特點(diǎn),投資者開始傾向于在社交網(wǎng)絡(luò)上抒發(fā)自己和獲取他人對(duì)股票市場(chǎng)的情緒,因此,輿論情緒對(duì)投資者交易情緒的影響越來(lái)越大,易導(dǎo)致投資者非理性交易,增加股價(jià)波動(dòng)不確定性,對(duì)股價(jià)的預(yù)測(cè)難度加大[1]。
就目前的學(xué)術(shù)界來(lái)說,目前較多是使用傳統(tǒng)統(tǒng)計(jì)學(xué)方法和機(jī)器學(xué)習(xí)方法來(lái)預(yù)測(cè)股價(jià),但是由于一些時(shí)間序列數(shù)據(jù)的非穩(wěn)定性和非線性特征,自回歸模型不具有普適性。時(shí)間序列數(shù)據(jù)的預(yù)測(cè)工作實(shí)質(zhì)上與機(jī)器學(xué)習(xí)中的回歸分析密切相關(guān),與傳統(tǒng)統(tǒng)計(jì)學(xué)方法相比機(jī)器學(xué)習(xí)方法更好的處理非平穩(wěn)性、高信噪比的金融時(shí)間序列[2]。長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory, LSTM)于1997年由Hochreiter等[3]提出,可以很好的實(shí)現(xiàn)時(shí)間序列數(shù)據(jù)的長(zhǎng)期上下文且具備良好的擴(kuò)展性。一些學(xué)者[4-5]通過LSTM模型,采用多變量輸入對(duì)股票價(jià)格或者股票指數(shù)進(jìn)行預(yù)測(cè),進(jìn)一步對(duì)比多個(gè)方法,驗(yàn)證了LSTM模型的預(yù)測(cè)精度最優(yōu)。隨著研究推進(jìn),衍生出很多基于LSTM模型的混合預(yù)測(cè)模型,Kim等[6]構(gòu)建LSTM與卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)組合模型對(duì)股票價(jià)格進(jìn)行預(yù)測(cè),并驗(yàn)證了該組合模型在預(yù)測(cè)精度上超越了單一模型。一些學(xué)者[7-9]通過CNN-LSTM模型在股價(jià)上的預(yù)測(cè)效果均優(yōu)于LSTM或CNN等單一模型。由于CNN無(wú)法捕捉時(shí)間序列中的時(shí)間尺度的信息,于是Shaojie Bai等[10]提出了時(shí)間卷積網(wǎng)絡(luò)(Temporal Convolutional Network, TCN),TCN核心是一維卷積層和空洞因果卷積結(jié)構(gòu),能捕捉不同時(shí)間尺度的特征,并更好理解時(shí)序數(shù)據(jù)的長(zhǎng)期依賴關(guān)系。
盡管先前有很多方法可以預(yù)測(cè)股價(jià),但是這些工作都忽視了輿論情緒對(duì)投資者交易情緒的影響。隨著互聯(lián)網(wǎng)的迅猛發(fā)展,信息傳播速度加快且渠道多樣化,社交媒體成為股票市場(chǎng)輿論情緒的重要載體,其誘導(dǎo)放大了投資者的態(tài)度傾向。一些學(xué)者[11-12]的研究證明了在社交媒體上大眾對(duì)股票市場(chǎng)的情緒變化影響著投資者個(gè)人的收益。
為了提高股價(jià)預(yù)測(cè)的精確性,本文構(gòu)建了一種新的股票價(jià)格預(yù)測(cè)模型。該模型將情感信息、價(jià)格信息和技術(shù)指標(biāo)信息結(jié)合起來(lái)。首先,利用BERT模型分類股市評(píng)論中的情感傾向。其次,對(duì)提取到的當(dāng)日的所有情感傾向求得每日情感均值。最后,利用每日情感均值與股票價(jià)格數(shù)據(jù)、技術(shù)指標(biāo)融合通過運(yùn)用TCN-LSTM模型實(shí)現(xiàn)了對(duì)股價(jià)的預(yù)測(cè),最終提升了預(yù)測(cè)的正確率。
1 基于情感分析和TCN-LSTM的股價(jià)預(yù)測(cè)
1.1 基于BERT的股評(píng)情感特征提取
BERT模型是谷歌公司在2018年提出的一種基于Transformer的雙向語(yǔ)言模型,利用Self-Attention機(jī)制來(lái)計(jì)算文本表示,相較詞向量技術(shù)(Word2Vec)有更好的泛化能力,同時(shí)更準(zhǔn)確地處理上下文邏輯關(guān)系。由于本文金融股評(píng)文本信息為中文,因此本文選擇BERT-base-Chinese模型,該模型使用中文文本進(jìn)行預(yù)訓(xùn)練可以取得較好的成效。
本文將東方財(cái)富網(wǎng)股吧抓取的10 000條數(shù)據(jù)并手工打上情緒標(biāo)簽作為模型微調(diào)的數(shù)據(jù)集,數(shù)據(jù)集按70%、15%和15%分割訓(xùn)練集、驗(yàn)證集和測(cè)試集。模型微調(diào)采用學(xué)習(xí)率為0.000 01的Adam優(yōu)化器,使用交叉熵?fù)p失函數(shù),批大小設(shè)置為32。
將爬取到的股評(píng)數(shù)據(jù)通過分詞、去停用詞等預(yù)處理操作后,使用微調(diào)完成后的BERT-base-Chinese模型進(jìn)行情感特征提取,首先輸入BERT-base-Chinese模型的嵌入層中添加位置編碼信息,隨后經(jīng)過多頭自注意力機(jī)制層進(jìn)行多頭自注意力計(jì)算,然后通過前饋網(wǎng)絡(luò)層和兩層殘差連接以及歸一化層,后將信息傳遞到下一個(gè)編碼器,最后在輸出層,使用Sigmoid函數(shù)輸出在0~1之間的情感值,情緒值越接近1說明市場(chǎng)對(duì)股價(jià)態(tài)度越積極。如表1所示為隨機(jī)選取的部分滬深300股評(píng)數(shù)據(jù)。
為了量化當(dāng)天股民的情緒值,對(duì)每日消極、積極情緒數(shù)求對(duì)數(shù)平均的方法求出每日情緒值:
(1)
其中semt為第t天的情緒值,semt的值越大,表示當(dāng)日偏向積極情感的評(píng)論數(shù)據(jù)越多,整體輿論情緒偏積極。semt的值越小,則表示日偏向消極情感的評(píng)論數(shù)據(jù)越多,整體輿論情緒偏消極。
1.2 基于TCN-LSTM的股價(jià)預(yù)測(cè)
1.2.1 時(shí)間卷積神經(jīng)網(wǎng)絡(luò)
TCN模型通過多個(gè)殘差模塊組成,每個(gè)殘差模塊由擴(kuò)張因果卷積,WeightNorm層,ReLU激活函數(shù)和Dropout層組成,擴(kuò)張卷積可以解決傳統(tǒng)卷積層在處理長(zhǎng)序列時(shí)感受野較小的問題,通過逐漸增加卷積核的擴(kuò)張率,可以增加感受野的大小。引入殘差鏈接解決了模型在訓(xùn)練過程中的梯度消失問題。WeightNorm層,ReLU激活函數(shù)和Dropout層都是為了機(jī)提高模型的泛化能力,其結(jié)構(gòu)如圖1所示。
其中因果卷積只操作當(dāng)前時(shí)刻的輸入,避免對(duì)未來(lái)的數(shù)據(jù)產(chǎn)生依賴,更好地保留時(shí)序信息的因果關(guān)系,濾波器F=(f1,f2,f3,…,fK),序列X=(x1,x2,x3,…,xT),則在xt處的因果卷積如式(2)所示:
(2)
但是,這種基本設(shè)計(jì)的一個(gè)主要缺點(diǎn)是:為了實(shí)現(xiàn)較長(zhǎng)的有效歷史規(guī)模,就需要一個(gè)極深的網(wǎng)絡(luò)或非常大的濾波器,因此引入擴(kuò)張卷積,擴(kuò)張卷積(Dilated Convolution)在卷積操作中加入空洞,逐漸增加感受野的大小,捕獲到更多信息,從而更好地處理長(zhǎng)距離的依賴關(guān)系。設(shè)一維序列輸入序列X=(x1,x2,x3,…,xT),濾波器F=(f1,f2,f3,…,fK)則在xt處的Dilation Rate為d的空洞卷積如式(3)所示:
(3)
其中,d為擴(kuò)張因子,K為濾波器大小,t-K+k為過去的方向。因此,擴(kuò)張相當(dāng)于在每?jī)蓚€(gè)相鄰的濾波器抽頭之間引入一個(gè)固定的步長(zhǎng)。使用更大的擴(kuò)張可以使頂層的輸出代表更廣泛的輸入,從而有效地?cái)U(kuò)大感受野。原理如圖2所示。
1.2.2 LSTM模型
由于LSTM模型的門控結(jié)構(gòu),使得LSTM可以從序列中集成、提取特征同時(shí)能夠考慮過去保留下來(lái)的重要信息,LSTM模型單元結(jié)構(gòu)如圖3所示。LSTM單元的信息更新過程如式(4)~(9):
(4)
(5)
(6)
(7)
(8)
(9)
其中σ(.)為激活函數(shù)Sigmoid,xt為模型的輸入,h(t-1)為t-1時(shí)刻的輸出,bf和Wf分別為遺忘門的偏置和權(quán)重矩陣。ft為遺忘門狀態(tài),其值越接近0,被遺忘的信息越多。Wi和bi為輸入門的權(quán)重矩陣和偏置,WC和bC為隱藏狀態(tài)?t的權(quán)重矩陣和偏置。it為輸入門的狀態(tài),得到的值越大,說明新從TCN模型輸出的輸入xt的重要性越高。Ct為當(dāng)前更新的隱藏單元,?t為當(dāng)前的隱藏記憶單元。ot為輸出門輸出定義了可以輸出的信息量。Wo和bo為當(dāng)前輸出門的權(quán)重矩陣和偏置。
1.2.3 基于情感分析的TCN-LSTM模型
本文提出一種金融時(shí)間序列預(yù)測(cè)的模型——BERT-TCN-LSTM混合模型股價(jià)預(yù)測(cè)方法。方法結(jié)構(gòu)框架如圖4所示。模型主要包含兩個(gè)階段:用BERT預(yù)訓(xùn)練模型對(duì)股評(píng)數(shù)據(jù)進(jìn)行情緒分析并計(jì)算每日情緒指標(biāo)構(gòu)建基于BERT-TCN-LSTM 模型的股價(jià)預(yù)測(cè)模型。兩個(gè)階段共包括四個(gè)步驟:
1)使用爬蟲工具從東方財(cái)富網(wǎng)股吧抓取股吧評(píng)論,并通過數(shù)據(jù)清洗、分詞、去除停用詞等步驟提升文本數(shù)據(jù)的可讀性。
2)利用BERT預(yù)訓(xùn)練模型進(jìn)行情感分析,根據(jù)分析結(jié)果計(jì)算每日的情緒值,從而形成每日的情緒指標(biāo)。
3)將每日的情緒指標(biāo)與歷史交易數(shù)據(jù)、技術(shù)指標(biāo)數(shù)據(jù)結(jié)合,構(gòu)建用于預(yù)測(cè)的全面的股指數(shù)據(jù)集。由于股票價(jià)格數(shù)據(jù)中的開盤價(jià)等價(jià)格與交易量的量綱不同,因此需要進(jìn)行數(shù)據(jù)歸一化處理。歸一化處理。在本文中,使用Z-Score歸一化方法式(10)對(duì)數(shù)據(jù)進(jìn)行處理,保證了數(shù)據(jù)間的可比性,式(10)如下:
(10)
其中,x為原始數(shù)據(jù),μ為x的平均值,σ為x的標(biāo)準(zhǔn)差,xnormalization表示歸一化后得到的數(shù)據(jù)。
4)將經(jīng)過處理的數(shù)據(jù)輸入TCN-LSTM模型對(duì)模型進(jìn)行訓(xùn)練和預(yù)測(cè)任務(wù)。TCN-LSTM混合模型結(jié)合了TCN和LSTM的優(yōu)點(diǎn),相比于卷積神經(jīng)網(wǎng)絡(luò),TCN具有更快的收斂速度和更出色的特征挖掘能力[13]。利用TCN模型的擴(kuò)張因果卷積對(duì)時(shí)間序列長(zhǎng)期依賴關(guān)系的優(yōu)勢(shì)提取股價(jià)數(shù)據(jù)集的特征,進(jìn)一步輸入到LSTM模型中,LSTM的門結(jié)構(gòu)可以。選擇性地保留或遺忘某些信息,使得LSTM能夠更好地捕獲和存儲(chǔ)股價(jià)數(shù)據(jù)的長(zhǎng)期依賴關(guān)系,能夠更深入地學(xué)習(xí)數(shù)據(jù)的內(nèi)在規(guī)律,彌補(bǔ)TCN靈活性不足的缺點(diǎn),此外TCN中的殘差結(jié)構(gòu)提高了模型的表達(dá)能力和魯棒性,并能夠更準(zhǔn)確地預(yù)測(cè)未來(lái)的值。以上四個(gè)步驟如圖4所示。
2 實(shí)驗(yàn)與結(jié)果
為了評(píng)估模型性能表現(xiàn),本文選用了平均絕對(duì)誤差(Mean Absolute Error, MAE)、均方誤差(Mean Square Error, MSE)、均方根誤差(Root Mean Square Error, RMSE)和平均絕對(duì)百分比誤差(Mean Absolute Percentage Error, MAPE)作為模型評(píng)價(jià)指標(biāo),計(jì)算過程如式(11)至(14)所示:
(11)
(12)
(13)
(14)
其中,?i為預(yù)測(cè)值,i=1,2,3,…,n;yi為真實(shí)值,評(píng)價(jià)指標(biāo)MAE、MSE、RMSE和MAPE的取值范圍都是[0,+?)。評(píng)價(jià)指標(biāo)的值越低越接近于0,說明模型的預(yù)測(cè)精度越高,反之則表明模型的預(yù)測(cè)性能越差。
2.1 數(shù)據(jù)集選擇
本文股票交易數(shù)據(jù)來(lái)自Tushare數(shù)據(jù)庫(kù),數(shù)據(jù)選擇開盤價(jià)、最高價(jià)、最低價(jià)、收盤價(jià)、成交量、成交額等歷史交易數(shù)據(jù),和布林線、指數(shù)平滑移動(dòng)平均線等技術(shù)指標(biāo)數(shù)據(jù)。股評(píng)數(shù)據(jù)來(lái)自東方財(cái)富網(wǎng)股吧,選取2020年1月1日至2023年1月1日滬深300指數(shù)的歷史交易數(shù)據(jù)、技術(shù)指標(biāo)數(shù)據(jù)以及100萬(wàn)條股吧股評(píng)作為樣本。股吧股評(píng)通過BERT預(yù)訓(xùn)練模型進(jìn)行情緒分類后對(duì)其每日消極、積極情緒數(shù)求對(duì)數(shù)平均,將含有情緒數(shù)據(jù)技術(shù)指標(biāo)和交易數(shù)據(jù)的股價(jià)數(shù)據(jù)集進(jìn)行劃分,其中70%的數(shù)據(jù)用作訓(xùn)練集,15%的數(shù)據(jù)用作驗(yàn)證集,剩余的15%的數(shù)據(jù)用作測(cè)試集。利用訓(xùn)練集對(duì)模型進(jìn)行訓(xùn)練,并通過驗(yàn)證集篩選出性能最佳的模型。最后,使用測(cè)試集評(píng)估已訓(xùn)練完備模型的性能。
2.2 股指實(shí)驗(yàn)結(jié)果
本節(jié)為了驗(yàn)證BERT-TCN-LSTM(BTL)混合模型的可行性和高效性本文選取2020年1月1日至2023年1月1日的滬深300指數(shù)(000300.sh)數(shù)據(jù)和2020年1月1日至2023年1月1日滬深300指數(shù)的100萬(wàn)條股吧股評(píng)作為樣本,并使用TCN、CNN-LSTM和LSTM以及考慮情緒指標(biāo)的BERT-TCN(BT)、BERT-CNN-LSTM(BCL)和BERT-LSTM(BL)作為對(duì)比模型進(jìn)行對(duì)比實(shí)驗(yàn),各個(gè)模型在不同數(shù)據(jù)集上的評(píng)價(jià)指標(biāo)結(jié)果如表2所示。
由表可知,BERT-TCN-LSTM模型的表現(xiàn)最好,其預(yù)測(cè)準(zhǔn)確性最高,在表2結(jié)果中表明,相較之下,LSTM模型的各項(xiàng)指標(biāo)均為最差,這在一定程度上突顯了TCN模型的優(yōu)勢(shì)。TCN模型相較于LSTM模型,在評(píng)價(jià)指標(biāo)MAE、MSE、RMSE以及MAPE上的數(shù)值均更小,這可能是由于TCN模型的主要結(jié)構(gòu)——1DFCN與空洞因果卷積的結(jié)合,使其能夠并行處理輸入序列的不同部分,從而提高了預(yù)測(cè)精度。此外,當(dāng)考慮情緒指標(biāo)時(shí),模型的性能普遍優(yōu)于未考慮情緒指標(biāo)的相同模型。這一觀察結(jié)果表明,情緒指標(biāo)的引入對(duì)于模型的預(yù)測(cè)結(jié)果具有一定的積極影響。最后,BERT-TCN-LSTM模型在預(yù)測(cè)準(zhǔn)確性方面表現(xiàn)優(yōu)異,其優(yōu)勢(shì)在于結(jié)合了TCN和LSTM的特點(diǎn),同時(shí)情緒指標(biāo)的引入可以進(jìn)一步提高模型的預(yù)測(cè)性能。
2.3 個(gè)股實(shí)驗(yàn)結(jié)果
由于個(gè)股反應(yīng)的是特定上市公司的經(jīng)營(yíng)狀況和基本面信息,與影響股指的因素不同,為了更深入地驗(yàn)證模型的魯棒性和普適性,本文選擇2016年1月1日至2023年1月1日七年的平安銀行(000001.sh)、五糧液(000858.sz)、伊利股份(600887.sh)和長(zhǎng)江電力(600900.sz)的歷史交易數(shù)據(jù)、技術(shù)指標(biāo)和相關(guān)股吧總共90萬(wàn)條股評(píng)作為數(shù)據(jù)集,并使用TCN、CNN-LSTM和LSTM以及考慮情緒指標(biāo)的BERT-TCN(BT)、BERT-CNN-LSTM(BCL)和BERT-LSTM(BL)作為對(duì)比模型進(jìn)行對(duì)比實(shí)驗(yàn),各個(gè)模型在不同數(shù)據(jù)集上的評(píng)價(jià)指標(biāo)結(jié)果如表3所示。
由表3可知,在四支個(gè)股的數(shù)據(jù)中,BERT-TCN-LSTM模型的各項(xiàng)指標(biāo)均優(yōu)于TCN、CNN-LSTM和LSTM模型以及考慮情緒指標(biāo)的BERT-TCN、BERT-CNN-LSTM和BERT-LSTM模型,其優(yōu)越性和魯棒性均得到了驗(yàn)證。因此,通過個(gè)股以及股指的預(yù)測(cè)實(shí)驗(yàn)結(jié)果表明,本文提出的BERT-TCN-LSTM模型對(duì)于提高投資者收益、降低投資中存在風(fēng)險(xiǎn)能夠提供重要幫助作用。
3 結(jié) 論
本文提出的基于情感分析的金融市場(chǎng)趨勢(shì)預(yù)測(cè)模型TCN-LSTM,通過BERT-base-Chinese對(duì)評(píng)論文本進(jìn)行情緒分類,將情緒劃分為0或1,按日為單位通過對(duì)數(shù)平均的方法得出每日的情感均值。再使用TCN-LSTM模型進(jìn)行股價(jià)預(yù)測(cè)。本文使用了滬深300股指的三年數(shù)據(jù)以及平安銀行、五糧液、樂普醫(yī)療、億緯鋰能、伊利股份和長(zhǎng)江電力這六支個(gè)股的五年數(shù)據(jù)進(jìn)行試驗(yàn),并與LSTM、TCN和CNN-LSTM模型進(jìn)行了性能比較。結(jié)果表明,在優(yōu)化改進(jìn)后的模型性能方面,該模型具有更好的表現(xiàn)。本文所提出的模型在股價(jià)預(yù)測(cè)上具有較高的精度,可以為市場(chǎng)中的參與者的決策提供一個(gè)有效的參考依據(jù)。同時(shí),輿論情緒值與股價(jià)的結(jié)合對(duì)相關(guān)價(jià)差機(jī)構(gòu)也具有一定的參考價(jià)值。
未來(lái)的研究計(jì)劃引入更多相關(guān)數(shù)據(jù),如基本面數(shù)據(jù)、相關(guān)公司股價(jià)數(shù)據(jù)等,以進(jìn)一步提升模型性能。此外,還將探索研究更適合金融文本處理的自然語(yǔ)言處理方法,并嘗試在不同時(shí)間長(zhǎng)度的金融相關(guān)文本上提取情感值作為模型輸入,同時(shí)進(jìn)一步改進(jìn)模型,以提升模型的預(yù)測(cè)精度。
參考文獻(xiàn):
[1] 苗怡霖.基于投資者情緒視角的不同行業(yè)股價(jià)波動(dòng)實(shí)證研究 [J].投資與合作,2023(6):41-43.
[2] 陳凱杰,唐振鵬,吳俊傳,等.基于分解-集成和混頻數(shù)據(jù)采樣的中國(guó)股票市場(chǎng)預(yù)測(cè)研究 [J].系統(tǒng)工程理論與實(shí)踐,2022,42(11):3105-3120.
[3] HOCHREITER S,SCHMIDHUBER J. Long Short-Term Memory [J].Neural Computation,1997,9(8):1735-1780.
[4] CHEN K,ZHOU Y,DAI F Y. A LSTM-based Method for Stock Returns Prediction:A Case Study of China Stock Market [C]//2015 IEEE International Conference on Big Data (Big Data).Santa Clara:IEEE,2015:2823-2824.
[5] FISCHER T,KRAUSS C. Deep Learning with Long Short-term Memory Networks for Financial Market Predictions [J].European Journal of Operational Research,2018,270(2):654-669.
[6] KIM T,KIM H Y. Forecasting Stock Prices with a Feature Fusion LSTM-CNN Model Using Different Representations of the Same Data [J/OL].PLoS ONE,2019,14(2):e0212320[2024-01-20].https://doi.org/10.1371/journal.pone.0212320.
[7] ALDHYANI T H H,ALZAHRANI A. Framework for Predicting and Modeling Stock Market Prices Based on Deep Learning Algorithms [J/OL].Electronics,2022,11(19):3149[2024-01-20].https://doi.org/10.3390/electronics11193149.
[8] 叢敬奇,成鵬飛,趙振軍.基于CEEMD-CNN-LSTM的股票指數(shù)集成預(yù)測(cè)模型 [J].系統(tǒng)工程,2023,41(4):104-116.
[9] 耿晶晶,劉玉敏,李洋,等.基于CNN-LSTM的股票指數(shù)預(yù)測(cè)模型 [J].統(tǒng)計(jì)與決策,2021,37(5):134-138.
[10] BAI S J,KOLTER J Z,KOLTUN V. An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling [J/OL].arXiv:1803.01271 [cs.LG].[2024-01-26].https://arxiv.org/abs/1803.01271.
[11] AFFUSO E,LAHTINEN K D. Social media sentiment and market behavior [J].Empirical Economics,2019,57(1):105-127.
[12]黃創(chuàng)霞,溫石剛,楊鑫,等.個(gè)體投資者情緒與股票價(jià)格行為的互動(dòng)關(guān)系研究[J].中國(guó)管理科學(xué),2020,28(3):191-200.
[13]郭玲,徐青山,鄭樂.基于TCN-GRU模型的短期負(fù)荷預(yù)測(cè)方法[J].電力工程技術(shù),2021,40(3):66-71.
DOI:10.19850/j.cnki.2096-4706.2024.17.013
作者簡(jiǎn)介:張庭溢(1982.08—),男,漢族,福建莆田人,副教授,博士,研究方向:量化投資與機(jī)器學(xué)習(xí);通迅作者:黃禮欽(1997.02—),男,漢族,浙江紹興人,碩士研究生在讀,研究方向:區(qū)塊鏈與智慧管理、量化投資與機(jī)器學(xué)習(xí);陳香香(1996.06—),女,漢族,安徽蕪湖人,碩士研究生在讀,研究方向:區(qū)塊鏈與智慧管理、量化投資與機(jī)器學(xué)習(xí)。
收稿日期:2024-03-07
基金項(xiàng)目:國(guó)家社科規(guī)劃基金一般項(xiàng)目(22BGL007)
TCN-LSTM Stock Price Prediction Based on Sentiment Analysis
ZHANG Tingyi1, HUANG Liqin2, CHEN Xiangxiang2
(1.School of Management, Fujian University of Technology, Fuzhou 350118, China;
2.School of Internet Economics and Business, Fujian University of Technology, Fuzhou 350011, China)
Abstract: In view of the fact that traditional stock price prediction models do not consider the impact of market investor sentiment on stock prices and are difficult to handle stock price prediction tasks, a time series Deep Learning model BERT-TCN-LSTM that integrates sentiment features is proposed. Firstly, sentiment analysis is performed on investor comments crawled from stock bars, and the average value of daily sentiment is extracted as the input of the model. Secondly, the TCN-LSTM model constructed by the daily sentiment average and stock price data and technical indicators is trained. Finally, experiments are conducted on the data sets of CSI 300 and four individual stock data. The results show that compared with the Temporal Convolutional Network (TCN), LSTM and CNN-LSTM, the Mean Absolute Error (MAE) of BERT-TCN-LSTM on the CSI 300 data set is reduced by an average of 54%. The BERT-TCN-LSTM model can effectively improve the accuracy of stock price prediction.
Keywords: time series prediction; sentiment analysis; Temporal Convolutional Networks; Long Short-Term Memory