国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于BiGRU和殘差圖注意力網(wǎng)絡(luò)的股票價(jià)格預(yù)測(cè)模型

2024-03-07 01:33:30徐渺王雷春史含笑陳敏劉丹妮
關(guān)鍵詞:股票價(jià)格時(shí)序特征提取

徐渺,王雷春,史含笑,陳敏,劉丹妮

(湖北大學(xué)計(jì)算機(jī)與信息工程學(xué)院,湖北 武漢 430062)

0 引言

股票市場(chǎng)是市場(chǎng)經(jīng)濟(jì)的關(guān)鍵組成部分,對(duì)國(guó)家經(jīng)濟(jì)的穩(wěn)定運(yùn)行和健康發(fā)展具有重要的作用。隨著股票交易的廣泛普及,各種交易數(shù)據(jù)及衍生的技術(shù)指標(biāo)被用于股市預(yù)測(cè);特別是對(duì)股票價(jià)格的預(yù)測(cè),得到了學(xué)者和投資者的廣泛關(guān)注,成為金融領(lǐng)域的一個(gè)關(guān)注焦點(diǎn)和研究熱點(diǎn)[1]。股票價(jià)格走勢(shì)是一種非線性、非穩(wěn)定的時(shí)間序列,不但有其自身規(guī)律,還受到文化、心理、政策等因素的影響,存在著明顯的非理性特征[2-3]。目前,股票價(jià)格的預(yù)測(cè)方法一般可分為三類:傳統(tǒng)方法、機(jī)器學(xué)習(xí)方法和深度學(xué)習(xí)方法。

傳統(tǒng)方法通常利用統(tǒng)計(jì)學(xué)、經(jīng)濟(jì)學(xué)等方法對(duì)股票交易的特征和技術(shù)指標(biāo)進(jìn)行建模以預(yù)測(cè)股票價(jià)格。典型的方法包括自回歸移動(dòng)平均法[4]、差分整合移動(dòng)平均自回歸法[5]、廣義自回歸條件異方差方法[6]等。股價(jià)的不平穩(wěn)、非線性[7]等特點(diǎn)導(dǎo)致傳統(tǒng)方法在股票價(jià)格預(yù)測(cè)方面存在著較大的不足。

機(jī)器學(xué)習(xí)方法從股票中選擇能夠表征股票關(guān)鍵信息的特征,使用支持向量機(jī)(support vector machine,SVM)[8]、多層感知器(multilayer perceptron,MLP)[9]、隨機(jī)森林(random forest)[10]和支持向量回歸(support vector regression,SVR)[11]等方法對(duì)其建模,對(duì)未來(lái)的股票價(jià)格進(jìn)行預(yù)測(cè)。機(jī)器學(xué)習(xí)方法要求人工選擇和處理股票特征,工作量大,對(duì)具有時(shí)間性、非線性等特點(diǎn)的股票價(jià)格預(yù)測(cè)效果并不理想。

深度學(xué)習(xí)方法將循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)[12]、長(zhǎng)短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)[13]和門控循環(huán)單元 (gated recurrent unit,GRU)[14]等深度學(xué)習(xí)網(wǎng)絡(luò)引入,對(duì)股票歷史交易數(shù)據(jù)進(jìn)行建模,預(yù)測(cè)股票未來(lái)的價(jià)格。例如,文獻(xiàn)[15]將LSTM和卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)融合構(gòu)成(CNN-LSTM)模型,使用CNN提取原始股票數(shù)據(jù)的深度特征,使用LSTM來(lái)挖掘股票長(zhǎng)期時(shí)間序列特征。深度學(xué)習(xí)方法傾向于將股票交易數(shù)據(jù)作為時(shí)間序列,使用循環(huán)神經(jīng)網(wǎng)絡(luò)及變體對(duì)其進(jìn)行處理,但對(duì)不同股票之間的關(guān)聯(lián)特性還缺乏有效的挖掘。

近年來(lái),圖神經(jīng)網(wǎng)絡(luò)(graph neural network,GNN)[16-17]在交通流量預(yù)測(cè)[18-19]和電力負(fù)荷預(yù)測(cè)[20-21]等領(lǐng)域取得較好的研究效果,一些學(xué)者將GNN引入金融領(lǐng)域?qū)善眱r(jià)格進(jìn)行預(yù)測(cè)。文獻(xiàn)[22]中的研究結(jié)果表明了股票市場(chǎng)預(yù)測(cè)和圖神經(jīng)網(wǎng)絡(luò)結(jié)合的有效性。文獻(xiàn)[23]中利用維基百科的行業(yè)關(guān)系數(shù)據(jù)對(duì)股票市場(chǎng)靜態(tài)建模后進(jìn)行股票預(yù)測(cè)。然而,如何有效挖掘和融合不同股票之間的關(guān)聯(lián)特征和時(shí)序特征,還需要進(jìn)一步的研究。

總結(jié)以上研究的局限性,主要包括三個(gè)方面:1)現(xiàn)有文獻(xiàn)大多從靜態(tài)角度挖掘不同股票之間的關(guān)聯(lián)關(guān)系,對(duì)股票之間的關(guān)聯(lián)關(guān)系隨時(shí)間變化而動(dòng)態(tài)變化的特性缺乏足夠的考慮;2)沒有深入研究不同特征對(duì)股票之間關(guān)聯(lián)關(guān)系的不同影響;3)未能將股票之間的關(guān)聯(lián)特征和股票序列的時(shí)序特征進(jìn)行有效融合。為了克服現(xiàn)有工作的局限性,本研究提出一種基于雙向門控循環(huán)單元(bidirectional gated recurrent unit, BiGRU)和殘差圖神經(jīng)網(wǎng)絡(luò)(graph attention network with residua,ResGAT)的股票價(jià)格預(yù)測(cè)模型(stock price prediction model based on BiGRU and ResGAT,BiGRU-ResGAT),主要工作如下:1)通過一種新的結(jié)合注意力機(jī)制的時(shí)間滑動(dòng)窗口方法動(dòng)態(tài)獲取不同股票之間的關(guān)聯(lián)關(guān)系,構(gòu)建股票圖結(jié)構(gòu);2)使用多重BiGRU[24]提取股票數(shù)據(jù)的時(shí)序特征,學(xué)習(xí)股票數(shù)據(jù)的上下文信息;3)采用帶殘差(Residual)[25]的圖注意力網(wǎng)絡(luò)GAT[26](ResGAT)對(duì)不同維度的股票特征進(jìn)行融合,充分挖掘股票數(shù)據(jù)的深層語(yǔ)義信息,對(duì)股票價(jià)格進(jìn)行預(yù)測(cè)。

1 問題描述

股票價(jià)格預(yù)測(cè)目的是根據(jù)股票歷史數(shù)據(jù)建立模型,提取股票的強(qiáng)表征信息,對(duì)股票未來(lái)的價(jià)格進(jìn)行預(yù)測(cè)。本文股票價(jià)格預(yù)測(cè)的思路是采用時(shí)間滑動(dòng)窗口的方法,對(duì)指定窗口長(zhǎng)度范圍內(nèi)的股票數(shù)據(jù)進(jìn)行學(xué)習(xí),預(yù)測(cè)未來(lái)一個(gè)交易日的股票價(jià)格(指股票收盤價(jià)格Close)。

1.1 股票數(shù)據(jù)定義

(1)

1.2 股票圖定義

(2)

其中:ξ表示轉(zhuǎn)換函數(shù),功能是將股票數(shù)據(jù)轉(zhuǎn)換為股票圖結(jié)構(gòu)。

H=ψ({Dt-L+1,Dt-L+2,…,Dt})

(3)

其中:ψ表示提取函數(shù),功能是從股票序列中提取時(shí)序特征。

假定股票數(shù)據(jù)特征融合模型為φ,則股票數(shù)據(jù)的融合特征MH可通過式(4)得到:

MH=φ(A,H)

(4)

(5)

2 模型框架

2.1 模型概述

股票價(jià)格預(yù)測(cè)模型BiGRU-ResGAT是對(duì)股票數(shù)據(jù)的縱向時(shí)間特征和橫向關(guān)聯(lián)特征建模,挖掘股票數(shù)據(jù)中的關(guān)鍵信息,從而實(shí)現(xiàn)準(zhǔn)確的股票價(jià)格預(yù)測(cè)(見圖1)。

圖1 BiGRU-ResGAT框架

如圖1所示,BiGRU-ResGAT模型主要包含四個(gè)部分:股票圖構(gòu)建層、時(shí)序特征提取層、關(guān)聯(lián)特征提取與融合層和股價(jià)預(yù)測(cè)層。其中,股票圖構(gòu)建層通過一種結(jié)合注意力機(jī)制的時(shí)間滑動(dòng)窗口(time sliding window method combining attention mechanism,TSWMCAM)方法挖掘不同股票之間的關(guān)聯(lián)關(guān)系構(gòu)建股票圖結(jié)構(gòu);時(shí)序特征提取層使用由BiGRU組成的時(shí)序特征組件從股票序列中提取時(shí)序特征;關(guān)聯(lián)特征提取與融合層利用ResGAT提取關(guān)聯(lián)特征后與股票時(shí)序特征進(jìn)行融合;股價(jià)預(yù)測(cè)層則使用融合后的股票特征對(duì)未來(lái)一個(gè)交易日的股票價(jià)格進(jìn)行預(yù)測(cè)。

2.2 股票圖構(gòu)建層

股票數(shù)據(jù)是一個(gè)不包含股票序列間關(guān)聯(lián)關(guān)系的多維時(shí)間序列,無(wú)法被圖網(wǎng)絡(luò)直接處理。因此,對(duì)股票數(shù)據(jù)進(jìn)行建模,構(gòu)造股票圖結(jié)構(gòu)G=(V,E,F,A),如圖2所示。

圖2 股票圖構(gòu)建

在股票圖G中,不同股票間的關(guān)聯(lián)關(guān)系信息由特征矩陣F和鄰接矩陣A組成。股票圖的特征矩陣F∈RL×N×K,由模型選取的股票指標(biāo)參數(shù)構(gòu)成,包括:6個(gè)日線行情指標(biāo),即開盤價(jià)(Open)、最高價(jià)(High)、最低價(jià)(Low)、收盤價(jià)(Close)、成交量(Volume)和成交額(Amount);4個(gè)技術(shù)指標(biāo),即5日移動(dòng)平均線(MA5)、10日移動(dòng)平均線(MA10)、20日移動(dòng)平均線(MA20)和30日移動(dòng)平均線(MA30)。

在股票市場(chǎng)中,股票的關(guān)聯(lián)關(guān)系可能隨著時(shí)間的推移不斷變化,且股票的不同特征對(duì)于股票之間關(guān)聯(lián)關(guān)系的重要性也不相同。因此,在文獻(xiàn)[27]基礎(chǔ)上,提出一種結(jié)合注意力機(jī)制的時(shí)間滑動(dòng)窗口方法動(dòng)態(tài)計(jì)算股票之間的關(guān)聯(lián)特性。具體步驟如下:

1)使用最小-最大規(guī)范化方法將股票在時(shí)間滑動(dòng)窗口長(zhǎng)度為L(zhǎng)的特征矩陣F∈RL×N×K中不同數(shù)據(jù)的特征值進(jìn)行歸一化,方法如式(6)所示:

(6)

其中:x′表示歸一化的數(shù)據(jù);x表示原始數(shù)據(jù);xmax和xmin分別表示該維數(shù)據(jù)的最大值和最小值。

Ci=Fi?Watt

(7)

3)計(jì)算股票i和j之間在L內(nèi)的關(guān)聯(lián)系數(shù)ρij,如式(8)所示:

(8)

4)確定股票i和j之間在L內(nèi)的關(guān)聯(lián)關(guān)系,通過鄰接矩陣A=(aij)表示,如式(9)所示。

(9)

其中:θ表示事先設(shè)定的閾值。

2.3 時(shí)序特征提取層

為了解決股票序列的時(shí)間距離依賴問題,BiGRU-ResGAT采用由BiGRU組成的時(shí)序特征層提取股票數(shù)據(jù)的時(shí)序特征。通過BiGRU門控機(jī)制控制股票的輸入與記憶等信息,能夠循環(huán)神經(jīng)網(wǎng)絡(luò)的梯度消失問題,簡(jiǎn)化長(zhǎng)短期記憶單元的計(jì)算機(jī)制,從而提高股票預(yù)測(cè)的效率和精度(見圖1)。

由圖1可知,股票序列的時(shí)序特征由時(shí)序特征提取層的時(shí)序特征組件提取。一個(gè)時(shí)序特征組件包括若干時(shí)序特征單元,每個(gè)時(shí)序特征單元由多重BiGRU組成,負(fù)責(zé)提取一支股票的時(shí)序特征。時(shí)序特征提取單元的結(jié)構(gòu)如圖3所示。由圖3可知,一只股票的時(shí)序特征包括正向時(shí)序特征和反向時(shí)序特征,分別由正向GRU和反向GRU提取。

圖3 時(shí)序特征單元

GRU提取一個(gè)時(shí)間滑動(dòng)窗口內(nèi)第i支股票序列時(shí)序特征的步驟如下:

(10)

其中:Wz和Uz分別為更新門中時(shí)序特征和上一交易日隱藏狀態(tài)的權(quán)重矩陣,bz為偏置值,σ表示Sigmoid激活函數(shù)。

(11)

其中:Wr和Ur分別為重置門對(duì)時(shí)序特征和上一交易日隱藏狀態(tài)門中的權(quán)重矩陣,br為偏置值。

(12)

其中:Wh和Uh分別為新記憶狀態(tài)計(jì)算中重置門對(duì)時(shí)序特征和上一交易日股票隱藏狀態(tài)的權(quán)重矩陣,bh為偏置值,⊙表示向量間的點(diǎn)乘,用于計(jì)算不同交易日股票信息的殘留情況;tanh表示激活函數(shù)。

(13)

2.4 關(guān)聯(lián)特征提取與融合層

為了充分挖掘和利用股票的不同特征,BiGRU-ResGAT在關(guān)聯(lián)特征提取與融合層采用ResGAT對(duì)股票之間的關(guān)聯(lián)特征進(jìn)行深度挖掘后再與股票序列的時(shí)序特征進(jìn)行融合,如圖4所示。

圖4 關(guān)聯(lián)特征提取與融合層

該層的輸入為股票圖G的鄰接矩陣A和股票序列的時(shí)序特征H∈RN×K;輸出為融合特征MH∈RN×2K。

首先,將股票圖G的鄰接矩陣A和股票序列的時(shí)序特征H使用多重ResGAT進(jìn)行處理,獲得關(guān)聯(lián)特征M∈RN×K。上一重ResGAT的特征輸出為下一重ResGAT的輸入,過程如式(14)~(16)所示:

M1=ResGAT(A,H)

(14)

M2=ResGAT(A,M1)

(15)

M3=ResGAT(A,M2)

(16)

其中:Mi(i=1,2,3)表示第i重ResGAT的輸出。

然后,對(duì)關(guān)聯(lián)特征Mi(i=1,2,3)進(jìn)行算術(shù)運(yùn)算處理,并送入下一重ResGAT處理,過程如式(17)~(18)所示:

(17)

Mout=ResGAT(A,Mave)

(18)

其中:Mave為Mi(i=1,2,3)算術(shù)運(yùn)算處理的結(jié)果;Mout為最后一重ResGAT的輸出。

以第2重ResGAT為例(輸入為M1,輸出為M2),其更新關(guān)聯(lián)特征M∈RN×K分為兩個(gè)階段。

階段1:GAT計(jì)算特征。

1)計(jì)算股票節(jié)點(diǎn)vi的一階鄰居股票節(jié)點(diǎn)vij對(duì)vi的注意力系數(shù)βij,計(jì)算方法如式(19)所示:

(19)

2)根據(jù)注意力系數(shù)βij可計(jì)算歸一化權(quán)重系數(shù)αij,計(jì)算方法如式(20)所示:

(20)

其中:LeakyReLu表示激活函數(shù),Si表示節(jié)點(diǎn)vi的一階鄰接節(jié)點(diǎn)的編號(hào)集合。

(21)

其中:Wα表示權(quán)重矩陣;ReLu表示激活函數(shù)。

階段2:殘差連接。

將階段1的輸入M1和經(jīng)過GAT后輸出進(jìn)行連接得到最終ResGAT的輸出M2,其過程如式(22)所示:

M2=GAT(A,M1)+M1

(22)

將時(shí)序特征H和深度關(guān)聯(lián)特征Mout進(jìn)行融合,得到融合后的特征MH,如式(23)所示:

MH=Concat(Mout,H)

(23)

其中:Concat表示特征融合函數(shù)。

2.5 股價(jià)預(yù)測(cè)層

(24)

其中:Wpre表示維度變換參數(shù)矩陣;FC表示全連接函數(shù)。

2.6 股票價(jià)格預(yù)測(cè)算法流程

本研究提出的BiGRU-ResGAT模型通過TSWMCAM方法構(gòu)建股票關(guān)系圖,解決了不同股票之間的動(dòng)態(tài)關(guān)聯(lián)特性問題;采用BiGRU提取股票序列過去和未來(lái)的時(shí)序特征信息,解決了股票序列的時(shí)序距離長(zhǎng)依賴問題;同時(shí),使用ResGAT對(duì)股票之間的關(guān)聯(lián)特征進(jìn)行深度挖掘,再與股票時(shí)序特征進(jìn)行融合,最后對(duì)股票未來(lái)價(jià)格進(jìn)行有效的預(yù)測(cè)。BiGRU-ResGAT的算法流程如算法1所示。

算法1 BiGRU-ResGAT股票價(jià)格預(yù)測(cè)輸入:股票數(shù)據(jù)集D={D1,D2,…,DT}輸出:預(yù)測(cè)的股票價(jià)格Y^t+1FOREACHCj∈{C1,C2,…,CN}:ρij=Corr(Ci,Cj)aij←ρijENDFORFOREACHDi∈{D1,D2,…,DN}://計(jì)算時(shí)序特征h?it=Bi-GRUs({Dit-L+1,Dit-L+2,…,Dit})ENDFORFOREACHi∈{1,2,3}://計(jì)算中間關(guān)聯(lián)特征Mi=ResGAT(A,Mi-1)//M0=HENDFORMave=Ave(A,Mi)(i=1,2,3)//多層ResGAT平均值Mout=ResGAT(A,Mave)//最后一層ResGAT輸出MH=Concat(Mout,H)//特征融合Y^t+1=BiGRU-ResGAT(MH)//股票價(jià)格預(yù)測(cè)RETURNY^t+1//返回股票的預(yù)測(cè)價(jià)格

3 實(shí)驗(yàn)與結(jié)果分析

3.1 數(shù)據(jù)集與實(shí)驗(yàn)設(shè)置

實(shí)驗(yàn)數(shù)據(jù)來(lái)源于公開的財(cái)經(jīng)數(shù)據(jù)接口Tushare(https://www.tushare.pro/),選取上海證券交易所主板市場(chǎng)498支股票在2017年1月1日至2021年12月31日的股票交易數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)集(簡(jiǎn)稱股票數(shù)據(jù)集)。在實(shí)驗(yàn)中,將數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,如表1所示。

表1 股票數(shù)據(jù)集劃分

實(shí)驗(yàn)?zāi)P筒捎肞ython編程語(yǔ)言、PyTorch深度學(xué)習(xí)框架和PyTorch Geometric圖神經(jīng)網(wǎng)絡(luò)庫(kù)(簡(jiǎn)稱PyG)實(shí)現(xiàn)。在訓(xùn)練過程中,學(xué)習(xí)率設(shè)置為0.001,epoch 設(shè)置為200,batch size設(shè)置為32,采用Adam優(yōu)化器。時(shí)間滑動(dòng)窗口長(zhǎng)度設(shè)置為16。所有實(shí)驗(yàn)均在具有16GB RAM的單個(gè)NVIDIA Quadro RTX 5000上進(jìn)行。

3.2 模型評(píng)價(jià)指標(biāo)

本文中選用平均絕對(duì)誤差(mean absolute error,MAE)、均方根誤差(root mean squared error,RMSE)和決定系數(shù)(Rsquared,R2)對(duì)模型的預(yù)測(cè)性能進(jìn)行評(píng)估,如式(25)~(27)所示:

(25)

(26)

(27)

3.3 結(jié)果及分析

3.3.1 消融實(shí)驗(yàn)

為了驗(yàn)證BiGRU-ResGAT的有效性,分別對(duì)關(guān)鍵模塊和關(guān)系系數(shù)計(jì)算方法進(jìn)行消融實(shí)驗(yàn)。

1)模塊消融

首先,時(shí)序特征層的提取模型LSTM和關(guān)聯(lián)特征提取與融合層的提取模型GCN作為基線模型(LSTM-GCN)。然后,在基線模型的基礎(chǔ)上進(jìn)行改進(jìn)得到3組消融實(shí)驗(yàn):將時(shí)序特征提取層的LSTM模型改進(jìn)為BiGRU模型(BiGRU-GCN)、將關(guān)聯(lián)特征提取與融合層的關(guān)聯(lián)關(guān)系提取模型GCN改進(jìn)為GAT(LSTM-GAT),同時(shí)將LSTM與GCN模型替換為BiGRU與GAT (BiGRU-GAT)。最后,再將ResNet網(wǎng)絡(luò)結(jié)構(gòu)引入得到4組不同的消融實(shí)驗(yàn):LSTM-ResGCN、BiGRU-ResGCN、LSTM-ResGAT和BiGRU-ResGAT。實(shí)驗(yàn)結(jié)果如表2所示。

表2 模塊消融實(shí)驗(yàn)結(jié)果對(duì)比

由表2可知,在所有的模型中,LSTM結(jié)合圖卷積網(wǎng)絡(luò)模型的效果最差;將圖卷積網(wǎng)絡(luò)改進(jìn)為圖注意力網(wǎng)絡(luò)后,模型預(yù)測(cè)效果明顯提升,這說明股票間的影響程度是不同的。在加深模型網(wǎng)絡(luò)結(jié)構(gòu)的同時(shí)引入殘差網(wǎng)絡(luò),深層提取股票關(guān)聯(lián)特征信息,在預(yù)測(cè)效果上也取得了較好的表現(xiàn)。將LSTM改進(jìn)為BiGRU,通過雙向提取股票歷史特征信息,再融合殘差圖注意力網(wǎng)絡(luò)得到最終的BiGRU-ResGAT模型,在預(yù)測(cè)效果上均優(yōu)于其他融合模型。

2)關(guān)聯(lián)系數(shù)計(jì)算方法對(duì)比

為了驗(yàn)證模型中TSWMCAM在構(gòu)建股票圖時(shí)的有效性,實(shí)驗(yàn)將其和全連接(FCs)、皮爾遜系數(shù)(Pearson)、行業(yè)關(guān)系(Industry)和無(wú)滑動(dòng)窗口的注意力關(guān)聯(lián)系數(shù)(ACCM)等方法構(gòu)建鄰接矩陣的效果進(jìn)行對(duì)比實(shí)驗(yàn)(見表3)。

表3 不同方法生成鄰接矩陣對(duì)比

由表3可知,全連接方法將所有股票進(jìn)行連接,引入了大量的“噪音股票”,預(yù)測(cè)誤差大,導(dǎo)致模型預(yù)測(cè)性能大幅下降;皮爾遜關(guān)聯(lián)系數(shù)方法在構(gòu)建鄰接矩陣時(shí)僅考慮股票收盤價(jià)格,影響了模型預(yù)測(cè)效果;行業(yè)關(guān)系方法靜態(tài)構(gòu)圖并未考慮股票特征信息,效果欠佳;采用基于注意力機(jī)制的關(guān)聯(lián)系數(shù)方法利用了股票特征信息,但未考慮股票的動(dòng)態(tài)關(guān)聯(lián)特性;TSWMCAM方法綜合考慮了股票所有的特征信息和動(dòng)態(tài)關(guān)聯(lián)特性的,股票預(yù)測(cè)效果優(yōu)良。

3.3.2 模型參數(shù)實(shí)驗(yàn)

實(shí)驗(yàn)通過控制變量法,對(duì)比不同閾值θ、BiGRU層數(shù)和ResGAT層數(shù)時(shí)BiGRU-ResGAT的MAE、RMSE和R2的變化情況。

1)閾值對(duì)比分析

計(jì)算鄰接矩陣aij的閾值θ是決定股票間是否有關(guān)聯(lián)邊的重要參數(shù),對(duì)股票圖構(gòu)建起著非常關(guān)鍵的作用。閾值θ太低會(huì)引入過多的噪音股票,過高不能反映股票間真實(shí)的關(guān)聯(lián)關(guān)系,都會(huì)導(dǎo)致BiGRU-ResGAT的預(yù)測(cè)誤差變大。由表4可知,當(dāng)閾值θ范圍為0.66~0.70時(shí)誤差最低。

表4 不同閾值取值性能對(duì)比

2)BiGRU層數(shù)對(duì)比分析

模型中的BiGRU能夠提取股票的時(shí)序特征,挖掘上下文股票的特征信息,但過深的BiGRU層數(shù)在訓(xùn)練中會(huì)出現(xiàn)梯度消失、局部收斂等情況。由表5可知,當(dāng)層數(shù)為2時(shí)BiGRU-ResGAT的性能相對(duì)較好。

表5 不同BiGRU層數(shù)性能對(duì)比

3)ResGAT層數(shù)對(duì)比分析

ResGAT能夠聚合股票間關(guān)聯(lián)節(jié)點(diǎn)的特征信息。較少的ResGAT層數(shù)只能提取淺層的股票關(guān)聯(lián)特征信息;層數(shù)增多可以提取更深層的特征信息,但會(huì)導(dǎo)致計(jì)算時(shí)間過長(zhǎng)和過平滑等現(xiàn)象。由表6可知,當(dāng)ResGAT層數(shù)為3時(shí)BiGRU-ResGAT的誤差相對(duì)較低。

表6 不同ResGAT層數(shù)性能對(duì)比

因此,BiGRU-ResGAT最終確定閾值θ為0.68,BiGRU層數(shù)為2,ResGAT層數(shù)為3。

3.3.3 模型性能實(shí)驗(yàn)

1)不同模型性能對(duì)比

為了驗(yàn)證BiGRU-ResGAT的性能,實(shí)驗(yàn)對(duì)測(cè)試集的498支股票價(jià)格進(jìn)行了預(yù)測(cè),選擇基準(zhǔn)模型SVM[8]、GRU[14]、CNN-LSTM[15]和RSR[23]在MAE、RMSE和R2指標(biāo)上進(jìn)行對(duì)比。實(shí)驗(yàn)結(jié)果如表7所示。

表7 不同模型性能對(duì)比

由表7可知,SVM的MAE、RMSE比其他模型(均為深度學(xué)習(xí)模型)高,R2系數(shù)比其他模型低;在深度學(xué)習(xí)模型中,GRU的MAE、RMSE比其他模型高,R2系數(shù)比其他模型低;BiGRU-ResGAT的MAE、RMSE比最低,R2系數(shù)最高。

實(shí)驗(yàn)結(jié)果表明:深度學(xué)習(xí)模型比機(jī)器學(xué)習(xí)模型具有更好的非線性學(xué)習(xí)能力;通過行業(yè)關(guān)系構(gòu)圖的RSR模型,以靜態(tài)角度挖掘股票之間關(guān)系,在股票價(jià)格預(yù)測(cè)的效果上也相對(duì)較優(yōu);BiGRU-ResGAT通過BiGRU和殘差圖注意力網(wǎng)絡(luò)能夠更好地挖掘和融合股票數(shù)據(jù)的時(shí)序特征、關(guān)聯(lián)特征,極大地降低股票價(jià)格預(yù)測(cè)的誤差。

2)模擬投資組合

為了進(jìn)一步評(píng)價(jià)模型的性能,本文中通過股票的累計(jì)收益率來(lái)評(píng)判不同模型的預(yù)測(cè)能力。累計(jì)收益率的計(jì)算方法如式(28)所示:

(28)

其中:profitt0表示初始交易日t0的總資產(chǎn),profitt表示交易日t的總資產(chǎn),Rt表示交易日t的累計(jì)收益率。

圖5 股票投資收益曲線

由圖5可知,不同模型在幾只股票上的累計(jì)收益率都隨著股票價(jià)格的波動(dòng)而波動(dòng)。在模擬交易期間,SVM和GRU在幾支股票的累計(jì)收益率表現(xiàn)相似,處于圖形的下方;與SVM相比,GRU在幾支股票的最終收益率要高一些。CNN-LSTM、RSR和BiGRU-ResGAT在整個(gè)交易期間的累計(jì)收益率表現(xiàn)更好,最終收益率更高;但BiGRU-ResGAT在幾支股票的累計(jì)收益率表現(xiàn)最好,最終累計(jì)收益率也最高(特別是600761.SH股票)。

圖6顯示了各模型在整個(gè)股票數(shù)據(jù)集上的的最終投資收益率。由圖6可知,SVM的最終收益率最低,BiGRU-ResGAT的最終收益率最高。BiGRU-ResGAT的最終收益率分別比SVM、GRU、CNN-LSTM和RSR高出10.77、7.89、6.81、5.03個(gè)百分點(diǎn)。

圖6 投資總收益結(jié)果

BiGRU-ResGAT比其他模型具有更好投資收益率的原因是BiGRU-ResGAT能夠有效地提取和融合股票數(shù)據(jù)的時(shí)序特征和關(guān)聯(lián)特征,準(zhǔn)確地預(yù)測(cè)股票上漲和下跌時(shí)間,從而買入或賣出股票,給股民帶來(lái)較好的投資收益率,降低投資風(fēng)險(xiǎn);其他模型不能很好地提取和挖掘股票數(shù)據(jù)的關(guān)鍵特征,在股票價(jià)格預(yù)測(cè)上存在較大的誤差,導(dǎo)致投資收益率下降。

4 結(jié)語(yǔ)

本研究提出了基于BiGRU和ResGAT的股票價(jià)格預(yù)測(cè)模型BiGRU-ResGAT,該模型通過TSWMCAM動(dòng)態(tài)獲取股票之間的關(guān)聯(lián)特征并構(gòu)建股票圖結(jié)構(gòu),使用BiGRU提取股票序列的時(shí)序特征,然后利用ResGAT對(duì)股票之間的關(guān)聯(lián)特征和股票序列的時(shí)序特征進(jìn)行深度挖掘和融合,對(duì)未來(lái)一個(gè)交易日的股票價(jià)格進(jìn)行預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,BiGRU-ResGAT能夠同時(shí)挖掘和融合股票序列的時(shí)序特征和股票之間的關(guān)聯(lián)特征,解決股票價(jià)格預(yù)測(cè)的橫向特征關(guān)聯(lián)問題和縱向時(shí)間依賴問題,對(duì)股票價(jià)格進(jìn)行有效的預(yù)測(cè)。在今后的工作中,將繼續(xù)優(yōu)化BiGRU-ResGAT以提高模型的預(yù)測(cè)結(jié)果,并進(jìn)一步探討所提模型在基金、債券及其他領(lǐng)域的預(yù)測(cè)性能。

猜你喜歡
股票價(jià)格時(shí)序特征提取
基于時(shí)序Sentinel-2數(shù)據(jù)的馬鈴薯遙感識(shí)別研究
基于Sentinel-2時(shí)序NDVI的麥冬識(shí)別研究
基于GARCH族模型的重慶啤酒股票價(jià)格波動(dòng)研究
基于Daubechies(dbN)的飛行器音頻特征提取
電子制作(2018年19期)2018-11-14 02:37:08
Bagging RCSP腦電特征提取算法
一種毫米波放大器時(shí)序直流電源的設(shè)計(jì)
電子制作(2016年15期)2017-01-15 13:39:08
論股票價(jià)格準(zhǔn)確性的社會(huì)效益
我國(guó)股票價(jià)格指數(shù)與“克強(qiáng)指數(shù)”的關(guān)系研究
基于MED和循環(huán)域解調(diào)的多故障特征提取
基于多元回歸與技術(shù)分析的組合股票價(jià)格預(yù)測(cè)
留坝县| 正镶白旗| 宜君县| 云林县| 科尔| 建湖县| 潮安县| 祁连县| 广平县| 运城市| 阿城市| 通许县| 米泉市| 天津市| 紫云| 女性| 南部县| 烟台市| 甘孜县| 乃东县| 郓城县| 辽宁省| 云南省| 枞阳县| 芒康县| 林口县| 丽江市| 辽宁省| 广汉市| 西贡区| 万年县| 白朗县| 新营市| 宁安市| 云阳县| 温泉县| 正定县| 巨鹿县| 纳雍县| 麦盖提县| 佛坪县|