王毓謙
【摘? 要】期貨市場是一個復雜系統(tǒng),其價格數(shù)據(jù)具有非線性、高噪聲等特性,導致其預測難度較高。論文結合深度學習框架下的神經(jīng)網(wǎng)絡模型對選取的滬深300指數(shù)期貨開盤、收盤價數(shù)據(jù)進行分析并預測趨勢,最終得到較高的預測精度。論文表明,深度學習循環(huán)神經(jīng)網(wǎng)絡在期貨價格預測方面有著不錯的表現(xiàn)并且發(fā)展?jié)摿^大。
【Abstract】Futures market is a complex system, and its price data is nonlinear and noisy, which makes it difficult to predict. Combined with the neural network model under the framework of deep learning, this paper analyzes and predicts the trend of the selected opening and closing prices of CSI 300 index futures, and finally obtains a higher prediction accuracy. The paper shows that deep learning recurrent neural network has a good performance in futures price prediction and has great development potential.
【關鍵詞】深度學習;神經(jīng)網(wǎng)絡;長短期記憶;期貨市場;價格預測
【Keywords】deep learning; neural network; long and short-term memory; futures market; price prediction
【中圖分類號】F724.5;TP183? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文獻標志碼】A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文章編號】1673-1069(2021)12-0137-03
1 引言
隨著經(jīng)濟的不斷發(fā)展、理財類產(chǎn)品的不斷宣傳,各種類型的理財產(chǎn)品逐漸在人們的視野中出現(xiàn),對資產(chǎn)進行合理配置,讓錢變得值錢,使得自己擁有的財富能夠在價值上得到最大的提升,引起了我國國民的廣泛關注。在一系列的投資交易方式之中,量化交易脫穎而出,成為新時代的寵兒。量化交易也被稱為算法交易,顧名思義就是依靠預先編寫好的代碼由計算機進行擬合預測,通過預先設計的算法,獲得交易策略的過程。量化交易采用量化模型代替人為的主觀判斷,減少了人為因素帶來的損失。機器學習作為人工智能中的重要發(fā)展領域,現(xiàn)如今發(fā)展很快,得到各界人士的認可。深度學習的概念源于人工神經(jīng)網(wǎng)絡的研究,其希望通過創(chuàng)立神經(jīng)元來模擬人腦的運作機制,從而解釋數(shù)據(jù)并且處理數(shù)據(jù),其特點就是模型結構的深度,通常深度學習構建的神經(jīng)網(wǎng)絡能有較高深度。本文根據(jù)上述背景,進行深度學習神經(jīng)網(wǎng)絡應用在量化交易策略上的研究。
目前學術界已有相關研究,郭朋(2012)第一次在國內提出了量化交易這一概念,并且對國外的研究進行了綜述,從那之后,國內開始了對量化交易的研究。王新華(2017)在其論文之中提出將人工智能運用到金融領域之中,其在論文中提到,金融領域最多的便是數(shù)據(jù),而人工智能則擁有很多處理數(shù)據(jù)的方式,所以人工智能的相關方法可以在這個領域有很多的運用。胡葉帥(2021)在其論文中提到將深度學習運用到量化交易策略之中,深度學習的特點就是將大量的數(shù)據(jù)集帶入設計好的模型之中,在圖像識別領域發(fā)展得很好,但是在處理時序金融數(shù)據(jù)這方面的研究還不是很多。王鑫(2018)將深度學習神經(jīng)網(wǎng)絡中的LSTM循環(huán)神經(jīng)網(wǎng)絡運用到系統(tǒng)故障預測之中,證明了LSTM在時序數(shù)據(jù)方面的可行性。
文章基于研究現(xiàn)狀,以滬深300指數(shù)的主力合約(合約代碼IF9999)為研究對象,通過深度學習神經(jīng)網(wǎng)絡進行數(shù)據(jù)預測,預測出未來合約交易的趨勢,并進行策略研究,結果證明深度學習神經(jīng)網(wǎng)絡在期貨交易價格預測問題方面具有較高的實用性。
2 期貨交易價格數(shù)據(jù)描述
目前資本市場的股票、期貨數(shù)據(jù)獲取渠道相對較多,數(shù)據(jù)的準確度較高,為量化交易行業(yè)研究奠定一個較好的基礎,文章的期貨數(shù)據(jù)主要是通過聚寬(www.joinquant.com)專業(yè)量化投資平臺獲取,獲取的數(shù)據(jù)主要是開盤價(open)、收盤價(close)、最高價(high)、最低價(low)、成交量(volume)以及成交金額(money)6個常見指標。具體數(shù)據(jù)形式如表1所示。
期貨交易市場上午9:00開盤,10:15~10:30,休息15min,11:30收盤。下午13:30開盤,15:00收盤。晚上21:00開盤,23:00收盤。文章考慮到數(shù)據(jù)集的大小問題,選取2019~2021年滬深300指數(shù)主力合約(合約代碼IF9999)的每分鐘數(shù)據(jù)進行研究,原因是滬深300指數(shù)主力合約屬于熱門期貨交易合約,每分鐘的成交量較多,并且成交金額較大,這樣有利于學習模型學習到數(shù)據(jù)趨勢,并且滬深300指數(shù)是國內期貨交易市場的主要合約,具有一定的代表性,從某種方面講具有一定的普適性,在這個合約里能夠預測出的結果在其他的合約上也能夠實現(xiàn)。
文章獲取的數(shù)據(jù)存在大量缺失值以及噪聲數(shù)據(jù),文章使用基本的數(shù)據(jù)處理方式對數(shù)據(jù)進行處理,對于缺失的數(shù)據(jù),我們使用就近原則,取其前一組數(shù)據(jù)以及后一組數(shù)據(jù)的平均值將其補上,使得數(shù)據(jù)的偏差幅度不會過大影響到后面的數(shù)據(jù)預測。對于偏離整體趨勢的數(shù)據(jù)進行刪除并且修正。最后對數(shù)據(jù)進行歸一化處理,并將其做成64個數(shù)據(jù)為1組的batch型數(shù)據(jù)方便導入模型之中使用。
3 神經(jīng)網(wǎng)絡選取以及模型搭建
深度學習之中基礎的線性回歸模型以及卷積神經(jīng)網(wǎng)絡模型一般用于處理數(shù)值信息以及將圖像信息轉化為矩陣模式進行模型迭代計算,而要適配文章所描述的金融時序數(shù)據(jù),需要使用新的模型。數(shù)據(jù)會根據(jù)時間進程而進行相應的變化,所以使用新的神經(jīng)網(wǎng)絡模型:循環(huán)神經(jīng)網(wǎng)絡。
在神經(jīng)網(wǎng)絡模型之中,有一類含有隱藏層的多層感知機。在對于小批量數(shù)據(jù)樣本X∈Rn×d,隱藏層的激活函數(shù)為?準,偏差函數(shù)為b,權重參數(shù)為W,那么隱藏層輸出值H∈Rn×d的計算方法為:H=?準(XWxn+bh)。
最終輸出的結果為:O=HWhq+bq。
一般的多層感知機用于線性回歸模型以及卷積塊模型,是一個靜態(tài)模型,并沒有加入過時間變量,所以需要使用到循環(huán)神經(jīng)網(wǎng)絡,它是通過隱藏狀態(tài)來儲存之前的時間段t內的信息,并且參與到下一次的迭代之中,對下一次迭代的結果造成影響。
現(xiàn)在考慮輸入的數(shù)據(jù)存在時間相關性的情況,輸入的數(shù)據(jù)樣本需要添加一個下標t使之變?yōu)閄t∈Rn×d,其代表在序列之中時間為的時候小批量輸入的數(shù)據(jù)值,另外有Ht表示時間為t的時候的隱藏變量,并且引入新的權重參數(shù)Whh∈Rh×h,其大小表示t-1時間段的數(shù)據(jù)影響t時間數(shù)據(jù)的程度。在這種情況下,隱藏層的隱藏狀態(tài)輸出變化為:
為解決梯度問題、模型效率不高的問題,使用門控循環(huán)神經(jīng)網(wǎng)絡的思路,這種神經(jīng)網(wǎng)絡可以更好地捕捉時間序列之中時間步之間的依賴關系。近年來對于處理時間序列問題,有一類較為熱門的神經(jīng)網(wǎng)絡模型——長短期記憶循環(huán)神經(jīng)網(wǎng)絡模型。
輸入門、遺忘門、輸出門的輸入是當前時間段的輸入Xt以及上一個時間段的隱藏狀態(tài)Ht-1,通過sigmoid函數(shù)作為激活函數(shù)計算得到。假設時間步t的小批量輸入Xt∈Rn×d以及上一個時間步輸出的隱藏狀態(tài)Ht-1∈Rn×h;Wxx與bx為各個門對應的權重參數(shù)以及偏差參數(shù),輸入門It、遺忘門Ft以及輸出門Ot的計算方式如下:
最終每個神經(jīng)元內結構如圖1所示。
以上為文章選取的LSTM模型的原理,本文將以此搭建LSTM神經(jīng)網(wǎng)絡模型,并對上文截取的數(shù)據(jù)進行分析以及研究。
文章在Windows10操作系統(tǒng)下搭建GPU版本的LSTM神經(jīng)網(wǎng)絡,使用python語言作為編譯語言,pytorch包作為搭載。pytorch包具有靈活性高、擴展性強等優(yōu)點,通過繼承父類模型來搭建自定義模型,編寫evaluate函數(shù)對數(shù)據(jù)進行迭代,最終得出權重參數(shù)。文章采用model類,搭建幾種不同的神經(jīng)網(wǎng)絡模型對一支期貨進行收盤價的分析預測,對模型預測準確性使用平方根誤差、平均絕對誤差進行結果對比。
圖2展示了搭建的部分神經(jīng)網(wǎng)絡模型:卷積神經(jīng)網(wǎng)絡、全連接神經(jīng)網(wǎng)絡、長短期記憶神經(jīng)網(wǎng)絡。
4 實驗結果以及分析
根據(jù)上文所構建的模型以及獲取到的數(shù)據(jù),文章基于python語言對長短期記憶神經(jīng)網(wǎng)絡模型進行代碼實現(xiàn),并且將數(shù)據(jù)集以8∶2的比例分為訓練集以及測試集,以方便進行模型的訓練以及數(shù)據(jù)預測。
文章使用滬深300指數(shù)主力合約從2019年9月~2021年9月的每分鐘數(shù)據(jù)進行數(shù)據(jù)預測,共有84864*9個數(shù)據(jù),文章選取期貨數(shù)據(jù)開盤價進行數(shù)據(jù)預測,并且已經(jīng)進行數(shù)據(jù)的預處理(見圖3)。
文章遵循神經(jīng)網(wǎng)絡訓練的基本規(guī)則,按照8∶2的比例進行數(shù)據(jù)集的切分,對2021年2月之前的數(shù)據(jù)歸為一類作為訓練集,將2021年2月之后的數(shù)據(jù)歸為一類作為測試集,如圖3所示,訓練集的數(shù)據(jù)由黑色線表示,接著之后的測試集數(shù)據(jù)由灰色線表示。
如圖2所示模型以及參數(shù),本文搭建LSTM神經(jīng)網(wǎng)絡、卷積神經(jīng)網(wǎng)絡、全連接多層感知器幾類模型進行數(shù)據(jù)的分析以及預測。
在每個模型進行1000次迭代后,得出的預測精度如表2所示。
從表1可以看出,LSTM神經(jīng)網(wǎng)絡的預測精度較好并且穩(wěn)定性較強,于是使用LSTM進行數(shù)據(jù)的預測并使用matplotlib包進行繪圖(見圖4)。
如圖4所示,LSTM神經(jīng)網(wǎng)絡對期貨開盤價數(shù)據(jù)進行了一次較好的擬合,雖然與真實數(shù)據(jù)仍有差距,但依舊能展示出大概的趨勢。
5 結語與展望
文章通過代碼構建神經(jīng)網(wǎng)絡模型實現(xiàn)期貨數(shù)據(jù)預測,并且經(jīng)過多個模型的對比選取較為精確的網(wǎng)絡,雖仍有誤差,但是能夠對整體趨勢有一個較好的預測,對于投資者而言有參考價值,文章仍存在以下不足之處:
文章中采用的模型是最基礎的神經(jīng)網(wǎng)絡模型,模型深度并沒有達到多深,并且使用的超參數(shù)都是默認參數(shù),沒有進行修改,在之后的文章中可以使用網(wǎng)格排序法對每種超參數(shù)進行枚舉,并得出最優(yōu)的參數(shù),并且對模型的結構進行調整,找到一個最適合的模型結構。本文使用的是滑動窗口式的預測方法,容易造成數(shù)據(jù)誤差的累計,導致長期的模型預測精度較低,固考慮采用S2S的搭建模型與讀取數(shù)據(jù)方式,加入注意力機制讓模型預測精度有更多的提升。
本文僅通過數(shù)據(jù)預測得出開盤價未來變動的趨勢,未來可以考慮在此數(shù)據(jù)基礎上使用量化交易中的策略進行期貨交易,并預估收益,這都是未來文章研究的方向。
【參考文獻】
【1】郭朋.國外高頻交易的發(fā)展現(xiàn)狀及啟示[J].證券市場導報,2012(07):56-61.
【2】王新華,肖波.人工智能及其在金融領域的應用[J].銀行家,2017(12):126-128.
【3】胡葉帥.期貨深度量化交易策略的研究[D].沈陽:遼寧大學,2021.
【4】王鑫,吳際,劉超,等.基于LSTM循環(huán)神經(jīng)網(wǎng)絡的故障時間序列預測[J].北京航空航天大學學報,2018,44(04):772-784.
【5】岑躍峰,張晨光,岑崗,等.基于近端強化學習的股價預測方法[J].控制與決策,2021,36(04):967-973.
【6】余凱,賈磊,陳雨強,等.深度學習的昨天、今天和明天[J].計算機研究與發(fā)展,2013,50(09):1799-1804.
【7】Wen Hu,Yuxue Shi. Prediction of online consumers' buying behavior based on LSTM-RF model[A]. Sichuan University.Proceedings of the 5th International Conference on Communication, Image and Signal Processing (CCISP 2020)[C].Sichuan University:成都夏洛克教育咨詢有限公司,2020:5.
【8】孫志軍,薛磊,許陽明,等.深度學習研究綜述[J].計算機應用研究,2012,29(08):2806-2810.
【9】李澤艷,陳銀鈞.LSTM Deep Learning Stock Prediction System Based on PyTorch Framework[J].運籌與模糊學,2021,11(02):137-146.