沈 虹,李 旭,潘 琪
(揚(yáng)州大學(xué) 商學(xué)院,江蘇 揚(yáng)州 225127)
作為有色金屬的生產(chǎn)和消費(fèi)大國,中國有色金屬行業(yè)在全球定價權(quán)方面的影響力有了顯著提升,“上海規(guī)則”和“上海價格”在行業(yè)內(nèi)獲得了充分認(rèn)可。同時,中國經(jīng)濟(jì)的持續(xù)增長,為中國金屬期貨的發(fā)展提供了有力保證。近年來,期貨市場交易持續(xù)活躍,規(guī)模穩(wěn)步擴(kuò)大,市場功能及其輻射影響力顯著增強(qiáng)。然而,期貨市場暴漲暴跌現(xiàn)象仍時有發(fā)生。不論“國儲銅”事件還是“原油寶”事件,都使市場及投資者遭受到嚴(yán)重?fù)p害,因此研究期貨市場的價格波動以及風(fēng)險防范迫在眉睫。
信息技術(shù)快速發(fā)展的過程中,爆發(fā)式增長的金融數(shù)據(jù)是進(jìn)行全球金融監(jiān)管的重要資源。收集金融數(shù)據(jù),結(jié)合人工智能、統(tǒng)計分析、數(shù)據(jù)挖掘等手段及算法判斷和識別金融變量的變化趨勢是當(dāng)今量化投資金融領(lǐng)域的研究熱點(diǎn)之一。
作為人工智能技術(shù)的代表,通過機(jī)器學(xué)習(xí)挖掘變量之間的非線性關(guān)系可以有效提高金融預(yù)測的效果。Dhar等[1]利用經(jīng)典多層感知器(Multi-layer perceptron,MLP)模型預(yù)測印度證券交易所股指收盤價。Dunis等[2]對乙醇的壓榨價差套利策略采用MLP神經(jīng)網(wǎng)絡(luò)、高階神經(jīng)網(wǎng)絡(luò)(Higher order neural network,HONN)和遺傳規(guī)劃算法(Genetic programming algorithm,GPA)進(jìn)行了對比研究。Gu等[3]將機(jī)器學(xué)習(xí)算法應(yīng)用到美國市場上,實(shí)驗(yàn)表明機(jī)器學(xué)習(xí)比傳統(tǒng)線性回歸模型更加有效。李斌等[4]通過對機(jī)器學(xué)習(xí)的系統(tǒng)性運(yùn)用,發(fā)現(xiàn)機(jī)器學(xué)習(xí)算法能有效識別異象因子,從而提升基本面量化投資中的股票收益預(yù)測效果。
深度學(xué)習(xí)能夠提取大量數(shù)據(jù)中的隱藏信息,因此作為機(jī)器學(xué)習(xí)領(lǐng)域中1個新的研究方向開始廣泛應(yīng)用于量化投資預(yù)測。Di Persio等[5]使用MLP、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN)和長短期記憶(Long-short term memory,LSTM)神經(jīng)網(wǎng)絡(luò)對標(biāo)準(zhǔn)普爾500指針(Standard & Poor’s 500 index,S&P 500)第2天收盤價漲跌進(jìn)行預(yù)測,發(fā)現(xiàn)基于CNN的預(yù)測誤差最小。Bao等[6]將小波變換與LSTM模型結(jié)合,首次基于股票的深層次特征對股價進(jìn)行消除噪聲的分解,得到良好的預(yù)測效果。文宇[7]通過構(gòu)建CNN-LSTM網(wǎng)絡(luò)對金融二級市場價格進(jìn)行分析,無論在短期預(yù)測中還是在長期預(yù)測中都取得了顯著的預(yù)測效果。鄧鳳欣等[8]使用LSTM神經(jīng)網(wǎng)絡(luò)模型對以友邦保險、長和、微軟以及亞馬遜為研究對象的美港市場進(jìn)行預(yù)測,結(jié)果證實(shí)LSTM模型在個股的價格趨勢預(yù)測中的精確程度和穩(wěn)定程度都很高。宋剛等[9]使用基于自適應(yīng)粒子群優(yōu)化(Particle swarm optimization,PSO)的學(xué)習(xí)策略對LSTM模型的關(guān)鍵參數(shù)進(jìn)行尋優(yōu),使股票數(shù)據(jù)特征與網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)相匹配,不僅提高了股價預(yù)測精度還具有普適性。
上述研究嘗試將機(jī)器學(xué)習(xí)及深度學(xué)習(xí)方法應(yīng)用于價格預(yù)測,其適用性得到了一定的驗(yàn)證。其中,LSTM神經(jīng)網(wǎng)絡(luò)在挖掘時間序列長期依賴關(guān)系中極具優(yōu)勢。有色金屬期貨市場作為全球重要的金融子市場,該市場的價格波動會對現(xiàn)貨市場、實(shí)體經(jīng)濟(jì)造成風(fēng)險溢出,因此針對期貨市場的價格監(jiān)測變得尤為重要。然而,針對該市場的金融預(yù)測,現(xiàn)有研究主要通過傳統(tǒng)時間序列模型來實(shí)現(xiàn),沒有考慮到因變量與自變量之間的動態(tài)非線性變化。因此,本文將深度學(xué)習(xí)方法引入期貨市場,利用非線性模型對其進(jìn)行深度數(shù)據(jù)挖掘,從中獲取變量間的非線性關(guān)系,提高預(yù)測能力。本文采用深度學(xué)習(xí)中的LSTM網(wǎng)絡(luò)模型、機(jī)器學(xué)習(xí)MLP模型與線性ARIMA模型對比,進(jìn)行國內(nèi)外有色金屬期貨價格預(yù)測研究,為有色金屬期貨市場的金融預(yù)測提供可參考的模型。
MLP模型是機(jī)器學(xué)習(xí)中具有代表性的模型之一,在股票的預(yù)測分析中應(yīng)用廣泛,且在回歸和分類上均有較好的表現(xiàn)。因此,本文的機(jī)器學(xué)習(xí)模型選取了MLP模型。MLP由輸入層、輸出層和隱含層構(gòu)成,隱含層可以解決非線性可劃分的數(shù)據(jù)問題,最簡單的MLP模型只含有1個隱含層,即共3層,如圖1所示。
圖1 含有1個隱含層的MLP模型結(jié)構(gòu)圖
由圖1可知,MLP每層節(jié)點(diǎn)與網(wǎng)絡(luò)的下一層節(jié)點(diǎn)之間是完全連接的。假設(shè)數(shù)據(jù)從輸入層輸入,其它層的節(jié)點(diǎn)通過將輸入數(shù)據(jù)與層上節(jié)點(diǎn)的權(quán)重W以及閾值b組合,并通過激活函數(shù)得到該層相應(yīng)的輸出。MLP學(xué)習(xí)原理就是通過最速下降法,利用反向傳播調(diào)整網(wǎng)絡(luò)的權(quán)重和閾值,使網(wǎng)絡(luò)誤差達(dá)到最小。3層MLP公式為
f(x)=f(2)(b(2)+w(2)(f(1)(b(1)+w(1)x)))
(1)
式中:函數(shù)f可以是sigmod函數(shù)或者tanh函數(shù),w(1)是輸入層到第1個隱含層的權(quán)重,w(2)是隱含層到輸出層的權(quán)重,b(1)是隱含層的激活閾值,b(2)是輸出層的激活閾值。
循環(huán)神經(jīng)網(wǎng)絡(luò)模型(Recurrent neural network,RNN)是帶有記憶功能的深度學(xué)習(xí)模型,圖2是RNN按時間序列展開的模型。其中,主體結(jié)構(gòu)A將在t時刻讀取輸入層的信息Xt,與上一時刻狀態(tài)ht-1同時輸入模型,從而得到新的自身狀態(tài)ht,并輸出σt。在t+1時刻,又將ht與Xt+1輸入神經(jīng)網(wǎng)絡(luò)A,進(jìn)而得到下一時刻的輸出,如此往復(fù)構(gòu)成1個循環(huán)。故而,RNN模型具有一種重復(fù)神經(jīng)網(wǎng)絡(luò)模塊的鏈?zhǔn)叫问?使得任意時刻的輸出都受到之前數(shù)據(jù)的影響,能夠做到記憶歷史信息并計算當(dāng)前輸出,如圖2所示。
圖2 RNN按時間序列展開結(jié)構(gòu)圖
對于依靠短期記憶來預(yù)測結(jié)果的情形,RNN模型具有良好的預(yù)測效果。然而,當(dāng)權(quán)重大于1時,反向傳播誤差將會一直放大,引起梯度爆炸;當(dāng)權(quán)重小于1時,誤差將會一直縮小,引起梯度消失,進(jìn)而導(dǎo)致網(wǎng)絡(luò)權(quán)重更新緩慢,參數(shù)難以訓(xùn)練達(dá)到最優(yōu)值,使得RNN網(wǎng)絡(luò)無法有效處理長期時序依賴關(guān)系,出現(xiàn)如同人腦一樣,不能永久記憶,過快遺忘的問題。
LSTM神經(jīng)網(wǎng)絡(luò)[10,11]是一種特殊的RNN模型,由于能夠更好地發(fā)現(xiàn)長期依賴關(guān)系而被廣泛應(yīng)用于解決各種復(fù)雜問題。具體來說,LSTM包含3個門,遺忘門(Forget gate)、更新門(Update gate)和輸出門(Output gate)?!伴T”是一種能夠?qū)π畔⒌耐ㄟ^進(jìn)行選擇性控制的結(jié)構(gòu),通過sigmod函數(shù)和點(diǎn)乘操作實(shí)現(xiàn)。sigmod取值介于0~1之間,點(diǎn)乘決定了傳送的信息量,0表示舍棄信息,1表示完全傳輸。LSTM利用內(nèi)部記憶單元即細(xì)胞的狀態(tài)保存歷史信息,并利用不同的“門”動態(tài)地讓網(wǎng)絡(luò)學(xué)習(xí)適時遺忘歷史信息,依據(jù)新信息更新細(xì)胞狀態(tài),進(jìn)而解決了RNN中梯度消失與梯度爆炸的問題。
LSTM單元內(nèi)部結(jié)構(gòu)如圖3所示。上一時刻的輸出ht-1與這一時刻的輸入xt通過LSTM結(jié)構(gòu)的遺忘門控制從當(dāng)前狀態(tài)中移除哪些信息,更新門控制哪些信息添加到當(dāng)前狀態(tài)中,輸出門控制當(dāng)前狀態(tài)中的哪些信息用作輸出。3個“門”共同作用、處理信息,完成時間序列的預(yù)測ht。
圖3 LSTM單元內(nèi)部結(jié)構(gòu)圖
1.3.1 遺忘門
通過遺忘門的sigmod函數(shù)決定從細(xì)胞狀態(tài)中丟棄哪些信息,公式如下
ft=σ(Wf·[ht-1,xt]+bf)
(2)
式中:ht-1是(t-1)時刻的輸出;xt是t時刻本層的輸入;Wf是各個變量的權(quán)重;bf是偏置項;激活函數(shù)σ是sigmod函數(shù),形式為σ(x)=(1+e-x)-1;ft介于0~1之間,表示輸出給每個細(xì)胞狀態(tài)Ct-1的值,1表示完全保留,0表示完全舍棄。
1.3.2 更新門
it=σ(Wi·[ht-1,xt]+bi)
(3)
(4)
(5)
式中:it介于0~1之間;tanh即為雙曲正切激勵函數(shù),輸出介于-1到1之間的數(shù)值;Ct-1表示(t-1)時的細(xì)胞狀態(tài)值,即從t時刻輸入信息中提取出要記錄的信息;Ct表示更新后的細(xì)胞狀態(tài)值。
1.3.3 輸出門
輸出門用來決定輸出的消息。通過sigmod函數(shù)確實(shí)能夠得到細(xì)胞狀態(tài)的輸出信息量,接著將細(xì)胞狀態(tài)Ct經(jīng)過tanh函數(shù)的處理得到1個介于-1到1之間的值,與sigmod的輸出門相乘就得到了最終的輸出值。
ot=σ(Wo·[ht-1,xt]+bo)
(6)
ht=ot·tanh(Ct)
(7)
綜上,通過3個控制門機(jī)制完成了1個神經(jīng)元的內(nèi)部處理,使得LSTM模型可以有效利用輸入數(shù)據(jù),高效地處理復(fù)雜長期時序動態(tài)依賴關(guān)系,從而適用于復(fù)雜的金融時間序列預(yù)測。
金融時間序列分析是研究微觀金融的核心方法之一,在資產(chǎn)定價、金融預(yù)測以及市場檢驗(yàn)等方面發(fā)揮了至關(guān)重要的作用。本文選擇自回歸移動平均(Autoregressive integrated moving average,ARIMA)模型作為線性預(yù)測模型,進(jìn)行價格預(yù)測,同時也為本文的機(jī)器學(xué)習(xí)及深度學(xué)習(xí)提供了對照模型。ARIMA模型是一種時間序列預(yù)測方法,其含義為:假設(shè)1個隨機(jī)過程含有d個單位根,其經(jīng)過d次差分后可以變換為1個平穩(wěn)的自回歸移動平均過程,則該隨機(jī)過程稱為單積(整)自回歸移動平均過程。ARIMA(p,d,q)公式如下
(8)
式中:p是自回歸階數(shù),φi是自回歸參數(shù),xt是經(jīng)過d階差分后的平穩(wěn)序列,q是移動平均階數(shù),ut是t時刻的隨機(jī)擾動項。式(8)由自回歸(AR)和移動平均(MA)2部分共同構(gòu)成。
2.1.1 數(shù)據(jù)來源
為了能夠充分評估MLP、LSTM和ARIMA模型在有色金屬期貨市場上的預(yù)測效果,本文選取了全球最有影響力的兩大有色金屬交易市場——倫敦金屬期貨交易所(London Metal Exchange,LME)和上海期貨交易所(Shanghai Futures Exchange,SHFE)作為國外市場和國內(nèi)市場的代表,對2個市場上交易的金屬期貨的價格變動進(jìn)行預(yù)測。研究對象具體涵蓋:LME和SHFE交易的鋁、銅、鎳、鉛、錫和鋅這6種金屬期貨。涉及變量包括:金屬期貨的開盤價、最低價、最高價、成交量以及收盤價,均為日度數(shù)據(jù)。需特別說明,由于期貨數(shù)據(jù)本身并不是連續(xù)的,每個合約有到期日,所以這里的日度數(shù)據(jù)是根據(jù)當(dāng)月的主力合約構(gòu)建而成的。數(shù)據(jù)源于Wind數(shù)據(jù)庫和國際貨幣基金組織(International Monetary Fund,IMF)數(shù)據(jù)庫。
2.1.2 總樣本區(qū)間、訓(xùn)練集與測試集的劃分
本文選用Wind和IMF數(shù)據(jù)庫中自統(tǒng)計數(shù)據(jù)有記載之日起至2020年7月10日的所有交易數(shù)據(jù)。由于金融資產(chǎn)的價格是在買賣雙方的交易作用下形成的,因此在數(shù)據(jù)篩選時剔除了成交量為0的當(dāng)期數(shù)據(jù)。為進(jìn)一步細(xì)化預(yù)測效果,本文對有色金屬進(jìn)行長、短期價格預(yù)測。采用20個交易日的時間長度衡量短期預(yù)測效果,采用250個交易日的時間長度衡量長期預(yù)測效果。本文的預(yù)測模型訓(xùn)練時,使用前60個交易日的數(shù)據(jù)信息預(yù)測第61日收盤價,因此將總樣本區(qū)間剔除最后310個交易日后的數(shù)據(jù)作為訓(xùn)練集,分別選取最后310個交易日的前80和310個交易日數(shù)據(jù)作為短期和長期預(yù)測的測試集。
在建模過程中,為消除數(shù)據(jù)間的量綱影響并提升模型的預(yù)算速度,對所有有色金屬期貨的交易數(shù)據(jù)進(jìn)行了零-均值(Z-score)規(guī)范化處理,其轉(zhuǎn)換函數(shù)公式為
(9)
式中:X為需要被標(biāo)準(zhǔn)化處理的原始值,即有色金屬期貨的開盤價、最高價、最低價、收盤價和交易量,μ為各自的均值,σ為標(biāo)準(zhǔn)差且不等于0。Z經(jīng)標(biāo)準(zhǔn)化處理,代表有色金屬期貨各變量和集合均值之間的距離,Z低于均值為負(fù)數(shù),反之為正數(shù),范圍為(-∞,+∞)。
(10)
選擇優(yōu)化器方面,本文選取Adam優(yōu)化器自適應(yīng)矩估計(Adaptive moment estimation)進(jìn)行優(yōu)化訓(xùn)練。Adam的優(yōu)點(diǎn)主要在于經(jīng)過偏置校正后,每一次迭代學(xué)習(xí)率都有個確定范圍,使得參數(shù)比較平穩(wěn)。以SHFE交易的銅期貨為例,設(shè)置學(xué)習(xí)率為0.000 6時,可以看出迭代次數(shù)在500次的時候,網(wǎng)絡(luò)已經(jīng)比較穩(wěn)定,故而迭代次數(shù)設(shè)置為500。圖4為銅的Loss函數(shù)關(guān)于迭代次數(shù)的收斂情況,其他品種的參數(shù)設(shè)置可根據(jù)實(shí)際收斂情況進(jìn)行動態(tài)調(diào)整。
圖4 銅的Loss函數(shù)關(guān)于迭代次數(shù)的收斂情況圖
MLP神經(jīng)網(wǎng)絡(luò)和LSTM神經(jīng)網(wǎng)絡(luò)對每個有色金屬期貨預(yù)測思路均是:用60個交易日的歷史交易數(shù)據(jù)對未來1 d的有色金屬期貨的收盤價進(jìn)行預(yù)測。通常前60個交易日的交易數(shù)據(jù)已經(jīng)包含足夠信息對未來1 d的價格進(jìn)行預(yù)測,超出60 d的交易數(shù)據(jù)對后續(xù)的影響不大。模型輸入方面,本文采用有色金屬期貨的開盤價、收盤價、最高價、最低價以及成交量5個指標(biāo)的日度數(shù)據(jù)作為模型輸入,未來1 d的有色金屬期貨的收盤價預(yù)測值作為模型輸出[12]。
ARIMA模型也記作ARIMA(p,d,q),是統(tǒng)計模型中最常見的一種用來進(jìn)行時間序列預(yù)測的模型,ARIMA (p,d,q)作為線性模型的代表對金融市場的預(yù)測研究貢獻(xiàn)極大。因此,本文采用ARIMA (p,d,q)模型作為評估LSTM模型的對照模型。具體預(yù)測思路是:首先對金屬期貨的收盤價取對數(shù)并進(jìn)行一階差分,通過增廣迪基—富勒(Augment Dickey-Fuller,ADF)檢驗(yàn)測試序列的平穩(wěn)性;其次通過赤池信息量準(zhǔn)則(Akaike information criterion,AIC)和貝葉斯信息準(zhǔn)則(Bayesian information criterion,BIC)得到最佳模型參數(shù)ARIMA (p,d,q)并進(jìn)行序列建模;最后采用已建好的ARIMA (p,d,q)進(jìn)行預(yù)測。
本文使用Python深度學(xué)習(xí)軟件,對SHFE和LME的鋁、銅、鎳、鉛、錫和鋅6種有色金屬期貨價格分別進(jìn)行長、短期預(yù)測。
鑒于本文針對多種有色金屬進(jìn)行預(yù)測效果研究,選擇相對誤差指標(biāo)作為預(yù)測評價指標(biāo)。本文選用平均絕對百分比誤差(Mean absolute percentage error,MAPE)。MAPE值越小,代表預(yù)測精度越高,模型的預(yù)測效果越好。
(11)
MAPE是衡量預(yù)測準(zhǔn)確性的統(tǒng)計指標(biāo),是百分比值。一般認(rèn)為MAPE小于10時,預(yù)測精度較高。但是,如果存在某個實(shí)際值yi為0,那么MAPE則無法進(jìn)行計算。
本文選用250個交易日的時間長度來衡量MLP模型、LSTM模型和ARIMA模型對有色金屬期貨收盤價的長期預(yù)測結(jié)果。表1和表2展示了在SHFE和LME上交易的鋁、銅、鎳、鉛、錫和鋅的預(yù)測結(jié)果。
表1 SHFE有色金屬期貨長期預(yù)測結(jié)果表 %
表2 LME有色金屬期貨長期預(yù)測結(jié)果表 %
橫向比較觀測數(shù)據(jù),對于SHFE和LME,在6種有色金屬期貨的長期預(yù)測中,LSTM模型的MAPE值均小于MLP模型。同時,ARIMA模型對6種有色金屬期貨價格預(yù)測的MAPE值又均小于LSTM模型下的MAPE值。結(jié)果說明LSTM、MLP和ARIMA模型在對SHFE和LME的長期預(yù)測中,ARIMA線性模型的預(yù)測精度最高,LSTM模型其次,MLP模型最后。
圖5展示了MLP模型、LSTM模型和ARIMA模型長期預(yù)測下的SHFE期貨銅(簡稱滬銅)的價格走勢圖,能夠更加清晰直觀地看出各個模型的預(yù)測效果。綜合2個金屬期貨市場可以得出:在長期預(yù)測中,ARIMA模型對6種有色金屬價格的預(yù)測效果整體上優(yōu)于LSTM模型的預(yù)測效果,MLP模型的預(yù)測效果最不理想。
圖5 滬銅期貨價格預(yù)測走勢圖
縱向比較觀測數(shù)據(jù):對LME預(yù)測,由于英國的期貨市場起源較早,各金屬期貨合約掛牌交易均比較早,故而數(shù)據(jù)較為充分,6種有色金屬期貨價格的預(yù)測均未出現(xiàn)異常。對SHFE預(yù)測,MLP模型、LSTM模型和ARIMA模型都同時在對鎳和錫的預(yù)測上出現(xiàn)了較大幅度的偏差,MLP模型、LSTM模型的偏差尤為明顯,鎳的MAPE值分別為8.73、2.10和1.31,錫的MAPE值分別為3.74、1.39和0.94,是每種模型在6種有色金屬期貨中MAPE值最大的2組。預(yù)測出現(xiàn)如此大不穩(wěn)定性的主要原因在于,鎳和錫的期貨合約于2015年3月27日才正式在SHFE掛牌交易,因而兩者的交易數(shù)據(jù)較少,訓(xùn)練集較少,導(dǎo)致非線性模型MLP和LSTM的訓(xùn)練過程受到了很大的限制,預(yù)測模型未達(dá)到收斂的效果即結(jié)束運(yùn)行,故而在預(yù)測過程中出現(xiàn)了非常大的波動,預(yù)測效果欠佳。
本文選用20個交易日的時間長度來衡量MLP模型、LSTM模型和ARIMA模型對有色金屬期貨收盤價的短期預(yù)測。表3、4展示了在SHFE和LME交易的鋁、銅、鎳、鉛、錫和鋅的預(yù)測結(jié)果。
表3 SHFE有色金屬期貨短期預(yù)測結(jié)果表 %
由表3可知,對6種有色金屬期貨收盤價的短期預(yù)測中,除有色金屬鎳外,SHFE、LSTM神經(jīng)網(wǎng)絡(luò)模型的MAPE值均小于MLP模型。對鋁、鉛、鋅3種有色金屬,LSTM模型MAPE值均略大于ARIMA模型。對鎳和錫2種有色金屬,LSTM模型MAPE值與ARIMA模型相差較大。對有色金屬銅,LSTM模型MAPE值略小于ARIMA模型。因此,在SHFE交易的有色金屬期貨利用ARIMA線性進(jìn)行短期預(yù)測的精確度較好,LSTM模型稍遜,MLP模型效果不理想。
由表4可知,對于LME的6種有色金屬期貨收盤價的短期預(yù)測中,LSTM神經(jīng)網(wǎng)絡(luò)模型MAPE值均小于MLP模型。同時可以發(fā)現(xiàn),鋁、鎳、錫、鋅4種有色金屬期貨的LSTM神經(jīng)網(wǎng)絡(luò)MAPE值大于ARIMA模型,說明在LME交易的鋁、鎳、錫、鋅4種有色金屬期貨利用ARIMA線性模型預(yù)測效果較好;銅、鉛2種有色金屬的LSTM模型MAPE值小于ARIMA模型,表明LSTM模型在這2個期貨品種上表現(xiàn)更加出色。由此可以得出,在短期預(yù)測中,MLP模型整體效果不夠理想,但LSTM模型與ARIMA模型的預(yù)測精確度不相上下。
表4 LME有色金屬期貨短期預(yù)測結(jié)果表 %
綜合考慮2個金屬期貨市場情況可以得出,在長期預(yù)測中,ARIMA模型對6種有色金屬價格的預(yù)測效果整體上優(yōu)于LSTM模型的預(yù)測效果,MLP模型的預(yù)測效果最不理想。在短期預(yù)測中,ARIMA模型和LSTM模型對鋁、銅、鉛3種有色金屬價格的預(yù)測效果相似,但在鎳、錫、鋅3種有色金屬價格的預(yù)測中ARIMA明顯優(yōu)于LSTM模型,MLP模型的預(yù)測效果最不理想。
在2個金屬期貨市場出現(xiàn)上述機(jī)器學(xué)習(xí)MLP模型和深度網(wǎng)絡(luò)學(xué)習(xí)LSTM模型預(yù)測效果未優(yōu)于線性ARIMA模型的原因在于:
(1)有色金屬期貨價格受到供需平衡的影響,在供應(yīng)旺季和消費(fèi)淡季時,價格較低;反之,在供應(yīng)淡季和消費(fèi)旺季時,價格較高。結(jié)合期貨合約的價格發(fā)現(xiàn)和套期保值功能,持有該期貨合約規(guī)避風(fēng)險的大型企業(yè)較多,故而交易量和交易價格具有明顯的季節(jié)性特征。同一季節(jié)趨勢變化較為穩(wěn)定,不同季節(jié)之間差異很大,容易在換季節(jié)點(diǎn)出現(xiàn)價格大幅變動并很快平穩(wěn),故而在同一季節(jié)較為符合線性模型預(yù)測的時間序列穩(wěn)定性要求。并且由于線性模型預(yù)測僅考慮收盤價1個因素的影響,預(yù)測結(jié)果有接近滯后1d的特點(diǎn),在換季節(jié)點(diǎn)大幅變動后很快又平穩(wěn)時,線性模型能迅速跟上,而長短期記憶模型仍需考慮預(yù)測日前多個交易日的數(shù)據(jù),故而精確性受到一定影響。
(2)單純使用某一有色金屬期貨的各項交易數(shù)據(jù)對收盤價格進(jìn)行預(yù)測,對于深度學(xué)習(xí)的LSTM模型來說,存在數(shù)據(jù)規(guī)模不足,數(shù)據(jù)類型不夠全面的問題。LSTM深度神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時需要大量的訓(xùn)練數(shù)據(jù),對于具有海量數(shù)據(jù)的金融模型的訓(xùn)練和學(xué)習(xí)有著天然的優(yōu)勢。然而如果針對某一有色金屬期貨市場的價格進(jìn)行預(yù)測時,僅考慮將有色金屬期貨自身的交易數(shù)據(jù)作為影響因素遠(yuǎn)遠(yuǎn)不夠。由于有色金屬屬于基礎(chǔ)金屬,更多的是作為原材料應(yīng)用到工業(yè)生產(chǎn)領(lǐng)域,很大程度上受到國家宏觀經(jīng)濟(jì)預(yù)期和基本面的影響,特別是新冠疫情的持續(xù)發(fā)酵導(dǎo)致市場情緒或趨于悲觀,有色金屬價格受到壓制,因此對市場價格預(yù)測的過程中還需考慮與之密切相關(guān)的宏觀經(jīng)濟(jì)因素、政策變更以及相關(guān)股票市場上的價格波動對其的聯(lián)動影響。隨著數(shù)據(jù)規(guī)模和數(shù)據(jù)類型的增加,將更多與有色金屬期貨價格相關(guān)的非線性因素納入分析框架時,LSTM模型將是ARIMA模型的最優(yōu)替代之一。
本文通過使用機(jī)器學(xué)習(xí)MLP模型、深度學(xué)習(xí)LSTM模型以及線性ARIMA模型,對在SHFE和LME交易的鋁、銅、鎳、鉛、錫和鋅6種有色金屬期貨進(jìn)行長期和短期的價格預(yù)測分析,得出以下結(jié)論:
(1)在有色金屬期貨市場的長期預(yù)測中,ARIMA模型的預(yù)測表現(xiàn)均略優(yōu)于LSTM模型,MLP模型最不理想;
(2)在有色金屬期貨市場的短期預(yù)測中,ARIMA模型的預(yù)測結(jié)果和LSTM模型相近,均優(yōu)于MLP模型。
(3)LSTM模型與MLP模型相比,不論是模型的穩(wěn)定性還是預(yù)測的精確度都更加出色。
在探究預(yù)測有色金屬期貨價格時,選取的數(shù)據(jù)相對單一會造成機(jī)器學(xué)習(xí)模型預(yù)測性能得不到充分發(fā)揮。鑒于機(jī)器學(xué)習(xí)擅長挖掘變量間的非線性關(guān)系,可以用來彌補(bǔ)ARIMA模型變量間線性關(guān)系的不足,隨著數(shù)據(jù)規(guī)模及類型的增加,以LSTM為代表的深度學(xué)習(xí)模型會更具優(yōu)勢。因此,通過上述模型的比較,LSTM模型可作為ARIMA模型的最優(yōu)替代之一。
在大數(shù)據(jù)時代的今天,人工智能技術(shù)的興起與完善,為構(gòu)建更有效的系統(tǒng)性風(fēng)險監(jiān)測模型提供了新的方向。本文將機(jī)器學(xué)習(xí)中的MLP模型和深度學(xué)習(xí)中的LSTM方法拓展應(yīng)用于有色金屬期貨市場的價格預(yù)測,為人工智能技術(shù)廣泛應(yīng)用到量化投資領(lǐng)域提供了實(shí)踐經(jīng)驗(yàn),為復(fù)雜金融時間序列的建模研究提供了參考,同時有利于提升量化研究方法的科學(xué)性與實(shí)用性。然而,本文對有色金屬期貨價格預(yù)測的變量選取僅僅基于歷史交易數(shù)據(jù),沒有充分考慮其他影響因素,這將是本文后續(xù)研究的方向。