劉金培,儲(chǔ) 娜,羅 瑞,陶志富,陳華友
(1.安徽大學(xué) 商學(xué)院,安徽 合肥 230601;2.安徽大學(xué) 大數(shù)據(jù)與統(tǒng)計(jì)學(xué)院,安徽 合肥 230601)
匯率波動(dòng)對(duì)國(guó)家經(jīng)濟(jì)的發(fā)展及內(nèi)外均衡起著決定性的作用[1].受復(fù)雜多變的國(guó)際經(jīng)濟(jì)形勢(shì)以及持續(xù)反復(fù)的新冠疫情等多重影響,外匯市場(chǎng)存在大量的不確定性因素.在此背景下,如何構(gòu)建精確有效的匯率預(yù)測(cè)模型成為一項(xiàng)重要的研究課題.匯率變化具有連續(xù)性和區(qū)間關(guān)聯(lián)度特征.點(diǎn)值預(yù)測(cè)模型難以準(zhǔn)確分析匯率的連續(xù)波動(dòng),而區(qū)間數(shù)據(jù)不僅包含了日內(nèi)的最大值和最小值,還能刻畫變量取值的不確定性和連續(xù)變化性[2].因此,基于區(qū)間數(shù)據(jù)的預(yù)測(cè)模型具有更強(qiáng)的穩(wěn)定性,對(duì)于掌握中國(guó)宏觀經(jīng)濟(jì)的未來(lái)發(fā)展趨勢(shì)具有重要的理論價(jià)值[3].
現(xiàn)有匯率預(yù)測(cè)模型主要分為3類:計(jì)量經(jīng)濟(jì)、人工智能和分解集成模型.傳統(tǒng)的計(jì)量經(jīng)濟(jì)模型[4-7]在處理復(fù)雜非線性問題方面存在局限性.而人工智能模型[8-11]雖然在處理非線性時(shí)間序列上表現(xiàn)出了相對(duì)優(yōu)越的性能,但也存在過擬合以及參數(shù)不確定等問題,且單一模型無(wú)法同時(shí)提取匯率序列的多尺度特征.依據(jù)“分而治之”的思想,分解集成方法成為智能預(yù)測(cè)領(lǐng)域的主流.Das等[12]提出了基于經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,簡(jiǎn)稱EMD)與核極限學(xué)習(xí)機(jī)(kernel extreme learning machine,簡(jiǎn)稱KELM)的匯率預(yù)測(cè)模型.Huang等[13]使用遺傳算法(genetic algorithm,簡(jiǎn)稱GA)對(duì)變分模態(tài)分解(variational mode decomposition,簡(jiǎn)稱VMD)的參數(shù)進(jìn)行優(yōu)化,并結(jié)合LSTM(long short-term memory)預(yù)測(cè)美元兌加元匯率等多個(gè)金融時(shí)間序列.熊志斌[14]利用自適應(yīng)噪聲完備經(jīng)驗(yàn)?zāi)B(tài)分解(complete ensemble empirical mode decomposition with adaptive noise,簡(jiǎn)稱CEEMDAN)和LSTM 預(yù)測(cè)與人民幣有關(guān)的4種匯率的波動(dòng)情況.分解集成模型有利于提高匯率的預(yù)測(cè)精度,然而,傳統(tǒng)的數(shù)據(jù)分解方法僅適用于點(diǎn)值時(shí)間序列,會(huì)造成區(qū)間匯率波動(dòng)性特征的較大損失.另外,二維經(jīng)驗(yàn)?zāi)B(tài)分解(bidimensional empirical mode decomposition,簡(jiǎn)稱BEMD)雖然可以處理非線性、非平穩(wěn)的區(qū)間時(shí)間序列,但其分解結(jié)果存在上下界混疊的問題.為此,論文提出一種新的區(qū)間經(jīng)驗(yàn)?zāi)B(tài)分解(interval empirical mode decomposition,簡(jiǎn)稱IEMD)方法,該方法不僅可以實(shí)現(xiàn)區(qū)間序列的有效分解,而且能夠克服分解后區(qū)間子序列上下界混疊的問題.
除了上述預(yù)測(cè)方法的改進(jìn),預(yù)測(cè)因子的選擇也會(huì)對(duì)預(yù)測(cè)效果產(chǎn)生重要的影響.匯率的預(yù)測(cè)因子主要包括兩類:一類為芝加哥期權(quán)交易所波動(dòng)率(the Chicago board options exchange volatility index,簡(jiǎn)稱VIX指數(shù))[15]、居民消費(fèi)價(jià)格指數(shù)[16]和消費(fèi)者信心指數(shù)[17]等經(jīng)濟(jì)指標(biāo)的結(jié)構(gòu)化數(shù)據(jù).另一類為基于網(wǎng)絡(luò)搜索指數(shù)和文本的非結(jié)構(gòu)化數(shù)據(jù).其中,結(jié)構(gòu)化的預(yù)測(cè)因子難以提供實(shí)時(shí)信息,會(huì)導(dǎo)致預(yù)測(cè)結(jié)果存在滯后性.在大數(shù)據(jù)的時(shí)代背景下,學(xué)者們逐漸將研究視角轉(zhuǎn)向時(shí)效性更強(qiáng)的非結(jié)構(gòu)化數(shù)據(jù).Lin等[18]發(fā)現(xiàn)將百度指數(shù)作為預(yù)測(cè)因子,可以提高美元兌人民幣匯率的預(yù)測(cè)精度.劉金培等[19]從百度指數(shù)中提取相關(guān)的非結(jié)構(gòu)化數(shù)據(jù)用于匯率預(yù)測(cè),有效改善了預(yù)測(cè)效果.張杰等[20]引入互聯(lián)網(wǎng)新聞對(duì)匯率進(jìn)行預(yù)測(cè),提高了預(yù)測(cè)的準(zhǔn)確率.孫少龍等[21]通過構(gòu)建情感詞典對(duì)在線外匯新聞進(jìn)行情感分析,實(shí)現(xiàn)了模型預(yù)測(cè)性能的有效提升.上述研究均表明,非結(jié)構(gòu)化數(shù)據(jù)能夠?yàn)閰R率預(yù)測(cè)提供更多的有效信息.因此,將海量的新聞文本量化為情感傾向,并與結(jié)構(gòu)化指標(biāo)相結(jié)合,以作為模型的輔助變量,對(duì)匯率預(yù)測(cè)具有一定意義.
此外,匯率還易受到各種不確定重大事件的影響,如歐債危機(jī)、英國(guó)脫歐[22]、新冠疫情(corona virus disease 2019,簡(jiǎn)稱COVID-19)[23]等.2020年初爆發(fā)的COVID-19疫情對(duì)全球經(jīng)濟(jì)造成了巨大的沖擊,外匯市場(chǎng)也不可避免地受到了影響.Feng等[23]通過實(shí)證發(fā)現(xiàn)COVID-19確診病例數(shù)量的增加會(huì)加劇匯率波動(dòng).朱寧等[24]研究得出COVID-19會(huì)通過影響生產(chǎn)活動(dòng)和人們的心理預(yù)期,改變消費(fèi)、投資等行為,從而影響人民幣匯率.由此可見,COVID-19疫情會(huì)引發(fā)匯率的異常波動(dòng).論文以COVID-19疫情為例,通過引入全球恐懼指數(shù)(the global fear index,簡(jiǎn)稱GFI)量化疫情對(duì)匯率的影響,以期為重大事件影響下的匯率預(yù)測(cè)提供借鑒和參考.
綜上所述,現(xiàn)有研究存在以下3個(gè)方面的問題:①匯率的影響因素復(fù)雜,而大多數(shù)傳統(tǒng)預(yù)測(cè)研究?jī)H考慮歷史數(shù)據(jù)或結(jié)構(gòu)化指標(biāo),無(wú)法實(shí)時(shí)反映市場(chǎng)情緒的變化,導(dǎo)致預(yù)測(cè)結(jié)果存在滯后性.②現(xiàn)有預(yù)測(cè)模型未能反映新冠疫情等重大事件引起的匯率波動(dòng),從而缺乏適用性.③針對(duì)匯率區(qū)間時(shí)間序列,現(xiàn)有多尺度分解方法存在上下界混疊的問題.針對(duì)以上問題,論文提出一種基于新聞情感分析和區(qū)間分解的匯率波動(dòng)預(yù)測(cè)模型.首先引入外匯新聞文本、VIX指數(shù)和GFI指標(biāo)作為匯率的影響因素,并提出一種新的IEMD方法對(duì)原始匯率序列進(jìn)行分解,接著針對(duì)不同序列的特征選取合適的預(yù)測(cè)方法進(jìn)行組合預(yù)測(cè).最后通過4組對(duì)比實(shí)驗(yàn)驗(yàn)證所提模型的準(zhǔn)確性和適應(yīng)性.
COVID-19的快速傳播造成了巨大的生命損失,疫情爆發(fā)給人們帶來(lái)了明顯的恐懼[25].為了反映疫情的影響,論文引入GFI指標(biāo)[26]來(lái)對(duì)匯率進(jìn)行預(yù)測(cè),GFI旨在衡量人們對(duì)COVID-19的傳播和嚴(yán)重程度的日常關(guān)注和情緒.
首先,根據(jù)每日?qǐng)?bào)告的確診和死亡病例總?cè)藬?shù),計(jì)算報(bào)告病例指數(shù)(reported cases index,簡(jiǎn)稱RCI)和報(bào)告死亡指數(shù)(reported death index,簡(jiǎn)稱RDI)
然后,根據(jù)RCI和RDI計(jì)算GFI指標(biāo)
為了解決傳統(tǒng)經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)僅適用于點(diǎn)值時(shí)間序列的問題,論文針對(duì)區(qū)間時(shí)間序列,提出一種新的區(qū)間經(jīng)驗(yàn)?zāi)B(tài)分解(IEMD)方法.
EMD是一種將信號(hào)分解為幾個(gè)本征模態(tài)函數(shù)(intrinsic mode function,簡(jiǎn)稱IMF)和一個(gè)余項(xiàng)的方法[27],主要包括5個(gè)步驟:①確定原始序列中的所有局部極值點(diǎn);②生成上下包絡(luò)線,用3次樣條插值擬合上下包絡(luò)線,并計(jì)算上下包絡(luò)線的平均值m(t);③從原始序列中減去m(t),得到分量h(t);④判斷序列h(t)是否滿足IMF的條件,若滿足則h(t)就是第一個(gè)IMF分量c1(t),若不滿足則用h(t)代替原始序列重復(fù)步驟1~3,直到滿足IMF條件;⑤從原始序列中減去c1(t)得到余項(xiàng)r1(t),將r1(t)作為原始序列重復(fù)上述過程,當(dāng)rn(t)成為單調(diào)函數(shù)或小于特定閾值時(shí),結(jié)束分解過程.
雖然EMD可以有效降低非線性、非平穩(wěn)數(shù)據(jù)的復(fù)雜性,但它只能實(shí)現(xiàn)點(diǎn)值數(shù)據(jù)的分解.為此,論文在EMD的基礎(chǔ)上進(jìn)行改進(jìn),提出可以分解區(qū)間時(shí)間序列的IEMD方法,具體步驟如下:
(1)將原始區(qū)間序列構(gòu)造成中心-半徑形式,即
(3)將半徑的趨勢(shì)分量rn(t)按照等比序列的原則分成m份,分別加減到中心序列的各個(gè)分量中,得到區(qū)間分解后的上界和下界,從而避免了分解后上下界混疊的問題,即
將剩下的n-1個(gè)分量相加,得到匯率殘差序列R
(4)此時(shí)原始區(qū)間序列就被分解成m個(gè)區(qū)間子序列和1個(gè)殘差序列,即
論文提出的IEMD分解方法可以實(shí)現(xiàn)對(duì)區(qū)間時(shí)間序列的分解,有效降低序列復(fù)雜度.另外,該方法能夠克服傳統(tǒng)區(qū)間分解方法存在的上下界混疊問題,以保留原始區(qū)間序列的波動(dòng)特征.
由于分解重構(gòu)后的區(qū)間子序列具有不同的尺度特征,論文選擇極限學(xué)習(xí)機(jī)(extreme learning machine,簡(jiǎn)稱ELM)、多層感知機(jī)(multi-layer perceptron,簡(jiǎn)稱MLP)、隨機(jī)森林(random forest,簡(jiǎn)稱RF)、二次曲面支持向量回歸(quadric surface support vector regression,簡(jiǎn)稱QSSVR)4種單項(xiàng)預(yù)測(cè)方法對(duì)它們進(jìn)行組合預(yù)測(cè).
1.3.1 極限學(xué)習(xí)機(jī)(ELM)
極限學(xué)習(xí)機(jī)(ELM)是一種基于單隱層前饋神經(jīng)網(wǎng)絡(luò)架構(gòu)的快速高效算法[28],它的輸入權(quán)重和隱藏層偏差是隨機(jī)選擇的,不需要在整個(gè)學(xué)習(xí)過程中進(jìn)行調(diào)整以確定輸出權(quán)重.ELM 的損失函數(shù)可以描述為
其中:N為訓(xùn)練樣本數(shù)量,L為隱含層的神經(jīng)元數(shù),βi為隱含層與輸出層之間的網(wǎng)絡(luò)權(quán)重,g(x)為激活函數(shù),Wi為輸入層與隱含層之間的網(wǎng)絡(luò)權(quán)重,Xj為輸入數(shù)據(jù),bi為隱含層的閾值,tj為輸出數(shù)據(jù).
1.3.2 多層感知機(jī)(MLP)
多層感知機(jī)(MLP)是一種前饋神經(jīng)網(wǎng)絡(luò),它具有高度的非線性映射能力,可以解決復(fù)雜的非線性問題.MLP由輸入層、隱含層和輸出層組成,其中隱含層可以為一個(gè)或多個(gè),且層與層之間的關(guān)系為全連接.輸入層負(fù)責(zé)接收信號(hào),隱含層負(fù)責(zé)轉(zhuǎn)換輸入值并將信息轉(zhuǎn)發(fā)到輸出層,輸出層根據(jù)輸入信號(hào)以決策或預(yù)測(cè)的形式計(jì)算結(jié)果.反向傳播算法是訓(xùn)練MLP最常用的學(xué)習(xí)算法之一.
1.3.3 隨機(jī)森林(RF)
隨機(jī)森林(RF)模型是由Breiman[29]提出的一種集成回歸算法,其過程如下:
(1)使用Bootstrap抽樣方法隨機(jī)抽取x個(gè)樣本集,并將這些樣本集輸入到x顆回歸樹中進(jìn)行預(yù)測(cè).
(2)對(duì)于每顆回歸樹,隨機(jī)選擇p維變量作為備選分支變量,使用分類和回歸樹(classification and regression tree,簡(jiǎn)稱CART)算法來(lái)訓(xùn)練回歸樹,直到生成最佳回歸樹.
(3)計(jì)算x個(gè)回歸樹輸出的平均值作為RF的最終輸出.
1.3.4 二次曲面支持向量回歸(QSSVR)
核函數(shù)支持向量回歸模型能夠有效提取復(fù)雜序列的非線性特征,但核函數(shù)及其參數(shù)的選擇沒有通用的規(guī)則,需要耗費(fèi)大量的計(jì)算時(shí)間.為克服其缺陷,論文引入無(wú)核的QSSVR 模型[30],對(duì)訓(xùn)練集,yi∈R進(jìn)行非線性擬合.QSSVR模型可以在不利用任何核函數(shù)的情況下,生成二次曲面,對(duì)n個(gè)訓(xùn)練點(diǎn)進(jìn)行有效擬合,其中:(W,b,c)為未知參數(shù),具體形式如下
與經(jīng)典的SVR模型類似,QSSVR模型的目標(biāo)是生成一個(gè)“管道”,然后試圖在這個(gè)“管道”中包括盡可能多的訓(xùn)練點(diǎn).即對(duì)于一個(gè)給定的δ,首先忽略“管道”內(nèi)訓(xùn)練點(diǎn)|y-(0.5xTWx+bTx+c)|≤δ的誤差,然后,為了在該“管道”中包括盡可能多的數(shù)據(jù)點(diǎn),將“管道”邊界之間的距離最大化,將“管道”外的數(shù)據(jù)點(diǎn)的誤差ξi最小化.因此,QSSVR模型可以表述為
使得
其中:δ,Cp>0為模型超參數(shù).
在對(duì)指標(biāo)因子以及相關(guān)方法的理論性和可行性進(jìn)行詳細(xì)闡述的基礎(chǔ)上,論文進(jìn)一步提出了基于新聞情感分析和區(qū)間分解的匯率波動(dòng)預(yù)測(cè)模型,如圖1所示.該模型主要包括4個(gè)步驟:
圖1 模型框架圖
(1)數(shù)據(jù)提取.首先,從相關(guān)網(wǎng)站收集所需的原始數(shù)據(jù),包括匯率區(qū)間數(shù)據(jù)、VIX指數(shù)、外匯新聞標(biāo)題、新冠疫情確診和死亡病例.然后,利用Python自帶的第三方庫(kù)Snownlp對(duì)爬取的外匯新聞標(biāo)題進(jìn)行情感分析,每條新聞標(biāo)題對(duì)應(yīng)一個(gè)情感分?jǐn)?shù),分?jǐn)?shù)越接近1表明情感傾向越積極.同時(shí),利用新冠疫情確診和死亡病例數(shù)據(jù)構(gòu)建GFI指標(biāo).
(2)區(qū)間分解.在分解階段,由于匯率具有連續(xù)變化的特征,為了保留其波動(dòng)信息,使用IEMD對(duì)匯率的原始數(shù)據(jù)進(jìn)行區(qū)間分解,對(duì)其他子序列進(jìn)行EMD簡(jiǎn)單分解.然后,基于樣本熵對(duì)分解后的各子序列進(jìn)行重構(gòu),依次得到對(duì)應(yīng)的匯率數(shù)據(jù)、VIX指數(shù)、情感分?jǐn)?shù)和GFI的高、中、低頻區(qū)間序列以及匯率殘差序列.
(3)組合預(yù)測(cè).在預(yù)測(cè)階段,將相同頻率的區(qū)間匯率歷史數(shù)據(jù)和VIX指數(shù)、情感分?jǐn)?shù)、GFI作為對(duì)應(yīng),分別用ELM,MLP,RF和QSSVR對(duì)高頻序列、中頻序列、低頻序列和殘差序列進(jìn)行預(yù)測(cè).
(4)模型評(píng)估.為了驗(yàn)證論文模型的有效性,作者使用區(qū)間均方誤差(interval mean squared error,簡(jiǎn)稱IMSE)、區(qū)間平均絕對(duì)誤差(interval mean absolute error,簡(jiǎn)稱IMAE)和區(qū)間平均絕對(duì)百分比誤差(interval mean absolute percentage error,簡(jiǎn)稱IMAPE)3種誤差評(píng)價(jià)指標(biāo),對(duì)匯率區(qū)間預(yù)測(cè)結(jié)果進(jìn)行檢驗(yàn).
論文選取日度美元兌人民幣(USD/CNY)、澳元兌人民幣(AUD/CNY)和瑞士法郎兌人民幣(CHF/CNY)3種匯率區(qū)間數(shù)據(jù)作為研究對(duì)象.所用的數(shù)據(jù)集包括4個(gè)部分:匯率歷史數(shù)據(jù)、VIX指數(shù)、外匯新聞標(biāo)題、新冠疫情確診和死亡病例數(shù).其中匯率歷史數(shù)據(jù)和VIX指數(shù)均來(lái)源于Wind金融終端,外匯新聞標(biāo)題從和訊網(wǎng)的外匯專場(chǎng)板塊爬取獲得,疫情數(shù)據(jù)來(lái)源于Our World in Data數(shù)據(jù)網(wǎng)站(https://ourworldindata.org/).樣本區(qū)間設(shè)置為2019年1月1日—2022年10月28日,剔除周末和節(jié)假日,共927個(gè)區(qū)間數(shù)據(jù).其中,將2019年1月1日—2022年1月19日的742個(gè)數(shù)據(jù)作為訓(xùn)練集,2022年1月20日—2022年10月28日的185個(gè)數(shù)據(jù)作為測(cè)試集.
為了確保數(shù)據(jù)的可用性,使用Snownlp對(duì)爬取的匯率新聞標(biāo)題進(jìn)行情感分析,并將相同日期的情感分?jǐn)?shù)取平均,得到每日的情感分?jǐn)?shù)值.同時(shí),根據(jù)1.1節(jié)的方法構(gòu)建GFI指標(biāo).
該節(jié)使用IEMD對(duì)3種匯率數(shù)據(jù)進(jìn)行區(qū)間分解,設(shè)置參數(shù)q=1/8,得到對(duì)應(yīng)的匯率區(qū)間序列和殘差序列,同時(shí)對(duì)其他子序列進(jìn)行EMD簡(jiǎn)單分解.然后,通過計(jì)算各個(gè)序列的樣本熵,按照頻率高低對(duì)分解后的各子序列進(jìn)行重構(gòu),依次得到對(duì)應(yīng)的匯率數(shù)據(jù)、VIX指數(shù)、情感分?jǐn)?shù)和GFI的高頻序列、中頻序列、低頻序列以及殘差序列.圖2展示了重構(gòu)后的USD/CNY 區(qū)間序列和殘差序列.可以看出,重構(gòu)后的USD/CNY區(qū)間序列無(wú)上下界混疊,且趨勢(shì)明顯,易于預(yù)測(cè).
圖2 重構(gòu)后的USD/CNY區(qū)間序列與殘差序列
將重構(gòu)后相同頻率的VIX指數(shù)、情感分?jǐn)?shù)和GFI與匯率區(qū)間序列對(duì)應(yīng),以提前1期的高頻序列、中頻序列、低頻序列和殘差序列作為輸入變量.進(jìn)而,分別運(yùn)用極限學(xué)習(xí)機(jī)(ELM)、多層感知機(jī)(MLP)、隨機(jī)森林(RF)和二次曲面支持向量回歸(QSSVR)對(duì)高頻序列、中頻序列、低頻序列和殘差序列進(jìn)行預(yù)測(cè),對(duì)所有子序列的預(yù)測(cè)值進(jìn)行組合即可得到最終的區(qū)間預(yù)測(cè)結(jié)果.將最終預(yù)測(cè)結(jié)果分別與3種匯率數(shù)據(jù)的實(shí)際值進(jìn)行對(duì)比,上下界的預(yù)測(cè)效果如圖3所示.可見預(yù)測(cè)值與實(shí)際值之間的變動(dòng)趨勢(shì)基本一致,模型的預(yù)測(cè)精度較高.
圖3 該模型預(yù)測(cè)效果圖
為了驗(yàn)證論文所提方法的有效性,將論文模型與另外8個(gè)相關(guān)的預(yù)測(cè)模型進(jìn)行比較,采用IMSE,IMAE和IMAPE 3個(gè)評(píng)價(jià)指標(biāo)進(jìn)行誤差檢驗(yàn),結(jié)果如表1所示.
表1 各模型預(yù)測(cè)誤差評(píng)價(jià)指標(biāo)對(duì)比
(1)與不同影響因素的對(duì)比.為了比較不同影響因素對(duì)匯率預(yù)測(cè)的影響,在論文方法的基礎(chǔ)上,將論文模型與只考慮VIX+外匯新聞的模型和不考慮任何影響因素的模型進(jìn)行對(duì)比,分別記為VIX+外匯新聞-IEMD-組合預(yù)測(cè)方法和IEMD-組合預(yù)測(cè)方法,如表1中(1)和(2)所示.可見,論文所提出的考慮了VIX+外匯新聞+GFI的模型在所有指標(biāo)下都具有最好的預(yù)測(cè)效果,體現(xiàn)了該模型的有效性;然后,與未考慮GFI的模型相比,考慮了GFI的模型預(yù)測(cè)效果更好,這說(shuō)明將GFI添加到模型中參與預(yù)測(cè)有助于提高匯率的預(yù)測(cè)精度;最后,將只考慮了“VIX+外匯新聞”的模型(1)和沒有考慮任何影響因素的模型(2)對(duì)比,前者預(yù)測(cè)效果更好,說(shuō)明將外匯新聞中涵蓋的市場(chǎng)情緒量化,并結(jié)合VIX指數(shù)參與預(yù)測(cè),可以有效改善匯率區(qū)間序列的預(yù)測(cè)效果.
(2)與不進(jìn)行區(qū)間分解的對(duì)比.將論文提出的IEMD區(qū)間分解方法與EMD簡(jiǎn)單分解方法進(jìn)行對(duì)比,記為VIX+外匯新聞+GFI-EMD-組合預(yù)測(cè)方法,如表1中(6)所示,表明作者所提出的IEMD區(qū)間分解方法可以為匯率預(yù)測(cè)提供更多的有效信息,從而提高預(yù)測(cè)精度.
(3)與單項(xiàng)預(yù)測(cè)方法的對(duì)比.基于論文預(yù)測(cè)模型,對(duì)分解重構(gòu)后具有不同尺度特征的子序列采用單項(xiàng)預(yù)測(cè)方法進(jìn)行預(yù)測(cè),記為VIX+外匯新聞+GFI-IEMD-ELM 方法、VIX+外匯新聞+GFI-IEMD-MLP方法和VIX+外匯新聞+GFI-IEMD-RF方法.對(duì)比結(jié)果如表1中(3)~(5)所示.其中,采用MLP進(jìn)行單項(xiàng)預(yù)測(cè)的模型誤差最高,效果最差.而采用RF進(jìn)行單項(xiàng)預(yù)測(cè)的模型效果最好,這體現(xiàn)了單項(xiàng)預(yù)測(cè)方法的不穩(wěn)定性.此外,論文模型的各項(xiàng)誤差評(píng)價(jià)指標(biāo)均明顯低于上述3種單項(xiàng)預(yù)測(cè)方法,這表明對(duì)匯率序列進(jìn)行區(qū)間分解和重構(gòu),進(jìn)而根據(jù)不同分量的頻率特征選擇不同的方法對(duì)其進(jìn)行組合預(yù)測(cè),能夠更有效地?cái)M合序列的變化趨勢(shì)和細(xì)節(jié)波動(dòng),從而提高預(yù)測(cè)的準(zhǔn)確性.
(4)與已有預(yù)測(cè)模型的對(duì)比.將論文模型與其他預(yù)測(cè)匯率相關(guān)文獻(xiàn)中使用過的模型EMD-MLP[27]以及EEMD-SVR[28]進(jìn)行比較分析,對(duì)比結(jié)果如表1中(7)和(8)所示,可以看出,論文模型的預(yù)測(cè)誤差要明顯低于EMD-MLP和EEMD-SVR模型,體現(xiàn)了論文模型的合理性.
針對(duì)匯率數(shù)據(jù)的高波動(dòng)性、不確定性特征以及傳統(tǒng)區(qū)間分解方法存在的缺陷,論文提出了一種基于新聞情感分析和區(qū)間分解的匯率預(yù)測(cè)方法.首先,基于Snownlp情感詞典將爬取的外匯新聞標(biāo)題量化為情緒評(píng)分,并利用疫情數(shù)據(jù)構(gòu)建GFI指標(biāo),與VIX指數(shù)一起作為匯率時(shí)間序列的影響因子;其次,使用IEMD和EMD分別對(duì)匯率區(qū)間數(shù)據(jù)和影響因子進(jìn)行分解,并根據(jù)樣本熵重構(gòu)得到高、中、低頻區(qū)間序列和一個(gè)殘差項(xiàng);然后,將對(duì)應(yīng)頻率的匯率區(qū)間序列和影響因素序列進(jìn)行組合,并對(duì)不同特征的序列采取合適的預(yù)測(cè)方法;最后,通過實(shí)證對(duì)比分析,證明論文模型預(yù)測(cè)精度較高,對(duì)于匯率的突發(fā)波動(dòng)能夠及時(shí)、準(zhǔn)確地進(jìn)行擬合,適用于疫情沖擊下的匯率區(qū)間時(shí)間序列預(yù)測(cè),與已有研究相比具有更高的預(yù)測(cè)精度和穩(wěn)定性.
綜上所述,該研究具有以下3個(gè)方面的優(yōu)勢(shì):①在預(yù)測(cè)因子上,選取了反映市場(chǎng)情緒的外匯新聞和VIX指數(shù),此外還引入GFI來(lái)量化疫情的影響,為重大事件下的匯率預(yù)測(cè)提供了有效參考.②提出了針對(duì)區(qū)間序列的分解方法,并取得了良好的預(yù)測(cè)效果,說(shuō)明該方法可以為預(yù)測(cè)提供更多的有效信息,更具現(xiàn)實(shí)意義.③在預(yù)測(cè)階段,根據(jù)不同序列的尺度特征,選取合適的方法對(duì)其進(jìn)行組合預(yù)測(cè).對(duì)比分析結(jié)果表明該方法比單項(xiàng)預(yù)測(cè)方法更加穩(wěn)定有效.此外,論文所提出的區(qū)間分解方法還可以應(yīng)用于其他區(qū)間時(shí)間序列的預(yù)測(cè)中,如碳價(jià)格預(yù)測(cè)、空氣質(zhì)量預(yù)測(cè)等.
論文的研究還存在一定的不足,匯率的波動(dòng)是各種復(fù)雜因素綜合影響的結(jié)果,而論文提出的模型無(wú)法涵蓋所有的影響因素.因此,在未來(lái)的研究中可以考慮加入更多其他的影響因素,以提高匯率的預(yù)測(cè)效果.