王吉祥 過(guò)弋 戚天梅 王志宏 李真 湯敏偉
摘 要:針對(duì)目前人民幣匯率預(yù)測(cè)研究存在的數(shù)據(jù)源單一導(dǎo)致難以提升預(yù)測(cè)效果的問(wèn)題,提出一種嵌入互聯(lián)網(wǎng)輿情強(qiáng)度的預(yù)測(cè)技術(shù),通過(guò)融合多方面數(shù)據(jù)源進(jìn)行對(duì)比分析,有效降低了人民幣匯率的預(yù)測(cè)誤差。首先,融合互聯(lián)網(wǎng)外匯新聞數(shù)據(jù)和歷史行情數(shù)據(jù),并將多源文本數(shù)據(jù)轉(zhuǎn)化為可計(jì)算的特征向量;其次,通過(guò)情感特征向量構(gòu)建五種特征組合并對(duì)其進(jìn)行對(duì)比,給出了嵌入互聯(lián)網(wǎng)輿情強(qiáng)度的特征組合作為預(yù)測(cè)模型輸入;最后,設(shè)計(jì)外匯輿情影響匯率預(yù)測(cè)的滑動(dòng)時(shí)間窗口,建立基于機(jī)器學(xué)習(xí)的匯率預(yù)測(cè)模型。實(shí)驗(yàn)結(jié)果表明,嵌入互聯(lián)網(wǎng)輿情的特征組合相對(duì)于不含輿情的特征組合在均方根誤差(RMSE)和平均絕對(duì)誤差(MAE)上分別提升了9.8%和16.2%;此外,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)預(yù)測(cè)模型比支持向量回歸(SVR)、決策回歸(DT)和深度神經(jīng)網(wǎng)絡(luò)(DNN)預(yù)測(cè)模型表現(xiàn)更好。
關(guān)鍵詞:機(jī)器學(xué)習(xí);文本向量化;輿情影響力;匯率預(yù)測(cè);滑動(dòng)時(shí)間窗口
中圖分類號(hào):TP391
文獻(xiàn)標(biāo)志碼:A
RMB exchange rate forecast embedded with Internet public opinion intensity
WANG Jixiang1, GUO Yi1,2,3*, QI Tianmei1, WANG Zhihong1, LI Zhen4, TANG Minwei4
1.School of Information Science and Engineering, East University of Science and Technology, Shanghai 200237, China;
2.National Engineering Laboratory for Big Data Distribution and Exchange Technologies, Shanghai 200237, China;
3.Shanghai Engineering Research Center of Big Data and Internet Audience, Shanghai 200072, China;
4.Department of Risk Management, China Telecom BestPay Company Limited, Shanghai 200085, China
Abstract:
Aiming at the low prediction effect caused by single data source in the current RMB exchange rate forecast research, a forecast technology based on Internet public opinion intensity was proposed. By comparing and analyzing various data sources, the forecast error of RMB exchange rate was effectively reduced. Firstly, the Internet foreign exchange news data and historical market data were fused, and the multisource text data were converted into the computable vectors. Secondly, five feature combinations based on sentiment feature vectors were constructed and compared, and the feature combination embedded with intensity of Internet public opinion was given as the input of forecast models. Finally, a temporal sliding window of foreign exchange public opinion data was designed, and an exchange rate forecast model based on machine learning was built. Experimental results show that feature combination embedded with Internet public opinion outperforms the feature combination without public opinion by 9.8% and 16.2% in Root Mean Squared Error (RMSE) and Mean Squared Error (MAE). At the same time, the forecast model based on Long ShortTerm Memory network (LSTM) is better than that based on Support Vector Regression (SVR), Decision Tree regression (DT) and Deep Neural Network (DNN).
Key words:
machine learning; text embedding; public opinion impact; exchange rate forecast; temporal sliding window
0?引言
人民幣匯率預(yù)測(cè)一直是廣大學(xué)者和研究者關(guān)注的話題與方向。近年來(lái)中美貿(mào)易失衡有加劇的趨勢(shì),美國(guó)政府將其對(duì)中國(guó)巨額貿(mào)易赤字的根源歸咎于人民幣幣值的低估,并將人民幣兌美元匯率視為影響中美雙方經(jīng)貿(mào)關(guān)系的焦點(diǎn)問(wèn)題[1], 因此,在當(dāng)下人民幣匯率雙向波動(dòng)和彈性擴(kuò)大的環(huán)境中,對(duì)人民幣匯率進(jìn)行有效預(yù)測(cè),對(duì)于指導(dǎo)個(gè)人投資行為、幫助企業(yè)制定科學(xué)的國(guó)際貿(mào)易決策以及國(guó)家外匯儲(chǔ)備資產(chǎn)管理和外匯風(fēng)險(xiǎn)防范都有著重要的意義[2]。
人民幣匯率走勢(shì)的預(yù)測(cè)及分析是許多金融領(lǐng)域?qū)W者們關(guān)注并研究的方向,但是結(jié)合輿情數(shù)據(jù)去預(yù)測(cè)短期內(nèi)人民幣匯率的漲幅卻少有研究。多數(shù)文獻(xiàn)對(duì)人民幣匯率的研究是利用宏觀經(jīng)濟(jì)學(xué)與計(jì)量統(tǒng)計(jì)學(xué)的模型去擬合人民幣匯率的曲線,但是這種方法不能預(yù)測(cè)匯率在外界金融事件和輿情影響下的波動(dòng)。實(shí)際上,影響匯率的諸多因素中除了定量的實(shí)際觀測(cè)數(shù)據(jù),像輿情這類非結(jié)構(gòu)化的定性數(shù)據(jù)也具有很大的影響力。互聯(lián)網(wǎng)的快速發(fā)展,提升了輿情傳播對(duì)經(jīng)濟(jì)社會(huì)的影響力。尤其是各種新型網(wǎng)絡(luò)平臺(tái)的出現(xiàn),使信息的傳播更加快速,滲透更為深刻。網(wǎng)絡(luò)輿情數(shù)據(jù)不僅對(duì)股票價(jià)格[3]和商品價(jià)格有影響,對(duì)外匯匯率也有極大的影響。
為了應(yīng)對(duì)上述挑戰(zhàn),本文在融合了互聯(lián)網(wǎng)輿情數(shù)據(jù)和人民幣匯率歷史數(shù)據(jù)的基礎(chǔ)上,設(shè)計(jì)輿情影響人民幣匯率預(yù)測(cè)的滑動(dòng)時(shí)間窗口并構(gòu)建預(yù)測(cè)模型。本文主要貢獻(xiàn)如下:
1)嵌入互聯(lián)網(wǎng)輿情情感,并對(duì)比詞向量、情感極性、情感強(qiáng)度等不同嵌入方式的預(yù)測(cè)效果;
2)根據(jù)輿情時(shí)效性較短的特點(diǎn),設(shè)計(jì)了輸入向量滑動(dòng)窗口和預(yù)測(cè)滯后滑動(dòng)窗口;
3)在真實(shí)的人民幣匯率數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),驗(yàn)證本文提出的方法能夠提高預(yù)測(cè)效果。
1?相關(guān)工作
1.1?輿情影響力
輿情事件在互聯(lián)網(wǎng)中的發(fā)展像生物一樣會(huì)經(jīng)歷出生、成長(zhǎng)、衰老和死亡的過(guò)程。某一輿情事件的發(fā)生,通常會(huì)伴隨網(wǎng)絡(luò)輿情信息的傳播。文獻(xiàn)[4]提到公共危機(jī)事件的網(wǎng)絡(luò)輿情生命周期有潛伏期、成長(zhǎng)期、爆發(fā)期和平息期。文獻(xiàn)[5]的實(shí)驗(yàn)曲線趨勢(shì)表明,輿情參與人數(shù)和轉(zhuǎn)發(fā)頻次的演化特征幾乎一致。網(wǎng)絡(luò)輿情的傳播會(huì)在前期爆發(fā)時(shí)到達(dá)一個(gè)高峰,消退一段時(shí)間后還會(huì)漲到另一個(gè)高峰,在這之后一段時(shí)間會(huì)慢慢削弱。
行為經(jīng)濟(jì)學(xué)表明,公眾輿論深刻影響個(gè)人行為和決策[6]。文獻(xiàn)[7]表明網(wǎng)絡(luò)輿情通過(guò)影響入市資金流進(jìn)一步影響股市行情;文獻(xiàn)[8]證實(shí)并分析了基于微博的投資者情緒對(duì)股票市場(chǎng)的影響,輿情可以在一定程度上預(yù)測(cè)股票價(jià)格;文獻(xiàn)[9]將非結(jié)構(gòu)化文本數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化的特征向量矩陣,與股票的收益率建立支持向量回歸(Support Vector Regression, SVR),研究結(jié)果表明,預(yù)測(cè)的股價(jià)漲跌趨勢(shì)與實(shí)際趨勢(shì)基本吻合,可以通過(guò)分析網(wǎng)絡(luò)輿情來(lái)對(duì)股市未來(lái)發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè);文獻(xiàn)[10]分別從社交媒體和財(cái)經(jīng)新聞中的文本信息中捕捉社會(huì)情感和專業(yè)意見(jiàn),然后通過(guò)張量表示由這兩個(gè)信息源組成的整個(gè)市場(chǎng)信息空間以及公司特征。實(shí)驗(yàn)表明與傳統(tǒng)的基于矢量的系統(tǒng)相比,從多信息源的聯(lián)合效應(yīng)角度研究社會(huì)情緒作用的智能系統(tǒng)更有效。上述的文獻(xiàn)足以說(shuō)明網(wǎng)絡(luò)輿情的直接影響力非常之大,能夠影響人民幣匯率并能在預(yù)測(cè)方面作出貢獻(xiàn)。然而沒(méi)有文獻(xiàn)給出輿情影響力與時(shí)間的具體函數(shù)關(guān)系,無(wú)法量化輿情具體的影響力值。
1.2?價(jià)格預(yù)測(cè)模型
學(xué)者們對(duì)于人民幣匯率預(yù)測(cè)模型研究文獻(xiàn)較少,所以作者也查閱了股票價(jià)格預(yù)測(cè)的文獻(xiàn)。研究者們多數(shù)利用機(jī)器學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)來(lái)研究對(duì)價(jià)格的預(yù)測(cè)。機(jī)器學(xué)習(xí)算法主要包括支持向量回歸(SVR)和人工神經(jīng)網(wǎng)絡(luò)等。文獻(xiàn)[2]運(yùn)用SVR方法對(duì)人民幣匯率進(jìn)行實(shí)證預(yù)測(cè),結(jié)果表明基于SVR的匯率預(yù)測(cè)方法在預(yù)測(cè)精度和穩(wěn)定性方面優(yōu)于對(duì)照模型,更能體現(xiàn)匯率行為所反映的經(jīng)濟(jì)因素;文獻(xiàn)[11]驗(yàn)證了SVR有助于使用機(jī)器人技術(shù)自動(dòng)作出外匯市場(chǎng)中買(mǎi)/賣(mài)的交易決策;文獻(xiàn)[12]從Twitter捕獲1-170-414個(gè)數(shù)據(jù)點(diǎn),并使用文本挖掘方法提取情緒并應(yīng)用于SVR提高預(yù)測(cè)效果;文獻(xiàn)[13]使用帶有延遲因子的前饋神經(jīng)網(wǎng)絡(luò)能較好地預(yù)測(cè)短期的外匯匯率。隨著深度學(xué)習(xí)的快速發(fā)展,其應(yīng)用變得更加廣泛,尤其是卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)算法和循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)算法等。文獻(xiàn)[14]表明與機(jī)器學(xué)習(xí)方法相比,基于CNN的預(yù)測(cè)模型可以有效提高長(zhǎng)期預(yù)測(cè)的準(zhǔn)確性;基于RNN和門(mén)控遞歸單位的模型[15]來(lái)預(yù)測(cè)中國(guó)股市的股票能夠獲得良好的預(yù)測(cè)性能;文獻(xiàn)[16]使用在線股票論壇的信息融合股票市場(chǎng)數(shù)據(jù),通過(guò)RNN實(shí)現(xiàn)預(yù)測(cè),實(shí)驗(yàn)結(jié)果表明模型在帶情感的數(shù)據(jù)上表現(xiàn)明顯更好。
綜合上述文獻(xiàn),學(xué)者們?cè)陬A(yù)測(cè)人民幣匯率上已有多方面的研究與實(shí)驗(yàn),但仍有空白之處: 第一,沒(méi)有將外匯輿情數(shù)據(jù)作為人民幣匯率預(yù)測(cè)的基礎(chǔ),忽略了匯率受外界事件的影響?;ヂ?lián)網(wǎng)外匯輿情的影響力不容小覷; 第二,缺少外匯輿情影響人民幣匯率的滑動(dòng)時(shí)間窗口,忽略了輿情的時(shí)效性和情感特點(diǎn)。隨著時(shí)間的增加,輿情影響力會(huì)有不同的變化且有延遲現(xiàn)象, 設(shè)計(jì)外匯輿情影響匯率預(yù)測(cè)的滑動(dòng)時(shí)間窗口能夠改善這個(gè)問(wèn)題, 所以本文將重點(diǎn)研究設(shè)計(jì)外匯輿情影響人民幣匯率預(yù)測(cè)的滑動(dòng)時(shí)間窗口以及融合網(wǎng)絡(luò)輿情數(shù)據(jù)和歷史行情數(shù)據(jù),利用機(jī)器學(xué)習(xí)方法構(gòu)建人民幣匯率預(yù)測(cè)模型,最后對(duì)比四組預(yù)測(cè)算法并進(jìn)行分析與評(píng)估。
2?準(zhǔn)備性研究工作
2.1?數(shù)據(jù)準(zhǔn)備
本文實(shí)驗(yàn)的數(shù)據(jù)均通過(guò)Python編寫(xiě)的爬蟲(chóng)工具采集。目前具有較大影響力的財(cái)經(jīng)資訊網(wǎng)站主要包括華爾街見(jiàn)聞(https://wallstreetcn.com)、路透社、彭博新聞社等。華爾街見(jiàn)聞作為一個(gè)綜合多信息源的集成者,在其相關(guān)領(lǐng)域具有很大的參考價(jià)值,因此本文將其作為實(shí)驗(yàn)研究的數(shù)據(jù)源。本文實(shí)驗(yàn)采用2016-06-30—2017-12-29共369個(gè)交易日的歷史行情數(shù)據(jù)和外匯輿情數(shù)據(jù)。
歷史行情數(shù)據(jù)示例如表1所示,字段包含時(shí)間和人民幣匯率(美元兌人民幣)?;ヂ?lián)網(wǎng)外匯新聞數(shù)據(jù)示例如表2所示,采集的字段有包括發(fā)布時(shí)間和新聞內(nèi)容。
發(fā)布時(shí)間新聞內(nèi)容
2016-06-30T15:23新浪援引外媒稱,中國(guó)央行愿意讓人民幣匯率在今年降至1美元兌6.8元
2016-06-30T17:07BBH高級(jí)副總裁Marc Chandler:英鎊的走勢(shì)和基本面并沒(méi)有關(guān)系,反彈的原因是空頭平倉(cāng)以及機(jī)構(gòu)投資者在月末和季末調(diào)整倉(cāng)位
2016-06-30T18:10MBM研究團(tuán)隊(duì)首席研究員Richard Cox:瑞士央行如市場(chǎng)預(yù)期維持了其擴(kuò)張性的貨幣政策,理事會(huì)主席Thomas Jordan也承認(rèn)負(fù)利率政策還將會(huì)維持一段時(shí)間
2016-07-01T16:20【提醒】北京時(shí)間16:30將公布英國(guó)6月制造業(yè)PMI
2.2?數(shù)據(jù)預(yù)處理
本文的互聯(lián)網(wǎng)輿情數(shù)據(jù)的預(yù)處理主要包括:對(duì)文本進(jìn)行分詞、替換文本中特殊符號(hào)、去除低頻詞和停用詞等。
實(shí)驗(yàn)采用jieba分詞工具,它的分詞模式有三種:精確模式、全模式和搜索引擎模式。精確模式試圖將句子最精確地切開(kāi),適合文本分析,并且速度非常之快。
在信息檢索和自然語(yǔ)言處理的過(guò)程中,為了節(jié)省存儲(chǔ)空間和提高檢索效率,需要過(guò)濾掉一些對(duì)當(dāng)前實(shí)驗(yàn)無(wú)用且沒(méi)有含義的字詞和符號(hào),這些字詞和符號(hào)就叫作停用詞。本實(shí)驗(yàn)采用的是哈爾濱工業(yè)大學(xué)停用詞表和百度停用詞表的結(jié)合。
2.3?文本數(shù)據(jù)特征化
本文的互聯(lián)網(wǎng)外匯輿情數(shù)據(jù)來(lái)源于華爾街見(jiàn)聞,爬取的新聞數(shù)據(jù)包含了諸多與外匯領(lǐng)域有關(guān)的情感詞及其情感強(qiáng)度。本文利用公共情感分析工具將互聯(lián)網(wǎng)新聞數(shù)據(jù)處理成特征向量,并將其作為預(yù)測(cè)模型的輸入來(lái)預(yù)測(cè)人民幣匯率,具體分析流程如圖1所示。
為了探究互聯(lián)網(wǎng)輿情對(duì)人民幣預(yù)測(cè)的影響,本文分別將數(shù)據(jù)處理成5種特征維度的數(shù)據(jù),如表3所示,其中:PT代表人民幣歷史匯率特征,PT&WV代表人民幣歷史匯率和新聞詞向量的特征組合,PT&PV代表人民幣歷史匯率和新聞情感極性值的特征組合,PT&QV代表人民幣歷史匯率和新聞情感強(qiáng)度值的特征組合,PT&CQ代表人民幣歷史匯率和新聞情感強(qiáng)度的變化值的特征組合。
3?美元兌人民幣匯率預(yù)測(cè)模型實(shí)現(xiàn)
本文實(shí)驗(yàn)的技術(shù)路線第一階段如圖2所示,第二階段如圖3所示。
本文首先采集互聯(lián)網(wǎng)外匯輿情數(shù)據(jù)和人民幣歷史行情數(shù)據(jù),并將文本型數(shù)據(jù)處理成特征向量; 進(jìn)而設(shè)計(jì)了滑動(dòng)時(shí)間窗口以探究輿情對(duì)匯率預(yù)測(cè)的影響; 接著基于機(jī)器學(xué)習(xí)構(gòu)建人民幣匯率預(yù)測(cè)模型,包括SVR[17]、決策樹(shù)回歸(Decision Tree regression, DT)[18]、深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network, DNN)[19]和長(zhǎng)短期記憶網(wǎng)絡(luò)(Long ShortTerm Memory network, LSTM)[20]; 最后對(duì)預(yù)測(cè)模型進(jìn)行對(duì)比和評(píng)估。
3.1?特征組合的選擇
本文實(shí)驗(yàn)開(kāi)發(fā)環(huán)境為Pycharm64,開(kāi)發(fā)語(yǔ)言為Python3.6,操作系統(tǒng)為Windows 10。本次實(shí)驗(yàn)建立的SVR價(jià)格預(yù)測(cè)模型和DT價(jià)格預(yù)測(cè)模型,直接使用了Python自帶的Sklearn[21]里的工具包,DNN和LSTM模型在Keras框架上實(shí)現(xiàn)。
回歸算法的常用評(píng)估方法有均方根誤差(Root Mean Squared Error, RMSE)和平均絕對(duì)誤差(Mean Absolute Error, MAE),見(jiàn)式(1)和式(2)。RMSE和MAE越小,代表預(yù)測(cè)的誤差越小,預(yù)測(cè)效果越好。
RMSE=∑mi=1(yt-yt′)2m(1)
MAE=∑mi=1yt-yt′m(2)
其中:m為樣本數(shù)量,y為標(biāo)簽值,y′為預(yù)測(cè)的真實(shí)值。
為了對(duì)比分析五種特征組合對(duì)人民幣匯率預(yù)測(cè)結(jié)果的影響力,分別用以上兩種評(píng)價(jià)指標(biāo)對(duì)其進(jìn)行評(píng)估。以LSTM算法為例(采樣時(shí)間為30min),其他參數(shù)均為默認(rèn)值,滑動(dòng)窗口分別為1,2,…,80。
由表4均值可得,PT&CQ和PT&QV的RMSE相對(duì)最小,相比于PT提高了9.8%。說(shuō)明歷史行情數(shù)據(jù)加上情感強(qiáng)度及其變化值的特征組合RMSE效果最好。PT& CQ的MAE相對(duì)其他數(shù)據(jù)來(lái)說(shuō)較低,相比于PT降低了16.2%。說(shuō)明加上情感強(qiáng)度值變化的數(shù)據(jù)表現(xiàn)效果最好。
綜上所述,融合外匯領(lǐng)域互聯(lián)網(wǎng)輿情數(shù)據(jù)的混合特征組合(PT&WV、PT&PV、PT&QV和PT&CQ)比僅含有歷史行情數(shù)據(jù)的預(yù)測(cè)效果要更好。而在這些混合特征組合中, PT&WV包含了互聯(lián)網(wǎng)外匯新聞的詞向量特征,計(jì)算了每條新聞中的所有詞匯的詞向量。這使PT&WV含有更多的信息量,實(shí)驗(yàn)證實(shí)了其效果比PT要好。PT&CQ的RMSE值和MAE值都相對(duì)較低。由于PT&CQ包含了互聯(lián)網(wǎng)外匯輿情的強(qiáng)度值的變化,能夠較好地反映出互聯(lián)網(wǎng)輿情的情感變化情況,因此對(duì)人民幣匯率的預(yù)測(cè)幫助較大。接下來(lái)將基于預(yù)測(cè)效果最好的PT&CQ特征組合進(jìn)行實(shí)驗(yàn)。
3.2?輸入向量窗口的設(shè)定
訓(xùn)練模型輸入的向量中包含的時(shí)間節(jié)點(diǎn)越多能表達(dá)越多的信息量,但是窗口太大會(huì)增加算法復(fù)雜度從而影響模型的運(yùn)行效率, 所以本文仍需尋找一個(gè)最優(yōu)的時(shí)間節(jié)點(diǎn)個(gè)數(shù)作為滑動(dòng)窗口的大小。本節(jié)除采用PT&CQ作為輸入向量外,其余實(shí)驗(yàn)配置和參數(shù)設(shè)置均與3.1節(jié)相同。
從圖4可得,PT&CQ預(yù)測(cè)結(jié)果的RMSE在窗口值為[1,5]時(shí)較小,值在0.003-5附近波動(dòng)。窗口值為[5,70]逐漸上升到最大值,隨后略有下降并在0.005值上下波動(dòng)??紤]到能夠盡量多地輸入時(shí)間點(diǎn)特征為模型提供更多的信息量,本文將訓(xùn)練模型的最佳輸入窗口值定為5。
3.3?預(yù)測(cè)滯后窗口的設(shè)定
由3.2節(jié)的實(shí)驗(yàn)結(jié)果得知,訓(xùn)練模型時(shí)輸入向量的窗口為5預(yù)測(cè)效果最好。此時(shí),訓(xùn)練輸入的特征維度包括5個(gè)時(shí)間節(jié)點(diǎn)的特征(每個(gè)時(shí)間節(jié)點(diǎn)特征為44維),用這些特征維度去預(yù)測(cè)第6個(gè)時(shí)間節(jié)點(diǎn)和第7個(gè)時(shí)間節(jié)點(diǎn)將得到不一樣的預(yù)測(cè)結(jié)果。所以在得知最優(yōu)訓(xùn)練輸入窗口的情況下,本文仍需尋找最優(yōu)的預(yù)測(cè)滯后窗口。由于訓(xùn)練輸入窗口為5,按常理可知預(yù)測(cè)滯后窗口不應(yīng)該大于5,即在[0,5]中尋找最優(yōu)的預(yù)測(cè)滯后窗口。本節(jié)的實(shí)驗(yàn)配置與參數(shù)設(shè)置與3.1節(jié)的實(shí)驗(yàn)相同。
從表5可得,在數(shù)據(jù)訓(xùn)練輸入窗口為5并采取不同預(yù)測(cè)滯后窗口時(shí),預(yù)測(cè)結(jié)果的RMSE值在窗口值的整個(gè)取值區(qū)間逐漸增大,最小值為0.022-3,最大值為0.056-0。MAE值表現(xiàn)相似,在區(qū)間內(nèi)逐漸增大,最小值為0.014-2,最大值為0.040-4。綜合表現(xiàn)結(jié)果來(lái)看,預(yù)測(cè)滯后窗口值為0時(shí)效果最好。
預(yù)測(cè)滯后窗口較小時(shí)預(yù)測(cè)結(jié)果的RMSE和MAE值較低。這樣的結(jié)果可能是由于滯后的窗口越大,窗口中的信息被拋棄,使得模型訓(xùn)練時(shí)遺失了距離預(yù)測(cè)時(shí)間點(diǎn)最近的信息,從而導(dǎo)致了預(yù)測(cè)結(jié)果不理想。
3.4?預(yù)測(cè)模型參數(shù)尋優(yōu)
本文實(shí)驗(yàn)的預(yù)測(cè)模型選取了SVR、DT、DNN和LSTM四種方法進(jìn)行對(duì)比分析。SVR的核函數(shù)為徑向基函數(shù),DT的樹(shù)深為20,其他參數(shù)都采用了默認(rèn)的參數(shù)。在DNN和LSTM模型中,一般認(rèn)為增加隱層數(shù)可以降低網(wǎng)絡(luò)誤差,提高精度,但也使網(wǎng)絡(luò)復(fù)雜化,從而增加了網(wǎng)絡(luò)的訓(xùn)練時(shí)間和出現(xiàn)“過(guò)擬合”的傾向。所以本文實(shí)驗(yàn)在設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)層數(shù)時(shí)考慮3層網(wǎng)絡(luò)(有2個(gè)隱層),靠調(diào)節(jié)隱層節(jié)點(diǎn)數(shù)來(lái)獲得較低的誤差,這樣的訓(xùn)練效果要比增加隱層數(shù)更容易實(shí)現(xiàn)[22]。
如何尋找這個(gè)最佳隱節(jié)點(diǎn)數(shù),學(xué)者們給出了一些方案,見(jiàn)式(3)~(5):
∑ni=0Cin1>k(3)
其中:k為樣本量,n1為隱層節(jié)點(diǎn)數(shù), n為輸入層節(jié)點(diǎn)數(shù)。當(dāng)i>n1時(shí),Cin1=0。
n1=(n+m)12+a (4)
其中:n為輸入層節(jié)點(diǎn)數(shù),m為輸出層節(jié)點(diǎn)數(shù),a為1~10的常數(shù)。
n1=lbn(5)
本文實(shí)驗(yàn)利用式(4)計(jì)算出隱節(jié)點(diǎn)個(gè)數(shù)的取值范圍,再進(jìn)行實(shí)驗(yàn)選擇最優(yōu)的隱節(jié)點(diǎn)數(shù)目。實(shí)驗(yàn)以LSTM為例,3層網(wǎng)絡(luò)結(jié)構(gòu),輸入層節(jié)點(diǎn)數(shù)為44,輸出層節(jié)點(diǎn)數(shù)為1,所以隱層節(jié)點(diǎn)數(shù)取7~17。
由表6可得,在隱節(jié)點(diǎn)數(shù)為[7,17]的整個(gè)取值區(qū)間中,RMSE值和MAE值都不是很穩(wěn)定,波動(dòng)起伏較大。當(dāng)隱節(jié)點(diǎn)數(shù)為13時(shí),RMSE值和MAE值最小,那么將最優(yōu)隱節(jié)點(diǎn)的個(gè)數(shù)取為13是較為合理的決定。
4?實(shí)驗(yàn)與結(jié)果分析
本文實(shí)驗(yàn)的數(shù)據(jù)是2016-6-30—2017-12-29共369個(gè)交易日的行情數(shù)據(jù)和互聯(lián)網(wǎng)新聞?shì)浨閿?shù)據(jù)。對(duì)比四種機(jī)器學(xué)習(xí)的預(yù)測(cè)模型,訓(xùn)練集和測(cè)試集的比例為10∶1,DNN和LSTM網(wǎng)絡(luò)模型的網(wǎng)絡(luò)層數(shù)為3,隱節(jié)點(diǎn)數(shù)為13。訓(xùn)練模型輸入窗口值取5,預(yù)測(cè)滯后窗口取0。分別用不同的采樣區(qū)間的數(shù)據(jù)做實(shí)驗(yàn),得到如圖5、6結(jié)果所示。
從圖5和圖6可以得到,SVR在采樣區(qū)間120min時(shí)效果最好;DT在采樣區(qū)間15min時(shí)效果相對(duì)較好;DNN在采樣區(qū)間為60min時(shí)效果最好,RMSE和MAE都最小;LSTM采樣區(qū)間為5min時(shí)效果最好,RMSE和MAE都是最低值。
SVR的原理是在高維空間中尋找出一個(gè)曲面進(jìn)行分類,但是由于本文數(shù)據(jù)的稀疏性,很難精準(zhǔn)地尋到這樣的高維曲面。DT可能更適用于特征維度不相關(guān)的數(shù)據(jù),本文的實(shí)驗(yàn)數(shù)據(jù)特征之間并不是完全獨(dú)立的,這極大地影響了DT的算法效果。DNN是最簡(jiǎn)單的神經(jīng)網(wǎng)絡(luò)模型,沒(méi)有處理序列關(guān)系的功能。LSTM模型能夠捕捉長(zhǎng)序列關(guān)系,學(xué)習(xí)保留需要的信息,遺忘不需要的信息,更符合本文含有時(shí)間序列特征的數(shù)據(jù),所以LSTM比DNN表現(xiàn)出更好的人民幣匯率預(yù)測(cè)效果。綜合對(duì)比四種預(yù)測(cè)模型,LSTM的RMSE值和MAE值相對(duì)較小,是四個(gè)預(yù)測(cè)模型中預(yù)測(cè)效果最好的模型。
5?結(jié)語(yǔ)
本文將外匯歷史行情數(shù)據(jù)與互聯(lián)網(wǎng)外匯新聞數(shù)據(jù)融合作為預(yù)測(cè)美元兌人民幣匯率的源數(shù)據(jù),研究了模型訓(xùn)練的輸入向量窗口和預(yù)測(cè)滯后窗口的合理設(shè)置,對(duì)比分析了外匯新聞更好表達(dá)情感并為預(yù)測(cè)算法作基礎(chǔ)的特征組合,最后對(duì)比分析了四種機(jī)器學(xué)習(xí)模型的預(yù)測(cè)效果。從實(shí)驗(yàn)中能夠發(fā)現(xiàn)加入外匯新聞數(shù)據(jù)比僅含有歷史行情數(shù)據(jù)預(yù)測(cè)未來(lái)匯率變化的效果更好,且將外匯新聞數(shù)據(jù)處理成情感強(qiáng)度變化值來(lái)預(yù)測(cè)人民幣匯率效果最好。模型訓(xùn)練的輸入向量窗口不宜過(guò)大,小窗口更能給出好的預(yù)測(cè)效果,實(shí)驗(yàn)給出的最優(yōu)結(jié)果是5。預(yù)測(cè)滯后窗口設(shè)置為0有助于預(yù)測(cè)人民幣匯率。相比其他預(yù)測(cè)模型,LSTM的RMSE值和MAE值都較小,預(yù)測(cè)效果更好。
由于本文構(gòu)建的外匯領(lǐng)域的新聞情感關(guān)鍵詞匯表較為簡(jiǎn)單、詞匯數(shù)量較少,導(dǎo)致構(gòu)建的情感向量維度很大一部分是數(shù)據(jù)為零(新聞內(nèi)容中沒(méi)有匹配到關(guān)鍵詞),這是本文實(shí)驗(yàn)的不足。實(shí)際上當(dāng)前外匯領(lǐng)域并沒(méi)有可用的具有領(lǐng)域特色的關(guān)鍵詞匯表,這對(duì)本文的實(shí)驗(yàn)也是一個(gè)挑戰(zhàn),未來(lái)希望能夠補(bǔ)充更多的外匯領(lǐng)域關(guān)鍵詞。另外,在對(duì)情感特征化的處理上本文采用了現(xiàn)有的公共情感分析工具,這對(duì)外匯領(lǐng)域的人民幣預(yù)測(cè)算法的適用性不是最佳的,未來(lái)將改進(jìn)情感分析算法以適用于外匯領(lǐng)域。目前本文對(duì)輸入向量窗口和預(yù)測(cè)滯后窗口的最優(yōu)值設(shè)定為定值,而對(duì)于波動(dòng)頻繁的人民幣匯率,自動(dòng)變化尋找最優(yōu)大小的滑動(dòng)窗口能夠達(dá)到更好的預(yù)測(cè)效果,這也是本文的未來(lái)工作之一。
參考文獻(xiàn) (References)
[1]秦喜文,張瑜,董小剛,等. 基于EEMD和SVR的人民幣匯率預(yù)測(cè)[J].東北師大學(xué)報(bào)(自然科學(xué)版), 2017, 49(2):47-51. (QIN X W, ZHANG Y, DONG X G, et al. Forecasting RMB exchange rate based on EEMD and SVR[J]. Journal of Northeast Normal University (Natural Science Edition), 2017, 49(2):47-51.)
[2]馬超. 人民幣匯率預(yù)測(cè)[D]. 濟(jì)南: 山東大學(xué), 2017:8-56. (MA C. RMB exchange rate forecast[D]. Jinan: Shandong University, 2017: 8-56.)
[3]FRSCHLER F, ALFANO S. Reading between the lines: The effect of language sentiment on economic indicators[C]// Proceedings of the 2017 Enterprise Applications, Markets and Services in the Finance Industry, LNBIP 276. Berlin: Springer, 2017:89-104.
[4]趙巖,王利明,楊菁. 公共危機(jī)事件網(wǎng)絡(luò)輿情生命周期特征分析及對(duì)策研究[J]. 經(jīng)濟(jì)研究參考, 2015(16):57-69. (ZHAO Y, WANG L M, YANG J. Analysis of the characteristics of public opinion cycle of public crisis events and its countermeasures[J]. Economic Research Reference, 2015(16):57-69.)
[5]丁潔. 基于社會(huì)網(wǎng)絡(luò)的網(wǎng)絡(luò)輿情演化研究[D]. 南京: 南京理工大學(xué), 2015:38-44. (DING J. Analysis on the evolution of online public opinion based on social network[D]. Nanjing: Nanjing University of Science and Technology, 2015: 38-44.)
[6]PAGOLU V S, REDDY K N, PANDA G, et al. Sentiment analysis of Twitter data for predicting stock market movements[C]// Proceedings of the 2016 International Conference on Signal Processing, Communication, Power and Embedded System. Piscataway: IEEE, 2016: 1345-1350.
[7]陳云松,嚴(yán)飛. 網(wǎng)絡(luò)輿情是否影響股市行情?基于新浪微博大數(shù)據(jù)的ARDL模型邊限分析[J]. 社會(huì), 2017, 37(2):51-73. (CHEN Y S, YAN F. Does online sentiment predict stock market indices? The ARDL bounds tests based on Sinamicroblog data[J]. Society, 2017, 37(2):51-73.)
[8]張信東,原東良. 基于微博的投資者情緒對(duì)股票市場(chǎng)影響研究[J]. 情報(bào)雜志, 2017, 36(8):81-87. (ZHANG X D, YUAN D L. Research on the impact of investor sentiment on stock market based on microblog[J]. Journal of Intelligence, 2017, 36(8):81-87.)
[9]朱昶勝,孫欣,馮文芳. 基于R語(yǔ)言的網(wǎng)絡(luò)輿情對(duì)股市影響研究[J]. 蘭州理工大學(xué)學(xué)報(bào), 2018, 44(4):103-108. (ZHU C S, SUN X, FENG W F. Study on the impact of network public opinion on the stock market based on Rlanguage[J]. Journal of Lanzhou University of Technology, 2018, 44(4):103-108.)
[10]LI Q, WANG J, WANG F, et al. The role of social sentiment in stock markets: a view from joint effects of multiple information sources[J]. Multimedia Tools and Applications, 2017, 76(10):12315-12345.
[11]THU T N T, XUAN V D. Using support vector machine in FoRex predicting[C]// Proceedings of the 2018 IEEE International Conference on Innovative Research and Development. Piscataway: IEEE, 2018:1-5.
[12]SEETO E W K, YANG Y. Market sentiment dispersion and its effects on stock return and volatility[J]. Electronic Markets, 2017, 27(3): 283–296.
[13]鄧景煒. 基于神經(jīng)網(wǎng)絡(luò)的外匯匯率預(yù)測(cè)研究[D]. 廣東: 暨南大學(xué), 2017:56-65. (DENG J W. Research on foreign exchange rate forecast based on neural network[D]. Guangdong: Jinan University, 2017: 56-65.)
[14]LIU C, HOU W, LIU D. Foreign exchange rates forecasting with convolutional neural network[J]. Neural Processing Letters, 2017, 46(3):1095-1119.
[15]CHEN W, ZHANG Y, YEO C K, et al. Stock market prediction using neural network through news on online social networks[C]// Proceedings of the 2017 International Smart Cities Conference. Piscataway: IEEE, 2017: 1-6.
[16]LIU Y, QIN Z, LI P, et al. Stock volatility prediction using recurrent neural networks with sentiment analysis[C]// Proceedings of the 2017 International Conference on Industrial, Engineering and Other Applications of Applied Intelligent Systems, LNCS 10350. Berlin: Springer, 2017: 192-201.
[17]AWAD M, KHANNA R. Support vector regression[J]. Neural Information Processing Letters and Reviews, 2007, 11(10):203-224.
[18]QUINLAN J R. Induction on decision tree[J]. Machine Learning, 1986, 1(1):81-106.
[19]SCHMIDHUBER J. Deep learning in neural networks: an overview[J]. Neural Networks, 2015, 61:85-117.
[20]SHI X, CHEN Z, WANG H, et al. Convolutional LSTM network: a machine learning approach for precipitation nowcasting[C]// Proceedings of the 28th International Conference on Neural Information Processing Systems. Cambridge, MA: MIT Press, 2015: 802-810.
[21]PEDREGOSA F, VAROQUAUX G, GRAMFORT A. Scikitlearn: machine learning in Python[J]. Journal of Machine Learning Research, 2011, 12:2825-2830.
[22]王嶸冰,徐紅艷,李波,等. BP神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點(diǎn)數(shù)確定方法研究[J]. 計(jì)算機(jī)技術(shù)與發(fā)展, 2018, 28(4): 31-35. (WANG R B, XU H Y, LI B, et al. Research on the method of determining hidden layer nodes in BP neural network[J]. Computer Technology and Development, 2018, 28(4):31-35.)
This work is partially supported by the National Key Research and Development Program of China (2018YFC0807105), the National Natural Science Foundation of China (61462073), the Scientific Research Project of Science and Technology Committee of Shanghai Municipality (17DZ1101003, 18511106602, 18DZ2252300).
WANG Jixiang, born in 1995, M. S. candidate. Her research interests include natural language processing, data mining.
GUO Yi, born in 1975, Ph. D., professor. His research interests include text mining, knowledge discovery.
QI Tianmei, born in 1994, M. S. candidate. Her research interests include natural language processing, data mining.
WANG Zhihong, born in 1990, Ph. D. candidate. His research interests include natural language processing, text mining.
LI Zhen, born in 1976, Ph. D. Her research interests include financial risk management, fraud risk prevention.
TANG Minwei, born in 1990, M. S. His research interests include abnormal event detection, malicious group recognition.