国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

在線社區(qū)支持傾向?qū)墒惺找婧筒▌拥挠绊憿?/h1>
2020-07-13 11:07:20李子饒
管理科學學報 2020年2期
關鍵詞:一致性收益率卷積

錢 宇,李子饒,李 強,袁 華

(電子科技大學經(jīng)濟與管理學院,成都 611731)

0 引 言

有效市場假說指出,資產(chǎn)價格能夠反映資產(chǎn)基礎價值的信息,信息的不斷揭示導致資產(chǎn)價格的變化[1].早期大量的文獻針對公司財務報告[2]、并購重組等重大事項公告[3]、分析師調(diào)研報告[4]等的信息披露,通過考察股票的短期市場反應,對有效市場假說進行了實證檢驗.然而,這些相對標準化的報告或公告不僅是按照特定的信息披露規(guī)則進行披露,而且通常是由上市公司官方或?qū)I(yè)的金融機構(gòu)進行發(fā)布.近年來,信息科技的飛速發(fā)展和深度融合把人們帶入大數(shù)據(jù)時代,數(shù)據(jù)呈現(xiàn)出體量大、多樣性、密度低、速率高等屬性特征[5].特別是社交媒體體驗分享的用戶生成內(nèi)容(user generated content, UGC),對投資者尤其是非專業(yè)的“個體投資者”的信息獲取與處理能力提出了巨大挑戰(zhàn).

越來越多的投資者通過在線金融社區(qū)(論壇、股吧)發(fā)表自己對于市場的評論,海量評論中蘊含著情緒和支持傾向等豐富的信息,并在以非專業(yè)投資者為主的用戶之間分享傳遞.有證據(jù)[6,7]表明,人與人在社會互動過程中的信息獲取與意見交換,以及樂觀或悲觀的情緒傳播,對投資者的金融決策具有重要影響[8].Antweiler和 Frank[9]對股票留言板評論情緒的研究,以及Chen等[10]對金融社交媒體中的用戶股評以及用戶相互討論形成的群體智慧的研究也支持了上述觀點.

然而,區(qū)別于年報、公告、新聞報道等具有相對正式規(guī)范的信息披露形式,以及具有信息內(nèi)容密度高、可靠性強等特點的傳統(tǒng)信息來源,在線金融社區(qū)的用戶評論信息不僅形式上具有短文本、不規(guī)范、錯誤多、口語化的特點,而且內(nèi)容上也呈現(xiàn)出信息價值密度低、可靠性弱等特點[11,12],加之在線金融社區(qū)用戶通常是整體專業(yè)水平較低的個體投資者.為此,如何充分利用在線金融社區(qū)的海量文本信息,提取并測度個體投資者對未來市場走勢的看法,進而形成看漲或看跌的支持傾向?以及非專業(yè)個體投資者整體的支持傾向能否揭示未來市場的收益和波動狀況?上述問題的解決,可以幫助投資者構(gòu)建相應的投資策略,不僅對于豐富大數(shù)據(jù)分析技術(shù)在金融領域的應用,而且對于投資者決策實踐都具有重要的意義.

需要指出的是,本文主要討論的是用戶的支持傾向而不是樸素的用戶情緒,前者是指用戶對未來市場看漲看跌的預期,包含了更多的用戶投資行為相關的信息;而后者是指一種對市場普遍的樂觀或悲觀的心態(tài),是更為樸素的個人情感[13,14].本文將在控制用戶情緒的條件下討論用戶支持傾向?qū)墒惺找婧筒▌拥挠绊?,這與以往基于用戶情緒的研究有所不同.

本文利用2017年1月1日~2018年9月30日期間東方財富網(wǎng)的5 178 824條用戶評論數(shù)據(jù),首先基于深度學習的卷積神經(jīng)網(wǎng)絡分類算法提取并測度在線用戶評論的支持傾向,并將之與傳統(tǒng)分類算法效果進行比較.然后,在控制用戶情緒的條件下,利用分布滯后模型、GJR(1,1)模型,考察了用戶支持傾向?qū)?00指數(shù)成分股的收益和波動的影響.進一步,本文對日間和日內(nèi)用戶支持傾向的成因進行了探討,結(jié)果表明歷史市場表現(xiàn)是用戶形成支持傾向的重要原因.本文的創(chuàng)新點主要有三點:第一,利用卷積神經(jīng)網(wǎng)絡的分類算法,識別測度了在線用戶評論中的用戶支持傾向,較之以往的傳統(tǒng)分類算法具有更高的精確度和召回率;第二,考察用戶支持傾向?qū)κ袌鍪找媛屎筒▌有缘挠绊憰r引入了市場非對稱效應的影響,并討論了用戶支持傾向的成因,提供了用戶支持傾向具有“羊群效應”的證據(jù);第三,將用戶支持傾向和用戶情緒區(qū)分開來,彌補了以往研究中將二者混淆的不足.

1 文獻綜述

1.1 金融文本挖掘相關研究

早期的金融文本挖掘的分析方法較為簡單,主要是基于單詞級別的詞頻統(tǒng)計.例如,Li使用“l(fā)ingua::en: fathom”軟件計算公司年報中相關字符、單詞、句子和段落的頻率,并構(gòu)建可讀性指標FOG(迷霧指數(shù)),實證發(fā)現(xiàn)市場參與者樂觀或悲觀的情緒對股票價格具有重要影響[2].此外,在文本向量表征上,TF-IDF向量模型被廣泛用于金融文本挖掘[15,16].

金融文本信息提取的研究對象主要集中在新聞媒體、專業(yè)機構(gòu)發(fā)布的各種形式的報告等高質(zhì)量文本.這些高質(zhì)量的文本在形式上具有表達正式、規(guī)范化的特點,其信息密度高,內(nèi)容可靠性高.相比之下,本文的研究對象是在線金融社區(qū),其主要用戶是以“散戶”為主的個體投資者,整體的信息解讀、處理和分析能力較弱進而專業(yè)素質(zhì)水平較低.此外,加上網(wǎng)絡社區(qū)的開放性和缺乏監(jiān)督性,用戶評論往往具有短文本、不規(guī)范、文字錯誤、口語化、信息密度低、不可靠等特點[11,12],這些都使得從文本中提取出用戶支持傾向更加困難.

1.2 金融社區(qū)、 金融社交媒體的相關研究

Tumarkin和Whitelaw對RagingBull.com論壇的研究發(fā)現(xiàn),在留言板發(fā)生積極的情緒變化之前,股價出現(xiàn)小幅異常上漲,事件日的留言板意見和異?;貓笙嚓P,且交易量在事件日當天大幅增加,并在之后一個交易日保持高位.然而,該研究認為很少有證據(jù)表明用戶意見能預測未來市場的回報[17].Antweiler等對Yahoo!Finance和RagingBull.com股票留言板上的信息進行研究,他們發(fā)現(xiàn)留言信息的分歧有助于預測交易量,發(fā)帖活動也有助于預測股價的波動率[9].Das和Chen基于五種分類器開發(fā)了一種從股票留言板中提取投資者情緒的算法,研究發(fā)現(xiàn)從留言板評論提取出的情緒信息與個股股價之間并沒有很強的關系[18].Chen對美國最大的投資類社交媒體網(wǎng)站Seeking Alpha的文章和評論區(qū)進行分析,在控制了金融分析報告、新聞報道等傳統(tǒng)信息源后,發(fā)現(xiàn)社交媒體網(wǎng)站的信息仍然能夠提供價值可觀的信息,能夠有效地預測投資回報率和驚喜收益[10].Renault對股評社區(qū)(stocktwits.com)的消息進行情感分析,利用開盤后30min的在線投資者情緒成功預測了收盤前30min的標普500股指收益,并認為這種預測力來源于新手交易者[19].Eli等對Twitter中個人賬號發(fā)表的意見進行了正負情感極性分類,在控制了其他決定收益的因素之后,發(fā)現(xiàn)Twitter的綜合意見有助于預測季度收益以及收益公告發(fā)布前后的異常回報[20].然而,以往的研究在進行信息提取時往往關注的是用戶情緒,甚至將情緒與支持傾向混淆對待,在本文后續(xù)章節(jié)中將看到情緒與支持傾向的不同之處.

國內(nèi)也有一些針對股票社區(qū)/社交媒體的研究工作,但大多數(shù)研究都基于簡單的變量且高度依賴人工處理數(shù)據(jù).劉海飛等基于關注度、信賴度和更新頻率來衡量微博信息質(zhì)量,研究了微博平臺披露信息質(zhì)量與股價的同步性[21].丁慧等研究了社交媒體“上證e互動”中問答互動的數(shù)量與股價崩盤事件的關聯(lián)[22].俞慶進和張兵基于創(chuàng)業(yè)板股票的百度指數(shù)來構(gòu)建投資者關注度指標,研究了其對市場收益率、換手率和成交量的影響[23].何賢杰等利用上市公司在新浪微博上發(fā)布的信息,討論了上市公司在網(wǎng)絡新媒體上披露的信息內(nèi)容對股價同步性的影響[24].孫書娜等利用雪球社區(qū)用戶的自選股信息構(gòu)建了日度超額雪球關注度指標,對投資者關注的行為特征、投資者關注與市場表現(xiàn)之間的相關關系和因果關系進行了研究[25].與本文研究內(nèi)容最相近的是部慧等的研究,他們用樸素貝葉斯分類算法提取了東方財富網(wǎng)股吧貼文中的投資者情緒,研究了投資者情緒對市場收益率、波動率和交易量的影響[26].然而,與他們的不同之處在于,本文采用卷積神經(jīng)網(wǎng)絡的分類算法分析在線金融社區(qū)用戶評論,提取出看漲或看跌的用戶支持傾向,在控制用戶情緒的條件下利用分布滯后模型和GJR(1,1)模型,考察在線用戶評論信息反映的支持傾向?qū)墒胁▌雍褪找娴挠绊懀⑦M一步討論了用戶支持傾向的成因,提供了用戶支持傾向具有“羊群效應”的證據(jù).

2 數(shù)據(jù)、算法與指標

2.1 數(shù)據(jù)描述

艾瑞咨詢發(fā)布了基于日均覆蓋人數(shù)的《2017年6月PC網(wǎng)站榜單top1 000》[27],在財經(jīng)類網(wǎng)站中,東方財富網(wǎng)以1 071萬的日均覆蓋人數(shù)高居第一,是第二名同花順的近5倍,遙遙領先于同行,是中國目前最大的在線股票社區(qū).為了保證實驗數(shù)據(jù)具有代表性,本文選取2017年1月1日~2018年9月30日期間東方財富網(wǎng)中滬深300成分股的股票評論.剔除部分因停市、網(wǎng)站維護等原因?qū)е掠脩粼u論不完整或無法獲取的股票后,最終得到269只股票共5 178 824條評論數(shù)據(jù),每條評論的平均字數(shù)為39,每只股票平均的評論數(shù)為19 252條.

本文使用jieba模塊對評論進行分詞.為了準確識別金融語境下的詞匯,本文在分詞模塊中加入了搜狗細胞詞典中的財經(jīng)金融詞匯大全、財會術(shù)語、股票基金詞庫大全以及從東方財富網(wǎng)爬取的所有股票名稱、股票代碼構(gòu)成的股票信息詞庫.Mikolov等提出的Word2vec模型是將文本轉(zhuǎn)換為數(shù)值向量的最流行和最有效的方法之一[28].本文使用python中的gensim模塊訓練Word2vec模型并生成詞向量.經(jīng)測試,語料庫中的最佳模型訓練參數(shù)是skip-gram模型,詞表征維度為300,窗口大小為6,其余都是默認配置.

本文對投資者支持傾向的定義為投資者對某一標準的預期,當投資者預期回報高于“平均水平”時,支持傾向為看漲;當投資者預期回報低于“平均水平”時,支持傾向為看跌,且這個“平均水平”因人而異[29].將情緒定義為投資者普遍的樂觀和悲觀情緒[13,14],這種定義更接近于樸素的個人情感.

在標注數(shù)據(jù)時,本文判斷支持傾向和情緒的基準是:評論中是否包含對未來市場或漲或跌的信息.表1給出了一些實例.有的評論中只包含用戶純粹的情緒宣泄,并不包含對未來市場漲跌信息的判斷,如表1中序號①~④所示,這種特征正是在線金融社區(qū)用戶評論信息價值密度低的體現(xiàn);有的評論在宣泄情緒的同時也表達了對未來市場看漲或看跌的個人看法,如表1中序號⑤~⑧所示.

在用戶評論中,同時包含了用戶樸素的樂觀/悲觀的情感和對未來行情看漲看跌的期望,本文更關注后者而不是前者.在后續(xù)分類任務中,將用戶對未來市場的支持傾向分為看漲、看跌和無明確傾向三種,將用戶情緒分為正向、負向和無情緒三種.

表1 評論中用戶支持傾向與情緒示例

2.2 CNN分類算法

卷積神經(jīng)網(wǎng)絡(convolutional neural network, CNN)是一類包含卷積計算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(feedforward neural networks),是深度學習的代表算法之一,廣泛應用于圖像識別、語音處理和自然語言處理[30],并在情緒分類問題上實現(xiàn)了較好的效果.

本文參考Kim[31]的CNN情感分類模型,搭建了包含一層卷積層、一層池化層和全連接層的CNN框架,如圖1所示.卷積層的輸入為詞向量化后m×n的句子矩陣(行的大小m為句子長度、列的大小n為詞向量的維度).對于文本處理來說,卷積核的大小一般取x×n,以步長i從第一行向下滑動,每次滑動都會得到一個卷積結(jié)果,滑動到最后一行便得到一個m-x維的向量(即特征圖).卷積核的大小參數(shù)取決于文本類型,若文本越長、語義信息越復雜,卷積核越大.同時,為了捕獲更為豐富的語義信息,需要設置幾種不同大小的卷積核,且卷積核的數(shù)目應該足夠多.每一個卷積核在輸入的m×n句子矩陣滑動后,得到的m-x維的向量作為池化層的輸入,池化層中預設的池化函數(shù)將對特征圖進行特征選擇和信息過濾.文本處理中的池化層一般采用k-max pooling的方法,輸出一個k維的特征向量.將所有卷積核的池化層輸出結(jié)果拼接起來,得到一個k×num_filters(卷積核數(shù)目)維的句特征向量.經(jīng)過卷積層和池化層,詞向量被映射成高維的語義句向量,已能夠很好地表征語義信息.全連接層是一個淺層神經(jīng)網(wǎng)絡,通過標注的數(shù)據(jù)集和標注的結(jié)果就可以訓練淺層神經(jīng)網(wǎng)絡分類器,輸出支持傾向分類.

圖1 卷積神經(jīng)網(wǎng)絡結(jié)構(gòu)圖

Fig. 1 The structure of convolutional neural network

經(jīng)測試,在本文語料庫中表現(xiàn)最好的網(wǎng)絡框架和參數(shù)為:卷積層的卷積核大小為2×300、3×300、4×300、5×300、6×300,且每種卷積核的數(shù)目都使用了100個;卷積核以步長1在輸入的矩陣滑動,從而生成特征圖進入池化層;池化層采用1-max pooling的方法;所有卷積核經(jīng)過池化層后的輸出拼接成一個500維的高維句向量表征;500維的高維句向量作為全連接層的輸入,全連接層輸出支持傾向分類.

為了訓練模型,對于評論的標注按照自然語言處理標簽標注的一般方法,由專家標注了5 000條用戶評論中的支持傾向和情緒.為了說明標注的訓練樣本數(shù)量能夠滿足算法訓練,本文通過逐步增加訓練樣本數(shù)的方式,來考察訓練樣本數(shù)的增加對訓練效果的影響,圖2展示了實驗結(jié)果.可以看到,算法在訓練樣本為3 000左右就趨于收斂,說明標注的訓練樣本數(shù)量能夠滿足分類算法的訓練.

為了保證模型的泛化能力和穩(wěn)定性,實驗對模型進行了5次5折交叉驗證,結(jié)果表明CNN模型在用戶支持傾向分類上能夠達到74.8%的精度和74.7%的召回率.進一步為了驗證CNN分類算法的優(yōu)越性,表2給出了5次5折交叉驗證情形下該算法與其它常用分類器的對比結(jié)果.結(jié)果表明傳統(tǒng)分類算法對于情緒分類效果較好,但對于支持傾向分類效果較差,這是因為支持傾向分類需要提取用戶的潛在意圖信息,比情緒分類任務更為復雜.相對于部慧等使用的貝葉斯算法[26]、Cecchini等[16]使用的SVM或是其他經(jīng)典分類算法(1)算法詳情參考Tan等的《數(shù)據(jù)挖掘?qū)д摗穂32]和周志華的《機器學習》[33].,本文所提出的CNN算法都能實現(xiàn)更好的分類效果.

圖2 訓練樣本數(shù)量對訓練效果的影響

表2 不同分類器模型對比結(jié)果

2.3 支持傾向序列構(gòu)建

本文使用CNN算法識別了語料庫中每條用戶評論的支持傾向.在討論這些支持傾向?qū)κ袌龅挠绊懼埃枰獙⑦@些意見進行匯總,并構(gòu)建一個支持傾向序列,因此借鑒了Antweiler和Frank的牛市信號指標(Bullishness Signal)[9].然而,牛市信號指標的不足在于,無法體現(xiàn)股票市場對信息反應的非對稱效應[34],即好消息和壞消息對股價波動的影響存在差異.若壞消息對市場的影響比好消息對市場的影響更大,稱之為正向杠桿效應;若好消息對市場的影響比壞消息對市場的影響更大,稱之為反向杠桿效應[35].非對稱效應已經(jīng)從理論和實證研究中得以證實[36,37].與本文研究對象最為接近的是Tetlock的研究,他們的研究表明股票收益率對負面新聞的反應比對正面新聞的反應更加劇烈[38].從本文的研究對象——在線金融社區(qū)用戶評論來看,相同程度的看漲傾向和看跌傾向?qū)κ袌龅挠绊懯遣灰恢碌?,而Antweiler和Frank的牛市信號指標認為相同程度的看漲傾向和看跌傾向?qū)κ袌龅挠绊懯窍嗤?,從而忽略了這種非對稱效應.因此,本文在結(jié)合Antweiler和Frank的研究基礎上引入了股票市場中對信息的非對稱效應的影響.

已經(jīng)識別出每條評論中的看漲或看跌傾向,因此可以定義一段時間D(t) 內(nèi)的看漲或看跌傾向為Ot,c,如式(1)所示,其中c∈{看漲(bullish),看跌(bearish),無},xi,c表示當?shù)趇條評論屬于c時取值為1,否則為0;ωi表示第i條評論的權(quán)重.本文更加關注的是表征看漲和看跌的支持傾向,可以利用一段時間內(nèi)看漲看跌差值來表征這段時間內(nèi)整體的支持傾向,此處加入市場非對稱效應的調(diào)整因子af(asymmetric factor),并進行歸一化處理.當af>1時,能夠表征市場的正向杠桿效應,即人們對壞消息更敏感;當af<1時,能夠表征市場的反向杠桿效應,即人們對好消息更敏感.然而目前的指標還不夠完善,它不能很好地表征支持傾向強度.為此,本文考慮將看漲看跌的有效評論數(shù)加入支持傾向指標中[9],得到式(2).這樣,支持傾向指標不僅能用其正負符號來表征該時期內(nèi)整體的看漲或看跌的支持傾向,還能用其絕對值的大小表征該種支持傾向的強度

(1)

ln(1+Ot,bullish+Ot,bearish)

(2)

式(1)中的ωi表示該條評論可靠性程度或重要程度,即具有較高專業(yè)素養(yǎng)的用戶的意見會更加重要,因此其權(quán)重應該更大,而其他非專業(yè)個體投資者的權(quán)重應該更小.然而,用戶的個人專業(yè)信息很難被觀測到,且在線金融社區(qū)的評論主體是專業(yè)素養(yǎng)較低的個體投資者,于是本文在實驗中對所有的評論賦權(quán)為1,即認為每條評論對市場的影響力相同[9],這種賦權(quán)方式實質(zhì)上捕捉的是廣大個體投資者(散戶)的支持傾向.

投資者的意見分歧被認為可能是交易的動機[39,40],因此為了衡量這種意見分歧程度,本文直接引用了文獻[9]的一致性指數(shù)At(agreement index),由式(3)給出.一致性指數(shù)At是一個區(qū)間為[0,1]的數(shù),其值越大表明一致性程度越高.為了后續(xù)說明用戶支持傾向和情緒存在差異,以同樣的方法計算了情緒和情緒一致性指數(shù).方便起見,用S1和S2分別表示支持傾向和情緒,用A1和A2分別表示支持傾向一致性和情緒一致性

(3)

結(jié)合構(gòu)建的變量和滬深300指數(shù)的日收益率和日振幅數(shù)據(jù),表3(a)給出了重要變量的描述性統(tǒng)計,從表中的單位根檢驗可知各重要變量均為平穩(wěn)序列(在5%的顯著性水平下).表3(b)和表3(c)給出了支持傾向強度和支持傾向一致性與滬深300指數(shù)當期收益率、振幅的簡單描述性統(tǒng)計.從表中的結(jié)果可以看出,支持傾向與滬深300指數(shù)當期收益率正相關、與當期振幅負相關,支持傾向一致性與滬深300指數(shù)當期收益率負相關、與當期振幅正相關.本文將在下一節(jié)進一步討論支持傾向與市場表現(xiàn)的關系.

表3(a) 重要變量描述性統(tǒng)計

表3(b) 支持傾向強度與收益率、 振幅基本統(tǒng)計

注:*、**、***分別代表10%、5%和1%的顯著性水平,括號中為t檢驗的統(tǒng)計值,下同.

表3(c) 支持傾向一致性與收益率、 振幅基本統(tǒng)計

3 用戶支持傾向?qū)κ袌龅挠绊?/h2>

3.1 支持傾向?qū)κ袌鍪找媛实挠绊懛治?/h3>

當市場參與者在金融社區(qū)中發(fā)表自己的看法時,他們的支持傾向可能會產(chǎn)生投資交易活動,推動資產(chǎn)價格變化從而影響市場收益率.本節(jié)將討論用戶評論中的支持傾向信息能否影響市場收益率.

以支持傾向發(fā)生前10日作為基準,統(tǒng)計分析了支持傾向發(fā)生前后10日的累計收益率,如圖3所示.其中,當af取不同值時,橫坐標之上的線和橫坐標之下的線分別表示了支持傾向為正和為負的情形.

圖3 支持傾向發(fā)生前后10天的累計收益率

從圖3中af=1.0的累積收益率可以看出,當看漲看跌傾向的程度相同時,市場對看跌的反應程度更加劇烈,這驗證了已有研究關于中國滬深股市存在正向杠桿效應的結(jié)論[41].因此,本文通過增大af來調(diào)整杠桿效應.通過式(4)單獨討論了支持傾向?qū)κ袌鍪找媛实姆菍ΨQ性效應的調(diào)節(jié),其中S1t-i是支持傾向,r10是過去10日的累積市場收益率.表4給出了支持傾向?qū)κ袌鍪找媛实姆菍ΨQ性效應的回歸結(jié)果.從結(jié)果可以看出,隨著af值的增大,支持傾向?qū)κ袌龈軛U效應的刻畫就越強,顯著性水平和擬合優(yōu)度也隨之提升,說明市場確實存在杠桿效應,通過刻畫杠桿效應而使得回歸效果更優(yōu).在后續(xù)回歸中af被設置為1.8(在4.3中進一步討論了af的取值以及支持傾向?qū)κ袌鍪找媛实姆菍ΨQ效應)

(4)

為了表征從支持傾向發(fā)生到市場發(fā)生反應這一滯后現(xiàn)象,與Chen等[10]類似,本文同樣使用了分布滯后模型,其表達式由式(5)給出.其中,rt表示市場收益率,S1t-i為支持傾向,A1t-i為支持傾向一致性指標,S2t為情緒,A2t為情緒一致性指標,messaget-i為發(fā)帖量,X為一組控制變量,其設定參考了已有研究[42,43]以及現(xiàn)實交易中的常用變量,包括:前10個交易日的累計收益率和平均波動率、交易量、換手率、市盈率、市凈率、市銷率、市現(xiàn)率、波動率,εt是隨機誤差項.其中,市場支持傾向通過將個股等權(quán)相加整合而成,市場數(shù)據(jù)則使用了滬深300指數(shù)相關數(shù)據(jù)(下同).與Antweiler和Frank一樣,本文認為只有最近期的用戶傾向信息與股票收益率相關.為了更一般地探討支持傾向在收益率回歸中的影響,設置的最大滯后期為2.回歸以2017年1月1日~2018年9月30日期間共427個交易日為樣本.表5給出了回歸結(jié)果,受篇幅限制,此處只列出了最關心的變量結(jié)果(下同).在表5中,模型(1)給出了僅有簡單控制變量的情形,擬合優(yōu)度較低;模型(2)~模型(4)通過逐步加入支持傾向及其滯后期來觀察支持傾向?qū)κ找媛实挠绊懀С謨A向指標顯著,擬合優(yōu)度逐漸提高,說明支持傾向?qū)τ谑找媛视薪忉屃?;模?5)進一步加入了用戶情緒信息作為控制變量,結(jié)果依然穩(wěn)健

(5)

表4 支持傾向?qū)κ袌鍪找媛实姆菍ΨQ性效應的調(diào)節(jié)

表5 用戶支持傾向?qū)κ袌鍪找媛视绊懙幕貧w結(jié)果

表5的收益率回歸結(jié)果中,支持傾向高度顯著,當期符號為正,滯后期為負,即當期看漲導致當期的正收益,而滯后期的看漲將導致當期的負收益.已有的基于用戶情緒的研究表明,情緒對當期收益率有正向影響,但對未來的收益率無預測能力[26,29].本文基于用戶支持傾向的研究結(jié)果與之不同,當期支持傾向不僅對當期收益率有正向影響,而且與未來收益率相反,這說明股吧用戶支持傾向并不能正確預測未來的市場收益.若用戶支持傾向存在“羊群效應”,則可能導致這種支持傾向與收益率方向相反的結(jié)果.本文在4.1節(jié)和4.2節(jié)中進一步討論了用戶支持傾向的“羊群效應”.在加入情緒信息作為控制變量后,回歸結(jié)果依舊成立,這進一步說明用戶支持傾向確實存在著不同于用戶情緒的信息可以用于解釋市場收益率.

3.2 支持傾向?qū)κ袌霾▌有缘挠绊懛治?/h3>

本節(jié)將討論用戶評論中的支持傾向是否會影響市場波動性.

衡量市場波動性的指標有很多,本文用振幅來代表單日市場波動,計算公式為

(6)

為了刻畫從支持傾向發(fā)生到市場發(fā)生反應這一滯后現(xiàn)象,本文再次采用了分布滯后模型,其表達式由式(7)給出.其中,A1t-i為支持傾向一致性指數(shù),S1t-i為支持傾向,A2t為情緒一致性指數(shù),S2t為情緒,messaget-i為發(fā)帖量,X為一組控制變量,其設定與式(5)中一致,εt是隨機誤差項.在表6中,模型(1)給出了只有簡單控制變量的結(jié)果;模型(2)~模型(4)通過逐步加入支持傾向一致性指標及其滯后項來探究其對振幅的影響,當加入滯后2期的一致性指標時,指標不顯著且擬合優(yōu)度有所下降,說明只有當期和滯后1期的支持傾向一致性指標具有解釋力;模型(5)加入了用戶情緒作為控制變量

Xδ+εt

(7)

表6 用戶支持傾向一致性對市場波動性影響的回歸結(jié)果

從表6的振幅回歸結(jié)果中,支持傾向一致性指數(shù)顯著且符號為正,即用戶的分歧越小(一致性越高),市場的波動性越大.已有的理論認為投資者的分歧將導致交易,從而產(chǎn)生更大的市場波動.然而,本文的樣本僅僅是股吧論壇中的廣大用戶,大部分都是散戶投資者,僅能代表在線金融社區(qū)用戶群體的看漲看跌傾向,而其他投資群體如機構(gòu)券商等可能有相反的看漲看跌傾向,從而促成具有不同看漲看跌傾向的群體之間的交易.如果股吧論壇中的用戶支持傾向存在“羊群效應”,用戶達成一致性就可能是一種羊群行為,進而導致更大的市場波動性.為此,本文在4.1節(jié)和4.2節(jié)進一步討論了用戶支持傾向的“羊群效應”.

4 進一步的檢驗

4.1 日間市場表現(xiàn)與支持傾向的關系

在討論用戶支持傾向?qū)κ袌鍪找婧筒▌拥挠绊憰r,可能存在反向因果的問題.用戶的支持傾向可能來源于歷史市場表現(xiàn),即歷史市場表現(xiàn)低迷時傾向于看跌,歷史市場表現(xiàn)較好時傾向于看漲,從而利用用戶支持傾向?qū)ξ磥硎找孢M行預測時產(chǎn)生了不符合直覺的結(jié)果.圖3顯示,無論是看漲還是看跌的支持傾向,在支持傾向發(fā)生前,市場就已經(jīng)有所反應,且在支持傾向發(fā)生后市場累計收益率幾乎保持不變.這說明,0時刻的支持傾向可能更多地反映了投資者對過去一段時間內(nèi)市場走勢的態(tài)度,并認為這種趨勢將得以延續(xù).在收益率回歸模型中,滯后期的支持傾向?qū)o隨其后的股市收益率都具有顯著的負向影響.

為了說明支持傾向更多的是投資者對過去一段時間市場行情的趨勢延續(xù),本文以支持傾向/情緒為因變量S1t/S2t,以歷史支持傾向/情緒S1t-i/S2t-i、歷史市場收益率rt-i、歷史支持傾向、情緒的一致性指數(shù)A1t-i和A2t-i、歷史發(fā)帖數(shù)messaget-i以及控制變量X(與式(5)中一致)為自變量,進行回歸檢驗,如式(8)和式(9)所示.在表7中,列(1)~列(3)展示了式(8)的回歸結(jié)果;列(4)展示了式(9)的回歸結(jié)果.

表7的回歸結(jié)果表明,用戶的支持傾向與過去一段時間內(nèi)的市場表現(xiàn)具有顯著的正向關系,即當過去一段時間內(nèi)的市場表現(xiàn)較好,用戶傾向于發(fā)表看漲評論;當過去一段時間內(nèi)的市場表現(xiàn)較低迷,用戶傾向于發(fā)表看跌評論.這說明用戶支持傾向信息更有可能來源于市場趨勢.此外,表7顯示支持傾向信息來源于過去多期的市場收益率,且重要程度隨滯后期的增加而遞減,而情緒信息僅與當期和滯后一期的市場收益率相關,且符號不穩(wěn)定,這進一步說明了支持傾向信息不同于情緒信息,即支持傾向信息是一種相對更加有效的、與用戶投資行為更相關的信息

Xδ+εt

(8)

Xδ+εt

(9)

4.2 日內(nèi)市場表現(xiàn)與支持傾向的關系

行為金融學認為投資者群體具有“羊群效應”[44],為了討論從在線金融社區(qū)用戶評論中提取出的支持傾向信息是否存在“羊群效應”,本節(jié)以30min為周期,檢驗日內(nèi)市場表現(xiàn)與支持傾向的關系.

s1i,t=c+Ri,t-1+β0S1i,t-1+β1S2i,t-1+

β2A1i,t-1+β3A2i,t-1+αYi,t+δZi+εi,t

(10)

表7 日間收益率對支持傾向、 情緒的影響的回歸結(jié)果

表8 日內(nèi)收益率對支持傾向、 情緒的影響的回歸結(jié)果

從日內(nèi)市場表現(xiàn)與支持傾向、情緒的回歸結(jié)果可以看出,日內(nèi)支持傾向/情緒與日內(nèi)市場累計收益率正相關,即用戶在跟隨市場累計收益率并發(fā)表自己的支持傾向,這說明在線金融社區(qū)用戶存在“羊群效應”.進一步,日內(nèi)當期支持傾向與累計支持傾向正相關,日內(nèi)當期情緒與累計情緒正相關,表明用戶日內(nèi)已經(jīng)發(fā)表評論的支持傾向和情緒會影響后面的用戶的支持傾向和情緒,這進一步加強了在線金融社區(qū)用戶評論的“羊群效應”.在線金融社區(qū)用戶評論的這種“羊群效應”可能導致出現(xiàn)在3.1節(jié)和3.2節(jié)中部分不符合直覺的結(jié)果.

4.3 股市波動性的非對稱效應

本節(jié)將使用金融時間序列分析中的GJR(1,1)模型以檢驗第3節(jié)中回歸結(jié)果的穩(wěn)健性,同時討論在構(gòu)造支持傾向St時取不同的非對稱效應調(diào)整因子(af)所帶來的影響.

GARCH類模型是金融時間序列分析中經(jīng)典的模型簇,其中在市場非對稱效應下表現(xiàn)最好的模型是GJR(1,1)模型[35].因此,本節(jié)運用GJR(1,1)模型來檢驗前文得出結(jié)論的穩(wěn)健性.

(11)

(12)

表9 GJR(1,1)模型結(jié)果

5 結(jié)束語

本文利用卷積神經(jīng)網(wǎng)絡分類算法提取并測度了在線金融社區(qū)中用戶評論所體現(xiàn)的支持傾向,能夠達到74.8%的精度和74.7%的召回率,優(yōu)于現(xiàn)有文獻的分類算法.并且考察了支持傾向?qū)?00指數(shù)成分股的收益和波動的影響.

在對市場收益的影響方面,用戶當期的支持傾向?qū)Ξ斊诘氖袌鍪找媛示哂姓蛴绊?,但?、2日的支持傾向?qū)Ξ斎帐找媛示哂胸撓蛴绊?,這一結(jié)果在控制用戶情緒的條件下依舊顯著.進一步,通過考察日間股市表現(xiàn)對用戶支持傾向的影響,發(fā)現(xiàn)在羊群行為作用下,過去10日內(nèi)的市場表現(xiàn)是用戶形成支持傾向的重要原因,當市場歷史表現(xiàn)好的情況下,用戶會形成看漲的支持傾向,反之形成看跌的支持傾向.在日內(nèi)收益率與支持傾向的影響檢驗中,本文發(fā)現(xiàn)不僅日內(nèi)的累計收益率會對用戶支持傾向產(chǎn)生正向影響,而且用戶已發(fā)表的評論中的累計支持傾向也會對后續(xù)用戶的支持傾向產(chǎn)生正向影響,這進一步加強了在線金融社區(qū)用戶追漲殺跌的“羊群效應”.

在對市場波動的影響方面,用戶支持傾向的一致性對市場波動具有正向影響,即用戶的分歧越小,市場的波動性越大.通過描述性統(tǒng)計和回歸檢驗表明了股市中存在正向杠桿效應.通過引入的市場非對稱效應的調(diào)整因子af(asymmetric factor),本文很好地捕捉并刻畫了市場的正向杠桿效應.

未來的研究一方面可以基于本文提出的在線金融社區(qū)用戶的支持傾向測度方法,將本文對市場收益和波動的影響研究擴展至個股或股票組合層面.另一方面,針對在線金融社區(qū)投資者群體與機構(gòu)、券商等其他投資群體支持傾向及一致性的差異研究,也值得進一步思考.

猜你喜歡
一致性收益率卷積
關注減污降碳協(xié)同的一致性和整體性
公民與法治(2022年5期)2022-07-29 00:47:28
注重教、學、評一致性 提高一輪復習效率
基于3D-Winograd的快速卷積算法設計及FPGA實現(xiàn)
IOl-master 700和Pentacam測量Kappa角一致性分析
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
基于傅里葉域卷積表示的目標跟蹤算法
基于事件觸發(fā)的多智能體輸入飽和一致性控制
一種基于卷積神經(jīng)網(wǎng)絡的性別識別方法

金堂县| 元氏县| 呼伦贝尔市| 蒲江县| 黄梅县| 郎溪县| 徐水县| 山阳县| 鄄城县| 时尚| 莒南县| 叙永县| 乐平市| 兰坪| 光泽县| 张家界市| 新和县| 丹阳市| 修武县| 山阳县| 乐都县| 杭锦后旗| 巴中市| 海丰县| 嫩江县| 庆安县| 新宾| 黔西县| 太湖县| 石城县| 威宁| 平远县| 乐清市| 榆中县| 桦南县| 安陆市| 乳源| 曲阜市| 华池县| 巴林右旗| 莱州市|