国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

社會(huì)互動(dòng)對(duì)股票市場(chǎng)的影響
——基于新浪財(cái)經(jīng)博客的實(shí)證分析

2016-11-21 06:00:36
關(guān)鍵詞:博主博客投資者

(浙江大學(xué)經(jīng)濟(jì)學(xué)院,浙江 杭州 310027)

引言

對(duì)于個(gè)體投資者而言,股票投資是一項(xiàng)復(fù)雜的決策,個(gè)體通常會(huì)面臨知識(shí)匱乏和信息不完全的局限性。在這種情況下,社會(huì)互動(dòng)成為投資者交流信息、表達(dá)意見的一個(gè)重要方式。近年來有相當(dāng)多的文獻(xiàn)討論了社會(huì)互動(dòng)對(duì)金融決策行為的影響。Duflo和Saez(2003)[4]的研究證實(shí)社會(huì)互動(dòng)對(duì)個(gè)人購(gòu)買養(yǎng)老金產(chǎn)品的決策行為產(chǎn)生影響;Hong等(2004)[6]和李濤(2006)[15][16]的研究都表明社會(huì)互動(dòng)會(huì)顯著推動(dòng)居民參與股市投資;Karlan(2005)[7]則提供了通過社會(huì)互動(dòng)影響個(gè)體信貸決策的證據(jù)。

隨著互聯(lián)網(wǎng)的飛速發(fā)展,投資者不僅可以在網(wǎng)絡(luò)上獲取信息,而且可以主動(dòng)發(fā)布信息,與其他投資者互相交流。博客、微博、論壇等網(wǎng)絡(luò)社區(qū)已經(jīng)成為投資者之間進(jìn)行互動(dòng)的重要平臺(tái)?;ヂ?lián)網(wǎng)時(shí)代,投資者社會(huì)互動(dòng)的規(guī)模、頻率、速度都出現(xiàn)了變革性的提升?;诨ヂ?lián)網(wǎng)的社會(huì)互動(dòng)對(duì)證券市場(chǎng)的發(fā)展是一把雙刃劍。一方面,互聯(lián)網(wǎng)平臺(tái)具有及時(shí)、覆蓋面廣的特征,投資者之間的社會(huì)互動(dòng)有助于提高市場(chǎng)信息的透明度,由此提高證券市場(chǎng)的信息有效性;另一方面,與傳統(tǒng)媒體的權(quán)威性相比較,互聯(lián)網(wǎng)平臺(tái)具有匿名性、草根性的特點(diǎn),極易成為謠言傳播和主觀情緒宣泄的主要渠道,投資者之間的社會(huì)互動(dòng)會(huì)導(dǎo)致市場(chǎng)價(jià)格產(chǎn)生過度反應(yīng),從而影響市場(chǎng)的穩(wěn)定性。研究基于互聯(lián)網(wǎng)的投資者社會(huì)互動(dòng)對(duì)股票市場(chǎng)的影響,在理論上有利于探索互聯(lián)網(wǎng)時(shí)代資產(chǎn)定價(jià)的新特征,在實(shí)踐上有助于為促進(jìn)網(wǎng)絡(luò)媒體規(guī)范運(yùn)作和金融市場(chǎng)穩(wěn)定發(fā)展提供政策依據(jù)。

本文以網(wǎng)絡(luò)互動(dòng)平臺(tái)——新浪財(cái)經(jīng)博客為例探究社會(huì)互動(dòng)對(duì)股票市場(chǎng)的影響。與已有文獻(xiàn)相比,本文的創(chuàng)新點(diǎn)體現(xiàn)在以下幾個(gè)方面。第一,從研究對(duì)象上來看,與已有文獻(xiàn)采用的調(diào)查和實(shí)驗(yàn)方法不同,我們用財(cái)經(jīng)博客作為刻畫投資者社會(huì)互動(dòng)的媒介。雖然當(dāng)前信息傳播和交流的媒介形式多樣,但財(cái)經(jīng)博客在描述投資者社會(huì)互動(dòng)上具有一定的優(yōu)勢(shì)。與股吧等投資者論壇相比,財(cái)經(jīng)博客表達(dá)的是專業(yè)人士的觀點(diǎn)見解,股票投資本身是一種專業(yè)行為,市場(chǎng)上大多數(shù)散戶都缺乏相關(guān)專業(yè)知識(shí),財(cái)經(jīng)博客能夠較好地刻畫普通投資者如何通過與專業(yè)博主之間的交流來獲取相關(guān)信息;與報(bào)紙新聞或者電視新聞相比,報(bào)紙、電視僅僅只是單向的信息傳播平臺(tái),具體的互動(dòng)影響范圍、互動(dòng)的程度都無法觀察,以博客為研究對(duì)象,可以通過閱讀量、評(píng)論/轉(zhuǎn)發(fā)/喜歡/收藏?cái)?shù)或者博主的人氣等角度來刻畫互動(dòng)的特征。第二,從研究方法來看,我們采用文本挖掘技術(shù)獲取新浪財(cái)經(jīng)博客網(wǎng)頁(yè)上的相關(guān)信息,不僅統(tǒng)計(jì)博客閱讀量等數(shù)值型數(shù)據(jù),更進(jìn)一步分析博客文本包含的情緒傾向,據(jù)此構(gòu)造的變量比較全面地揭示了社會(huì)互動(dòng)的程度和屬性。第三,從研究的視角來看,已有文獻(xiàn)對(duì)社會(huì)互動(dòng)的研究,較多地分析了社會(huì)互動(dòng)對(duì)個(gè)體決策行為的影響,例如對(duì)股票投資參與度、對(duì)個(gè)人信貸決策和購(gòu)買養(yǎng)老金產(chǎn)品決策的影響,本文的研究則檢驗(yàn)了社會(huì)互動(dòng)對(duì)股票市場(chǎng)收益率、波動(dòng)率和成交量的影響,揭示社會(huì)互動(dòng)對(duì)股票市場(chǎng)產(chǎn)生的宏觀效應(yīng)。

文獻(xiàn)綜述

與本文主題相關(guān)的文獻(xiàn)包括兩個(gè)方面,一是社會(huì)互動(dòng);二是以微博、博客為代表的網(wǎng)絡(luò)互動(dòng)平臺(tái)對(duì)股票市場(chǎng)的影響。

一、社會(huì)互動(dòng)的涵義及其度量方法

社會(huì)互動(dòng)是來自社會(huì)學(xué)的概念。巴克(1984)[12]認(rèn)為社會(huì)互動(dòng)是一方或多方的反應(yīng),取決于或依賴于另一方所說所做的程度,社會(huì)情景則隨著這種程度而變化。Durlauf和Ioannides(2010)[5]將社會(huì)互動(dòng)的內(nèi)涵從社會(huì)學(xué)范疇拓展到了經(jīng)濟(jì)學(xué)范疇,他們認(rèn)為社會(huì)互動(dòng)是指?jìng)€(gè)體之間的相互依賴性,在這些相互依賴性作用之下,一個(gè)兼具社會(huì)和經(jīng)濟(jì)行為特性的人,其偏好、信念以及其所面臨的預(yù)算約束都受到其他人的特征與選擇的直接影響。

近年來,經(jīng)濟(jì)學(xué)的研究逐步開始討論社會(huì)互動(dòng)對(duì)經(jīng)濟(jì)行為的影響。社會(huì)互動(dòng)這一概念的引入也給經(jīng)濟(jì)學(xué)研究帶來了新的視角。Duflo和Saez(2003)[4]采用實(shí)驗(yàn)的方法研究了社會(huì)互動(dòng)對(duì)個(gè)人做出購(gòu)買養(yǎng)老金產(chǎn)品決策的影響,結(jié)論表明這種影響是顯著的。Hong等(2004)[6]在控制了財(cái)富水平、種族、受教育程度和風(fēng)險(xiǎn)忍受程度后發(fā)現(xiàn),那些經(jīng)常與鄰居互動(dòng)交流、出席教會(huì)的人參與股市投資的可能性更大,并且這種社會(huì)互動(dòng)的影響在那些股市參與度更高的地區(qū)更加顯著。Hong等(2004)[6]以及Karlan(2005)[7]還分別提供了通過社會(huì)互動(dòng)獲得信息而影響基金經(jīng)理持股行為和通過社會(huì)互動(dòng)交流感受而影響個(gè)體信貸決策的證據(jù)。李濤(2006a)[15]研究了我國(guó)社會(huì)互動(dòng)與股市參與的關(guān)系,通過問卷調(diào)查采用“居民在2004年春節(jié)期間以各種形式給親屬、朋友以及認(rèn)識(shí)的人拜年的總?cè)藬?shù)”和“居民對(duì)自己在社會(huì)上人際交往程度的主觀評(píng)價(jià)”這兩個(gè)指標(biāo)來衡量社會(huì)互動(dòng),結(jié)果表明社會(huì)互動(dòng)推動(dòng)了居民參與股市。李濤(2006b)[16]采用問卷的方式對(duì)2005年我國(guó)12個(gè)城市的居民進(jìn)行了抽樣調(diào)查,詳盡調(diào)查了居民的13種常見個(gè)人投資項(xiàng)目(包括銀行存款、外匯、股票等),對(duì)于個(gè)體以及個(gè)體周圍的人是否投資于這13種項(xiàng)目分別設(shè)立虛擬變量,并對(duì)“個(gè)體做投資決策時(shí)是否依賴來自朋友的信息”、“個(gè)體投資過程中與朋友交流的重要性判斷”等信息進(jìn)行量化,結(jié)果表明社會(huì)互動(dòng)推動(dòng)了個(gè)體對(duì)這些投資項(xiàng)目的參與。朱光偉等(2014)[18]利用中國(guó)家庭金融調(diào)查2011年數(shù)據(jù),發(fā)現(xiàn)關(guān)系對(duì)家庭股市參與的正向促進(jìn)的影響渠道之一是社會(huì)互動(dòng)。他們按社區(qū)的股市參與率將社區(qū)劃分為高、中、低參與率社區(qū)并設(shè)置為虛擬變量,發(fā)現(xiàn)高參與率社區(qū)和關(guān)系的交叉項(xiàng)顯著為正,而低參與率社區(qū)和關(guān)系的交叉項(xiàng)顯著為負(fù),這意味著在股市參與率更高的社區(qū),社會(huì)互動(dòng)推動(dòng)家庭參與股市的作用會(huì)更大。郭士祺和梁平漢(2014)[14]研究社會(huì)互動(dòng)對(duì)家庭股市參與的影響,他們得到的結(jié)論與朱光偉等(2014)[18]類似,并認(rèn)為傳統(tǒng)的社會(huì)互動(dòng)正被網(wǎng)絡(luò)信息渠道部分替代。

二、微博、博客對(duì)股票市場(chǎng)的影響

關(guān)于微博、博客影響的研究,由傳媒學(xué)領(lǐng)域拓展開來的主要包括市場(chǎng)營(yíng)銷、金融學(xué)等領(lǐng)域。在市場(chǎng)營(yíng)銷領(lǐng)域,Mishne和Glance(2006)[9]研究了博客情緒和電影票房之間的關(guān)系,結(jié)果表明無論是電影上映之前還是之后,博客對(duì)電影的討論與電影的票房收入有顯著正相關(guān)性,博客積極的情緒是電影票房成功的有效預(yù)測(cè)指標(biāo)。Liu等(2007)[8]構(gòu)建了一個(gè)利用博客情緒信息和商品過去的銷售表現(xiàn)來預(yù)測(cè)商品未來銷售情況的模型。以電影票房收入為例,該模型的準(zhǔn)確性和有效性均得到了驗(yàn)證。

金融學(xué)領(lǐng)域的研究方向主要是微博、博客對(duì)股票市場(chǎng)的影響。Zhang等(2011)[11]分析每條Twitter包含的情緒,分為積極情緒和消極情緒,用包含情緒的Twitter數(shù)量占總Twitter數(shù)量的比例作為一個(gè)自變量指標(biāo),發(fā)現(xiàn)這個(gè)比例與道瓊斯指數(shù)、納斯達(dá)克指數(shù)和標(biāo)普500指數(shù)均呈顯著負(fù)相關(guān),但與芝加哥期權(quán)交易所波動(dòng)率指數(shù)顯著正相關(guān)。類似地,Bollen等(2011)[2]基于Twitter,使用谷歌提供的情緒挖掘工具OpinionFinder(OF)和Google-Profile of Mood States (GPOMS)來度量文本情緒。OF能實(shí)時(shí)量化當(dāng)前網(wǎng)絡(luò)上積極情緒和消極情緒的強(qiáng)度;GPOMS則能將情緒細(xì)分為六類(平靜(calm),警惕(alert),確信(sure),至關(guān)重要(vital),和藹(kind)和高興(happy))。實(shí)證結(jié)果表明積極和消極情緒的比例僅對(duì)滯后一天的道瓊斯指數(shù)變化產(chǎn)生顯著影響,而六個(gè)維度的情緒序列中僅calm對(duì)滯后2到6天的道瓊斯指數(shù)變化情況影響顯著。

De Choudhury等(2008)[3]專門針對(duì)4家美國(guó)科技類公司,分析了2007年1~11月之間關(guān)于這4家公司博客的特征,包括博客數(shù)量、評(píng)論數(shù)量、評(píng)論平均長(zhǎng)度和回復(fù)時(shí)間、不同的評(píng)論回復(fù)者的角色等,結(jié)果表明量化這些博客的特征之后,它們與公司股價(jià)每天的變化率顯著相關(guān),在股價(jià)變動(dòng)方向的預(yù)測(cè)上有87%的準(zhǔn)確性,在股價(jià)變動(dòng)規(guī)模上有78%的準(zhǔn)確性。Ruiz等(2012)[10]不僅關(guān)注股價(jià)的變動(dòng)還研究了交易量的變動(dòng),發(fā)現(xiàn)Twitter自身特征與股票交易量之間的關(guān)系比與股價(jià)之間的關(guān)系更加顯著。

岑維等(2014)[13]通過深交所“互動(dòng)易”平臺(tái)這一類似微博網(wǎng)站的問答數(shù)據(jù),將深市上市公司某月被投資者提問的問題數(shù)作為投資者關(guān)注度的衡量指標(biāo),發(fā)現(xiàn)關(guān)注度越高,股票收益越高,股票波動(dòng)率風(fēng)險(xiǎn)和流動(dòng)性風(fēng)險(xiǎn)越低,表明深交所“互動(dòng)易”這一投資者和上市公司之間的互動(dòng)平臺(tái)可以顯著的降低信息不對(duì)稱、穩(wěn)定市場(chǎng)和保護(hù)投資者權(quán)益。張繼勛和韓冬梅(2015)[19]根據(jù)深交所“互動(dòng)易”平臺(tái)統(tǒng)計(jì)數(shù)據(jù),通過實(shí)驗(yàn)向被試提供上市公司管理層回復(fù)及時(shí)性和明確程度的信息,及時(shí)回復(fù)組被試被告知管理層一般24小時(shí)內(nèi)回復(fù),不及時(shí)回復(fù)組被試被告知管理層一般在一兩天回復(fù),有時(shí)在一周之后,而管理層回復(fù)明確程度則是通過向被試提供在互動(dòng)平臺(tái)上以一問一答的形式出現(xiàn)的五組公司管理層回復(fù)投資者的實(shí)例。實(shí)驗(yàn)結(jié)果表明管理層回復(fù)越及時(shí),回復(fù)明確程度越高,投資者的投資可能性越高。

研究背景和理論假設(shè)

從互動(dòng)的主體來看,目前國(guó)內(nèi)典型的財(cái)經(jīng)互動(dòng)平臺(tái)可以分為三種類型。第一類是上市公司與投資者之間的互動(dòng)平臺(tái),比如深交所的“互動(dòng)易”以及各上市公司的官方博客、微博,是網(wǎng)絡(luò)時(shí)代提高上市公司信息透明度重要途徑;第二類是投資者之間的互動(dòng)平臺(tái),以東方財(cái)富網(wǎng)股吧為典型代表,股吧提供了雙向信息交互方式,已成為中小投資者分享投資經(jīng)驗(yàn)的重要平臺(tái),但也具有鮮明的草根特點(diǎn),其中的信息表現(xiàn)出非理性情緒多、虛假信息多、無關(guān)信息多等特點(diǎn)(證券市場(chǎng)導(dǎo)報(bào),2012)[17]。第三類是財(cái)經(jīng)名家或者專業(yè)投資者與普通投資者的互動(dòng)平臺(tái),包括新浪、搜狐以及和訊的博客,專業(yè)人士作為博主發(fā)表財(cái)經(jīng)評(píng)論,并與其他博主、普通投資者展開互動(dòng)1。本文的研究對(duì)象是第三類互動(dòng)平臺(tái)。

新浪博客自2005年上線,采用以明星吸引大量草根博客的策略,逐漸形成了分布廣泛、基礎(chǔ)龐大而穩(wěn)定的用戶群。根據(jù)Alexa中國(guó)官方網(wǎng)站2016年2月的及時(shí)數(shù)據(jù),新浪博客的人均頁(yè)面瀏覽量為3.69,而其主要競(jìng)爭(zhēng)對(duì)手網(wǎng)易博客、搜狐博客的人均頁(yè)面瀏覽量分別為1.35和1.67,新浪博客的知名度和活躍度在同類網(wǎng)絡(luò)平臺(tái)中處于領(lǐng)先地位。新浪財(cái)經(jīng)博客匯集了財(cái)經(jīng)界眾多知名學(xué)者和專業(yè)投資者,每日刊發(fā)眾多財(cái)經(jīng)評(píng)論和觀點(diǎn)。鑒于新浪財(cái)經(jīng)博客具有較大的知名度和影響力,本文將其作為研究對(duì)象。

圖1顯示了基于博客的社會(huì)網(wǎng)絡(luò)關(guān)系。根據(jù)社會(huì)網(wǎng)絡(luò)的分析方法,在一部分局部網(wǎng)絡(luò)中,一些行動(dòng)者具有“中心性”,他們居于中心地位并往往與他者有多種關(guān)聯(lián)。我們認(rèn)為博主便是這樣一個(gè)在局部網(wǎng)絡(luò)中處于中心地位的角色。基于博客的社會(huì)互動(dòng)包含了三個(gè)層次:首先,不同博主之間存在相互關(guān)注、訪問的關(guān)系;第二,投資者通過閱讀博客、轉(zhuǎn)載或評(píng)論等與博主產(chǎn)生直接交流關(guān)系;第三,不同的投資者之間存在信息溝通。從社會(huì)互動(dòng)的內(nèi)涵來看,以上三層關(guān)系均屬于社會(huì)互動(dòng)的范疇。本文所要研究的社會(huì)互動(dòng)指上述的第二層關(guān)系,即投資者與博主的互動(dòng)。

圖1 博客的社會(huì)網(wǎng)絡(luò)關(guān)系與互動(dòng)傳播模式

博主與投資者之間的互動(dòng)對(duì)投資決策的影響可以通過以下兩個(gè)渠道來實(shí)現(xiàn)。首先,財(cái)經(jīng)博客的博主是財(cái)經(jīng)界名人或者至少是具有一定財(cái)經(jīng)專業(yè)知識(shí)的專業(yè)人士,大多數(shù)散戶投資者都是缺乏相關(guān)專業(yè)知識(shí)的,因此,財(cái)經(jīng)博客自然成為投資者十分倚重的信息源和決策基礎(chǔ),他們所傳遞的信息也往往被投資者當(dāng)做具有權(quán)威性的意見來認(rèn)知、傳播,從而影響投資者的信息結(jié)構(gòu)以及對(duì)信息的解讀。其次,投資者在評(píng)論/轉(zhuǎn)發(fā)博客時(shí)會(huì)對(duì)接收的信息進(jìn)一步深化,或者通過評(píng)論來表達(dá)自己的相反意見,評(píng)論/轉(zhuǎn)發(fā)這一系列行為又會(huì)影響投資者的判斷和決策。以上兩個(gè)方面表明,互動(dòng)會(huì)影響投資者對(duì)信息的感知和處理,并最終影響投資行為,也就是說,處于中心地位的博主以這樣一種發(fā)散式網(wǎng)狀互動(dòng)模式,一層一層地對(duì)投資者產(chǎn)生直接、間接影響,從而通過投資者的交易行為持續(xù)作用于股票市場(chǎng)。

根據(jù)以上分析,本文提出的理論假設(shè)是以博客為平臺(tái)的社會(huì)互動(dòng)模式會(huì)對(duì)我國(guó)股票市場(chǎng)產(chǎn)生影響。

研究設(shè)計(jì)

一、樣本選取與數(shù)據(jù)來源

我們選取新浪財(cái)經(jīng)博客中與股票市場(chǎng)聯(lián)系最直接、關(guān)聯(lián)度最高的四個(gè)板塊“獨(dú)家看市”、“博客看市”、“板塊/個(gè)股”以及“證券市場(chǎng)”作為博客樣本。時(shí)間跨度確定為2013年12月18日~2015年11月27日,包含了股票指數(shù)逐步進(jìn)入上升階段,價(jià)格不斷膨脹,隨后猛烈下跌的周期。我們通過文本挖掘來獲取每篇博客的文本信息、博客的閱讀數(shù)、評(píng)論/轉(zhuǎn)發(fā)/喜歡/收藏?cái)?shù)、博主的關(guān)注人氣等內(nèi)容,并通過文本分類來獲取每篇博客所傳遞的信號(hào)或者情緒,由此構(gòu)建以日為單位的反映社會(huì)互動(dòng)的各項(xiàng)指標(biāo)。

股票市場(chǎng)的變量包括市場(chǎng)指數(shù)的收益率、波動(dòng)率和成交量。數(shù)據(jù)均來自Wind數(shù)據(jù)庫(kù),收益率選用滬深300指數(shù)當(dāng)日漲跌幅率,波動(dòng)率選用滬深300指數(shù)近26周波動(dòng)率,按照26周窗口滾動(dòng)計(jì)算,計(jì)算公式為其中xi是區(qū)間內(nèi)對(duì)數(shù)收益率,μx為平均收益率。

二、變量構(gòu)造說明

為了獲得新浪財(cái)經(jīng)博客的相關(guān)數(shù)據(jù),我們需要采用文本挖掘技術(shù)來摘取網(wǎng)頁(yè)上的信息。使用Gooseeker網(wǎng)絡(luò)爬蟲軟件掃描博客網(wǎng)站的底層代碼,通過html標(biāo)簽來抓取原始數(shù)據(jù)。在原始數(shù)據(jù)清洗與整理之后得到1262條博主數(shù)據(jù)和142579條博文數(shù)據(jù)。博主數(shù)據(jù)的變量包括博主ID、博主主頁(yè)、博主昵稱、關(guān)注人氣等;博文數(shù)據(jù)的主要變量是博客ID、博客標(biāo)題、博客發(fā)表時(shí)間、閱讀數(shù)/評(píng)論數(shù)/喜歡數(shù)/收藏?cái)?shù)/轉(zhuǎn)發(fā)數(shù)等。我們統(tǒng)計(jì)了關(guān)注度最高的10位博主信息,如表1所示。

表1 關(guān)注度最高的10位博主信息

我們以日為單位構(gòu)建社會(huì)互動(dòng)變量。變量構(gòu)建步驟如下:

第一步,按如下公式計(jì)算每日的博客數(shù)量、閱讀數(shù)、評(píng)論/轉(zhuǎn)發(fā)/喜歡/收藏?cái)?shù)以及高人氣博主所占比例。

每日高人氣博主所占比例的計(jì)算方法是將1262位博主按照關(guān)注人氣排序,選取關(guān)注人氣排名前100的博主。我們將這100位博主定義為高人氣博主,然后統(tǒng)計(jì)每天發(fā)表博客的博主中這些高人氣博主所占比例。

第二步,利用文本分類方法,確定每日的情緒指數(shù)。

142579篇博客按照它所傳遞的信號(hào)被分為“積極”、“中立”和“消極”三類。由于博客正文篇幅過長(zhǎng),這里我們僅針對(duì)博客標(biāo)題進(jìn)行分類2。分類的過程主要如下:首先,從全體博客樣本中隨機(jī)抽取一小部分作為“訓(xùn)練數(shù)據(jù)集”進(jìn)行人工分類。為了保證訓(xùn)練數(shù)據(jù)集分類客觀、有代表性,我們從全體樣本中抽取2000條博客,邀請(qǐng)三位金融學(xué)研究生共同進(jìn)行人工分類:若認(rèn)為博客標(biāo)題傳遞的是積極信號(hào)或情緒則分類為“積極”;若博客標(biāo)題傳遞的是消極信號(hào)或情緒則分類為“消極”;若是中性信號(hào)則分類為“中立”。取三人的眾數(shù)作為最終結(jié)果,若三人的分類各異,則把該條博客歸為“中立”。然后,計(jì)算機(jī)通過學(xué)習(xí)訓(xùn)練數(shù)據(jù)集的結(jié)果建立計(jì)算機(jī)自己的分類模型。我們使用應(yīng)用最廣泛的數(shù)據(jù)挖掘開源包Weka,將多種算法進(jìn)行比較后選擇正確率最高的KNN算法3,并選取參數(shù)K=5。最后,將訓(xùn)練得到的分類模型再反過來應(yīng)用在訓(xùn)練數(shù)據(jù)集上進(jìn)行驗(yàn)證,發(fā)現(xiàn)計(jì)算機(jī)對(duì)博客分類的正確率超過90%,這說明分類方法較為準(zhǔn)確地判斷了博客傳遞的信號(hào)4。

在對(duì)142579篇博客進(jìn)行情緒分類之后,我們借鑒Antweiler和Frank(2004)[1]的方法構(gòu)建博客情緒指數(shù)。假設(shè)一天中傳遞“積極”信號(hào)的所有博客數(shù)量設(shè)為一天中傳遞“消極”信號(hào)的所有博客數(shù)量設(shè)為則每日的博客情緒指數(shù)構(gòu)造如下:

可以看出,該指數(shù)越大,表明當(dāng)天博客整體傳遞的信號(hào)或情緒越積極,反之,越消極。

第三步,構(gòu)造包含情緒特征的互動(dòng)變量。

互動(dòng)的主體是博主與投資者,從博主的角度,一方面我們需要考察眾多博主的互動(dòng)訴求如何,即每天有多少篇博客被發(fā)表;另一方面則是博主的影響力,在所有博客中,其博主為高人氣博主的比例如何。從投資者的角度,一方面可以通過博客的閱讀量來衡量互動(dòng)覆蓋范圍的大小,另一方面可以通過博客的評(píng)論/轉(zhuǎn)發(fā)/喜歡/收藏?cái)?shù)來衡量互動(dòng)程度的高低。除了上述衡量互動(dòng)程度的指標(biāo)之外,我們構(gòu)造的互動(dòng)變量還需要包含博客所傳遞的情緒傾向,也就是這種社會(huì)互動(dòng)的屬性是消極、積極還是中性。

結(jié)合第一步中計(jì)算出的每日的博客數(shù)量、閱讀數(shù)、評(píng)論/轉(zhuǎn)發(fā)/喜歡/收藏?cái)?shù)和高人氣博主所占比例,以及第二步中構(gòu)建的每日博客情緒指數(shù),將它們分別相乘取乘積,便可以確定最終的每日包含情緒的社會(huì)互動(dòng)變量,如表2所示。

實(shí)證結(jié)果與分析

一、變量描述性統(tǒng)計(jì)

在我們的樣本期內(nèi),共有475個(gè)交易日。表3是本文所使用的每日博客數(shù)據(jù)的統(tǒng)計(jì)情況。

475個(gè)交易日中,博客數(shù)量平均值為276,發(fā)表最多的一天達(dá)448篇。閱讀數(shù)最多的一天平均每篇博客被閱讀了34086次,閱讀數(shù)最少的一天則是1754次。評(píng)論/轉(zhuǎn)發(fā)/喜歡/收藏?cái)?shù)中,平均值最大的是喜歡數(shù)76.57,表明投資者使用最多的一種互動(dòng)形式是點(diǎn)擊“喜歡”,就像在微博、微信等社交平臺(tái)上點(diǎn)贊一樣,由于最為方便快捷而成為了投資者最喜歡的互動(dòng)形式。一些博客關(guān)閉了評(píng)論功能或者禁止轉(zhuǎn)載,但我們難以分辨究竟是博主關(guān)閉了這種功能還是沒有人評(píng)論和轉(zhuǎn)發(fā),兩種情況混在一起,會(huì)使得我們統(tǒng)計(jì)出來的數(shù)據(jù)偏低,因此在下文的分析中我們僅使用其中的“喜歡數(shù)”來作進(jìn)一步的分析。高人氣博主所占比例的均值為0.20,并且大多比例都介于0.15和0.30之間,較為穩(wěn)定。

表2 社會(huì)互動(dòng)變量的構(gòu)造

表3 每日博客原始數(shù)據(jù)描述性統(tǒng)計(jì)

關(guān)于博客情緒指數(shù),根據(jù)上文的構(gòu)建方法可知,情緒指數(shù)大于0,說明當(dāng)天的博客整體傳遞出積極信號(hào),數(shù)值越大,積極信號(hào)越強(qiáng)烈;情緒指數(shù)等于0,傳遞中性信號(hào);情緒指數(shù)小于0,則整體傳遞消極信號(hào)。本文的475個(gè)樣本中,213天的數(shù)值小于0,平均值為-0.27;等于0的天數(shù)為16天;其余246天的情緒指數(shù)均大于0,平均值為0.29。各互動(dòng)變量和股票市場(chǎng)變量的描述性統(tǒng)計(jì),如表4所示。

為了能夠直觀地觀察互動(dòng)變量與股票市場(chǎng)的關(guān)系,我們選取其中的幾組變量繪制成如圖所示的變化曲線。圖2的左軸是博主的互動(dòng)訴求——包含情緒的博客數(shù)量,右軸是滬深300指數(shù)收益率。總體來看,兩者呈現(xiàn)出一定的聯(lián)動(dòng)關(guān)系,收益率的上漲往往伴隨著博主的互動(dòng)訴求的增加。

表4 主要變量描述性統(tǒng)計(jì)

圖2 博主的互動(dòng)訴求與滬深300指數(shù)收益率

圖3 博客閱讀量與滬深300指數(shù)成交量

圖3顯示了博客閱讀量與滬深300指數(shù)成分股成交量隨時(shí)間變化的趨勢(shì)。左軸代表博客閱讀量,右軸代表成交量。成交量在2014年10月底開始陡增,隨后的階段博客閱讀量與成交量存在明顯的正向動(dòng)態(tài)關(guān)系5,尤其是在2015年3~6月股市成交量迅猛增加的時(shí)期,投資者熱情高漲,博客閱讀量也顯著上升。在2015年6~7月股災(zāi)發(fā)生的階段,成交量迅速萎縮,而博客閱讀量曾出現(xiàn)急劇上升的情況,這意味著市場(chǎng)的高度不確定性引發(fā)了大量投資者的關(guān)注,人們不愿意相信牛市終結(jié)了。至2015年10月成交量和博客閱讀量雙雙跌落到低點(diǎn),這表明投資者對(duì)市場(chǎng)已經(jīng)失去信心。

二、社會(huì)互動(dòng)對(duì)股票市場(chǎng)的影響

本文中股票市場(chǎng)的相關(guān)變量是以時(shí)間序列的形式呈現(xiàn)的,因此我們采用GJR-GARCH(1,1)模型來分析社會(huì)互動(dòng)對(duì)股票市場(chǎng)的影響。

我們使用Stata計(jì)量軟件。首先,對(duì)各個(gè)互動(dòng)變量和股票市場(chǎng)變量序列進(jìn)行ADF平穩(wěn)性檢驗(yàn),結(jié)果顯示,所有互動(dòng)變量均為平穩(wěn)時(shí)間序列,滬深300指數(shù)收益率為平穩(wěn)序列(收益率單位為%),而波動(dòng)率和成交量取其一階差分Dvolatility和Dvolume后平穩(wěn)。接著,我們檢驗(yàn)是否存在ARCH效應(yīng)。以滬深300指數(shù)收益率和包含情緒的博客數(shù)量為例,先建立簡(jiǎn)單的線性模型:

BG檢驗(yàn)的p值為0.0409,在5%顯著性水平下拒絕“無自相關(guān)”的原假設(shè),即認(rèn)為存在線性的自相關(guān)關(guān)系,因而修改上述簡(jiǎn)單線性模型為:

BG檢驗(yàn)的p值為0.2564,無法拒絕“無自相關(guān)”的原假設(shè),即認(rèn)為不存在線性的自相關(guān)關(guān)系。然后對(duì)該線性模型做ARCH效應(yīng)檢驗(yàn):采用最小二乘法OLS估計(jì)原方程,進(jìn)而對(duì)殘差平方序列進(jìn)行Q檢驗(yàn),結(jié)果顯示存在ARCH效應(yīng)。

最后,我們建立GJR-GARCH(1,1)模型,具體形式如下:

其中,λ1表示包含情緒的博客數(shù)量對(duì)滬深300指數(shù)收益率的影響,衡量了博主的互動(dòng)訴求是否會(huì)影響到市場(chǎng)指數(shù)的收益率。α1、?1和?1則分別是ARCH項(xiàng)、GARCH項(xiàng)和TARCH的系數(shù),其中,dt-1為虛擬變量,當(dāng)隨機(jī)擾動(dòng)項(xiàng)εt-1小于0(表示負(fù)沖擊)時(shí),dt-1等于1,反之等于0,因此,若?1大于0,表示負(fù)的沖擊對(duì)收益率的影響要大于同等強(qiáng)度的正向沖擊,小于0則表示正向沖擊對(duì)收益率的影響要大于同等強(qiáng)度的負(fù)沖擊。這里,我們需要重點(diǎn)考察的是系數(shù)λ1。

對(duì)于其他幾組變量,采用上述同樣的方法檢驗(yàn)ARCH效應(yīng)并構(gòu)建模型。

表5、6、7和8顯示了四個(gè)互動(dòng)變量分別與滬深300指數(shù)收益率、波動(dòng)率和成交量回歸的結(jié)果(其中收益率的單位取%)。

表5 博主對(duì)互動(dòng)的訴求EN對(duì)股票市場(chǎng)的影響

表5的結(jié)果顯示,包含情緒的博客數(shù)量EN對(duì)滬深300指數(shù)收益率在1%顯著性水平上具有正向影響、對(duì)成交量在5%顯著性水平上具有正向影響,但對(duì)于波動(dòng)率的影響不顯著。這表明財(cái)經(jīng)博客的博主作為互動(dòng)的主體,他們的互動(dòng)訴求越強(qiáng)烈,包含情緒的博客數(shù)量越大,那么這種互動(dòng)效應(yīng)就越能影響到市場(chǎng)指數(shù)收益率和成交量的提高。

從表6可以看出,包含情緒的高人氣博主所占比例與滬深300指數(shù)收益率與成交量都呈顯著正相關(guān)關(guān)系,而與波動(dòng)率關(guān)系不顯著。說明互動(dòng)主體的影響力會(huì)在一定程度上增加市場(chǎng)收益、擴(kuò)大成交量。

表7和表8的結(jié)果顯示,互動(dòng)覆蓋范圍與滬深300指數(shù)收益率和成交量均顯著正相關(guān),與波動(dòng)率負(fù)相關(guān)但是不顯著;互動(dòng)程度同樣與收益率和成交量正相關(guān)并且顯著,同時(shí)與波動(dòng)率負(fù)相關(guān)但不顯著。我們知道,互動(dòng)覆蓋范圍和互動(dòng)程度是分別由閱讀數(shù)和喜歡數(shù)與博客情緒指數(shù)的乘積項(xiàng)來衡量的,對(duì)于同樣的閱讀數(shù)或喜歡數(shù),若情緒越積極,或者對(duì)于同樣的情緒指數(shù),若閱讀數(shù)或喜歡數(shù)越高,互動(dòng)的效應(yīng)就會(huì)越大,這種效應(yīng)帶來了股市收益率和成交量的增加。

此外,表5、6、7和8的結(jié)果中,波動(dòng)率方程中的TARCH(1)項(xiàng)均顯著為負(fù),而成交量方程中的TARCH(1)項(xiàng)均顯著為正,表明對(duì)波動(dòng)率來說,正向沖擊的影響比同等強(qiáng)度的負(fù)向沖擊的影響更大,即好消息對(duì)波動(dòng)率的波動(dòng)性的影響大于壞消息;而對(duì)成交量來說,負(fù)向沖擊的影響比同等強(qiáng)度的正向沖擊的影響更大,即壞消息對(duì)成交量的波動(dòng)性的影響大于好消息。

表6 博主的影響力EI對(duì)股票市場(chǎng)的影響

表7 互動(dòng)覆蓋范圍ER對(duì)股票市場(chǎng)的影響

表8 互動(dòng)程度EL對(duì)股票市場(chǎng)的影響

三、穩(wěn)健性檢驗(yàn)

為了進(jìn)一步考察社會(huì)互動(dòng)對(duì)股票市場(chǎng)的影響同時(shí)對(duì)上述結(jié)果進(jìn)行穩(wěn)健性檢驗(yàn),我們按照滬深300指數(shù)點(diǎn)位分組回歸、更換因變量為上證指數(shù)和創(chuàng)業(yè)板指數(shù)再進(jìn)行回歸。

根據(jù)2014~2015年滬深300指數(shù)的具體情況來看,2015年6月8日到達(dá)最高5335.12點(diǎn),此前指數(shù)呈明顯上漲期,而此后呈明顯下跌期。因此,我們以2015年6月8日為節(jié)點(diǎn),將總體樣本分為兩個(gè)部分分別對(duì)收益率進(jìn)行回歸:5335.12點(diǎn)之前,359個(gè)交易日,為上漲期;5335.12點(diǎn)之后,116個(gè)交易日,為下跌期?;貧w結(jié)果如表9所示(此處僅報(bào)告均值方程中社會(huì)互動(dòng)變量的系數(shù)情況)。

上文總體樣本的回歸的四個(gè)互動(dòng)變量均顯著,此處分組的結(jié)果與總體樣本保持一致。再進(jìn)一步觀察回歸結(jié)果,下跌期樣本的系數(shù)均大于上漲期樣本。例如,對(duì)于互動(dòng)程度EL,EL每增加(減少)一單位,下跌期樣本對(duì)指數(shù)收益率的影響是低指數(shù)點(diǎn)位樣本的1.87倍。由此可見,在我國(guó)股市2015年6月以后出現(xiàn)的暴跌階段,面對(duì)股市高度的不確定性,投資者之間社會(huì)互動(dòng)對(duì)股票市場(chǎng)產(chǎn)生了更為顯著的影響。

表10是以上證指數(shù)收益率和創(chuàng)業(yè)板指數(shù)收益率為因變量的估計(jì)結(jié)果。我們將上文的滬深300指數(shù)的結(jié)果同時(shí)列出進(jìn)行比較。可以看出,四組因變量回歸的結(jié)果不論是互動(dòng)變量的系數(shù)方向還是顯著性水平均保持一致,只是系數(shù)大小不同??傮w來看,社會(huì)互動(dòng)對(duì)創(chuàng)業(yè)板指數(shù)的影響略大一些,這可能是處于成長(zhǎng)階段的創(chuàng)業(yè)板更容易受到社會(huì)互動(dòng)這種外部因素的作用。

表9 互動(dòng)變量對(duì)滬深300指數(shù)收益率影響的分組回歸結(jié)果(均值方程)

表10 互動(dòng)變量對(duì)滬深300指數(shù)、上證指數(shù)、創(chuàng)業(yè)板指數(shù)收益率的影響(均值方程結(jié)果)

結(jié)論

本文以新浪財(cái)經(jīng)博客作為社會(huì)互動(dòng)的方式,實(shí)證檢驗(yàn)社會(huì)互動(dòng)對(duì)股票市場(chǎng)的影響。從互動(dòng)的主體——博主和投資者兩個(gè)角度出發(fā),我們利用文本挖掘技術(shù)分析了2013年12月~2015年11月期間博客文本的情緒傾向,構(gòu)造了四個(gè)變量來描述和衡量投資者的社會(huì)互動(dòng)。具體包括博主的互動(dòng)訴求、博主的影響力、互動(dòng)覆蓋范圍和互動(dòng)程度。實(shí)證結(jié)果顯示博主的互動(dòng)訴求、博主的影響力、互動(dòng)覆蓋范圍和互動(dòng)程度對(duì)市場(chǎng)指數(shù)的收益率和成交量存在正向影響。樣本期間我國(guó)股票市場(chǎng)發(fā)生了劇烈的震蕩,股指呈現(xiàn)倒U型走勢(shì)。以2015年6月股指達(dá)到頂點(diǎn)為分界線,我們發(fā)現(xiàn)社會(huì)互動(dòng)對(duì)收益率的影響程度在指數(shù)處于下跌期時(shí)比上升期時(shí)更大。與滬深300指數(shù)和上證指數(shù)相比,創(chuàng)業(yè)板指數(shù)收益率受到互動(dòng)的影響更大。此外,博主的互動(dòng)訴求、博主的影響力、互動(dòng)覆蓋范圍和互動(dòng)程度對(duì)波動(dòng)率均沒有顯著影響。

本文的結(jié)論為網(wǎng)絡(luò)互動(dòng)對(duì)股票市場(chǎng)產(chǎn)生的影響提供了證據(jù)?;谏鲜鼋Y(jié)論,我們認(rèn)為在互聯(lián)網(wǎng)時(shí)代,監(jiān)管當(dāng)局應(yīng)該規(guī)范網(wǎng)絡(luò)互動(dòng)平臺(tái),杜絕不實(shí)謠言,并積極引導(dǎo)投資者理性、健康地參與社會(huì)互動(dòng),在長(zhǎng)期內(nèi)營(yíng)造和諧的、有助于推動(dòng)經(jīng)濟(jì)發(fā)展與改革的社會(huì)互動(dòng)氛圍。而對(duì)于財(cái)經(jīng)博客的博主來說,作為一名財(cái)經(jīng)專業(yè)人士,應(yīng)該理性表達(dá)自己的觀點(diǎn)態(tài)度,不能為了吸引讀者眼球、彰顯個(gè)性、提升知名度而刻意夸大說法;此外,還應(yīng)該避免傳遞盲目樂觀或者過分悲觀的信號(hào)及情緒,以此引導(dǎo)投資者行為趨于理性,為市場(chǎng)的發(fā)展產(chǎn)生積極的作用。

注釋

1. 近年來興起的雪球網(wǎng)兼具第二類和第三類平臺(tái)的特征,即有實(shí)名認(rèn)證的知名專業(yè)人士,也有普通投資者。

2. 通常情況下,投資者在瀏覽博客時(shí),正文部分不一定會(huì)看完,或者僅僅瀏覽博客列表,那么此時(shí)投資者接收到的信息幾乎完全來自博客標(biāo)題,因此我們僅針對(duì)標(biāo)題分類也具有現(xiàn)實(shí)合理性。

3. KNN算法的基本原理是:如果一個(gè)樣本與K個(gè)最相似的樣本中的大多數(shù)屬于某一個(gè)類別,則該樣本也屬于這個(gè)類別。例如,在K=5時(shí),有某篇待分類的博客,我們找出它在訓(xùn)練數(shù)據(jù)集中特征最相近的5篇博客,如果其中有3篇博客都是積極類,則該篇博客也被分類為積極。

4. 實(shí)際上,計(jì)算機(jī)對(duì)博客分類的錯(cuò)誤大多來自將一部分傳遞積極或消極信號(hào)的博客歸為了中立類型,而混淆積極和消極的錯(cuò)誤是很少出現(xiàn)的。具體結(jié)果顯示:訓(xùn)練數(shù)據(jù)集中被人工分類為“消極”的博客,其中3.12%被錯(cuò)誤地歸為了積極;而人工分類為“積極”的博客,其中0.50%被錯(cuò)誤地歸為了消極。

5. 如果剔除2013年12月26日博客閱讀量的異常點(diǎn),閱讀量高峰均出現(xiàn)在2015年6月之后。

猜你喜歡
博主博客投資者
跟著零食博主買拼多多小吃
好日子(2022年6期)2022-08-17 07:16:42
如果孩子想當(dāng)美妝博主
投資者
聊聊“普通投資者”與“專業(yè)投資者”
時(shí)尚博主謝慕梓:分享身邊的美
金橋(2021年1期)2021-05-21 08:22:04
新興市場(chǎng)對(duì)投資者的吸引力不斷增強(qiáng)
博客天下
博客天下(2015年2期)2015-09-15 14:12:57
創(chuàng)意折紙小動(dòng)物
投資者關(guān)注對(duì)IPO首日收益率影響幾何?
博客相冊(cè)
博客天下(2009年12期)2009-08-21 07:35:10
西盟| 喀什市| 贵州省| 乳源| 马边| 隆子县| 绍兴县| 灵武市| 博罗县| 红原县| 汾西县| 朝阳区| 林州市| 会泽县| 易门县| 灵川县| 泾川县| 宜君县| 洛隆县| 称多县| 雅江县| 兴山县| 义乌市| 澄城县| 涟水县| 民丰县| 砀山县| 罗城| 义乌市| 雷波县| 阜城县| 怀宁县| 中方县| 平顺县| 信丰县| 施秉县| 宜川县| 大姚县| 黑水县| 集贤县| 阳东县|