楊玉龍,吳文,高永靖,張倩男
(1. 浙江工商大學 財務與會計學院,浙江 杭州 310018;2. 清華大學 五道口金融學院,北京 100083;3. 上海財經大學 會計學院,上海 200433)
我國的媒體最具特色之處是其雙重性,以及由此衍生的媒體產業(yè)的雙軌制運營(李良榮,2003)。改革開放以后,我國經濟開始逐步轉型,媒體產業(yè)結構也開始出現變化。特別是1992年之后,媒體企業(yè)化經營取得突破,部分媒體由政府撥款轉向自負盈虧,經濟上逐漸獨立(田中初,2005)。同時,媒體數量迅速增長,管理機構開始對媒體產業(yè)采取“抓大放小”的分層管理策略。于是,媒體出現分化,一部分媒體繼續(xù)維持傳統(tǒng)運營模式,資訊內容偏重在政策方面;另一部分媒體如都市商業(yè)類報刊則逐步獲得相對獨立的編輯權,并開始注重市場對于資訊的訴求(李良榮,2003)。我們將前者稱為“政策導向媒體”,將后者稱為“市場導向媒體”,這便形成了我國媒體產業(yè)雙軌制運營的特色。
通過對政策導向媒體和市場導向媒體正負面詞匯使用的橫向與縱向比較,我們可以看到媒體雙軌制運營對資訊內容的鮮明影響。圖1繪制了巨靈財經數據庫2000?2013年所收錄的政策導向媒體與市場導向媒體(相關定義與分類見下文)的正負面報道比例情況。圖中有三點值得注意:一是媒體的正面報道比例遠高于負面報道;二是市場導向媒體的正面報道要少于政策導向媒體,而負面報道要多于政策導向媒體;三是從時間趨勢來看,正面報道比例在逐步減少,負面報道比例則逐漸增加,而且這一趨勢在市場導向媒體中更加明顯。
圖1 2000?2013年政策導向媒體與市場導向媒體歷年的正負面報道比例
資訊文本是信息的載體,不同類型媒體在資訊文本方面的差異必然導致在信息傳遞效果上有所不同。以往的文獻從整體上探討了媒體在優(yōu)化公司治理、提升資本市場信息效率方面的作用,并給予了正面評價。更深入的研究還需要對媒體類型和資訊文本特征同時進行識別和分析,從而考察不同類型媒體的差異化表現。畢竟,對資本市場上的投資者而言,他們更感興趣的問題是選取哪一類媒體、閱讀哪一類資訊來支持其決策。換言之,他們需要識別對資本市場信息整合有實質性影響的媒體與資訊。因此,本文將從我國媒體的雙軌制運營出發(fā),探討政策導向媒體與市場導向媒體在影響資本市場信息整合方面的差異,并分析導致這種差異的原因。
本文發(fā)現,媒體做出的負面報道能夠促進特質性信息反映在個股股價中,正面報道反而不利于特質性信息整合。在將媒體區(qū)分為政策導向媒體和市場導向媒體后,本文發(fā)現媒體對資本市場的影響主要由政策導向媒體促成,市場導向媒體則無顯著影響。隨后,本文對媒體的資訊內容進行了文本分析,并計量了資訊內容的兩項特征:信息傳遞和信息挖掘。分析結果表明,政策導向媒體的報道在這兩項特征上顯著不同于市場導向媒體。引入調節(jié)變量模型后,我們發(fā)現政策導向媒體主要憑借更深層次的信息挖掘與更精準的信息傳遞,更有力地在影響資本市場的信息整合。
本文可能存在以下兩點貢獻:第一,從我國媒體產業(yè)雙軌制運營的特色入手,探討了政策導向媒體與市場導向媒體在影響資本市場信息整合效率方面的差異。我們使用股價同步性和知情交易概率兩個指標來衡量媒體信息整合效率,發(fā)現政策導向媒體可以更好地提升資本市場信息效率。另外,本文還發(fā)現媒體提升資本市場信息效率的關鍵在于信息挖掘的深入程度和信息傳遞的精準程度。這有助于監(jiān)管部門評價和選擇信息發(fā)布的媒體平臺,并在資訊內容方面對媒體報道給予指引與建議。
第二,在技術方面,本文依托中國知網“中文信息結構庫”提供的正負面詞庫,結合Loughran和McDonald(2011)提供的英文正負面詞匯清單,通過文本挖掘得到了適用于我國媒體報道的正負面詞庫。同時,我們使用Python編程語言,以巨靈財經報刊數據庫為基礎,構建了時間跨度超過十年(2000?2013年)的媒體正負面報道數據庫。此外,我們還利用潛在語義主題分配模型(Latent Dirichlet Allocation,簡稱LDA主題分析)度量了不同類型媒體對上市公司公告跟蹤報道的信息挖掘深度和信息傳遞精度,并以此為基礎解釋了政策導向媒體和市場導向媒體在影響資本市場信息整合效率方面的差異。
(一)正負面報道與資本市場信息效率
公司股票價格的形成和變動有賴于三個層面的信息,即宏觀信息、行業(yè)信息以及公司特質性信息(Piotroski和Roulstone,2004)。其中,宏觀信息和行業(yè)信息會引起資本市場上所有公司或特定行業(yè)所有公司的股價波動,只有與公司基本面相關的特質性信息才會引起單個公司股價產生獨立于市場或行業(yè)趨勢的特異性波動。宏觀和行業(yè)信息所引發(fā)的市場上多只股票的同向價格波動導致了股市的“同漲同跌”現象,即股價同步性。因此,股價同步性可以作為個股股價中特質性信息含量的反向測度(Morck等,2000)。本文主要使用股價同步性作為資本市場信息效率的測度指標。之所以選取這個指標,主要基于以下兩點考慮:第一,股價同步性指標可以測度個股交易中整合的公司特質性信息(Morck等,2000),這便于我們直接探討哪種類型的媒體能夠挖掘更多的公司特質性信息;第二,媒體跟蹤上市公司時覆蓋的時間跨度往往很長,能夠涵括這一時間跨度影響的市場類指標以股價同步性為佳,因為它可以精確地截取研究所需的市場交易時段進行計算。
在資本市場中,不同類型信息的擴散模式存在差異。這種信息傳播差異可能來自兩個方面:一方面,讀者有關注負面消息的傾向。相對于好消息,人們更傾向于傳播壞消息,所謂“好事不出門,壞事行千里”。在演化過程中,人類繼承了原始社會狩獵環(huán)境下的相關習性,出于生存需要對負面與危險信號極為關注(Liu等,2014),這一遺傳習性直接影響了我們對于信息資訊的傳遞。個體在獲知好消息后,平均而言會向6個人傳遞;而在獲知壞消息后,平均而言會向23個人傳遞(趙亞東和高研,2012)。Heath(1996)的實驗研究也表明,在社會氛圍普遍消極的情境下,人們更樂意傳遞壞消息。另一方面,個體有累積壞消息并打包釋放的傾向。個體在面臨多項損失或多項收益時,為了得到最大的效用,通常將損失合并在一起而將收益逐一分開(Kahneman和Tversky,1979)。這導致上市公司管理層有動機暫時隱藏壞消息,而等待特定時機一起公布(Kothari等,2009)。
綜上所述,當媒體大規(guī)模披露壞消息時,壞消息應當比好消息傳遞得更快,①Hong等(2000)認為“Bad news travels slowly”,這看似與本文矛盾。但他們強調的是管理層會有意識地暫時隱藏公司的負面信息,使壞消息的釋放與好消息相比會出現延遲。本文試圖論證的是公司的壞消息被媒體挖掘(釋放)出來后,在資本市場上傳遞的速度要快于好消息。這也與生活常識相一致,所謂“好事不出門,壞事傳千里”。因此,本文的觀點與其并不矛盾。而且管理層可能暫時隱藏壞消息而等待時機一起釋放,導致壞消息披露時包含的公司特質性信息更多。因此,媒體針對上市公司的負面報道比例越高,上市公司股價同步性越低。而正面信息在傳遞中則相對緩慢且分散,使得上市公司股價在整合正面資訊時不如負面資訊及時,股價更多地隨宏觀或行業(yè)層面信息波動,從而股價同步性較高。據此,本文提出以下假說:
假說1:對上市公司的報道中,負面報道比例越高,該上市公司股價同步性越低;正面報道比例越高,該上市公司股價同步性越高。
(二)媒體雙軌制運營與資本市場信息整合
政策導向媒體與市場導向媒體的資金來源不同。政策導向媒體享有公費訂閱的支持,并在稅收上得到減免等優(yōu)惠;市場導向媒體則被推向市場,自負盈虧,易為廣告費用等商業(yè)利益所俘獲,從而在針對上市公司的報道中表現出較弱的獨立性。
媒體的利益訴求會影響其報道行為,其中以商業(yè)利益最為典型。媒體挖掘和傳播有關上市公司的私有信息可以促進資本市場的信息整合,但在挖掘出上市公司私有信息之后,并不必然通過發(fā)布報道來擴大報刊銷量獲益,也可通過威脅上市公司高管索取封口費來謀利,這便是“有償沉默”。方軍雄(2014)發(fā)現,如果公司在IPO期間向媒體支付費用以換取沉默,那么這類公司在IPO之后的盈余質量更差,也更可能出現業(yè)績反轉。這表明媒體的有償沉默縱容了內部人的私有信息交易,犧牲其他投資者利益而謀取了私利。
與“有償沉默”相對應的是“有償報道”,既然媒體會屈從商業(yè)利益,自然有公司或機構會加以利用,使媒體發(fā)布對自身有利的信息。逯東等(2016)認為,機構投資者存在主動管理媒體的行為,即利用媒體制造信息噪音來引導市場熱點的短期炒作行為;實證研究發(fā)現,為了獲取超額收益,機構投資者會通過主動管理媒體來提高其重倉股票的媒體關注度。盡管這種“主動媒體管理”能在短期內推動股價上漲,但同時也會導致壞消息被藏匿,從而惡化資本市場的信息環(huán)境,增加未來的股價崩盤風險(逯東等,2016)。
媒體因商業(yè)利益而做出的有偏或虛假報道,會因投資者的羊群效應而將不良影響放大。媒體報道中充斥著大量所謂股評家的專業(yè)建議,普通投資者極易受其引導,爭相購入特定股票。熱點資訊總是稀缺資源,媒體通常會針對某一熱點事件進行多次報道,而且不同媒體也會針對同一熱點事件進行重復報道。這很可能會凸顯本來微不足道的事件的重要性,對投資者預期產生正反饋作用,進而增強原有事件對投資者預期和決策的沖擊。游家興和吳靜(2012)研究發(fā)現,股票價格對基本面的背離程度受媒體報道影響,特別地,媒體報道情緒越極端,股價對基本面的背離程度就越大。股價原本是公司價值的良好信號,但媒體的有偏或虛假報道會扭曲這一信號,加劇資本市場上的信息不對稱。
政策導向媒體的收入來源主要是財政支持,因而更注重信息公平因素。①容易引發(fā)爭議的是,有相反觀點認為,政策導向媒體既然受財政支持,則有可能受到行政干預或管制,所報道的資訊更多的是宏觀或行業(yè)層面信息,導致特質性信息更少。然而,這一觀點在財經資訊領域并無可靠的證據支持。以《中國證券報》為例,它是典型的政策導向媒體,由于不可能每天都有政策變動或宏觀事件發(fā)生,該報刊每天都有大量的個股信息。從大樣本實證考察來看,中央媒體(主要由政策導向媒體構成)的確發(fā)掘了大量特質性信息(楊玉龍等,2016)。市場導向媒體的收入來源主要是廣告收入等市場業(yè)務,因而更容易被商業(yè)利益所俘獲,其“有償沉默”與“有償報道”等違規(guī)行為與政策導向媒體相比要更為嚴重。此外,資訊發(fā)布有著嚴格的紀律要求,低級別媒體通常需要等待高級別媒體的指示或訊號。政策導向媒體在行政級別上往往高于市場導向媒體,意味著其報道不僅獨立于商業(yè)利益,而且更加及時,這強化了其對資本市場的影響。因此,在資本市場信息整合方面,我國媒體的影響主要體現在政策導向媒體上,而較少體現在市場導向媒體上。據此,本文提出以下假說:
假說2:我國媒體對資本市場信息效率的影響主要體現在政策導向媒體上,而市場導向媒體則無顯著影響。
(一)數據來源與樣本選取
1.媒體類型與媒體報道數據。本文以巨靈財經報刊數據庫為基礎,該數據庫涵括了2000?2013年的媒體報道。本文使用Python編程語言,對數據庫提供的上市公司相關報道進行統(tǒng)計,得到媒體報道相關變量。通過對數據庫所覆蓋的137家媒體進行追根溯源,我們可以準確地甄別和區(qū)分各個媒體,挖掘其主辦單位及行政級別、注冊地等信息,以便于探討不同類型的媒體在資本市場信息整合方面的差異化表現。上市公司公告雖然借助媒體發(fā)布,但這是上市公司的主動披露行為,并不反映媒體的態(tài)度,不符合本文研究意圖,故予以剔除。
2.上市公司數據來源與樣本選取。本文以2003?2013年我國A股上市公司為樣本,并做了如下篩選:(1)剔除金融保險類公司;(2)剔除在公司治理和股權性質等變量存在數據缺失的公司。樣本期之所以從2003年開始,是因為CSMAR數據庫從這一年開始提供公司治理和股權性質數據。本文最終得到了18419個樣本。媒體的主辦單位、行政級別、注冊地信息等數據均手工搜集得到,其他數據來自CSMAR數據庫和Wind數據庫。本文對所有連續(xù)變量進行了上下1%的縮尾處理。
(二)主要變量定義。本文主要涉及三類變量:媒體類型與媒體報道相關變量、上市公司市場交易相關變量以及公司財務與治理相關變量。
1.媒體類型。本文將媒體區(qū)分為政策導向媒體和市場導向媒體兩種類型。我們在分類時主要依據媒體主辦單位的行政級別,并兼顧該媒體所在城市影響力。本文對政策導向媒體和市場導向媒體的劃分參考了楊玉龍等(2017)等文獻。
2.媒體正負面報道。我們參照汪昌云和武佳薇(2015)及張純和吳明明(2015)提供的計量方案來識別媒體的正面報道與負面報道。具體而言,我們根據每篇媒體報道中正負面詞匯數的相對大小來判斷報道是正面的還是負面的:如果報道中的正面詞匯數超過負面詞匯數,則定義為正面報道;如果報道中的負面詞匯數超過正面詞匯數,則定義為負面報道;其他則視為中立報道。進一步地,對每一家公司的所有媒體報道進行描述性統(tǒng)計,得到該上市公司的負面報道比例和正面報道比例。在此基礎上,我們進一步區(qū)分不同媒體類型,得到政策導向媒體的負面報道比例和正面報道比例,以及市場導向媒體的負面報道比例和正面報道比例。
3.股價同步性。本文參考楊玉龍等(2016)的計量方法,使用實證CAPM模型的擬合系數R2來衡量股價同步性:
模型的擬合系數R2越大,表明股價的波動包含越多的市場風險因素,即公司特質風險對股價的解釋力越差。為了滿足OLS的正態(tài)分布條件,我們對擬合系數R2進行了對數變換,得到股價同步性指標RSQm。
本文變量定義見表1。
表1 變量定義
續(xù)表 1 變量定義
(三)模型設定。本文采用模型(3)至模型(5)來研究媒體的正負面報道對股價同步性的影響。模型(3)等式右側前兩項是關鍵解釋變量負面報道比例(Neg_News_Ratio)和正面報道比例(Pos_News_Ratio),模型(4)等式右側前兩項分別為政策導向媒體負面報道比例(Politic_Neg_Ratio)與正面報道比例(Politic_Pos_Ratio),模型(5)等式右側前兩項分別為市場導向媒體負面報道比例(Market_Neg_Ratio)與正面報道比例(Market_Pos_Ratio)。
Controln表示控制變量,包括操控性應計項目Da、上市公司政治關聯(lián)Pc、獨立董事比例Indep_dir、機構持股比例Inst、是否由四大審計Big4、第一大股東持股Lshr,股權制衡Othshr、高管持股比例Excutive、銷售增長率Sgrowth、盈利相對波動Droe、個股股價波動Stdp、個股換手率Tvr、公司規(guī)模Size、公司上市年限Age以及行業(yè)虛擬變量Ind和年度虛擬變量Year。
(一)描述性統(tǒng)計
1.媒體類型與正負面報道。表2列示了我國媒體的正負面報道比例,以及每篇報道的正負面詞匯使用情況??梢钥吹?,無論是市場導向媒體還是政策導向媒體,正面報道比例遠遠大于負面報道比例(3倍以上),而且每篇報道中使用的正面詞匯平均數量也遠遠超過負面詞匯(約為2倍)。此外,相對于政策導向媒體,市場導向媒體的負面報道比例顯著較高,而正面報道比例則顯著較低,而且每篇報道中使用的負面詞匯數量也顯著較多,正面詞匯數量顯著較少。因此,政策導向媒體與市場導向媒體因其功能定位差異,的確在資訊內容方面表現不同。
表2 媒體類型與正負面報道
2.變量描述性統(tǒng)計。從表3中可以看出,無論是政策導向媒體還是市場導向媒體,負面報道比例都小于正面報道比例,說明媒體對不同上市公司也以正面報道為主。需要指出的是,表2是針對媒體所有報道所做的統(tǒng)計分析,表3則是針對上市公司的媒體報道所做的統(tǒng)計分析。
表3 變量描述性統(tǒng)計
(二)回歸分析
1.正負面報道與資本市場信息效率。本文采用模型(3)至模型(5)來研究媒體的正負面報道對股價同步性的影響,以普通最小二乘法(OLS)進行估計。從表4中可以看到,在對上市公司的報道中,負面報道比例越高,股價同步性越低,但不顯著;正面報道比例越高,股價同步性越高。這一結果部分支持了假說1,我們將在下文考察不同類型媒體報道對股價同步性的影響。此外,公司信息不夠透明(Da較高)或者具有政治關聯(lián),均會導致較高的股價同步性。
2.媒體雙軌制與資本市場信息整合。我們進一步將媒體區(qū)分為政策導向媒體和市場導向媒體,以便考察我國媒體的雙軌制運營對資本市場信息整合功能的影響。從表4中可以看到,促成資本市場信息整合的媒體報道主要是政策導向媒體的負面報道,市場導向媒體的負面報道并沒有顯著傳遞有關上市公司的特質性信息。值得注意的是,市場導向媒體的正面報道也會提高上市公司的股價同步性。本文認為,市場導向媒體的正面資訊進入股價的速度緩慢,而且在報道方面通常緊跟政策導向媒體,造成信息冗余重復而特質性信息不足,這也是其導致股價同步性上升的重要原因。
表4 媒體正負面報道與股價同步性
(一)穩(wěn)健性測試。以股價同步性來反映股價對公司特質性信息的整合是有爭議的。West(1988)研究發(fā)現,基于噪聲信息的交易降低了公司的股價同步性。Kelly(2014)認為,公司股票的R2越低,其信息環(huán)境越差,表明R2并非度量信息效率的有效指標。為解決這一問題,我們將使用直接反映特質性信息整合的指標知情交易概率進行穩(wěn)健性測試。
知情交易概率(Possibility of Informed Trading,PIN)是指個股交易中知情交易的比重。其基本計量思路是將給定區(qū)間內針對個股的交易分為兩類:一類是由私有信息促成的知情交易;另一類是由隨機擾動因素驅動的噪聲交易。促使股價向真實價值回歸的動力主要來自知情交易,因此個股交易中知情交易的比重越高,股價對于信息的整合越有效。我們沿用已有研究中估計PIN 指數的經典方法(Easley 和 O’hara,1987,1992),計量方法詳見朱偉驊(2008)及孔東民等(2013)。
表5列示了PIN對媒體正負面報道的回歸結果。可以看到,負面報道可促使知情交易比例上升,而正面報道則會減少知情交易,這與上文所論證的“負面報道促進特質性信息整合,正面報道不利于特質性信息整合”相一致。同時,我們可以看到媒體報道對知情交易產生影響主要體現在政策導向媒體上,市場導向媒體對知情交易概率則無顯著影響。
表5 媒體正負面報道與知情交易概率
(二)拓展性分析。本文的主要實證結果表明,在促進資本市場信息整合方面,政策導向媒體顯示出了強于市場導向媒體的影響力。我們將從資訊特征的角度,探討造成這一差異的原因。本文主要考察兩項資訊特征:信息挖掘和信息傳遞。所謂信息挖掘,是指媒體通過公開信息渠道或者調查暗訪等手段搜集各類信息,并進行分析比對,形成獨立的觀點和結論。所謂信息傳遞,是指媒體針對上市公司已經發(fā)布的信息,通過對語句進行重新組織、概括、演繹等,以投資者更容易理解的方式再次呈現出來。
以文本分析來考察媒體的資訊特征,目前只有很少的研究關注了媒體報道更深層次的信息角色。Drake等(2014)將媒體對上市公司盈余公告的跟蹤報道區(qū)分為被上市公司雇用以傳播信息的“信息傳遞”類報道(Presswire Services)和帶有作者“信息創(chuàng)造”的報道(Newswire Services),發(fā)現媒體對上市公司年度盈余公告的報道能夠減少現金流誤定價,但不能降低應計誤定價,且這種降低會計誤定價的作用主要是由媒體“信息傳遞”而非“信息創(chuàng)造”功能實現的。他們對于信息傳遞和信息挖掘的度量,得益于特殊的數據庫(News Wire),很難被復制。
在分析師跟蹤的相關研究中,有文獻探討了分析師報告的不同“信息角色”。這類研究主要通過市場反應來度量分析師報告的“信息解釋”與“信息挖掘”兩類信息角色。Huang等(2014)認為用市場反應來間接度量分析師報告的“信息角色”有兩點局限:一是以市場反應來度量信息挖掘和信息解釋,其前提條件是投資者能夠充分理解分析師報告中的信息,且信息能迅速融在價格中,但現有研究表明這一前提條件并不成立;二是上市公司披露信息和分析師跟蹤發(fā)布報告在時間上比較接近,學者難以區(qū)分資本市場反應是針對上市公司信息披露還是分析師跟蹤報告。因此,他們主張用潛在語義主題分配模型(Latent Dirichlet Allocation,簡稱LDA主題分析)來直接度量分析師報告的信息挖掘和信息解釋程度。本文也使用LDA主題分析來直接度量我國媒體報道的“信息角色”,并區(qū)分政策導向媒體和市場導向媒體,探討兩者之間的差異。
1.信息挖掘與信息傳遞的度量。以LDA模型來度量媒體信息挖掘與信息傳遞的基本思想是,比較上市公司公告與隨后的媒體跟蹤報道之間的差異,根據這一差異來衡量分析師報告信息挖掘或傳遞的程度。附錄A描述了我們對公司公告與隨后的媒體跟蹤報道進行匹配的具體過程。為避免出現噪音,本文僅選擇公司當天有且僅有一條信息公告的觀測值,從而可以對上市公司公告與媒體報道進行精確匹配。這會使樣本量略有變化,我們最終得到18108個公司年份觀測值。
本文參考Huang等(2014)及張純和吳明明(2015)的方法,以公司公告和媒體報道的文本內容為對象進行LDA主題建模。這一建模的基本思路是,所有公告或媒體報道的內容盡管千差萬別,但是主題(話題)卻很有限,無非是產業(yè)支持政策、信息披露、股權發(fā)行、風險和相關披露、債務和擔保、法律訴訟等,我們發(fā)現這些公告和資訊大致可以歸結為40個有意義的主題(建模過程詳見附錄B)。而后我們可以測算兩項內容:一是每篇上市公司公告與隨后的跟蹤報道所涵括的主題數量;二是每篇上市公司公告與隨后的跟蹤報道在描述同一主題時的用詞分布。
在此基礎上,我們采用媒體跟蹤報道與對應的上市公司公告之間的主題分布差異來度量媒體跟蹤報道的信息挖掘程度。這樣處理背后的邏輯是,如果媒體對上市公司公告進行了深入分析,則其報道的隱含主題集合與公司公告的隱含主題集合之間會存在差異。因此,公司公告和媒體報道的主題分布差異越大,則媒體對公司信息進行了越深入的解讀和挖掘。
同時,我們統(tǒng)計了媒體報道與公司公告在描述同一主題時的用詞差異,反映媒體的信息傳遞水平。這樣處理背后的邏輯是,如果媒體對上市公司公告進行了有效的信息傳遞,那么其報道的用詞和表述應當與上市公司公告高度一致。因此,在描述同一主題時的用詞分布差異越小,則信息傳遞的扭曲越小。
媒體的信息挖掘水平和信息傳遞水平分別記為Discover和Dissemination,本文對這兩個變量的計量主要參考了Huang等(2014)及張純和吳明明等(2015)的研究,略有調整,詳見附錄C。
2.媒體類型與資訊特征。表6列示了政策導向媒體和市場導向媒體在資訊特征上的差異化表現??梢钥吹?,政策導向媒體在信息挖掘方面的表現要顯著優(yōu)于市場導向媒體(0.387>0.341);同時,政策導向媒體的信息傳遞水平均值為0.325,大于市場導向媒體的信息傳遞水平均值0.269??梢?,政策導向媒體在信息挖掘和信息傳遞方面顯著優(yōu)于市場導向媒體,這與上文所述政策導向媒體具有更強的經濟獨立性與及時性相一致。
表6 媒體類型與資訊特征
資訊特征必然會對媒體報道的效果產生影響,本文使用調節(jié)效應模型來探討這種影響。我們仍以股價同步性來衡量資本市場信息效率,區(qū)分政策導向媒體和市場導向媒體后,在模型(4)和模型(5)的基礎上,加入不同類型媒體的正面報道比例、負面報道比例與資訊特征的交叉項,構建了模型(6)至模型(9)。
表7列示了回歸結果??梢钥吹?,政策導向媒體通過更深入的信息挖掘與更精準的信息傳遞,不僅可以強化負面報道的信息整合作用,還可以削弱正面報道對資本市場信息整合的不利影響。唯一的例外是,政策導向媒體對負面報道的信息傳遞在進一步降低股價同步性方面不顯著。市場導向媒體的信息挖掘與信息傳遞則基本上沒有展示出增強媒體報道效力的作用。基于以上證據,我們認為政策導向媒體在信息挖掘方面更加深入,在信息傳遞方面更加精準,使其整合資本市場信息的作用強于市場導向媒體。
表7 資訊特征、媒體報道與股價同步性
續(xù)表 7 資訊特征、媒體報道與股價同步性
改革開放以后,我國媒體產業(yè)發(fā)展迅速,媒體形式也逐漸多樣化。然而,媒體數量上的增長帶來了諸多問題,如經濟利益對媒體獨立性的綁架、媒體從業(yè)者水平有待提高等,使得讀者在選取資訊來源時猶豫不決,并對資訊內容產生了諸多疑問。因此,需要科學的量化研究來探討媒體的資訊特征,為讀者遴選媒體與資訊提供指引。資本市場為我們理解我國媒體的影響力提供了良好的量化場景,盡管這一量化僅限于金融資源配置這一狹小領域,但是仍可以為我們理解媒體的社會功能提供參考。
本文從我國媒體產業(yè)的雙軌制特色入手,借助文本分析技術,考察了政策導向媒體和市場導向媒體的正負面報道影響資本市場信息整合的效力。本文發(fā)現,媒體的負面報道對資本市場信息整合有促進作用,而正面報道則不利于特質性信息反映在股價中,這意味著負面報道對投資者而言更具決策價值。特別地,媒體報道對資本市場的影響主要集中在政策導向媒體上,這進一步縮小了投資者決策時的媒體參考范圍。本文進一步探察了政策導向媒體與市場導向媒體出現上述差異的原因。本文利用LDA主題分析模型,測量了兩者在信息挖掘深度與信息傳遞精度上的表現差異。本文發(fā)現,政策導向媒體在信息挖掘方面更加深入,在信息傳遞方面更加精準,使其整合資本市場信息的功能強于市場導向媒體。這一研究結果具有重要的現實意義,有助于投資者重新審視不同的資訊來源,并給予其一定的啟發(fā)與指引。
[1]方軍雄.信息公開、治理環(huán)境與媒體異化——基于IPO有償沉默的初步發(fā)現[J].管理世界,2014,(11):95?104.
[2]孔東民,劉莎莎,應千偉.公司行為中的媒體角色:激濁揚清還是推波助瀾?[J].管理世界,2013,(7):145?162.
[3]李良榮.論中國新聞媒體的雙軌制——再論中國新聞媒體的雙重性[J].現代傳播,2003,(4):1?4.
[4]逯東,付鵬,楊丹.機構投資者會主動管理媒體報道嗎?[J].財經研究,2016,(2):73?84.
[5]田中初.新聞實踐與政治控制[M].濟南:山東人民出版社,2005.
[6]汪昌云,武佳薇.媒體語氣、投資者情緒與 IPO 定價[J].金融研究,2015,(9):174?189.
[7]楊玉龍,孫淑偉,孔祥.媒體報道能否彌合資本市場上的信息鴻溝?——基于社會關系網絡視角的實證考察[J].管理世界,2017,(7):99?119.
[8]楊玉龍,吳明明,王璟,等.異質性媒體與資本市場信息效率[J].財經研究,2016,(3):83?94.
[9]游家興,吳靜.沉默的螺旋:媒體情緒與資產誤定價[J].經濟研究,2012,(7):141?152.
[10]張純,吳明明.媒體在資本市場中的角色:信息解釋還是信息挖掘?[J].財經研究,2015,(12):72?83.
[11]趙亞東,高巖.公安網絡輿論的生成機制及其引導功能[J].中國人民公安大學學報(社會科學版),2012,(2):136?141.
[12]朱偉驊.公司治理與內幕交易監(jiān)管效率研究[J].經濟學(季刊),2008,(1):271?288.
[13]Drake M S,Guest N M,Twedt B J.The media and mispricing:The role of the business press in the pricing of accounting information[J].The Accounting Review,2014,89(5):1673?1701.
[14]Easley D,O’hara M.Price,trade size,and information in securities markets[J].Journal of Financial Economics,1987,19(1):69?90.
[15]Easley D,O’hara M.Time and the process of security price adjustment[J].The Journal of Finance,1992,47(2):577?605.
[16]Heath C.Do people prefer to pass along good or bad news?Valence and relevance of news as predictors of transmission propensity[J].Organizational Behavior and Human Decision Processes,1996,68(2):79?94.
[17]Hong H,Lim T,Stein J C.Bad news travels slowly:Size,analyst coverage,and the profitability of momentum strategies[J].The Journal of Finance,2000,55(1):265?295.
[18]Huang A,Lehavy R,Zang A Y,et al.A thematic analysis of analyst information discovery and information interpretation roles[R].Working Paper No.1229,2014.
[19]Kahneman D,Tversky A.Prospect theory:An analysis of decision under risk[J].Econometrica,1979,47(2):263?292.
[20]Kelly P J.Information efficiency and firm-specific return variation[J].Quarterly Journal of Finance,2014,4(4):1?44.
[21]Kothari S P,Shu S,Wysocki P D.Do managers withhold bad news?[J].Journal of Accounting Research,2009,47(1):241?276.
[22]Liu G,Xin Z,Lin C.Lax decision criteria lead to negativity bias:Evidence from the emotional stroop task[J].Psychological Reports,2014,114(3):896?912.
[23]Loughran T,McDonald B.When is a liability not a liability?Textual analysis,dictionaries,and10-Ks[J].The Journal of Finance,2011,66(1):35?65.
[24]Morck R,Yeung B,Yu W.The information content of stock markets:Why do emerging markets have synchronous stock price movements?[J].Journal of Financial Economics,2000,58(1-2):215?260.
[25]Piotroski J D,Roulstone D T.The influence of analysts,institutional investors,and insiders on the incorporation of market,industry,and firm-specific information into stock prices[J].The Accounting Review,2004,79(4):1119?1151.
[26]West K D.Bubbles,fads and stock price volatility tests:A partial evaluation[J].The Journal of Finance,1988,43(3):639?656.
附錄A 媒體跟蹤報道和上市公司信息披露公告的匹配過程
1.對于上市公司披露的財務報表,由于主要內容是表格和數字,不適用LDA主題模型進行文本分析,本文剔除了這類公告。
2.由于媒體跟蹤上市公司公告一般會在新聞內容中出現“**(公司)**(時間)公告稱”之類的用語,本文在新聞全文中首先定位找到“公告”這一關鍵詞,將其之前直到上一個句終標點(句號、嘆號、問號等)或新聞全文字符串的首個字符截取下來,然后刪除其中的空格,進行時間關鍵詞掃描。之所以不包括逗號、頓號等非句終標點,是因為存在以下形式的表述:“**(公司)**(時間)進行了**披露,公告稱……”。時間關鍵詞包括:
(1)“昨”,代表昨天,可以是“昨天”、“昨日”、“昨晚”等。
(2)“前日”“前天”,代表 2 天前。
(3)“今日”“今天”“今晚”“今早”,代表當天。
(4)具體的年月日,對于“年”“月”“日”之前的數字,可以是阿拉伯數字和中文數字及相應的全角數字。
(5)如果沒有出現以上四類時間關鍵詞,但是出現了“晚間”“上午”“下午”“早間”“一早”“晚上”“傍晚”,則代表當天。
附錄B 對上市公司公告和媒體跟蹤報道文本集進行LDA主題建模過程
1.LDA 主題模型
LDA主題模型是在自然語言信息處理中提取大規(guī)模語料集的主題結構任務的一類機器學習模型。它可以從文本集中估算提取出主題信息,并把每個文本表示為關于主題的多項式分布,而每個主題被表示為關于語料集合中所有不同詞語的多項式分布。因此,學者可以利用LDA主題模型的輸出結果,對不同文本的差異進行比較。
LDA主題模型用統(tǒng)計過程來模仿文本的生成過程。該算法假設所有語料集的所有文檔共享同一組主題,但是主題在不同文檔間的分布不同。每個文檔被建模為關于主題的概率分布,而每個主題被建模為關于詞語的概率分布。該算法假定文檔中的每個詞語通過以下兩個步驟生成:第一步,文檔的作者從所有可用的主題分布中選擇一個主題;第二步,對于選定的主題,文檔的作者從表現該主題的詞語分布中選擇一個詞語。重復這兩個步驟,逐詞生成整個文檔。每篇文檔的生成過程都是一樣的且相互獨立。
在上述假定的基礎上,LDA主題模型估算出最匹配(似然度最大)文本數據的模型參數。參數估算過程依賴于詞語在同一篇文檔中的出現情況。直觀地講,如果兩個詞頻繁在同一篇文檔中出現,那么LDA模型把這兩個詞歸類為同一個主題的概率就會較高。LDA模型的主要輸出結果是每個主題的詞頻分布矩陣(用Topic_Word表示),這也可以作為LDA的建模結果;另外,LDA模型也會同時輸出訓練集中每個文檔關于主題的頻率分布矩陣(用Doc_Topic表示)。
2.LDA建模前的文本數據預處理
與一般的中文文本分析準備步驟一樣,在LDA主題分析之前,首先要對全文進行中文分詞。我們采用NLPIR中文分詞系統(tǒng),將每篇上市公司公告和財經媒體跟蹤報道分拆成詞語列表。然后,為了防止對主題建模的干擾,我們剔除了分詞結果中的非中文詞語(包括數字、英文等),并根據《哈工大停用詞表》剔除了中文停用詞(Stop Words),如功能詞“還有”、“即便”等。最后,中文分詞系統(tǒng)會把媒體報道中大量存在的人名、公司名等非常見專有名詞切割成出現頻率較高的單個漢字,如“嘉”、“宏”等,這會對主題建模產生干擾,所以我們進一步剔除了分詞結果中以單個漢字形式呈現的中文詞。
3.決定主題個數
LDA主題分析的算法需要人工輸入主題個數,而主題個數的選擇會影響結果解讀。設定太少的主題數會導致最后的主題區(qū)分過于寬泛和模糊,而設定太多的主題數又會產生一些沒有經濟意義的主題?;贖uang等(2014)及張純和吳明明(2015)的研究,我們使用“復雜度”(Perplexity)統(tǒng)計量來確定LDA模型的主題數,最后選取40作為最優(yōu)的主題數。
4.LDA 建模結果
由于不同行業(yè)的上市公司公告和媒體跟蹤報道內容會涉及含有各自行業(yè)特點的主題,我們按照證監(jiān)會二級行業(yè)代碼,剔除“金融、保險業(yè)”,對余下的21個行業(yè)進行了LDA主題分析。表8列示了樣本中文檔數最多的制造業(yè)中“機械、設備、儀表”(C7)行業(yè)的LDA建模結果。其中,“主題的詞語分布中前20個詞語”為LDA建模后輸出結果,而“人工擬定主題名稱”為我們根據該主題的詞語分布中前20個詞語人工判定的主題語義。從前10個主題的前20個詞語可以看出,LDA較好地概括了上市公司公告和財經媒體跟蹤報道經常涉及的主題,其中第二個主題“產業(yè)支持政策對公司的影響”、第四個主題“新項目機會”和第八個主題“出口、海外市場”體現了一定的行業(yè)特點,另外六個主題則是上市公司一般都會涉及的主題。
表8 樣本中文檔數最多的“機械、設備、儀表”行業(yè)LDA建模結果(前10個主題的前20個詞語)
附錄C 信息挖掘(Discover)和信息傳遞(Dissemination)計量步驟
1.以文檔d標記上市公司公告與媒體報道的文本,構建文檔d中的主題向量Td。在文檔分詞的基礎上,利用LDA建??梢匀〉酶鱾€行業(yè)文檔集的主題?詞匯分布矩陣Topic_Word,這一矩陣將實現特定主題(S)與一組詞匯的對應。針對某一文檔d(可以是上市公司公告,也可以是媒體報道),以句子為單位,分析句中的詞匯,若該句所用詞匯歸屬于主題S的最多,則該句被歸為主題S。以此類推,我們可以對文檔d中所有句子進行主題歸類。我們再把文檔d中歸屬于各個主題的句子數除以文檔d中句子總數,形成如下向量:
2.確定文檔d中的主題后,針對特定主題S,匯總文檔中出現的歸屬于主題S的詞匯列表,并統(tǒng)計各個詞匯出現的頻數,進而形成每篇文檔中每個主題的詞語向量。
其中,元素viS或wiS代表所在文檔中詞語i用于描述主題S的頻數。
3.度量媒體跟蹤的信息挖掘程度。本文計算了上市公司公告與媒體跟蹤報道的主題向量余弦值,用1減去該余弦值來衡量兩者之間的主題分布差異,其現實意義便是媒體跟蹤報道的信息挖掘程度,計算公式如下:
其中,SMedia,s和SAnn,s分別代表媒體跟蹤報道和上市公司公告的主題向量中第s個元素。
4.度量媒體跟蹤的信息傳遞效果。首先針對每個主題S,計算該主題的詞語向量的余弦,然后將所對應上市公司公告中的前Sd個主題下計算的這個值進行算數平均。我們對每篇上市公司公告的主題頻率從高到低排序,取累積頻率達到80%的前Sd個主題進行檢驗,以排除文檔中不太重要的主題所帶來的干擾。
其中,N為文檔d中所有不同的詞語個數,vjs和wjs分別為上市公司公告和媒體跟蹤報道中主題S的詞語向量中第j個元素。