国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

文本分析技術(shù)文獻(xiàn)綜述

2018-01-23 20:02王瀟敏
中國市場 2018年1期
關(guān)鍵詞:情感分析文本分析可讀性

王瀟敏

[摘要]文章運(yùn)用文獻(xiàn)綜述的方法,篩選多篇文章,對文本分析技術(shù)的不同種類與方法進(jìn)行介紹,并對不同方法在文獻(xiàn)中的運(yùn)用進(jìn)行梳理,區(qū)分不同方法的特征。

[關(guān)鍵詞]文本分析; 情感分析; 詞袋;可讀性

[DOI]1013939/jcnkizgsc201801022

1引言

文本分析技術(shù)是指通過文本信息進(jìn)行挖掘檢索,把從文本中抽取出的特征詞進(jìn)行量化來表示文本內(nèi)容,它是一種基于大數(shù)據(jù)時代的新興技術(shù),并廣泛用于經(jīng)濟(jì)與會計的研究領(lǐng)域。文章將介紹不同的文本分析方法在經(jīng)濟(jì)與會計研究方面的應(yīng)用。

2可讀性分析

用可讀性進(jìn)行文本分析是比較常用的方法,文本可讀性通常用迷霧指數(shù),F(xiàn)lesch指數(shù) Flesch-Kincaid指數(shù)和文本長度來表示,早期的研究大多都是基于小樣本的研究。比如[1]Lewis,Parker1986年只用了跨越四個年度的九個公司作為樣本,用不同度量方法來研究財務(wù)報表的可讀性。

第一篇用大樣本量研究有關(guān)于文本可讀性的文章是[2]Li 2008年發(fā)表的關(guān)于年度報表可讀性與公司業(yè)績的關(guān)系的文章。這篇文章后被大量引用,他主要就是用年度報表的迷霧指數(shù)和包含的單詞個數(shù)來度量文本的可讀性。繼Li之后有關(guān)于用可讀性衡量文本信息的文章層出不窮。[3]Lawrence于2013年發(fā)現(xiàn)迷霧指數(shù)與年度報表的單詞總數(shù)與個人的股票持有量相關(guān)。[4]Lehavy,Li,Merkley于2011年通過分析發(fā)現(xiàn)年度報表的迷霧指數(shù)越高那么分析師的偏差越小,盈利預(yù)測越準(zhǔn)確。

3文本語調(diào)分析

另一種常用的文本分析方法為“詞袋法”,詞袋法在文獻(xiàn)中運(yùn)用比較多的是通過將表達(dá)不同情感的詞進(jìn)行歸類形成詞語列表,比如分別將含有消極、積極、不確定等感情色彩的詞進(jìn)行歸類列表。比較簡單地用詞袋法進(jìn)行文本分析的方法是目標(biāo)詞匹配法。

Loughran,McDonld和Yun于2009就運(yùn)用目標(biāo)詞批匹配法考慮“道德”這個詞與“企業(yè)責(zé)任”“社會責(zé)任”一起出現(xiàn)的頻率與企業(yè)的股票狀況、公司治理現(xiàn)狀和是否可能遭到起訴是否有聯(lián)系。[5]相比關(guān)鍵詞匹配法用詞袋法中的詞語列表法進(jìn)行研究的文獻(xiàn)更多一些。在經(jīng)濟(jì)與會計研究領(lǐng)域共有四種詞語列表被廣泛應(yīng)用,例Henry(2008),Harvards GI,Diction,Loughran和McDonald。最早期的研究就主要集中于消極詞匯的單詞列表,國內(nèi)的研究主要有[6]謝德仁、林樂同樣用詞袋法分別在2014年和2015年發(fā)表了通過研究業(yè)績說明會中管理層語調(diào)分析與市場反應(yīng)和公司未來業(yè)績的關(guān)系。[7]包燕娜通過詞袋法研究了管理層語調(diào)離差對分析師預(yù)測的影響程度。[8]Tetlock于2007年用Harvard詞匯列表把華爾街日報中了解市場部分與股票市場水平相聯(lián)系,他發(fā)現(xiàn)華爾街日報中該部分悲觀情緒與隨后的股票回報率呈負(fù)相關(guān)與股票市場的波動性呈正相關(guān)。繼Tetlock之后大量的研究都用Harvard詞匯列表進(jìn)行研究。在度量文本語調(diào)的研究中,現(xiàn)在越來越多的研究更偏愛用積極與消極用語單詞列表法。但是L M指出Harvard詞匯列表和積極與消極用語單詞列表法的弊端,比如Harvard詞匯列表中75%的消極詞匯在經(jīng)濟(jì)類文章中并沒有消極含義。[9]Loughran,McDonld于2011創(chuàng)造了六種不同的單詞列表包括積極的、消極的、不確定的、好爭論的、強(qiáng)模式的、弱模式的。LM詞匯列表相比于上述其他三種更成熟與完整,大量的文章或新聞都用LM法去度量文本語調(diào)。[10]Garcia于2013年利用LM的消極與積極詞匯列表來度量1905—2005年紐約時報的經(jīng)濟(jì)模塊,結(jié)果表明新聞內(nèi)容所傳遞的情緒在預(yù)測未來股票回報特別是在經(jīng)濟(jì)蕭條時期的股票回報有著至關(guān)重要的作用。

相信隨著計算機(jī)技術(shù)的發(fā)展和數(shù)據(jù)大爆炸的到來文本分析技術(shù)會運(yùn)用得越來越廣泛,技術(shù)也會越來越成熟。

參考文獻(xiàn):

[1]Lewis,NR,LDParker,GDPound and PSutcliffe.Accounting Report Readability: The Use of Readability Techniques[J].Accounting and Business Research,1986(16): 199-213

[2]LI,F(xiàn)Annual Report Readability,Current Earnings,and Earnings Persistence[J].Journal of Accounting and Economics,2008(45): 221-247.

[3]Lawrence,AIndividual Investors and Financial Disclosure[J].Journal of Accounting & Economics,2013(56): 130-147.

[4]Lehavy R,F(xiàn)LI and KMerkleyThe Effect of Annual Report Readability on Analyst following and the Properties of their Earnings Forecasts[J].The Accounting Review,2011(86): 1087-1115.

[5]Loughran T,BMcdonald and HYunA Wolf in Sheeps Clothing:The Use of EthicsRelated Terms in 10-K Reports[J].Journal of Business Ethics,2009(89): 39-49.

[6]謝德仁,林樂管理層語調(diào)能預(yù)示公司未來業(yè)績嗎[J].會計研究,2015(2):20-27.

[7]包燕娜管理層語調(diào)離差策略及其對分析師預(yù)測樂觀度的影響[D].杭州:浙江工商大學(xué),2016.

[8]Tetlock,PCGiving Content to Investor Sentiment: The Role of Media in the Stock Market[J].Journal of Finance,2007(62): 1139-1168

[9]Loughran,T,and BMcdonaldWhen is a Liability not a Liability? Textual analysis,Dictionaries,and 10‐Ks[J].Journal of Finance,2011(66): 35-65

[10]Garcia,DSentiment during Recessions[J].Journal of Finance,2013(68): 1267-1300endprint

猜你喜歡
情感分析文本分析可讀性
在線評論情感屬性的動態(tài)變化
投資者情緒短期對股票市場的影響研究
初中英語聽說課教學(xué)實踐探索
對增強(qiáng)吸引力可讀性引導(dǎo)力的幾點(diǎn)思考
淺談對提高黨報可讀性的幾點(diǎn)看法
长岭县| 双流县| 和静县| 延安市| 武宁县| 深泽县| 衡南县| 上饶县| 星座| 惠州市| 体育| 平定县| 滨海县| 鲁山县| 那坡县| 太白县| 定结县| 瓦房店市| 三门县| 阳信县| 罗源县| 康平县| 高雄县| 雷山县| 婺源县| 海伦市| 西昌市| 辰溪县| 正镶白旗| 隆子县| 新昌县| 清镇市| 赣榆县| 随州市| 德令哈市| 开封市| 屏山县| 江安县| 汉川市| 平原县| 屏东县|