段釗 周紅 周輝
摘 要:文本的“通俗易懂”是證券市場信息披露質(zhì)量的前提與保證,為此提供了一個上市公司社會責(zé)任報告可讀性質(zhì)量評估的解決方案:首先,結(jié)合證券市場信息披露動機及閱讀行為分析,提出了一個基于“閱讀效率”與“適應(yīng)水平”的兩維度可讀性質(zhì)量評估模型;其次,設(shè)計并驗證了一個基于機器學(xué)習(xí)的信息披露文本可讀性質(zhì)量評估的方法;最后,對我國上市公司2009-2017年發(fā)布的社會責(zé)任報告可讀性質(zhì)量水平進行了測度,并對全樣本的總體與結(jié)構(gòu)特征進行了數(shù)據(jù)分析。研究發(fā)現(xiàn):我國上市公司社會責(zé)任報告可讀性水平整體呈正態(tài)分布且逐年提升;不同行業(yè)與年份組間差異顯著,行業(yè)異質(zhì)性和外部政策變化可能是差異出現(xiàn)的主要原因。上述模型為信息披露質(zhì)量評估提供了一個新的思路,評價方法有效減少了可讀性質(zhì)量評估中主觀性干擾問題;同時研究結(jié)果為后續(xù)實證研究提供了一組新的量化數(shù)據(jù),也為證券市場信息披露監(jiān)管提供了新的啟示。
關(guān)鍵詞:信息披露;企業(yè)社會責(zé)任;機器學(xué)習(xí);可讀性
一、引? 言
2020年10月,國務(wù)院印發(fā)了《關(guān)于進一步提高上市公司質(zhì)量的意見》,明文要求“上市公司及其他信息披露義務(wù)人要充分披露投資者作出價值判斷和投資決策所必需的信息,并做到簡明清晰、通俗易懂”;同時,為了落實新證券法,完善信息披露制度,證監(jiān)會在2021年5月開始實施的《上市公司信息披露管理辦法》中,新增了信息披露中“通俗易懂”的原則性要求。顯而易見,伴隨注冊制的推行與信息披露規(guī)則體系的完善,披露文本可讀性不僅將成為我國證券市場監(jiān)管的一個重要對象,也成為衡量信息披露質(zhì)量的重要指標(biāo)之一,有必要對其開展系統(tǒng)與深入的研究,實現(xiàn)對“通俗易懂”水平的客觀、準(zhǔn)確與量化評估。
作為信息披露質(zhì)量的保證與前提(Chen,2020;張秀敏等,2017),披露文本的可讀性對于降低市場不確定性、提升溝通效率、保護投資者,以及信用評級、分析師預(yù)測等方面具有重要影響(Bonsall,2017;Luo,2018;Ahsan,2018;Hassan,2019;Muslu,2019;Seifzadeh,2020)。近年來,相關(guān)的實證研究提出了一些中文披露信息可讀性的評估方法:如有文獻采用公式法針對深市B股公司年報采用公式法對其進行了可讀性評估(閻達五等,2002),在此基礎(chǔ)上有研究者借鑒Smith等(1992)的方法,設(shè)計完形填空測試,讓具有會計專業(yè)背景被試者參與評估(孫蔓莉,2004);還有研究者以A股上市公司的年報為樣本,選取平均單句詞數(shù)以及難詞的比例為指標(biāo)衡量可讀性,借助Python語言對全樣本進行了可讀性評估(葉勇等,2018);也有學(xué)者借鑒英文可讀性中常用的Fog指數(shù)(Li,2008),并結(jié)合中文相關(guān)語言學(xué)研究成果,從分句平均字?jǐn)?shù)、每句話中副詞和連詞比例以及前兩者的簡單算術(shù)平均這三個角度構(gòu)建可讀性評價指標(biāo)(徐巍等,2021)。此外,有研究認為文本間的邏輯關(guān)系正是導(dǎo)致讀者理解難度上升的主要因素,從文本邏輯和字詞兩方面構(gòu)建了文本可讀性評估變量(王克敏等,2018)。但總體來說,由于目前缺乏權(quán)威性的標(biāo)準(zhǔn),披露文本可讀性評估研究中仍存在依賴評價者的主觀經(jīng)驗,隨意性較強,以及信息接受者需求導(dǎo)向不明確等問題。
另一方面,現(xiàn)有研究大部分基于內(nèi)容與格式有明確規(guī)定的年報或董事會報告展開,針對更容易進行語義操縱和實施印象管理的企業(yè)社會責(zé)任(CSR)報告較為少見。而CSR報告作為非財務(wù)信息披露的主要形式,向市場傳遞著企業(yè)可持續(xù)發(fā)展能力的信號(段釗等,2017),對利益相關(guān)者的決策發(fā)揮著越來越重要的影響(Ben A.,2018;劉媛媛等,2019;唐國平等,2019)。相對于年報而言,CSR報告具有更高的自主性、靈活性、多樣性與不確定性;并且通常由專業(yè)人員進行編制,有著篇幅長、議題豐富、表述相對正式、專業(yè)詞匯使用較多、語義相對固定,邏輯復(fù)雜度高等特征,在其可讀性質(zhì)量評估中需要有針對性地設(shè)計。雖然有文獻通過對CSR報告的封面色彩、平均句長、頁數(shù)與圖片數(shù)量進行標(biāo)準(zhǔn)化處理得到可讀性指數(shù)(吉利等,2016),但是,類似的變量設(shè)計考慮更多的是“易讀性”問題,注重披露信息的外在形態(tài),而未涉及文本表意的明確與否,對“通俗易懂”的內(nèi)涵表達尚不夠充分。
針對現(xiàn)有研究中的主要問題,本文首先結(jié)合信息披露動機及閱讀行為分析,構(gòu)建了一個基于效率與適應(yīng)水平的兩維度可讀性質(zhì)量評估模型,給出了一個基于時間數(shù)據(jù)的CSR報告可讀性質(zhì)量評估的思路;設(shè)計并驗證了一個基于機器學(xué)習(xí)的披露文本可讀性質(zhì)量評估的方法,并對我國2009-2017年上市公司發(fā)布的CSR報告的全樣本進行了測度;最后,對上市公司整體、各行業(yè)、各年份以及不同產(chǎn)權(quán)性質(zhì)下的CSR報告可讀性的總體以及結(jié)構(gòu)與分布特征進行了分析與討論。本文可能的邊際貢獻在于:第一,本文提出的CSR報告可讀性質(zhì)量評估模型緊扣“通俗易懂”這一信息披露質(zhì)量要求,在評估方法上相較于以往的評價主觀性強、缺乏可比性等問題,具有客觀性強、標(biāo)準(zhǔn)統(tǒng)一、可量化對比、有效可靠與自適應(yīng)的特點,并可以為相關(guān)場景的應(yīng)用提供借鑒;第二,通過全樣本、橫縱向分析,得到了一組全新的、系統(tǒng)與可量化的上市公司信息披露質(zhì)量的特征數(shù)據(jù),為相關(guān)理論與應(yīng)用研究提供了重要的基礎(chǔ);第三,在實踐中,有助于“印象管理”與市場操縱行為的識別,為信息披露質(zhì)量評估與監(jiān)管提供了一個新的工具。
二、文獻回顧與CSR信息披露中的可讀性
(一)可讀性質(zhì)量評估模型
“通俗易懂”的內(nèi)涵并不復(fù)雜,即更多的人更容易理解信息傳遞的內(nèi)容,但如何有效衡量與測度卻并不容易。受到閱讀者的知識背景、興趣愛好、閱讀動機、閱讀策略與認知能力等因素的影響(李廣建,1989),不同的閱讀者對于相同文本評估結(jié)果會有很大的差異,情境因素也會對閱讀者的感受產(chǎn)生干擾。顯而易見,根據(jù)專家或者實驗被試者的閱讀感受,直接得出定性或定量結(jié)論,這種“以己度人”的方式很難消除主觀性與標(biāo)準(zhǔn)不一致的問題;雖然,一些研究通過問卷調(diào)查、回答問題與完形填空等方式(Taylor,1953),力求建立一個相對客觀的判斷標(biāo)準(zhǔn),但也會面臨抽樣與樣本完整性的挑戰(zhàn)(張秀敏等,2017),針對特定人群的小樣本評估效果可能有一定的效果,而在多主體、大樣本的評估在實踐中往往很難開展。此外,根據(jù)披露文本中的專業(yè)術(shù)語密度、次常用字密度、句法復(fù)雜度與句子結(jié)構(gòu)等(Lu,2010;Flor,2013;陳銀娥等,2017;任宏達等,2018)等指標(biāo)來量化,不僅在特征變量選擇、模型構(gòu)建上易受到研究者知識、經(jīng)驗和偏好的影響,在指標(biāo)的賦權(quán)上也會存在缺乏依據(jù)的情況,從而導(dǎo)致統(tǒng)計值與真實值之間的偏差(孫文章等,2019)。總體來說,語言的模糊性與認知的主觀性和復(fù)雜性,造成披露文本可讀性評估往往是“知易行難”。從實踐目的出發(fā),解決問題的關(guān)鍵需要緊扣 “通俗易懂”這一信息披露政策要求,基于CSR信息披露者與閱讀者目的與行為特征,以及證券市場信息披露情境,重新理解與界定“可讀性”。
基于信號傳遞理論,信息披露的主要目的是降低信息發(fā)送者與接收者之間的信息不對稱程度(Li,2008),減少對利益相關(guān)者帶來的困惑和猶豫。上市公司在編制CSR報告時,能否將信息清晰地、實質(zhì)性地傳遞出去,滿足合規(guī)性的要求,理論上是其首先考慮的因素;而文采是否優(yōu)美和在陳述與修辭上進行修飾以達成契合與共鳴等,通常并不是報告編寫中的主要出發(fā)點。在這樣的披露動機下,披露的信息并不是要達到“一千個讀者眼中有一千個哈姆雷特”的效果,而是要盡可能地讓不同信息接收者達成對報告理解的一致性狀態(tài),這種一致性包含兩個方面:與信息發(fā)送方所表達含義一致,以及不同信息接收者之間在理解上的一致。然而,由于語言的模糊性,現(xiàn)實中披露方在編制文本時一般擁有很大的策略空間,從自利的考慮出發(fā),一些情況下,上市公司會刻意操縱可讀性水平,如設(shè)置一些特定的邏輯關(guān)系,采用抽象描述或特定語法結(jié)構(gòu)等,以達到文本操縱與印象管理的目的(田利輝等,2017;Bacha,2019;Ben A和Belgacem,2018;Loughran,2020),從而造成披露方意圖表達的信息與實質(zhì)信息往往存在差異。因而,站在質(zhì)量評估與監(jiān)管的立場,CSR信息披露是否“通俗易懂”,意味著是否能夠適應(yīng)信息接收者不同認知水平,容易達成對實質(zhì)信息理解上的趨同。即不同的人在閱讀同一信息達成正確判斷時,其認知成本差異較小,達成一致性正確判斷所花的代價較低。我們將這一可讀性質(zhì)量評估維度稱為“適應(yīng)水平”。
對信息接收方而言,CSR報告的讀者一般為利益相關(guān)方,閱讀目的通常是想從公開信息中發(fā)現(xiàn)企業(yè)可持續(xù)發(fā)展能力的特定信號以提高決策效率。即使在現(xiàn)階段參與者以中小投資者為主的我國證券市場,也有證據(jù)顯示,投資者仍然具有強烈的投資理性和獲得各類信息的動機,以便資產(chǎn)價值能夠在投機干擾下回歸理性(趙子夜等,2019)。因而,一般情況下,在閱讀的過程中,他們在主觀上會保持一種理性與謹(jǐn)慎的態(tài)度;因為一旦存在理解上的偏差,閱讀者可能會承受相應(yīng)的經(jīng)濟與社會行為后果。但是,與財務(wù)指標(biāo)為主的內(nèi)控信息不同,CSR報告閱讀的過程中,相關(guān)決策知識的形成往往來自于利益相關(guān)者對搜尋到的信息的再加工,并不容易從文本中直接獲得?;诖?,從信息接收方的目的與行為方式出發(fā),應(yīng)主要考慮閱讀者對文本中的有效信息搜尋與編碼的效率,即信息接收者越容易找到對其決策有幫助的內(nèi)容,并做出正確的判斷,CSR報告越是“通俗易懂”,反之亦然。我們將這一評估維度稱為“閱讀效率”。
根據(jù)上述兩個維度,從考察是否能實現(xiàn)有效信息傳遞以達到“通俗易懂”,我們將CSR信息披露文本可讀性分為四種不同類型,如圖1所示。其中,第1種類型閱讀者信息搜尋與再加工的效率最高,且容易與他人形成一致的正確理解。第2種與第3種類型可讀性處于中間水平,代表“易懂不通俗”和“通俗不易懂”的兩種情況,這也是文本操縱與印象管理中最常見的方式?!耙锥煌ㄋ住敝搁喿x者從披露文本中搜尋到有效信息的難度并不大,但不同類型的閱讀者據(jù)此形成的知識具有差異,常見的情況是在框定效應(yīng)的作用下(Hellmann,2017;Chung,2019),專業(yè)知識的欠缺和信息的弱勢的閱讀者會被披露方所“誤導(dǎo)”;而“通俗不易懂”指披露文本一般歧義較少,但其中存在大量冗余信息,找到關(guān)鍵信息并形成決策知識并不容易,閱讀者要花費較大的信息搜尋與編碼成本。
(二)可讀性的測度
對披露文本的閱讀效率與適應(yīng)水平進行系統(tǒng)、可量化的測度,是實現(xiàn)可讀性質(zhì)量評估的關(guān)鍵。從現(xiàn)有可讀性測度技術(shù)路線來看,可大致分為兩類:一類是基于公式計量的方式,一類是基于機器學(xué)習(xí)的方式。公式計量源于美國學(xué)者Lively等(1923),1923年他們通過對初中英文教材詞匯難度進行的考察,構(gòu)建了第一個英文文本可讀性評估公式;此后Vogel等(1928)在1928年提出了Winnetka公式,通過使用回歸方程的方法,將詞匯和語法等文本特征納入可讀性公式來評估兒童文本的理解程度;伴隨著研究的深入,一些研究者從不同角度對可讀性公式進行改進,比較有影響的如Flesch與Dale-Chall(Flesch,1948;Dale,1948)以及近年來使用頻繁的Fog指數(shù)(Li,2008)和Bog指數(shù)(Bonsall,2017)等測量公式。中文文本可讀性的評估起步相對較晚,早期研究多集中于教育領(lǐng)域,主要借鑒國外可讀性公式設(shè)計思路,結(jié)合具體的應(yīng)用場景,提出中文文本可讀性測量公式(Yang,1970;孫剛,2015;荊溪昱,1995;宋曜廷等,2013):如有文獻(張寧志,2000)對29部常用教材的語料進行分析,設(shè)計了中文可讀性公式的雛形;還有研究者(王蕾,2017)基于對外漢語教學(xué)的分析,提出了一個衡量記敘性文本的難易度的可讀性公式。伴隨著信息技術(shù)的發(fā)展,研究者開始將機器學(xué)習(xí)技術(shù)應(yīng)用于該問題,通過人工標(biāo)注語料庫,學(xué)習(xí)不同難度級別語料特征,構(gòu)建分類器或比較器模型,對目標(biāo)文本進行可讀性難度級別分析。如Si(2001)將一元詞串隸屬度模型引入可讀性研究,首次將文本可讀性分析與機器學(xué)習(xí)聯(lián)系起來;Collins-Thompson(Colins,2004)等在Si的研究基礎(chǔ)上加大了訓(xùn)練模型,采用Good-Turing平滑算法,提高了文本可讀性預(yù)測的準(zhǔn)確性。近年來,機器學(xué)習(xí)的方法在一些領(lǐng)域顯示出較好的應(yīng)用前景(Kate,2010;Kim,2012;McNamara,2015;Nandhini,2016;Jin,2018)。
從目前的研究進展來看,由于中文與英文在語言特征上存在差異(顧曰國,1992;孟慶濤,2009),基于中文字、詞、句長度與音節(jié)等結(jié)構(gòu)性特征構(gòu)建的公式,其有效性還有待進一步驗證;同時,CSR報告作為一種規(guī)范性的信息披露文本在陳述方式上往往非常相似,結(jié)構(gòu)特征差異并不明顯,采用公式計量的方式,用一把通用的“尺子”,很難將結(jié)構(gòu)類似文本的可讀性有效區(qū)分開來。而在機器學(xué)習(xí)研究中,語料庫通常需要進行人工標(biāo)注,除成本高外,也難以排除標(biāo)注過程中的主觀性干擾,涉及大規(guī)模標(biāo)注時,標(biāo)準(zhǔn)的一致性又難以保證,存在分類的可靠性與穩(wěn)定性問題。相對而言,如果能解決語料庫構(gòu)建的問題,基于機器學(xué)習(xí)構(gòu)建分類器的方式,在中文披露文本的可讀性測度上會更具有優(yōu)勢。
可讀性本質(zhì)上源于個體主觀感受,我們可能都會認同某一文本的確“通俗易懂”,但不同的人從不同的經(jīng)驗出發(fā),往往會做出不同程度的判斷。而這些沒有量綱的描述,通常是不可以直接進行比較的。例如,在給定相同的語料與標(biāo)注說明的情況下,不同的標(biāo)注者往往會達成相同的意見,但卻給出不同的評估絕對值;雖然可以運用排序方法得到文本的兩兩相對難度關(guān)系(Schlkopf,2006;Tanaka-Ishii,2010),但一般只能做到文檔的相互比較,難以達到段落或篇章水平兩兩比較,且大規(guī)模標(biāo)注的成本很高。提高客觀性與評估標(biāo)準(zhǔn)的一致性是本文測度方法設(shè)計的主要考慮。從“通俗易懂”原則出發(fā),我們認為閱讀效率與適應(yīng)水平兩個可讀性質(zhì)量評估維度,涉及個體和群體信息搜尋成本,而信息搜尋成本可以通過時間這一客觀指標(biāo),轉(zhuǎn)化為閱讀者行為特征來進行有效測量。基于此,本文用同一語料多個閱讀者的耗費時間均值來測度閱讀效率;由同一語料多個閱讀者的耗費時間標(biāo)準(zhǔn)差來測度適應(yīng)水平。這樣,不僅很好地滿足了兩維度測量的構(gòu)念效度,也可以有效解決語料標(biāo)注中的主觀性問題,保證了可讀性質(zhì)量評估結(jié)果的可靠性。
三、CSR信息披露可讀性質(zhì)量評估方法
(一)CSR報告語料采集
目前尚未有專門針對CSR報告的人工標(biāo)注語料庫,需要研究者進行自行設(shè)計與構(gòu)建。除滿足語料庫構(gòu)建中的一般性原則外,CSR報告可讀性語料還需從文本特殊性出發(fā),考慮提供真實的數(shù)據(jù)資源和深層次的語言信息的功能。文本抽樣是一個關(guān)鍵性問題,如果所抽取的樣本存在較大的系統(tǒng)性偏差或代表性偏差,將直接影響機器學(xué)習(xí)的有效性。在抽樣數(shù)量有限的約束下,若通過隨機抽樣,樣本結(jié)構(gòu)與總體結(jié)構(gòu)存在差異的可能性會很大,如果代表性偏差不能很好控制,那就意味著,語料庫可能只適用于某一話語特征文本的評價。與之相對應(yīng),CSR報告同一文本中上下文表述類型差異較小,因而通過人工控制進行分層抽樣,可以有效提取出更多類型的文本,且保證系統(tǒng)性偏差的可控。另外,CSR報告總體上數(shù)量并不大,且人工標(biāo)注成本較高,分層抽樣也有利于提升機器學(xué)習(xí)的效率。
我們對所收集的報告按類型隨機抽樣、文本分割、主題合并、分層抽樣的流程,盡可能控制了抽樣偏差的出現(xiàn),并結(jié)合閱讀者的習(xí)慣,對提取的語料進行了人工編輯,以保證將各種話語類型包含在語料樣本中,提高自動評估的效果。具體分為五個步驟:第一步,根據(jù)報告陳述模式的類型與主題篇幅分布,將所有報告分為四個類型:質(zhì)性均勻、質(zhì)性不均勻、混合均勻與混合不均勻;第二步,在樣本庫中按行業(yè)和年份比重,進行類型隨機,由兩名研究人員同時進行初步研讀,在意見一致的前提下進行人工分類,意見無法形成一致的樣本作為第五類,直至抽取各類型報告數(shù)量至少達到20份,總量達到200份;第三步,綜合國際、國內(nèi)和行業(yè)各類編制指南與標(biāo)準(zhǔn),按照6個信息披露主題對報告文本進行內(nèi)容分割,并在同一主題下進行文本合并,得到6個一級子類,這6個主題分別是:公司概況、股東、客戶和消費者、供應(yīng)商、員工、環(huán)境社區(qū)公益;第四步,對于每一子類中的報告片段,按敘事型、闡述型與混合型修辭方式進行分層,段落中句子多以人物、事件或地點作為起點,使用放射型推進方式的為敘事型,若在邏輯上與上文保持聯(lián)系,或者是對上文某個部分的擴展或依附為闡述性型,兩者兼有為混合型,并最終得到18個層;第五步,按“總字?jǐn)?shù)占比”在18個層中分別隨機抽取段落片段,經(jīng)人工比對合并、調(diào)整與編輯,控制字?jǐn)?shù)在300字左右(±3%),最終得到600個語料片段。
語料抽取后,首先針對每一個片段,經(jīng)過至少2人的仔細判讀,提取其中可能會影響決策的有效信息;在達成共識的基礎(chǔ)上,按照統(tǒng)一的句子長度、語法結(jié)構(gòu)、難易水平設(shè)計兩道判斷題,最終得到包含300字左右文本片段和兩道判斷題在內(nèi)的600個數(shù)據(jù)集;接著,根據(jù)采集的語料,本文設(shè)計開發(fā)了一個可讀性標(biāo)注平臺,通過網(wǎng)頁答題的方式提供給標(biāo)注者,600個語料片段被隨機分成24組標(biāo)注數(shù)據(jù)集,每組標(biāo)注數(shù)據(jù)集包含25個語料與50道判斷題;最后,通過預(yù)實驗對語料進行完善,并測算出每組語料正常標(biāo)注的總耗時應(yīng)不低于25分鐘。
(二)CSR報告可讀性評估數(shù)據(jù)集構(gòu)建
利用眾包方式構(gòu)建語料庫,已成為研究者解決數(shù)據(jù)集不足問題的一條常見的途徑(Schumacher,2016;Vajjala,2017),基于可讀性標(biāo)注平臺,我們設(shè)計了一個眾包實驗來記錄被試的閱讀時間特征,閱讀過程本身就是標(biāo)注。保證過程可控與結(jié)果可靠是實驗設(shè)計的主要出發(fā)點:第一,選擇了與現(xiàn)實中CSR報告閱讀者認知特征相似的被試,不事先告知研究的真實目的,避免實驗者偏差和偶然減員;第二,進行有效的啟動,通過目標(biāo)激勵與分心物抑制,保證被試閱讀過程中的持續(xù)專注;第三,注意避免選擇性偏差,同一語料隨機分配給多個閱讀者,以記錄均值與方差;第四,注意過程控制,被試在閱讀完語料后,會進入下一頁面回答兩道判斷題,測試其對語料中關(guān)鍵信息搜尋的效果,如果答題錯誤,將自動返回語料頁面,被試再次閱讀后答題,重復(fù)過程直至答案全部正確,并只記錄在語料頁面停留的合計時間;第五,保證測量的一致性,根據(jù)語料中關(guān)鍵信息編寫的判斷題,在句子長度、語法結(jié)構(gòu)、難易水平上等方面基本一致;第六,保證標(biāo)注數(shù)據(jù)的可靠性,對于每段語料對應(yīng)的多個被試閱讀的時間數(shù)據(jù),在去除極值與異常值后計算閱讀時間均值與標(biāo)準(zhǔn)差。
參與眾包標(biāo)注實驗的被試主要由高校經(jīng)管專業(yè)本科與研究生、企業(yè)管理人員與政府部門工作人員構(gòu)成,總計483人。我們提前通知他們將進行專業(yè)知識測試,結(jié)果與考核或獎勵有關(guān),并要求其預(yù)留好時間。實驗中,每組標(biāo)注數(shù)據(jù)集在線并行發(fā)放給了15個以上的被試,當(dāng)系統(tǒng)后臺收到18個正常返回結(jié)果(總耗時大于25分鐘)后,將自動停止發(fā)放該組數(shù)據(jù)。剔除返回的組異常結(jié)果與組數(shù)據(jù)縮尾處理后,共獲得600個語料對應(yīng)的9000個時間數(shù)據(jù)。進一步針對單個語料對應(yīng)的15個時間數(shù)據(jù)進行第二次縮尾處理,最終得到6000個時間標(biāo)注數(shù)據(jù)。根據(jù)兩維度評估模型,我們計算了每條語料的10個有效閱讀時間均值和標(biāo)準(zhǔn)差,并按這兩個指標(biāo)的中位數(shù),對600個語料進行了分類,在兩個維度上各得到高低水平的不同的300條標(biāo)注結(jié)果,為分類器的構(gòu)建提供了基礎(chǔ),實驗數(shù)據(jù)如圖2所示。
(三)CSR報告可讀性分類器構(gòu)建
由于標(biāo)注的成本較大的原因,完全依賴標(biāo)注數(shù)據(jù)集進行有監(jiān)督學(xué)習(xí)的實現(xiàn)難度較大,因此,在大多數(shù)情況下,我們所面臨的只是少量數(shù)據(jù)或者少量標(biāo)注數(shù)據(jù)的情況。同時,弱監(jiān)督學(xué)習(xí)作為機器學(xué)習(xí)領(lǐng)域的研究熱點之一,不少學(xué)者也在不斷嘗試將弱監(jiān)督學(xué)習(xí)應(yīng)用到小數(shù)據(jù)集機器學(xué)習(xí)中(Wang,2016;Wang,2018;Boney,2018)。目前常用的一種方式是在一個大數(shù)據(jù)集上對模型進行預(yù)訓(xùn)練,并在特定任務(wù)上對其進行微調(diào),以控制過擬合的情況。2018年Bert模型的推出為弱監(jiān)督學(xué)習(xí)應(yīng)用提供了重要的基礎(chǔ),近年來在文本分類、問答系統(tǒng),情感分析,垃圾郵件過濾,命名實體識別等任務(wù)有了較廣泛的應(yīng)用,現(xiàn)有的一些研究也表明,基于Bert模型預(yù)訓(xùn)練,在小數(shù)據(jù)集的情況下也能實現(xiàn)顯著的分類效果?;诖?,本研究借助Howard(2018)提出的方法,構(gòu)建了基于閱讀效率(閱讀時間)和適應(yīng)水平(標(biāo)準(zhǔn)差)的兩維度的分類器,然后通過對兩個維度學(xué)習(xí)速率的變化來微調(diào)語言模型,讓模型更快地在小樣本數(shù)據(jù)集上收斂。
在預(yù)訓(xùn)練的基礎(chǔ)上,如何利用有限的標(biāo)注數(shù)據(jù)提高分類準(zhǔn)確性是一個關(guān)鍵問題。由于CSR信息披露文本的特殊性,相對于數(shù)據(jù)增強,從語文教育等相關(guān)領(lǐng)域進行知識結(jié)構(gòu)遷移存在較大不確定性。因而,按照常見的機器學(xué)習(xí)方法,我們首先加載了Bert中文模型,進行了無監(jiān)督的預(yù)訓(xùn)練;在此基礎(chǔ)上用標(biāo)注好的數(shù)據(jù)進行了微調(diào)。由于進行有監(jiān)督微調(diào)的標(biāo)注數(shù)據(jù)集中只有600條語料,為避免過擬合的情況,我們設(shè)置了閱讀時間和標(biāo)準(zhǔn)差兩個分類器模型(核心代碼詳見附錄1),以減少特征維度提高特征數(shù)據(jù)集重復(fù)利用率。同時,由于小數(shù)據(jù)集的本質(zhì)問題在于數(shù)據(jù)量過少,從而造成分類準(zhǔn)確率偏低,我們采用了早期針對數(shù)據(jù)增強的方法,對數(shù)據(jù)應(yīng)用了一組變換來增加樣本量,并且考慮到采用同義詞替換、回譯、隨機插入與刪除等方式,可能會改變文本可讀性水平,相比而言中文閱讀習(xí)慣性下,句子和詞的順序不會對理解有太大影響,故采用了打亂句與詞順序的方式,進行了數(shù)據(jù)增強,并經(jīng)人工逐條閱讀進行了確認。
數(shù)據(jù)增強后,按照9∶1的比例將標(biāo)注數(shù)據(jù)集劃分為訓(xùn)練集和測試集。完成訓(xùn)練后,經(jīng)過測試發(fā)現(xiàn),對平均分類準(zhǔn)確率達到了85.3%。我們也選取了其他幾種分類算法對CSR報告的分類準(zhǔn)確性進行了對比(如表1所示)。結(jié)果表明,基于Bert模型預(yù)訓(xùn)練的可讀性分類效果較好,基本滿足對CSR報告文本進行可讀性質(zhì)量評估的要求。
(四)CSR報告可讀性綜合評估
相對于文學(xué)作品而言,CSR報告在整體上層次較為清晰,情感傾向不明顯,長句多,上下文通常和總分、順接、轉(zhuǎn)折、例證、因果與對照等關(guān)系直接相關(guān),閱讀過程中句與段落在信息傳遞與搜尋功能上的獨立性較強。針對這一特征,本文采用了對CSR報告進行分段處理;以段落為粒度進行自動分類;并進行無量綱賦權(quán)與數(shù)據(jù)降維的方法;最終計算出篇章和整個文檔的可讀性程度。
首先,在扎根的基礎(chǔ)上,我們結(jié)合中國人基本閱讀速度,將報告中的段落按句號為準(zhǔn),按300字左右整合為一段,據(jù)此計算出單個報告的總段數(shù);接著應(yīng)用閱讀時間與適應(yīng)水平分類器,對報告進行可讀性類別自動判斷,得到每個類別的段落數(shù);然后計算每個分類類別段落數(shù)占總段落數(shù)的比例,可以得到閱讀效率高低與適應(yīng)水平高低兩兩結(jié)合類型段落數(shù)占總段落數(shù)的比例四個指標(biāo);最后,我們借鑒了郭亞軍(2011,2017)等人的研究,提出了一個基于主客觀信息綜合判斷的拉開檔次法,對數(shù)據(jù)進行降維處理,盡可能拉大被評價指標(biāo)間整體差異的同時,并兼顧考慮到專家主觀信息及各個指標(biāo)本身的相對重要程度,最終得到披露文本篇章和文檔級的可讀性質(zhì)量評估數(shù)據(jù)。
四個評價指標(biāo)分別為閱讀時間短標(biāo)準(zhǔn)差小x1、閱讀時間短標(biāo)準(zhǔn)差大x2、閱讀時間長標(biāo)準(zhǔn)差小 x3、閱讀時間長標(biāo)準(zhǔn)差大x4,指標(biāo)均為極大型指標(biāo)。具體計算步驟如下:
記xij為被評價對象i在評價指標(biāo)j下的觀測值,其中i=1,2,…,n;j=1,2,…,m,x*ij表示經(jīng)過無量綱化后處理的指標(biāo)值,不失一般性,記無量綱化處理后的數(shù)值仍為xij。
(1)對原始指標(biāo)數(shù)據(jù)進行無量綱化處理。本文采用極值處理法對原始數(shù)據(jù)進行無量綱化處理,即x*ij=(xij-xminj)/(xmaxj-xminj)。
(2)非線性因子的選取。記評價指標(biāo)xj關(guān)于n個被評價對象取值的方差為 D(xj),各被評價對象間整體離散程度的貢獻率為μj,則μj=D(xj)∑mj=1D(xj)。根據(jù)該公式計算可讀性各評價指標(biāo)關(guān)于CSR報告間整體離散程度的貢獻率μj,計算結(jié)果為(0.274,0.304,0.270,0.152),結(jié)合專家的相關(guān)建議,事先確定給定的指標(biāo)離散程度對各被評價對象間差異影響的貢獻率的閾值α為0.29,由于μ2=0.304>0.29,因此指標(biāo)x2為非線性因子。
(3)評價指標(biāo)序關(guān)系的判斷。邀請5位相關(guān)領(lǐng)域?qū)<医Y(jié)合自身的知識經(jīng)驗對本研究中確定的可讀性評價指標(biāo)的重要程度進行排序,排序結(jié)果為x1>x2>x3>x4。設(shè)根據(jù)主觀判斷給出的評價指標(biāo)xk-1與 xk的重要程度之比為rk=wk-1/wk(k=m,m-1,…,2),wk表示指標(biāo)相應(yīng)權(quán)重,rk的取值如表2所示。由于專家根據(jù)主觀信息很難準(zhǔn)確地給出rk的確定值,最終,結(jié)合幾個專家的一致意見確定排序后相鄰兩個評價指標(biāo)重要程度的比值rk的取值范圍,如表3所示。
(4)確定評價指標(biāo)權(quán)重。為了使各被評價對象間的差異盡可能地拉大,各被評價對象間的整體差異可以用各被評價對象綜合評價值的方差進行衡量。即
s2=1n∑ni=1(yi-y-)2=(yi)Tyin-(y-)2(1)
因此為了使各被評價對象間的差異最大,就是使式(1)的方差最大,因此按如下規(guī)劃求解來計算評價指標(biāo)權(quán)重:
max(s2)=max(yi)Tyin-(y-)2
s.t.r-k≤wk-1wk≤r+k0 根據(jù)規(guī)劃模型中計算得到的指標(biāo)權(quán)重,按式(3)計算各被評價對象最終的評價值yi,本文評價指標(biāo)數(shù)據(jù)xij均大于等于0。 yi=∑mj=1j≠k0xijwj+(xk0)2wk0,xij均大于(小于)等于0時∑mj=1j≠k0xijwj+(xk0)3wk0,其他情形(3) 根據(jù)式(1)及規(guī)劃模型(2)計算可讀性各評價指標(biāo)的權(quán)重系數(shù),本文運用Python軟件進行編碼計算(核心代碼見附錄2),計算得出w1,w2,w3,w4分別為0.443,0.277,0.173,0.107。 (5)將計算得出的評價指標(biāo)權(quán)重系數(shù)wj帶入式(3)中,即可計算出各被評價對象最終的綜合評價結(jié)果,得到上市公司CSR報告樣本的最終可讀性評價得分分值。 四、數(shù)據(jù)分析與結(jié)果討論 (一)樣本選取 我們從企業(yè)社會責(zé)任中國網(wǎng)等上市公司信息披露官方網(wǎng)站收集了2009-2017年的CSR報告全樣本共5183篇。以2009年為樣本起點進行研究分析,除2009年前樣本量很少外,缺乏披露指南,樣本質(zhì)量參差不齊也是一個重要因素。上市公司一般是在次年初中期才會發(fā)布上一年度的社會責(zé)任報告,而本研究樣本收集截止時間到2019年3月,只有小部分企業(yè)發(fā)布了2018年的CSR報告,因此目前只對2009-2017年的數(shù)據(jù)進行了分析研究。本文使用的企業(yè)財務(wù)信息主要從國泰安和銳思數(shù)據(jù)庫獲得;行業(yè)分類主要來源于國家統(tǒng)計局發(fā)布的分類標(biāo)準(zhǔn)。同時,對于存在修訂公告以及樣本量過少的行業(yè),本文均予以剔除,最終得到2009-2017年涉及12個行業(yè)的5088個有效樣本。 (二)描述性統(tǒng)計 不同行業(yè)報告的可讀性數(shù)據(jù)統(tǒng)計情況見表4。從表中可以看出,制造業(yè)披露的CSR報告數(shù)量最多,樣本數(shù)量為2902篇,占總體樣本的57.04%;其次是金融業(yè),樣本數(shù)量為373篇,占樣本總數(shù)的7.33%;而樣本量最少的行業(yè)為租賃和商務(wù)服務(wù)業(yè),其樣本數(shù)量為23篇,僅占總樣本的0.45%。可讀性得分均值最高的是文化、體育與娛樂業(yè),達到了0.331048,其次是建筑業(yè),它的可讀性得分均值達到了0.322493,都高于樣本均值0.302245。可讀性最低的行業(yè)是農(nóng)、林、牧、漁業(yè)其報告可讀性僅為0.287223。 報告可讀性均值按年份統(tǒng)計情況如表5、圖3所示,從表5中可以看出,2009年企業(yè)發(fā)布的報告最少,僅為165篇,2017年發(fā)布的報告數(shù)量最多,達到了731篇,數(shù)量呈逐年上升趨勢,其中2009年到2010年報告數(shù)量增長速度最快。從不同年份報告的可讀性均值來看,分值最高的是2013年,其值為0.305952,高于總樣本均值0.302245,報告可讀性數(shù)據(jù)均值最低的年份是2009年,其值為0.288167,明顯低于總樣本均值。 由圖3可以看到,整體上CSR報告可讀性得分均值隨年份變化比較明顯,2009-2013年間發(fā)布的CSR報告可讀得分均值快速上升,但在2014年可讀性數(shù)據(jù)平均得分略有回調(diào),并隨后基本保持穩(wěn)定。初步推斷這一變化趨勢與2009-2013年間信息披露規(guī)則體系逐步完善有關(guān),由于報告編寫有了相應(yīng)的標(biāo)準(zhǔn)與指南,顯現(xiàn)出較強的學(xué)習(xí)效應(yīng);而在2014年后報告可讀性分?jǐn)?shù)回調(diào),可能是因為披露方在熟悉相關(guān)標(biāo)準(zhǔn)之后,在編寫報告的過程中進行了策略優(yōu)化,以保證披露信息的規(guī)范性與減少披露風(fēng)險。 (三)數(shù)據(jù)分析 (1)正態(tài)檢驗 在描述性統(tǒng)計后,本文根據(jù)可讀性數(shù)據(jù),進行了全樣本的正態(tài)分布檢驗,直方圖檢驗如圖4所示。從圖中可以看出,大部分報告的可讀性分值在0.20~0.40分之間,處于中間位置,而處于兩端的可讀性得分占樣本總量較少。進一步檢測數(shù)據(jù)的正態(tài)分布情況,如圖5所示,由樣本可讀性實測值和預(yù)期的正態(tài)值組成的散點圖基本上都落在直線附近,只有少部分兩端的可讀性極端值與直線的值相差較大。因此,可以推斷出可讀性分值基本上服從正態(tài)分布。 (2)方差分析 在對數(shù)據(jù)正態(tài)檢驗后,進一步對不同行業(yè)、不同年份、不同產(chǎn)權(quán)性質(zhì)的可讀性分值進行了方差齊性檢驗,結(jié)果顯示除了按照不同行業(yè)進行分組后的可讀性數(shù)據(jù)方差不齊外,其他兩個組的數(shù)據(jù)符合方差齊性。首先,本文采用獨立樣本 Kruskal-Wallis 檢驗對不同行業(yè)的可讀性分值進行分析。由表6可以看出,不同行業(yè)獨立樣本Kruskal-Wallis 檢驗結(jié)果顯著性小于0.05,表明不同行業(yè)之間可讀性評分存在顯著差異,行業(yè)異質(zhì)性是影響CSR信息可讀性水平的重要因素。 結(jié)合已有的經(jīng)驗證據(jù)推斷,在自身CSR行為與績效的描述中,經(jīng)營范疇的差異會對可讀性產(chǎn)生相應(yīng)的影響。例如,由于行業(yè)原因一些報告里面存在較多的專業(yè)術(shù)語,如果沒有對其進行解釋的話,那么報告的可讀性就會大打折扣,而文化、體育與娛樂業(yè),在經(jīng)營內(nèi)容上比較容易理解;此外,一些環(huán)境敏感型行業(yè),為修飾其社會責(zé)任表現(xiàn),可能會有意進行語義操縱。另一個原因則可能是行業(yè)樣本分布不均勻所致(冼迪曦,2012)。 由于不同產(chǎn)權(quán)性下的報告可讀性分值既服從正態(tài)分布又是等方差的,因此本文采取方差分析對不同產(chǎn)權(quán)性質(zhì)下的CSR報告可讀性分值進行了檢驗。檢驗結(jié)果如表7所示,表明產(chǎn)權(quán)特征并不是可讀性高低的主要影響因素。 同樣,本文采用方差分析對不同年份間的CSR報告可讀性分值進行了檢驗,檢驗結(jié)果如表8中所示。從表8可以看出,不同年份的CSR報告可讀性數(shù)據(jù)F值顯著性水平低于5%,說明不同年份的可讀性得分存在差異。 為了更準(zhǔn)確地發(fā)現(xiàn)具體哪些年份的報告可讀性得分存在差異,本文采用了LSD法,對可讀性分值數(shù)據(jù)進行了多重比較,具體結(jié)果如表9所示。 從表9可以看出,2011-2017年中,每一年與其他年份可讀性分值都沒有顯著性的差異,2009年與其他年份可讀性分值均有顯著性的差異。結(jié)合政策研究可基本確定,這一現(xiàn)象是外部政策的結(jié)果,2009-2010年前后,相繼發(fā)布了《社會責(zé)任績效分類指引》、《社會責(zé)任指南》等標(biāo)準(zhǔn),中國上市公司CSR報告的編寫逐漸趨向標(biāo)準(zhǔn)化;除此之外,一些上市公司還積極與GRI等國際標(biāo)準(zhǔn)接軌,在報告的內(nèi)容和形式等方面不斷提升,大大增強了利益相關(guān)者的投資決策效率。 (3)異常值分析 為進一步發(fā)現(xiàn)報告可讀性分值中存在的異常值,我們采用了箱型圖的方式對可讀性異常值進了描述分析。結(jié)果如圖6所示。 由圖6可以看到,僅有兩個行業(yè)中沒有存在異常值,表明文化體育與娛樂業(yè)、租賃和商務(wù)服務(wù)業(yè)報告可讀性得分比較均勻。異常值最多的是制造業(yè),其中編號為199的樣本為2010年浙江某橡膠股份有限公司發(fā)布的報告,經(jīng)查閱判斷可讀性水平相對較低,主要是由于這篇報告結(jié)構(gòu)比較混亂,語言表述模糊,容易產(chǎn)生歧義。而得分比較高的3215號樣本為2015年安徽某水泥股份有限公司發(fā)布的CSR報告,可讀性強的原因是編制中邏輯清晰,描述中確定性程度高,歧義表達少。通過箱型圖可以快速地發(fā)現(xiàn)樣本可讀性得分中的異常值,通過比對找出異常原因,為質(zhì)量評估與市場監(jiān)管提供依據(jù)。 (4)有效性檢驗 為明確本文提出的信息披露文本可讀性質(zhì)量評估方法在實際應(yīng)用中的效果,我們采用了與專家評分對比實驗的方法,來檢驗整體方案的實用性和穩(wěn)定性。通常情況下,專家給出的是定性判斷,需要對本文得到的數(shù)據(jù)進行離散化處理。由于可讀性得分主要分布于0.20~0.45之間,因此采用五分量表法,把區(qū)間分為5等份,對應(yīng)賦值區(qū)間分別為1~5分,分別代表:可讀性非常低、可讀性低、可讀性一般、可讀性高、可讀性非常高。具體情況如表10所示。 根據(jù)實例分析中得到的結(jié)果,我們在每一個可讀性得分區(qū)間分別隨機抽取了一篇報告,分別為《600352浙江龍盛:2014年度社會責(zé)任報告》《601107四川成渝:2013年度社會責(zé)任報告》《600383金地集團:2016年度社會責(zé)任報告》《000883湖北能源:2016年度社會責(zé)任報告》《600372中航電子:2015年度社會責(zé)任報告》,可讀性分值分別為0.238619、0.261585、0.338352、0.391487、0.423627,分別對應(yīng)5分法中的1~5分值。 我們聯(lián)系了非財務(wù)信息披露評價專業(yè)機構(gòu)中的5位專家,明確告知其評價對象為樣本整體上閱讀和理解的容易程度,并請他們對抽樣的5篇報告按照5分量表進行分別評分。結(jié)果如表11所示,對于同一份CSR報告來說,不同專家之間的可讀性評分具有一致性。同時,我們計算了5位專家評估的平均值,通過對比分析可得,專家法得到的平均值和本文研究結(jié)果基本一致,從而在一定程度上驗證了本文提出的方法在實際應(yīng)用中具有良好的評估效果,以及實例分析結(jié)果的可靠性與有效性。 五、研究結(jié)論與不足 信息披露的可讀性自動評估,作為一種預(yù)測性的手段,具有客觀性和經(jīng)濟性的優(yōu)點(吳思遠等,2018)。由于人類語言和認知的復(fù)雜性,面向通用領(lǐng)域的自動評估往往具有很大的難度;特定應(yīng)用場景下的研究,由于可以結(jié)合情境、文本特征、作者心理與閱讀者行為等因素,進行更具體和有針對性的分析,而展現(xiàn)出較好的研究前景和應(yīng)用價值。過去十多年來,伴隨著機器學(xué)習(xí)技術(shù)的發(fā)展,可讀性評估方法與實踐有了很大的進展,但如何控制標(biāo)注過程中因人的主觀性差異所帶來的標(biāo)準(zhǔn)不同,目的不同和結(jié)果不一致,仍然是一個尚待解決的問題。在文本閱讀過程中,相對于心理與認知層面的測量,對人的行為特征的觀察會更直接與準(zhǔn)確,解決問題的關(guān)鍵在于找到一個能夠合理聯(lián)系閱讀行為特征與文本可讀性的理論框架及有效測量方法。 從這一研究目的出發(fā),本文從評估“通俗易懂”的質(zhì)量評估與監(jiān)管要求出發(fā),針對CSR信息披露中的特點,在信息披露方與接收方的動機與行為分析的基礎(chǔ)上,構(gòu)建了一個基于閱讀效率與適應(yīng)水平的兩維度評估模型,提出了一個從信息搜尋的效率與達成理解一致性的成本進行評估的思路。這一模型的重要意義在于,將特定場景下的閱讀行為特征與報告可讀性聯(lián)系起來,并可以根據(jù)同一披露報告不同人閱讀時間均值與標(biāo)準(zhǔn)差,客觀區(qū)分不同文本可讀性之間的差異。根據(jù)這一認識,本文進一步設(shè)計了一個完整有效的方法,結(jié)合我國2009-2017年A股上市公司披露的CSR報告,采集了CSR報告語料,并采用眾包實驗對語料進行人工標(biāo)注,同時結(jié)合機器學(xué)習(xí)和改進的拉開檔次法,最終得到了篇章級CSR信息披露可讀性數(shù)據(jù);同時在此基礎(chǔ)上,我們對所得到數(shù)據(jù)根據(jù)不同行業(yè)、年份、產(chǎn)權(quán)性質(zhì)進行了分析,結(jié)構(gòu)顯示我國CSR報告的可讀性水平整體上服從正態(tài)分布;產(chǎn)權(quán)性質(zhì)對CSR信息披露可讀性影響不大,而不同行業(yè)與年份可讀性分值差異較為顯著;行業(yè)異質(zhì)性和外部政策的變化可能是差異性形成的主要原因。 同時,本文也存在一定的局限性:第一,信息披露文本可讀性質(zhì)量評估的兩維度理論模型的提出,主要基于“通俗易懂”的非財務(wù)信息披露質(zhì)量評估與監(jiān)管的政策要求,能否滿足其他場景的要求還有待進一步檢驗;第二,CSR報告的可讀性語料庫的規(guī)模仍較小,雖然進行了基于Bert模型的預(yù)訓(xùn)練和數(shù)據(jù)增強,但仍然可能存在過擬合的情況;第三,眾包標(biāo)注實驗采用了在線方式,雖然通過數(shù)據(jù)處理進行了誤差控制,對被試行為的監(jiān)測仍然相對較弱,尚不能完全排除標(biāo)注過程中環(huán)境因素的影響;第四,本文從“通俗易懂”的政策要求出發(fā),主要針對的是信息披露文本的可讀性質(zhì)量,雖然我們對抽象圖片內(nèi)容進行了文字識別,而CSR報告中常見的實景圖片也可能在利益相關(guān)者查閱報告時對其產(chǎn)生影響,從而造成可讀性程度的偏差,對于這些存在的問題,我們將會在未來研究中進行有針對性地優(yōu)化和改進,并在更大范圍對研究結(jié)果進行檢驗。 參考文獻: [1] 陳銀娥、江媛,2017:《管理層權(quán)力、制度環(huán)境與董事會報告可讀性—— 來自我國上市公司的經(jīng)驗證據(jù)》,《珞珈管理評論》 第3期。 [2] 段釗、何雅娟、鐘原,2017:《企業(yè)社會責(zé)任信息披露是否客觀——基于文本挖掘的我國上市公司實證研究》,《南開管理評論》 第4期。 [3] 顧曰國,1992:《禮貌、語用與文化》,《外語教學(xué)與研究:外國語文雙月刊》 第4期。 [4] 郭亞軍、馬鳳妹、董慶興,2011:《無量綱化方法對拉開檔次法的影響分析》,《管理科學(xué)學(xué)報》 第5期。 [5] 郭亞軍、阮泰學(xué)、宮誠舉,2017:《基于主客觀信息綜合判斷的非線性拉開檔次法》,《運籌與管理》 第6期。 [6] 吉利、張麗、田靜,2016:《我國上市公司社會責(zé)任信息披露可讀性研究——基于管理層權(quán)力與約束機制的視角》,《會計與經(jīng)濟研究》 第1期。 [7] 荊溪昱,1995:《中文國文教材的適讀性研究:適讀年級值的推估》,《教育研究資訊》 第5期。 [8] 李廣建,1989:《略論閱讀能力》,《圖書館建設(shè)》 第3期。 [9] 劉媛媛、田言,2019:《財務(wù)報表誤述、誤述風(fēng)險與自愿性信息披露——基于企業(yè)社會責(zé)任報告的證據(jù)》,《會計研究》 第4期。 [10] 孟慶濤,2009:《英漢語用禮貌原則跨文化交際運用探析》,《現(xiàn)代語文(語言研究版)》 第2期。 [11] 任宏達、王琨,2018:《社會關(guān)系與企業(yè)信息披露質(zhì)量——基于中國上市公司年報的文本分析》,《南開管理評論》 第5期。 [12] 宋曜廷、陳茹玲、李宜憲, 等,2013:《中文文本可讀性探討:指標(biāo)選取、模型建立與效度驗證》,《中華心理學(xué)刊》 第1期。 [13] 孫剛,2015:《基于線性回歸的中文文本可讀性預(yù)測方法研究》,南京大學(xué)。 [14] 孫蔓莉,2004:《論上市公司信息披露中的印象管理行為》,《會計研究》 第3期。 [15] 孫文章、李延喜、朱佳瑋,2019:《基于MC-AHP與灰色關(guān)聯(lián)度的企業(yè)中文年度報告可讀性綜合評價體系及實證檢驗研究》,《當(dāng)代會計評論》 第1期。 [16] 唐國平、劉忠全,2019:《環(huán)境保護稅法》 對企業(yè)環(huán)境信息披露質(zhì)量的影響——基于湖北省上市公司的經(jīng)驗證據(jù)》,《湖北大學(xué)學(xué)報(哲學(xué)社會科學(xué)版)》 第1期。 [17] 田利輝、王可第,2017:《社會責(zé)任信息披露的“掩飾效應(yīng)”和上市公司崩盤風(fēng)險——來自中國股票市場的DID-PSM分析》,《管理世界》 第11期。 [18] 王克敏、王華杰、李棟棟, 等,2018:《年報文本信息復(fù)雜性與管理者自利——來自中國上市公司的證據(jù)》,《管理世界》 第12期。 [19] 王蕾,2017:《初中級日韓學(xué)習(xí)者漢語文本可讀性公式研究》,《語言教學(xué)與研究》 第5期。 [20] 吳思遠、蔡建永、于東, 等,2018:《文本可讀性的自動分析研究綜述》,《中文信息學(xué)報》 第12期。 [21] 冼迪曦,2012:《基于會計視角的企業(yè)社會責(zé)任報告研究》,廣東工業(yè)大學(xué)。 [22] 徐巍、姚振曄、陳冬華,2021:《中文年報可讀性:衡量與檢驗》,《會計研究》 第3期。 [23] 閻達五、孫蔓莉,2002:《深市B股發(fā)行公司年度報告可讀性特征研究》,《會計研究》 第5期。 [24] 葉勇、王涵,2018:《盈余管理對企業(yè)年度報告可讀性的影響研究》,《四川理工學(xué)院學(xué)報(社會科學(xué)版)》 第6期。 [25] 張寧志,2000:《漢語教材語料難度的定量分析》,《世界漢語教學(xué)》 第3期。 [26] 張秀敏、劉星辰、汪瑾,2017:《閱讀難易程度與信息披露質(zhì)量——基于易讀衡量和關(guān)聯(lián)因素視角的分析》,《當(dāng)代經(jīng)濟管理》 第6期。 [27] 趙子夜、楊慶、楊楠,2019:《言多必失?管理層報告的樣板化及其經(jīng)濟后果》,《管理科學(xué)學(xué)報》 第3期。 [28] Ahsan, H. and Mostafa, M. H.,2018,Business strategies and annual report readability, Accounting & Finance,60 (3). [29] Bacha, S. and Ajina, A.,2019,CSR performance and annual report readability: evidence from France, Corporate Governance: The International Journal of Business in Society,20 (2):201-215. [30] Ben A, W. and Belgacem, I.,2018,Do socially responsible firms provide more readable disclosures in annual reports? Corporate Social Responsibility and Environmental Management,25(5):1009-1018. [31] Boney, R. and Ilin, A. Semi-supervised few-shot learning with MAMLl.in: Proc. of the ICLR (Workshop), 2018. [32] Bonsall, S. B. and Miller, B. P.,2017,The impact of narrative disclosure readability on bond ratings and the cost of debt, Review of Accounting Studies,22 (2):608-643. [33] Bonsall, S. B.,Leone, A. J. and Miller, B. P., et al,2017,A Plain English Measure of Financial Reporting Readability, Journal of Accounting and Economics,63 (2-3):329-357. [34] Chen, T. K. and Tseng, Y. J.,2020,Readability of Notes to Consolidated Financial Statements and Corporate Bond Yield Spread, The European accounting review,1-31. [35] Chung, S. W. and Lee, S. Y.,2019,Visual CSR Messages and the Effects of Emotional Valence and Arousal on Perceived CSR Motives, Attitude, and Behavioral Intentions, Communication Research,46 (7):926-947. [36] Colins, T. K. and Callan, J.,2004,A Language Modeling Approach to Predicting Reading Difficulty,Human Language Technologies: the 2004 Conference of the North American Chapter of the Association for Computational Linguistics.,Association for Computational Linguistics,193-200. [37] Dale, E. and Chall, J.,1948,A Formula for Predicting Readability: Instructions, Educational Research Bulletin,27 (2). [38] Flesch, R.,1948,A New Readability Yardstick, Journal of Applied Psychology,32 (3):221-233. [39] Flor, M.,Klebanov, B. B. and Sheehan, K. M.,2013,Lexical Tightness and Text Complexity,Workshop of Natural Language Processing for Improving Textual Accessibility, [40] Hassan, M. K.,Abu Abbas, B. and Garas, S. N.,2019,Readability, governance and performance: a test of the obfuscation hypothesis in Qatari listed firms, Corporate Governance: The International Journal of Business in Society,19 (2):270-298. [41] Hellmann, A.,Yeow, C. and De Mello, L.,2017,The influence of textual presentation order and graphical presentation on the judgements of non-professional investors, Accounting and business research,47 (4):455-470. [42] Howard, J. and Ruder, S.,2018,Universal Language Model Fine-tuning for Text Classification,Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics,328-339. [43] Jin, T. and Lu, X.,2018,A Data-Driven Approach to Text Adaptation in Teaching Material Preparation: Design, Implementation, and Teacher Professional Development, TESOL Quarterly,52 (2):457-467. [44] Kate, R. J.,Luo, X. and Siddharth, P., et al,2010,Learning to Predict Readability using Diverse Linguistic Features,23rd International Conference on Computational Linguistics,546-554. [45] Kim, J. Y.,Kevyn, C. T. and Bennett, P., et al,2012,Characterizing web content, user interests, and search behavior by reading level and topic,ACM International Conference on Web Search and Data Mining,ACM,213-222. [46] Li, F.,2008,Annual report readability, current earnings, and earnings persistence, Journal of Accounting and Economics,45 (2-3):221-247. [47] Lively, B. A. and Pressey, S. L.,1923,A Method for Measuring the “vocabulary Burden” of Textbooks, Educational administration and supervision,(9):298-389. [48] Loughran, Tim and McDonald, Bill,2020,Textual Analysis in Finance, Annual Review of Financial Economics,(12): 357-375. [49] Lu, X. F.,2010,Automatic analysis of syntactic complexity in second language writing, International Journal of Corpus Linguistics,15 (4):474-496. [50] Luo, J.,Li, X. and Chen, H.,2018,Annual report readability and corporate agency costs, China Journal of Accounting Research,11 (3):187-212. [51] McNamara, D. S.,Crossley, S. A. and Roscoe, R. D., et al,2015,A hierarchical classification approach to automated essay scoring, Assessing Writing,(23):35-59. [52] Muslu, V.,Mutlu, S. and Radhakrishnan, S., et al,2019,Corporate Social Responsibility Report Narratives and Analyst Forecast Accuracy, Journal of Business Ethics,154 (4):1119-1142. [53] Nandhini, K. and Balasundaram, S. R.,2016,Improving Readability through Individualized Summary Extraction, Using Interactive Genetic Algorithm, Applied Artificial Intelligence,30 (7):635-661. [54] Schlkopf, B.,John, P. and Hofmann, T.,2006,TrueSkillTM: A Bayesian Skill Rating System,Advances in Neural Information Processing Systems 19: Proceedings of the 2006 Conference,MITP,569-576. [55] Schumacher, E.,Eskenazi, M. and Frishkoff, G., et al,2016,Predicting the Relative Difficulty of Single Sentences With and Without Surrounding Context,Proceedings of Conference on Empirical Methods in Natural Language Processing,1871-1881. [56] Seifzadeh, M.,Salehi, M. and Abedini, B., et al,2020,The relationship between management characteristics and financial statement readability, EuroMed Journal of Business. [57] Si, L. and Callan, J.,2001,A statistical model for scientific readability,Proceedings of the 2001 ACM CIKM International Conference on Information and Knowledge Management,ACM,574-576. [58] Smith, M. and Taffler, R.,1992,Readability and Understandability: Different Measures of the Textual Complexity of Accounting Narrative, Accounting, Auditing & Accountability Journal,5 (4):84-98. [59] Tanaka-Ishii, K.,Tezuka, S. and Terada, H.,2010,Sorting Texts by Readability, Computational Linguistics,36 (2):203-227. [60] Taylor,1953,“Cloze Procedure”: A New Tool For Measuring Readability, The Journalism Quarterly,30 (4):415-433. [61] Vajjala, S.,2017,Automated Assessment of Non-Native Learner Essays: Investigating the Role of Linguistic Features, International Journal of Artificial Intelligence in Education,28 (1):79-105. [62] Vogel, M. and Washburne, C.,1928,An Objective Method of Determining Grade Placement of Children’s Reading Material, The Elementary School Journal,28 (5):373-381. [63] Wang, Y X and Hebert, M. Learning from small sample sets by combining unsupervised meta-training with CNNs. in: Advances in Neural Information Processing Systems, 2016. [64] Wang, Y X,Girshick, R. and M, Hebert. Low-shot learning from imaginary data. in: Proc. of the IEEE Conf. on Computer Vision and Pattern Recognition, 2018. [65] Yang, S.,1970,A Readability Formula for Chinese Language,University of Wisconsin-Madison. Is the Social Responsibility Information Disclosed By Listed Companies ‘Easy to Understand’? —Readability Quality Assessment and Empirical Research Based on Machine Learning Duan Zhao1,2, Zhou Hong1,2, and Zhou Hui1 (1.School of Information Management, Central China Normal University;2. Center for Corporate Social Responsibility, Central China Normal University) Abstract:Text readability is the premise and guarantee for the quality of information disclosure in the securities market. This paper attempts to provide a solution to the evaluation of the readability and quality of social responsibility reports released by the listed companies. Firstly, combined with the analysis of the motivation of information disclosure and reading behavior in the securities market, a two-dimension readability evaluation model based on the efficiency and adaptability level is proposed. Then, a method for assessing the readability of information disclosure text based on machine learning is designed and validated. And finally, the readability level of the full sample of social responsibility reports released by the Chinese listed companies from 2009 to 2017 is measured, while the overall and structural characteristics of the samples are analyzed. The results show that the readability level of social responsibility reports released by the listed companies in China is normally distributed and it increases year by year. The readability level of samples in different industries and years is significantly different, and the industry heterogeneity and external policy changes may be the main reasons for the differences. The model proposed in this paper provides a new way of thinking for the evaluation of the quality of information disclosure, and the evaluation method can effectively reduce the subjective interference in readability evaluation. At the same time, the research results provide a new set of quantitative data for the follow-up empirical research, and also provide new guidance for the supervision of information disclosure in the securities market. Key Words:information disclosure; corporate social responsibility report; machine learning; readability 責(zé)任編輯 郝 偉