段釗 吳智敏 陸定一
摘要:隨著市場(chǎng)環(huán)境的變化與企業(yè)社會(huì)責(zé)任(CSR)信息披露規(guī)則的強(qiáng)化,上市公司披露策略與行為方式也隨之發(fā)生改變。準(zhǔn)確描述與測(cè)度CSR披露內(nèi)容的傾向性及其變動(dòng),不僅實(shí)踐中有助于切實(shí)提升資本市場(chǎng)信息披露質(zhì)量,理論上對(duì)理解企業(yè)披露動(dòng)機(jī)以及揭示披露行為影響機(jī)制也具有重要意義。從全面準(zhǔn)確測(cè)度CSR信息披露傾向性及其動(dòng)態(tài)變化的目的出發(fā)提出了兩個(gè)概念:“主題偏好”與“偏好漂移”,設(shè)計(jì)驗(yàn)證了變量測(cè)度與數(shù)據(jù)結(jié)構(gòu)化的方法,并基于2008-2017年全樣本進(jìn)行了數(shù)據(jù)分析與討論。研究表明:主題偏好與偏好漂移能有效顯示與甄別企業(yè)在CSR信息披露內(nèi)容上的傾向性及其隨時(shí)間的變化特征;全樣本分析顯示我國(guó)證券市場(chǎng)CSR信息披露中“厚此薄彼”的情況客觀存在,披露傾向性在總體上呈現(xiàn)6種不同類型,偏好漂移呈現(xiàn)正態(tài)分布;不同行業(yè)、年份與產(chǎn)權(quán)性質(zhì)上市公司的主題偏好與偏好漂移存在顯著性差異,行業(yè)異質(zhì)性、外部政策的沖擊等可能是差異形成的主要原因之一。
關(guān)鍵詞:企業(yè)社會(huì)責(zé)任;信息披露質(zhì)量;傾向性;主題偏好;偏好漂移
一、引言
企業(yè)社會(huì)責(zé)任(Corporate Social Responsibility)信息披露在提升證券市場(chǎng)信息的完備性方面扮演著重要角色(Dhaliwal等, 2012),也有助于上市公司保持良好聲譽(yù)(齊麗云等,2017)、降低融資成本(Dhaliwal等, 2011)、獲得競(jìng)爭(zhēng)優(yōu)勢(shì)(Barney等, 2011)以及投資者信任(馮麗艷等,2016)等。據(jù)2018年《中國(guó)企業(yè)社會(huì)責(zé)任報(bào)告白皮書》統(tǒng)計(jì),中國(guó)上市公司披露的CSR報(bào)告數(shù)量逐年遞增,但數(shù)量快速增加的同時(shí),CSR信息披露質(zhì)量卻不盡如人意,表現(xiàn)出報(bào)喜不報(bào)憂、議題內(nèi)容流于形式等問(wèn)題(田利輝和王可第,2017;Marquis和 Qian, 2014)。在這一背景下,2020年7月,證監(jiān)會(huì)公開征求意見(jiàn)的《上市公司信息披露管理辦法(修訂稿)》中新增列了自愿披露的相關(guān)條文,進(jìn)一步加強(qiáng)了對(duì)“選擇性披露”的防范,要求上市公司遵循完整與公平披露原則,保持披露信息的連續(xù)性和一致性,不用作實(shí)施誤導(dǎo)投資者的手段。這一政策的變化,對(duì)于信息披露的質(zhì)量評(píng)估與監(jiān)管提出了新的要求。
CSR作為一項(xiàng)復(fù)雜的社會(huì)實(shí)踐,其內(nèi)涵與邊界涉及范疇廣泛,并處于不斷擴(kuò)充與調(diào)整的過(guò)程中(肖紅軍和李平,2019;Aguinis和Glavas, 2012; Ansari等, 2010),組織對(duì)于CSR的理解不僅存在個(gè)體間的差異也會(huì)存在隨時(shí)間的改變而變化(Carroll, 1994)。相對(duì)于內(nèi)部控制信息,CSR信息有著更大的概念空間與多樣性理解,也為上市公司選擇性披露策略的實(shí)施提供了空間。一方面從披露動(dòng)機(jī)而言,無(wú)論是出于向資本市場(chǎng)發(fā)送私人信息以顯示其自身獨(dú)特性(沈洪濤等,2014;宋獻(xiàn)中等,2017),還是為了有意誤導(dǎo)利益相關(guān)者(黃萍萍和李四海,2020),披露方都會(huì)對(duì)CSR行為描述進(jìn)行篩選、整合與側(cè)重,從而在披露自述中表現(xiàn)出某種“厚此薄彼”的傾向性;另一方面,隨著標(biāo)準(zhǔn)指南的細(xì)化與審驗(yàn)制度的普及,CSR信息披露中的靈活性與不確定性逐步下降,出于緩解合法性壓力和節(jié)約成本的考慮(Durand等, 2019),披露方往往盡量匹配相關(guān)規(guī)則要求,或者至少在議題框架與其保持一致,“樣板化”的披露變得越來(lái)越普遍(趙子夜等,2019)。面對(duì)越來(lái)越多“形似而神不似”的CSR披露樣本,發(fā)現(xiàn)“厚此薄彼”的傾向性特征也愈發(fā)困難。
對(duì)于資本市場(chǎng)而言,CSR信息披露中存在的這種傾向性特征,客觀上會(huì)起到“信號(hào)發(fā)送”的作用(李四海和李震,2023),但其形成卻并非基于“給投資者一個(gè)真實(shí)的上市公司”導(dǎo)向。在缺乏有效“信息甄別”的情況下(李正等,2013),不僅會(huì)增加投資者形成錯(cuò)誤預(yù)期的風(fēng)險(xiǎn),也會(huì)增加市場(chǎng)逆向選擇發(fā)生的可能。因而,防范選擇性披露的關(guān)鍵,不是去消除“厚此薄彼”的情況,而是要能夠向市場(chǎng)提供一個(gè)有效的“信息甄別”工具,實(shí)現(xiàn)對(duì)CSR信息披露傾向性的準(zhǔn)確測(cè)度與量化,在具備全樣本可比性的基礎(chǔ)上,幫助投資者明辨披露方發(fā)送信號(hào)的特征,降低市場(chǎng)信息的不對(duì)稱性(Aguilera等, 2007; Deephouse, 1999; Durand和Kremp, 2016; White, 2010)。這對(duì)于在實(shí)踐中提升資本市場(chǎng)信息披露的質(zhì)量,以及在研究中的理論發(fā)現(xiàn),均具有重要意義。
近年來(lái),文本分析方法在CSR信息披露研究中的應(yīng)用逐步深入(段釗等,2017, 2021, 2022;張秀敏等,2019),但現(xiàn)有的對(duì)CSR信息披露傾向性的分析并不多見(jiàn),相關(guān)研究主要根據(jù)所披露的CSR報(bào)告目錄或?qū)嵤╉?xiàng)目與標(biāo)準(zhǔn)指南的契合度,以及同行業(yè)企業(yè)之間相互比對(duì)來(lái)實(shí)現(xiàn)(Zhang等, 2020),還存在一些尚待解決的問(wèn)題:第一,強(qiáng)制披露與報(bào)告樣板化的趨勢(shì)下,上市公司會(huì)盡力做到在形式上對(duì)員工、環(huán)境、股東與社區(qū)等CSR核心議題的全覆蓋,并采用印象管理的方式加以強(qiáng)化(黃藝翔和姚錚,2016;Diouf和Boiral, 2017; García-Sánchez等, 2019; Talbot和Boiral, 2018),現(xiàn)有方法在顯示樣本間的差異上會(huì)越來(lái)越困難;第二,在一個(gè)“命題作文”框架下,發(fā)送內(nèi)部信息并顯示其獨(dú)特性,往往表現(xiàn)在描述內(nèi)容側(cè)重與篇幅的設(shè)置,甚至是語(yǔ)義層面,而“有或無(wú)”方式的變量設(shè)計(jì),往往難以實(shí)現(xiàn)有效測(cè)度;第三,中國(guó)股票市場(chǎng)換手率很高,上市公司信號(hào)傳遞的出發(fā)點(diǎn)不完全出于行業(yè)競(jìng)爭(zhēng)的考慮,加之實(shí)施多元化戰(zhàn)略與經(jīng)營(yíng)領(lǐng)域調(diào)整,通過(guò)同行業(yè)企業(yè)比較來(lái)衡量個(gè)體傾向性,也存在一些問(wèn)題。
針對(duì)CSR信息披露實(shí)踐中出現(xiàn)的新的變化與現(xiàn)有研究可能存在的問(wèn)題,本文首先在理論分析的基礎(chǔ)上,提出了用以描述CSR信息披露傾向性與動(dòng)態(tài)變化的兩個(gè)概念:“主題偏好”與“偏好漂移”;其次,通過(guò)對(duì)現(xiàn)有LDA模型方法的改進(jìn),設(shè)計(jì)并驗(yàn)證了一個(gè)基于報(bào)告文本語(yǔ)義的測(cè)度與數(shù)據(jù)量化方法;最后,基于2008-2017年全樣本,對(duì)我國(guó)A股上市公司發(fā)布的CSR報(bào)告“主題偏好”與“偏好漂移”的整體態(tài)勢(shì)、變化趨勢(shì)、行業(yè)及不同產(chǎn)權(quán)性質(zhì)特征進(jìn)行了分析與討論。相較于以往研究,本文可能的貢獻(xiàn)在于:第一,在現(xiàn)有CSR報(bào)告形式模板化與內(nèi)容個(gè)性化的背景與趨勢(shì)下,基于文本語(yǔ)義層面提出的 “主題偏好”與“偏好漂移”這兩個(gè)概念能更好地描述組織CSR信息披露中的傾向性與變化特征;第二,本文所提出的傾向性測(cè)度方法,對(duì)于特定文本的主題分析與文本數(shù)據(jù)結(jié)構(gòu)化具有一定的借鑒意義;第三,本文為后續(xù)相關(guān)理論提出與檢驗(yàn)提供新的變量設(shè)計(jì)與實(shí)證數(shù)據(jù),也為市場(chǎng)監(jiān)管與證券分析提供了新的工具;第四,以往對(duì)于上市公司CSR信息選擇性披露的總體與差異性特征,往往基于定性與主觀判斷,本文全樣本數(shù)據(jù)分析的結(jié)果具有驗(yàn)證與完善的作用。
二、CSR信息披露中的主題偏好和偏好漂移
隨著可持續(xù)發(fā)展理念深入人心,近年來(lái)全球范圍內(nèi)主要證券市場(chǎng)對(duì)CSR信息披露的政策與標(biāo)準(zhǔn)一直處于強(qiáng)化的進(jìn)程中,據(jù)《畢馬威2017年度企業(yè)社會(huì)責(zé)任報(bào)告調(diào)查》,法國(guó)、英國(guó)、美國(guó)等經(jīng)濟(jì)體均已出臺(tái)強(qiáng)制性披露法規(guī),CSR報(bào)告披露率均達(dá)到90%以上,第三方審計(jì)也正在普及。我國(guó)從2006年起,深交所、上交所、中國(guó)社科院、國(guó)際標(biāo)準(zhǔn)化組織、全球報(bào)告倡議組織等監(jiān)管部門和證券市場(chǎng)也發(fā)布了一系列的政策與標(biāo)準(zhǔn),倡導(dǎo)企業(yè)及時(shí)規(guī)范完整地披露CSR信息,在2018年修訂的《上市公司治理準(zhǔn)則》中已明確要求上市公司應(yīng)按照法規(guī)與部門要求披露環(huán)境、社會(huì)與公司治理(ESG)情況??梢钥吹剑珻SR信息披露在政策設(shè)計(jì)上正逐步接近會(huì)計(jì)信息披露的規(guī)則,合規(guī)性要求的擴(kuò)展與深化加之CSR理念已被納入公眾認(rèn)知與社會(huì)規(guī)范,上市公司面對(duì)的CSR信息披露風(fēng)險(xiǎn)進(jìn)一步增強(qiáng)。
在這一背景下,披露方普遍會(huì)按照標(biāo)準(zhǔn)指引中的框架來(lái)編制CSR報(bào)告,這樣既可以滿足合規(guī)性的要求,又能減少“言多必失”的風(fēng)險(xiǎn)(趙子夜等,2019)。此外,一些政策和第三方審計(jì)從完整性出發(fā)強(qiáng)制要求部分CSR信息的披露,這也提供了一種外部激勵(lì)機(jī)制,如《關(guān)于加強(qiáng)上市公司社會(huì)責(zé)任承擔(dān)工作暨發(fā)布〈上海證券交易所上市公司環(huán)境信息披露指引〉的通知》要求CSR披露中必須包括“促進(jìn)環(huán)境及生態(tài)可持續(xù)發(fā)展方面的工作”。如果企業(yè)沒(méi)有發(fā)生與環(huán)境生態(tài)議題密切相關(guān)的實(shí)質(zhì)性活動(dòng),又沒(méi)有跨行業(yè)且普遍適用的編寫規(guī)范,為降低不確定性和搜尋成本以及出于不同的短期目的,同行業(yè)領(lǐng)先者、市場(chǎng)交易活躍、股價(jià)上漲或者市場(chǎng)評(píng)價(jià)好的企業(yè)均可能會(huì)成為其模仿的對(duì)象,進(jìn)一步造成披露框架的趨同。
CSR信息披露是企業(yè)與利益相關(guān)方的重要溝通方式(Dhaliwal等, 2011),向資本市場(chǎng)提供了重要的信號(hào)傳遞與信息甄別機(jī)制。雖然樣板化的披露形式能夠緩解企業(yè)所面臨的合法性壓力,但也會(huì)削弱企業(yè)向市場(chǎng)傳遞自身獨(dú)特性的功能。因而,如果存在兼顧或平衡兩者的考慮,在給定的框架下,披露方只有操縱CSR行為的具體描述去實(shí)施信號(hào)傳遞。而CSR本身是一個(gè)交錯(cuò)復(fù)雜的范疇,其行為與績(jī)效信息的直接可比性差,加上語(yǔ)言文字存在模糊性和可操縱性強(qiáng)的特點(diǎn),也會(huì)強(qiáng)化這一策略的實(shí)施動(dòng)機(jī)。在這種情況下,即使對(duì)于具備專業(yè)知識(shí)的利益相關(guān)者而言,“回音室”與“信息繭房”效應(yīng)的甄別與防范也會(huì)愈加困難(Muslu等, 2019),進(jìn)而無(wú)意識(shí)地強(qiáng)化了證券市場(chǎng)上的選擇性理解與“群體極化”。解決這一問(wèn)題的辦法之一,就是在客觀與標(biāo)準(zhǔn)一致的情況下,通過(guò)大范圍與橫縱向比對(duì),把披露方傾向性特征描述出來(lái),增強(qiáng)市場(chǎng)理性。
目前我國(guó)上市公司在CSR披露實(shí)施中遵循主要標(biāo)準(zhǔn)指引,雖然都明確了企業(yè)社會(huì)責(zé)任行為的范圍與披露框架,但沒(méi)有規(guī)定特定議題下的披露方式或優(yōu)先事項(xiàng),在文本形式上為披露者提供了較大的空間(孫蔓莉,2004;周建等,2021;Marquis和Qian, 2014)。我們基于樣本的扎根研究發(fā)現(xiàn),常見(jiàn)的情況包括:第一,由于各標(biāo)準(zhǔn)在核心議題區(qū)別不大,而在核心議題下的主題設(shè)置及描述要求存在一定的差異,披露方可以根據(jù)需要參照最“合適”的標(biāo)準(zhǔn)來(lái)編制文本;第二,在CSR行為與結(jié)果的描述中,披露方可以通過(guò)調(diào)整議題分布來(lái)強(qiáng)化其想要傳遞的信息,簡(jiǎn)單來(lái)講,該說(shuō)的都要說(shuō),但想說(shuō)的會(huì)多說(shuō),例如有證據(jù)顯示企業(yè)所在行業(yè)要面對(duì)環(huán)境污染、法律訴訟等困境時(shí), 會(huì)側(cè)重環(huán)境議題(Patten, 1991; Gray等, 1995);第三,披露方可以在子議題設(shè)置上進(jìn)行選擇,例如采掘行業(yè)會(huì)通常在環(huán)境議題下側(cè)重公眾健康、安全防護(hù)及商業(yè)道德等方面的內(nèi)容(Jenkins和Yakovleva, 2006);第四,由于一項(xiàng)具體社會(huì)實(shí)踐,可能涉及多個(gè)CSR議題,披露者可以在描述上進(jìn)行側(cè)重,將其納入某一目標(biāo)議題,例如對(duì)于救助貧困員工,既可以看作員工福利,也可以作為慈善,如何描述取決于披露者想強(qiáng)調(diào)哪一方面;第五,披露方還可以對(duì)不同主題采用印象管理的方式來(lái)進(jìn)行強(qiáng)化或弱化,例如采用獨(dú)特的構(gòu)詞方式,調(diào)整句子長(zhǎng)短和陳述方式等??傮w而言,披露方上述一系列可能的操作,其根本目的是在降低的披露風(fēng)險(xiǎn)與成本的情況下,增強(qiáng)信號(hào)傳遞效果。我們將在這一機(jī)制作用下,最終表現(xiàn)在CSR披露文本中的語(yǔ)義特征定義為“主題偏好”,其含義為上市公司對(duì)CSR披露內(nèi)容所做出的傾向性選擇,即披露方想在哪些方面?zhèn)鬟f更多的信息。
此外,我們觀察到很多企業(yè)CSR信息披露中的“主題偏好”并不是一成不變的,通常會(huì)隨內(nèi)外環(huán)境與組織動(dòng)機(jī)的變化而進(jìn)行調(diào)整。例如:2012年光明乳業(yè)股份有限公司的CSR信息披露中,針對(duì)牛奶酸敗事件,大大強(qiáng)化了其消費(fèi)者責(zé)任議題,相比于上一年所披露內(nèi)容增加了一倍;而在1999-2003年我國(guó)石化塑行業(yè)上市公司年報(bào)中,與CSR有關(guān)的公平交易的內(nèi)容在《上市公司治理準(zhǔn)則》出臺(tái)后逐年增加(沈洪濤和金婷婷,2006)。根據(jù)實(shí)踐中出現(xiàn)這些情況,我們將主題偏好的調(diào)整定義歸納為“偏好漂移”,用以描述披露內(nèi)容傾向性的動(dòng)態(tài)調(diào)整?!捌啤痹从凇案拍钇啤?,它是指要研究的目標(biāo)變量的統(tǒng)計(jì)特性隨著時(shí)間的推移以不可預(yù)見(jiàn)的方式變化的現(xiàn)象(Widmer和Kubat, 1996)。與之相似,將相鄰兩期CSR披露信息“主題偏好”計(jì)量并進(jìn)行比較,兩者在方向與程度上的差異也就是“偏好漂移”?,F(xiàn)有一系列理論研究已表明,組織行為與績(jī)效,以及影響利益相關(guān)者的決策動(dòng)機(jī),一定程度上會(huì)在對(duì)外信息披露的文本特征上有所體現(xiàn)(呂源和彭長(zhǎng)桂,2012;Loughran和Mcdonald, 2016)。當(dāng)前制度與實(shí)踐背景下,“主題偏好”與“偏好漂移”對(duì)于理解我國(guó)上市公司的披露動(dòng)機(jī)以及揭示披露行為影響機(jī)制具有重要的意義。
三、主題偏好與偏好漂移的測(cè)度
為減少主觀性且基于一致性的標(biāo)準(zhǔn),我們采用了自然語(yǔ)言處理中的主題模型來(lái)對(duì)主題偏好與偏好漂移進(jìn)行測(cè)度。主題模型是以非監(jiān)督學(xué)習(xí)的方式對(duì)文本隱含語(yǔ)義結(jié)構(gòu)進(jìn)行聚類的統(tǒng)計(jì)模型,通過(guò)詞頻統(tǒng)計(jì)矩陣來(lái)推斷文檔中“主題—詞語(yǔ)”與“文檔—主題”的概率,進(jìn)而發(fā)現(xiàn)文本想要傳遞的實(shí)質(zhì)性內(nèi)容(Blei等, 2003)。而從CSR報(bào)告的具體編制過(guò)程來(lái)看:首先,披露方會(huì)根據(jù)某一特定標(biāo)準(zhǔn)指引所提供的內(nèi)容框架,按照一定的概率選擇傳遞獨(dú)特性的核心議題;其次,將這些議題與實(shí)踐中的自身感受、具體行為與結(jié)果聯(lián)系起來(lái),以一定的概率去選擇某些詞語(yǔ)來(lái)展開描述;最終重復(fù)上述遣詞造句過(guò)程,形成披露文本。將上述兩個(gè)過(guò)程對(duì)比來(lái)看,主題建模實(shí)質(zhì)上是CSR報(bào)告編制在抽象層面上的一個(gè)逆過(guò)程。因而,通過(guò)主題模型可以有針對(duì)性地實(shí)現(xiàn)對(duì)CSR報(bào)告文本的數(shù)據(jù)結(jié)構(gòu)化,自動(dòng)分析所得到的主題占比,通過(guò)數(shù)據(jù)擬合與橫縱向比對(duì),即可實(shí)現(xiàn)對(duì)主題偏好和偏好漂移的有效測(cè)度。
(一)主題模型
本文選擇LDA(Latent Dirichlet Allocation)模型對(duì)CSR報(bào)告樣本進(jìn)行處理,對(duì)于HDP等無(wú)需定義主題數(shù)的無(wú)監(jiān)督、有層次的主題模型,或者Labeled LDA等有監(jiān)督的模型而言,LDA模型將文檔看作是潛在主題隨機(jī)混合的一種表現(xiàn),而每個(gè)主題都可以用某些詞語(yǔ)的分布來(lái)表征該主題,這是其最大的優(yōu)點(diǎn)之一(李志欣等,2011)。同時(shí),選擇LDA模型也更符合本文的研究目的,因?yàn)镃SR數(shù)據(jù)結(jié)構(gòu)化程度與可比性較低,利益相關(guān)者對(duì)披露方行為與績(jī)效的判斷,往往是基于對(duì)文本閱讀總體感受而做出的;而且由于實(shí)踐中披露方所選擇依照的標(biāo)準(zhǔn)指引存在差異,子議題表述和設(shè)置上的不同,以及對(duì)多屬性CSR行為描述選擇等問(wèn)題,有監(jiān)督模型不太適用本文的研究;另外,我們前期隨機(jī)抽取了100篇CSR報(bào)告應(yīng)用HDP等模型進(jìn)行主題抽取,結(jié)果發(fā)現(xiàn)自動(dòng)抽取的主題數(shù)過(guò)多,擬合度低,經(jīng)比對(duì)發(fā)現(xiàn)造成這種結(jié)果的原因與文本內(nèi)容形式有關(guān),所以無(wú)監(jiān)督、有層次的模型也并不適用。
LDA模型運(yùn)用中,確定的最佳主題數(shù)目是一個(gè)重要的問(wèn)題(曲佳彬和歐石燕,2018)。主題設(shè)置過(guò)多,主題間含義越難以區(qū)分;而設(shè)置過(guò)少則難以發(fā)現(xiàn)偏好特征。常用的計(jì)算復(fù)雜度(Perplexity)的方法雖可以表明LDA模型本身的泛化能力,但與抽取結(jié)果好壞沒(méi)有直接關(guān)系,并且以該指標(biāo)判定主題數(shù)目也缺乏邏輯嚴(yán)謹(jǐn)性(Ramage等, 2010),據(jù)此本文使用了人工評(píng)測(cè)方法來(lái)確定最終主題數(shù)(阮光冊(cè),2014)。由于主題偏好考察的是披露方想在哪些方面向利益相關(guān)者傳遞更多的信息,從傾向性范疇和信號(hào)發(fā)送對(duì)象來(lái)確定主題數(shù)是一個(gè)相對(duì)合理的選擇。在相關(guān)研究的基礎(chǔ)上(聶卉,2017;Cao等, 2009; Zhao等, 2015),結(jié)合樣本的扎根,我們將CSR信息披露中涉及的傾向性范疇定義為6個(gè)方面:公司概況、投資者(債權(quán)人)權(quán)益、員工權(quán)益、供應(yīng)鏈權(quán)益、環(huán)境保護(hù)、社區(qū)與公眾權(quán)益?;诖?,最終 LDA主題建模數(shù)目確定為7個(gè)。
隨后本文隨機(jī)抽取50篇CSR報(bào)告,分別對(duì)單個(gè)樣本進(jìn)行了預(yù)實(shí)驗(yàn),80%以上返回的結(jié)果不理想,主要表現(xiàn)為主題聚焦性太差,即跟某一主題高度相關(guān)的特征詞出現(xiàn)在其他主題之中,導(dǎo)致了這一主題無(wú)法識(shí)別其主要描述內(nèi)容,并且單個(gè)樣本每一次抽取結(jié)果差異較大。其主要原因是在主題數(shù)目一定的情況下,LDA主題模型更適用于對(duì)大型語(yǔ)料庫(kù)做模型訓(xùn)練,對(duì)單篇文本直接抽取時(shí),會(huì)由于文本量較少而存在特征向量空間稀疏性過(guò)高的問(wèn)題,對(duì)此相關(guān)研究也表明LDA一些情況下的提取效果并不理想(魏強(qiáng)等,2014;Lu和Zhai, 2008)。針對(duì)該缺陷,有研究提出通過(guò)樣本訓(xùn)練得到的LDA主題模型,可用于對(duì)新的樣本在其基礎(chǔ)上進(jìn)行推斷,推斷過(guò)程保持“主題—特征詞”概率分布矩陣不變,而只估計(jì)“文檔—主題”概率分布(徐戈和王厚峰,2011)。這一技術(shù)路線與本文目標(biāo)相符,據(jù)此分別按照每次增加100個(gè)樣本用于訓(xùn)練LDA主題判斷模型,根據(jù)返回的結(jié)果,顯示當(dāng)樣本量為400時(shí)(小于CSR全樣本的10%),效果最好,最終確定訓(xùn)練判斷模型的樣本數(shù)量。
(二)抽樣方法與標(biāo)準(zhǔn)樣本庫(kù)
主題判斷模型的主要功能在于,對(duì)全樣本進(jìn)行分析時(shí),能事先給定一個(gè)“坐標(biāo)系”。雖然全樣本每一個(gè)輸出結(jié)果都是計(jì)量相對(duì)于判斷模型的偏移程度,對(duì)數(shù)據(jù)結(jié)構(gòu)化并不產(chǎn)生實(shí)質(zhì)性影響;但為了分析結(jié)果更接近真實(shí)情況,就需要盡可能地把各類主題偏好特征的訓(xùn)練樣本抽取出來(lái),并進(jìn)行相對(duì)準(zhǔn)確的主題命名?;谶@一考慮,本文采用了分層抽樣的方法,樣本年份行業(yè)分布如表1所示:
(三)數(shù)據(jù)預(yù)處理與LDA模型結(jié)果分析
對(duì)于訓(xùn)練樣本,我們進(jìn)行了文本數(shù)據(jù)的預(yù)處理:(1)清除亂碼、空格、數(shù)字、換行符、制表符等噪聲,只保留干凈的文本信息。(2)每個(gè)完整的句子(以句號(hào)為界)組成一行。(3)基于CSR報(bào)告的語(yǔ)言特色添加了包括“本集團(tuán)”、“現(xiàn)金紅利”、“每股收益”、“十九大”等共計(jì)104個(gè)詞語(yǔ)到自定義分詞詞典。(4)將“截止”、“首屆”、“支行”、“萬(wàn)元”、“年底”等共計(jì)233個(gè)詞列入停用詞表。分詞結(jié)果顯示,準(zhǔn)確率達(dá)到了96%以上;接著在數(shù)據(jù)清洗與分詞優(yōu)化的基礎(chǔ)上,采用Python語(yǔ)言編制了相應(yīng)的程序,對(duì)訓(xùn)練樣本進(jìn)行了多次主題抽取,在對(duì)輸出結(jié)果相互比較的基礎(chǔ)上,最終選擇確定了判斷模型,結(jié)果如表2所示。
需要進(jìn)一步說(shuō)明的是,采用不同的訓(xùn)練樣本,輸出的判斷模型一定會(huì)存在差異;同時(shí),應(yīng)用LDA模型對(duì)同一樣本進(jìn)行主題抽取時(shí),每次輸出結(jié)果也可能不同,這是LDA主題分析方法本身所決定的。為解決這一問(wèn)題,本文所提出的技術(shù)路線,判斷模型的實(shí)質(zhì)功能在于確定一個(gè) “坐標(biāo)系”,通過(guò)樣本間“坐標(biāo)”差異顯示其主題偏好和偏好漂移。從理論上來(lái)講,每一次輸出結(jié)果都可以作為“坐標(biāo)系”,只要所有樣本按照一致性方式處理,即在一個(gè)固定的“主題—特征詞”概率分布矩陣下進(jìn)行“文檔—主題”概率推斷,不會(huì)對(duì)數(shù)據(jù)結(jié)構(gòu)化的結(jié)果造成干擾。為更好地顯示主題偏好的實(shí)質(zhì)性內(nèi)容,我們結(jié)合了主要CSR信息披露標(biāo)準(zhǔn)指引,通過(guò)主題命名的方式對(duì)于輸出的結(jié)果進(jìn)行了檢驗(yàn)與比較,主題命名及判定依據(jù)如表3所示。
(四)主題偏好和偏好漂移數(shù)值化與驗(yàn)證
根據(jù)訓(xùn)練樣本得到LDA主題判斷模型后,即可以按不同文本粒度對(duì)主題分布進(jìn)行概率預(yù)測(cè),并得到“文檔—主題”概率分布,該概率分布代表新樣本在LDA模型中每個(gè)主題下的內(nèi)容占比。通過(guò)編寫的Python程序,我們首先根據(jù)全樣本以行業(yè)為粒度進(jìn)行了測(cè)試,得到行業(yè)主題偏好雷達(dá)圖如圖1所示。
由圖1可知,不同行業(yè)公司的主題偏好存在明顯差異。進(jìn)一步觀察,6個(gè)主題下的數(shù)據(jù)可構(gòu)成一個(gè)規(guī)則的6邊形,可以雷達(dá)圖的中心為坐標(biāo)原點(diǎn)(0,0)建立直角坐標(biāo)系。為了更好地描述這種主題披露傾向性的不同,本文采取較為通用的加權(quán)平均的方式將這6個(gè)主題披露的差異歸一化處理,以該六邊形的重心所在坐標(biāo)來(lái)代表公司社會(huì)責(zé)任信息披露的主題偏好,并以重心到原點(diǎn)的距離表示披露的偏好程度。
為了考察偏好漂移的情況,我們對(duì)同一公司近五年的CSR報(bào)告主題偏好進(jìn)行了分析,結(jié)果如圖2所示。從圖中我們可以看出,隨著時(shí)間的推移,該公司企業(yè)社會(huì)責(zé)任信息披露主題偏好發(fā)生了調(diào)整,主要表現(xiàn)為逐步增加了公司概況與社區(qū)公益方面信息的披露,逐步減少了股東與債權(quán)人方面信息的披露。為了更好地反映漂移的方向與程度,本文以這幾個(gè)6邊形重心之間的“歐幾里得距離”來(lái)計(jì)量不同年份之間企業(yè)社會(huì)責(zé)任信息披露中的偏好漂移情況。
上市公司如何保護(hù)員工權(quán)益是CSR信息披露中的重要內(nèi)容之一,為進(jìn)一步體現(xiàn)主題偏好及偏好漂移測(cè)度方法的有效性,本文結(jié)合上市公司勞動(dòng)力的有關(guān)研究進(jìn)行驗(yàn)證(鄧悅等,2019):參照經(jīng)由第三方機(jī)構(gòu)鑒定為優(yōu)的CSR報(bào)告,人工編寫了包括員工工作環(huán)境、員工培訓(xùn)與教育、員工職業(yè)晉升、員工薪資、員工活動(dòng)、員工關(guān)愛(ài)與福利6個(gè)方面的語(yǔ)料;隨機(jī)抽取一篇CSR報(bào)告樣本,添加不超過(guò)原始總字?jǐn)?shù)20%的語(yǔ)料進(jìn)行處理,并將原始CSR報(bào)告的主題概率分布數(shù)據(jù)與該數(shù)據(jù)繪制成雷達(dá)圖,結(jié)果如圖3所示。由圖中可以看出,職工人權(quán)主題部分明顯相對(duì)于處理前得到的數(shù)據(jù)圖形有所突出,且六邊形的重心坐標(biāo)位置也相應(yīng)改變,即CSR信息披露的傾向性發(fā)生了調(diào)整,表明本文提出的方法能精確顯示主題偏好特征差異。
在此基礎(chǔ)上,繼續(xù)驗(yàn)證偏好漂移測(cè)量方法的有效性。由于此處的實(shí)驗(yàn)屬于破壞性實(shí)驗(yàn)(人工改寫、添加、調(diào)整文本),并且添加人工編寫的語(yǔ)料成本較高,在這樣的情況下,特殊檢查水平更加適用,據(jù)此,我們根據(jù)GB2828.1-2003標(biāo)準(zhǔn)中特殊檢查水平AQL的S-3標(biāo)準(zhǔn),選擇以20份作為最終實(shí)驗(yàn)樣本。具體步驟如下:首先隨機(jī)抽取的20篇CSR報(bào)告樣本;然后,保持其他主題披露內(nèi)容不變,去除報(bào)告中的職工人權(quán)主題下的所有內(nèi)容,向這20份CSR報(bào)告中隨機(jī)添加上述已人工編寫好的職工人權(quán)主題下屬的6個(gè)方面的語(yǔ)料,并按添加語(yǔ)料的數(shù)量級(jí)分別定義為 1分到6分;最后,計(jì)算偏好漂移得分,并與添加語(yǔ)料數(shù)量級(jí)的進(jìn)行相關(guān)性分析,結(jié)果顯示R2=0.91967,表明本文所提出的偏好漂移測(cè)度的方法能精確測(cè)度主題偏好改變的方向與程度。
四、數(shù)據(jù)分析與結(jié)果討論
本文選取巨潮資訊網(wǎng)公布的中國(guó)上市公司A股2008—2017年度企業(yè)社會(huì)責(zé)任報(bào)告共計(jì)5625篇。所用的財(cái)務(wù)指標(biāo)和公司治理數(shù)據(jù)主要來(lái)源于CSMAR數(shù)據(jù)庫(kù),根據(jù)2016年第4季度中國(guó)證監(jiān)會(huì)制定的《中國(guó)上市公司行業(yè)分類指引》,進(jìn)一步剔除了部分英文版、修訂公告及樣本量過(guò)少的行業(yè),最終得到2008-2017年12個(gè)行業(yè)的5250個(gè)有效樣本。
(一)主題偏好分析
(1)全樣本的主題偏好程度與聚類分析
本研究首先對(duì)整體樣本的偏好程度進(jìn)行了統(tǒng)計(jì)分析,如圖4所示。從圖中可以看到我國(guó)CSR信息披露存在“厚此薄彼”的現(xiàn)象,其中偏好程度高于0.4的樣本占6.5%,高于0.3的樣本占16.8%,高于0.2的占40.4%,高于0.1的占76.0%。
為了進(jìn)一步觀察企業(yè)具體的傾向情況,本研究對(duì)5250個(gè)樣本的主題偏好重心進(jìn)行了k-means聚類,共得到6個(gè)類型,結(jié)果如圖5所示,黑色的點(diǎn)代表聚類中心,聚類中心越靠近原點(diǎn),表明該類型主題分布越均衡。每一類別樣本數(shù)量與主題偏好的命名如表4所示。
從全樣本主題偏好的聚類結(jié)果可以看到,有4個(gè)類別的聚類中心靠近原點(diǎn),樣本占比達(dá)81%,表明總體上我國(guó)上市公司CSR主題偏好的極性并不明顯;同時(shí)6個(gè)聚類中心坐標(biāo)位置所處的區(qū)域不同,表明主題偏好上的差異客觀存在,很好地顯示了上市公司CSR信息披露中的傾向性特征。這不僅能為證券市場(chǎng)信息披露質(zhì)量評(píng)估與監(jiān)管提供重要的參考;同時(shí)也為判斷上市公司是否通過(guò)CSR信息披露來(lái)尋求緩解合法性壓力與發(fā)送獨(dú)特性的平衡,提供了經(jīng)驗(yàn)證據(jù)。
(2)主題偏好的行業(yè)類別分布
樣本在不同行業(yè)的類別分布結(jié)果如表5所示。為更好地顯示行業(yè)以及類別分布特征,我們將樣本主題偏好所占比最多的兩類進(jìn)行加總,得到行業(yè)CSR信息披露主題偏好集中度指數(shù)CR2,并計(jì)算行業(yè)與類別分布變異系數(shù)值(CV)。從數(shù)據(jù)離散化情況可以看出,主題偏好存在較明顯的行業(yè)特征,進(jìn)一步觀察行業(yè)傾向主題內(nèi)容,也與行業(yè)的經(jīng)營(yíng)與結(jié)構(gòu)特征基本吻合:如批發(fā)零售業(yè)傾向選擇披露社會(huì)公益、客戶與消費(fèi)者方面的信息,采礦業(yè)與電力、熱力、燃?xì)饧八a(chǎn)和供應(yīng)業(yè)傾向員工與環(huán)保信息的披露;制造業(yè)與信息行業(yè)覆蓋面廣,業(yè)態(tài)形式多樣;建筑業(yè)與房地產(chǎn)行業(yè)自身經(jīng)營(yíng)中社會(huì)責(zé)任涉及面廣,因而信息披露主題偏好分布也相對(duì)均勻。同時(shí),金融業(yè)、文化體育與娛樂(lè)業(yè)行業(yè)的一致性程度較高,在主題類型5與類型3上各行業(yè)間的披露傾向性差異相對(duì)較小。
由于行業(yè)主題偏好數(shù)據(jù)是離散型數(shù)據(jù),是依據(jù)不同主題樣本占比情況獲得,因而本文采用卡方分析來(lái)檢驗(yàn)不同行業(yè)性質(zhì)下的主題偏好的情況,結(jié)果如表6所示:不同行業(yè)上市公司在CSR信息披露中的主題偏好存在顯著差異。
(3)主題偏好的時(shí)間類別分布
樣本在不同年份的類別分布如表7所示。對(duì)比可見(jiàn),相對(duì)于行業(yè)特征,在時(shí)間序列上,主題偏好的年份差異性相對(duì)較小,去除2008年和2009年樣本后,這一特征更為明顯。一個(gè)可能的原因是CSR信息披露規(guī)則體系變化所造成的:在CSR信息披露初期,由于缺乏權(quán)威性的指引,上市公司往往根據(jù)自身理解與運(yùn)營(yíng)實(shí)踐來(lái)編寫報(bào)告;2010年國(guó)際標(biāo)準(zhǔn)化組織發(fā)布了ISO26000《社會(huì)責(zé)任指南》標(biāo)準(zhǔn)后,CSR信息披露形式與內(nèi)容有了相對(duì)完善的框架,披露方也逐步形成了相對(duì)穩(wěn)定的主題偏好。
(4)主題偏好的產(chǎn)權(quán)性質(zhì)類別分布
樣本在不同產(chǎn)權(quán)性質(zhì)上的類別分布如圖6所示。從左右呈大體對(duì)稱可以看出,國(guó)資背景企業(yè)與民營(yíng)企業(yè)樣本在類型分布上類似,差異并不十分顯著。無(wú)論是國(guó)資背景企業(yè)和民營(yíng)企業(yè)都傾向于披露社區(qū)、職工人權(quán)以及股東債權(quán)人方面的責(zé)任,造成這一現(xiàn)象的原因可能有兩點(diǎn):第一,國(guó)資委等部門從2008年起就已逐步推進(jìn)國(guó)企CSR信息披露工作,在先發(fā)效應(yīng)的作用下,國(guó)資背景企業(yè)披露模式往往成為民營(yíng)企業(yè)的參照模仿對(duì)象;第二,國(guó)資背景的企業(yè)在除受市場(chǎng)規(guī)則的約束外,也面臨更多的政治壓力、社會(huì)負(fù)擔(dān)及公眾關(guān)注,與公共政策目標(biāo)的匹配和結(jié)合是經(jīng)營(yíng)決策中的一個(gè)重要的考慮方面,并且國(guó)資背景企業(yè)的高管通常享有行政級(jí)別,出于政治晉升目的,往往也會(huì)平衡經(jīng)濟(jì)績(jī)效與社會(huì)績(jī)效間的關(guān)系(李四海等,2015;劉柏和盧家銳,2018),所以在CSR方面也具有一定的示范效應(yīng)。
(二) 偏好漂移分析
偏好漂移數(shù)據(jù)根據(jù)同一企業(yè)相鄰兩個(gè)年份主題偏好重心間的“歐幾里得距離”計(jì)算得到,因此得到數(shù)據(jù)量會(huì)小于總體樣本數(shù),共計(jì)4069個(gè)有效值。其數(shù)據(jù)分布情況如圖7所示;正態(tài)檢驗(yàn)P-P如圖8所示,形狀基本呈一條直線,由此可判定偏好漂移數(shù)據(jù)服從正態(tài)分布。
(1)行業(yè)間的偏好漂移差異
不同行業(yè)偏好漂移均值統(tǒng)計(jì)情況見(jiàn)表8,偏好漂移程度最高的是文化、體育娛樂(lè)業(yè),其值為0.12670,高于總體樣本均值(0.1001607)。偏好漂移程度最低的是建筑業(yè),其值僅為0.0865778。
由于偏好漂移的行業(yè)分組數(shù)據(jù)既服從正態(tài)分布,又是等方差的,因而本文采用方差分析來(lái)檢驗(yàn)不同行業(yè)性質(zhì)下的偏好漂移的情況,結(jié)果如表9所示,不同行業(yè)上市公司在CSR信息披露中的偏好漂移程度存在顯著差異。
(2)年份間的偏好漂移差異
CSR報(bào)告偏好漂移均值按年份統(tǒng)計(jì)情況如表10與圖9所示,由表10可知, 2009至2010年CSR報(bào)告偏好漂移均值最大,為0.1477038,高于總體樣本均值(0.1001607),2016至2017年CSR報(bào)告偏好漂移均值最小,其值為0.0842266,遠(yuǎn)低于總體樣本均值。
由圖9中以看出,CSR報(bào)告偏好漂移得分均值總體趨勢(shì)隨年份變化顯著,且在2009-2010年間發(fā)布的報(bào)告偏好漂移得分均值增長(zhǎng)迅速,在2010-2011年偏好漂移得分均值有所下降,接著在2012-2013年又迅速增長(zhǎng),2013年以后偏好漂移得分均值又逐漸下降。結(jié)合主題偏好年份類別分布的情況,可以進(jìn)一步明確一系列外部政策環(huán)境變化與這一現(xiàn)象存在密切關(guān)聯(lián):2009年1月上交所發(fā)布了關(guān)于上市公司企業(yè)社會(huì)責(zé)任報(bào)告工作的通知,提供了履行社會(huì)責(zé)任的報(bào)告格式,鼓勵(lì)上市公司積極披露社會(huì)責(zé)任報(bào)告;2010年11月,國(guó)際標(biāo)準(zhǔn)化組織發(fā)布了ISO26000《社會(huì)責(zé)任指南》標(biāo)準(zhǔn),這些規(guī)則相對(duì)集中的發(fā)布可能導(dǎo)致2008-2010年間披露主題策略的調(diào)整。與這種情況類似,對(duì)于2012-2014年間的變化,同樣也可以與全球報(bào)告倡議組織(GRI)發(fā)布《可持續(xù)發(fā)展報(bào)告指南》 G4標(biāo)準(zhǔn)相聯(lián)系。而2014年后偏好漂移均值持續(xù)下降,也表明模板化的報(bào)告逐步成為趨勢(shì),上市公司逐步明確了CSR信息披露中,如何平衡合法性與獨(dú)特性的實(shí)施策略。
由于偏好漂移的不同年份的分組數(shù)據(jù)既服從正態(tài)分布,又是等方差的,因而同樣采用方差分析檢驗(yàn)了不同年份間的偏好漂移的情況,結(jié)果如表11所示,不同年份間上市公司在CSR信息披露中的偏好漂移存在顯著差異。
(3)產(chǎn)權(quán)類型間的偏好漂移差異
CSR報(bào)告偏好漂移均值按企業(yè)產(chǎn)權(quán)性質(zhì)統(tǒng)計(jì)情況如表12所示,可以得知,國(guó)資背景企業(yè)偏好漂移得分均值為0.10744,高于總體樣本均值0.10016,而民營(yíng)企業(yè)偏好漂移得分均值為0.10013,低于總體樣本均值。說(shuō)明不同產(chǎn)權(quán)類型下偏好漂移得分均值也存在一定差異。
同樣,本文對(duì)不同產(chǎn)權(quán)性質(zhì)情況下的偏好漂移情況進(jìn)行了方差檢驗(yàn),結(jié)果如表13所示,不同產(chǎn)權(quán)特征企業(yè)在CSR信息披露中的偏好漂移存在顯著差異。
(三)偏好漂移的異常值分析
出于監(jiān)管與市場(chǎng)分析等實(shí)踐的需要,本文采取箱形圖的分析方式,來(lái)發(fā)現(xiàn)信息披露中偏好漂移的異常情況,結(jié)果如圖10所示。編號(hào)為1739、2259、2797的偏好漂移3個(gè)極值都出自“海亮股份”,經(jīng)過(guò)人工查閱,發(fā)現(xiàn)其在2014年度發(fā)布的是社會(huì)責(zé)任報(bào)告,而2015年度發(fā)布的則是環(huán)境報(bào)告,2016年則發(fā)布的又是社會(huì)責(zé)任報(bào)告,兩者內(nèi)容上有著很大的差異,因此其偏好漂移程度異常偏高。同樣,“雙鷺?biāo)帢I(yè)”在2015—2016年間的偏好漂移程度極低,通過(guò)人工比較,發(fā)現(xiàn)其所披露的主題內(nèi)容幾乎相同,除了部分關(guān)乎時(shí)間節(jié)點(diǎn)的內(nèi)容和數(shù)據(jù)有改動(dòng),報(bào)告的頁(yè)數(shù)字?jǐn)?shù)以及結(jié)構(gòu)框架一模一樣。這也表明,異常值分析在實(shí)踐中具有較高的應(yīng)用價(jià)值。
五、研究總結(jié)與展望
隨著資本市場(chǎng)環(huán)境的變化與披露規(guī)則體系的不斷強(qiáng)化,CSR信息披露已表現(xiàn)出一系列新的變化。上市公司很難再依賴于披露框架設(shè)定上的差異來(lái)達(dá)到信號(hào)傳遞或?qū)嵤┯∠蠊芾淼哪康模鴷?huì)更多地考慮通過(guò)主題設(shè)定、篇幅分布以及語(yǔ)義描述將自身與其他企業(yè)區(qū)分開來(lái)。簡(jiǎn)單來(lái)說(shuō),“厚此薄彼”在形式上不會(huì)表現(xiàn)得那么明顯,會(huì)由原來(lái)的“說(shuō)什么與不說(shuō)什么”轉(zhuǎn)變?yōu)椤岸嗾f(shuō)什么與說(shuō)好什么”。在這種新的趨勢(shì)下,信息披露質(zhì)量評(píng)估與監(jiān)管的方法與工具,以及觀察維度、研究變量設(shè)計(jì)以及數(shù)據(jù)上也需要進(jìn)行相應(yīng)的拓展與完善,尤其是需要有效描述CSR信息披露的內(nèi)容傾向性及其變動(dòng)去滿足實(shí)踐與理論研究的需要。
結(jié)合現(xiàn)有研究與信息披露的現(xiàn)狀,本文提出了主題偏好與偏好漂移兩個(gè)新的概念,為理解我國(guó)上市公司的披露動(dòng)機(jī)以及揭示披露行為影響機(jī)制提供重要的基礎(chǔ)。研究結(jié)果顯示:本文提出的主題偏好與偏好漂移概念及其變量測(cè)度方法能夠很好地顯示與甄別CSR信息披露的傾向性與動(dòng)態(tài)變化特征;基于2008-2017年全樣本數(shù)據(jù)分析表明,我國(guó)上市公司CSR信息披露中“厚此薄彼”的情況客觀存在,在主題偏好上總體呈現(xiàn)出6種不同的類型,主題漂移呈現(xiàn)正態(tài)分布;不同行業(yè)、不同年份與產(chǎn)權(quán)性質(zhì)企業(yè)的主題偏好與偏好漂移存在顯著性差異,行業(yè)異質(zhì)性、外部政策的沖擊等可能是差異形成的主要原因。本文拓寬了CSR披露文本分析的維度,為信息披露質(zhì)量評(píng)估與后續(xù)理論研究,提供了新的概念、新的變量測(cè)度方法與基礎(chǔ)性數(shù)據(jù),對(duì)于完善信息披露質(zhì)量評(píng)估與監(jiān)管具有重要價(jià)值。
根據(jù)上述研究結(jié)論,對(duì)于進(jìn)一步提高CSR信息披露質(zhì)量,形成三個(gè)方面的建議:第一,當(dāng)前規(guī)則體系下,CSR信息披露的操縱行為,往往表現(xiàn)為信息內(nèi)容的精巧組合與編碼方式的精心設(shè)計(jì),選擇性披露在取證、舉證、監(jiān)管與處罰上的困難將進(jìn)一步加大,提升信息披露質(zhì)量,要立足于披露信息的再加工,通過(guò)擴(kuò)大公共信息服務(wù)供給,建立與完善市場(chǎng)“信息甄別”機(jī)制,提高投資者理性程度;第二,監(jiān)管部門要關(guān)注與跟蹤上市公司CSR信息披露中傾向性變化的方向與程度,組織話語(yǔ)與組織實(shí)在存在雙向建構(gòu)的功能,組織話語(yǔ)的異常變化,通常伴隨著組織動(dòng)機(jī)、行為與績(jī)效的特定情況;第三,適時(shí)推進(jìn)整合披露與第三方審驗(yàn)制度,提高信息可驗(yàn)證的范圍與程度,進(jìn)一步發(fā)揮自愿披露信息的市場(chǎng)功能。
同時(shí),本文存在一些尚待完善的地方:首先,只針對(duì)中文的CSR報(bào)告進(jìn)行了分析,樣本也來(lái)源于我國(guó)上市A股公司的披露信息,如果能進(jìn)一步開展跨國(guó)比較和非上市企業(yè)比較,其理論意義將更為重大;其次,主題判斷模型的訓(xùn)練樣本雖然采用了分層抽樣,以避免代表性偏差,但缺乏有效方法來(lái)保證所抽取的400個(gè)樣本是最優(yōu)抽樣結(jié)果,后續(xù)考慮通過(guò)重復(fù)實(shí)驗(yàn)、人工改寫或加入標(biāo)準(zhǔn)指南語(yǔ)料等數(shù)據(jù)增強(qiáng)的方法來(lái)解決。此外,更大范圍的有效性檢驗(yàn)也有待深入展開;再次,雖然對(duì)全樣本中10657張抽象圖片進(jìn)行了文字轉(zhuǎn)碼,但對(duì)44443張實(shí)景圖片只進(jìn)行了標(biāo)題提取,會(huì)存在一些不可避免的信息遺漏,下一步我們將通過(guò)人工標(biāo)注或圖像識(shí)別的方式,將圖片信息轉(zhuǎn)為更詳細(xì)的描述信息,進(jìn)一步提升分析的準(zhǔn)確性;最后,雖然全樣本描述統(tǒng)計(jì)與方差分析能夠在一定程度上發(fā)現(xiàn)與顯示規(guī)律性數(shù)量特征,但相關(guān)因果機(jī)制的推斷還有待后續(xù)實(shí)證研究完善。
參考文獻(xiàn):
[1]沈洪濤、金婷婷,2006:《我國(guó)上市公司社會(huì)責(zé)任信息披露的現(xiàn)狀分析》,《審計(jì)與經(jīng)濟(jì)研究》第3期。
[2]沈洪濤、黃珍、郭肪汝,2014:《告白還是辯白——企業(yè)環(huán)境表現(xiàn)與環(huán)境信息披露關(guān)系研究》,《南開管理評(píng)論》第2期。
[3]鄧悅、鄭漢林、郅若平,2019:《“放管服”改革對(duì)企業(yè)經(jīng)營(yíng)績(jī)效的影響——來(lái)自中國(guó)企業(yè)-勞動(dòng)力匹配調(diào)查(CEES)的經(jīng)驗(yàn)證據(jù)》,《改革》第8期。
[4]段釗、何雅娟、鐘原,2017:《企業(yè)社會(huì)責(zé)任信息披露是否客觀——基于文本挖掘的我國(guó)上市公司實(shí)證研究》,《南開管理評(píng)論》第4期。
[5]段釗、涂秋陽(yáng)、胡穎,2021:《上市公司對(duì)社會(huì)責(zé)任的自述“言之有據(jù)”嗎?——信息披露實(shí)據(jù)性質(zhì)量評(píng)估方法與實(shí)證研究》,《宏觀質(zhì)量研究》第5期。
[6]段釗、周紅、周輝,2022:《上市公司披露的社會(huì)責(zé)任信息“通俗易懂”嗎?——基于機(jī)器學(xué)習(xí)的可讀性質(zhì)量評(píng)估與實(shí)證研究》,《宏觀質(zhì)量研究》第4期。
[7]馮麗艷、肖翔、趙天驕,2016:《社會(huì)責(zé)任、商業(yè)信任與商業(yè)信用成本》,《北京工商大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)》第1期。
[8]黃萍萍、李四海,2020:《社會(huì)責(zé)任報(bào)告語(yǔ)調(diào)與股價(jià)崩盤風(fēng)險(xiǎn)》,《審計(jì)與經(jīng)濟(jì)研究》第1期。
[9]黃藝翔、姚錚,2016:《企業(yè)社會(huì)責(zé)任報(bào)告、印象管理與企業(yè)業(yè)績(jī)》,《經(jīng)濟(jì)管理》第1期。
[10] 李四海、李曉龍、宋獻(xiàn)中,2015:《產(chǎn)權(quán)性質(zhì)、市場(chǎng)競(jìng)爭(zhēng)與企業(yè)社會(huì)責(zé)任行為——基于政治尋租視角的分析》,《中國(guó)人口·資源與環(huán)境》第1期。
[11] 李志欣、施智平、李志清等,2011:《融合語(yǔ)義主題的圖像自動(dòng)標(biāo)注》,《軟件學(xué)報(bào)》第4期。
[12] 李四海、李震,2023:《企業(yè)社會(huì)責(zé)任報(bào)告特質(zhì)信息含量的信號(hào)效應(yīng)研究——基于自然語(yǔ)言處理技術(shù)的分析》,《中國(guó)工業(yè)經(jīng)濟(jì)》第1期。
[13] 李正、官峰、李增泉,2013:《企業(yè)社會(huì)責(zé)任報(bào)告鑒證活動(dòng)影響因素研究——來(lái)自我國(guó)上市公司的經(jīng)驗(yàn)證據(jù)》,《審計(jì)研究》第3期。
[14] 劉柏、盧家銳,2018:《“順應(yīng)潮流”還是“投機(jī)取巧”:企業(yè)社會(huì)責(zé)任的傳染機(jī)制研究》,《南開管理評(píng)論》第4期。
[15] 呂源、彭長(zhǎng)桂,2012:《話語(yǔ)分析:開拓管理研究新視野》,《管理世界》第10期。
[16] 聶卉,2017:《隱主題模型下產(chǎn)品評(píng)論觀點(diǎn)的凝聚與量化》,《情報(bào)學(xué)報(bào)》第6期。
[17] 齊麗云、李騰飛、郭亞楠,2017:《企業(yè)社會(huì)責(zé)任對(duì)企業(yè)聲譽(yù)影響的實(shí)證研究——基于戰(zhàn)略選擇的調(diào)節(jié)作用》,《科研管理》第7期。
[18] 曲佳彬、歐石燕,2018:《基于主題過(guò)濾與主題關(guān)聯(lián)的學(xué)科主題演化分析》,《數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)》第1期。
[19] 阮光冊(cè),2014:《基于LDA的網(wǎng)絡(luò)評(píng)論主題發(fā)現(xiàn)研究》,《情報(bào)雜志》第3期。
[20] 宋獻(xiàn)中、胡珺、李四海,2017:《社會(huì)責(zé)任信息披露與股價(jià)崩盤風(fēng)險(xiǎn)——基于信息效應(yīng)與聲譽(yù)保險(xiǎn)效應(yīng)的路徑分析》,《金融研究》第4期。
[21] 孫蔓莉,2004:《論上市公司信息披露中的印象管理行為》,《會(huì)計(jì)研究》第3期。
[22] 田利輝、王可第,2017:《社會(huì)責(zé)任信息披露的“掩飾效應(yīng)”和上市公司崩盤風(fēng)險(xiǎn)——來(lái)自中國(guó)股票市場(chǎng)的DID-PSM分析》,《管理世界》第11期。
[23] 魏強(qiáng)、金芝、許焱,2014:《基于概率主題模型的物聯(lián)網(wǎng)服務(wù)發(fā)現(xiàn)》,《軟件學(xué)報(bào)》第8期。
[24] 肖紅軍、李平,2019:《平臺(tái)型企業(yè)社會(huì)責(zé)任的生態(tài)化治理》,《管理世界》第4期。
[25] 徐戈、王厚峰,2011:《自然語(yǔ)言處理中主題模型的發(fā)展》,《計(jì)算機(jī)學(xué)報(bào)》第8期。
[26] 張秀敏、楊連星、高云霞等,2019:《什么影響了社會(huì)責(zé)任報(bào)告中修辭語(yǔ)言的運(yùn)用?》,《會(huì)計(jì)研究》第6期。
[27] 趙子夜、楊慶、楊楠,2019:《言多必失?管理層報(bào)告的樣板化及其經(jīng)濟(jì)后果》,《管理科學(xué)學(xué)報(bào)》第3期。
[28] 周建、原東良、馬雨飛,2021:《MD&a語(yǔ)調(diào)會(huì)影響企業(yè)履行社會(huì)責(zé)任嗎?——基于信息增量與印象管理的視角》,《管理學(xué)刊》第6期。
[29] Aguilera, R. V., Rupp, D. E., Williams, C. A. and Ganapathi, J., 2007, Putting the S Back in Corporate Social Responsibility: A Multilevel Theory of Social Change in Organizations, Academy of Management Review, 32(3):836-863.
[30] Aguinis, H. and Glavas, A., 2012, What We Know and Dont Know about Corporate Social Responsibility: A Review and Research Agenda, Journal of Management, 38(4):932-968.
[31] Ansari, S. M., Fiss, P. C. and Zajac, E. J., 2010, Made to Fit: How Practices Vary as They Diffuse, Academy of Management Review, 35(1):67-92.
[32] Barney, J. B., Ketchen, D. J., Wright, M., McWilliams, A. and Siegel, D. S., 2011, Creating and Capturing Value: Strategic Corporate Social Responsibility, Resource-Based Theory, and Sustainable Competitive Advantage, Journal of Management, 37(5):1480-1495.
[33] Blei, D. M., Ng, A. Y. and Jordan, M. I., 2003, Latent Dirichlet Allocation, Journal of Machine Learning Research, 3(1):993-1022.
[34] Cao, J., Xia, T., Li, J., Zhang, Y. and Tang, S., 2009, A Density-Based Method for Adaptive LDA Model Selection, Neurocomputing, 72(7):1775-1781.
[35] Carroll, A. B., 1994, Social Issues in Management Research: Experts Views, Analysis, and Commentary, Business & Society, 33(1):5-29.
[36] Deephouse, D. L., 1999, To Be Different, or to Be the Same? Its a Question (and Theory) of Strategic Balance, Strategic Management Journal, 20(2):147-166.
[37] Dhaliwal, D. S., Li, O. Z., Tsang, A. and Yang, Y. G., 2011, Voluntary Nonfinancial Disclosure and the Cost of Equity Capital: The Initiation of Corporate Social Responsibility Reporting, The Accounting Review, 86(1):59-100.
[38] Dhaliwal, D. S., Radhakrishnan, S., Tsang, A. and Yang, Y. G., 2012, Nonfinancial Disclosure and Analyst Forecast Accuracy: International Evidence on Corporate Social Responsibility Disclosure, The Accounting Review, 87(3):723-759.
[39] Diouf, D. and Boiral, O., 2017, The Quality of Sustainability Reports and Impression Management: A Stakeholder Perspective, Accounting, Auditing & Accountability Journal, 30(3):643-667.
[40] Durand, R., Hawn, O. and Ioannou, I., 2019, Willing and Able: A General Model of Organizational Responses to Normative Pressures, Academy of Management Review, 44(2):299-320.
[41] Durand, R. and Kremp, P. A., 2016, Classical Deviation: Organizational and Individual Status as Antecedents of Conformity, Academy of Management Journal, 59(1):65-89.
[42] García-Sánchez, I. M., Suárez-Fernández, O. and Martínez-Ferrero, J., 2019, Female Directors and Impression Management in Sustainability Reporting, International Business Review, 28(2):359-374.
[43] Gray, R., Kouhy, R. and Lavers, S., 1995, Corporate Social and Environmental Reporting: A Review of the Literature and a Longitudinal Study of UK Disclosure, Accounting, Auditing & Accountability Journal, 8(2):47-77.
[44] Jenkins, H. and Yakovleva, N., 2006, Corporate Social Responsibility in the Mining Industry: Exploring Trends in Social and Environmental Disclosure, Journal of Cleaner Production, 14(3):271-284.
[45] Loughran, T. and Mcdonald, B., 2016, Textual Analysis in Accounting and Finance: A Survey: Textual Analysis in Accounting and Finance, Journal of Accounting Research, 54(4):1187-1230.
[46] Lu, Y. and Zhai, C., 2008, Opinion Integration through Semi-Supervised Topic Modeling, in Proceedings of the 17th International Conference on World Wide Web, New York, NY, USA: Association for Computing Machinery.
[47] Marquis, C. and Qian, C., 2014, Corporate Social Responsibility Reporting in China: Symbol or Substance? Organization Science, 25(1):127-148.
[48] Muslu, V., Mutlu, S., Radhakrishnan, S. and Tsang, A., 2019, Corporate Social Responsibility Report Narratives and Analyst Forecast Accuracy, Journal of Business Ethics, 154(4):1119-1142.
[49] Patten, D. M., 1991, Exposure, Legitimacy, and Social Disclosure, Journal of Accounting and Public Policy, 10(4):297-308.
[50] Ramage, D., Dumais, S. and Liebling, D., 2010, Characterizing Microblogs with Topic Models, Proceedings of the International AAAI Conference on Web and Social Media, 4(1):130-137.
[51] Talbot, D. and Boiral, O., 2018, GHG Reporting and Impression Management: An Assessment of Sustainability Reports from the Energy Sector, Journal of Business Ethics, 147(2):367-383.
[52] White, L. J., 2010, Markets: The Credit Rating Agencies, Journal of Economic Perspectives, 24(2):211-226.
[53] Widmer, G. and Kubat, M., 1996, Learning in the Presence of Concept Drift and Hidden Contexts, Machine Learning, 23(1):69-101.
[54] Zhang, Y., Wang, H. and Zhou, X., 2020, Dare to Be Different? Conformity versus Differentiation in Corporate Social Activities of Chinese Firms and Market Responses, Academy of Management Journal, 63(3):717-742.
[55] Zhao, W., Chen, J. J., Perkins, R., Liu, Z., Ge, W., Ding, Y. and Zou, W., 2015, A Heuristic Approach to Determine an Appropriate Number of Topics in Topic Modeling, BMC Bioinformatics, 16(13):S8.
Is There Favoritism in the Self-report of Social
Responsibility of Listed Companies?
—Tendency-based Information Disclosure Quality Evaluation
and Empirical Research
Duan Zhao Wu Zhimin and Lu Dingyi
(1.School of Information Management,Central China Normal University;
2.Center for Corporate Social Responsibility, Central China Normal University)
Abstract:With the changes in the market environment and the strengthening of corporate social responsibility (CSR) information disclosure rules, listed companies disclosure strategies and behaviors have also changed. In this context, accurately describing and measuring the inclination and changes of CSR disclosure content not only helps to effectively improve the quality of capital market information disclosure in practice, but also have important significance in understanding corporate disclosure motivation and revealing the impact mechanism of disclosure behavior in theory. This study proposes two concepts to describe the tendency and dynamic changes of CSR information disclosure: “Topic Preference” and “Topic Drift”; design and verification of variable measurement and data structuring methods; and based on the full sample from 2008 to 2017 for data analysis and discussion. Research shows that topic preference and topic drift can well show and identify the tendency of companies in the content of CSR information disclosure and their changing characteristics over time; full-sample analysis shows that the situation of “favoritism” in CSR information disclosure in my countrys securities market is objective Existence, tendencies present six different types in general, and the theme drift presents a normal distribution; the theme preference and theme drift of listed companies in different industries, years and property rights are significantly different, industry heterogeneity, external Policy shocks may be the main reason for the differences. This article provides a new way of thinking, tools and empirical evidence for the evaluation and supervision of information disclosure quality of listed companies; it also provides an important empirical basis for the development of related theoretical research.
Key Words:corporate social responsibility; information disclosure quality; tendency; topic preference; topic drift
責(zé)任編輯 鄧悅