張 楊,廉吉慶,張 揚(yáng),高德毅
(1.上海理工大學(xué) 管理學(xué)院,上海 200093;2.上海出版印刷高等??茖W(xué)校 印刷包裝工程系,上海 200093;3.上海市人大外事委,上海 200003)
根據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)第48次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,截至2021年6月,我國網(wǎng)民規(guī)模達(dá)10.11億。網(wǎng)絡(luò)已成為大眾生活不可缺少的一部分。全媒體時(shí)代,網(wǎng)民可以在各類社交平臺上通過發(fā)帖、評論、轉(zhuǎn)發(fā)、點(diǎn)贊等行為對社會(huì)事件、經(jīng)濟(jì)民生、企業(yè)聲譽(yù)、產(chǎn)品質(zhì)量、教育教學(xué)等話題表達(dá)觀點(diǎn)和態(tài)度。近年來,這些網(wǎng)絡(luò)輿情信息在數(shù)量上呈指數(shù)級增長,導(dǎo)致網(wǎng)絡(luò)輿情爆發(fā)頻次增加。
網(wǎng)絡(luò)輿情可以反映社情民意,處理不當(dāng)會(huì)演化成輿情危機(jī),給社會(huì)造成嚴(yán)重的負(fù)面影響,因此,如何正確處理網(wǎng)絡(luò)輿情成為學(xué)術(shù)界和社會(huì)共同關(guān)注的重要問題。網(wǎng)絡(luò)輿情信息中包含的大量網(wǎng)民情感信息是推動(dòng)網(wǎng)絡(luò)輿情傳播和發(fā)酵的重要因素之一,以情感角度為切入點(diǎn),研究網(wǎng)絡(luò)輿情的傳播特征和演化規(guī)律,有助于政府部門及時(shí)把控輿情導(dǎo)向,精準(zhǔn)研判和處理輿情事件,對我國社會(huì)的進(jìn)步和發(fā)展具有重要的現(xiàn)實(shí)意義。
目前,越來越多學(xué)者從情感角度出發(fā),借助數(shù)據(jù)挖掘技術(shù)、深度學(xué)習(xí)、機(jī)器學(xué)習(xí)等方法,對網(wǎng)絡(luò)輿情進(jìn)行深層次挖掘,探討輿情發(fā)展規(guī)律,研究網(wǎng)民心理行為特征?;诖?,本研究通過收集國內(nèi)網(wǎng)絡(luò)輿情情感分析領(lǐng)域期刊題錄信息,以共詞分析法為手段,對該領(lǐng)域研究現(xiàn)狀進(jìn)行梳理和總結(jié),剖析該領(lǐng)域重要主題,為后續(xù)研究提供借鑒和參考。
TF-IDF是一種詞權(quán)重計(jì)算方法,用于評估某個(gè)詞語在文本中的重要程度,其主要思想為:一個(gè)詞在一篇文章中出現(xiàn)的頻率較高,同時(shí)在其他文章中出現(xiàn)的頻率較低,則認(rèn)為該詞為重要關(guān)鍵詞,適合作為特征詞用于分類,常用的計(jì)算方法如下:
其中ni,j表示詞ti在dj中的出現(xiàn)次數(shù)表 示 所有詞在文檔dj出現(xiàn)的頻次之和,|D|表示所有文檔總數(shù),|{j:ti∈dj}|表示包含詞ti的文檔總數(shù)。
共詞分析法是一種常用的內(nèi)容分析方法,統(tǒng)計(jì)詞對在文本中兩兩共現(xiàn)情況,以此為基礎(chǔ)生成共詞矩陣,并通過聚類分析使共現(xiàn)頻率較高的詞對聚集在一起形成詞群,反映詞群所代表領(lǐng)域的研究熱點(diǎn)、研究范式,發(fā)展過程等[1-2]。一方面,關(guān)鍵詞詞頻呈冪律分布特征,這種特征有助于用高頻詞概括研究領(lǐng)域中的熱門知識點(diǎn)。另一方面,從詞語義角度來看,中、低頻次詞(如人名、地名、專有名詞等)能更多反映文本主題信息,但在實(shí)際應(yīng)用中往往被忽略[3]。共詞分析的結(jié)果受選擇的核心關(guān)鍵詞所影響,如何獲取更能體現(xiàn)熱點(diǎn)主題的關(guān)鍵詞是需要解決的問題。
網(wǎng)絡(luò)輿情情感研究熱點(diǎn)分析思路示意圖如圖1所示,網(wǎng)絡(luò)輿情情感研究熱點(diǎn)分析步驟如下:
圖1 網(wǎng)絡(luò)輿情情感研究熱點(diǎn)分析思路示意圖
(1)通過Python提取論文摘要;
(2)以作者標(biāo)引關(guān)鍵詞來建立關(guān)鍵詞詞典,以哈工大停用詞表為基礎(chǔ),添加輿情通用泛化詞,組成停用詞詞典;
(3)通過TF-IDF提取關(guān)鍵詞;
(4)對關(guān)鍵詞進(jìn)行規(guī)范化處理;
(5)借助SPSS軟件對數(shù)據(jù)進(jìn)行共詞分析;
(6)得到層次聚類結(jié)果,反映網(wǎng)絡(luò)輿情情感研究熱點(diǎn)的細(xì)分類團(tuán),進(jìn)而得到多維尺度分析結(jié)果,反映網(wǎng)絡(luò)輿情情感研究熱點(diǎn)的宏觀分類結(jié)果。
本文以CNKI期刊數(shù)據(jù)庫(SCI來源期刊、EI來源期刊、核心期刊、CSSCI來源期刊)為數(shù)據(jù)源,為保證檢全率和檢準(zhǔn)率,將檢索條件分別設(shè)定為主題、篇名、關(guān)鍵詞、摘要,將檢索詞設(shè)定為“網(wǎng)絡(luò)輿情”與“情感”。文獻(xiàn)發(fā)表時(shí)間不做限制,檢索截止時(shí)間為2020年12月25日,檢索日期為2020年12月29日。為保證研究的可信度,去除會(huì)議、前言、動(dòng)態(tài)、通知等學(xué)術(shù)性弱的文獻(xiàn),去除與檢索名稱相同但內(nèi)涵不同的不相關(guān)文獻(xiàn)、重復(fù)刊載的文獻(xiàn),最終得到有效結(jié)果369篇。
從詞源角度來看,共詞分析關(guān)鍵詞詞源包括:作者提供的關(guān)鍵詞、標(biāo)題、摘要提取詞語、主題詞、人工標(biāo)引代碼、正文內(nèi)容提取詞等。在進(jìn)行關(guān)鍵詞篩選過程中,一些同樣能代表領(lǐng)域研究熱點(diǎn)的新詞或近義詞由于無法滿足入選要求而被過濾掉[4]。因此,如何選取合適的關(guān)鍵詞是有待進(jìn)一步研究的難點(diǎn)。采用作者提供的關(guān)鍵詞,來源單一,存在“標(biāo)引者效應(yīng)”,為解決這個(gè)問題,相關(guān)研究提出對文獻(xiàn)中的標(biāo)題[5]、摘要[6]、文獻(xiàn)正文[7]提取關(guān)鍵詞,或?qū)θ咄瑫r(shí)提取關(guān)鍵詞。然而有研究分別對關(guān)鍵詞和標(biāo)題提取詞進(jìn)行共詞分析,發(fā)現(xiàn)其結(jié)果相似[2,8]。而從文獻(xiàn)正文自動(dòng)標(biāo)引取詞難度較大,在實(shí)際研究中較少采用。摘要是文獻(xiàn)內(nèi)容的凝練,通過分詞技術(shù)從摘要提取關(guān)鍵詞,既能避免標(biāo)引主觀性,也能更接近作者學(xué)術(shù)思維[9]。因此,本文選擇以作者標(biāo)引關(guān)鍵詞作為詞典,從摘要中提取關(guān)鍵詞作為詞源。關(guān)鍵詞規(guī)范化處理的具體步驟為:(1)清理泛化籠統(tǒng)數(shù)據(jù);
(2)對同義詞、近義詞數(shù)據(jù)進(jìn)行合并;
(3)歸并有上下位關(guān)系的關(guān)鍵詞。
部分規(guī)范化結(jié)果如表1所示。
表1 關(guān)鍵詞規(guī)范結(jié)果(部分)
高頻詞是概括研究領(lǐng)域中熱門知識點(diǎn)的基礎(chǔ),但一些同樣能體現(xiàn)領(lǐng)域研究熱點(diǎn)的詞,由于詞頻較低而被忽略,影響研究結(jié)果。因此,本研究引入詞權(quán)重的計(jì)算方法,結(jié)合關(guān)鍵詞詞頻與TF-IDF,確定重要關(guān)鍵詞。然后,根據(jù)Donohue提出的高頻低頻詞分界定律其中T表示高頻詞數(shù)量,I1表示詞頻為1的詞的個(gè)數(shù))確定關(guān)鍵詞數(shù)量[10]。最終確定關(guān)鍵詞數(shù)量為69。將選定的關(guān)鍵詞構(gòu)建69×69共詞矩陣。建立相關(guān)矩陣并轉(zhuǎn)換為相異矩陣,如表2所示。
表2 相異矩陣(部分)
將建立好的相異矩陣導(dǎo)入SPSS22.0系統(tǒng)中。通過系統(tǒng)聚類方法,聚類算法選擇“Ward法”,測量標(biāo)準(zhǔn)選擇“區(qū)間:卡方度量”,標(biāo)準(zhǔn)化方法選擇“Z分?jǐn)?shù)”,得到共詞聚類結(jié)果如圖2所示。
根據(jù)圖2,將共詞聚類結(jié)果與關(guān)鍵詞語義關(guān)系相結(jié)合,將國內(nèi)輿情情感研究歸納為16個(gè)類團(tuán),分別為輿情主題情感分析、輿情節(jié)點(diǎn)情感分析、輿情情感文本處理、輿情載體情感分析、輿情情感強(qiáng)度、輿情情感傾向、輿情情感信息處理技術(shù)、輿情情感演化、情感分析在輿情監(jiān)測與治理的應(yīng)用、輿情主體情感分析、輿情情感極化、社會(huì)輿情情感分析、情感分析在輿情預(yù)警的應(yīng)用、高校輿情情感分析、情感分析在輿情危機(jī)的應(yīng)用、情感分析在輿情研判的應(yīng)用。從微觀角度看,部分類團(tuán)之間存在語義相似或性質(zhì)相同的關(guān)鍵詞,原因在于不同研究目標(biāo)使用的研究方法、設(shè)計(jì)的研究思路可能存在相似性。
圖2 層次聚類結(jié)果
從宏觀角度看,根據(jù)研究方法和研究思路的共性特征,可以將層次聚類結(jié)果的16個(gè)類團(tuán)歸并為三類:基于內(nèi)容層面的輿情情感研究、基于技術(shù)層面的輿情情感研究、基于輿情傳播要素的輿情情感研究。
為驗(yàn)證共詞聚類結(jié)果宏觀歸類有效性,將相異矩陣導(dǎo)入SPSS22.0系統(tǒng)中,通過多維尺度分析方法,度量模型選擇“Euclidean距離”作為度量標(biāo)準(zhǔn),“卡方統(tǒng)計(jì)”作為度量標(biāo)準(zhǔn),“Z得分”作為標(biāo)準(zhǔn)化方法,得到多維尺度分析結(jié)果,如圖3所示。
根據(jù)圖3可知,多維尺度分析結(jié)果將選取的高頻關(guān)鍵詞分為3個(gè)類團(tuán),分別代表網(wǎng)絡(luò)輿情情感分析領(lǐng)域的研究熱點(diǎn)方向??傮w來說,從語義關(guān)系看,多維尺度分析結(jié)果與層次聚類宏觀歸并結(jié)果比較一致。
圖3 多維尺度分析結(jié)果
輿情信息內(nèi)容指網(wǎng)絡(luò)主體 (包括但不限于網(wǎng)民、機(jī)構(gòu)、組織等)在參與網(wǎng)絡(luò)輿情過程中,產(chǎn)生的評論性、觀點(diǎn)性信息,包括文字、圖片、表情符號等[11],具有大量高價(jià)值隱藏情感信息。情感分析又稱意見挖掘,是對帶有情感色彩的網(wǎng)絡(luò)信息內(nèi)容進(jìn)行分析以獲取主體觀點(diǎn)、態(tài)度、情感等的過程[12],包括情感識別、情感分類、情感傾向性判斷、情感計(jì)算、情感演化分析等內(nèi)容[13]?;谏鲜龈拍?,可認(rèn)為類團(tuán)1(輿情主題情感分析)、類團(tuán)5(輿情情感強(qiáng)度)、類團(tuán)6(輿情情感傾向)、類團(tuán)8(輿情情感演化)、類團(tuán)11(輿情情感極化)是當(dāng)前內(nèi)容層面的研究熱點(diǎn),根據(jù)研究內(nèi)容是否考慮時(shí)間維度,可將研究分為兩類:信息靜止視角下的內(nèi)容分析和信息運(yùn)動(dòng)視角下的內(nèi)容分析。根據(jù)關(guān)鍵詞共現(xiàn)語義關(guān)系,結(jié)合所選的文獻(xiàn)進(jìn)行梳理,展開如下分析。
信息靜止視角下的內(nèi)容分析指在不考慮時(shí)間序列維度的情況下,將某個(gè)時(shí)間段內(nèi)的輿情信息看作整體,進(jìn)行內(nèi)容分析,可以讓我們了解網(wǎng)絡(luò)主體對輿情事件的態(tài)度、情緒,例如:贊同、反對、高興、悲傷、正面態(tài)度、負(fù)面態(tài)度等,包括類團(tuán)1、類團(tuán)5、類團(tuán)6。
類團(tuán)1和類團(tuán)6是對輿情主題進(jìn)行情感分析,一方面在識別熱門主題的基礎(chǔ)上分析網(wǎng)絡(luò)主體的情感傾向,如有文獻(xiàn)基于LDA主題模型分析論壇網(wǎng)民關(guān)注熱點(diǎn)方向,并結(jié)合情感分析技術(shù),展現(xiàn)論壇輿情方向和網(wǎng)民態(tài)度[14];有研究通過LDA-BiLSTM模型提取社交網(wǎng)絡(luò)平臺數(shù)據(jù)中的熱門主題,獲取其下回復(fù)文本的情感極性,分析潛在輿情[15]。另一方面在識別情感類別或情感傾向的基礎(chǔ)上,檢測某類情感話題,如有研究提出面向負(fù)面情感突發(fā)話題檢測算法,先識別文本信息主題詞的加速度和負(fù)面情感強(qiáng)度變化率,基于此提取目標(biāo)文本,再進(jìn)行負(fù)面話題主題結(jié)構(gòu)分析[16]。
類團(tuán)5輿情情感強(qiáng)度是基于情感計(jì)算的研究,文本預(yù)處理、特征信息提取、情感強(qiáng)度特征定義或附值、情感強(qiáng)度計(jì)算是其研究基本范式。當(dāng)前研究集中于輿情情感強(qiáng)度模型的建立、優(yōu)化及應(yīng)用上,包括構(gòu)建基于PAD的網(wǎng)絡(luò)輿情情感強(qiáng)度測度模型[17],還包括基于語義角度定義輿情事件中的情感詞、短語、句子、篇章的情感強(qiáng)度,對輿情中多對象進(jìn)行情感計(jì)算,得出輿情情感強(qiáng)度值[18]。
信息運(yùn)動(dòng)視角下的內(nèi)容分析是在研究靜止信息的基礎(chǔ)上,引入時(shí)間序列維度,對某個(gè)時(shí)間段內(nèi)輿情動(dòng)態(tài)變化特征和傳播規(guī)律進(jìn)行研究,進(jìn)一步分析、預(yù)測輿情情感隨時(shí)間的演化規(guī)律。類團(tuán)8(輿情情感演化)和類團(tuán)11(輿情情感極化)便是基于信息運(yùn)動(dòng)視角下的研究。
一方面對提取的輿情信息內(nèi)容進(jìn)行情感傾向和情感演化分析,如有文獻(xiàn)構(gòu)建基于LDA-ARMA的混合模型,分析網(wǎng)絡(luò)輿情情感演化趨勢[19];有研究通過HHM模型構(gòu)建突發(fā)公共事件風(fēng)險(xiǎn)影響因素框架,分析網(wǎng)絡(luò)輿情風(fēng)險(xiǎn)演化機(jī)理和過程[20];有作者構(gòu)建SIR演化博弈模型,分析網(wǎng)絡(luò)虛擬社群負(fù)面情緒傳染規(guī)律[21]。另一方面,對分析結(jié)果開展應(yīng)用,進(jìn)行輿情趨勢預(yù)測。如有研究通過專家知識構(gòu)建輿情情感演化評估體系,并借助圖卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建評估模型[22],實(shí)現(xiàn)基于排序?qū)W習(xí)的輿情演化趨勢預(yù)測方法[23];有研究構(gòu)建基于ARIMA和LSTM的新冠肺炎網(wǎng)絡(luò)情感關(guān)注度趨勢預(yù)測模型,預(yù)測效果優(yōu)于全國數(shù)據(jù)擬合模型[24]。
總之,基于內(nèi)容層面的輿情情感研究主要以時(shí)間序列維度為基礎(chǔ),進(jìn)行輿情主題分析、情感演化特征分析、情感趨勢預(yù)測等,對節(jié)點(diǎn)關(guān)聯(lián)度、節(jié)點(diǎn)影響力、網(wǎng)民心理特征等因素考慮較少,而這些因素對提高研究的準(zhǔn)確度有重要意義,未來可以從多維度、多方面對輿情內(nèi)容進(jìn)行分析。
輿情情感研究技術(shù)即情感分析技術(shù),其研究對象是輿情信息內(nèi)容,研究目的是通過改進(jìn)情感分析技術(shù),提升對輿情信息內(nèi)容的情感識別和分析效果。類團(tuán)3(輿情情感文本處理)、類團(tuán)7(輿情情感信息處理技術(shù))可概括為此類內(nèi)容。詞共現(xiàn)語義關(guān)系呈現(xiàn)的情感分析技術(shù)有基于情感詞典的語義識別技術(shù)、傳統(tǒng)機(jī)器學(xué)習(xí)、深度學(xué)習(xí),這也是情感分析的幾個(gè)主流技術(shù)方法。結(jié)合對選取文獻(xiàn)的梳理,展開如下分析。
基于情感詞典的語義識別技術(shù)依賴于情感詞典的構(gòu)建,通過依存句法分析、語義規(guī)則、語義相似度等方法進(jìn)行情感分析,對該類技術(shù)的改進(jìn)方向包括:優(yōu)化或擴(kuò)充情感詞典、改進(jìn)語義規(guī)則、改進(jìn)語義特征提取方式等。如有研究通過擴(kuò)充情感詞典提升微博輿情文本的情感分類效果[25];有研究將情感詞典和語義規(guī)則結(jié)合,提升微博輿論文本細(xì)粒度情感分類的準(zhǔn)確率[26]。有作者提出基于短語級情感分析的不良信息檢測方法,定制新的語法規(guī)則來提取敏感詞所在短語,結(jié)合二次分類的情感詞典,進(jìn)而判斷內(nèi)容的情感傾向,有效提升檢測結(jié)果準(zhǔn)確率。
基于傳統(tǒng)機(jī)器學(xué)習(xí)的情感分析方法依賴于大規(guī)模高質(zhì)量的訓(xùn)練數(shù)據(jù)集,通過建立標(biāo)簽化情感數(shù)據(jù)訓(xùn)練集,訓(xùn)練一個(gè)情感分類器,再對目標(biāo)測試內(nèi)容進(jìn)行情感識別。主要包括支持向量機(jī)、LDA主題模型、樸素貝葉斯、協(xié)同過濾、隨機(jī)森林、最大熵、K-means等。對于該類方法的優(yōu)化,有研究改進(jìn)SVM算法,提出基于SVM-WNB網(wǎng)絡(luò)輿情分類方法,提升網(wǎng)絡(luò)輿情情感分類能力和分類效率[27];有研究改進(jìn)傳統(tǒng)LDA主題模型,建立面向情感詞權(quán)重的LAD主題模型,對情感詞的重要度和分布度進(jìn)行定義和加權(quán),作為特征輸入LDA模型,并進(jìn)行主題求解,提高了主題詞分布廣度和主題語義區(qū)分度[3]。
深度學(xué)習(xí)是多層網(wǎng)絡(luò)進(jìn)行任務(wù)學(xué)習(xí)時(shí)嵌入人工神經(jīng)網(wǎng)絡(luò)的方法,隨著深度學(xué)習(xí)在圖像和語音處理方面取得重大進(jìn)展,在情感分析領(lǐng)域也開始被廣泛應(yīng)用。深度學(xué)習(xí)在情感分析研究使用的模型主要有CNN、RNN、LSTM、BiLSTM、GRU和注意力機(jī)制等。對該類方法的優(yōu)化主要體現(xiàn)在模型構(gòu)建、模型訓(xùn)練效率和分類精度提升上,如有文獻(xiàn)將微博輿情信息情感劃分為高興、贊賞、驚訝、悲傷、厭惡、恐懼、憤怒7類,構(gòu)建基于卷積神經(jīng)網(wǎng)絡(luò)的微博輿情情感分類模型,提升微博輿情情感分類效果[28];有文獻(xiàn)通過多卷積核改變微博評論上下文信息有限的條件制約,構(gòu)建基于字向量的多尺度卷積神經(jīng)網(wǎng)絡(luò)微博輿情內(nèi)容情感分類模型,得到較好分類結(jié)果[29]。
除了單獨(dú)使用某類技術(shù)進(jìn)行情感分析外,越來越多的學(xué)者從混合方法角度,結(jié)合基于情感詞典的語義識別技術(shù)、傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法,進(jìn)行多方法混合研究,提升輿情情感分析效果,如有研究將領(lǐng)域詞典進(jìn)行擴(kuò)充,在融合情感貢獻(xiàn)度的情感極性計(jì)算方法中引入TF-IDF算法,分析網(wǎng)民情感表達(dá)狀況及關(guān)注焦點(diǎn)內(nèi)容,對評價(jià)指標(biāo)值均有提高[30];有研究將基于詞典和知識庫的OCC模型與樸素貝葉斯模型[31]、LSTM[32]等方法結(jié)合,提升輿情文本情感分類的準(zhǔn)確率。
總之,語義分析依賴情感詞典工具,需要及時(shí)擴(kuò)充不斷更新的網(wǎng)絡(luò)流行詞、自造詞、隱喻詞等來滿足需求;機(jī)器學(xué)習(xí)可借助訓(xùn)練集及時(shí)調(diào)整模型,但忽視上下文的語義關(guān)聯(lián),因此精度低;深度學(xué)習(xí)既能分析上下文關(guān)系,又具有較強(qiáng)的特征學(xué)習(xí)能力,但訓(xùn)練時(shí)間長,可解釋性差。因此,基于技術(shù)層面的輿情情感研究發(fā)展方向主要有兩個(gè),一是算法升級,提升單一算法的語義分析能力,提高分析結(jié)果的準(zhǔn)確率;二是綜合運(yùn)用多種情感分析技術(shù),實(shí)現(xiàn)優(yōu)勢互補(bǔ)。
網(wǎng)絡(luò)輿情傳播實(shí)際上是信息傳播過程,網(wǎng)絡(luò)輿情特征受輿情信息傳播要素影響,網(wǎng)絡(luò)信息傳播要素包括輿情主體(輿情事件參與者和推動(dòng)者)、輿情客體(輿情事件本身)、輿情本體(用以描述網(wǎng)絡(luò)輿情事件)、輿情媒體(輿情主體參與平臺和信息傳播載體)、環(huán)境噪音[32-33]。 根據(jù)上述分類,結(jié)合拉斯韋爾“5W”信息傳播要素[34]和輿情研究的最終目的,本文將基于輿情傳播要素的情感研究分為四個(gè)方面:輿情主體研究、輿情客體研究、輿情媒體研究和輿情情感研究應(yīng)用。輿情主體研究包括類團(tuán)2(輿情節(jié)點(diǎn)情感分析)、類團(tuán)10(輿情主體情感分析);輿情客體研究包括類團(tuán)12(社會(huì)輿情情感分析)、類團(tuán)14(高校輿情情感分析);輿情媒體研究包括類團(tuán)4(輿情載體情感分析);輿情情感研究應(yīng)用包括類團(tuán)9(情感分析在輿情監(jiān)測與治理的應(yīng)用)、類團(tuán)13(情感分析在輿情預(yù)警的應(yīng)用)、類團(tuán)15(情感分析在輿情危機(jī)的應(yīng)用)、類團(tuán)16(情感分析在輿情研判的應(yīng)用),根據(jù)詞共現(xiàn)語義關(guān)系,結(jié)合對選取文獻(xiàn)的梳理,展開如下分析。
輿情主體研究對象是網(wǎng)絡(luò)輿情的主要參與者和推動(dòng)者,研究熱點(diǎn)內(nèi)容包括融合網(wǎng)民情感屬性的關(guān)鍵節(jié)點(diǎn)分析[35-36];輿情主體心理特征分析[36-37],如人格特點(diǎn)、參與動(dòng)機(jī)、行為意愿、網(wǎng)民理性、心智狀態(tài)等;基于輿情主體心里特征的社會(huì)情緒分析[38],如恐慌心理、集群情感、心理動(dòng)力等;意見領(lǐng)袖情感分析等[39-41]。
輿情客體研究對象是輿情事件本身,在詞共現(xiàn)結(jié)果中,類團(tuán)12和類團(tuán)14為當(dāng)前研究熱點(diǎn),說明當(dāng)前研究關(guān)注較多的輿情事件有社會(huì)輿情,如公民維權(quán)、社會(huì)公正、居民生活、公共管理、公共決策、經(jīng)濟(jì)民生等;高校輿情,如高等師范院校、職業(yè)院校、高校管理、留學(xué)生、研究生等。
輿情媒體研究對象是媒體的輿情信息內(nèi)容,研究單個(gè)媒體(如新浪微博)或多個(gè)媒體平臺組成的社交網(wǎng)絡(luò)輿情信息情感特征,如有研究對三種網(wǎng)絡(luò)類型平臺輿情類信息的情感表達(dá)特點(diǎn)進(jìn)行對比分析[42];有研究以微博輿情信息內(nèi)容為中心,闡釋人群、內(nèi)容、情緒3個(gè)社會(huì)屬性與意見領(lǐng)袖、事件、情感3個(gè)外化表現(xiàn)之間的內(nèi)部邏輯,以揭示微博輿情的多維度社會(huì)屬性[43];有研究通過融合主題與情感特征的方法分析微博突發(fā)事件輿情演化規(guī)律,可以解釋輿情主題與情感特征的協(xié)同演化規(guī)律[44]。
輿情情感分析的目的是對輿情發(fā)生、發(fā)展規(guī)律進(jìn)行探索總結(jié),從而給輿情導(dǎo)控和治理提供參考。從全過程視角看,輿情導(dǎo)控和治理需要先發(fā)現(xiàn)后治理,包括類團(tuán)9(輿情監(jiān)測)、類團(tuán)13(輿情預(yù)警)、類團(tuán)16(輿情研判)、類團(tuán)15(危機(jī)處理)、類團(tuán)9(輿情治理)等步驟,根據(jù)詞共現(xiàn)語義關(guān)系,這些內(nèi)容是當(dāng)前研究的熱點(diǎn)內(nèi)容。如有文獻(xiàn)構(gòu)建基于LDA-BiLSTM模型的高校網(wǎng)絡(luò)輿情情感監(jiān)測模型,實(shí)時(shí)甄別高校網(wǎng)絡(luò)信息內(nèi)容,監(jiān)測潛在輿情[15];有研究通過分析教育輿情研判的影響因素及對策,得出教育輿情研判應(yīng)將數(shù)據(jù)與經(jīng)驗(yàn)結(jié)合,注重情感分析[45];有研究將輿情信息傳播要素危機(jī)形態(tài)進(jìn)行排序組合,在其關(guān)系節(jié)點(diǎn)建立輿情危機(jī)等級基數(shù),建立輿情危機(jī)風(fēng)險(xiǎn)分型模型,提高輿情危機(jī)案例匹配速度和精準(zhǔn)度[46];有研究以網(wǎng)絡(luò)輿情危機(jī)動(dòng)力要素為基礎(chǔ),對輿情引導(dǎo)方法進(jìn)行探討,如以輿情當(dāng)事人回應(yīng)內(nèi)容[47]、群體心理規(guī)律[48]、負(fù)面輿情規(guī)律[49]、媒體輿情規(guī)律[50]等為切入點(diǎn),提出相應(yīng)策略和模型。
總之,網(wǎng)絡(luò)輿情情感分析的最終目的是給輿情治理提供理論和技術(shù)支撐。輿情突發(fā)事件種類繁多,每類輿情事件有不同的傳播發(fā)展規(guī)律,目前研究多著眼于單一事件的分析,缺少對某類輿情事件傳播發(fā)展規(guī)律的整體分析和規(guī)律挖掘,研究結(jié)果不具普適性。以高校輿情為例,如果能對高校突發(fā)事件進(jìn)行歸類整理,以高校輿情事件集合為對象,總結(jié)一類事件的傳播、發(fā)展特征,研究結(jié)果會(huì)更具普適性,更具現(xiàn)實(shí)應(yīng)用和指導(dǎo)價(jià)值。未來可以將輿情數(shù)據(jù)集作為研究對象,挖掘輿情事件類的整體特征。
本文以CNKI數(shù)據(jù)庫(SCI來源期刊、EI來源期刊、核心期刊、CSSCI來源期刊)中網(wǎng)絡(luò)輿情情感分析為數(shù)據(jù)源,結(jié)合TF-IDF與共詞分析方法,對國內(nèi)網(wǎng)絡(luò)輿情情感分析研究熱點(diǎn)進(jìn)行定量分析。為獲取熱點(diǎn)主題的關(guān)鍵詞,以文章摘要作為詞源,通過TF-IDF算法提取關(guān)鍵詞,通過共詞分析得到層次聚類結(jié)果和多維尺度分析結(jié)果,據(jù)此將國內(nèi)網(wǎng)絡(luò)輿情情感分析研究熱點(diǎn)歸并為3個(gè)宏觀類團(tuán),分別為基于內(nèi)容層面的輿情情感研究、基于技術(shù)層面的輿情情感研究、基于輿情傳播要素的輿情情感研究。
結(jié)合對相關(guān)文獻(xiàn)的梳理和比較,對當(dāng)前網(wǎng)絡(luò)輿情情感分析研究熱點(diǎn)進(jìn)行展望,主要觀點(diǎn)如下:
(1)網(wǎng)絡(luò)輿情情感分析呈多學(xué)科交叉發(fā)展的趨勢。網(wǎng)絡(luò)輿情在數(shù)據(jù)上具有自然科學(xué)屬性,其參與主體包括媒介、政府、網(wǎng)民等,具有社會(huì)科學(xué)屬性。研究路徑和研究方法涉及的學(xué)科包括情報(bào)學(xué)、管理學(xué)、社會(huì)學(xué)、傳播學(xué)、心理學(xué)、計(jì)算機(jī)科學(xué)、語言學(xué)等,越來越多的研究在構(gòu)建情感分析數(shù)理模型的同時(shí),加入對輿情主體心理特征、行為習(xí)慣等因素的考量,為未來跨學(xué)科視角的輿情情感分析提供思路和實(shí)現(xiàn)路徑。
(2)網(wǎng)絡(luò)輿情情感分析在研究方法上呈定性與定量分析相結(jié)合的趨勢。信息相對靜止視角下的內(nèi)容分析主要運(yùn)用語義分析和數(shù)理建模兩種主流方法,信息運(yùn)動(dòng)視角下的內(nèi)容分析主要從模型仿真和復(fù)雜網(wǎng)絡(luò)分析兩個(gè)主流維度展開,社會(huì)情緒分析是在輿情信息內(nèi)容分析的基礎(chǔ)上展開的,一方面借助語義分析和數(shù)理建模等方法;另一方面融入社會(huì)學(xué)、傳播學(xué)、心理學(xué)等社會(huì)科學(xué)研究理論和研究范式,研究內(nèi)容和結(jié)果包含對網(wǎng)絡(luò)受眾心理特征、行為特征、情緒特征等的深入探究,并對情緒觀點(diǎn)進(jìn)行量化計(jì)算,增強(qiáng)研究結(jié)果的現(xiàn)實(shí)指導(dǎo)意義。
(3)網(wǎng)絡(luò)輿情傳播是信息傳播過程,輿情傳播要素之間共同作用形成網(wǎng)絡(luò)輿情整體特征和規(guī)律,現(xiàn)有研究既包含對單個(gè)輿情傳播要素的探索,也有對輿情傳播要素之間作用機(jī)制的關(guān)注,在輿情傳播要素中,傳播主體具有強(qiáng)社會(huì)屬性,已有研究開始關(guān)注傳播主體心理機(jī)制和輿情信息內(nèi)容之間的作用關(guān)系,對其進(jìn)行更深入的社會(huì)屬性特征挖掘,為輿情情感研究提供新思路,更利于掌握網(wǎng)絡(luò)輿情傳播的內(nèi)在機(jī)理和規(guī)律。