嚴(yán)霞 張琨
摘? 要: 教學(xué)評價(jià)情感特征不明顯,復(fù)雜句式使用較多,而傳統(tǒng)的情感分析方法往往忽略對復(fù)雜句式的分析。針對評教文本上述特點(diǎn),提出一種基于情感詞典的情感分析方法,該方法基于評教領(lǐng)域情感詞典,融合復(fù)雜句式特征,定量計(jì)算文本的情感強(qiáng)度。將該方法應(yīng)用于南京理工大學(xué)研究生綜合管理信息系統(tǒng)中的評教文本,實(shí)驗(yàn)結(jié)果表明,所提方法有效地解決了評教文本的情感分類問題,具有較強(qiáng)的實(shí)用性。
關(guān)鍵詞: 評教; 情感分析; 教學(xué)質(zhì)量; 情感詞典
中圖分類號:TP391.1? ? ? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ?文章編號:1006-8228(2019)01-51-04
Abstract: The emotional characteristics of teaching evaluation are not obvious. The more complex sentence patterns in teaching evaluation text are usually ignored by traditional algorithms. According to the characteristics of teaching text, a sentiment analysis algorithm based on sentiment dictionary is put forward to solve the problem. The proposed algorithm fuses complex sentence on the basis of domain-extended dictionary to quantify the emotional intensity. The algorithm is used in the evaluation texts of the postgraduates' comprehensive management information system in Nanjing University of Science and Technology. The final results show that the algorithm effectively solves the problem and has strong practicability.
Key words: teaching evaluation; sentiment analysis; teaching quality; sentiment dictionary
0 引言
學(xué)生是接受教育的對象,對教學(xué)質(zhì)量有著直觀清晰的感受,評教信息能有效反應(yīng)課程的質(zhì)量情況[1]。隨著研究生培養(yǎng)規(guī)模和培養(yǎng)類型的不斷增加,評教數(shù)據(jù)與日俱增,教師和管理者很難通過人工方式處理海量評論的情感分類問題[2]。因此,從大量評教文本中高效自動(dòng)提取出有價(jià)值的信息成為亟待研究的課題。
本文針對評教文本情感傾向不明顯,建議性評論數(shù)量大,復(fù)雜句式使用多等特點(diǎn),提出一種基于評教領(lǐng)域情感詞典,融合復(fù)雜句式特征的情感強(qiáng)度計(jì)算方法,并根據(jù)建議詞表,自動(dòng)抽取出評教文本中的建議性評價(jià)。以南京理工大學(xué)信息系統(tǒng)中產(chǎn)生和存儲的評教數(shù)據(jù)作為研究對象,驗(yàn)證其有效性和科學(xué)性。
1 國內(nèi)外研究現(xiàn)狀
文本情感分析旨在運(yùn)用機(jī)器學(xué)習(xí)算法或基于語義詞典的分類方法分析海量評論的情感類別[3]?;跈C(jī)器學(xué)習(xí)的分類方法主要是通過訓(xùn)練樣本完成褒貶分類器的訓(xùn)練,然后通過分類器自動(dòng)判斷評論信息的正負(fù)情感傾向[4]。李燕玲[5]將改進(jìn)的SVM算法應(yīng)用于廣西大學(xué)的評教文本中,進(jìn)行教學(xué)質(zhì)量的預(yù)評估,并通過實(shí)驗(yàn)驗(yàn)證了該算法的可行。Yu B[6]等人針對分類精度有限的問題提出了一種結(jié)合字符和詞的雙輸入卷積神經(jīng)網(wǎng)絡(luò)模型CP-CNN來提高分類效果?;跈C(jī)器學(xué)習(xí)的情感分類算法存在處理過程復(fù)雜、準(zhǔn)確率受數(shù)據(jù)集影響大等問題,而評教文本驗(yàn)證數(shù)據(jù)集相對較小,準(zhǔn)確率很難達(dá)到讓人滿意的效果。
基于語義詞典的分類方法是利用情感詞典識別待分析文本中表達(dá)或影響主觀情感的要素,通過數(shù)值化形式展現(xiàn),并將得到的情感值累加起來獲取文本的整體情感類別。劉若蘭等[7]從網(wǎng)絡(luò)爬取教材在線評論文本,將建材領(lǐng)域的情感用詞加入到通用的情感詞典上,設(shè)計(jì)適合教材評論的情感分類算法,并通過實(shí)驗(yàn)驗(yàn)證了算法的有效性。陳開望[8]使用語義相似度算法構(gòu)建適用于評教文本的情感詞典,將情感強(qiáng)度和極性數(shù)值量化,研究并實(shí)現(xiàn)了基于情感詞統(tǒng)計(jì)的情感分類算法。
此外,現(xiàn)有的基于語義詞典的方法缺乏對復(fù)雜句式的分析。因此,本文結(jié)合評教領(lǐng)域特有詞匯和評價(jià)相關(guān)網(wǎng)絡(luò)詞匯擴(kuò)展基準(zhǔn)詞匯,構(gòu)建適用于評教文本的情感詞典,并基于否定詞表、程度詞表、轉(zhuǎn)折復(fù)雜結(jié)構(gòu)詞表,設(shè)計(jì)適合評教文本的情感程度計(jì)算方法。
2 情感分析算法與建議抽取
2.1 數(shù)據(jù)預(yù)處理
2.1.1 數(shù)據(jù)清洗
評教文本具有隨意性和主觀性,非書面和非規(guī)范用語多,如:同音異字、錯(cuò)別字、拼音表達(dá)的評論等。此外,語料中摻雜冗余評論、無價(jià)值評論(如“無”,“……”等)。如果不對這些噪音數(shù)據(jù)加以處理,則會導(dǎo)致語料分詞、詞性標(biāo)注產(chǎn)生錯(cuò)誤,勢必會影響分析結(jié)果的準(zhǔn)確性,因此,執(zhí)行分詞操作前,先要執(zhí)行對原始數(shù)據(jù)的去噪操作。本文的去噪處理主要包括剔除無價(jià)值的評論和冗余評論、拼音替換、錯(cuò)別字糾正、繁簡轉(zhuǎn)換等。
2.1.2 文本分詞
文本分詞是利用工具或算法將句子分割成單獨(dú)詞的過程[9]。分詞結(jié)果的準(zhǔn)確性對后續(xù)情感分析有著不可忽視的影響。目前的分詞技術(shù)已取得很大的成功,準(zhǔn)確率得到了大幅度提高,已有很多成熟的分詞工具供開發(fā)者使用。本文采用哈爾濱工業(yè)大學(xué)研發(fā)的自然語言處理工具(language technology platform, LTP)來進(jìn)行分詞,該平臺提供了中文分詞,詞性標(biāo)注、語義依存分析等功能。在分詞準(zhǔn)確率測評中,LTP在很多數(shù)據(jù)集上都優(yōu)于其它分詞系統(tǒng)。
2.1.3 評教領(lǐng)域情感詞典構(gòu)建
國內(nèi)已經(jīng)整理出很多實(shí)用性強(qiáng)的情感詞典,其中使用最為廣泛且最具權(quán)威的是董振東教授編著的知網(wǎng)情感詞典。2007年,知網(wǎng)發(fā)布了最新版本“情感分析用詞語集(beta版)”,本文采用該詞語集中的評價(jià)詞典作為基準(zhǔn)詞典,基準(zhǔn)詞典共有6846個(gè)評價(jià)詞語,正面3730個(gè),負(fù)面3116個(gè)。教學(xué)評價(jià)中含有的一些領(lǐng)域詞匯還尚未納入通用情感詞典中,如:層次分明,治學(xué)嚴(yán)謹(jǐn),偏題,照本宣科等,將這些詞加入情感詞典,并人工標(biāo)注其情感極性。此外,隨著互聯(lián)網(wǎng)的發(fā)展,“給力”“不忍吐槽”等網(wǎng)絡(luò)流行用語層出不窮,我們將與評論相關(guān)的常用的網(wǎng)絡(luò)詞加入基準(zhǔn)詞典,形成評教領(lǐng)域情感詞典。
2.2 情感分析算法
2.2.1 特征選擇
本文選取四個(gè)特征作為識別情感和判別情感強(qiáng)度的要素:情感特征、程度副詞特征、否定詞特征、復(fù)雜句式特征。
⑴ 情感特征
情感特征是指評教文本中帶有正負(fù)情感表征的有代表性詞匯,觀點(diǎn)或情感大多由情感特征來展現(xiàn)[10]。因?yàn)榻虒W(xué)評論字?jǐn)?shù)很少,往往不超過200字,所以正負(fù)面情感詞更是決定了情感的傾向。為了定量表示詞匯的情感極性,使用數(shù)值1、-1、0來分別定量表示正、負(fù)以及中性情感特征詞匯。
⑵ 程度副詞特征
程度副詞特征用于判別情感強(qiáng)度。評教文本中含有大量的抒發(fā)自己感情的評論,如“老師講課特別認(rèn)真”,“這門課有點(diǎn)難,要投入更多時(shí)間”。情感程度被定為好或一般,其差異很大程度上取決于程度副詞的使用。漢語中的程度副詞不多,可以逐個(gè)列舉出來。藺璜[11]列出85個(gè)常見程度副詞,并將其歸至到更加細(xì)致的7個(gè)分類。本文以知網(wǎng)中文情感分析用詞中提供的程度級別詞語為基準(zhǔn),參考藺璜的常用程度副詞分類表,人工整理了一份程度副詞,并按強(qiáng)度不同將程度副詞分為了三個(gè)級別,表1展示了三個(gè)級別作用與權(quán)重。
將程度副詞的修正系數(shù)與其修飾的第一個(gè)情感詞的值相乘。程度副詞e對第i個(gè)情感詞的修正系數(shù)de(i)定義為:
其中,e為第i個(gè)情感詞起往前特定長度內(nèi)檢索到的第一個(gè)程度副詞,de(i)為程度副詞e對第i個(gè)情感詞強(qiáng)度的權(quán)重,M,N分別為第一級別和第三級別程度副詞的集合。
⑶ 否定詞特征
否定詞在評教文本情感傾向性判斷上有著重要影響,被奇數(shù)個(gè)否定詞修飾的情感詞會反轉(zhuǎn)其原有的極性。根據(jù)評教語料庫,參考郝雷紅[12]對否定副詞范圍的界定,整理出18個(gè)常見的否定詞。評教文本中可能含有多重否定的句子,若有奇數(shù)個(gè)否定詞修飾情感詞,則將該情感詞極性值乘以-1,若有偶數(shù)個(gè)或無否定詞修飾,則該情感詞極性保持不變。否定詞對第i個(gè)情感詞的修正系數(shù)定義為ne(i):
其中,cn為修飾第i個(gè)情感詞的否定副詞個(gè)數(shù)。
⑷ 復(fù)雜句式特征
根據(jù)句子的結(jié)構(gòu)可以將中文文本分為簡單結(jié)構(gòu)和復(fù)雜結(jié)構(gòu)。簡單結(jié)構(gòu)文本由主謂賓構(gòu)成,結(jié)構(gòu)簡單,情感極性單一。復(fù)雜結(jié)構(gòu)文本由多個(gè)單句通過連接詞組合,各單句情感極性可能不同的文本,如“雖然老師布置的作業(yè)有些多,但這個(gè)課程讓我受益匪淺”,句子的情感極性更加偏向于“但是”引出的單句極性,因此分析評教數(shù)據(jù)極性更加需要考慮復(fù)雜句式。本文暫不考慮復(fù)雜句式中前后單句極性相同的連接詞,給極性相反的連接詞建立轉(zhuǎn)折詞表,如“……,但”、“……,卻”、“……,只是”、“即使……,也”、“雖然……,但是”等。
算法中,將文本模式分為兩種模式,無轉(zhuǎn)折復(fù)雜結(jié)構(gòu)模式中,文本傾向與情感詞典分析極性相同。有轉(zhuǎn)折復(fù)雜結(jié)構(gòu)模式中,評論文本情感值等于第二個(gè)關(guān)聯(lián)詞后文本的情感值。
2.2.2 情感分析
評教文本大多由多個(gè)句子組成,而前后句子的情感極性很多是不一致的,但往往單句內(nèi)的情感傾向是一致的。因此本文將一條評論分成多個(gè)段,段之間由逗號、句號、感嘆號等隔開,若單段內(nèi)含有轉(zhuǎn)折連接詞,則連接的兩段合并為一段處理。以段為獨(dú)立分析單元,先使用分詞工具將單段分詞。對于確定為情感詞的詞語,將該情感詞分值與程度副詞修正系數(shù)、否定修正系數(shù)相乘得到部分情感值,然后將獨(dú)立單元內(nèi)所有部分情感值相加,從而得到該段情感值。獨(dú)立單元的情感強(qiáng)度和極性由情感值的大小和正負(fù)表示,情感分值大于零,則將該段歸類為正面情感,且絕對值越大,情感極性越強(qiáng)。評論的正面情感值則是評論各個(gè)情感值為正的獨(dú)立單元值相加,負(fù)面情感值為評論的各個(gè)情感值為負(fù)的獨(dú)立單元值相加,該評論的情感值由正負(fù)面情感差決定。獨(dú)立單元情感分值的計(jì)算方式如下:
其中qi為第i個(gè)情感詞的情感極性,正情感傾向,qi=1,負(fù)情感傾向qi=-1,ne(i)表示修飾該情感詞否定特征對qi取值的影響,de(i)表示修飾該情感詞的程度副詞對情感強(qiáng)度的影響,圖1為獨(dú)立單元的情感分值計(jì)算流程圖。
評論實(shí)例:“雖然選這門課程同學(xué)不是很多,但是老師每次講解都很細(xì)致,收獲很大”。分詞后數(shù)據(jù)為:“雖然/c選/v這/r門/q課程/n同學(xué)/n不/d是/v很/d多/a,/wp但是/c老師/n每/r次/q講解/v都/d很/d細(xì)致/a,/wp收獲/v很/d大/a”。轉(zhuǎn)折復(fù)雜結(jié)構(gòu)判斷后分析數(shù)據(jù)為:“老師/n每/r次/q講解/v都/d很/d細(xì)致/a,/wp收獲/v很/d大/a”。該評論的情感分值:
2.3 建議提取
學(xué)生評價(jià)中有直接帶強(qiáng)烈感情色彩的,也有中肯建議的。建議性評論是學(xué)生評教中的重要組成部分,是教師與學(xué)生進(jìn)行交流的重要方式。把建議提取出來反饋給教師本人,有助于提高教學(xué)質(zhì)量。參考知網(wǎng)發(fā)布的“情感分析用詞語集(beta版)”中的主張?jiān)~表,根據(jù)中文用語習(xí)慣和語料庫,人工整理了26個(gè)帶有建議特征的詞語,包括“希望,更好,建議,可以……更,能夠”等,形成建議詞表。根據(jù)構(gòu)建的建議詞表,采用匹配法抽取出評論文本中的帶建議信息的評論。
3 結(jié)論
實(shí)驗(yàn)文本選取南京理工大學(xué)研究生綜合信息系統(tǒng)存儲的4620條非空評教數(shù)據(jù)。在數(shù)據(jù)清洗階段去除相似、無意義、冗余的評論后剩余2727條,經(jīng)過人工逐條識別,具體數(shù)據(jù)信息如表2所示。
所有評價(jià)中帶有建議信息的評論有418條。將評論文本前后均為肯定的情況標(biāo)注為正情感傾向,文本前后均為否定的情況標(biāo)注為負(fù)情感傾向,一條評論中若包含兩種情感的取其中一種較為明顯的,若正負(fù)情感差值小(算法中Q<閾值y,y暫且設(shè)置為2),則歸為中性情感傾向。評論前后各段均為提建議的也統(tǒng)一標(biāo)注為中性情感傾向。圖2為南京理工大學(xué)研究生綜合管理信息系統(tǒng)的一門課程前5條評教文本,其中1,4為正面情感傾向文本,5為負(fù)面情感傾向文本,2,3為中性情感傾向評價(jià),帶有建議信息評價(jià)有2,3。
為驗(yàn)證算法準(zhǔn)確率,忽略情感強(qiáng)度,只判斷極性。采用常用指標(biāo)精確率P(precision),召回率R(recall),準(zhǔn)確率A(accuracy)對所獲得的結(jié)果進(jìn)行檢驗(yàn)。
其中判定正面情感樣本中,TP(True Positive)表示判斷正確的數(shù)目,F(xiàn)P(False Positive)表示判斷錯(cuò)誤的數(shù)目。判定負(fù)面情感樣本中,TN(True Negative)表示判斷正確的數(shù)目,F(xiàn)N(False Negative)表示判斷錯(cuò)誤的數(shù)目,得到結(jié)果如表3所示。
與傳統(tǒng)的基于詞典的情感計(jì)算方法相比,本文提出的計(jì)算規(guī)則準(zhǔn)確率得到提高。算法還存在以下問題。
⑴ 若閾值y設(shè)置過大,則會降低正負(fù)情感評論分類的準(zhǔn)確率,若閾值y過小,則會影響中性情感傾向評論的準(zhǔn)確率。
⑵ 基于詞典的分類算法準(zhǔn)確率很大依賴于情感詞典和判斷規(guī)則的質(zhì)量。
⑶ 隨著時(shí)代的發(fā)展,網(wǎng)絡(luò)新詞、舊詞新意使原有詞典中的詞匯不適用于新語言環(huán)境,算法推廣擴(kuò)展能力差。
因此,在進(jìn)后的學(xué)習(xí)中,需要探索擴(kuò)展性強(qiáng),準(zhǔn)確率更高的方法,使評價(jià)分析結(jié)果更加客觀、科學(xué)。
參考文獻(xiàn)(References):
[1] 教育部:更好發(fā)揮課程學(xué)習(xí)在研究生培養(yǎng)中的作用[J].中國大學(xué)生就業(yè),2015.5:12-13
[2] 邢政權(quán). 高校學(xué)生評教制度存在的問題及改革研究[D].西北農(nóng)林科技大學(xué),2017.
[3] 趙妍妍,秦兵,劉挺.文本情感分析[J].軟件學(xué)報(bào),2010.21(8):1834-1848
[4] Chen J Q, Zhang Y. Text Sentiment Analysis Based on Neural Networks with Language Model[J]. Modern Computer,2018.
[5] 李燕玲. BT-SVM多分類算法在教學(xué)質(zhì)量評價(jià)中的應(yīng)用[D].廣西大學(xué),2014.
[6] Yu B, Zhang L, Management S O. Chinese short text classification based on CP-CNN[J]. Application Research of Computers,2018.
[7] 劉若蘭. 教材在線評論的情感傾向性分析研究[D].新疆師范大學(xué),2017.
[8] 陳開望. 數(shù)字校園中文本情感傾向性計(jì)算方法研究[D].北方工業(yè)大學(xué),2015.
[9] 孔希希,廖述魁,程兵.基于不同分詞模式的文本分類研究[J].數(shù)學(xué)的實(shí)踐與認(rèn)識,2018.48(01):116-123
[10] Li Y, Shen B. Research on sentiment analysis of?microblogging based on LSA and TF-IDF[C]// IEEE International Conference on Computer and Communications. IEEE,2017:2584-2588
[11] Lin H, Guo S H. On the Characteristics, Range and Classification of Adverbs of Degree[J]. Journal of Shanxi University,2003.
[12] 郝雷紅.現(xiàn)代漢語否定副詞研究[D].首都師范大學(xué),2003.