肖 銳, 張鄺弋, 袁睿廷
(1. 云南大學(xué) 漢語國際教育學(xué)院,云南 昆明 650091;2. 普洱學(xué)院 學(xué)報(bào)編輯部,云南 普洱 665000)
為構(gòu)建高質(zhì)量的數(shù)字人文教育體系,應(yīng)加快推動(dòng)我國教育信息化建設(shè),為國際中文教材高質(zhì)量發(fā)展提供支撐。教材評(píng)價(jià)是讀者對(duì)教材能夠不斷適應(yīng)形勢變化下的情感態(tài)度判斷,能夠?yàn)榻滩馁|(zhì)量的提升起到促進(jìn)作用。文本情感分析是自然語言處理領(lǐng)域的一個(gè)重要分支,廣泛應(yīng)用于輿情分析和內(nèi)容推薦等方面,是國際中文教材評(píng)價(jià)重要的數(shù)字化研究手段?;跈C(jī)器學(xué)習(xí)的文本情感分析主要是指通過調(diào)用機(jī)器學(xué)習(xí)算法模型,對(duì)文本進(jìn)行數(shù)據(jù)挖掘和情感分析,其過程主要包括關(guān)鍵詞詞頻統(tǒng)計(jì)分析、詞云圖可視化展示、短評(píng)內(nèi)容情感傾向判斷等。因此文章對(duì)豆瓣讀書上國際中文教育專業(yè)教材相關(guān)的1317條網(wǎng)絡(luò)短評(píng)進(jìn)行情感分析,融合國際中文教材高質(zhì)量發(fā)展的客觀指標(biāo)和讀者評(píng)價(jià)與需求,提出國際中文教材高質(zhì)量發(fā)展的路徑。
目前中英文文本情感分析的研究主要集中于以下方面:第一,從研究內(nèi)容來看,一是關(guān)于文化對(duì)外傳播的研究,王燕等通過對(duì)《孫子兵法》的網(wǎng)絡(luò)短評(píng)進(jìn)行情感分析,為中華傳統(tǒng)文化的傳播提供了有效的建議(1)王燕,邵謐.基于Python的中國典籍對(duì)外翻譯傳播效果研究——以《孫子兵法》英譯本為例[J].外國語文,2022,(3).;劉玲玉等通過分析《流浪地球》的網(wǎng)絡(luò)短評(píng)文本,從影視文化的角度塑造中國對(duì)外國家形象(2)劉玲玉,鄧燕燕.基于Python情感分析和批評(píng)隱喻的網(wǎng)絡(luò)話語分析——以影片《流浪地球》中美德影評(píng)為例[J].江蘇大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2022,(3).;二是漢語文本情感分析算法模型的優(yōu)化,杜啟明等結(jié)合上下文和依存句法信息,提出了一種新型的中文短文文本情感分析模型(CDSI)(3)杜啟明,李男,劉文甫,等.結(jié)合上下文和依存句法信息的中文短文本情感分析[J].計(jì)算機(jī)科學(xué),2023,(3).;Botong利用卷積神經(jīng)網(wǎng)絡(luò)提升了文本情感分析的準(zhǔn)確率(4)She Botong.Deep Learning-Based Text Emotion Analysis for Legal Anomie [J].Frontiers in Psychology,2022.;Li通過將CNN模型改造為混合神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)了英文文本情感分析準(zhǔn)確率的提升(5)Ping Li.Hybrid neural network model based on multi-head attention for English text emotion analysis[J]. EAI Endorsed Transactions on Scalable Information Systems,2022,(35).;三是關(guān)于在線教學(xué)的研究,沈浩等通過對(duì)B站中彈幕文本進(jìn)行情感分析,為在線教學(xué)課程發(fā)展提供了策略和建議(6)沈浩,梁瑩.在線教學(xué)有效策略探索——基于嗶哩嗶哩網(wǎng)站在線開放課程“教育學(xué)”的彈幕文本分析[J].電化教育研究,2022,(11).;劉清堂等通過對(duì)慕課中課程短評(píng)的分析,為人文社科課程架構(gòu)設(shè)置提出了改進(jìn)意見(7)劉清堂,尹興翰,吳林靜,等.基于學(xué)習(xí)者評(píng)論數(shù)據(jù)挖掘的MOOC課程質(zhì)量影響因素研究[J].遠(yuǎn)程教育雜志,2023,(1).。第二,從研究視角來看,一是為中華傳統(tǒng)文化和影視文化的傳播提供有效的建議和策略(8)周娜,何潤奇.基于文本情感分析的文化綜藝節(jié)目綜合評(píng)價(jià)——以央視文化類綜藝節(jié)目《國家寶藏》為例[J].中南民族大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版),2019,(5).;二是提升文本情感分析的效率(9)孔韋韋,田喬鑫,滕金保,等.融合注意力機(jī)制的混合神經(jīng)網(wǎng)絡(luò)文本情感分析模型[J].電訊技術(shù),2023,(6).;三是為在線教學(xué)課程的發(fā)展和改進(jìn)提供數(shù)據(jù)支持和意見(10)李浩君,汪旭輝,廖偉霞.在線教育彈幕情感信息智能識(shí)別模型研究——融合變式情感詞典與深度學(xué)習(xí)技術(shù)[J].現(xiàn)代遠(yuǎn)距離教育,2023,(1).;第三,從研究方法來看,一是基于網(wǎng)絡(luò)短評(píng)文本的情感分析(11)劉毓,趙云閣.基于教學(xué)評(píng)價(jià)的中文短文本情感分析[J].現(xiàn)代電子術(shù),2019,(6).;二是基于上下文和依存句法信息的情感分析模型(12)楊書新,張楠.融合情感詞典與上下文語言模型的文本情感分析[J].計(jì)算機(jī)應(yīng)用,2021,(10).;三是基于卷積神經(jīng)網(wǎng)絡(luò)和混合神經(jīng)網(wǎng)絡(luò)的情感分析模型(13)高瑋軍,趙華洋,李磊,等.基于ALBERT-HACNN-TUP模型的文本情感分析[J].計(jì)算機(jī)仿真,2023,(5).。
由此可見,文本情感分析在文化傳播、在線教學(xué)以及算法模型改造方面的研究已取得了一定成果,而在國際中文教材評(píng)價(jià)領(lǐng)域的研究較為有限。因此,文章利用文本情感分析對(duì)國際中文教育專業(yè)教材的網(wǎng)絡(luò)短評(píng)進(jìn)行研究,以期對(duì)國際中文教材持續(xù)高質(zhì)量發(fā)展有所啟示。
文章的研究對(duì)象是《現(xiàn)代漢語(增訂版)》《古代漢語》《語言學(xué)綱要(修訂版)》《中國文化要略(第4版)》《跨文化交際學(xué)概論》《對(duì)外漢語教育學(xué)引論》這6套教材的豆瓣讀書網(wǎng)絡(luò)短評(píng)。為保證分析框架的科學(xué)性,本文依據(jù)國際中文教育專業(yè)學(xué)科框架,將以上6套教材分為三類:(1)漢語本體教材,包括《現(xiàn)代漢語》《古代漢語》和《語言學(xué)綱要》;(2)漢語文化教材,包括《中國文化要略》和《跨文化交際學(xué)概論》;(3)漢語教學(xué)教材為《對(duì)外漢語教育學(xué)引論》。
基于研究目的,結(jié)合國際中文教材高質(zhì)量發(fā)展的客觀指標(biāo)與要求對(duì)讀者評(píng)價(jià)與需求進(jìn)行科學(xué)分析,文章指出國際中文教材高質(zhì)量發(fā)展的路徑,我們將集中回答以下三個(gè)研究問題:
1. 讀者對(duì)國際中文教育專業(yè)教材的關(guān)注重點(diǎn)是什么?
2. 讀者對(duì)國際中文教育專業(yè)教材的情感態(tài)度是怎樣的?
3. 國際中文教育專業(yè)教材存在哪些問題?
針對(duì)第一個(gè)研究問題,我們采用詞頻統(tǒng)計(jì)的方式挖掘網(wǎng)絡(luò)短評(píng)文本內(nèi)部的語義信息,探究讀者的關(guān)注點(diǎn);另一方面,利用詞云圖展示,更直觀、立體地展示網(wǎng)絡(luò)短評(píng)的內(nèi)容,初步判斷讀者的情感態(tài)度。
針對(duì)第二個(gè)研究問題,由于傳統(tǒng)針對(duì)網(wǎng)絡(luò)短評(píng)文本情感態(tài)度的量化研究不多,文章以量化的方式對(duì)網(wǎng)絡(luò)短評(píng)內(nèi)容文本進(jìn)行打分,實(shí)現(xiàn)量化研究和質(zhì)性研究的有效結(jié)合,同時(shí)這也是本文的重點(diǎn)和難點(diǎn)所在。
針對(duì)第三個(gè)研究問題,不同讀者對(duì)相同的專業(yè)教材的評(píng)價(jià)和情感態(tài)度均有正面和負(fù)面的區(qū)別。文章對(duì)負(fù)面情感部分的短評(píng)進(jìn)行歸納總結(jié),從而明晰國際中文教育教材存在哪些問題。
在此基礎(chǔ)上,基于網(wǎng)絡(luò)短評(píng)的情感分析視角,闡釋讀者群體對(duì)國際中文教材高質(zhì)量發(fā)展的評(píng)價(jià)與需求。
1. 數(shù)據(jù)采集標(biāo)準(zhǔn)
在大數(shù)據(jù)時(shí)代,數(shù)據(jù)采集采用分布式架構(gòu)和多種技術(shù)來進(jìn)行,以適應(yīng)數(shù)據(jù)的多樣性和復(fù)雜性。短評(píng)內(nèi)容、用戶評(píng)分和推薦意見這3項(xiàng)特征具有多樣性和復(fù)雜性。為保證數(shù)據(jù)采集的科學(xué)性,文章數(shù)據(jù)采集指標(biāo)包括短評(píng)內(nèi)容、用戶評(píng)分和推薦意見。被采集的數(shù)據(jù),必須同時(shí)具備上述三項(xiàng)特征,任何一項(xiàng)特征缺失,都不予采集。數(shù)據(jù)采集時(shí),選擇合適的特征來描述數(shù)據(jù)的屬性和特點(diǎn),以保證數(shù)據(jù)的質(zhì)量和可靠性。數(shù)據(jù)采集后,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理、存儲(chǔ)、分析和挖掘等操作,提高數(shù)據(jù)的利用率和價(jià)值。
2. 數(shù)據(jù)采集及預(yù)處理
文章選取豆瓣讀書網(wǎng)絡(luò)短評(píng)作為數(shù)據(jù)源,采集過程包括:第一,自行編寫網(wǎng)絡(luò)爬蟲程序,定位到所要爬取的網(wǎng)頁,打開網(wǎng)頁源代碼分析網(wǎng)頁結(jié)構(gòu),明晰要爬取的內(nèi)容。第二,獲取對(duì)應(yīng)網(wǎng)頁的文本數(shù)據(jù)參數(shù)。第三,第一次采集到10438條短評(píng)數(shù)據(jù);第四,從已采集到的10438條數(shù)據(jù)中,剔除缺失值、異常值,實(shí)現(xiàn)第二次數(shù)據(jù)篩選,剩余2658條數(shù)據(jù);第五,使用正則表達(dá)式剔除無意義的字符和表情符號(hào)等,實(shí)現(xiàn)第三次數(shù)據(jù)清洗,剩余1317條數(shù)據(jù),將其保存為csv文件。三次采集到的數(shù)據(jù)數(shù)量如表1所示:
表1 國際中文教材網(wǎng)絡(luò)短評(píng)文本數(shù)據(jù)表
在數(shù)據(jù)分析階段,本文的分析過程如下:首先,為初步了解短評(píng)內(nèi)容,調(diào)用Python的Jieba庫對(duì)文本進(jìn)行分詞,將文本切分為有意義的詞語。利用Python并結(jié)合《中文停用詞表》去除文本停用詞,如“的”“了”“是”等,提取關(guān)鍵詞并進(jìn)行詞頻統(tǒng)計(jì),以便發(fā)現(xiàn)文本中最常出現(xiàn)的主題和觀點(diǎn)。其次,為初步了解讀者的情感傾向,在所得關(guān)鍵詞基礎(chǔ)上,調(diào)用Python中的WordCloud庫和matplotlib庫進(jìn)行詞云圖可視化展示。通過觀察詞云圖,可以大致判斷讀者對(duì)教材的評(píng)價(jià)。然后,為更深入了解讀者的情感傾向,調(diào)用Python中的SnowNLP庫對(duì)網(wǎng)絡(luò)短評(píng)進(jìn)行情感打分,并計(jì)算每條短評(píng)進(jìn)行情感分值的平均值和標(biāo)準(zhǔn)差,從而得到讀者對(duì)教材的整體情感需求。最后,通過繪制評(píng)論情感餅狀圖,考察讀者對(duì)教材的總體情感傾向。通過將情感分值按閾值分為正面和負(fù)面兩種,計(jì)算各類評(píng)論的數(shù)量和百分比,繪制出評(píng)論情感餅狀圖,以便直觀地展示讀者對(duì)教材的評(píng)價(jià)和需求。
羅燕等指出詞頻統(tǒng)計(jì)是一種詞匯分析研究方法,通過對(duì)一定長度文本的詞頻進(jìn)行統(tǒng)計(jì)、分析,進(jìn)而描繪出詞匯規(guī)律。(14)羅燕,趙書良,李曉超,等.基于詞頻統(tǒng)計(jì)的文本關(guān)鍵詞提取方法[J].計(jì)算機(jī)應(yīng)用,2016,(3).文章將通過詞頻統(tǒng)計(jì)來分析網(wǎng)絡(luò)短評(píng)文本中的關(guān)鍵詞,從而明晰短評(píng)文本的主要內(nèi)容,其中在短評(píng)中出現(xiàn)頻率均位于前三的關(guān)鍵詞如表2所示:
表2 國際中文教材網(wǎng)絡(luò)短評(píng)文本關(guān)鍵詞表
1. 漢語本體教材關(guān)鍵詞詞頻的讀者評(píng)價(jià)及其情感分析
從表2我們發(fā)現(xiàn),《現(xiàn)代漢語》短評(píng)關(guān)鍵詞出現(xiàn)頻率排名前三的是“語音”“現(xiàn)代漢語”“漢語”,這表明讀者對(duì)漢語本體知識(shí)的學(xué)習(xí)具有較高的需求。通過對(duì)搜集的短評(píng)進(jìn)行人工檢閱發(fā)現(xiàn),讀者的評(píng)價(jià)更多集中在概念表述、知識(shí)難度設(shè)置?!豆糯鷿h語》短評(píng)關(guān)鍵詞以“教材”“王力”“讀”的數(shù)量居多,表明讀者對(duì)這套教材及編者的評(píng)價(jià)熱度較高?!墩Z言學(xué)綱要》短評(píng)的關(guān)鍵詞以“語言學(xué)”“教材”“入門”的數(shù)量居多。其中“語言學(xué)”一詞表明了該教材的主要內(nèi)容和關(guān)注重點(diǎn),“入門”一詞則表明讀者對(duì)該教材內(nèi)容難度設(shè)置的態(tài)度評(píng)價(jià)。
2. 漢語文化教材關(guān)鍵詞詞頻的讀者評(píng)價(jià)及其情感分析
文化是語言產(chǎn)生的基礎(chǔ),同時(shí)語言又是文化的重要組成部分,語言和文化在發(fā)展中相互影響、相互促進(jìn),因此語言的學(xué)習(xí)離不開對(duì)與其相適應(yīng)的文化的學(xué)習(xí)和理解。從表2可知,《中國文化要略》短評(píng)關(guān)鍵詞以“考研”“文化”“中國”居多。其中“考研”表明國際中文教育專業(yè)學(xué)生對(duì)這一套教材的需求度較高,同時(shí)該套教材作為國際中文教育專業(yè)研究生入學(xué)考試的參考教材,也從側(cè)面反映出其內(nèi)容的豐富性。《跨文化交際學(xué)概論》短評(píng)關(guān)鍵詞以“跨文化”“交際”“內(nèi)容”為主,其中“跨文化”“交際”等詞表明讀者對(duì)該教材這三個(gè)主題學(xué)習(xí)的需求,也從側(cè)面反映了該教材主題的吸引力。
3. 漢語教學(xué)教材關(guān)鍵詞詞頻的讀者評(píng)價(jià)及其情感分析
語言教學(xué)是語言本體知識(shí)和語言文化知識(shí)的輸出和應(yīng)用,只有通過語言教學(xué),漢語教師才能向漢語學(xué)習(xí)者傳授漢語的本體和文化知識(shí)。從表2可知,《對(duì)外漢語教育學(xué)引論》短評(píng)關(guān)鍵詞以“書”“對(duì)外漢語”“教學(xué)”的數(shù)量居多。其中“對(duì)外漢語”表明讀者對(duì)該教材的評(píng)價(jià)頻率高,“教學(xué)”則表明讀者對(duì)該教材的需求在于教學(xué)應(yīng)用,凸顯該書教育學(xué)理論的性質(zhì)。
為了更直觀地從教材短評(píng)內(nèi)容去分析讀者的評(píng)價(jià)及其情感態(tài)度,進(jìn)一步證實(shí)關(guān)鍵詞所反映的關(guān)注重點(diǎn),文章采用可視化的詞云圖方式對(duì)教材短評(píng)的內(nèi)容進(jìn)行全面展示。詞云圖可對(duì)文本中出現(xiàn)頻率較高的主題詞進(jìn)行渲染,頻次越多字號(hào)越大,并在視覺上進(jìn)行突出,使讀者能夠直觀看到文本的關(guān)注熱點(diǎn)和主題。同時(shí)結(jié)合詞云圖中的形容詞,能夠初步探析讀者評(píng)價(jià)和情感傾向。
1. 漢語本體教材詞云圖的讀者評(píng)價(jià)及其情感分析
從《現(xiàn)代漢語》詞云圖(圖1)中,我們可以看到“修辭”“語法”“文字”等關(guān)鍵詞顯示較為明顯,說明讀者對(duì)該教材整體評(píng)價(jià)都很好,保持正面積極的情感態(tài)度,這也印證了關(guān)鍵詞詞頻分析部分所得結(jié)論。從功能用途看,“考研”一詞凸顯了該教材的獨(dú)特功能屬性。從情感色彩來看,與表2中出現(xiàn)的關(guān)鍵詞有所區(qū)別的是,圖1包含“不錯(cuò)”“細(xì)致”“喜歡”“詳細(xì)”“收獲”“認(rèn)同”“透徹”等具有正面情感態(tài)度色彩的關(guān)鍵詞,表明讀者不論是從編寫內(nèi)容上,還是在閱讀學(xué)習(xí)后的感受上,對(duì)該教材都持有正向的評(píng)價(jià)和情感。
圖1 《現(xiàn)代漢語》詞云圖
從《古代漢語》詞云圖(圖2)中,我們可以看到讀者對(duì)該教材的評(píng)價(jià)熱點(diǎn)在“文選”“注釋”“古文”“語法”“詩詞”“通論”上,因此我們可以看出,讀者對(duì)該教材全面性體現(xiàn)的評(píng)價(jià),體現(xiàn)了該教材編排的均衡性、合理性、科學(xué)性,與關(guān)鍵詞分析所得結(jié)論相同。從情感分析來看,與表2有所區(qū)別的是,詞云圖中增加了“經(jīng)典”“喜歡”“好看”“努力”等詞,由此可知讀者們對(duì)該套教材持有喜歡的情感態(tài)度。
圖2 《古代漢語》詞云圖
《語言學(xué)綱要》詞云圖(圖3)中“語音”“語法”“語用”“國際音標(biāo)”等詞表明,讀者對(duì)該教材的評(píng)價(jià)結(jié)論是整體上編排較為集中,該教材在每個(gè)章節(jié)編排比例上都有所側(cè)重,與關(guān)鍵詞頻率分析所得結(jié)論相同。從情感分析來看,與關(guān)鍵詞分析有所不同的是,詞云圖增加了“有意思”“不錯(cuò)”“喜歡”等詞。由此可見,在評(píng)價(jià)語言上,讀者對(duì)該教材持正面積極的情感態(tài)度。
圖3 《語言學(xué)綱要》詞云圖
2. 漢語文化教材詞云圖的讀者評(píng)價(jià)及其情感分析
《中國文化要略》詞云圖(圖4)中“文化”“歷史”“中國”“馬可波羅”表明,該教材的主要內(nèi)容和側(cè)重點(diǎn)與關(guān)鍵詞頻率分析所得結(jié)論總體相同。從情感態(tài)度上來看,與關(guān)鍵詞分析不同的是,詞云圖中增加了“有意思”“可讀性”“入門”“喜歡”“有趣”“很全”等詞,由此可知,讀者對(duì)該教材的評(píng)價(jià)重點(diǎn)在于關(guān)注該教材的趣味性,持有正面的情感態(tài)度。
圖4 《中國文化要略》詞云圖
如《跨文化交際學(xué)概論》詞云圖(圖5)所示,由“跨文化”“價(jià)值觀”“理論”等詞可知,該書側(cè)重于對(duì)世界不同民族的文化、價(jià)值觀等差異性的介紹。從情感色彩上來看,相比于關(guān)鍵詞分析,詞云圖中增加了“淺顯易懂”“薄薄”“印象深刻”“喜歡”“很全”等詞,由此可知,讀者對(duì)該教材的理論深度評(píng)價(jià)較多。
圖5 《跨文化交際學(xué)概論》詞云圖
3. 漢語教學(xué)教材詞云圖的讀者評(píng)價(jià)及其情感分析
《對(duì)外漢語教育學(xué)引論》詞云圖(圖6)中包括“心理學(xué)”“國際教育”“教育學(xué)”“圖式”“順應(yīng)”“第二語言”等詞,表明該書很好地體現(xiàn)了國際中文教育的交叉學(xué)科性質(zhì)以及跨學(xué)科特點(diǎn),體現(xiàn)該教材的國際中文教育專業(yè)核心教材的地位,這是在關(guān)鍵詞頻率分析基礎(chǔ)上的深入探究。從功能用途上看,由“考研”等詞可知,讀者對(duì)該教材知識(shí)深度的掌握要求較高,這與關(guān)鍵詞分析部分有所區(qū)別。從情感態(tài)度來看,詞云圖增加了“必讀”“不錯(cuò)”等詞,反映了讀者對(duì)該教材的必要性和重要性持積極肯定的情感態(tài)度。
圖6 《對(duì)外漢語教育學(xué)引論》詞云圖
為進(jìn)一步探究讀者對(duì)這6套教材的情感態(tài)度,文章調(diào)用Python中的SnowNLP庫對(duì)教材短評(píng)進(jìn)行情感打分,以數(shù)值的方式呈現(xiàn)讀者的評(píng)價(jià)傾向和情感需求,如表3所示。Python中的SnowNLP庫將從用戶總體評(píng)分均值、用戶評(píng)分樣本均值以及情感得分均值三個(gè)維度進(jìn)行分析。其中用戶總體評(píng)分均值是指豆瓣讀書中所有用戶的評(píng)分均值,用戶評(píng)分樣本均值則是指本文中抽取的用戶樣本的均值,情感得分均值則是基于Python的SnowNLP庫對(duì)短評(píng)內(nèi)容進(jìn)行打分所得。
表3 網(wǎng)絡(luò)短評(píng)文本情感得分均值
1. 漢語言本體教材的讀者情感得分及其情感分析
從表3來看,《現(xiàn)代漢語》用戶評(píng)分總體均值為0.845,用戶評(píng)分樣本均值約為0.817,情感均值得分約為0.806。由此可知:第一,三項(xiàng)特征的得分均大于0.8,進(jìn)一步證明《現(xiàn)代漢語》是一本用戶評(píng)價(jià)高、需求量大的教材。第二,特征1與特征2的均值均大于特征3,但均值差分別僅為0.039和0.011,這表明基于機(jī)器學(xué)習(xí)的情感打分具有較高的信度。
《古代漢語》用戶評(píng)分總體均值為0.92,用戶評(píng)分樣本均值約為0.91,情感均值得分約為0.75。由此可知:第一,三項(xiàng)特征的得分均大于0.7,證明《古代漢語》是一部受到廣泛關(guān)注和喜愛的教材。第二,特征1與特征2的均值大于特征3,且均超過0.9,差異較為明顯。由此可知,基于機(jī)器學(xué)習(xí)的情感評(píng)分在一定程度上與人的主觀情感還有一定差距。第三,造成明顯差異的原因主要有兩個(gè):一是算法設(shè)計(jì)問題,對(duì)存在歧義的詞難以準(zhǔn)確區(qū)分和判斷,導(dǎo)致誤差疊加;二是教材短評(píng)文本內(nèi)容的一些新詞,未曾出現(xiàn)在計(jì)算機(jī)詞庫中,也會(huì)導(dǎo)致誤差。
《語言學(xué)綱要》用戶評(píng)分總體均值為0.79,用戶評(píng)分樣本均值約為0.75,情感均值得分約為0.80。由此可知:第一,三項(xiàng)特征的得分均大于0.7,這證明《語言學(xué)綱要》的評(píng)論熱度和情感需求處于較高的數(shù)值。第二,特征1和特征3的均值大于特征2,由此可知,對(duì)該教材的樣本量選擇還存在一定問題。第三,特征1和特征3的均值差僅為0.009,證明基于機(jī)器學(xué)習(xí)的情感打分具有一定的信度。
2. 漢語文化教材的讀者情感得分及其情感分析
《中國文化要略》用戶評(píng)分總體均值為0.83,用戶評(píng)分樣本均值約為0.84,情感均值得分約為0.83。第一,三項(xiàng)特征的得分均大于0.8,這證明《中國文化要略》是一部讀者評(píng)價(jià)較好,能夠較好滿足讀者需求的教材。第二,三項(xiàng)特征的均值均在0.83~0.84左右。由此可知,這三項(xiàng)指標(biāo)都表明讀者對(duì)該套教材的肯定和認(rèn)可。
《跨文化交際學(xué)概論》用戶評(píng)分總體均值為0.75,用戶評(píng)分樣本均值約為0.76,情感均值得分約為0.82。由此可知:第一,三特征的得分均大于0.75,這證明讀者對(duì)《跨文化交際學(xué)概論》這部教材持總體持正面情感態(tài)度。第二,特征1和特征2的均值均小于特征3,這表明基于機(jī)器學(xué)習(xí)的情感評(píng)分在準(zhǔn)確度上還有所欠缺。
3. 漢語教學(xué)教材的讀者情感得分及其情感分析
《對(duì)外漢語教育學(xué)引論》用戶評(píng)分總體均值為0.82,用戶評(píng)分樣本均值約為0.87,情感均值得分約為0.79。由此可知:第一,三特征的得分均大于0.75,這表明讀者對(duì)該教材總體持正面情感態(tài)度;第二,特征1和特征2的均值均大于特征3,但特征1與特征2和特征3的均值差分別約0.05和0.03,由此可知基于機(jī)器學(xué)習(xí)的情感評(píng)分具有一定的信度。
1. 網(wǎng)絡(luò)短評(píng)讀者評(píng)價(jià)的情感分布分析
教材短評(píng)的高頻關(guān)鍵詞反映了讀者的評(píng)價(jià)熱點(diǎn),詞云圖側(cè)面證明讀者對(duì)教材的正面情感態(tài)度,從短評(píng)情感得分我們可以得到讀者對(duì)教材的具體情感態(tài)度均值。為了能夠更全面地了解讀者對(duì)這些教材的整體情感態(tài)度,我們繪制了這6套教材1317條短評(píng)的正負(fù)面情感占比餅圖,其中正面情感約為1283條,占比97%;負(fù)面情感為34條,占比3%,如圖7所示。我們對(duì)負(fù)面情感短評(píng)內(nèi)容的出現(xiàn)原因進(jìn)行分析,結(jié)合前文對(duì)讀者情感態(tài)度的總體分析,為將來國際中文教育教材的改進(jìn)提出啟示和建議。
圖7 網(wǎng)絡(luò)短評(píng)文本正負(fù)面情感評(píng)價(jià)分析占比
2. 網(wǎng)絡(luò)短評(píng)讀者評(píng)價(jià)的負(fù)面情感短評(píng)原因分析
《現(xiàn)代漢語》中,讀者和教材之間的目標(biāo)、水平、偏好等方面的不適應(yīng)和不協(xié)調(diào),導(dǎo)致讀者對(duì)這套書產(chǎn)生了質(zhì)疑的負(fù)面情感。這些原因反映出讀者對(duì)現(xiàn)代漢語教學(xué)讀物的高要求和動(dòng)態(tài)性需求,也反映了該教材在現(xiàn)代漢語教學(xué)讀物方面的不足。
《古代漢語》中,讀者期待書籍在內(nèi)容上能夠兼顧本體知識(shí)與傳統(tǒng)文化的關(guān)系,同時(shí)具有適應(yīng)現(xiàn)代語言環(huán)境和學(xué)術(shù)發(fā)展的特點(diǎn),但是《古代漢語》在上述內(nèi)容上與讀者的期待存在一定差距,因此讀者對(duì)這套教材產(chǎn)生了質(zhì)疑和負(fù)面評(píng)價(jià)?!墩Z言學(xué)綱要》中讀者關(guān)注的重點(diǎn)在于語言學(xué)的時(shí)效性;語言的應(yīng)用性以及多樣性;語言的普遍性以及跨文化性,而該教材在上述內(nèi)容的闡述中存在缺失和不足,因此造成了讀者與作者之間認(rèn)知上的差異,從而導(dǎo)致了負(fù)面情感短評(píng)的產(chǎn)生。 《對(duì)外漢語教育學(xué)引論》中讀者在教材的物理品質(zhì)、內(nèi)容以及評(píng)價(jià)標(biāo)準(zhǔn)方面與作者有不同的觀點(diǎn)。讀者更希望從教材中獲取更多的教學(xué)技巧和方法,而不僅僅是了解理論知識(shí);同時(shí)該書未能動(dòng)態(tài)反映國際中文教育發(fā)展的趨勢和前沿問題,因此導(dǎo)致了負(fù)面情感短評(píng)的產(chǎn)生。《中國文化要略》中讀者和作者之間的期待、目標(biāo)、標(biāo)準(zhǔn)等方面存在差異和沖突,造成讀者對(duì)這本書產(chǎn)生了質(zhì)疑和批評(píng)。這些原因反映了讀者對(duì)中國文化普及讀物的高標(biāo)準(zhǔn)和多元需求,也反映了在中國文化普及讀物方面的局限和挑戰(zhàn)。《跨文化交際學(xué)概論》中讀者對(duì)該教材的質(zhì)疑主要集中在知識(shí)水平與閱讀需求不匹配、書中觀點(diǎn)與作者觀點(diǎn)不一致上。一部分讀者認(rèn)為,書中的內(nèi)容過于主觀,缺乏客觀和公正的視角,沒有充分考慮到不同文化背景和價(jià)值觀的差異和多樣性等。
大數(shù)據(jù)技術(shù)和網(wǎng)絡(luò)環(huán)境變化的不斷加速,為國際中文教材高質(zhì)量發(fā)展創(chuàng)造了新的機(jī)遇和挑戰(zhàn)。為不斷滿足讀者對(duì)國際中文教材高質(zhì)量發(fā)展的迫切需求,需明晰教材評(píng)價(jià)與讀者評(píng)價(jià)和需求之間的關(guān)系,從而提出有效的國際中文教材高質(zhì)量發(fā)展路徑。因此文章國際中文教材高質(zhì)量發(fā)展的語言準(zhǔn)確性、語言實(shí)用性、文化適應(yīng)性、教學(xué)可操作性、信息化應(yīng)用、反饋機(jī)制、教學(xué)資源豐富性、全球視野和考試對(duì)接等9個(gè)客觀指標(biāo),得出當(dāng)前讀者群體對(duì)國際中文教材高質(zhì)量發(fā)展的評(píng)價(jià)與需求,主要結(jié)論如下:
(1)從語言準(zhǔn)確性和實(shí)用性看,《語言學(xué)綱要》存在個(gè)別語法規(guī)則不明確、詞匯范圍不充分等不足。
(2)從文化適應(yīng)性和全球視野看,《中國文化要略》等教材缺乏對(duì)多元文化、跨文化交流的關(guān)注。
(3)從教學(xué)可操作性看,《對(duì)外漢語教育學(xué)引論》在教學(xué)方法、教學(xué)設(shè)計(jì)方面難度較高。
(4)從信息化應(yīng)用看,《現(xiàn)代漢語》《古代漢語》等教材的網(wǎng)絡(luò)平臺(tái)、多媒體資源應(yīng)用不足。
(5)從教學(xué)資源豐富性看,《跨文化交際學(xué)概論》缺乏實(shí)例分析、案例討論等資源。
(6)從反饋機(jī)制和考試對(duì)接看,仍需進(jìn)一步提升讀者反饋收集與處理、考試內(nèi)容與標(biāo)準(zhǔn)匹配度等。
基于以上研究結(jié)論,文章提出以下國際中文教材高質(zhì)量發(fā)展路徑:
(1)完善教材編寫標(biāo)準(zhǔn),明確語法規(guī)則,擴(kuò)充詞匯范圍,提高語言準(zhǔn)確性和實(shí)用性。為了達(dá)到這個(gè)目標(biāo),教材編寫者應(yīng)該多參考國際中文教學(xué)的最新研究成果和規(guī)范,避免語法錯(cuò)誤和歧義,選擇適合不同水平和背景的學(xué)習(xí)者的詞匯,注重語言的功能和交際效果,提供豐富的語言實(shí)踐和練習(xí)機(jī)會(huì)。
(2)增加多元文化、跨文化交流的內(nèi)容,培養(yǎng)學(xué)習(xí)者的文化適應(yīng)性和全球視野。為了達(dá)到這個(gè)目標(biāo),教材編寫者應(yīng)該充分考慮學(xué)習(xí)者的文化多樣性和差異,尊重和包容不同的文化觀點(diǎn)和價(jià)值觀,提供多文化背景語言材料,引導(dǎo)學(xué)習(xí)者了解和比較中華文化與其他文化,培養(yǎng)學(xué)習(xí)者的跨文化意識(shí)和溝通能力。
(3)降低教學(xué)難度,提供教學(xué)方法、教學(xué)設(shè)計(jì)的指導(dǎo),增強(qiáng)教學(xué)可操作性。為了達(dá)到這個(gè)目標(biāo),教材編寫者應(yīng)該根據(jù)學(xué)習(xí)者的實(shí)際水平和需求,合理安排教材的難易程度和進(jìn)度,避免過于抽象或復(fù)雜的內(nèi)容和表達(dá),提供清晰的教學(xué)目標(biāo)、步驟和評(píng)價(jià)標(biāo)準(zhǔn),激發(fā)學(xué)習(xí)者的主動(dòng)性和創(chuàng)造性。
(4)利用信息化技術(shù),開發(fā)網(wǎng)絡(luò)平臺(tái)、多媒體資源,豐富教學(xué)手段和形式。為了達(dá)到這個(gè)目標(biāo),教材編寫者應(yīng)該充分利用現(xiàn)代信息技術(shù)的優(yōu)勢,建立與教材內(nèi)容相配套的網(wǎng)絡(luò)平臺(tái),提供多種形式和類型的多媒體資源,如音頻、視頻、圖片、動(dòng)畫、游戲等,增加教材的互動(dòng)性和趣味性,拓展學(xué)習(xí)者的學(xué)習(xí)渠道。
(5)提供實(shí)例分析、案例討論等教學(xué)資源,增加學(xué)習(xí)者的參與度和興趣。為了達(dá)到這個(gè)目標(biāo),教材編寫者應(yīng)該結(jié)合實(shí)際情況和熱點(diǎn)話題,選擇具有代表性和啟發(fā)性的實(shí)例分析和案例討論,展示語言知識(shí)和技能在運(yùn)用中的效果和問題,引導(dǎo)學(xué)習(xí)者進(jìn)行深入思考和討論,培養(yǎng)學(xué)習(xí)者的批判性思維和問題解決能力。
(6)建立有效的反饋機(jī)制,收集和處理讀者反饋,調(diào)整教材內(nèi)容和結(jié)構(gòu),提高考試內(nèi)容與標(biāo)準(zhǔn)的匹配度。為了達(dá)到這個(gè)目標(biāo),教材編寫者應(yīng)該建立與讀者之間的良好溝通渠道,定期收集讀者對(duì)教材使用情況、滿意度、建議等方面的反饋信息,并及時(shí)進(jìn)行分析和處理,根據(jù)反饋結(jié)果對(duì)教材進(jìn)行必要的修改和完善。同時(shí),教材編寫者也應(yīng)該關(guān)注國際中文教學(xué)的考試體系和標(biāo)準(zhǔn),確保教材內(nèi)容與考試內(nèi)容的一致性和適應(yīng)性,幫助學(xué)習(xí)者提高考試成績和水平。
讀者評(píng)價(jià)與需求是國際中文教材建設(shè)的重要依據(jù)和動(dòng)力,能夠推動(dòng)國際中文教材語言準(zhǔn)確性、語言實(shí)用性、文化適應(yīng)性、教學(xué)可操作性、信息化應(yīng)用等發(fā)生系統(tǒng)性變革,逐步構(gòu)建更適應(yīng)全球視野和考試對(duì)接的高質(zhì)量發(fā)展過程。國際中文教材是否具有實(shí)用性、趣味性和教育價(jià)值等特征,可以通過分析不同地區(qū)、年齡、專業(yè)等學(xué)習(xí)者的需求特點(diǎn),采用多種媒介語和多種媒介物,利用信息化技術(shù)提供智能化和個(gè)性化學(xué)習(xí)服務(wù)。融合讀者評(píng)價(jià)與需求下的國際中文教材高質(zhì)量發(fā)展將更加貼近目標(biāo)群體,反映時(shí)代變化,增強(qiáng)交際效果,提高學(xué)習(xí)興趣,促進(jìn)文化理解。讀者評(píng)價(jià)與需求為國際中文教材的高質(zhì)量發(fā)展提供了依據(jù),但是在更微觀層面的問題上還需要繼續(xù)深入探討。