国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于MOOC課程評論的話題挖掘與情感分析研究

2020-09-02 06:31田娜周驛
軟件導(dǎo)刊 2020年8期
關(guān)鍵詞:文本挖掘情感分析

田娜 周驛

摘 要:為了深入挖掘與分析在線課程評論文本,探索學(xué)習(xí)者參與在線課程學(xué)習(xí)時關(guān)注的話題及其情感態(tài)度,為提高在線課程質(zhì)量提供幫助。首先采用詞頻分析方法,實現(xiàn)對學(xué)習(xí)者在線課程評論內(nèi)容的整體認識;然后利用非監(jiān)督學(xué)習(xí)方法潛在狄利克雷分布主題模型對評論文本信息的特征結(jié)構(gòu)、語義內(nèi)容進行自動挖掘和分析,得到學(xué)習(xí)者的關(guān)注話題;最后對每個話題的課程評論文本進行情感傾向分析,得到學(xué)習(xí)者的情感傾向分布。實驗結(jié)果表明,在參與課程學(xué)習(xí)的過程中,學(xué)習(xí)者主要關(guān)注教師授課、課程內(nèi)容和學(xué)習(xí)資源3個話題。情感分析結(jié)果顯示,學(xué)習(xí)者對于該課程普遍表示滿意和贊賞,但是對于該課程學(xué)習(xí)資源表達了較多負面情感。

關(guān)鍵詞:MOOC;文本挖掘;LDA;情感分析;主題模型

DOI:10. 11907/rjdk. 192449 開放科學(xué)(資源服務(wù))標識碼(OSID):

中圖分類號:TP301文獻標識碼:A 文章編號:1672-7800(2020)008-0019-05

Abstract:In this paper, the review text of online courses is deeply mined and analyzed with the aim to explore the topics and emotional attitudes that learners are interested in when participating in online courses, and help improve the quality of online courses. Firstly, the word frequency analysis method is adopted to overall understand the review content of learners online courses, and then the LDA topic model is used to automatically mine and analyze the characteristic structure and semantic content of the review text information, so as to obtain the topic of learners attention. Finally, the text of course review on each topic is analyzed to get the distribution of learners sentiment tendency. The experimental results show that in the process of participating in the course learning, learners mainly pay attention to the teachers teaching, course content and learning resources. The result of sentiment analysis shows that learners generally express satisfaction and appreciation for the course, but express negative feelings on the learning resources of the course.

Key Words: MOOC; text mining; LDA; sentiment analysis; topic modeling

0 引言

知識經(jīng)濟時代,越來越多人選擇通過在線學(xué)習(xí)提高自身知識水平,由此,MOOC得到迅速發(fā)展并成為國內(nèi)外學(xué)者研究的熱點話題。在線課程平臺開放性、資源共享性以及學(xué)習(xí)時間、地點的不受限性等,吸引了大量學(xué)習(xí)者投入到在線學(xué)習(xí)中來。MOOC學(xué)習(xí)者在參與在線課程學(xué)習(xí)過程中,產(chǎn)生了各種學(xué)習(xí)行為數(shù)據(jù),這些數(shù)據(jù)真實地反映了學(xué)習(xí)者在學(xué)習(xí)過程中的狀態(tài)[1]。以往對傳統(tǒng)課堂教學(xué)中的學(xué)習(xí)者數(shù)據(jù)進行分析研究,需要依靠特定人員對課堂學(xué)習(xí)者進行觀察、記錄和整理,不僅需要耗費大量的人工成本,而且記錄的數(shù)據(jù)完全依賴于人的主觀判斷,不具有客觀性,會造成研究結(jié)果不準確。目前,教育數(shù)據(jù)挖掘集中于分析并解釋學(xué)習(xí)數(shù)據(jù),運用多種方法(如文本分析、語義分析、回歸分析等)實現(xiàn)學(xué)習(xí)分析目的。比如學(xué)習(xí)效果預(yù)測、學(xué)習(xí)者學(xué)業(yè)預(yù)警、學(xué)習(xí)效果影響因素、學(xué)習(xí)資源和學(xué)習(xí)路徑推薦等。因此,運用適當(dāng)?shù)臄?shù)據(jù)挖掘技術(shù)對學(xué)習(xí)數(shù)據(jù)進行分析,可以發(fā)現(xiàn)潛在的、有價值的信息,可以更好地支持在線開放課程的設(shè)計、實施、評價,幫助教師組織教學(xué)活動、完善教學(xué)內(nèi)容和教學(xué)過程[2],同時也可以幫助在線學(xué)習(xí)平臺進一步完善基礎(chǔ)建設(shè),提升學(xué)習(xí)者學(xué)習(xí)體驗。

以往的學(xué)習(xí)分析技術(shù)主要側(cè)重于結(jié)構(gòu)化數(shù)據(jù)分析,比如學(xué)習(xí)者觀看視頻時長、參與討論次數(shù)、考試成績得分等。如郭欣悅[3]通過對課程學(xué)習(xí)者學(xué)習(xí)行為類型進行梳理,構(gòu)建多元學(xué)習(xí)分析框架以分析學(xué)習(xí)者學(xué)習(xí)趨勢;羅恒等[4]通過利用Google Analytics網(wǎng)站流量分析工具收集與分析賓夕法尼亞州立大學(xué)一門開放課程中的網(wǎng)站流量數(shù)據(jù),揭示了高校開放課程中學(xué)習(xí)者社群和學(xué)習(xí)行為總體特點及演變趨勢。但是,對于一些非結(jié)構(gòu)化的交互式文本數(shù)據(jù),比如學(xué)習(xí)者參與討論、進行課程評論、發(fā)送視頻彈幕、進行答疑等數(shù)據(jù)缺乏相應(yīng)研究[5]。通過對在線學(xué)習(xí)平臺上交互文本的挖掘與分析,可以反映出學(xué)習(xí)者的關(guān)注話題、情感傾向、在線學(xué)習(xí)體驗,有助于優(yōu)化在線教育教學(xué)。目前,一些研究小組和機構(gòu)已開展了許多相關(guān)研究。例如,Wanli等[6]通過對學(xué)習(xí)者論壇發(fā)帖內(nèi)容中的情感進行量化分析,探索情緒對學(xué)生輟學(xué)率的影響;Gianluca等[7]設(shè)計了RAMS學(xué)習(xí)分析系統(tǒng),通過對Moodle平臺討論論壇的數(shù)據(jù)進行主題聚類和情感分析,得到學(xué)習(xí)者的總體情感傾向以及在不同時間段論壇情感變化情況,進而得到學(xué)習(xí)者對該課程的滿意度,實驗證明,該系統(tǒng)可以有效進行自動化、實時的學(xué)習(xí)分析;羅玉萍等[8]以煙臺大學(xué)評教數(shù)據(jù)為實驗數(shù)據(jù),基于語義分析技術(shù)挖掘?qū)W生留言的情感傾向,生成教師評價摘要;吳林靜等[9]通過分析愛課程上的4門課程評論,提出面向大數(shù)據(jù)的慕課評論語義分析模型,并將慕課評論分為內(nèi)容相關(guān)類、情感相關(guān)類和其它類。

綜上所述,針對學(xué)習(xí)過程中的文本數(shù)據(jù)相關(guān)研究還不深入,比如關(guān)于課程評論文本的研究。很少有研究利用合適的數(shù)據(jù)挖掘方法對評論文本進行聚類和情感分析,找出學(xué)習(xí)者關(guān)注的話題及情感傾向,學(xué)習(xí)者對于課程內(nèi)容本身、教師教學(xué)方式、在線課程平臺、學(xué)習(xí)資源等的需求不能得到很好體現(xiàn)。因此,本文在已有研究基礎(chǔ)上,提出一種基于話題的情感分析方法。首先,通過數(shù)據(jù)采集軟件,采集并預(yù)處理中國大學(xué)MOOC平臺上某課程的課程評論信息;經(jīng)過預(yù)處理之后利用LDA主題模型對其進行話題挖掘,最后對聚類之后每個話題的評論文本進行情感分析,得到學(xué)習(xí)者關(guān)于每個話題的情感傾向。

1 數(shù)據(jù)收集與預(yù)處理

1.1 數(shù)據(jù)收集

挖掘在線課程評論的隱含信息,前提是獲取在線課程評論數(shù)據(jù)。本文數(shù)據(jù)來源于中國大學(xué)MOOC平臺上某課程評論區(qū)的學(xué)習(xí)者評論數(shù)據(jù),該課程作為多次榮登中國大學(xué)MOOC十佳課程的精品課程,其參與人數(shù)眾多,有著豐富的交互數(shù)據(jù),有利于實驗的進行。目前獲取網(wǎng)頁數(shù)據(jù)的方法主要有兩種:一是通過編寫代碼進行網(wǎng)頁爬蟲,二是采用已有商業(yè)爬蟲軟件獲取數(shù)據(jù)。本文使用八爪魚采集器采集該課程評論區(qū)的文本數(shù)據(jù),截至課程結(jié)束,共爬取評論數(shù)據(jù)6 084條,去除無用及重復(fù)數(shù)據(jù)后,實際得到數(shù)據(jù)5 778條。數(shù)據(jù)主要內(nèi)容有:評論人名稱、評論內(nèi)容、評論時間。

1.2 數(shù)據(jù)預(yù)處理

1.2.1 數(shù)據(jù)去重

問題數(shù)據(jù)可能對數(shù)據(jù)的完整性和合理性造成影響,從而影響數(shù)據(jù)分析結(jié)果[10]。因此,在進行文本主題抽取和情感分析之前,至關(guān)重要的步驟是對采集到的數(shù)據(jù)進行預(yù)處理。本文以每條評論文本為基本單位進行處理,由于學(xué)習(xí)者評論中經(jīng)常會反復(fù)提到相同的詞,這些詞表達的意義基本相同,比如:“好好好”“喜歡喜歡”之類的評價語句,如果直接使用這些語句進行主題抽取,會對實驗的準確性造成很大影響。因此,在對數(shù)據(jù)進行預(yù)處理時首先要對評論文本去重。常見的文本去重方法大多以計算文本之間的相似度為基礎(chǔ)。由于此實驗中的文本數(shù)據(jù)為短文本,重復(fù)文本大都是相同的詞語或單個字,因此采用機械壓縮取詞的方法,將完全重復(fù)的文本壓縮成單個詞語或字。

1.2.2 中文分詞及去停用詞

與英文文本以空格區(qū)分詞不同,在中文文本中,詞與詞之間的界限比較模糊,直接區(qū)分較為困難,要得到更為準確的分析結(jié)果,必須采用合適的工具進行中文分詞。本實驗首先利用中科院ICTCLAS分詞系統(tǒng)對采集到的課程評論文本進行分詞。然后,利用停用詞表剔除文本中停用詞、噪音詞、低頻詞和特殊符號(本文所用停用詞表是將哈爾濱工業(yè)大學(xué)停用詞表、四川大學(xué)停用詞表進行合并去除重復(fù)詞之后得到的停用詞表)。

2 相關(guān)研究方法

2.1 LDA主題模型

Blei等[11]于2003年提出LDA模型,主要被用于推測文檔主題分布并挖掘大規(guī)模文檔集中潛在語義知識。它以概率分布的形式表現(xiàn)文檔集中每篇文檔的主題,在對文檔的主題分布進行分析后,能夠利用主題分布實現(xiàn)主題聚類或文本分類。其基本思想是:文本由若干個主題混合生成,每一個主題又由若干個特征詞構(gòu)成 [12]。LDA模型如今已被廣泛應(yīng)用于多個領(lǐng)域,比如個性化資源推薦、社交網(wǎng)絡(luò)互動、新聞?wù)?。隨著教育數(shù)據(jù)挖掘研究的不斷深入,LDA成為教育數(shù)據(jù)分析的新方法,打破了以往文本分析研究主要依賴主觀經(jīng)驗判斷的限制,給學(xué)習(xí)分析研究提供了新的思路與方法。

LDA模型認為,從文檔主題分布中抽取一個主題,然后從抽取到的主題所對應(yīng)的單詞中抽取一個單詞,將此過程重復(fù)N次,就可以生成一篇有N個詞的文檔[13]。其生成過程如圖1所示。

根據(jù)LDA模型,可以計算出文檔中主題—詞匯概率分布矩陣,更加細粒度地表示學(xué)習(xí)者在參與在線課程討論時關(guān)注的話題,為課程評論文本分析提供自動化支持。

2.2 文本情感分析

文本情感分析也稱意見挖掘,可以認為,情感分析就是利用計算機技術(shù),對帶有情感色彩的文本進行提取、分析、處理、歸納和推理,以幫助用戶獲取有效信息的過程[14]。最初的情感分析主要是對帶有情感色彩詞語的分析,比如“漂亮”是表示褒義的詞語,而“丑陋”是表示貶義的詞語。目前,研究者們對于情感分析的研究已經(jīng)逐漸轉(zhuǎn)向句子級、篇章級以及詞語級的分析。文本情感分析方法主要分為機器學(xué)習(xí)方法和基于詞典的方法。機器學(xué)習(xí)方法的準確率高但是需要對原始數(shù)據(jù)進行人工標注,不僅耗時秏力,而且人工標注數(shù)據(jù)的結(jié)果會直接影響到分析的準確性;而基于詞典的方法不需要人工標注,主要對經(jīng)過預(yù)處理后文本中的情感詞與情感詞典中的詞進行匹配得到文本的情感傾向,但是由于詞匯在不同情境下可能會表現(xiàn)出不同的情感傾向,比如“他跑得好快”中“快”是褒義的,而在“電池耗電快”中“快”是貶義的。因此,采用情感詞典進行情感分析雖然簡便,但會由于一些詞語的多義性造成分析結(jié)果不穩(wěn)定。本實驗主要采用ROST Content Mining作為情感分析工具,通過對課程評論文本話題進行情感分析,找出學(xué)習(xí)者關(guān)注話題的情感傾向性分布,為后續(xù)課程建設(shè)提供建議。

3 數(shù)據(jù)分析

3.1 基于TF_IDF的詞頻分析

對在線課程評論文本數(shù)據(jù)進行預(yù)處理后,根據(jù)TF_IDF(Term Frequency-Inverse Document Frequency,詞頻—逆文檔頻率)方法計算評論文本的特征項權(quán)重,其中TF表示詞條在文檔中出現(xiàn)的頻率,IDF是詞條普遍重要性的度量。TF_IDF的計算如式(1)所示。

運用Python對文本數(shù)據(jù)進行特征權(quán)重計算,最終得到評論文本詞頻權(quán)重排名前 20的高頻關(guān)鍵詞,如表1所示。

對詞頻權(quán)重統(tǒng)計結(jié)果分析可以發(fā)現(xiàn),在線課程評論文本中,出現(xiàn)頻率較高的詞是“老師”“課程”“python”“講解”等。這些詞匯表明了學(xué)習(xí)者對本門課程的授課教師以及教師授課方式的肯定和支持。而從 “內(nèi)容”“實例”“代碼”“課件”等詞匯可以看出,除授課教師外,學(xué)習(xí)者也關(guān)注該課程內(nèi)容、學(xué)習(xí)資源。并且,反映學(xué)習(xí)者參與在線課程學(xué)習(xí)體驗的詞也較多,比如“很棒”“有趣” “詳細”“感謝”等,從這些詞匯看,大部分學(xué)習(xí)者對參與該課程學(xué)習(xí)的總體態(tài)度是比較正面的。

3.2 基于LDA的課程評論話題挖掘

利用LDA主題模型挖掘課程評論文本中的隱含話題,為實施針對性學(xué)習(xí)干預(yù)和教學(xué)反饋提供數(shù)據(jù)支撐。目前,對于LDA的主題數(shù)目沒有最優(yōu)解,一般是通過人工調(diào)參解決。本實驗對預(yù)處理后的評論文本進行主題建模后,通過事先設(shè)置主題數(shù)目、進行主題模型訓(xùn)練、觀察主題訓(xùn)練結(jié)果、手動調(diào)整參數(shù)、優(yōu)化主題數(shù)目的方法確定主題數(shù)目。實驗發(fā)現(xiàn),當(dāng)[α]=0.6,[β]=0.1,話題數(shù)K=3 時,實驗效果最佳,如表2所示。

由表2可見,學(xué)習(xí)者進行在線課程學(xué)習(xí)時主要關(guān)注3個話題。從話題1的單詞概率分布情況,可推測出此話題主要集中于教師授課方式。教師授課風(fēng)格得到了學(xué)習(xí)者的認同和贊賞,認為教師講課很棒,講解詳細、清晰,注重基礎(chǔ);從話題2的單詞概率分布情況可知,此話題主要關(guān)注在線課程內(nèi)容。學(xué)習(xí)者認為編程課程有用,課程內(nèi)容適合零基礎(chǔ)學(xué)習(xí)者學(xué)習(xí),達到了學(xué)習(xí)者對于Python學(xué)習(xí)的期望,并對后續(xù)課程充滿期待。最后,從話題3的單詞分布概率可以看出,學(xué)習(xí)者在學(xué)習(xí)課程之后能夠有收獲,但是對于該課程的衍生性學(xué)習(xí)資源,比如課件、課程視頻以及習(xí)題等,學(xué)習(xí)者表達了“太短”“聽不懂”等負面情緒,說明學(xué)習(xí)者對該課程的學(xué)習(xí)資源表示關(guān)注。因此,將學(xué)習(xí)者對于在線課程的關(guān)注點歸納為:教師授課、課程內(nèi)容、學(xué)習(xí)資源3個方面。

3.3 課程評論情感傾向性分析

本文以ROST Content Mining作為情感分析工具,通過對在線學(xué)習(xí)者參與課程評論文本進行情感分析,旨在挖掘?qū)W習(xí)者對于課程的滿意度情況,以便對課程進行改進和完善。首先利用該軟件對每條評論文本進行情感分析并賦值,然后用該數(shù)值判斷學(xué)習(xí)者的情感傾向。該數(shù)值為正表示積極情緒,數(shù)值為0表示中性情緒,而數(shù)值為負表示消極情緒。為了更為精確地表示在線學(xué)習(xí)者的情感傾向,積極情緒又被分為一般(0~15)、中度(15~25)和高度(25以上)3種程度;消極情緒被分為一般(-15~0)、中度(-25~-15)和高度(-25以下)3種程度。

3.3.1 在線課程評論整體情感分析

利用ROST Content Mining 對課程評論文本進行情感分析的詳細結(jié)果如表3所示,學(xué)習(xí)者對該課程的積極情感占據(jù)絕大部分,表明大多數(shù)學(xué)習(xí)者對于該課程表示滿意,中性情緒和消極情感共占12.79%,表明部分學(xué)習(xí)者對該課程感到不滿意,該課程還有需要改進的地方。

3.3.2 話題情感分析

選取課程學(xué)習(xí)資源、課程內(nèi)容、教師授課3個話題的評論文本分別作情感分析,可以反映學(xué)習(xí)者關(guān)注的該課程3個話題的情感傾向,分析結(jié)果如表4所示。由表4可知,教師授課因素的積極情緒明顯高于課程內(nèi)容和學(xué)習(xí)資源因素,達到93.57%,即學(xué)習(xí)者對該課程的授課教師本人、教師的教學(xué)方式、教師講課水平等滿意度較高,說明該課程的授課教師是學(xué)習(xí)者表達積極情緒的主要原因;學(xué)習(xí)者積極情緒較高的還有課程內(nèi)容因素,體現(xiàn)為高度、中度和一般的積極情緒占比分別為15.26%、21.98%和50.06%,都高于該因素下的消極情緒和中性情緒;與教師授課以及課程內(nèi)容因素的積極情緒相比,學(xué)習(xí)資源因素的積極情緒只有70.99%,中性情緒和消極情緒與前兩者相比有明顯增加,說明學(xué)習(xí)者對本課程的學(xué)習(xí)資源(如課程作業(yè)、學(xué)習(xí)資料、作業(yè)平臺等)表現(xiàn)出不滿意的消極情緒,直接降低了課程評分。

簡言之,在3個話題中,教師授課和課程內(nèi)容是學(xué)習(xí)者在本課程學(xué)習(xí)中的主要關(guān)注點,是課程評分高低的核心參考因素,而學(xué)習(xí)資源是學(xué)習(xí)者表達中性情緒和消極情緒的主要因素。因此,在后續(xù)課程設(shè)計中,教學(xué)設(shè)計者要著力于提高該課程衍生性學(xué)習(xí)資源質(zhì)量。

4 結(jié)論及建議

隨著在線開放課程的迅速普及,在線課程評論數(shù)量也呈迅猛增長趨勢,這些信息直接或間接地表達了學(xué)習(xí)者對于參與課程的情感態(tài)度。因此,從這些信息中挖掘他們的關(guān)注重點和情感態(tài)度對于促進個性化學(xué)習(xí)、提供有效學(xué)習(xí)支持服務(wù)具有重要意義。本文以中國大學(xué)MOOC平臺中某課程的評論文本為研究對象,從文本挖掘方式入手,采用LDA主題模型建模和情感分析方法,探索在線課程學(xué)習(xí)過程中學(xué)習(xí)者的關(guān)注重點以及每個話題的情感傾向。

通過實驗發(fā)現(xiàn),在線課程學(xué)習(xí)者主要關(guān)注課程內(nèi)容、教師授課方式以及學(xué)習(xí)資源3個方面。課程內(nèi)容、教師授課方式是學(xué)習(xí)者表現(xiàn)積極情緒的主要原因,而對于該課程的學(xué)習(xí)資源,學(xué)習(xí)者表達的負面情感較多。這些結(jié)果將有助于教師改善教學(xué)設(shè)計,有助于平臺開發(fā)人員完善學(xué)習(xí)平臺功能建設(shè),提供更好的用戶體驗,還可以幫助學(xué)習(xí)者直觀地了解該課程的基本情況,以決定是否參與該課程的學(xué)習(xí)。在已有研究基礎(chǔ)上,本文提出如下建議:

(1)關(guān)注課程資源及衍生性學(xué)習(xí)資源。課程資源以及課程運行過程中產(chǎn)生的衍生性學(xué)習(xí)資源作為每一門在線課程不可或缺的一部分,其完整性、時效性和豐富性是該資源能否得到學(xué)習(xí)者積極評價以及影響學(xué)習(xí)者持續(xù)學(xué)習(xí)的主要原因。學(xué)習(xí)者對于學(xué)習(xí)資源的評價內(nèi)容直接指出了該課程資源在內(nèi)容設(shè)置、資源制作等方面存在的問題,對課程資源以及相應(yīng)衍生性學(xué)習(xí)資源進行持續(xù)優(yōu)化和更新,能夠幫助提升學(xué)習(xí)者的在線學(xué)習(xí)體驗。

(2)教師教學(xué)行為提升。對該課程進行研究發(fā)現(xiàn),絕大部分學(xué)習(xí)者對于該課程授課教師表達了積極情感,說明該教師的授課方式、語言表達符合學(xué)習(xí)者的要求。學(xué)習(xí)者參與課程學(xué)習(xí)雖多是出于對該課程內(nèi)容的興趣,但是教師的授課、演示以及其它教學(xué)行為帶來的正面影響,對于學(xué)習(xí)者參與課程討論、思考學(xué)習(xí)內(nèi)容、教師與學(xué)習(xí)者的深層交互以及學(xué)習(xí)者知識建構(gòu)等具有重要意義。比如,教師可以針對重要內(nèi)容設(shè)置相應(yīng)問題,鼓勵并引導(dǎo)學(xué)習(xí)者參與在線討論及課后作業(yè),積極解決學(xué)習(xí)者存在的困難,以促進學(xué)習(xí)者的學(xué)習(xí)。

(3)重視課程評價。課程評價作為在線課程學(xué)習(xí)的重要組成部分,是研究者通過課程評價數(shù)據(jù)進行觀點挖掘或者學(xué)習(xí)分析的重要資源。目前,在線學(xué)習(xí)平臺建設(shè)正如火如荼,但更多集中于學(xué)習(xí)資源建設(shè)方面,而課程評價較少引起注意,雖然幾乎每門課程都有相應(yīng)的評價模塊,參與課程的學(xué)習(xí)者數(shù)量多達十萬,但是得到的評價數(shù)量卻相對較少,且評價維度相對單一。為了深入挖掘分析在線學(xué)習(xí)者關(guān)注的話題和情感傾向,可以鼓勵學(xué)習(xí)者從多維度、不同方面對課程進行評價,從而獲取學(xué)習(xí)者的觀點態(tài)度,并對課程進行改進。

5 結(jié)語

本文通過利用LDA主題模型和情感分析相結(jié)合的方法對學(xué)習(xí)者評論數(shù)據(jù)進行挖掘與分析,獲取學(xué)習(xí)者關(guān)注話題與情感傾向,證明該方法能夠有效挖掘課程評論文本中隱含的深層次信息,能夠為在線課程建設(shè)提供幫助。但是文中對于課程評論文本數(shù)據(jù)的研究還有很大探索空間,比如,本文所用的情感分析方法依賴于已有軟件,沒有考慮到該實驗數(shù)據(jù)的實際應(yīng)用領(lǐng)域,沒有構(gòu)造基于課程評論文本的情感詞典。在后續(xù)研究中,應(yīng)該考慮跨領(lǐng)域文本的情感極性分類,構(gòu)建以在線課程評論文本為基礎(chǔ)的情感詞典,提高情感分類準確性、情感模型科學(xué)性,還可以嘗試運用基于機器學(xué)習(xí)的方法對文本進行聚類和情感分析,進一步提高實驗結(jié)果的準確性。

參考文獻:

[1] 江波,高明,陳志翰,等. 基于行為序列的學(xué)習(xí)過程分析與學(xué)習(xí)效果預(yù)測[J]. 現(xiàn)代遠程教育研究,2018(2):103-112.

[2] 王改花,傅鋼善. 數(shù)據(jù)挖掘視角下網(wǎng)絡(luò)學(xué)習(xí)者行為特征聚類分析[J]. 現(xiàn)代遠程教育研究,2018(4):106-112.

[3] 郭欣悅. 多元分析框架下的MOOC學(xué)習(xí)行為分析[J]. 開放學(xué)習(xí)研究,2017,22(4):21-28.

[4] 羅恒,楊婷婷,伊麗莎·理查德森,等. 開放課程中的學(xué)習(xí)行為分析:來自Google Analytics的證據(jù)[J]. 中國電化教育,2017(10):8-14,31.

[5] 劉三女牙,彭晛,劉智,等. 面向MOOC課程評論的學(xué)習(xí)者話題挖掘研究[J]. 電化教育研究,2017,38(10):30-36.

[6] XING W L,TANG H T,PEI B. Beyond positive and negative emotions: looking into the role of achievement emotions in discussion forums of MOOCs[J]. The Internet and Higher Education, 2019(43):100690.

[7] GIANLUCA ELIA,GIANLUCA SOLAZZO,GIANLUCA LORENZO,et al. Assessing learners satisfaction in collaborative online courses through a big data approach[J]. Computers in Human Behavior, 2019(92): 589-599.

[8] 羅玉萍,潘慶先,劉麗娜,等. 基于情感挖掘的學(xué)生評教系統(tǒng)設(shè)計及其應(yīng)用[J]. 中國電化教育,2018(4):91-95.

[9] 吳林靜,劉清堂,毛剛,等. 大數(shù)據(jù)視角下的慕課評論語義分析模型及應(yīng)用研究[J]. 電化教育研究,2017,38(11):43-48.

[10] 洪慶,王思堯,趙欽佩,等. 基于彈幕情感分析和聚類算法的視頻用戶群體分類[J]. 計算機工程與科學(xué),2018,40(6):1125-1139.

[11] BLEI D M,NG A Y,JORDAN M I. Latent dirichlet allocation[J]. Journal of Machine Learning Research,2003,3(3):993-1022.

[12] 崔雪蓮,那日薩,劉曉君. 基于主題相似性的在線評論情感分析[J]. 系統(tǒng)管理學(xué)報,2018,27(5):821-827.

[13] 劉嘯劍,謝飛,吳信東. 基于圖和LDA主題模型的關(guān)鍵詞抽取算法[J]. 情報學(xué)報,2016,35(6):664-672.

[14] 陳蘋,馮林. 情感分析中的方面提取綜述[J]. 計算機應(yīng)用,2018,38(S2):84-88,96.

(責(zé)任編輯:孫 娟)

猜你喜歡
文本挖掘情感分析
在線評論情感屬性的動態(tài)變化
慧眼識璞玉,妙手煉渾金
辽宁省| 山西省| 垫江县| 靖西县| 大渡口区| 拉萨市| 义马市| 武宣县| 屏东市| 栾川县| 正宁县| 呼伦贝尔市| 囊谦县| 绩溪县| 松阳县| 通城县| 体育| 紫云| 门源| 科尔| 雅江县| 高州市| 米易县| 腾冲县| 鹿邑县| 涞源县| 思南县| 望城县| 邯郸市| 定边县| 肥东县| 喀什市| 南丰县| 隆德县| 奉新县| 东丽区| 诏安县| 资源县| 华阴市| 和政县| 阜南县|