国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

情感指數(shù)對MOOC學生成績的預測研究

2019-07-08 02:56趙帥黃曉婷
中國大學教學 2019年5期
關鍵詞:文本分析

趙帥 黃曉婷

摘 要:MOOC學生情感狀態(tài)與學習成績間的關系有助于教師了解學生學習狀況并優(yōu)化教學設計,但少有深入研究。本文用文本分析法定義并計算了一門中文MOOC課程學生的“快樂指數(shù)”和“痛苦指數(shù)”,發(fā)現(xiàn)“快樂指數(shù)”與成績無顯著關聯(lián),而“痛苦指數(shù)”能顯著、正向地預測成績,是MOOC課程的挑戰(zhàn)度指數(shù)。MOOC平臺可設置實時反饋機制,將“痛苦指數(shù)”等數(shù)據(jù)提供給教師,方便及時、針對性優(yōu)化教學或者提供翻轉。同時,“痛苦指數(shù)”有潛力成為鑒別MOOC中“水課”的指標。

關鍵詞:情感指數(shù);學業(yè)表現(xiàn);MOOC;文本分析;挑戰(zhàn)度;水課

MOOC(Massive Open Online Course)全稱為大規(guī)模開放式在線課程。自2012年MOOC元年后[1],MOOC發(fā)展迅猛,三大平臺Coursera、Udacity、edX與世界高校合作,使MOOC席卷全球。在中國,2013年前MOOC相關論文在國內(nèi)期刊上僅發(fā)表5篇,但到了2016年,這一數(shù)字變?yōu)?420篇[2]。與傳統(tǒng)課堂相比,MOOC的核心優(yōu)勢是跨越了空間局限,也使學習時間更加靈活,因而促進了優(yōu)質(zhì)教育資源共享。MOOC也面臨許多問題,高輟學率①

是其中最嚴峻的一項。根據(jù)美國賓夕法尼亞大學統(tǒng)計,MOOC平均輟學率高達90%[3],這不免讓人對其教學效果產(chǎn)生疑問。因此,優(yōu)化課程設計以提高學生學習動機、增加學習主動性并通過考核,成為MOOC發(fā)展的當務之急。

課程設計優(yōu)化需要清楚地知道哪些變量影響學生學業(yè)表現(xiàn)。蔣卓軒等發(fā)現(xiàn),學生觀看課程視頻及提交小測驗的次數(shù)能預測課程完成

率[4];Yang等證實學生論壇發(fā)帖數(shù)與輟學率關系密切[5];Ramesh等的研究表明,學生參與課程的行為類型能顯著預測成績[6]。

目前,少有研究關注MOOC學生的情感狀態(tài)是否能預測成績。按照維果斯基“最近發(fā)展區(qū)”理論,學生的發(fā)展水平有兩種,一種是學生自身所能達到的水平,另一種是通過教育所能達到的潛在水平,兩者間差異即為最近發(fā)展區(qū)。教育應向學生提供有難度、有挑戰(zhàn)的教學內(nèi)容和教學要求以激發(fā)學生潛能,使學生到達或超越最近發(fā)展區(qū)。MOOC課程為高等教育課程,本質(zhì)上屬于高深學問。學生要想在期末考核中取得好成績,需在學習過程中迎接挑戰(zhàn)、投入更多精力,也因此體驗更多痛苦情感。本文假設:在MOOC學習過程中學生體驗的痛苦情感越強,越可能取得較高成績。

傳統(tǒng)課堂中,教師潛意識中通過觀察學生面部表情、肢體語言了解學生情感狀態(tài)反饋,并據(jù)此調(diào)整語速、講解重點及改變提問策略,其過程異常迅速。越有教學經(jīng)驗的教師對課堂中學生情緒反應的判斷越迅速和準確,后續(xù)教學調(diào)整也更有針對性和效率。相比傳統(tǒng)課堂,MOOC中教師授課主要是提前錄制視頻并上傳平臺,學生通過觀看視頻學習,教師講授過程相對固定。此外,MOOC并不能全面、廣泛提供翻轉課堂以方便線下討論,師生間少有后期面對面交流。除課程視頻外,教師與學生、學生與學生之間唯一可以交流的場景為在線課程論壇。學習越投入、越期待通過考試的學生,越可能就學習中遇到的問題參與討論,于是論壇發(fā)帖成為實時分析MOOC學生情感的一個可靠數(shù)據(jù)源。

本文基于一門中文MOOC的論壇數(shù)據(jù),以大數(shù)據(jù)分析中的文本分析法提取學生情感信息,基于選定的情感詞典統(tǒng)計論壇討論中學生發(fā)布的積極、消極情感詞語及詞頻,據(jù)此計算“痛苦指數(shù)”和“快樂指數(shù)”,通過回歸分析檢驗情感指數(shù)是否能有效預測成績。

一、研究數(shù)據(jù)及方法

1.數(shù)據(jù)

本文數(shù)據(jù)源自北京大學在Coursera上開設的MOOC課程“計算概論A”,該課程開始于2014年9月,截止于2015年1月,共14 855名學生注冊。所有學生中90.9%輟學(沒有期末成績);9.1% 的未輟學學生中,僅1%及格,0.5%成績超過85分。在課程論壇上,450名學生參與討論,發(fā)布了3 864條帖子,共526 083字;平均每名學生發(fā)帖9條,共826字,其中最活躍學生發(fā)帖201條,共25 239字。在所有輟學學生中,僅2名在論壇上發(fā)言;在所有未輟學學生(共1 347名)中,434名在論壇上發(fā)言,其中及格學生有116名,占所有及格學生(共148名)的78.4%。

2.方法

(1)文本分析中的情感信息挖掘

人的情感與行為緊密聯(lián)系,情感因素因而逐漸被金融、教育等領域學者關注[7-10]。隨著大數(shù)據(jù)時代來臨,互聯(lián)網(wǎng)上積累了大量文本,如新聞稿、論壇發(fā)帖、微博等,這些文本成為分析情感信息的良好數(shù)據(jù)源,利用文本分析進行情感挖掘逐漸成為熱點。與教育研究中衡量學生情感狀態(tài)的問卷法相比,文本分析優(yōu)勢有兩點[7]:首先避開了問卷法中學生自我評估的缺陷。自我評估一般事后完成,并非即時,其過程與結果受諸多不確定因素干擾,所得出的情感信息可信度較低;其次,基于積累的文本可以靈活分析一段時間內(nèi)學生的情感信息,而問卷法僅能評估學生填寫問卷時對學習過程情感的回憶,且摻雜填寫問卷時的個人情感狀態(tài)。

文本分析進行情感信息挖掘的方法主要有兩類。

第一類是機器學習法。應用時可分三步:第一步,準備好一組打好情感標簽的文本。第二步,對文本量化處理。量化過程視不同語言而定,若分析中文文檔,需首先運用自然語言處理的分詞模型對文檔分詞;若分析英文文檔,因文字自然被空格隔開而無須分詞處理。之后,應用文本量化模型將文檔轉換成向量,常用模型為詞包模型(bag-of-words)。假設文檔集合對應的詞匯表中包含m個詞語,運用詞包模型將每篇文檔轉換為一個m維向量,每個分量的值對應一個詞語權重。計算詞語權重的方法主要有三種。第一種,將詞語權重賦值為0或1,指代詞語是否在文檔中出現(xiàn);第二種,將詞語在文檔中出現(xiàn)的頻次設為權重,強調(diào)頻繁出現(xiàn)詞語的重要性;第三種,按照詞頻—逆文檔頻率(term frequency-inverse document frequency)計算詞語權重,權重為兩部分乘積:一部分是詞語出現(xiàn)頻率,即詞頻除以文檔長度;另一部分是逆文檔頻率,即計算總文檔數(shù)與包含具體詞語的文檔數(shù)之商,再取對數(shù)得出。詞包模型僅考慮詞語自身而忽略詞語順序(即語境信息),在一些文本分析中表現(xiàn)不盡如人意。為彌補缺陷,有許多更全面的文本量化模型被提出,其中最為直觀的是n-grams詞包模型(bag-of-n-grams),該模型將n個連續(xù)詞語組成的詞組視作分析單元,并基于詞包模型的權重計算方法計算詞組權重。第三步,基于量化后的文本訓練機器學習分類器,并利用訓練好的分類器識別新文本中的情感信息。早期研究中,傳統(tǒng)機器學習模型常被用作情感分類器,如林江豪等[11]通過樸素貝葉斯模型實現(xiàn)了微博情感分類。隨著深度學習技術崛起,學者發(fā)現(xiàn)深度神經(jīng)網(wǎng)絡在情感分類上的表現(xiàn)優(yōu)于傳統(tǒng)模型,如Lai等證實:相比于邏輯回歸與支持向量機,遞歸神經(jīng)網(wǎng)絡、卷積神經(jīng)網(wǎng)絡在文本數(shù)據(jù)集上的情感分類準確率較高[12]。機器學習法能識別否定、反問等特殊情感表達,準確判斷較細顆粒文本的情感,但所需數(shù)據(jù)量較大,且需耗費人工為文本打情感標簽,成本較高。

猜你喜歡
文本分析
投資者情緒短期對股票市場的影響研究
維護正統(tǒng)還是觀念復辟?
文本情感計算系統(tǒng)“小菲”的設計及其在教育領域文本分析中的應用
我國地方紀錄片的出路研究
初中英語聽說課教學實踐探索
《化學:概念與應用》專題作業(yè)設計分析及啟示