白 楊
(遼東學(xué)院 信息工程學(xué)院,遼寧 丹東 118003)
近年來,隨著多媒體技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,在線學(xué)習(xí)已成為人們學(xué)習(xí)的另一種主要方式。在線學(xué)習(xí)打破了傳統(tǒng)教學(xué)在時(shí)間和空間上的限制,給學(xué)習(xí)者提供了一個(gè)寬松、自由、開放的學(xué)習(xí)環(huán)境。大數(shù)據(jù)技術(shù)的興起對(duì)社會(huì)生產(chǎn)和生活都產(chǎn)生著深刻的影響,過去無法收集和分析的數(shù)據(jù)被大數(shù)據(jù)技術(shù)賦予了新的可能性,近年來涌起了對(duì)人們行為和喜好挖掘的研究熱潮,大數(shù)據(jù)技術(shù)成為了教育變革與創(chuàng)新的重要推動(dòng)力。大數(shù)據(jù)所特有的“全面性”的數(shù)據(jù)、潛在的“大價(jià)值”及先進(jìn)的技術(shù)手段,為充分挖掘?qū)W習(xí)者的情感語義進(jìn)而促進(jìn)個(gè)性化學(xué)習(xí)平臺(tái)構(gòu)建提供了有力的支撐。在大數(shù)據(jù)環(huán)境下,教育學(xué)習(xí)資源變得越來越豐富,學(xué)習(xí)者模型的內(nèi)容不僅包含了學(xué)習(xí)者的知識(shí)狀態(tài),而且還包含了學(xué)習(xí)者的興趣偏好、學(xué)習(xí)風(fēng)格和認(rèn)知能力等特征,因此個(gè)性化學(xué)習(xí)成為新時(shí)期學(xué)習(xí)者的更高要求。同時(shí),在線學(xué)習(xí)中學(xué)習(xí)者以自主學(xué)習(xí)為主,長時(shí)間處于孤立的學(xué)習(xí)狀態(tài),缺乏情感支持。現(xiàn)有的研究對(duì)學(xué)習(xí)者的動(dòng)機(jī)、情感等非智力因素還關(guān)注不夠,不僅缺乏有效的表示方法,而且缺乏恰當(dāng)?shù)慕<夹g(shù),嚴(yán)重影響了在線學(xué)習(xí)的效果。因此,如何為學(xué)習(xí)者構(gòu)建一個(gè)智能化、個(gè)性化的學(xué)習(xí)環(huán)境,成了近年來人工智能教育應(yīng)用領(lǐng)域的研究熱點(diǎn)。通過對(duì)大數(shù)據(jù)個(gè)性化學(xué)習(xí)模型的分析,能夠深入探究學(xué)習(xí)者的學(xué)習(xí)過程與情境,發(fā)現(xiàn)學(xué)習(xí)規(guī)律,并根據(jù)每一個(gè)學(xué)生的需求和能力為其提供個(gè)性化自適應(yīng)學(xué)習(xí)。本研究從學(xué)習(xí)者文本情感分析的視角,重點(diǎn)研究在線教學(xué)網(wǎng)絡(luò)的學(xué)習(xí)者的個(gè)性化學(xué)習(xí)模式,使智能學(xué)習(xí)系統(tǒng)具有情感能力,符合智能推薦、信息共享等個(gè)性化服務(wù)發(fā)展的實(shí)際需要。
文本情感分析是利用計(jì)算機(jī)自動(dòng)挖掘出主觀性文本中表達(dá)的情緒、態(tài)度和意見[1]。隨著Web2.0的迅猛發(fā)展,人們從被動(dòng)地瀏覽信息到主動(dòng)地發(fā)表意見、表達(dá)思想,網(wǎng)絡(luò)由此而產(chǎn)生了海量的、主觀的文本數(shù)據(jù)。在線教學(xué)網(wǎng)絡(luò)如慕課、可汗學(xué)院等平臺(tái)不僅提供了大量的學(xué)習(xí)資料,還為學(xué)習(xí)者提供了一個(gè)自由表達(dá)情感的空間,學(xué)習(xí)者通過參與討論、發(fā)表評(píng)論等方式進(jìn)行知識(shí)交流和共享,而由此產(chǎn)生的數(shù)據(jù)大部分以文本形式存在,許多學(xué)者開始分析和挖掘這些文本數(shù)據(jù)中的情感信息。文本情感分析已經(jīng)成為自然語言處理中的研究熱點(diǎn),通常包括以下4個(gè)方面研究內(nèi)容[2]。
(1)詞語極性判定。詞語的情感分析是句子、篇章情感分析的基礎(chǔ)。詞語情感分析包括情感詞語自動(dòng)識(shí)別和詞語情感極性判斷兩方面內(nèi)容,實(shí)現(xiàn)的基本思路通常有兩種:基于語料庫的方法和基于語義詞典的方法。
(2)文本情感分類。根據(jù)文本中表達(dá)的觀點(diǎn)、態(tài)度,將其劃分為“肯定”、“否定”或“中立”3種基本的文本情感分類。目前,主要有基于情感詞語和基于機(jī)器學(xué)習(xí)的兩種實(shí)現(xiàn)文本情感分類的思路。
(3)評(píng)論意見挖掘。學(xué)習(xí)者評(píng)論文本中一般包含多個(gè)主題,學(xué)習(xí)者對(duì)不同的主題往往持有不同的意見。為了深入挖掘用戶對(duì)某個(gè)主題的態(tài)度和意見,目前流行的挖掘方法是細(xì)粒度的意見挖掘。
(4)文本情緒識(shí)別。以上3種一般是面向評(píng)論文本,而對(duì)于博文、日志等文本內(nèi)容,通常需要識(shí)別學(xué)習(xí)者高興、悲傷、生氣等情緒。目前比較流行的研究方法是通過情感詞和語義規(guī)則來識(shí)別文本中的情感信息。
在線學(xué)習(xí)者在學(xué)習(xí)過程中情感狀態(tài)會(huì)隨著學(xué)習(xí)活動(dòng)的進(jìn)行而發(fā)生變化,這一變化產(chǎn)生的因素主要有學(xué)習(xí)內(nèi)容、學(xué)習(xí)時(shí)間、學(xué)習(xí)結(jié)果等。譬如,學(xué)習(xí)之初由于學(xué)習(xí)內(nèi)容較為簡單,學(xué)習(xí)者的情緒往往表現(xiàn)為輕松、高興;而隨著學(xué)習(xí)內(nèi)容難度的加深,學(xué)習(xí)者的情緒逐漸呈現(xiàn)沮喪、難過。這時(shí),學(xué)習(xí)者參加的討論活動(dòng)中,這些情緒會(huì)在相應(yīng)的文本數(shù)據(jù)中有所體現(xiàn),學(xué)習(xí)模式系統(tǒng)通過對(duì)這些文本數(shù)據(jù)進(jìn)行情感識(shí)別,建立情感模型,以智能學(xué)習(xí)系統(tǒng)為支持,為學(xué)習(xí)者提供個(gè)性化服務(wù),比如為學(xué)習(xí)者推薦相應(yīng)的學(xué)習(xí)資料、分享多數(shù)人在此時(shí)的經(jīng)驗(yàn)、做法,甚至推送一段輕松的音樂等,已達(dá)到對(duì)學(xué)習(xí)者進(jìn)行情感調(diào)節(jié),使他們在學(xué)習(xí)過程中脫離孤立無援的狀態(tài)的目的。融合本文情感分析的個(gè)性化學(xué)習(xí)模式框架結(jié)構(gòu)如圖1所示,主要包括4個(gè)環(huán)節(jié)內(nèi)容。
圖1 融合本文情感分析的個(gè)性化學(xué)習(xí)模式框架
分詞處理將確定語句的粒度,如詞(words)或詞項(xiàng)(terms)。分詞方法包括詞典分詞和無詞典分詞兩種,前者是利用詞典中包括的領(lǐng)域術(shù)語,根據(jù)設(shè)定好的切詞字?jǐn)?shù),通過最大正向匹配將語句從左至右進(jìn)行切分。后者是利用統(tǒng)計(jì)思想來分詞,如最大概率法公式為:一個(gè)詞的概率=其出現(xiàn)的次數(shù)/語料中總的詞數(shù),以此區(qū)分詞在一個(gè)文檔中的重要程度。另外,還有一些常用的切詞工具如Standard Analyzer,Chinese Analyzer等都各具優(yōu)勢。
情感建模是個(gè)性化學(xué)習(xí)模式的關(guān)鍵環(huán)節(jié)。隨著情感計(jì)算的發(fā)展,研究者已提出了許多有效的情感識(shí)別技術(shù),為學(xué)習(xí)者情感建模打下了良好的技術(shù)基礎(chǔ)。可以通過文本挖掘技術(shù)識(shí)別學(xué)習(xí)者某一時(shí)間的情感狀態(tài),主要包括情感特征選擇、情感語義描述、情感類別分類3個(gè)步驟。通常的做法是在文本分詞之后,結(jié)合情感語義詞典選擇文本的情感特征項(xiàng),采用向量空間模型來實(shí)現(xiàn)文本語義內(nèi)容的形式化描述,然后基于Apriori,F(xiàn)P-樹等分類方法進(jìn)行情感分類器的訓(xùn)練、情感類別判定和文本情感分析,從而實(shí)現(xiàn)學(xué)習(xí)者的情感建模。
該系統(tǒng)存儲(chǔ)了學(xué)習(xí)模型的適應(yīng)性規(guī)則,如定義了如何根據(jù)學(xué)習(xí)者的知識(shí)狀態(tài)、學(xué)習(xí)者選擇的知識(shí)點(diǎn)、學(xué)習(xí)者的學(xué)習(xí)風(fēng)格以及學(xué)習(xí)者的情感狀態(tài),從領(lǐng)域知識(shí)本體中選擇出合適的知識(shí)點(diǎn),并包括導(dǎo)航學(xué)習(xí)的過程的內(nèi)容。
主要用于對(duì)學(xué)習(xí)者實(shí)現(xiàn)個(gè)性化推薦,如根據(jù)學(xué)習(xí)者的學(xué)習(xí)風(fēng)格和情感狀態(tài)向?qū)W習(xí)者推薦難度匹配和類型恰當(dāng)?shù)膶W(xué)習(xí)資源,根據(jù)學(xué)習(xí)者的知識(shí)狀態(tài)和情感狀態(tài)推薦學(xué)習(xí)內(nèi)容。還可以進(jìn)行學(xué)習(xí)者社區(qū)的挖掘,為實(shí)現(xiàn)知識(shí)的共享提供支持。
個(gè)性化學(xué)習(xí)模型是智能學(xué)習(xí)系統(tǒng)的核心組件。在大數(shù)據(jù)環(huán)境下,融入文本情感分析的個(gè)性化學(xué)習(xí)模式能夠?qū)崿F(xiàn)全面地記錄、跟蹤、掌握學(xué)習(xí)者的不同學(xué)習(xí)特點(diǎn)、學(xué)習(xí)需求、學(xué)習(xí)基礎(chǔ)和學(xué)習(xí)行為,為學(xué)習(xí)者建立個(gè)性化學(xué)習(xí)模型,打造個(gè)性化的學(xué)習(xí)路徑,推薦個(gè)性化學(xué)習(xí)資源。因此,融入文本情感分析讓教育變得千人千面,暗合了“因材施教”的理念,適應(yīng)個(gè)性化和人性化的學(xué)習(xí)變化,使學(xué)習(xí)者在學(xué)習(xí)過程中真正找到幸福感。本研究重點(diǎn)討論文本情感分析的過程,并未探討學(xué)習(xí)者知識(shí)狀態(tài)及學(xué)習(xí)風(fēng)格等內(nèi)容的存儲(chǔ)和識(shí)別,未來的工作將進(jìn)一步完善個(gè)性化學(xué)習(xí)模型的內(nèi)容。