劉超慧 陶浩武 邢丹陽 李宇根
摘要:隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和富媒體教學(xué)理念的興起,在線學(xué)習(xí)評論數(shù)量增加,高效地將評論信息反饋給教師成為教學(xué)的新需求。論文概述了富媒體的相關(guān)概念和研究現(xiàn)狀,構(gòu)建了基于最大正向匹配算法的語句關(guān)鍵詞提取模型,論述了富媒體教學(xué)資源開發(fā)流程。最后,利用AJAX和Servlet等編程技術(shù),設(shè)計完成了富媒體教學(xué)資源平臺,平臺運(yùn)行結(jié)果表明在海量評論語句環(huán)境下能減輕授課教師負(fù)擔(dān),提高教學(xué)效果,具有一定的推廣應(yīng)用價值。
關(guān)鍵詞:富媒體;最大正向匹配算法;語句關(guān)鍵詞提取;學(xué)習(xí)平臺
中圖分類號:G434 ? ? ? ?文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2019)15-0176-03
Abstract: With the development of Internet technology and the rise of Rich Media teaching concept, the number of online learning reviews has increased. Feedback of comments to teachers efficiently becomes a new requirement of education. This paper summarizes the related concepts and research status of Rich Media, constructs a sentence keyword extraction model based on Maximum Matching Algorithm, and discusses the development process of Rich Media Teaching Resources. Finally, using AJAX and Servlet programming technology, designed and completed the platform of rich media teaching resources. The results show that the platform can reduce the burden of teaching teachers and improve the teaching effect under the environment of massive comment sentences, which has certain application value.
Key words:Rich Media; Maximum Matching; Sentence keyword extraction; Learning platform
1 引言
富媒體教學(xué)理念的興起,為教育教學(xué)提供了新的思路和方法。教育部于2015年發(fā)布《關(guān)于“十三五”期間全面深入推進(jìn)教育信息化工作的指導(dǎo)意見》提出“要通過融合創(chuàng)新提升教育信息化效能”,“互聯(lián)網(wǎng)+教育”已成為新的教育探索領(lǐng)域[1]。富媒體充分將視頻、文字、圖片和聲音等融為一體,能極大地豐富教學(xué)手段,提高教學(xué)效果。隨著在線教學(xué)平臺的逐步推廣,學(xué)習(xí)評論數(shù)量也日益增多。然而教師通過分析學(xué)習(xí)評論,來了解學(xué)生學(xué)習(xí)情況,變得困難起來。正向最大匹配算法為解決類似問題,提供了新思路。
文章在富媒體教學(xué)資源開發(fā)過程中,通過增加關(guān)鍵詞提取,構(gòu)建了語句反饋模型。在此基礎(chǔ)上,開發(fā)了富媒體教學(xué)資源平臺,平臺為減輕授課教師的壓力,提高教學(xué)效率和質(zhì)量提供了新思路。
2 相關(guān)理論介紹
2.1 富媒體教學(xué)資源
富媒體(Rich Media)是指具有動畫、聲音、視頻和交互性的信息的傳播方法,是包括以下常見形式之一或者是幾種的組合:流媒體、聲音、Flash、以及JavaScript、DHTML等程序設(shè)計語言。用于賦予傳統(tǒng)媒體以友好的交互效果和復(fù)雜的視覺體驗(yàn),是結(jié)合了傳統(tǒng)媒體技術(shù)和交互技術(shù)的新興媒體形式,具有豐富多樣的UI展現(xiàn)、深度的用戶交互、實(shí)時響應(yīng)和動態(tài)驅(qū)動性[4]。
國外發(fā)達(dá)國家教育信息化進(jìn)程快,對富媒體運(yùn)用于教學(xué)有更多的研究。2012年,Inkling公司推出的Habitat數(shù)字化教材出版平臺,可以更快捷地生產(chǎn)交互式電子書[2]。2015年,英國推出數(shù)字教材平臺Kortext,且整合進(jìn)微軟的辦公軟件,使得世界的大學(xué)生都能通過365平臺進(jìn)行使用[3]。余濤等人指出富媒體教材在推動教育教學(xué)改革方面起重要作用[5]。將富媒體用于在線教學(xué)無疑能夠最大限度的豐富課程資源,提高互動性。
2.2 正向最大匹配算法
正向最大匹配算法,是一種基于字符串匹配的分詞方法,在機(jī)械分詞中占據(jù)主流地位。其基本思想為:
S1:統(tǒng)計得到語料庫中最長詞條,并將其記為最大詞長maxLen;
S2:在待切分語句中從第1個字開始取以len為長度的字符串str;
S3:在語料庫中查找比對是否存在以str字符串構(gòu)成的詞。若存在,表明得到一個提取詞,轉(zhuǎn)到S5;若不存在繼續(xù)執(zhí)行S4;
S4:去除str最右邊的一個字符,判斷l(xiāng)en是否為1。若len=1表明這是一個單字;若不等于,轉(zhuǎn)到S3;
S5:把str字符串從待切分語句中刪除,判斷此時語句是否為空。若不為空轉(zhuǎn)到S2;若為空表明此語句已匹配完畢。
該算法易于理解,實(shí)現(xiàn)簡單,因此得到了廣泛的應(yīng)用。但仍存在著初始最大詞長設(shè)置不合理、覆蓋范圍不合理、歧義識別等問題。為此,很多學(xué)者進(jìn)行了富有成效的研究[6-8]。郭丙華等人提出一種基于詞語搭配關(guān)系的分詞歧義性消除方法[7]。王瑞雷等人提出了一種基于改進(jìn)Trie樹結(jié)構(gòu)的正向最大匹配算法,能有效提高中文分詞速度[8]。
3 富媒體教學(xué)平臺的設(shè)計
3.1 系統(tǒng)需求分析
圍繞減輕教師授課壓力為主要目標(biāo)開發(fā)富媒體教學(xué)資源系統(tǒng)。系統(tǒng)分為游客、學(xué)生、教師三類用戶。經(jīng)注冊登錄后,教師可創(chuàng)建課程、查看學(xué)生學(xué)習(xí)進(jìn)度、通過反饋模獲取學(xué)生的學(xué)習(xí)反饋信息;游客可以瀏覽相關(guān)信息,但不可以在線學(xué)習(xí)和發(fā)布評論;學(xué)生可加入課程、在線學(xué)習(xí);系統(tǒng)提供討論區(qū),學(xué)生可發(fā)布話題、回答他人評論、點(diǎn)贊高質(zhì)量解答等。
3.2 系統(tǒng)功能分析
平臺功能采用面向?qū)ο笤O(shè)計的思想。學(xué)生有包括個人信息、課程管理等在內(nèi)的四個模塊。教師有包括教學(xué)資源管理、學(xué)生管理、個人中心等三個模塊。學(xué)生進(jìn)行課程學(xué)習(xí),在互助討論區(qū),發(fā)表對于未理解知識的疑惑或解決他人問題,系統(tǒng)對學(xué)生疑惑的評論提取關(guān)鍵字,反饋給教師,教師以此為依據(jù)修改課程重點(diǎn)難點(diǎn)內(nèi)容。每個模塊包含若干個功能,整體功能模塊圖如圖1所示。
4 反饋模型的構(gòu)建及系統(tǒng)實(shí)現(xiàn)
4.1 關(guān)鍵詞提取模型的構(gòu)建
將評論語句分為求助帖(未理解的知識點(diǎn))和回答帖(已理解的知識點(diǎn))兩大類,通過TF-IDF(Term Frequency-Inverse Document Frequency)算法來獲取文檔類型富媒體教學(xué)資源的特征,用作正向最大匹配算法的語料庫。同時對語句進(jìn)行預(yù)處理,去除句子中對句子整體語義無貢獻(xiàn)的停用與常用詞等詞匯,在用正向最大匹配算法得到關(guān)鍵詞。主要操作步驟如下:
Step1:使用TF-IDF算法從富媒體教學(xué)資源中得到文本特征集合,并作為語料庫data。其中,富媒體教學(xué)資源中的具體文本記為dj,詞記為ti,用n(i,j)表示特定詞ti在文本dj中出現(xiàn)的次數(shù),用Σknk,j表示在文本dj中出現(xiàn)所有詞次數(shù)之和,|D|表示在教學(xué)資源中所出現(xiàn)的文本總數(shù),具體的表達(dá)式如式1。
Step2:統(tǒng)計詞庫的詞匯得到最長詞條,并將其記為最大詞長maxLen;
Step3:對待切分語句進(jìn)行預(yù)處理,從左至右以此掃描去除對語義無影響的字詞,得到新的待切分語句sentence;
Step4: 對語句sentence執(zhí)行正向最大匹配算法,得到關(guān)鍵詞集合;
至此,模型已構(gòu)建成功,可以更加精準(zhǔn)且高效地得到具體領(lǐng)域內(nèi)的專業(yè)詞匯。
4.2 教學(xué)資源開發(fā)流程
此模塊主要是面向教師發(fā)布資源使用。教師創(chuàng)建或修正的課程素材,系統(tǒng)進(jìn)行加工、分類和整合,最終形成富媒體在線教學(xué)資源,支持在線學(xué)習(xí)和討論。系統(tǒng)對學(xué)生未理解的評論,通過上述語句關(guān)鍵詞提取反饋模型得到未理解的專業(yè)性知識點(diǎn),并反饋教師,便于教師對教學(xué)資源進(jìn)行修正,流程圖如圖2所示。
4.3 平臺的功能實(shí)現(xiàn)
平臺前端開發(fā)利用HTML5+CSS3+JavaScript等技術(shù),其中JavaScript是使用的jQuery類庫,后臺通過Servlet+MySQL+tomcat實(shí)現(xiàn)開發(fā),通過AJAX實(shí)現(xiàn)前后臺的交互,且數(shù)據(jù)以JSON格式進(jìn)行傳送,從而實(shí)現(xiàn)對頁面的局部刷新。平臺利用開源的集成開發(fā)環(huán)境eclipse和MySQL數(shù)據(jù)庫系統(tǒng),易于搭建。平臺的在線學(xué)習(xí)界面如圖3所示,學(xué)生話題討論區(qū)如圖4所示。
以學(xué)生在線瀏覽文檔類型的富媒體教學(xué)資源為例介紹實(shí)現(xiàn)具體細(xì)節(jié)。前端使用了JQuery類庫和Font Awesome的圖標(biāo)字體庫,需要在HTML文件中引入如下所示的代碼:
在后臺通過Java的POI來實(shí)現(xiàn)對文檔的操縱,讀取文檔內(nèi)容主要代碼如下,其中path是給定的文件路徑,str是得到的文檔內(nèi)容:
OPCPackage opcPackage = POIXMLDocument.openPackage(path);
POIXMLTextExtractor extractor = new XWPFWordExtractor(opcPackage);
str=extractor.getText();
在Servlet中對得到的文檔內(nèi)容進(jìn)行封裝,以JSON格式傳至前端AJAX中,使用JSON作為數(shù)據(jù)傳送格式需在項(xiàng)目中引入JSON所需的jar包。主要代碼如下,其中response是傳回客戶端的響應(yīng)數(shù)據(jù)。
JSONObject obj=new JSONObject();
obj.put("content", str);
response.getWriter().append(obj.toString());
最后AJAX對得到的數(shù)據(jù)進(jìn)行解析并加載呈現(xiàn)在前端界面。主要代碼如下,其中在請求成功后的回調(diào)函數(shù)success中的get(result)是對得到的數(shù)據(jù)進(jìn)行解析的函數(shù)。
$.ajax({
contentType: "application/x-www-form-urlencoded; charset=utf-8",
type:"post",
url:"/ourweb/onloadFileServlet",
async:true,
data:"",
dataType:"JSON",
success:function(result){ get(result); },
error:function(request){ alert("error!"); }
});
5 總結(jié)
隨著互聯(lián)網(wǎng)技術(shù)的深入發(fā)展和富媒體教學(xué)的興起,在線學(xué)習(xí)評論語句數(shù)量激增,給教師了解學(xué)生學(xué)習(xí)的基本情況帶來新的挑戰(zhàn)。論文在諸多學(xué)者研究的基礎(chǔ)上,對未理解評論語句構(gòu)建了關(guān)鍵詞提取模型,開發(fā)了富媒體在線教學(xué)平臺,能有效減輕教師的授課負(fù)擔(dān)。然而中文文本信息處理技術(shù)是個復(fù)雜的問題,需進(jìn)一步通過對評論信息進(jìn)行提取,進(jìn)而對學(xué)生進(jìn)行畫像學(xué)生,提供個性化服務(wù)。
參考文獻(xiàn):
[1]范燕瑩.“書聯(lián)網(wǎng)”:整合的不僅是教育內(nèi)容[N].中國新聞出版廣電報,2016-01-25(05).
[2]李逢慶.信息時代大學(xué)教學(xué)支持服務(wù)體系發(fā)展研究[D].南京大學(xué),2013.
[3]吳丹.富媒體數(shù)字教材的特性及應(yīng)用研究[D].北京印刷學(xué)院,2015.
[4]傅偉.富媒體技術(shù)在數(shù)字化學(xué)習(xí)終端上的應(yīng)用探索[J].遠(yuǎn)程教育雜志,2011,29(4):95-102.
[5]余濤.劉超慧.富媒體教材出版的應(yīng)用研究[J].科技與出版,2017(11):165-168.
[6]陳開昌.自然語言處理技術(shù)中的中文分詞研究[J].信息與電腦,2016(19).
[7]郭丙華.俞亞堃.李中華.基于詞語搭配關(guān)系的一種中文分詞歧義性消除方法[J].計算機(jī)應(yīng)用與軟件,2016(10):94-97.
[8]王瑞雷,欒靜,潘曉花,等.一種改進(jìn)的中文分詞正向最大匹配算法[J]. 計算機(jī)應(yīng)用與軟件, 2011, 28(3):276-278.
[9]胡炎貴.面向“書聯(lián)網(wǎng)”的富媒體教學(xué)資源管理平臺的設(shè)計與開發(fā)[D].華中師范大學(xué),2018.
【通聯(lián)編輯:王力】