国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘在國際中文教育個性化學(xué)習(xí)中的應(yīng)用研究*

2022-12-21 02:02:14潘毓昉
關(guān)鍵詞:數(shù)據(jù)挖掘個性化漢語

潘毓昉, 趙 文

(1.四川大學(xué) 文學(xué)與新聞學(xué)院,四川 成都 610207;2.四川農(nóng)業(yè)大學(xué) 都江堰基礎(chǔ)教學(xué)部,四川 都江堰 611830)

一、引 言

近年來,因新冠疫情的爆發(fā)以及互聯(lián)網(wǎng)教育的飛速發(fā)展,國際中文教育在線上教學(xué)、資源建設(shè)、平臺研發(fā)等多方面都取得了長足進(jìn)步,國際中文教育信息化建設(shè)正朝著“數(shù)字化、網(wǎng)絡(luò)化、智能化”方向持續(xù)發(fā)展。但由于各個國家、地區(qū)之間存在較大的政治、經(jīng)濟(jì)、語言文化、硬軟件設(shè)施等差異,因此國際中文教育仍存在發(fā)展不平衡,本土化進(jìn)程較緩慢,教學(xué)環(huán)境、學(xué)習(xí)者個體教育程度差異較大等問題。

教育部2022年工作要點(diǎn)中明確提出實(shí)施教育數(shù)字化戰(zhàn)略行動,要求“強(qiáng)化需求牽引,深化融合、創(chuàng)新賦能、應(yīng)用驅(qū)動,積極發(fā)展‘互聯(lián)網(wǎng)+教育’,加快推進(jìn)教育數(shù)字轉(zhuǎn)型和智能升級”。(1)中華人民共和國教育部.教育部2022年工作要點(diǎn)[EB/OL].http://www.moe.gov.cn/jyb_xwfb/gzdt_gzdt/202202/t20220208_597666.html,2022-02-08/2022-03-05.因此,在信息化時代背景下,滿足日益劇增的多元化學(xué)習(xí)需求,適應(yīng)漢語學(xué)習(xí)者個性化、自主化的學(xué)習(xí)特點(diǎn),需要以學(xué)習(xí)者個性化需求為導(dǎo)向,發(fā)揮新技術(shù)輔助功能驅(qū)動國際中文教育數(shù)字化發(fā)展,實(shí)現(xiàn)個性化教育。

數(shù)據(jù)挖掘(DM:Data Mining)是“從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中人們事先不知道的,但又是潛在有用的信息和知識的過程?!?2)孫玉榮,羅立宇,黃慧華.數(shù)據(jù)挖掘在網(wǎng)絡(luò)教學(xué)中的應(yīng)用[J].現(xiàn)代教育技術(shù),2009,(6).數(shù)據(jù)挖掘技術(shù)具有較強(qiáng)的學(xué)科交叉性,涉及數(shù)理統(tǒng)計(jì)、模糊數(shù)學(xué)、神經(jīng)網(wǎng)絡(luò)以及人工智能等領(lǐng)域,目前已廣泛應(yīng)用于大型信息化系統(tǒng)的海量數(shù)據(jù)處理。數(shù)據(jù)挖掘的主要方法包括概念描述、關(guān)聯(lián)規(guī)則、分類分析、聚類分析、進(jìn)化分析等。(3)毛國君.數(shù)據(jù)挖掘的概念、系統(tǒng)結(jié)構(gòu)和方法[J].計(jì)算機(jī)工程與設(shè)計(jì),2002,(8).目前,較多學(xué)者對教育領(lǐng)域的數(shù)據(jù)挖掘進(jìn)行研究,主要集中于學(xué)習(xí)者模型構(gòu)建(4)岳俊芳,陳逸.基于大數(shù)據(jù)分析的遠(yuǎn)程學(xué)習(xí)者建模與個性化學(xué)習(xí)應(yīng)用[J].中國遠(yuǎn)程教育,2017,(7).、學(xué)習(xí)者成績預(yù)測(5)吳青,羅儒國.基于在線學(xué)習(xí)行為的學(xué)習(xí)成績預(yù)測及教學(xué)反思[J].現(xiàn)代教育技術(shù),2017,(6).、教學(xué)評價與反饋(6)鄭慶華.運(yùn)用教學(xué)大數(shù)據(jù)分析技術(shù)提高課堂教學(xué)質(zhì)量[J].中國大學(xué)教學(xué),2017,(2).、可視化分析(7)黃昌勤,朱寧,黃瓊浩,韓中美.支持個性化學(xué)習(xí)的行為大數(shù)據(jù)可視化研究[J].開放教育研究,2019,(2).、個性化學(xué)習(xí)研究等方面。其中個性化學(xué)習(xí)研究主要包含個性化學(xué)習(xí)服務(wù)研究,如楊麗娜等從設(shè)計(jì)、實(shí)施到評價三個層面構(gòu)建了個性化學(xué)習(xí)服務(wù)體系(8)楊麗娜,魏永紅,肖克曦,王維花.教育大數(shù)據(jù)驅(qū)動的個性化學(xué)習(xí)服務(wù)機(jī)制研究[J].電化教育研究,2020,(9).,姜強(qiáng)等基于APRIORIALL算法,在挖掘?qū)W習(xí)者學(xué)習(xí)行為軌跡基礎(chǔ)上生成個性化學(xué)習(xí)路徑(9)姜強(qiáng),趙蔚,李松,王朋嬌.大數(shù)據(jù)背景下的精準(zhǔn)個性化學(xué)習(xí)路徑挖掘研究——基于APRIORIALL的群體行為分析[J].電化教育研究,2018,(2).,牟智佳等在基于學(xué)習(xí)測評數(shù)據(jù)的個性化評價模型基礎(chǔ)上設(shè)計(jì)了個性化評價工具原型(10)牟智佳,李雨婷,彭曉玲.基于學(xué)習(xí)測評數(shù)據(jù)的個性化評價建模與工具設(shè)計(jì)研究[J].電化教育研究,2019,(8).;個性化學(xué)習(xí)行為研究,如王改花等對網(wǎng)絡(luò)學(xué)習(xí)者的行為特征進(jìn)行聚類分析(11)王改花,傅鋼善.數(shù)據(jù)挖掘視角下網(wǎng)絡(luò)學(xué)習(xí)者行為特征聚類分析[J].現(xiàn)代遠(yuǎn)程教育研究,2018,(4).;個性化學(xué)習(xí)平臺設(shè)計(jì)研究等,如李俊杰等借助教育大數(shù)據(jù)分析技術(shù)等搭建了基于自適應(yīng)題庫的個性化語言學(xué)習(xí)平臺。(12)李俊杰,張建飛,胡杰,盛守卓.基于自適應(yīng)題庫的智能個性化語言學(xué)習(xí)平臺的設(shè)計(jì)與應(yīng)用[J].現(xiàn)代教育技術(shù),2018,(10).

在國際中文教育領(lǐng)域,數(shù)據(jù)挖掘研究主要集中于數(shù)據(jù)庫建設(shè)(13)鄭通濤,曾小燕.大數(shù)據(jù)時代的漢語中介語語料庫建設(shè)[J].廈門大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版),2016,(2).、教師發(fā)展研究(14)袁萍,劉玉屏.大數(shù)據(jù)時代國際漢語教師數(shù)據(jù)素養(yǎng)研究透視[J].民族教育研究,2020,(6).、語法研究(15)王瑋,蔡蓮紅.關(guān)聯(lián)規(guī)則在漢語詞屬性中的研究[J].計(jì)算機(jī)工程與應(yīng)用,2001,(5).及教學(xué)方法研究(16)鄭艷群.教學(xué)分析與教學(xué)計(jì)算:大數(shù)據(jù)時代漢語教學(xué)研究方法探新[J].國際漢語教學(xué)研究,2020,(2);鄭艷群.漢語教學(xué)數(shù)據(jù)挖掘:意義和方法[J].語言文字應(yīng)用,2016,(4).等方面。其中,已有學(xué)者將其運(yùn)用到個性化學(xué)習(xí)研究中,如熊玉珍在分析漢語個性化學(xué)習(xí)需求及學(xué)習(xí)者個性特征的基礎(chǔ)上,構(gòu)建了基于測評技術(shù)的漢語個性化學(xué)習(xí)環(huán)境模型(17)熊玉珍.基于測評的漢語個性化學(xué)習(xí)環(huán)境的構(gòu)建[J].電化教育研究,2012,(3).??傮w而言,數(shù)據(jù)挖掘在個性化學(xué)習(xí)研究中的應(yīng)用日漸廣泛,然而在國際中文教育領(lǐng)域研究仍較為有限。鑒于此,文章基于國際中文教育學(xué)習(xí)者個性化學(xué)習(xí)需求,構(gòu)建基于數(shù)據(jù)挖掘的國際中文教育個性化學(xué)習(xí)平臺模型,探究數(shù)據(jù)挖掘在國際中文教育個性化學(xué)習(xí)中的應(yīng)用,以期為不同國家、地區(qū)、民族的漢語學(xué)習(xí)者提供個性化服務(wù),推動國際中文教育個性化、智能化、國際化發(fā)展。

二、國際中文教育個性化學(xué)習(xí)數(shù)據(jù)挖掘

(一)國際中文教育個性化學(xué)習(xí)

隨著海外漢語學(xué)習(xí)者數(shù)量日益增加,學(xué)習(xí)者類型以及學(xué)習(xí)需求多元化、差異化問題日漸凸顯,國際中文教育需要在教學(xué)資源開發(fā),教學(xué)方法應(yīng)用、教學(xué)平臺建設(shè)等多個領(lǐng)域?qū)崿F(xiàn)國別化、本土化、個性化發(fā)展。個性化學(xué)習(xí)主要是指“針對學(xué)生個性特點(diǎn)和發(fā)展?jié)撃芏扇∏‘?dāng)?shù)姆椒ā⑹侄?、?nèi)容、起點(diǎn)、進(jìn)程、評價方式,促使學(xué)生各方面獲得充分、自由、和諧的發(fā)展過程?!?18)李廣,姜英杰.個性化學(xué)習(xí)的理論建構(gòu)與特征分析[J].東北師大學(xué)報(bào),2005,(3).國際中文教育個性化學(xué)習(xí)具體體現(xiàn)為學(xué)習(xí)對象的個性化以及學(xué)習(xí)需求的個性化。

1.學(xué)習(xí)對象個性化

除了國籍、年齡、性別、職業(yè)、民族等基本信息不同以外,漢語學(xué)習(xí)者之間在語言水平、學(xué)習(xí)動機(jī)、學(xué)習(xí)策略、學(xué)習(xí)風(fēng)格等方面同樣也存在較大差異。跟基本信息不同,語言水平、學(xué)習(xí)風(fēng)格等數(shù)據(jù)較為動態(tài),會隨著時間發(fā)生改變。因此,利用數(shù)據(jù)挖掘技術(shù)分析漢語學(xué)習(xí)者在學(xué)習(xí)中所產(chǎn)生的動態(tài)數(shù)據(jù),有利于較為全面地掌握學(xué)生的個性化學(xué)習(xí)特征以及預(yù)測其學(xué)習(xí)行為。

2.學(xué)習(xí)需求個性化

不同國家、地區(qū)、民族漢語學(xué)習(xí)者需求多樣化,具體體現(xiàn)在學(xué)習(xí)目標(biāo)、學(xué)習(xí)資源、學(xué)習(xí)內(nèi)容、學(xué)習(xí)興趣、學(xué)習(xí)計(jì)劃、學(xué)習(xí)方法等方面。

(1)在學(xué)習(xí)目標(biāo)上,漢語學(xué)習(xí)者既有可能以學(xué)歷或就業(yè)為需求導(dǎo)向,同時也可能出于愛好和興趣等原因,不同的學(xué)習(xí)目標(biāo)將會影響學(xué)習(xí)內(nèi)容、學(xué)習(xí)資源等方面的選擇。

(2)學(xué)習(xí)資源按媒介性質(zhì)可分為紙質(zhì)資源和數(shù)字化資源;按類型可分為數(shù)字、文字、圖片、表格、視頻、音頻等。首先,需要盡量滿足不同學(xué)習(xí)者的個性化需求,提供針對不同母語背景、受眾年齡、漢語水平、學(xué)習(xí)方式、學(xué)習(xí)風(fēng)格的資源;其次,加強(qiáng)學(xué)習(xí)資源建設(shè),尤其是數(shù)字化資源,如教材、慕課、微課、中文教學(xué)軟件、線上學(xué)習(xí)及資源平臺等,以此拓展學(xué)生學(xué)習(xí)渠道;最后,資源的形式應(yīng)依據(jù)學(xué)生的感官偏好多樣化呈現(xiàn),提供包含多種模態(tài)及媒體資源。

(3)學(xué)習(xí)內(nèi)容按語言技能可分為聽說讀寫;按語言要素可分為語音、漢字、詞匯、語法;按等級可分為初級、中級、高級;文化知識類包括漢語的文化因素、中國基本國情和文化背景知識等;特殊用途類可分為商務(wù)漢語、科技漢語、旅游漢語、醫(yī)用漢語等。根據(jù)學(xué)生個人學(xué)習(xí)目標(biāo)應(yīng)開設(shè)不同的教學(xué)課程,首先,學(xué)習(xí)內(nèi)容的安排基于學(xué)習(xí)者的學(xué)習(xí)目標(biāo)和需要應(yīng)有所偏重,如針對短期來華的漢語學(xué)習(xí)者,需更重視聽和說技能的訓(xùn)練。其次,滿足不同學(xué)習(xí)者的學(xué)習(xí)需要,提供多種“中文+職業(yè)技能”課程內(nèi)容,如“中文+醫(yī)學(xué)”“中文+旅游”等。此外,不同國家、民族的漢語學(xué)習(xí)者不僅對漢語學(xué)習(xí)內(nèi)容需求不同,對于中國文化的學(xué)習(xí)需求同樣存在差異,同一文化需根據(jù)不同學(xué)習(xí)者的漢語水平進(jìn)行分層次教學(xué)。最后,個性化的學(xué)習(xí)內(nèi)容還需強(qiáng)化學(xué)習(xí)者的弱勢學(xué)科和技能。

(4)在學(xué)習(xí)興趣上,學(xué)習(xí)者感興趣的內(nèi)容包含學(xué)習(xí)內(nèi)容、教材、教師等不同方面,應(yīng)盡量滿足不同國別、不同漢語水平的學(xué)習(xí)者興趣偏好。

(5)在學(xué)習(xí)計(jì)劃上,漢語水平等級、課程類型以及個人學(xué)習(xí)安排的不同導(dǎo)致學(xué)習(xí)者的學(xué)習(xí)進(jìn)度呈現(xiàn)差異化,應(yīng)盡量符合學(xué)習(xí)者當(dāng)前的認(rèn)知能力和漢語水平等級,并跟隨學(xué)生的動態(tài)變化及時調(diào)節(jié)。

(6)在學(xué)習(xí)方法上,漢語學(xué)習(xí)者具有不同的學(xué)習(xí)策略和手段等,如在漢語寫作課程中,有的學(xué)生偏向基于大量練習(xí)來提高寫作,有的偏向在教師講解后或在大量閱讀基礎(chǔ)上進(jìn)行寫作等。因此滿足學(xué)習(xí)個性化需求應(yīng)提供多種學(xué)習(xí)方法,實(shí)現(xiàn)學(xué)生的個性化發(fā)展。

(二)國際中文教育個性化學(xué)習(xí)數(shù)據(jù)處理流程

系統(tǒng)深入地探究漢語學(xué)習(xí)者的個性化學(xué)習(xí)特征,為學(xué)生制定個性化學(xué)習(xí)方案,推送個性化學(xué)習(xí)資源,提供個性化學(xué)習(xí)服務(wù),需要充分利用現(xiàn)代信息技術(shù),特別是數(shù)據(jù)挖掘,以此實(shí)現(xiàn)對學(xué)生動態(tài)學(xué)習(xí)過程中產(chǎn)生的數(shù)據(jù)進(jìn)行深層次地分析和利用。國際中文教育個性化學(xué)習(xí)的數(shù)據(jù)處理分為數(shù)據(jù)采集、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、結(jié)果分析四個過程(19)李劍波,李小華.大數(shù)據(jù)挖掘技術(shù)與應(yīng)用[M].延吉:延邊大學(xué)出版社,2018:12~16.,流程如圖1所示。

圖1 國際中文教育個性化學(xué)習(xí)數(shù)據(jù)處理流程

1.數(shù)據(jù)采集:采集線上、線下課堂以及各學(xué)習(xí)平臺上漢語學(xué)習(xí)者的數(shù)據(jù),數(shù)據(jù)可通過文字、音頻、視頻等多種形式呈現(xiàn)。國際中文教育個性化學(xué)習(xí)數(shù)據(jù)主要來源于兩方面,一是學(xué)習(xí)者的基本信息數(shù)據(jù),二是學(xué)習(xí)數(shù)據(jù),各類具體數(shù)據(jù)內(nèi)容見表1。全面系統(tǒng)的數(shù)據(jù)收集是數(shù)據(jù)挖掘的基礎(chǔ),收集到的數(shù)據(jù)一方面是進(jìn)行學(xué)習(xí)分析的依據(jù),同時也是提供個性化服務(wù)的重要來源。

表1 數(shù)據(jù)類型

2.數(shù)據(jù)預(yù)處理:對收集到的數(shù)據(jù)進(jìn)行整理,清除無用的、不完整的、不一致的數(shù)據(jù),確保數(shù)據(jù)真實(shí)有效。數(shù)據(jù)預(yù)處理包括數(shù)據(jù)集成、數(shù)據(jù)清理、數(shù)據(jù)變化、數(shù)據(jù)簡化等。(20)劉明吉,王秀峰,黃亞樓.數(shù)據(jù)挖掘中的數(shù)據(jù)預(yù)處理[J].計(jì)算機(jī)科學(xué),2000,(4).

3.數(shù)據(jù)挖掘:運(yùn)用關(guān)聯(lián)規(guī)則、聚類分析、統(tǒng)計(jì)分析、頻繁訪問組等方法對漢語學(xué)習(xí)者數(shù)據(jù)進(jìn)行挖掘。

4.結(jié)果分析:通過以上的數(shù)據(jù)分析得出結(jié)果,并將結(jié)果以可理解、可視化的方式呈現(xiàn)。通過結(jié)果分析,我們可以較為直觀看到學(xué)生的個體學(xué)習(xí)特征及學(xué)習(xí)偏好,比如有的學(xué)習(xí)者口語流利但是寫作較差,有的學(xué)生很難發(fā)準(zhǔn)某個聲調(diào),有的學(xué)生經(jīng)常在某類詞或句型產(chǎn)生偏誤,有的學(xué)生難以分辨相似詞語之間的差異,有的學(xué)生對圖像比對文字更靈敏等。

三、基于數(shù)據(jù)挖掘的國際中文教育個性化學(xué)習(xí)平臺模型

國際中文教育個性化學(xué)習(xí)面臨的主要挑戰(zhàn)就是如何因人而異有針對性地提供差別化的課程安排和教學(xué)內(nèi)容,目前流行的教育模式,包括網(wǎng)絡(luò)教育系統(tǒng)和遠(yuǎn)程輔助教學(xué)系統(tǒng),大部分是以傳統(tǒng)教學(xué)模式為基礎(chǔ),難以滿足信息時代學(xué)生的個性化學(xué)習(xí)需求。信息化和云計(jì)算平臺技術(shù)的發(fā)展,特別是數(shù)據(jù)挖掘的實(shí)際應(yīng)用,為個性化學(xué)習(xí)這一目標(biāo)提供了強(qiáng)有力的技術(shù)支撐,為實(shí)現(xiàn)個性化學(xué)習(xí)提供了可能。

基于數(shù)據(jù)挖掘的具備個性化學(xué)習(xí)功能的學(xué)習(xí)平臺是在原有信息化系統(tǒng)的基礎(chǔ)上,增加數(shù)據(jù)挖掘處理和個性化服務(wù)等功能,在有效提取、分析國際中文教育漢語學(xué)習(xí)者產(chǎn)生的學(xué)習(xí)數(shù)據(jù)基礎(chǔ)上,以個性化學(xué)習(xí)及二語習(xí)得相關(guān)理論為指導(dǎo),以學(xué)習(xí)者信息庫、教學(xué)資源庫、測試資源庫等為支撐,利用數(shù)據(jù)挖掘技術(shù),運(yùn)用教學(xué)策略,構(gòu)建能夠有效反饋學(xué)習(xí)數(shù)據(jù)的個性化學(xué)習(xí)平臺模型,制定學(xué)習(xí)者個性化學(xué)習(xí)方案,以期為學(xué)習(xí)者提供高效的個性化服務(wù),提升漢語學(xué)習(xí)者的漢語水平和學(xué)習(xí)能力等。

基于數(shù)據(jù)挖掘的國際中文教育個性化學(xué)習(xí)平臺模型采用三層架構(gòu)進(jìn)行設(shè)計(jì),包含表現(xiàn)層、業(yè)務(wù)邏輯層、數(shù)據(jù)訪問層(21)朱愛紅,余冬梅,張聚禮.基于B/S軟件體系結(jié)構(gòu)的研究[J].計(jì)算機(jī)工程與設(shè)計(jì),2005,(5).,如圖2所示。

圖2 基于數(shù)據(jù)挖掘的國際中文教育個性化學(xué)習(xí)平臺模型

1.表現(xiàn)層主要是個性化學(xué)習(xí)平臺的功能展示。學(xué)習(xí)者在個性化學(xué)習(xí)平臺進(jìn)行自主學(xué)習(xí)、開展學(xué)習(xí)活動及進(jìn)行測試等。

2.業(yè)務(wù)邏輯層主要功能是對數(shù)據(jù)進(jìn)行分析,為個性化學(xué)習(xí)平臺的構(gòu)建提供技術(shù)支撐。主要分為數(shù)據(jù)挖掘、個性化服務(wù)以及教學(xué)策略。

(1)數(shù)據(jù)挖掘。數(shù)據(jù)挖掘指運(yùn)用相關(guān)技術(shù)對學(xué)習(xí)者在平臺的學(xué)習(xí)數(shù)據(jù)進(jìn)行挖掘和分析,并基于此數(shù)據(jù)為學(xué)生提供個性化服務(wù)。

(2)個性化服務(wù)。結(jié)合孫雨生的分類(22)孫雨生,于凡,郝麗靜,等.國內(nèi)基于大數(shù)據(jù)的個性化服務(wù)研究進(jìn)展:核心內(nèi)容[J].情報(bào)雜志,2017,(10).,將其劃分以下四類:個性化定制,根據(jù)學(xué)習(xí)者需求設(shè)置系統(tǒng),如個性化皮膚、網(wǎng)頁內(nèi)容和風(fēng)格設(shè)置以及定制個性化學(xué)習(xí)方案。在平臺系統(tǒng)的設(shè)計(jì)中可融合具備中國特色的文化符號,豐富學(xué)生感知中國傳統(tǒng)文化的形式。個性化推送,基于推送標(biāo)準(zhǔn)或協(xié)議,由系統(tǒng)或人工基于大數(shù)據(jù)平臺等,結(jié)合用戶信息、需求及興趣等構(gòu)建并基于用戶興趣模型查找、分類信息,以E-mail傳遞、預(yù)約通知、Web、APP等形式分階段、適度、主動地推送到客戶端或?yàn)g覽器并接收用戶反饋以完善推送系統(tǒng)。(23)孫雨生,于凡,郝麗靜,等.國內(nèi)基于大數(shù)據(jù)的個性化服務(wù)研究進(jìn)展:核心內(nèi)容[J].情報(bào)雜志,2017,(10).進(jìn)行個性化推送時注重內(nèi)容的實(shí)時性和實(shí)用性,將實(shí)時熱點(diǎn)與教學(xué)內(nèi)容相結(jié)合,如新詞新語的使用以及充分利用中國節(jié)慶或節(jié)氣等。個性化檢索是針對個人、群體、大眾用戶特征、需求、設(shè)置、行為,依托大數(shù)據(jù)平臺構(gòu)建個性化檢索引擎,基于特定方法、技術(shù)分析用戶實(shí)時、潛在需求,實(shí)時智能、低成本、精準(zhǔn)對同一檢索詞返回不同結(jié)果并接收反饋且內(nèi)嵌感情分析、語義聯(lián)想、結(jié)果去重、鄰近搜索、智能分詞、數(shù)據(jù)庫實(shí)時同步、用戶隱私保護(hù)等功能。(24)孫雨生,于凡,郝麗靜,等.國內(nèi)基于大數(shù)據(jù)的個性化服務(wù)研究進(jìn)展:核心內(nèi)容[J].情報(bào)雜志,2017,(10).比如,初級學(xué)習(xí)者在檢索教材時,面向初級的教材應(yīng)在檢索結(jié)果的前列。個性化推薦是針對數(shù)據(jù)進(jìn)行個性化資源推薦,比如課程、教材、視頻推薦等。需要注意的是個性化推薦應(yīng)在系統(tǒng)分析學(xué)生動態(tài)學(xué)習(xí)行為的基礎(chǔ)上進(jìn)行,而不能僅以學(xué)習(xí)者興趣偏好為導(dǎo)向。

(3)教學(xué)策略。教學(xué)策略為平臺的教學(xué)設(shè)計(jì)以及個性化服務(wù)設(shè)置提供依據(jù)和方向。如在內(nèi)容的推送上需要遵循語言習(xí)得的“i+1”的原則,根據(jù)漢語者的水平進(jìn)行可理解輸入;在學(xué)習(xí)內(nèi)容的重現(xiàn)上需要結(jié)合語言習(xí)得的遺忘規(guī)律,可根據(jù)學(xué)習(xí)者個人識記時間、內(nèi)容、數(shù)量、程度以及方式進(jìn)行內(nèi)容推送等。

3.數(shù)據(jù)訪問層的主要功能是負(fù)責(zé)數(shù)據(jù)庫的訪問,對數(shù)據(jù)庫完成增加、刪除、修改、查詢操作(25)李俊杰,張建飛,胡杰,盛守卓.基于自適應(yīng)題庫的智能個性化語言學(xué)習(xí)平臺的設(shè)計(jì)與應(yīng)用[J].現(xiàn)代教育技術(shù),2018,(10).,主要包括學(xué)習(xí)者信息庫、教學(xué)資源庫、測試資源庫、其他資源庫等。

四、數(shù)據(jù)挖掘在國際中文教育個性化學(xué)習(xí)中的應(yīng)用

(一)基于數(shù)據(jù)挖掘的國際中文教育個性化學(xué)習(xí)平臺流程設(shè)計(jì)

圖3 基于數(shù)據(jù)挖掘的國際中文教育個性化學(xué)習(xí)平臺流程設(shè)計(jì)

基于數(shù)據(jù)挖掘的國際中文教育個性化學(xué)習(xí)平臺流程設(shè)計(jì)具體如下:

1.輸入信息和語言水平診斷。學(xué)習(xí)者登錄平臺后輸入基本信息,基于平臺提供的測試題庫,進(jìn)行語言水平測試。平臺通過數(shù)據(jù)分析能初步了解學(xué)習(xí)者的學(xué)習(xí)能力以及目前的漢語水平等,為個性化學(xué)習(xí)方案的定制提供數(shù)據(jù)支撐。

2.構(gòu)建個性化學(xué)習(xí)方案。個性化學(xué)習(xí)方案主要包含兩個方面,一是學(xué)習(xí)者根據(jù)自己的學(xué)習(xí)目標(biāo)進(jìn)行個性化學(xué)習(xí)設(shè)計(jì),如對學(xué)習(xí)資源、學(xué)習(xí)內(nèi)容以及學(xué)習(xí)計(jì)劃的設(shè)置等。二是平臺在全面系統(tǒng)分析學(xué)習(xí)者個性化需求以及學(xué)習(xí)特征的基礎(chǔ)上生成的學(xué)習(xí)者模型?;谝陨蟽蓚€數(shù)據(jù),平臺為學(xué)習(xí)者提供最優(yōu)化的學(xué)習(xí)方案,如圖4所示。根據(jù)診斷測試以及考察學(xué)習(xí)數(shù)據(jù)(分?jǐn)?shù)、測試、作業(yè)、發(fā)言、匯報(bào)等)可以預(yù)估學(xué)習(xí)者目前的漢語水平;根據(jù)學(xué)習(xí)感官偏好、工具偏好、信息加工偏好等,可了解到學(xué)習(xí)者的學(xué)習(xí)風(fēng)格,如學(xué)習(xí)者更喜歡視覺模態(tài)的內(nèi)容呈現(xiàn),在平臺中可以適時增加以圖片、視頻、動畫呈現(xiàn)形式的學(xué)習(xí)資源;通過抓取學(xué)習(xí)者的行為數(shù)據(jù)(資源下載、點(diǎn)贊、評論、分享、網(wǎng)頁瀏覽、個人收藏等),可追蹤到學(xué)習(xí)者的興趣偏好;針對漢語水平及興趣偏好等可初步制定學(xué)習(xí)資源、學(xué)習(xí)內(nèi)容以及學(xué)習(xí)計(jì)劃等。

圖4 基于數(shù)據(jù)挖掘的個性化學(xué)習(xí)方案

3.推送個性化學(xué)習(xí)資源。基于生成的個性化學(xué)習(xí)方案,為學(xué)習(xí)者設(shè)計(jì)相關(guān)學(xué)習(xí)活動,推送符合語言水平、學(xué)習(xí)需求及興趣偏好的學(xué)習(xí)內(nèi)容。學(xué)習(xí)者的偏好及語言水平會隨著課程的學(xué)習(xí)發(fā)生變化,因此提供的學(xué)習(xí)內(nèi)容需在及時追蹤和跟進(jìn)學(xué)習(xí)者水平及興趣愛好的動態(tài)變化的基礎(chǔ)上進(jìn)行更新與修訂。

4.生成個性化學(xué)習(xí)數(shù)據(jù)。在學(xué)習(xí)的過程,學(xué)習(xí)者的認(rèn)知偏好、認(rèn)知能力、知識水平等是動態(tài)的,由此同樣也會因?qū)W習(xí)階段的改變、學(xué)習(xí)內(nèi)容的加深生成最新的個性化學(xué)習(xí)數(shù)據(jù)。在該階段,平臺會依據(jù)學(xué)習(xí)進(jìn)度對學(xué)習(xí)者知識掌握情況進(jìn)行過程性評價和總結(jié)性評價,并在此基礎(chǔ)上調(diào)整相應(yīng)資源推送。同時,學(xué)習(xí)者根據(jù)測驗(yàn)結(jié)果也可自主調(diào)整學(xué)習(xí)內(nèi)容、學(xué)習(xí)計(jì)劃以及學(xué)習(xí)方式等。

5.進(jìn)行個性化學(xué)習(xí)監(jiān)管。個性化監(jiān)管是針對不同學(xué)習(xí)者的學(xué)習(xí)情況和狀態(tài)設(shè)定不同的干預(yù)程序,然后依據(jù)學(xué)生個人具體情況,運(yùn)用技術(shù)進(jìn)行不同程度、形式的監(jiān)督和管理。平臺基于生成的最新學(xué)習(xí)數(shù)據(jù),一方面可以有效地對學(xué)習(xí)者進(jìn)行個性化學(xué)習(xí)監(jiān)管與干預(yù),如對學(xué)生的學(xué)習(xí)時間、學(xué)習(xí)側(cè)重點(diǎn)進(jìn)行提示,給出個性化學(xué)習(xí)建議等。另一方面生成的數(shù)據(jù)是平臺優(yōu)化個性化學(xué)習(xí)方案的重要來源,根據(jù)學(xué)習(xí)者的目前的知識水平修改個性化學(xué)習(xí)方案,對學(xué)生薄弱環(huán)節(jié)進(jìn)行鞏固練習(xí),對有難度的知識點(diǎn)進(jìn)行強(qiáng)化訓(xùn)練,減少已掌握內(nèi)容推送等。如因受母語和目的語的干擾,日本學(xué)習(xí)者在學(xué)習(xí)漢字時就需要加強(qiáng)漢語漢字詞和日語漢字詞的辨析等。

(二)數(shù)據(jù)挖掘技術(shù)與具體應(yīng)用

數(shù)據(jù)挖掘技術(shù)通過對不同學(xué)習(xí)者課堂學(xué)習(xí)數(shù)據(jù)、訪問的學(xué)習(xí)平臺留下的登錄信息、日志文件等的挖掘分析,能夠找出潛在的學(xué)習(xí)模式與特征,了解學(xué)習(xí)者的學(xué)習(xí)風(fēng)格和偏好,歸納學(xué)習(xí)規(guī)律及預(yù)測學(xué)習(xí)趨勢。其中,統(tǒng)計(jì)分析、關(guān)聯(lián)規(guī)則、頻繁訪問組、聚類分析等是數(shù)據(jù)挖掘常用方法。

1.統(tǒng)計(jì)分析

統(tǒng)計(jì)分析是數(shù)據(jù)庫處理數(shù)據(jù)的最基本功能。通過統(tǒng)計(jì)分析方法,可以統(tǒng)計(jì)學(xué)習(xí)者各類作業(yè)、測試以及語音、語法、詞匯、漢字等語言要素中出現(xiàn)偏誤較多的知識點(diǎn),如統(tǒng)計(jì)出學(xué)生最難發(fā)的音調(diào)、最容易混淆的詞匯、最易錯的句型等。同時,在國際中文教育個性化學(xué)習(xí)平臺中,將學(xué)習(xí)者的訪問課程、停留時間、學(xué)習(xí)時長、點(diǎn)擊次數(shù)以及不同時期該平臺所呈現(xiàn)的訪問特點(diǎn)等數(shù)據(jù),與學(xué)習(xí)測試結(jié)果中的成績分布相結(jié)合進(jìn)行技術(shù)分析,可以剖析學(xué)生的學(xué)習(xí)特征并預(yù)測學(xué)生偏誤等。

2.關(guān)聯(lián)規(guī)則

“關(guān)聯(lián)規(guī)則是在交易數(shù)據(jù)、關(guān)系數(shù)據(jù)或其他信息載體中,查找存在于項(xiàng)目集合或?qū)ο蠹现虚g的頻繁模式、關(guān)聯(lián)、相關(guān)性或因果結(jié)果,通過分析數(shù)據(jù)或記錄間的關(guān)系,決定哪些事情將一起發(fā)生?!?26)李芳,王恒山,呂麗娟.關(guān)聯(lián)規(guī)則在教學(xué)管理決策支持中的應(yīng)用[J].上海理工大學(xué)學(xué)報(bào),2005,(3).利用關(guān)聯(lián)規(guī)則進(jìn)行數(shù)據(jù)挖掘,可以分析出兩個或兩個以上數(shù)據(jù)之間的潛在關(guān)系,提取數(shù)據(jù)之間的相關(guān)性。

首先,關(guān)聯(lián)規(guī)則的應(yīng)用有利于掌握漢語學(xué)習(xí)者的動態(tài)學(xué)習(xí)特征。借助關(guān)聯(lián)規(guī)則技術(shù)挖掘?qū)W生在漢語學(xué)習(xí)過程中練習(xí)、測試中產(chǎn)生的大量數(shù)據(jù),分析產(chǎn)生的偏誤與學(xué)習(xí)者之間的關(guān)系,提取偏誤與其背后知識體系的關(guān)聯(lián)及產(chǎn)生原因,找到學(xué)習(xí)者掌握不足的內(nèi)容,這便于及時調(diào)整個性化學(xué)習(xí)方案,重點(diǎn)鞏固學(xué)生薄弱知識。因此,在國際中文教育個性化學(xué)習(xí)平臺中需及時增加學(xué)生應(yīng)該鞏固的相關(guān)知識點(diǎn),達(dá)到及時復(fù)習(xí)的效果。

其次,關(guān)聯(lián)規(guī)則的應(yīng)用能夠聚焦學(xué)習(xí)者學(xué)習(xí)興趣,優(yōu)化教學(xué)設(shè)計(jì)。關(guān)聯(lián)規(guī)則能夠挖掘漢語學(xué)習(xí)者瀏覽的路徑(如網(wǎng)頁、軟件等)以及關(guān)注、下載、收藏、評價內(nèi)容等之間的關(guān)系,從中不僅能夠推斷出學(xué)生重點(diǎn)關(guān)注內(nèi)容和興趣偏好,同時可以獲取不易發(fā)現(xiàn)或關(guān)注度較高的學(xué)習(xí)資源,如點(diǎn)擊率較高的內(nèi)容、網(wǎng)頁、平臺等,從而擴(kuò)充整合可利用學(xué)習(xí)資源,改進(jìn)教學(xué)設(shè)計(jì)等。因此,在個性化平臺中可以添加關(guān)聯(lián)度較高的高點(diǎn)擊率或高關(guān)注度的相關(guān)學(xué)習(xí)資源鏈接,為學(xué)生提供便捷服務(wù)。

3.頻繁訪問組

頻繁訪問組是指確定哪些頁面是漢語學(xué)習(xí)者經(jīng)常訪問的,即構(gòu)成用戶頻繁訪問的頁組。比如,學(xué)習(xí)課程《當(dāng)代中國話題》的學(xué)生對該課程的部分內(nèi)容感興趣,就會頻繁訪問相關(guān)內(nèi)容,通過對頻繁訪問的路徑進(jìn)行分析,可以掌握學(xué)生感興趣的學(xué)習(xí)內(nèi)容,這有利于補(bǔ)充滿足學(xué)生興趣偏好的課程內(nèi)容。同樣,國際中文教育個性化學(xué)習(xí)平臺也可以將學(xué)習(xí)者頻繁訪問的鏈接地址在平臺中保存,方便學(xué)習(xí)者訪問用戶頻繁訪問網(wǎng)頁組。

4.聚類分析

“聚類分析是一種根據(jù)研究對象的特性,由已知數(shù)據(jù)計(jì)算各觀察個體或變量之間親疏關(guān)系的統(tǒng)計(jì)量,從而對樣本或變量進(jìn)行定量分析的統(tǒng)計(jì)方法?!?27)劉堅(jiān),黃鈺瑩,顏李朝.課堂教學(xué)評價數(shù)據(jù)挖掘與分析[J].湖南師范大學(xué)教育科學(xué)學(xué)報(bào),2019,(2).在Web訪問模式挖掘中,聚類分析包含頁面聚類和學(xué)習(xí)者聚類。(28)陳超.基于數(shù)據(jù)挖掘的個性化學(xué)習(xí)模式研究[J].電子設(shè)計(jì)工程,2013,(12).國際中文教育個性化學(xué)習(xí)平臺中的頁面聚類是:當(dāng)具有相似漢語水平以及學(xué)習(xí)興趣的學(xué)習(xí)者都集中于某一類型的學(xué)習(xí)資源或網(wǎng)站時,也可以為同樣漢語水平等級以及興趣偏好的學(xué)習(xí)者推薦相似內(nèi)容。比如,不同國別、年齡、學(xué)歷的漢語學(xué)習(xí)者對中國文化符號的認(rèn)知以及所感興趣的中華文化具備差異性,在追蹤到某一群體的文化興趣偏好的基礎(chǔ)上,聚類分析可以將相似內(nèi)容同樣推薦給具備相同國別、年齡、學(xué)歷等特征的其他學(xué)習(xí)者。學(xué)習(xí)者聚類主要是將具有相似訪問行為的漢語學(xué)習(xí)者聚成一類,可將該學(xué)習(xí)平臺上具備相同或類似學(xué)習(xí)特征的學(xué)習(xí)者聚類為一個學(xué)習(xí)社區(qū)或小組,并有針對性地設(shè)置和提供該學(xué)習(xí)小組感興趣、有助于該小組鞏固所學(xué)知識點(diǎn)的教學(xué)頁面結(jié)構(gòu)和頁面內(nèi)容,從而為這些學(xué)習(xí)者提供一個個性化的學(xué)習(xí)環(huán)境。

數(shù)據(jù)挖掘在國際中文教育個性化學(xué)習(xí)中的應(yīng)用對漢語學(xué)習(xí)者、國際中文教育個性化學(xué)習(xí)平臺的發(fā)展及建設(shè)有著重要意義和應(yīng)用價值。漢語學(xué)習(xí)者可以清晰地了解自己的學(xué)習(xí)情況,認(rèn)識到自己的優(yōu)勢和不足,優(yōu)化自己的學(xué)習(xí)行為,提高學(xué)習(xí)績效。個性化學(xué)習(xí)平臺一方面可以較為清晰地掌握學(xué)生情況,洞悉學(xué)生學(xué)習(xí)特征和相關(guān)規(guī)律,預(yù)測學(xué)生學(xué)習(xí)行為,給予學(xué)生方法指導(dǎo);另一方面同時可以基于數(shù)據(jù)及時調(diào)整個性化學(xué)習(xí)方案,提升學(xué)習(xí)效果。最后,數(shù)據(jù)挖掘技術(shù)在國際中文教育個性化學(xué)習(xí)平臺建設(shè)中的應(yīng)用,除了便于掌握學(xué)生的動態(tài)學(xué)習(xí)數(shù)據(jù),更好地實(shí)現(xiàn)個性化服務(wù)之外,還為國際中文教育信息化平臺的建設(shè)提供了路徑參考,驅(qū)動國際中文教育智能化發(fā)展。

五、結(jié) 語

在“互聯(lián)網(wǎng)+”時代背景下,如何整合利用海量數(shù)據(jù)與資源,為漢語學(xué)習(xí)者提供高效、實(shí)用的個性化服務(wù)值得進(jìn)一步深入研究。數(shù)據(jù)挖掘等現(xiàn)代技術(shù)的運(yùn)用是大數(shù)據(jù)時代教育發(fā)展的必然趨勢,數(shù)據(jù)挖掘在國際中文教育個性化學(xué)習(xí)中的應(yīng)用為發(fā)現(xiàn)更多潛在的數(shù)據(jù)與信息提供了有效途徑,通過挖掘和分析數(shù)據(jù)之間的潛在關(guān)系,能夠清楚了解漢語學(xué)習(xí)者的現(xiàn)狀及動態(tài)發(fā)展,掌握學(xué)習(xí)者學(xué)習(xí)特征與規(guī)律,并根據(jù)學(xué)習(xí)者的個性化需求進(jìn)行精準(zhǔn)投放與監(jiān)管干預(yù),以此實(shí)現(xiàn)個性化教育。隨著大數(shù)據(jù)、互聯(lián)網(wǎng)、人工智能、云計(jì)算等現(xiàn)代信息技術(shù)的持續(xù)發(fā)展與廣泛應(yīng)用,將為實(shí)現(xiàn)國際中文教育個性化學(xué)習(xí)提供技術(shù)支撐,為國際中文教育智能化發(fā)展提供強(qiáng)大動力。

猜你喜歡
數(shù)據(jù)挖掘個性化漢語
學(xué)漢語
金橋(2022年6期)2022-06-20 01:36:16
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
輕輕松松聊漢語 后海
金橋(2020年11期)2020-12-14 07:52:56
堅(jiān)持個性化的寫作
文苑(2020年4期)2020-05-30 12:35:12
新聞的個性化寫作
新聞傳播(2018年12期)2018-09-19 06:27:10
追劇宅女教漢語
漢語不能成為“亂燉”
華人時刊(2017年17期)2017-11-09 03:12:08
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
上汽大通:C2B個性化定制未來
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
祁连县| 建昌县| 钦州市| 上高县| 阜康市| 合阳县| 福州市| 资源县| 柏乡县| 东平县| 安多县| 虎林市| 永福县| 临沭县| 仪陇县| 六枝特区| 环江| 抚顺县| 西华县| 铁岭市| 太湖县| 玉树县| 红安县| 二连浩特市| 顺昌县| 泊头市| 科尔| 新宁县| 板桥市| 临桂县| 洪泽县| 泾阳县| 尚志市| 贡嘎县| 托克托县| 丰原市| 根河市| 青河县| 喀什市| 德阳市| 苍山县|