徐焱
摘 ? 要:隨著大數(shù)據(jù)時(shí)代的到來和在線學(xué)習(xí)的蓬勃發(fā)展,個(gè)性化自適應(yīng)學(xué)習(xí)日益成為人們關(guān)注的熱點(diǎn)。本文從教育數(shù)據(jù)挖掘的目標(biāo)和關(guān)鍵技術(shù)出發(fā),在個(gè)性化自適應(yīng)學(xué)習(xí)系統(tǒng)中應(yīng)用教育數(shù)據(jù)挖掘技術(shù),研究了學(xué)習(xí)者模型、領(lǐng)域知識(shí)模型和社交網(wǎng)絡(luò)模型的構(gòu)建、融合和應(yīng)用,設(shè)計(jì)出基于教育數(shù)據(jù)挖掘的個(gè)性化自適應(yīng)學(xué)習(xí)系統(tǒng)的架構(gòu)和流程,探討了模型的構(gòu)建和個(gè)性化自適應(yīng)學(xué)習(xí)引擎機(jī)制的建立,提出了基于聚類的個(gè)性化自適應(yīng)學(xué)習(xí)內(nèi)容呈現(xiàn)、基于序列挖掘和關(guān)聯(lián)規(guī)則的最佳學(xué)習(xí)路徑推薦、基于協(xié)同過濾和社交網(wǎng)絡(luò)的個(gè)性化資源推薦方法。
關(guān)鍵詞:大數(shù)據(jù);教育數(shù)據(jù)挖掘;個(gè)性化自適應(yīng)學(xué)習(xí)
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-8454(2019)11-0060-06
隨著信息技術(shù)和互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,人們?cè)絹碓蕉嗟男袨榘l(fā)生在網(wǎng)絡(luò)中,網(wǎng)絡(luò)中的數(shù)據(jù)呈現(xiàn)爆炸式增長(zhǎng),人們已經(jīng)被網(wǎng)絡(luò)信息淹沒,但卻時(shí)常感嘆缺少有用信息,于是,數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。通過數(shù)據(jù)挖掘技術(shù),我們可以收集、處理規(guī)模龐大而復(fù)雜的數(shù)據(jù),從而獲得知識(shí)和洞見。在教育領(lǐng)域,一直未能真正解決“因材施教”的問題,學(xué)生的學(xué)習(xí)能力、學(xué)習(xí)習(xí)慣、行為偏好、知識(shí)水平、興趣愛好等方面都存在個(gè)性差異,教師一般按照自己的認(rèn)知授課,很少關(guān)注學(xué)生真正的個(gè)性需求,不能實(shí)時(shí)跟蹤學(xué)生的知識(shí)掌握情況,也就無(wú)法及時(shí)對(duì)學(xué)生的學(xué)習(xí)策略作出調(diào)整。隨著在線學(xué)習(xí)的蓬勃發(fā)展,越來越多的學(xué)校、教師、學(xué)生認(rèn)可并積極參與在線學(xué)習(xí),通過在線學(xué)習(xí)系統(tǒng),學(xué)習(xí)者可以獲得優(yōu)質(zhì)的學(xué)習(xí)資源,但是,目前大多數(shù)主流的在線學(xué)習(xí)系統(tǒng)仍然是照搬傳統(tǒng)的教學(xué)模式,以課程為中心而非以學(xué)生為中心,沒有真正收集、挖掘、利用學(xué)生的學(xué)習(xí)過程數(shù)據(jù),因此造成了在線學(xué)習(xí)完成率低下。隨著“大數(shù)據(jù)時(shí)代”的到來,數(shù)據(jù)挖掘技術(shù)的快速發(fā)展,為在線學(xué)習(xí)平臺(tái)實(shí)現(xiàn)個(gè)性化自適應(yīng)學(xué)習(xí)提供了可能。
本研究設(shè)計(jì)的個(gè)性化自適應(yīng)學(xué)習(xí)系統(tǒng)可以全面實(shí)時(shí)記錄學(xué)習(xí)者的學(xué)習(xí)過程,通過教育數(shù)據(jù)挖掘?qū)W(xué)生的學(xué)習(xí)數(shù)據(jù)進(jìn)行加工、處理、利用,及時(shí)給予學(xué)生反饋信息,預(yù)測(cè)學(xué)生的學(xué)習(xí)趨勢(shì),動(dòng)態(tài)呈現(xiàn)個(gè)性化自適應(yīng)學(xué)習(xí)內(nèi)容,規(guī)劃學(xué)習(xí)路徑,推薦個(gè)性化學(xué)習(xí)資源,最終實(shí)現(xiàn)學(xué)生的個(gè)性化自適應(yīng)學(xué)習(xí)。
大數(shù)據(jù)是指無(wú)法在一定時(shí)間內(nèi)用傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具進(jìn)行獲取、管理和處理的數(shù)據(jù)集合。[1]大數(shù)據(jù)需要使用數(shù)據(jù)挖掘技術(shù)才能從中挖掘出價(jià)值,獲取知識(shí)和洞見。與傳統(tǒng)數(shù)據(jù)相比,大數(shù)據(jù)具有4V特征:數(shù)據(jù)量大(Volume)、種類多樣(Variety)、時(shí)效性強(qiáng)(Velocity)、價(jià)值巨大(Value)。
教育數(shù)據(jù)挖掘是指應(yīng)用統(tǒng)計(jì)理論、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)方法對(duì)教育大數(shù)據(jù)進(jìn)行獲取、處理以及利用,發(fā)現(xiàn)存在于教育大數(shù)據(jù)背后的潛在模式,挖掘教育大數(shù)據(jù)背后的潛藏價(jià)值。[2]通過構(gòu)建數(shù)據(jù)模型,發(fā)現(xiàn)學(xué)習(xí)者學(xué)習(xí)結(jié)果與學(xué)習(xí)時(shí)長(zhǎng)、學(xué)習(xí)內(nèi)容、答題正確率等一系列特征的相關(guān)關(guān)系,來預(yù)測(cè)學(xué)習(xí)者將來的學(xué)習(xí)趨勢(shì),從而對(duì)學(xué)習(xí)者進(jìn)行指導(dǎo)和干預(yù);挖掘隱藏在教學(xué)評(píng)價(jià)、學(xué)生成績(jī)等數(shù)據(jù)中有用的知識(shí)和規(guī)律,為教師優(yōu)化教學(xué)提供支持和決策。
1.教育數(shù)據(jù)挖掘的研究目標(biāo)
教育數(shù)據(jù)挖掘主要有四個(gè)研究目標(biāo):
①通過整合學(xué)習(xí)者的知識(shí)水平、學(xué)習(xí)風(fēng)格、學(xué)習(xí)背景、學(xué)習(xí)需求等詳細(xì)信息構(gòu)建學(xué)習(xí)者模型。
②通過探索教學(xué)內(nèi)容、教學(xué)順序與學(xué)習(xí)者學(xué)習(xí)結(jié)果的相關(guān)關(guān)系,構(gòu)建最佳教學(xué)內(nèi)容、教學(xué)順序的領(lǐng)域知識(shí)模型。
③通過研究學(xué)習(xí)者遠(yuǎn)程協(xié)同學(xué)習(xí)交流等信息,構(gòu)建學(xué)習(xí)者社交網(wǎng)絡(luò)模型。
④通過融合學(xué)習(xí)者模型、領(lǐng)域知識(shí)模型和學(xué)習(xí)者社交網(wǎng)絡(luò)模型,構(gòu)建數(shù)據(jù)計(jì)算模型,實(shí)現(xiàn)學(xué)習(xí)者個(gè)性化自適應(yīng)學(xué)習(xí),促進(jìn)有效學(xué)習(xí)的發(fā)生。
2.教育數(shù)據(jù)挖掘的關(guān)鍵技術(shù)
為了實(shí)現(xiàn)以上四個(gè)研究目標(biāo),需要采用以下五種教育數(shù)據(jù)挖掘技術(shù):
①聚類。根據(jù)數(shù)據(jù)本身特征將它們合成若干簇,在聚類過程中要求簇內(nèi)數(shù)據(jù)相似度盡可能大而簇間數(shù)據(jù)相似度盡可能小。聚類主要用于對(duì)學(xué)生進(jìn)行分組,以便開展個(gè)性化教學(xué)。
②預(yù)測(cè)。通過整合多個(gè)變量來預(yù)測(cè)某一變量的值或值區(qū)間。例如:根據(jù)學(xué)生的網(wǎng)上學(xué)習(xí)時(shí)間、單元測(cè)試情況、發(fā)帖數(shù)等預(yù)測(cè)學(xué)生課程成績(jī)或該課程學(xué)習(xí)是否會(huì)失敗。
③關(guān)聯(lián)規(guī)則。通過置信度和支持度探索變量之間的關(guān)聯(lián)關(guān)系。例如:研究者通過關(guān)聯(lián)規(guī)則挖掘?qū)W習(xí)者學(xué)習(xí)行為與學(xué)習(xí)成績(jī)的相關(guān)關(guān)系,結(jié)果反饋?zhàn)饔糜谥笇?dǎo)和干預(yù)學(xué)習(xí)者的學(xué)習(xí)行為。
④可視化??梢暬怯靡环N人們易于理解的方式描述數(shù)據(jù),以便人們可以快速區(qū)分和辨別數(shù)據(jù)特征。例如:姜強(qiáng)等研究者采用統(tǒng)計(jì)和可視化的方法用不同顏色、進(jìn)度條、圖、表等工具顯示學(xué)生的學(xué)習(xí)進(jìn)度、學(xué)習(xí)時(shí)間、學(xué)習(xí)次數(shù)以及學(xué)習(xí)者社交網(wǎng)絡(luò)等信息,以激勵(lì)學(xué)習(xí)者學(xué)習(xí)。[3]
⑤社交網(wǎng)絡(luò)分析。社交網(wǎng)絡(luò)分析是對(duì)在線社交關(guān)系進(jìn)行分析的方法,通過發(fā)現(xiàn)學(xué)習(xí)者之間的關(guān)系,來實(shí)現(xiàn)資源推薦。研究者采用社交網(wǎng)絡(luò)分析計(jì)算遠(yuǎn)程協(xié)同學(xué)習(xí)中學(xué)習(xí)偏好相似度,來實(shí)現(xiàn)個(gè)性化資源推薦。[4]
每個(gè)學(xué)習(xí)者有不同的生物遺傳基礎(chǔ),來自不同的社會(huì)文化環(huán)境,在智力和非智力因素方面有突出的個(gè)體差異,表現(xiàn)在認(rèn)知、情感、注意力、態(tài)度、學(xué)習(xí)能力、學(xué)習(xí)動(dòng)機(jī)和需求等方面,即使同一個(gè)學(xué)習(xí)者在不同的學(xué)習(xí)時(shí)段學(xué)習(xí)需求也不同。[5]而傳統(tǒng)的統(tǒng)一教學(xué)內(nèi)容和方式不能滿足學(xué)習(xí)者的個(gè)性化學(xué)習(xí)需求,不利于學(xué)習(xí)者學(xué)習(xí)和成長(zhǎng)。解決這一問題的方法之一就是個(gè)性化自適應(yīng)學(xué)習(xí)。教育數(shù)據(jù)挖掘的發(fā)展為個(gè)性化自適應(yīng)學(xué)習(xí)提供了可能,通過對(duì)學(xué)習(xí)系統(tǒng)中大量詳細(xì)的學(xué)習(xí)者信息和相關(guān)行為數(shù)據(jù),如學(xué)習(xí)路徑、學(xué)習(xí)日志、學(xué)習(xí)成果、學(xué)習(xí)管理數(shù)據(jù)、課程數(shù)據(jù)等的采集、存儲(chǔ)和挖掘,根據(jù)學(xué)習(xí)者個(gè)性特征差異為學(xué)習(xí)者提供個(gè)性化學(xué)習(xí)內(nèi)容,以可視化方式呈現(xiàn)數(shù)據(jù)結(jié)果,促進(jìn)學(xué)習(xí)者自適應(yīng)學(xué)習(xí);幫助教師優(yōu)化教學(xué)內(nèi)容,提升教學(xué)水平;發(fā)現(xiàn)學(xué)習(xí)者潛在的學(xué)習(xí)問題并預(yù)測(cè)未來表現(xiàn),教學(xué)管理者根據(jù)預(yù)測(cè)結(jié)果進(jìn)行指導(dǎo)和干預(yù),促進(jìn)有效學(xué)習(xí)的發(fā)生。
在個(gè)性化自適應(yīng)學(xué)習(xí)系統(tǒng)中應(yīng)用教育數(shù)據(jù)挖掘主要包括:[6]構(gòu)建學(xué)習(xí)者模型、構(gòu)建領(lǐng)域知識(shí)模型、構(gòu)建社交網(wǎng)絡(luò)模型、模型融合,通過模型構(gòu)建、融合和應(yīng)用促進(jìn)學(xué)習(xí)者有效學(xué)習(xí)的發(fā)生。
(1)構(gòu)建學(xué)習(xí)者模型
構(gòu)建學(xué)習(xí)者模型包括學(xué)習(xí)者建檔、構(gòu)建學(xué)習(xí)者知識(shí)模型、經(jīng)歷模型、行為模型等四個(gè)方面。
①學(xué)習(xí)者建檔:采集學(xué)習(xí)者學(xué)習(xí)相關(guān)數(shù)據(jù)和個(gè)人信息數(shù)據(jù),通過聚類分析學(xué)習(xí)者的學(xué)習(xí)特征,對(duì)學(xué)習(xí)者進(jìn)行分簇,建立學(xué)習(xí)者檔案,為不同簇的學(xué)習(xí)者提供個(gè)性化學(xué)習(xí)內(nèi)容和學(xué)習(xí)路徑,促進(jìn)有效學(xué)習(xí)的發(fā)生。本研究通過對(duì)學(xué)習(xí)者學(xué)習(xí)新知識(shí)前進(jìn)行前驅(qū)知識(shí)測(cè)試,為學(xué)習(xí)者建立學(xué)習(xí)檔案,根據(jù)學(xué)習(xí)者的不同特征,為學(xué)習(xí)者呈現(xiàn)個(gè)性化和適應(yīng)性的學(xué)習(xí)內(nèi)容。
②構(gòu)建學(xué)習(xí)者知識(shí)模型:學(xué)習(xí)者的在線遠(yuǎn)程學(xué)習(xí)數(shù)據(jù),包括回答正確率、請(qǐng)求幫助的次數(shù)、每次回答的時(shí)間、重復(fù)答錯(cuò)的數(shù)據(jù),這些數(shù)據(jù)可以是課程層次的、也可以是單元層次的或者是知識(shí)點(diǎn)層次的。通過挖掘分析,構(gòu)建學(xué)習(xí)者知識(shí)模型??捎糜诳梢暬@示學(xué)習(xí)者的知識(shí)掌握情況,也可用于系統(tǒng)自動(dòng)反饋學(xué)習(xí)內(nèi)容給學(xué)習(xí)者。本研究通過收集個(gè)性化自適應(yīng)系統(tǒng)中學(xué)習(xí)者學(xué)習(xí)每一個(gè)學(xué)習(xí)單元的詳細(xì)數(shù)據(jù),為學(xué)習(xí)者構(gòu)建學(xué)習(xí)者知識(shí)模型,一方面用于可視化顯示學(xué)習(xí)者的真實(shí)學(xué)習(xí)情況,另一方面用于自動(dòng)判斷學(xué)習(xí)者是否已掌握本單元學(xué)習(xí)內(nèi)容,如果未掌握,則根據(jù)學(xué)習(xí)者知識(shí)模型給學(xué)習(xí)者自動(dòng)反饋個(gè)性化自適應(yīng)學(xué)習(xí)內(nèi)容。
③構(gòu)建學(xué)習(xí)者經(jīng)歷模型:通過采集學(xué)習(xí)者在后續(xù)單元或課程學(xué)習(xí)中的選擇、表現(xiàn)、行為和學(xué)習(xí)效果以及學(xué)習(xí)者學(xué)習(xí)滿意度問卷調(diào)查等數(shù)據(jù),構(gòu)建學(xué)習(xí)者經(jīng)歷模型,使用該模型可以對(duì)在線遠(yuǎn)程學(xué)習(xí)中的課程再設(shè)計(jì),提高教學(xué)效率和學(xué)生學(xué)習(xí)成績(jī)。
本研究通過收集學(xué)習(xí)者在課程學(xué)習(xí)中單元學(xué)習(xí)順序的選擇、行為、學(xué)習(xí)結(jié)果和學(xué)習(xí)者滿意度問卷調(diào)查等數(shù)據(jù),構(gòu)建學(xué)習(xí)者經(jīng)歷模型,一方面通過預(yù)測(cè)方法預(yù)知學(xué)習(xí)者下一步的學(xué)習(xí)需求,為學(xué)習(xí)者提供個(gè)性化的自適應(yīng)學(xué)習(xí)內(nèi)容,另一方面通過關(guān)聯(lián)規(guī)則挖掘?qū)W習(xí)順序、行為和結(jié)果之間的相關(guān)關(guān)系,優(yōu)化課程學(xué)習(xí)順序,為優(yōu)化領(lǐng)域知識(shí)模型提供支持。
④構(gòu)建學(xué)習(xí)者行為模型:通過采集學(xué)習(xí)者在線遠(yuǎn)程學(xué)習(xí)中的學(xué)習(xí)時(shí)長(zhǎng)、完成課程的學(xué)習(xí)情況、學(xué)習(xí)行為的變化情況、考試成績(jī)等數(shù)據(jù),挖掘?qū)W習(xí)者學(xué)習(xí)行為和學(xué)習(xí)成績(jī)的相關(guān)關(guān)系,構(gòu)建學(xué)習(xí)者行為模型。本研究通過收集學(xué)習(xí)者在在線遠(yuǎn)程學(xué)習(xí)中的學(xué)習(xí)時(shí)長(zhǎng)、學(xué)習(xí)次數(shù)、測(cè)試完成情況、發(fā)帖數(shù)、任務(wù)完成度和學(xué)習(xí)成績(jī)等數(shù)據(jù),以關(guān)聯(lián)規(guī)則挖掘構(gòu)建學(xué)習(xí)者行為模型,預(yù)測(cè)學(xué)習(xí)者課程學(xué)習(xí)失敗的可能性,把預(yù)測(cè)信息反饋給教師和管理者,及時(shí)對(duì)學(xué)習(xí)者進(jìn)行指導(dǎo)和干預(yù)。
(2)構(gòu)建領(lǐng)域知識(shí)模型
構(gòu)建領(lǐng)域知識(shí)模型:領(lǐng)域知識(shí)模型包括領(lǐng)域知識(shí)的組成元素和元素之間的關(guān)系。通過采集知識(shí)點(diǎn)、課程單元和課程內(nèi)容組織方式與學(xué)習(xí)結(jié)果之間的相關(guān)關(guān)系,對(duì)現(xiàn)有領(lǐng)域知識(shí)模型進(jìn)行優(yōu)化。根據(jù)優(yōu)化的領(lǐng)域知識(shí)模型,可以為學(xué)習(xí)者推薦最佳學(xué)習(xí)路徑。本研究依據(jù)聯(lián)通主義理論,將課程知識(shí)點(diǎn)以有向圖的方式形成知識(shí)地圖,一方面構(gòu)建領(lǐng)域知識(shí)模型,另一方面以可視化方式呈現(xiàn)給學(xué)習(xí)者。此外通過對(duì)學(xué)習(xí)者經(jīng)歷模型的構(gòu)建優(yōu)化現(xiàn)有領(lǐng)域知識(shí)模型。
(3)構(gòu)建社交網(wǎng)絡(luò)模型
構(gòu)建社交網(wǎng)絡(luò)模型:通過采集在線遠(yuǎn)程學(xué)習(xí)中的協(xié)作與交流數(shù)據(jù),形成鏈接學(xué)習(xí)者的社交網(wǎng)絡(luò),構(gòu)建學(xué)習(xí)者的社交網(wǎng)絡(luò)模型。
根據(jù)學(xué)習(xí)者的關(guān)系網(wǎng)絡(luò)模型進(jìn)行偏好預(yù)測(cè),預(yù)測(cè)結(jié)果推薦給學(xué)習(xí)者;也可以根據(jù)社交網(wǎng)絡(luò)模型,計(jì)算協(xié)作者之間的內(nèi)聚力,對(duì)協(xié)作進(jìn)行評(píng)價(jià)和干預(yù)。構(gòu)建社交網(wǎng)絡(luò)模型,一方面進(jìn)行偏好預(yù)測(cè),推薦個(gè)性化資源給學(xué)習(xí)者,另一方面可視化顯示學(xué)習(xí)者的社交網(wǎng)絡(luò),學(xué)習(xí)者可以查看同伴的學(xué)習(xí)進(jìn)度等信息,激勵(lì)學(xué)習(xí)者自主學(xué)習(xí)。
(4)模型融合
模型融合包含兩方面的含義:一方面構(gòu)建學(xué)習(xí)者模型和領(lǐng)域知識(shí)模型完成后,這兩個(gè)模型任意一個(gè)單獨(dú)使用都無(wú)法為學(xué)習(xí)者提供幫助,兩個(gè)模型必須融合才能給學(xué)習(xí)者提供服務(wù)。例如,對(duì)學(xué)習(xí)者建檔完成后,已經(jīng)了解學(xué)習(xí)者的前驅(qū)知識(shí)掌握情況,這時(shí)必須結(jié)合領(lǐng)域知識(shí)模型,才能給學(xué)習(xí)者提供個(gè)性化適應(yīng)性學(xué)習(xí)內(nèi)容。又例如,根據(jù)答題時(shí)間和重復(fù)答錯(cuò)的數(shù)據(jù)構(gòu)建學(xué)習(xí)者知識(shí)模型完成后,再結(jié)合領(lǐng)域知識(shí)模型,為學(xué)習(xí)者呈現(xiàn)個(gè)性化自適應(yīng)學(xué)習(xí)內(nèi)容。另一方面,模型融合還體現(xiàn)在通過構(gòu)建學(xué)習(xí)者經(jīng)歷模型,來優(yōu)化領(lǐng)域知識(shí)模型。
本研究提出了基于教育數(shù)據(jù)挖掘的個(gè)性化自適應(yīng)學(xué)習(xí)系統(tǒng)模型,如圖1所示,下面詳細(xì)分析本模型的運(yùn)行流程。
①在本系統(tǒng)中,學(xué)習(xí)者根據(jù)學(xué)習(xí)需求選擇學(xué)習(xí)單元,在開始學(xué)習(xí)之前,系統(tǒng)為了解學(xué)習(xí)者的單元前驅(qū)知識(shí)掌握情況(包括概念、過程性知識(shí)、技能和高級(jí)思維技能),為學(xué)習(xí)者提供學(xué)前測(cè)試。
②根據(jù)學(xué)習(xí)者的學(xué)前測(cè)試,采集答題正確、答題錯(cuò)誤、每題用時(shí)等數(shù)據(jù),采用聚類方法對(duì)學(xué)習(xí)者進(jìn)行建檔,個(gè)性化自適應(yīng)學(xué)習(xí)引擎根據(jù)建檔結(jié)果和領(lǐng)域知識(shí)模型,為學(xué)習(xí)者呈現(xiàn)個(gè)性化自適應(yīng)學(xué)習(xí)內(nèi)容。
③學(xué)習(xí)者學(xué)習(xí)過程中的全部行為數(shù)據(jù)會(huì)自動(dòng)采集到學(xué)習(xí)者數(shù)據(jù)庫(kù)中,包括學(xué)習(xí)需求數(shù)據(jù)、學(xué)前測(cè)試數(shù)據(jù)、學(xué)習(xí)過程數(shù)據(jù)、單元測(cè)試數(shù)據(jù)等,此外該數(shù)據(jù)庫(kù)還包含學(xué)習(xí)者的個(gè)人信息詳細(xì)數(shù)據(jù)。
④學(xué)習(xí)完成后,系統(tǒng)會(huì)給出一個(gè)單元測(cè)試,根據(jù)學(xué)習(xí)單元測(cè)試數(shù)據(jù),構(gòu)建學(xué)習(xí)者知識(shí)模型,一方面可視化顯示這些詳細(xì)數(shù)據(jù)給學(xué)習(xí)者,讓學(xué)習(xí)者全面了解單元學(xué)習(xí)結(jié)果;另一方面,對(duì)于測(cè)試未通過的學(xué)習(xí)者,個(gè)性化自適應(yīng)學(xué)習(xí)引擎根據(jù)學(xué)習(xí)者知識(shí)模型和領(lǐng)域知識(shí)模型,給學(xué)習(xí)者提供新的個(gè)性化自適應(yīng)學(xué)習(xí)內(nèi)容。
⑤系統(tǒng)會(huì)自動(dòng)采集學(xué)習(xí)者數(shù)據(jù)庫(kù)中的學(xué)習(xí)者行為和測(cè)試數(shù)據(jù),通過關(guān)聯(lián)規(guī)則挖掘?qū)W習(xí)者行為和測(cè)試成績(jī)的相關(guān)性,構(gòu)建學(xué)習(xí)者行為模型,個(gè)性化自適應(yīng)學(xué)習(xí)引擎再根據(jù)學(xué)習(xí)者最近一周的學(xué)習(xí)行為數(shù)據(jù),實(shí)時(shí)預(yù)測(cè)學(xué)習(xí)者課程學(xué)習(xí)失敗的可能性,把預(yù)測(cè)信息反饋給預(yù)警管理模塊,教師和管理者及時(shí)對(duì)學(xué)習(xí)者進(jìn)行指導(dǎo)和干預(yù)。這種實(shí)時(shí)預(yù)警可以及早發(fā)現(xiàn)學(xué)習(xí)者當(dāng)前的異常情況,盡可能地避免學(xué)習(xí)者學(xué)習(xí)失敗。
⑥系統(tǒng)自動(dòng)采集學(xué)習(xí)者數(shù)據(jù)庫(kù)中的學(xué)習(xí)經(jīng)歷等數(shù)據(jù),通過關(guān)聯(lián)規(guī)則挖掘單元學(xué)習(xí)順序與成績(jī)之間的相關(guān)性,構(gòu)建學(xué)習(xí)者經(jīng)歷模型,個(gè)性化自適應(yīng)學(xué)習(xí)引擎再根據(jù)當(dāng)前學(xué)習(xí)內(nèi)容,預(yù)測(cè)學(xué)習(xí)者下一個(gè)學(xué)習(xí)需求,為學(xué)習(xí)者呈現(xiàn)個(gè)性化自適應(yīng)的學(xué)習(xí)內(nèi)容。另一方面根據(jù)學(xué)習(xí)者經(jīng)歷模型,對(duì)領(lǐng)域知識(shí)模型進(jìn)行優(yōu)化。
⑦將知識(shí)點(diǎn)以有向圖的方式形成知識(shí)地圖,地圖中的知識(shí)點(diǎn)分為前驅(qū)知識(shí)點(diǎn)和后繼知識(shí)點(diǎn)以表示知識(shí)點(diǎn)之間的相關(guān)關(guān)系。本系統(tǒng)以此為基礎(chǔ)構(gòu)建領(lǐng)域知識(shí)模型,并根據(jù)學(xué)習(xí)者經(jīng)歷模型對(duì)領(lǐng)域知識(shí)模型進(jìn)行優(yōu)化完善。個(gè)性化自適應(yīng)學(xué)習(xí)引擎根據(jù)領(lǐng)域知識(shí)模型,一方面系統(tǒng)可以為學(xué)習(xí)者推薦最佳學(xué)習(xí)路徑,另一方面系統(tǒng)還可以根據(jù)學(xué)習(xí)者當(dāng)前學(xué)習(xí)路徑和設(shè)置閾值判斷學(xué)習(xí)者是否偏離最佳學(xué)習(xí)路徑,如果偏離,則對(duì)學(xué)習(xí)者進(jìn)行引導(dǎo),實(shí)現(xiàn)學(xué)習(xí)者個(gè)性化自適應(yīng)學(xué)習(xí)。
⑧系統(tǒng)自動(dòng)采集學(xué)習(xí)者數(shù)據(jù)庫(kù)中的協(xié)作交流數(shù)據(jù),構(gòu)建社交網(wǎng)絡(luò)模型,個(gè)性化自適應(yīng)學(xué)習(xí)引擎采用協(xié)同過濾技術(shù),計(jì)算學(xué)習(xí)者間偏好的相似度,進(jìn)行偏好預(yù)測(cè),找出學(xué)習(xí)者可能感興趣的內(nèi)容或活動(dòng),給學(xué)習(xí)者推薦個(gè)性化資源,另一方面可視化顯示學(xué)習(xí)者的社交網(wǎng)絡(luò),學(xué)習(xí)者可以允許或不允許同伴查看自己學(xué)習(xí)進(jìn)度等信息,激勵(lì)學(xué)習(xí)者自主學(xué)習(xí)。
在本系統(tǒng)中,學(xué)習(xí)者學(xué)習(xí)數(shù)據(jù)循環(huán)使用并且實(shí)時(shí)更新,圖2中每一個(gè)模塊的內(nèi)容隨著數(shù)據(jù)的實(shí)時(shí)更新而更新。首先學(xué)習(xí)者學(xué)習(xí)產(chǎn)生的數(shù)據(jù)進(jìn)入學(xué)習(xí)者數(shù)據(jù)庫(kù),系統(tǒng)根據(jù)學(xué)習(xí)者數(shù)據(jù)庫(kù)的數(shù)據(jù)構(gòu)建學(xué)習(xí)者模型、領(lǐng)域知識(shí)模型和社交網(wǎng)絡(luò)模型,個(gè)性化自適應(yīng)學(xué)習(xí)引擎根據(jù)這些模型和學(xué)習(xí)者實(shí)時(shí)的行為數(shù)據(jù),進(jìn)行預(yù)測(cè)和推薦,給學(xué)習(xí)者呈現(xiàn)動(dòng)態(tài)的、個(gè)性化的、適應(yīng)的學(xué)習(xí)內(nèi)容,找到最佳學(xué)習(xí)路徑并推薦個(gè)性化資源。學(xué)習(xí)者對(duì)新內(nèi)容的學(xué)習(xí)過程產(chǎn)生新的數(shù)據(jù),再次進(jìn)入學(xué)習(xí)者數(shù)據(jù)庫(kù),系統(tǒng)根據(jù)新的學(xué)習(xí)過程數(shù)據(jù)不斷對(duì)學(xué)習(xí)者模型、領(lǐng)域知識(shí)模型和社交網(wǎng)絡(luò)模型進(jìn)行優(yōu)化,再結(jié)合學(xué)習(xí)者當(dāng)前學(xué)習(xí)數(shù)據(jù)進(jìn)行預(yù)測(cè)和推薦,將動(dòng)態(tài)結(jié)果呈現(xiàn)給學(xué)習(xí)者,此過程循環(huán)往復(fù),系統(tǒng)能夠不斷進(jìn)化,自我改善和提升,使推薦和預(yù)測(cè)的內(nèi)容更適應(yīng)學(xué)習(xí)者。
在本系統(tǒng)中,學(xué)習(xí)者模型、領(lǐng)域知識(shí)模型、社交網(wǎng)路模型和個(gè)性化自適應(yīng)學(xué)習(xí)引擎是核心部分,下面介紹這四部分的機(jī)理和機(jī)制。
學(xué)習(xí)者模型(學(xué)習(xí)者建檔、行為模型、知識(shí)模型、經(jīng)歷模型)。其中學(xué)習(xí)者建檔包括學(xué)前測(cè)試中的答題正確、答題錯(cuò)誤、部分正確、重復(fù)錯(cuò)誤、每題作答時(shí)間等信息。行為模型包括登錄時(shí)間、訪問頁(yè)面、學(xué)習(xí)時(shí)長(zhǎng)、學(xué)習(xí)次數(shù)、測(cè)試完成情況、作業(yè)完成情況、發(fā)帖數(shù)、任務(wù)完成度和測(cè)試成績(jī)等信息。知識(shí)模型包括單元測(cè)試中答題正確率、每題用時(shí)、重復(fù)答錯(cuò),已學(xué)課程、掌握的知識(shí)點(diǎn)等信息。經(jīng)歷模型包括知識(shí)點(diǎn)學(xué)習(xí)順序的選擇、行為、評(píng)價(jià)和成績(jī)。
領(lǐng)域知識(shí)模型包含兩方面的內(nèi)容,[7]一方面是知識(shí)點(diǎn)本身的描述信息、學(xué)習(xí)內(nèi)容(視頻、文本、圖片、語(yǔ)音)、練習(xí)活動(dòng)、學(xué)習(xí)活動(dòng)、知識(shí)網(wǎng)絡(luò)信息;另一方面是知識(shí)點(diǎn)之間的相關(guān)關(guān)系。本研究采用有向圖的形式來構(gòu)建領(lǐng)域知識(shí)模型。如圖3所示,每一個(gè)節(jié)點(diǎn)代表一個(gè)知識(shí)點(diǎn),每個(gè)知識(shí)點(diǎn)又包含多項(xiàng)內(nèi)容。箭頭指向的方向?yàn)楹罄^知識(shí)點(diǎn),箭頭的起始端為前繼知識(shí)點(diǎn)。如知識(shí)點(diǎn)3的前繼知識(shí)點(diǎn)為知識(shí)點(diǎn)1和2,后繼知識(shí)點(diǎn)為知識(shí)點(diǎn)4。
每一個(gè)知識(shí)本身都是一個(gè)獨(dú)立的學(xué)習(xí)內(nèi)容,學(xué)習(xí)者可以在任何時(shí)候獲取需要的知識(shí),自主選擇知識(shí)點(diǎn)內(nèi)的資源、學(xué)習(xí)順序等。起始的領(lǐng)域知識(shí)模型可以按照教材或者教師的經(jīng)驗(yàn)來構(gòu)建,后期可以通過對(duì)學(xué)習(xí)者學(xué)習(xí)經(jīng)歷模型的挖掘,發(fā)現(xiàn)知識(shí)點(diǎn)之間的相關(guān)關(guān)系,不斷優(yōu)化和完善領(lǐng)域知識(shí)模型。
社交網(wǎng)絡(luò)是指社會(huì)行為者及其關(guān)系的集合。社交網(wǎng)絡(luò)圖包含節(jié)點(diǎn)和點(diǎn)之間的連線。節(jié)點(diǎn)表示信息的接收者和發(fā)出者,連線的粗細(xì),表示信息傳遞的頻率或信息量的大小。[8]本研究根據(jù)學(xué)習(xí)者之間的交流協(xié)作次數(shù)來構(gòu)建社交網(wǎng)絡(luò)模型。例如在圖4中,學(xué)習(xí)者11與學(xué)習(xí)者2、3、4、12和10有過協(xié)作交流,而且與學(xué)習(xí)者10的交流最為頻繁。
(1)基于聚類的個(gè)性化自適應(yīng)學(xué)習(xí)內(nèi)容呈現(xiàn)
個(gè)性化自適應(yīng)學(xué)習(xí)內(nèi)容的呈現(xiàn)主要體現(xiàn)在兩方面,一方面是針對(duì)學(xué)習(xí)內(nèi)容的初次學(xué)習(xí),根據(jù)學(xué)前測(cè)試情況對(duì)學(xué)習(xí)者聚類建檔,為不同類型的學(xué)習(xí)者提供個(gè)性化適應(yīng)性學(xué)習(xí)內(nèi)容;另一方面是針對(duì)學(xué)習(xí)完成后單元測(cè)試情況,根據(jù)作答數(shù)據(jù),構(gòu)建或更新學(xué)習(xí)者知識(shí)模型,如果測(cè)試通過,則本次單元學(xué)習(xí)完成,如果測(cè)試未通過,則根據(jù)詳細(xì)作答數(shù)據(jù)自動(dòng)反饋適合學(xué)習(xí)者的學(xué)習(xí)內(nèi)容。
聚類就是把一組對(duì)象按照相似性歸成若干簇,使簇中對(duì)象的相似度很高,而不同簇中的對(duì)象相似度很低。通過采集學(xué)前測(cè)試的數(shù)據(jù),根據(jù)聚類方法對(duì)學(xué)習(xí)者聚類分組,給學(xué)習(xí)者建檔。本研究采用K-means均值算法,根據(jù)學(xué)習(xí)者的答題數(shù)據(jù)對(duì)學(xué)習(xí)者聚類。算法的核心思想是首先從聚類N個(gè)對(duì)象中選擇K個(gè)對(duì)象作為聚類中心,然后計(jì)算剩余對(duì)象到聚類中心的距離,并將它分配給最相似的聚類,然后重新計(jì)算新聚類的聚類中心,重復(fù)這一過程,直到?jīng)]有點(diǎn)能改變聚類結(jié)果。本研究根據(jù)學(xué)前測(cè)試即前驅(qū)知識(shí)測(cè)試作答情況,進(jìn)行二次聚類。第一次聚類將學(xué)習(xí)者分為兩簇:A和B,簇A的對(duì)象表示通過學(xué)前測(cè)試,可以進(jìn)行新知識(shí)的學(xué)習(xí);簇B表示未通過學(xué)前測(cè)試,需要補(bǔ)習(xí)前驅(qū)知識(shí)的學(xué)習(xí)。第二次聚類,簇A中的對(duì)象根據(jù)不同的知識(shí)掌握情況、答題速度等分為不同的層次,系統(tǒng)提供不同層次的學(xué)習(xí)內(nèi)容;簇B中的對(duì)象根據(jù)前驅(qū)知識(shí)的欠缺情況再細(xì)化分簇,為不同簇提供適應(yīng)個(gè)性化知識(shí)的學(xué)習(xí)內(nèi)容。
(2)基于序列挖掘和關(guān)聯(lián)規(guī)則的最佳學(xué)習(xí)路徑推薦
學(xué)習(xí)路徑包含兩個(gè)層次的內(nèi)容:一個(gè)是知識(shí)點(diǎn)內(nèi)資源組織路徑,因?yàn)槊總€(gè)知識(shí)點(diǎn)可能包含多種不同的資源;另一個(gè)是知識(shí)點(diǎn)之間的學(xué)習(xí)路徑,學(xué)習(xí)者可以自由選擇知識(shí)點(diǎn)的學(xué)習(xí)順序,不一定是按照課本的順序,有可能是按照同伴的學(xué)習(xí)路徑。
序列挖掘算法是給定一個(gè)序列集合,每個(gè)序列都由若干元素按順序有序排列,設(shè)定用戶給出的最小支持度閾值。序列挖掘模式是找出所有的頻繁子集,即在序列集合中出現(xiàn)的頻率不小于最小支持度閾值的子序列。[9]本研究通過采集用戶訪問頁(yè)面的順序,建立學(xué)習(xí)者行為模型,通過序列挖掘方法,找出相關(guān)頁(yè)面,盡可能縮短相關(guān)內(nèi)容頁(yè)面分布的距離,在用戶學(xué)習(xí)一些內(nèi)容的時(shí)候,能夠預(yù)測(cè)用戶下一步的學(xué)習(xí)需求,為用戶提供便捷的路徑指引。
關(guān)聯(lián)規(guī)則能夠找出數(shù)據(jù)集中不同項(xiàng)目之間的相關(guān)性,關(guān)聯(lián)規(guī)則有兩個(gè)重要指標(biāo):支持度和置信度。假設(shè)I={i1,i2,i3,…im,}是m個(gè)項(xiàng)的集合,數(shù)據(jù)庫(kù)D是數(shù)據(jù)庫(kù)事務(wù)的集合,每個(gè)事務(wù)T是I的非空子集。X、Y是I中項(xiàng)的集合,如果X?T,則稱事務(wù)T包含X。支持度(support)是數(shù)據(jù)庫(kù)D中的事務(wù),同時(shí)包含X、Y的百分比;置信度(confidence)是數(shù)據(jù)庫(kù)D中的事務(wù),在已經(jīng)包含X的情況下,包含Y的百分比。如果同時(shí)滿足最小支持度閾值和最小置信度閾值,則認(rèn)為關(guān)聯(lián)規(guī)則是有趣的,[10]這些閾值是根據(jù)挖掘需要人為設(shè)定的。本研究通過采集學(xué)習(xí)者知識(shí)點(diǎn)學(xué)習(xí)順序和成績(jī)等數(shù)據(jù),建立學(xué)習(xí)者經(jīng)歷模型,通過關(guān)聯(lián)規(guī)則分析學(xué)習(xí)順序與成績(jī)之間的相關(guān)性,從而得出最佳學(xué)習(xí)路徑,用于優(yōu)化知識(shí)模型和推薦學(xué)習(xí)路徑。
(3)基于協(xié)同過濾和社交網(wǎng)絡(luò)的個(gè)性化資源推薦
協(xié)同過濾是目前推薦效果最好的算法之一,它的核心思想是計(jì)算用戶之間的偏好相似度,并進(jìn)行推薦。本研究通過構(gòu)建學(xué)習(xí)者之間交流協(xié)作的社交網(wǎng)絡(luò),來計(jì)算學(xué)習(xí)者之間的興趣偏好相似度,進(jìn)而進(jìn)行推薦。在圖4中,學(xué)習(xí)者11與學(xué)習(xí)者2、3、4、12和10有過協(xié)作交流,而且與學(xué)習(xí)者10的交流最為頻繁。這說明學(xué)習(xí)者11與學(xué)習(xí)者2、3、4、12、10可能存在相似的學(xué)習(xí)需求,或者對(duì)相同的資源感興趣,我們可以認(rèn)為他們有相似的學(xué)習(xí)偏好,而且學(xué)習(xí)者11與學(xué)習(xí)者10的偏好相似度最高,我們可以把學(xué)習(xí)者10學(xué)過的資源或者感興趣的資源優(yōu)先推薦給學(xué)習(xí)者11。這種推薦最顯著的優(yōu)點(diǎn)是不需要研究資源本身的內(nèi)容,就可以進(jìn)行效果較好的推薦,畢竟很難對(duì)資源本身的內(nèi)容進(jìn)行分析研究。
隨著大數(shù)據(jù)技術(shù)的發(fā)展,越來越多的學(xué)習(xí)者和教師認(rèn)可在線遠(yuǎn)程教育并參與其中,越來越多的行為可以被跟蹤和記錄,為實(shí)現(xiàn)學(xué)習(xí)者個(gè)性化自適應(yīng)學(xué)習(xí)提供了可能。本文在個(gè)性化自適應(yīng)學(xué)習(xí)系統(tǒng)中,應(yīng)用教育數(shù)據(jù)挖掘技術(shù),提出了基于教育數(shù)據(jù)挖掘的個(gè)性化自適應(yīng)學(xué)習(xí)系統(tǒng)的架構(gòu)和流程,研究了構(gòu)建學(xué)習(xí)者模型、領(lǐng)域知識(shí)模型、社交網(wǎng)絡(luò)模型和自適應(yīng)引擎的機(jī)制,通過模型構(gòu)建、融合和應(yīng)用,為學(xué)習(xí)者提供了動(dòng)態(tài)的個(gè)性化自適應(yīng)學(xué)習(xí)內(nèi)容、最佳學(xué)習(xí)路徑并推薦了個(gè)性化學(xué)習(xí)資源,促進(jìn)了學(xué)習(xí)者有效學(xué)習(xí)的發(fā)生。在后期研究中,我們將進(jìn)一步研究基于教育數(shù)據(jù)挖掘的個(gè)性化自適應(yīng)學(xué)習(xí)系統(tǒng)的改進(jìn)方法和具體應(yīng)用效果。
[1]趙剛.大數(shù)據(jù)技術(shù)與應(yīng)用實(shí)踐指南[M].北京:電子工業(yè)出版社,2013:4-5.
[2]江波,邱飛岳,李浩君.教育數(shù)據(jù)挖掘研究綜述——技術(shù)的視角[J].計(jì)算機(jī)與教育,2014(8):112-122.
[3]姜強(qiáng),趙蔚,王朋嬌,王麗萍.基于大數(shù)據(jù)的個(gè)性化自適應(yīng)在線學(xué)習(xí)分析模型及實(shí)現(xiàn)[J].中國(guó)電化教育,2015(1):85-92.
[4]Yang F,Han P,et al.A novel resource recommendation system based on connecting to similar e-learners[J].Springer Berlin Heidelberg,2005(3583):122-130.
[5]姜強(qiáng),趙蔚,王麗萍,李松.個(gè)性化自適應(yīng)學(xué)習(xí)研究——大數(shù)據(jù)時(shí)代數(shù)字化學(xué)習(xí)的新常態(tài)[J].中國(guó)電化教育,2016(2):25-32.
[6]徐鵬,王以寧,劉艷華,張海.大數(shù)據(jù)視角分析學(xué)習(xí)變革——美國(guó)《通過教育數(shù)據(jù)挖掘和學(xué)習(xí)分析促進(jìn)教與學(xué)》報(bào)告解讀及啟示[J].遠(yuǎn)程教育雜志,2013(6):11-17.
[7]馬相春,鐘紹春,徐妲.大數(shù)據(jù)視角下個(gè)性化自適應(yīng)學(xué)習(xí)系統(tǒng)支撐模型及實(shí)現(xiàn)機(jī)制研究[J].中國(guó)電化教育,2017(4):97-102.
[8]葛道凱,張少剛,魏順平.教育數(shù)據(jù)挖掘方法與應(yīng)用[M].北京:教育科學(xué)出版社,2012.
[9]夏明波,王曉川,孫永強(qiáng),金士堯.序列模式挖掘算法研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2006,4 (4):4-6.
[10]蔡偉杰,張曉輝,朱建秋,朱揚(yáng)勇.關(guān)聯(lián)規(guī)則挖掘綜述[J].計(jì)算機(jī)工程,2001,5(5):31-33.
(編輯:王曉明)