李菲茗 葉艷偉 李曉菲 史丹丹
【摘要】? 近年來(lái),隨著在線(xiàn)學(xué)習(xí)系統(tǒng)在教育環(huán)境中越來(lái)越普及,在線(xiàn)學(xué)習(xí)人數(shù)越來(lái)越多,教育者不可能追蹤每一個(gè)學(xué)習(xí)者的知識(shí)狀態(tài)并提供個(gè)性化的學(xué)習(xí)指導(dǎo);在線(xiàn)學(xué)習(xí)系統(tǒng)中的知識(shí)需要學(xué)習(xí)者通過(guò)各種冗余信息自我查找,導(dǎo)致學(xué)習(xí)資源和學(xué)習(xí)路徑多樣化但卻不一定有效。為了解決上述問(wèn)題,一個(gè)可以自動(dòng)追蹤學(xué)習(xí)者知識(shí)掌握情況的知識(shí)追蹤模型對(duì)教育者和學(xué)習(xí)者都是必要的,因?yàn)樗瓤梢韵蚪逃叻答亴W(xué)習(xí)者知識(shí)掌握情況,讓教育者更加了解每一個(gè)學(xué)習(xí)者,也可以推斷學(xué)習(xí)者的知識(shí)弱點(diǎn),向?qū)W習(xí)者推薦高效的學(xué)習(xí)路徑和恰當(dāng)?shù)膶W(xué)習(xí)資源,從而做到因材施教。通過(guò)2008—2017年相關(guān)文獻(xiàn)的內(nèi)容分析,從知識(shí)點(diǎn)、學(xué)習(xí)者和數(shù)據(jù)三方面總結(jié)知識(shí)追蹤模型在教育領(lǐng)域的應(yīng)用。知識(shí)追蹤模型為教育研究者預(yù)測(cè)學(xué)習(xí)者知識(shí)掌握提供了一個(gè)便捷的途徑,一直是教育數(shù)據(jù)挖掘領(lǐng)域的研究熱點(diǎn)。
【關(guān)鍵詞】? 在線(xiàn)學(xué)習(xí)系統(tǒng);知識(shí)追蹤模型;學(xué)習(xí)路徑;學(xué)習(xí)資源;知識(shí)點(diǎn)層面;學(xué)習(xí)者層面;數(shù)據(jù)層面;
教育應(yīng)用
【中圖分類(lèi)號(hào)】? G434? ? ? ?【文獻(xiàn)標(biāo)識(shí)碼】? B? ? ? ?【文章編號(hào)】? 1009-458x(2019)7-0086-06
在線(xiàn)學(xué)習(xí)系統(tǒng)是快速發(fā)展的網(wǎng)絡(luò)學(xué)習(xí)平臺(tái),在教育環(huán)境中越來(lái)越普及,吸引了數(shù)百萬(wàn)學(xué)習(xí)者注冊(cè)學(xué)習(xí)多元化的在線(xiàn)課程。從教育研究的角度來(lái)看,在線(xiàn)學(xué)習(xí)系統(tǒng)提供了幾個(gè)重要的優(yōu)點(diǎn),最顯著的是留下學(xué)習(xí)者詳細(xì)的學(xué)習(xí)軌跡,提供了調(diào)查不同軌跡下學(xué)習(xí)者行為效能的條件。然而,在線(xiàn)學(xué)習(xí)系統(tǒng)中的知識(shí)需要通過(guò)各種冗余信息自我尋求,對(duì)于學(xué)習(xí)者選擇什么樣的學(xué)習(xí)資源和學(xué)習(xí)路徑,教育者還不能及時(shí)提供幫助,因此,學(xué)習(xí)者往往缺乏個(gè)性化的教學(xué)指導(dǎo)幫助他們更有效地學(xué)習(xí)。為了提供個(gè)性化的指導(dǎo),教育者需要評(píng)估一個(gè)學(xué)習(xí)者知道什么,不知道什么,具體來(lái)說(shuō)是根據(jù)過(guò)去一系列具有正確或不正確答案的練習(xí)自動(dòng)分析學(xué)習(xí)者的知識(shí)掌握情況,預(yù)測(cè)其未來(lái)表現(xiàn)(閭漢原, 等, 2011)。其中一種方法是利用潛在變量(學(xué)習(xí)者知識(shí)掌握)和觀(guān)察變量(學(xué)習(xí)者的表現(xiàn))構(gòu)建分析學(xué)習(xí)者知識(shí)掌握情況的知識(shí)追蹤模型(如圖1所示),為提供個(gè)性化學(xué)習(xí)資源和學(xué)習(xí)路徑做好診斷。隨著研究的深入,如何利用知識(shí)追蹤模型研究學(xué)習(xí)者學(xué)習(xí)問(wèn)題,以提高學(xué)習(xí)效率,成了研究者關(guān)注的問(wèn)題。因此,本文的目的是通過(guò)對(duì)2008—2017年相關(guān)文獻(xiàn)內(nèi)容分析,總結(jié)出知識(shí)追蹤模型預(yù)測(cè)學(xué)習(xí)者知識(shí)掌握的研究情況,為知識(shí)追蹤模型在在線(xiàn)教育的應(yīng)用和研究提供參考。
一、知識(shí)追蹤模型
(一)知識(shí)追蹤模型的起源
知識(shí)追蹤模型是模擬學(xué)習(xí)者知識(shí)掌握情況的一個(gè)典型模型,由Atkinson于1972年首次提出。它假設(shè)每個(gè)知識(shí)點(diǎn)由猜測(cè)率、學(xué)習(xí)率、失誤率和學(xué)習(xí)知識(shí)之前的先驗(yàn)概率4個(gè)參數(shù)組成(Pardos & Heffernan, 2010),并由Corbett和Anderson(1994)引入智能教育領(lǐng)域,目前已經(jīng)發(fā)展成為智能輔導(dǎo)系統(tǒng)中對(duì)學(xué)習(xí)者知識(shí)掌握情況建模的主流方法。
(二)知識(shí)追蹤模型的原理
知識(shí)追蹤模型需要對(duì)不同的知識(shí)點(diǎn)分別建模,因此,在分析學(xué)習(xí)者對(duì)知識(shí)點(diǎn)的掌握情況時(shí)一般是把將要學(xué)習(xí)的知識(shí)體系分為以層級(jí)關(guān)系連接的若干個(gè)知識(shí)點(diǎn),并把學(xué)習(xí)者對(duì)每個(gè)知識(shí)點(diǎn)的掌握水平用一組二元變量來(lái)表示,每組二元變量代表學(xué)習(xí)者對(duì)此知識(shí)點(diǎn)處于“會(huì)”和“不會(huì)”兩種狀態(tài)之一。
具體來(lái)說(shuō),每個(gè)知識(shí)點(diǎn)賦予5個(gè)參數(shù)(如表1所示),分別為兩個(gè)學(xué)習(xí)參數(shù)、兩個(gè)表現(xiàn)參數(shù)和一個(gè)遺忘參數(shù)。初始概率P(L)和學(xué)習(xí)概率P(T)是學(xué)習(xí)參數(shù),猜測(cè)概率P(G)和失誤概率P(S)是學(xué)習(xí)者的表現(xiàn)參數(shù)。請(qǐng)注意,在Corbett和Anderson首次提出的知識(shí)追蹤模型中遺忘概率P(F)設(shè)置為0,即假設(shè)學(xué)習(xí)者在知識(shí)學(xué)習(xí)過(guò)程中不存在遺忘現(xiàn)象(王卓, 等, 2015)。根據(jù)圖1所示的知識(shí)追蹤模型,每次學(xué)習(xí)者答題后模型都會(huì)根據(jù)答題正誤的序列利用貝葉斯公式迭代更新其對(duì)知識(shí)的掌握情況。當(dāng)P(G)和P(S)都為0時(shí),說(shuō)明學(xué)習(xí)者答題不存在猜測(cè)和失誤情況,答題結(jié)果將會(huì)客觀(guān)真實(shí)地反映學(xué)習(xí)者的知識(shí)水平;如果P(G)和P(S)值大于0.5,說(shuō)明知識(shí)追蹤模型出現(xiàn)模型退化現(xiàn)象,學(xué)習(xí)者回答問(wèn)題的結(jié)果不能用來(lái)反映其真實(shí)知識(shí)水平。
實(shí)際上知識(shí)追蹤模型是一種特殊的隱馬爾科夫模型(hidden markov model, HMM),每一個(gè)節(jié)點(diǎn)都通過(guò)條件概率表(conditional probability table, CPT)來(lái)量化父節(jié)點(diǎn)對(duì)自身的影響(如表2所示)。表現(xiàn)節(jié)點(diǎn)在知識(shí)追蹤模型中是已知態(tài),或?yàn)檎_,或?yàn)殄e(cuò)誤;將已知的做題表現(xiàn)作為輸入,分析學(xué)習(xí)者潛在知識(shí)節(jié)點(diǎn)的掌握情況,預(yù)測(cè)學(xué)習(xí)者再次遇到該知識(shí)點(diǎn)時(shí)的表現(xiàn)。
(三)知識(shí)追蹤模型的概率公式和更新算法
根據(jù)對(duì)以上知識(shí)追蹤模型的分析,很容易得到答對(duì)答錯(cuò)時(shí)的概率公式和知識(shí)水平更新算法。這些公式被用來(lái)預(yù)測(cè)學(xué)習(xí)者做題表現(xiàn)的概率,算法用來(lái)更新學(xué)習(xí)者知識(shí)掌握水平。
1. 根據(jù)做題數(shù)據(jù)訓(xùn)練好參數(shù)之后,預(yù)測(cè)學(xué)習(xí)者做題表現(xiàn)的概率
當(dāng)答對(duì)題目時(shí):學(xué)習(xí)者答對(duì)題目的概率被解釋為在知道知識(shí)點(diǎn)的情況下沒(méi)有犯錯(cuò)和在不知道知識(shí)點(diǎn)的情況下猜對(duì)的概率之和,即
當(dāng)答錯(cuò)題目時(shí):學(xué)習(xí)者答錯(cuò)題目的概率被解釋為在知道知識(shí)點(diǎn)的情況下犯錯(cuò)和在不知道知識(shí)點(diǎn)的情況下猜錯(cuò)的概率之和,即
2. 學(xué)習(xí)者知識(shí)水平的更新算法
知識(shí)追蹤模型分為兩個(gè)階段:一是上面提到的利用學(xué)習(xí)者的大量答題序列訓(xùn)練模型參數(shù);二是學(xué)習(xí)者在學(xué)習(xí)過(guò)程中的知識(shí)掌握情況隨著時(shí)間變化,[P(L)]表示所有學(xué)習(xí)者對(duì)知識(shí)點(diǎn)掌握的初始情況。在推斷學(xué)習(xí)者對(duì)知識(shí)點(diǎn)的掌握情況時(shí),每次學(xué)習(xí)者給出答案后,利用已訓(xùn)練好的模型基于該學(xué)習(xí)者答題正誤的序列,使用貝葉斯公式迭代更新其對(duì)知識(shí)掌握的程度值(Pardos, Bergner, Seaton, & Pritchard, 2013)。知識(shí)點(diǎn)掌握情況迭代更新的算法思想如表3所示。其中,[P(Lk)]表示學(xué)習(xí)者在回答第k道題之前對(duì)相應(yīng)知識(shí)已掌握的先驗(yàn)概率,而[PLk|evidencek]根據(jù)學(xué)習(xí)者第k道題回答情況,表示更新后的已掌握知識(shí)的后驗(yàn)概率。另外,最后一個(gè)等式表示的是學(xué)習(xí)者答題后收到系統(tǒng)反饋時(shí)的學(xué)習(xí)轉(zhuǎn)化過(guò)程,這個(gè)公式在加入學(xué)習(xí)概率后計(jì)算新的先驗(yàn)概率。
總的來(lái)說(shuō),知識(shí)追蹤模型是預(yù)測(cè)學(xué)習(xí)者下一階段學(xué)習(xí)表現(xiàn)的一項(xiàng)重要建模技術(shù)。上述介紹為理解知識(shí)追蹤模型提供了基本指導(dǎo)原則。知識(shí)追蹤模型能夠用一種更加直觀(guān)且容易理解的方式判斷學(xué)習(xí)者什么時(shí)候掌握了某個(gè)知識(shí)點(diǎn),而不是簡(jiǎn)單地以學(xué)習(xí)者連續(xù)N個(gè)同一知識(shí)點(diǎn)題目回答正確來(lái)判斷。因此,對(duì)于知識(shí)追蹤模型的研究者而言,需要了解如何運(yùn)用和解釋知識(shí)追蹤模型的變化,以便在變化的學(xué)習(xí)環(huán)境中更恰當(dāng)?shù)乩斫鈱W(xué)習(xí)者的知識(shí)掌握情況。
二、研究對(duì)象的選擇
本研究的中文文獻(xiàn)來(lái)源于中國(guó)知網(wǎng)(CNKI),英文文獻(xiàn)來(lái)自Springer數(shù)據(jù)庫(kù)、Wiley-Blackwell數(shù)據(jù)庫(kù)和ACM數(shù)據(jù)庫(kù)。文獻(xiàn)的時(shí)間跨度為2008— 2017年。中文使用“貝葉斯知識(shí)追蹤”和“知識(shí)追蹤”,英文使用“Bayesian Knowledge Tracing”和“Knowledge Tracing”作為關(guān)鍵詞在相應(yīng)的中英文數(shù)據(jù)庫(kù)進(jìn)行精確搜索獲得相關(guān)文獻(xiàn)。對(duì)獲得的相關(guān)文獻(xiàn)進(jìn)行分析整理,選取關(guān)于知識(shí)追蹤模型教育應(yīng)用的文獻(xiàn)納入研究樣本,最終選定58篇文獻(xiàn),其中英文文獻(xiàn)56篇,中文文獻(xiàn)2篇,可見(jiàn)國(guó)外知識(shí)追蹤模型研究文獻(xiàn)相對(duì)較多。
通過(guò)深入分析這些相關(guān)文獻(xiàn),希望能揭示知識(shí)追蹤模型在教育領(lǐng)域應(yīng)用的三個(gè)問(wèn)題:①知識(shí)追蹤模型分析了知識(shí)點(diǎn)的哪些方面;②學(xué)習(xí)者的哪些特性影響知識(shí)追蹤模型的效果;③數(shù)據(jù)集包含的樣本和數(shù)據(jù)量對(duì)知識(shí)追蹤模型的影響。
三、文獻(xiàn)內(nèi)容分析
各種各樣功能豐富的在線(xiàn)學(xué)習(xí)系統(tǒng)正在產(chǎn)生大量的數(shù)據(jù)。為了分析這些數(shù)據(jù),研究人員經(jīng)常使用一種發(fā)展了20年的方法——知識(shí)追蹤,目前知識(shí)追蹤模型已經(jīng)成為對(duì)學(xué)習(xí)者知識(shí)掌握情況建模的主流方法。通過(guò)對(duì)2008—2017年知識(shí)追蹤模型相關(guān)文獻(xiàn)內(nèi)容的分析,文章從以下三個(gè)方面分析知識(shí)追蹤模型的教育應(yīng)用。
(一)從知識(shí)層面分析知識(shí)追蹤模型的教育應(yīng)用
知識(shí)追蹤模型根據(jù)學(xué)習(xí)者答題情況反映當(dāng)前知識(shí)點(diǎn)的掌握狀況,追蹤學(xué)習(xí)者在學(xué)習(xí)過(guò)程中知識(shí)掌握情況的變化,在知識(shí)追蹤模型的知識(shí)點(diǎn)層面從單個(gè)知識(shí)點(diǎn)和多個(gè)知識(shí)點(diǎn)兩個(gè)角度分析教育領(lǐng)域已有的研究。
首先,從單個(gè)知識(shí)點(diǎn)角度,Hawkins等(2014)研究了同一知識(shí)點(diǎn)中各問(wèn)題的相似性對(duì)于適度提高知識(shí)追蹤模型預(yù)測(cè)準(zhǔn)確性的作用,發(fā)現(xiàn)問(wèn)題之間相似度越大模型預(yù)測(cè)表現(xiàn)越好;Pardos等(2011)研究通過(guò)增加知識(shí)難度節(jié)點(diǎn)使知識(shí)追蹤模型給學(xué)習(xí)者合理分配知識(shí)練習(xí)的時(shí)間,并提高學(xué)習(xí)者知識(shí)掌握情況反饋報(bào)告的準(zhǔn)確性;Lin等(2016)對(duì)每個(gè)知識(shí)點(diǎn)采取不同類(lèi)型的教學(xué)干預(yù)措施(如一種誘發(fā)式教學(xué)干預(yù)),使答題數(shù)據(jù)與知識(shí)追蹤模型的擬合性更強(qiáng),并提升模型的預(yù)測(cè)精度。
從多個(gè)知識(shí)點(diǎn)角度,即知識(shí)組合不僅僅是單個(gè)知識(shí)的“總和”,而是將知識(shí)與知識(shí)相結(jié)合(或連接起來(lái))以產(chǎn)生額外知識(shí),且較低層次的知識(shí)作為了解更高層次知識(shí)的先決條件。Lee等(2015)使用知識(shí)追蹤模型來(lái)追蹤隨著時(shí)間的推移知識(shí)的出現(xiàn)模式,發(fā)現(xiàn)知識(shí)之間層級(jí)和關(guān)系的拓?fù)浣Y(jié)構(gòu);Klingler等(2014)研究了知識(shí)組合的不同層級(jí)和關(guān)系,結(jié)果表明獲取知識(shí)之間的層次結(jié)構(gòu)可以顯著提高知識(shí)追蹤模型預(yù)測(cè)精度;Huang等(2016)研究了具有知識(shí)組合分層功能的知識(shí)追蹤模型,結(jié)果表明這種模型顯著提高了知識(shí)掌握預(yù)測(cè)精度,并且傾向于更合理地分配學(xué)習(xí)者各知識(shí)點(diǎn)的學(xué)習(xí)時(shí)間;值得一提的是,Zhang等(2016)的研究表明,知識(shí)拓?fù)浣Y(jié)構(gòu)的目標(biāo)是產(chǎn)生滿(mǎn)足所有先決條件的一系列知識(shí),以前的研究很少?gòu)闹R(shí)追蹤模型的角度看待這一問(wèn)題。實(shí)驗(yàn)結(jié)果也顯示,知識(shí)拓?fù)浣Y(jié)構(gòu)可用于提高學(xué)習(xí)者的學(xué)習(xí)效率,并為學(xué)習(xí)者提供個(gè)性化的學(xué)習(xí)路徑;David等(2016)在知識(shí)追蹤模型中采用一種序列算法排列學(xué)習(xí)者各知識(shí)點(diǎn)掌握情況來(lái)推薦個(gè)性化教育內(nèi)容,以滿(mǎn)足他們個(gè)性化的學(xué)習(xí)資源需求;Zhang等(2016)的研究利用各個(gè)知識(shí)點(diǎn)之間的關(guān)系,直接輸出學(xué)習(xí)者對(duì)每個(gè)知識(shí)的掌握程度,并描繪學(xué)習(xí)者知識(shí)掌握的變化,更好地模擬學(xué)習(xí)過(guò)程,提高學(xué)習(xí)者的學(xué)習(xí)效率。
(二)從學(xué)習(xí)者層面分析知識(shí)追蹤模型的教育應(yīng)用
對(duì)知識(shí)追蹤模型的學(xué)習(xí)者層面研究表明,學(xué)習(xí)者特性對(duì)模型預(yù)測(cè)精度有影響。在該研究層面也確定了可以提高預(yù)測(cè)精度的兩類(lèi)方法:模型本身包含的學(xué)習(xí)者參數(shù)特性和學(xué)習(xí)者學(xué)習(xí)參與特性。
Nelimarkka等(2014)研究表明,先驗(yàn)概率值的設(shè)定不是越大越好,因?yàn)榫哂休^高先驗(yàn)概率的學(xué)習(xí)者產(chǎn)生較少的信息供知識(shí)追蹤模型來(lái)估計(jì)猜測(cè)率和學(xué)習(xí)率,估計(jì)誤差會(huì)略有增加;Pardos等(2010)利用相關(guān)知識(shí)先前的數(shù)據(jù)集建模,賦予學(xué)習(xí)者不同的先驗(yàn)概率,結(jié)果表明模型預(yù)測(cè)精度明顯改善;Corbett等(2008)通過(guò)學(xué)習(xí)者前后答題情況估計(jì)猜測(cè)率和失誤率,而不是在所有情況下使用固定猜測(cè)和失誤率,結(jié)果顯示知識(shí)追蹤模型預(yù)測(cè)學(xué)習(xí)者表現(xiàn)比以前的方法明顯更精確;QIU等(2011)確定了貝葉斯知識(shí)追蹤模型在預(yù)測(cè)學(xué)習(xí)者表現(xiàn)方面存在系統(tǒng)錯(cuò)誤的特殊情況——隨著時(shí)間知識(shí)遺忘這種現(xiàn)象,雖然這不令人驚訝,但是加入學(xué)習(xí)者隨著時(shí)間會(huì)遺忘的特性,知識(shí)追蹤模型更容易解釋?zhuān)⒖梢愿玫財(cái)M合一些數(shù)據(jù)集。
盡管模型本身包含的學(xué)習(xí)者參數(shù)特性通常也能很好地預(yù)測(cè)學(xué)習(xí)者的表現(xiàn),但它沒(méi)有考慮到學(xué)習(xí)者的學(xué)習(xí)參與特性。Spaulding和Breazeal(2015)對(duì)學(xué)習(xí)者情緒狀態(tài)的研究表明,學(xué)習(xí)者情緒(高興/悲傷等)影響知識(shí)追蹤模型的交互時(shí)間和預(yù)測(cè)準(zhǔn)確性;閭漢原等(2011)的研究結(jié)果表明,學(xué)習(xí)者的學(xué)習(xí)態(tài)度影響知識(shí)追蹤模型的預(yù)測(cè)準(zhǔn)確性;Xu等(2014)通過(guò)腦電波(EEG)捕捉的精神狀態(tài)來(lái)估計(jì)學(xué)習(xí)者在冷靜或?qū)W⒌葼顟B(tài)下的學(xué)習(xí)效率和失誤率,并從EEG數(shù)據(jù)中推斷學(xué)習(xí)者的參與度,可以及時(shí)調(diào)整知識(shí)追蹤模型以便重新吸引學(xué)習(xí)者最終提升學(xué)習(xí)效率;而Schultz等(2014)則利用知識(shí)追蹤模型研究了學(xué)習(xí)者學(xué)習(xí)過(guò)程中的不參與行為。
(三)從數(shù)據(jù)層面分析知識(shí)追蹤模型的教育應(yīng)用
從數(shù)據(jù)層面分析知識(shí)追蹤模型教育應(yīng)用有三個(gè)方面:①提高數(shù)據(jù)所包含的信息量。如Wang(2011)和Heffernan等(2013)的兩個(gè)研究中不僅是從學(xué)習(xí)者回答問(wèn)題的正確(1)和錯(cuò)誤(0)兩個(gè)維度獲取數(shù)據(jù),而是賦予每個(gè)學(xué)習(xí)者連續(xù)的0~1之間的值代表答對(duì)題的概率,結(jié)果表明這種方法可以更精確地估算學(xué)習(xí)者知識(shí)掌握水平,實(shí)現(xiàn)知識(shí)追蹤模型更精準(zhǔn)的未來(lái)表現(xiàn)預(yù)測(cè)。②使用部分?jǐn)?shù)據(jù)代替所有數(shù)據(jù)訓(xùn)練知識(shí)追蹤模型參數(shù)。如Nooraei等(2010)使用這一方法發(fā)現(xiàn):每個(gè)學(xué)習(xí)者最后15個(gè)問(wèn)題的數(shù)據(jù)訓(xùn)練知識(shí)追蹤模型在節(jié)省運(yùn)行時(shí)間的同時(shí)取得和使用學(xué)習(xí)者總體數(shù)據(jù)訓(xùn)練的知識(shí)追蹤模型可比的預(yù)測(cè)效果。③確定選擇多大的樣本量。如果訓(xùn)練樣本量不夠充分,即使是完美的擬合算法也會(huì)產(chǎn)生預(yù)測(cè)能力較差的參數(shù),樣本量多了雖然預(yù)測(cè)效果好,但卻加大了模型運(yùn)行時(shí)間。如Coetzee等(2014)在研究了知識(shí)追蹤模型的樣本量后提出用于訓(xùn)練模型的學(xué)習(xí)者數(shù)量以及生成參數(shù)的值等因素,提高對(duì)推斷參數(shù)的準(zhǔn)確性的估計(jì),分析表明誤差的標(biāo)準(zhǔn)偏差大致與1/[n]成正比(n是樣本大?。瑥亩o出了在理想的或可接受的標(biāo)準(zhǔn)偏差下應(yīng)該取多大樣本量的參考。
以上研究表明,選擇不同的數(shù)據(jù)類(lèi)型(二進(jìn)制數(shù)據(jù)或連續(xù)數(shù)據(jù))、題目數(shù)量和學(xué)習(xí)者樣本量來(lái)訓(xùn)練知識(shí)追蹤模型會(huì)導(dǎo)致模型預(yù)測(cè)精度的差異,所以應(yīng)該根據(jù)不同的需求選擇包含需要的知識(shí)點(diǎn)維度和學(xué)習(xí)者維度的數(shù)據(jù)。不同維度的選取要有相關(guān)性,否則會(huì)導(dǎo)致數(shù)據(jù)處理時(shí)難以形成邏輯,更多的只能流于表面和片段式分析。
上述研究從知識(shí)點(diǎn)層面、學(xué)習(xí)者層面和數(shù)據(jù)層面對(duì)知識(shí)追蹤模型的教育應(yīng)用做了探索。在知識(shí)點(diǎn)層面研究了單知識(shí)點(diǎn)的難度和同一知識(shí)點(diǎn)不同題目之間的相似性,以及多知識(shí)點(diǎn)的知識(shí)層級(jí)關(guān)系和知識(shí)拓?fù)漤樞虻戎R(shí)組合問(wèn)題。在學(xué)習(xí)者層面研究了根據(jù)學(xué)習(xí)者特性制定的知識(shí)追蹤模型五個(gè)參數(shù)(先驗(yàn)知識(shí)/學(xué)習(xí)速率/猜測(cè)概率/失誤率/遺忘)對(duì)模型的影響,并探究了學(xué)習(xí)者情緒、態(tài)度和參與度等對(duì)于提高模型預(yù)測(cè)精度的作用。在數(shù)據(jù)層面研究了數(shù)據(jù)集包含的維度和樣本量對(duì)知識(shí)追蹤模型預(yù)測(cè)精度的影響。通過(guò)對(duì)這三個(gè)方面的探討揭示出,調(diào)整這三個(gè)層面中的一個(gè)方面有助于改善知識(shí)追蹤模型的預(yù)測(cè)準(zhǔn)確性(Zhang, et al., 2017)。
另一類(lèi)優(yōu)化知識(shí)追蹤模型預(yù)測(cè)精度的方法是將知識(shí)追蹤與其他模型組合應(yīng)用。如Gonzalez-Brenes等(2014)研究證明,知識(shí)追蹤與其他建模方法組合應(yīng)用對(duì)模型預(yù)測(cè)精度可以有更好的影響。Khajah等(2014)組合知識(shí)追蹤和項(xiàng)目反應(yīng)理論(Item Response Theory, IRT)兩種互補(bǔ)模型——以知識(shí)追蹤模擬學(xué)習(xí)者學(xué)習(xí)、IRT反映學(xué)習(xí)者的個(gè)體差異來(lái)預(yù)測(cè)學(xué)習(xí)者的知識(shí)掌握,結(jié)果顯示組合模型顯著優(yōu)于知識(shí)追蹤模型。這個(gè)結(jié)論與Khajah等(2014)利用潛在因素結(jié)合知識(shí)追蹤模型得出的結(jié)論一致;該結(jié)論在Xu等(2013)利用項(xiàng)目反應(yīng)理論結(jié)合知識(shí)追蹤的研究中也曾被提及。Cai等(2015)組合知識(shí)追蹤和回歸分析模型研究學(xué)習(xí)者整體學(xué)習(xí)趨勢(shì)來(lái)預(yù)測(cè)學(xué)習(xí)者的未來(lái)表現(xiàn),獲得了更好的預(yù)測(cè)效果。這類(lèi)建模方法組合研究為優(yōu)化知識(shí)追蹤模型預(yù)測(cè)精度提供了一些可用建議:在預(yù)測(cè)學(xué)習(xí)者未來(lái)學(xué)習(xí)表現(xiàn)時(shí),應(yīng)該根據(jù)不同的預(yù)測(cè)要求選擇不同的模型組合。另外,在模型組合中不同模型呈現(xiàn)的內(nèi)容要有相關(guān)性,否則會(huì)導(dǎo)致處理學(xué)習(xí)內(nèi)容時(shí)需要更長(zhǎng)的時(shí)間,從而降低學(xué)習(xí)效率。
四、結(jié)論與展望
正如文獻(xiàn)分析結(jié)果所顯示的,知識(shí)追蹤模型能通過(guò)對(duì)前一階段的表現(xiàn)來(lái)預(yù)測(cè)學(xué)習(xí)者對(duì)知識(shí)的掌握情況,并可以利用知識(shí)之間的關(guān)系,自動(dòng)描繪學(xué)習(xí)者不斷變化的知識(shí)狀態(tài),分析學(xué)習(xí)者整體學(xué)習(xí)趨勢(shì),更好地模擬學(xué)習(xí)者的學(xué)習(xí)過(guò)程,提高學(xué)習(xí)者的學(xué)習(xí)效率;通過(guò)分析學(xué)習(xí)者的學(xué)習(xí)軌跡所包含的有意義信息,潛在地做出提供暗示、反饋或建議新的練習(xí)等干預(yù)措施,讓教育者更加了解學(xué)習(xí)者的進(jìn)步和問(wèn)題領(lǐng)域,滿(mǎn)足學(xué)習(xí)者對(duì)個(gè)性化學(xué)習(xí)路徑和學(xué)習(xí)資源的需求,提高智能輔導(dǎo)系統(tǒng)的有效性,為研究者實(shí)現(xiàn)自動(dòng)分析學(xué)習(xí)者知識(shí)掌握程度、自動(dòng)評(píng)價(jià)學(xué)習(xí)者和自動(dòng)反饋給學(xué)習(xí)者自適應(yīng)的學(xué)習(xí)資源和學(xué)習(xí)路徑提供動(dòng)態(tài)的數(shù)據(jù)支撐。
知識(shí)追蹤模型作為一種對(duì)學(xué)習(xí)者知識(shí)掌握情況建模的主流方法,在教育和軍事等方面都已經(jīng)有了不少成功案例,研究的深度和廣度都得到了很大的拓展。然而,本文認(rèn)為在知識(shí)點(diǎn)、學(xué)習(xí)者和數(shù)據(jù)三個(gè)層面都還存在一些不足。例如對(duì)于知識(shí)掌握的預(yù)測(cè)會(huì)設(shè)定度和閾值,但是很少涉及學(xué)習(xí)者知識(shí)掌握判定的度或閾值的設(shè)定,不知道什么類(lèi)型的知識(shí)設(shè)定什么樣的閾值范圍,以及設(shè)置閾值的依據(jù)是什么;而且現(xiàn)有的知識(shí)追蹤模型相關(guān)文獻(xiàn)多是對(duì)單個(gè)學(xué)習(xí)者對(duì)于知識(shí)點(diǎn)掌握預(yù)測(cè),缺少小組學(xué)習(xí)、合作學(xué)習(xí)/協(xié)作學(xué)習(xí)的學(xué)習(xí)者知識(shí)掌握的研究。另外,雖然已經(jīng)知道數(shù)據(jù)量和樣本量的選擇都會(huì)影響模型預(yù)測(cè)精度和模型運(yùn)行時(shí)間,但還沒(méi)有相對(duì)可靠的標(biāo)準(zhǔn)給出何種類(lèi)型的探究實(shí)驗(yàn)對(duì)應(yīng)大致的樣本和數(shù)據(jù)量范圍。但毋庸置疑的是,知識(shí)追蹤模型比判斷學(xué)習(xí)者知識(shí)掌握的傳統(tǒng)方法提供了更豐富的動(dòng)態(tài)信息和預(yù)測(cè),使教育者可以面對(duì)更多學(xué)習(xí)者,更加了解學(xué)習(xí)者知識(shí)的掌握,讓學(xué)習(xí)者更加清楚自己學(xué)習(xí)的問(wèn)題。隨著人工智能技術(shù)的發(fā)展,知識(shí)追蹤模型在教育領(lǐng)域的研究會(huì)得到越來(lái)越廣泛的運(yùn)用。
下一步我們計(jì)劃利用加入遺忘的標(biāo)準(zhǔn)知識(shí)追蹤模型與動(dòng)態(tài)鍵值存儲(chǔ)網(wǎng)絡(luò)組合模型等分析具體的學(xué)習(xí)數(shù)據(jù),探究在教育中的應(yīng)用,希望知識(shí)追蹤模型不僅僅應(yīng)用在自動(dòng)監(jiān)督、自動(dòng)評(píng)價(jià)和自動(dòng)反饋等方面,還能向第二導(dǎo)師方向發(fā)展,真正實(shí)現(xiàn)教育領(lǐng)域的一對(duì)一、個(gè)性化和自適應(yīng),為教學(xué)程序的改善和學(xué)習(xí)效果的增強(qiáng)尋求可行的途徑。
[參考文獻(xiàn)]
閭漢原,申麟,漆美. 2011. 基于“態(tài)度”的知識(shí)追蹤模型及集成技術(shù)[J]. 江蘇師范大學(xué)學(xué)報(bào)(自然科學(xué)版),29(4):54-57.
王卓,張銘. 2015. 基于貝葉斯知識(shí)跟蹤模型的慕課學(xué)生評(píng)價(jià)[J]. 中國(guó)科技論文,10(2):241-246.
Baker, R. S. J. D., Corbett, A. T., & Aleven, V. (2008). More accurate student modeling through contextual estimation of slip and guess probabilities in bayesian knowledge tracing. Lecture Notes in Computer Science, 5091, 406-415.
Cai, Y., Niu, Z., Wang, Y., & Niu, K. (2015). Learning Trend Analysis and Prediction Based on Knowledge Tracing and Regression Analysis. Database Systems for Advanced Applications. Springer International Publishing.
Chen, L., & Min, C. (2016). Intervention-BKT: Incorporating Instructional Interventions into Bayesian Knowledge Tracing. International Conference on Intelligent Tutoring Systems (pp. 208-218). Springer, Cham.
Coetzee, D. (2014). Choosing Sample Size for Knowledge Tracing Models. EDM (Workshops).
Corbett, A. T., & Anderson, J. R. (1994). Knowledge tracing: modeling the acquisition of procedural knowledge. User Modeling and User-Adapted Interaction, 4(4), 253-278.
David, Y. B., Segal, A., & Gal, Y. (2016). Sequencing educational content in classrooms using bayesian knowledge tracing (pp. 354-363).
Gonzalez-Brenes, J., Huang, Y., & Brusilovsky, P. (2014). General features in knowledge tracing to model multiple subskills, temporal item response theory, and expert knowledge.
Hawkins, W. J., & Heffernan, N. T. (2014). Using Similarity to the Previous Problem to Improve Bayesian Knowledge Tracing. EDM (Workshops).
Huang, Y., Guerra-Hollstein, J. D., & Brusilovsky, P. (2016). Modeling Skill Combination Patterns for Deeper Knowledge Tracing. The Intl. Workshop on Personalization Approaches in Learning Environments.
K?ser, T., Klingler, S., Schwing, A. G., & Gross, M. (2014). Beyond Knowledge Tracing: Modeling Skill Topologies with Bayesian Networks. Intelligent Tutoring Systems. Springer International Publishing.
Khajah, M. M., Huang, Y., Gonzalez-Brenes, J. P., Mozer, M. C., & Brusilovsky, P. (2014). Integrating knowledge tracing and item response theory: a tale of two frameworks. Bmj Quality & Safety.
Khajah, M. M., Wing, R. M., Lindsey, R. V., & Mozer, M. C. (2014). Integrating latent-factor and knowledge-tracing models to predict individual differences in learning. Journal of Nursing Education, 39(9), 409-11.
Lee, H. S., Gweon, G. H., Dorsey, C., Tinker, R., Finzer, W., & Damelin, D., et al. (2015). How does Bayesian knowledge tracing model emergence of knowledge about a mechanical system? International Conference (pp. 171-175).
Nelimarkka, M., & Ghori, M. (2014). The effect of variations of prior on knowledge tracing. In International Conference on Educational Data Mining.
Nooraei, B. B., Pardos, Z. A., Heffernan, N. T., & Baker, R. S. J. D. (2010). Less is More: Improving the Speed and Prediction Power of Knowledge Tracing by Using Less Data. International Conference on Educational Data Mining, Eindhoven, the Netherlands, July (pp. 101-110). DBLP.
Pardos, Z. A., & Heffernan, N. T. (2010). Modeling Individualization in a Bayesian Networks Implementation of Knowledge Tracing. International Conference on User Modeling, Adaptation, and Personalization (Vol. 6075, pp. 255-266). Springer-Verlag.
Pardos, Z. A., & Heffernan, N. T. (2011). KT-IDEM: Introducing Item Difficulty to the Knowledge Tracing Model. User Modeling, Adaption and Personalization. Springer Berlin Heidelberg.
Pardos, Z., Bergner, Y., Seaton, D. T., & Pritchard, D. E. (2013). Adapting Bayesian Knowledge Tracing to a Massive Open Online Course in edX. International Conference on Educational Data Mining (Vol. 66, pp. 939–951).
Qiu, Y., Qi, Y., Lu, H., Pardos, Z. A., & Heffernan, N. T. (2011). Does Time Matter? Modeling the Effect of Time with Bayesian Knowledge Tracing. International Conference on Educational Data Mining, Eindhoven, the Netherlands, July (Vol. 39, pp. 139-148).
Schultz, S. E., & Arroyo, I. (2014). Expanding Knowledge Tracing to Prediction of Gaming Behaviors. EDM (Workshops).
Spaulding, S., & Breazeal, C. (2015). Affect and Inference in Bayesian Knowledge Tracing with a Robot Tutor. The Tenth ACM/IEEE International Conference (pp. 219-220). ACM.
Wang, Y. (2011). Extend the knowledge tracing framework using partial credit as performance.
Wang, Y., & Heffernan, N. (2013). Extending Knowledge Tracing to Allow Partial Credit: Using Continuous versus Binary Nodes. International Conference on Artificial Intelligence in Education (Vol. 7926, pp. 181-188). Springer Berlin Heidelberg.
Xu, Y., Ave, F., & Mostow, J. (2013). Using item response theory to refine knowledge tracing. Psychiatry-interpersonal & Biological Processes, 26(6), 1015-20.
Xu, Y., & Chang, K. (2014). Using eeg in knowledge tracing.
Zhang, J., & King, I. (2016). Topological Order Discovery via Deep Knowledge Tracing. Neural Information Processing. Springer International Publishing.
Zhang, J., Shi, X., King, I., & Yeung, D. Y. (2016). Dynamic key-value memory networks for knowledge tracing.
Zhang, L., Xiong, X., Zhao, S., Botelho, A., & Heffernan, N. T. (2017). Incorporating Rich Features into Deep Knowledge Tracing. ACM Conference on Learning (pp. 169-172). ACM.
收稿日期:2018-03-30
定稿日期:2018-05-22
作者簡(jiǎn)介:李菲茗,博士,副教授,碩士生導(dǎo)師;葉艷偉,碩士研究生;李曉菲,碩士研究生;史丹丹,碩士研究生。浙江工業(yè)大學(xué)教育科學(xué)與技術(shù)學(xué)院(310023)。
責(zé)任編輯 韓世梅