王志鋒 熊莎莎 左明章 閔秋莎 葉俊民
(1.華中師范大學(xué) 人工智能教育學(xué)部 教育信息技術(shù)學(xué)院;2.華中師范大學(xué) 計算機學(xué)院,湖北武漢 430079)
進(jìn)入21 世紀(jì),人工智能、大數(shù)據(jù)、虛擬現(xiàn)實、區(qū)塊鏈、物聯(lián)網(wǎng)等高新信息技術(shù)引發(fā)了人類社會的顛覆性變革,也進(jìn)一步推動著傳統(tǒng)教育向智慧教育新范式轉(zhuǎn)型和演進(jìn)?!缎乱淮斯ぶ悄馨l(fā)展規(guī)劃》提出要發(fā)展“智慧教育”,以推動教學(xué)方法改革[1]。《教育信息化2.0 行動計劃》和《中國教育現(xiàn)代化2035》也進(jìn)一步指出,要探索新的智慧教育模式,促進(jìn)以個性化學(xué)習(xí)為基礎(chǔ)的智能化教學(xué)支持環(huán)境建設(shè)的開展,推動人工智能技術(shù)在教學(xué)方面的應(yīng)用[2][3]。智慧教育的實踐與落地,有賴于智能教育的核心支撐作用:一則智能教育通過技術(shù)賦能教育,從而支持智慧學(xué)習(xí)環(huán)境的構(gòu)建(如智慧校園、智慧教室、智慧終端、智慧教育云、創(chuàng)客空間等);二則智能教育通過技術(shù)賦能學(xué)習(xí)服務(wù),從而支持智慧教學(xué)法的形成(如精準(zhǔn)教學(xué)、智能學(xué)習(xí)推薦、自適應(yīng)學(xué)習(xí)、個性化學(xué)習(xí)等); 三則智能教育通過教育大數(shù)據(jù)與學(xué)習(xí)分析支持智慧學(xué)習(xí)評估的建立(如多元化評價、全程化評價、個性化評價等)[4]。
近五年來,知識追蹤作為一項重要的智能技術(shù),受到學(xué)術(shù)界和產(chǎn)業(yè)界的廣泛關(guān)注,并逐漸發(fā)展成為實踐智慧教育的一條重要路徑。知識追蹤的目標(biāo)在于對學(xué)習(xí)者的知識水平與認(rèn)知結(jié)構(gòu)進(jìn)行建模,根據(jù)學(xué)習(xí)者的歷史學(xué)習(xí)軌跡,融合統(tǒng)計學(xué)習(xí)、深度學(xué)習(xí)等智能技術(shù)手段,深入分析、挖掘?qū)W習(xí)者的知識掌握水平與知識認(rèn)知結(jié)構(gòu),來準(zhǔn)確預(yù)測學(xué)習(xí)者未來的學(xué)習(xí)表現(xiàn)[5]。知識追蹤從提出至今,已有近三十年的發(fā)展歷程,同時伴隨大量在線教育平臺的涌現(xiàn)、海量學(xué)習(xí)數(shù)據(jù)的累計以及越來越多新興人工智能技術(shù)的引入,使得知識追蹤能夠更好地表征學(xué)習(xí)者的復(fù)雜學(xué)習(xí)狀態(tài),為智慧教育實踐提供技術(shù)支撐。
本文聚焦于智慧教育視域下的知識追蹤,綜合運用文獻(xiàn)調(diào)研、大數(shù)據(jù)建模、深度學(xué)習(xí)、多模態(tài)分析等研究方法,關(guān)注并嘗試回答以下具體問題:(1)智慧教育視域下知識追蹤的概念如何界定?(2)面向智慧教育應(yīng)用的知識追蹤發(fā)展的現(xiàn)狀如何?(3)目前知識追蹤在智慧教育場景中所存在的問題及解決思路為何? (4)如何構(gòu)建面向智慧教育實踐的知識追蹤框架? (5)知識追蹤在智慧教育中的未來發(fā)展趨勢及應(yīng)用路徑有哪些?
本文以“中國知網(wǎng)”和“Web of Science”索引庫作為文獻(xiàn)來源,以“知識追蹤”“Knowledge Tracing”為搜索關(guān)鍵詞,檢索時間為1994年1月-2021年3月,研究方向為計算機科學(xué)、心理學(xué)、教育學(xué)等,開展相關(guān)文獻(xiàn)檢索。剔除無關(guān)文獻(xiàn)后,再從參考文獻(xiàn)中繼續(xù)獲取二級文獻(xiàn),最終得到有效文獻(xiàn)169 篇。接著,從年限、領(lǐng)域、平臺以及方法四個方面,對知識追蹤相關(guān)文獻(xiàn)的分布特點進(jìn)行了分析,并從中探究知識追蹤的發(fā)展現(xiàn)狀,如圖1 所示。
首先,知識追蹤的研究拓展符合智慧教育的發(fā)展需求。2020年以來,受新冠疫情影響,線上教育達(dá)到空前規(guī)模,如何在開展大規(guī)模在線教育的同時,能有效提供個性化學(xué)習(xí)服務(wù),成為了迫切且重要的需求,知識追蹤則成為滿足這一需求的重要范例。如圖1 所示,知識追蹤領(lǐng)域文獻(xiàn)成果呈上升趨勢,尤其是2019年和2020年呈現(xiàn)“爆發(fā)式”增長,說明知識追蹤已逐漸成為一個研究熱點。篩選的文獻(xiàn)涉及123個K-12 教育場景、57 個教育場景、47 個其它教育場景,分為166 個線上教育環(huán)境、32 個線下教育環(huán)境,說明知識追蹤的教育適用場景多樣化。但目前知識追蹤的應(yīng)用對象,主要聚焦在K-12 階段的學(xué)習(xí)者,應(yīng)用環(huán)境主要集中于在線教育平臺。
其次,知識追蹤能融合新興的智能技術(shù)來促進(jìn)智慧教育的發(fā)展。如圖1 所示,涉及85 篇基于深度學(xué)習(xí)的知識追蹤文獻(xiàn)、51 篇基于概率圖的知識追蹤文獻(xiàn),這兩個方向占據(jù)整個文獻(xiàn)量的3/4,說明這兩個方向是較為廣泛的知識追蹤應(yīng)用方法。從時間脈絡(luò)上來看,自2015年起,基于深度學(xué)習(xí)的知識追蹤成為了知識追蹤研究的“主力”。究其原因在于近年來人工智能技術(shù)和深度學(xué)習(xí)的快速發(fā)展,帶動了人工智能賦能教育,助推了知識追蹤應(yīng)用的快速發(fā)展。綜上,自深度學(xué)習(xí)引入知識追蹤以后,知識追蹤便得到了飛躍式的發(fā)展,并且越來越多新興的智能技術(shù)融入了知識追蹤,這為進(jìn)一步促進(jìn)智慧教育的發(fā)展提供了新的思路和機遇。
最后,通過梳理知識追蹤相關(guān)文獻(xiàn),本文給出了智慧教育視域下知識追蹤的概念界定: 知識追蹤即通過跟蹤學(xué)習(xí)者的歷史學(xué)習(xí)軌跡,對學(xué)習(xí)者與學(xué)習(xí)資源的學(xué)習(xí)交互過程進(jìn)行建模,深入分析、挖掘、追蹤學(xué)習(xí)者的動態(tài)知識掌握水平與認(rèn)知結(jié)構(gòu),并準(zhǔn)確預(yù)測學(xué)習(xí)者未來學(xué)習(xí)表現(xiàn),通過人機協(xié)同優(yōu)化教學(xué)過程,助力于學(xué)習(xí)者終身發(fā)展的智慧教育新模式。
自上世紀(jì)90年代以來,一些研究者提出了多種類型的知識追蹤方法,從早期的概率模型到當(dāng)前的深層神經(jīng)網(wǎng)絡(luò)。例如,在貝葉斯知識追蹤中使用隱馬爾可夫模型(Hidden Markov Model,HMM);在深度知識追蹤中使用遞歸神經(jīng)網(wǎng)絡(luò)模型(Recursive Neural Network,RNN)。本文依據(jù)知識追蹤模型中核心技術(shù)所屬領(lǐng)域,并結(jié)合上述對知識追蹤文獻(xiàn)來源的分析,從基于概率圖的知識追蹤、基于深度學(xué)習(xí)的知識追蹤、基于參數(shù)估計的知識追蹤這三個類型對知識追蹤的研究進(jìn)展進(jìn)行梳理。
1.基于概率圖的知識追蹤
概率圖模型是一種學(xué)習(xí)任務(wù)的框架描述,其任務(wù)具體為用已知變量對未知變量的分布進(jìn)行推斷。貝葉斯知識追蹤(Bayesian Knowledge Tracing,BKT)模型就是典型的基于概率圖的知識追蹤模型,其使用的核心方法隱馬爾可夫模型就是一種基于模板的概率圖模型。在深度學(xué)習(xí)還沒有引入知識追蹤任務(wù)之前,BKT 模型即為當(dāng)時主流的知識追蹤模型。它是一種構(gòu)建學(xué)習(xí)者學(xué)習(xí)的時序模型,本質(zhì)是一個含有隱變量的馬爾可夫模型,以隱含層表示知識狀態(tài),以觀察層表示性能數(shù)據(jù)。并且BKT 模型給出了“三個假設(shè)”:(1)學(xué)習(xí)者的知識狀態(tài)只有掌握和未掌握;(2)學(xué)習(xí)者在學(xué)習(xí)過程中不會產(chǎn)生遺忘;(3)知識點之間是相互獨立的。
然而,針對學(xué)習(xí)者所處的真實學(xué)習(xí)場景的“三個假設(shè)”過于理想化。針對假設(shè)1,認(rèn)為學(xué)習(xí)者的知識狀態(tài)表達(dá)只有掌握和未掌握兩個狀態(tài),會導(dǎo)致對學(xué)習(xí)過程的分析粒度過粗,而形成建模誤差;針對假設(shè)2,學(xué)習(xí)者在學(xué)習(xí)過程必然會存在遺忘行為,若假設(shè)學(xué)習(xí)者一旦學(xué)會就不會遺忘,則不符合現(xiàn)實情況;針對假設(shè)3,在學(xué)習(xí)過程中知識之間具有一定的關(guān)聯(lián),如學(xué)習(xí)者在了解加法的交換律這一概念后會對其理解乘法的交換律產(chǎn)生促進(jìn)作用。因此,研究者們也提出了許多BKT 模型的變體來解決因 “三個假設(shè)”而產(chǎn)生的模型缺陷,其不僅能夠更好地反映真實的學(xué)習(xí)場景,也在不同程度上提高了模型在預(yù)測學(xué)習(xí)者表現(xiàn)的精度,詳見表1。
表1 針對不同假設(shè)存在的問題提出的改進(jìn)方法
另外,引入個性化學(xué)習(xí)參數(shù)也是知識追蹤研究中的一個熱點方向。研究者們認(rèn)為,基于概率圖的知識追蹤模型的預(yù)測精度取決于其參數(shù),傳統(tǒng)BKT 在預(yù)測過程中將四個參數(shù)固定不變。然而,在實際學(xué)習(xí)場景中,不同學(xué)習(xí)者的初始掌握概率、做題的失誤、猜測概率都不一樣。因此,個性化學(xué)習(xí)參數(shù)[6][7][8][9]能夠更好地對學(xué)習(xí)者的整個學(xué)習(xí)過程進(jìn)行表征,也能提高預(yù)測精度。
基于概率圖的知識追蹤是用圖來表示變量概率依賴關(guān)系,使用學(xué)習(xí)者答對答錯這個觀察量和學(xué)習(xí)者潛在知識狀態(tài)這個隱變量,表示概率圖的兩個節(jié)點,再設(shè)計出隱變量與變量、變量與變量之間的聯(lián)系,最后假設(shè)這些變量服從特定的分布。其優(yōu)勢在于:(1)對數(shù)據(jù)集大小的要求不高;(2)模型簡捷,可以很好地利用教育學(xué)原理,可解釋性強。而其不足之處在于:(1)由于其固有的結(jié)構(gòu)以及函數(shù)形式的限制,不能對學(xué)習(xí)者長期學(xué)習(xí)的時序依賴建模;(2)依賴教育專家對教學(xué)場景的理解,容易導(dǎo)致建模的局限性。目前,基于概率圖的知識追蹤因其解釋性強、模型簡捷,已被廣泛應(yīng)用于各類智能導(dǎo)學(xué)系統(tǒng)和在線學(xué)習(xí)平臺。
2.基于深度學(xué)習(xí)的知識追蹤
深度學(xué)習(xí)是近年來新興的人工智能方法,在計算機視覺和自然語言處理等許多傳統(tǒng)人工智能應(yīng)用中,發(fā)揮著重要的助推作用。隨著人工智能在教育領(lǐng)域的持續(xù)發(fā)展,深度學(xué)習(xí)也被逐漸應(yīng)用于教育領(lǐng)域。2015年,斯坦福大學(xué)的皮耶希(C.Piech)等[19]首次將循環(huán)神經(jīng)網(wǎng)絡(luò)的變種——長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM) 引入到知識追蹤任務(wù)當(dāng)中,提出第一個深度知識追蹤模型(Deep Knowledge Tracing,DKT),來建模學(xué)習(xí)者的知識狀態(tài)。由于循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)相比隱彌哥夫模型具有更高維連續(xù)的潛在狀態(tài)表示,且其在時序任務(wù)中更具優(yōu)勢。因此,DKT 相較于BKT 可以建模學(xué)習(xí)者長期學(xué)習(xí)時序依賴,而不是局限于當(dāng)前學(xué)習(xí)者知識掌握情況只與上一時刻學(xué)習(xí)者知識掌握情況有關(guān)的假設(shè)。尤其是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的變種——長短期記憶網(wǎng)絡(luò),其獨特的“三門” 結(jié)構(gòu)可以記憶學(xué)習(xí)者與試題更長時間的交互,從而更好地模擬人類的記憶系統(tǒng)。而DKT 的出現(xiàn),也極大地提高了學(xué)習(xí)者表現(xiàn)預(yù)測的精確度,吸引了越來越多的研究者投入其中并助力于知識追蹤領(lǐng)域的發(fā)展。可見,近年來,基于深度學(xué)習(xí)的知識追蹤模型,在學(xué)習(xí)者知識狀態(tài)表征、學(xué)習(xí)者表現(xiàn)預(yù)測方面,性能遠(yuǎn)超以往傳統(tǒng)的知識追蹤模型,使得知識追蹤得到了快速發(fā)展。至此,越來越多的深度學(xué)習(xí)方法被研究者應(yīng)用于知識追蹤任務(wù)當(dāng)中,從而更好地對學(xué)習(xí)者的知識狀態(tài)以及學(xué)習(xí)表現(xiàn)進(jìn)行預(yù)測。目前,在知識追蹤領(lǐng)域引用的深度學(xué)習(xí)方法,詳見表2。
表2 在知識追蹤領(lǐng)域引用的深度學(xué)習(xí)方法及代表模型
基于深度學(xué)習(xí)的知識追蹤使用神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)來建模學(xué)習(xí)者學(xué)習(xí)序列,從而預(yù)測學(xué)習(xí)者表現(xiàn),并用隱藏層表示其潛在的知識空間。相比于基于概率圖的知識追蹤,其在學(xué)習(xí)者表現(xiàn)預(yù)測以及學(xué)習(xí)者知識狀態(tài)挖掘方面,體現(xiàn)出了更高的精準(zhǔn)性,也能更好地幫助學(xué)習(xí)者清晰自我認(rèn)知結(jié)構(gòu)并更具針對性地開展學(xué)習(xí);相應(yīng)地,教育者也能更好地進(jìn)行教學(xué)干預(yù)和個性化教學(xué)。其優(yōu)勢在于:(1)在學(xué)習(xí)者知識狀態(tài)表征以及學(xué)習(xí)者表現(xiàn)預(yù)測方面,都優(yōu)于傳統(tǒng)知識追蹤;(2)打破了知識之間的獨立性,DKT 在隱空間建模了學(xué)習(xí)者對多個知識點的綜合狀態(tài);(3)不局限于一階馬爾可夫的性質(zhì),可以建模學(xué)習(xí)者長期學(xué)習(xí)的時序依賴,不需要人工標(biāo)記知識點。但不可否認(rèn)的是,基于深度學(xué)習(xí)的知識追蹤也存在許多不足之處:(1)存在冷啟動問題;(2)需要大量訓(xùn)練數(shù)據(jù);(3)可解釋性不強,解釋性弱仍然是亟待后續(xù)研究者解決的問題。人類進(jìn)行學(xué)習(xí)本身就是一個非常復(fù)雜的過程,想要更好地表征學(xué)習(xí)過程也是充滿挑戰(zhàn)。目前,基于深度學(xué)習(xí)的知識追蹤,主要應(yīng)用于學(xué)習(xí)者表現(xiàn)預(yù)測、認(rèn)知診斷以及教學(xué)資源推薦等。
3.基于參數(shù)估計的知識追蹤
基于參數(shù)估計的知識追蹤進(jìn)展,包括以下三個方面:(1)基于概率矩陣分解的知識追蹤引入了概率矩陣分解技術(shù),從概率建模角度動態(tài)跟蹤和解釋學(xué)習(xí)者知識狀態(tài)的變化情況,將學(xué)習(xí)者和練習(xí)映射到具有明確含義的知識空間中,再利用矩陣分解模型將每個學(xué)習(xí)者的相關(guān)信息嵌入到同一個知識空間中,從而追蹤其知識狀態(tài)。其從概率建模角度提升了模型結(jié)果的可解釋性,但其不足之處在于擴展性差且不適用于大數(shù)據(jù)集。(2)基于項目反應(yīng)理論的知識追蹤融合了項目反應(yīng)理論的特性,并假設(shè)學(xué)習(xí)是一個漸變的過程,從而直接預(yù)測學(xué)習(xí)者的表現(xiàn)。其模型高度結(jié)構(gòu)化,可解釋性較強,但是仍需依賴專家標(biāo)記知識點與練習(xí)之間的映射關(guān)系。(3)基于因式分解機的知識追蹤將知識追蹤看作是一個融入學(xué)習(xí)者學(xué)習(xí)過程的學(xué)習(xí)行為特征以及試題屬性特征的分類問題,從而預(yù)測學(xué)習(xí)者表現(xiàn)。該方法適用于小數(shù)據(jù)集和稀疏數(shù)據(jù)集,且預(yù)測結(jié)果具備可解釋性。
面向智慧教育應(yīng)用,知識追蹤已經(jīng)成為熱門研究話題,相關(guān)的新研究接踵而至,但是由于學(xué)習(xí)環(huán)境多變、學(xué)習(xí)過程復(fù)雜、學(xué)習(xí)行為不易量化等因素,知識追蹤仍然存在諸多亟需解決的問題,主要體現(xiàn)在以下四個層面。
首先,目前知識追蹤建模涉及的學(xué)科主要為K-12 教育的數(shù)學(xué)學(xué)科,主要原因是該學(xué)科知識清晰、邏輯嚴(yán)密、層次分明,在知識點標(biāo)注、作答行為量化方面都有利于知識追蹤建模。但是,若換成其它知識結(jié)構(gòu)模糊、學(xué)習(xí)行為不易量化的學(xué)科(如語文、英語等),知識追蹤的跨學(xué)科移植性就面臨巨大的挑戰(zhàn);其次,線上教育模式收集學(xué)習(xí)日志較為便捷且收集的數(shù)據(jù)量龐大,線下教育模式可能會出現(xiàn)收集學(xué)習(xí)數(shù)據(jù)體量較少的現(xiàn)象。雖然知識追蹤可應(yīng)用于不同的教育模式,但不同的知識追蹤模型能處理的數(shù)據(jù)體量單一。例如,基于概率圖的知識追蹤在數(shù)據(jù)體量小的數(shù)據(jù)集上表現(xiàn)較好;而基于深度學(xué)習(xí)的知識追蹤在數(shù)據(jù)體量大的數(shù)據(jù)集上表現(xiàn)良好??梢?,這種數(shù)據(jù)不平衡的問題極大地限制了知識追蹤的適用性。
基于上述問題的解決思路: 針對知識追蹤的跨學(xué)科移植性問題,可引入模糊邏輯對不同學(xué)科知識量化的不確定性進(jìn)行建模,從而基于模糊邏輯架構(gòu)開展知識追蹤; 針對知識追蹤的數(shù)據(jù)不平衡的敏感問題,可融合遷移學(xué)習(xí)等小樣本智能學(xué)習(xí)技術(shù),提升知識追蹤處理小樣本、不平衡的能力,從而增強知識追蹤的適用性。
首先,目前知識追蹤未形成統(tǒng)一的、體系化的理論框架,現(xiàn)行方法大多遵循一些各自制定的前提假設(shè),采用的建模手段也大相徑庭,適用的教育場景也各不相同,知識追蹤的理論體系構(gòu)建成為了亟待解決的問題;其次,當(dāng)前的知識追蹤系統(tǒng)研發(fā)缺乏統(tǒng)一的參照標(biāo)準(zhǔn)。例如,數(shù)據(jù)接口標(biāo)準(zhǔn)為何? 模型構(gòu)建標(biāo)準(zhǔn)為何?決策輸出接口標(biāo)準(zhǔn)為何?這些標(biāo)準(zhǔn)化問題極大限制了知識追蹤在智慧教育中的應(yīng)用。
基于上述問題的解決思路: 針對知識追蹤的體系化理論缺乏問題,可綜合運用教育學(xué)、心理學(xué)、計算機及腦科學(xué)等多學(xué)科知識,自上而下地從頂層設(shè)計統(tǒng)一的理論體系。針對知識追蹤系統(tǒng)標(biāo)準(zhǔn)缺失的問題,可參照學(xué)習(xí)者建模標(biāo)準(zhǔn)、學(xué)習(xí)系統(tǒng)體系結(jié)構(gòu)與服務(wù)接口等,利用軟件工程方法,制定知識追蹤體系結(jié)構(gòu)與接口標(biāo)準(zhǔn)。
隨著深度學(xué)習(xí)等人工智能技術(shù)的引入,知識追蹤雖然在準(zhǔn)確性上得到了極大地提升,但是同時也帶有解釋性弱、遷移能力差的問題。首先,深度知識追蹤模型因其黑盒屬性,無法給出決策過程及決策結(jié)果的解釋信息;其次,目前的知識追蹤模型大多基于數(shù)據(jù)驅(qū)動的范式,換一個應(yīng)用場景就需要再訓(xùn)練一個對應(yīng)的新模型,針對不同教育場景的遷移能力較差。
基于上述問題的解決思路: 針對知識追蹤可解釋性弱的問題,一方面,可考慮引入可解釋機器學(xué)習(xí)方法,對知識追蹤的決策進(jìn)行解釋;另一方面,可融合教育學(xué)、心理學(xué)等領(lǐng)域知識作為決策的解釋支撐。另外,針對知識追蹤遷移能力差的問題,還可引入自適應(yīng)學(xué)習(xí)機制,通過領(lǐng)域自適應(yīng)來構(gòu)建遷移能力強的知識追蹤方法。
首先,目前知識追蹤應(yīng)用于智慧教育的實踐路徑尚不清晰,如何充分利用知識追蹤的效能從而促進(jìn)智慧教育范式的形成,是亟需解決的問題;其次,目前知識追蹤建模時存在學(xué)科偏向性、學(xué)習(xí)環(huán)境偏向性、學(xué)習(xí)者偏向性等問題,如何在應(yīng)用知識追蹤時,彌合這些偏向性顯得尤為關(guān)鍵。
基于上述問題的解決思路: 針對知識追蹤實踐路徑不清晰的問題,可通過實證研究將知識追蹤應(yīng)用于真實的智慧環(huán)境中,探究知識追蹤的有效作用路徑。針對知識追蹤的領(lǐng)域偏向性問題,可采用智能數(shù)據(jù)增強技術(shù)消除偏向性的影響,并結(jié)合多模態(tài)分析方法構(gòu)建多元知識追蹤模型,從而構(gòu)建更具普適性的知識追蹤模型。
針對上述所提出的解決思路,綜合運用大數(shù)據(jù)建模、深度學(xué)習(xí)、多模態(tài)分析等方法,本文提出了智慧教育視域下的知識追蹤框架,如圖2 所示。
具體而言,學(xué)習(xí)者在在線學(xué)習(xí)平臺、混合課堂、虛擬現(xiàn)實教學(xué)等智慧環(huán)境中的學(xué)習(xí),會不斷產(chǎn)生學(xué)習(xí)日志數(shù)據(jù),這些數(shù)據(jù)往往蘊含著豐富的待挖掘信息。為此,首先需要采集這些數(shù)據(jù)并做一系列包括數(shù)據(jù)清洗、數(shù)據(jù)填充、數(shù)值統(tǒng)一化、文本編碼、圖形編碼等數(shù)據(jù)預(yù)處理操作。在這些數(shù)據(jù)中所記錄的學(xué)習(xí)者學(xué)習(xí)過程的作答情況,可以反映學(xué)習(xí)者真實的學(xué)習(xí)過程并進(jìn)而借此構(gòu)建學(xué)習(xí)者畫像。學(xué)習(xí)者畫像囊括了一系列指標(biāo),每一個指標(biāo)都能對應(yīng)學(xué)習(xí)者的某一學(xué)習(xí)情況。接著,以基于概率圖、深度學(xué)習(xí)、參數(shù)估計的知識追蹤等智能技術(shù)為實踐路徑,智能分析學(xué)習(xí)者的知識水平,挖掘?qū)W習(xí)者的知識結(jié)構(gòu)并預(yù)測學(xué)習(xí)者下一時刻的表現(xiàn)。進(jìn)而,知識追蹤的診斷分析結(jié)果,可應(yīng)用于智能學(xué)習(xí)推薦、自動學(xué)習(xí)干預(yù)、知識地圖構(gòu)建、學(xué)習(xí)可視化、學(xué)習(xí)成就預(yù)測、學(xué)習(xí)者畫像等教育領(lǐng)域,并從學(xué)習(xí)能力、認(rèn)知結(jié)構(gòu)等維度,對學(xué)習(xí)者學(xué)習(xí)模式進(jìn)行智能評估,并給出結(jié)構(gòu)化的可視化診斷報告??梢?,無論是知識追蹤的診斷分析結(jié)果,還是其產(chǎn)生模式和智能評估結(jié)果,都能為培養(yǎng)智慧人才服務(wù),從而輔助智慧環(huán)境的構(gòu)建。
該框架對學(xué)習(xí)者來說,能使自己更加清晰地掌握自身知識結(jié)構(gòu),認(rèn)識到自己的知識盲區(qū),從而查漏補缺,規(guī)劃學(xué)習(xí),提高學(xué)習(xí)效率,促進(jìn)個性化學(xué)習(xí)的開展;對教師來說,能更好地了解學(xué)習(xí)者學(xué)習(xí)狀態(tài)、知識水平,以調(diào)整教學(xué)策略,并根據(jù)學(xué)習(xí)者的薄弱環(huán)節(jié)因材施教,從而提升教學(xué)效率和教學(xué)質(zhì)量。同時,教師可以給予學(xué)習(xí)者更具針對性的學(xué)習(xí)反饋,制定學(xué)習(xí)方案,指導(dǎo)學(xué)習(xí)者個性化需求等,從而提高教學(xué)效果;對于教育管理者來說,這有助于進(jìn)行更有恰切性的教學(xué)干預(yù),幫助教師優(yōu)化教學(xué),同時優(yōu)化教育管理;對科研工作者來說,這能更好地修正知識追蹤原理,完善知識追蹤模型,助推相關(guān)研究的發(fā)展。
智能學(xué)習(xí)推薦是給學(xué)習(xí)者推薦適合自己的教學(xué)資源,例如最佳學(xué)習(xí)項目序列、習(xí)題資源等。知識追蹤能夠通過學(xué)習(xí)者過去的學(xué)習(xí)交互序列追蹤學(xué)習(xí)者的知識狀態(tài),從而預(yù)測下一次交互作答的準(zhǔn)確概率。因此,教師可以借此觀察學(xué)習(xí)者的預(yù)期學(xué)習(xí)狀態(tài),并推薦下一個能使學(xué)習(xí)者知識狀態(tài)更好的學(xué)習(xí)問題,再利用啟發(fā)式Exceptimax 算法,給出學(xué)習(xí)者的最佳學(xué)習(xí)項目序列[47]。艾方哲等人[48]通過將改進(jìn)的基于深度強化學(xué)習(xí)的知識追蹤模型建立學(xué)習(xí)者模擬器,強化學(xué)習(xí)要素中的環(huán)境模型,并通過學(xué)習(xí)者環(huán)境模型準(zhǔn)確預(yù)測某一學(xué)習(xí)者對某一道題答對的概率,根據(jù)學(xué)習(xí)者針對某個一級知識概念進(jìn)行專題訓(xùn)練,設(shè)計習(xí)題推薦策略。
知識追蹤能夠在學(xué)習(xí)過程中不斷更新學(xué)習(xí)者的知識狀態(tài),使教師能夠及時了解學(xué)習(xí)者的知識結(jié)構(gòu),進(jìn)而采取補救措施,如針對學(xué)習(xí)薄弱點進(jìn)行教學(xué)、為學(xué)習(xí)者推薦難度適中的練習(xí)等,從而提高教學(xué)效能,達(dá)到因材施教的目的,為學(xué)習(xí)者提供個性化的發(fā)展機會。有研究將改進(jìn)的貝葉斯知識追蹤模型應(yīng)用于六年級小學(xué)數(shù)學(xué)課堂中[49],利用知識追蹤模型診斷學(xué)習(xí)者的知識掌握水平,并給出可視化診斷報告,使學(xué)習(xí)者明確自我在某一知識點上是否還要繼續(xù)努力,從而督促學(xué)習(xí)者學(xué)習(xí),同時,也能為這些學(xué)習(xí)者提供個性化的幫助。
知識地圖構(gòu)建即構(gòu)建知識點之間的關(guān)系。知識點之間存在不同的關(guān)系,例如先驗關(guān)系、依賴關(guān)系等,但如果用人工標(biāo)記這些知識點之間的關(guān)系,會造成人力成本過高,且準(zhǔn)確率無法保證。因此,在知識追蹤過程中使用神經(jīng)網(wǎng)絡(luò)[50]或者設(shè)置知識點關(guān)系參數(shù)[51]等,來自動挖掘知識點之間的關(guān)系的應(yīng)用應(yīng)運而生。總體來看,挖掘知識點之間的關(guān)系,不僅能夠更好地表征學(xué)習(xí)者的學(xué)習(xí)過程,也能夠被再度利用來提升知識追蹤預(yù)測學(xué)習(xí)者表現(xiàn)的能力。
研究者通過文本數(shù)據(jù)的交互結(jié)構(gòu)圖形來形象地展示信息或者知識,可以幫助人們更加直觀地理解相關(guān)教育數(shù)據(jù)。在知識追蹤領(lǐng)域,有研究者通過可視化知識追蹤診斷結(jié)果,從而直觀地分析學(xué)習(xí)者的知識掌握情況、知識點之間的關(guān)系網(wǎng)絡(luò)。例如,張明心等人[52]考慮知識之間的影響程度,提出新的BKT 模型,并將其應(yīng)用于小學(xué)數(shù)學(xué)認(rèn)知診斷中,并生成了個性化認(rèn)知診斷報告,可明晰知識追蹤診斷效果以及學(xué)習(xí)者能力水平。還有研究者以熱力圖的形式,展現(xiàn)某一學(xué)習(xí)者在試題上的交互結(jié)果,即學(xué)習(xí)者在做完每道試題后答對下一道試題的概率,可以更好地展現(xiàn)知識追蹤在發(fā)展學(xué)習(xí)者知識掌握進(jìn)程中的作用。
學(xué)習(xí)者成就預(yù)測通過學(xué)習(xí)者與試題的交互,建立學(xué)習(xí)者學(xué)習(xí)行為與學(xué)業(yè)表現(xiàn)間的關(guān)系模型,用以預(yù)測學(xué)習(xí)者最終的成績。一方面,知識追蹤的目的之一就是根據(jù)學(xué)習(xí)者在在線學(xué)習(xí)平臺上的學(xué)習(xí)日志,清理挖掘出學(xué)習(xí)者對知識的掌握情況并預(yù)測學(xué)習(xí)者在下一時刻的成績;另一方面,大部分知識追蹤模型的性能,都是通過比較其在學(xué)習(xí)者成績預(yù)測方面的性能表現(xiàn)來判斷的。
學(xué)習(xí)者畫像能夠通過對學(xué)習(xí)者建模來挖掘不同學(xué)習(xí)者的特點,如情緒、認(rèn)知、學(xué)習(xí)偏好等,以識別不同類型的學(xué)習(xí)者,從而對其施加相應(yīng)的措施,來滿足學(xué)習(xí)者的個性化學(xué)習(xí)需求。知識追蹤是學(xué)習(xí)者建模的一種方法,根據(jù)學(xué)習(xí)者與試題產(chǎn)生的學(xué)習(xí)日志,通過知識建模,診斷出學(xué)習(xí)者的知識掌握情況以及預(yù)測學(xué)習(xí)者在下一時刻的表現(xiàn)。除了建模知識,一些改進(jìn)的知識追蹤模型,還可以建模學(xué)習(xí)者的情感特征、學(xué)習(xí)者學(xué)習(xí)過程中的記憶與遺忘因素、學(xué)習(xí)者掌握知識點快慢、學(xué)習(xí)者做題時間等等,從而優(yōu)化個性化學(xué)習(xí)。長谷(K.Nagatani)等人[53]通過建模與遺忘有關(guān)的多種類型的信息來考慮遺忘,從而提高了預(yù)測精度。
目前,絕大多數(shù)知識追蹤模型都是以學(xué)習(xí)者的歷史答題情況為基礎(chǔ),涉及的特征只有試題包含的知識點以及學(xué)習(xí)者的作答反應(yīng),然而學(xué)習(xí)者的學(xué)習(xí)過程卻更為復(fù)雜,會產(chǎn)生許多其它特征。這些特征可分為“學(xué)習(xí)者特征”以及“試題屬性特征”,其中“學(xué)習(xí)者特征” 指的是學(xué)習(xí)者在與試題進(jìn)行交互時產(chǎn)生的行為特征以及情感特征,例如學(xué)習(xí)者的作答反應(yīng)、作答時間、答題次數(shù)、查看提示、學(xué)習(xí)速率和消極/積極的情緒等;“試題屬性特征” 指的是學(xué)習(xí)者作答的試題本身所具有的屬性特征,例如,試題與知識點的映射關(guān)系特征、試題之間的依賴關(guān)系特征、試題中知識點之間的關(guān)系特征、試題難度等。這些特征會影響最終學(xué)習(xí)者的知識狀態(tài)診斷以及學(xué)習(xí)成績預(yù)測,因此,如何采集并選擇適合的特征進(jìn)行學(xué)習(xí)者知識建模?如何根據(jù)特征的不同特點進(jìn)行數(shù)據(jù)預(yù)處理增加知識追蹤模型的可移植性? 如何使得多特征充分且深入地融合? 這些都是未來的研究方向之一。
不論是深度知識追蹤還是以往的貝葉斯知識追蹤,它們的參數(shù)要么是基于試題的,要么是全部學(xué)習(xí)者共用的。然而,學(xué)習(xí)率、學(xué)習(xí)能力、失誤概率、猜測概率、遺忘等學(xué)習(xí)參數(shù),都應(yīng)該是因?qū)W習(xí)者而異的?;趯W(xué)習(xí)者的學(xué)習(xí)參數(shù),能更好地解釋學(xué)習(xí)者之間的差異,并利用這些信息更準(zhǔn)確地預(yù)測學(xué)習(xí)者的表現(xiàn),實現(xiàn)進(jìn)一步推動個性化教學(xué)和達(dá)到因材施教的目的。因此,加強個性化也是未來知識追蹤領(lǐng)域的研究方向之一。
隨著教育的改革與發(fā)展,各種學(xué)習(xí)模式如雨后春筍般爭相而出,例如,合作學(xué)習(xí)、小組學(xué)習(xí)、SPOC等等,學(xué)習(xí)者學(xué)習(xí)模式的改變必然會對學(xué)習(xí)者產(chǎn)生影響。當(dāng)然,對知識追蹤領(lǐng)域來說,如何追蹤參與不同學(xué)習(xí)模式的學(xué)習(xí)者的知識狀態(tài)? 如何利用不同學(xué)習(xí)模式對學(xué)習(xí)者的影響來追蹤學(xué)習(xí)者個性化的知識狀態(tài)? 這些都將會成為知識追蹤領(lǐng)域關(guān)注的重點。
深度知識追蹤在可解釋機制方面,一直不夠完善,主要原因在于認(rèn)知領(lǐng)域方面的理論支撐不足。因此,介入教育學(xué)、認(rèn)知心理學(xué)等方面的理論知識去完善知識追蹤原理以及提升知識追蹤模型,具有客觀的研究前景。例如,如何完美融合認(rèn)知診斷模型與知識追蹤模型,使得認(rèn)知診斷模型不具有時序性、知識追蹤模型診斷結(jié)果可解釋性不強等問題都能得到解決。又如,引入布魯姆教育目標(biāo)分類認(rèn)知領(lǐng)域的理論去優(yōu)化知識追蹤模型,進(jìn)而改善知識追蹤模型診斷粒度較粗的問題。
以往的知識追蹤模型雖然適用于小樣本小數(shù)據(jù)量的數(shù)據(jù)集,然而,預(yù)測效果卻并不如深度知識追蹤。而深度知識追蹤需要大量的數(shù)據(jù)來做訓(xùn)練,也不適用于小樣本、小數(shù)據(jù)量的數(shù)據(jù)集。因此,在保證預(yù)測效果的前提下,如何使得深度知識追蹤模型也能適用于小樣本小數(shù)據(jù)量的數(shù)據(jù)集,是今后值得探索的研究方向之一。
首先,智慧教育旨在實現(xiàn)人機協(xié)同優(yōu)化教學(xué)過程、助力學(xué)習(xí)者的智能發(fā)展,知識追蹤作為重要的智能教育方法和技術(shù),逐漸成為實踐智慧教育的重要路徑。本文通過對國內(nèi)外相關(guān)文獻(xiàn)的梳理,采用大數(shù)據(jù)建模、深度學(xué)習(xí)、多模態(tài)分析等方法,基于智慧教育視域,界定知識追蹤的概念,力圖讓知識追蹤從真正意義上服務(wù)于智慧教育實踐。
其次,本文從基于概率圖的知識追蹤、基于深度學(xué)習(xí)的知識追蹤、基于參數(shù)估計的知識追蹤這三個角度探究其最新研究進(jìn)展及面臨的挑戰(zhàn),并獲得如下結(jié)論:(1)從數(shù)據(jù)層面看,知識追蹤存在跨學(xué)科、不平衡的問題;(2)從模型層面看,知識追蹤存在體系化、標(biāo)準(zhǔn)化的問題;(3)從決策層面看,知識追蹤存在解釋性弱、遷移能力差的問題;(4)從應(yīng)用層面看,知識存在實踐路徑不清晰、領(lǐng)域偏向性的問題?;诖耍疚奶岢鲆韵陆ㄗh:(1)引入模糊邏輯對不同學(xué)科知識量化的不確定性進(jìn)行建模,從而基于模糊邏輯架構(gòu)開展知識追蹤,融合遷移學(xué)習(xí)等小樣本智能學(xué)習(xí)技術(shù),提升知識追蹤處理小樣本及不平衡的能力,從而增強知識追蹤的適用性;(2)綜合運用教育學(xué)、心理學(xué)、計算機等多學(xué)科知識,自上而下地從頂層設(shè)計統(tǒng)一的理論體系,參照學(xué)習(xí)者建模標(biāo)準(zhǔn)、學(xué)習(xí)系統(tǒng)體系結(jié)構(gòu)與服務(wù)接口等,利用軟件工程方法,制定知識追蹤體系結(jié)構(gòu)與接口標(biāo)準(zhǔn);(3)引入可解釋機器學(xué)習(xí)方法,對知識追蹤的決策進(jìn)行解釋,融合教育學(xué)、心理學(xué)等領(lǐng)域知識作為決策的解釋支撐,引入自適應(yīng)學(xué)習(xí)機制,通過領(lǐng)域自適應(yīng)來構(gòu)建遷移能力強的知識追蹤方法;(4)通過實證研究將知識追蹤應(yīng)用于真實的智慧環(huán)境中,探究知識追蹤的有效應(yīng)用路徑,采用智能數(shù)據(jù)增強技術(shù)消除偏向性的影響,并結(jié)合多模態(tài)分析方法構(gòu)建多元知識追蹤模型,從而構(gòu)建具有普適性的知識追蹤模型。
再次,本文綜合運用大數(shù)據(jù)建模、深度學(xué)習(xí)、多模態(tài)分析等方法,提出了智慧教育視域下的知識追蹤框架,以期為后續(xù)研究提供思路與參考。并從智能學(xué)習(xí)推薦、自動學(xué)習(xí)干預(yù)、知識地圖構(gòu)建、學(xué)習(xí)可視化、學(xué)習(xí)成就預(yù)測、學(xué)習(xí)者畫像等方面,探究知識追蹤面向智慧教育的實踐應(yīng)用路徑。
最后,本文從多模態(tài)知識追蹤、個性化學(xué)習(xí)參數(shù)、面向跨學(xué)習(xí)模式、融合認(rèn)知解釋性、小樣本適用模型五個層面,總結(jié)了知識追蹤的未來發(fā)展趨勢,以期進(jìn)一步推動知識追蹤在智慧教育領(lǐng)域的落地與實踐。