朱 佳,張麗君,梁婉瑩
(1. 華南師范大學(xué)計(jì)算機(jī)學(xué)院,廣州 510631; 2. 廣州市大數(shù)據(jù)智能教育重點(diǎn)實(shí)驗(yàn)室,廣州 510631)
移動(dòng)互聯(lián)網(wǎng)、智能教育的發(fā)展,極大地延伸了傳統(tǒng)的學(xué)習(xí)空間和教育實(shí)踐,促使教學(xué)模式和學(xué)習(xí)方式發(fā)生深刻變革[1]. 在人工智能(AI)、大數(shù)據(jù)、移動(dòng)互聯(lián)網(wǎng)和云計(jì)算等新興技術(shù)的支持下,數(shù)據(jù)驅(qū)動(dòng)下的個(gè)性化自適應(yīng)學(xué)習(xí)日益成為教育界關(guān)注的焦點(diǎn),并逐漸發(fā)展成為以大數(shù)據(jù)為基礎(chǔ)的教育技術(shù)新范式[2-3]. 我國(guó)《教育信息化“十三五”規(guī)劃》[4]、《教育信息化2.0行動(dòng)計(jì)劃》[5]、《新一代人工智能發(fā)展規(guī)劃》[6]等文件均明確了個(gè)性化學(xué)習(xí)的重要性,指出“關(guān)注學(xué)習(xí)者不同特點(diǎn)和個(gè)性差異”“為每個(gè)學(xué)習(xí)者提供適合的教育”“探索在信息化條件下實(shí)現(xiàn)差異化教學(xué)、個(gè)性化學(xué)習(xí)、精細(xì)化管理、智能化服務(wù)的典型途徑”等內(nèi)容. 由此可見(jiàn),關(guān)注個(gè)性化學(xué)習(xí)、尊重個(gè)體差異、促進(jìn)學(xué)習(xí)者個(gè)性化發(fā)展,是我國(guó)未來(lái)教育發(fā)展的重要內(nèi)容[7]. 目前有關(guān)自適應(yīng)學(xué)習(xí)的研究,本質(zhì)均指向個(gè)性化,認(rèn)為將其作為一種實(shí)現(xiàn)個(gè)性化學(xué)習(xí)的具體方法[8],可以為學(xué)習(xí)者提供個(gè)性化服務(wù)[9]. 在數(shù)字化學(xué)習(xí)環(huán)境中,個(gè)性化自適應(yīng)學(xué)習(xí)(Personalized Adaptive Learning)通過(guò)特定的科學(xué)手段挖掘?qū)W習(xí)者個(gè)性特征差異,全程記錄和分析學(xué)習(xí)行為數(shù)據(jù),對(duì)學(xué)習(xí)活動(dòng)、學(xué)習(xí)過(guò)程和學(xué)習(xí)結(jié)果進(jìn)行價(jià)值判斷,以此開(kāi)展個(gè)性化的干預(yù)和指導(dǎo)[10-11],從而促進(jìn)知識(shí)意義的主動(dòng)建構(gòu)和有效學(xué)習(xí).
近年來(lái),隨著如Knewton、InterBook、ELM-ART、AcroBatiq、Smart Sparrow、英語(yǔ)流利說(shuō)和猿題庫(kù)等系統(tǒng)的大規(guī)模普及與應(yīng)用,個(gè)性化自適應(yīng)學(xué)習(xí)的發(fā)展尤為迅速. 對(duì)國(guó)內(nèi)外相關(guān)研究調(diào)研發(fā)現(xiàn),當(dāng)前個(gè)性化自適應(yīng)學(xué)習(xí)的研究主要集中在系統(tǒng)模型構(gòu)建、框架設(shè)計(jì)和平臺(tái)開(kāi)發(fā)[12-13]、技術(shù)應(yīng)用研究[14-15]、系統(tǒng)模塊組件開(kāi)發(fā)和構(gòu)建[1,16]以及對(duì)研究現(xiàn)狀綜述分析[17-18]等領(lǐng)域,知識(shí)圖譜[19-20]及其表示學(xué)習(xí)[21-22]、知識(shí)追蹤[23-24]和路徑推薦[25-27]等為其研究熱點(diǎn),神經(jīng)網(wǎng)絡(luò)[28-29]、深度學(xué)習(xí)[30-31]和貝葉斯網(wǎng)絡(luò)[32-33]等技術(shù)也被廣泛應(yīng)用. 然而,根據(jù)文獻(xiàn)梳理,當(dāng)前系統(tǒng)模塊相關(guān)組件的關(guān)鍵技術(shù)多采用自然語(yǔ)言處理、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等方法實(shí)現(xiàn)[23,30,34-35],可解釋性效果不佳,在某種程度上容易形成“黑箱”問(wèn)題. 因此,針對(duì)教育技術(shù)領(lǐng)域中面臨的關(guān)鍵問(wèn)題和現(xiàn)有方法缺陷,本文在對(duì)個(gè)性化自適應(yīng)學(xué)習(xí)框架進(jìn)行解讀的基礎(chǔ)上,開(kāi)展相關(guān)組件關(guān)鍵技術(shù)研究動(dòng)態(tài)和存在問(wèn)題的梳理分析,并對(duì)近年來(lái)解釋性較好的技術(shù)研究作出介紹. 這些研究和應(yīng)用經(jīng)驗(yàn)的借鑒和綜合運(yùn)用,將成為推動(dòng)學(xué)習(xí)者個(gè)性化發(fā)展行之有效的策略.
當(dāng)前個(gè)性化自適應(yīng)學(xué)習(xí)框架主要由領(lǐng)域知識(shí)模型、學(xué)習(xí)者特征模型和教學(xué)模型三部分組成[8,36-37],又稱(chēng)為經(jīng)典的“三角模型”[38]. 其中,領(lǐng)域知識(shí)模型包含學(xué)習(xí)領(lǐng)域的邏輯體系、基本概念和原理、規(guī)則定義以及探究方式等,學(xué)習(xí)者特征模型動(dòng)態(tài)描述學(xué)習(xí)者的認(rèn)知狀況、學(xué)科知識(shí)、學(xué)習(xí)歷史、情感狀態(tài)、學(xué)習(xí)風(fēng)格和偏好等方面的個(gè)性特征,教學(xué)模型決定適合學(xué)習(xí)者的學(xué)習(xí)活動(dòng)和教學(xué)策略. 此三角模型正是教學(xué)過(guò)程“三要素”(教師、學(xué)生和教學(xué)內(nèi)容)在計(jì)算機(jī)輔助教學(xué)(Computer Aided Instruction,CAI)中智能化、程序化的實(shí)現(xiàn),相關(guān)工作原理(圖1)為:教學(xué)模型根據(jù)領(lǐng)域知識(shí)及其推理,對(duì)學(xué)習(xí)者特征模型反映出的知識(shí)水平、認(rèn)知能力、學(xué)習(xí)風(fēng)格和偏好等加以診斷和分析,做出適應(yīng)性決策,動(dòng)態(tài)安排高切合度的學(xué)習(xí)內(nèi)容、學(xué)習(xí)資源及其呈現(xiàn)方式,有針對(duì)性地向?qū)W習(xí)者提供個(gè)性化推薦服務(wù);同時(shí),對(duì)學(xué)習(xí)過(guò)程進(jìn)行實(shí)時(shí)監(jiān)測(cè)和管理,動(dòng)態(tài)獲取學(xué)習(xí)者表現(xiàn)數(shù)據(jù),由此不斷訓(xùn)練、更新學(xué)習(xí)者特征模型.
圖1 個(gè)性化自適應(yīng)學(xué)習(xí)基本框架
根據(jù)關(guān)聯(lián)主義學(xué)習(xí)理論,知識(shí)是一個(gè)由相互聯(lián)系的事實(shí)、概念、命題和規(guī)則等要素構(gòu)成的網(wǎng)絡(luò),而學(xué)習(xí)就是為了增加對(duì)這個(gè)網(wǎng)絡(luò)的認(rèn)知和理解,從而促進(jìn)有基礎(chǔ)、有意義的創(chuàng)造,更好地開(kāi)展個(gè)體建構(gòu)[39-40]. 領(lǐng)域知識(shí)模型對(duì)應(yīng)用領(lǐng)域的組成元素及其結(jié)構(gòu)進(jìn)行描述,表示內(nèi)部各組成元素及其之間的相互關(guān)系[41],一般由語(yǔ)義網(wǎng)、領(lǐng)域本體、層次結(jié)構(gòu)和知識(shí)圖譜等技術(shù)構(gòu)建,其核心作用在于支持知識(shí)的獲取、組織和推理等. 在大數(shù)據(jù)視角下,CHAPLOT和KOEDINGER[42]提出使用教育知識(shí)圖譜來(lái)引導(dǎo)一個(gè)過(guò)程中多個(gè)單元間的先決條件關(guān)系,其他學(xué)者[28,34,43]也通過(guò)引入神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等技術(shù)對(duì)教育知識(shí)圖譜構(gòu)建過(guò)程中的關(guān)鍵環(huán)節(jié)(如實(shí)體識(shí)別、關(guān)系提取和知識(shí)表示等)進(jìn)行深入研究. 在知識(shí)表示學(xué)習(xí)領(lǐng)域,當(dāng)前絕大多數(shù)工作均聚焦于通用知識(shí)圖譜方面,如:BORDES等[44]將“關(guān)系”解釋為低維向量空間上頭部和尾部實(shí)體間的轉(zhuǎn)換操作,JI等[45]提出了一種使用2個(gè)向量來(lái)表示實(shí)體和關(guān)系的TransD細(xì)粒度模型,XU等[22]提出了一種用于學(xué)習(xí)實(shí)體結(jié)構(gòu)和文本信息聯(lián)合表示的深層體系結(jié)構(gòu),KAZEMI和POOLE[46]提出了一種基于張量分解方法的雙線(xiàn)性模型來(lái)解決頭尾實(shí)體關(guān)聯(lián)性問(wèn)題等. 然而,以上技術(shù)大多僅停留在表層學(xué)習(xí)概念間的鏈接關(guān)系,缺乏對(duì)實(shí)體重要性以及不同類(lèi)型實(shí)體間的關(guān)系研究,同時(shí)對(duì)海量多元異構(gòu)媒體資源的跨圖譜表示學(xué)習(xí)也存在魯棒性不足問(wèn)題,與實(shí)際的應(yīng)用需求仍有較大差距.
學(xué)習(xí)者特征模型是個(gè)性化自適應(yīng)學(xué)習(xí)的核心和基礎(chǔ),反映個(gè)體自身及其行為所受強(qiáng)化關(guān)系上的個(gè)體差異,預(yù)示不同的學(xué)習(xí)行為表現(xiàn)[11]. 每個(gè)學(xué)習(xí)者的個(gè)性特征各不相同且動(dòng)態(tài)變化,因此需借助AI技術(shù)對(duì)學(xué)習(xí)者行為序列進(jìn)行動(dòng)態(tài)檢測(cè)和建模,預(yù)測(cè)其對(duì)知識(shí)的掌握程度及學(xué)習(xí)趨勢(shì),相關(guān)方法主要有知識(shí)追蹤、覆蓋模型和貝葉斯網(wǎng)絡(luò)等. 如:CORBETT和ANDERSON[32]提出了一種貝葉斯知識(shí)追蹤(Bayesian Knowledge Tracing,BKT)模型,該模型從結(jié)構(gòu)上來(lái)說(shuō)是一個(gè)隱馬爾可夫模型(Hidden Markov Model,HMM),將學(xué)習(xí)者的知識(shí)狀態(tài)表示為一個(gè)二元組{掌握該知識(shí)點(diǎn),未掌握該知識(shí)點(diǎn)},并根據(jù)當(dāng)前知識(shí)狀態(tài)來(lái)預(yù)測(cè)隱變量的概率分布;PIECH等[23]提出一個(gè)深度知識(shí)追蹤(Deep Knowledge Tracing,DKT)模型,通過(guò)循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)對(duì)學(xué)習(xí)者的知識(shí)狀態(tài)進(jìn)行建模后,利用長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)追蹤學(xué)習(xí)者隨時(shí)間變化的知識(shí)熟練程度,相關(guān)效果被證明優(yōu)于BKT模型;YEUNG等[24]在原始DKT模型的損失函數(shù)中引入與重建波動(dòng)相對(duì)應(yīng)的正則項(xiàng)和正則約束,增強(qiáng)了跨時(shí)間補(bǔ)償預(yù)測(cè)性能的一致性. 根據(jù)以上研究可知:基于深度學(xué)習(xí)的知識(shí)追蹤模型已被證明在無(wú)需人工特征的情況下優(yōu)于傳統(tǒng)的知識(shí)追蹤模型,但也存在未考慮到學(xué)習(xí)者知識(shí)狀態(tài)將受知識(shí)難度和遺忘規(guī)律[47-48]影響的問(wèn)題,且相關(guān)參數(shù)和表示一直被指出不可解釋.
教學(xué)模型根據(jù)知識(shí)間蘊(yùn)含的前驅(qū)和后繼關(guān)系,綜合考慮學(xué)習(xí)者當(dāng)前知識(shí)狀態(tài)、認(rèn)知能力、學(xué)習(xí)風(fēng)格及偏好等特征,有針對(duì)性地推送個(gè)性化的學(xué)習(xí)路徑和學(xué)習(xí)資源,其構(gòu)建方法主要有基于內(nèi)容的推薦、基于協(xié)同過(guò)濾的推薦以及混合推薦等. 在早期學(xué)習(xí)推薦系統(tǒng)中,基于內(nèi)容的推薦技術(shù)被廣泛使用[49-50],但這些方法存在采用人工標(biāo)記耗時(shí)且僅適用于小規(guī)模數(shù)據(jù)方面的問(wèn)題. 后來(lái),有關(guān)學(xué)者應(yīng)用協(xié)同過(guò)濾技術(shù)[25,51]或混合過(guò)濾的方式[52-55]提供相關(guān)的自適應(yīng)信息,如應(yīng)用本體技術(shù)、語(yǔ)義和上下文關(guān)系等改善了這一情況,但也發(fā)現(xiàn)混合過(guò)濾并不能輕易通過(guò)改變結(jié)構(gòu)而改善結(jié)果[56]. 如:陳敏等[57]以“學(xué)習(xí)元”平臺(tái)為例,提出泛在學(xué)習(xí)的內(nèi)容個(gè)性化推薦模型;TANG等[58]通過(guò)應(yīng)用RNN,實(shí)現(xiàn)下一步學(xué)習(xí)推薦可高達(dá)60%的預(yù)測(cè)準(zhǔn)確度. 以上提到的絕大多數(shù)推薦方法,只是在現(xiàn)有學(xué)習(xí)數(shù)據(jù)支持下針對(duì)學(xué)習(xí)者的知識(shí)背景和學(xué)習(xí)條件而開(kāi)展的推薦,其可解釋性效果不佳.
在大數(shù)據(jù)時(shí)代,越來(lái)越多的學(xué)習(xí)行為能夠被追蹤和記錄,教育從“用經(jīng)驗(yàn)說(shuō)話(huà)”向“用數(shù)據(jù)驅(qū)動(dòng)決策、管理與創(chuàng)新”的方向發(fā)展[59]. 數(shù)據(jù)驅(qū)動(dòng)下的個(gè)性化自適應(yīng)學(xué)習(xí)通過(guò)大數(shù)據(jù)分析學(xué)習(xí)過(guò)程和學(xué)習(xí)行為,能夠精準(zhǔn)識(shí)別學(xué)習(xí)者的個(gè)性特征、動(dòng)態(tài)監(jiān)控學(xué)習(xí)過(guò)程、實(shí)時(shí)預(yù)測(cè)學(xué)習(xí)趨勢(shì)和有效評(píng)價(jià)學(xué)習(xí)結(jié)果,給予學(xué)習(xí)者個(gè)性化的干預(yù)和自適應(yīng)的指導(dǎo)[60]. 因此,如何對(duì)海量教育數(shù)據(jù)的概念特征進(jìn)行自動(dòng)提取并建立關(guān)系、如何追蹤學(xué)習(xí)者在學(xué)習(xí)過(guò)程中不斷變化的個(gè)性特征、如何精準(zhǔn)確定學(xué)習(xí)者每一步要學(xué)習(xí)的知識(shí)單元等,均是當(dāng)前教育實(shí)踐中亟需解決的科學(xué)難題. 鑒于此,針對(duì)經(jīng)典“三角模型”建立一個(gè)可解釋的個(gè)性化自適應(yīng)學(xué)習(xí)技術(shù)框架,需著重對(duì)教育知識(shí)圖譜的構(gòu)建與表示學(xué)習(xí)、知識(shí)追蹤和個(gè)性化學(xué)習(xí)路徑推薦等核心技術(shù)難點(diǎn)(圖2)進(jìn)行研究,以解決教育數(shù)據(jù)中的概念邊界檢測(cè)、教育知識(shí)圖譜表示學(xué)習(xí)的實(shí)體間語(yǔ)義信息傳播、深度知識(shí)追蹤的數(shù)據(jù)稀疏化和不可解釋、個(gè)性化學(xué)習(xí)路徑推薦融合課程序列等問(wèn)題.
圖2 個(gè)性化自適應(yīng)學(xué)習(xí)框架的相關(guān)組件及對(duì)應(yīng)關(guān)鍵技術(shù)
知識(shí)圖譜(Knowledge Graph,KG)作為診斷學(xué)習(xí)者對(duì)知識(shí)和技能真實(shí)掌握狀況的底層依托,知識(shí)元抽取在本質(zhì)上來(lái)看屬于序列標(biāo)記問(wèn)題,因此,可將教育數(shù)據(jù)的概念提取視為詞語(yǔ)序列標(biāo)記問(wèn)題. 考慮到教育數(shù)據(jù)的順序性及其內(nèi)部詞語(yǔ)的依賴(lài)性,HUANG等[61]在融合雙向長(zhǎng)短期記憶網(wǎng)絡(luò)(Bidirectional LSTM,BiLSTM)和條件隨機(jī)場(chǎng)算法(Conditional Random Fields,CRF)的基礎(chǔ)上提出了BiLSTM-CRF(Bidirectional LSTM-CRF)模型,該模型精準(zhǔn)度高且對(duì)詞向量的依賴(lài)性較低. 李振和周東岱[20]深入分析了基于深度學(xué)習(xí)的知識(shí)元抽取,指出:BiLSTM-CRF模型是當(dāng)前序列標(biāo)注問(wèn)題解決領(lǐng)域中較為成熟的應(yīng)用,該模型結(jié)合了BiLSTM和CRF的特點(diǎn)[62],具有序列建模能力強(qiáng)、特征抽取自動(dòng)化的優(yōu)點(diǎn);MA和HOVF[63]將卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)融入BiLSTM-CRF模型,提出了一種“端到端”的BiLSTM-CNN-CRF模型,該模型通過(guò)采用CNN模型進(jìn)行文本字向量特征學(xué)習(xí),識(shí)別效果得到顯著提升. 此外,LI等[64]專(zhuān)注命名實(shí)體邊界檢測(cè),提出了AT-BDRY(Adversarial Transfer for Named Entity Boundary Detection)模型,通過(guò)無(wú)監(jiān)督的傳輸學(xué)習(xí)方法來(lái)減少源域和目標(biāo)域之間數(shù)據(jù)分布中的差異,無(wú)需任何手工特征或任何先前語(yǔ)言知識(shí)便能從文本中檢測(cè)出實(shí)體邊界. 為融合實(shí)體的文本和結(jié)構(gòu)信息,KIPF和WELLING[65]提出一種圖卷積網(wǎng)絡(luò)(Graph Convolutional Networks,GCN)的半監(jiān)督學(xué)習(xí)模型,該模型通過(guò)譜圖卷積的局部一階近似確定卷積網(wǎng)絡(luò)結(jié)構(gòu)的選擇、學(xué)習(xí)隱藏層表示、編碼局部圖形結(jié)構(gòu)和節(jié)點(diǎn)特征,可直接用于圖結(jié)構(gòu)數(shù)據(jù)處理. 此外,SCHLICHTKRULL等[66]引入關(guān)系圖卷積神經(jīng)網(wǎng)絡(luò)(Relational Graph Convolutional Networks,R-GCN)構(gòu)建知識(shí)圖譜,對(duì)鏈接預(yù)測(cè)和實(shí)體分類(lèi)的2個(gè)實(shí)驗(yàn)均驗(yàn)證了R-GCN模型作為實(shí)體分類(lèi)的獨(dú)立模型的有效性. 領(lǐng)域知識(shí)建模是構(gòu)建個(gè)性化自適應(yīng)學(xué)習(xí)系統(tǒng)的關(guān)鍵,然而,當(dāng)前的研究主要依賴(lài)可編碼、可量化的顯性知識(shí)進(jìn)行建模,忽略了隱性知識(shí)的應(yīng)用. 因此,如何利用教育知識(shí)圖譜對(duì)學(xué)習(xí)者學(xué)習(xí)過(guò)程中的隱性知識(shí)進(jìn)行表示和建模,如何有效實(shí)現(xiàn)隱性知識(shí)和顯性知識(shí)間的轉(zhuǎn)化,將成為未來(lái)教育知識(shí)圖譜研究和發(fā)展的重點(diǎn)和難點(diǎn).
知識(shí)追蹤基于學(xué)習(xí)者的行為序列進(jìn)行建模,能夠預(yù)測(cè)學(xué)習(xí)者對(duì)知識(shí)的掌握程度,是個(gè)性化自適應(yīng)學(xué)習(xí)系統(tǒng)構(gòu)建的核心和基礎(chǔ). 近年來(lái),基于RNN模型的知識(shí)追蹤方法因具備捕獲人類(lèi)學(xué)習(xí)的復(fù)雜表示能力、其效果優(yōu)于其他所有傳統(tǒng)方法而被廣泛應(yīng)用,但同時(shí)也不可避免地存在輸入序列重構(gòu)、預(yù)測(cè)結(jié)果波動(dòng)和處理稀疏數(shù)據(jù)時(shí)無(wú)法泛化等問(wèn)題. 這些問(wèn)題雖可以采用在損失函數(shù)中引入正則項(xiàng)并對(duì)輸出結(jié)果進(jìn)行正則約束等方法進(jìn)行優(yōu)化[24],但在效果提升方面卻不顯著且缺乏足夠的可解釋性[67]. 為此,NAKAGAWA等[68]提出一種基于圖神經(jīng)網(wǎng)絡(luò)(Graph Neural Networks,GNN)的知識(shí)追蹤方法,該方法將知識(shí)結(jié)構(gòu)轉(zhuǎn)化為圖形,從而間接將知識(shí)追蹤任務(wù)重構(gòu)成GNN模型中時(shí)間序列節(jié)點(diǎn)級(jí)分類(lèi)問(wèn)題. 從數(shù)據(jù)結(jié)構(gòu)的角度來(lái)看,知識(shí)結(jié)構(gòu)可以以圖形G=(V,E,A)形式進(jìn)行組織,將有關(guān)數(shù)據(jù)圖形結(jié)構(gòu)性質(zhì)的先驗(yàn)知識(shí)整合到模型中,提高知識(shí)追蹤的性能和可解釋性[69]. 相關(guān)實(shí)驗(yàn)表明:文獻(xiàn)[68]提出的知識(shí)追蹤方法可以改善對(duì)學(xué)習(xí)者成績(jī)的預(yù)測(cè)效果,在無(wú)需增加其他信息的情況下更具解釋性. 近年來(lái),通過(guò)深度學(xué)習(xí)處理圖結(jié)構(gòu)數(shù)據(jù)的GNN方法研究備受關(guān)注,各種泛化框架和重要操作陸續(xù)問(wèn)世,并在相關(guān)研究領(lǐng)域也都取得了成功結(jié)果[70-71].
另一方面,知識(shí)追蹤也可以看作為對(duì)學(xué)習(xí)者參與學(xué)習(xí)活動(dòng)時(shí)知識(shí)概念(Knowledge Concepts,KCs)掌握程度進(jìn)行建模的一項(xiàng)任務(wù). PANDEY和KARYPIS[72]認(rèn)為:在知識(shí)概念的學(xué)習(xí)中,學(xué)習(xí)者在各項(xiàng)學(xué)習(xí)活動(dòng)中所掌握的技能彼此關(guān)聯(lián),且取決于與該學(xué)習(xí)活動(dòng)相關(guān)聯(lián)的過(guò)去學(xué)習(xí)表現(xiàn);為有效解決數(shù)據(jù)稀疏時(shí)無(wú)法泛化的問(wèn)題,提出一種基于自我注意(Self-Attention)的知識(shí)追蹤模型,該模型能夠在不使用任何RNN模型的情況下模擬學(xué)習(xí)者的互動(dòng)歷史,并通過(guò)學(xué)習(xí)者歷史互動(dòng)中的學(xué)習(xí)行為表現(xiàn)來(lái)進(jìn)行推理和預(yù)測(cè),相關(guān)實(shí)驗(yàn)表明該模型比基于RNN模型的方法快一個(gè)數(shù)量級(jí). 此外,GONZLEZ-BRENES等[73]研究表明:通過(guò)知識(shí)追蹤和其他建模方法的組合應(yīng)用,可有效提升模型的預(yù)測(cè)精度. 如:CAI等[74]采用知識(shí)追蹤和回歸分析模型相結(jié)合的方法研究學(xué)習(xí)者整體學(xué)習(xí)趨勢(shì),預(yù)測(cè)未來(lái)學(xué)習(xí)趨勢(shì)和表現(xiàn);KHAJAH等[75]結(jié)合知識(shí)追蹤和項(xiàng)目反應(yīng)理論(Item Response Theory,IRT)模型來(lái)預(yù)測(cè)學(xué)習(xí)者的知識(shí)掌握,獲得了顯著成效.
總的來(lái)說(shuō),訓(xùn)練知識(shí)追蹤的目標(biāo)是利用學(xué)習(xí)者的歷史學(xué)習(xí)數(shù)據(jù)去預(yù)測(cè)其未來(lái)學(xué)習(xí)表現(xiàn),DKT模型在優(yōu)化學(xué)習(xí)效率、發(fā)現(xiàn)不同知識(shí)點(diǎn)間內(nèi)在聯(lián)系、動(dòng)態(tài)反映學(xué)習(xí)者連續(xù)知識(shí)水平變化等方面表現(xiàn)出強(qiáng)大優(yōu)勢(shì),但也存在模型無(wú)法重構(gòu)、學(xué)習(xí)者對(duì)知識(shí)點(diǎn)掌握程度不連續(xù)問(wèn)題,未來(lái)需進(jìn)一步對(duì)各種相關(guān)的DKT+模型進(jìn)行探索和研究.
與常規(guī)的推薦系統(tǒng)類(lèi)似,個(gè)性化自適應(yīng)學(xué)習(xí)路徑推薦除了需解決常見(jiàn)的數(shù)據(jù)過(guò)大和冷啟動(dòng)問(wèn)題外,還需考慮系統(tǒng)中其他模塊的輸出問(wèn)題. 個(gè)性化學(xué)習(xí)路徑推薦是一個(gè)詳細(xì)的推薦過(guò)程,如果僅使用學(xué)習(xí)者數(shù)據(jù),難度是非常大的. 為了提供更加準(zhǔn)確多樣和可解釋的推薦,WANG等[76]在基于KG與用戶(hù)——項(xiàng)目圖(User-Item Graph)的混合結(jié)構(gòu)中提出一種知識(shí)圖注意力網(wǎng)絡(luò)(Knowledge Graph Attention Network,KGAT)方法,在GNN模型框架下以“端到端”的方式實(shí)現(xiàn)知識(shí)圖的高階關(guān)系建模;該模型采用遞歸方式傳播來(lái)自節(jié)點(diǎn)鄰居的嵌入并引入Attention機(jī)制區(qū)分鄰居嵌入的重要性,相關(guān)實(shí)驗(yàn)證明了其在理解高級(jí)關(guān)系重要性方面的可解釋性.
學(xué)習(xí)路徑由不同的節(jié)點(diǎn)組成,每個(gè)節(jié)點(diǎn)代表一個(gè)知識(shí)點(diǎn),每個(gè)課程均包含著或多或少的知識(shí)點(diǎn). NABIZADEH等[26]提出一條融合課程知識(shí)關(guān)系的學(xué)習(xí)路徑推薦模型,該模型從課程序列圖中選擇所要學(xué)習(xí)的知識(shí)點(diǎn)后,組合知識(shí)關(guān)系和深度優(yōu)先算法對(duì)所選知識(shí)點(diǎn)的課程序列進(jìn)行深度搜索,估算學(xué)習(xí)時(shí)間及得分,再根據(jù)學(xué)習(xí)目標(biāo)、認(rèn)知狀態(tài)和先驗(yàn)知識(shí)等要素推薦一系列滿(mǎn)足學(xué)習(xí)者有限時(shí)間限制的學(xué)習(xí)路徑;相關(guān)實(shí)驗(yàn)證明:該模型可在最大程度上提高學(xué)習(xí)者分?jǐn)?shù)的同時(shí)滿(mǎn)足時(shí)間限制,但仍存在學(xué)習(xí)者和學(xué)習(xí)對(duì)象冷啟動(dòng)問(wèn)題.
冷啟動(dòng)問(wèn)題在推薦系統(tǒng)中最為普遍,如果沒(méi)有學(xué)習(xí)者的學(xué)習(xí)行為數(shù)據(jù),那么后續(xù)的神經(jīng)網(wǎng)絡(luò)模型便無(wú)法正常運(yùn)行. 為有效解決該問(wèn)題,PLIAKOS等[77]提出一種將IRT和機(jī)器學(xué)習(xí)相結(jié)合的混合方法,該方法將IRT與基于學(xué)習(xí)者輔助信息的分類(lèi)樹(shù)、回歸樹(shù)相集成,并對(duì)學(xué)習(xí)者能力評(píng)估和項(xiàng)目反應(yīng)進(jìn)行預(yù)測(cè);實(shí)驗(yàn)結(jié)果表明:IRT與隨機(jī)森林相結(jié)合可提供誤差最低和響應(yīng)最高的預(yù)測(cè)準(zhǔn)確性,有效減輕學(xué)習(xí)環(huán)境中冷啟動(dòng)問(wèn)題的影響. ZHOU等[27]提出一種基于LSTM模型融合知識(shí)關(guān)系的全路徑學(xué)習(xí)推薦模型:先基于個(gè)性特征相似度對(duì)學(xué)習(xí)者集合進(jìn)行聚類(lèi)并訓(xùn)練LSTM模型,預(yù)測(cè)學(xué)習(xí)路徑及其表現(xiàn),再?gòu)穆窂筋A(yù)測(cè)結(jié)果中選擇個(gè)性化的學(xué)習(xí)路徑進(jìn)行推薦,從而有效解決沒(méi)有學(xué)習(xí)行為數(shù)據(jù)的學(xué)習(xí)者路徑推薦問(wèn)題;學(xué)習(xí)路徑中每個(gè)節(jié)點(diǎn)都具有關(guān)于學(xué)習(xí)者個(gè)體特征、學(xué)習(xí)內(nèi)容和學(xué)習(xí)資源等多維數(shù)據(jù),與文本數(shù)據(jù)的特征相似,學(xué)習(xí)路徑數(shù)據(jù)同樣具有序列結(jié)構(gòu),實(shí)驗(yàn)證明該模型對(duì)各種數(shù)據(jù)集都有較好的權(quán)衡. 知識(shí)關(guān)系來(lái)源于知識(shí)追蹤,由于知識(shí)追蹤模型具備可解釋性,因此,該推薦模型具備了一定的可解釋性.
教育是一個(gè)復(fù)雜的系統(tǒng)工程,個(gè)性化學(xué)習(xí)路徑推薦的進(jìn)一步豐富和發(fā)展需回歸教育本質(zhì). 從教育的角度出發(fā),將學(xué)習(xí)路徑的個(gè)性化推薦研究與教育全過(guò)程相結(jié)合,在教育教學(xué)理論的指導(dǎo)下開(kāi)展推薦模型的構(gòu)建和系統(tǒng)的研發(fā),真正為學(xué)習(xí)者提供更具個(gè)性化的學(xué)習(xí)服務(wù),將成為未來(lái)個(gè)性化自適應(yīng)學(xué)習(xí)研究的重中之重.
本文在分析國(guó)內(nèi)外個(gè)性化自適應(yīng)學(xué)習(xí)研究的基礎(chǔ)上,從數(shù)據(jù)驅(qū)動(dòng)的視角出發(fā),對(duì)其框架進(jìn)行解讀和對(duì)相關(guān)組件技術(shù)進(jìn)行分析,并對(duì)近年來(lái)可促進(jìn)解釋性提升的有關(guān)技術(shù)研究作出介紹. 雖然個(gè)性化自適應(yīng)學(xué)習(xí)在人工智能教育中具有廣闊的應(yīng)用和發(fā)展前景,但其在基本科學(xué)問(wèn)題、重點(diǎn)體系框架、關(guān)鍵核心技術(shù)和重要應(yīng)用示范等方面仍然處于不斷探索階段. 尤其是在具體應(yīng)用場(chǎng)景上,主要還是集中于在線(xiàn)教育方面,而在線(xiàn)下實(shí)體教育中尚缺乏實(shí)際應(yīng)用,其主要原因在于線(xiàn)下數(shù)據(jù)采集的困難性以及不同實(shí)體教學(xué)結(jié)構(gòu)的差異性上. 因此,個(gè)性化自適應(yīng)學(xué)習(xí)的未來(lái)發(fā)展應(yīng)從知識(shí)圖譜及其表示學(xué)習(xí)、知識(shí)追蹤、個(gè)性化學(xué)習(xí)路徑推薦等方面,深入研究多場(chǎng)景數(shù)據(jù)驅(qū)動(dòng)下個(gè)性化自適應(yīng)學(xué)習(xí)的基礎(chǔ)理論和框架體系、核心技術(shù)和平臺(tái)構(gòu)建,積極推進(jìn)落地應(yīng)用示范,通過(guò)實(shí)際反饋切實(shí)推動(dòng)其在教育領(lǐng)域的創(chuàng)新發(fā)展.