摘要:隨著大數(shù)據(jù)、人工智能等新一代信息技術(shù)的迅速發(fā)展,智慧教育從理念模式向落地實(shí)踐的方向轉(zhuǎn)變,并逐步規(guī)模化發(fā)展。由于目前國內(nèi)在線教育平臺未能充分利用已有的海量學(xué)習(xí)者學(xué)習(xí)數(shù)據(jù)和學(xué)習(xí)資源數(shù)據(jù),導(dǎo)致學(xué)習(xí)者無法充分了解自己的學(xué)習(xí)情況并對學(xué)習(xí)資源產(chǎn)生信息迷航。針對上述問題,文章提出一種基于學(xué)習(xí)者畫像的個性化習(xí)題資源推薦系統(tǒng),利用學(xué)習(xí)者學(xué)習(xí)過程的數(shù)據(jù)并結(jié)合學(xué)習(xí)者畫像,為學(xué)習(xí)者提供個性化的習(xí)題資源推薦。該系統(tǒng)首先采用二次K-means聚類算法構(gòu)建學(xué)習(xí)者多維學(xué)習(xí)能力分?jǐn)?shù),畫出學(xué)習(xí)者多維能力雷達(dá)圖,用以構(gòu)建學(xué)習(xí)者畫像;其次融合學(xué)習(xí)者多維能力分?jǐn)?shù),采用多種推薦系統(tǒng)模型實(shí)現(xiàn)對學(xué)習(xí)者的個性化習(xí)題資源推薦;最后對學(xué)習(xí)者畫像和習(xí)題資源推薦進(jìn)行可視化展示。該研究為在線教育平臺充分利用海量學(xué)習(xí)數(shù)據(jù)提供了新思路。
關(guān)鍵詞:學(xué)習(xí)者畫像;習(xí)題資源推薦;可視化展示;在線教育;智慧教育
中圖分類號:TP311" " " " 文獻(xiàn)標(biāo)識碼:A" " " 文章編號:1674-0688(2024)06-0103-04
0 引言
2017年7月,國務(wù)院發(fā)布的《新一代人工智能發(fā)展規(guī)劃》中明確提出,推動人工智能在教學(xué)、管理、資源建設(shè)等方面的全流程應(yīng)用,促進(jìn)人才培養(yǎng)模式和教學(xué)方法改革,構(gòu)建新型教育體系[1]。在學(xué)術(shù)領(lǐng)域,“互聯(lián)網(wǎng)+教育”領(lǐng)域的學(xué)術(shù)研究共同體呼吁教學(xué)組織方式、學(xué)校形態(tài)、教育供給模式和在線教育新業(yè)態(tài)的發(fā)展和創(chuàng)新[2]。近年來,隨著互聯(lián)網(wǎng)的快速發(fā)展,在線教育平臺的用戶數(shù)據(jù)呈爆發(fā)式增長。目前,個性化推薦系統(tǒng)是解決學(xué)習(xí)者面臨“信息過載”問題的一種有效方法。為了實(shí)現(xiàn)智慧教育中對學(xué)習(xí)者學(xué)習(xí)能力評估精細(xì)化、智能化的目標(biāo),以及幫助學(xué)習(xí)者解決學(xué)習(xí)過程中產(chǎn)生的認(rèn)知過載和定向障礙等問題,設(shè)計一套個性化習(xí)題資源推薦系統(tǒng)尤為迫切。
國內(nèi)許多研究團(tuán)隊(duì)正聚焦于學(xué)習(xí)者畫像的構(gòu)建方法和個性化學(xué)習(xí)資源推薦模型開展研究。謝雨婷等[3]基于主成分分析法提出九維綜合素質(zhì)評價指標(biāo),并借助自組織映射神經(jīng)網(wǎng)絡(luò)(Self-Organizing Feature Map,SOM)構(gòu)建學(xué)生群體分類模型,完成對學(xué)生群體綜合素質(zhì)的評價。ZHOU等[4]基于MOOC(大型開放式網(wǎng)絡(luò)課程)學(xué)習(xí)平臺,將學(xué)習(xí)者學(xué)習(xí)過程中產(chǎn)生的6項(xiàng)數(shù)據(jù)通過K-means聚類分析劃分3個類別,再使用SPSS軟件將6維數(shù)據(jù)降至2維數(shù)據(jù),即任務(wù)完成度和學(xué)習(xí)熱情度,以評估學(xué)習(xí)者的學(xué)習(xí)情況,并構(gòu)建3種學(xué)習(xí)者畫像:學(xué)習(xí)天才畫像、積極勤奮畫像、學(xué)習(xí)遲緩畫像。LI等[5]設(shè)計一種基于協(xié)同過濾算法的個性化在線教育平臺,通過對協(xié)同過濾算法進(jìn)行改進(jìn),較大地提高了推薦的準(zhǔn)確性和效率。唐小燕等[6]提出采用兩個半自動編碼器模型從學(xué)生的學(xué)習(xí)行為特征和學(xué)習(xí)資源特征中提取學(xué)習(xí)者與學(xué)習(xí)資源的相關(guān)特征,再與矩陣分解結(jié)合,將學(xué)生和學(xué)習(xí)資源的交互記錄映射到隱式向量,用于推薦學(xué)習(xí)資源。
上述文獻(xiàn)對學(xué)習(xí)者進(jìn)行聚類分析,實(shí)現(xiàn)對學(xué)習(xí)者群體的分類評估,并且結(jié)合學(xué)習(xí)者學(xué)習(xí)過程數(shù)據(jù),通過推薦算法為學(xué)習(xí)者推薦學(xué)習(xí)資源。在前人研究的基礎(chǔ)上,本文設(shè)計一款基于學(xué)習(xí)者畫像的個性化習(xí)題資源推薦系統(tǒng),該系統(tǒng)首先通過二次K-means聚類算法對學(xué)習(xí)者學(xué)習(xí)過程數(shù)據(jù)進(jìn)行聚類評估,獲取3組不同的能力評分,其次根據(jù)學(xué)習(xí)者學(xué)習(xí)過程數(shù)據(jù)和能力評分,采用多種推薦模型為學(xué)習(xí)者推薦個性化的習(xí)題資源,最后將以上兩個部分的內(nèi)容進(jìn)行可視化展示。
1 系統(tǒng)總體設(shè)計
本系統(tǒng)包括學(xué)習(xí)者畫像構(gòu)建模型和個性化習(xí)題資源推薦模型兩大功能模塊。首先,系統(tǒng)使用二次K-means聚類算法對學(xué)習(xí)者學(xué)習(xí)過程數(shù)據(jù)進(jìn)行聚類評估,解決傳統(tǒng)學(xué)習(xí)者能力評估中類內(nèi)無法再次評估和評估數(shù)據(jù)類型單一的問題;其次,結(jié)合學(xué)習(xí)者學(xué)習(xí)過程數(shù)據(jù)和習(xí)題資源數(shù)據(jù)訓(xùn)練個性化推薦模型,為學(xué)習(xí)者推薦更具個性化的習(xí)題資源,以解決學(xué)習(xí)者學(xué)習(xí)過程中出現(xiàn)的認(rèn)知過載和定向障礙的問題。
本系統(tǒng)以某在線教育平臺提供的學(xué)習(xí)者學(xué)習(xí)過程數(shù)據(jù)和習(xí)題資源數(shù)據(jù)為基礎(chǔ),構(gòu)建學(xué)習(xí)者多維學(xué)習(xí)能力雷達(dá)圖,為學(xué)習(xí)者提供個性化的習(xí)題資源推薦,并且展示推薦系統(tǒng)模型的各項(xiàng)評價指標(biāo)值。系統(tǒng)運(yùn)行流程圖見圖1。
本系統(tǒng)的整體架構(gòu)一共劃分為以下7個部分:基礎(chǔ)層、數(shù)據(jù)層、預(yù)處理層、支撐層、服務(wù)層、業(yè)務(wù)層、展示層。系統(tǒng)架構(gòu)設(shè)計圖見圖2。
(1)基礎(chǔ)層?;A(chǔ)層包括網(wǎng)絡(luò)、本地服務(wù)器、操作系統(tǒng)及中間件,為整個系統(tǒng)架構(gòu)提供軟、硬件支撐。
(2)數(shù)據(jù)層。數(shù)據(jù)層的功能主要是向業(yè)務(wù)層提供數(shù)據(jù)并保證數(shù)據(jù)的可靠性,當(dāng)業(yè)務(wù)層需要數(shù)據(jù)時,數(shù)據(jù)層負(fù)責(zé)從數(shù)據(jù)庫讀取數(shù)據(jù)后提供給業(yè)務(wù)層。數(shù)據(jù)層中的主要數(shù)據(jù)來源于某在線教育平臺提供的學(xué)習(xí)者學(xué)習(xí)信息和習(xí)題資源信息,數(shù)據(jù)脫敏后同步到系統(tǒng)的數(shù)據(jù)庫中,該部分?jǐn)?shù)據(jù)將作為系統(tǒng)前期個性化推薦系統(tǒng)計算模塊的數(shù)據(jù)支撐,系統(tǒng)后期支持教師和學(xué)習(xí)者上傳習(xí)題資源,用戶也可以使用。系統(tǒng)利用MySQL數(shù)據(jù)庫存儲習(xí)題資源信息、用戶數(shù)據(jù)和交互信息。
(3)預(yù)處理層。預(yù)處理層主要采用數(shù)據(jù)預(yù)處理功能對采集數(shù)據(jù)進(jìn)行清理,過濾掉空的習(xí)題資源,并且完成學(xué)習(xí)者學(xué)習(xí)行為數(shù)據(jù)的標(biāo)準(zhǔn)化,作為學(xué)習(xí)者畫像構(gòu)建和個性化推薦模型訓(xùn)練的數(shù)據(jù)支撐。
(4)支撐層。支撐層使用TensorFlow深度學(xué)習(xí)庫和Skearn機(jī)器學(xué)習(xí)庫為模型訓(xùn)練、評估及預(yù)測提供服務(wù)。使用Django框架為用戶信息管理、習(xí)題資源管理和搜索排序提供數(shù)據(jù)服務(wù)和功能支持。
(5)服務(wù)層。服務(wù)層分為三大模塊,分別是學(xué)習(xí)者畫像構(gòu)建模塊、推薦模塊、信息管理模塊,為業(yè)務(wù)層提供數(shù)據(jù)處理支持。
(6)業(yè)務(wù)層。業(yè)務(wù)層是整個系統(tǒng)的核心,業(yè)務(wù)層將產(chǎn)生的數(shù)據(jù)通過數(shù)據(jù)層保存到數(shù)據(jù)庫,業(yè)務(wù)層具有五大業(yè)務(wù)模塊,分別是學(xué)習(xí)者畫像構(gòu)建業(yè)務(wù)、習(xí)題資源業(yè)務(wù)、用戶管理業(yè)務(wù)、搜索業(yè)務(wù)、推薦業(yè)務(wù),其中推薦業(yè)務(wù)模塊通過數(shù)據(jù)層提供的數(shù)據(jù),使用融合了多頭自注意力機(jī)制的xDeepFM模型訓(xùn)練并計算得到用戶的推薦習(xí)題資源列表,結(jié)果經(jīng)業(yè)務(wù)層處理后提供給展示層,然后保存到數(shù)據(jù)庫。
(7)展示層。展示層主要使用Web前端技術(shù)Django框架為用戶提供瀏覽、操作功能,以及為管理者提供用戶和數(shù)據(jù)管理。當(dāng)用戶打開瀏覽器訪問個性化習(xí)題資源推薦系統(tǒng)首頁時,用戶發(fā)出的請求將轉(zhuǎn)接到業(yè)務(wù)層,業(yè)務(wù)層通過計算,從數(shù)據(jù)層中的數(shù)據(jù)庫獲取推薦習(xí)題資源等數(shù)據(jù)后返回給展示層,展示層通過渲染前端UI(用戶界面)最終將數(shù)據(jù)呈現(xiàn)給用戶。該層采用的技術(shù)包括HTML5、CSS(層疊樣式表)、JavaScript等。
2 系統(tǒng)實(shí)現(xiàn)方式
2.1 學(xué)習(xí)者畫像構(gòu)建模型
學(xué)習(xí)者畫像構(gòu)建模型主要使用二次K-means聚類算法對學(xué)習(xí)者學(xué)習(xí)過程數(shù)據(jù)進(jìn)行聚類評估。本研究通過分析某在線教育平臺提供的反映學(xué)習(xí)者學(xué)習(xí)行為的數(shù)據(jù)集,結(jié)合前人的研究和教育學(xué)相關(guān)知識,構(gòu)建出學(xué)習(xí)者的能力評估分?jǐn)?shù)。首先從學(xué)生學(xué)習(xí)過程中抽取16個反映學(xué)習(xí)者學(xué)習(xí)情況的特征維度,將其進(jìn)行整合,構(gòu)建新的特征表示學(xué)生學(xué)習(xí)能力評估維度;其次通過實(shí)訓(xùn)題測評時長得分、實(shí)訓(xùn)題測評次數(shù)得分、作業(yè)成績、視頻觀看次數(shù)、實(shí)訓(xùn)題通過率、關(guān)卡通過率構(gòu)建知識技能分?jǐn)?shù),測試完成率、簽到成績、測試打回次數(shù)、作業(yè)打回次數(shù)、視頻觀看率、作業(yè)完成率構(gòu)建學(xué)習(xí)態(tài)度分?jǐn)?shù),以及討論次數(shù)、簽到次數(shù)、測驗(yàn)完成次數(shù)、作業(yè)完成次數(shù)構(gòu)建課程興趣分?jǐn)?shù)。
本系統(tǒng)首先采用第一次K-means聚類算法對學(xué)習(xí)者的學(xué)習(xí)行為特征進(jìn)行多維度聚類,對每個類別求平均分后進(jìn)行排序,以得到每位學(xué)習(xí)者的第一個能力評估得分;其次使用第二次K-means對每個類別進(jìn)行聚類,對獲得的每個新類別求平均分后排序,以得到每位學(xué)習(xí)者的第二個能力評估得分,第一次聚類得分乘以10再與第二次聚類得分相加,即得到學(xué)習(xí)者的能力評估分?jǐn)?shù)。K-means聚類算法步驟如下。
(1)隨機(jī)初始化簇的數(shù)目K和聚類中心,最大迭代數(shù)為N。
(2)根據(jù)公式(1)計算每個樣本到聚類中心之間的歐式距離d,將每個樣本合并到最近的聚類中心,使其成為該聚類中心的一個類。
(3)計算每個聚類中樣本的均值,更新聚類中心。
(4)重復(fù)“步驟(2)”和“步驟(3)”,直到聚類中心不再變化。
2.2 個性化習(xí)題資源推薦模型
個性化習(xí)題資源推薦模型主要使用學(xué)習(xí)者學(xué)習(xí)過程數(shù)據(jù)和習(xí)題資源數(shù)據(jù)訓(xùn)練多種推薦算法模型,得出多種推薦算法模型的評價指標(biāo),將評價指標(biāo)最佳的推薦模型作為學(xué)習(xí)者習(xí)題資源推薦模型。
本系統(tǒng)采用的數(shù)據(jù)集由學(xué)習(xí)者特征信息表、習(xí)題特征信息表和學(xué)習(xí)者對習(xí)題提出問題的交互記錄3個部分組成,包含34 832名學(xué)習(xí)者、7 734道習(xí)題和34 832條交互記錄。學(xué)習(xí)者特征為學(xué)生的性別、教育背景和本文“2.1”小節(jié)中構(gòu)建的16個學(xué)習(xí)者畫像特征,其中包括作業(yè)成績、測驗(yàn)成績、知識技能分?jǐn)?shù)、學(xué)習(xí)態(tài)度分?jǐn)?shù)和課程興趣分?jǐn)?shù)等。習(xí)題特征為習(xí)題ID、習(xí)題所屬章節(jié)ID、學(xué)生對習(xí)題的難度評價分?jǐn)?shù)、學(xué)習(xí)人數(shù)、包含的題目數(shù)量等。習(xí)題資源均為計算機(jī)編程類習(xí)題,包括但不限于C語言、Java語言、數(shù)據(jù)結(jié)構(gòu)、人工智能算法與設(shè)計等課程。系統(tǒng)將上述數(shù)據(jù)集輸入推薦算法模型中,訓(xùn)練多個推薦算法模型,推薦算法模型包括因子分解機(jī)算法、DSSM(Deep Structured Semantic Model)雙塔模型、YouTube DNN(Deep Neural Networks for YouTube Recommendations)模型、PNN(Product-based Neural Network)模型、xDeepFM模型、融合自注意力機(jī)制的xDeepFM模型(SA-xDee?pFM)、融合多頭自注意力的xDeepFM模型(MHAS-xDeepFM)。計算上述推薦算法和模型的評價指標(biāo),最終選擇評價指標(biāo)最佳的模型作為個性化習(xí)題資源推薦模型,為學(xué)習(xí)者推薦習(xí)題資源。
2.3 可視化頁面展示
系統(tǒng)通過將前期某在線教育平臺提供的數(shù)據(jù)集上傳至數(shù)據(jù)庫,采用學(xué)習(xí)者畫像構(gòu)建方法畫出學(xué)習(xí)者多維學(xué)習(xí)能力雷達(dá)圖,并將此類數(shù)據(jù)展示在系統(tǒng)上。系統(tǒng)可對數(shù)據(jù)進(jìn)行預(yù)處理和聚類分析,主要包括數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)準(zhǔn)化、特征提取、K-means聚類等。對數(shù)據(jù)進(jìn)行聚類分析,畫出學(xué)習(xí)者能力評估分?jǐn)?shù)雷達(dá)圖(見圖3),以便更好地將學(xué)習(xí)過程數(shù)據(jù)展示給學(xué)習(xí)者。
系統(tǒng)構(gòu)建學(xué)習(xí)者畫像后,采用個性化習(xí)題資源推薦模型,為學(xué)習(xí)者提供習(xí)題資源推薦。推薦模型對全量數(shù)據(jù)集進(jìn)行推薦召回,得到召回列表,再將召回列表中的習(xí)題展示在學(xué)習(xí)者的推薦頁面中(見圖4)。
3 系統(tǒng)運(yùn)行結(jié)果及分析
系統(tǒng)由學(xué)習(xí)者畫像構(gòu)建模型和個性化習(xí)題資源推薦模型兩大功能模塊組成,學(xué)習(xí)者畫像構(gòu)建模型對學(xué)習(xí)者多維學(xué)習(xí)能力進(jìn)行聚類評估,畫出學(xué)習(xí)者多維能力雷達(dá)圖;個性化習(xí)題資源推薦模型采用多個推薦模型進(jìn)行實(shí)驗(yàn),然后對比評價指標(biāo),并采用評價指標(biāo)最佳的推薦模型為學(xué)習(xí)者提供個性化的習(xí)題資源。推薦模型準(zhǔn)確率對比頁面見圖5。
系統(tǒng)采用目前業(yè)界廣泛認(rèn)可的聚類算法和人工智能推薦模型,旨在實(shí)現(xiàn)學(xué)習(xí)者畫像和習(xí)題資源推薦功能。通過使用通用接口進(jìn)行定義,可以提高模型的魯棒性和可擴(kuò)展性,從而便于新模型的開發(fā)和導(dǎo)入。
4 結(jié)語
在線教育平臺的用戶數(shù)據(jù)和學(xué)習(xí)資源數(shù)據(jù)快速增長,當(dāng)前主流的在線教育平臺存在兩大挑戰(zhàn):一是在線教育平臺只提供各種學(xué)習(xí)資源給學(xué)習(xí)者,缺少對學(xué)習(xí)者的深入評估,無法根據(jù)學(xué)習(xí)者的學(xué)習(xí)過程推薦學(xué)習(xí)資源;二是學(xué)習(xí)者學(xué)習(xí)過程中產(chǎn)生的數(shù)據(jù)過多且存在不同的評價維度,由于缺少有效的個性化推薦方法,所以平臺無法準(zhǔn)確地根據(jù)學(xué)習(xí)者的需求為學(xué)習(xí)者提供個性化的推薦。針對上述問題,本文通過某在線教育平臺提供的原始數(shù)據(jù)集,研究學(xué)習(xí)者畫像的構(gòu)建方法和個性化習(xí)題資源推薦模型,實(shí)現(xiàn)了學(xué)習(xí)者多維學(xué)習(xí)能力評估功能和個性化習(xí)題資源推薦功能。該系統(tǒng)采用的是聚類算法和多種推薦算法模型實(shí)現(xiàn)這兩大功能,具有良好的魯棒性和可擴(kuò)展性,未來可加入新的算法模型進(jìn)行二次開發(fā)設(shè)計。
5 參考文獻(xiàn)
[1]曹培杰.智慧教育:人工智能時代的教育變革[J].教育研究,2018,39(8):121-128.
[2]陳麗,徐亞倩.“互聯(lián)網(wǎng)+教育”研究的十大學(xué)術(shù)新命題[J].電化教育研究,2021,42(11):5-12.
[3]謝雨婷,代秀云,黃先莉,等.基于學(xué)生成績的學(xué)生綜合素質(zhì)量化評價研究[J].高等理科教育,2021(1):115-123.
[4]ZHOU Y,F(xiàn)AN H D.Research on construction of learner portrait based on learning analytics technology[C]//International Conference on Artificial Intelligence and Industrial Design(AIID 2022).SPIE,2023,12612:223-227.
[5]LI J,YE Z.Course recommendations in online education based on collaborative filtering recommendation algorithm[J].Complexity,2020:1-10.
[6]唐小燕,李斌,張承江,等.基于半自動編碼器的學(xué)習(xí)資源推薦[J].揚(yáng)州大學(xué)學(xué)報(自然科學(xué)版),2023,26(1):74-78.
*湖南省重點(diǎn)實(shí)驗(yàn)室項(xiàng)目“基礎(chǔ)教育信息化技術(shù)”(2015TP1017);教育部產(chǎn)學(xué)合作協(xié)同育人項(xiàng)目“工業(yè)互聯(lián)網(wǎng)人才培養(yǎng)的新工科專業(yè)建設(shè)”(230804978265939)。
【作者簡介】曾榮科,男,湖南常德人,在讀碩士研究生,研究方向:自然語言處理、推薦系統(tǒng);李倩倩,女,河南虞城人,碩士,講師,研究方向:大數(shù)據(jù)分析;周文健,男,湖南衡陽人,在讀本科,研究方向:大數(shù)據(jù)分析;李璐瑤,女,河南新鄉(xiāng)人,在讀碩士研究生,研究方向:推薦系統(tǒng);李睿,男,湖南郴州人,在讀碩士研究生,研究方向:大數(shù)據(jù)分析。
【引用本文】曾榮科,李倩倩,周文健,等.基于學(xué)習(xí)者畫像的個性化習(xí)題資源推薦系統(tǒng)設(shè)計與實(shí)現(xiàn)[J].企業(yè)科技與發(fā)展,2024(6):103-106.