国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種基于HIN的學習資源推薦算法研究

2019-05-05 06:29葉俊民黃朋威羅達雄王志鋒
小型微型計算機系統(tǒng) 2019年4期
關鍵詞:相似性準確度排序

葉俊民,黃朋威,羅達雄,王志鋒,陳 曙

1(華中師范大學 計算機學院,武漢 430079)2(華中師范大學 教育信息技術學院,武漢 430079)

1 引 言

如何更精準地進行學習資源推薦是自適應學習中有待進一步研究的問題.傳統(tǒng)的的推薦方法主要是通過計算學習者之間的相似度,或者計算知識單元之間的相似度,以實現向學習者推薦學習資源.但相關方法沒有注意到學習者和知識單元之間豐富的關聯關系.由于異構信息網絡能夠很好支持對象及對象間的關聯表達,因此基于異構信息網絡來研究學習資源推薦具有較大的理論研究意義和實踐應用價值.

國外關于自適應學習中學習資源推薦的研究主要集中在各類推薦算法在自適應學習平臺的應用效果研究、各種學習環(huán)境因素對于推薦算法的影響,以及大數據技術在學習資源推薦中的應用.

X Peng等根據學習者的搜索行為和資源屬性,提出了能夠高效匹配搜索字符串與學習資源的推薦方法[1];H Chen提出了基于主題模型的興趣挖掘算法,實現了高效的個性化學習資源推薦[2];M Salehi等應用隱式、顯式屬性,采用推薦序列模式挖掘算法得到了精度更高的學習資源推薦效果[3];G Sun等基于概念圖的本體構建方法,結合學習者的歷史信息,開發(fā)了自適應教育資源推薦系統(tǒng)MLaaS[4];T Liang等提出了一種基于內容過濾的PageRank學習資源推薦算法[5].

國內的研究工作主要關注推薦算法的改進、學習者和學習資源的特征與關聯的使用,以及個性化因素的研究.程巖等根據學習者的知識水平、學習風格和對學習路徑的評價,提出了一種擴展蟻群算法用以實現學習路徑的推薦[6];付芬等提出了一種基于隱式評分和相似度傳遞的學習資源推薦算法[7];李浩君等將協(xié)同過濾算法和二進制粒子群算法進行結合,提出了基于多維特征差異的個性化學習資源推薦算法[8];丁繼紅等基于張量理論實現了學習者和學習資源之間的精準匹配[9];姜宇等基于學習網頁的點擊流數據實現了學習資源推薦[10].

相關研究工作表明,自適應學習的推薦研究所用算法主要有:協(xié)同過濾算法、聚類算法、基于內容的推薦算法和蟻群算法等.但對于如何從異構信息網絡的角度來研究學習資源推薦,并使用異構信息網絡基于元路徑的相似性度量來設計推薦算法,這方面的研究目前還是處于初步探索階段.

2 問題研究框架

2.1 問題定義

定義 1.自適應學習系統(tǒng).自適應學習系統(tǒng)(Adaptive Learning System,簡稱ALS)是一種可針對個體學習者在學習過程中的差異而提供適合個體特征的學習支持系統(tǒng),該系統(tǒng)通過對學習者學習風格、認知水平等因素的綜合分析,為學習者營造出個性化的學習環(huán)境,以支持學習者在任何時間、地點都可以進行學習.常見的自適應學習系統(tǒng)依據學習者的學習風格和認知水平,向學習者推薦學習資源以實現對學習者個性化學習的支持.

定義 2.信息網絡[11].信息網絡是一個帶有對象類型映射函數φ:V→A和鏈接類型映射函數ψ:E→R的有向圖G=(V,E).其中,每個對象v∈V屬于一個特定的對象類型集合A:φ(v)∈A,每個鏈接e∈E屬于一個特定的關系類型R:ψ(e)∈R.

定義 3.異構信息網絡[11].如果對象類型滿足|A|>1或者關系類型滿足|R|>1,則該信息網絡為異構信息網絡(Heterogeneous Information Network,HIN).

ALS是一種HIN,圖1中的ALS涉及三類對象:學習者、課程知識和輔導老師.對象之間的關聯關系主要有:學習者學習課程知識,課程知識被學習者學習,輔導老師輔導學習者,學習者被輔導老師輔導,輔導老師引用課程知識,課程知識被輔導老師引用,課程知識前驅課程知識,課程知識后繼課程知識.

圖1 自適應系統(tǒng)網絡示意圖Fig.1 Adaptive system network diagram

定義 4.網絡模式[11].網絡模式是指帶有對象類型映射φ:V→A和鏈接類型映射ψ:E→R的異構信息網絡G=(V,E)的元模板,記為TG=(A,R).

圖2 自適應系統(tǒng)中的網絡模式Fig.2 Network mode in adaptive system

網絡模式描述了實體的類型及其二元聯系,為HIN提供了元層面(模式層)上的表示,加強了信息網絡的可理解性和可操作性.HIN的網絡模式限定了對象集合與對象間關系的類型約束,而這些約束使得HIN具有了半結構化的特點,對網絡語義的探究起著引導作用.通過分析ALS中對象和鏈接的類型,歸納得出ALS的網絡模式如圖2所示.

在HIN中,兩個對象通過不同路徑相關聯.如學習者之間的路徑可以是“學習者—課程知識—學習者”,“學習者—輔導老師—學習者”等.因為HIN中對象間的相似性是根據對象在網絡中的鏈接方式確定的,所以對ALS進行元路徑描述是確定本文推薦算法的重要依據.同時,不同的鏈接類型也代表了不同的語義.通過分析ALS中的鏈接類型,可給出幾個有代表性的元路徑實例,具體如表1所示,其中S代表學習者,K代表課程知識,T代表輔導老師.

表1 自適應系統(tǒng)中的元路徑含義列表Table 1 A list of meta path meanings in adaptive systems

定義 6.基于元路徑的相似性度量問題.基于元路徑的相似性度量是指使用HIN的原理計算兩個對象在特定元路徑上的語義相似性.不同的元路徑對應著不同的推薦服務,而語義相似性的計算是推薦算法的推薦依據,所以實現基于HIN的自適應學習推薦還要先進行元路徑的選擇,而元路徑的選擇取決于ALS的推薦需求.

相似度計算算法的輸入和輸出分別為:1)輸入方面:學習者、課程知識與輔導老師之間交互的有向圖(ALS中對象的異構信息網);2)輸出方面:ALS中對象間的相似性計算結果(學習者與課程知識的相似度、學習者與輔導老師的相似度等).

如果該資源越適合學習者當前的需求,則表示其關聯關系的相似度值就越大,因此推薦算法可使用相似度top-K的資源對象來做推薦服務.可描述這種關聯關系的一種有效手段即采用所謂的HIN,而這種關聯關系相似度計算就恰好可以規(guī)約為HIN中的語義距離計算.

2.2 研究框架

為了更好地實現自適應學習系統(tǒng)的基本設計目標,首先需要將學習者與課程知識之間的關聯關系刻畫出來,然后通過這種關聯關系的相似度計算來實現學習資源推薦.基于此思路,設計出的問題研究框架如圖3所示.

圖3的計算流程如下:

1)在獲取了學生信息、教學資源信息、學習記錄和輔導記錄后,自適應推薦引擎首先根據學習者的學習目標為其定位課程知識的學習范圍,初步篩選出適合學習者學習的知識單元集合φ;

2)根據規(guī)則匹配的內容對學習者與φ中的知識單元進行知識水平匹配、認知能力匹配,得到φ中所有知識單元最終的匹配值;

圖3 學習資源推薦問題的研究框架Fig.3 Research framework for learning resource recommendation

3)將學習者與φ中匹配值top-K的學習單元進行學習風格匹配,得出適合學習者學習風格的學習資源類型,并將具體類型的學習資源推薦給學習者;

4)記錄學習者的學習數據和輔導數據;

5)根據學習者、課程知識、輔導老師之間的交互信息,結合推薦需求選擇元路徑并計算對象間的相似度,根據相似度進行學習資源推薦;

6)迭代步驟4)及5)的計算活動.

3 構建模型

3.1 構建學習者模型

學習者模型描述了學習者內外部的學習特征,是實現學習分析工具的前提和基礎[13],其記錄了出現在計算系統(tǒng)中學習者的狀況,是學習者認知狀況的一種描述,是系統(tǒng)中學習者的抽象表示.理想的學習者模型應該包括學習者過去與學習相關的所有要素、課程學習中的進步狀態(tài)、學習類型以及其它所有與學習者相關的信息;同時,該模型允許系統(tǒng)儲存學習者的相關知識,以便于為學習者的個性化學習途徑提供選擇.本文根據學習者模型規(guī)范和學習者個性化特征所構建的學習者模型如圖4所示.

圖4 學習者模型Fig.4 Student model

3.2 構建領域知識模型

領域知識模型構建包括如下內容:知識層次結構的梳理、知識表示方法的設計和知識轉化關系的研究.

知識的層次結構將課程學習細分為一個個小的知識點的學習,不僅描述知識間的關聯關系,也建立了學習知識與學習資源之間映射關系.知識層次結構將與知識相關的目標、概念、關系、資源、測試、屬性等進行了清晰的劃分,為實現知識元素的分類存儲提供了指導.本文以知識點作為最小的課程內容學習單位,從目標層、概念層、關系層、任務層和實體層這五個層次對知識點表示進行了多層邏輯劃分,得到知識點的層次結構如圖5所示.

圖5 知識的層次結構圖Fig.5 Hierarchy of knowledge

知識的層次結構從多角度設計知識的邏輯結構,為實現學習系統(tǒng)對知識的查詢、管理和呈現等操作提供了方法.例如可使用n元組表示知識,其中包括:知識點所屬的學習目標范圍,其取值為課程教學要求中的各階段細化的學習目標;知識點的概念名稱可對不同的知識點起到了標記作用,實現了對知識點的查找;知識點關系可以通過前驅知識點與后繼知識點來表示;知識點難度用于將不同難度的知識點推薦給不同學習能力的學習者;知識點風格涉及理論型知識點、探索型知識點和應用型知識點等;知識點的學習時長;知識點對應的學習資源類型等.

知識之間的轉化關系可以使用貝葉斯知識跟蹤模型(Bavesian knowledge tramsing model,BKT)來描述[14].該模型為確定學習者知識掌握狀況提供了一個更加直觀的解決方法.例如可使用4個參數表示學習者進行知識學習時的狀態(tài),具體如表2所示.

表2 貝葉斯知識跟蹤模型的4個參數Table 2 Four parameters of BKT

根據貝葉斯知識跟蹤模型,可計算出學習者從已知某一知識點x的情況下,到掌握另一知識點y的概率:

(1)

其中,N表示知識點x到知識點y需要經歷的中間知識點個數,i表示從知識點x到知識點y的過程中所經歷到的第i個知識點.

4 學習資源推薦算法

實現學習資源的推薦依賴于對象間的相似性的度量,為此本文提出了基于元路徑計算兩個對象相似度的方法SimALS,并結合自適應學習的特點,給出了對包含“KK(知識點到知識點)”關系和“SK(學習者到知識點)”關系元路徑相似度計算的改進算法,并在此基礎上定義了學習資源推薦算法.

4.1 SimALS相似性度量

在計算兩個集合A和B的相似性時,可使用杰卡德相似性算法:

(2)

根據杰卡德相似性算法和頂點可達性原理,設計元路徑P=R1°R2° …°Rl上兩個物體s和t之間的相似度SimALS(s∈R1.S和t∈Rl.T)為:

(3)

其中O(s|R1)是物體s基于關系R1的外鄰域,I(t|Rl)是物體t基于關系Rl的內鄰域,R.S和R.T分別表示關系R的源對象類型和目標對象.

SimALS(s,t|P)是一種基于兩兩隨機游走的測量方法,當s沿著路徑移動時,t沿著相反方向移動,它評估s和t到達同一節(jié)點的概率.因為該算法使用了迭代的遞推方法,所以時間復雜度為O(nl/2),l為元路徑的長度.

s和t的移動過程如下:

4.2 基于“KK”關系改進的SimALS算法

SimALS(s,t|R1°R2° …°Rl)計算兩個對象s和t在元路徑P=R1°R2°…°Rl上的相似性,其算法原理是逐步迭代Oi(s|R1)和Ij(t|Rl),并累加每對Oi(s|R1)、Ij(t|Rl)的相似度之和.Oi(s|R1)和Ij(t|Rl)的相似度是通過判斷其是否為同一對象來確定的,計算結果為1和0.當使用4.1節(jié)描述的SimALS算法計算含有“KK”元路徑的兩個對象間相似度時,會將不同知識點的相似度按照0做處理.但在實際情況中,知識點間存在者前驅、后繼等聯系,不同的知識點間的相互轉化是有概率的.所以,對于自適應學習系統(tǒng)做推薦而言,4.1節(jié)的SimALS算法的局限性在于當計算含有“KK”的元路徑中對象的相似度時,忽略了知識點間的傳播(或轉化概率)信息.

針對SimALS在知識點轉化方面的局限性,本節(jié)使用貝葉斯知識跟蹤模型將知識點間的鏈接信息(轉化概率)引入至知識點間相似性的計算中.當?Ri=KK且i∈{1,2,…,l}時,相似性的計算如下:

(4)

其中,Mxy表示貝葉斯知識跟蹤模型中知識點轉化概率的鄰接矩陣M的第(x,y)項的取值,代表著從知識點x轉化為知識點y的轉化概率,其計算方法見公式1;Oi(s|R1)=x,Ij(t|Rl)=y.

4.3 基于“SK”關系改進的SimALS

對于推薦算法而言,用戶行為是能夠直接反應用戶喜好的依據,也是驗證一切推薦算法效果的主要參考,常常作為用戶對資源興趣程度的評分項.而自適應學習系統(tǒng)中學習者的行為信息,主要表現為學習者實時的學習反饋信息(主要包括:正在學習某一知識點、收藏某一知識點的內容、對某一知識點打標簽等).自適應學習系統(tǒng)通過實時地接收學習者的學習反饋信息,并根據學習者的學習狀況為學習者安排下一步的學習內容,以完成自適應推薦功能.由于學習者的學習反饋信息是實時收集的,具有熱門效應,對提高推薦算法的準確度十分有意義.所以,在計算含有“SK”的元路徑下兩物體的相似性時,需要考慮學習者與知識點間的反饋信息.為此,本節(jié)進一步提出具有這一功能的算法.

當?Ri=SK,且i∈{1,2,…,l}時,相似性的計算如下:

(5)

其中,λ=(a+b+c)/3表示學習者對于某一知識點的反饋信息量,a表示學習者是否正在學習某一知識點(若學習者正在學習某一知識點,則a=1;反之,a=0),b代表學習者是否收藏了某一知識點,c代表學習者是否對某一知識點打標簽.a、b、c∈{0,1},0≤λ<1.

4.4 基于HIN的資源推薦算法

基于HIN的資源推薦算法,是以學習者為推薦對象,所產生的推薦資源主要為知識點、輔導老師和學習者.結合上述基于元路徑的相似性算法,得到本文核心推薦算法如圖6所示.

基于HIN的學習資源推薦算法的實現過程是:首先選擇推薦資源的類型;其次根據基于元路徑的相似性算法計算學習者與所有該類型學習資源的語義相似度;然后對該相似度進行排名并將排名top-K的學習資源推薦給學習者.該算法的時間復雜度為O(n(len/2)+2),len為元路徑的長度閾值.

算法功能:向ALS中的學習者s推薦學習資源

輸入:學習者實例s;推薦資源類型T(知識點、輔導老師、學習者);推薦資源個數K;領域知識庫實例N;元路徑長度閾值len

輸出:與學習者相似度最高的K個T類型的學習資源

5 實證與分析

為了驗證本文所設計的基于HIN的自適應學習資源推薦算法的有效性和準確度,本文將從算法的分類準確率P(L)和平均排序分RS兩個角度進行實驗論證.

5.1 實驗數據

本文采集了國內某大學二年級某班的所有80名學習者在自適應學習系統(tǒng)中“數據結構”課程上9月份至10月份的學習數據,并通過量化手段從中抽取學習者信息庫、領域知識庫、輔導記錄庫三個方面所對應的數據集D1、D2、D3.

學習者信息庫、領域知識庫、輔導記錄庫記錄了自適應學習系統(tǒng)中學習者、領域知識、輔導老師這三個主要對象及其交互的所有信息,存儲了實現資源推薦算法的基礎數據.為了對推薦結果進行有效的驗證,可將上述數據集進行如下處理:(1)以月份分區(qū).將9月份的數據作為訓練集,10月份的數據作為測試集.使用學習者10月份的學習數據來驗證通過計算9月份學習數據所得的推薦序列的準確度;(2)以學習者分區(qū)(按學習者成績平均分配).將40名學習者的學習數據作為訓練集,來訓練知識點間的轉化概率.將另外40名學習者作為測試集,來驗證改進的推薦算法的有效性.

5.2 評價指標

推薦算法的準確度評價方法有多種,本文根據所設計的資源推薦算法的特點,從分類準確度和排序準確度兩個方面選擇相關指標來對推薦算法進行評價.

定義8.準確率.準確率是衡量推薦算法分類準確度的重要指標,是指推薦正確的信息條數占所有推薦信息條數的比例,即通過推薦算法產生的推薦資源中被學習者接受的推薦資源的比例.準確率的評價指標P(L)的計算方法見公式(6).

(6)

其中,N為學習者人數;Ii為第i個學習者所收到的推薦資源集合;|Ii|為資源集合Ii中的資源個數(設|Ii|=10,即向學習者推薦10個學習資源);Si為第i個學習者接受推薦資源的個數.

定義9.平均排序分.平均排序分是衡量推薦算法排序準確度的重要指標,該定義是指用戶需求的推薦資源在推薦算法所生成的推薦序列中的排名之和與推薦序列中所有資源的排名之和的比例.

在比較兩個推薦算法時,如果兩個算法推薦的n個推薦資源中都有m個資源是用戶需要的,那么兩者的推薦準確率都為m/n.但是在兩個推薦算法中,用戶需求的m個資源的排序并不相同.顯然,能夠使m個資源排名靠前的推薦算法更具有優(yōu)勢,所以本文使用排序準確度來衡量推薦算法的優(yōu)劣.排序準確度指標度量推薦算法所生成的推薦序列與用戶的需求序列的統(tǒng)一程度,可以通過使用平均排序分的方法來實現.平均排序分的評價指標RS(Average Rank Score)的計算方法見公式(7).

(7)

其中,U為推薦算法所產生的推薦資源集合;Ri為推薦資源i在推薦序列U中的排名;D為用戶所需求的推薦資源集合;Rj為用戶所需求的推薦資源j在U中的排序.平均排序分越低,則算法的準確度越高.采用平均排序分,不僅可以進一步對比本文所提出的推薦算法(SimALS1、SimALS2、SimALS3和SimALS4)之間的準確度,也可以實現將本文推薦算法與其他推薦算法作對比.

5.3 研究問題

為了區(qū)分兩種情況下改進的相似性方法和原始的相似性方法所產生的推薦算法,本文將以SimALS為相似性度量的推薦算法記為SimALS1,以基于“KK”關系改進的相似性度量的推薦算法記為SimALS2,以基于“SK”關系改進的相似性度量的推薦算法記為SimALS3,以同時融合了基于“KK”關系和“SK”關系的相似性度量的推薦算法記為SimALS4.

本文將學習資源推薦算法的有效性驗證細化為以下兩個研究問題.

Question1:比起一般的推薦算法,SimALS4是否會有更好的分類準確度和排序準確度?

本文使用推薦系統(tǒng)中最常用的協(xié)同過濾算法來與SimALS4進行推薦效果的比較,以判斷本文提出的學習資源推薦算法的有效性.

Question2:SimALS1、SimALS2、SimALS3、SimALS4的推薦準確度分別如何?

本文在SimALS1的基礎上針對不同的情況,提出了SimALS2、SimALS3和SimALS4.為了驗證改進之后的推薦算法是否會提高推薦的準確度,需要對SimALS1、SimALS2、SimALS3、SimALS4的推薦準確度進行比較分析.

5.4 實驗結果

Question1的實驗結果如圖7和圖8所示.圖7展示了基于用戶的協(xié)同過濾算法UserCF[15]與SimALS4算法的準確率對比結果.UserCF根據學習者各知識點的測試成績計算相似的學習者,并將相似學習者的偏好進行推薦.可以看到隨著推薦資源個數K逐漸增大,推薦算法的準確率也會逐漸降低,但本文所提出的學習資源推薦算法SimALS4的準確率均要高于UserCF準確率.

圖7 準確率對比(Question1)Fig.7 Comparison of P(L)(Question1)

圖8展示了基于物品的協(xié)同過濾算法ItemCF[15]與SimALS4算法的平均排序分對比結果.ItemCF將相似的知識點進行排名,并推薦給感興趣的學習者.可以看到隨著推薦資源個數K逐漸增大,推薦算法的平均排序分也會逐漸升高,但本文所提出的學習資源推薦算法SimALS4的平均排序分均要低于ItemCF的平均排序分.

圖8 平均排序分對比(Question1)Fig.8 Comparison of RS (Question1)

通過實驗對Question1的解答,可以得出結論:SimALS4比一般的推薦算法準確度更優(yōu)(較高的分類準確度和較低的排序準確度).

圖9 準確率對比(Question2)Fig.9 Comparison of P(L) (Question2)

Question2的實驗結果如圖9和圖10所示.圖9展示了SimALS1、SimALS2、SimALS3和SimALS4的準確率對比結果.可以看到,SimALS2、SimALS3、SimALS4的分類準確率均要高于SimALS1分類準確率,而SimALS4的準確率最高,SimALS2和SimALS3的準確率相差無幾.

圖10展示了SimALS1、SimALS2、SimALS3和SimALS4的平均排序分對比結果.可以看到,SimALS2、SimALS3、SimALS4的平均排序分均要低于SimALS1平均排序分,而SimALS4的平均排序分最低,SimALS2和SimALS3的平均排序分相差無幾.通過實驗對Question2的解答,可以得出結論.

圖10 平均排序分對比Fig.10 Comparison of RS (Question2)

1)對SimALS進行傳播信息和反饋信息改進后,所得到的基于“KK”關系、“SK”關系改進的推薦算法SimALS2、SimALS3在推薦準確度上有了較大的提高;

2)融合了基于“KK”關系和“SK”關系而改進的推薦算法SimALS4比SimALS2、SimALS3推薦準確度都高.所以,本文對于基于HIN的學習資源推薦算法的改進提高了原始算法的推薦準確度.

6 結 語

本文以自適應學習的學習資源推薦為研究方向,在實現自適應學習核心構建的過程中,結合HIN的語義相似性來設計推薦算法,以達到提高自適應學習推薦準確度的目的.進一步的研究內容是:

1)本文雖引入了學習反饋信息,但對各種反饋因素的比重和量化缺少更加深入的研究;

2)本文的學習資源推薦算法的設計省略隔離了學習診斷的過程,后續(xù)要結合學習診斷的相關方法加以改進.

猜你喜歡
相似性準確度排序
影響重力式自動裝料衡器準確度的因素分析
作者簡介
淺析當代中西方繪畫的相似性
恐怖排序
節(jié)日排序
12個毫無違和感的奇妙動物組合
基于隱喻相似性研究[血]的慣用句
論提高裝備故障預測準確度的方法途徑
Word中“郵件合并”功能及應用
對GB 17167實施過程中衡器準確度要求問題的探討
宁南县| 武威市| 尚志市| 尉犁县| 阿克陶县| 武安市| 海林市| 金秀| 佛冈县| 固镇县| 屏东县| 晋宁县| 贵溪市| 榆中县| 英山县| 宜兰市| 浮山县| 田阳县| 清徐县| 南昌市| 连州市| 金堂县| 山丹县| 凤翔县| 晋城| 化隆| 和硕县| 额敏县| 屏东县| 尼木县| 麻城市| 福州市| 延川县| 获嘉县| 方山县| 红安县| 五台县| 利川市| 石柱| 临猗县| 满洲里市|