葉根梅 吳志霞
摘要:針對目前大多高校網(wǎng)絡(luò)教學(xué)平臺教學(xué)資源呈現(xiàn)單一、不能根據(jù)學(xué)習(xí)者的學(xué)習(xí)軌跡進(jìn)行內(nèi)容推薦的弊端,研究關(guān)聯(lián)規(guī)則和Apriori算法,以及Apriori算法在網(wǎng)絡(luò)教學(xué)平臺中的應(yīng)用。運(yùn)用關(guān)聯(lián)規(guī)則挖掘獲取學(xué)習(xí)內(nèi)容相關(guān)的頁面集合,從而一定程度地優(yōu)化網(wǎng)站結(jié)構(gòu),并對學(xué)習(xí)者進(jìn)行個性化內(nèi)容推薦服務(wù),提高學(xué)習(xí)者的網(wǎng)絡(luò)平臺學(xué)習(xí)體驗(yàn)。
關(guān)鍵詞:關(guān)聯(lián)規(guī)則 Apriori 網(wǎng)絡(luò)教學(xué)
中圖分類號: TP434? ? ?文獻(xiàn)標(biāo)識碼:A? ? ? 文章編號:1009-3044(2019)01-0017-02
1 背景
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,各大高校陸續(xù)構(gòu)建自己的網(wǎng)絡(luò)教學(xué)平臺,以實(shí)現(xiàn)學(xué)習(xí)資源數(shù)字化、教學(xué)方式網(wǎng)絡(luò)化、學(xué)習(xí)方式多元化的網(wǎng)絡(luò)教學(xué)方式。但是,目前高校的網(wǎng)絡(luò)教學(xué)平臺普遍存在網(wǎng)絡(luò)資源呈現(xiàn)單一化特征,網(wǎng)站不能根據(jù)學(xué)習(xí)者的學(xué)習(xí)行為提供個性化的內(nèi)容推薦服務(wù)。因此,在教學(xué)平臺中,加入基于關(guān)聯(lián)規(guī)則的個性化內(nèi)容推薦對提升學(xué)生的學(xué)習(xí)體驗(yàn)和效果很有意義。
2 關(guān)聯(lián)規(guī)則挖掘
關(guān)聯(lián)規(guī)則挖掘最早用來發(fā)現(xiàn)超市交易數(shù)據(jù)中商品之間的關(guān)聯(lián)[1],近幾年在網(wǎng)站和移動應(yīng)用的個性化推薦系統(tǒng)中,如電子商務(wù)、新聞網(wǎng)站、社交等領(lǐng)域被廣泛應(yīng)用。通過關(guān)聯(lián)規(guī)則挖掘可以發(fā)現(xiàn)事務(wù)之間的聯(lián)系,提升信息篩選的效率,對于決策者和用戶來說,具有現(xiàn)實(shí)的意義,因此,關(guān)聯(lián)規(guī)則挖掘也作為數(shù)據(jù)挖掘一個重要的課題和方法被廣泛研究和應(yīng)用。
3 關(guān)聯(lián)規(guī)則在高校網(wǎng)絡(luò)教學(xué)平臺中的應(yīng)用
3.1 網(wǎng)絡(luò)教學(xué)平臺的關(guān)聯(lián)規(guī)則挖掘功能模型
網(wǎng)絡(luò)教學(xué)平臺中要實(shí)現(xiàn)學(xué)習(xí)者因人而異、按需學(xué)習(xí)的內(nèi)容自動推薦功能,運(yùn)用關(guān)聯(lián)規(guī)則,可建立如下功能模型,如圖1所示。
參照《WEB挖掘技術(shù)在網(wǎng)絡(luò)教學(xué)中的應(yīng)用研究》和精品課程論文。
在該模型中,服務(wù)器端記錄用戶訪問信息并存儲用戶日志數(shù)據(jù),包括用戶在教學(xué)平臺中的訪問內(nèi)容和行為,如頁面瀏覽內(nèi)容和時間、訪問路徑、超鏈接的點(diǎn)擊行為等。對這些數(shù)據(jù)進(jìn)行收集、預(yù)處理和規(guī)范化,構(gòu)成事務(wù)集,再運(yùn)用關(guān)聯(lián)規(guī)則挖掘技術(shù),挖掘出有價值的網(wǎng)頁集合,從而明確學(xué)習(xí)者的學(xué)習(xí)興趣和需求,根據(jù)關(guān)聯(lián)規(guī)則結(jié)果進(jìn)行個性化內(nèi)容推薦,方便學(xué)習(xí)者快速發(fā)現(xiàn)自己需要的學(xué)習(xí)內(nèi)容[2]。
3.2 關(guān)聯(lián)規(guī)則挖掘算法--Apriori算法
Apriori算法是關(guān)聯(lián)規(guī)則最成熟的算法,因其數(shù)據(jù)要求低、推導(dǎo)相對簡單,使其得到廣泛應(yīng)用。
設(shè)I={i1,i2,…,im},是m個不同的項目的集合, 長度為m的項集I稱為m-項集,T={T1,T2,…Tn}是與任務(wù)相關(guān)的事務(wù)的集合,每個事務(wù)Ti都是項集I的一個子集。假定X,Y均為項集,均是T的非空子集,且X和Y的交集不為空,則表示X和Y是相關(guān)聯(lián)的項集,項集X在某一事務(wù)中出現(xiàn),會導(dǎo)致Y以某一概率也會出現(xiàn)[3]。將蘊(yùn)含表達(dá)式X=>Y稱作T中的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則的強(qiáng)弱通過指標(biāo)支持度和置信度來衡量。事務(wù)集T中項目集X出現(xiàn)的次數(shù)count(X)與事務(wù)集T中事務(wù)總數(shù)|T|的百分比,稱作項目集X的支持度support(X),可通過以下計算公式獲得:
support(X)=[count(X)|T|]*100%
相應(yīng)地,關(guān)聯(lián)規(guī)則X=>Y的支持度support(X=>Y)的計算公式如下:
support(X=>Y)=[count(X?Y)|T|]*100%
事務(wù)集T中X、Y同時出現(xiàn)的次數(shù)與事務(wù)集T中項目集X出現(xiàn)的次數(shù)的百分比,稱作關(guān)聯(lián)規(guī)則X=>Y的置信度confidence(X=>Y),可通過以下計算公式獲得:
confidence(X=>Y)= [supportX?Y supportX]*100%
最小支持度minsup和最小置信度minconf是用戶設(shè)定的衡量支持度和置信度的一個閾值,如果關(guān)聯(lián)規(guī)則X=>Y的支持度support(X=>Y)和置信度confidence(X=>Y)大于等于用戶定義的最小支持度minsup和最小置信度minconf,則稱X=>Y為強(qiáng)關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則挖掘的目的就是找出強(qiáng)關(guān)聯(lián)規(guī)則。同時,對于項目集X,如果support(X)>= minsup,則X為頻繁項集。
3.3 運(yùn)用Apriori算法挖掘關(guān)聯(lián)規(guī)則
運(yùn)用Apriori算法實(shí)施數(shù)據(jù)挖掘主要分為兩步:
首先,找出事務(wù)數(shù)據(jù)庫中所有大于等于指定的最小支持度的頻繁項集,然后根據(jù)指定的最小置信度找出需要的關(guān)聯(lián)規(guī)則。
針對高校網(wǎng)絡(luò)教學(xué)課程,學(xué)生訪問網(wǎng)站不同頁面時,其訪問信息都將在網(wǎng)頁路徑中體現(xiàn)出來。 如用戶訪問http://localhost:8080/course/s20.php,然后又訪問http://localhost:8080/course/s23.php,并在這些頁面及其子頁面停留了一定的時間,表示用戶學(xué)習(xí)了頁面分別為s20.php和s23.php的兩門課程及其對應(yīng)的知識點(diǎn)資源。將用戶在網(wǎng)站訪問期間的頁面路徑暫存在用戶會話文件中,當(dāng)用戶離開網(wǎng)站時,將該信息作為用戶學(xué)習(xí)日志記錄表中的一條記錄保存起來。然后,對事務(wù)數(shù)據(jù)庫進(jìn)行預(yù)處理,運(yùn)用Apriori算法挖掘?qū)W生學(xué)習(xí)網(wǎng)絡(luò)課程的訪問日志,找出學(xué)生頻繁訪問的知識點(diǎn)頁面所在的網(wǎng)頁路徑,基于學(xué)生頻繁訪問的網(wǎng)頁路徑,找出頻繁項集,進(jìn)而進(jìn)行個性化內(nèi)容推薦[4]。
按照上述步驟,這里,抽取5個學(xué)生對網(wǎng)絡(luò)教學(xué)平臺課程訪問信息,表1記錄了其訪問網(wǎng)站的網(wǎng)頁路徑。
假設(shè)最小支持度minsup為3,最小置信度minconf為70%。Fk表示頻繁k-項集的集合,Ck表示產(chǎn)生FK項集的候選項集,算法的處理步驟如下:
對置信度進(jìn)行計算:
confidence(s3=>s4)=4/5=80%
confidence(s3=>s5=4/5=80%
confidence(s4=>s5)=3/4=75%
由此可見,{s3 s4 s5}是學(xué)習(xí)者訪問頻率較高的一種網(wǎng)頁組合,因此可以通過建立超鏈接的方式對這些頁面進(jìn)行關(guān)聯(lián),或者將該關(guān)聯(lián)規(guī)則存儲到關(guān)聯(lián)規(guī)則表中,提供學(xué)習(xí)者的訪問效率,實(shí)現(xiàn)網(wǎng)絡(luò)教學(xué)平臺的個性化推薦功能。
4 結(jié)束語
在高校網(wǎng)絡(luò)教學(xué)平臺中引入關(guān)聯(lián)規(guī)則,優(yōu)化網(wǎng)站課程結(jié)構(gòu),實(shí)現(xiàn)一定程度的教學(xué)內(nèi)容的個性化推薦,提升學(xué)習(xí)者的學(xué)習(xí)體驗(yàn),對高校網(wǎng)絡(luò)教學(xué)平臺的建設(shè)具有非?,F(xiàn)實(shí)的意義。
參考文獻(xiàn):
[1] 王濤偉, 楊愛民. 加權(quán)關(guān)聯(lián)規(guī)則研究及其在個性化推薦系統(tǒng)中的應(yīng)用[J]. 鄭州大學(xué)學(xué)報: 理學(xué)版, 2007(2): 65-69.
[2] 梁燕紅. WEB挖掘技術(shù)在網(wǎng)絡(luò)教學(xué)中的應(yīng)用研究[J]. 信息技術(shù)與信息化, 2017(9): 128.
[3] 盧小華, 劉靜. Apriori算法在網(wǎng)絡(luò)教學(xué)平臺自動推薦學(xué)習(xí)資源功能中的應(yīng)用[J]. 現(xiàn)代工業(yè)經(jīng)濟(jì)和信息化,2016(15): 101-102.
[4] 于華. 網(wǎng)站結(jié)構(gòu)優(yōu)化方案的設(shè)計與實(shí)現(xiàn)[J]. 現(xiàn)代計算機(jī), 2017(20): 82-84.