◎胡三寧
(河南科技大學(xué) 應(yīng)用工程學(xué)院,河南 三門(mén)峽 472000)
個(gè)性化推薦技術(shù)在學(xué)習(xí)資源共享系統(tǒng)中的應(yīng)用
◎胡三寧
(河南科技大學(xué) 應(yīng)用工程學(xué)院,河南 三門(mén)峽 472000)
為解決互聯(lián)網(wǎng)上日益增多的學(xué)習(xí)資源造成的信息超載,提高用戶信息使用效率,設(shè)計(jì)并實(shí)現(xiàn)了基于推薦的學(xué)習(xí)資源共享系統(tǒng)。論文首先闡述了系統(tǒng)的設(shè)計(jì)目標(biāo)及原則,進(jìn)而介紹了邏輯模型架構(gòu)與主要功能模塊的設(shè)計(jì),結(jié)合標(biāo)簽機(jī)制及社交網(wǎng)絡(luò)關(guān)系,提出了融合好友信任關(guān)系的混合推薦算法,并應(yīng)用于資源推薦過(guò)程中。實(shí)驗(yàn)表明,該算法具有一定的可行性,該系統(tǒng)可以提供有效的個(gè)性化推薦服務(wù)。
信息超載;標(biāo)簽;信任關(guān)系;混合推薦
隨著信息技術(shù)的發(fā)展和網(wǎng)絡(luò)的進(jìn)一步普及,網(wǎng)絡(luò)學(xué)習(xí)因其形式開(kāi)放、時(shí)空不受限及資源豐富等優(yōu)勢(shì),已逐漸成為教育教學(xué)體系中的重要組成部分[1]。經(jīng)歷函授、廣播電視教育及遠(yuǎn)程教育后,MOOK等也逐漸進(jìn)入人們的視野并被廣泛接受。但在全民學(xué)習(xí)如火如荼上演的同時(shí),伴隨而來(lái)的是新的問(wèn)題[2-4]:在終身學(xué)習(xí)熱潮不斷高漲的今天,如何避免“信息過(guò)載”,準(zhǔn)確、有效地在浩瀚的“數(shù)據(jù)海洋”中獲得相關(guān)資源?在時(shí)代節(jié)奏較快的今天,如何在海量良莠不齊的資源間,高效的選擇優(yōu)質(zhì)資源?
個(gè)性化推薦作為解決信息超載問(wèn)題的有效途徑之一[3-5],已廣泛應(yīng)用于電子商務(wù)領(lǐng)域。在網(wǎng)絡(luò)學(xué)習(xí)領(lǐng)域應(yīng)用研究中,很多學(xué)者對(duì)此進(jìn)行了大量有益的工作。文獻(xiàn)[6]提出了一種基于學(xué)習(xí)狀態(tài)匹配的相似學(xué)習(xí)者關(guān)聯(lián)發(fā)現(xiàn)算法,為社區(qū)學(xué)習(xí)者提供了有針對(duì)性的學(xué)習(xí)資源推薦;文獻(xiàn)[7]提出了一種基于決策樹(shù)和BP神經(jīng)網(wǎng)絡(luò)的混合推薦算法,按照學(xué)習(xí)模式進(jìn)行后繼知識(shí)預(yù)測(cè)及推薦;文獻(xiàn)[8]基于多代理、并結(jié)合Agent技術(shù)構(gòu)建混合推薦系統(tǒng);文獻(xiàn)[9]結(jié)合學(xué)習(xí)者特征及學(xué)習(xí)資源特征,采用協(xié)同過(guò)濾為學(xué)習(xí)者提供學(xué)習(xí)資源;文獻(xiàn)[10]通過(guò)構(gòu)建知識(shí)結(jié)構(gòu)圖,運(yùn)用IRT分析學(xué)習(xí)者差異,提出以PSO算法為基礎(chǔ)的推薦方法完成學(xué)習(xí)資源推薦。
筆者針對(duì)目前網(wǎng)絡(luò)學(xué)習(xí)中“信息過(guò)載”與“信息孤島”間、“大眾式服務(wù)”與“個(gè)性化需求”間存在的矛盾,結(jié)合社交網(wǎng)絡(luò)中的好友及其之間的信任關(guān)系,利用社會(huì)化標(biāo)簽標(biāo)注,設(shè)計(jì)并實(shí)現(xiàn)了基于推薦的學(xué)習(xí)資源共享系統(tǒng)。論文章節(jié)安排如下:第1節(jié)討論了系統(tǒng)的設(shè)計(jì)目標(biāo),第2、3節(jié)分別給出了系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)的詳細(xì)過(guò)程,并在第4節(jié)給出系統(tǒng)測(cè)試,最后總結(jié)全文。
通過(guò)設(shè)計(jì)針對(duì)學(xué)習(xí)資源的共享系統(tǒng),利用用戶的貢獻(xiàn)來(lái)上傳資源,并采用統(tǒng)一的數(shù)據(jù)格式保存,以期于系統(tǒng)內(nèi)匯聚大量的高質(zhì)量的資源,方便資源管理的同時(shí),減少用戶對(duì)目標(biāo)資源的檢索時(shí)間,使得網(wǎng)絡(luò)學(xué)習(xí)更加高效。作為主動(dòng)檢索的必要補(bǔ)充,結(jié)合聚類(lèi)分析及推薦技術(shù),向用戶提供個(gè)性化的資源推薦服務(wù),一方面進(jìn)一步提高了定位目的資源的準(zhǔn)確性與高效性,另一方面可以作為興趣發(fā)現(xiàn)的輔助手段,在滿足學(xué)習(xí)者對(duì)于網(wǎng)絡(luò)學(xué)習(xí)的個(gè)性化需求的同時(shí),發(fā)掘更多的用戶潛質(zhì),最大限度地促進(jìn)個(gè)人發(fā)展。系統(tǒng)具體設(shè)計(jì)目標(biāo)如下:
(1)實(shí)現(xiàn)對(duì)海量學(xué)習(xí)資源的統(tǒng)一管理。傳統(tǒng)的根據(jù)欄目或是分類(lèi)進(jìn)行的數(shù)據(jù)管理,無(wú)法應(yīng)對(duì)海量資源的實(shí)時(shí)管理及面向興趣的推薦需求。故在此基礎(chǔ)上引入標(biāo)簽及評(píng)價(jià),使資源貢獻(xiàn)者成為管理者、資源使用者成為評(píng)價(jià)者,在統(tǒng)一管理資源的同時(shí)為資源推薦提供必要的基礎(chǔ)數(shù)據(jù)。
(2)實(shí)現(xiàn)對(duì)目標(biāo)資源的快速、準(zhǔn)確檢索。搜索引擎作為用戶發(fā)起的主動(dòng)檢索行為,一定程度上反映了用戶近期的訴求,并對(duì)推薦具有較高的參考價(jià)值。而搜索引擎源于信息的全文檢索,依賴(lài)于文檔處理結(jié)果[11]。通過(guò)標(biāo)簽功能的引入,不但為信息檢索提供了必要的關(guān)鍵詞,而且簡(jiǎn)化了對(duì)非結(jié)構(gòu)化數(shù)據(jù)特征提取的處理。
(3)實(shí)現(xiàn)有效的個(gè)性化推薦。作為信息過(guò)載的解決方案,準(zhǔn)確的個(gè)性化推薦有助于用戶在過(guò)量信息中快速獲取對(duì)自己有用的部分,從而提高信息使用效率[5]。對(duì)系統(tǒng)而言,通過(guò)用戶及資源建模,進(jìn)行興趣相似度計(jì)算,完成針對(duì)用戶興趣的個(gè)性化推薦服務(wù),將被動(dòng)檢索變主動(dòng)推薦,最終提高用戶忠誠(chéng)度,有助于建立長(zhǎng)期穩(wěn)定的關(guān)系。
同時(shí),系統(tǒng)設(shè)計(jì)應(yīng)遵循的原則有:
(1)功能完備性:除了資源的統(tǒng)一管理、檢索服務(wù)及個(gè)性化推薦,系統(tǒng)還包括用戶及角色管理、權(quán)限管理、欄目管理、標(biāo)簽管理等。
(2)操作簡(jiǎn)便性:良好的交互體驗(yàn)可以提高用戶滿意度,在維系用戶關(guān)系的同時(shí),有利于更大的生態(tài)系統(tǒng)的構(gòu)建。
(3)推薦準(zhǔn)確性:個(gè)性化推薦旨在有針對(duì)性的滿足不同用戶的需求,而只有符合用戶興趣的推薦才是有意義的,即只有提高推薦準(zhǔn)確率才能使用戶對(duì)推薦產(chǎn)生依賴(lài)[4]。
(4)系統(tǒng)安全性:通過(guò)安全的身份認(rèn)證,保護(hù)用戶基礎(chǔ)數(shù)據(jù);結(jié)合角色及授權(quán)管理,實(shí)現(xiàn)不同功能模塊的權(quán)限管理。
(5)平臺(tái)開(kāi)放性:支持多種硬件平臺(tái)及操作系統(tǒng),支持通用的數(shù)據(jù)類(lèi)型,提供開(kāi)發(fā)的數(shù)據(jù)接口以滿足二次開(kāi)發(fā)。
2.1 系統(tǒng)總體設(shè)計(jì)
基于推薦的學(xué)習(xí)資源共享系統(tǒng)框架組織如圖1示:
圖1 系統(tǒng)框架示意
圖2 系統(tǒng)功能模塊
在數(shù)據(jù)層,采用XML技術(shù)及Database完成數(shù)據(jù)的存儲(chǔ),并結(jié)合EF以對(duì)象方式操作抽象數(shù)據(jù);支持層實(shí)現(xiàn)資源的標(biāo)注及評(píng)價(jià),并提供用戶建模;在業(yè)務(wù)邏輯層,除傳統(tǒng)CURD操作外,主要進(jìn)行用戶聚類(lèi)分析與內(nèi)容協(xié)同過(guò)濾,為推薦算法提供數(shù)據(jù)輸入;最終實(shí)現(xiàn)個(gè)性化推薦服務(wù)及系統(tǒng)管理。
2.2 主要功能設(shè)計(jì)
經(jīng)進(jìn)一步整合,系統(tǒng)主要功能模塊如圖2示:
2.2.1 用戶管理模塊
該模塊主要實(shí)現(xiàn)對(duì)注冊(cè)用戶及后臺(tái)用戶的管理。對(duì)于后臺(tái)用戶,系統(tǒng)管理員可以進(jìn)行添加、編輯、刪除用戶及修改密碼等操作。高級(jí)管理員除可添加(或刪除)低級(jí)管理員用戶外,也可針對(duì)低級(jí)用戶所屬的角色進(jìn)行修改,以進(jìn)行角色與權(quán)限管理。對(duì)于注冊(cè)用戶,管理員可針對(duì)其在系統(tǒng)內(nèi)發(fā)言的合法性進(jìn)行凍結(jié)及注銷(xiāo)等操作。
2.2.2 權(quán)限管理模塊
系統(tǒng)采用基于角色的用戶管理,故權(quán)限管理部分設(shè)計(jì)為面向“角色-模塊”二元組的權(quán)限分配。為更好地進(jìn)行訪問(wèn)控制及委托管理,系統(tǒng)引入了DETRBAC模型[12]進(jìn)行工作流管理。
2.2.3 系統(tǒng)管理模塊
系統(tǒng)管理主要提供系統(tǒng)的備份還原、日志管理及常規(guī)系統(tǒng)設(shè)置等。
2.2.4 內(nèi)容管理模塊
該模塊主要提供對(duì)資源、標(biāo)簽及評(píng)價(jià)等內(nèi)容的管理。系統(tǒng)內(nèi)資源以分類(lèi)組織,通過(guò)標(biāo)注標(biāo)簽作為資源關(guān)鍵詞,統(tǒng)一了結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)的特征提取。用戶貢獻(xiàn)資源的同時(shí)標(biāo)注資源,該標(biāo)簽從一定程度上反映了用戶興趣,并從側(cè)面為用戶興趣建模提供了基礎(chǔ)數(shù)據(jù)。
2.2.5 個(gè)性化推薦模塊
個(gè)性化推薦旨在提供滿足用戶興趣需求的有效資源。針對(duì)系統(tǒng)特點(diǎn),本文在文獻(xiàn)[13]提出的混合推薦算法的基礎(chǔ)上,結(jié)合社交網(wǎng)絡(luò)中的好友及其之間的信任關(guān)系,充分利用社會(huì)化標(biāo)簽標(biāo)注機(jī)制,進(jìn)行了個(gè)性化推薦方法設(shè)計(jì)與實(shí)現(xiàn),具體見(jiàn)第3節(jié)。
3.1 算法設(shè)計(jì)
文獻(xiàn)[13]提出了一種基于用戶興趣及標(biāo)簽相似度的混合推薦算法HAS_Com:構(gòu)建基于標(biāo)簽的用戶興趣模型,進(jìn)而通過(guò)計(jì)算與資源相似度可完成推薦,同時(shí)融合時(shí)間因素研究用戶興趣變化,提高了基于內(nèi)容的推薦中相似度計(jì)算的準(zhǔn)確率;根據(jù)用戶興趣相似度聚類(lèi)用戶,通過(guò)興趣的協(xié)同推薦可減少對(duì)評(píng)分矩陣的依賴(lài);結(jié)合用戶基本信息有望緩解冷啟動(dòng)問(wèn)題。HAS_Com獲取用戶興趣與資源特征間的相似度(S)的定義可具體描述為:
其中,Vres為資源的特征向量、Vu為用戶的興趣向量,Wj為用戶對(duì)標(biāo)簽的興趣權(quán)重,Tagj反映了用戶興趣是隨時(shí)間的變化。Sim為采用互信息衡量標(biāo)簽Tagi與Tagj間相似度:
而相關(guān)研究表明,用戶獲得的推薦往往是其信任網(wǎng)絡(luò)中與其距離較近的用戶評(píng)價(jià)較好的項(xiàng)目[14,15]。因此,系統(tǒng)在實(shí)現(xiàn)過(guò)程中,采用上述算法的同時(shí),設(shè)計(jì)并實(shí)現(xiàn)了用戶間好友關(guān)系的維護(hù),以融合社交網(wǎng)絡(luò)中好友間的信任關(guān)系,旨在提高推薦準(zhǔn)確率。
定義Wf(resi,uj)為資源resi被用戶uj好友推薦的權(quán)重,即描述用戶uj之好友是否對(duì)該資源感興趣,具體通過(guò)計(jì)算該資源被其好友推薦的數(shù)量在其好友間所有感興趣資源中所占的比例,如式(3):
其中,CresiIn(Guj)指資源resi出現(xiàn)在用戶uj好友關(guān)系圖中的次數(shù);r為在該關(guān)系圖中所有用戶推薦的資源數(shù)目之和。
故對(duì)于資源的特征向量Vres={Tag1,Tag2,…,Tagn}及用戶興趣向量Vu={
其中,Sim(Tagi,Tagj)計(jì)算標(biāo)簽Tagi與Tagj間相似度。
3.2 實(shí)驗(yàn)分析
利用系統(tǒng)數(shù)據(jù),從正確推薦數(shù)C、準(zhǔn)確率P、召回率R、推薦覆蓋率COV等[3,8]方面,給出算法HASR_Com與算法HAS_Com[13]的實(shí)驗(yàn)對(duì)比結(jié)果,具體如下表:
Top20實(shí)驗(yàn)結(jié)果表
由表可知,筆者提出的混合推薦算法在準(zhǔn)確率、召回率等方面,有了一定的提高;在推薦覆蓋率上,通過(guò)融合好友及信任關(guān)系,較有效地解決了因用戶興趣聚類(lèi)而造成的推薦多樣性較低的問(wèn)題。
融合信任關(guān)系的學(xué)習(xí)資源共享系統(tǒng)實(shí)現(xiàn)如圖3所示:系統(tǒng)根據(jù)資源與用戶興趣的匹配度、發(fā)布時(shí)間及其熱度等,分別給出了 “推薦資源”、“最新資源”及“熱門(mén)資源”等三種資源推薦方案,可在個(gè)性化推薦的基礎(chǔ)上,通過(guò)“熱門(mén)資源”推薦作為傳統(tǒng)無(wú)差別推薦的補(bǔ)充,也可根據(jù)“最新資源”推薦進(jìn)一步縮短新增資源被認(rèn)可的周期。
圖3 學(xué)習(xí)資源推薦示意
筆者結(jié)合社會(huì)化標(biāo)簽標(biāo)注,利用社交網(wǎng)絡(luò)中的好友及其之間的信任關(guān)系對(duì)推薦有效性的影響,改進(jìn)了協(xié)同過(guò)濾推薦算法,且實(shí)驗(yàn)表明該方法具有一定的可行性。在該方法的基礎(chǔ)上,設(shè)計(jì)并實(shí)現(xiàn)了基于推薦的學(xué)習(xí)資源共享系統(tǒng),經(jīng)測(cè)試,該系統(tǒng)可以有效地進(jìn)行資源推薦,達(dá)到了設(shè)計(jì)目標(biāo)。
[1]唐國(guó)菊.網(wǎng)絡(luò)學(xué)習(xí)資源個(gè)性化推薦系統(tǒng)的設(shè)計(jì)與開(kāi)發(fā)[D].西安:陜西師范大學(xué),2012.
[2]王萍,張際平.云計(jì)算與網(wǎng)絡(luò)學(xué)習(xí)[J].現(xiàn)代教育技術(shù),2008(11):81-84.
[3]朱郁筱,呂琳媛.推薦系統(tǒng)評(píng)價(jià)指標(biāo)綜述[J].電子科技大學(xué)學(xué)報(bào),2012(2):163-175.
[4]王國(guó)霞,劉賀平.個(gè)性化推薦系統(tǒng)綜述[J].計(jì)算機(jī)工程與應(yīng)用,2012(7):66-76.
[5]許海玲,吳瀟,李曉東,等.互聯(lián)網(wǎng)推薦系統(tǒng)比較研究[J].軟件學(xué)報(bào),2009(2):350-362.
[6]王志梅,楊帆.基于相似學(xué)習(xí)者發(fā)現(xiàn)的資源推薦系統(tǒng)[J].浙江大學(xué)學(xué)報(bào)(工學(xué)版),2006(10):1688-1691+1791.
[7]吳彥文,黃珍.混合算法用于學(xué)習(xí)資源的自動(dòng)推薦[J].計(jì)算機(jī)應(yīng)用與軟件,2008(12):202-203.
[8]吳兵,葉春明,陳信.基于多代理的個(gè)性化推薦學(xué)習(xí)系統(tǒng)[J].計(jì)算機(jī)工程,2010(15):256-258.
[9]葉樹(shù)鑫,何聚厚.協(xié)作學(xué)習(xí)中基于協(xié)同過(guò)濾的學(xué)習(xí)資源推薦研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2014,(10):63-66.
[10]楊超.基于粒子群優(yōu)化算法的學(xué)習(xí)資源推薦方法[J].計(jì)算機(jī)應(yīng)用,2014(5):1350-1353.
[11]查大元.個(gè)性化推薦系統(tǒng)的研究和實(shí)現(xiàn)[J].計(jì)算機(jī)應(yīng)用與軟件,2011(1):47-49.
[12]殷慧文,易俗.工作流系統(tǒng)中一種基于任務(wù)角色的委托模型[J].遼寧大學(xué)學(xué)報(bào)(自然科學(xué)版),2011(2):173-176.
[13]胡三寧.一種基于相似度的混合推薦方法[J].三門(mén)峽職業(yè)技術(shù)學(xué)院學(xué)報(bào),2015(2):140-144.
[14]李慧,馬小平,胡云,等.融合社會(huì)網(wǎng)絡(luò)與信任度的個(gè)性化推薦方法研究[J].計(jì)算機(jī)應(yīng)用研究,2014(3):808-810.
[15]羅辛,歐陽(yáng)元新,熊璋,等.通過(guò)相似度支持度優(yōu)化基于K近鄰的協(xié)同過(guò)濾算法[C]//Ndbc中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文,2010:1437-1445.
(責(zé)任編輯 卞建寧)
Application of Personalized Recommendation in Learning Resources Sharing System
HU Sanning
(Academic Affairs Office,Sanmenxia Polytechnic,Sanmenxia 472000,China)
TP311
B
1671-9123(2017)02-0140-05
2017-03-20
胡三寧(1983-),男,河南洛寧人,河南科學(xué)大學(xué)應(yīng)用工程學(xué)院、三門(mén)峽職業(yè)技術(shù)學(xué)院講師。