賀超波++付志文++劉海
摘 要:在線學(xué)習(xí)用戶(hù)難于快速有效發(fā)現(xiàn)感興趣的學(xué)習(xí)資源,從而影響了學(xué)習(xí)的積極性和主動(dòng)性。針對(duì)該問(wèn)題,本文設(shè)計(jì)了一種基于興趣社區(qū)的學(xué)習(xí)資源推薦模式,首先通過(guò)構(gòu)建基于社交網(wǎng)絡(luò)的在線學(xué)習(xí)服務(wù)為學(xué)習(xí)用戶(hù)提供交流協(xié)作以及學(xué)習(xí)資源評(píng)價(jià)環(huán)境,然后利用興趣社區(qū)挖掘技術(shù)發(fā)現(xiàn)興趣高度相似的用戶(hù)群體,最后基于相似用戶(hù)群體對(duì)目標(biāo)用戶(hù)進(jìn)行學(xué)習(xí)資源推薦。通過(guò)自主開(kāi)發(fā)基于社交網(wǎng)絡(luò)的在線課程服務(wù),對(duì)該推薦模式的應(yīng)用效果進(jìn)行了實(shí)際驗(yàn)證。
關(guān)鍵詞:學(xué)習(xí)資源推薦;興趣社區(qū);社交網(wǎng)絡(luò);在線學(xué)習(xí)
中圖分類(lèi)號(hào):G642 文獻(xiàn)標(biāo)志碼:B
一、引言
隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,在線學(xué)習(xí)服務(wù)由于可以提供不受時(shí)空限制以及自由獲取知識(shí)的學(xué)習(xí)環(huán)境,目前已越來(lái)越受到廣大教師和學(xué)生的歡迎,各大在線學(xué)習(xí)服務(wù)吸引了眾多教師建立在線課程,注冊(cè)的學(xué)習(xí)用戶(hù)數(shù)量也增長(zhǎng)迅速。例如,國(guó)外三大主流在線學(xué)習(xí)服務(wù)平臺(tái):Coursera、edX和Udacity的各類(lèi)在線課程在2013年就已吸引了遍布全球220多個(gè)國(guó)家的600多萬(wàn)名學(xué)習(xí)者[1],國(guó)內(nèi)具有代表性的在線學(xué)習(xí)服務(wù)平臺(tái):國(guó)家精品課程資源網(wǎng)、中國(guó)大學(xué)精品開(kāi)放課程網(wǎng)(icourse)、MOOC學(xué)院、學(xué)堂在線以及騰訊課堂等在各自網(wǎng)站上公布的選課人數(shù)也已經(jīng)達(dá)到百萬(wàn)級(jí)別。各大在線學(xué)習(xí)服務(wù)高速發(fā)展的同時(shí),也積累了海量的學(xué)習(xí)資源,以國(guó)家精品課程資源網(wǎng)為例,截止到2016年11月,該網(wǎng)站包含教學(xué)視頻、課件以及試題等學(xué)習(xí)資源的數(shù)量已超過(guò)130萬(wàn)個(gè)。面對(duì)數(shù)量如此龐大的學(xué)習(xí)資源,學(xué)習(xí)用戶(hù)很容易遭遇“資源過(guò)載”的問(wèn)題:為了查找與學(xué)習(xí)相關(guān)、感興趣的學(xué)習(xí)資源,往往需要付出大量時(shí)間和精力,這嚴(yán)重影響了學(xué)習(xí)用戶(hù)進(jìn)行在線學(xué)習(xí)的積極性和主動(dòng)性。
如何為廣大學(xué)習(xí)用戶(hù)主動(dòng)推薦高質(zhì)量的學(xué)習(xí)資源已成為各大在線學(xué)習(xí)服務(wù)提供商以及研究人員共同關(guān)注的熱點(diǎn)話(huà)題[2]。例如,具有代表性的中國(guó)大學(xué)精品開(kāi)放課程網(wǎng)能夠根據(jù)學(xué)習(xí)用戶(hù)的基本信息和學(xué)習(xí)行為實(shí)時(shí)推薦相關(guān)課程資源,包括熱門(mén)課程、教師、學(xué)習(xí)小組等,但推薦結(jié)果與學(xué)習(xí)用戶(hù)興趣愛(ài)好的匹配不夠準(zhǔn)確,學(xué)習(xí)資源的選取與推送存在盲點(diǎn),系統(tǒng)不能夠精準(zhǔn)地感知學(xué)習(xí)情境來(lái)有效推薦適合學(xué)習(xí)用戶(hù)的個(gè)性化優(yōu)質(zhì)資源,其個(gè)性化推薦服務(wù)模式還需要不斷改進(jìn)。目前在線社交網(wǎng)絡(luò)(Online Social Network, OSN)已成為互聯(lián)網(wǎng)應(yīng)用熱點(diǎn),廣大互聯(lián)網(wǎng)用戶(hù)通過(guò)OSN加強(qiáng)了人與人之間的聯(lián)系,形成了虛擬網(wǎng)絡(luò)世界中數(shù)量眾多的興趣社區(qū)。興趣社區(qū)中的用戶(hù)聯(lián)系更加緊密,興趣更加相似,信息資源在興趣社區(qū)中可以得到更廣泛、更快速和更準(zhǔn)確的傳播,這為改進(jìn)現(xiàn)有在線學(xué)習(xí)資源推薦模式提供了新的途徑。為此,本文設(shè)計(jì)了一種基于OSN興趣社區(qū)的學(xué)習(xí)資源推薦模式,目的在于提高在線學(xué)習(xí)用戶(hù)的學(xué)習(xí)資源獲取質(zhì)量和效率,并提高學(xué)習(xí)的積極性和主動(dòng)性。
二、基于興趣社區(qū)的學(xué)習(xí)資源推薦模式
1.模式框架設(shè)計(jì)
基于興趣社區(qū)的學(xué)習(xí)資源推薦模式需要利用用戶(hù)的OSN信息以及資源偏好信息,其首先通過(guò)構(gòu)建基于OSN的在線學(xué)習(xí)服務(wù),為學(xué)習(xí)用戶(hù)提供交流協(xié)作、資源分享以及資源評(píng)價(jià)功能,然后在形成用戶(hù)關(guān)系網(wǎng)絡(luò)的基礎(chǔ)上,通過(guò)挖掘興趣社區(qū)對(duì)學(xué)習(xí)用戶(hù)進(jìn)行興趣特征建模,最后應(yīng)用排序算法形成學(xué)習(xí)資源推薦列表。推薦模式的整體框架設(shè)計(jì)如圖1所示。
圖1所示的模式框架包括三大組成部分,分別為:①面向在線學(xué)習(xí)的OSN服務(wù)。OSN服務(wù)用于促進(jìn)學(xué)習(xí)用戶(hù)關(guān)系網(wǎng)絡(luò)的形成,為學(xué)習(xí)資源推薦提供可以利用的用戶(hù)OSN信息。該服務(wù)基于Web2.0的技術(shù)規(guī)范以及OSN服務(wù)建設(shè)標(biāo)準(zhǔn)進(jìn)行設(shè)計(jì)與開(kāi)發(fā), 并結(jié)合在線學(xué)習(xí)的需求提供學(xué)習(xí)用戶(hù)在信息分享、互動(dòng)交流以及群組協(xié)作支持等方面的功能,可以為在線學(xué)習(xí)用戶(hù)進(jìn)行協(xié)作式學(xué)習(xí)提供支持環(huán)境。②基于OSN的在線學(xué)習(xí)服務(wù)。在線學(xué)習(xí)服務(wù)為用戶(hù)提供學(xué)習(xí)資源服務(wù)環(huán)境,該服務(wù)參照目前流行的“慕課”服務(wù)模式進(jìn)行設(shè)計(jì),包含課程信息、課程動(dòng)態(tài)、學(xué)習(xí)用戶(hù)管理以及學(xué)習(xí)資源等基本功能,并基于OSN提高在線學(xué)習(xí)服務(wù)的互動(dòng)能力,尤其是用戶(hù)與用戶(hù)、用戶(hù)與學(xué)習(xí)資源之間的交互。此外,通過(guò)提供學(xué)習(xí)資源的評(píng)價(jià)功能,可以獲取學(xué)習(xí)用戶(hù)的學(xué)習(xí)資源偏好信息。③學(xué)習(xí)資源推薦服務(wù)。該服務(wù)是學(xué)習(xí)資源推薦模式的核心組成部分,通過(guò)用戶(hù)關(guān)系網(wǎng)絡(luò)挖掘興趣社區(qū),可以發(fā)現(xiàn)興趣社區(qū)內(nèi)的高度相似用戶(hù)群體并結(jié)合學(xué)習(xí)資源評(píng)分信息進(jìn)行學(xué)習(xí)資源推薦列表生成以及推薦排序等。此外,還可以利用用戶(hù)的反饋信息不斷改進(jìn)推薦服務(wù)質(zhì)量。學(xué)習(xí)資源推薦服務(wù)的實(shí)現(xiàn)流程如圖2所示。
由圖2可以看出學(xué)習(xí)資源推薦流程涉及從數(shù)據(jù)采集到推薦排序等多個(gè)步驟,其中興趣社區(qū)挖掘、用戶(hù)相似性計(jì)算及學(xué)習(xí)資源評(píng)分預(yù)測(cè)是學(xué)習(xí)資源推薦的重要組成部分,下面將分別介紹這三大部分的具體實(shí)現(xiàn)過(guò)程。
2.學(xué)習(xí)用戶(hù)興趣社區(qū)挖掘
通過(guò)OSN服務(wù),學(xué)習(xí)用戶(hù)之間可以建立起好友關(guān)系,實(shí)現(xiàn)動(dòng)態(tài)關(guān)注以及資源分享。隨著用戶(hù)的增多以及好友關(guān)系的不斷建立,在線學(xué)習(xí)服務(wù)的好友關(guān)系網(wǎng)絡(luò)也將不斷增長(zhǎng)并且具有明顯的聚集結(jié)構(gòu),具有相同學(xué)習(xí)興趣的用戶(hù)聯(lián)系密集,具有不同學(xué)習(xí)興趣的用戶(hù)聯(lián)系稀疏,即好友關(guān)系網(wǎng)絡(luò)存在各種各樣的興趣社區(qū)。通過(guò)挖掘興趣社區(qū),可以發(fā)現(xiàn)社區(qū)內(nèi)具有高度興趣相似度的用戶(hù)。例如,圖3給出了一個(gè)學(xué)習(xí)用戶(hù)好友關(guān)系網(wǎng)絡(luò)示例,其中共有7個(gè)用戶(hù)節(jié)點(diǎn):u1,u2,u3,u4,u5,u6及u7,可以看出u1,u2,u3及u4作為興趣社區(qū)1的成員彼此之間聯(lián)系密集,u5,u6及u7作為興趣社區(qū)2的成員彼此之間也聯(lián)系密集,但不同興趣社區(qū)之間的用戶(hù)聯(lián)系稀疏。
為有效挖掘?qū)W習(xí)用戶(hù)好友關(guān)系網(wǎng)絡(luò)存在的興趣社區(qū),本文采用基于非負(fù)矩陣分解(Nonnegative matrix factorization,NMF)的社區(qū)挖掘模型[3]進(jìn)行處理。首先學(xué)習(xí)用戶(hù)好友關(guān)系網(wǎng)絡(luò)可以建模為無(wú)向無(wú)權(quán)圖,其對(duì)應(yīng)的鄰接矩陣X=[xij]n×n,其中n為用戶(hù)數(shù)量,當(dāng)任意兩個(gè)用戶(hù)ui和uj存在好友關(guān)系時(shí),xij=0,否則,可知X為非負(fù)值矩陣。假設(shè)社區(qū)挖掘數(shù)目為k,可構(gòu)建基于NMF的社區(qū)挖掘模型:
minX-HHT2F(1)
其中F為Frobenius范數(shù),H為n×k的非負(fù)矩陣,對(duì)于任意一個(gè)元素hil∈H可以表示為用戶(hù)i與社區(qū)l的歸屬?gòu)?qiáng)度。實(shí)際操作中,H可以通過(guò)文獻(xiàn)[3]提出的迭代近似優(yōu)化方法求解,各個(gè)興趣社區(qū)可以通過(guò)判斷成員與社區(qū)對(duì)應(yīng)的矩陣元素大小獲得。例如,對(duì)于圖3所示的學(xué)習(xí)用戶(hù)好友關(guān)系網(wǎng)絡(luò)示例,其對(duì)應(yīng)的興趣社區(qū)挖掘過(guò)程如圖4所示,最終挖掘結(jié)果與圖3是一致的。
3.學(xué)習(xí)用戶(hù)相似性計(jì)算及學(xué)習(xí)資源評(píng)分預(yù)測(cè)
由于同一個(gè)興趣社區(qū)內(nèi)的成員之間存在較高的興趣相似度,對(duì)學(xué)習(xí)資源有共同的偏好,因此可以綜合屬于同一個(gè)社區(qū)的成員對(duì)某一個(gè)學(xué)習(xí)資源的評(píng)分信息,形成目標(biāo)用戶(hù)對(duì)該學(xué)習(xí)資源的評(píng)分預(yù)測(cè)。當(dāng)預(yù)測(cè)的評(píng)分較高時(shí),則可以向目標(biāo)用戶(hù)推薦該學(xué)習(xí)資源。為方便量化用戶(hù)對(duì)學(xué)習(xí)資源的評(píng)分,在基于OSN的在線學(xué)習(xí)服務(wù)中,可以提供用戶(hù)對(duì)學(xué)習(xí)資源的評(píng)分互動(dòng)功能。如可以采用1-5分制,用于表達(dá)用戶(hù)對(duì)學(xué)習(xí)資源的評(píng)價(jià)等級(jí),分值越大代表用戶(hù)對(duì)該學(xué)習(xí)資源的興趣度越高。假設(shè)學(xué)習(xí)資源集合為{I1,I2,…Im},其中m為學(xué)習(xí)資源數(shù)量,用戶(hù)ui對(duì)學(xué)習(xí)資源Ij的評(píng)分表示為Rij,ui所在的興趣社區(qū)表示為C,則預(yù)測(cè)用戶(hù)ui對(duì)未評(píng)價(jià)的學(xué)習(xí)資源Ij的評(píng)分可以按照如下公式計(jì)算:
■ij=Ri+(■sim(i,p)(Rpj-Rp))/■sim(i,p)(2)
其中Ri和Rp分別表示用戶(hù)ui和up已有評(píng)分的平均值,sim(i,p)=■i·■p表示為用戶(hù)ui和up的相似度,其中ui和upi均屬于同一個(gè)社區(qū)C,hi和hp分別為用戶(hù)ui和up在H中對(duì)應(yīng)的行向量。通過(guò)應(yīng)用公式2可計(jì)算得到用戶(hù)ui預(yù)測(cè)評(píng)分較高的學(xué)習(xí)資源,并為提供最終的學(xué)習(xí)資源推薦列表。例如,假設(shè)在線學(xué)習(xí)服務(wù)中具有5個(gè)學(xué)習(xí)資源{I1,I2,I3,I4,I5},圖3所示的用戶(hù)已有的評(píng)分信息如表1所示,其中“?”表示為待預(yù)測(cè)的評(píng)分。
根據(jù)圖4所示的興趣社區(qū)挖掘結(jié)果,與、以及處于同一個(gè)社區(qū),可以計(jì)算,,,,,以及。根據(jù)公式(2),可以計(jì)算對(duì)于、以及的預(yù)測(cè)評(píng)分分別為:,以及,因此最終為推薦的學(xué)習(xí)資源排序列表為:,以及。
三、應(yīng)用效果分析
作者研究團(tuán)隊(duì)在已開(kāi)發(fā)的學(xué)術(shù)OSN:學(xué)者網(wǎng)(http://www.scholat.com)基礎(chǔ)上,進(jìn)一步開(kāi)發(fā)了學(xué)者網(wǎng)在線課程服務(wù),可以為廣大教師、學(xué)生用戶(hù)提供基于OSN的在線課程學(xué)習(xí)環(huán)境。目前,學(xué)者網(wǎng)在線課程服務(wù)具有的功能如圖5所示,截止到2016年11月,該在線課程服務(wù)共吸引了來(lái)自中山大學(xué)、武漢大學(xué)以及四川大學(xué)等132所高校的5萬(wàn)多名注冊(cè)用戶(hù)使用,共創(chuàng)建有覆蓋多個(gè)學(xué)科的790門(mén)課程以及積累了10萬(wàn)多件各種類(lèi)型的學(xué)習(xí)資源。
學(xué)者網(wǎng)學(xué)習(xí)用戶(hù)通過(guò)OSN提供的“加為好友”功能可以建立好友關(guān)系網(wǎng)絡(luò),實(shí)現(xiàn)實(shí)時(shí)關(guān)注各自最新動(dòng)態(tài)以及分享學(xué)習(xí)資源。此外,通過(guò)在線課程提供的學(xué)習(xí)資源評(píng)價(jià)功能,學(xué)習(xí)用戶(hù)還可以對(duì)各類(lèi)學(xué)習(xí)資源進(jìn)行評(píng)分以及評(píng)論。通過(guò)近2年的實(shí)際運(yùn)行,學(xué)者網(wǎng)在線課程用戶(hù)已形成了一定規(guī)模的好友關(guān)系網(wǎng)絡(luò)以及積累了豐富的學(xué)習(xí)資源評(píng)價(jià)數(shù)據(jù),這為進(jìn)行基于興趣社區(qū)的學(xué)習(xí)資源推薦提供了理想的應(yīng)用環(huán)境。為驗(yàn)證本文推薦模式的實(shí)際應(yīng)用效果,在學(xué)者網(wǎng)在線課程服務(wù)平臺(tái)上進(jìn)行了實(shí)證研究,采用用戶(hù)問(wèn)卷調(diào)查的方式對(duì)推薦效果進(jìn)行評(píng)價(jià),實(shí)際發(fā)放問(wèn)卷120份,回收120份,有效回收率100%,具體問(wèn)卷調(diào)查的內(nèi)容及統(tǒng)計(jì)結(jié)果如表2所示。
在表2中,問(wèn)題1、問(wèn)題2以及問(wèn)題3主要用來(lái)評(píng)測(cè)本文推薦模式的推薦準(zhǔn)確度,調(diào)查結(jié)果發(fā)現(xiàn)有95.3%的受訪用戶(hù)認(rèn)為學(xué)習(xí)資源推薦服務(wù)提供了感興趣的學(xué)習(xí)資源,同時(shí)有92.1%的用戶(hù)使用了推薦的學(xué)習(xí)資源,另外有91.5%的用戶(hù)認(rèn)為推薦排序結(jié)果是合理的,這些數(shù)據(jù)都說(shuō)明本文推薦模式具有較高的推薦準(zhǔn)確度。問(wèn)題4用于評(píng)測(cè)本文推薦模式是否可以感知用戶(hù)興趣的變化并做出相應(yīng)推薦,由于本文采用基于興趣社區(qū)挖掘的推薦策略,可以較好地獲取到學(xué)習(xí)用戶(hù)在不同學(xué)習(xí)時(shí)期所處的興趣社區(qū),因此具有感知用戶(hù)興趣變化的特性,實(shí)際的調(diào)查結(jié)果也有93.2%的用戶(hù)表示認(rèn)同。問(wèn)題5用于評(píng)測(cè)用戶(hù)對(duì)學(xué)習(xí)資源推薦服務(wù)的信任程度,結(jié)果發(fā)現(xiàn)有86.6%的用戶(hù)都主要通過(guò)推薦服務(wù)獲取感興趣的學(xué)習(xí)資源,這說(shuō)明了本文提出的推薦模式能夠切實(shí)有效幫助用戶(hù)“過(guò)濾”海量學(xué)習(xí)資源,相應(yīng)的推薦服務(wù)已成為了用戶(hù)經(jīng)常使用的學(xué)習(xí)資源獲取工具。
四、結(jié)束語(yǔ)
本文在基于OSN構(gòu)建在線學(xué)習(xí)服務(wù)的基礎(chǔ)上,設(shè)計(jì)了一種基于興趣社區(qū)的在線學(xué)習(xí)資源推薦模式,實(shí)際應(yīng)用分析表明該模式具有較好的推薦效果,可以為學(xué)習(xí)用戶(hù)提供高質(zhì)量的學(xué)習(xí)資源推薦服務(wù)。此外,本文相關(guān)研究結(jié)果無(wú)論是在理論還是應(yīng)用層面都具有積極意義,具體表現(xiàn)在:①通過(guò)研究利用OSN在用戶(hù)群組、協(xié)作交互以及資源分享具有的獨(dú)特優(yōu)勢(shì)構(gòu)建在線學(xué)習(xí)服務(wù),不僅可以形成一種基于OSN的在線協(xié)作式學(xué)習(xí)環(huán)境構(gòu)建模式,而且還可以進(jìn)一步豐富目前在線學(xué)習(xí)服務(wù)的構(gòu)建形式。②通過(guò)研究基于興趣社區(qū)的在線學(xué)習(xí)資源推薦模式,可以探索OSN的集體智慧對(duì)學(xué)習(xí)資源推薦的影響機(jī)制,相關(guān)研究結(jié)果將是對(duì)現(xiàn)有在線學(xué)習(xí)資源推薦研究框架的一次有益拓展。(3)通過(guò)開(kāi)展基于興趣社區(qū)的在線學(xué)習(xí)資源推薦模式的實(shí)際應(yīng)用,不僅可為各類(lèi)在線學(xué)習(xí)服務(wù)的學(xué)習(xí)資源建設(shè)提供支持,而且還可以在不同領(lǐng)域的開(kāi)放式學(xué)習(xí)資源平臺(tái)中進(jìn)行應(yīng)用,研究成果具有較強(qiáng)的普適性以及推廣價(jià)值。
參考文獻(xiàn):
[1]袁莉,斯蒂芬·鮑威爾,馬紅亮.大規(guī)模開(kāi)放在線課程的國(guó)際現(xiàn)狀分析[J].開(kāi)放教育研究,2013,19(3):56-62+84.
[2]劉靜,熊才平,丁繼紅,等.教育信息資源個(gè)性化推薦服務(wù)模式研究[J].中國(guó)遠(yuǎn)程教育,2016(2):5-9.
[3]賀超波,湯庸,沈玉利等.應(yīng)用非負(fù)值矩陣分解模型的社區(qū)挖掘方法[J].小型微型計(jì)算機(jī)系統(tǒng),2014,35(6):1275-1280.
(編輯:王曉明)