郝耀軍+郭玉鳳+趙青杉
摘 要:傳統(tǒng)在線學(xué)習(xí)共同體的構(gòu)建過分依賴用戶的自組織性,忽視了用戶的興趣偏好特征,放任了海量信息中用戶自組織的盲目性。因此,根據(jù)學(xué)習(xí)者在網(wǎng)絡(luò)活動(dòng)中的學(xué)習(xí)行為信息,計(jì)算用戶對(duì)學(xué)習(xí)內(nèi)容的偏好程度,最后利用協(xié)同過濾技術(shù),在改進(jìn)用戶興趣相似度計(jì)算方法的基礎(chǔ)上推薦組成學(xué)習(xí)共同體。通過實(shí)際應(yīng)用,驗(yàn)證了該方法能建立有效的虛擬網(wǎng)絡(luò)學(xué)習(xí)共同體,獲得更好的學(xué)習(xí)效果。
關(guān)鍵詞:興趣相似度;學(xué)習(xí)共同體;網(wǎng)絡(luò)學(xué)習(xí);協(xié)同過濾
中圖分類號(hào):G434 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1673-8454(2015)17-0020-04z
引言
互聯(lián)網(wǎng)的快速發(fā)展和不斷普及,使在線信息成為知識(shí)的重要來源,人們的學(xué)習(xí)觀念也已發(fā)生巨大改變,“從認(rèn)為學(xué)習(xí)是學(xué)習(xí)者個(gè)體的知識(shí)建構(gòu)的過程逐漸轉(zhuǎn)向?yàn)閷W(xué)習(xí)是學(xué)習(xí)者參與社會(huì)群組互動(dòng)并完成知識(shí)意義建構(gòu)的學(xué)習(xí)觀”[1]。個(gè)人學(xué)習(xí)模式已不能有效滿足個(gè)人需求與社會(huì)認(rèn)知的需要,基于互聯(lián)網(wǎng)的虛擬社區(qū)應(yīng)用催生了各種各樣的學(xué)習(xí)社區(qū)?!疤摂M學(xué)習(xí)共同體是信息技術(shù)環(huán)境下群體協(xié)作、群體智慧創(chuàng)造與分享的必然結(jié)果,虛擬社區(qū)為信息的快速傳播、知識(shí)的分享與集體智慧的創(chuàng)造提供了溝通與互動(dòng)的平臺(tái)?!盵1]
國(guó)內(nèi)外的學(xué)者對(duì)此展開了廣泛的研究,盧強(qiáng)[2]對(duì)近10多年來國(guó)內(nèi)學(xué)習(xí)共同體研究進(jìn)展情況進(jìn)行分析和總結(jié),指出“國(guó)內(nèi)學(xué)習(xí)共同體領(lǐng)域主要關(guān)注學(xué)習(xí)共同體的基本理論、具體應(yīng)用以及組織策略,研究熱點(diǎn)中,學(xué)習(xí)共同體在教師專業(yè)發(fā)展領(lǐng)域的應(yīng)用和網(wǎng)絡(luò)學(xué)習(xí)共同體方面問題突出?!?關(guān)于學(xué)習(xí)共同體的構(gòu)建研究,范玉鳳[3]等對(duì)虛擬學(xué)習(xí)共同體的構(gòu)成要素進(jìn)行了分析,探討了基于活動(dòng)理論建構(gòu)虛擬學(xué)習(xí)共同體的設(shè)計(jì)理念、方法和運(yùn)行機(jī)制,并依據(jù)七個(gè)要素設(shè)計(jì)了一個(gè)虛擬學(xué)習(xí)共同體的架構(gòu)原型。胡小勇[4]則研究了創(chuàng)建優(yōu)秀網(wǎng)絡(luò)學(xué)習(xí)共同體的實(shí)踐策略,并且總結(jié)了一個(gè)基于博客平臺(tái)的網(wǎng)絡(luò)學(xué)習(xí)共同體的實(shí)踐效果。在國(guó)內(nèi)實(shí)踐應(yīng)用中,孫娟[5]等通過QQ群進(jìn)行了網(wǎng)絡(luò)學(xué)習(xí)共同體在實(shí)際教學(xué)中的應(yīng)用研究;萬力勇[6]探討了基于QQ群的網(wǎng)絡(luò)學(xué)習(xí)共同體社會(huì)互動(dòng)的機(jī)制,并從互動(dòng)頻率、互動(dòng)深度、互動(dòng)方式和互動(dòng)信任度等方面進(jìn)行了分析;楊洪剛[7]等人則從成員角色變化的角度分析了基于SNS的學(xué)習(xí)共同體的構(gòu)建過程。
在國(guó)外,這方面的一些研究包括:Judy Sheard[8]研究了建立虛擬學(xué)習(xí)社區(qū)和管理共同體的方法和策略,指出計(jì)算機(jī)作為中介的協(xié)作學(xué)習(xí)會(huì)越來越頻繁,遠(yuǎn)遠(yuǎn)超過了對(duì)其理論的研究進(jìn)度,在共同體的構(gòu)建和管理中需要更多的技巧與策略。在實(shí)踐中,賓州州立大學(xué)運(yùn)用“生活—學(xué)習(xí)社區(qū)”引導(dǎo)學(xué)生廣泛參與,在操作能力、記憶力、課堂參與度、學(xué)術(shù)能力等方面卓有成效。[9] Mary Beth Rosson等人[10]基于Facebook構(gòu)建了一個(gè)稱之為“wConnect”的學(xué)習(xí)社區(qū),用以幫助女性計(jì)算機(jī)和信息科學(xué)的職業(yè)發(fā)展。
以上這些研究與實(shí)踐,共同體的構(gòu)建主要依賴成員的自組織,不能有效利用成員的興趣偏好、學(xué)習(xí)進(jìn)度等信息,在共同體的整個(gè)存在周期中并不與其他共同體互享信息、動(dòng)態(tài)調(diào)整。然而,開放虛擬社區(qū)在以指數(shù)級(jí)增長(zhǎng)信息量的傾瀉下,不可避免地會(huì)造成信息過載現(xiàn)象,共同體成員很容易陷入“信息迷航”,因此,不僅要將數(shù)量巨大,來源廣泛,專業(yè)興趣愛好各異的社區(qū)成員聚集在一起構(gòu)建學(xué)習(xí)共同體,更重要的是能借用信息技術(shù)合理組織、管理共同體。而源于信息檢索和過濾技術(shù)的個(gè)性化推薦策略為這類問題提供了解決思路和技術(shù)支持。
協(xié)同過濾技術(shù)是最早被提出并被廣泛應(yīng)用的個(gè)性化推薦策略,該推薦算法主要分為兩大類:一類是基于用戶的協(xié)同過濾算法;另一類是基于物品的協(xié)同過濾算法。
本文根據(jù)學(xué)生的網(wǎng)絡(luò)學(xué)習(xí)活動(dòng)計(jì)算用戶對(duì)學(xué)習(xí)內(nèi)容的偏好程度,進(jìn)而采用改進(jìn)的用戶興趣相似度計(jì)算方法確定用戶間的距離,利用協(xié)同過濾技術(shù)動(dòng)態(tài)構(gòu)建虛擬學(xué)習(xí)共同體。實(shí)現(xiàn)了共同體內(nèi)成員以興趣為吸引、以推薦為動(dòng)力的動(dòng)態(tài)流轉(zhuǎn)構(gòu)建機(jī)制。
一、用戶興趣偏好的度量
對(duì)用戶興趣偏好的度量需要分析用戶在網(wǎng)絡(luò)的學(xué)習(xí)行為,也即將用戶網(wǎng)絡(luò)行為的一些結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化成協(xié)同過濾算法所需要的數(shù)據(jù)結(jié)構(gòu)。在建立虛擬學(xué)習(xí)社區(qū)的共同體時(shí),必須對(duì)成員的反饋信息進(jìn)行動(dòng)態(tài)分析,并將其抽取、量化為共同體成員對(duì)主題或資源的興趣偏好度,也即成員——主題學(xué)習(xí)資源的評(píng)分,類似于推薦系統(tǒng)中用戶對(duì)物品的評(píng)分,這是采用協(xié)同過濾推薦技術(shù)的數(shù)據(jù)來源。
本文重點(diǎn)研究社區(qū)成員的學(xué)習(xí)主題與資源操作行為,在線學(xué)習(xí)中不像在線交易能給出明確的評(píng)分,在線學(xué)習(xí)中主要通過記錄用戶對(duì)學(xué)習(xí)資源的正反饋行為來考察用戶的偏好,在這里主要研究和量化共同體成員對(duì)主題學(xué)習(xí)資源的關(guān)注、回帖、瀏覽、轉(zhuǎn)載等操作行為,具體定量策略如表1所示。
表1中的權(quán)重分別設(shè)置為w1,w2,w3,w4依據(jù)其對(duì)偏好程度佐證的重要程度一般設(shè)置w1 對(duì)于瀏覽時(shí)長(zhǎng)t的取值需要作特別說明:考慮到正常閱讀速度和頁(yè)面篇幅,t應(yīng)在一個(gè)合理的范圍內(nèi),因此做如下處理: t=0 t?t1 t t1?t t2 t?t2?t2 其中,t1表示最小閱讀時(shí)間,當(dāng)t低于t1時(shí),認(rèn)為學(xué)習(xí)者沒有閱讀該頁(yè)面,可能為用戶的誤操作;t2表示最大閱讀時(shí)間,表示用正常閱讀速度能夠讀完的時(shí)間,超出該時(shí)間,也不能說明用戶興趣度增加,這可以避免學(xué)習(xí)者由于處理其他事情的耽擱所帶來的影響。[11] 以上抽取的這些數(shù)據(jù)主要利用了用戶的正反饋數(shù)據(jù),在一定程度上衡量了社區(qū)成員參與社區(qū)互動(dòng)與交流過程的表現(xiàn),也捕捉了成員對(duì)虛擬社區(qū)主題學(xué)習(xí)資源的興趣偏好程度。 二、用戶間興趣相似關(guān)系的判定 以上網(wǎng)絡(luò)行為數(shù)據(jù)經(jīng)過量化后,生成如表2所示的成員——主題學(xué)習(xí)資源得分矩陣表,該得分矩陣就是社區(qū)成員對(duì)主題學(xué)習(xí)資源興趣度與偏好的形式化表示。 在表2中,Iij表示社區(qū)成員i對(duì)j類資源的興趣度,該興趣度的定量計(jì)算公式是基于社區(qū)成員i對(duì)主題j是否關(guān)注、瀏覽的時(shí)間、回復(fù)的次數(shù)與資源的轉(zhuǎn)載情況進(jìn)行的綜合計(jì)算,定量的計(jì)算公式如下:
其中,attentionij表示成員i對(duì)j類主題的關(guān)注情況,如果加了關(guān)注,其值為1,否則為0;tij表示成員i對(duì)j類主題的瀏覽時(shí)長(zhǎng),avg(ti)表示成員i對(duì)社區(qū)中所有主題瀏覽的平均時(shí)長(zhǎng),二者比值反映了成員i對(duì)j類主題的特別瀏覽情況;ans_numij表示成員i對(duì)j類主題的回復(fù)次數(shù),avg(ans_numi)表示成員i在社區(qū)中的平均發(fā)帖量,二者比值反映了成員i對(duì)j類主題的特別回復(fù)情況;repij表示成員i對(duì)j類主題資源的轉(zhuǎn)載情況,如果進(jìn)行了轉(zhuǎn)載,其值為1,否則為0。
在協(xié)同過濾推薦技術(shù)實(shí)現(xiàn)過程中,為了生成目標(biāo)用戶的鄰居成員集合,首先需要確定相似成員的計(jì)算方法。一般情況下,計(jì)算相似性有很多方法,常采用余弦相似性的計(jì)算方法,即通過矢量間的余弦夾角來度量用戶間的相似度。公式如下:
sim(i,k)=cos(I,k)==
其中,I、K為用戶i、k對(duì)所有主題的興趣度向量,Ri,c,Rk,c分別為用戶i和用戶k對(duì)資源c的興趣度。
三、改進(jìn)的用戶興趣相似度計(jì)算方法
在理想狀態(tài)下,隨機(jī)地對(duì)學(xué)習(xí)資源的訪問中,公式2能較好地反映用戶間的興趣相似度。但在實(shí)際使用中,對(duì)比網(wǎng)絡(luò)學(xué)習(xí)共同體的學(xué)習(xí)記錄發(fā)現(xiàn):如果社區(qū)成員都只對(duì)基礎(chǔ)的、熱門的學(xué)習(xí)資源感興趣,這絲毫不能說明二者興趣的相似度高;例如,在“ACCESS數(shù)據(jù)庫(kù)”虛擬學(xué)習(xí)社區(qū)中,幾乎所有的學(xué)生都在開始要學(xué)習(xí)“關(guān)系數(shù)據(jù)庫(kù)原理”這類學(xué)習(xí)資源,并不能說明其中的任意兩個(gè)用戶興趣相似度高。反而,兩個(gè)成員對(duì)冷門的學(xué)習(xí)資源采取過同樣的行為更能說明他們興趣相似度高;例如,如果兩個(gè)成員都學(xué)習(xí)“菜單與工具欄”,這更能說明二者興趣相似度高。
基于以上分析,對(duì)熱門的基礎(chǔ)資源加入懲罰因子,因而在系統(tǒng)中采用如下改進(jìn)的計(jì)算用戶興趣相似度的公式:
其中,N(c)表示對(duì)c類資源感興趣的用戶數(shù),Ri,c,Rk,c分別為用戶i和用戶k對(duì)資源c的興趣度。
可以看到,公式3通過懲罰了成員i和成員k共同興趣列表中熱門的、基礎(chǔ)的主題資源對(duì)他們興趣相似度的影響,對(duì)于用戶相似度的判定更加靈敏。
四、學(xué)習(xí)共同體的構(gòu)建
在虛擬社區(qū)開始使用時(shí)還沒有學(xué)生的學(xué)習(xí)行為數(shù)據(jù),因此共同體在冷啟動(dòng)時(shí)的構(gòu)建主要基于學(xué)生的注冊(cè)信息和自主選擇。隨著學(xué)生學(xué)習(xí)行為數(shù)據(jù)的增多,對(duì)未加入學(xué)習(xí)共同體的成員按以下策略推薦其加入已有的共同體:
(1)無學(xué)習(xí)記錄者,開始學(xué)習(xí)時(shí)進(jìn)入知識(shí)樹根結(jié)點(diǎn)相關(guān)的共同體學(xué)習(xí)。
(2)有學(xué)習(xí)記錄者,通過系統(tǒng)推薦用TOPN篩選找到其用戶興趣相似度最高的5名用戶。
(3)對(duì)5名用戶所屬的學(xué)習(xí)共同體用TOP1篩選找到認(rèn)同感最大的學(xué)習(xí)共同體,推薦用戶加入。
(4)若用戶不認(rèn)同上述結(jié)果可以自行選擇加入其他學(xué)習(xí)共同體。
在協(xié)同過濾推薦過程中,隨著時(shí)間的推移,社區(qū)成員的學(xué)習(xí)興趣、專業(yè)愛好會(huì)發(fā)生變化,該計(jì)算、推薦過程也會(huì)不斷重復(fù)進(jìn)行,根據(jù)社區(qū)成員不間斷的反饋行為,就可以計(jì)算出潛在的興趣相似集合,進(jìn)而實(shí)現(xiàn)動(dòng)態(tài)的學(xué)習(xí)共同體構(gòu)建。
在筆者主持的ACCESS數(shù)據(jù)庫(kù)教改項(xiàng)目中,對(duì)網(wǎng)絡(luò)學(xué)習(xí)資源按“關(guān)系數(shù)據(jù)庫(kù)原理”、“SQL語(yǔ)言及實(shí)驗(yàn)”、“數(shù)據(jù)庫(kù)設(shè)計(jì)”、“表操作”、“查詢操作”、“窗體設(shè)計(jì)”、“宏”、“VBA編程”、“報(bào)表設(shè)計(jì)”、“菜單與工具欄”、“數(shù)據(jù)的傳遞與共享”等主題設(shè)計(jì)。在該學(xué)習(xí)平臺(tái),成員分屬于不同的學(xué)習(xí)小組,每個(gè)學(xué)習(xí)小組可以共享學(xué)習(xí)資源,成員之間可以發(fā)私信。系統(tǒng)根據(jù)用戶的學(xué)習(xí)記錄向其推薦興趣相似度較高的成員以及適合加入的學(xué)習(xí)共同體。該推薦更多地關(guān)注相似用戶的學(xué)習(xí)狀態(tài),動(dòng)態(tài)向當(dāng)前用戶推薦感興趣的學(xué)習(xí)共同體,推薦其加入。社區(qū)某用戶登錄并學(xué)習(xí)一段時(shí)間后,有如圖1所示的學(xué)習(xí)界面。
在未改進(jìn)興趣相似度算法之前,由于知識(shí)樹的根結(jié)點(diǎn)“關(guān)系數(shù)據(jù)庫(kù)原理”主題學(xué)習(xí)資源處于基礎(chǔ)地位,學(xué)習(xí)用戶較多,在開始推薦時(shí)由于受其影響會(huì)向每個(gè)用戶推薦加入“關(guān)系數(shù)據(jù)庫(kù)原理”學(xué)習(xí)共同體,并且在后續(xù)學(xué)習(xí)中“關(guān)系數(shù)據(jù)庫(kù)原理”學(xué)習(xí)共同體總會(huì)出現(xiàn)在推薦中,推薦效果并不理想,該資源的“群集”現(xiàn)象十分明顯,后來利用改進(jìn)的公式3,加入懲罰因子后,推薦的精度和靈敏度都大幅度提高。
在上述學(xué)習(xí)共同體的構(gòu)建中,以相對(duì)靜態(tài)的學(xué)習(xí)主題資源劃分若干數(shù)目相對(duì)確定的學(xué)習(xí)共同體,共同體內(nèi)的成員以興趣為基礎(chǔ)組織,隨著學(xué)習(xí)的進(jìn)展,成員在不同的共同體間流動(dòng),從而吸引興趣相近的好友在不同的共同體間遷徙。這種以興趣吸引為基礎(chǔ)、以集中遷徙為動(dòng)力的機(jī)制可以促使所有學(xué)習(xí)者在不同主題資源的學(xué)習(xí)共同體內(nèi)交叉進(jìn)步。
五、關(guān)鍵技術(shù)實(shí)現(xiàn)
系統(tǒng)基于.NET平臺(tái)開發(fā),開發(fā)環(huán)境使用Visual Studio 2008,采用基于B/S的三層體系結(jié)構(gòu),用ASP.Net實(shí)現(xiàn),在協(xié)同過濾技術(shù)的實(shí)現(xiàn)環(huán)節(jié)引入IronPython語(yǔ)言編程實(shí)現(xiàn)。在混合編程時(shí),需要在ASP.Net的WebSite項(xiàng)目中添加對(duì)IronPython.dll,ironMath.dll,Microsoft.Web.IronPython.dll三個(gè)文件的引用。
對(duì)于改進(jìn)的用戶興趣相似度計(jì)算方法的關(guān)鍵IronPython代碼如下:
def userSim(train):
#建立倒排表
Item_users=dict()
for u,items in train.items():
for j in items.keys():
if j not in item_users:
Item_users[j]=set()
Item_users[j].add(u)
#計(jì)算用戶間的興趣相似度
C=dict()
N=dict()
for j, users in item_users.items():
for u in users:
N[u] +=1
for v in users:
if u==v:
Continue
C[u][v]+=1/math.log(1+len(users))
#計(jì)算改進(jìn)的興趣相似度
W=dict()
for u,related_users in C.items():
for v, cuv in related_users.item():
W[u][v]=cuv/math.sqrt(N[u]*N[v])
return W
六、結(jié)束語(yǔ)
本文設(shè)計(jì)了一種基于改進(jìn)用戶興趣相似度的學(xué)習(xí)共同體的構(gòu)建方法,借鑒協(xié)同過濾算法思想將具有相似興趣的學(xué)習(xí)者自動(dòng)有效地組織成學(xué)習(xí)共同體,幫助虛擬社區(qū)“人以群分”,促進(jìn)協(xié)作式學(xué)習(xí)。在學(xué)習(xí)共同體的生成中既摒棄了盲目的自組織性,又兼顧了用戶的自主性,保證信息暢通。實(shí)驗(yàn)結(jié)果證明:該構(gòu)建方法具有較高的分組效率和良好的用戶滿意度,靈活動(dòng)態(tài)的組建方法和適當(dāng)?shù)牧鬓D(zhuǎn)遷徙機(jī)制都有積極的探索意義。但用戶在初次“冷啟動(dòng)”學(xué)習(xí)時(shí)一般按學(xué)習(xí)進(jìn)度默認(rèn)加入“初始學(xué)習(xí)組”,這種處理方式還需要探討改進(jìn)。
參考文獻(xiàn):
[1]楊麗娜,顏志軍等.基于個(gè)性化推薦思想的虛擬社區(qū)學(xué)習(xí)共同體動(dòng)態(tài)構(gòu)建[J].現(xiàn)代教育技術(shù),2012,22(1):88-92.
[2]盧強(qiáng).國(guó)內(nèi)學(xué)習(xí)共同體研究現(xiàn)狀與進(jìn)展分析[J].中國(guó)遠(yuǎn)程教育,2012(5):29-35.
[3]范玉鳳,李欣.活動(dòng)理論視角下的虛擬學(xué)習(xí)共同體構(gòu)建研究[J].中國(guó)電化教育,2013(2):43-47.
[4]胡小勇.促進(jìn)教師專業(yè)發(fā)展的網(wǎng)絡(luò)學(xué)習(xí)共同體創(chuàng)建研究[J].開放教育研究,2009(2):87-91.
[5]孫娟,熊才平,謝耀輝.基于IM的網(wǎng)絡(luò)學(xué)習(xí)共同體構(gòu)建及應(yīng)用研究[J].現(xiàn)代教育技術(shù)2011,21(4):130-135.
[6]萬力勇,趙呈領(lǐng)等.基于群的網(wǎng)絡(luò)學(xué)習(xí)共同體社會(huì)互動(dòng)研究[J].電化教育研究,2012(9):56-58.
[7]楊洪剛,寧玉文,高東懷等.基于SNS的網(wǎng)絡(luò)學(xué)習(xí)共同體構(gòu)建研究[J].現(xiàn)代教育技術(shù),2010,20(5):93-96.
[8]Judy Sheard.Electronic Learning Communities: Strategies for Establishment and Management[J].ITiCSE04,United Kingdom, 2004(8):37-41.
[9]Sandra Gorka, Matthew Helf, Jacob Miller. Implementing a Living-Learning Community in Information Technology[J].SIGITE14, Atlanta, Georgia, USA, 2014(10):153-157.
[10]Mary Beth Rosson, John M. Carroll, Dejin Zhao, Timothy Paone. wConnect: A Facebook-Based Developmental Learning Community to Support Women in Information Technology[J]. C&T09, University Park, Pennsylvania, USA, 2009(6):125-134.
[11]何玲,高琳琦.網(wǎng)絡(luò)環(huán)境中學(xué)習(xí)資料的個(gè)性化推薦方法[J].中國(guó)遠(yuǎn)程教育, 2009(2):67-69.
[12]項(xiàng)亮.推薦系統(tǒng)實(shí)踐[M].北京:人民郵電出版社,2012.
[13]席亞卿,馬芳.基于群體動(dòng)力機(jī)制的校際網(wǎng)絡(luò)學(xué)習(xí)共同體支撐平臺(tái)的構(gòu)建[J].中國(guó)教育信息化,2012(5):37-38.
(編輯:楊馥紅)