王夢(mèng)菊 邵晶波
哈爾濱金融學(xué)院 黑龍江 哈爾濱 150080
虛擬學(xué)習(xí)社區(qū)是借助信息技術(shù)創(chuàng)建的網(wǎng)絡(luò)學(xué)習(xí)環(huán)境,是在聯(lián)結(jié)主義的啟發(fā)下出現(xiàn)的一種學(xué)習(xí)組織,也是將在線學(xué)習(xí)與社交網(wǎng)絡(luò)相結(jié)合的產(chǎn)物。在虛擬學(xué)習(xí)社區(qū)中,不同的群體對(duì)構(gòu)建知識(shí)的貢獻(xiàn)和所起的作用不盡相同。因此,認(rèn)識(shí)和理解虛擬學(xué)習(xí)社區(qū)中的各類(lèi)角色,可以更好地分析和理解虛擬學(xué)習(xí)社區(qū)、預(yù)測(cè)用戶(hù)行為、研究用戶(hù)之間的關(guān)系和交互過(guò)程、對(duì)不同的角色采取不同的支撐策略。
社會(huì)網(wǎng)絡(luò)理論出現(xiàn)于20世紀(jì)50、60年代,德國(guó)社會(huì)學(xué)家Georg Simmelcon從社會(huì)學(xué)角度將其定義為:一個(gè)由一組代表社會(huì)成員的節(jié)點(diǎn)和表示節(jié)點(diǎn)間關(guān)系的邊或連線構(gòu)成的社會(huì)結(jié)構(gòu)。 1969年,Milgram做了Small-World實(shí)驗(yàn),1991年Guare提出“六度分離”概念。1992年,美國(guó)社會(huì)學(xué)家Ronald Burt提出了結(jié)構(gòu)洞理論。美國(guó)斯坦福大學(xué)人文與科學(xué)學(xué)院社會(huì)學(xué)家Mark Granovetter對(duì)找工作的過(guò)程進(jìn)行研究,得出結(jié)論:“弱連接”有著極快的以及可能具有低成本和高效能的傳播效率。此外, “二對(duì)一理論”和結(jié)構(gòu)角色理論也是目前主要的社會(huì)網(wǎng)絡(luò)理論。但傳統(tǒng)的社會(huì)網(wǎng)絡(luò)研究具有準(zhǔn)確性低、個(gè)人主觀性強(qiáng)以及樣本規(guī)模小等問(wèn)題。
社會(huì)角色的概念最早是由人類(lèi)學(xué)家Ralphlinton提出,指人們對(duì)于某種位置上人的行為的期望或要求。目前,社會(huì)網(wǎng)絡(luò)角色識(shí)別的主要方法為以下4種以及之間的組合:社會(huì)網(wǎng)絡(luò)分析方法、數(shù)學(xué)分析方法、內(nèi)容分析方法、機(jī)器學(xué)習(xí)方法。另外,根據(jù)結(jié)構(gòu)相似性、規(guī)則結(jié)構(gòu)等價(jià)性、結(jié)構(gòu)特征的分類(lèi)、聚類(lèi)、概率圖模型等具體識(shí)別的方法,可歸屬到上述4種方法中。這些研究方法目前面臨的挑戰(zhàn)有:社會(huì)網(wǎng)絡(luò)復(fù)雜性分析問(wèn)題、海量數(shù)據(jù)問(wèn)題和評(píng)價(jià)問(wèn)題等。
國(guó)內(nèi)最早出現(xiàn)虛擬學(xué)習(xí)社區(qū)的概念是由陳超等在2001年提出。國(guó)外對(duì)于虛擬學(xué)習(xí)社區(qū)的研究早于國(guó)內(nèi),研究者們使用社交網(wǎng)絡(luò)中的密度、出度/入度、社群圖、中心性等基本屬性來(lái)分析學(xué)習(xí)者的交互結(jié)構(gòu),一般將虛擬學(xué)習(xí)社區(qū)中的群體劃分成核心、積極和非積極三類(lèi)。已有學(xué)者為了研究學(xué)習(xí)者在構(gòu)建知識(shí)中的角色和在虛擬社區(qū)中的地位,使用了結(jié)構(gòu)洞、凝聚子群王、塊模型中的結(jié)構(gòu)等價(jià)等方法[1]。
在這些方法中,專(zhuān)門(mén)劃分社交網(wǎng)絡(luò)中行為人地位的是塊模型和概率模型識(shí)別方法。傳統(tǒng)的塊模型主要是通過(guò)網(wǎng)絡(luò)的關(guān)系結(jié)構(gòu)來(lái)構(gòu)建,忽視了用戶(hù)間交互的信息內(nèi)容。而概率模型,在不考慮網(wǎng)絡(luò)關(guān)系結(jié)構(gòu)的情況下,將文本內(nèi)容與圖中的邊關(guān)聯(lián)起來(lái),雖然用到了節(jié)點(diǎn)間文本的關(guān)鍵信息,卻缺乏像塊模型從全局的角度來(lái)識(shí)別。因此,如何將這兩種模式有效結(jié)合,是當(dāng)前虛擬學(xué)習(xí)社區(qū)角色分類(lèi)方法中的一個(gè)重要思路。
研究對(duì)象為大型在線開(kāi)放課程的課后討論區(qū)。選取中國(guó)大學(xué)慕課中《操作系統(tǒng)原理》的課后討論區(qū)作為模型設(shè)計(jì)階段的數(shù)據(jù)來(lái)源,具備豐富的數(shù)據(jù)樣本空間,適合作為訓(xùn)練樣本。本文作者近兩年使用中國(guó)大學(xué)慕課平臺(tái)上的《操作系統(tǒng)原理》課程進(jìn)行SPOC教學(xué),熟悉該課程的教學(xué)過(guò)程,有利于對(duì)課后討論區(qū)中數(shù)據(jù)進(jìn)行特征分析。在模型評(píng)價(jià)階段,擬選取我校智慧樹(shù)平臺(tái)上的在線開(kāi)放課程《數(shù)據(jù)結(jié)構(gòu)》的課后討論區(qū)學(xué)習(xí)者昵稱(chēng)和發(fā)言文本作為評(píng)價(jià)數(shù)據(jù)源,本文作者為該課程負(fù)責(zé)人,方便調(diào)取后臺(tái)數(shù)據(jù),同時(shí),熟悉課程學(xué)生情況,便于在實(shí)際教學(xué)和互動(dòng)中掌握學(xué)生角色類(lèi)別,為人工評(píng)價(jià)提供了可行性。
本文研究數(shù)據(jù)來(lái)源于MOOC中國(guó)慕課網(wǎng)和智慧樹(shù)平臺(tái)。
MOOC即大規(guī)模開(kāi)放在線課程,于2008年次提出。2012年,美國(guó)的頂尖大學(xué)陸續(xù)設(shè)立網(wǎng)絡(luò)學(xué)習(xí)平臺(tái),Coursera、Udacity、edX三大課程提供商興起,給更多學(xué)生提供了系統(tǒng)學(xué)習(xí)的可能。平臺(tái)上的課程向?qū)W習(xí)者免費(fèi)提供,與真正的大學(xué)相似,有一套自己的學(xué)習(xí)和管理系統(tǒng)。MOOC平臺(tái)課程具有資源工具多元化、課程學(xué)習(xí)方便、課程受眾面廣等特點(diǎn)。
智慧樹(shù)于2009 年成立,是中國(guó)最大的MOOC式在線互動(dòng)學(xué)堂,支持跨校授課和學(xué)分互認(rèn),適合實(shí)現(xiàn)跨校選課修讀。該平臺(tái)可實(shí)現(xiàn)在線課程和見(jiàn)面課相結(jié)合,同時(shí)設(shè)置技術(shù)向?qū)В瑸榻處熀蛯W(xué)生引領(lǐng)學(xué)習(xí)過(guò)程的開(kāi)展。在課程教學(xué)的整個(gè)流程中都提供平臺(tái)服務(wù),同時(shí),通過(guò)統(tǒng)計(jì)圖和進(jìn)程條等方式反饋個(gè)體和群體學(xué)習(xí)情況,使教師能夠及時(shí)掌握學(xué)情。
社會(huì)網(wǎng)絡(luò)數(shù)據(jù)的海量化和動(dòng)態(tài)化,使角色識(shí)別算法的數(shù)據(jù)處理面臨如下挑戰(zhàn):處理的時(shí)間即效率和算法的準(zhǔn)確率。因此,本課題中數(shù)據(jù)源的選取考慮三個(gè)方面:數(shù)據(jù)規(guī)模、數(shù)據(jù)的時(shí)間變化和數(shù)據(jù)的種類(lèi)多樣化。如上所述,中國(guó)大學(xué)慕課平臺(tái)是大規(guī)模在線開(kāi)放課程平臺(tái),選課人數(shù)眾多、數(shù)據(jù)規(guī)模較大,適合訓(xùn)練樣本的選擇;同時(shí),課程的多次開(kāi)課使得同一課程在不同時(shí)間階段擁有不同學(xué)習(xí)者群體的學(xué)習(xí)數(shù)據(jù),更適合作為動(dòng)態(tài)訓(xùn)練樣本,方便進(jìn)行對(duì)比、評(píng)價(jià)。智慧樹(shù)平臺(tái)作為在線互動(dòng)學(xué)堂,設(shè)有課程論壇和見(jiàn)面課,能夠進(jìn)行互動(dòng)交流,使得教師在異步和同步互動(dòng)中更加熟悉學(xué)生情況,方便進(jìn)行學(xué)生角色的主觀識(shí)別,從而對(duì)模型的識(shí)別結(jié)果進(jìn)行主觀評(píng)價(jià)。分別從上述兩大平臺(tái)中選取2門(mén)共3次課程數(shù)據(jù),從而確保數(shù)據(jù)種類(lèi)的多樣化。具體選取策略如下:
2.3.1 選取大規(guī)模在線開(kāi)放課程中國(guó)大學(xué)慕課中《操作系統(tǒng)原理》(第六次開(kāi)課)的課后討論區(qū)作為模型設(shè)計(jì)階段的數(shù)據(jù)來(lái)源。本文作者近兩年使用中國(guó)大學(xué)慕課平臺(tái)上的《操作系統(tǒng)原理》課程進(jìn)行SPOC教學(xué),熟悉該課程的教學(xué)過(guò)程,有利于對(duì)課后討論區(qū)中數(shù)據(jù)進(jìn)行特征分析。使得訓(xùn)練樣本空間有足夠數(shù)量的歷史數(shù)據(jù)作為靜態(tài)訓(xùn)練樣本,數(shù)據(jù)收集截止日期至2020年6月30日。
2.3.2 選取上述《操作系統(tǒng)原理》課程的第七次開(kāi)課數(shù)據(jù)作為動(dòng)態(tài)訓(xùn)練樣本,進(jìn)行識(shí)別模型測(cè)試。
2.3.3 采用智慧樹(shù)平臺(tái)上的在線開(kāi)放課程《數(shù)據(jù)結(jié)構(gòu)》的課后討論區(qū)學(xué)習(xí)者昵稱(chēng)和發(fā)言文本作為評(píng)價(jià)數(shù)據(jù)源。該課程的負(fù)責(zé)人為本文作者,方便后臺(tái)數(shù)據(jù)調(diào)取。同時(shí),由于該課程的教學(xué)團(tuán)隊(duì)熟悉課程學(xué)生情況,便于在實(shí)際教學(xué)和互動(dòng)中掌握學(xué)生角色類(lèi)別,因此由一線教師進(jìn)行人工評(píng)價(jià)(目前,人工評(píng)價(jià)仍是評(píng)估社會(huì)網(wǎng)絡(luò)角色識(shí)別模型的主要方法)。
結(jié)構(gòu)等價(jià)的定義比正則等價(jià)嚴(yán)苛,在小規(guī)模的、自發(fā)形成的社交網(wǎng)絡(luò)中,很難找到能夠結(jié)構(gòu)等價(jià)的兩個(gè)節(jié)點(diǎn)。 像虛擬學(xué)習(xí)區(qū)中常見(jiàn)的場(chǎng)次多但參與人數(shù)不多的討論,用正則等價(jià)比較容易實(shí)現(xiàn)區(qū)分角色的目標(biāo)。將正則等價(jià)結(jié)構(gòu)與塊模型的構(gòu)建結(jié)合,實(shí)現(xiàn)正則等價(jià)下的角色劃分[2]。
選取主題,即在課后評(píng)論區(qū)選取一個(gè)數(shù)量較小詞匯的分布對(duì)大量的文本進(jìn)行總結(jié),這些分布被稱(chēng)為 “主題”。把主題定義為一個(gè)給定詞匯的多項(xiàng)式分布。具體過(guò)程如下:
對(duì)評(píng)論區(qū)的每一個(gè)帖子,從狄利克雷分布中抽取出該帖子的主題分布。根據(jù)主題分布,對(duì)帖子中的每一個(gè)詞匯選擇一個(gè)單一的主題。從具有特定采樣主題的詞匯多項(xiàng)式分布中,對(duì)每個(gè)詞匯進(jìn)行采樣。由該生成過(guò)程對(duì)應(yīng)的分層貝葉斯模型,得到關(guān)于參與主體的主題信息和每個(gè)帖子中這些主題的權(quán)重信息。
設(shè)計(jì)優(yōu)化組合策略,計(jì)劃使用迭代方法,將前期構(gòu)建的正則等價(jià)塊模型和主題概率模型相融合,構(gòu)建混合識(shí)別模型。在動(dòng)態(tài)訓(xùn)練樣本空間上運(yùn)行、修改優(yōu)化。目前,社會(huì)網(wǎng)絡(luò)角色識(shí)別的大多數(shù)方法,或是依據(jù)社會(huì)網(wǎng)絡(luò)中的結(jié)構(gòu),或是依據(jù)社會(huì)網(wǎng)絡(luò)中的內(nèi)容。前者側(cè)重從宏觀角度識(shí)別角色,對(duì)主題或環(huán)境的因素幾乎沒(méi)有考慮;后者從微觀角度識(shí)別社會(huì)網(wǎng)絡(luò)中的角色,更多關(guān)注文本中的關(guān)鍵信息,缺乏對(duì)全局的認(rèn)識(shí)。
本文采用“混合方案”,在角色識(shí)別中使用塊模型關(guān)注社會(huì)網(wǎng)絡(luò)的結(jié)構(gòu),同時(shí)使用主題概率模型關(guān)注社會(huì)網(wǎng)絡(luò)的內(nèi)容。通過(guò)對(duì)二者的優(yōu)化組合,并考慮時(shí)間因素,使角色識(shí)別結(jié)果更符合虛擬學(xué)習(xí)社區(qū)的實(shí)際情況。
目前,還沒(méi)有一種評(píng)估方法,可以對(duì)所有角色識(shí)別方法進(jìn)行有效評(píng)估,甚至很多時(shí)候需要通過(guò)人工來(lái)完成。本文采取客觀評(píng)價(jià)與主觀評(píng)價(jià)相結(jié)合的策略。對(duì)于識(shí)別結(jié)果效率等定量問(wèn)題,采用在相同樣本空間上與其他識(shí)別方法對(duì)比的評(píng)價(jià)方法。而角色識(shí)別方法的評(píng)價(jià)問(wèn)題中,最難解決的是如何判斷識(shí)別結(jié)果是否符合實(shí)際情況,即識(shí)別出的角色在實(shí)際活動(dòng)中是否符合角色特征。這是一個(gè)具有主觀性的問(wèn)題。針對(duì)這一問(wèn)題,將采用智慧樹(shù)平臺(tái)上的在線開(kāi)放課程《數(shù)據(jù)結(jié)構(gòu)》平臺(tái)上的數(shù)據(jù)作為評(píng)價(jià)樣本空間,由課程團(tuán)隊(duì)中教師進(jìn)行人工評(píng)價(jià)。采用以下四種方法,從角色識(shí)別的精度和效率兩個(gè)方面進(jìn)行綜合評(píng)估:與常見(jiàn)的聚類(lèi)算法進(jìn)行對(duì)比。與單一塊模型算法進(jìn)行對(duì)比。與單一主題概率模型算法進(jìn)行對(duì)比。由智慧樹(shù)平臺(tái)上的在線開(kāi)放課程《數(shù)據(jù)結(jié)構(gòu)》教學(xué)團(tuán)隊(duì)進(jìn)行人工評(píng)價(jià)。
通過(guò)上述混合識(shí)別模型,發(fā)現(xiàn)虛擬學(xué)習(xí)社區(qū)的學(xué)習(xí)者在知識(shí)構(gòu)建的過(guò)程中形成的不同的角色。得到他們?cè)诮涣饔懻?、知識(shí)傳遞的過(guò)程中表現(xiàn)的不同特征[3]。根據(jù)角色分類(lèi)的結(jié)果,預(yù)計(jì)在以下方面有所啟發(fā):對(duì)虛擬學(xué)習(xí)社區(qū)的不同角色進(jìn)行知識(shí)推薦,采取不同的策略,促進(jìn)個(gè)性化學(xué)習(xí)。同時(shí),角色識(shí)別的結(jié)果也為自適應(yīng)課程中知識(shí)模塊的劃分和總體策略的制定提供了參考。挖掘?qū)W(xué)者,向慕課的教師推薦“學(xué)生助教”。發(fā)現(xiàn)初學(xué)者,對(duì)其給予更多關(guān)注。在SPOC課程中,在線學(xué)習(xí)社區(qū)的角色識(shí)別可以幫助教師及時(shí)了解學(xué)情,調(diào)整與學(xué)生互動(dòng)的方案,提高教學(xué)效果。學(xué)習(xí)者角色的識(shí)別結(jié)果,也可用于“自適應(yīng)”課程針對(duì)不同的學(xué)習(xí)角色進(jìn)行不同的知識(shí)模塊組合。對(duì)于大型在線開(kāi)放課程平臺(tái),學(xué)習(xí)者角色識(shí)別可以幫助教學(xué)者了解當(dāng)前課程學(xué)習(xí)者的多樣需求,對(duì)于課程建設(shè),甚至專(zhuān)業(yè)課程設(shè)置、人才培養(yǎng)方案制定都起著積極的作用。