潘志宏,萬智萍,謝海明
(1.中山大學(xué)新華學(xué)院,廣東 廣州 510520;2.中國(guó)移動(dòng)通信集團(tuán)廣東有限公司,廣東 廣州 510623)
近年來隨著移動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等技術(shù)的不斷發(fā)展,國(guó)內(nèi)外涌現(xiàn)大批MOOC平臺(tái),它讓學(xué)習(xí)者根據(jù)不同的學(xué)習(xí)主題形成學(xué)習(xí)圈,并通過社交網(wǎng)絡(luò)構(gòu)建學(xué)習(xí)群體。但目前大部分MOOC平臺(tái)的課程資源僅依靠平臺(tái)方來建設(shè),學(xué)習(xí)者只需要按部就班地學(xué)習(xí)課程內(nèi)容,這種模式具有一定的局限性。首先學(xué)習(xí)者會(huì)比較被動(dòng)地學(xué)習(xí)平臺(tái)所提供的資源,缺乏參與學(xué)習(xí)的主動(dòng)性;其次平臺(tái)學(xué)習(xí)資源僅依靠一方來維護(hù),很難保證內(nèi)容的多樣性。因此為了提升學(xué)習(xí)者的主動(dòng)性以及平臺(tái)資源庫(kù)的豐富性,有學(xué)者提出將眾包理念融入MOOC平臺(tái)[1-4],讓學(xué)習(xí)者和教師構(gòu)成學(xué)習(xí)共同體,在完成新知識(shí)學(xué)習(xí)的同時(shí)進(jìn)行資源庫(kù)建設(shè)。通過眾包協(xié)同構(gòu)建MOOC資源的步驟如下:首先,教師通過MOOC平臺(tái)發(fā)布任務(wù),包含以校驗(yàn)學(xué)習(xí)效果為主的基礎(chǔ)型任務(wù)、以構(gòu)建MOOC資源為主的開放型任務(wù)、以評(píng)估他人任務(wù)完成效果為主的評(píng)估型任務(wù)等各種類型眾包任務(wù),這些設(shè)置合理的眾包任務(wù)一方面讓學(xué)生融入課程學(xué)習(xí)的全過程,另一方面協(xié)助MOOC平臺(tái)資源的動(dòng)態(tài)更新;其次,設(shè)計(jì)眾包質(zhì)量控制策略保證眾包任務(wù)在實(shí)現(xiàn)教學(xué)功能的前提下幫助平臺(tái)構(gòu)建更高質(zhì)量的MOOC資源也是非常重要的問題。
在眾包研究中質(zhì)量控制一直是重點(diǎn)和熱點(diǎn),主要集中在眾包任務(wù)分配和眾包任務(wù)評(píng)估兩方面[5-7],其中合理分配眾包任務(wù)是獲得優(yōu)秀眾包結(jié)果的核心基礎(chǔ),不同類型的平臺(tái)有不同的任務(wù)分配策略。第一類眾包平臺(tái)通常被用來發(fā)布簡(jiǎn)單的微任務(wù),對(duì)參與者的技能要求不高,它更多時(shí)候采用的是先來先得的任務(wù)分配方式,比如通過亞馬遜AMT發(fā)布標(biāo)注圖片任務(wù)[7];第二類眾包平臺(tái)雖然對(duì)參與者的知識(shí)技能要求不高,但是對(duì)參與者的位置、時(shí)間有嚴(yán)格要求,比如通過群智感知平臺(tái)收集移動(dòng)終端用戶的感知位置、時(shí)間、照片等信息獲得城市交通、環(huán)境等情況[8-9];第三類是知識(shí)密集型眾包任務(wù),對(duì)參與者的知識(shí)技能水平都有特定的要求,比如眾包翻譯[10]、軟件眾包平臺(tái)TopCoder[11]等。高校MOOC資源眾包平臺(tái)上的任務(wù)就屬于知識(shí)密集型任務(wù),因此挑選合適的任務(wù)參與者至關(guān)重要,它關(guān)系到MOOC資源的構(gòu)建質(zhì)量。文中利用課程、學(xué)生知識(shí)技能與眾包任務(wù)的關(guān)聯(lián)關(guān)系來設(shè)計(jì)任務(wù)分配算法,并將任務(wù)分發(fā)至最合適的學(xué)生來完成,以構(gòu)建更高質(zhì)量的MOOC資源庫(kù)。
主要貢獻(xiàn)在于提出一種針對(duì)高校MOOC資源眾包平臺(tái)的任務(wù)分配方案,它包含學(xué)生的準(zhǔn)入篩選、預(yù)期工作能力評(píng)估與任務(wù)分配兩個(gè)階段。方案首先設(shè)計(jì)基于改進(jìn)Apriori的課程關(guān)聯(lián)規(guī)則生成算法[12]對(duì)學(xué)生選課進(jìn)行準(zhǔn)入篩選;其次設(shè)計(jì)基于黃金標(biāo)準(zhǔn)和知識(shí)關(guān)聯(lián)的學(xué)生預(yù)期工作能力評(píng)估與任務(wù)分配算法,將眾包任務(wù)分配到工作能力最合適的學(xué)生;最后分別在任務(wù)課程關(guān)聯(lián)、任務(wù)知識(shí)關(guān)聯(lián)兩個(gè)方面對(duì)方案的實(shí)現(xiàn)效果進(jìn)行測(cè)試驗(yàn)證,測(cè)試結(jié)果表明,該方案能夠較好地提高M(jìn)OOC資源的構(gòu)建效果。
挑選合適的任務(wù)參與者對(duì)知識(shí)密集型眾包任務(wù)是非常關(guān)鍵的,它是獲得高質(zhì)量眾包結(jié)果的重要保證。文中從學(xué)生選課準(zhǔn)入篩選、學(xué)生能力評(píng)估和任務(wù)分配兩個(gè)方面來設(shè)計(jì)MOOC資源眾包平臺(tái)的任務(wù)分配方案,并設(shè)計(jì)詳細(xì)的算法流程。
一般眾包平臺(tái)都想用盡量少的成本雇傭合適的人以高質(zhì)量地完成眾包任務(wù),但是高校MOOC資源眾包平臺(tái)在眾包人員的選擇上具有特殊性。首先平臺(tái)強(qiáng)調(diào)參與廣度,讓更多學(xué)生能受惠于優(yōu)質(zhì)的學(xué)習(xí)資源;其次平臺(tái)任務(wù)屬于知識(shí)密集型眾包任務(wù),對(duì)知識(shí)和技能要求較高,所以必須對(duì)學(xué)生的技能進(jìn)行一定的評(píng)估篩選,以確認(rèn)學(xué)生更好地完成課程學(xué)習(xí)和構(gòu)建MOOC資源的任務(wù);最后普通眾包平臺(tái)通常會(huì)因?yàn)槌杀締栴},在進(jìn)行眾包質(zhì)量控制時(shí)盡量避免使用太多冗余人員來獲得更高質(zhì)量的結(jié)果,但這卻是高校MOOC平臺(tái)的優(yōu)勢(shì),它沒有成本限制,可以讓更多的學(xué)生參與同樣的任務(wù),從而獲得更高質(zhì)量的MOOC資源庫(kù)。
針對(duì)上述三個(gè)特點(diǎn),首先提出基于改進(jìn)Apriori的課程關(guān)聯(lián)規(guī)則生成算法,在課程準(zhǔn)入方面對(duì)學(xué)生進(jìn)行初步篩選,其次提出黃金標(biāo)準(zhǔn)和知識(shí)關(guān)聯(lián)的學(xué)生預(yù)期工作能力評(píng)估與任務(wù)分配算法,在不同知識(shí)塊對(duì)學(xué)生預(yù)期任務(wù)工作能力進(jìn)行多維度評(píng)估,保證他們有能力完成眾包任務(wù)。圖1給出了高校MOOC眾包資源平臺(tái)的任務(wù)分配工作流程,包含學(xué)生準(zhǔn)入篩選、工作能力評(píng)估與任務(wù)分配兩大模塊。
圖1 MOOC平臺(tái)任務(wù)分配工作流程
學(xué)生準(zhǔn)入篩選階段,判斷學(xué)生是否具備完成課程學(xué)習(xí)和完成相應(yīng)眾包任務(wù)的知識(shí)儲(chǔ)備,一般情況下高校會(huì)采用人才培養(yǎng)方案的先修課程規(guī)則對(duì)學(xué)生進(jìn)行初步過濾準(zhǔn)入,這種通過靜態(tài)課程設(shè)置規(guī)則進(jìn)行簡(jiǎn)單限制具有一定的缺陷,首先它不能很好地過濾出更多滿足條件的學(xué)生,其次也不能較好地適應(yīng)不斷更新的高校MOOC平臺(tái)的課程體系。針對(duì)這種情況,文中利用改進(jìn)Apriori算法對(duì)不同課程成績(jī)進(jìn)行分析從而得到課程之間的關(guān)聯(lián)規(guī)則[12],一方面可以進(jìn)行選課準(zhǔn)入篩選,另一方面當(dāng)學(xué)生沒有完成相關(guān)先修課程或者沒有通過課前能力測(cè)試時(shí),可以通過課程關(guān)聯(lián)規(guī)則推薦相關(guān)先修課程給學(xué)生學(xué)習(xí)。
首先高校MOOC平臺(tái)與本校教務(wù)系統(tǒng)對(duì)接獲取課程成績(jī)數(shù)據(jù)源;接著進(jìn)行課程關(guān)聯(lián)規(guī)則生成,主要分為三個(gè)步驟:第一對(duì)成績(jī)數(shù)據(jù)進(jìn)行預(yù)處理;第二根據(jù)課程成績(jī)數(shù)據(jù)找出有效的頻繁項(xiàng)集;第三從生成的頻繁項(xiàng)集中生成高置信度課程關(guān)聯(lián)規(guī)則;最后將規(guī)則保存至對(duì)應(yīng)數(shù)據(jù)庫(kù),以供用戶準(zhǔn)入過濾使用。詳細(xì)流程如算法1所示,為了算法描述方便,做如下定義。
定義1:數(shù)據(jù)項(xiàng)集I={i1,i2,…,im},集合X?I為項(xiàng)集,Tn=
定義2:X→Y表示課程關(guān)聯(lián)規(guī)則,支持度用support(X→Y)表示,它代表X、Y同時(shí)出現(xiàn)在D中的概率,計(jì)算公式如式(1)所示。其中sup(XY)表示XY在D中同時(shí)出現(xiàn)的次數(shù),Count(D)表示D中事務(wù)的總數(shù)量。置信度用conf(X→Y)表示,它代表X出現(xiàn),Y也出現(xiàn)的概率,計(jì)算公式如式(2)所示。其中sup(X)表示X在D中出現(xiàn)的次數(shù)。
(1)
(2)
定義3:Lk表示頻繁K項(xiàng)集,Ck表示候選項(xiàng)集,最小支持閾值為minsup,最小置信度為minconf,規(guī)則數(shù)據(jù)庫(kù)為RDB。
算法1:基于改進(jìn)Apriori的課程關(guān)聯(lián)規(guī)則生成算法。
1:初始化:設(shè)置minsup,minconf初始值。
2:數(shù)據(jù)采集與預(yù)處理:首先通過API接口對(duì)教務(wù)系統(tǒng)的學(xué)生課程成績(jī)進(jìn)行采集,將成績(jī)進(jìn)行離散化。文中只是為了分析學(xué)生學(xué)好某門課程能否學(xué)好另外一門課程,因此只分是否優(yōu)秀等級(jí),85~100為優(yōu)秀等級(jí),用“1”表示,0~84為不優(yōu)秀等級(jí),用“0”表示,將課程用KCn(n≥1)表示,經(jīng)過預(yù)處理后生成事務(wù)數(shù)據(jù)庫(kù)D。
3:產(chǎn)生有效的課程頻繁項(xiàng)集。
將事務(wù)數(shù)據(jù)庫(kù)D轉(zhuǎn)化為垂直結(jié)構(gòu)的項(xiàng)目事務(wù)數(shù)據(jù)ItemDB,接著掃描項(xiàng)目事務(wù)數(shù)據(jù)ItemDB并根據(jù)最小支持度獲得頻繁1項(xiàng)集L1=find_frequent_1-itemsets(ItemDB)
for(k=2;Lk-1≠?;k++) do
Ck=Apriori_gen(Lk-1)//生成新的候選項(xiàng)集
foreachiin ItemDB do //i表示ItemDB中每個(gè)項(xiàng)目事務(wù)
Ci=subset(Ck,i) //獲取i中包含的候選項(xiàng)集
foreachcinCido//c表示Ci中每個(gè)候選項(xiàng)
c.count++
end
Lk={c∈Ck|c.count≥minsup}
end
L=UkLk//返回所有頻繁項(xiàng)集k
4:生成課程關(guān)聯(lián)規(guī)則。
foreachLkinL,其中k≥2 do
A←{X|X?Lk,X≠?}//初始化前件集合
whileA≠? do
X←A中的最大元素
A←AX//從A中刪除X
conf=sup(Lk)/sup(X)
if(conf≥minconf) then
outputX→Y,support(Lk),conf并存入RDB
else
A←A
end while
end for
算法性能優(yōu)化分析:一般Apriori算法在計(jì)算項(xiàng)集時(shí)會(huì)掃描原始數(shù)據(jù)表,在面對(duì)大規(guī)模數(shù)據(jù)時(shí)會(huì)顯得性能較低,文中主要從三個(gè)方面來優(yōu)化算法性能問題:第一在算法步驟2中采用離散化對(duì)數(shù)據(jù)進(jìn)行預(yù)處理并保存事務(wù)數(shù)據(jù)庫(kù),這樣就會(huì)降低數(shù)據(jù)掃描和處理的速度;第二在算法步驟3中將事務(wù)數(shù)據(jù)庫(kù)D轉(zhuǎn)化為垂直結(jié)構(gòu)的項(xiàng)目事務(wù)數(shù)據(jù)ItemDB[13],記錄并統(tǒng)計(jì)每個(gè)1項(xiàng)集出現(xiàn)次數(shù)并根據(jù)最小支持度刪除不滿足的項(xiàng)集,從而生成新的數(shù)據(jù)庫(kù),然后用Apriori算法的連接,同時(shí)求連接項(xiàng)目的記錄交集,重新生成記錄數(shù)據(jù)庫(kù),這樣就避免了重新掃描原始數(shù)據(jù)庫(kù),而且生成的頻繁項(xiàng)目集越多,掃描的數(shù)據(jù)庫(kù)就會(huì)越小,從而提高了運(yùn)行效率;第三由于平臺(tái)新增課程更新速度較小,在算法步驟4中將生成規(guī)則保存至規(guī)則數(shù)據(jù)庫(kù),只有新增課程時(shí)才會(huì)啟動(dòng)課程關(guān)聯(lián)算法。從空間復(fù)雜度看,每次產(chǎn)生頻繁項(xiàng)集后,數(shù)據(jù)庫(kù)不斷減小,減少占用內(nèi)存空間;從時(shí)間復(fù)雜度看,改進(jìn)Apriori算法節(jié)約了剪枝步驟中頻繁項(xiàng)集的比較次數(shù),大大提升了算法運(yùn)行效率。
兩種算法在不同最小支持度下的時(shí)間總開銷對(duì)比如圖2所示。
圖2 兩種算法在不同最小支持度下的時(shí)間總開銷對(duì)比
眾包平臺(tái)都想獲得更優(yōu)秀的眾包結(jié)果,因此非常關(guān)注任務(wù)參與者的工作能力與眾包任務(wù)的匹配度,故設(shè)計(jì)分配算法將任務(wù)分配到匹配度最高的參與者就成為研究重點(diǎn)。文中提出了基于黃金標(biāo)準(zhǔn)和任務(wù)知識(shí)關(guān)聯(lián)的學(xué)生預(yù)期工作能力評(píng)估與任務(wù)分配算法,首先是利用具有黃金標(biāo)準(zhǔn)答案的基礎(chǔ)任務(wù)對(duì)學(xué)生預(yù)期工作能力進(jìn)行評(píng)估,接著在學(xué)生參加某個(gè)進(jìn)階任務(wù)時(shí)需要對(duì)學(xué)生進(jìn)行綜合評(píng)估,評(píng)估重點(diǎn)為學(xué)生在與該進(jìn)階任務(wù)相關(guān)聯(lián)的基礎(chǔ)任務(wù)中的完成情況,以此確定是否參加進(jìn)階任務(wù)[14-15]。
高校MOOC資源平臺(tái)有兩類任務(wù):第一類是課程學(xué)生都必須參與的基礎(chǔ)任務(wù),它由具有黃金標(biāo)準(zhǔn)答案的客觀問題構(gòu)成,可以通過它來評(píng)估學(xué)生預(yù)期的工作能力;第二類任務(wù)是通過預(yù)期評(píng)估挑選出來的學(xué)生才能參與的進(jìn)階任務(wù),它大部分由不知道答案的開放性問題組成,這些設(shè)置合理問題是幫助構(gòu)建豐富MOOC資源平臺(tái)的關(guān)鍵。基礎(chǔ)任務(wù)是按照課程的不同章節(jié)知識(shí)塊來設(shè)置的,但是進(jìn)階任務(wù)既可以是單知識(shí)塊內(nèi)的任務(wù),也可以是跨不同知識(shí)塊的任務(wù)。由于進(jìn)階任務(wù)是構(gòu)建MOOC資源的核心,在學(xué)生參與時(shí)需要評(píng)估他們的預(yù)期工作能力,并且進(jìn)階任務(wù)大多數(shù)是跨越不同知識(shí)塊綜合任務(wù),所以必須全面考慮學(xué)生在該進(jìn)階任務(wù)相關(guān)聯(lián)的基礎(chǔ)任務(wù)中的綜合表現(xiàn)。文中提出任務(wù)知識(shí)關(guān)聯(lián)矩陣這個(gè)關(guān)鍵概念,并設(shè)計(jì)了能力評(píng)估和任務(wù)分配的詳細(xì)算法流程。
定義4:假設(shè)一門課程有m項(xiàng)進(jìn)階任務(wù),用Ti(1≤i≤m)表示每項(xiàng)進(jìn)階任務(wù),用TDBi(1≤i≤m)表示存放每項(xiàng)進(jìn)階任務(wù)所有學(xué)生的能力評(píng)估得分,用WDBi(1≤i≤m)存放滿足參與進(jìn)階任務(wù)條件的學(xué)生。
定義5:一門課程有n個(gè)學(xué)生,用Wj(1≤j≤n)表示每個(gè)學(xué)生。
定義6:一門課程有k個(gè)知識(shí)塊,每個(gè)知識(shí)塊對(duì)應(yīng)一組基礎(chǔ)任務(wù),其中用Bt(1≤t≤k)表示知識(shí)塊,用FTt(1≤t≤k)表示一組基礎(chǔ)任務(wù),知識(shí)塊得分?jǐn)?shù)據(jù)庫(kù)BDBt(1≤t≤k),存儲(chǔ)每個(gè)知識(shí)塊所有學(xué)生的得分。
定義7:知識(shí)塊與進(jìn)階任務(wù)的關(guān)聯(lián)矩陣,用R來表示關(guān)聯(lián)矩陣,btti(1≤t≤k,1≤i≤m)表示第t個(gè)知識(shí)塊與第i項(xiàng)進(jìn)階任務(wù)的關(guān)系,取值為0或者1,1表示任務(wù)跟該知識(shí)塊有關(guān)聯(lián),0則表示兩者無關(guān)聯(lián)。
(3)
定義8:篩選因子FF(filter factor)表示根據(jù)排名從學(xué)生中篩選出參加進(jìn)階任務(wù)的百分比,取值為(0 算法2:基于黃金標(biāo)準(zhǔn)和任務(wù)知識(shí)關(guān)聯(lián)的學(xué)生預(yù)期工作能力評(píng)估與任務(wù)分配算法。 1:輸入:Ti,Wj,Bt,F(xiàn)Tt,R,F(xiàn)F 2:輸出:WDBi(1≤i≤m) 3:學(xué)生在完成每個(gè)知識(shí)塊學(xué)習(xí)之后參加對(duì)應(yīng)的一組基礎(chǔ)任務(wù)FTt(1≤t≤k),系統(tǒng)自動(dòng)評(píng)分并存放進(jìn)入BDBt數(shù)據(jù)庫(kù) 4:foreachTi(1≤i≤m) do 5:從關(guān)聯(lián)矩陣R中取出第i列 6:foreachBt(1≤t≤k) do 7:讀取btti用于判斷進(jìn)階任務(wù)Ti與每個(gè)知識(shí)塊Bt之間的關(guān)聯(lián) 8:if(btti==1) 9:將BDBt數(shù)據(jù)庫(kù)對(duì)應(yīng)第t知識(shí)塊的所有學(xué)生得分加入TDBi中 10:end if 11:end for 12:將第i個(gè)進(jìn)階任務(wù)所有學(xué)生的能力評(píng)估得分TDBi轉(zhuǎn)為百分制得分進(jìn)行排序 13:從TDBi中取出前n*FF個(gè)學(xué)生得分記錄存入WDBi 14:判斷WDBi是否有學(xué)生得分低于FWCT,如果有將其從中剔除WDBi 15:end for 算法時(shí)間復(fù)雜度分析:假設(shè)對(duì)每個(gè)知識(shí)塊關(guān)聯(lián)處理時(shí)間為t,一門課程包含m個(gè)進(jìn)階任務(wù),每個(gè)進(jìn)階任務(wù)與k個(gè)知識(shí)塊相關(guān)聯(lián),則算法計(jì)算時(shí)間總的開銷為:T=m×k×t,計(jì)算復(fù)雜度表示為O(N2)。由于k的取值相對(duì)較小,一般一門課程大概分為50-100個(gè)知識(shí)塊左右,相對(duì)于一門課程上萬甚至十萬級(jí)別學(xué)生這個(gè)數(shù)量級(jí)來說,k可以忽略不計(jì),因此時(shí)間復(fù)雜度約等于O(N),算法運(yùn)行時(shí)間總開銷主要取決于選課學(xué)生數(shù)量。 本節(jié)主要在任務(wù)課程關(guān)聯(lián)、任務(wù)知識(shí)關(guān)聯(lián)兩個(gè)方面對(duì)方案提出的兩種算法進(jìn)行驗(yàn)證,利用教務(wù)數(shù)據(jù)和MOOC平臺(tái)的使用數(shù)據(jù)進(jìn)行測(cè)試,并配置方案的最佳參數(shù)值,最后與其他方法的應(yīng)用效果進(jìn)行測(cè)試對(duì)比。 為了驗(yàn)證課程關(guān)聯(lián)規(guī)則是否能靈活地解決學(xué)生選課的準(zhǔn)入判斷,在MOOC平臺(tái)選取三門課程,對(duì)選課學(xué)生沒有加入任何準(zhǔn)入判斷(NR),但是對(duì)滿足靜態(tài)課程設(shè)置規(guī)則(SR)、提出的課程關(guān)聯(lián)規(guī)則(AR)這兩種規(guī)則的學(xué)生分別進(jìn)行標(biāo)注和跟蹤,并針對(duì)這三種情況下學(xué)生參加人數(shù)、完成基礎(chǔ)任務(wù)平均得分兩個(gè)維度進(jìn)行測(cè)試對(duì)比,結(jié)果如圖3所示。 從圖3可以看出,在沒有任何準(zhǔn)入過濾下,雖然參加的學(xué)生人數(shù)是最多的,但是學(xué)生的基礎(chǔ)參差不齊,完成任務(wù)平均分?jǐn)?shù)最低;靜態(tài)課程規(guī)則由于是根據(jù)培養(yǎng)方案靜態(tài)設(shè)置,對(duì)學(xué)生過濾也是最嚴(yán)格的,即使學(xué)生具備學(xué)習(xí)本課程的能力,也會(huì)因?yàn)闆]有完成靜態(tài)規(guī)則對(duì)應(yīng)的先修課程直接被過濾掉,所以它參加人數(shù)是最少的。文中提出的課程關(guān)聯(lián)規(guī)則通過成績(jī)挖掘出更多課程關(guān)聯(lián)規(guī)則,一方面能最大限度地滿足學(xué)生選課的要求,另一方面所選取的學(xué)生能很好地完成課程學(xué)習(xí)和眾包任務(wù),靜態(tài)規(guī)則和課程關(guān)聯(lián)規(guī)則下學(xué)生完成基礎(chǔ)任務(wù)能力差距微小。說明文中提出的算法在人數(shù)限制和能力限制這兩方面做到了很好地均衡,較好地滿足了平臺(tái)的實(shí)際需求。 在第1.3節(jié)中提出算法通過進(jìn)階任務(wù)與知識(shí)塊之間的關(guān)聯(lián)關(guān)系來評(píng)估學(xué)生預(yù)期工作能力從而進(jìn)行任務(wù)分配,下面通過兩個(gè)實(shí)驗(yàn)測(cè)試算法效果。第1個(gè)實(shí)驗(yàn)主要是通過測(cè)試分配結(jié)果不斷優(yōu)化算法參數(shù)來獲得更優(yōu)性能。文中地眾包任務(wù)分配算法有兩個(gè)關(guān)鍵參數(shù),分別是篩選因子FF和篩選工作能力閾值FWCT,它們既要保證眾包結(jié)果的效果,也要盡量滿足讓更多學(xué)生參加進(jìn)來,這是MOOC資源眾包平臺(tái)與其他眾包平臺(tái)最大地不同。下面通過幾組實(shí)驗(yàn)測(cè)試,來選擇更合適的參數(shù)值,讓算法更好地滿足和均衡MOOC平臺(tái)的兩大要求。實(shí)驗(yàn)中選取兩個(gè)參數(shù)的3組參數(shù)設(shè)置,數(shù)據(jù)如表1所示,選取一門課程中的10項(xiàng)進(jìn)階任務(wù),觀察在這3組不同參數(shù)下,文中提出的算法在每項(xiàng)任務(wù)上篩選出來的學(xué)生數(shù)量和完成每項(xiàng)進(jìn)階任務(wù)的平均得分。實(shí)驗(yàn)結(jié)果如圖4所示,可以看出,在第PS1與PS2參數(shù)下,所選學(xué)生完成進(jìn)階任務(wù)的得分差距非常小,PS2參數(shù)下得分比PS1參數(shù)得分略低1.7%左右,但是PS2參數(shù)下參與學(xué)生數(shù)量提高接近10%左右,可以讓更多學(xué)生參與學(xué)習(xí)任務(wù)中,較好地達(dá)到了平臺(tái)的兩個(gè)要求;PS3參數(shù)下雖然參加人數(shù)提高了,但是得分明顯降低較多,10項(xiàng)任務(wù)平均得分比PS2參數(shù)下低5.1%左右。通過上面的分析結(jié)果可以得出,算法在第2組參數(shù)下能取得不錯(cuò)的效果,較好地滿足平臺(tái)需求。 表1 不同篩選因子和篩選閾值取值 圖4 不同參數(shù)下算法效果對(duì)比 第2個(gè)實(shí)驗(yàn)主要驗(yàn)證算法篩選出的學(xué)生的工作能力,通過下面兩種方法對(duì)比挑選出來的學(xué)生完成進(jìn)階任務(wù)的得分。方法1是所有任務(wù)都是直接根據(jù)學(xué)生在本課程所有知識(shí)塊平均得分來分配,方法2則是文中提出的通過計(jì)算每個(gè)任務(wù)在其關(guān)聯(lián)知識(shí)塊上面的得分來挑選學(xué)生。實(shí)驗(yàn)中同樣任意挑選某門課程的10項(xiàng)進(jìn)階任務(wù),然后通過上述兩種方法來挑選學(xué)生完成這10個(gè)進(jìn)階任務(wù),接著對(duì)進(jìn)階任務(wù)的完成效果進(jìn)行評(píng)估打分,結(jié)果如圖5所示??梢钥闯?,文中算法篩選的學(xué)生在每項(xiàng)任務(wù)的平均得分都要高于方法1,并且10項(xiàng)任務(wù)的平均得分高出5%左右,能較好地滿足構(gòu)建資源的需求。 圖5 篩選學(xué)生完成眾包任務(wù)能力對(duì)比 在高校MOOC平臺(tái)不斷發(fā)展的背景下,利用眾包策略構(gòu)建MOOC學(xué)習(xí)平臺(tái)的資源庫(kù),讓學(xué)習(xí)者和教師構(gòu)成學(xué)習(xí)共同體,在完成新知識(shí)學(xué)習(xí)的同時(shí)進(jìn)行MOOC資源建設(shè)。為了解決這種知識(shí)密集型的眾包任務(wù),提出一種針對(duì)高校MOOC資源眾包平臺(tái)的任務(wù)分配方案,它包含學(xué)生的準(zhǔn)入篩選、預(yù)期工作能力評(píng)估兩個(gè)階段。首先利用課程關(guān)聯(lián)規(guī)則進(jìn)行學(xué)生準(zhǔn)入判斷;其次利用知識(shí)關(guān)聯(lián)進(jìn)行能力評(píng)估與任務(wù)分配,最后對(duì)方案進(jìn)行測(cè)試驗(yàn)證,結(jié)果表明該方案能夠能較好地保證學(xué)生的挑選和任務(wù)分配效果,促進(jìn)構(gòu)建更高質(zhì)量的MOOC資源。2 實(shí)驗(yàn)結(jié)果及分析
2.1 融合課程關(guān)聯(lián)規(guī)則的準(zhǔn)入篩選實(shí)驗(yàn)
2.2 融合知識(shí)關(guān)聯(lián)的眾包任務(wù)分配實(shí)驗(yàn)
3 結(jié)束語