融合關(guān)聯(lián)規(guī)則的MOOC資源眾包平臺(tái)任務(wù)分配算法

2020-04-30 04:26潘志宏萬智萍謝海明

計(jì)算機(jī)技術(shù)與發(fā)展 2020年4期

關(guān)鍵詞：項(xiàng)集進(jìn)階關(guān)聯(lián)

潘志宏，萬智萍，謝海明

(1.中山大學(xué)新華學(xué)院，廣東廣州 510520；2.中國(guó)移動(dòng)通信集團(tuán)廣東有限公司，廣東廣州 510623)

0 引言

近年來隨著移動(dòng)互聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算等技術(shù)的不斷發(fā)展，國(guó)內(nèi)外涌現(xiàn)大批MOOC平臺(tái)，它讓學(xué)習(xí)者根據(jù)不同的學(xué)習(xí)主題形成學(xué)習(xí)圈，并通過社交網(wǎng)絡(luò)構(gòu)建學(xué)習(xí)群體。但目前大部分MOOC平臺(tái)的課程資源僅依靠平臺(tái)方來建設(shè)，學(xué)習(xí)者只需要按部就班地學(xué)習(xí)課程內(nèi)容，這種模式具有一定的局限性。首先學(xué)習(xí)者會(huì)比較被動(dòng)地學(xué)習(xí)平臺(tái)所提供的資源，缺乏參與學(xué)習(xí)的主動(dòng)性；其次平臺(tái)學(xué)習(xí)資源僅依靠一方來維護(hù)，很難保證內(nèi)容的多樣性。因此為了提升學(xué)習(xí)者的主動(dòng)性以及平臺(tái)資源庫(kù)的豐富性，有學(xué)者提出將眾包理念融入MOOC平臺(tái)[1-4]，讓學(xué)習(xí)者和教師構(gòu)成學(xué)習(xí)共同體，在完成新知識(shí)學(xué)習(xí)的同時(shí)進(jìn)行資源庫(kù)建設(shè)。通過眾包協(xié)同構(gòu)建MOOC資源的步驟如下：首先，教師通過MOOC平臺(tái)發(fā)布任務(wù)，包含以校驗(yàn)學(xué)習(xí)效果為主的基礎(chǔ)型任務(wù)、以構(gòu)建MOOC資源為主的開放型任務(wù)、以評(píng)估他人任務(wù)完成效果為主的評(píng)估型任務(wù)等各種類型眾包任務(wù)，這些設(shè)置合理的眾包任務(wù)一方面讓學(xué)生融入課程學(xué)習(xí)的全過程，另一方面協(xié)助MOOC平臺(tái)資源的動(dòng)態(tài)更新；其次，設(shè)計(jì)眾包質(zhì)量控制策略保證眾包任務(wù)在實(shí)現(xiàn)教學(xué)功能的前提下幫助平臺(tái)構(gòu)建更高質(zhì)量的MOOC資源也是非常重要的問題。

在眾包研究中質(zhì)量控制一直是重點(diǎn)和熱點(diǎn)，主要集中在眾包任務(wù)分配和眾包任務(wù)評(píng)估兩方面[5-7]，其中合理分配眾包任務(wù)是獲得優(yōu)秀眾包結(jié)果的核心基礎(chǔ)，不同類型的平臺(tái)有不同的任務(wù)分配策略。第一類眾包平臺(tái)通常被用來發(fā)布簡(jiǎn)單的微任務(wù)，對(duì)參與者的技能要求不高，它更多時(shí)候采用的是先來先得的任務(wù)分配方式，比如通過亞馬遜AMT發(fā)布標(biāo)注圖片任務(wù)[7]；第二類眾包平臺(tái)雖然對(duì)參與者的知識(shí)技能要求不高，但是對(duì)參與者的位置、時(shí)間有嚴(yán)格要求，比如通過群智感知平臺(tái)收集移動(dòng)終端用戶的感知位置、時(shí)間、照片等信息獲得城市交通、環(huán)境等情況[8-9]；第三類是知識(shí)密集型眾包任務(wù)，對(duì)參與者的知識(shí)技能水平都有特定的要求，比如眾包翻譯[10]、軟件眾包平臺(tái)TopCoder[11]等。高校MOOC資源眾包平臺(tái)上的任務(wù)就屬于知識(shí)密集型任務(wù)，因此挑選合適的任務(wù)參與者至關(guān)重要，它關(guān)系到MOOC資源的構(gòu)建質(zhì)量。文中利用課程、學(xué)生知識(shí)技能與眾包任務(wù)的關(guān)聯(lián)關(guān)系來設(shè)計(jì)任務(wù)分配算法，并將任務(wù)分發(fā)至最合適的學(xué)生來完成，以構(gòu)建更高質(zhì)量的MOOC資源庫(kù)。

主要貢獻(xiàn)在于提出一種針對(duì)高校MOOC資源眾包平臺(tái)的任務(wù)分配方案，它包含學(xué)生的準(zhǔn)入篩選、預(yù)期工作能力評(píng)估與任務(wù)分配兩個(gè)階段。方案首先設(shè)計(jì)基于改進(jìn)Apriori的課程關(guān)聯(lián)規(guī)則生成算法[12]對(duì)學(xué)生選課進(jìn)行準(zhǔn)入篩選；其次設(shè)計(jì)基于黃金標(biāo)準(zhǔn)和知識(shí)關(guān)聯(lián)的學(xué)生預(yù)期工作能力評(píng)估與任務(wù)分配算法，將眾包任務(wù)分配到工作能力最合適的學(xué)生；最后分別在任務(wù)課程關(guān)聯(lián)、任務(wù)知識(shí)關(guān)聯(lián)兩個(gè)方面對(duì)方案的實(shí)現(xiàn)效果進(jìn)行測(cè)試驗(yàn)證，測(cè)試結(jié)果表明，該方案能夠較好地提高M(jìn)OOC資源的構(gòu)建效果。

1 高校MOOC資源眾包平臺(tái)的任務(wù)分配策略

挑選合適的任務(wù)參與者對(duì)知識(shí)密集型眾包任務(wù)是非常關(guān)鍵的，它是獲得高質(zhì)量眾包結(jié)果的重要保證。文中從學(xué)生選課準(zhǔn)入篩選、學(xué)生能力評(píng)估和任務(wù)分配兩個(gè)方面來設(shè)計(jì)MOOC資源眾包平臺(tái)的任務(wù)分配方案，并設(shè)計(jì)詳細(xì)的算法流程。

1.1 構(gòu)建高校MOOC資源平臺(tái)的眾包任務(wù)分配方案

一般眾包平臺(tái)都想用盡量少的成本雇傭合適的人以高質(zhì)量地完成眾包任務(wù)，但是高校MOOC資源眾包平臺(tái)在眾包人員的選擇上具有特殊性。首先平臺(tái)強(qiáng)調(diào)參與廣度，讓更多學(xué)生能受惠于優(yōu)質(zhì)的學(xué)習(xí)資源；其次平臺(tái)任務(wù)屬于知識(shí)密集型眾包任務(wù)，對(duì)知識(shí)和技能要求較高，所以必須對(duì)學(xué)生的技能進(jìn)行一定的評(píng)估篩選，以確認(rèn)學(xué)生更好地完成課程學(xué)習(xí)和構(gòu)建MOOC資源的任務(wù)；最后普通眾包平臺(tái)通常會(huì)因?yàn)槌杀締栴}，在進(jìn)行眾包質(zhì)量控制時(shí)盡量避免使用太多冗余人員來獲得更高質(zhì)量的結(jié)果，但這卻是高校MOOC平臺(tái)的優(yōu)勢(shì)，它沒有成本限制，可以讓更多的學(xué)生參與同樣的任務(wù)，從而獲得更高質(zhì)量的MOOC資源庫(kù)。

針對(duì)上述三個(gè)特點(diǎn)，首先提出基于改進(jìn)Apriori的課程關(guān)聯(lián)規(guī)則生成算法，在課程準(zhǔn)入方面對(duì)學(xué)生進(jìn)行初步篩選，其次提出黃金標(biāo)準(zhǔn)和知識(shí)關(guān)聯(lián)的學(xué)生預(yù)期工作能力評(píng)估與任務(wù)分配算法，在不同知識(shí)塊對(duì)學(xué)生預(yù)期任務(wù)工作能力進(jìn)行多維度評(píng)估，保證他們有能力完成眾包任務(wù)。圖1給出了高校MOOC眾包資源平臺(tái)的任務(wù)分配工作流程，包含學(xué)生準(zhǔn)入篩選、工作能力評(píng)估與任務(wù)分配兩大模塊。

圖1 MOOC平臺(tái)任務(wù)分配工作流程

1.2 基于課程關(guān)聯(lián)規(guī)則的學(xué)生準(zhǔn)入篩選

學(xué)生準(zhǔn)入篩選階段，判斷學(xué)生是否具備完成課程學(xué)習(xí)和完成相應(yīng)眾包任務(wù)的知識(shí)儲(chǔ)備，一般情況下高校會(huì)采用人才培養(yǎng)方案的先修課程規(guī)則對(duì)學(xué)生進(jìn)行初步過濾準(zhǔn)入，這種通過靜態(tài)課程設(shè)置規(guī)則進(jìn)行簡(jiǎn)單限制具有一定的缺陷，首先它不能很好地過濾出更多滿足條件的學(xué)生，其次也不能較好地適應(yīng)不斷更新的高校MOOC平臺(tái)的課程體系。針對(duì)這種情況，文中利用改進(jìn)Apriori算法對(duì)不同課程成績(jī)進(jìn)行分析從而得到課程之間的關(guān)聯(lián)規(guī)則[12]，一方面可以進(jìn)行選課準(zhǔn)入篩選，另一方面當(dāng)學(xué)生沒有完成相關(guān)先修課程或者沒有通過課前能力測(cè)試時(shí)，可以通過課程關(guān)聯(lián)規(guī)則推薦相關(guān)先修課程給學(xué)生學(xué)習(xí)。

首先高校MOOC平臺(tái)與本校教務(wù)系統(tǒng)對(duì)接獲取課程成績(jī)數(shù)據(jù)源；接著進(jìn)行課程關(guān)聯(lián)規(guī)則生成，主要分為三個(gè)步驟：第一對(duì)成績(jī)數(shù)據(jù)進(jìn)行預(yù)處理；第二根據(jù)課程成績(jī)數(shù)據(jù)找出有效的頻繁項(xiàng)集；第三從生成的頻繁項(xiàng)集中生成高置信度課程關(guān)聯(lián)規(guī)則；最后將規(guī)則保存至對(duì)應(yīng)數(shù)據(jù)庫(kù)，以供用戶準(zhǔn)入過濾使用。詳細(xì)流程如算法1所示，為了算法描述方便，做如下定義。

定義1：數(shù)據(jù)項(xiàng)集I={i1,i2,…,im}，集合X?I為項(xiàng)集，Tn=為每個(gè)事務(wù)，D={T1,T2,…,Tn}為事務(wù)數(shù)據(jù)庫(kù)，Im=ItemDB為項(xiàng)目事務(wù)數(shù)據(jù)庫(kù)，tmSet表示包含im事務(wù)的所有事務(wù)id集合。

定義2：X→Y表示課程關(guān)聯(lián)規(guī)則，支持度用support(X→Y)表示，它代表X、Y同時(shí)出現(xiàn)在D中的概率，計(jì)算公式如式(1)所示。其中sup(XY)表示XY在D中同時(shí)出現(xiàn)的次數(shù)，Count(D)表示D中事務(wù)的總數(shù)量。置信度用conf(X→Y)表示，它代表X出現(xiàn)，Y也出現(xiàn)的概率，計(jì)算公式如式(2)所示。其中sup(X)表示X在D中出現(xiàn)的次數(shù)。

(1)

(2)

定義3：Lk表示頻繁K項(xiàng)集，Ck表示候選項(xiàng)集，最小支持閾值為minsup，最小置信度為minconf,規(guī)則數(shù)據(jù)庫(kù)為RDB。

算法1：基于改進(jìn)Apriori的課程關(guān)聯(lián)規(guī)則生成算法。

1：初始化：設(shè)置minsup，minconf初始值。

2：數(shù)據(jù)采集與預(yù)處理：首先通過API接口對(duì)教務(wù)系統(tǒng)的學(xué)生課程成績(jī)進(jìn)行采集，將成績(jī)進(jìn)行離散化。文中只是為了分析學(xué)生學(xué)好某門課程能否學(xué)好另外一門課程，因此只分是否優(yōu)秀等級(jí)，85～100為優(yōu)秀等級(jí)，用“1”表示，0～84為不優(yōu)秀等級(jí)，用“0”表示，將課程用KCn(n≥1)表示，經(jīng)過預(yù)處理后生成事務(wù)數(shù)據(jù)庫(kù)D。

3：產(chǎn)生有效的課程頻繁項(xiàng)集。

將事務(wù)數(shù)據(jù)庫(kù)D轉(zhuǎn)化為垂直結(jié)構(gòu)的項(xiàng)目事務(wù)數(shù)據(jù)ItemDB，接著掃描項(xiàng)目事務(wù)數(shù)據(jù)ItemDB并根據(jù)最小支持度獲得頻繁1項(xiàng)集L1=find_frequent_1-itemsets(ItemDB)

for(k=2;Lk-1≠?;k++) do

Ck=Apriori_gen(Lk-1)//生成新的候選項(xiàng)集

foreachiin ItemDB do //i表示ItemDB中每個(gè)項(xiàng)目事務(wù)

Ci=subset(Ck,i) //獲取i中包含的候選項(xiàng)集

foreachcinCido//c表示Ci中每個(gè)候選項(xiàng)

c.count++

end

Lk={c∈Ck|c.count≥minsup}

end

L=UkLk//返回所有頻繁項(xiàng)集k

4：生成課程關(guān)聯(lián)規(guī)則。

foreachLkinL,其中k≥2 do

A←{X|X?Lk,X≠?}//初始化前件集合

whileA≠? do

X←A中的最大元素

A←AX//從A中刪除X

conf=sup(Lk)/sup(X)

if(conf≥minconf) then

outputX→Y,support(Lk),conf并存入RDB

else

A←A(〗W|W?X} //從A刪除X所有子集

end while

end for

算法性能優(yōu)化分析：一般Apriori算法在計(jì)算項(xiàng)集時(shí)會(huì)掃描原始數(shù)據(jù)表，在面對(duì)大規(guī)模數(shù)據(jù)時(shí)會(huì)顯得性能較低，文中主要從三個(gè)方面來優(yōu)化算法性能問題：第一在算法步驟2中采用離散化對(duì)數(shù)據(jù)進(jìn)行預(yù)處理并保存事務(wù)數(shù)據(jù)庫(kù)，這樣就會(huì)降低數(shù)據(jù)掃描和處理的速度；第二在算法步驟3中將事務(wù)數(shù)據(jù)庫(kù)D轉(zhuǎn)化為垂直結(jié)構(gòu)的項(xiàng)目事務(wù)數(shù)據(jù)ItemDB[13]，記錄并統(tǒng)計(jì)每個(gè)1項(xiàng)集出現(xiàn)次數(shù)并根據(jù)最小支持度刪除不滿足的項(xiàng)集，從而生成新的數(shù)據(jù)庫(kù)，然后用Apriori算法的連接，同時(shí)求連接項(xiàng)目的記錄交集，重新生成記錄數(shù)據(jù)庫(kù)，這樣就避免了重新掃描原始數(shù)據(jù)庫(kù)，而且生成的頻繁項(xiàng)目集越多，掃描的數(shù)據(jù)庫(kù)就會(huì)越小，從而提高了運(yùn)行效率；第三由于平臺(tái)新增課程更新速度較小，在算法步驟4中將生成規(guī)則保存至規(guī)則數(shù)據(jù)庫(kù)，只有新增課程時(shí)才會(huì)啟動(dòng)課程關(guān)聯(lián)算法。從空間復(fù)雜度看，每次產(chǎn)生頻繁項(xiàng)集后，數(shù)據(jù)庫(kù)不斷減小，減少占用內(nèi)存空間；從時(shí)間復(fù)雜度看，改進(jìn)Apriori算法節(jié)約了剪枝步驟中頻繁項(xiàng)集的比較次數(shù)，大大提升了算法運(yùn)行效率。

兩種算法在不同最小支持度下的時(shí)間總開銷對(duì)比如圖2所示。

圖2 兩種算法在不同最小支持度下的時(shí)間總開銷對(duì)比

1.3 基于黃金標(biāo)準(zhǔn)和任務(wù)知識(shí)關(guān)聯(lián)的學(xué)生預(yù)期工作能力評(píng)估與任務(wù)分配算法

眾包平臺(tái)都想獲得更優(yōu)秀的眾包結(jié)果，因此非常關(guān)注任務(wù)參與者的工作能力與眾包任務(wù)的匹配度，故設(shè)計(jì)分配算法將任務(wù)分配到匹配度最高的參與者就成為研究重點(diǎn)。文中提出了基于黃金標(biāo)準(zhǔn)和任務(wù)知識(shí)關(guān)聯(lián)的學(xué)生預(yù)期工作能力評(píng)估與任務(wù)分配算法，首先是利用具有黃金標(biāo)準(zhǔn)答案的基礎(chǔ)任務(wù)對(duì)學(xué)生預(yù)期工作能力進(jìn)行評(píng)估，接著在學(xué)生參加某個(gè)進(jìn)階任務(wù)時(shí)需要對(duì)學(xué)生進(jìn)行綜合評(píng)估，評(píng)估重點(diǎn)為學(xué)生在與該進(jìn)階任務(wù)相關(guān)聯(lián)的基礎(chǔ)任務(wù)中的完成情況，以此確定是否參加進(jìn)階任務(wù)[14-15]。

高校MOOC資源平臺(tái)有兩類任務(wù)：第一類是課程學(xué)生都必須參與的基礎(chǔ)任務(wù)，它由具有黃金標(biāo)準(zhǔn)答案的客觀問題構(gòu)成，可以通過它來評(píng)估學(xué)生預(yù)期的工作能力；第二類任務(wù)是通過預(yù)期評(píng)估挑選出來的學(xué)生才能參與的進(jìn)階任務(wù)，它大部分由不知道答案的開放性問題組成，這些設(shè)置合理問題是幫助構(gòu)建豐富MOOC資源平臺(tái)的關(guān)鍵。基礎(chǔ)任務(wù)是按照課程的不同章節(jié)知識(shí)塊來設(shè)置的，但是進(jìn)階任務(wù)既可以是單知識(shí)塊內(nèi)的任務(wù)，也可以是跨不同知識(shí)塊的任務(wù)。由于進(jìn)階任務(wù)是構(gòu)建MOOC資源的核心，在學(xué)生參與時(shí)需要評(píng)估他們的預(yù)期工作能力，并且進(jìn)階任務(wù)大多數(shù)是跨越不同知識(shí)塊綜合任務(wù)，所以必須全面考慮學(xué)生在該進(jìn)階任務(wù)相關(guān)聯(lián)的基礎(chǔ)任務(wù)中的綜合表現(xiàn)。文中提出任務(wù)知識(shí)關(guān)聯(lián)矩陣這個(gè)關(guān)鍵概念，并設(shè)計(jì)了能力評(píng)估和任務(wù)分配的詳細(xì)算法流程。

定義4：假設(shè)一門課程有m項(xiàng)進(jìn)階任務(wù)，用Ti(1≤i≤m)表示每項(xiàng)進(jìn)階任務(wù)，用TDBi(1≤i≤m)表示存放每項(xiàng)進(jìn)階任務(wù)所有學(xué)生的能力評(píng)估得分，用WDBi(1≤i≤m)存放滿足參與進(jìn)階任務(wù)條件的學(xué)生。

定義5：一門課程有n個(gè)學(xué)生，用Wj(1≤j≤n)表示每個(gè)學(xué)生。

定義6：一門課程有k個(gè)知識(shí)塊，每個(gè)知識(shí)塊對(duì)應(yīng)一組基礎(chǔ)任務(wù)，其中用Bt(1≤t≤k)表示知識(shí)塊，用FTt(1≤t≤k)表示一組基礎(chǔ)任務(wù)，知識(shí)塊得分?jǐn)?shù)據(jù)庫(kù)BDBt(1≤t≤k)，存儲(chǔ)每個(gè)知識(shí)塊所有學(xué)生的得分。

定義7：知識(shí)塊與進(jìn)階任務(wù)的關(guān)聯(lián)矩陣，用R來表示關(guān)聯(lián)矩陣，btti(1≤t≤k,1≤i≤m)表示第t個(gè)知識(shí)塊與第i項(xiàng)進(jìn)階任務(wù)的關(guān)系，取值為0或者1，1表示任務(wù)跟該知識(shí)塊有關(guān)聯(lián)，0則表示兩者無關(guān)聯(lián)。

(3)

定義8：篩選因子FF(filter factor)表示根據(jù)排名從學(xué)生中篩選出參加進(jìn)階任務(wù)的百分比，取值為(0

算法2：基于黃金標(biāo)準(zhǔn)和任務(wù)知識(shí)關(guān)聯(lián)的學(xué)生預(yù)期工作能力評(píng)估與任務(wù)分配算法。

1：輸入：Ti，Wj，Bt，F(xiàn)Tt，R，F(xiàn)F

2：輸出：WDBi(1≤i≤m)

3：學(xué)生在完成每個(gè)知識(shí)塊學(xué)習(xí)之后參加對(duì)應(yīng)的一組基礎(chǔ)任務(wù)FTt(1≤t≤k)，系統(tǒng)自動(dòng)評(píng)分并存放進(jìn)入BDBt數(shù)據(jù)庫(kù)

4：foreachTi(1≤i≤m) do

5：從關(guān)聯(lián)矩陣R中取出第i列

6：foreachBt(1≤t≤k) do

7：讀取btti用于判斷進(jìn)階任務(wù)Ti與每個(gè)知識(shí)塊Bt之間的關(guān)聯(lián)

8：if(btti==1)

9：將BDBt數(shù)據(jù)庫(kù)對(duì)應(yīng)第t知識(shí)塊的所有學(xué)生得分加入TDBi中

10：end if

11：end for

12：將第i個(gè)進(jìn)階任務(wù)所有學(xué)生的能力評(píng)估得分TDBi轉(zhuǎn)為百分制得分進(jìn)行排序

13：從TDBi中取出前n*FF個(gè)學(xué)生得分記錄存入WDBi

14：判斷WDBi是否有學(xué)生得分低于FWCT，如果有將其從中剔除WDBi

15：end for

算法時(shí)間復(fù)雜度分析：假設(shè)對(duì)每個(gè)知識(shí)塊關(guān)聯(lián)處理時(shí)間為t，一門課程包含m個(gè)進(jìn)階任務(wù)，每個(gè)進(jìn)階任務(wù)與k個(gè)知識(shí)塊相關(guān)聯(lián)，則算法計(jì)算時(shí)間總的開銷為：T=m×k×t，計(jì)算復(fù)雜度表示為O(N2)。由于k的取值相對(duì)較小，一般一門課程大概分為50-100個(gè)知識(shí)塊左右，相對(duì)于一門課程上萬甚至十萬級(jí)別學(xué)生這個(gè)數(shù)量級(jí)來說，k可以忽略不計(jì)，因此時(shí)間復(fù)雜度約等于O(N)，算法運(yùn)行時(shí)間總開銷主要取決于選課學(xué)生數(shù)量。

2 實(shí)驗(yàn)結(jié)果及分析

本節(jié)主要在任務(wù)課程關(guān)聯(lián)、任務(wù)知識(shí)關(guān)聯(lián)兩個(gè)方面對(duì)方案提出的兩種算法進(jìn)行驗(yàn)證，利用教務(wù)數(shù)據(jù)和MOOC平臺(tái)的使用數(shù)據(jù)進(jìn)行測(cè)試，并配置方案的最佳參數(shù)值，最后與其他方法的應(yīng)用效果進(jìn)行測(cè)試對(duì)比。

2.1 融合課程關(guān)聯(lián)規(guī)則的準(zhǔn)入篩選實(shí)驗(yàn)

為了驗(yàn)證課程關(guān)聯(lián)規(guī)則是否能靈活地解決學(xué)生選課的準(zhǔn)入判斷，在MOOC平臺(tái)選取三門課程，對(duì)選課學(xué)生沒有加入任何準(zhǔn)入判斷(NR)，但是對(duì)滿足靜態(tài)課程設(shè)置規(guī)則(SR)、提出的課程關(guān)聯(lián)規(guī)則(AR)這兩種規(guī)則的學(xué)生分別進(jìn)行標(biāo)注和跟蹤，并針對(duì)這三種情況下學(xué)生參加人數(shù)、完成基礎(chǔ)任務(wù)平均得分兩個(gè)維度進(jìn)行測(cè)試對(duì)比，結(jié)果如圖3所示。

從圖3可以看出，在沒有任何準(zhǔn)入過濾下，雖然參加的學(xué)生人數(shù)是最多的，但是學(xué)生的基礎(chǔ)參差不齊，完成任務(wù)平均分?jǐn)?shù)最低；靜態(tài)課程規(guī)則由于是根據(jù)培養(yǎng)方案靜態(tài)設(shè)置，對(duì)學(xué)生過濾也是最嚴(yán)格的，即使學(xué)生具備學(xué)習(xí)本課程的能力，也會(huì)因?yàn)闆]有完成靜態(tài)規(guī)則對(duì)應(yīng)的先修課程直接被過濾掉，所以它參加人數(shù)是最少的。文中提出的課程關(guān)聯(lián)規(guī)則通過成績(jī)挖掘出更多課程關(guān)聯(lián)規(guī)則，一方面能最大限度地滿足學(xué)生選課的要求，另一方面所選取的學(xué)生能很好地完成課程學(xué)習(xí)和眾包任務(wù)，靜態(tài)規(guī)則和課程關(guān)聯(lián)規(guī)則下學(xué)生完成基礎(chǔ)任務(wù)能力差距微小。說明文中提出的算法在人數(shù)限制和能力限制這兩方面做到了很好地均衡，較好地滿足了平臺(tái)的實(shí)際需求。

2.2 融合知識(shí)關(guān)聯(lián)的眾包任務(wù)分配實(shí)驗(yàn)

在第1.3節(jié)中提出算法通過進(jìn)階任務(wù)與知識(shí)塊之間的關(guān)聯(lián)關(guān)系來評(píng)估學(xué)生預(yù)期工作能力從而進(jìn)行任務(wù)分配，下面通過兩個(gè)實(shí)驗(yàn)測(cè)試算法效果。第1個(gè)實(shí)驗(yàn)主要是通過測(cè)試分配結(jié)果不斷優(yōu)化算法參數(shù)來獲得更優(yōu)性能。文中地眾包任務(wù)分配算法有兩個(gè)關(guān)鍵參數(shù)，分別是篩選因子FF和篩選工作能力閾值FWCT，它們既要保證眾包結(jié)果的效果，也要盡量滿足讓更多學(xué)生參加進(jìn)來，這是MOOC資源眾包平臺(tái)與其他眾包平臺(tái)最大地不同。下面通過幾組實(shí)驗(yàn)測(cè)試，來選擇更合適的參數(shù)值，讓算法更好地滿足和均衡MOOC平臺(tái)的兩大要求。實(shí)驗(yàn)中選取兩個(gè)參數(shù)的3組參數(shù)設(shè)置，數(shù)據(jù)如表1所示，選取一門課程中的10項(xiàng)進(jìn)階任務(wù)，觀察在這3組不同參數(shù)下，文中提出的算法在每項(xiàng)任務(wù)上篩選出來的學(xué)生數(shù)量和完成每項(xiàng)進(jìn)階任務(wù)的平均得分。實(shí)驗(yàn)結(jié)果如圖4所示，可以看出，在第PS1與PS2參數(shù)下，所選學(xué)生完成進(jìn)階任務(wù)的得分差距非常小，PS2參數(shù)下得分比PS1參數(shù)得分略低1.7%左右，但是PS2參數(shù)下參與學(xué)生數(shù)量提高接近10%左右，可以讓更多學(xué)生參與學(xué)習(xí)任務(wù)中，較好地達(dá)到了平臺(tái)的兩個(gè)要求；PS3參數(shù)下雖然參加人數(shù)提高了，但是得分明顯降低較多，10項(xiàng)任務(wù)平均得分比PS2參數(shù)下低5.1%左右。通過上面的分析結(jié)果可以得出，算法在第2組參數(shù)下能取得不錯(cuò)的效果，較好地滿足平臺(tái)需求。

表1 不同篩選因子和篩選閾值取值

圖4 不同參數(shù)下算法效果對(duì)比

第2個(gè)實(shí)驗(yàn)主要驗(yàn)證算法篩選出的學(xué)生的工作能力，通過下面兩種方法對(duì)比挑選出來的學(xué)生完成進(jìn)階任務(wù)的得分。方法1是所有任務(wù)都是直接根據(jù)學(xué)生在本課程所有知識(shí)塊平均得分來分配，方法2則是文中提出的通過計(jì)算每個(gè)任務(wù)在其關(guān)聯(lián)知識(shí)塊上面的得分來挑選學(xué)生。實(shí)驗(yàn)中同樣任意挑選某門課程的10項(xiàng)進(jìn)階任務(wù)，然后通過上述兩種方法來挑選學(xué)生完成這10個(gè)進(jìn)階任務(wù)，接著對(duì)進(jìn)階任務(wù)的完成效果進(jìn)行評(píng)估打分，結(jié)果如圖5所示?？梢钥闯?，文中算法篩選的學(xué)生在每項(xiàng)任務(wù)的平均得分都要高于方法1，并且10項(xiàng)任務(wù)的平均得分高出5%左右，能較好地滿足構(gòu)建資源的需求。

圖5 篩選學(xué)生完成眾包任務(wù)能力對(duì)比

3 結(jié)束語

在高校MOOC平臺(tái)不斷發(fā)展的背景下，利用眾包策略構(gòu)建MOOC學(xué)習(xí)平臺(tái)的資源庫(kù)，讓學(xué)習(xí)者和教師構(gòu)成學(xué)習(xí)共同體，在完成新知識(shí)學(xué)習(xí)的同時(shí)進(jìn)行MOOC資源建設(shè)。為了解決這種知識(shí)密集型的眾包任務(wù)，提出一種針對(duì)高校MOOC資源眾包平臺(tái)的任務(wù)分配方案，它包含學(xué)生的準(zhǔn)入篩選、預(yù)期工作能力評(píng)估兩個(gè)階段。首先利用課程關(guān)聯(lián)規(guī)則進(jìn)行學(xué)生準(zhǔn)入判斷；其次利用知識(shí)關(guān)聯(lián)進(jìn)行能力評(píng)估與任務(wù)分配，最后對(duì)方案進(jìn)行測(cè)試驗(yàn)證，結(jié)果表明該方案能夠能較好地保證學(xué)生的挑選和任務(wù)分配效果，促進(jìn)構(gòu)建更高質(zhì)量的MOOC資源。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡