国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于K-means聚類算法的在線學(xué)習(xí)行為分析

2017-10-13 15:48:31劉訓(xùn)星
湖南科技學(xué)院學(xué)報 2017年6期
關(guān)鍵詞:宣城聚類算法

劉訓(xùn)星

?

基于K-means聚類算法的在線學(xué)習(xí)行為分析

劉訓(xùn)星

(宣城職業(yè)技術(shù)學(xué)院,安徽 宣城 242000)

K-means算法是基于距離作用相似性度量的聚類算法,論文介紹K-means聚類算法的3個基本參數(shù)。通過對學(xué)員學(xué)習(xí)行為記錄數(shù)據(jù),運用K-means聚類分析算法,可以構(gòu)建出電大學(xué)員行為特征,有效的改善在線資源的配置。

用戶行為;K-means聚類算法;初始聚類中心選??;行為特征

引 言

在信息快速發(fā)展的今天,網(wǎng)絡(luò)技術(shù)快速發(fā)展和數(shù)字化學(xué)習(xí)資源建立,為我們學(xué)習(xí)方式帶來了新的機遇和挑戰(zhàn),如何使用網(wǎng)絡(luò)組織高效學(xué)習(xí),則成為我們關(guān)注焦點。電大學(xué)員的學(xué)習(xí)方式也悄然發(fā)生改變,在線學(xué)習(xí)方式在電大教育模式中,扮演者重要的角色。電大學(xué)員就能根據(jù)自己工作和家庭的情況合理安排學(xué)習(xí)時間(靈活多變學(xué)習(xí)方式)、選擇自己學(xué)習(xí)的內(nèi)容(個性化的學(xué)習(xí)資源),同時有助于教師建立個性化教學(xué)設(shè)計、科學(xué)的學(xué)習(xí)行為評價模式、高效服務(wù)體系。國外學(xué)者主要集中在行為的理論[1]發(fā)展研究,國內(nèi)學(xué)者不少在活動評價[2]方面研究。

文中首先采集了電大宣城分校服務(wù)器對有學(xué)籍學(xué)員在線學(xué)習(xí)原始數(shù)據(jù),其次對獲取進行預(yù)處理,選擇有效數(shù)據(jù),最后運用k-means聚類算法進行數(shù)據(jù)挖掘,獲取在線學(xué)習(xí)行為模式。本課題的最大亮點是k-means聚類算法首次在電大在線學(xué)習(xí)行為模型中使用,通過對在線學(xué)習(xí)行為模式的數(shù)據(jù)挖掘分析,有效的提高電大在線教育教學(xué)質(zhì)量。

1 在線學(xué)習(xí)行為

1.1 學(xué)員在線學(xué)習(xí)行為探討

在線學(xué)習(xí)是課堂學(xué)習(xí)一種重要補充,學(xué)員利用在線學(xué)習(xí)平臺,可以學(xué)習(xí)平臺上豐富學(xué)習(xí)資源。在線學(xué)習(xí)注重媒體教學(xué)[3]和時空分離。在線學(xué)習(xí)行為主要有課件閱讀、課程視頻點播、論壇發(fā)帖討論、教學(xué)在線直播、論壇答疑解惑、學(xué)習(xí)資料下載、在線完成作業(yè)、在線自我測試等。

1.2 學(xué)員在線學(xué)習(xí)行為分析

1.2.1.學(xué)員特征分析。學(xué)員在線學(xué)習(xí)受到很多方面影響,最主要的是心理因素和環(huán)境因素兩個方面。心理因素:學(xué)習(xí)目的、掌握的學(xué)習(xí)方法、學(xué)員意志品質(zhì)。環(huán)境因素:學(xué)習(xí)內(nèi)容展現(xiàn)形式、學(xué)習(xí)輔助工具、學(xué)習(xí)平臺更新和服務(wù)。

1.2.2.學(xué)習(xí)過程分析。學(xué)員根據(jù)在線學(xué)習(xí)平臺的學(xué)習(xí)任務(wù),制定各自在線學(xué)習(xí)目標(學(xué)習(xí)目標),在學(xué)習(xí)目標的指引下主動的進行學(xué)習(xí)(自主學(xué)習(xí)),為了解決在線學(xué)習(xí)過程問題,學(xué)員之間或?qū)W員與老師之間通過平臺中論壇進行交流溝通(交流研討),在學(xué)員進行學(xué)習(xí)過程中平臺會及時將進度和評價并反饋給學(xué)員,學(xué)員依據(jù)平臺評價認真反思及時調(diào)整學(xué)習(xí)方式方法(反思性學(xué)習(xí)),最后在線平臺依據(jù)學(xué)員狀況給出每個學(xué)員學(xué)習(xí)結(jié)果(學(xué)習(xí)結(jié)果)。在整個學(xué)習(xí)過程學(xué)員之間進行學(xué)習(xí)經(jīng)驗交流溝通和學(xué)習(xí)資源共享相互協(xié)作(團隊協(xié)作)。

學(xué)員在線學(xué)習(xí)以自主學(xué)習(xí)、協(xié)同學(xué)習(xí)為主,還包括情景學(xué)習(xí)[4]。自主學(xué)習(xí)是以學(xué)員自己為主體,使用網(wǎng)絡(luò)資源,進行探索、創(chuàng)造、實踐來達到學(xué)習(xí)目標方式。協(xié)同學(xué)習(xí)是網(wǎng)絡(luò)發(fā)展以中新趨勢,學(xué)員們可以使用網(wǎng)絡(luò)平臺就學(xué)習(xí)內(nèi)容進行交流溝通、分享學(xué)習(xí)資源,從而達到共同進步。情景學(xué)習(xí)內(nèi)容豐富內(nèi)涵深刻,是一種嶄新的學(xué)習(xí)視角,是一種將從孤立學(xué)習(xí)到維系在具體情景中的過程、是一種學(xué)習(xí)個體走向?qū)W習(xí)共同體的過程、是一種從共同體邊緣走向中心的過程。

2 K-means算法

2.1 算法

K-means算法[5]屬于聚類方法中的一種劃分方法,具有好伸縮性和很高的效率,比較適合大量數(shù)據(jù)處理。將對象分成若干組,以對象的相似度分組,結(jié)果得到多個不同聚類,相似度高對象就劃分在同一聚類中。

(1)隨機性地從n個模式{i1,i2,…ik}中選參數(shù)k。

(2)k個原型{W1,W1,…Wk}

(3)j∈{l,2,…,k},l∈{l,2,…,n}。

K-means算法流程

圖1.K-means算法流程圖

2.2 類別個數(shù)K

K-means算法中由于缺乏嚴格數(shù)學(xué)準則,類別個數(shù)K的選擇飽受爭議,學(xué)者們提出了許多啟發(fā)式和貪婪準則。這其中最具有代表性的是,如圖1所示,令K不停增加,J隨著K的增加而減少,隨著K值小到一定程度J增量為0,這時每個類數(shù)據(jù)自成一類。拐點A最靠近最優(yōu)值。

然而不是所有情況下都能找到J-K關(guān)系曲線的拐點。對這些個別K的選擇改進的算法是數(shù)據(jù)分析算法[6],該算法根據(jù)通過模式類分類和合并來反復(fù)修改改變聚類中心數(shù)量,從而得到理想合理類別數(shù)K。

圖2.J-K關(guān)系曲線

2.3 初始聚類中心的選取

由于K-means聚類算法是貪心算法,往往僅能獲得局部的最佳。所以就有了初始聚類中心方案。經(jīng)典方案是隨機選取的,王成等人提出使用最大最小原則來選取初始聚類中心[7]。該方法最大的不同點在于是個確定性過程。模擬退火、生物遺傳等優(yōu)化也被用于聚類中心選擇。

圖3.多次重新啟動K-means聚類算法圖

2.4 相似性度量和距離矩陣

聚類分析就是針對對象兩兩之間的差異程度來劃分的,然而相似度往往使用距離來衡量的。目前使用較廣泛得是歐氏距離。

聚類結(jié)果的好壞通??梢允褂镁垲悳蕜t函數(shù)來判斷,倘若選擇的聚類準則函數(shù)選得好,聚類結(jié)果的質(zhì)量自然就高,反之亦然。常用的聚類準則函數(shù)有下面三種:(1)加權(quán)平均距離和準則。(2)加權(quán)類距離和準則。(3)誤差平方和準則。

3 實驗結(jié)果

3.1 實驗數(shù)據(jù)選取

3.1.1數(shù)據(jù)采集。采集電大宣城分校在線學(xué)習(xí)的數(shù)據(jù),存放到excel表格中,為下一步數(shù)據(jù)預(yù)處理做好充分準備。

3.1.2數(shù)據(jù)預(yù)處理。首先對原始數(shù)據(jù)進行預(yù)處理,從而得到目標數(shù)據(jù)集。通過進一步分析找到關(guān)注的閱讀、視頻、論壇,資料,作業(yè),在線測試等屬性,得到電大學(xué)員網(wǎng)絡(luò)學(xué)習(xí)行為描述相關(guān)性最大的集合。

數(shù)據(jù)重復(fù)記錄[9]合并:在分析宣城電大在線學(xué)員上網(wǎng)行為的原始數(shù)據(jù)時。會存在某一用戶大量充分的上網(wǎng)學(xué)習(xí)數(shù)據(jù),為了能夠統(tǒng)計出更準確的結(jié)果,我們將合并重復(fù)記錄。將在某一段時間內(nèi),同一個IP地址產(chǎn)生的多條數(shù)據(jù)流記錄,將該多條記錄合并,然后對用戶網(wǎng)絡(luò)行為分析記錄。

3.1.3數(shù)據(jù)選取。為了能夠最佳分析結(jié)果,所以我們從中除掉那些不相干的多余屬性,最終選擇最能表現(xiàn)學(xué)習(xí)行為的數(shù)據(jù)屬性。

3.2 K-means在線學(xué)習(xí)行為聚類分析結(jié)果

采集宣城電大在線學(xué)習(xí)系統(tǒng)中2015年8月1日,至2016年7月31日用戶上網(wǎng)學(xué)習(xí)存在宣城電大在線存放sql server2005數(shù)據(jù)庫中流量數(shù)據(jù)進行預(yù)處理的54729條記錄。用戶網(wǎng)上學(xué)習(xí)資源很多,我們只選擇使用最多前6種。設(shè)置k值為6,設(shè)置3個數(shù)據(jù)字段,分別是學(xué)習(xí)時間、學(xué)習(xí)方式和ip地址。挖掘結(jié)果如圖3、4、5所示。

圖3.在線學(xué)習(xí)資源分布餅圖

從圖3看出電大宣城分校學(xué)員在線學(xué)習(xí)最主要的視頻課程學(xué)習(xí),其次完成作業(yè)。所在在教學(xué)資源設(shè)置過程中。(1)增加視頻課程所占比例。(2)學(xué)員把22%時間用于完成作業(yè),授課教師和班主任要及時批閱并及時反饋學(xué)員完成數(shù)量和質(zhì)量。(3)學(xué)員只把9%的時間用在論壇上,要充分發(fā)揮論壇交流溝通作用,主要是兩個方面。一方面學(xué)員之間交流學(xué)習(xí)經(jīng)驗。另一方面通過論壇答疑版塊解決學(xué)習(xí)過程中疑難問題。

圖4.各時間使用人數(shù)折線圖

通過對圖4分析11點至22點,最高峰出現(xiàn)在晚上8點到10點,低谷在早晨4點到6點。為了提高在線學(xué)習(xí)效果,首先保證晚上8點到10點服務(wù)器能夠正常運行,服務(wù)器若要維護應(yīng)當(dāng)安排在清晨進行。同時晚上7點到9點要安排老師進行在線學(xué)習(xí)指導(dǎo)、答疑。

圖5.工作日—雙休日人數(shù)對比

通過對圖5分析,(1)在9點-11點和14點-17點這兩個時間段,在線學(xué)習(xí)人數(shù)顯著下降,主要原因是在雙休日這兩個時間段電大宣城分校在開展面授課程。(2)在18點-20點人數(shù)顯著增加,主要原因是在雙休日這兩個時間段安徽電大和電大宣城分校經(jīng)常性安排網(wǎng)絡(luò)直播課和在線答疑。(3)從整體來看,雙休日與工作日在線人數(shù)有所下降,可能原因是雙休日家庭生活任務(wù)需要處理。

結(jié) 語

通過使用K-means聚類算法分析出電大學(xué)員在線學(xué)習(xí)行為模式,就能夠有助從宏觀角度掌握電大在線學(xué)習(xí)平臺使用狀況、有助于微觀了解具體每個學(xué)員學(xué)習(xí)行為,對電大在線學(xué)習(xí)平臺的資源庫建設(shè)和建立高效學(xué)習(xí)行為評價體系具有重要的意義。

隨著數(shù)字化資源不斷豐富、網(wǎng)絡(luò)技術(shù)不斷提高和智能化移動終端普及,在線學(xué)習(xí)將來成為電大教學(xué)中非常重要學(xué)習(xí)模式。將K-means聚類算法用到電大學(xué)員在線學(xué)習(xí)行為分析中是一種有意義的嘗試,K-means聚類算法的聚類結(jié)果有助于電大師生提高在線學(xué)習(xí)效。

K-means聚類算法必須事先指定合理聚類的個數(shù),否則就會出現(xiàn)聚類結(jié)果不合理。現(xiàn)在已有研究人員嘗試利用類間和類內(nèi)相異度改進K的值[10],從而減少孤立點和噪聲點。

[1]Julia Y.K.Chan,Christopher F.Bauer.Identifying At-Risk Students in General Chemistry via Cluster Analysis of Affective Characteristics[J].Chemical Education Research,2014,(9):1417-1425.

[2]張杰,卓靈,朱韻攸.一種K-means聚類算法的改進與應(yīng)用[J].網(wǎng)絡(luò)與信息安全,2015,(1):125-127.

[3]高紅艷,劉飛.基于局部相似性的K-means譜聚類算法[J].小型微型計算機系統(tǒng),2014,(5):1133-1134.

[4]王勇,唐靖,饒勤菲,等.高效率的K-means最佳聚類數(shù)確定算法[J].計算機應(yīng)用,2014,(5):1331-1335.

[5]王金亮,張月芬.系統(tǒng)聚類法在網(wǎng)絡(luò)學(xué)習(xí)行為中的應(yīng)用研究[J].中國教育信息化,2016,(8):90-93.

[6]王千,王成,馮振元,葉金鳳.K-means聚類算法研究綜述[J].電子設(shè)計工程,2012,(7):21-23.

[7]WANG Cheng,LI Jiao-jiao,BAI Jun-qing,et al.Max-Min K-means Clustering Algorithm and Application in Post-processing of Scientific Computing[C].//Napoli:ISEM,2011:7-9.

[8]曹永春,蔡正琦,邵亞斌.基于K-means的改進人工蜂群聚類算法[J].計算機應(yīng)用,2014,(1):204-207.

[9]薛黎明,欒維新.聚類算法在高校網(wǎng)絡(luò)用戶行為分析中的應(yīng)用[J].現(xiàn)代電子技術(shù),2016,(7):30-32.

[10]吳淑蘋.基于數(shù)據(jù)挖掘的教師網(wǎng)絡(luò)學(xué)習(xí)行為分析與研究[J].教師教育研究,2013,(3):47-55.

(責(zé)任編校:京華,俊華)

2017-03-08

安徽廣播電視大學(xué)青年教師科研基金項目“網(wǎng)絡(luò)遠程教育學(xué)習(xí)行為及效果的分析研究”(項目編號qn15-17)。

劉訓(xùn)星(1981-),男,安徽宣城人,碩士,宣城職業(yè)技術(shù)學(xué)院講師,研究方向為數(shù)據(jù)挖掘、教育信息化。

G442

A

1673-2219(2017)06-0007-03

猜你喜歡
宣城聚類算法
安徽宣城:村里有群姑娘叫『小花』
司爾特宣城公司舉行消防演練
《宣城小鎮(zhèn)》
流行色(2020年1期)2020-04-28 11:16:38
基于MapReduce的改進Eclat算法
Travellng thg World Full—time for Rree
進位加法的兩種算法
宣城以外看宣城
基于DBSACN聚類算法的XML文檔聚類
電子測試(2017年15期)2017-12-18 07:19:27
一種改進的整周模糊度去相關(guān)算法
基于改進的遺傳算法的模糊聚類算法
连江县| 白银市| 嘉善县| 汶上县| 财经| 镇坪县| 郯城县| 安岳县| 当涂县| 江陵县| 同德县| 博爱县| 开封县| 江北区| 侯马市| 潜江市| 鲁山县| 亳州市| 东阳市| 吉木乃县| 永济市| 高邑县| 巧家县| 南平市| 公主岭市| 阿图什市| 华亭县| 十堰市| 灵寿县| 武汉市| 浮山县| 巨野县| 青铜峡市| 泗水县| 儋州市| 阳高县| 上蔡县| 永修县| 阿荣旗| 融水| 南雄市|