葉文靜,黃今慧
(北京工商大學計算機與信息工程學院,北京 100048)
在線學習是指通過計算機互聯(lián)網(wǎng),或通過移動無線網(wǎng)絡(luò),進行內(nèi)容傳播和快速學習的方式[1]。這種學習方式不僅能使自身的學習需求被滿足,同時也收集了與學習行為相關(guān)的數(shù)據(jù)。這些數(shù)據(jù)可從網(wǎng)絡(luò)學習平臺提取,然后對這些數(shù)據(jù)更加深入挖掘,再通過挖掘出的信息研究在線學習行為。但是在線學習過程中產(chǎn)生的數(shù)據(jù)龐大且雜亂,其中還包含了大量非結(jié)構(gòu)信息,單是使用簡單的統(tǒng)計分析方法不容易發(fā)現(xiàn)其隱藏的知識和規(guī)律,而且這些數(shù)據(jù)實際來源于教育大數(shù)據(jù),因此我們需要采用更為精確,復(fù)雜的方式來研究。數(shù)據(jù)挖掘技術(shù)可以分析大量數(shù)據(jù)并能提取出隱藏在其中的、人們事先不了解的并對決策有用的信息和知識。數(shù)據(jù)挖掘技術(shù)就是我們所要選擇的技術(shù)。
針對學習者的平均學習時間、學習進度、學習交流、各類資源應(yīng)用等與學習行為有關(guān)的信息數(shù)據(jù)進行統(tǒng)計、可視化和各類挖掘方式,并結(jié)合學習者的個體數(shù)據(jù)來分析在線學習行為的特征[2-3]。可從以下幾個方面分析在線學習行為的特征:靜態(tài)和動態(tài)特征、固有和變化特征以及一般和風格特征。本文主要分析的是學習者的靜態(tài)和動態(tài)特征。顧名思義,靜態(tài)特征是指學習者自身所固有的不會隨時間的變化而變化或緩慢變化的方面;而動態(tài)特征則是指學習者隨著時間的變化而發(fā)生顯著變化的,并會對學習產(chǎn)生較大影響方面。若要從這兩個方面展開分析,可以運用以下方法:
①根據(jù)通過具有相似或相同靜態(tài)特征的學習者群體進行不同動態(tài)特征的在線學習行為分析并將這類人群進行分類。主要是通過協(xié)作過濾推薦算法,根據(jù)學習者的性別、年齡、學歷以及學業(yè)專業(yè)等靜態(tài)特征篩選出具有相似靜態(tài)特征的學習者,并對參與總?cè)藬?shù)進行分組,將相似的學習者分為一組,調(diào)查并記錄每組學習者彼此間的在線學習行為數(shù)據(jù),分析這些數(shù)據(jù)可獲取在線學習行為的影響因素。例如,年齡在18~22歲的女性計算機本科專業(yè)學習群體的學習行為差異主要在那幾個方面、有何不同、如何分類等問題。
②基于對某網(wǎng)絡(luò)學習平臺的分析,根據(jù)分析能獲取在線學習行為特征。首先采集該平臺的數(shù)據(jù),如學習者的登錄時間、訪問路徑、在線時間長短以及在線學習內(nèi)容等,然后再對這些數(shù)據(jù)進行分類研究;再如同一時間訪問該平臺且學習地點與時間長短相同的,正在學習同一門課程的人群可能是正在學校上課的學生,這類人群的學習行為不是自發(fā)的,但他們的學習進度卻可以反映出各自的學習能力以及學習需求。
通過以上方法,可以了解在線學習行為受許多因素影響,而這些因素又可區(qū)分為內(nèi)在因素和外在因素,如個人學習目的、學習需求以及不同的時間安排等可歸納于內(nèi)在影響因素;不同專業(yè)的學習內(nèi)容、不同的學習平臺應(yīng)用、多樣的學習工具使用等可歸納于外在影響因素。這些因素不僅對在線學習行為帶來了不同程度的影響,而且還產(chǎn)生了各種在線學習行為特征。
以某一網(wǎng)絡(luò)學習平臺為基礎(chǔ),然后基于該平臺存儲的在線學習行為的記錄來采集數(shù)據(jù),再對這些零散的數(shù)據(jù)進行處理和研究,最終可以構(gòu)建一個基于數(shù)據(jù)挖掘的在線學習行為模型[4]。該模型主要用于對學習需求、學習資源、學習工具以及學習模式對學習者在線學習行為所造成的影響以及影響程度的研究。之后還可用它挖掘出最佳學習者,并探索影響他們在線學習行為的因素。通過對這些因素的進一步研究,將推測如何有效提高學習者學習效果的方法,讓更多的學習者有效地提高學習效率,找到適用于自己的學習方法。除此之外,我們還能將該模型應(yīng)用于網(wǎng)絡(luò)學習平臺,進一步優(yōu)化網(wǎng)絡(luò)學習平臺,使它能獲得更精確的數(shù)據(jù),這樣就能更全面、系統(tǒng)、深入地分析在線學習行為,構(gòu)建更廣泛、更智能、更豐富的網(wǎng)絡(luò)學習平臺。
不同的數(shù)據(jù)采集所研究的方向也不同,但總體方向卻是相同的,都是針對學習者在線學習行為進行研究。通過記載人們訪問網(wǎng)站的次數(shù)以及在該網(wǎng)站停留的時間,可以發(fā)現(xiàn)最受人們喜愛的網(wǎng)絡(luò)學習平臺;通過記錄學生作業(yè)完成情況以及解決疑難問題的方式,可以分析出他們的學習方式;通過記載人們對學習內(nèi)容的觀看時間以及留言評論,可以找到他們的興趣愛好[5]。因此,如何采集數(shù)據(jù)是構(gòu)建在線學習模型的第一步。主要是通過對網(wǎng)絡(luò)學習平臺的選取以及數(shù)據(jù)準備來實現(xiàn)數(shù)據(jù)采集。
數(shù)據(jù)采集完成后,通過對該數(shù)據(jù)處理與挖掘,以獲取研究者想要的信息,這是對在線學習行為構(gòu)建模型的第二步。
3.2.1 數(shù)據(jù)處理
完成第一步后,所采集到的原始數(shù)據(jù)不能直接用于數(shù)據(jù)挖掘,還應(yīng)對該數(shù)據(jù)進行處理,使其能轉(zhuǎn)換成可供數(shù)據(jù)挖掘使用的數(shù)據(jù)。
3.2.2 數(shù)據(jù)挖掘
將數(shù)據(jù)處理好后,就要使用數(shù)據(jù)挖據(jù)對其進行操作。選取與研究一致的數(shù)據(jù)挖掘技術(shù)和工具也是至關(guān)重要的。分類,聚類和關(guān)聯(lián)規(guī)則挖掘等算法均可應(yīng)用于在線學習行為的數(shù)據(jù)挖掘中[6]。
完成以上步驟后,可以開始對在線學習行為構(gòu)建模型。首先,通過數(shù)據(jù)挖掘獲得的信息可以深入分析個人的在線學習時間安排、在線學習行為特征以及影響在線學習行為的主要因素。然后開始整合數(shù)據(jù),將這些數(shù)據(jù)關(guān)聯(lián)在一起并使用統(tǒng)計分析方法建立在線學習行為的模型。最后還要對該模型進行驗證,把該模型應(yīng)用于某一網(wǎng)絡(luò)學習平臺,然后根據(jù)學習者的在線學習效果是否提高,在線學習效率是否提升,以及該網(wǎng)絡(luò)學習平臺是否優(yōu)化成功來驗證該模型的準確性和實用性。
本文從數(shù)據(jù)挖掘的角度探討了在大數(shù)據(jù)背景下的在線學習行為的分析與建模。經(jīng)過一系列理論分析,最終發(fā)現(xiàn)構(gòu)建在線學習行為模型是具有重大意義的。建立在線學習行為的模型,對網(wǎng)絡(luò)學習平臺進行優(yōu)化,找到適合自己的學習方法。這不僅對提高人們的學習效率有很大的作用,還能幫助他們獲得更完美的學習成果。這對于教育領(lǐng)域也是一大進展。因此,基于數(shù)據(jù)挖掘的在線學習行為的分析與建模是十分有必要的。