国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

可視化在高校在線教學(xué)系統(tǒng)數(shù)據(jù)挖掘中的應(yīng)用研究

2022-08-01 04:04付志文吳東醒賀超波
現(xiàn)代計算機 2022年11期
關(guān)鍵詞:數(shù)據(jù)挖掘可視化數(shù)據(jù)庫

付志文,吳東醒,賀超波

(仲愷農(nóng)業(yè)工程學(xué)院,廣州 510225)

0 引言

隨著MOOC 在高校的大規(guī)模推廣應(yīng)用,各高校紛紛建立起了在線教學(xué)平臺,在線學(xué)習(xí)已成為當代大學(xué)生不可或缺的學(xué)習(xí)形式。在傳統(tǒng)的面授課堂中,師生沒有物理隔閡,可以及時開展交互,在交互過程中教師不斷根據(jù)學(xué)生反饋情況調(diào)節(jié)自己的教學(xué)策略。在線學(xué)習(xí)的課堂,師生地理上處于分離狀態(tài),一般采用錄播視頻及輔助資料開展學(xué)習(xí),師生間的反饋限定于預(yù)定的一些收集技術(shù),如作業(yè)、交互式考試、論壇答疑。這些技術(shù)所獲取的交互情況對比面授課堂還是遠遠不夠的,不足以支持教師全面掌握學(xué)生的在線學(xué)習(xí)情況。

在線學(xué)習(xí)平臺可以采集到更多細粒度的教育行為數(shù)據(jù)。例如,學(xué)習(xí)者資源瀏覽行為記錄、交互記錄、作業(yè)情況、測驗成績、小組報告質(zhì)量、論壇發(fā)帖的數(shù)量和質(zhì)量等,它們能保存到數(shù)據(jù)庫中或系統(tǒng)日志中。對這些數(shù)據(jù)進行處理,提取出有意義的、具有潛在教育價值的信息就是教育數(shù)據(jù)挖掘所關(guān)注的領(lǐng)域。教育數(shù)據(jù)挖掘(Educational Data Mining,EDM)是一門新興的學(xué)科,關(guān)注各種用于分析來自教育環(huán)境的大規(guī)模數(shù)據(jù)的方法,并使用這些方法來更好地理解學(xué)生以及他們在其中學(xué)習(xí)的環(huán)境。這些數(shù)據(jù)通過EDM 可以轉(zhuǎn)化為有用的信息,從另一個層面更多地收集在線學(xué)習(xí)平臺的使用情況。

當前國內(nèi)外已有較多對EDM 的研究與實踐,周慶等綜合分析了EDM 在新型網(wǎng)絡(luò)教學(xué)環(huán)境下智能導(dǎo)學(xué)系統(tǒng)、計算機支持的協(xié)作學(xué)習(xí)、基于游戲的學(xué)習(xí)系統(tǒng)、社交網(wǎng)絡(luò)方面的應(yīng)用。國內(nèi)外已有研究指出,對在線教學(xué)系統(tǒng)進行EDM 可產(chǎn)生良好作用,李婷等認為EDM 更重要的意義在于指導(dǎo)和改善學(xué)習(xí),提高教學(xué)質(zhì)量。EDM 按數(shù)據(jù)使用方向可分為管理部門、教師、學(xué)生。管理部門可以利用這些信息來了解學(xué)校開展在線教學(xué)的整體情況,繼而通過一定的政策改進學(xué)校在線課程管理制度,推動在線教學(xué)的平衡發(fā)展;教師可以利用這些信息來了解學(xué)生個體及總體情況,改進教學(xué)過程;學(xué)生也可以從這些信息中受益,比如獲取合適的學(xué)習(xí)內(nèi)容,調(diào)整自己的學(xué)習(xí)過程等等。

本文依托某大學(xué)的在線教學(xué)平臺,試圖通過教育數(shù)據(jù)挖掘獲取數(shù)據(jù)背后的教育隱義,為學(xué)校在線教育改革提供可行性建議。

1 研究樣本概況

本文所研究數(shù)據(jù)來源于某大學(xué)所使用的在線教學(xué)平臺,平臺在2016 年投入使用,建有課程200 多門,用戶數(shù)8 萬余人,系統(tǒng)訪問量總計200 萬多次。整體來看,選取的系統(tǒng)數(shù)據(jù)量較大,滿足EDM 的需求。系統(tǒng)采用.net +SQL Server的技術(shù)路線開發(fā),整個系統(tǒng)由四臺服務(wù)器組成,Web 系統(tǒng)、數(shù)據(jù)庫系統(tǒng)、文件系統(tǒng)分別使用一臺服務(wù)器,另有一臺備份系統(tǒng)。

該學(xué)習(xí)平臺已自帶簡單的數(shù)據(jù)分析工具,包括瀏覽趨勢分析、活躍度分析、課程建設(shè)分析、互動分析。瀏覽趨勢分析包括總用戶、總瀏覽量;活躍度分析包含師生的在線情況、活躍度排行等;課程建設(shè)分析包含網(wǎng)站、MOOC、資源的建設(shè)分析;課程互動分析包含作業(yè)、討論等師生互動的排名。

這些數(shù)據(jù)分析工具對了解系統(tǒng)的整體運行情況有一定的幫助,但是缺陷也比較明顯。一是統(tǒng)計指標比較少,缺少對課程運行細節(jié)分析的觀測點。二是統(tǒng)計的時間跨度較小,僅提供最近60 天的統(tǒng)計查詢,如果需要分析不同時間段的數(shù)據(jù)發(fā)展趨勢,就要對系統(tǒng)數(shù)據(jù)庫中保存的數(shù)據(jù)進行挖掘。系統(tǒng)后臺記錄的數(shù)據(jù)較為全面,但是系統(tǒng)自帶的分析系統(tǒng)沒有對這些數(shù)據(jù)進行有效的分析利用。例如數(shù)據(jù)庫對用戶登陸情況記錄就包括用戶ID、用戶類型、登陸時間(年月日時分秒格式)、登陸IP 等四類信息,系統(tǒng)自帶的分析系統(tǒng)僅統(tǒng)計了總的瀏覽量。實際上對教育工作者更有意義的可能是某個ID 每次訪問系統(tǒng)時間、某個ID 登陸次數(shù)等,這些數(shù)據(jù)有助于形成學(xué)習(xí)者的用戶畫像。以上不足之處也是本研究的一個邏輯起點。

2 研究過程

Romero 等等總結(jié)了EDM 研究中正常的工作流程,這個流程圖已被研究者們廣泛采用,如圖1 所示。從數(shù)據(jù)挖掘的角度來看,數(shù)據(jù)處理流程包含了預(yù)處理、數(shù)據(jù)挖掘和評估三個階段;從教育的角度來看,這是一個從教育環(huán)境產(chǎn)生的數(shù)據(jù)中發(fā)現(xiàn)知識,再利用這些知識來改善教育環(huán)境的循環(huán)過程。教育環(huán)境中收集到的原始數(shù)據(jù)需要經(jīng)過預(yù)處理(數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)規(guī)約、數(shù)據(jù)變換)再進行數(shù)據(jù)挖掘,從海量數(shù)據(jù)中提煉出的教育隱義即為知識,可用以改善教育環(huán)境。這個工作流程圖是本研究參考的范例,以下根據(jù)EDM 的流程闡述研究開展的具體過程。

圖1 EDM工作流程圖

2.1 數(shù)據(jù)預(yù)處理

通過分析該在線課程平臺數(shù)據(jù)庫管理系統(tǒng)發(fā)現(xiàn),整個系統(tǒng)由五十多個數(shù)據(jù)表組成,剔除與教學(xué)無關(guān)的系統(tǒng)運行支撐數(shù)據(jù)表后,導(dǎo)出與在線教學(xué)密切相關(guān)的10 個表格,具體情況見如表1。

表1 在線教學(xué)原始數(shù)據(jù)表

經(jīng)過以上數(shù)據(jù)清洗之后,進行數(shù)據(jù)轉(zhuǎn)換。教學(xué)平臺原始數(shù)據(jù)存儲于SQL Server中,而本系統(tǒng)擬采取Java+MySQL 的架構(gòu)進行開發(fā),因此需要將數(shù)據(jù)從SQL Server 中轉(zhuǎn)換格式后導(dǎo)入到MySQL 數(shù)據(jù)庫。使用SQL Server 自帶的數(shù)據(jù)導(dǎo)出功能將數(shù)據(jù)存儲為SQL 文件,然后使用數(shù)據(jù)庫管理軟件Navicat for MySQL 的導(dǎo)入數(shù)據(jù)功能將SQL文件還原為數(shù)據(jù)庫結(jié)構(gòu)、數(shù)據(jù)表及數(shù)據(jù)。

2.2 數(shù)據(jù)挖掘

數(shù)據(jù)挖掘的目的是從數(shù)據(jù)中建立模型,主要包括預(yù)測模型(predictive model)和描述模型(descriptive model)兩類。本文對在線學(xué)習(xí)平臺數(shù)據(jù)挖掘的目的是建立一個描述模型,以發(fā)現(xiàn)平臺上線以來的總體運行狀態(tài),用于評估參與在線教學(xué)各方的績效。Romero 等把網(wǎng)絡(luò)教育系統(tǒng)中的特定數(shù)據(jù)挖掘方法分為統(tǒng)計和可視化及Web 挖掘兩類,本文所使用的是統(tǒng)計和可視化??梢暬╲isualization,VS)將信息或知識形象化地展示,可視化技術(shù)能夠幫助人們更加直觀地理解教育數(shù)據(jù)。前文已提及,學(xué)習(xí)平臺本身自帶的可視化分析功能較弱,為此本研究開發(fā)了一個可視化分析系統(tǒng)。

系統(tǒng)采用主流的Browser/Server 架構(gòu),使用Springboot 技術(shù),以JDK8(Java SE Development Kit 8)作為開發(fā)語言,前端框架選擇VUE組件式開發(fā)框架、Element UI 頁面渲染框架與jQuery 框架,后端框架選擇Springboot 集成開發(fā)中間件框架,數(shù)據(jù)庫采用MySQL,數(shù)據(jù)可視化分析框架選擇Echarts,前后端數(shù)據(jù)交互的實現(xiàn)選擇Ajax異步通信。系統(tǒng)架構(gòu)如圖2所示。

圖2 系統(tǒng)架構(gòu)圖

可視化分析的實現(xiàn)原理是根據(jù)數(shù)據(jù)庫表累積的數(shù)據(jù)進行可視化圖表的繪制,通過可視化圖表如柱狀圖、曲線圖等顯示紛繁復(fù)雜的數(shù)據(jù),方便解讀數(shù)據(jù)背后的教育意義。圖3是對在線課程的“社區(qū)發(fā)帖”這一指標進行可視化分析的結(jié)果。

圖3 數(shù)據(jù)可視化圖例

在技術(shù)實現(xiàn)上,為了在系統(tǒng)中實現(xiàn)可視化分析圖表的復(fù)用,每個可視化圖表分別使用一個VUE 組件進行繪制。圖表的繪制主要依賴于Echarts.min.js 文件,通過前端JavaScript 語言創(chuàng)建option對象并設(shè)置不同的屬性來達到圖表不同效果的展示。由于數(shù)據(jù)量龐大,如果每次都發(fā)送Ajax 請求到MySQL 數(shù)據(jù)庫讀取數(shù)據(jù),會造成數(shù)據(jù)庫查詢緩慢,前端展示效果不佳。因此使用Redis 來對龐大的課程數(shù)據(jù)進行緩存,這樣每次Ajax 訪問會先從內(nèi)存中獲取緩存的課程數(shù)據(jù),相比于每次都直接訪問數(shù)據(jù)庫,使用Redis 中間件可以大大提高查詢的效率,減輕數(shù)據(jù)庫的查詢壓力。

在線課程數(shù)據(jù)可視化系統(tǒng)對10 個數(shù)據(jù)表進行了可視化分析,分析的依據(jù)是表2 所列的11個指標項。

表2 數(shù)據(jù)可視化分析指標一覽表

從表2可以看出,本文的數(shù)據(jù)可視化分析以教學(xué)單位為統(tǒng)計口徑,分別對教學(xué)行為總量和教學(xué)行為分時段變化趨勢進行了分析,這樣有助于對各教學(xué)單位在線課程運行情況的總體情況和變化趨勢形成直觀的認識。

圖4 課程點擊量變化趨勢圖

2.3 知識

知識是EDM 的研究結(jié)果,EDM 產(chǎn)生的知識將會對教育環(huán)境產(chǎn)生一定的影響。具體到本研究而言,是對前文得到的數(shù)據(jù)可視圖表進行解讀,進而為學(xué)校在線課程管理策略提供參考。因篇幅所限,下文僅以“課程點擊量變化趨勢”這一指標項分析結(jié)果進行簡要闡述,其他指標項的解讀從略。

(1)多數(shù)教學(xué)單位在線課程點擊量較少,比較活躍的僅有馬克思主義學(xué)院、機電工程學(xué)院、計算科學(xué)學(xué)院、自動化學(xué)院、人文與社會科學(xué)學(xué)院和信息科學(xué)與技術(shù)學(xué)院6個教學(xué)單位。其他教學(xué)單位的活躍度較低則可能是在線課程建設(shè)在其教學(xué)平臺的緣故。

(2)馬克思主義學(xué)院自2018年9月以來,課程的點擊量逐步攀升,是現(xiàn)有的教學(xué)單位中在線課程點擊量最高的。據(jù)了解,該學(xué)院自2018年以來多個課程建設(shè)項目獲得省教育廳的質(zhì)量工程立項,已有《馬克思主義基本原理》《思想道德修養(yǎng)與法律基礎(chǔ)》2門課程持續(xù)開展線上教學(xué),這兩門課程也是公共必修課,因此課程使用率非常高。

(3)2020 年上半年疫情期間,學(xué)校實行“停課不停學(xué)”的在線教學(xué)模式(2020 年3 月—2020 年7 月),馬克思主義學(xué)院的在線課程點擊量相對于其他學(xué)院有很明顯的上升走向,其次是計算科學(xué)學(xué)院,同時其余學(xué)院均有上升;但相對于馬克思主義學(xué)院和計算科學(xué)學(xué)院的數(shù)據(jù),上升幅度相對平緩。

綜合以上可知:①該平臺在疫情“停課不停學(xué)”期間起到了較大的作用,為在線教學(xué)的開展提供了基礎(chǔ)條件;②各教學(xué)單位在該平臺的課程建設(shè)非常不均衡,單一平臺的數(shù)據(jù)尚不能完全反映學(xué)校在線教學(xué)開展情況,需要進一步調(diào)查其他在線學(xué)習(xí)平臺的數(shù)據(jù)。

3 研究結(jié)果及局限性

本研究目的是通過對某大學(xué)在線課程平臺進行教育數(shù)據(jù)挖掘,探尋該平臺建設(shè)及運行情況的整體趨勢。關(guān)注的是各教學(xué)單位在線課程運行方面的指標,通過2 個一級指標11 個二級指標的數(shù)據(jù)可視化揭示了在線課程數(shù)量、在線課程活躍度情況。研究結(jié)果可為學(xué)校的教務(wù)管理、教育技術(shù)部門提供決策支持,以改進在線課程管理制度,也可作為對教師和課程進行評價的數(shù)據(jù)依據(jù)。

研究的局限性在于,僅使用描述模型通過分析數(shù)據(jù)對在線課程的開展情況的歷史進行了總結(jié)性描述,沒有做到預(yù)測性的分析。在數(shù)據(jù)挖掘的使用方面,傾向于為管理決策提供支撐,未對某一個在線課程進行教學(xué)組織策略、教學(xué)進程、教學(xué)討論、教學(xué)成績等的數(shù)據(jù)進行分析,也未對具體的師生教學(xué)行為數(shù)據(jù)進行微觀的挖掘。未來可以進一步開展挖掘參與在線教學(xué)的個體學(xué)習(xí)數(shù)據(jù)的工作,具體到每個教師、每個學(xué)生的教學(xué)行為數(shù)據(jù),如教師對課程建設(shè)的貢獻度,包括上傳資料,發(fā)布測試,批改作業(yè),回答問題等行為數(shù)據(jù);學(xué)生方面,可關(guān)注學(xué)生的學(xué)習(xí)行為數(shù)據(jù),如完成作業(yè)、完成測試、觀看視頻、觀看文本資料及與其他同學(xué)的互動情況等。

猜你喜歡
數(shù)據(jù)挖掘可視化數(shù)據(jù)庫
基于數(shù)據(jù)挖掘探討慢性腎衰竭處方規(guī)律
數(shù)據(jù)可視化設(shè)計在美妝類APP中的應(yīng)用
思維可視化
復(fù)變函數(shù)級數(shù)展開的可視化實驗教學(xué)
復(fù)變函數(shù)級數(shù)展開的可視化實驗教學(xué)
復(fù)變函數(shù)共形映射的可視化實驗教學(xué)
復(fù)變函數(shù)共形映射的可視化實驗教學(xué)
數(shù)據(jù)挖掘綜述
數(shù)據(jù)庫
軟件工程領(lǐng)域中的異常數(shù)據(jù)挖掘算法
泸溪县| 新泰市| 藁城市| 高尔夫| 南华县| 常宁市| 永修县| 彰武县| 轮台县| 清镇市| 南华县| 霍林郭勒市| 平山县| 和龙市| 自贡市| 庆城县| 翼城县| 石城县| 洞口县| 施秉县| 马龙县| 克拉玛依市| 乌兰浩特市| 辰溪县| 尼木县| 古丈县| 宜都市| 蒲江县| 太仓市| SHOW| 陆川县| 湖州市| 天峻县| 昌邑市| 兰州市| 南平市| 民乐县| 陈巴尔虎旗| 泰安市| 扎囊县| 中卫市|