国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于R語言的課程教學(xué)效果可視化分析

2022-05-30 10:48:04吳立知
電腦知識與技術(shù) 2022年31期
關(guān)鍵詞:R語言數(shù)據(jù)分析可視化

摘要:隨著大數(shù)據(jù)和云時代的到來,數(shù)據(jù)分析技術(shù)作為一門前沿技術(shù),廣泛應(yīng)用于各大領(lǐng)域,“數(shù)據(jù)分析”作為大數(shù)據(jù)時代的核心技術(shù),其商業(yè)價值正在逐步展現(xiàn)。文章將使用最前沿的R語言,借助數(shù)據(jù)可視化平臺RStudio,對本校計算機網(wǎng)絡(luò)技術(shù)專業(yè)的專業(yè)基礎(chǔ)課程計算機網(wǎng)絡(luò)基礎(chǔ)的教學(xué)效果進行可視化分析,從而為教學(xué)質(zhì)量改革提出有效建議。

關(guān)鍵詞:數(shù)據(jù)分析;R語言;可視化;匯總分析

中圖分類號:G424 ? ? ?文獻標(biāo)識碼:A

文章編號:1009-3044(2022)31-0053-03

1 引言

R語言是一種面向?qū)ο蟮木幊陶Z言,是為統(tǒng)計計算和圖形顯示而設(shè)計的語言環(huán)境,也是一套開源的數(shù)據(jù)分析解決方案。R語言最大的優(yōu)勢在于其軟件包生態(tài)系統(tǒng)的開放性,即免費開源,并且可以在不同的平臺上運行。R語言作為完全免費的統(tǒng)計分析軟件,可以輕松地從各種類型的數(shù)據(jù)源讀寫數(shù)據(jù),幾乎所有類型的數(shù)據(jù)都可以用R語言進行統(tǒng)計分析。另外,R語言具有頂尖水準(zhǔn)的制圖功能,能夠直觀地提升用戶對數(shù)據(jù)的理解,并幫助用戶做出正確的判斷和改進[1]。

R語言的原始編譯窗口較為簡單,提供的編譯環(huán)境不太友好,為了提高代碼的編寫效率,本文選擇使用RStudio 作為代碼編譯環(huán)境。RStudio作為R語言的免費的圖形界面編輯器,其實質(zhì)性的編程語言與R 語言無異,但是比R語言原有的編譯窗口擁有更友好的界面環(huán)境和更強大的操作性能[1]。

本文將使用最前沿的R語言,借助數(shù)據(jù)可視化平臺RStudio,對計算機網(wǎng)絡(luò)技術(shù)專業(yè)的專業(yè)基礎(chǔ)課程計算機網(wǎng)絡(luò)基礎(chǔ)的教學(xué)效果進行可視化分析。通過統(tǒng)計分析和可視化圖形展示,為計算機網(wǎng)絡(luò)基礎(chǔ)課程的教學(xué)改革提供有力的數(shù)據(jù)支撐,從而進一步提升計算機網(wǎng)絡(luò)技術(shù)專業(yè)的教師教學(xué)水平。

2 將數(shù)據(jù)導(dǎo)入到RStudio

本文將針對計算機網(wǎng)絡(luò)技術(shù)專業(yè)的專業(yè)基礎(chǔ)課程計算機網(wǎng)絡(luò)基礎(chǔ)的學(xué)生成績進行分析,因此首先需完成數(shù)據(jù)的導(dǎo)入?;诮虅?wù)系統(tǒng)的數(shù)據(jù)管理流程,學(xué)生的成績均是存放在學(xué)校教務(wù)系統(tǒng)的數(shù)據(jù)庫中的,因此,在數(shù)據(jù)分析前,需先將學(xué)生成績數(shù)據(jù)導(dǎo)入RStudio中。

本文將模擬從MySQL數(shù)據(jù)庫將數(shù)據(jù)導(dǎo)入RStudio的過程。

2.1 數(shù)據(jù)準(zhǔn)備工作

首先在MySQL中創(chuàng)建數(shù)據(jù)庫stuanalysis,本文要用到的計算機網(wǎng)絡(luò)基礎(chǔ)課程的學(xué)生成績表存在于數(shù)據(jù)庫stuanalysis的表格中,將數(shù)據(jù)表命名為stuscore,通過查看表格內(nèi)容,可以確定該專業(yè)年級215名學(xué)生的成績信息已存在于數(shù)據(jù)表stuscore中(圖1) 。

通過查詢,可以看到,計算機網(wǎng)絡(luò)基礎(chǔ)課程的成績由課堂活動、作業(yè)和考試三部分組成,三個部分均以百分制來計分,在總成績中所占比例分別為課堂活動(30%) 、作業(yè)(30%) 、考試(40%) ;總成績由以上三部分的成績按比例計算而來,同樣采用百分制計分。

2.2 R環(huán)境準(zhǔn)備

在用R進行數(shù)據(jù)分析前,先要完成R和MySQL數(shù)據(jù)庫的連接,方便人們直接對數(shù)據(jù)進行處理。具體步驟如下:

1) R下載RODBC包,加載RODBC包;

2) 下載并安裝mySQL ODBC;

3) 控制面板→管理工具→數(shù)據(jù)源(ODBC) →點擊添加→選中MySQL ODBC driver選項;

4) 打開RStudio的界面調(diào)用數(shù)據(jù)庫;

5) 至此,R已經(jīng)成功與MySQL數(shù)據(jù)庫連接,并且獲取了MySQL庫中stuanalysis數(shù)據(jù)庫里stuscore表中的數(shù)據(jù),存放在數(shù)據(jù)框StuAnalysis中。

3 數(shù)據(jù)清洗與匯總分析

R語言中的數(shù)據(jù)清洗的目的在于刪除重復(fù)、有缺失值的信息,對數(shù)據(jù)進行重新審查和消炎,糾正存在的錯誤;而R語言中提供的多種數(shù)值計算和統(tǒng)計分析的函數(shù),則可以幫助人們快速地對數(shù)據(jù)進行匯總統(tǒng)計分析[2]。

3.1 缺失數(shù)據(jù)處理

在數(shù)據(jù)分析的過程中,數(shù)據(jù)對象的不完整性會對后期的數(shù)據(jù)可視化分析造成影響,比如,因在學(xué)生成績表中會存在某些學(xué)生按時參加課堂活動,完成教學(xué)安排,但是因個人原因無法參加期末考試的情況。因此在進行數(shù)據(jù)分析前,先要進行數(shù)據(jù)的缺失值處理。

1) 檢測StuAnalysis中是否存在缺失值。代碼如下:

> anyNA(StuAnalysis)

[1] TRUE

經(jīng)檢測,StuAnalysis確實存在缺失值;

2) 刪除StuAnalysis中存在缺失值的行,并將刪除缺失值后的數(shù)據(jù)賦值給新的變量score.data。代碼如下:

score.data<- na.omit(StuAnalysis)

3.2 數(shù)據(jù)匯總統(tǒng)計分析

對于學(xué)生成績數(shù)據(jù)的統(tǒng)計分析,首先可以使用R語言中的數(shù)值計算和統(tǒng)計分析函數(shù),對學(xué)生成績進行初步統(tǒng)計分析。

在傳統(tǒng)的成績分析中,往往會以最大值、最小值、均值等指標(biāo)作為初步的統(tǒng)計量,在 R 語言中,也要通過指標(biāo)來表現(xiàn)數(shù)據(jù)樣本的集中趨勢、離散程度和數(shù)據(jù)分布形狀[3]。

通過 R 語言的數(shù)值計算和統(tǒng)計分析函數(shù)來實現(xiàn)對學(xué)生學(xué)習(xí)成績的初步分析,分別得出課堂活動、作業(yè)、考試和總成績的各項統(tǒng)計值,得出結(jié)果如表1所示。

表1 ? 學(xué)生成績統(tǒng)計表

[統(tǒng)計分量 均 ?值 中位數(shù) 標(biāo)準(zhǔn)差 方 ?差 變異系數(shù) 課堂活動 91.34995 93.33 11.0805 122.7774 12.12972 作 ?業(yè) 81.85977 88.105 17.58625 309.2761 21.48338 考 ?試 64.93458 66 16.79664 282.1272 25.86702 總成績 77.93734 80.595 11.54148 133.2057 14.80866 ]

通過上表可得知:變異強度最低的是課堂活動,其次是總成績;在數(shù)據(jù)統(tǒng)計分析中,如果變異系數(shù)值超過15,則認為數(shù)據(jù)存在疑問。因此,本科目的作業(yè)成績和期末考試成績可能因為某些客觀原因而導(dǎo)致數(shù)據(jù)變異強度過大;但是基于總成績的變異系數(shù)在規(guī)定范圍內(nèi),可見本課程的教學(xué)效果相對良好。

4 數(shù)據(jù)可視化分析

R 語言的強大不僅體現(xiàn)在便捷的數(shù)據(jù)統(tǒng)計計算,還體現(xiàn)在可生成各種可視化的圖形,從而更加直觀地向決策者提供數(shù)據(jù)依據(jù)[4]。本文將使用R語言中的散點矩陣圖和箱線圖來反映學(xué)生成績分布情況。

4.1 繪制成績散點矩陣圖

根據(jù)導(dǎo)入的課堂活動、作業(yè)、考試和總成績數(shù)據(jù),利用R語言的pairs() 函數(shù),繪制成績散點矩陣圖(圖2) 。代碼和運行結(jié)果如下:

> pairs(score.data[,3:6])

通過散點矩陣圖,可以直觀地發(fā)現(xiàn),課堂活動、作業(yè)和考試分數(shù)與總成績之間基本上可以滿足線性規(guī)律,其中考試分數(shù)與總成績之間的線性相關(guān)性最高,說明試卷的難易程度符合課程考核要求。另外,通過觀察發(fā)現(xiàn),課堂活動、作業(yè)和考試分數(shù)三者之間的相關(guān)性不高,尤其是課堂活動與考試之間,難以發(fā)現(xiàn)線性相關(guān),說明某些課堂活動參與度高的同學(xué)反而在考試中成績表現(xiàn)并不好,這是需要任課教師在今后的教學(xué)活動中進一步做出調(diào)整和改進。

4.2 繪制成績箱線圖

為了對學(xué)生專業(yè)課成績的差異性及產(chǎn)生原因進行分析,本文將利用R語言的boxplot() 函數(shù)繪制課堂活動、作業(yè)、考試和總成績數(shù)據(jù)的箱線圖(圖3) 。代碼和運行結(jié)果如下:

> boxplot(score.data[3:6])

通過箱線圖,可以直觀地發(fā)現(xiàn),課堂活動、作業(yè)和考試分數(shù)與總成績之間存在一定的差異性,主要體現(xiàn)以下四點:

1) 在學(xué)生的課堂活動成績相較于其他三項較高,而且相對集中,數(shù)據(jù)離散值較少;

2) 作業(yè)的箱線圖相較于其他三項離散值最多,說明學(xué)生在作業(yè)完成情況上差異項較大;

3) 學(xué)生的考試成績雖均值較低,但數(shù)據(jù)的分布情況最好,可以滿足成績的正態(tài)分布規(guī)律;

4) 從總成績的分布來看,該科目的教學(xué)效果較良好,基本滿足教學(xué)要求。

5 總結(jié)

本文借助數(shù)據(jù)可視化平臺RStudio,對本校計算機網(wǎng)絡(luò)技術(shù)專業(yè)的專業(yè)基礎(chǔ)課程計算機網(wǎng)絡(luò)基礎(chǔ)的課程成績進行了全面細致的分析,使用R語言實現(xiàn)了對數(shù)據(jù)的初步統(tǒng)計分析,并通過散點矩陣圖和箱線圖對教學(xué)效果進行可視化分析,從而為教學(xué)質(zhì)量改革提出有效建議。

近年來,隨著大數(shù)據(jù)時代的到來,基于R語言的數(shù)據(jù)挖掘技術(shù)得到了快速發(fā)展和應(yīng)用的良機[5]。同時也為高校教師提供了便利,促使我們將其使用在學(xué)生成績分析中,通過數(shù)據(jù)統(tǒng)計和可視化圖形來發(fā)現(xiàn)教學(xué)中的問題,從而進一步優(yōu)化教學(xué)過程,提升專業(yè)核心競爭力。

參考文獻:

[1] Kabacoff R I.R語言實戰(zhàn)[M].高濤,肖楠,陳鋼,譯.北京:人民郵電出版社,2013.

[2] 林智章,張良均.R語言編程基礎(chǔ)[M].北京:人民郵電出版社,2019.

[3] 洪明意,龍海俠,王覓,等.R語言在學(xué)習(xí)成績應(yīng)用中的探究[J].福建電腦,2018,34(4):3-5.

[4] 楊超.基于R語言的學(xué)生成績分析[J].遼寧師專學(xué)報(自然科學(xué)版),2020,22(4):95-99.

[5] 岳強,胡中玉,文瑾,等.基于R語言的數(shù)據(jù)挖掘課程實驗設(shè)計[J].微型電腦應(yīng)用,2016,32(5):31-34,37.

【通聯(lián)編輯:聞翔軍】

收稿日期:2022-03-16

基金項目:教育部高校學(xué)生司關(guān)于供需對接就業(yè)育人項目(人力資源提升項目)(項目編號:20220101016)

作者簡介:吳立知(1985—) ,女,貴州貴陽人,副教授,碩士,研究方向為網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)挖掘。

猜你喜歡
R語言數(shù)據(jù)分析可視化
基于CiteSpace的足三里穴研究可視化分析
基于Power BI的油田注水運行動態(tài)分析與可視化展示
云南化工(2021年8期)2021-12-21 06:37:54
基于CGAL和OpenGL的海底地形三維可視化
“融評”:黨媒評論的可視化創(chuàng)新
傳媒評論(2019年4期)2019-07-13 05:49:14
基于GPS軌跡數(shù)據(jù)進行分析改善城市交通擁擠
基于R語言的Moodle平臺數(shù)據(jù)挖掘技術(shù)的研究
Excel電子表格在財務(wù)日常工作中的應(yīng)用
淺析大數(shù)據(jù)時代背景下的市場營銷策略
新常態(tài)下集團公司內(nèi)部審計工作研究
中國市場(2016年36期)2016-10-19 04:31:23
淺析大數(shù)據(jù)時代對企業(yè)營銷模式的影響
保靖县| 白朗县| 永清县| 永福县| 灌南县| 游戏| 珠海市| 阜康市| 顺昌县| 眉山市| 竹北市| 枞阳县| 汉中市| 丰宁| 集安市| 石狮市| 凌云县| 高台县| 衡水市| 武强县| 麦盖提县| 五常市| 辽源市| 靖宇县| 迁安市| 琼结县| 枝江市| 赞皇县| 万州区| 衡东县| 文成县| 米泉市| 洪江市| 紫云| 桓台县| 石阡县| 讷河市| 无锡市| 汾阳市| 华亭县| 县级市|