戴堅(jiān)
摘??要:答題正確性不僅取決于學(xué)生對某一知識點(diǎn)的掌握程度,還受到學(xué)生心理狀態(tài)、答題習(xí)慣等多方面因素的影響。為探究學(xué)生在線答題正確性的影響因素,基于SPSS?Modeler,使用決策樹和人工神經(jīng)網(wǎng)絡(luò)兩種統(tǒng)計分析方法,對影響學(xué)生答題正確性的平均知識水平、平均粗心程度、行為總數(shù)、專注度、沮喪、鉆系統(tǒng)的空子這6個因素進(jìn)行了分析。結(jié)果顯示:平均知識水平對平均正確性的影響最大,平均粗心程度次之。研究成果將為學(xué)生學(xué)習(xí)行為的改進(jìn)和老師教學(xué)方法的完善提供理論依據(jù)與指導(dǎo)。
關(guān)鍵詞:SPSS?Modeler??決策樹??人工神經(jīng)網(wǎng)絡(luò)??答題正確性??影響因素
中圖分類號:G434????????????????文獻(xiàn)標(biāo)識碼:A???文章編號:1672-3791(2022)07(b)-0000-00
Research?on?Factors?Affecting?the?Correctness?of?Students'?Online?Answers?Based?on?Decision?Tree?and?Artificial?Neural?Network
DAI?Jian
(College?of?Educational?Science?and?Technology,?Zhejiang?University?of?Technology,?Hangzhou,Zhejiang?Province,310023?China)
Abstract:?The?correctness?of?answering?questions?not?only?depends?on?students'?mastery?of?a?certain?knowledge?point,?but?also?is?influenced?by?various?factors?such?as?students'?mental?state?and?answering?habits.?To?investigate?the?factors?influencing?students'?online?answer?correctness,?six?factors,?including?average?knowledge?level,?average?carelessness,?total?number?of?behaviors,?concentration,?frustration,?and?drilling?the?system,?were?analyzed?based?on?SPSS?Modeler,?using?two?statistical?analysis?methods,?decision?tree?and?artificial?neural?network,?to?influence?students'?answer?correctness.?The?results?showed?that?the?average?level?of?knowledge?had?the?greatest?effect?on?average?correctness,?followed?by?the?average?level?of?carelessness.?The?results?of?the?study?will?provide?theoretical?basis?and?guidance?for?the?improvement?of?students'?learning?behaviors?and?the?improvement?of?teachers'?teaching?methods.954C5CC5-D736-41D1-B0D6-667E2E2DF32D
Key?Words:?SPSS?Modeler;?Decision?tree;?Artificial?neural?network;?Correctness?of?answers;?Influencing?factors
1??研究背景
網(wǎng)絡(luò)教學(xué)平臺是利用網(wǎng)絡(luò)技術(shù)手段給予學(xué)習(xí)者支持和服務(wù)的網(wǎng)絡(luò)工具[1]。后疫情背景下,教師傾向于使用網(wǎng)絡(luò)教學(xué)平臺開展教學(xué)工作和學(xué)生考核[2]。在線測試作為一種比較便捷的考核形式,受到了教師和學(xué)生的青睞。在線答題的正確性作為衡量學(xué)生知識掌握程度的重要指標(biāo),受到了教師和學(xué)生的廣泛關(guān)注。然而,目前的研究很少涉及在線答題正確性的影響因素,導(dǎo)致學(xué)生缺乏理論和數(shù)據(jù)依據(jù)來有效提高答題正確性,教師也無法采取針對性的措施來提高班級的整體成績。因此,該文將對影響學(xué)生在線答題的因素進(jìn)行分析,找出主要的影響因素,為廣大師生的教與學(xué)提供理論依據(jù)和科學(xué)指導(dǎo)。
2??研究方法
2.1??數(shù)據(jù)來源
研究樣本數(shù)據(jù)來源于ITEST平臺,包含20?638條學(xué)生用戶的在線學(xué)習(xí)數(shù)據(jù),其中的字段有AveKnow(學(xué)生的平均知識水平)、AveCarelessness(學(xué)生的平均粗心程度)等。
2.2??研究工具
SPSS?Modeler是IBM公司開發(fā)的數(shù)據(jù)挖掘軟件,其由SPSS統(tǒng)計分析軟件與Clementine數(shù)據(jù)挖掘軟件整合而成[3],允許研究人員組織數(shù)據(jù)并對其進(jìn)行快速概述,以更有效地得出有意義的結(jié)果[4]。該研究使用的版本為SPSS?Modeler?18.0。
2.3??變量選取與數(shù)據(jù)預(yù)處理
該文擬探究影響學(xué)生在線答題正確性的主要因素,為教育教學(xué)提供有價值的參考。因此,研究選取的7個變量分別為:AveKnow(學(xué)生的平均知識水平)、AveCarelessness(學(xué)生的平均粗心程度)、AveCorrect(學(xué)生的平均正確性)、NumActions(系統(tǒng)中學(xué)生的行為總數(shù))、AveResEngcon(平均學(xué)生情緒:專注度)、AveResFrust(平均學(xué)生情緒:沮喪)、AveResGaming(平均學(xué)生情緒:鉆系統(tǒng)的空子),其中AveCorrect為輸出變量,其余變量為輸入變量。
對數(shù)據(jù)進(jìn)行預(yù)處理,將AveCorrect字段中低于或等于0.3的數(shù)據(jù)替換為“低”,高于0.3且低于0.6的數(shù)據(jù)替換為“中”,高于0.3或等于0.6的數(shù)據(jù)替換為“高”。處理完畢后,將數(shù)據(jù)文件導(dǎo)入SPSS?Modeler?18.0,使用決策樹和神經(jīng)網(wǎng)絡(luò)兩種統(tǒng)計方法對相關(guān)情況進(jìn)行分析和預(yù)測,找出影響學(xué)生在線答題正確性的主要因素,為制訂更好的學(xué)習(xí)計劃提出科學(xué)的建議。
3??研究過程
3.1??決策樹分析
決策樹借由分類已知的數(shù)據(jù)建立樹狀結(jié)構(gòu),從中歸納出數(shù)據(jù)的規(guī)律性[5]。讀取數(shù)據(jù)文件后,使用過濾器過濾無關(guān)變量,使用“類型”節(jié)點(diǎn)將AveCorrect字段的角色設(shè)定為“目標(biāo)”,再通過“分區(qū)”節(jié)點(diǎn)將訓(xùn)練分區(qū)大小設(shè)為70%,測試分區(qū)大小設(shè)為30%,分別作為訓(xùn)練集和測試集。最后,將“C5.0”節(jié)點(diǎn)連接到當(dāng)前數(shù)據(jù)流,運(yùn)行結(jié)果如圖1所示。
左圖為模型的規(guī)則集,其包含9條規(guī)則,解釋列舉如下。
(1)當(dāng)學(xué)生的平均知識水平小于或等于0.118時,如果其平均粗心程度小于或等于0.067、平均知識水平小于或等于0.067、專注度小于或等于0.616,并且系統(tǒng)中的行為總數(shù)小于或等于218,則其答題平均正確性為低。在訓(xùn)練樣本中,有159個學(xué)生符合這條規(guī)則且平均正確性低,該規(guī)則準(zhǔn)確率為100%。
(2)當(dāng)學(xué)生的平均知識水平小于或等于0.118時,如果其平均粗心程度小于或等于0.067、平均知識水平小于或等于0.067、專注度小于或等于0.616,并且系統(tǒng)中的行為總數(shù)大于218,則其答題平均正確性為中。在訓(xùn)練樣本中,有222個學(xué)生符合這條規(guī)則且平均正確性為中,該規(guī)則準(zhǔn)確率為100%。
(3)當(dāng)學(xué)生的平均知識水平小于或等于0.118時,如果其平均粗心程度小于或等于0.067、平均知識水平小于或等于0.067,且專注度大于0.616,則其答題平均正確性為低。在訓(xùn)練樣本中,有869個學(xué)生符合這條規(guī)則且平均正確性低,該規(guī)則準(zhǔn)確率為100%。
由右圖的預(yù)測變量重要性結(jié)果可知,變量的重要性排序?yàn)椋篈veKnow>AveCarelessness>AveResGaming>NumActions>AveResEngcon=?AveResFrust。由此可見,學(xué)生的平均知識水平對答題平均正確性的影響最大,平均粗心程度次之,專注度和沮喪情緒的影響最小。
3.2??人工神經(jīng)網(wǎng)絡(luò)分析
人工神經(jīng)網(wǎng)絡(luò)是從本質(zhì)上對大腦工作特性的一種簡單模擬的仿生學(xué)[6]。運(yùn)行模型,即可在出現(xiàn)的對話框中看到模型概要、預(yù)測變量重要性、混淆矩陣、神經(jīng)網(wǎng)絡(luò)的層次結(jié)構(gòu)等。
由預(yù)測變量重要性(圖2)可知,平均知識水平對平均正確性的影響最大,平均粗心程度次之,其余4個變量的影響都較小。
由混淆矩陣可知,模型預(yù)測的總體準(zhǔn)確率為100%,非常理想。
由神經(jīng)網(wǎng)絡(luò)的層次結(jié)構(gòu)(圖3)可知,該模型是一個三層神經(jīng)網(wǎng)絡(luò),其中包含一個隱層,隱層中包含6個隱節(jié)點(diǎn)(神經(jīng)元1~神經(jīng)元6)。
4??結(jié)語
該文通過決策樹和人工神經(jīng)網(wǎng)絡(luò)探究了影響學(xué)生在線答題正確性的影響因素。通過分析可以看出,平均知識水平和平均粗心程度對平均正確性有較大影響,而學(xué)生的行為總數(shù)對平均正確性的影響較小。鑒于此,學(xué)生應(yīng)該在學(xué)習(xí)時使用科學(xué)合理的方法,不能一味地追求行為的累加,而要注重知識的積累,切實(shí)提高自身的知識水平,還應(yīng)該在答題時認(rèn)真審題,不要麻痹大意。與此同時,老師應(yīng)該豐富自己的知識儲備,并使用合適的教學(xué)方法將知識教授給學(xué)生;此外,還應(yīng)該在答題時提醒學(xué)生注意審題,考慮全面,以便于提高答題正確性。
參考文獻(xiàn)
[1]? 劉歡.基于網(wǎng)絡(luò)學(xué)習(xí)平臺的高中信息技術(shù)課互動教學(xué)研究[D].延安:延安大學(xué),2021.
[2]? 沈艷.后疫情時代雙線融合混合式教學(xué)模式探析——以醫(yī)藥市場營銷為例[J].船舶職業(yè)教育,2021,9(5):34-37.
[3]? 李郁,韓松,婁永梅,等.SPSS?Modeler在軌道交通客流預(yù)測中的應(yīng)用[J].鐵路通信信號工程技術(shù),2020,17(1):80-83,95.
[4]? YEH?S?S.?Tourism?recovery?strategy?against?COVID-19?pandemic[J].?Tourism?Recreation?Research,2021,46(2):188-194.
[5]? 岳景鵬.基于C5.0決策樹算法的學(xué)生成績預(yù)測算法研究與應(yīng)用[D].長春:吉林大學(xué),2020.
[6]? 楊猛.基于遺傳算法與人工神經(jīng)網(wǎng)絡(luò)的加熱爐建模方法研究[D].合肥:中國科學(xué)技術(shù)大學(xué),2017.954C5CC5-D736-41D1-B0D6-667E2E2DF32D