明巧英, 劉淑婷(西安翻譯學院, 西安 710105)
決策樹在學生成績影響因素分析中的應用
明巧英, 劉淑婷
(西安翻譯學院, 西安 710105)
學生的學習成績是評估教學質量的重要依據(jù),但影響學生成績的因素很多。利用數(shù)據(jù)挖掘的核心技術之一決策樹,找出影響學生成績的潛在因素,并有針對性地采取措施,有利于提高教育教學質量。
決策樹; 成績分析; 解決對策
Abstract: Students’ achievement is the basic index for the evaluation of teaching quality. However, it may be subject to a lot of influencing factors. Implementing Decision Tree, one of the core technologies of Data Mining, this paper aims to explore the potential factors affecting students’ achievement, taking targeted measures to improve education and teaching quality.
Keywords: Decision Tree; Achievement Analysis; Coping Measures
隨著社會的發(fā)展,高校的招生規(guī)模也不斷的擴大,除了學生數(shù)量增加外,影響學生成績的因素也在增加。在我國目前的教育行業(yè)中,學生成績是衡量學生對所學知識掌握程度的重要標準,因此不可忽視。所以說對學生成績的影響因素的分析尤為重要,利用一定的技術分析學生的日常行為、教務管理系統(tǒng)中的數(shù)據(jù)等,獲取其中隱含的有價值的信息,找出課程成績和各種相關因素之間的內在聯(lián)系,利于教學相關部門、教師正確制定相關措施,利于教學質量的提高,最大程度地增強教學效果。
本文主要介紹數(shù)據(jù)挖掘中的決策樹技術在學生成績影響因素分析中的挖掘分析,全面了解影響學生成績的因素,幫助教師教學,給教學管理者提供決策依據(jù)。數(shù)據(jù)挖掘就是對數(shù)據(jù)庫或巨大的數(shù)據(jù)集進行分析,挖掘出未知的、隱含的、用戶感興趣的和有潛在價值的信息及規(guī)則,能為用戶提供決策的依據(jù)。決策樹技術是數(shù)據(jù)挖掘的核心技術之一,樹中的非葉節(jié)點對應著數(shù)據(jù)集中的某屬性,葉節(jié)點則對應著分類的結果。從根節(jié)點開始到任一葉節(jié)點為止,對應著一條分類規(guī)則,因此整個決策樹就對應著一組析取表達式規(guī)則,可以If-Then形式表現(xiàn)??傊?,決策樹以樹型結構表達最終的分類結果,便于使用者理解。
2.1 確定分析對象
以筆者2015—2016學年第二學期所授的《網(wǎng)頁設計》課程為例,分析的對象是電子商務專業(yè)2015級的學生。主要挖掘學生的非智力因素、課程測試成績、課程設計等方面的數(shù)據(jù),通過分析數(shù)據(jù),依據(jù)分析結果,使教師能及時地采取有效的教學方法指導教學,提高教學質量。
2.2 數(shù)據(jù)的采集
本研究的數(shù)據(jù)主要有兩個來源:一部分是回收統(tǒng)計調查問卷的結果;另一部分是學生的考核成績、課程設計完成情況(來自于教務管理系統(tǒng)),如表1~表3所示。
2.3 數(shù)據(jù)的處理
數(shù)據(jù)收集完成以后,需要處理才能進行挖掘,主要是因為在這些數(shù)據(jù)中可能含有噪聲(無效的或置信度低)數(shù)據(jù),處理噪聲數(shù)據(jù)后,才能建立出高準確率的數(shù)據(jù)模型。
在調查問卷中,為了方便被調查者作答,文字描述用選項的方式來表現(xiàn)(即選擇ABCD項),而此時又需要把這些選項重新用文字描述表示出來(即將收集來的ABCD選項還原為“是”、“否”等文字)。
學生成績表中的缺考、休學等記錄,要進行清理刪除,因為這種情況屬于數(shù)據(jù)缺失,是無效的,清理后確保表格數(shù)據(jù)的完整性。
表1 問卷調查的部分題目
表2 課程測試的部分數(shù)據(jù)
表3 課程設計的部分數(shù)據(jù)
根據(jù)實際情況,把學生成績的評價指標分為四個等級,優(yōu)秀:85分以上,含85;良好:70—84;合格:60—69;不合格60分以下。
2.4 構建決策樹模型
分別以末考成績、平時成績、課程設計、問卷調查分析結果為根結點,計算其信息增益,信息增益中末考成績最大,所以以末考成績作為根結點構建學生成績分析決策樹,如圖1所示。
2.5 決策樹模型分析及解決對策
決策樹最大的優(yōu)點是可直接提取分類規(guī)則,并以IF…THEN的形式表示出來。觀察圖1的決策樹,把其轉換成如下的分類規(guī)則:
規(guī)則1:IF末考成績=“優(yōu)秀”AND平時成績>=“良好”AND課程設計>=“良好”AND問卷分析>=“合格”THEN總成績=“優(yōu)秀”;
圖1 學生成績分析決策樹
規(guī)則2:IF末考成績=“優(yōu)秀”AND平時成績>=“良好”AND課程設計=“合格”AND問卷分析>=“良好”THEN總成績=“優(yōu)秀”;
通過規(guī)則1和2發(fā)現(xiàn):基礎知識和非智力因素都比較好的學生,只要平時刻苦努力,該門課程的綜合成績自然是優(yōu)秀。
規(guī)則3:IF末考成績>=“合格”AND平時成績=“不合格”AND課程設計>=“合格”AND問卷分析>=“合格”THEN總成績>=“合格”;
通過規(guī)則3發(fā)現(xiàn):基礎知識和非智力因素都比較好的一部分學生,由于平時的自我管理松懈,導致成績平平。對這部分學生應加強平時的教育管理,可使其更優(yōu)秀。
規(guī)則4:IF末考成績=“不合格”AND平時成績>=“合格”AND課程設計>=“合格”AND問卷分析<=“合格”THEN總成績=“不合格”;
通過規(guī)則4發(fā)現(xiàn):這類學生基礎一般,動手能力較好,學習踏實認真,但是心理素質差,學習方法不當,導致綜合成績不合格,對于這類學生首先要進行心理素質的教育和鍛煉,其次要幫助學生改變學習方法。
規(guī)則5:IF末考成績=“不合格”AND平時成績>=“合格”AND課程設計=“不合格”AND問卷分析=“不合格”THEN總成績=“不合格”;
通過規(guī)則5發(fā)現(xiàn):這類學生平時的學習態(tài)度是值得肯定的,但由于基礎和多方面的非智力因素差,導致綜合成績不合格,解決辦法是平時多鼓勵學生,有針對性的做一些訓練。
數(shù)據(jù)挖掘是深層次的數(shù)據(jù)信息分析方法,是一種決策支持過程。本文建立了學生成績分析決策樹模型,提出了影響學生成績的分類規(guī)則,利用這些規(guī)則,可以幫助教師有針對性地教學和管理學生,以達到提高教學質量的目的,為培養(yǎng)合格的人才打下堅實的基礎。
[1] 商俊燕,陸兵,柏倩然.決策樹C4.5算法在學生成績分析中的應用[J].微型電腦應用,2015,31(04):43-43-44.
[2] 李巧君,李偉.數(shù)據(jù)挖掘技術在學生成績分析中的應用研究[J].微型電腦應用,2015,31(04):35-35,36.
[3] 雷燕瑞.數(shù)據(jù)挖掘技術在高職成績分析中的應用[J].軟件,2013,34(12):70-171.
[4] 王平霞,郝志廷.決策樹技術在高職院校學生成績分析中的應用研究[J].電腦知識與技術,2013,9(13):2960-2963.
TheApplicationofDecisionTreeintheInfluencingFactorAnalysisofStudents'Achievement
Ming Qiaoying, Liu Shuting
(Xi'an FanYi University, 710105)
TP311
A
2016.11.30)
“決策樹技術在高職類學生成績分析中的研究及應用”課題(16B01)
明巧英(1981-),女,西安人,講師,工程碩士研究生,研究方向:數(shù)據(jù)挖掘. 劉淑婷(1984-),女,西安人,講師,工程碩士研究生,研究方向:網(wǎng)絡工程.
1007-757X(2017)09-0039-02