国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘技術(shù)在學(xué)生綜合素質(zhì)測評中的應(yīng)用

2016-10-21 16:37王鶯
科教導(dǎo)刊 2016年8期
關(guān)鍵詞:總成績獎懲數(shù)據(jù)挖掘

王鶯

摘 要 本文主要探討了把數(shù)據(jù)挖掘技術(shù)引用到學(xué)生綜合素質(zhì)測評工作中,對學(xué)生相關(guān)數(shù)據(jù)進(jìn)行分析,從中挖掘有用知識,為學(xué)校管理及輔導(dǎo)員工作決策提供有利幫助,進(jìn)一步提高學(xué)生管理工作的實(shí)效性和針對性。

關(guān)鍵詞 輔導(dǎo)員 數(shù)據(jù)挖掘 C4.5算法

中圖分類號:G712 文獻(xiàn)標(biāo)識碼:A DOI:10.16400/j.cnki.kjdkz.2016.03.006

Application of Data Mining Technology in Students'

Comprehensive Quality Assessment

WANG Ying

(Taizhou Vocational and Technical College, Taizhou, Zhejiang 318000)

Abstract This paper discusses the data mining technology to students' comprehensive quality evaluation reference work, the students analyze the relevant data, to dig a useful knowledge to help school management to provide favorable and counselors decision to further improve the effectiveness of student management and targeted.

Key words counselor; data mining; C4.5 algorithm

0 引言

推優(yōu)入黨、各類評獎評優(yōu)是高校輔導(dǎo)員工作的一個重要方面,各種榮譽(yù)名單的確定都是基于學(xué)生綜合素質(zhì)評價為基礎(chǔ)展開的。但現(xiàn)大多數(shù)高校中輔導(dǎo)員人數(shù)缺口較大,致使其事務(wù)性工作過多,臨時性和瑣碎性工作占用了輔導(dǎo)員大量的時間與精力,輔導(dǎo)員無法做到對每個學(xué)生情況的全面真實(shí)了解,無法準(zhǔn)確地了解學(xué)生的綜合素質(zhì)水平。

伴隨著信息技術(shù)的廣泛應(yīng)用,各高校都積累了大量的學(xué)生信息,如學(xué)生獎懲信息、學(xué)籍信息等。運(yùn)用傳統(tǒng)的數(shù)據(jù)分析方法對高校學(xué)生管理問題進(jìn)行研究,不能有效提取出數(shù)據(jù)中潛在的價值信息和規(guī)則,無法為學(xué)生管理工作提供決策依據(jù)。數(shù)據(jù)挖掘(Data Mining):就是從數(shù)據(jù)中“淘金”,從大量數(shù)據(jù)中獲取那些未知的、隱含的、有潛在價值的信息的過程。將數(shù)據(jù)挖掘決策樹分類方法應(yīng)用于學(xué)生綜合素質(zhì)評價中,能夠較為全面、公平、客觀地分析和掌握一個學(xué)生的發(fā)展?fàn)顩r,能較為動態(tài)地了解學(xué)生的綜合素質(zhì)水平,可幫助輔導(dǎo)員在獎學(xué)金名額分配、各類評獎評優(yōu)、推優(yōu)入黨、就業(yè)推薦等學(xué)生工作中更好地做決策,還可以研究學(xué)校應(yīng)該培養(yǎng)哪些能力提高學(xué)生綜合素質(zhì),為輔導(dǎo)員學(xué)生教育工作指明方向。

1 數(shù)據(jù)挖掘技術(shù)在學(xué)生綜合素質(zhì)評價中的應(yīng)用

1.1 研究對象及挖掘目標(biāo)

臺職院獎學(xué)金評定每學(xué)年一次,考慮學(xué)生信息完整性,研究對象定為大二、大三年級學(xué)生,研究的是大二、大三學(xué)生在上學(xué)年(即大一、大二)的數(shù)據(jù)。筆者服務(wù)于臺職院電信學(xué)院,故把2014/2015學(xué)年電信學(xué)院現(xiàn)大二、大三年級學(xué)生的相關(guān)數(shù)據(jù)作為重要處理對象,共計1251人。挖掘的目標(biāo)是根據(jù)這1251位學(xué)生的綜合信息,以學(xué)生綜合素質(zhì)的高低進(jìn)行分類,獲取綜合素質(zhì)高的學(xué)生的特點(diǎn)屬性,對這些特點(diǎn)屬性進(jìn)行分析,進(jìn)而針對性地對學(xué)生進(jìn)行培養(yǎng),使學(xué)生綜合能力得到提高,更適應(yīng)社會發(fā)展需求。

1.2 數(shù)據(jù)采集

根據(jù)挖掘目標(biāo),需獲得以下信息:學(xué)生日常表現(xiàn)(通過學(xué)生系統(tǒng)日常登記記錄獲得)、學(xué)生獎懲信息(通過學(xué)生系統(tǒng)日常登記記錄獲得)、學(xué)生基本數(shù)據(jù)信息(通過學(xué)校教務(wù)管理系統(tǒng)獲得)、成績信息(通過學(xué)校教務(wù)管理系統(tǒng)獲得)、學(xué)生綜合評價(根據(jù)學(xué)生綜合素質(zhì)評價標(biāo)準(zhǔn)計算得出,根據(jù)臺職院《學(xué)生手冊》規(guī)定,得分在80分以上的學(xué)生綜合素質(zhì)認(rèn)定為高,得分為60~79的學(xué)生綜合素質(zhì)認(rèn)定為中,60分以下的認(rèn)定為低)。

學(xué)生綜合信息采集:學(xué)號、姓名、班級名稱、學(xué)生日常表現(xiàn)、學(xué)生綜合素質(zhì)評價、學(xué)生獎懲評價。

學(xué)生基本數(shù)據(jù)信息采集:學(xué)號、姓名、班級名稱、專業(yè)、系別、性別、民族、籍貫、家庭地址、身份證號、學(xué)生干部等。

學(xué)生成績信息采集:學(xué)號、姓名、班級名稱、理論課平均成績、實(shí)踐課平均成績、課程總成績等。

1.3 數(shù)據(jù)預(yù)處理

(1)數(shù)據(jù)集成。我校學(xué)生在校期間使用同一學(xué)號,通過學(xué)號屬性,把信息合并成為一個學(xué)生綜合信息匯總表,字段:學(xué)號、姓名、班級名稱、專業(yè)、系別、性別、民族、籍貫、家庭地址、身份證號、聯(lián)系電話、是否學(xué)生干部、理論課平均成績、實(shí)踐課平均成績、課程總成績、學(xué)生日常表現(xiàn)評價、學(xué)生獎懲評價、學(xué)生綜合素質(zhì)評價等。

(2)相關(guān)性分析。集成后的數(shù)據(jù)集包含多個屬性,其中一些屬性與挖掘任務(wù)無關(guān),我們加以刪除,留下課程總成績、學(xué)生日常表現(xiàn)評價、學(xué)生獎懲評價、是否學(xué)生干部、學(xué)生綜合素質(zhì)評價等5個屬性。

(3)數(shù)據(jù)轉(zhuǎn)換。對剩余5個屬性進(jìn)行數(shù)據(jù)建模。將課程總成績的取值離散化為四個值:優(yōu)(>=170)、良(140~169)、中(120~139),因?qū)W校規(guī)定參與各類獎學(xué)金評定、推薦入黨的學(xué)生必須為品學(xué)兼優(yōu)學(xué)生,故不及格的數(shù)據(jù)、有處分記錄的數(shù)據(jù)會被刪除。

(4)數(shù)據(jù)清洗。數(shù)據(jù)清洗,主要是將數(shù)據(jù)庫中重復(fù)的記錄行刪除。將退休學(xué)的學(xué)生信息刪除,對空缺值進(jìn)行手工填補(bǔ),因數(shù)據(jù)基本來自教務(wù)系統(tǒng),且都是在校學(xué)生的重要數(shù)據(jù),工作量不大。

經(jīng)以上步驟,數(shù)據(jù)庫中可作為數(shù)據(jù)挖掘樣本的完整記錄共計有1251條,選擇48條記錄作為測試集,剩余1203條紀(jì)錄作為訓(xùn)練樣本集。生成學(xué)生綜合素質(zhì)評價總表如表1。

表1 學(xué)生綜合素質(zhì)評價總表(訓(xùn)練樣本集)

1.4 用C4.5算法創(chuàng)建決策樹

本文選擇學(xué)生日常表現(xiàn)評價、是否學(xué)生干部、學(xué)生獎懲評價、課程總成績四個屬性作為建立學(xué)生綜合素質(zhì)評價分類決策樹模型的依據(jù),利用C4.5算法,構(gòu)造出決策樹模型如圖1所示:

圖1 學(xué)生綜合素質(zhì)決策樹

1.5 分類規(guī)則生成

根據(jù)圖1,提取決策樹規(guī)則,用 IF-THEN 形式表示如下:

(1)IF(課程總成績=優(yōu)) AND (是否學(xué)生干部=是) THEN 學(xué)生綜合素質(zhì)=高。

(2) IF(課程總成績=良) AND (是否學(xué)生干部=是) AND (學(xué)生日常表現(xiàn)評價=優(yōu)) THEN學(xué)生綜合素質(zhì)=高。

(3)IF(課程總成績=良) AND (是否學(xué)生干部=是) AND (學(xué)生日常表現(xiàn)評價=差) THEN學(xué)生綜合素質(zhì)=低。

(4)IF(課程總成績=良) AND (是否學(xué)生干部=否) AND (學(xué)生獎懲評價=中) THEN學(xué)生綜合素質(zhì)=低。

(5)IF(課程總成績=中) AND (學(xué)生日常表現(xiàn)評價=優(yōu)) THEN學(xué)生綜合素質(zhì)=高。

(6)IF(課程總成績=中) AND (學(xué)生日常表現(xiàn)評價=中) AND (學(xué)生獎懲評價=良) THEN 學(xué)生綜合素質(zhì)=低。

(7)IF(課程總成績=中) AND (學(xué)生日常表現(xiàn)評價=中) AND (學(xué)生獎懲評價=中) THEN 學(xué)生綜合素質(zhì)=低。

(8)IF(課程總成績=中) AND (學(xué)生日常表現(xiàn)評價=差) THEN 學(xué)生綜合素質(zhì)=低。

1.6 結(jié)果分析

評價學(xué)生綜合素質(zhì)高的一條重要標(biāo)準(zhǔn)是學(xué)生課程總成績。如果課程總成績高(表示學(xué)科知識掌握好)且是學(xué)生干部,綜合素質(zhì)高。如果課程總成績良好,是學(xué)生干部且在校日常表現(xiàn)優(yōu)秀,學(xué)生綜合素質(zhì)高。如果課程總成績中等而在校日常表現(xiàn)優(yōu)秀,學(xué)生綜合素質(zhì)高。

對結(jié)果分析,給予學(xué)生培養(yǎng)工作以下指導(dǎo)意見:學(xué)生應(yīng)以學(xué)業(yè)為主,著重知識的積累,注重實(shí)踐育人。其次,學(xué)生是否為學(xué)生干部也較重要,代表學(xué)生在校期間有無擔(dān)任社會工作,學(xué)生溝通、交際等能力在校是否得到鍛煉,作為輔導(dǎo)員,更應(yīng)注重學(xué)生社會實(shí)踐能力的鍛煉,多組織一些技能比賽、辯論賽、社團(tuán)活動等。還有一個可評價學(xué)生綜合素質(zhì)的因素是學(xué)生在校日常表現(xiàn)情況,學(xué)生在校日常表現(xiàn)優(yōu)秀,代表他在學(xué)習(xí)態(tài)度、服務(wù)意識、公寓表現(xiàn)等方面表現(xiàn)較為突出,這種勤懇、踏實(shí)的作風(fēng)是目前企業(yè)單位所要求的,所以應(yīng)給予肯定。

2 結(jié)束語

研究表明將數(shù)據(jù)挖掘技術(shù)應(yīng)用于學(xué)生數(shù)據(jù)的分析,并將這些分析結(jié)果協(xié)助學(xué)生管理工作決策是可行的,通過對大量的學(xué)生學(xué)籍信息、成績信息、學(xué)生獎懲信息等個人信息數(shù)據(jù)的分析和理解,建立數(shù)據(jù)倉庫,并結(jié)合數(shù)據(jù)挖掘算法,挖掘出影響學(xué)生綜合素質(zhì)的關(guān)鍵因素及規(guī)則,實(shí)現(xiàn)了為學(xué)生管理工作者在對學(xué)生各類評獎評優(yōu)、學(xué)生入黨考察及畢業(yè)推薦等工作決策中提供科學(xué)依據(jù)的目標(biāo),最大化地做到“以學(xué)生為本”。

參考文獻(xiàn)

[1] 熊平.數(shù)據(jù)挖掘算法與Clementine實(shí)踐[M].北京:清華大學(xué)出版社,2011.

[2] 薛恩軍.決策樹技術(shù)在學(xué)生成績分析中的應(yīng)用[D].碩士學(xué)位論文,內(nèi)蒙古大學(xué),2008.

[3] 俞磊.基于數(shù)據(jù)挖掘的閩江學(xué)院學(xué)生管理系統(tǒng)設(shè)計與實(shí)現(xiàn)[D].碩士學(xué)位論文,電子科技大學(xué),2013.

[4] Quinlan J R.Induction of Decision Tree[J].Machine Learning,1986.1(1):81-106.

猜你喜歡
總成績獎懲數(shù)據(jù)挖掘
數(shù)據(jù)挖掘綜述
我國納稅信用體系建設(shè)研究
軟件工程領(lǐng)域中的異常數(shù)據(jù)挖掘算法
基于R的醫(yī)學(xué)大數(shù)據(jù)挖掘系統(tǒng)研究
淺談小學(xué)班主任工作方法
飛鏢比賽
淺議教學(xué)管理中的獎與懲
一本面向中高級讀者的數(shù)據(jù)挖掘好書
萍乡市| 桓仁| 土默特左旗| 台前县| 张家港市| 绥滨县| 同仁县| 临沂市| 石嘴山市| 定远县| 重庆市| 新河县| 霍邱县| 土默特右旗| 富民县| 舟曲县| 沽源县| 方山县| 湘西| 英吉沙县| 师宗县| 龙川县| 天门市| 绍兴市| 通州区| 名山县| 淮北市| 静宁县| 乐安县| 盐津县| 沙河市| 罗山县| 北川| 闸北区| 潜江市| 绥阳县| 阿坝| 喀喇| 苍梧县| 天峨县| 茶陵县|