吳煥瑞
【摘 要】數(shù)據(jù)挖掘技術(shù)能夠從海量信息中獲取有用的知識(shí),有利于輔助管理者制定決策。分析《計(jì)算機(jī)信息技術(shù)》的課程成績時(shí),挖掘得出影響學(xué)生成績的潛在的因素,目的在于改善課程教學(xué)。
【關(guān)鍵詞】決策樹;數(shù)據(jù)挖掘;成績分析
一、引言
傳統(tǒng)的學(xué)生學(xué)習(xí)成績分析大多只是將學(xué)生的考試成績檔和查詢做簡單的排序和分析,如果將數(shù)據(jù)挖掘技術(shù)運(yùn)用到高校學(xué)生成績分析中來,對(duì)成績數(shù)據(jù)進(jìn)行更深層次的有效分析處理,可以更加全面地分析各種影響學(xué)生成績的因素以及學(xué)生各項(xiàng)成績之間的潛在聯(lián)系,可以幫助教師們認(rèn)清同學(xué)們的學(xué)習(xí)現(xiàn)狀,從而更加靈活和有效的組織教學(xué),同時(shí),還可以進(jìn)一步幫助同學(xué)們科學(xué)的、有針對(duì)性的提高學(xué)習(xí)成績。
二、決策樹介紹
決策樹是一種類似于流程圖的樹結(jié)構(gòu),它對(duì)數(shù)據(jù)進(jìn)行分類,以此達(dá)到預(yù)測(cè)的目的。決策樹由決策結(jié)點(diǎn)、分支和葉子組成,每個(gè)決策結(jié)點(diǎn)代表一個(gè)問題或決策,最上面的結(jié)點(diǎn)為根結(jié)點(diǎn),每個(gè)分支代表一個(gè)新的測(cè)試輸出,每一個(gè)內(nèi)部節(jié)點(diǎn)代表在一個(gè)屬性上的測(cè)試,每一個(gè)葉子結(jié)點(diǎn)代表一種可能的分類結(jié)果。決策樹結(jié)構(gòu)是采用自上而下的遞歸算法,由內(nèi)部結(jié)點(diǎn)屬性值的比較來判斷下面再根據(jù)哪個(gè)結(jié)點(diǎn)進(jìn)行分支,最后找到?jīng)Q策樹的葉節(jié)點(diǎn)。
三、決策樹算法在《計(jì)算機(jī)信息技術(shù)》成績分析中的應(yīng)用
《計(jì)算機(jī)信息技術(shù)》在學(xué)生在大一時(shí)上的一門基礎(chǔ)課,包含選擇題、windows操作、word操作、excel操作、PPT、網(wǎng)絡(luò)等,利用決策樹技術(shù)研究在計(jì)算機(jī)等級(jí)考試中,各個(gè)模塊對(duì)成績影響的程度,通過構(gòu)造決策樹可以很容易看出,哪些屬性對(duì)成績起決定作用最大。
(一)數(shù)據(jù)采集
本文利用的數(shù)據(jù)源是2013級(jí)計(jì)算機(jī)類專業(yè)的《計(jì)算機(jī)信息技術(shù)》成績,由于現(xiàn)實(shí)數(shù)據(jù)是不完整和包含噪聲的,對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,是進(jìn)行數(shù)據(jù)挖掘操作前必須要做的一個(gè)非常重要的步驟。數(shù)據(jù)預(yù)處理部分包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換等操作。
數(shù)據(jù)清洗:采用忽略元組的方式,將采集到的原始數(shù)據(jù)中缺考、緩考、曠考、作弊的學(xué)生記錄刪除。
數(shù)據(jù)選擇:因?yàn)橹饕槍?duì)各個(gè)模塊對(duì)成績的影響進(jìn)行分析,所以學(xué)生的學(xué)號(hào)姓名等無關(guān)字段一并刪除。
數(shù)據(jù)轉(zhuǎn)換:因?yàn)橹攸c(diǎn)分析成績及格和不及格決定因素,因此將數(shù)據(jù)轉(zhuǎn)換為表:
(二)數(shù)據(jù)分析
利用C5.0算法,在Spss Clementine下建立“成績分析”表的決策樹模型。
流中將“分析結(jié)果.xls”作為源文件節(jié)點(diǎn)。用到了Excel、類型、C5.0模型三個(gè)對(duì)象。將三個(gè)節(jié)點(diǎn)對(duì)象拖如流中,并建立其連接。在建立成績是否及格決策樹模型時(shí),以等級(jí)屬性作為分類屬性。運(yùn)行后對(duì)結(jié)果進(jìn)行了分析,得出了基于等級(jí)字段類型的決策樹模型為圖2,分類規(guī)則如圖3.
(三)結(jié)果分析
通過以上分析,可以看到對(duì)EXCEL決定這最終成績的影響是最為重要的,其次是網(wǎng)絡(luò),word。因此,同學(xué)們?cè)谟?jì)算機(jī)信息技術(shù)的等級(jí)考試的時(shí)候可以將excel作為重點(diǎn)來進(jìn)行強(qiáng)化訓(xùn)練。另一方面,任課教師也可以根據(jù)通過等級(jí)的幾種規(guī)則有所了解,在日常的教學(xué)工作中,合理制定教學(xué)計(jì)劃,適時(shí)調(diào)整教學(xué)方法。授課教師要在課堂上多進(jìn)行excel強(qiáng)化訓(xùn)練,經(jīng)常提醒同學(xué)們多重視、多練習(xí)。因此根據(jù)數(shù)據(jù)挖掘分析結(jié)果教師對(duì)同學(xué)們學(xué)習(xí)進(jìn)行科學(xué)的指導(dǎo),幫助學(xué)生進(jìn)一步提高學(xué)習(xí)效率。
四、總結(jié)
本文運(yùn)用數(shù)據(jù)挖掘的技術(shù)建立了分類處理模型,探究了《計(jì)算機(jī)信息技術(shù)》這門課中,找出規(guī)律,從而不斷改進(jìn)教學(xué)工作,指導(dǎo)學(xué)生調(diào)整學(xué)習(xí)計(jì)劃、完善學(xué)習(xí)方法、科學(xué)有效提高學(xué)習(xí)成績。
【參考文獻(xiàn)】
[1]吳全勝,馬敏.數(shù)據(jù)挖掘技術(shù)及其應(yīng)用現(xiàn)狀[J].科技信息,2009(33).
[2]范明 ,孟小峰,譯.數(shù)據(jù)挖掘概念與技術(shù)[M].機(jī)械工業(yè)出版社,2001.
[3]趙艷春.決策樹算法在中職招生宣傳中的應(yīng)用研究[J].中國西部科技,2013 (01).
[4]張春琴.數(shù)據(jù)挖掘技術(shù)在課程成績分析管理中的應(yīng)用研究[D].杭州:浙江工業(yè)大學(xué),2009.