国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

決策樹在成績分析中的應(yīng)用

2015-05-22 06:41吳煥瑞
智富時(shí)代 2015年3期
關(guān)鍵詞:決策樹數(shù)據(jù)挖掘

吳煥瑞

【摘 要】數(shù)據(jù)挖掘技術(shù)能夠從海量信息中獲取有用的知識(shí),有利于輔助管理者制定決策。分析《計(jì)算機(jī)信息技術(shù)》的課程成績時(shí),挖掘得出影響學(xué)生成績的潛在的因素,目的在于改善課程教學(xué)。

【關(guān)鍵詞】決策樹;數(shù)據(jù)挖掘;成績分析

一、引言

傳統(tǒng)的學(xué)生學(xué)習(xí)成績分析大多只是將學(xué)生的考試成績檔和查詢做簡單的排序和分析,如果將數(shù)據(jù)挖掘技術(shù)運(yùn)用到高校學(xué)生成績分析中來,對(duì)成績數(shù)據(jù)進(jìn)行更深層次的有效分析處理,可以更加全面地分析各種影響學(xué)生成績的因素以及學(xué)生各項(xiàng)成績之間的潛在聯(lián)系,可以幫助教師們認(rèn)清同學(xué)們的學(xué)習(xí)現(xiàn)狀,從而更加靈活和有效的組織教學(xué),同時(shí),還可以進(jìn)一步幫助同學(xué)們科學(xué)的、有針對(duì)性的提高學(xué)習(xí)成績。

二、決策樹介紹

決策樹是一種類似于流程圖的樹結(jié)構(gòu),它對(duì)數(shù)據(jù)進(jìn)行分類,以此達(dá)到預(yù)測(cè)的目的。決策樹由決策結(jié)點(diǎn)、分支和葉子組成,每個(gè)決策結(jié)點(diǎn)代表一個(gè)問題或決策,最上面的結(jié)點(diǎn)為根結(jié)點(diǎn),每個(gè)分支代表一個(gè)新的測(cè)試輸出,每一個(gè)內(nèi)部節(jié)點(diǎn)代表在一個(gè)屬性上的測(cè)試,每一個(gè)葉子結(jié)點(diǎn)代表一種可能的分類結(jié)果。決策樹結(jié)構(gòu)是采用自上而下的遞歸算法,由內(nèi)部結(jié)點(diǎn)屬性值的比較來判斷下面再根據(jù)哪個(gè)結(jié)點(diǎn)進(jìn)行分支,最后找到?jīng)Q策樹的葉節(jié)點(diǎn)。

三、決策樹算法在《計(jì)算機(jī)信息技術(shù)》成績分析中的應(yīng)用

《計(jì)算機(jī)信息技術(shù)》在學(xué)生在大一時(shí)上的一門基礎(chǔ)課,包含選擇題、windows操作、word操作、excel操作、PPT、網(wǎng)絡(luò)等,利用決策樹技術(shù)研究在計(jì)算機(jī)等級(jí)考試中,各個(gè)模塊對(duì)成績影響的程度,通過構(gòu)造決策樹可以很容易看出,哪些屬性對(duì)成績起決定作用最大。

(一)數(shù)據(jù)采集

本文利用的數(shù)據(jù)源是2013級(jí)計(jì)算機(jī)類專業(yè)的《計(jì)算機(jī)信息技術(shù)》成績,由于現(xiàn)實(shí)數(shù)據(jù)是不完整和包含噪聲的,對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,是進(jìn)行數(shù)據(jù)挖掘操作前必須要做的一個(gè)非常重要的步驟。數(shù)據(jù)預(yù)處理部分包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換等操作。

數(shù)據(jù)清洗:采用忽略元組的方式,將采集到的原始數(shù)據(jù)中缺考、緩考、曠考、作弊的學(xué)生記錄刪除。

數(shù)據(jù)選擇:因?yàn)橹饕槍?duì)各個(gè)模塊對(duì)成績的影響進(jìn)行分析,所以學(xué)生的學(xué)號(hào)姓名等無關(guān)字段一并刪除。

數(shù)據(jù)轉(zhuǎn)換:因?yàn)橹攸c(diǎn)分析成績及格和不及格決定因素,因此將數(shù)據(jù)轉(zhuǎn)換為表:

(二)數(shù)據(jù)分析

利用C5.0算法,在Spss Clementine下建立“成績分析”表的決策樹模型。

流中將“分析結(jié)果.xls”作為源文件節(jié)點(diǎn)。用到了Excel、類型、C5.0模型三個(gè)對(duì)象。將三個(gè)節(jié)點(diǎn)對(duì)象拖如流中,并建立其連接。在建立成績是否及格決策樹模型時(shí),以等級(jí)屬性作為分類屬性。運(yùn)行后對(duì)結(jié)果進(jìn)行了分析,得出了基于等級(jí)字段類型的決策樹模型為圖2,分類規(guī)則如圖3.

(三)結(jié)果分析

通過以上分析,可以看到對(duì)EXCEL決定這最終成績的影響是最為重要的,其次是網(wǎng)絡(luò),word。因此,同學(xué)們?cè)谟?jì)算機(jī)信息技術(shù)的等級(jí)考試的時(shí)候可以將excel作為重點(diǎn)來進(jìn)行強(qiáng)化訓(xùn)練。另一方面,任課教師也可以根據(jù)通過等級(jí)的幾種規(guī)則有所了解,在日常的教學(xué)工作中,合理制定教學(xué)計(jì)劃,適時(shí)調(diào)整教學(xué)方法。授課教師要在課堂上多進(jìn)行excel強(qiáng)化訓(xùn)練,經(jīng)常提醒同學(xué)們多重視、多練習(xí)。因此根據(jù)數(shù)據(jù)挖掘分析結(jié)果教師對(duì)同學(xué)們學(xué)習(xí)進(jìn)行科學(xué)的指導(dǎo),幫助學(xué)生進(jìn)一步提高學(xué)習(xí)效率。

四、總結(jié)

本文運(yùn)用數(shù)據(jù)挖掘的技術(shù)建立了分類處理模型,探究了《計(jì)算機(jī)信息技術(shù)》這門課中,找出規(guī)律,從而不斷改進(jìn)教學(xué)工作,指導(dǎo)學(xué)生調(diào)整學(xué)習(xí)計(jì)劃、完善學(xué)習(xí)方法、科學(xué)有效提高學(xué)習(xí)成績。

【參考文獻(xiàn)】

[1]吳全勝,馬敏.數(shù)據(jù)挖掘技術(shù)及其應(yīng)用現(xiàn)狀[J].科技信息,2009(33).

[2]范明 ,孟小峰,譯.數(shù)據(jù)挖掘概念與技術(shù)[M].機(jī)械工業(yè)出版社,2001.

[3]趙艷春.決策樹算法在中職招生宣傳中的應(yīng)用研究[J].中國西部科技,2013 (01).

[4]張春琴.數(shù)據(jù)挖掘技術(shù)在課程成績分析管理中的應(yīng)用研究[D].杭州:浙江工業(yè)大學(xué),2009.

猜你喜歡
決策樹數(shù)據(jù)挖掘
一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹算法
決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
基于改進(jìn)決策樹的故障診斷方法研究
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
基于決策樹的出租車乘客出行目的識(shí)別
基于決策樹的復(fù)雜電網(wǎng)多諧波源監(jiān)管
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
數(shù)據(jù)挖掘的分析與探索
基于GPGPU的離散數(shù)據(jù)挖掘研究
英德市| 东明县| 永仁县| 自贡市| 綦江县| 获嘉县| 襄汾县| 察隅县| 茌平县| 拉萨市| 樟树市| 浪卡子县| 肇州县| 光山县| 石渠县| 乡城县| 青川县| 革吉县| 宁蒗| 环江| 正宁县| 乐都县| 晴隆县| 邵武市| 肇州县| 五家渠市| 桓仁| 广州市| 双城市| 沙湾县| 莲花县| 喜德县| 苏尼特左旗| 青冈县| 宜州市| 喀什市| 尤溪县| 武鸣县| 琼结县| 九寨沟县| 错那县|