国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘技術(shù)在計(jì)算機(jī)等級(jí)考試成績中的分析研究

2015-07-13 11:49曾斯
電腦知識(shí)與技術(shù) 2015年13期
關(guān)鍵詞:關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘

曾斯

摘要:利用數(shù)據(jù)挖掘技術(shù)分析某高職院校全國計(jì)算機(jī)等級(jí)考試成績,從中發(fā)現(xiàn)了影響考試成績的一些隱藏信息,得到的結(jié)論對(duì)于提高學(xué)生的考試通過率和教師今后的教學(xué)起著指導(dǎo)作用。

關(guān)鍵詞:數(shù)據(jù)挖掘;等級(jí)考試;關(guān)聯(lián)規(guī)則

中圖分類號(hào):TP3911 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)13-0014-02

Abstract: Analysis of data mining technology the National computer grade examination results of Vocational Colleges, Some of the hidden information that has been found to affect the results of the exam is found. The conclusion is of guiding function for improving students' examination pass rate and teachers' future teaching.

Key words: data mining; grade examination; association rules

1 引言

隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,越來越多的高校開始重視計(jì)算機(jī)應(yīng)用基礎(chǔ)課程的教學(xué),《計(jì)算機(jī)應(yīng)用基礎(chǔ)》作為一門必修的公共基礎(chǔ)課,很多高職院校對(duì)該課程的考核不再是采用單一的期末考試,而是把計(jì)算機(jī)等級(jí)考試成績列為對(duì)考核學(xué)生該課程的重要內(nèi)容和對(duì)教師教學(xué)效果的評(píng)價(jià)依據(jù)。以筆者所任職的學(xué)院為例,學(xué)院將全國計(jì)算機(jī)等級(jí)考試一級(jí)的通過率作為考核學(xué)生的《計(jì)算機(jī)應(yīng)用基礎(chǔ)》課程的成績,而且該證書也得到了很多用人單位的認(rèn)可,也成為了學(xué)生畢業(yè)找工作的一個(gè)敲門磚,因此學(xué)院非常重視。鑒于各種原因,學(xué)生的通過率普遍不高,事實(shí)上,影響學(xué)生考試通過率的原因很多,本文就該問題引入了數(shù)據(jù)挖掘技術(shù),目的是從中找到影響學(xué)生成績的各種關(guān)聯(lián)因素,以此來制定整改措施,為后續(xù)的教學(xué)活動(dòng)提供參考,從而提高學(xué)生計(jì)算機(jī)等級(jí)考試的通過率。

2 數(shù)據(jù)挖掘技術(shù)

數(shù)據(jù)挖掘技術(shù)是從海量的、不完整的、模糊的、有噪聲的以及隨機(jī)的原始數(shù)據(jù)中搜索出隱含在其中的,之前未知的而具有利用價(jià)值的信息的過程。如何對(duì)一些直觀的或隱含的海量數(shù)據(jù)進(jìn)行分析,并且發(fā)現(xiàn)各數(shù)據(jù)間存在的聯(lián)系,提取出有用的模式,用以指導(dǎo)實(shí)際工作是數(shù)據(jù)挖掘技術(shù)的關(guān)鍵所在。由于數(shù)據(jù)挖掘技術(shù)的優(yōu)越性和不斷成熟,目前該技術(shù)已經(jīng)廣泛應(yīng)用到商業(yè)決策、生產(chǎn)控制、工程設(shè)計(jì)和金融業(yè)等多個(gè)領(lǐng)域。

數(shù)據(jù)挖掘的分析方法有多種,關(guān)聯(lián)規(guī)則分析、聚類規(guī)則分析、預(yù)測分析、分類規(guī)則分析等都是常用的挖掘方法。

數(shù)據(jù)挖掘的過程包括以下幾步:首先對(duì)數(shù)據(jù)進(jìn)行收集和預(yù)處理,對(duì)其進(jìn)行消噪,去掉錯(cuò)誤或冗余數(shù)據(jù)等處理,使之成為目標(biāo)數(shù)據(jù),為下一步的操作做準(zhǔn)備,同時(shí)要確定挖掘方法;然后是數(shù)據(jù)變換,根據(jù)之前的挖掘算法建立分析模型;接下來是數(shù)據(jù)挖掘和模式評(píng)估,將上一步得到的經(jīng)過變換后的數(shù)據(jù)進(jìn)行挖掘;最后是結(jié)果分析和知識(shí)同化,解釋并評(píng)估結(jié)果,將分析后得到的知識(shí)應(yīng)用到實(shí)際的案例中。在數(shù)據(jù)挖掘整個(gè)過程中,牽涉到了前期大量的準(zhǔn)備與規(guī)劃工作,幾乎有80%的時(shí)間和精力花費(fèi)在了數(shù)據(jù)的預(yù)處理階段,而且數(shù)據(jù)預(yù)處理階段得出的數(shù)據(jù)質(zhì)量的高低也直接決定了挖掘后的結(jié)果。因此,在進(jìn)行數(shù)據(jù)挖掘分析之前,還是很有必要做好前期的準(zhǔn)備工作。

3 數(shù)據(jù)挖掘技術(shù)在計(jì)算機(jī)等級(jí)考試成績分析中的應(yīng)用

本文挖掘的數(shù)據(jù)來源于作者所任教學(xué)校的幾次全國計(jì)算機(jī)等級(jí)考試一級(jí)成績。由于每次考試都產(chǎn)生幾千條數(shù)據(jù),久而久之,大量的數(shù)據(jù)存儲(chǔ)在教務(wù)系統(tǒng)中,并沒有得到充分的利用,如何利用好這些數(shù)據(jù)為以后的教學(xué)提供服務(wù)是數(shù)據(jù)挖掘的目的所在。在數(shù)據(jù)挖掘之前,需要對(duì)數(shù)據(jù)進(jìn)行清理,比如對(duì)于一些缺考的學(xué)生,還有一些因漏答造成數(shù)據(jù)不完整的記錄等都需要將其清除掉。

3.1應(yīng)用關(guān)聯(lián)規(guī)則分析教師的教齡、職稱、評(píng)教情況在計(jì)算機(jī)等級(jí)考試成績中的影響

關(guān)聯(lián)分析是在當(dāng)前教學(xué)活動(dòng)中使用很頻繁的有效的方法。它用于發(fā)現(xiàn)數(shù)據(jù)庫中數(shù)值之間的相關(guān)性,從中找尋一些潛在的有用信息用于指導(dǎo)以后的教學(xué)工作。目前比較常用的關(guān)聯(lián)分析方法有關(guān)聯(lián)規(guī)則和序列模式。比如從海量的超市購物數(shù)據(jù)中發(fā)現(xiàn)有趣的關(guān)聯(lián)關(guān)系,可以幫助商家進(jìn)行改變營銷策略,如促銷的時(shí)機(jī)、交叉銷售、貨架商品的擺放設(shè)計(jì)等。

對(duì)于某些高職院校,由于取消了單一的期末考試,往往將學(xué)生英語過級(jí)和計(jì)算機(jī)等級(jí)考試的通過率作為評(píng)價(jià)教師教學(xué)效果的依據(jù)。通過運(yùn)用關(guān)聯(lián)規(guī)則來分析學(xué)生的考試成績,挖掘出一些可能會(huì)影響學(xué)生過級(jí)率的一些相關(guān)因素,對(duì)今后的教學(xué)過程起著重要的指導(dǎo)作用?,F(xiàn)將我院計(jì)算機(jī)等級(jí)考試成績進(jìn)行如下分析:

隨機(jī)抽取本院擔(dān)任計(jì)算機(jī)教學(xué)的教師信息和學(xué)生計(jì)算機(jī)等級(jí)考試成績集成教師教學(xué)綜合信息表。然后將教師的教齡、職稱、評(píng)教情況、所教授對(duì)應(yīng)學(xué)生的成績錄入數(shù)據(jù)庫中,其他信息不做處理。為了簡化分析,接下來需要將數(shù)據(jù)進(jìn)行抽象和離散化處理。優(yōu)秀的為3(90~100),良好的為2(80~89),及格的為1(60~79),不及格的為0(0~59)。教齡分為四個(gè)階段,分別用A1(1-5)、A2(6-10)、A3(11-20)、A4(21-30)表示,職稱分別用B1(初級(jí))、B2(中級(jí))、B3(副高)、B4(正高)表示,評(píng)教情況分別用C1(好)、C2(一般)、C3(較差)表示,D1(3,2,1,0)分別表示考試成績的等級(jí)。

數(shù)據(jù)經(jīng)預(yù)處理后的視圖如下:

根據(jù)關(guān)聯(lián)規(guī)則算法,先預(yù)設(shè)最小支持度以及最小可信度,得到如下結(jié)論:教師的教齡和職稱對(duì)于過級(jí)率的影響并不直接,而跟教師的評(píng)教情況卻不無關(guān)系,教師的評(píng)教情況越好,對(duì)應(yīng)的學(xué)生考試成績也就越好。因此,通過及時(shí)反饋學(xué)生對(duì)教師的教學(xué)評(píng)價(jià),來加強(qiáng)教師的教學(xué)質(zhì)量,對(duì)提高學(xué)生等級(jí)考試成績是非常重要的。

3.2 應(yīng)用聚類算法對(duì)等級(jí)考試試題進(jìn)行分析

眾所周知,計(jì)算機(jī)一級(jí)考試題型有以下6種:選擇題、Windows7操作題、文字處理、電子表格、演示文稿和網(wǎng)絡(luò)操作題。在這里將采用聚類算法中的K-Means算法對(duì)這6個(gè)屬性間的聚類分析進(jìn)行挖掘。

為了更好地進(jìn)行聚類分析,首先需要對(duì)數(shù)據(jù)實(shí)行標(biāo)準(zhǔn)化。在實(shí)行標(biāo)準(zhǔn)化時(shí)需遵循的原則是:將每個(gè)題型的實(shí)際得分?jǐn)?shù)除以該題型的總分,如對(duì)于文字處理題,某考生得分為20分,文字處理題的總分為25分,20/25=0.8。同樣的方法,由此得到最終的標(biāo)準(zhǔn)化值范圍是[0,1]。其次是對(duì)數(shù)據(jù)進(jìn)行聚類分析,傳統(tǒng)的K-Means 算法采取的是隨機(jī)選擇初始聚類中心的原則,這就使得不同的初始聚類中心會(huì)造成聚類結(jié)果的差異和不穩(wěn)定。為了使聚類結(jié)果具有更好的穩(wěn)定性,現(xiàn)將學(xué)生的考試成績分布情況大致分為優(yōu)秀、良好、及格和不及格4個(gè)等級(jí)。通過不同的等級(jí)來確定該等級(jí)的初始聚類中心。最后是對(duì)生成的聚類結(jié)果進(jìn)行分析。例如學(xué)生在網(wǎng)絡(luò)操作題上普遍得分率較高,在電子表格處理題上面得分率較低。通過分析教師能夠直觀的了解學(xué)生對(duì)各知識(shí)點(diǎn)的掌握程度,便于以后在實(shí)際的教學(xué)中做出針對(duì)性的改進(jìn)。同時(shí),教師也可根據(jù)各類學(xué)生的學(xué)習(xí)特點(diǎn)做合適的指導(dǎo),調(diào)整教學(xué)方法及相應(yīng)內(nèi)容,從而幫助學(xué)生順利通過考試。

3.3 應(yīng)用分類算法分析影響計(jì)算機(jī)等級(jí)考試成績的其他因素,如有無計(jì)算機(jī)基礎(chǔ)、平時(shí)上機(jī)作業(yè)成績、是否參加了考前培訓(xùn)、學(xué)習(xí)興趣等

所謂分類是對(duì)一個(gè)事件或者一組對(duì)象依據(jù)他們本身的特性來進(jìn)行分類。分類的目的是找到一組能夠科學(xué)地描述數(shù)據(jù)典型特征的模型。以便將來能夠識(shí)別未來數(shù)據(jù)的類別或歸屬。使用分類模型不但可以分析現(xiàn)有的數(shù)據(jù),而且可以預(yù)測未來。分類和預(yù)測作為兩類主要的預(yù)測問題,根據(jù)它們的不同分別用于離散數(shù)據(jù)和連續(xù)數(shù)據(jù)的預(yù)測。對(duì)于影響計(jì)算機(jī)等級(jí)考試成績的諸多因素以及數(shù)據(jù)的特點(diǎn),將應(yīng)用分類算法來對(duì)其各種影響因素來進(jìn)行分析。分析的流程為:首先,采集數(shù)據(jù),主要包括的數(shù)據(jù)有以下幾個(gè)方面:學(xué)生基本信息(學(xué)號(hào)、姓名、性別、院系、班級(jí));學(xué)生的學(xué)習(xí)情況信息(有無計(jì)算機(jī)基礎(chǔ)、是否參加了考前培訓(xùn)、學(xué)習(xí)興趣等);這些信息主要是通過對(duì)學(xué)生的問卷調(diào)查來獲得,成績(平時(shí)上機(jī)作業(yè)成績、等級(jí)考試成績)。其次,對(duì)獲取的數(shù)據(jù)預(yù)處理。在預(yù)處理之前需要對(duì)數(shù)據(jù)進(jìn)行集成和清理,這一步的目的是為了填補(bǔ)一些遺漏的數(shù)據(jù),從而有利于將上述收集到的各種數(shù)據(jù)通過數(shù)據(jù)庫技術(shù)生成一個(gè)標(biāo)準(zhǔn)的學(xué)生成績數(shù)據(jù)庫。然后就是數(shù)據(jù)轉(zhuǎn)換,即對(duì)數(shù)據(jù)進(jìn)行離散化操作。接著是數(shù)據(jù)消減,其目的是縮減挖掘數(shù)據(jù)的規(guī)模,但前提條件是不能影響最終的挖掘結(jié)果。最后是進(jìn)行數(shù)據(jù)分類挖掘并產(chǎn)生分類規(guī)則。通過上述的幾個(gè)步驟可得出哪些因素是影響了學(xué)生考試成績的。

如IF平時(shí)上機(jī)作業(yè)成績=優(yōu)秀 AND有無計(jì)算機(jī)基礎(chǔ)=有AND參加考前培訓(xùn)=是 THEN 等級(jí)考試通過率=96%

IF平時(shí)上機(jī)作業(yè)成績=良好 AND有無計(jì)算機(jī)基礎(chǔ)=有AND參加考前培訓(xùn)=是THEN 等級(jí)考試通過率=75%

IF平時(shí)上機(jī)作業(yè)成績=及格 AND有無計(jì)算機(jī)基礎(chǔ)=有AND參加考前培訓(xùn)=無 THEN 等級(jí)考試通過率=50%

4 結(jié)束語

本文利用了數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則分析、聚類算法和分類算法對(duì)全國計(jì)算機(jī)等級(jí)考試一級(jí)成績進(jìn)行了分析,科學(xué)、客觀地找出了影響考試成績的一系列因素。其分析結(jié)果可以幫助學(xué)生發(fā)現(xiàn)《計(jì)算機(jī)應(yīng)用基礎(chǔ)》這門課程的某些薄弱環(huán)節(jié),對(duì)于以后提高學(xué)生的考試通過率提供了幫助。同時(shí)對(duì)于教師今后的教學(xué)方法的改進(jìn)和學(xué)院對(duì)于等級(jí)考試的相關(guān)工作也起著指導(dǎo)作用。

參考文獻(xiàn):

[1] 劉芳,林海霞.數(shù)據(jù)挖掘技術(shù)在高校計(jì)算機(jī)等級(jí)考試成績分析中的應(yīng)用[J].廣西輕工業(yè),2008(11).

[2] 曾旭,司馬宇.K-Means算法在計(jì)算機(jī)等級(jí)考試成績分析中的應(yīng)用[J].軟件導(dǎo)刊,2012(12).

[3] 袁小玲,李瑞. 數(shù)據(jù)挖掘技術(shù)在高職院校學(xué)生成績管理中的應(yīng)用分析與探究[J].網(wǎng)絡(luò)與信息工程, 2014(13).

猜你喜歡
關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
基于Apriori算法的高校學(xué)生成績數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘分析
基于關(guān)聯(lián)規(guī)則和時(shí)間閾值算法的5G基站部署研究
關(guān)聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進(jìn)
基于關(guān)聯(lián)規(guī)則的計(jì)算機(jī)入侵檢測方法
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
數(shù)據(jù)挖掘的分析與探索
临武县| 彝良县| 冀州市| 桐城市| 嘉义市| 吴川市| 崇礼县| 丰都县| 贡嘎县| 木兰县| 紫阳县| 抚顺市| 旺苍县| 日土县| 南开区| 林西县| 林口县| 新干县| 乐山市| 南乐县| 锡林郭勒盟| 盐山县| 张掖市| 富顺县| 潢川县| 微山县| 东城区| 攀枝花市| 铜梁县| 明溪县| 崇礼县| 长宁县| 句容市| 宜宾县| 东乡| 永嘉县| 许昌市| 阳新县| 广丰县| 鄂伦春自治旗| 宣恩县|