国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘在教務(wù)管理中的應(yīng)用研究

2015-04-01 01:51王麗娜
河南科技 2015年13期
關(guān)鍵詞:項(xiàng)集置信度數(shù)據(jù)挖掘

王麗娜

(河南司法警官職業(yè)學(xué)院信息技術(shù)系,河南 鄭州 450011)

數(shù)據(jù)挖掘在教務(wù)管理中的應(yīng)用研究

王麗娜

(河南司法警官職業(yè)學(xué)院信息技術(shù)系,河南 鄭州 450011)

為了全面了解學(xué)生在校的學(xué)習(xí)情況,更客觀地了解學(xué)校教學(xué)對(duì)學(xué)生學(xué)習(xí)狀況的影響,本文對(duì)學(xué)生的成績(jī)進(jìn)行分析,采用了關(guān)聯(lián)規(guī)則的Apriori算法挖掘出了學(xué)生的前期課程和后續(xù)課程之間的關(guān)系、理論課程和實(shí)驗(yàn)課程的關(guān)系、教師對(duì)學(xué)生學(xué)習(xí)情況的影響以及高中知識(shí)學(xué)習(xí)情況對(duì)大學(xué)學(xué)習(xí)情況的影響。

數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;Apriori

近年來(lái)隨著教育信息化建設(shè)的不斷推進(jìn)和招生規(guī)模的擴(kuò)大,作為高校信息化建設(shè)的一部分,教學(xué)管理系統(tǒng)的數(shù)據(jù)不斷膨脹,存儲(chǔ)了大量的成績(jī)數(shù)據(jù),積累了海量的數(shù)據(jù)。但是目前大部分高校的教學(xué)管理系統(tǒng)的功能比較簡(jiǎn)單,只能夠進(jìn)行簡(jiǎn)單的數(shù)據(jù)增加、刪除、修改以及一些簡(jiǎn)單的評(píng)價(jià)功能,如學(xué)生成績(jī)的分布等。我們面對(duì)大量的數(shù)據(jù)卻無(wú)法獲得最想要的信息,雖然也有不少的研究者將數(shù)據(jù)挖掘的算法應(yīng)用到教學(xué)管理系統(tǒng)中,但是研究涉及的問(wèn)題具有片面性、單一性。如何從大量數(shù)據(jù)中發(fā)現(xiàn)潛在規(guī)律,找出隱含的信息和模式,從而提高高校教學(xué)管理水平,是目前高校迫切需要解決的熱點(diǎn)問(wèn)題。

我們將數(shù)據(jù)挖掘技術(shù)應(yīng)用于教學(xué)管理系統(tǒng),重點(diǎn)挖掘和分析了學(xué)生培養(yǎng)計(jì)劃中的前期課程和后續(xù)課程之間的關(guān)系、理論課程與實(shí)驗(yàn)課程之間的關(guān)系以及教學(xué)活動(dòng)的兩個(gè)主要的參與者——教師教學(xué)情況對(duì)學(xué)生學(xué)習(xí)的影響。

1 關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘算法

數(shù)據(jù)挖掘技術(shù)[1一3]是從數(shù)據(jù)庫(kù)中大量的存儲(chǔ)數(shù)據(jù)中提取一些隱含的有用信息,它可以充分利用現(xiàn)有的數(shù)據(jù),揭示這些數(shù)據(jù)隱藏的關(guān)系,為用戶(hù)提供科學(xué)、客觀的分析結(jié)果,并能夠?qū)ξ磥?lái)發(fā)展趨勢(shì)的預(yù)測(cè)提供一定的參考。

數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則算法是為了揭示兩個(gè)或者多個(gè)變量值之間存在的規(guī)律關(guān)系。在關(guān)聯(lián)規(guī)則的算法中,選取了Apriori[4]算法對(duì)數(shù)據(jù)進(jìn)行挖掘分析。這個(gè)算法是影響力廣泛的挖掘數(shù)據(jù)之間布爾關(guān)聯(lián)規(guī)則的頻繁項(xiàng)集的算法。

這個(gè)算法使用了頻繁項(xiàng)集的先驗(yàn)知識(shí),并進(jìn)行逐層的搜索迭代,找出下一層的頻繁項(xiàng)集。首先從已經(jīng)進(jìn)行過(guò)預(yù)處理的數(shù)據(jù)中,選取所有的項(xiàng)集作為最初的頻繁項(xiàng)集,這為第一層的頻繁項(xiàng)集,記為L(zhǎng)1;然后利用L1項(xiàng)集尋找第二層的頻繁項(xiàng)集,記為L(zhǎng)2;然后再利用L2,尋找L3;一直到找不出任何的頻繁項(xiàng)集,找出關(guān)聯(lián)規(guī)則,而且這些規(guī)則是滿(mǎn)足最小的置信度和支持度的。其中支持度是確定規(guī)則可以用于給定數(shù)據(jù)集的頻繁程度,而置信度是一個(gè)項(xiàng)在另一個(gè)項(xiàng)中出現(xiàn)的頻繁程度。

2 關(guān)聯(lián)規(guī)則在教學(xué)管理系統(tǒng)的功能

數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則是挖掘兩個(gè)或者多個(gè)條件之間的關(guān)系。而對(duì)于教學(xué)管理系統(tǒng)中,可以挖掘的條件比較多,例如學(xué)生的學(xué)習(xí)成績(jī)、理論課程成績(jī)、實(shí)驗(yàn)課程成績(jī)、教師的信息等。

學(xué)校在安排學(xué)生學(xué)習(xí)專(zhuān)業(yè)課時(shí),一般都會(huì)事先安排一些基礎(chǔ)課程,為專(zhuān)業(yè)課的學(xué)習(xí)打下基礎(chǔ)。而這些基礎(chǔ)課就是前期課程,而專(zhuān)業(yè)課成為后續(xù)課程。即使同為專(zhuān)業(yè)課程,學(xué)習(xí)的順序不同,對(duì)學(xué)生的學(xué)習(xí)狀況產(chǎn)生不同的結(jié)果,這也是挖掘的重點(diǎn)內(nèi)容。而且目前針對(duì)教學(xué)管理系統(tǒng)的大部分研究,都忽略了一個(gè)非常重要的前期課程——高中課程。因此,在挖掘前期課程和后續(xù)課程之間的關(guān)系時(shí),將高考的成績(jī)作為一個(gè)原始的項(xiàng)集加入到最初的頻繁項(xiàng)集中,從而挖掘高中的學(xué)習(xí)情況對(duì)于進(jìn)入大學(xué)后學(xué)習(xí)情況的影響。

學(xué)生在進(jìn)入大學(xué)之后,進(jìn)行的是一個(gè)系統(tǒng)化的學(xué)習(xí),不僅包括理論課也包括動(dòng)手能力的訓(xùn)練即實(shí)驗(yàn)課程的學(xué)習(xí),例如計(jì)算機(jī)等工科專(zhuān)業(yè)。計(jì)算機(jī)專(zhuān)業(yè)是一個(gè)很典型的應(yīng)用訓(xùn)練和理論學(xué)習(xí)并重的專(zhuān)業(yè)。而對(duì)于理論課程的學(xué)習(xí)是否和實(shí)驗(yàn)課程的學(xué)習(xí)相關(guān)也是我們研究的內(nèi)容。

本文研究的另一個(gè)關(guān)鍵點(diǎn),是教學(xué)活動(dòng)的兩個(gè)重要參與者——教師和學(xué)生中教師對(duì)學(xué)生的影響。教師作為教學(xué)活動(dòng)的重要參與者,對(duì)于學(xué)生學(xué)習(xí)情況的影響是比較重要的。每個(gè)學(xué)期學(xué)生都要對(duì)本學(xué)期所學(xué)課程的教師教學(xué)質(zhì)量進(jìn)行評(píng)價(jià)。從學(xué)生所學(xué)課程的成績(jī)以及這名學(xué)生對(duì)于相對(duì)應(yīng)的教師的評(píng)價(jià)來(lái)挖掘教師對(duì)于學(xué)生學(xué)習(xí)的影響。所以將教師的基本信息、學(xué)生的學(xué)習(xí)成績(jī)以及學(xué)生對(duì)該教師的評(píng)分作為Apriori算法中最初的項(xiàng)集,挖掘出關(guān)聯(lián)規(guī)則。

3 應(yīng)用實(shí)例分析

研究使用的是我院2010級(jí)至2012級(jí)計(jì)算機(jī)應(yīng)用技術(shù)專(zhuān)業(yè)的學(xué)生成績(jī),采用c#語(yǔ)言和ORACLE數(shù)據(jù)庫(kù)系統(tǒng)進(jìn)行數(shù)據(jù)管理和數(shù)據(jù)挖掘分析。首先進(jìn)行預(yù)處理,將學(xué)生的成績(jī)分為優(yōu)、良、中、及格這四個(gè)等級(jí)。學(xué)生成績(jī)?cè)跀?shù)據(jù)庫(kù)中的形式如表1所示。其中,如果學(xué)生所學(xué)的課程分為理論和實(shí)驗(yàn)課則用“課程名1”表示為理論課程,“課程名2”為相應(yīng)的實(shí)驗(yàn)課,如“Java1”為Java的理論課程成績(jī),Java2為實(shí)驗(yàn)課成績(jī)。

在挖掘?qū)W生的前期課程和后續(xù)課程的關(guān)聯(lián)規(guī)則時(shí),設(shè)最小支持度為0.3,最小置信度為0.5,得出如下一些強(qiáng)規(guī)則:如:(Flash,網(wǎng)頁(yè)設(shè)計(jì))=>(網(wǎng)站建設(shè)與規(guī)劃)支持度為90%,置信度為73%;(ACCESS)=>(SQLServer數(shù)據(jù)庫(kù)管理技術(shù))支持度為80%,置信度為81%;(C#語(yǔ)言程序設(shè)計(jì))=>(JAVA)支持度為80%,置信度為70%等。發(fā)現(xiàn)Flash,網(wǎng)頁(yè)設(shè)計(jì)對(duì)網(wǎng)站建設(shè)與規(guī)劃、ACCESS對(duì)SQLServer數(shù)據(jù)庫(kù)管理技術(shù)、C#對(duì)Java課程學(xué)習(xí)的好壞影響較大。從這些結(jié)果可以了解到前期課程的學(xué)習(xí)對(duì)于后續(xù)課程的學(xué)習(xí)有很大的影響。教師在教授前期課程時(shí)一定要引導(dǎo)學(xué)生重視該課程的學(xué)習(xí),強(qiáng)調(diào)該前期課程對(duì)后續(xù)課程的影響。

表1 學(xué)生學(xué)習(xí)成績(jī)表

在評(píng)價(jià)學(xué)生高中成績(jī)對(duì)于大學(xué)成績(jī)的影響時(shí),還使用了高考總成績(jī)和大學(xué)里面學(xué)生的平均成績(jī)作為項(xiàng)集進(jìn)行挖掘,其中高考的總成績(jī)按照學(xué)生的入學(xué)成績(jī)進(jìn)行排名分為優(yōu),良,中三個(gè)區(qū)段,所占比例分別為20%,30%, 50%,學(xué)生的在校平均成績(jī)按照分?jǐn)?shù)分為優(yōu),良,中,及格四個(gè)等級(jí)。同樣的設(shè)置最小的支持度為0.3,最小的置信度為0.5,得出如下的規(guī)則:(高考成績(jī)=‘良’)=>(在校平均成績(jī)=‘良’)的支持度為90%,置信度為50%;(高考成績(jī)=‘中’)=>(在校平均成績(jī)=‘優(yōu)’)的支持度為80%,置信度為30%。從結(jié)果看出,學(xué)生高中階段的學(xué)習(xí)情況對(duì)于大學(xué)的學(xué)習(xí)情況是有一定影響的,但是并不是非常重要。原因是學(xué)生在高中的學(xué)習(xí)是被動(dòng)的學(xué)習(xí),教師教什么學(xué)生學(xué)習(xí)什么,而大學(xué)學(xué)習(xí)是一個(gè)主動(dòng)學(xué)習(xí)的過(guò)程,學(xué)習(xí)方式的轉(zhuǎn)變,導(dǎo)致了學(xué)生高中學(xué)習(xí)的成績(jī)對(duì)于大學(xué)學(xué)習(xí)成績(jī)的影響不是很大。

在挖掘理論課程和實(shí)驗(yàn)課程之間的關(guān)系時(shí),設(shè)置最小的支持度為0.3,最小的置信度為0.5,得到一些強(qiáng)規(guī)則,如:((ACCESS1)=‘良’)=>(學(xué)(ACCESS2)=‘良’)支持度為85%,置信度為80%;((ACCESS2)=‘良’)=>((ACCESS1)=‘良’)支持度為83%,置信度為75%。發(fā)現(xiàn)實(shí)驗(yàn)課程的學(xué)習(xí)和理論課程的學(xué)習(xí)是相互促進(jìn)的。

表2 教師基本信息表

圖1 學(xué)生對(duì)教師的評(píng)價(jià)表

在教學(xué)管理系統(tǒng)中,有一個(gè)教師的基本信息(如表2所示),從這個(gè)表格中可以知道某門(mén)課程的授課教師的基本情況。同時(shí)從一個(gè)選課表中,可以知道這個(gè)教師教授的課程。

圖1所示的為學(xué)生對(duì)教師的評(píng)價(jià)根據(jù)。不同的條件具有不同的權(quán)重,然后可以對(duì)教師評(píng)出一個(gè)總分。而且學(xué)校也會(huì)對(duì)教師有一個(gè)評(píng)價(jià),評(píng)價(jià)標(biāo)準(zhǔn)也是圖1所示。并且學(xué)校和學(xué)生對(duì)教師的評(píng)價(jià)設(shè)置不同的比重值,這才得出最終的教師的評(píng)價(jià)總分。然后將這個(gè)總分化為5分制即優(yōu)秀、良好、中等、及格和不及格。然后針對(duì)于這個(gè)評(píng)價(jià)總分,再結(jié)合教師所教授班級(jí)的平均分,進(jìn)行數(shù)據(jù)整理,形成了教師評(píng)價(jià)表,如表3所示。

表3 教師評(píng)價(jià)表

針對(duì)于表3,進(jìn)行數(shù)據(jù)挖掘,設(shè)最小支持度為0.3,最小置信度為0.5,得出如下一些強(qiáng)規(guī)則:例如(教師評(píng)價(jià)等級(jí)(ACCESS)=‘良’)=>(學(xué)生成績(jī)(ACCESS)=‘良’)支持度為80%,置信度為70%。從得出的強(qiáng)規(guī)則可以了解到教師對(duì)于學(xué)生的學(xué)習(xí)是有較大影響的。

4 結(jié)語(yǔ)

我們將關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘算法用于教務(wù)管理數(shù)據(jù),分析得出對(duì)于大學(xué)的課程而言,前期課程對(duì)于后期課程、高中學(xué)習(xí)情況對(duì)于大學(xué)的課程學(xué)習(xí)、實(shí)驗(yàn)課程的學(xué)習(xí)對(duì)于理論課程的學(xué)習(xí)、教師對(duì)于學(xué)生的學(xué)習(xí)都是有一定影響的。這些發(fā)現(xiàn)的規(guī)律和模式,可以使教務(wù)管理者做決策時(shí)更加有的放矢,提高教學(xué)管理水平。

[1]JiaweiHan,MichelineKamber.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機(jī)械工業(yè)出版社,2007.

[2]邵峰晶,于忠清.數(shù)據(jù)挖掘原理與算法[M].北京:中國(guó)水利水電出版社,2003.

[3]蔡偉杰,張曉輝,朱建秋,等.關(guān)聯(lián)規(guī)則挖掘綜述[J].計(jì)算機(jī)工程,2001(5):8一9.

[4]周翠紅.數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則的研究及在高校教學(xué)質(zhì)量評(píng)估中的應(yīng)用[P].長(zhǎng)沙:中南大學(xué),2007.

Study on the APPlication of Data Mining in Educational Administration

Wang Lina
(Department of Information Technology Henan Judicial Police Vocational College,Zhengzhou Henan 450011)

In order to understand the students’s learning at school comprehensively,more objectively understand the influence of teaching on studentsˊlearning,this article analyzed the studentˊs learning results,used Apriori algorithmof association rulesto evacuatethe relationship between studentsˊpre一course and subsequent course,relationship between studentˊs theoretical courses and experimental courses,teachers’influences onstudents’study,and influences on learning situation of high school knowledge on learning in university.

Data mining;Association rules;Apriori

TP311

A

1003一5168(2015)07一0004一3

2015一6一25

王麗娜(1973一),女,碩士,副教授,研究方向:數(shù)據(jù)挖掘。

猜你喜歡
項(xiàng)集置信度數(shù)據(jù)挖掘
一種基于定位置信度預(yù)測(cè)的二階段目標(biāo)檢測(cè)方法
硼鋁復(fù)合材料硼含量置信度臨界安全分析研究
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
不確定數(shù)據(jù)的約束頻繁閉項(xiàng)集挖掘算法
正負(fù)關(guān)聯(lián)規(guī)則兩級(jí)置信度閾值設(shè)置方法
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
置信度條件下軸承壽命的可靠度分析
高級(jí)數(shù)據(jù)挖掘與應(yīng)用國(guó)際學(xué)術(shù)會(huì)議
一種新的改進(jìn)Apriori算法*
奈曼旗| 浮山县| 霍城县| 天峻县| 黑山县| 彭阳县| 若尔盖县| 环江| 临西县| 雷州市| 山西省| 武宣县| 吐鲁番市| 丹东市| 兰溪市| 鸡泽县| 芦溪县| 建瓯市| 上蔡县| 滨州市| 大足县| 石门县| 佛冈县| 获嘉县| 松阳县| 油尖旺区| 萨嘎县| 自治县| 乐山市| 武夷山市| 邢台县| 桐柏县| 华蓥市| 洪泽县| 婺源县| 蒙阴县| 翼城县| 镇江市| 调兵山市| 西峡县| 五莲县|