国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘在職業(yè)院校“學(xué)評(píng)教”體系中的應(yīng)用

2016-09-24 02:13:20李高菊宿遷開放大學(xué)江蘇宿遷223800
關(guān)鍵詞:項(xiàng)集置信度數(shù)據(jù)挖掘

李高菊(宿遷開放大學(xué),江蘇 宿遷 223800)

數(shù)據(jù)挖掘在職業(yè)院校“學(xué)評(píng)教”體系中的應(yīng)用

李高菊
(宿遷開放大學(xué),江蘇 宿遷 223800)

在傳統(tǒng)的教學(xué)評(píng)價(jià)過程中,每個(gè)學(xué)校都積累了大量的評(píng)價(jià)數(shù)據(jù),而學(xué)校只是對(duì)這些數(shù)據(jù)進(jìn)行簡(jiǎn)單的統(tǒng)計(jì)和查詢,在海量數(shù)據(jù)中存在的更有價(jià)值的信息并沒有得到真正利用。利用數(shù)據(jù)挖掘技術(shù)中的挖掘算法對(duì)評(píng)價(jià)數(shù)據(jù)和教師的個(gè)人信息進(jìn)行梳理與分析,發(fā)現(xiàn)教師的性別、學(xué)歷等不會(huì)影響教學(xué)效果,而職稱、年齡則會(huì)影響教學(xué)效果。如何能在教學(xué)安排中做到統(tǒng)籌兼顧,是學(xué)校管理者在協(xié)調(diào)教學(xué)過程中的一個(gè)參照。

數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則;Apriori算法和FP-Growth算法;學(xué)評(píng)教

1 研究背景

隨著信息的快速增長(zhǎng),數(shù)據(jù)挖掘技術(shù)在信息資源開發(fā)方面的優(yōu)越性越來越明顯,目前已經(jīng)在電子商務(wù)、金融、商業(yè)等領(lǐng)域發(fā)揮著巨大的作用,它結(jié)合了信息化、統(tǒng)計(jì)等方面的技術(shù)支持著企業(yè)的快速發(fā)展。而在教育領(lǐng)域中目前其應(yīng)用還只停留在萌芽階段。高校要想提高學(xué)校的教學(xué)管理水平,必須構(gòu)建好自己的教學(xué)質(zhì)量監(jiān)控體系,這是提高教學(xué)質(zhì)量的重要保障和有效途徑。

目前,在各高校對(duì)于現(xiàn)有數(shù)據(jù)信息中教師個(gè)人信息、最終教學(xué)評(píng)價(jià)信息與學(xué)生學(xué)習(xí)效果及未來就業(yè)方面的信息之間的關(guān)聯(lián)很少有人研究,高校管理者也沒有試圖去發(fā)現(xiàn)他們之間存在的關(guān)聯(lián),或者說,現(xiàn)在僅僅是對(duì)數(shù)據(jù)作了最簡(jiǎn)單、最原始的基本操作,如查詢、修改等,數(shù)據(jù)之間所蘊(yùn)藏的聯(lián)系并沒有被發(fā)現(xiàn),而數(shù)據(jù)表層的信息根本無法給教育行政管理人員提供決策參考。借助數(shù)據(jù)挖掘技術(shù)從海量數(shù)據(jù)中提取出有效信息,一方面完善了教學(xué)監(jiān)控體系,另一方面可以從評(píng)教數(shù)據(jù)中挖掘出有用的規(guī)則,進(jìn)而推進(jìn)教師隊(duì)伍的建設(shè)。因此,數(shù)據(jù)挖掘?qū)⒊蔀榻窈蠼虒W(xué)評(píng)價(jià)體系研究的熱點(diǎn),也會(huì)是今后一段時(shí)間教育界研究的一大重點(diǎn)。

本文首先對(duì)評(píng)教的數(shù)據(jù)(或信息)進(jìn)行處理,然后通過對(duì)比分析選擇合適的數(shù)據(jù)挖掘算法,最終找出數(shù)據(jù)間的關(guān)聯(lián)規(guī)則,從中挖掘出教師個(gè)人條件與教學(xué)最終效果之間的潛在聯(lián)系,總結(jié)出教學(xué)一般規(guī)律并發(fā)現(xiàn)影響教學(xué)效果的相關(guān)因素。經(jīng)過綜合分析最終找出可以提高學(xué)校教學(xué)質(zhì)量的思路和辦法,進(jìn)而有效地指導(dǎo)教師改進(jìn)教學(xué)。

2 所采用的關(guān)鍵技術(shù)

數(shù)據(jù)挖掘,是指從龐大的數(shù)據(jù)集中尋找出有價(jià)值的知識(shí)的過程,通過挖掘操作能發(fā)現(xiàn)潛伏在數(shù)據(jù)內(nèi)部、而用直觀方法或經(jīng)驗(yàn)根本看不出但非常有價(jià)值的信息,通常也稱為知識(shí)發(fā)現(xiàn)過程[1]。這類信息一般是用戶比較期待的,結(jié)論也是可以理解并易接受的。

2.1數(shù)據(jù)挖掘的方法與技術(shù)

數(shù)據(jù)挖掘的每種方法都有其適用的特定領(lǐng)域,主要包括關(guān)聯(lián)規(guī)則挖掘技術(shù)、決策樹方法、神經(jīng)網(wǎng)絡(luò)方法、遺傳算法、粗糙集算法等[2]。而在現(xiàn)實(shí)生活的應(yīng)用中,在一個(gè)復(fù)雜的數(shù)據(jù)挖掘系統(tǒng)中往往不是使用某種單一的挖掘算法,而是將多種數(shù)據(jù)挖掘方法結(jié)合起來,并且利用可視化技術(shù)最終實(shí)現(xiàn)。下面主要介紹一下關(guān)聯(lián)規(guī)則挖掘算法。

關(guān)聯(lián)規(guī)則的分析方法相對(duì)比較簡(jiǎn)單,在生活中應(yīng)用也非常廣泛。該算法是在1993年由R.A-grawal、Imielinski、Swam幾人最先提出的。它最主要的目的是找出被挖掘數(shù)據(jù)之間隱藏的不易被覺察的潛在聯(lián)系,即找出某一事件中潛在的規(guī)律和模式。就目前來看,關(guān)聯(lián)規(guī)則挖掘技術(shù)已較成熟,大部分用于對(duì)數(shù)據(jù)的關(guān)聯(lián)分析。Apriori和FP-growth算法都是常見的算法。Apriori算法的基本過程為:首先通過對(duì)數(shù)據(jù)的分析找出所有頻繁出現(xiàn)的項(xiàng)集,然后根據(jù)得到的頻繁項(xiàng)集總結(jié)出有用的關(guān)聯(lián)規(guī)則。許多演變的關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的挖掘算法都是由它演變而來的。隨著數(shù)據(jù)量的逐漸加大以及人們?cè)谏钪袑?duì)數(shù)據(jù)挖掘的有效利用,采用關(guān)聯(lián)規(guī)則挖掘算法找出數(shù)據(jù)間的關(guān)聯(lián)知識(shí)已成為人們非常關(guān)注的內(nèi)容。關(guān)聯(lián)分析常被用來分析顧客的購(gòu)買模式、產(chǎn)品生產(chǎn)模式等,最典型的例子就是購(gòu)物籃分析。

2.2數(shù)據(jù)挖掘的過程

數(shù)據(jù)挖掘的過程其實(shí)就是知識(shí)發(fā)現(xiàn)的完整過程,它是由很多個(gè)步驟相互連接起來的[3]。一般情況下,它包括三個(gè)主要階段:第一是數(shù)據(jù)準(zhǔn)備,第二是進(jìn)行數(shù)據(jù)挖掘,第三是得出結(jié)論和解釋的階段。其實(shí),知識(shí)的發(fā)現(xiàn)過程也是在這三個(gè)階段反復(fù)進(jìn)行人機(jī)交互的過程。數(shù)據(jù)挖掘的知識(shí)發(fā)現(xiàn)過程(KDD)如圖1所示。

圖1 KDD的挖掘全部過程

3 在“學(xué)評(píng)教”系統(tǒng)中的應(yīng)用

3.1數(shù)據(jù)的準(zhǔn)備

將評(píng)教獲得的數(shù)據(jù)作為訓(xùn)練樣本集,并且把教學(xué)評(píng)價(jià)表Evaluation和教師信息表Teacher進(jìn)行整合,整合后的數(shù)據(jù)表很大,但是有些字段比如教師姓名、班級(jí)編號(hào)、課程編號(hào)等與我們要挖掘的問題聯(lián)系不大,所以人為地將它們刪除。

3.2數(shù)據(jù)預(yù)處理

在評(píng)教的過程中,由于各種原因,很容易產(chǎn)生一些不符合要求的數(shù)據(jù),若是不能及時(shí)地進(jìn)行處理,勢(shì)必會(huì)對(duì)挖掘結(jié)果產(chǎn)生影響。所以必須對(duì)數(shù)據(jù)進(jìn)行清理,數(shù)據(jù)清理就是消除原始數(shù)據(jù)集中存在的錯(cuò)誤、包含的噪聲或有缺損的對(duì)象,只有這樣才能保證數(shù)據(jù)挖掘結(jié)果的準(zhǔn)確性與合理性。比如對(duì)數(shù)據(jù)中填寫不完整的或有一屬性值為空的某一項(xiàng)記錄人為地將數(shù)據(jù)補(bǔ)填上,或者直接將該條記錄忽略等辦法。

對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換的主要目的就是將數(shù)據(jù)轉(zhuǎn)換成能適合數(shù)據(jù)挖掘的描述形式,以便進(jìn)行高效的數(shù)據(jù)分析[4]。在本系統(tǒng)中主要采用數(shù)據(jù)泛化的辦法,即將一個(gè)屬性取值范圍投射到一個(gè)特定區(qū)間之內(nèi),進(jìn)行聚集和統(tǒng)一,防止給挖掘的結(jié)果帶來誤差。

首先,將教師的職稱進(jìn)行泛化處理后得到表1的轉(zhuǎn)換值。

表1 教師職稱進(jìn)行轉(zhuǎn)換的規(guī)則

其次,將教師的年齡進(jìn)行離散化處理,得到五個(gè)階段,如表2所示。

表2 教師年齡進(jìn)行轉(zhuǎn)換的規(guī)則

最后,再將教師所得評(píng)教分?jǐn)?shù)按表3的轉(zhuǎn)換規(guī)則進(jìn)行轉(zhuǎn)換。

表3 評(píng)教分?jǐn)?shù)轉(zhuǎn)換規(guī)則

3.3關(guān)聯(lián)規(guī)則挖掘結(jié)果分析

(1)教師年齡與教學(xué)評(píng)價(jià)結(jié)果之間的關(guān)聯(lián)規(guī)則

利用FP-Growth算法對(duì)數(shù)據(jù)進(jìn)行處理后,統(tǒng)計(jì)得到年齡與教學(xué)效果項(xiàng)集的支持度和置信度,如表4所示。

表4 統(tǒng)計(jì)年齡與教學(xué)效果項(xiàng)集得到支持度和置信度

如果設(shè)置最小支持度為5%,最小置信度為45%,那么從上面的項(xiàng)集中最終可以得到2個(gè)頻繁項(xiàng)集,如表5所示。

表5 滿足教師年齡與教學(xué)效果篩選條件的頻繁項(xiàng)集

從上面得到的結(jié)果可以看到,40~50歲之間(包括50歲)和50~60歲之間(包括60歲)的教師最終教學(xué)效果優(yōu)秀,這也說明了隨著時(shí)間的推移,教師積累了豐富的教學(xué)經(jīng)驗(yàn)。

(2)教師學(xué)歷與教學(xué)評(píng)價(jià)結(jié)果之間的關(guān)聯(lián)規(guī)則

利用FP-Growth算法對(duì)數(shù)據(jù)進(jìn)行處理,統(tǒng)計(jì)后得到學(xué)歷與教學(xué)效果項(xiàng)集的支持度和置信度,如表6所示。

表6 統(tǒng)計(jì)教師學(xué)歷與教學(xué)效果項(xiàng)集得到支持度和置信度

如果設(shè)置最小支持度為5%,最小置信度為45%,那么從上面的項(xiàng)集中最終可以得到3個(gè)頻繁項(xiàng)集,如表7所示。

表7 滿足教師學(xué)歷與教學(xué)效果篩選條件的頻繁項(xiàng)集

從上述所得的頻繁項(xiàng)集來看,學(xué)歷為博士和碩士的教師教學(xué)效果都為良好,本科學(xué)歷的教師教學(xué)效果為優(yōu)秀。

(3)教師職稱與教學(xué)評(píng)價(jià)結(jié)果之間的關(guān)聯(lián)規(guī)則

利用FP-Growth算法對(duì)數(shù)據(jù)進(jìn)行處理后,得出職稱與教學(xué)效果項(xiàng)集的支持度和置信度,如表8所示。

表8 統(tǒng)計(jì)教師職稱與教學(xué)效果項(xiàng)集得到支持度和置信度

如果設(shè)置最小支持度為5%,最小置信度為45%,那么從上面的項(xiàng)集中最終可以得到3個(gè)頻繁項(xiàng)集,如表9所示。

表9 滿足教師職稱與教學(xué)效果篩選條件的頻繁項(xiàng)集

從上面得到的結(jié)果可以看到,職稱的高低與教學(xué)效果也有直接的關(guān)系,正高、副高的教師教學(xué)評(píng)價(jià)都為優(yōu)秀,中級(jí)職稱的評(píng)價(jià)為良好。

(4)教師性別與評(píng)價(jià)結(jié)果之間的關(guān)聯(lián)規(guī)則

利用FP-Growth算法對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和處理后,得到性別與教學(xué)效果項(xiàng)集的支持度和置信度,如表10所示。

表10 教師性別與教學(xué)效果項(xiàng)集的支持度和置信度統(tǒng)計(jì)

假設(shè)設(shè)置最小支持度為5%,最小置信度為45%,那么從上面的項(xiàng)集中就找不到滿足要求的頻繁項(xiàng)集,也就是說教學(xué)效果與教師性別無必然聯(lián)系。

3.4結(jié)論

根據(jù)以上對(duì)學(xué)生評(píng)教的數(shù)據(jù)進(jìn)行分析得出如下幾條結(jié)論:

(1)40~50歲之間的教師和50~60歲之間的教師最終教學(xué)效果都為優(yōu)秀,這充分說明了時(shí)間的沉淀能夠使教師積累豐富的教學(xué)經(jīng)驗(yàn)。

(2)碩士或更高學(xué)歷的教師教學(xué)效果良好,本科學(xué)歷的教師教學(xué)效果為優(yōu)秀。這說明在本校教師自身的學(xué)歷和所授課的內(nèi)容與總評(píng)成績(jī)之間的聯(lián)系不大,經(jīng)過分析判斷,可能是本科學(xué)歷的教師比較注重學(xué)生的實(shí)踐指導(dǎo)以及其他環(huán)節(jié)(如作業(yè)批改和輔導(dǎo)答疑)的原因。另外結(jié)合本校學(xué)生培養(yǎng)的要求,要想提高整體教學(xué)質(zhì)量,就應(yīng)更加注重實(shí)踐環(huán)節(jié)的教學(xué)。

(3)職稱的高低與教學(xué)效果也有直接的關(guān)系,正高、副高的教師教學(xué)評(píng)價(jià)都為優(yōu)秀,中級(jí)職稱的教師評(píng)價(jià)也為良好。擁有高級(jí)職稱的教師,教學(xué)效果好,能夠得到學(xué)生的認(rèn)可。因此,學(xué)校應(yīng)加大高級(jí)職稱教師的引進(jìn)力度,以優(yōu)化師資結(jié)構(gòu),此外,學(xué)校有關(guān)部門應(yīng)采取相應(yīng)措施,以盡快提高教師的學(xué)歷層次,改善教師的職稱結(jié)構(gòu)。

(4)從性別方面的項(xiàng)集中找不到滿足要求的頻繁項(xiàng)集,也就是說,教學(xué)效果與教師性別無必然聯(lián)系。

4 結(jié)束語(yǔ)

教學(xué)質(zhì)量是學(xué)校的生命線,本文通過對(duì)評(píng)教系統(tǒng)中大量數(shù)據(jù)進(jìn)行梳理,利用關(guān)聯(lián)規(guī)則挖掘算法,找出數(shù)據(jù)之間的關(guān)聯(lián),即找出影響教學(xué)效果的多方面因素,可以為管理者提供決策指導(dǎo)。但也存在一定的不足,在今后的工作中還要進(jìn)一步研究挖掘算法,使它在執(zhí)行效率上有所提高,以進(jìn)一步完善“學(xué)評(píng)教”系統(tǒng),讓其成為促進(jìn)教學(xué)工作的一大利器。

[1]孟衛(wèi)平.數(shù)據(jù)挖掘在移動(dòng)電子商務(wù)中的應(yīng)用研究[J].現(xiàn)代商業(yè),2010(24).

[2]王瑄.多最小支持度下的關(guān)聯(lián)規(guī)則研究[D].長(zhǎng)春:長(zhǎng)春理工大學(xué),2008.

[3]宮輝力,趙文吉,李京.多源遙感數(shù)據(jù)挖掘系統(tǒng)技術(shù)框架[J].中國(guó)圖象圖形學(xué)報(bào),2005(5).

[4]林建勤.基于Web的數(shù)據(jù)挖掘應(yīng)用模式研究[J].貴州師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2004(3).

The Application of Data mining In the “Student rating of teaching”system of Occupation colleges

LI Gao-ju
(Suqian Open University,Jiangsu Suqian 223800,China)

In the traditional teaching evaluation process,each school have accumulated large amounts of data,and the school is on these data were simple statistic and query. However,in vast amounts of data in the presence of more valuable information has not been really use.We use data mining technology in mining algorithm on the evaluation data and teacher's personal information were sorted out and analyzed and found that the teacher's gender,educational background will not affect the teaching effect,and the title,age will influence the teaching effect.How can the teaching arrangements so balanced,school managers in a reference to the coordination of the teaching process.

Data mining;Association rules;Apriori algorithm;FP-Growth algorithm;School teaching assessment

TP274

A

1673-2022(2016)03-0047-04

2016-06-20

李高菊(1980-),女,江蘇宿遷人,講師,碩士,主要從事計(jì)算機(jī)方面的教育教學(xué)研究。

猜你喜歡
項(xiàng)集置信度數(shù)據(jù)挖掘
硼鋁復(fù)合材料硼含量置信度臨界安全分析研究
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
正負(fù)關(guān)聯(lián)規(guī)則兩級(jí)置信度閾值設(shè)置方法
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
置信度條件下軸承壽命的可靠度分析
軸承(2015年2期)2015-07-25 03:51:04
關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
卷宗(2014年5期)2014-07-15 07:47:08
一種頻繁核心項(xiàng)集的快速挖掘算法
基于GPGPU的離散數(shù)據(jù)挖掘研究
多假設(shè)用于同一結(jié)論時(shí)綜合置信度計(jì)算的新方法?
临夏市| 静安区| 中方县| 镇江市| 曲麻莱县| 天峨县| 鹿邑县| 称多县| 泰顺县| 汉中市| 调兵山市| 璧山县| 贞丰县| 阿克苏市| 蓝山县| 蒙自县| 萨迦县| 密山市| 松原市| 左云县| 曲周县| 东乡族自治县| 长岛县| 清徐县| 青河县| 习水县| 奉化市| 尖扎县| 宁国市| 山东| 肥西县| 桃园县| 醴陵市| 东兴市| 大宁县| 秭归县| 克山县| 仙游县| 邵武市| 徐汇区| 托克托县|