李紅林 孔德劍
曲靖師范學(xué)院計(jì)算機(jī)科學(xué)與工程學(xué)院 655011
基于Apriori算法的高校教學(xué)評價數(shù)據(jù)挖掘
李紅林 孔德劍
曲靖師范學(xué)院計(jì)算機(jī)科學(xué)與工程學(xué)院 655011
高校在教學(xué)和管理中積累了大量的數(shù)據(jù),本文把數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則挖掘算法Apriori應(yīng)用于教學(xué)評價中,通過對這些數(shù)據(jù)分析,找到高校教師的教學(xué)效果與教師的年齡、職稱、學(xué)歷等相關(guān)。
關(guān)聯(lián)規(guī)則;Apriori;挖掘;教學(xué);評價
教學(xué)評價是教學(xué)過程的重要組成部分,它以教學(xué)目標(biāo)為依據(jù),制定科學(xué)的評價標(biāo)準(zhǔn),運(yùn)用一切有效的技術(shù)手段,對教與學(xué)活動的過程及其結(jié)果進(jìn)行測量,并給以價值判斷[1]。教學(xué)質(zhì)量是高校生存與發(fā)展的基礎(chǔ),也是高等教育國際化的必然要求。高校在日常的教學(xué)和管理中積累了大量的數(shù)據(jù),但是這些數(shù)據(jù)未得到充分利用,大部分學(xué)校只是通過統(tǒng)計(jì)或排序等方式獲得數(shù)據(jù)的表面信息,對這些信息只是進(jìn)行簡單的數(shù)值計(jì)算和定性總結(jié),然后將這些表面信息通報給教師,作為晉升職稱、評優(yōu)、績效工資等的依據(jù)。未對這些數(shù)據(jù)中隱含的內(nèi)在信息進(jìn)行深層次的挖掘和思考。如何將這些數(shù)據(jù)轉(zhuǎn)換成可以進(jìn)一步利用的信息,為學(xué)校管理者提供決策支持,是高校教育中急需解決的一個問題。
數(shù)據(jù)挖掘(DM,Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的、但又是潛在的有用信息和知識的過程[2]。在長期的教學(xué)和管理中,隨著積累的數(shù)據(jù)越來越多,人們對從這些數(shù)據(jù)中挖掘相應(yīng)的關(guān)聯(lián)知識越來越有興趣。挖掘關(guān)聯(lián)規(guī)則(知識)就是從給定的數(shù)據(jù)集中搜索數(shù)據(jù)項(xiàng)之間所存在的有價值聯(lián)系[3]。
關(guān)聯(lián)規(guī)則挖掘就是從大量的數(shù)據(jù)中挖掘出有價值描述數(shù)據(jù)項(xiàng)之間相互聯(lián)系的有關(guān)知識。Agrawal等人在1993年首先提出從交易數(shù)據(jù)庫發(fā)現(xiàn)項(xiàng)目間關(guān)聯(lián)規(guī)則的相關(guān)問題,并給出了基本頻繁集的Apriori算法[4][5]。關(guān)聯(lián)規(guī)則反映一個事物與其它事物之間的相互依存性和關(guān)聯(lián)性,如果兩個事物或者多個事物之間存在一定的關(guān)聯(lián)關(guān)系,那么,其中一個事物就能通過其他事物預(yù)測到。關(guān)聯(lián)規(guī)則挖掘能發(fā)現(xiàn)大量數(shù)據(jù)集中項(xiàng)之間的有趣聯(lián)系。
關(guān)聯(lián)規(guī)則:設(shè)D是事務(wù)集,I={I1, I2,…,Im}是D中全體項(xiàng)組成的集合,其中Ik(k=1,2,…,m)稱為項(xiàng),包含k個項(xiàng)的項(xiàng)集稱為k-項(xiàng)集。一個事務(wù)T是一個項(xiàng)集,它是I的一個子集,每個事務(wù)都與一個唯一標(biāo)識符Tid相聯(lián)系。不同的事務(wù)一起組成了事務(wù)集D,它構(gòu)成了關(guān)聯(lián)規(guī)則發(fā)現(xiàn)的事務(wù)數(shù)據(jù)庫。若X,Y為項(xiàng)目集,且X∩Y≠φ,則蘊(yùn)涵式稱為關(guān)聯(lián)規(guī)則,X稱為關(guān)聯(lián)規(guī)則的前件或前提,Y稱為關(guān)聯(lián)規(guī)則的后件或結(jié)論。
Apriori是通過對數(shù)據(jù)庫D的多次掃描來發(fā)現(xiàn)所有的頻繁項(xiàng)目集,在每一次掃描中只考慮具有同一長度的所有項(xiàng)目集。在第一次掃描時,Apriori算法計(jì)算D中所有單個項(xiàng)目的支持度,生成所有長度為1的頻繁項(xiàng)目集,在后續(xù)的每一次掃描中,首先以k-1次掃描所生成的所有頻繁項(xiàng)目集為基礎(chǔ)產(chǎn)生新的候選項(xiàng)目集。然后掃描數(shù)據(jù)庫D,計(jì)算這些候選項(xiàng)目的支持度,刪除其支持度低于用戶給定的最小支持度的項(xiàng)目集。最后,生成所有長度為k的頻繁項(xiàng)目集,重復(fù)上述過程直到再也發(fā)現(xiàn)不了新的頻繁項(xiàng)目集為止。此算法高效的關(guān)鍵在于生成較小的候選項(xiàng)目集,也就是盡可能不產(chǎn)生和計(jì)算那些不可能成為頻繁項(xiàng)目集的候選項(xiàng)目集。為了實(shí)現(xiàn)這一點(diǎn),此算法利用了這樣一個基本性質(zhì),即:一個頻繁項(xiàng)目集的任何一子集必定是頻繁項(xiàng)目集,一個非頻繁項(xiàng)目集的任一超集必定也是非頻繁項(xiàng)目集。Apriori算法如下:
輸入:交易數(shù)據(jù)庫D,最小支持閾值min_sup。輸出:Li,D中的頻繁項(xiàng)集。處理流程:
本文從學(xué)校專任教師中任意抽取300名,其中副高以上職稱的教師100人,中級職稱的120人,初級職稱的80人。同時收集到2008-2009第一學(xué)期、第二學(xué)期學(xué)生對這300名教師的教學(xué)質(zhì)量評價數(shù)據(jù)。教師教學(xué)質(zhì)量評價結(jié)果主要從學(xué)生給教師的打分來區(qū)別。學(xué)生從以下四方面給教師打分:教師的教學(xué)態(tài)度、教學(xué)內(nèi)容、教學(xué)方法、教學(xué)效果。
對收集到的數(shù)據(jù)進(jìn)行選擇,建立相應(yīng)的數(shù)據(jù)庫。建立數(shù)據(jù)庫是為關(guān)聯(lián)規(guī)則挖掘提供挖掘所需要的數(shù)據(jù), 教師的數(shù)據(jù)存放在數(shù)據(jù)庫中。本文收集到與教學(xué)質(zhì)量相關(guān)性最大教學(xué)質(zhì)量評價數(shù)據(jù)以及與教師本人的某些基本情況相關(guān)的數(shù)據(jù), 如教師的學(xué)歷、職稱等,并將這兩類數(shù)據(jù)放入數(shù)據(jù)庫中。
利用關(guān)聯(lián)規(guī)則挖掘算法——Apriori,對數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行挖掘,得到相應(yīng)的關(guān)聯(lián)規(guī)則。
(1) 年齡在30至40歲之間的中青年教師具有較高職和豐富的課堂教學(xué)經(jīng)驗(yàn),且精力充沛,評定分?jǐn)?shù)較高,且有高的支持度、置信度。由此可見,學(xué)校重視師資隊(duì)伍建設(shè), 提高了中青年教師的各種教育教學(xué)實(shí)際能力,中青年教師已經(jīng)成為學(xué)校教學(xué)工作的骨干,教師隊(duì)伍結(jié)構(gòu)趨于合理。
(2) 年齡50至60歲以上年齡層的骨干教師置信度較高,這部分教師講課較受歡迎。但是這些教師現(xiàn)在即將退休或已經(jīng)退休, 他們留下的空缺必須馬上填補(bǔ), 因此, 需重視對30歲以下青年教師的培養(yǎng)。
(3) 30歲以下的年輕教師,由于剛走上講臺不久,教學(xué)方法和教學(xué)經(jīng)驗(yàn)有待進(jìn)一步提高。由于大學(xué)教學(xué)內(nèi)容專業(yè)化程度高, 科學(xué)性強(qiáng), 信息量大, 具有一定的寬度和深度, 且大學(xué)課堂教學(xué)具有較強(qiáng)的學(xué)術(shù)性。這就要求年輕教師要加強(qiáng)專業(yè)知識的學(xué)習(xí),不斷提高自己的業(yè)務(wù)水平。
通過學(xué)生從教學(xué)態(tài)度、教學(xué)內(nèi)容、教學(xué)方法、教學(xué)效果四個方面對教師打分,評價結(jié)果顯示,具有副高及以上、中級職稱、初級職稱的教師平均分分別為:97.8、96.6、93.6。
總之,教授、副教授及碩士學(xué)歷教師科研水平較高,知識面較寬,教學(xué)能力強(qiáng), 在課堂教學(xué)中經(jīng)常向?qū)W生介紹學(xué)科發(fā)展的動態(tài),鼓勵學(xué)生刻苦鉆研, 指導(dǎo)學(xué)生進(jìn)行科學(xué)研究, 把教學(xué)與科研有機(jī)地結(jié)合起來, 促進(jìn)學(xué)生科研能力的增長, 深受學(xué)生歡迎。初級職稱教師還需加強(qiáng)實(shí)踐、學(xué)習(xí), 努力提高自己的教學(xué)、科研水平。因此,對于教學(xué)管理人員,在班級排課時, 應(yīng)注意在同一層次的教學(xué)班中配備的教師的教齡、職稱、學(xué)歷等的合理分配,使學(xué)生能保持良好的學(xué)習(xí)狀態(tài),從而為教學(xué)部門提供決策支持信息,促使更好地開展教學(xué)工作, 提高教學(xué)質(zhì)量。同時,高校也應(yīng)采取有關(guān)措施去提高教師的學(xué)歷層次,改善教師的職稱結(jié)構(gòu),做好教學(xué)對象分析和教學(xué)策略設(shè)計(jì),從整體上提高高校教師的教學(xué)科研水平,培養(yǎng)出高素質(zhì)的人才。
目前,人們逐步陷入“數(shù)據(jù)豐富,知識貧乏”的尷尬境地。人們真正體會到數(shù)據(jù)海洋,無邊無際。面對如此巨大的數(shù)據(jù)資源,如何從中獲得有用的信息,數(shù)據(jù)挖掘技術(shù)越來越受到人們的關(guān)注。本文把數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則挖掘技術(shù)應(yīng)用于高校的教學(xué)評價中,從學(xué)生對教師的教學(xué)評價的數(shù)據(jù)中,得出教師的教學(xué)評價結(jié)果與教師的年齡、學(xué)歷、職稱等因素具有內(nèi)在聯(lián)系。
[1]宋中山,吳立鋒.關(guān)聯(lián)規(guī)則挖掘在教學(xué)評價中的應(yīng)用[J].中南民族大學(xué)學(xué)報(自然科學(xué)版).2006,25(1):72-74.
[2]邵峰晶,于忠清.數(shù)據(jù)挖掘原理與算法[M].北京:中國水利水電出版社.2003.
[3]朱明.數(shù)據(jù)挖掘[M].安徽:中國科學(xué)技術(shù)大學(xué)出版社.2002.
[4]Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in large databases.In:buncman P,Jajodia S,eds.Proc.of the ACM SIGMOD Conf.on Management of Data(SigMod’93).New York:ACM Press,1993: 207-216.
[5]Agrawal R,Srikant R.Fast algorithms for mining association rules.In:Bocca JB,Jarke M, Zaniolo C,eds.Proc.of the 20the Int’l Conf.on Very Large Data Bases.Santigo:Morgan Kaufman Publishers,1994:478-499.
Data Mining Based on the Algorithm of Apriori in Teaching Evaluation of University
Li Honglin Kong Dejian
School of Compute Science and Engineering, Qujing Normal University, Qujing Yunnan 655011,China
10.3969/j.issn.1001-8972.2010.21.118
曲靖師范學(xué)院專項(xiàng)基金項(xiàng)目(2008ZX003)
李紅林(1980-),女,云南人,碩士,講師,主要從事計(jì)算機(jī)圖像處理、模式識別方面的研究。
AbstractThe massive data is accumulated in the teaching and the management of the universities.In this paper, the Apriori algorithm of association rules which is applied to teaching evaluation.Through to analyze these data, found teacher’s teaching effect in the university relates to teacher’s age, title and education background and so on.
Key wordsAssociation Rules; Apriori; Mining; Teaching; Evaluation