祁瑞麗,郭學(xué)濤,孟軍英,李 瑗
(1.石家莊學(xué)院 計算機科學(xué)與工程學(xué)院,河北 石家莊 050035;2.中國電信集團有限公司石家莊分公司,河北 石家莊 050000)
教學(xué)評價是衡量高校教學(xué)質(zhì)量的重要指標(biāo),也是教學(xué)環(huán)節(jié)的基礎(chǔ)組成部分,關(guān)系到學(xué)生學(xué)習(xí)效果和就業(yè)質(zhì)量.當(dāng)前的教學(xué)質(zhì)量評價大多按照以下程序展開:首先教學(xué)主管部門結(jié)合本校實際制定評價指標(biāo)和評價權(quán)重,然后通過網(wǎng)絡(luò)對評價量表進行逐項打分,最后,教務(wù)部門根據(jù)網(wǎng)絡(luò)評分劃分教學(xué)質(zhì)量考核等級,并以此作為重要參考對教師進行評優(yōu)評先和年度考核.通常,評價主體采用多元化方式,包括學(xué)生評價、同行互評、專家評價等[1-4],各個評價部分按重要程度占有不同的比例.網(wǎng)絡(luò)系統(tǒng)評分后,如何合理地利用數(shù)據(jù)挖掘技術(shù)對大量的評教數(shù)據(jù)進行處理和分析,尋找其背后隱藏的有價值信息,更好地為教師和教學(xué)管理部門服務(wù),已成為亟待解決的問題[5-7].
本研究首先對評價的原始數(shù)據(jù)進行預(yù)處理,然后選擇關(guān)聯(lián)規(guī)則作為數(shù)據(jù)挖掘算法,找出教師信息和課程信息與教學(xué)評價結(jié)果之間的隱藏聯(lián)系,發(fā)現(xiàn)提高教學(xué)質(zhì)量的相關(guān)因素,為今后的課程設(shè)置和教學(xué)改革提供思路和方法.
數(shù)據(jù)挖掘是從大量、未經(jīng)清洗、隨機的數(shù)據(jù)中,抽取出蘊含在其中隱含著有實用價值的信息和知識的過程[8].數(shù)據(jù)挖掘系統(tǒng)利用所挖掘的知識類型分類包括:關(guān)聯(lián)和相關(guān)分析、分類、預(yù)測、聚類等[9].
關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘的一種重要方法,該算法從大規(guī)模數(shù)據(jù)集中尋找項間的隱含關(guān)系.關(guān)聯(lián)規(guī)則挖掘的主要步驟為:
1)找出所有滿足最小支持度的頻繁項集;
2)找出滿足最小支持度和最小置信度的頻繁項集,并產(chǎn)生強關(guān)聯(lián)規(guī)則.
關(guān)于支持度和置信度有如下定義:
假設(shè)I={I1,I2,…,I m}是項的集合.設(shè)數(shù)據(jù)庫D={T1,T2,…,T n}是數(shù)據(jù)庫事務(wù)的集合,其中每個事務(wù)T i(1<=i<=n)是項的集合,使得T i?I.每個事務(wù)有一個唯一標(biāo)識符TID.關(guān)聯(lián)規(guī)則是形如A=>B的蘊涵式,其中 A?I,B?I,且 A∩B=?.
1)支持度:稱D中事務(wù)包含A∪B的百分比為規(guī)則A=>B的支持度support,即概率P(A∪B).因此有式(1)成立:
2)置信度:稱D中包含A的事務(wù)同時也包含B的百分比為規(guī)則A=>B的置信度confidence,即條件概率P(B|A).因此有式(2)成立:
通常用百分比表示支持度和置信度,二者的閾值由用戶或領(lǐng)域?qū)<以O(shè)定[10].若一個規(guī)則既滿足最小支持度閾值又滿足最小置信度閾值,則稱其為強關(guān)聯(lián)規(guī)則.
最常用的關(guān)聯(lián)規(guī)則挖掘算法是Aprioir算法.該算法掃描數(shù)據(jù)庫,搜索滿足最小支持度的項,并找出頻繁項的集合.算法多次迭代執(zhí)行,直到不能再找到頻繁K項集為止[10].
將關(guān)聯(lián)規(guī)則挖掘技術(shù)應(yīng)用到教學(xué)評價分析中,試圖發(fā)現(xiàn)教師信息、課程信息與教學(xué)評價結(jié)果之間的關(guān)聯(lián)性,以便進一步提高教學(xué)質(zhì)量,服務(wù)于教學(xué)管理.
為了去掉數(shù)據(jù)中的噪聲和不一致,提高挖掘結(jié)果的質(zhì)量,采用數(shù)據(jù)清理技術(shù)對源數(shù)據(jù)進行處理.本研究提取石家莊學(xué)院計算機學(xué)院2014~2018年的學(xué)生評價數(shù)據(jù)作為源數(shù)據(jù),對其中的不完整、噪聲和不一致進行消除處理,然后采用數(shù)據(jù)集成方法,將教師信息表、課程信息表和教學(xué)評價信息表整合到一起,并對用戶敏感信息做刪除處理,對教師工號和課程代碼做簡化處理,部分整合后的數(shù)據(jù)如表1所示.
為了提高數(shù)據(jù)挖掘過程的精度和性能[10],首先要對原始數(shù)據(jù)進行必要的轉(zhuǎn)換.結(jié)合上述原始數(shù)據(jù)特點及數(shù)據(jù)轉(zhuǎn)換方法,對數(shù)值型數(shù)據(jù)主要采用數(shù)據(jù)泛化的辦法,將原本分散的數(shù)值映射到特定的區(qū)間和范圍內(nèi).對文本型數(shù)據(jù)如職稱,則進行離散化處理,將其劃分為不同的類別標(biāo)識.
具體轉(zhuǎn)換方法:將年齡分為 4 組:A1[28,35],A2[36,43],A3[44,51],A4[52,59];評定分?jǐn)?shù)分為 4 組:S1[87,90],S2[91,92],S3[93,95],S4[96,98];職稱劃分為 4 組:L1 初級,L2 中級,L3 副高,L4 正高;對學(xué)生人數(shù)進行離散化處理,評價人數(shù)分為 4 組:N1[10,50],N2[51,100],N3[101,150],N4[151,350];教師學(xué)位劃分為學(xué)士,碩士,博士3個等級.
表1 部分教學(xué)評價信息
將處理后的教學(xué)評價數(shù)據(jù)作為源數(shù)據(jù),采用數(shù)據(jù)挖掘工具SPSS Modeler,基于Aprioir算法進行數(shù)據(jù)建模,設(shè)置支持度和置信度閾值,尋找滿足條件的頻繁項集,分析評價等級相關(guān)因素與結(jié)果之間的內(nèi)在聯(lián)系.
2.3.1 學(xué)生人數(shù)與評價等級之間的關(guān)系
設(shè)置數(shù)據(jù)流如圖1所示.利用Aprioir算法,對授課班級人數(shù)和教學(xué)評價等級進行關(guān)聯(lián)分析,得到學(xué)生人數(shù)和評價等級的支持度和置信度. 假設(shè)最小支持度為10%,最小置信度為45%,得到學(xué)生人數(shù)和評價等級的頻繁項集(表2)
圖1 數(shù)據(jù)流圖
從表2可以看出,授課班級人數(shù)在151~350人時,評價等級處于91~92分的支持度和置信度分別為10.87%和80.0%;學(xué)生人數(shù)在51~100人時,評價等級為93~95分的支持度為39.13%,置信度為47.22%.
2.3.2 教師年齡與評價等級之間的關(guān)系
以教師年齡作為輸入項,評價等級作為目標(biāo)項,得到教師年齡和評價等級之間的支持度和置信度.設(shè)置最小支持度10%,最小置信度40%,得到教師年齡與評價等級的頻繁項集(表3).
由表3可知,當(dāng)教師年齡處于28~35歲時,評價等級處于91~92分的支持度為16.30%,置信度為53.33%;當(dāng)教師年齡處于44~51歲時,評價等級處于96~98分的支持度和置信度分別為17.39%和43.75%;當(dāng)教師年齡處于36~43歲時,評價等級處于93~95分的支持度為57.61%,置信度為43.40%.
2.3.3 教師職稱與評價等級之間的關(guān)系
以教師職稱作為輸入項,評價等級作為目標(biāo)項,得到教師職稱和評價等級之間的支持度和置信度.假設(shè)最小支持度20%,最小置信度40%,得到教師職稱與評價等級的頻繁項集(表4).
由表4可以看出,教師職稱為中級時,評價等級在93~95分的支持度為48.91%,置信度為40.0%;教師職稱為副高,評價等級在93~95分的支持度和置信度分別為27.17%和44.0%.職稱為副高,評價等級在93~95分的支持度和置信度分別為27.17%和44.0%.
表2 學(xué)生人數(shù)和評價等級的頻繁項集
表3 教師年齡與評價等級的頻繁項集
表4 教師職稱與評價等級的頻繁項集
根據(jù)以上數(shù)據(jù)相關(guān)性分析結(jié)果,得出如下結(jié)論:
1)授課班級的學(xué)生人數(shù)對評價結(jié)果有重要影響,二者之間大致呈反比關(guān)系.學(xué)生人數(shù)較少時,教學(xué)評價等級較高;反之,則教學(xué)評價等級較低.由此可見,授課班級人數(shù)會影響到教學(xué)效果與學(xué)習(xí)質(zhì)量,人數(shù)超過一定數(shù)量就會影響授課方式、教學(xué)組織、課堂互動、作業(yè)批改和輔導(dǎo)答疑,造成學(xué)習(xí)體驗和學(xué)習(xí)效果的下降.因此,學(xué)院今后在安排課程時,要想提高整體教學(xué)質(zhì)量,就應(yīng)倡導(dǎo)小班授課模式,積極探索人數(shù)較多的公共基礎(chǔ)課和公選課的教學(xué)方法.
2)教師年齡與評價等級之間大致呈反比關(guān)系.年齡為44~51歲的教師,教學(xué)評價為96~98分的概率較大;年齡為28~35歲的教師,教學(xué)評價為91~92分的概率較大.學(xué)校應(yīng)加大對青年教師的培養(yǎng)力度,為其提供培訓(xùn)和學(xué)習(xí)的機會,充分發(fā)揮老教師的優(yōu)勢,形成青年教師導(dǎo)師制,以盡快提高青年教師業(yè)務(wù)能力和專業(yè)素養(yǎng).
3)教師職稱與評價等級之間沒有直接相關(guān)性.無論職稱如何,都不影響教師教學(xué)的積極性.
教學(xué)效果關(guān)系到學(xué)生的成長和發(fā)展,對高校人才培養(yǎng)的質(zhì)量起著關(guān)鍵作用.本研究采用關(guān)聯(lián)規(guī)則挖掘技術(shù)對教學(xué)評價數(shù)據(jù)進行建模和分析,為高校的教學(xué)組織、人才引進和教師培訓(xùn)等管理工作提供思路.進一步結(jié)合課程性質(zhì)、專業(yè)特點及學(xué)生情感因素等挖掘評價數(shù)據(jù),以及分析評價指標(biāo)的維度和權(quán)重設(shè)置,以制定具有個性化的評價系統(tǒng),是未來研究的重要方向.