王珠冉 陳 波
(江蘇第二師范學(xué)院數(shù)學(xué)科學(xué)學(xué)院 江蘇·南京 210000)
學(xué)生評(píng)教制度起源于20 世紀(jì)20 年代的美國(guó),因其能在一定程度上反饋教學(xué)質(zhì)量,從而被其他國(guó)家高校廣泛采用。 目前,學(xué)生評(píng)教成為國(guó)內(nèi)各高校教學(xué)質(zhì)量管理的一種重要手段,也是教學(xué)評(píng)價(jià)體系重要的組成部分。 然而,學(xué)生在評(píng)教過程中極易受主觀因素影響,使得評(píng)教分?jǐn)?shù)存在一定的偏差。 若直接使用原始評(píng)教數(shù)據(jù),則不能客觀反映教師真實(shí)的教學(xué)水平。 因此,有必要對(duì)原始評(píng)教數(shù)據(jù)進(jìn)行合理的加工。 包水梅和陳嘉誠(chéng)[1]學(xué)者基于L 大學(xué)三個(gè)學(xué)期2139 門課程分析學(xué)生評(píng)教的有效性, 探究影響評(píng)教的因素;郭東威和宋樹林[2]學(xué)者應(yīng)用科利法,借助教師在同一班級(jí)學(xué)生評(píng)教的等級(jí)信息進(jìn)行評(píng)價(jià)。 本文則采用Tukey's Test 方法,保證數(shù)據(jù)有效的前提下, 使用K-W 檢驗(yàn)探究主觀因素是否對(duì)評(píng)教過程造成影響。 其次,以班級(jí)和課程性質(zhì)將數(shù)據(jù)劃分為二維數(shù)組,計(jì)算每組標(biāo)準(zhǔn)分用于最終學(xué)院教學(xué)排名。 所以該方法在保留原始評(píng)教信息的同時(shí),極大程度上降低主觀因素帶來的誤差。
本次研究使用的數(shù)據(jù)來自J 師范院校2022—2023 學(xué)年第一學(xué)期學(xué)生的原始評(píng)教數(shù)據(jù),共76796條。 每條評(píng)價(jià)記錄由學(xué)生基礎(chǔ)信息、教師基礎(chǔ)信息、課程基礎(chǔ)信息和二十二項(xiàng)評(píng)價(jià)指標(biāo)(詳見表1)。其中二十項(xiàng)指標(biāo)針對(duì)教師的教學(xué)態(tài)度、教學(xué)方法和教學(xué)內(nèi)容方面進(jìn)行評(píng)價(jià), 評(píng)分方式采用李克特5 級(jí)量表:1 代表非常不滿意,2 代表比較不滿意,3 代表一般滿意,4 代表比較滿意,5 代表非常滿意。 另外兩項(xiàng)則注重學(xué)生的課堂收獲, 采用文本的方式記錄。此外,每學(xué)期由質(zhì)評(píng)處發(fā)布學(xué)生評(píng)教和教師評(píng)學(xué)通知,依托綜合信息平臺(tái)開展,年級(jí)輔導(dǎo)員和二級(jí)學(xué)院教學(xué)院長(zhǎng)督促,學(xué)生參評(píng)率較高。 可見數(shù)據(jù)具有一定的代表性,其研究結(jié)果對(duì)提高我國(guó)高校學(xué)生評(píng)教有效性和可比性具有較強(qiáng)的參考價(jià)值。
表1 評(píng)價(jià)指標(biāo)
為保證數(shù)據(jù)的質(zhì)量和可信度,在分析數(shù)據(jù)前對(duì)76796 評(píng)教信息進(jìn)行清洗。
剔除缺失值。 學(xué)生通過網(wǎng)絡(luò)平臺(tái)完成評(píng)教過程, 評(píng)價(jià)系統(tǒng)只有填寫完所有指標(biāo)才可以進(jìn)行提交,因此,原始數(shù)據(jù)非常完整,不存在缺失問題。
剔除異常值。 部分學(xué)生在評(píng)教過程中過于受主觀因素影響,變成離群點(diǎn),影響后期數(shù)據(jù)的有效性。面對(duì)這種情況,常見處理方法是以全部評(píng)教信息為整體,剔除前后10%的數(shù)據(jù)。 而教師授課是以班級(jí)為單位, 故本文考慮四分位數(shù), 采用Tukey's Test方法剔除偏離班級(jí)的異常值。
最大值估計(jì)=Q3+k(Q3-Q1)
最小值估計(jì)=Q1-k(Q3-Q1)
這里取k=3,即保留總分在[最小值,最大值]范圍內(nèi)的評(píng)教信息,剔除極度異常值。 篩選后,有效評(píng)教數(shù)據(jù)有74533 條,有效率為97.05%。
本文采用SPSS.25 對(duì)清洗后的數(shù)據(jù)進(jìn)行信效度檢驗(yàn)。 經(jīng)過信度分析, 得到克隆巴赫Alpha 系數(shù)為0.992,即評(píng)教數(shù)據(jù)具有較好的信度。效度方面(詳見表2),KMO 值為0.966,巴特利特球形度檢驗(yàn)對(duì)應(yīng)P值趨近于0, 說明評(píng)教指標(biāo)的設(shè)計(jì)也具有一定的信度,適合提取因子。
表2 KMO 和巴特利特檢驗(yàn)
因此,對(duì)數(shù)據(jù)進(jìn)行探索性因子分析,結(jié)果顯示因子提取效果一般。 為探究具體原因,輸出20 項(xiàng)評(píng)價(jià)指標(biāo)之間的相關(guān)系數(shù)矩陣,發(fā)現(xiàn)指標(biāo)之間的相關(guān)性大多集中在0.3—0.4 區(qū)間, 相關(guān)性并不強(qiáng)烈,這可能是導(dǎo)致因子提取一般的原因。故后文依舊以20項(xiàng)評(píng)教指標(biāo)為基礎(chǔ),進(jìn)行后續(xù)分析。
綜上所述,本次實(shí)證分析所用的評(píng)教數(shù)據(jù)有效性較高,能夠在一定程度上反映學(xué)生評(píng)教制度的設(shè)定與實(shí)踐結(jié)果的真實(shí)可靠性。
基于國(guó)內(nèi)外研究成果發(fā)現(xiàn),學(xué)生評(píng)教過程易受眾多主觀因素影響[3-6]:教師上課要求嚴(yán)格會(huì)影響評(píng)教分?jǐn)?shù)偏低;學(xué)生評(píng)教分?jǐn)?shù)高低往往與課程性(公共課、學(xué)科基礎(chǔ)課、專業(yè)課和實(shí)訓(xùn)課)、重要度和難易程度有關(guān);不同學(xué)科背景的學(xué)生,因其思考方式有一定差別,對(duì)教學(xué)質(zhì)量的關(guān)注點(diǎn)也會(huì)不同,從而導(dǎo)致評(píng)教結(jié)果存在差異性。
為驗(yàn)證以上因素是否在學(xué)生評(píng)教過程中起到一定的影響,本文采用合適的統(tǒng)計(jì)方法進(jìn)行分析。
1.課堂管理與滿意度
為探究學(xué)生評(píng)教過程是否受教師課堂要求嚴(yán)格這一因素影響,將指標(biāo)3(課堂管理要求嚴(yán)格)與指標(biāo)20(對(duì)教師總體滿意)進(jìn)行獨(dú)立性檢驗(yàn)。
H10:教師課堂管理嚴(yán)格與學(xué)生對(duì)教師的滿意度之間獨(dú)立;
H11:教師課堂管理嚴(yán)格與學(xué)生對(duì)教師的滿意度之間不獨(dú)立。
通過卡方檢驗(yàn),對(duì)應(yīng)卡方值為7318.7,P 值趨近于0,認(rèn)為拒絕原假設(shè),接受備擇假設(shè),認(rèn)為教師課堂管理嚴(yán)格與學(xué)生對(duì)教師的滿意度之間不獨(dú)立。 進(jìn)一步通過對(duì)應(yīng)分析,觀察二者之間一一對(duì)應(yīng)關(guān)系。
圖1 中1—5 代表學(xué)生對(duì)教師課堂管理評(píng)價(jià),“非常不滿意”“非常滿意” 則表示學(xué)生對(duì)教師總體滿意度。 從圖1 第四象限可清晰看出,在“課堂管理嚴(yán)格=5”處,除了對(duì)教師非常滿意外,確實(shí)存在部分學(xué)生因?yàn)榻處熣n堂管理嚴(yán)格而導(dǎo)致對(duì)教師的整體滿意度不高。 觀察源數(shù)據(jù),可知對(duì)教師總體滿意度在1—3 分的學(xué)生共計(jì)2736 人,其中學(xué)生認(rèn)為課堂管理嚴(yán)格即分值在4—5 分的人數(shù)占69.23%。
圖1 課堂管理與教師總體滿意度對(duì)應(yīng)分析
2.不同學(xué)科是否具有一定差異性
本文根據(jù)課程性質(zhì)將有效評(píng)價(jià)數(shù)據(jù)分成4 組:公共課、學(xué)科基礎(chǔ)課、專業(yè)課和實(shí)訓(xùn)課。 組內(nèi)基礎(chǔ)信息詳見表3。
表3 課程性質(zhì)分組信息
根據(jù)分組信息,可以看出專業(yè)課評(píng)價(jià)條數(shù)較多,實(shí)訓(xùn)課評(píng)價(jià)條數(shù)最少。這與學(xué)校和專業(yè)制定的人才培養(yǎng)方案相關(guān), 大一年級(jí)基本是公共課和學(xué)科基礎(chǔ)課,大二大三開始接觸專業(yè)課程,只有少部分專業(yè)有實(shí)訓(xùn)課。從均值角度分析,各組之間分值幾乎穩(wěn)定在85 左右,差距不大。 但是實(shí)訓(xùn)課對(duì)應(yīng)方差值較大為93.30,可見學(xué)生對(duì)于實(shí)訓(xùn)課程的感受不太相同。
為進(jìn)一步檢驗(yàn),不同課程性質(zhì)對(duì)評(píng)教數(shù)據(jù)是否具有影響,本文擬采用單因素方差分析。 方差分析是英國(guó)統(tǒng)計(jì)學(xué)家R.A.Fisher 提出的對(duì)兩個(gè)或多個(gè)樣本平均數(shù)差異顯著檢驗(yàn)的方法,先決條件需要滿足同方差性。 以課程性質(zhì)分組,通過方差齊性檢驗(yàn),對(duì)應(yīng)P 值趨近0,故認(rèn)為數(shù)據(jù)不滿足齊方差性。此時(shí)考慮采用Kruskal-Wallis 檢驗(yàn), 非參數(shù)方法的優(yōu)勢(shì)之一: 不要求樣本數(shù)據(jù)來自何種總體分布。 Kruskal-Wallis 檢驗(yàn)基于Wilcoxon 秩和檢驗(yàn), 其原假設(shè)為M1=M2=…=Mk, 目的是檢驗(yàn)不同分組之間中位數(shù)是否相同。 其中為k 分組數(shù),Mi 為第i 組樣本總體的中位數(shù)。 若拒絕原假設(shè),則說明k 組之間的中位數(shù)不全相同,即k 組樣本不全來自一個(gè)總體。 現(xiàn)假設(shè):
H20:不同課程性質(zhì)的評(píng)教數(shù)據(jù)分布相同;
H21:不同課程性質(zhì)的評(píng)教數(shù)據(jù)分布不相同或不全相同。
經(jīng)檢驗(yàn),對(duì)應(yīng)P 值趨近0,故拒絕原假設(shè),接受備擇假設(shè), 不同課程性質(zhì)的評(píng)教數(shù)據(jù)不全來自同一總體,即認(rèn)為不同課程性質(zhì)對(duì)學(xué)生評(píng)教過程有影響。
3.不同班級(jí)是否具有一定差異性
以班級(jí)作為評(píng)教數(shù)據(jù)劃分依據(jù),主要驗(yàn)證具有不同學(xué)科背景的學(xué)生評(píng)教結(jié)果是否存在差異性。 通過R 共分出208 個(gè)班級(jí), 大四學(xué)生都在校外實(shí)習(xí),所以沒有參與此次評(píng)教。 而不同班級(jí)之間存在樣本量差距偏大的情況,故依舊考慮K-W 檢驗(yàn)。
H30:不同班級(jí)的評(píng)教數(shù)據(jù)總體分布相同;
H31:不同班級(jí)的評(píng)教數(shù)據(jù)總體分布不相同或不全相同。
經(jīng)檢驗(yàn),對(duì)應(yīng)P 值趨近0,故拒絕原假設(shè),接受備擇假設(shè), 不同班級(jí)的評(píng)教數(shù)據(jù)不全來自同一總體,即認(rèn)為不同學(xué)科背景的學(xué)生在評(píng)教過程對(duì)學(xué)生有影響。
盡量避免以上因素對(duì)評(píng)教的影響, 本文通過R語言,從課程性質(zhì)和班級(jí)兩個(gè)維度進(jìn)行分類,計(jì)算標(biāo)準(zhǔn)分,以此增加評(píng)教數(shù)據(jù)的可比性。
根據(jù)表4 前后評(píng)教排名對(duì)比,并咨詢S 學(xué)院督導(dǎo)、領(lǐng)導(dǎo)和同行意見后,一致認(rèn)為使用標(biāo)準(zhǔn)分進(jìn)行排名更為合理,與日常聽課感受更為相同。 比如排名靠前編號(hào)5 和4 的兩名教師曾獲校教學(xué)十佳等多項(xiàng)教學(xué)榮譽(yù), 排名靠后的教師較多是新進(jìn)教師,還有教學(xué)進(jìn)步學(xué)習(xí)的空間。 編號(hào)18,19 和21 等教師查看原數(shù)據(jù),存在學(xué)生報(bào)復(fù)性評(píng)教的情況。 標(biāo)準(zhǔn)分值的區(qū)間也相應(yīng)擴(kuò)大,可比性增加的同時(shí),更能體現(xiàn)教師教學(xué)水平存在的差異性。
表4 S 院評(píng)教排名前后對(duì)比
J 師范院校除了20 項(xiàng)5 級(jí)評(píng)分性指標(biāo),還包括2 項(xiàng)文本性指標(biāo), 主要用于詢問學(xué)生的課堂收獲和反思。 本文以詞云統(tǒng)計(jì)表的形式展現(xiàn),如圖2.
圖2 詞頻統(tǒng)計(jì)圖
由圖2 可知,關(guān)于課堂收獲情況,學(xué)生留言中的正向情感詞偏多,其中“喜歡”和“知識(shí)”占據(jù)前兩名。 而通過詢問學(xué)生給后者學(xué)習(xí)該門課程的建議時(shí),學(xué)生的回答也在一定程度上代表了自身對(duì)該課程學(xué)習(xí)的反思。 學(xué)生留言較多的關(guān)鍵詞是“認(rèn)真聽課”“完成課后作業(yè)并及時(shí)復(fù)習(xí)”, 可見學(xué)生學(xué)習(xí)態(tài)度是積極向上的。
由原始數(shù)據(jù)可知,學(xué)生評(píng)教結(jié)果具有較高的信度和一致性。 這說明大多數(shù)學(xué)生是本著認(rèn)真負(fù)責(zé)的態(tài)度完成對(duì)教師教學(xué)的評(píng)價(jià),且反饋正向積極。 因獲取數(shù)據(jù)的總體分布不知,且按組劃分后,樣本數(shù)據(jù)具有異方差性。 因此采用非參K-W 方法得出課程性質(zhì)與學(xué)生的學(xué)科背景對(duì)評(píng)教結(jié)果有一定的影響。 通過卡方分析和對(duì)應(yīng)分析,得出存在因教師對(duì)課堂管理嚴(yán)格而對(duì)教師總體滿意度偏低的現(xiàn)象。 因此,若直接進(jìn)行均值法,對(duì)個(gè)別教師的評(píng)教結(jié)果不公平也不科學(xué)。 對(duì)數(shù)據(jù)清洗后的結(jié)果,以學(xué)科性質(zhì)和班級(jí)兩個(gè)維度進(jìn)行分類,借助R 軟件計(jì)算4×208組的標(biāo)準(zhǔn)分。 此舉在保留原始信息的同時(shí),能夠在很大程度上減少因?qū)W生主觀因素帶來的誤差。 以S學(xué)院評(píng)教數(shù)據(jù)為例,證明利用標(biāo)準(zhǔn)分排名結(jié)果更能反映教師教學(xué)的真實(shí)水平。
在實(shí)證分析中,發(fā)現(xiàn)現(xiàn)有的評(píng)教制度和實(shí)施存在一定的問題。 現(xiàn)針對(duì)問題,提出如下相關(guān)建議:
第一,評(píng)教指標(biāo)個(gè)數(shù)偏多且緊密性不強(qiáng)。 效度檢驗(yàn)結(jié)果證明一致性較高,但本文在進(jìn)行探索性因子分析時(shí),提取因子并不顯著,可見指標(biāo)之間存在一定的相關(guān)度但并不高。 建議高校相關(guān)部門設(shè)置指標(biāo)時(shí), 可以參考現(xiàn)有量表事先設(shè)置好問卷結(jié)構(gòu),提高結(jié)構(gòu)一致性。
第二,評(píng)教過程缺少質(zhì)量控制環(huán)節(jié)。 評(píng)教指標(biāo)的設(shè)計(jì)可以適當(dāng)加入2-3 道陷阱題目,防止學(xué)生為節(jié)省時(shí)間,或在沒有仔細(xì)閱讀指標(biāo)后打出統(tǒng)一的分?jǐn)?shù)。 依賴Tukey's Test 方法僅僅能剔除極度異常值,無法剔除不認(rèn)真評(píng)教的數(shù)據(jù)。
第三,部分班級(jí)學(xué)生參與評(píng)教的自主性有待加強(qiáng)。 計(jì)算標(biāo)準(zhǔn)分時(shí),出現(xiàn)缺失值,究其原因在于剔除異常值后, 該班級(jí)僅剩1~3 個(gè)相同的有效分?jǐn)?shù),不存在波動(dòng)性。 故部分學(xué)院仍需加大教學(xué)質(zhì)量監(jiān)督力度,提高學(xué)生主動(dòng)參評(píng)率。
宿州教育學(xué)院學(xué)報(bào)2023年5期