曹 佳,孫 艷,陳麗麗,高曉華
(哈爾濱醫(yī)科大學(xué)公共衛(wèi)生學(xué)院,黑龍江 哈爾濱 150081)
預(yù)防醫(yī)學(xué)考試試題質(zhì)量評價
曹 佳,孫 艷,陳麗麗,高曉華
(哈爾濱醫(yī)科大學(xué)公共衛(wèi)生學(xué)院,黑龍江 哈爾濱 150081)
目的 評價預(yù)防醫(yī)學(xué)考試試題質(zhì)量,以便科學(xué)地命題,理想地檢驗學(xué)生成績,使成績考核能真實地反映教學(xué)質(zhì)量。方法 運用統(tǒng)計學(xué)方法對試題難度、覆蓋度、區(qū)分度、可信度進行分析。結(jié)果 試題難度適當,覆蓋度欠佳,區(qū)分度尚好,可信度良好。結(jié)論 在出題時,要注意試題難度和難度分配,增加試題類型和數(shù)量,提高覆蓋度和區(qū)分度。
預(yù)防醫(yī)學(xué);考試試題;質(zhì)量評價
如何科學(xué)地命題,理想地檢驗學(xué)生成績,是值得教師認真思考的問題。為檢驗并提高試題質(zhì)量,同時也檢驗教學(xué)上存在的問題,我們對近年來公共事業(yè)管理本科學(xué)生預(yù)防醫(yī)學(xué)試卷質(zhì)量進行評價,為以后教學(xué)命題提供借鑒。教學(xué)質(zhì)量涉及到教學(xué)的整個過程,而檢驗教學(xué)質(zhì)量的重要手段就是成績考核,而成績考核能否真實地反映教學(xué)質(zhì)量,命題顯得特別重要。試題過難、過偏,會出現(xiàn)學(xué)生成績偏低;命題過易,勢必降低了教學(xué)大綱所規(guī)定的目標,使得學(xué)生成績偏高,無法區(qū)分開學(xué)生成績的優(yōu)劣。
2001級、2002級公共事業(yè)管理本科學(xué)生103人的預(yù)防醫(yī)學(xué)試卷103份。
試題類型共分6種,分別是概念題(10分)、判斷題(15分)、單選題(15分)、多選題(25分)、簡答題(15分)、論述題(20分)。經(jīng)統(tǒng)計學(xué)方法處理,根據(jù)考試成績對各試題得分進行分析。
假設(shè)試卷題目類型個數(shù)為n,P為得分(百分制評分),n個類型題目的滿分值分別為
設(shè)抽查全體學(xué)生數(shù)為N,樣本值用x1,x2,…,xn表示。這就是所抽查到的N個學(xué)生的考試成績。用xij表示第i個學(xué)生第j題的實際得分分別表示第j題的均值和方差。
為了統(tǒng)一檢驗量綱和提高各題間的可比性,把各題的得分標準化,令,則 sij為第 i個學(xué)生第 j題的標準分。這個過程實際上就是把符合正態(tài)分布的學(xué)生成績轉(zhuǎn)化為標準正態(tài)分布的過程。令aj、bj分別表示第j題滿分和0分的標準分。
采用4項指標即難度、覆蓋度、區(qū)分度和可信度[1]作為評價試題質(zhì)量的主要指標。
覆蓋度:用各題之間相關(guān)矩陣表示,即r=(rij)n×n,其中
這種描述的基本思想是試題覆蓋面越廣,則各題之間的交叉相關(guān)性越小,反之則越大。相關(guān)系數(shù)的實質(zhì)就是反映試題覆蓋面大小。通常以 rij<0.2 為覆蓋面大(i,j=1,2,…,n)。
區(qū)分度:第i題的區(qū)分度Gj為
其中,Hj,Lj分別表示樣本中高分組、低分組第j題的平均分。高分組和低分組各占樣本容量的25%、30%為宜。試卷總區(qū)分度Gj為各題區(qū)分度的加權(quán)平均,即
區(qū)分度是標志試題能否將學(xué)生成績拉開距離,真正從分數(shù)上將好、中、差的學(xué)生區(qū)分開來。區(qū)分度G>0.4為可,G<0.2為差。
可信度描述了試卷總分差在排除了各題隨機誤差之后,余下部分占總方差的百分比。各題隨機誤差小,則試卷可信度就高,反之則可信度低。一般情況下,試卷可信度可達0.5。
(1)103份試卷成績統(tǒng)計情況(見表1)。卷面分為56.2~95.5分,平均分為(76.44±4.4)分趨于正態(tài)分布??傠y度D值為0.21,試卷難度適當;總方差為129,則可信度B=0.63,試卷可信度良好。
表1 103名學(xué)生成績統(tǒng)計(分)
(2)試卷各題相關(guān)系數(shù)矩陣。
從矩陣上看,概念題與判斷題、單選題的相關(guān)系數(shù)基本滿足<0.2的要求,判斷題、單選題與論述題的相關(guān)系數(shù)基本滿足<0.2的要求,其他各題間的相關(guān)系數(shù)均>0.2,試卷覆蓋度不夠好。
(3)對學(xué)生考試成績原始數(shù)據(jù)按從高分到低分排列,取前25名和后25名學(xué)生成績作為高分組和低分組(見表2)。試題總區(qū)分度為D=0.76。試卷區(qū)分度總體上較好。
表2 高分組與低分組間各題區(qū)分度
考試是教學(xué)中不可缺少的環(huán)節(jié),是檢查和評價教學(xué)質(zhì)量的必要手段。通過對考試成績和試卷的分析,及時發(fā)現(xiàn)教學(xué)中存在的問題,不斷完善命題工作,使考試在教學(xué)中發(fā)揮應(yīng)有的作用。
從難度D值上看,多選題和論述題較難,難度均>0.2。這2個題型的確是教學(xué)重點和難點,難度設(shè)置較為理想。其余各題型難度均<0.2,特別是概念題和單選題,屬于基本概念題和容易判斷的選擇題,提示今后在同類班次的教學(xué)中,應(yīng)增加這2個題型的難度。從覆蓋度上看,判斷題和多選題間以及多選題和簡答題間相關(guān)系數(shù)較高,說明試卷覆蓋度不夠好,今后在出題時,應(yīng)注意授課的覆蓋面,避免在教學(xué)的重點地方反復(fù)出題。另外,作為結(jié)束考試,只出了6個類型題,覆蓋面也難達到高的要求,以后應(yīng)增加試題類型,提高試題覆蓋度。試卷總區(qū)分度較好,但概念題和單選題區(qū)分度為0.09(<0.2),區(qū)分度較差,幾乎不可取用,應(yīng)提高概念題和單選題區(qū)分度,可增加其難度。
綜上所述,試題難度較為理想,個別試題難度偏低;覆蓋度較差;總區(qū)分度良好,個別試題區(qū)分度較差;可信度良好。這只是從學(xué)生試題成績數(shù)據(jù)進行分析和評價,實際上影響學(xué)生成績的因素很多,如命題難易程度、命題合理性、學(xué)生掌握程度、考場紀律、授課人與命題人的關(guān)系等。要提高試題質(zhì)量,應(yīng)注意以下幾點:(1)注意試題難度和難度分配。在出題時,應(yīng)將試題平均難度控制在0.5(0.4~0.7)左右。另外,應(yīng)把難度分配做到相對平均又有所側(cè)重。(2)增加試題類型和數(shù)量。通過提高信度反過來提高難度和區(qū)分度。(3)加強試題質(zhì)量評價。
[1]羅伯特·L·艾伯爾著,漆書清譯.教育測量綱要[M].南昌:江西師范大學(xué)高等教育研究室,1979.
G40-03
B
1671-1246(2010)24-0041-02