吳延科 張朝霞
摘 要:考試是學(xué)校教學(xué)的重要環(huán)節(jié),低質(zhì)量的試題只是對(duì)知識(shí)的簡單重復(fù),徒增師生的負(fù)擔(dān)。因此,提高試卷質(zhì)量是提高學(xué)生學(xué)習(xí)效率和教師教學(xué)質(zhì)量的一種科學(xué)有效的途徑,研究試卷質(zhì)量對(duì)學(xué)生的成績影響具有重要的現(xiàn)實(shí)意義。教師以廣東省湛江市某中學(xué)2017屆學(xué)生的10次考試成績?yōu)闃颖荆懻撛嚲碣|(zhì)量對(duì)考生成績的影響。
關(guān)鍵詞:試卷質(zhì)量;考試評(píng)價(jià);學(xué)生成績
中圖分類號(hào):G63 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1673-9132(2018)17-0049-02
DOI:10.16657/j.cnki.issn1673-9132.2018.17.030
試卷質(zhì)量對(duì)考試的影響是多方面的。文獻(xiàn)一[1]認(rèn)為難度系數(shù)、區(qū)分度系數(shù)、信度、效度及覆蓋度等測(cè)評(píng)指標(biāo)是分析試卷質(zhì)量的重要指標(biāo)。文獻(xiàn)二[2]提出了衡量試卷質(zhì)量的四個(gè)指標(biāo),介紹了用數(shù)理統(tǒng)計(jì)方法對(duì)試卷如何進(jìn)行科學(xué)的評(píng)價(jià)。文獻(xiàn)三[3]構(gòu)建了以效度驗(yàn)證為根本,以目標(biāo)性、測(cè)量學(xué)、結(jié)構(gòu)性、規(guī)范性、統(tǒng)計(jì)性評(píng)價(jià)指標(biāo)為支撐,以證據(jù)收集為手段,以德爾菲法為價(jià)值判斷方法的高考試卷質(zhì)量評(píng)價(jià)體系。
一、試卷質(zhì)量評(píng)價(jià)指標(biāo)
我們使用難度、區(qū)分度、信度、效度和覆蓋度五個(gè)指標(biāo)對(duì)試卷進(jìn)行分析。難度系數(shù)評(píng)價(jià)的是試題或試卷的難易程度,其值越大,意味著試題或試卷越難。試卷的難度系數(shù)定義為試卷平均得分與滿分值的比值。區(qū)分度也稱鑒別力,一般可以使用高低分方法進(jìn)行計(jì)算,即先把成績進(jìn)行降序排列,分別取最高和最低的27%個(gè)考生記錄,計(jì)算平均得分之差與總分值的比例即為區(qū)分度。信度系數(shù)是測(cè)試可靠性的指標(biāo),表示所得結(jié)果的一致性,一般使用克朗巴赫α值進(jìn)行計(jì)算。效度指的是考試的有效性程度,反映的是考試所能夠達(dá)到的目的的程度。試題的效度是使用該題得分與某一效標(biāo)得分的相關(guān)系數(shù)來衡量。由于同一份試卷中的試題具有同質(zhì)性,主要是測(cè)量學(xué)生同一部分的知識(shí)點(diǎn)的掌握程度,因而一般可以取試卷總得分作為效標(biāo)。這樣,試題的效度就等于該題得分與試卷總得分的相關(guān)系數(shù),它表示的是該題與試卷總體具有的內(nèi)在一致性。覆蓋度表示試題對(duì)教學(xué)大綱規(guī)定內(nèi)容的覆蓋程度。各題得分的相關(guān)系數(shù)可反映各題間內(nèi)容的相似程度,如果各題間相關(guān)系數(shù)大,說明各題內(nèi)容相關(guān)性大,否則說明各題的內(nèi)容相對(duì)獨(dú)立,因此試題的覆蓋度可通過與試卷中各題間的相關(guān)系數(shù)的平均值之差來反映。試卷覆蓋度越大,試卷的內(nèi)容效度越高。
二、試卷質(zhì)量分析
我們選取廣東省湛江市某中學(xué)2017屆學(xué)生的10次各類考試成績?yōu)闃颖?,通過對(duì)10次考試考生平均分、偏度和峰度的調(diào)查統(tǒng)計(jì),得出一份好的試卷應(yīng)該使考生成績近似服從正態(tài)分布,其偏度應(yīng)該接近0,而峰度應(yīng)該接近3。從這個(gè)角度來講,有的模擬試卷比較理想,有的模擬試卷不理想。
10次考試的難度分別為:
0.5679,0.4361,0.5018,0.3654,0.4818,
0.4537,0.5270,0.5952,0.5282,0.6380;
區(qū)分度分別為:
0.4640,0.4415,0.5321,0.4132,0.4958,
0.5421,0.5249,0.4408,0.4601,0.4579;
信度分別為:
0.7280,0.7474,0.7913,0.7156,0.8012,
0.7874,0.7553,0.6957,0.7274,0.6490;
效度分別為:
0.8256,0.8167,0.8483,0.8321,0.8749,
0.8672,0.8514,0.8120,0.8308,0.7998;
覆蓋度分別為:
0.5122,0.5054,0.4275,0.5256,0.3889,
0.4125,0.4337,0.5364,0.5051,0.6139。
通過對(duì)10次考試難度、區(qū)分度、信度、效度、覆蓋度的具體研究,結(jié)合前述分析結(jié)果,我們給出如下命題建議:
1.難度對(duì)考生平均得分的影響最大,并且對(duì)各類考生的影響基本一致。因此,試卷命題人需要重點(diǎn)控制試卷難度,這一點(diǎn)與我們的經(jīng)驗(yàn)一致,大多數(shù)試卷命題人都能夠留意到。
2.為了提高試卷質(zhì)量,還需要有效控制試卷的效度。由于試卷的效度是各題效度的加權(quán)平均,而各題的效度等于該題得分與試卷總得分的相關(guān)系數(shù),因此,為提高試卷效度,就需要盡量使每一題的難度與試卷整體難度一致,即不能夠使各題的難度系數(shù)差別過大。
3.試卷信度對(duì)考生平均成績的影響同樣不能忽視。為了提高試卷信度,需要減小各題的得分方差,而增大總得分方差,這顯然不能兼顧。由統(tǒng)計(jì)學(xué)知識(shí)可知,總得分方差可以分解為各題得分方差與各題間得分方差之和。因此,減小各題得分方差和增大各題間得分方差是增大信度的兩種途徑。實(shí)際操作中,由于客觀題的數(shù)量和分值是固定的,可以把主觀題分解為幾個(gè)小題,難度循序漸進(jìn),這樣不但可以減小各題的得分方差,而且能夠增大主觀題與客觀題間的得分方差,從而有效增大試卷的信度。
4.覆蓋度也是評(píng)價(jià)試卷質(zhì)量的重要指標(biāo)。增大覆蓋度需要減小各題間的相關(guān)系數(shù),一個(gè)有效途徑就是盡量使各題考查的知識(shí)點(diǎn)不相同。
5.區(qū)分度對(duì)成績的影響最具規(guī)律性,成績?cè)胶玫目忌?,大的區(qū)分度對(duì)其越有利。由于區(qū)分度是使用高分段和低分段考生的平均成績之差來度量的,顯然,試題難度過大或過小都會(huì)使得區(qū)分度變小。而適當(dāng)?shù)脑囶}難度會(huì)增大區(qū)分度,這對(duì)提高試卷質(zhì)量具有指導(dǎo)意義。
參考文獻(xiàn):
[1] 吳承禎,何麗華,林立群等.試卷質(zhì)量分析方法及其應(yīng)用[J].中國林業(yè)教育,2008(3):26.
[2] 伊繼東,劉江,姜家雄.用數(shù)理統(tǒng)計(jì)方法分析試卷質(zhì)量[J].云南師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 1995(Z1):40.
[3] 付慧宇.高考試卷質(zhì)量評(píng)價(jià)體系初探[J].天津師范大學(xué)學(xué)報(bào)(基礎(chǔ)教育版),2011(2):70.