鄒麗華
(大連教育學(xué)院 學(xué)習(xí)質(zhì)量監(jiān)測中心,遼寧 大連116021)
難度和區(qū)分度是評(píng)價(jià)試題質(zhì)量的兩個(gè)重要統(tǒng)計(jì)指標(biāo)。一般情況下,對(duì)于兼顧學(xué)業(yè)水平和選拔測試的中考,尤其是對(duì)于承載選拔進(jìn)入重點(diǎn)高中或一般高中的難題和中等難度的試題,比較重視試題難度指標(biāo),容易忽視試題區(qū)分度指標(biāo)。從題目得分率與總分關(guān)系,探究題目局部區(qū)分功能,其重要意義在于評(píng)價(jià)試題的“公平選拔”作用。
在經(jīng)典測量理論(CTT)框架下,難度指標(biāo)通常以通過率或得分率表示,用難度系數(shù)(p)大小表示試題的難易程度。難度指標(biāo)是一個(gè)反向指標(biāo),難度系數(shù)越小,試題就越難。區(qū)分度又稱為鑒別力,是指題目對(duì)不同水平考生的區(qū)分程度,用鑒別指數(shù)(D)或相關(guān)系數(shù)(r)的大小表示區(qū)分程度。從經(jīng)典教育測量與統(tǒng)計(jì)理論相關(guān)研究結(jié)果看,鑒別指數(shù)和題目難度不是彼此獨(dú)立的,中等難度水平的試題,D值可以最大。[1]表1是具有不同難度系數(shù)(p)的項(xiàng)目所對(duì)應(yīng)的可能的最大D值;最大D值與難度系數(shù)(p)的關(guān)系之間呈倒U型關(guān)系,即接近0.5難度水平的題目的鑒別度值大于難度在兩端的題目。
表1 最大D值與項(xiàng)目難度的關(guān)系
區(qū)分度指標(biāo)不僅會(huì)受到難度指標(biāo)影響,同樣也會(huì)受到樣本容量和被試同質(zhì)性程度的影響。如果被試學(xué)業(yè)水平整體較好,試題難度相對(duì)要小些,鑒別指數(shù)D會(huì)小;如果被試學(xué)業(yè)水平整體上表現(xiàn)都不是很好,試題難度相對(duì)要大些,鑒別指數(shù)D也不會(huì)大。以選拔為目的的測驗(yàn),接近于0.5難度水平的各個(gè)試題更為可選,題目更能較精確區(qū)分考生間差異。
以大連市內(nèi)五區(qū)考生試卷為樣本,選取近四年來中考物理試題的全部126道題目,進(jìn)行數(shù)據(jù)統(tǒng)計(jì)與分析,得到題目鑒別指數(shù)與難度系數(shù)之間的關(guān)系,見圖1。
圖1 中考物理試題鑒別指數(shù)與難度系數(shù)關(guān)系
圖1顯示,鑒別指數(shù)和難度系數(shù)關(guān)系基本上呈倒U型,即中等難度的題目可能產(chǎn)生最大的區(qū)分度,但并不意味著中等難度題目的D值一定大于簡單題或難題,即使p值小于0.4或大于0.7的題目也可能具有比較理想的D值;難度系數(shù)在0.9以上的題目D值普遍偏低??傊M管區(qū)分度與題目難度總體上符合倒U型數(shù)量關(guān)系,但并不存在著一一對(duì)應(yīng)的關(guān)系。因此,在中考物理學(xué)科命題過程中,單憑通過控制試題難度難以實(shí)現(xiàn)對(duì)區(qū)分度的控制。
試題局部區(qū)分功能類型可以劃分為全程區(qū)分、高端區(qū)分、低端區(qū)分、中高段區(qū)分和中低段區(qū)分,區(qū)分程度可劃分為強(qiáng)區(qū)分、中度區(qū)分和弱區(qū)分。[2]由于難度和區(qū)分度指標(biāo)的局限性,以及題目難度與區(qū)分度的實(shí)際關(guān)系并非呈倒U型關(guān)系,作為整體指標(biāo)的難度與區(qū)分度很難反映題目的局部特征與功能。不同難度試題的局部區(qū)分功能存在差異,區(qū)分度和難度相同或相近的兩道試題的局部特征也存在著差異。
CTT理論框架下難度與區(qū)分度的估計(jì)對(duì)樣本的依賴性很大。計(jì)算題目的難度和區(qū)分度指標(biāo)一般基于總體或總體的代表性樣本,以反映總體特征。以2010年中考物理試卷中具有相同的計(jì)算題型和測試能力的第24題和第25題為例,采用市內(nèi)五區(qū)考生試卷樣本數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,結(jié)果見表2。
表2 兩個(gè)題目統(tǒng)計(jì)結(jié)果
兩個(gè)題目通過率與總分的關(guān)系見圖2??梢钥闯?,兩條曲線并不重合,盡管兩題難度系數(shù)、區(qū)分度指標(biāo)均接近,但考生通過率的變化趨勢不盡相同。難度系數(shù)和區(qū)分指標(biāo)相同或接近的題目,同一考生群體的通過率卻存在著差別,即局部區(qū)分度功能存在差異。
圖2 題目24和題目25通過率隨總分變化曲線對(duì)比
通常,對(duì)兼顧學(xué)生水平測試和選拔兩種功能的中考命題來講,題目區(qū)分度不做要求。簡單題要求學(xué)生達(dá)到課標(biāo)基本要求即可,但對(duì)承載選拔任務(wù)的中等試題和難題要有較好區(qū)分度及局部區(qū)分功能。因此,命題必須重視難題和中等難度試題的局部區(qū)分功能的設(shè)計(jì)及調(diào)整。
大連中考的區(qū)分功能表現(xiàn)在將適合升入示范高中和適合升入一般高中的學(xué)生區(qū)分開來。根據(jù)錄取率確定難度系數(shù)節(jié)點(diǎn)是構(gòu)建合理難度分布模型的關(guān)鍵。近年來,大連示范和一般公辦高中錄取率分別穩(wěn)定在30%和55%左右,因此重點(diǎn)高中與一般高中的選拔難度系數(shù)節(jié)點(diǎn)為0.30和0.55。由于大連市中考試題難、中、易分值比為1:2:7,相應(yīng)各部分試題的難度系數(shù)分別為[0.2,0.4]、(0.4,0.7]、(0.7,1.0]。[3]在此基礎(chǔ)上,結(jié)合近幾年中考物理試題難度分布,合理建構(gòu)大連區(qū)域中考物理試題難度分布模型。[4]構(gòu)建合理難度模型的目的是為中考水平測試和選拔服務(wù)。在選拔不同類型學(xué)校的節(jié)點(diǎn)處附近設(shè)置與能力水平相近的高區(qū)分度試題,才能更好地落實(shí)公正選拔,減低錄取誤差。
選拔測驗(yàn)中相同難度試題,不論是簡單題還是難題,區(qū)分度越高越好。區(qū)分度越高,越能把不同能力水平的考生區(qū)分開來,越有利于選拔。對(duì)于難度系數(shù)在0.80~1.00,即屬于學(xué)業(yè)水平考試部分的試題,區(qū)分度低的試題也可以保留。
總分就是對(duì)所研究的能力、特質(zhì)或結(jié)構(gòu)的一種初步、近似的測量結(jié)果。物理試題編制要求:一是承載“1”部分的難題必須設(shè)置在高能力水平處考查,這樣才能保證得分越高的考生,其能力水平也越高,避免用簡單題區(qū)分高能力水平的考生。二是難題必須在高端強(qiáng)區(qū)分,中等難度題至少在中高段中度區(qū)分。區(qū)分功能較強(qiáng)的試題,難度系數(shù)應(yīng)設(shè)置在0.2~0.8為宜,保證鑒別指數(shù)在0.2以上。過難或過易的試題對(duì)測驗(yàn)分?jǐn)?shù)的變異性影響較小,對(duì)測驗(yàn)信度和效度幾乎不起作用。
試卷難度分布影響考試結(jié)果的分?jǐn)?shù)分布形態(tài),試卷的區(qū)分結(jié)構(gòu)更多針對(duì)被試群體進(jìn)行分層區(qū)分,難度分布和區(qū)分結(jié)構(gòu)影響試卷區(qū)分功能。選取、編制難度合適,并具有一定區(qū)分功能的試題,有利于測量能力較高考生之間的個(gè)體差異,有利于公平、公正地選拔考生。試卷設(shè)計(jì)不僅要考慮試題難度分布狀況,還要通過調(diào)整區(qū)分結(jié)構(gòu)來實(shí)現(xiàn)對(duì)某段考生的更高效的區(qū)分,如要對(duì)全體考生發(fā)揮均衡的區(qū)分作用,就要設(shè)計(jì)全程區(qū)分類型題目或均衡配置各種區(qū)分類型題目的比重。
大連市中考物理近四年承擔(dān)選拔功能的試題分布在選擇題、簡答題和綜合題三種題型。以2013年中考物理試卷中五道難題為例,題號(hào)、題型、考查內(nèi)容、滿分值、難度和區(qū)分度等內(nèi)容詳見表3所示。依據(jù)項(xiàng)目區(qū)分度評(píng)價(jià)標(biāo)準(zhǔn)確定這五道試題的相關(guān)程度。[2]
表3 五道題目難度系數(shù)和區(qū)分度
從表3選擇不同題型且D值相差較大的第14、29、32題,由實(shí)測原始分?jǐn)?shù),繪制題目得分率隨物理總分變化的關(guān)系曲線,即題目難度曲線,見圖3。
圖3 三道題目難度曲線
由圖3可見,在選拔重點(diǎn)高中的節(jié)點(diǎn)難度系數(shù)0.3左右的這三道難題,整體上均對(duì)高分考生具有較好的區(qū)分,其中第29題和第32題兩題性能較好。第29題對(duì)考生具有較強(qiáng)的區(qū)分功能表現(xiàn)在高分段(70分~88分),對(duì)70分以下的考生無區(qū)分;第32題對(duì)考生的區(qū)分主要體現(xiàn)在中高分?jǐn)?shù)段(50分~90分),對(duì)50分以下的考生弱區(qū)分;第14題是一道多選題,有一定的猜測度,該題只對(duì)80分以上的考生有較好的區(qū)分,在曲線低端和中段的得分率變化不是隨總分增加呈現(xiàn)上升的趨勢。換句話說,得分高的考生在該題上的得分不一定高,該題目區(qū)分不利于公正選拔考生。因此,區(qū)分度指標(biāo)作為整體指標(biāo)說明題目鑒別能力,很可能是有效的,但對(duì)題目局部區(qū)分功能的探討能很好地說明題目對(duì)哪一目標(biāo)群體區(qū)分更有效。
總之,對(duì)于水平考試要更多地關(guān)注難度分布,局部區(qū)分功能設(shè)計(jì)主要是通過題目難度分布的調(diào)控來實(shí)現(xiàn)。對(duì)于兼顧學(xué)業(yè)水平測試和選拔功能的中考來講,首先要依據(jù)課標(biāo)內(nèi)容要求命制合適難度的題目,同時(shí)也要考慮難題和中等難度試題的局部區(qū)分類型,確保達(dá)到公平公正合理選拔考生的測試目的。
[1]安妮·安納斯塔西,蘇珊娜·厄比納.20世紀(jì)心理學(xué)通覽—心理測驗(yàn)[M].江蘇:浙江教育出版社,2008(8):243.
[2]鄒麗華.區(qū)分度在中考試題質(zhì)量分析中的應(yīng)用[J].大連教育學(xué)院學(xué)報(bào),2011(4):27-30.
[3]趙娟.中考試題命制應(yīng)注意的幾個(gè)問題[J].大連教育學(xué)院學(xué)報(bào),2013(1):43-44.
[4]鄒麗華.中考物理試題難度的設(shè)置與控制[J].物理通報(bào),2013(3):107-109.