趙 娟
(大連教育學(xué)院 學(xué)習(xí)質(zhì)量監(jiān)測中心,遼寧 大連 116021)
中考是大規(guī)模的標(biāo)準(zhǔn)化考試,中考試題的質(zhì)量直接影響中考錄取的公平性,甚至影響到社會的安定。要保證中考試題的質(zhì)量,審題是不可缺少的環(huán)節(jié)。雖然不同省市的中考命審題管理各有不同,但審題過程中的關(guān)注點(diǎn)是共同的。
效度是指測量工具能夠準(zhǔn)確測出所需測量事物的程度。也就是說,效度與是否測出所要測量的特性有關(guān)。效度是測驗評價最核心的指標(biāo),體現(xiàn)在試題和試卷兩個方面。
1.試題效度
試題效度的審查除了要關(guān)注試題語言敘述的科學(xué)性、準(zhǔn)確性,圖文的對應(yīng)性,還要關(guān)注以下幾個方面。
(1)考查要點(diǎn)與課程標(biāo)準(zhǔn)要求的對應(yīng)性
課程標(biāo)準(zhǔn)明確規(guī)定了學(xué)科的內(nèi)容標(biāo)準(zhǔn),中考試題應(yīng)嚴(yán)格按照課標(biāo)的內(nèi)容標(biāo)準(zhǔn)。中考試題脫離課程標(biāo)準(zhǔn)常常表現(xiàn)在幾個方面:一是考查課程標(biāo)準(zhǔn)規(guī)定的選學(xué)內(nèi)容[1],二是把高中知識當(dāng)作考查能力的載體[2],三是用高中的方法解答問題更便利。
(2)問題情境與考查要點(diǎn)的對應(yīng)性
根據(jù)Osterlinter,試題的定義為:在教育和心理特質(zhì)測試中,試題是一個測量單元,它具有刺激情境和對應(yīng)答形式的規(guī)定,它的目的是要獲得被試的應(yīng)答,并根據(jù)應(yīng)答對考生的某些心理特質(zhì)方面的表現(xiàn)(如知識、能力等)進(jìn)行推測。[3]
設(shè)計刺激情境,目的是引起學(xué)生的某種應(yīng)答活動,推測其內(nèi)在的心理狀況。審查命題者設(shè)計的問題情境和對應(yīng)答方式的規(guī)定能否引起預(yù)期的學(xué)生的心理反應(yīng),借助這一反應(yīng)能否推斷學(xué)生學(xué)科能力的高低。如果學(xué)生的反應(yīng)有非預(yù)期的,且非預(yù)期的反應(yīng)不能用以推斷學(xué)生的學(xué)科能力,則說明試題的效度欠佳。
(3)問題呈現(xiàn)的方式與學(xué)生心理發(fā)展水平的對應(yīng)性
命題者所設(shè)計的問題情境是否能引起學(xué)生預(yù)期的心理反應(yīng),在一定程度上與學(xué)生對問題情境的理解有關(guān),而這種理解又與學(xué)生的心理發(fā)展水平有關(guān)。所以,審題者要審查試題的呈現(xiàn)方式是否符合初三學(xué)生的心理發(fā)展水平,保證絕大多數(shù)學(xué)生都明確問題的指向,能夠鎖定搜尋知識的范圍。如果學(xué)生因為不明白問題本身的含義和指向而無法得出正確的答案,那么命題借助反應(yīng)方式推斷學(xué)生能力水平就是不準(zhǔn)確的,試題本身的效度就無法體現(xiàn)。
(4)參考答案及賦分與學(xué)生能力水平的對應(yīng)性
同一試題,不同的學(xué)生解答的方式不同,解答的水平也不同。審題者要審查試題參考答案及賦分是否與學(xué)生的能力水平相對應(yīng)。具體包括:不同的解答方式是否反映不同的思維水平,思維含量大的步驟是否賦予更多的分?jǐn)?shù),體現(xiàn)思維水平的關(guān)鍵步驟是否賦予足夠的分?jǐn)?shù)。
2.試卷效度
試卷效度包括內(nèi)容效度和結(jié)構(gòu)效度。
內(nèi)容效度是指測驗內(nèi)容對所要測量的內(nèi)容的代表性程度。審查試卷的內(nèi)容效度可以從以下幾個方面入手。
覆蓋度。中考作為一種標(biāo)準(zhǔn)化測驗,各學(xué)科抽取的考查樣本具有一定要求,一級主題和二級主題要有100%的覆蓋度,三級主題覆蓋度的要求各科各有不同。因此,覆蓋度是重要的內(nèi)容效度指標(biāo)。審查覆蓋度時,還要審查是否有超過課程標(biāo)準(zhǔn)要求的試題。
核心知識、核心能力和核心思想方法的考查力度。在各個學(xué)科的知識體系中,不同的知識和能力要求對于學(xué)生發(fā)展的作用各不相同,所以每個學(xué)科都會有其特有的核心知識、核心能力要素和核心思想方法。審題要關(guān)注試卷中學(xué)科核心要素是否得到充分的考查。
試卷的結(jié)構(gòu)效度表現(xiàn)為中考試卷內(nèi)容、能力和題型結(jié)構(gòu)的合理性。審查試卷結(jié)構(gòu)效度可以從以下幾個方面入手。
審查雙向細(xì)目表,評價所考查各項內(nèi)容的比例合理性、所考查能力要求比例的合理性。評價的依據(jù)包括各部分內(nèi)容所占的學(xué)時數(shù),各項內(nèi)容和能力要求在學(xué)科體系中的重要性,往年命題的經(jīng)驗和專家的建議。
審查試題與雙向細(xì)目表的對應(yīng)性。要把全卷試題進(jìn)行分類匯總,確定內(nèi)容比例和能力要求比例是否與雙向細(xì)目表一致。
各種題型是否能夠考查同一學(xué)科能力的不同側(cè)面,又相互關(guān)聯(lián)。如果各題型考查學(xué)科能力的同一側(cè)面,那么,就無從發(fā)揮不同題型的特有的考查功能,同時也是一種浪費(fèi)。如果各類題型考查了學(xué)科能力的不同方面,但相關(guān)甚低,有可能是某一題型考查的能力側(cè)面偏離了本學(xué)科能力。
中考具有明顯的導(dǎo)向性,一次中考在一定程度上決定至少一年的教學(xué)導(dǎo)向。所以,審題者要審查每一試題對教學(xué)的引導(dǎo)作用。
1.試題的內(nèi)容范圍是否緊緊圍繞課程標(biāo)準(zhǔn),是否引導(dǎo)教師依據(jù)課程標(biāo)準(zhǔn)進(jìn)行教學(xué)。
2.試題的能力要求是否與課程標(biāo)準(zhǔn)規(guī)定的學(xué)習(xí)要求相對應(yīng),避免教師加重學(xué)生的課業(yè)負(fù)擔(dān)。
3.考查能力的載體是否與教材密切相關(guān),引導(dǎo)教師回歸教材,避免題海戰(zhàn)術(shù)。
4.問題情境的設(shè)計和應(yīng)答要求是否引導(dǎo)教師和學(xué)生關(guān)注學(xué)習(xí)過程,而不僅僅是學(xué)習(xí)結(jié)果。
5.問題情境的設(shè)計是否貼近學(xué)生的社會生活和實踐,引導(dǎo)學(xué)生關(guān)注社會生活中的問題,提高學(xué)生解決真實問題的能力。
6.試題的選材是否滲透情感、態(tài)度、價值觀的教育,引導(dǎo)教師在教學(xué)中關(guān)注多維教學(xué)目標(biāo)。
信度指測驗的穩(wěn)定性,中考審題主要審查內(nèi)部一致性信度和復(fù)本信度。
內(nèi)部一致性信度是指測驗內(nèi)部所有題目間的一致性程度。題目間的一致性含有兩層意思:一是指所有題目測的是同一種心理特質(zhì);二是指所有題目得分之間都有較高的正相關(guān)。也就是說,內(nèi)部一致性信度就是一個測驗所測內(nèi)容或特質(zhì)的相同程度。
內(nèi)部一致性信度的審查要點(diǎn)包括:各試題的考查內(nèi)容是否均從屬于本學(xué)科的知識體系,且是課程標(biāo)準(zhǔn)所規(guī)定;借助不同材料載體所考查的能力要點(diǎn)是否從屬于本學(xué)科的能力要求,而且這些能力要點(diǎn)是相對穩(wěn)定的;不同題型所考查的能力要點(diǎn)是否可以相互補(bǔ)充和印證學(xué)生學(xué)科能力狀況。
復(fù)本信度指的是兩個平行測驗(或等值試卷)測量同一批被試所得結(jié)果的一致性程度。
中考命題中的等值與心理測驗上的等值相比有其特殊性。通常情況下,啟用副卷時正卷已經(jīng)曝光,所以副卷與正卷的試題結(jié)構(gòu)雖然相同,但并不是一一對應(yīng)。審查要點(diǎn)包括:兩卷的內(nèi)容取樣是否是同一知識范圍內(nèi)的不同抽樣,且達(dá)到同樣的覆蓋度;兩卷中所考查的能力要點(diǎn)是否借用了不同的知識載體,但考查功能基本一致;兩卷中的同一知識和能力考查點(diǎn)是否采用不同的試題呈現(xiàn)方式,且考查功能基本一致。
同時副卷的絕對難度要高于正卷,這樣測試后的相對難度才能對等。審題要關(guān)注兩點(diǎn):一是正卷的某一試題對解答副卷的某道試題有多大的遷移度,借助提高副卷中試題的難易程度能否使同一學(xué)生在相繼的兩次考試中得到基本一致的分?jǐn)?shù)。二是正卷的某一試題對解答副卷的某道試題有多大的遷移度,借助改變知識載體和試題的呈現(xiàn)形式,能否使同一學(xué)生在相繼的兩次考試中得到基本一致的分?jǐn)?shù)。
試題的公平性是指試題的內(nèi)容和呈現(xiàn)方式能夠避免無關(guān)因素的干擾,能夠考查出學(xué)生的實際學(xué)科能力水平。審查試題的公平性除了關(guān)注測驗中的重點(diǎn)題目是否與其他省市、地區(qū)或本地區(qū)曾使用過的題目重復(fù),還要關(guān)注以下幾個方面。
1.試題背景的公平性
中考命題常常借助一定的背景材料考查學(xué)生的學(xué)科能力,但這些背景很難保證所有學(xué)生都見過。所以,只要通過言語描述或圖表能夠讓學(xué)生在頭腦中進(jìn)行清晰表征的試題背景就可認(rèn)定為具有公平性。如利用“盲道”的背景考查與摩擦力相關(guān)的知識,農(nóng)村的多數(shù)學(xué)生沒有見過盲道,如果題目借助圖像來呈現(xiàn)問題,試題背景就具有公平性。
2.生活環(huán)境的公平性
不同學(xué)生的家庭環(huán)境、學(xué)校環(huán)境和地域環(huán)境各不相同,如果試題內(nèi)容的設(shè)計不關(guān)注學(xué)生的生活環(huán)境,就會不公平。如中考作文題目“美麗的大?!?,對于生活在山區(qū)和平原的學(xué)生來說就是不公平的。
3.認(rèn)知風(fēng)格的公平性
不同認(rèn)知風(fēng)格的學(xué)生擅長解答不同種類的試題。如獨(dú)立型的學(xué)生更擅長解答抽象性試題,而場依存型的學(xué)生更擅長解答形象性試題。審題者一要審查整張試卷中不同種類試題的比例是否合理,二要審查是不是每道試題都能夠讓不同認(rèn)知風(fēng)格的學(xué)生找到解決問題的途徑。
4.性別和民族的公平性
不同性別學(xué)生對不同題材的試題的興趣和解答的水平是不同的,例如,在英語閱讀理解的選文中,體育比賽的題材更容易被男生理解。所以,為了保證試題的公平性,審題者還要審查試題題材的傾向性。民族的公平性類似于性別的公平性,不再贅述。
試題的難度和難度結(jié)構(gòu)設(shè)計服務(wù)于考試目的。多數(shù)城市的中考是兩考合一,同時承擔(dān)水平考查和選拔的功能,低、中、高檔試題分值的比例7∶2∶1,這也是中考常用的難度結(jié)構(gòu)比例。不同難度試題的區(qū)分度有所不同,一般情況下,0.5難度系數(shù)的試題區(qū)分度最大。但中考不是只把學(xué)生分為兩類,而是要區(qū)分各個層面的學(xué)生,為不同類學(xué)校輸送不同能力水平的學(xué)生。因此,審題者的審題要點(diǎn)包括兩個方面。
1.7∶2∶1的設(shè)定范圍是否符合錄取要求。例如,某一年大連市中考示范性高中的錄取率為30%,一般公辦高中的錄取率為55%,0.30和0.55就成為難度系數(shù)的節(jié)點(diǎn)。那么,“1”部分的試題難度系數(shù)可以控制在(0.20,0.40],在這個范圍內(nèi),0.3難度系數(shù)的試題占的比例最大?!?”部分試題的難度系數(shù)可以控制在(0.40,0.70],在這個范圍內(nèi),0.5難度系數(shù)試題的比例最大。“7”部分試題的難度系數(shù)可以控制在(0.70,1.00]之間。
2.“7”部分試題的呈現(xiàn)方式和應(yīng)答要求是否能保證絕大多數(shù)學(xué)生能夠得分,進(jìn)而保證中考的水平測試功能的達(dá)成。
總之,對試題和試卷的審查的縝密程度影響中考質(zhì)量,進(jìn)而影響中考功能的發(fā)揮。因此,中考審題應(yīng)科學(xué)、規(guī)范、重點(diǎn)突出。
[1]物理試卷評價組.2011年中考物理試題“紅黑榜”[J].基礎(chǔ)教育課程.2012(3):24-28.
[2]數(shù)學(xué)試題評閱組.2011年中考數(shù)學(xué)試題“紅黑榜”[J].基礎(chǔ)教育課程.2012(3):19-23.
[3]雷新勇,周群.試題命制的理論和技術(shù)(一)[J].考試研究,2008(1):84-97.