国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

高考的公平性再分析

2019-06-20 05:59張麗強
內(nèi)蒙古教育·綜合版 2019年5期
關(guān)鍵詞:主觀題等值公平性

張麗強

高考是我國重要的人才選拔考試,也是目前國內(nèi)影響力最大、影響面最廣的考試。它一頭關(guān)乎著國家社稷的發(fā)展和未來,另一頭維系著千家萬戶的期盼和希望。由此,高考的公平就成為社會關(guān)注的焦點,成為社會公平的重要組成部分,成為百姓心目中敏感脆弱、不能觸碰的底線。

近年來,隨著高考制度改革的深入,人們對于高考公平性的關(guān)注度持高不下。事實上,人們更多的是從社會學(xué)的角度來關(guān)注高考的公平性,關(guān)注的是形式上的、外在的、顯性的公平,如考試的內(nèi)容、考生的身份、加分的類型等。其實,考試的公平性是一個復(fù)合型的概念,不僅有形式上的公平,還有實質(zhì)上的公平,不僅有外在的公平,還有內(nèi)在的公平,不僅有顯性的公平,還有隱性的公平。分析的角度也是多元的,不僅可以從社會學(xué)的角度來分析,還可以從教育測量學(xué)的角度來分析,如主觀性試題評分質(zhì)量的控制、項目功能差異(DIF)檢測、分?jǐn)?shù)調(diào)整和等值、分?jǐn)?shù)組合方式的選擇以及作弊的防范和雷同答卷甄別,等等。這樣,考試的公平性分析就會更加立體,更加全面,也有助于加深人們對于高考的認(rèn)識,增強人們對于高考改革的認(rèn)同感,有利于進一步維護高考的公平公正。

一、主觀題的評分質(zhì)量控制

主觀題是相對于客觀題而言的,泛指無固定答案、采用多級計分的題目。主觀題的命題角度比較靈活,可以多維度測查考生能力,能展現(xiàn)考生的作答反應(yīng)過程,因而是很多考試中必不可少的題型。比如簡答題、論述題、作文等都是考試中常用的題型。

然而,主觀題也有其自身的弊端,由于評分員對于評分標(biāo)準(zhǔn)的理解和把握不同,加上疲勞效應(yīng)等因素的影響,評分的信度和效度偏低。但是,高考中很多科目如政治、歷史、地理等都會采用主觀題的題型,語文中的作文其分值在整卷中更是占到了相當(dāng)大的比重。高考,一分之差就可能影響錄取的結(jié)果,所以需要對主觀題的評分高度重視。

目前,高考主觀題的評閱大都采用了網(wǎng)上評閱系統(tǒng)來評分,會采用“2+1”評分模式來控制評分誤差,評分的質(zhì)量得到了有效控制。但是,趨中評分等問題依然凸顯,主觀題評分質(zhì)量的控制還任重道遠(yuǎn)。

隨著計算機技術(shù)的飛速發(fā)展和人工智能的廣泛應(yīng)用,計算機自動評分(Computer-Automated Scoring,CAS)應(yīng)運而生。計算機自動評分相較于人工打分,穩(wěn)定性好,效率高。目前,一些省市已將自動評分系統(tǒng)作為質(zhì)檢系統(tǒng)用于高考之中,檢測空白卷、疑似抄襲、特殊作答,對人工評分進行糾偏等。未來,隨著人工智能實現(xiàn)從感知智能到認(rèn)知智能的飛躍,通過計算機對人類的語義理解、知識表示、邏輯推理和自主學(xué)習(xí)的模擬和學(xué)習(xí),計算機自動評分技術(shù)將會實現(xiàn)質(zhì)的飛躍,評分質(zhì)量會顯著提高,應(yīng)用的范圍也將逐步擴大。人機結(jié)合的評分方法將成為主流,主觀題評分的準(zhǔn)確性和可靠性將會大大提高,考試的公平將會得到技術(shù)上的保障。

二、項目功能差異檢測

評分員會影響到考生的成績,題目質(zhì)量的好壞更是直接關(guān)系著考生答題、考生錄取等環(huán)節(jié),因而高考的題目質(zhì)量需要得到保證。題目質(zhì)量可以用難度、區(qū)分度以及項目功能差異(Differential Item Functioning,簡稱DIF)等指標(biāo)來衡量。在高考這種選拔性的考試中,考試目的是要對考生的能力水平進行區(qū)分。如果題目過難或過易都會失去鑒別的意義,因而要以難度適中的題目為主。此外,還需要檢測題目是否存在DIF。DIF指的是某題目在不同群體間表現(xiàn)出與測驗?zāi)康臒o關(guān)的功能性差異。這個指標(biāo)跟考試的公平性密切相關(guān)。但高考的考生樣本量龐大,在實際操作中進行DIF檢測會很復(fù)雜。盡管如此,還是要對可能存在DIF的題目引起注意。

高考題目雖然經(jīng)過了層層把關(guān),但由于考生人數(shù)多,可能由于無法兼顧不同考生群體的差異,而存在DIF。比如2015年陜西省高考語文的作文題是:一位父親在高速公路上開車打電話,孩子一再提醒不要打電話,可是父親不聽勸阻,最終孩子選擇報警,警察來后對父親進行批評教育。題目要求考生給父親、孩子或者相關(guān)部門寫一封信。有人認(rèn)為這道題對于不了解高速公路及高速上不能打電話等規(guī)定的農(nóng)村學(xué)生不公平。這是由于城鄉(xiāng)差異而引發(fā)的爭議。至于該題目是否存在DIF,則需要進一步研究。事實上,由于作文題材的不同,對不同性別的考生來說可能也是不公平的。假如給考生的作文題目是關(guān)于球賽的,那么這個題目對于男生來說是有利的,因為大多數(shù)男生比女生對于球賽的問題更感興趣。假如給考生的作文題目是關(guān)于美妝的,那么這個題目對于女生來說是有利的,因為大多數(shù)女生比男生更關(guān)注美妝方面的問題。因而題目在性別層面就可能會存在差異,對某一群體造成不公平。

題目存在DIF一般不受題型的影響。作文是多級計分的題目,而判斷題、單選題則屬于二級計分的題目。其實,國內(nèi)對二級計分題目的DIF的研究更多,對于多級計分題目的DIF的研究并不成熟,所以多級計分題目的DIF檢測方法仍有待進一步開發(fā)。運用檢測DIF的方法,關(guān)鍵在于如何判定兩組被試是否具有相同的能力,即確定匹配變量。然后根據(jù)地區(qū)、性別、專業(yè)、民族等方面的不同,將兩組被試分為目標(biāo)組和參照組。目標(biāo)組通常是可能被不公平對待的群體,參照組通常是用作比較的對象。DIF分析實際上就是在比較這兩組被試與測驗?zāi)康臒o關(guān)的差異。比如有一道用英文表述的數(shù)學(xué)題,如果這道題本質(zhì)上是要考查被試的數(shù)學(xué)知識,但由于題目是英文的表達(dá),而導(dǎo)致很多英語不好的被試做不對這道數(shù)學(xué)題目。那么,這道用英文表述的數(shù)學(xué)題就存在DIF。那是不是存在DIF的題目就是一道不好的題目?答案是否定的。這要看施測者要測查被試哪方面的能力。如果只是單純要測被試的數(shù)學(xué)能力,即測驗是單維度的,那么這道題目就是不合適的;如果要同時考查被試的英語水平和數(shù)學(xué)能力,即測驗是多維度的,那么這道題目就沒有問題。對于用DIF檢測方法得出的結(jié)論,屬于統(tǒng)計意義上的判斷。要想判定題目是否存在DIF,還要參考專家的意見。DIF分析為測驗的公平性提供了重要參考依據(jù),它與測驗的效度也有直接關(guān)聯(lián),是證明測驗有效性的重要證據(jù)。試題的DIF檢驗是標(biāo)準(zhǔn)化測驗研發(fā)的重要環(huán)節(jié),可以通過對題目進行DIF檢測以減少測驗的偏差。所以,多角度關(guān)注高考題目的質(zhì)量,會進一步提高考試的公平性。

三、分?jǐn)?shù)的調(diào)整和等值

為了使考試更具科學(xué)性和公平性,往往需要進行分?jǐn)?shù)調(diào)整和等值。等值(equating)指的是將難度、分?jǐn)?shù)分布不同的試卷得分轉(zhuǎn)換到一個統(tǒng)一量表上的過程,是分?jǐn)?shù)連接(linking)的一種方式。相比于連接的其他方式,等值要求更為嚴(yán)格,需測驗間構(gòu)念相同、難度相似、信度相同以及考生目標(biāo)總體基本相同。顯而易見,對于同一科目的測驗而言,有能夠進行等值的可能,但是不同的科目間,只能進行分?jǐn)?shù)的連接。

在一些省份,高考英語采用一年兩考的方式。由于很難確保兩次考試難度一致,因此是需要進行分?jǐn)?shù)調(diào)整的。等值就是對考后的分?jǐn)?shù)進行調(diào)整的一種手段。等值有兩種收集數(shù)據(jù)的方法,一種圍繞“共同題”展開,共同題又叫作錨題;另一種圍繞“共同組”展開。其中,在共同題的等值設(shè)計中,等值在拼卷的時候就已經(jīng)開始了。即在不同試卷中加入共同題,通過共同題進行等值。但是,高考不可能在前后兩次考試中出現(xiàn)相同的題目,這很不現(xiàn)實。對于高考英語,可以采用共同組的等值設(shè)計方法,即認(rèn)為前后兩次測驗的考生能力分布水平大致相同,從而實現(xiàn)等值的目的。

從現(xiàn)實情況來看,高考很難滿足不同科目之間進行等值的條件。但是,可以對高考進行分?jǐn)?shù)連接。根據(jù)高考改革方案,河北、遼寧等八省市將從2018年秋季入學(xué)的高中一年級學(xué)生開始實施“3+1+2”的模式?!?”是指全國統(tǒng)考科目語文、數(shù)學(xué)和外語;“1”是指首選科目,考生要在物理、歷史中選擇1門;“2”是指再選科目,考生可在化學(xué)、生物、思想政治和地理4個科目中選擇兩科。因為所有的考生都會參加語文、數(shù)學(xué)和外語考試,因而可以把這三科的考試當(dāng)作錨測驗,以此來進行高考分?jǐn)?shù)的連接。當(dāng)然,由于語文、數(shù)學(xué)和英語的構(gòu)念、難度等條件與其他考試科目不同,以這三科的成績來作為錨測驗的效果不一定很理想。因此,還要探求更為科學(xué)合理的分?jǐn)?shù)調(diào)整方式,以維護高考公平。

四、分?jǐn)?shù)的組合

在評分員完成評分之后,如果分?jǐn)?shù)結(jié)果沒有問題,還要對測驗分?jǐn)?shù)進行組合。分?jǐn)?shù)組合的方式會直接影響到考生最后的總成績,進而影響到錄取公平。

分?jǐn)?shù)組合的方式有很多種。比如臨床判斷、原始分直接相加、多重分段和多重回歸等方法。在高考中,分?jǐn)?shù)組合采用的是原始分直接相加的方法。

原始分相加從理論上來說需要滿足三個基本假設(shè):(1)這兩個測驗測量的是同一種心理特質(zhì)。這指的是所測量事物的屬性是一樣的,就像測量長度的單位不能與測量重量的單位等同,不能把兩公斤和兩米進行相加。在考試中,就如同不能直接把語文成績和數(shù)學(xué)成績相加一樣。很明顯,語文考試跟數(shù)學(xué)考試要測試的構(gòu)念不同,或者說不是同一種心理特質(zhì),因而將二者進行簡單相加是不合適的。(2)相加的兩個量應(yīng)該有相等的單位。如果所測量的事物屬性相同,單位也應(yīng)該相同。比如不能直接用一米跟一厘米進行相加。在考試中,將不同分測驗的分?jǐn)?shù)相加也是不科學(xué)的。因為一道兩分的判斷題與一道三分的選擇題同樣都是組成試卷的一部分,會因這兩部分答對數(shù)目的不同而導(dǎo)致總分不同。(3)對于取自同一樣本的兩個變量,應(yīng)有相同的變異才能相加。否則,兩個量相加時,變異程度大的變量對結(jié)果的影響大。比如對于文科生而言,數(shù)學(xué)成績好的學(xué)生可能會有優(yōu)勢,因為數(shù)學(xué)不好的同學(xué)跟數(shù)學(xué)好的同學(xué)的數(shù)學(xué)成績差距大。但是,語文的分?jǐn)?shù)相對比較集中,不會有數(shù)學(xué)那么大的分?jǐn)?shù)差距。對于以上三個假設(shè),現(xiàn)行的原始分?jǐn)?shù)直接組合的做法并不滿足。因此,從分?jǐn)?shù)組合上就可以看出最終考生的分?jǐn)?shù)是有誤差的。

除了原始分直接相加,高考還采用過用標(biāo)準(zhǔn)分相加的方式。但用標(biāo)準(zhǔn)分相加,不包含各個分測驗有相同變異的假設(shè),也就是說各個考試科目會被平等對待。但是用標(biāo)準(zhǔn)分相加的方式未能避免前兩個假設(shè),仍然具有不合理的地方。加之計算過程比較復(fù)雜,大眾理解起來較困難,因而沒有實行開來。高考一直在探索更加科學(xué)的分?jǐn)?shù)組合方式,以確保考試公平。

五、試后雷同答卷的甄別

高考作為我國最重要的選拔性考試之一,難免會有一些人因為利益驅(qū)動而進行作弊。隨著科技的發(fā)展,作弊技術(shù)也在不斷升級,有時很難被發(fā)現(xiàn)。除了有個人作弊的行為,還有作弊團伙聯(lián)合作弊的現(xiàn)象。通過互聯(lián)網(wǎng),甚至可以把作弊范圍擴展至全國。這嚴(yán)重違背了考試公平、公正的原則,損害了其他考生的利益。

高考對作弊行為是零容忍的態(tài)度,在打擊作弊行為方面已經(jīng)做了很大的努力。比如,《中華人民共和國刑法修正案(九)》明確了對于作弊行為的懲戒辦法,這對作弊群體具有強有力的震懾作用。為防止考生作弊,在高考前會做很多工作。如考前簽署誠信保證書,考試時使用屏蔽儀器、監(jiān)控器等設(shè)備。除了考前防患于未然,考后進行雷同答卷的甄別,更能確??荚嚢踩3R姷睦淄瑱z測方法有錯同率方法、g2方法、Kappa方法,以及K指數(shù)方法等。在我國,錯同率方法因運算速度快而成為被較多使用的一種方法。在實際操作中,應(yīng)該使用多種雷同檢測方法,以提高檢測結(jié)果的精準(zhǔn)性??蓪τ诟呖级?,公平和效率是需要同時兼顧的。從當(dāng)前條件來看,高考的規(guī)模大、考生數(shù)量多,運用雷同答卷弊甄別技術(shù)需要很大的成本。這樣做雖可以維護考試公平,但卻犧牲了效率。不過,高考在雷同檢測方面可以試著逐步推進。

高考公平與否,關(guān)系到考生能否平等地享有高等教育的入學(xué)機會,甚至關(guān)乎考生的個人命運。此外,還關(guān)涉一系列社會公平問題。所以高考的公平性受到了高度重視。在維護高考公平性方面,已經(jīng)做了大量的工作,但仍然需要繼續(xù)從教育測量學(xué)的角度來探尋制約考試公平的因素。當(dāng)然,還要不斷進行改革和完善,維護高考公平。

猜你喜歡
主觀題等值公平性
淺談“立體幾何主觀題”的復(fù)習(xí)備考
淺談高中政治“認(rèn)識類”主觀題答題技巧
極坐標(biāo)方程主觀題考點分析
異步電動機等值負(fù)載研究
一種提高TCP與UDP數(shù)據(jù)流公平性的擁塞控制機制
電網(wǎng)單點等值下等效諧波參數(shù)計算
關(guān)于公平性的思考
基于戴維南等值模型的靜穩(wěn)極限在線監(jiān)視
漢語國俗語義在維吾爾語中的等值再現(xiàn)
華東理工大學(xué)學(xué)報(自然科學(xué)版)(2014年1期)2014-02-27
呼伦贝尔市| 乌拉特前旗| 株洲市| 乐平市| 栖霞市| 无为县| 横山县| 上饶县| 镇雄县| 宝应县| 九寨沟县| 瑞安市| 连城县| 凤庆县| 宁蒗| 五原县| 海门市| 鹰潭市| 周至县| 尤溪县| 鱼台县| 屯昌县| 察雅县| 柳江县| 晴隆县| 监利县| 湖北省| 五原县| 丹巴县| 扶沟县| 奉贤区| 高陵县| 文成县| 巴塘县| 蛟河市| 宝鸡市| 宜昌市| 云南省| 天水市| 塔城市| 巩留县|