基于熵權(quán)TOPSIS法的高考數(shù)學(xué)試卷評(píng)價(jià)模型的建立及應(yīng)用*

2022-05-07 03:42:18云南省昆明市云南師范大學(xué)650500楊聰聰閆芳

中學(xué)數(shù)學(xué)研究(廣東) 2022年7期

云南省昆明市云南師范大學(xué)(650500) 楊聰聰閆芳

1 問題提出

2020年1月,教育部考試中心發(fā)布了《中國(guó)高考評(píng)價(jià)體系》、《中國(guó)高考評(píng)價(jià)體系說明》,指出中國(guó)高考評(píng)價(jià)包括高考的核心功能、考查內(nèi)容和考查要求.《中國(guó)高考評(píng)價(jià)體系》是高考命題、評(píng)價(jià)與改革的理論基礎(chǔ)和實(shí)踐指南[1].高考數(shù)學(xué)必須依托于高考評(píng)價(jià)體系,凸顯具有數(shù)學(xué)特色的考試與選拔要求.可是什么樣的試題才是符合這個(gè)要求的呢? 怎樣客觀、科學(xué)、合理、全面地分析和評(píng)價(jià)高考數(shù)學(xué)試題? 這是目前廣泛關(guān)注的問題.以往對(duì)于高考數(shù)學(xué)試題的分析多從難度出發(fā)去衡量一份試題的難度系數(shù)[2-3].或者是從高中數(shù)學(xué)核心素養(yǎng)的角度評(píng)價(jià)高考數(shù)學(xué)試題[4-5],其評(píng)價(jià)都具有一定的片面性.但是高考評(píng)價(jià)體系進(jìn)一步將核心素養(yǎng)深化,它是一體兩面的綜合體系,以“四層”為考查內(nèi)容,評(píng)價(jià)考生素質(zhì)內(nèi)涵;以“四翼”為考查要求,評(píng)價(jià)學(xué)生素質(zhì)達(dá)成度[1].綜上可得,以高考評(píng)價(jià)體系作為高考數(shù)學(xué)試卷評(píng)價(jià)的理論依據(jù)更為全面、科學(xué).基于以上的思考,本文以高考評(píng)價(jià)體系為研究前提和依據(jù),結(jié)合數(shù)學(xué)學(xué)科特點(diǎn),架構(gòu)分析框架,制定評(píng)價(jià)指標(biāo),并以此為分析工具,采用定量研究的方法分析2021年高考數(shù)學(xué)共9 套(上海卷除外)試題,并在此基礎(chǔ)上采用熵權(quán)法求得各個(gè)評(píng)價(jià)指標(biāo)的權(quán)重,構(gòu)建高考數(shù)學(xué)試題評(píng)價(jià)模型,最后利用TOPSIS 法對(duì)以上9 套試卷進(jìn)行綜合評(píng)價(jià)排序.

2 研究設(shè)計(jì)

2.1 構(gòu)建高考數(shù)學(xué)試卷評(píng)價(jià)框架

本文參考了《中國(guó)高考評(píng)價(jià)體系》[1]和任子朝、趙軒學(xué)者的相關(guān)研究[6],結(jié)合數(shù)學(xué)學(xué)科特點(diǎn),繪制了高考數(shù)學(xué)評(píng)價(jià)體系關(guān)系圖,如圖1 所示:

圖1

2.1.1 “四層”指標(biāo)的具體分析

由圖1 知,高考數(shù)學(xué)科的功能定位為: 發(fā)揮數(shù)學(xué)學(xué)科特點(diǎn)、以測(cè)試數(shù)學(xué)綜合能力、發(fā)展數(shù)學(xué)核心素養(yǎng)為目標(biāo)[6],其核心功能的實(shí)現(xiàn)依賴于“四層”、“四翼”、“情境”的考查.另外從具體分類來看,“四翼”和“情境”是同一指標(biāo)的不同層次,具有明顯的層次性,對(duì)學(xué)生的能力要求呈遞增的趨勢(shì),而四層的分類是基于不同的四個(gè)指標(biāo),為了更好地體現(xiàn)“四層”的指標(biāo)層次性以及實(shí)現(xiàn)后續(xù)的定量研究,本文參考普通高中數(shù)學(xué)課程標(biāo)準(zhǔn)(2017年版2020年修訂)[7]和段志貴與黃云鶴學(xué)者基于高考評(píng)價(jià)體系的試卷分析[8],將“四層”指標(biāo)進(jìn)一步細(xì)化,如圖2 所示:

圖2

由圖2 可知“四層”中的前三層指標(biāo)之間具有一定的相關(guān)性,但是必備知識(shí)分為四個(gè)主題,且各個(gè)主題間相互獨(dú)立,所以本文首先對(duì)這部分展開探究.在此統(tǒng)計(jì)了2021年(除上海卷外)9 套高考數(shù)學(xué)試卷在必備知識(shí)的考查分值比例,如表1所示:

表1 各試卷必備知識(shí)的分值考查比例表

由表1可知各試卷在各主題下的分值占比非常接近,為了更精確地檢驗(yàn)這些占比之間的一致性,在此進(jìn)行了Kendall W 協(xié)調(diào)系數(shù)分析,結(jié)果如表2:

表2 Kendall W 協(xié)調(diào)系數(shù)分析表

從表2可以看出: Kendall 協(xié)調(diào)系數(shù)檢驗(yàn)呈現(xiàn)出顯著性(p= 0.000＜0.05),意味著9 份試卷在四個(gè)主題的分值占比具有關(guān)聯(lián)性, 即說明評(píng)價(jià)具有一致性.同時(shí)Kendall 協(xié)調(diào)系數(shù)為0.990,大于0.8,說明評(píng)價(jià)一致性程度很強(qiáng),差異性較小.因此在本研究中沒有將“必備知識(shí)”納入對(duì)比評(píng)價(jià)指標(biāo).

2.1.2 高考數(shù)學(xué)試卷評(píng)價(jià)框架

在去除“必備知識(shí)”指標(biāo)后, 本文以“四層”中的核心價(jià)值、學(xué)科素養(yǎng)、關(guān)鍵能力以及考查要求、考查載體,共同構(gòu)成高考數(shù)學(xué)試題評(píng)價(jià)模型,具體含義及權(quán)重如表3[7].

由表3可知: 在該評(píng)價(jià)框架中,一級(jí)指標(biāo)有5 個(gè),分別是核心價(jià)值、學(xué)科素養(yǎng)、關(guān)鍵能力、考查要求、考查載體.

表3 評(píng)價(jià)指標(biāo)含義-賦值表

二級(jí)指標(biāo)細(xì)分為20 個(gè),由于前13 個(gè)指標(biāo)相互獨(dú)立,不具有明顯的層次性,所以權(quán)重都賦值為1,而后7 個(gè)指標(biāo)對(duì)學(xué)生能力要求具有明顯的層次性,根據(jù)要求能力的強(qiáng)弱,賦予了不同的權(quán)重.

2.2 高考數(shù)學(xué)試題評(píng)價(jià)指標(biāo)的編碼方法

為了使本研究更具有代表性,在此選取了2021年高考數(shù)學(xué)試卷(上海卷除外)共9 套試題為研究對(duì)象,對(duì)試卷中的每一個(gè)題目根據(jù)以上指標(biāo)進(jìn)行賦值,其中前三個(gè)一級(jí)指標(biāo)在同一個(gè)題目中可能會(huì)考查多個(gè)二級(jí)指標(biāo),所以該題目符合幾個(gè)二級(jí)指標(biāo),就給對(duì)應(yīng)的一級(jí)指標(biāo)賦數(shù)值為幾的權(quán)重.

具體賦值方法如下,以2021年全國(guó)乙卷(理數(shù))第9 題為例:

例魏晉時(shí)期劉徽撰寫的《海島算經(jīng)》是關(guān)于測(cè)量的數(shù)學(xué)著作,其中第一題是測(cè)量海島的高.如圖3, 點(diǎn)E,H,G在水平線AC上,DE和FG是兩個(gè)垂直于水平面且等高的測(cè)量標(biāo)桿的高度,稱為“表高”,EG稱為“表距”,GC和EH稱為“表目距”,GC與EH的差稱為“表目距的差”,則海島的高AB=( )

圖3

該題以魏晉時(shí)期我國(guó)數(shù)學(xué)家劉徽在其著作《海島算經(jīng)》中的測(cè)量方法為背景,要求考生根據(jù)測(cè)量過程中的相關(guān)條件,推斷海島高度的計(jì)算方法.試題在考查考生綜合運(yùn)用知識(shí)解決問題能力的同時(shí),也讓考生充分感悟到我國(guó)古代數(shù)學(xué)家的聰明才智.其中科學(xué)價(jià)值、教育價(jià)值、社會(huì)價(jià)值、文化價(jià)值都有體現(xiàn),所以核心價(jià)值賦值為4;學(xué)生在求解時(shí)需要理清各數(shù)量間的關(guān)系,利用三角函數(shù)構(gòu)建模型,理性思維、數(shù)學(xué)應(yīng)用、數(shù)學(xué)探索、數(shù)學(xué)文化都有所體現(xiàn),所以學(xué)科素養(yǎng)賦值為4;此外題目的設(shè)問較為新穎, 求解過程學(xué)生需要正確做出圖形,自己構(gòu)建求解模型,考察到了學(xué)生的創(chuàng)新能力,5 個(gè)關(guān)鍵能力都有所考查,因此關(guān)鍵能力賦值為5;考查要求是創(chuàng)新性,賦值為4;考查載體是探索創(chuàng)新情境,賦值為3.利用上述方法,對(duì)9 套試卷中的每一個(gè)題目進(jìn)行賦值.

2.3 高考數(shù)學(xué)試題一級(jí)評(píng)價(jià)指標(biāo)的信度檢驗(yàn)

利用2.2 的賦值方法,得到9 套試卷的每個(gè)題目在5 個(gè)指標(biāo)下的賦值,最后將這些指標(biāo)賦值進(jìn)行合計(jì),得到9 套試卷在5 個(gè)指標(biāo)下的總賦值得分,如表4所示:

表4 9 套試卷的總賦值得分

由于各套試卷題目數(shù)量不盡相同,為了消除題目數(shù)量的影響,在此給每個(gè)總賦值得分除以相應(yīng)的試卷題目數(shù)量,9 套試卷的題目數(shù)量分別是: 26、26、25、25、29、29、31、31、32(全國(guó)卷沒有把選做題列入),進(jìn)而得到表5,即9 套試卷的平均賦值得分:

表5 9套試卷的平均賦值得分表

為了檢驗(yàn)以上評(píng)價(jià)指標(biāo)的合理性,本文進(jìn)行了信度檢驗(yàn).本研究主要測(cè)量指標(biāo)體系的內(nèi)在信度.利用SPSS 軟件對(duì)9套試卷的5 個(gè)一級(jí)指標(biāo)的平均賦值得分進(jìn)行信度分析,特別地,采用克朗巴赫(Cronbach)創(chuàng)造的α系數(shù)檢驗(yàn)信度.α系數(shù)值介于0 與1 之間,α值越高,表明分項(xiàng)之間的一致性越強(qiáng),內(nèi)部一致性可信度越高,所得結(jié)果如表6:

表6 α 系數(shù)信度檢驗(yàn)表

從表6可以看到α系數(shù)為0.82,說明各分項(xiàng)評(píng)價(jià)指標(biāo)的內(nèi)部一致性較好,指標(biāo)體系的信度是令人滿意的.

2.4 各試卷一級(jí)評(píng)價(jià)指標(biāo)的比較

為了更直觀地體現(xiàn)9 套試卷在5 個(gè)指標(biāo)下的差異,在此繪制了相應(yīng)的平均賦值得分柱狀圖,如圖4 所示:

圖4

從圖4 可知核心價(jià)值指標(biāo)中,平均得分最高的是全國(guó)甲卷(理數(shù)),其次是北京卷,最低的是浙江卷;學(xué)科素養(yǎng)指標(biāo)中,平均得分最高的還是全國(guó)甲卷(理數(shù)),與新高考二卷基本持平,其次是北京卷,最低的是全國(guó)乙卷(文數(shù));關(guān)鍵能力指標(biāo)中,平均得分最高的是全國(guó)乙卷(理數(shù)),其次是新高考一卷,最低的是天津卷和浙江卷;考查載體指標(biāo)中,平均得分最高的是新高考一卷,其次是全國(guó)乙卷(理數(shù))和浙江卷基本持平,最低的是全國(guó)甲卷(文數(shù)).

另外從圖中也能夠直觀看出關(guān)鍵能力、考查要求的得分比其他三個(gè)指標(biāo)整體較高,這也能夠反映出9 套試卷對(duì)這兩個(gè)指標(biāo)的考查比較綜合,且要求較高,同一個(gè)題目會(huì)考查多個(gè)二級(jí)指標(biāo).

3 高考數(shù)學(xué)試卷綜合評(píng)價(jià)模型構(gòu)建與應(yīng)用

3.1 熵權(quán)TOPSIS 法的簡(jiǎn)介及計(jì)算步驟

熵權(quán)法是一種客觀的賦予權(quán)重的方法,它通過各個(gè)指標(biāo)所提供的信息不確定性來確定各指標(biāo)的權(quán)重,進(jìn)而得到各個(gè)指標(biāo)信息熵.熵值越小,無序程度越低,指標(biāo)權(quán)重就越低,依據(jù)該規(guī)律可以確定各個(gè)指標(biāo)的權(quán)重.指標(biāo)的信息熵越小,該指標(biāo)表達(dá)的信息不確定性越小,在綜合評(píng)價(jià)中對(duì)決策的幫助反而更大,對(duì)應(yīng)有較大的權(quán)重[9].

TOPSIS 綜合評(píng)價(jià)法用于解決對(duì)象多屬性決策問題,它的基本思想是選取評(píng)價(jià)對(duì)象在所有指標(biāo)下的最優(yōu)解和最劣解作為正負(fù)理想解(所謂正理想解是指設(shè)想的最好方案,它的各個(gè)屬性值都達(dá)到各指標(biāo)中最好的值,作為肯定的理想目標(biāo).而負(fù)理想解是另一設(shè)想的最壞的方案,作為否定的理想目標(biāo)),檢測(cè)評(píng)價(jià)對(duì)象各指標(biāo)值與正負(fù)理想解間的距離,通過計(jì)算相對(duì)貼合度從而對(duì)現(xiàn)有對(duì)象進(jìn)行排序與評(píng)價(jià).最優(yōu)結(jié)果為與肯定理想目標(biāo)最近,與否定理想目標(biāo)最遠(yuǎn).該方法充分考慮研究對(duì)象某一指標(biāo)值與樣本中最高值及最低值的距離,表現(xiàn)的是一個(gè)相對(duì)的概念[10].

例如有m個(gè)評(píng)價(jià)對(duì)象,n個(gè)評(píng)價(jià)指標(biāo),則具體計(jì)算是:

第一步: 先將原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,在這里將指標(biāo)分為正向和負(fù)向兩種指標(biāo),正向指標(biāo)即效益性指標(biāo),負(fù)向指標(biāo)即成本性指標(biāo).具體可利用公式(1)、(2):

其中vij表示第i個(gè)評(píng)價(jià)對(duì)象的第j個(gè)評(píng)價(jià)指標(biāo)的原始值,xij為第i個(gè)評(píng)價(jià)對(duì)象的第j個(gè)評(píng)價(jià)指標(biāo)的標(biāo)準(zhǔn)化值.

第二步: 計(jì)算指標(biāo)標(biāo)準(zhǔn)化值的比重, 對(duì)標(biāo)準(zhǔn)化矩陣X= (xij)m×n中的各指標(biāo)的標(biāo)準(zhǔn)化數(shù)據(jù)進(jìn)行比重歸一化處理,利用公式(3)

第三步: 計(jì)算各指標(biāo)的熵值ej,利用公式(4)

其中定義當(dāng)pij=0 時(shí),pijlnpij=0.

第四步: 計(jì)算各指標(biāo)熵權(quán)kj,利用公式(5)

第五步: 建立加權(quán)標(biāo)準(zhǔn)化決策矩陣,利用公式(6)

第六步: 確定正、負(fù)理想解,其中正理想解值的公式表示為:R+=(G+1,··· ,G+n), 負(fù)理想解R-=(G-1,··· ,G-n),利用公式(7)、(8):

第七步: 計(jì)算歐氏距離,利用公式(9):

第八步: 計(jì)算相對(duì)貼近度,利用公式(10):

第九步: 待估對(duì)象排序:

根據(jù)第i個(gè)對(duì)象的D的貼近度大小,依次對(duì)各個(gè)對(duì)象進(jìn)行排序[11].

3.2 一級(jí)評(píng)價(jià)指標(biāo)的權(quán)重確定及信效度檢驗(yàn)

在本文的高考數(shù)學(xué)試卷評(píng)價(jià)指標(biāo)中涉及5 個(gè)不同的指標(biāo),通過2.4 的比較可以發(fā)現(xiàn)9 套試卷在各指標(biāo)下的平均評(píng)價(jià)得分排序是不盡相同的,那5 個(gè)一級(jí)指標(biāo)對(duì)總評(píng)價(jià)的影響是否相同呢? 基于以上的思考,本文利用熵權(quán)法對(duì)各指標(biāo)的權(quán)重進(jìn)行了研究.

具體的計(jì)算是將9 套試卷的5 個(gè)指標(biāo)平均評(píng)價(jià)得分利用SPSSAU 在線數(shù)據(jù)分析軟件進(jìn)行熵權(quán)TOPSIS 分析,首先得到5 個(gè)指標(biāo)的權(quán)重,如表7所示,然后進(jìn)行了權(quán)重合理性T值檢驗(yàn),T值的計(jì)算公式為:

表7 高考評(píng)價(jià)各指標(biāo)權(quán)重系數(shù)表

如果其值界于0.5-1 之間,指標(biāo)越接近1,則權(quán)重分布越合理.

根據(jù)表7中的數(shù)據(jù)計(jì)算權(quán)重合理性檢驗(yàn)值,T=表明各指標(biāo)間的權(quán)重分布是非常合理的.

3.3 TOPSIS 綜合評(píng)價(jià)排序

在得到5 個(gè)指標(biāo)的權(quán)重后,利用公式(6),建立加權(quán)標(biāo)準(zhǔn)化決策矩陣,進(jìn)一步利用TOPSIS 法基于理想解得到9 套試卷的綜合評(píng)價(jià)排序,如表8所示:

表8 TOPSIS評(píng)價(jià)計(jì)算結(jié)果

為了更直觀地體現(xiàn)9 套試卷評(píng)價(jià)指標(biāo)與理想解的貼近程度,在此繪制了相應(yīng)的柱狀圖,如圖5 所示:

圖5

從圖5 能夠看出: 全國(guó)乙卷(文數(shù))距離正理想解的距離最大,其次是全國(guó)甲卷(文數(shù))與天津卷基本持平,距離最小的是新高考一卷.而新高考一卷距離負(fù)理想解的距離最大,其次是全國(guó)乙卷(理數(shù)),距離最小的是全國(guó)乙卷(文數(shù)).再看相對(duì)貼近度,貼近度最大的是新高考一卷,其次是全國(guó)乙卷(理數(shù)), 最小的是全國(guó)乙卷(文數(shù)), 說明新高考一卷、全國(guó)乙卷(理數(shù))這兩套試卷更接近正理想解,而全國(guó)乙卷(文數(shù))離正理想距離最遠(yuǎn).由此可見,這一結(jié)論在三個(gè)解釋中是一致的.

從前邊得到的5 個(gè)權(quán)重可以發(fā)現(xiàn)關(guān)鍵能力、考查要求、考查載體的權(quán)重相對(duì)較大,這也說明了新高考一卷、全國(guó)乙卷(理數(shù))在這三個(gè)指標(biāo)上較為突出,反之全國(guó)乙卷(文數(shù))在這三個(gè)指標(biāo)考查相對(duì)較弱.

其實(shí)這一結(jié)論在試題中也要直觀的體現(xiàn),例如新高考一卷的第7 題,此題設(shè)問簡(jiǎn)單,函數(shù)模型也是學(xué)生熟悉的常用指數(shù)函數(shù),考點(diǎn)是切線問題.這道題目看似比較常規(guī),但是卻隱含著多個(gè)概念問題,像指數(shù)函數(shù)的圖像、性質(zhì)、切線、導(dǎo)數(shù)、斜率等,解答此題,需要學(xué)生聯(lián)系函數(shù)與導(dǎo)數(shù)部分的多個(gè)知識(shí)內(nèi)容,甚至極限的思想,有可能“小題大做”[12].再例如全國(guó)乙卷(理數(shù))第12 題,要比較數(shù)值大小,需要合理構(gòu)造函數(shù),利用導(dǎo)數(shù)研究單調(diào)性,考查由特殊到一般設(shè)計(jì)構(gòu)造函數(shù)能力,運(yùn)算求解能力,需要考生有較強(qiáng)的理性思維、數(shù)學(xué)探索能力.

5 結(jié)語(yǔ)

5.1 評(píng)價(jià)模型進(jìn)一步優(yōu)化和完善試題評(píng)價(jià)方法

本研究以《中國(guó)高考評(píng)價(jià)體系》為理論基礎(chǔ)和研究起點(diǎn),構(gòu)建適合數(shù)學(xué)學(xué)科的高考評(píng)價(jià)體系,并以此為分析工具,利用熵權(quán)法確定各指標(biāo)的權(quán)重,構(gòu)建了高考數(shù)學(xué)試題評(píng)價(jià)模型,最后利用TOPSIS 法對(duì)試卷評(píng)價(jià)進(jìn)行綜合排序.相比以往的試題評(píng)價(jià)方法,高考數(shù)學(xué)試卷評(píng)價(jià)模型更具有綜合性,它將核心價(jià)值、學(xué)科素養(yǎng)、關(guān)鍵能力、考查要求、考查載體的評(píng)價(jià)融為一體,得到的試卷總評(píng)價(jià)更為全面、科學(xué)、合理.

5.2 評(píng)價(jià)模型對(duì)基礎(chǔ)教育教學(xué)具有指導(dǎo)意義

通過研究這些試卷的命題特點(diǎn),體會(huì)和領(lǐng)悟高考數(shù)學(xué)改革的方向,進(jìn)而正確把握新高考數(shù)學(xué)的命題方向.通過對(duì)比9 套試卷,可以發(fā)現(xiàn)新高考數(shù)學(xué)卷題目背景較為豐富,涉及日常生產(chǎn)生活、文化藝術(shù)、社會(huì)熱點(diǎn)、學(xué)科交叉等多種背景.將知識(shí)、素養(yǎng)、價(jià)值融于背景之中,升華知識(shí)的應(yīng)用,讓學(xué)生進(jìn)一步感受到數(shù)學(xué)在生活中的實(shí)用價(jià)值、藝術(shù)價(jià)值等.這些改變都突出了高考評(píng)價(jià)體系倡導(dǎo)的“價(jià)值引領(lǐng)、素養(yǎng)導(dǎo)向、能力為重、知識(shí)為基”的評(píng)價(jià)理念,這將對(duì)一線教師的教育教學(xué)改革起到積極的引導(dǎo)作用.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡