陳佳莉 拉薩師范高等??茖W(xué)校數(shù)學(xué)和自然科學(xué)系
小巴桑次仁 西藏大學(xué)理學(xué)院
有關(guān)西藏數(shù)學(xué)教育研究方面,很多學(xué)者從雙語教育、教學(xué)教法、信息技術(shù)等角度做了一定的研究[1],但是針對西藏教育環(huán)境下開展的試卷講評課的研究幾乎為零。試卷講評課是教學(xué)整體流程的一個重要環(huán)節(jié),能很好地評價學(xué)生“學(xué)”與教師“教”的效果,高效的試卷分析是提高講評課質(zhì)量的重要保障。當(dāng)前國內(nèi)有關(guān)“試卷分析”和“試卷講評課”的研究強(qiáng)調(diào)了試卷分析的深度和講評課各流程設(shè)計的科學(xué)性[2-3],但是試卷分析與講評課設(shè)計往往被作為兩個獨立的課題研究項目,未將上述兩個概念間的連續(xù)性與整體性作為研究對象;此外也有部分研究人員對講評課的一般性理論[4],如講評模式與講評原則等做了一般性陳述,但缺少一定的實踐性和針對性。
基于以上分析,本文首先通過定量與定性相結(jié)合的分析方法得到試卷質(zhì)量分析報告。試卷用于拉薩市高中生的數(shù)學(xué)考試,提煉試卷數(shù)據(jù)后借助WEKA平臺的K-means 算法獲得了以講評課設(shè)計為導(dǎo)向的試卷分析結(jié)果,從而初步確定了講評材料設(shè)計與學(xué)生分組方案。在此基礎(chǔ)上,結(jié)合訪談、問卷以及試卷反思數(shù)據(jù),綜合分析確定了最終的試卷講評材料和分組方案;將Apriori算法應(yīng)用于講評備選試題的分析可獲得題目間的關(guān)聯(lián)關(guān)系,進(jìn)而通過平移方法可得到相應(yīng)知識點間的關(guān)聯(lián)程度,從而為講評課方案的設(shè)計提供重要依據(jù)。
本文數(shù)據(jù)主要由學(xué)生調(diào)查問卷、教師訪談、學(xué)生試卷反思表以及試卷數(shù)據(jù)四部分構(gòu)成,各部分的分析情況如下。
西藏自治區(qū)拉薩市目前有6所高中,高中在校生13076人(2020年度),樣本數(shù)量依據(jù)如下有限樣本估計公式[5]確定:
其中n為樣本數(shù),N為總體數(shù)量,α為顯著性水平,k為置信度所對應(yīng)的分位數(shù),p為樣本估計的顯著性。當(dāng)α=0.05 時,可得k=1.96,P=0.5,從而樣本需求量為n ≥373。為進(jìn)一步避免抽樣誤差,研究依據(jù)2019-2020 兩年的統(tǒng)考成績對學(xué)校、班級分別進(jìn)行優(yōu)、中、差排序,經(jīng)分層抽樣,確定了調(diào)查對象為3 所學(xué)校的9 個班級。調(diào)查發(fā)放問卷400 份,收回381 份,其中有效問卷374 份,問卷有效回收率為98.16%。
學(xué)生調(diào)查問卷和教師訪談稿由4 個維度組成,包括對講評課的認(rèn)識與態(tài)度、講評課前、講評課中和講評課后的現(xiàn)狀。通過數(shù)據(jù)分析,問卷克隆巴赫系數(shù)為0.715,效度為0.739,屬于可接受范圍之內(nèi)。學(xué)生調(diào)查問卷和教師訪談信息的匯總與對比如表1所示。
表1 調(diào)查問卷與訪談稿結(jié)果匯總對比
表1 反映出拉薩市數(shù)學(xué)試卷講評課存在以下主要問題:1.學(xué)生學(xué)習(xí)主動性弱,很少進(jìn)行糾錯反思,具有畏難情緒;2.教師試卷分析的程度較淺;3.試卷講評課設(shè)計形式單一、內(nèi)容簡單;4.講評方法存在師生“不對等”現(xiàn)狀;5.個性化講評有待加強(qiáng)。
基于調(diào)查問卷和訪談稿中所反映出的問題,本文將通過設(shè)計學(xué)生試卷反思表解決表1 中的1、4、5 問題。
歸因理論認(rèn)為學(xué)生對成敗的正確歸因有助于刺激學(xué)生的學(xué)習(xí)動機(jī)。學(xué)生試卷反思表是學(xué)生從自身的角度出發(fā)對試題進(jìn)行歸類,以此幫助教師了解學(xué)生對講評的需求,增強(qiáng)講評課設(shè)計的針對性。本研究設(shè)計了具有5 個維度的學(xué)生試卷反思表,分別為:對而不會的題、會而不對的題、完全不會的題、過失性失分的題和期待講評的題。
被試班級學(xué)生試卷反思數(shù)據(jù)如圖1 所示,體現(xiàn)了學(xué)生期待講評的試題與完全不會的試題間的對比,從中得知,完全不會題目人數(shù)的最值處(包括最大與最小)獲得學(xué)生期待講評的最低值,比如難度最高得分率最低的21、22 題,學(xué)生期待值較低,說明被試班級學(xué)生具有畏難情緒,該現(xiàn)象與問卷(表1)調(diào)查講評課前學(xué)生行為研究中反映出的“學(xué)生學(xué)習(xí)反思、糾錯的主動性弱,具有畏難情緒”相吻合。依據(jù)各題期待講評的人數(shù)與講評課設(shè)計的課時要求結(jié)合分析,確定學(xué)生最希望講評的8 道試題,并與試卷數(shù)據(jù)分析結(jié)果進(jìn)一步比對后最終確定是否以及如何納入講評材料。
圖1 學(xué)生數(shù)學(xué)試卷反思表可視化
1.被試班級與試卷背景介紹
本研究所選擇的被試班級為拉薩市某中學(xué)高三年級的理科班,共47名學(xué)生。本次測試學(xué)校自主命題,其目的是為了了解學(xué)生在高中三年內(nèi)對數(shù)學(xué)知識的整體掌握情況,因此試卷命題具有難度大、范圍廣的特點。試卷包括22道題,覆蓋高考大綱(理科數(shù)學(xué))中的各模塊,其中平面解析幾何、立體幾何初步和數(shù)列部分占比最重;在“題型結(jié)構(gòu)”模塊,各種題型均有涉及,且各題型分值服從標(biāo)準(zhǔn)試卷設(shè)計分布;在“知識要求”模塊中,“了解;理解;掌握”分值按3:4:3的比例分布。整卷信度為0.62,具有信度;區(qū)分度為0.26,試卷質(zhì)量合格,整體難度值為0.36,說明本次測試相當(dāng)困難。[6]
2.試卷數(shù)據(jù)前處理
由于在網(wǎng)絡(luò)試卷評閱中每個填空題被視為一道題,體現(xiàn)不出各試題的個性特質(zhì),因此略去填空題對應(yīng)的數(shù)據(jù);為了確保試卷的質(zhì)量,本文選取難度值高于0.2的試題進(jìn)行分析,從而確定可應(yīng)用于進(jìn)一步數(shù)據(jù)分析的緯度為48×15的試卷數(shù)據(jù)矩陣C,其中“行”代表樣本(學(xué)生),“列”代表變量(題目)。將數(shù)據(jù)矩陣C導(dǎo)入用于數(shù)據(jù)分析的WEKA平臺,進(jìn)行了二值離散化處理。
K-means算法是一種用于分組的經(jīng)典數(shù)據(jù)分析方法,本文首先將K-means算法應(yīng)用于前處理后的二值離散數(shù)據(jù),依據(jù)學(xué)生完成試題的情況將被試班級學(xué)生進(jìn)行分組,分組信息包括確定每組人數(shù)、每組學(xué)生編號和存在問題的對應(yīng)題目。通過總結(jié)各組的分組特點獲取精準(zhǔn)的講評材料和個性化講評依據(jù),如表2所示。
表2 K-means分組(按人數(shù)降序排列)
基于解決全班大部分學(xué)生存在的問題為主要目的,將前三組存在問題的題目進(jìn)行匯總,并根據(jù)每道題錯誤的人數(shù)對試題進(jìn)行降序排列,按照課時安排(1課時),選擇前8道題作為講評預(yù)設(shè)材料,并與學(xué)生試卷反思表結(jié)果進(jìn)行進(jìn)一步比對。
Apriori 算法是數(shù)據(jù)分析領(lǐng)域解決關(guān)聯(lián)規(guī)則的常用算法,其主要原理為通過求解頻繁項集的方式挖掘研究對象之間的關(guān)聯(lián)規(guī)則。將Apriori 算法應(yīng)用于被試班級測試卷后提取試題間的關(guān)聯(lián)規(guī)則和關(guān)聯(lián)置信度,根據(jù)關(guān)聯(lián)規(guī)則和置信度強(qiáng)弱構(gòu)建試題關(guān)聯(lián)圖,再將試題與測試雙向細(xì)目表對比后,可平移得到相應(yīng)知識點的關(guān)聯(lián)圖以及知識云圖中各知識點之間的關(guān)聯(lián)程度,從而為試題的講評順序、分塊講評、時間安排等方面提供重要的參考依據(jù)。
本文依據(jù)迪克與凱里的教學(xué)系統(tǒng)設(shè)計模型,通過調(diào)定順序、步驟修正、形成循環(huán)三個階段,建立了以講評課性質(zhì)為基礎(chǔ)的講評課設(shè)計流程(如圖2 所示)。通過K-means 算法與學(xué)生數(shù)學(xué)試卷反思表確定講評材料的基礎(chǔ)上分析材料的知識點、知識水平和數(shù)學(xué)能力要求,確定講評目標(biāo);利用Apriori 算法對確定后的講評材料進(jìn)行關(guān)聯(lián)分析,確定講評策略。
圖2 試卷分析與講評課設(shè)計的關(guān)聯(lián)
學(xué)生試卷反思表確定的學(xué)生期待講評的試題與K-means算法分析出分組后學(xué)生前3組存在問題的試題對照如表3所示:
表3 被試班級試卷講評題目對比(部分)
對比發(fā)現(xiàn)題目2、7、9、11、12在兩種情況中都存在,因此該5道題目為必講材料且優(yōu)先講授;題目17、18、19屬于較難題目且學(xué)生有講評需求,因此列為必講材料并在前述5道題之后講解;學(xué)生出現(xiàn)錯誤較多但是無講評需求的題目為1、3、4,因此列為選擇性講評內(nèi)容。
對已確定的講評材料進(jìn)行關(guān)聯(lián)挖掘,得到試題間的關(guān)聯(lián)規(guī)則和關(guān)聯(lián)置信度,通過平移可得到知識點間的關(guān)聯(lián)置信度。如圖3所示,講評材料中三角函數(shù)的圖像是核心知識點,與三角函數(shù)的和差化積、向量加減法及其幾何意義和復(fù)數(shù)的四則運算關(guān)系最近,關(guān)系最遠(yuǎn)的是等比數(shù)列。因此,初步確定講評策略為主題式講評,以“三角函數(shù)的圖像”為主題,利用思維導(dǎo)圖將知識點進(jìn)行串聯(lián),構(gòu)建知識體系。
圖3 Apriori算法下篩選后試題的知識關(guān)聯(lián)云圖
針對調(diào)查問卷和教師訪談中所反映出來的當(dāng)前拉薩市數(shù)學(xué)試卷講評課的問題,本研究提出以下建議:
試卷數(shù)據(jù)庫的建立有助于教師從橫向空間分布與縱向時間分布掌握試卷命制的變化趨勢、學(xué)生學(xué)習(xí)能力的變化趨勢,精確定位學(xué)生考試所存在的核心問題,針對性制定講評課內(nèi)容和教學(xué)計劃。當(dāng)前拉薩市大部分高級中學(xué)在大型考試中的閱卷以網(wǎng)絡(luò)閱卷的形式開展,可以獲得每道試題的具體得分信息,因此,為構(gòu)建試卷數(shù)據(jù)庫創(chuàng)造了很好的條件。但在校級考試或者一般性考試中,閱卷主要為線下閱卷,因此需要手動錄入較詳細(xì)的信息。
調(diào)查顯示拉薩市高中階段大部分?jǐn)?shù)學(xué)教師的試卷分析還處于前計算階段。[7]試卷分析不等于教師把試卷從頭到尾做一遍,更不等于教師完全憑借經(jīng)驗篩選出試卷講評的重難點??茖W(xué)的試卷分析是開展針對性、高效性講評課的重要保障,轉(zhuǎn)變試卷分析觀念,重視試卷分析的深度與廣度,能促進(jìn)試卷講評課效率。其中的廣度可以通過擴(kuò)大時間和空間維度、豐富樣本量的方式實現(xiàn);挖掘試卷分析的深度可以通過應(yīng)用數(shù)據(jù)處理軟件聚類和關(guān)聯(lián)相關(guān)計算方法的方式達(dá)到,例如本研究中WEKA 平臺下的Kmeans 算法和Apriori 算法,對教育數(shù)據(jù)進(jìn)行深度分析,為此,需要對一線教師進(jìn)行一定的教育測量和軟件使用培訓(xùn)。
調(diào)查顯示當(dāng)前學(xué)生缺乏問題修正、反思和錯題鞏固的主觀能動性。韋納的歸因理論認(rèn)為正確的成敗歸因會提升學(xué)生自我效能感,激發(fā)學(xué)習(xí)動機(jī),促進(jìn)學(xué)業(yè)進(jìn)步。因此,在學(xué)生自主性不足,還未養(yǎng)成自主反思的學(xué)習(xí)習(xí)慣前,教師爭取每次測試后通過任務(wù)式或者督促式的訓(xùn)練方式讓學(xué)生填寫試卷反思表,提高學(xué)生成敗歸因、自我歸納和反思的技能,并通過教師針對性的指導(dǎo),學(xué)生學(xué)會對成?。ㄔ囶})正確歸因。
依據(jù)學(xué)生試卷反思表和K-means 聚類分析方法確定講評所用的“優(yōu)先講評”—“必須講評”—“選擇性講評”題目,緊接著依據(jù)Apriori 算法得到試題間關(guān)聯(lián)云圖,再參照課程標(biāo)準(zhǔn)和課程大綱的宏觀要求,確定以哪些知識點為主題進(jìn)行講授,合理規(guī)劃講評內(nèi)容和講評方式,進(jìn)而構(gòu)建科學(xué)而高效的講評方案。