鄭 琦 吳先球
(華南師范大學物理與電信工程學院 廣東 廣州 510006)
基于Origin8.0的學生形成性評價
——以學生成績?yōu)闃颖?/p>
鄭 琦吳先球
(華南師范大學物理與電信工程學院 廣東 廣州510006)
摘 要:現(xiàn)階段,成績?nèi)匀皇窃u價學生的主要手段.然而,由于不同測驗的信度不盡相同,其成績不能很好的反應學生現(xiàn)狀、發(fā)展狀況和潛力.本文利用Origin軟件高效地進行成績統(tǒng)計和轉(zhuǎn)化,圖式化結(jié)果并進行分析,克服原始分數(shù)的缺陷,促進學生的形成性評價.
關(guān)鍵詞:形成性評價成績分析Origin軟件
1引言
形成性評價是在教學過程中為了獲得有關(guān)教學的反饋信息,改進教學,使學生知識達到掌握程度所進行的系統(tǒng)性評價,即為了促進學生尚未掌握的內(nèi)容進行評價[1,2].成績作為現(xiàn)階段評價學生的主要手段,有效利用階段性測驗,可以激發(fā)學生改進動機、診斷學生的表現(xiàn)并以建設性的方式向?qū)W生反饋評價信息、幫助學生實施改進行動,發(fā)揮形成性評價的作用[3].
然而,不存在完美的測驗和參量完全相同的測驗.測驗本身由于各種原因會引起誤差,比如選擇題的猜測成分引起的不穩(wěn)定性、測驗難度、文字表達、測驗長度、測驗時間和評分標準等因素[4].這些都使得代表不同測驗成績的數(shù)值不能進行比較,任一數(shù)值也不能準確地反應學生的發(fā)展水平.為克服以上不足,很多學者倡導引入標準分數(shù)對成績進行轉(zhuǎn)換.然而,教師工作繁忙,標準分數(shù)轉(zhuǎn)化過程復雜,缺少有力的統(tǒng)計工具,使得這一倡導難以貫徹到平時的測驗中[5].
當前最常用的成績統(tǒng)計工具是Excel.然而Excel的統(tǒng)計功能有限,標準分數(shù)轉(zhuǎn)化過程復雜,圖式化呈現(xiàn)方式有限,不能很好地進行分數(shù)統(tǒng)計和分析.本文將利用Origin軟件高效地進行成績統(tǒng)計和分析,標準分數(shù)轉(zhuǎn)換,并引入標準誤差,多層次圖式化結(jié)果,有效地促進學生的形成性評價.
2Origin介紹
Origin是一款專業(yè)的數(shù)據(jù)分析、科技繪圖軟件.它采用面向?qū)ο蟮拇翱诓藛魏凸ぞ邫诓僮?,簡單易學;用計劃管理器管理項目,各子窗口可以單獨保存、批量處理且調(diào)用便利.因此,Origin尤其適用于大量數(shù)據(jù)的快速處理和繪圖.
本文主要利用了工作表窗口提供的數(shù)據(jù)計算、統(tǒng)計等相關(guān)的功能.利用了內(nèi)置的LabTalk語言編程進行的簡單編譯功能.利用了繪圖窗口提供的數(shù)學運算、曲線擬合以及多種二位模版進行繪圖和組合對比.利用“Tools工具欄”,還能對圖形數(shù)據(jù)進行精確讀?。?/p>
以上只是Origin強大功能的冰山一角.此外,除Origin自帶60余種二維和三維繪圖模版,用戶還可自定義數(shù)學函數(shù)、圖形樣式和繪圖模版,滿足不同需要.假設檢驗和方差分析也常用于數(shù)據(jù)統(tǒng)計中的比較樣本差異性和尋找事物影響因素.總之,有效利用Origin,進行深入分析和處理數(shù)據(jù),并用豐富的圖形表征功能表達結(jié)果,有利于教育測量和評價[6].
3成績分析的理論基礎
3.1標準分數(shù)
標準分數(shù)z是原始分數(shù)與平均分的離差以標準差為單位的分數(shù),用公式表示為
Z=50+10z
如此將分數(shù)標準化成通用的標準量表,以便進行不同考試的成績比較.
3.2標準誤差
標準誤差就是測量的標準差,用Se表示
式中rtt是測量的信度,信度是對測量一致性程度的估計.如前文所述,這里主要考慮測驗本身引起的誤差對信度的影響.在有條件的學校,使用讀卡器讀取全年級學生選擇題答案并做出統(tǒng)計,得出選擇題信度rtt.粗略將選擇題信度等同于整份試卷的信度,求出某次測驗的標準誤差Se.對于絕大多數(shù)學校,可以用分半相關(guān)法估計Se.以一個班的成績?yōu)槌D?,將某次測驗分為奇數(shù)項目和偶數(shù)項目(兩個項目的分值要一樣).一次測驗中不同題目要測的能力應具有一定的相關(guān)性,如果奇數(shù)項目得分Xo與偶數(shù)項目得分Xe一致性程度高,可以認為這個測驗的信度高,那么標準誤差就?。环粗嗳唬梅职霚y驗分數(shù)間差異的標準差作為標準誤差,如下公式
Se=SXo-Xe
其中SXo-Xe是奇數(shù)項得分與偶數(shù)項之差的標準差.
在正態(tài)分布的前提下,Xt表示實際得到的測驗成績;X∞表示真分數(shù),真分數(shù)是理想條件下使用完備的測驗工具獲得的、不存在誤差的成績,可以精確地反映學生的學業(yè)水平.如果選用95%的可靠度要求,真分數(shù)將有95%的可能性落在Xt±1.96Se的范圍.即
P(Xt-1.96 Se 標準誤差用于對個人真分數(shù)做置信區(qū)間的估計.也就是說,不能將測驗實得分數(shù)看作一個確切的點,而是具有一定的分布范圍的或是帶狀的,是真分數(shù)的估計值.實得分數(shù)對真分數(shù)估計的如何精確可以由Se顯示出來.Se越大,測驗越不精確,對真分數(shù)估計的精確度就越低.這樣,即可避免對兩次測驗之間小的差別做過分的解釋[4].這里,應用的是標準分數(shù)的標準誤差. 4單科多次測試成績分析實例 本節(jié)以廣州某高中某班52名學生4次數(shù)學測試成績?yōu)闃颖具M行分析.將成績進行標準分數(shù)轉(zhuǎn)換,展現(xiàn)每次測試成績整體分布情況、最高分和最低分、平均分、排名25%,50%,75%的分數(shù),評估試卷質(zhì)量.同時展現(xiàn)某學生4次測試的變化情況,引入標準誤差,更有針對性和建設性地分析學生的學習狀態(tài)和學習過程,制定學習方法,改進教學方法,并對接下來的學習進行預測,設定合理的目標.學生進行自我比較,可以減輕同學間比較帶來的壓力,改進學習動機. 4.1導入Excel數(shù)據(jù) 通過菜單命令【File】→【OpenExcel】導入Excel文件,選擇OpenasOriginWorkship,得到Origin工作表.工作表中記錄了4次測試成績,以及每次測試單數(shù)項目和偶數(shù)項目成績. 4.2標準分數(shù)轉(zhuǎn)化并引入標準誤差 為了統(tǒng)計方便,我們編輯公式計算標準分數(shù)和標準分數(shù)的標準誤差,之后每次需要時就可以直接調(diào)用公式.通過菜單命令【View】→【CodeBuilder】,打開OriginC的編輯窗口.在文件目錄中新建Z函數(shù),寫入程序,編譯后保存.我們用同樣的方法編譯標準分數(shù)的標準誤差公式. 選擇某一列數(shù)據(jù),通過菜單命令【Statistics】→【DescriptiveStatistics】→【StatisticsonColumns】,統(tǒng)計出此列數(shù)據(jù)的平均值、標準差等數(shù)據(jù).利用Origin的計算功能,調(diào)用已編譯的函數(shù),得到每次考試的標準分數(shù)Z,奇數(shù)項與偶數(shù)項標準分數(shù)之差Zo-Ze.圖1為一次測試的成績工作表. 在新的數(shù)據(jù)表格中,記錄同學甲幾次考試的標準分數(shù)Za和1.96倍的標準分數(shù)的標準誤差1.96 Se. 圖1 成績工作表截圖 4.3圖式化結(jié)果 首先進行總體統(tǒng)計.選中標準分數(shù)列數(shù)據(jù),通過菜單命令【Plot】→【Statistic】→【BoxChart】,系統(tǒng)將自動生成箱狀圖.再圖式化個體成績.通過【NewLayers(Axes)】新建圖層.將Za列數(shù)據(jù)進行線性擬合,并將1.96Se列數(shù)據(jù)作為誤差棒插入圖中. 如圖2所示,以第一次考試的標準分數(shù)Z1為例:最低分和最高分的數(shù)據(jù)用“×”標示;排名1%和第99%兩端分別用“短橫線”標示;排名25%,50%,75%用“長橫線”標示,并組成一個方框;平分分用小“□”標示.折線圖的拐點是同學甲每次考試的標準分數(shù),誤差棒的長度是兩倍的1.96Se,表示同學甲的成績有95%的可能性落在誤差棒所示的范圍內(nèi). 圖2 縱向?qū)Ρ炔煌瑴y試成績 4.4試卷評估與學生評價 4.4.1試卷評估 好的測試應該能很好地反映出學生的能力,有很好的區(qū)分度,其成績服從正態(tài)分布.如圖2,第1次測試Z1和第4次測試Z4成績平均分(小“□”標示)和排名中位數(shù)學生的成績(方框中的長橫線)接近,整體分布接近于常態(tài)分布,說明試題難度、區(qū)分度等設置較為合理.第2次測試Z2和第3次測試Z3平均分都明顯低于排名中位數(shù)學生的成績,成績分布為偏常態(tài)的,高分段學生較多,試題有待改進. 4.4.2學生評價 同學甲4次測試的原始分分別為:108,118,130,82,呈先上升,最后一次下降趨勢,受試題影響不能反映學生真實情況.轉(zhuǎn)換為標準分數(shù),成績分別為:54.77,60.63,59.11,47.78,由圖2折線圖標示,呈先上升,第3次考試開始下降趨勢. 具體到每次考試,引入標準誤差(誤差棒標示)分析.這里,可以將誤差棒理解為學生測試成績的浮動范圍.如圖2,以第3,4次考試為例,第4次測試的誤差棒最高端(可能達到的最高分)仍低于第3次測試誤差棒最低端,說明第4次測試較第3次有明顯退步.然而,第3次測試分數(shù)雖然低于第2次測試分數(shù),但第3次測試可能最高分(誤差棒最高端)高于測試2的分數(shù),說明第3次測試成績較第2次沒有明顯改變.同理,第2次測試誤差棒的最低端略高于第1次測試的分數(shù),說明第2次測試較第1次有略微進步. 由此反饋信息,同學甲此階段數(shù)學成績先略微上升后保持不變,又明顯下降,總體呈下降趨勢.接下來,需要進行更有針對性的反思總結(jié),做出預測,制定目標. 5多科多次測試成績分析實例 本節(jié)以同學乙語文、英語、數(shù)學3科4次測試的成績?yōu)闃颖具M行分析.通過建立彩色氣泡圖,比較4次測驗3科目的成績,更全面地考慮學生的發(fā)展情況,進一步完善形成性評價. 5.1圖式化表示 建立工作表記錄同學乙4次測驗中語文、英語和數(shù)學的標準分數(shù)Za和1.96倍的標準分數(shù)的標準誤差1.96Se.通過菜單命令【Plot】→【Symbol】→【Bubble+ColorMapped】,生成彩色氣泡圖[7]. 如圖3所示,紅色氣泡縱向代表語文測試標準分數(shù)范圍,綠色氣泡縱向代表英語測試標準分數(shù)范圍,藍色氣泡縱向代表數(shù)學測試標準分數(shù)范圍.折線圖拐點是每次測試的標準分數(shù). 圖3 縱橫向?qū)Ρ炔煌颇砍煽?/p> 5.2學生評價 首先單科目分析.對于語文測試,前3次都無明顯變化,第4次測試較第1次和第3次測試有略微下降,總體有略微下降趨勢;對于英語測試,第1,2次和3,4次測試無明顯變化,第3次測試較第2次略微下降,第4次測試較第1次略微下降,總體有略微下降趨勢;數(shù)學測試變化明顯,除了第1,2次無明顯變化,第2,3次進步明顯,3,4次也有略微進步,總體進步明顯. 再總體比較不同科目,同學乙一開始偏科嚴重,語文和英語都明顯優(yōu)于數(shù)學,但隨著數(shù)學的明顯進步,現(xiàn)在已無偏科現(xiàn)象.可見同學乙雖然數(shù)學基礎不好,但潛力很大;也要考慮,語文和英語的略微下降,是否因為學生用了太多的時間學習數(shù)學?下一步,如何合理安排時間精力分配,使同學乙全面發(fā)展是值得思索的. 6結(jié)語 本文利用Origin強大的統(tǒng)計、計算和作圖功能,對測試成績進行統(tǒng)計、轉(zhuǎn)換、圖式化.整體分析成績分布,個體分析成績狀況;縱向分析成績發(fā)展,橫向?qū)Ρ炔煌颇砍煽?,有助于學生的形成性評價.Origin內(nèi)嵌Excel工作簿,基于模版操作,容易上手,便于廣大教師使用. 參 考 文 獻 1恩斯特·卡西爾.人論.北京:光明日報出版社,2008 2亓文濤,喬愛玲.形成性評價在基礎教育教學中的應用研究.現(xiàn)代教育技術(shù),2007(11):89~92 3王宙.普通高校形成性學生評價研究.上海:華東師范大學,2007 4戴忠恒.心理與教育測量.上海:華東師范大學出版社,1987 5王小燕.MSExcel數(shù)據(jù)分析在成績分析暨試卷質(zhì)量評估的應用.現(xiàn)代教育技術(shù),2010(10):135~137 6吳先球,高遠靜,盧煒杰.Origin軟件在考試數(shù)據(jù)分析與評價中的應用.教育測量與評價,2014(5):4~7 7方安平,葉衛(wèi)平,Origin8.0實用指南.北京:機械工業(yè)出版社,2012 Student's Formative Assessment based on Origin8.0 Zheng QiWu Xianqiu (South China Normal University Physics & Telecomunication Engineering College,Guangzhou,Guangdong510006) Abstract:At this stage, test scores are still the main means to evaluate students. However, the reliabilities of each test are different, the scores can not represent students' present ability, development status and potential effectively.The scores can be statistically analyzed and transformed by Origin software, the results can be schematized and assessed by graphs, to overcome the defects of the original scores, to promote the formation of students' evaluation. Keywords:formative evaluation;score analysis;Origin software. 收稿日期:(2015-04-26)