● 劉學智 曹小旭
小學數(shù)學學業(yè)水平測試與課程標準一致性水平探究*
● 劉學智 曹小旭
借鑒韋伯模式,在分析縣域小學數(shù)學學業(yè)水平測試與課程標準的一致性狀況時發(fā)現(xiàn),小學數(shù)學三年級一致性水平呈現(xiàn)出數(shù)與代數(shù)領域一致性水平最好,空間與圖形領域次之,統(tǒng)計與概率領域一致性水平較差,而實踐與綜合運用領域一致性水平最差的特征。這說明我國學業(yè)水平測試存在偏離課程標準的問題,因此應采取有效策略,提高學業(yè)水平測試質量。
小學數(shù)學;學業(yè)水平測試;課程標準;一致性
學業(yè)水平測試是各縣區(qū)教育行政部門監(jiān)測學業(yè)質量的重要方法。課程改革的本質在于基于課程標準的教育改革,如何讓學生學業(yè)成就評價建立在課程標準的基礎之上,是國家、地方或學校實施基于標準的學業(yè)成就評價過程中必須解決的關鍵問題。[1]在實踐中發(fā)現(xiàn),各縣區(qū)教育行政部門非常重視學生學業(yè)水平測試分數(shù)的解釋,而忽視對學業(yè)水平測試是否反映課程標準要求的一致性推論,因而導致學業(yè)水平測試偏離課程標準的問題比較突山。本研究借鑒美國學者諾曼,韋伯(Norman.L.Webb)研制的學業(yè)評價與課程標準一致性的分析程序與方法(以下簡稱“一致性”),即韋伯模式,對某縣2010年小學3年級數(shù)學學業(yè)水平測試工具,即學業(yè)水平測試試卷進行一致性分析,為縣區(qū)層面在實施學業(yè)質量監(jiān)測過程中基于課程標準(以下簡稱“基于標準”)編制學業(yè)水平測試工具,提供必要的建議。
本研究以J省某縣2010小學三年級數(shù)學學業(yè)水平測試試卷為監(jiān)測對象。分析方法主要采用韋伯的一致性分析模式。韋伯分析模式是美國監(jiān)測學業(yè)水平測試工具質量的重要方法?!敖陙恚f伯模式已經(jīng)成為理解學業(yè)評價和課程標準之間關系的最重要、最具有創(chuàng)新性的模式,目前該模式已經(jīng)在美國24個州推廣和應用。[2]本研究借鑒和改造韋伯一致性分析模式旨在對基于標準的小學數(shù)學學業(yè)水平測試質量進行監(jiān)測與分析,即依據(jù)韋伯構建的一致性分析框架,從知識種類、知識深度、知識廣度和知識分布平衡性等四個維度[3],分析小學三年級數(shù)學一致性水平狀況。
本研究采用數(shù)學課標中刻畫的數(shù)學知識技能的目標動詞為判定依據(jù),即把了解、理解、掌握和靈活運用“四級”水平[4],作為一致性數(shù)據(jù)的編碼參照標準。
確定由課程專家、學科專家(小學數(shù)學骨干教師)、教研員三人組成編碼小組。在共同編碼過程中,不同類型的編碼者分工明確,課程專家負責對課程標準的具體目標進行分析與解讀,使編碼小組成員很好地理解課程標準內容的難易程度。學科專家負責向編碼小組提供課程實施中的學業(yè)評價狀況,進一步輔助編碼小組深刻理解評價項目。教研員集理論與實踐知識于一身,在共同編碼過程中,協(xié)調課程專家和學科專家在編碼討論過程中產(chǎn)生的分歧。本研究具體編碼過程如下:編碼小組依據(jù)了解、理解、掌握和靈活應用“四級”水平,對課程標準下的具體目標進行“水平等級”分析,在此基礎上,對小學三年級數(shù)學學業(yè)水平測試的測驗題目進行獨立編碼。
采用描述統(tǒng)計的方法生成知識種類、知識深度、知識廣度和知識分布平衡性等“四維度”一致性可接受水平統(tǒng)計表。
表1 學業(yè)評價與課程標準一致性水平判斷標準[5]
1.知識種類的一致性可接受水平
知識種類一致性是指用來判斷評價項目涉及的學習內容范圍與課程標準中描述的學習內容范圍是否相一致。[6]表2顯示,小學三年級數(shù)學學業(yè)水平測試試卷中數(shù)與代數(shù)、空間與圖形、統(tǒng)計與概率、實踐與綜合應用四大學習領域的測驗題目平均數(shù)分別為13、9.33、6.33、 0.33。按照表 1“擊中領域目標的測驗題目的平均數(shù)大于或等于6個題目即可判定知識種類達到一致性可接受水平?!钡呐袛鄻藴?,數(shù)與代數(shù)、空間與圖形、統(tǒng)計與概率三大學習領域其測驗題目平均數(shù)均超過6個,因此我們有理由判定該三大學習領域知識種類均到達一致性可接受水平;而實踐與綜合運用領域擊中領域目標的測驗題目僅為0.33,其測驗題目的平均數(shù)不足6個題目,由此可以判定該學習領域知識種類沒有達到一致性可接受水平。
表2 知識種類一致性可接受水平統(tǒng)計表
2.知識深度的一致性可接受水平
表3 知識深度一致性可接受水平統(tǒng)計表
知識深度一致性是指被用來判斷所評價的知識技能、認知要求與課程標準中期望學生“應該知道什么”和“應當做什么”目標是否相一致。[7]表3顯示,小學三年級數(shù)學學業(yè)水平測試試卷中數(shù)與代數(shù)、空間與圖形、統(tǒng)計與概率、實踐與綜合應用等四大學習領域符合具體目標深度水平測驗題目數(shù)百分比分別為64%、58%、62%、100%。按照表1“符合具體目標深度水平測驗題目平均數(shù)的百分比大于或等于50%即可判定知識深度具有一致性”的判斷標準,四大學習領域符合具體目標深度水平測驗題目數(shù)的百分比均大于50%,因此我們有理由判定數(shù)與代數(shù)、空間與圖形、統(tǒng)計與概率、實踐與綜合應用等四大學習領域知識深度都到達了一致性可接受水平。
3.知識廣度的一致性可接受水平
表4 知識廣度一致性可接受水平統(tǒng)計表
“知識廣度一致性是指被用來判斷課程標準中所涉及的概念、觀點與學生為了正確回答評價項目所需要的概念、觀點是否相一致?!盵8]表4顯示,數(shù)與代數(shù)、空間與圖形、統(tǒng)計與概率、實踐與綜合應用等四大學習領域目標擊中百分比分別為 58.1%、51.2%、38.8%、33.3%。按照表1“測驗題目擊中水平下目標數(shù)的平均數(shù)的百分比大于或等于50%即達到一致性可接受水平”的判斷標準,四大學習領域僅有數(shù)與代數(shù)、空間幾何達到可接受的一致性水平,而統(tǒng)計與概率、實踐與綜合應用等學習領域則難以達到知識廣度一致性可接受標準。
4.知識分布平衡性的一致性水平
表5 知識分布平衡性可接受水平統(tǒng)計表
“知識分布平衡性是指考察評價項目在各項具體目標之間分布的均勻程度。”[9]表5顯示,數(shù)與代數(shù)、間與圖形、統(tǒng)計與概率、實踐與綜合應用等四大學習領域知識分布平衡性指數(shù)分別為 0.746、0.364、0.548、0.132。 按照表1當“知識分布平衡性指數(shù)的平均數(shù)大于或等于0.7,即達到一致性可接受水平”的判斷標準”,該領域只有數(shù)與代數(shù)領域的知識分布平衡性達到了一致性可接受水平,其余各學習領域均未達到一致性可接受標準。
探究小學數(shù)學知識種類、知識深度、知識廣度和知識分布平衡性的一致性可接受水平狀況,我們發(fā)現(xiàn)小學三年級數(shù)學學業(yè)水平測試與課程標準一致性水平具有如下特征:
l.數(shù)與代數(shù)領域一致性水平最好
圖1 小學三年級數(shù)學(上)學業(yè)評價與課程標準一致性總體水平統(tǒng)計圖
從圖1發(fā)現(xiàn),在四大學習領域中,數(shù)與代數(shù)領域在四個維度上均達到指標要求,可以得出其一致性水平最好的結論。在小學階段,數(shù)與代數(shù)是課程標準內容目標下的基本學習領域,是進一步學習其他數(shù)學知識的載體,同時,該領域在課程標準中所占內容比例大,所涵蓋的知識點比較多,因而在編制試題時更傾向于數(shù)與代數(shù)領域,其一致性水平自然要好于其他領域。
2.空間與幾何領域一致性水平較好
從圖1發(fā)現(xiàn),空間與幾何領域前三個維度的一致性水平可以接受。該領域的測驗題目直接體現(xiàn)了小學數(shù)學第一學段要求學生能夠認識簡單幾何體以及平面圖形,初步感受平移、旋轉等現(xiàn)象,能夠運用直尺等工具進行簡單測量,與現(xiàn)實生活中兒童所接觸到的各種實物有著密切的聯(lián)系的內容,反映了數(shù)學課程標準關注學生生活實際的理念,因而一致性程度較好。
3.統(tǒng)計與概率領域一致性水平較差
從圖1發(fā)現(xiàn),統(tǒng)計與概率領域僅在知識種類及知識深度兩個維度上的一致性水平可以接受,可見其一致性水平較低。數(shù)學課程標準中明確規(guī)定,統(tǒng)計與概率領域旨在幫助學生逐步建立起數(shù)據(jù)分析觀念,了解隨機現(xiàn)象及其發(fā)生概率以及可能性事件概念等,在現(xiàn)實社會中應用廣泛。因此,從小學開始傳授統(tǒng)計與概率知識具有極強的現(xiàn)實性和必要性。但由于該領域首次出現(xiàn)在新課標中,教師及試卷編制人員對其重視程度不高,進而在試卷編制時受到人為因素、檢測時間、版面以及題型的影響及局限,很難把該領域更多的具體目標編排到需要考察的范圍之內。
4.實踐與綜合運用領域一致性水平最差
從圖1發(fā)現(xiàn),實踐與綜合運用領域僅有知識深度一致性水平可以接受。該領域在試卷中測驗項目只有一個題目,知識深度一致率為100%,說明該學習領域知識深度達到好的一致性水平。但除知識深度以外,其余維度均未達標,這說明該學習領域一致性水平仍然極差。實踐活動是小學數(shù)學第一學段呈現(xiàn)的主要形式,課程標準中關于數(shù)學實踐的目標旨在讓學生在數(shù)學學習中經(jīng)歷觀察、操作、推理等活動,了解數(shù)學在日常生活中的簡單應用。這一部分對紙筆測驗的要求較高,不易把握,因而在實際教學中,教師對這一領域的學業(yè)評價主要放在了課堂教學和日常學習生活中,而未將其作為紙筆測驗內容。可見,試卷編制者對這一領域的領悟還不夠深刻,未能很好的把握該領域的開放性、綜合性等要求。
本研究表明,J省某縣小學三年級數(shù)學學業(yè)水平測試試卷具有數(shù)與代數(shù)領域一致性水平好于其他領域,空間與圖形領域次之,統(tǒng)計與概率領域較差,而實踐與綜合運用領域一致性水平最差等特征。這表明,小學數(shù)學學業(yè)水平測試試卷的編制人員對數(shù)與代數(shù)和空間與圖形領域的試卷內容把握比較好,而對統(tǒng)計與概率、實踐與綜合應用領域把握程度不夠,存在偏離課程標準內容要求的問題。究其原因,在于我國數(shù)學課程標準中雖然明晰了內容標準,但卻未能制定出科學嚴謹?shù)膶W業(yè)評價標準,導致試題編制者在編制試題時無學業(yè)評價標準可依據(jù)。同時,以學業(yè)質量檢測為目的的學業(yè)水平測試雖然具有一定的公平、公正性,但是避免不了會受到考試利害相關者的干預,比如試題編制者在編制試卷時要綜合考慮來自學區(qū)或學校領導部門、教師以及家長的分數(shù)期望。各級領導受來自社會各方面的壓力,不得不對課程編制施以權威影響;大多教師認為學習哪些知識就應該考察哪些知識,因而對教材中未能凸顯,但在課程標準中卻有所強調的某些具體目標不予理會;家長和學生對考試成績的高期望,也會對試題的編制產(chǎn)生一定程度的影響,這些因素或多或少會導致試卷編制者在編制試卷內容時偏離課程標準的傾向。同時,各級教育部門過于重視對學生考試結果的監(jiān)測與分析,而忽視對于學生學業(yè)水平測試工具質量的監(jiān)測的做法,也會造成學業(yè)水平測試質量不高的問題,面對學業(yè)評價中的一系列問題,我們有必要借鑒韋伯等研究的一致性分析模式,創(chuàng)新具有本土化的學業(yè)水平測試質量監(jiān)測方法,推動各地忠實于課程標準編制學業(yè)水平測試工具。
[1]崔允漷,王少非,夏雪梅.基于標準的學生學業(yè)成就評價[M].上海:華東師范大學出版社,2008,16.
[2]Council of Chief State School Officer(2006)Aligning Assessment To Guide The Learning of All the Students,45.
[3]Norman L.Webb.A1ignment of science and mathematics standards[M].National lnstitute for Science Education University of WisconsinMadison,1999.11-18.
[4]中華人民共和國教育部.全日制義務教育數(shù)學課程標準(試驗稿)[M].北京:北京師范大學出版社, 2002.3.
[5]劉學智.小學數(shù)學學業(yè)評價與課程標準一致性的研究[D].(博士論文).長春:東北師范大學教育科學學院,2008:64.
[6][7][8][9]劉學智.論評價與課程標準一致性的建構:美國的經(jīng)驗[J].全球教育展望,2006(9):36,36,37,37.
*教育部人文社會科學項目《學業(yè)評價與課堂教學一致性研究》(課題編號:09YJA880020)
劉學智/東北師范大學國際與比較教育研究所副教授,教育學博士,研究方向課程與教學論 曹小旭/東北師范大學國際與比較教育研究所碩士生,研究方向課程與教學論
(責任編輯:張 斌)