李 勇,郭志英
自2001年開始的新課程改革以來,發(fā)展性評價理念已經深入人心。學生評價改革作為新課改六大改革目標之一,推動發(fā)展性評價是其核心要義?!痘A教育課程改革綱要(試行)》中明確提出“建立促進學生全面發(fā)展的評價體系。評價不僅要關注學生的學業(yè)成績,而且要發(fā)現和發(fā)展學生多方面的潛能,了解學生發(fā)展中的需求,幫助學生認識自我,建立自信。發(fā)揮評價的教育功能,促進學生在原有水平上的發(fā)展”。然而, 隨著新課程改革的深入推行,學生評價的改革變得舉步維艱, 從而影響到新課改推進的速度和質量,以及社會各界對新課改的評價。[1]發(fā)展性評價為何叫好不叫座,逐漸走入困境?究其原因是課程改革設計者自身對發(fā)展性評價理念的認識存有偏誤,基層對于什么樣的評價才是發(fā)展性評價、如何開展發(fā)展性評價的理解不可避免地陷入混亂,以致很多評價實踐工作盲目化、形式化。
在國內關于發(fā)展性評價的文獻中,大多將發(fā)展性評價翻譯為Developmental Assessment 或Developmental Evaluation。但是從國外文獻看,在教育領域,這兩個術語多用于指對嬰幼兒的生理和心理成長的發(fā)展水平評估,如果翻譯為中文,應該是“發(fā)展的評估或評價”。與發(fā)展性評價相近的一個術語是由威金斯1998年提出的教育性評價(Educative Assessment)。他認為評價一是為了改進學生和教師的表現,二是必須向學生和教師提供有意義和有用的反饋。[2]
新課程改革的設計者認為“發(fā)展性課程評價的提出,不僅體現了當前課程評價最新發(fā)展的趨勢與先進的評價思想,而且主要針對我國現行課程評價體系中的不足與局限,因此,深具前瞻性和現實性,對于推進基礎教育課程改革意義深遠。但在廣大的教師隊伍中,發(fā)展性課程評價還幾乎是一個全新的概念,有必要進行詮釋和分析,并給予相應的實施建議,從而使課程改革從概念變成行為,真正獲得實效”。[3]可見,一方面,發(fā)展性評價并不是一個外來引入的術語,而是新課程改革設計者針對我國教育評價現狀,在分析和吸收了國際上教育評價新理念的背景下提出的一個全新的本土化概念;另一方面,這一概念還在發(fā)展初期,并未達到成熟,需要我們進行大量的研究與詮釋。
庫巴和林肯將教育評價的發(fā)展劃分為四個階段,分別為測量時代(19世紀末至20世紀30年代),以追求評價結果的數量化、客觀化為主要目的;描述時代(20世紀30-50年代),泰勒正式提出教育評價這一術語,側重于對測驗結果作描述,以判斷實際的教育活動是否達到預期的教育目標及達到的程度如何;判斷時代(20世紀50-70年代),顯著特征是重視制定評價標準,并據此搜集數據,作出目標達到與否的價值判斷;建構時代(20世紀70年代以后),以回應和協商為重要標志,認為評價活動本質是一種心理建構的過程,強調評價者要重視利益相關者的意見,運用共同協商的方式推動評價活動。[4]作為第四代評價理念提出者的庫巴和林肯認為,前三代評價理念根植于科學主義范式,是完全由評價者控制的,而第四代評價提倡“價值多元化”“使用質性手段”“相互協商”等觀念。[5]
新課程改革設計者正是深受第四代評價理念的影響,認為根據評價思想的最新發(fā)展,當前我國的課程評價中存在很多問題,并據此提出了發(fā)展性評價理念:(1)評價主體互動性,強調評價過程中主體間的溝通協商,改變單一評價主體的現狀,加強自評、互評,使評價成為教師、管理者、學生、家長共同積極參與的交互活動;(2)評價內容多元化,不僅關注學業(yè)成績,更注重學生綜合素質的考查,尊重個體差異,以質評為基礎;(3)評價過程動態(tài)化,注重學生成長發(fā)展的過程,給予多次評價機會,鼓勵將評價貫穿于日常的教育教學行動中,如口頭評價、作業(yè)評價、成長記錄袋等。[3]
應該說,第四代評價的提出對推動評價理念的發(fā)展有積極意義,但過于強調價值多元、共同協商,也導致了其在實踐應用中的局限:一是需要不斷與利益相關者溝通協商,實施的工作強度大;二是過于強調評價標準的主觀性、不確定性,使評價工作容易陷入模糊化、隨意化;三是適用范圍受限,更適用于形成性評價。正如有研究者[6]在90年代就已警告的,第四代評價不重視對運用范圍進行限制,如果盲目擴大到其他性質的評價活動中去,其優(yōu)勢可能就會變成弱點。鑒于此,與其把第四代評價作為新一代的評價,似乎還不如把它視為一種新的評價理論更恰如其分。
顧名思義,發(fā)展性評價的本質要求就是“促進學生發(fā)展”。實際上,強調促進學生發(fā)展也是不同時期評價理念的共同目標,只不過它們的切入點和著重點不同而已。比如,最早泰勒提出教育評價這一術語,其定義就是“判斷課程和教學計劃在多大程度上實現了教育目標的過程”。[7]通俗地說,就是要求通過評價手段描述學生是否達到了預設學習目標的要求,以及達到何種程度。為改進課程與教學而進行評價是泰勒的一貫思想。其評價理念強調要注重課程目標在評價中的作用;評價方法可以有多種,不應限于筆試;評價并不是在教學的最后階段才出現的,應該與教學同步, 起著校正教學,使之向目標的方向發(fā)展的作用。[8]再如,作為第三代評價代表人物的布盧姆強調評價要基于清晰制定的評價標準,評價的目的在于為優(yōu)化和改善教學過程提供依據,是改進教學過程和學習過程的手段。布盧姆還從評價功能的角度出發(fā),將教學評價分為診斷性評價、形成性評價和終結性評價三大類。他提出的“掌握學習”教學理論,以適應學生個體差異,幫助大多數學生獲得發(fā)展為主旨,強調形成性評價和診斷性評價手段的應用,注重從具體細微的學習目標角度分析教學質量,促使大多數學生達到對課程材料的真正掌握。[9]可見,提倡發(fā)展并不是第四代評價理念的創(chuàng)舉,而是教育評價概念誕生以來永恒不變的主題。
發(fā)展性評價作為配合新課程改革提出的新概念,其最主要的特征是什么?對這個問題的解答,既關系到對發(fā)展性評價的理論探討與發(fā)展,也影響著廣大一線教育工作者對其概念的認知和實踐的取向。
基于對促進學生發(fā)展這一本質的認識,我們認為發(fā)展性評價的核心特征主要有以下三點:
一是基于過程。要評價學生的發(fā)展,必然至少要有一個起點和一個終點,通過終點相較于起點的進步狀況判斷學生發(fā)展的總體進步幅度以及發(fā)展的優(yōu)勢點與不足之處。需要注意的是,這種起點和終點發(fā)展狀況信息的獲取不一定通過形成性評價手段,也可以通過終結性評價手段。比如對學生在兩個年度的期末成績進行縱向比較,可以通過學習目標的掌握比例的變化情況評價總體進步水平,也可以根據不同內容領域或具體目標的掌握情況,評價學生在哪些方面發(fā)展得快,在哪些方面還有不足。
二是自我比較。要盡量采用標準參照方法,評價學生相對于既定標準的自我進步情況,避免使用學生間相對比較的常模參照方法。常模參照方法的主要問題是容易受到學生群體水平和任務難度水平的影響而不能反映個體的實際進步情況。但是常模參照方法在有的情況下,比如選拔和升學情景中,其作用還是難以被完全替代的。比如,一項可以將學生區(qū)分為優(yōu)秀、達標和未達標的英語等級測試,如果學生先后兩次參加,成績由達標提升為優(yōu)秀,則可以判斷其英語學習取得了明顯進步。這類評價的關鍵之處是要求評價標準前后保持一致,即雖然評價的具體任務可能是前后變化的,但評價的內容范圍以及優(yōu)秀、達標等等第的含義是不變的,因此,不同次評價的數據常常需要進行專家主觀標定或進行更復雜的等值化、量表化處理。需要注意的是,很多人將增值評價理解為自我參照性評價,而與標準參照性和常模參照性評價并列,實際上,雖不能說這是一種誤解,但卻可以說這種認識有片面性。首先,增值評價一般用于學校和教師評價,而非學生個體的評價。其次,增值評價的著重點不是評價自我發(fā)展,而是評價“凈”發(fā)展。它是將影響學生學習的外部因素,如人口學因素、家庭背景狀況、學校周圍地區(qū)的發(fā)展水平等效應分離出去,從而考察學?;蚪處煂W生學業(yè)成績影響的凈效應,進而實現對學?;蚪處熜茌^為科學、客觀的評價。再次,增值評價更偏向于統計手段,而非評價方式。增值評價這一術語基本上可以等同于其最常采用的多水平分析模型,而標準參照和常模參照性評價的劃分則體現的是不同的評價理念,并不綁定于某幾種統計方法。因此,增值評價體現的是評價之術,而標準參照和常模參照性評價體現的是評價之道。最后,增值評價統計模型的運算中,或多或少需要利用平均分等群體表現數據,做不到真正意義上的自我參照。
三是提供診斷。相較于告知學生發(fā)展的幅度,更重要的是要讓學生明了發(fā)展的方向。當前的評價實踐中,一個主要的問題是評價往往止步于報告總體水平,比如等第、總分、百分位,沒有進一步提供全面而詳實的診斷信息,這就造成學生只知道自己的整體水平如何,不知道哪些方面是自己的優(yōu)勢點或弱勢點,從而不能有針對性地提高改進。需要注意的是,要想保證診斷信息的全面性和準確性,必須在編制評價工具之初,就進行科學的設計,清晰梳理好評價領域及目標。
基于對上述發(fā)展性評價核心特征的理解,可以發(fā)現,當前理論與實踐中對發(fā)展性評價的認識還存在一些誤區(qū),主要體現在以下四個方面。
一是簡單化,認為發(fā)展性評價是區(qū)別于個體間橫向比較的一種縱向評價手段。有研究者[10]提出,發(fā)展性評價是針對以分等和獎懲為目的的終結性評價的弊端提出來的一種形成性評價。應該說發(fā)展性評價不能簡單等同于縱向手段的評價。
二是復雜化,泛泛地將各種現代教育教學理論的要求加諸其上,使其內涵龐雜,面臨理念的被接受程度大于實踐的被接受程度的窘境。很多研究者[11-13]提出發(fā)展性評價的理論基礎包括了多元智能理論,要求評價內容全面;人本主義思想,要求評價體現人文關懷;后現代主義思想,要求對不同的學生設立不同的評價標準。甚至還有研究者認為斯滕伯格的成功智力理論[14]、贊可夫的發(fā)展性教學理論[15]、皮格馬利翁效應[16]等都是發(fā)展性評價的理論根基。應該說,從發(fā)展性評價的提出看,主要是基于第四代評價理論及其背后的建構主義教學理論。
三是片面化,過于推崇質性手段,貶低量化手段。正如有研究者[17]指出,由于新課程改革強調質性評價手段的傾向,導致有些學?!罢劮稚儭?,大有視量化評價為發(fā)展性評價大敵之勢。實際上,量化與質性評價的區(qū)別不在于評價結果是否以分數呈現,而是要看評價過程是否貫穿了量化或質性的思想。
四是割裂化,將發(fā)展性評價視為對傳統評價的革新,而將兩者完全對立起來。應該說,發(fā)展性評價更為強調評價活動的“基于過程、自我比較、提供診斷”價值取向,其評價目的、手段與傳統評價并無本質區(qū)別;它的提出意義更多在實踐層面,而非理論層面。
在發(fā)展性評價的理論研究與實踐操作中,需要盡快走出上述誤區(qū),推動對發(fā)展性評價理念的再認識和再實踐。
參考文獻:
[1]張永勝. 學生評價改革的困境與反思[J]. 西北師大學報(社會科學版), 2010,47(5):71-75.
[2][美]Grant Wiggins,國家基礎教育課程改革促進教師發(fā)展與學生成長的評價研究項目組.教育性評價[M]. 北京: 中國輕工業(yè)出版社, 2005:12-13.
[3]鐘啟泉,等. 為了中華民族的復興 為了每位學生的發(fā)展——《基礎教育課程改革綱要(試行)》解讀[M]. 上海: 華東師范大學出版社, 2001:301-304.
[4]盧立濤. 測量、描述、判斷與建構——四代教育評價理論述評[J]. 教育測量與評價(理論版), 2009(03):4-7.
[5][瑞典]胡森, [德]波斯特爾斯威特,許建鉞,等.簡明國際教育百科全書:教育測量與評價[M]. 北京: 教育科學出版社, 1992:59-65.
[6]張民選. 回應、協商與共同建構——“第四代評價理論”評述[J]. 外國教育資料, 1995(03):53-59.
[7][美]拉爾夫·泰勒,羅康, 張閱.課程與教學的基本原理[M]. 北京:中國輕工業(yè)出版社, 2014:113.
[8]劉春惠. 泰勒課程評價模式述評[J]. 北京郵電大學學報(社會科學版), 2001,3(2):47-50.
[9]紀淑軍. 布盧姆:美國教學改革大師[J]. 教育與職業(yè), 2013(22):110-111.
[10]亓文濤, 喬愛玲. 形成性評價在基礎教育教學中的應用研究[J]. 現代教育技術, 2007,17(11):89-92.
[11]周智慧. 發(fā)展性教學評價的內涵及其理論基礎[J]. 內蒙古師范大學學報(教育科學版), 2004,17(8):35-37.
[12]何云峰. 學生評價的轉向:基于發(fā)展性評價的視角[J]. 教育理論與實踐, 2009(09):15-17.
[13]喬淑霞. 淺談發(fā)展性學生評價[J]. 教育探索, 2010(12):33-34.
[14]彭智勇. 數學新課程發(fā)展性評價研究[D]. 重慶:西南師范大學, 2004:41-44.
[15]謝婧. 發(fā)展性評價在小學數學學業(yè)評價中的運用[D]. 上海:上海師范大學, 2010:16-17.
[16]徐魁鴻, 張榮娟. 發(fā)展性學生評價理論與實踐研究[J]. 當代教育論壇,2004(5):53-54.
[17]許愛紅. 對發(fā)展性學生評價本質的思考[J]. 中國教育學刊, 2005(03):57-59.