于紅妍,張亞平,常冬青
(1.上海交通大學 體育系,上海 200030;2.新加坡楷博高等教育學院,上海 200050; 3.上海體育局 水上運動中心,上海 310000)
?
國家學生體質(zhì)健康監(jiān)測效果的真實性評價設計
于紅妍1,張亞平2,常冬青3
(1.上海交通大學 體育系,上海 200030;2.新加坡楷博高等教育學院,上海 200050; 3.上海體育局 水上運動中心,上海 310000)
從教育評價的視角分析,我國學生體質(zhì)健康監(jiān)測是一項工作,更是一項教育活動。當前由于忽略了它的教育功能,導致對監(jiān)測效果的評價出現(xiàn)了評價主體單一、評價內(nèi)容單一、測試工具單一等問題。運用文獻分析法和邏輯歸納法,以真實性評價理論為依據(jù),對我國學生體質(zhì)健康監(jiān)測如何開展和應用真實性評價進行研究。發(fā)現(xiàn),我國學生體質(zhì)健康監(jiān)測具有評價任務的真實性、評價內(nèi)容的真實性以及評價方式的真實性等特征。據(jù)此提出了學生體質(zhì)健康監(jiān)測實施真實性評價的五個步驟,并設計了四種類型的學生體質(zhì)健康監(jiān)測效果評價方案,為拓展我國學生體質(zhì)健康監(jiān)測的教育功能、提高體質(zhì)健康監(jiān)測效果提供方法上的支持。
國家學生體質(zhì)健康監(jiān)測;真實性評價;監(jiān)測效果;評價設計
我國十分重視學生體質(zhì)的健康發(fā)展。1952年我國出臺了新中國第一個體質(zhì)測試達標標準——《準備勞動與保衛(wèi)祖國體育制度》(簡稱《勞衛(wèi)制》,1952—1963年),伴隨著《國家體育鍛煉標準》(1975—2002年)、《(大、中、小學)學生體育合格標準》(1990—2001年)、《學生體質(zhì)健康標準》(2002—2006年)和《國家學生體質(zhì)健康標準》(2007年至今)等學生體質(zhì)健康評價標準的出臺,我國學生體質(zhì)健康監(jiān)測已走過了60余年的發(fā)展歷程,目前已成為學校體育教育中的一項系統(tǒng)工程。然而從教育評價學的視角分析,我國的學生體質(zhì)健康監(jiān)測存在著較突出的問題。如,評價主體較單一,學校或教師是評價的主體,師生之間的關(guān)系是評價和被評價的關(guān)系,忽視了學生、學生家長及社區(qū)等評價主體多元多向的參與。再如,測評工具較單一,目前使用的唯一的評價標準是《國家學生體質(zhì)健康標準》,由于每種評價工具都有一定的優(yōu)缺點,較單一的評價工具難免會導致評價結(jié)果的片面性。還有,評價內(nèi)容較單一,評價內(nèi)容主要是對學生的身體形態(tài)、機能和運動素質(zhì)進行評定,缺少對學生認知態(tài)度、參與表現(xiàn)、測試技能掌握等內(nèi)容的評價[1]。究其原因,筆者認為可能是我們將學生體質(zhì)健康監(jiān)測僅僅視為一項工作而不是一項教育活動,忽略了它教育的本質(zhì)功能。正在實施的《國家學生體質(zhì)健康標準》明確說明了學生體質(zhì)健康監(jiān)測“是促進學生體質(zhì)健康發(fā)展、激勵學生積極進行身體鍛煉的教育手段?!被谝陨显颍狙芯繃L試采用教育評價中真實性評價理論和方法,對學生體質(zhì)健康監(jiān)測如何開展真實性評價進行研究,以期為拓展我國學生體質(zhì)健康監(jiān)測的教育功能、提高體質(zhì)健康監(jiān)測效果提供借鑒。
真實性評價(authentic assessment)不是與“假”評價相對的。一方面,它作為一種評價方法最早由美國的學習評價和學校結(jié)構(gòu)顧問委員會執(zhí)行主任(Executive Director of Consultant on Learning, Assessment and School Structure)Grant Wiggins 于1989年提出,被定義為:學生運用自己所學的知識和掌握的技能解決生活中的或與現(xiàn)實情境相似的真實性任務,以便通過自己的創(chuàng)造性活動,培養(yǎng)、展示和證明自己的知識、才能以及解決問題過程中的策略[2]。它由真實性任務和評價量規(guī)兩個部分構(gòu)成[2-3]。其中,真實性任務是指現(xiàn)實生活中或模擬現(xiàn)實生活中的一件任務,學生可以用他們所學的知識和技能去解決。如操作一項實驗、表演或運動技能、展示作品、角色扮演等等,藉此考察學生在真實性任務中能夠做什么,而不是知道什么。量規(guī)是一種評分工具,它有評價標準、評價分數(shù)或等級以及評語三個方面,用來判斷學生在完成一項真實性任務的過程中是否達到了所提出的要求。概括來說,作為一種具體的評價方法,真實性評價就是讓學生完成一個操作性的任務,用以考察學生的知識與技能在解決實踐問題過程中表現(xiàn)的交流合作、批判性思考等多種復雜能力的發(fā)展狀況。
另一方面,隨著國內(nèi)外學者如Resnick (1987)、Savery(1995)、Hammond(2000)、Kathleen Montgomery(2001)、Judith(2009)以及俎媛嬡(2000)、梁恒(2013)等[4-10]對真實性評價標準和評價功能等理論研究的拓展和深入,真實性評價的涵義已超出了僅僅作為評價方法的局限。它通過將觀察性和理解性的評價、學生自身的評價以及成長檔案袋評價等質(zhì)性評價方法與標準化測驗相結(jié)合的方式,突出了評價的發(fā)展性功能、強調(diào)了評價的開放性和過程性,做到了對學生的全面、真實、有效、動態(tài)的評價,因此,真實性評價作為一種評價理念,成為多元性、過程性和發(fā)展性評價的典型代表。
2.1 學生體質(zhì)健康監(jiān)測任務的“真實性”
任務的真實性是真實性評價最重要的特點。這里的“真實性”是指任務是源自于現(xiàn)實生活的,故此學生的學習行為和學習成果能夠用具體的行為或行動方案表現(xiàn)。完成真實性的任務就是要求學生用所學到的知識和技能在實際的任務中進行鏈接和運用,以此來證明學生能夠做什么,而不是知道什么。學生體質(zhì)健康監(jiān)測通過這樣“真實性”的任務,要求學生不僅學會體質(zhì)健康監(jiān)測的知識,更重要的是掌握體質(zhì)健康監(jiān)測的操作性技術(shù)和方法,并能夠運用這些掌握的知識和技能解決現(xiàn)實生活中的問題,如體質(zhì)健康水平的自我測量、根據(jù)體質(zhì)健康評價結(jié)果給自己制定出有針對性的體育健身計劃等。
2.2 學生體質(zhì)健康監(jiān)測內(nèi)容的真實性
我國學生體質(zhì)健康評價標準從1952年實行《勞衛(wèi)制》到現(xiàn)行的《國家學生體質(zhì)健康標準》一共經(jīng)過了五次調(diào)整,盡管每一個新標準的出臺都有著不同的歷史背景或原因,但是幾次在測試項目上的調(diào)整都呈現(xiàn)出了一種趨勢,那就是,在測試內(nèi)容上已由軍事技能類和體能主導類項目轉(zhuǎn)向與健康相關(guān)的體質(zhì)健康項目的測試。如去掉了射擊、手榴彈、舉重、爬桿(繩)等項目,增加了肺活量(檢測肺功能)、體成分(測量體脂含量)等項目,而且正在積極開發(fā)心理健康測試項目。調(diào)整后的測試內(nèi)容與人們健康發(fā)展的觀念相符合,真正考慮了學生現(xiàn)實生活和身體健康發(fā)展的需求,體現(xiàn)出人的“全”健康的評價理念,因此,對學生的全面發(fā)展來說是真實的和可實現(xiàn)的[11]。
2.3 評價方式的真實性
真實性評價中典型的評價方式包括了檔案袋評價、表現(xiàn)性評價以及基于日常行為觀察的評價等。這些評價方式體現(xiàn)了真實性評價的發(fā)展性、個性化、開放性及多元性等過程性評價的特征,這也是將真實性評價應用于學生體質(zhì)健康監(jiān)測、解決當前只對監(jiān)測結(jié)果進行一次終結(jié)性評價問題的原因。如應用檔案袋評價方法,收集學生在體質(zhì)健康監(jiān)測過程中或結(jié)束后的一段時間內(nèi)參加各類體育活動的記錄、體育競賽取得的成績、體育課成績,以及體質(zhì)健康監(jiān)測登記卡、參與體育鍛煉的感想等,通過這些信息的收集和分析,真實反映他們所處的學習階段、過程中取得的進步或成長。再如觀察性評價是基于對學生日常體育行為進行完整的連續(xù)的觀察,做出的準確具體和詳盡的記錄,也可以邀請家長、專家以及同學參與評價的全過程,全面了解學生學習過程和學習表現(xiàn),對學生做出真實而有意義的反饋。目前在學生體質(zhì)健康監(jiān)測中使用的《國家學生體質(zhì)健康標準登記卡》以及建設中的學生體質(zhì)健康測試數(shù)據(jù)的信息系統(tǒng)就是建立和管理檔案袋評價的方式。這些評價方式是培養(yǎng)學生良好的體育鍛煉習慣和體育生活方式的一種監(jiān)督和鼓勵,也是學生體質(zhì)健康監(jiān)測目標真實體現(xiàn)的途徑。
開展真實性評價并沒有嚴格的程序,可根據(jù)不同的評價重點和要求靈活地實施。本文在這里設計了學生體質(zhì)健康監(jiān)測真實性評價的實施流程,該流程包括了實施真實性評價的五個基本步驟,為實施體質(zhì)健康監(jiān)測真實性評價提供操作性方法。
3.1 確定評價目標
評價始于對目標的確認,止于對目標達成程度的判斷(Lirm&Groulund,2003)[12]。確定學生體質(zhì)健康監(jiān)測的目標就是回答學生參與了體質(zhì)健康監(jiān)測后應該具備什么樣的知識和能力的問題。這些知識和能力將成為真實性評價的標準(standards)。目標可分為總體目標和具體操作性目標,無論是哪類目標都要求目標的提出要清晰明確,這是對學生體質(zhì)健康監(jiān)測的具體要求。例如“學生們通過參加體質(zhì)健康測試,能夠了解體質(zhì)健康相關(guān)知識,掌握體質(zhì)測評的技能和方法,并能夠獨立完成對自身體質(zhì)健康狀況的全面評價?!?/p>
3.2 設計真實性任務
為了評價學生是否達到了學生體質(zhì)健康監(jiān)測評價目標,評價者就要設計或選擇相關(guān)的真實性任務,讓學生通過執(zhí)行和完成任務來證明他們具備和掌握了相關(guān)的知識和技能、達到了評價預定的目標。如調(diào)查并分析本校學生體育鍛煉行為與其體質(zhì)健康水平的關(guān)系,并寫出評價報告;跟蹤測量本人的身高體重指數(shù),并預測未來可能的發(fā)展趨勢等。
3.3 建立評價標準
如何判斷學生在完成任務過程中的表現(xiàn)或完成真實性任務應該具備哪些標準?真實性評價標準是服從和服務于評價目標的,是對學生在某一方面應該達到的知識和技能的簡短陳述。它必須是可觀察、可測量的,而且公開和透明。本文設計了學生自評樣表(表1),將體質(zhì)健康監(jiān)測的評價過程劃分為三個階段,每個階段都列出了不同的評價項目。這樣,評價者就可以根據(jù)被評價者對項目的完成情況做出等級或評分的評定。另外,為了解決評價主體單一的問題,這里的評價者可以是學生本人、小組成員、教師和家長,他們應各占一定的評分比重來提高評價的信效度。
3.4 制定量規(guī)(assessment rubric)
根據(jù)任務表現(xiàn)標準,為了將不同學生的表現(xiàn)區(qū)分開,并與所確定的評價標準相對應,需要建立評價量規(guī)。量規(guī)也叫評分規(guī)則,主要由表現(xiàn)標準(criteria)、表現(xiàn)等級(performance level)和評語三個部分組成[12]。量規(guī)是一個非常靈活的工具,評價者可以根據(jù)需要自行開發(fā)量規(guī)形式或分配分值的權(quán)重[13]。但不管是哪種形式的量規(guī),它們或者是集中測量一定的表現(xiàn)、行為或品質(zhì)目標,即表現(xiàn)標準的陳述,或者是用一系列評分(等級)來評價表現(xiàn),即在每一個等級標準下都列有具體的表現(xiàn)特征,用以解釋這個等級的表現(xiàn)應達到的程度。量規(guī)是給學生提供反饋的具體實物,在實際使用中要根據(jù)反饋和需要適當?shù)卣{(diào)整和修改量規(guī)。
表1 學生體質(zhì)健康監(jiān)測效果評價表
3.5 價值判斷與反饋
價值判斷的過程是對教育活動滿足社會與個體需要的程度做出判斷的過程[14],它是實現(xiàn)教育決策科學化的重要環(huán)節(jié)。美國學者格郎蘭德(Gronlund,N.E.,1971)曾用一個簡單的公式描述了教育評價的特點:評價=測量(量的記錄)或非測量(質(zhì)的記錄)+價值判斷[15]。因此,學生體質(zhì)健康監(jiān)測的評價公式=體質(zhì)測量+真實性評價+價值判斷,可見,體質(zhì)測量與真實性評價后開展價值判斷是不可缺少的一個環(huán)節(jié)。最后,再將價值判斷的結(jié)果向監(jiān)測組織或?qū)W生反饋,即完成了學生體質(zhì)健康監(jiān)測真實性評價的整個過程。由此來看,真實性評價貫穿于體質(zhì)健康監(jiān)測、評價和反饋的每個環(huán)節(jié)中,是三者聯(lián)結(jié)的鎖鏈。下面的這種閉合式的循環(huán)設計使評價不斷趨向成熟和完善(圖1)。
圖1 學生體質(zhì)健康監(jiān)測真實性評價流程圖
效果評價是監(jiān)測活動整體構(gòu)建中的一個重要部分[16]??茖W的評價設計能從總體上對監(jiān)測過程進行有效控制,優(yōu)化監(jiān)測活動管理,提高監(jiān)測的實效性。本文提出的幾種典型的設計方案是按照體質(zhì)健康監(jiān)測開展的時間順序,將真實性評價方法應用其中,通過設計真實性評價在監(jiān)測活動中實施的時機和實驗組與對照組的比較,計量出監(jiān)測效果的定量值或是定性分析結(jié)果,實現(xiàn)對體質(zhì)健康監(jiān)測效果的檢驗。
4.1 單次評價設計
單次監(jiān)測活動評價設計是指在體質(zhì)健康監(jiān)測開始后,將真實性評價方法應用于監(jiān)測活動整個過程中,在監(jiān)測活動結(jié)束后進行一次性的評價數(shù)據(jù)的收集(圖2)。這種方法的優(yōu)點在于簡單易行,但是由于它在監(jiān)測之前沒有收集任何資料,許多難以控制的因素會影響評價的結(jié)果或效度,其缺點也很突出。
圖2 單次評價設計
4.2 同一小組實施監(jiān)測前后對比的評價設計
在監(jiān)測活動實施的前后各進行一次真實性評價數(shù)據(jù)的收集,兩者的差距即為監(jiān)測活動實施的效果。這種設計要比單次的監(jiān)測活動設計優(yōu)化了一步,將監(jiān)測實施前與監(jiān)測實施后的評價指標進行比較,就可以確定改進的情況。這種方法較為科學,操作也簡單,但如果監(jiān)測活動開展的時間較長,監(jiān)測過程中沒有對相關(guān)因素進行控制的話,不能完全保證監(jiān)測效果或是監(jiān)測中的某一些改進是通過實施監(jiān)測活動得來的(圖3)。
圖3 實施監(jiān)測活動前后對比的評價設計
4.3 同一小組多重評價設計
多重評價設計就是在監(jiān)測前后各進行多次的評價數(shù)據(jù)收集(圖4)。這是一種較為精確的評價設計。實驗組是自己的對照組。在監(jiān)測之前實施多重監(jiān)測會避免因不用對照組而產(chǎn)生的問題。而事后采取重復性評價,不僅可以對原始結(jié)果進行比較,也可以對監(jiān)測項目的長期效果進行評價。但是該評價設計需要投入大量的時間和費用,需要專人專門研究,實現(xiàn)起來比較困難。
圖4 同一小組多重評價設計
4.4 有對照組的評價設計
監(jiān)測活動實施前從同一學生群體中隨機選取兩組,進行真實性評價數(shù)據(jù)的收集,然后一組實施體質(zhì)健康監(jiān)測,稱為實驗組,另一組學生不進行體質(zhì)健康監(jiān)測,為對照組,實施監(jiān)測活動結(jié)束后兩組再次進行真實性評價數(shù)據(jù)的收集,與對照組比較,實驗組的結(jié)果表明了監(jiān)測活動的實施效果。對照組的另一個功能是排查監(jiān)測活動的實施過程中影響監(jiān)測效果的一些不利因素。這種設計是目前較有效的評價設計之一,但是兩組能否做到隨機抽樣是該方案實施的關(guān)鍵,在實踐中如果采用這種設計方案,則需要詳細說明隨機抽樣的辦法或操作過程。
圖5 有對照組的多重評價設計
另外,有對照組的最理想的設計是在上面的設計方案中再增加一個實驗組2。與實驗組1比較,實驗組2只是沒有前測,用于排除前測對監(jiān)測結(jié)果的影響。這種設計把監(jiān)測以外的干擾因素盡可能地消除,在實施設計中,這種設計是最好的。然而,從實際來看,要得到三個隨機選擇的抽樣小組有一些困難,另外,這種操作所用的時間長、費用高等缺點也較突出。
總之,不同的設計方案所用的人力、物力、財力、消耗的時間不同,能夠獲得的信息量也不同,因此,在實踐運用中要根據(jù)具體情況對這些設計方案做恰當?shù)倪x擇。
我國學生體質(zhì)健康監(jiān)測是一項工作,更是一項教育活動。從真實性評價的理論和方法分析,學生體質(zhì)健康監(jiān)測具備了監(jiān)測任務的真實性、監(jiān)測內(nèi)容的真實性和評價方式的真實性等特征,因此,學生體質(zhì)健康監(jiān)測應用真實性評價方法是可行的,也是現(xiàn)實所需的。
學生體質(zhì)健康監(jiān)測實施真實性評價有五個基本步驟:確定評價目標—設計真實性任務—建立評價標準—制定量規(guī)—價值判斷與反饋。由這五個步驟構(gòu)成的閉合式的循環(huán)結(jié)構(gòu),保證了評價過程的逐步成熟和完善。
本文根據(jù)真實性評價在體質(zhì)健康監(jiān)測中的應用時機設計了四種效果評價方案,并分析了每個方案的優(yōu)缺點。建議在我國學生體質(zhì)健康監(jiān)測的評價中采用真實性評價的方法,這是對提升我國學生體質(zhì)健康監(jiān)測效果的有益嘗試。
[1] 馮建新.現(xiàn)代教育評價與測量學[M].北京:中國社會科學出版社,2005.
[2] Wiggins G.A true test:toward more authentic and equitable assessment[J].Phi Delta Kappan,1989(20):703-713.
[3] 威金斯.教育性評價[M].北京:中國輕工業(yè)出版社,2005.
[4] Resnick L B. Learning in school and out[J].EducationalLeadership,1987,16(9):13-20.
[5] Savery J,Duffy T. Problem based learning:an instructional model and its constructivist framework[J].Educational Technology,1995(35):31-38.
[6] Darling H, Snyder J. Authentic assessment in teaching in context[J].Teaching and Teacher Education,2000(16):523-545.
[7] Kathleen M. Authentic Assessment: A guide for elementary teachers[M]. Essex:Addison Wesley Longman,Inc,2001.
[8] Judith T M, Theo J B, Paul A K.真實評價設計的五維框架[J].過程教育雜志,2009(4):62-66.
[9] 俎媛媛.真實性學生評價研究[D].上海:華東師范大學,2007.
[10] 梁恒.綜合實踐活動中真實性評價的探索與應用[J].基礎(chǔ)教育課程,2014(3):52-56.
[11] 孟慶光,胡國鵬.大學生體質(zhì)健康動態(tài)分析[J].河北體育學院學報,2012(1):86-89.
[12] 張繼璽.真實性評價:理論與實踐[J].教育發(fā)展研究,2007(01B):23-27.
[13] 張向眾,李永珺.真實性評價中的評分規(guī)則[J].外國教育研究,2004(12):35-38.
[14] 王篤勤.真實性評價:從理論到實踐[M].北京:外語教學與研究出版社,2007.
[15] Gronlund N E. Measurement and evaluation in teaching[M].New York: Macmillan Publishing Co.,Inc. and Collier,1971.
[16] 唐曉義,甄志平,劉鐵軍.我國研究生體質(zhì)測試現(xiàn)狀與分析[J].河北體育學院學報,2012(1):73-75.
Authentic Evaluation Design of National Student Physical Fitness Test in China
YU Hong-yan1, ZHANG Ya-ping2, CHANG Dong-qing3
(1. Department of Physical Education, Shanghai JiaoTong University, Shanghai 200030, China;2.Kaplan Higher Education Academy of Singapore, Shanghai 200050, China; 3.Aquatics Center, Shanghai Sports Bureau, Shanghai 310000, China)
From the perspective of educational evaluation, the National Students’ Physical Fitness Test (NSPFT) is task, and more importantly an educational activity. Currently, neglect of its educational function leads to a series of problems in the evaluation of the testing effectiveness, such as, the evaluation subject is single; the evaluation items are not rich; and the testing tools are not diversified. This paper applies methods of literature analysis and logical induction to research how to carry out NSPFT and its authentic assessment based on authentic assessment theory. It finds out that our NSPFT appears some features with the authentic tasks, the authentic contents and authentic evaluation methods. On this basis, it proposes five steps for the implementation of NSPFT authentic evaluation and four kinds of typical NSPFT evaluation design proposal, aiming to expand NSPFT’S educational function and to provide methodological support for the promotion of the evaluation effectiveness.
National Student’s Physical Fitness Test; authentic assessment;test effectiveness; evaluation design
2014-10-18
2013年教育部人文社科規(guī)劃項目基金項目(13YJC890042)
于紅妍(1976-),女,山東萊陽人,副教授,博士,研究方向為學生體質(zhì)健康監(jiān)測與評價。
G804.49
A
1008-3596(2015)02-0006-05