馬 曉,唐 炎
(1.上海體育學院 體育科學研究院,上海 200438;2.上海體育學院 體育教育訓練學院,上海 200438)
近年,隨著跨學科能力培養(yǎng)與“校園一體化”系列教學改革措施的不斷深入(Kohl et al.,2013),打破體育鍛煉與學業(yè)教育二元結構已成為促進學生身心協調發(fā)展的基本訴求。由此,一種體育與智育相結合的新型教學形式——體智融合教學應運而生(Goh et al.,2018;McMullen et al.,2016),且在推廣應用過程中顯著提升身體活動水平,有研究還取得了顯著的學業(yè)效益(Barrettwilliams et al.,2017;Bublitz et al.,2017;Drummy et al.,2016;Goh et al.,2018;Maykel et al.,2018;Norris et al.,2018;Seljebotn et al.,2019;Watson et al.,2019)。這種學業(yè)效益不僅體現在學業(yè)成就測驗成績、標準能力測驗評價結果,以及學業(yè)隨堂測試成績的提高,同時還表現為課堂注意等學習行為方面的顯著進步與優(yōu)化。針對學業(yè)效益來源的分析衍生出了大量隨機對照實驗研究和截面數據分析,在理論取向上可大致分為認知功能提升假說和課堂行為優(yōu)化假說。目前,針對課堂行為優(yōu)化取向的相關研究業(yè)已取得了較為一致的結果(Maykel et al.,2018),但從機制層面對其運動、心理、教育原理進行的探討尚未獲得一致性研究證據的支持(Verhagen,2020)。本研究認為,體智融合研究存在的這種差異化甚至完全相悖的研究結果與各項研究在干預劑量規(guī)劃與落實、學業(yè)效益分離與評價方面存在的方法學問題密切相關,以致難以闡明學業(yè)效益的來源機制。基于此,擬對體智融合教學學業(yè)效益研究的發(fā)展脈絡進行回顧,以兩種解釋取向為起點,歸納研究中存在的干預與評價問題,探討后續(xù)研究的思路與方向。
20世紀末,隨著美國青少年肥胖發(fā)生率的持續(xù)攀升,中小學體育課普及不足、體育教師專業(yè)資質匱乏等學校體育教學存在的問題日益凸顯。為了盡快解決中小學學生體質健康問題,美國提出了以《K-12國家體育教育標準》替代以走、跑、跳、投為主的基本運動技能教學,在充分挖掘體育育人價值的同時,鼓勵標準化中小學體育課程的開發(fā)與應用(Pangrazi,2003)。在此背景下,1989年,美國圣地亞哥州立大學主導開展了SPARK體育教育項目(The Sports,Play,and Active Recreation for Kids Programs)(Sallis et al.,1993),以圣地亞哥市郊7所小學的全體四年級學生(n1990=955,Mage=9.25±0.50)為樣本進行了為期2年的三臂隊列對照實驗,以探討體育課對學生身心健康的促進作用。該項目設置的實驗條件為專業(yè)體育教師、受訓班主任以及對照組。其中,專業(yè)體育教師和受訓班主任屬于體育教學條件,教授運動技能、MVPA和自我管理相關內容。在干預期內,每周實施3次干預,每次30 min,包括15 min體質健康活動和15 min技能活動,內容涉及有氧體育舞蹈、有氧游戲、跑、走、跳繩等10個健康素質項目,以及籃球、足球共9個學習單元(McKenzie et al.,2009;Mostafavi et al.,2013)。自我管理部分則以實施每周30 min室內教學形式為主,教授內容分別為自我監(jiān)控、目標設定、刺激調控、自我強化、自我指示訓練、問題解決,旨在幫助小學生建立課外自主鍛煉的好習慣。雖然SPARK項目的干預內容與學業(yè)教學內容無直接的關聯性,但至研究結束時,入組學生的健康素質和閱讀、語言、數學等學業(yè)表現均顯著提升(Centers for Disease Control and Prevention,2010;McKenzie et al.,1997)。該項目使得學校體育教育的學業(yè)促進價值備受矚目,而且經過專業(yè)化培訓的班主任均可掌握簡單的體育教育技術(Sallis et al.,1997),為后續(xù)體智融合教學的方案設計與教師培訓積累了經驗(Dowda et al.,2005;Sallis et al.,1999)。
自SPARK項目之后,相關研究進展緩慢,直至2000年4月,美國國際生活科學研究與健康促進中心(International Life Sciences Institute Center for Center for Health Promotion,ILSI CHP)提出制度順應性校內運動機會的理念后,體智融合教學方才正式提上中小學教育改革日程。制度順應性是指在不妨礙正常教學進度的前提下,將運動分別嵌入數學、科學、社會學習、語言藝術等學科的教學當中(Peregrin,2001),幫助學生實現每天至少60 min的中高強度身體活動(moderate-to-vigorous intensity physical activity,MVPA),以達到促進學生身心協調發(fā)展的目的(Katz et al.,2010)。該理念經專業(yè)團隊設計,最終以TAKE 10!?教學干預項目的形式在美國亞特蘭大地區(qū)27所小學進行了為期10周的試點應用(Kohl et al.,2001),后續(xù)結果表明,該項目運動強度規(guī)劃合理,不僅能夠提升學生中高強度的身體活動積累,減少課堂久坐時間,還可有效緩解小學生課堂注意分散進程,提升學業(yè)表現水平(Kibbe et al.,2011;Stewart et al.,2004)。
自2000年以后,以共享、整合為基調的校園一體化方案在豐富學生校內生活,優(yōu)化學習機會,提升兒童青少年學業(yè)表現及身心健康方面取得了矚目成就(Hawortha et al.,2015),極大地推動了后續(xù)運動、飲食營養(yǎng)等校園健康干預計劃的擬定與實施。2001年,澳大利亞對7~15歲四年級、八年級學生進行的學校體質健康調研(The Australian Schools Health and Fitness Survey)數據進一步支持了體育與學業(yè)之間的正相關關系(Vetter et al.,2019),為體育與智育之間的相關性提供了大數據支持。作為最早開展體育運動學業(yè)促進價值相關研究的國家,美國和澳大利亞近20年來開展了大量教學干預項目,不斷提升教案專業(yè)化水平、標準化水平、趣味性與科學性,相繼形成了多種適宜不同年級自由選用的成套教學干預方案,并通過隨機對照實驗檢驗應用效果、澄清效益來源。除了TAKE 10!?項目,近年美國、澳大利亞、英國、荷蘭相繼報告了A+PAAC(Academic Achievement and Physical Activity Across the Curriculum intervention)(Donnelly et al.,2017)、Energizers(Riley et al.,2015)、I-CAN?。˙artholomew et al.,2011)、EASY Mind(Riley et al.,2016)、ACTI-BREAK(Watson et al.,2018,2019)以及 Active Classrooms(Martin et al.,2015a,2015b,2017)、TWM-E(Mavilidi et al.,2020)、“Fit&Vaardig op School”[Fit and Academically Proficient at School(F&V)](Mullender-Wijnsma,2016)等大型研究項目的結果。
目前,體智融合教學的干預周期短則4周,長則3年。已公布的EASY MIND(6周)、TWM-E(4周)和Virtual Traveller(6周)等項目均取得了顯著的數學、英語學業(yè)干預效果和課堂注意行為改善(Mavilidi et al.,2019,2020;Owen et al.,2018;Riley et al.,2015,2016;Stapp et al.,2018)?;诮虒W方案應用場景與知識結合緊密程度的差異,體智融合教學逐漸分化為嵌入課堂教學的課堂融合模式和作為課堂間隔的課間融合模式。課堂融合模式是在常規(guī)課堂教學中嵌入5~10 min與所授知識相關的身體活動或通過體育游戲完成的課堂練習,其教學應用涉及數學、閱讀、拼寫、科學、藝術等(Erwin et al.,2013;Mavilidi et al.,2018;Riley et al.,2015,2016;Vazou et al.,2017;Vetter et al.,2019),典型的教學模塊包括3×3隨機字母矩陣跳躍拼寫任務(Mavilidi et al.,2018)、往返跑計數與加和任務(Donnelly et al.,2013)、字謎接龍(Grieco et al.,2016)等。隨著虛擬現實技術(virtual reality,VR)、動作游戲(active videogame,AVG)(Chen et al.,2017)、地理信息技術等科技手段在教學中的應用,與地理知識相關的戶外運動知識和元素得以通過更具象的形式融入課堂(Norris et al.,2016,2018),從而進一步拓展了體智融合教學的應用范圍,提升了課程的趣味性和沉浸感。課間融合模式則以運動為主,其與教學內容的關聯匹配程度相對較低,單次干預時間大多選擇10~30 min,依課間融合安排的運動內容、運動強度規(guī)劃差異可進一步細分為結構化課間和非結構化課間。經典干預方案以Energizers(Bailey et al.,2015;Mahar et al.,2006)、ACTI-BREAK(Watson et al.,2018,2019)、Brain Breaks(Glapa et al.,2018;Popeska et al.,2018)和TWC步行計劃(The Walking Classroom Program)(Stoepker et al.,2018)等大型體智融合研究項目最具代表性。
目前,針對體智融合教學的隨機對照研究、大樣本回歸分析(Correa-Burrows et al.,2017)、模型分析(Aibar et al.,2020;Wang et al.,2019),以及系統分析和元分析結果(Beck et al.,2016;Donnelly et al.,2016;Vazou et al.,2016)均肯定了體智融合教學的健康效益(Alhassan et al.,2016;Popeska et al.,2018;Martin et al.,2015),亦支持其對學生課堂表現、學業(yè)成績的提升作用(Vetter et al.,2019),尤其是學業(yè)效益既可見于課堂融合模式(Donnelly et al.,2017;Seljebotn et al.,2019),亦可見于課間融合模式(Howie et al.,2015;Mavilidi et al.,2019)。然而,體智融合教學在知識貫通、課堂重構方面的創(chuàng)新對教師綜合素質、教案設計水平、教學環(huán)境配置提出了更高的要求,在一定程度上影響了教學方式的普及。同時,部分長程項目,如A+PAAC項目,在延長運動時間、提升運動強度、增加教學科目和認知與運動評價指標后,干預效果未能獲得統計結果的支持(Donnelly et al.,2009,2017);部分小樣本研究在擴大樣本后亦出現學業(yè)表現提升維度的差異(Mavilidi et al.,2018),提示,當前體智融合教學研究中運動干預方案設計與干預效果之間的關聯尚未達到劑量化水平。
對體智融合教學學業(yè)效益的探討實質上是運動刺激-學業(yè)表現研究的延展,其對學業(yè)效益來源的解釋可分為以心理學取向為主的運動認知功能提升假說和以教育學取向為主的運動學習行為優(yōu)化假說。前者立足于個體的認知發(fā)展,后者則重在知識的教學與建構,二者從不同角度分別闡述了體智融合教學的學業(yè)效益來源。
運動認知功能提升假說以運動益智論和認知與學業(yè)呈正相關的證據為基礎,以運動相關腦塑造效益為佐證,構建了以認知為中介變量的“運動-認知-學業(yè)”效益路徑(Chaddock-Heyman et al.,2018;Lima et al.,2019;Oberer et al.,2018)。Donnelly等(2011)在對既往有關運動促進學生身心發(fā)展以及運動與學業(yè)成就關聯性研究回溯的基礎上,提出了以運動、心肺功能、肥胖、認知水平為影響因素的學業(yè)表現解釋模型,其中,運動、心肺功能、肥胖被視為認知功能的獨立影響因素,而認知功能的變化對個體學業(yè)表現具有重要影響。換言之,運動在提升健康水平的同時可改善個體的認知功能(Koutsandréou et al.,2016;Subramanian et al.,2015;Van Der Niet et al.,2015),進而促進其學業(yè)表現(Beck et al.,2016;Kern et al.,2018)。多項干預項目的研究結果皆支持運動與學生學業(yè)成績、能力及認知功能密切相關的論述(Mullender-Wijnsma et al.,2015;Haapala et al.,2014;Hillman et al.,2014;Van der Niet et al.,2016;Vazou et al.,2014)。而認知神經科學研究則從運動與腦發(fā)育水平關系的角度為該假說提供了神經生物學解釋。在運動過程中,運動引發(fā)的認知投入對認知功能具有練習作用(Schmidt et al.,2016,2015),運動本身對兒童大腦相關功能區(qū)具有激活與塑造作用(Donnelly et al.,2016;Hillman et al.,2008,2012;Subramanian et al.,2015),而且運動對神經內分泌系統的刺激可使其體內多種興奮性神經遞質的分泌增加(Hillman et al.,2009),因此與同齡兒童相比,長期進行規(guī)律運動的兒童,其腦結構和神經通路發(fā)育更好。研究顯示,青少年腦發(fā)育程度越接近成人則其認知水平越高,越有可能獲得較高的學業(yè)成就(Azad et al.,2015;Chaddock-Heyman et al.,2018;Chang et al.,2012;Feter et al.,2019;McMorris et al.,2015;Vaynman et al.,2015),提示,長期進行規(guī)律運動可以提升個體的學業(yè)表現。雖然這一效益假說具有相對完整的機制解釋,但單獨的運動干預研究結果并未獲得鏈式效益檢驗的有效證據,而且小樣本研究亦未能在大樣本隨機對照研究中獲得一致性結論(Vazou et al.,2016),如高認知投入的運動課間無益于學生刷新任務和抑制任務,甚至可能損害轉換任務表現(Egger et al.,2018)。Schmidt等(2016)所提供的運動-認知效益受個體在運動過程中被激發(fā)的情緒調節(jié)的證據,進一步佐證了運動-認知效益假說尚不足以全面解釋體智融合教學學業(yè)效益(De Greeff et al.,2016a)的發(fā)生路徑。
運動學習行為優(yōu)化假說以學業(yè)表現是學習效果的體現為基礎,立足體智融合教學方式的特征,從教學組織與知識傳授方式對學生課堂投入影響的角度對體智融合教學學業(yè)效益的來源進行分析,并構建了以課堂注意行為作為中介的“運動-課堂專注-學業(yè)”效益假說(Riley et al.,2015;Stapp et al.,2018)。學業(yè)表現不僅與個體智力、認知水平有關,還受到個體學業(yè)投入的影響,如學生的課堂學習狀況,特別是課堂注意。Evans等(1997)提出注意重置理論(Theories of Attentional Reset),認為游戲化課間休息不僅對兒童轉換注意、重新聚焦于后續(xù)學業(yè)任務具有積極的促進作用,同時對豐富個體體驗和經驗、提升教學效果亦大有裨益。針對課間休息和課堂注意與學生學業(yè)的復雜相關性,體智融合教學通過檢驗干預前后學生課上任務專注時間,以及課上專注與非專注行為發(fā)生頻率的變化(Mavilidi et al.,2020;Stapp et al.,2018),探討體智融合教學對學生課堂表現的影響,并通過學業(yè)能力測試或知識學習效果評價形成“運動—課堂專注—學業(yè)”的效益發(fā)生路徑(Riley et al.,2015;Stapp et al.,2018)。評價結果顯示,體智融合教學所取得的學業(yè)效益與運動對個體注意品質的優(yōu)化相關,即學生課堂專注時間延長、課堂分心行為減少。相對于學業(yè)表現是個體認知水平外化的“認知-學業(yè)”理論,課堂行為優(yōu)化假說更注重個體在學習過程中的付出,即學業(yè)表現是個體課堂學習結果的反映。運動學習行為優(yōu)化假說的理論基礎在于教學對學習表現的影響,但體智融合課間的學業(yè)促進效益并未顯著優(yōu)于有氧運動課間(Fedewa et al.,2018)的結果,使該假說有關教學方式可影響學習結果的論斷備受質疑。雖然體智融合教學延緩學生課堂注意渙散進程的效益(Goh et al.,2016,2018)得到了不同強度運動干預研究結果的支持(Grieco et al.,2016),且對小學男生的作用尤為突出(Watson et al.,2018,2019),但這種效益只是停留在降低學生課上分心行為發(fā)生頻率和促進課堂學習策略的選用,并未對學生課上回答問題、參與互動等課堂投入行為產生顯著的影響,特別是對學生的學業(yè)態(tài)度并無積極影響(Owen et al.,2018)。故而,當前運動—課堂投入—學業(yè)的效益路徑仍停留在單純描述個體行為,而對專注行為改善背后深層的教育、學習、心理機制的解釋相對不足,因此尚不能完全揭示課堂運動干預與學業(yè)改善的量化關系。
綜上,當前效益解釋假說及其研究證據尚無法解構課堂注意行為與個體心理之間存在的潛在聯系,亦鮮見行為塑造與心理能力之間基礎研究證據。同時,基于運動、健康水平、認知功能、學業(yè)表現的相關關系,當前的兩項效益解釋假說在生理基礎的解釋上有待進一步完善。
體智融合教學項目自應用以來,雖然在教案設計、教師培訓、實施流程上積累了豐富的經驗(Dinkel et al.,2017),但作為一項教育現場實驗研究,早期研究大多采用準實驗設計(Van der Niet et al.,2016;Verhagen,2020),部分研究存在無前測或對照組設置不完全等不足(Graham et al.,2014;Mullender-Wijnsma et al.,2015),不利于厘定實驗效果和總結經驗。雖然近年隨機對照干預方案應用于體智融合教學已日臻成熟,但干預劑量依據不明、干預周期過短、干預過程執(zhí)行監(jiān)管不力等問題仍是導致實驗結果偏倚的重要風險來源(Watson et al.,2017)。
當前干預劑量的設計依據主要來自實驗室運動認知干預的研究經驗和學校環(huán)境的執(zhí)行限制,通常單次干預時間為5~15 min,部分研究可達20 min或以上;單周干預頻率在3~5次。已有研究表明,單次5 min的運動干預由于時長過短(Howie et al.,2014),經隨機對照實驗證實無法顯著提升小學生的學業(yè)表現(Watson et al.,2018,2019);而單次10 min的有氧運動課間融合教學方案對小學生閱讀能力的提升效益則得到多水平增長模型分析結果的支持(Fedewa et al.,2018)。由此推斷,單次干預時長的有效取值以10~20 min為宜。除了實驗證據外,有研究者認為,干預劑量的設計還可結合運動健康指南和校內已有運動機會進行整體設計。這一建議的依據為,若每周MVPA累積時長達到健康部門推薦的50~70 min,則受試者學業(yè)表現更佳(Aibar et al.,2020)。Donnelly等(2013)在規(guī)劃運動干預劑量時,首先根據健康部門建議的運動量核算學生在校運動總時長,然后再計算當前在校運動劑量與目標劑量差額,以此為依據確定日均干預劑量,經過為期3年的運動干預,體智融合教學干預組學生韋氏個人測驗(Wechsler Individual Achievement Test-Third Edition,WIAT-Ⅲ)有關閱讀理解、數學能力、拼寫能力3個維度顯著高于對照組(Donnelly et al.,2017)。
基于探討問題的不同,干預研究可分為單次干預、短期干預和長期干預研究。教育對個體心理與行為影響的相關研究多采用中長期干預,以長程追蹤設計或隊列設計觀察教學干預對個體身心發(fā)展影響的動態(tài)變化,以及干預結束后心理行為改善的保持。既往體智融合教學研究所設定的干預周期短則4周,長則3年。如A+PAAC項目開展的相關研究大多持續(xù)1年以上,并在周期內進行若干次中期測試,以考察在體智融合干預下,學生運動水平、認知水平、學業(yè)表現的動態(tài)變化;早期開展的TAKE 10!?項目采用8周觀課數據探討體智融合教學對學生注意渙散進程的延緩作用(Kohl et al.,2001);其他一些研究則針對學生周期內學業(yè)效益的階段性變化展開(Mavilidi et al.,2020;Donnelly et al.,2017;Donnelly et al.,2009;Donnelly et al.,2013)。此類研究雖然取得了較為豐富的研究資料,但因歷時長、實驗控制欠佳,導致學業(yè)效益評價結果的一致性未盡如人意。而近年開展的干預實驗則主要采用4~8周的短期干預方案(Mavilidi et al.,2019,2020;Owen et al.,2018;Riley et al.,2015,2016;Stapp et al.,2018)。這一變化在一定程度上降低了兒童身心發(fā)展對教學結果的影響,但過短的干預周期是否符合學生的知識學習規(guī)律和能力發(fā)展規(guī)律尚需進一步效益評價結果的推定。同時,當前以截面數據和短程干預為主的實驗設計,存在周期短、中期操作檢查與效益評價不足等問題,難以進行交叉滯后等復雜的縱向數據分析,故而無法解釋學業(yè)發(fā)展的動態(tài)變化過程及運動劑量、認知水平、學業(yè)表現、學習行為在時間序列上的相互作用。同時,無論是長期干預還是短期干預,大多數體智融合教學研究均未能在干預結束后設置有效的隨訪評價,因此無法對干預效果的持續(xù)性進行客觀有效地評價。
對體智融合教學干預過程實行監(jiān)控的目的是為了更好地描述干預劑量的落實情況,亦是后續(xù)對因變量變化原因進行有效分析的必要保障。既往在實驗室進行的短時有氧運動干預時間一般約為15 min,受試者需在干預時限內按照器械(跑臺或功率自行車)設定的運動強度持續(xù)運動,直至干預階段結束。這種對運動劑量的嚴格管控為效益來源的分析提供了基本保障,但有別于實驗室對運動強度、有效運動時長的嚴格控制,學校干預劑量的落實受到學生輪流完成動作、整隊、講解等現實教學因素的干擾,而這種時間變量與強度變量上的雜糅嚴重影響了量效估計的準確性(Shore et al.,2020)。當前的研究大多通過加速度計、計步器、心率監(jiān)測儀等運動強度穿戴設備對學生的實際運動量加以量化,并逐漸以MVPA累積時長替代干預時間完成運動劑量的規(guī)劃。盡管如此,大多數研究仍難以達到預期的干預計量。挪威基于ASK(ACTIVE Smarter Kids)項目的群組隨機對照實驗,共對57所小學(28所干預校)1 129名5年級小學生實施為期7個月的校園運動干預,但未發(fā)現學生數學與語文學業(yè)成績顯著提升。經對ASK項目設定的身體活動累積時長與MVPA累積時長進行比較,雖然ASK項目對課堂、課間以及家庭體育作業(yè)等校園運動進行了整合,并為干預組學生提供了平均每周100 min的運動時長,但實驗組與對照組日均MVPA實際累積時長僅相差4 min,在校日均MVPA實際累積時長僅差1 min,而且兩組日均久坐時長也十分接近,說明該項目的運動干預未達到預期目標(Resaland et al.,2016);類似結果亦見于 ACTI-BREAK 項目(Watson et al.,2018,2019)。這兩項應用研究在運動劑量控制上的失敗,提示,大樣本運動干預項目大多存在實驗組與對照組干預劑量梯度落實的問題,也表明了對干預劑量落實水平實施監(jiān)控的必要性。
對體智融合學業(yè)效益進行客觀完整地評價是分析其效益來源和作用方式的起點與歸宿,其中評價內容、評價工具的水平是測評質量的關鍵。目前,體智融合學業(yè)效益的評價包括學業(yè)成就評價與學習表現評價兩方面,同時輔以認知、智力等心理評價結果分析學業(yè)效益的來源(Fedewa et al.,2015),但當前研究中存在評價內容靶向不明、評價工具標準化水平不一、測量等值性偏低等問題,使各研究之間的可比性和可重復性下降(Daly-Smith et al.,2018;Hollis et al.,2017;Watson et al.,2017),因而難以獲得相對穩(wěn)定且一致的結論。同時,受限于數據結構等因素,已有研究所應用的統計方法尚不足以分離學校教學因素和學生個人因素對體智融合教學干預效果的影響。
目前,體智融合教學研究的學業(yè)效益評價工具包括標準化學業(yè)表現測試和非標準化學業(yè)階段測試(如教師根據教學內容制作的知識測驗),部分研究還納入了智力測驗。與非標準化學業(yè)階段測試相比,學業(yè)標準化測試具有良好的測量結構、題目設計和評價常模,并能對學生學業(yè)能力進行跨樣本比較;而非標準化學業(yè)階段測試雖可為學生近期的學習效果提供具有針對性的評價信息,但缺乏跨樣本、跨時間的一致性。事實上,標準化測試和非標準化學業(yè)測試分別用于評價學生學業(yè)表現的不同來源,即能力增長和知識落實。雖然體智融合教學所產生的學業(yè)效益業(yè)已在這兩種測評中取得了相對一致的結果(Mullender-Wijnsma et al.,2015,2016;Vetter et al.,2019),但在具體的效益發(fā)生維度和效益發(fā)生進程上仍有所分歧。如同樣是針對小學生運動教學與數學能力、語言能力和智力發(fā)展關系的探討,Reed等(2010)選用與南加州課程相匹配的 PACT(Palmetto Achievement Challenge Tests)測驗作為評價工具,評價三年級小學生4個月運動化課堂(每天30 min、每周干預3天)的學業(yè)效益,研究結束時雖然學生的英語語言藝術、數學、科學學業(yè)表現均有所提升,但組間未達到統計學顯著差異。而Fedewa等(2015)以美國國家學業(yè)標準測驗(Measures of Academic Progress,MAP)對三至五年級小學生進行每天20 min的運動課堂干預,8個月后學生數學、閱讀和語言應用表現均顯著提升。以上述兩項研究的語言評價為例,前者選用州立學業(yè)評價工具的英語語言藝術維度,后者則以國家學業(yè)評價工具中的語言應用為標準,二者不僅在語言評價維度上不同,而且在工具的評價靶向、題項組織、分數量尺和評價切點上均存在較大的差異(Crodray,2013;Cronin,2004),因此,二者截然不同的學業(yè)效益判定結果并非源于干預方案的不同,而可能僅是兩項研究所選量具本身不等值造成的評價誤差。鑒于此,當前評價工具不一致所導致的矛盾結論不可完全歸因于工具的標準化水平,可能還與不同評價工具之間由于測評理論、內容、難度差異造成的量具不等值問題有關。事實上,這種測評不等值是目前各項研究難以進行跨樣本比較、分析、歸納的重要原因。
認知范式與智力測驗工具不等值的問題同樣也是體智融合教學研究認知效益歸納不力的原因。當前體智融合教學研究主要聚焦于執(zhí)行功能和注意,但二者的研究范式與測試任務較多,且各項研究之間的側重點與傾向性差異亦較大,導致不同范式間的等值性相對較低。以體智融合教學后學生注意的探討為例,不同研究者采用的范式和任務存在明顯差異,如針對學生側抑制的任務共有兩個版本,分別為兒童修訂版和顏色誘導版(Egger et al.,2018;Mavilidi et al.,2019);針對注意集中水平的任務則更為多樣化,包括雙目標字母劃銷測驗(two target letter cancellation test,LCT)、雙任務劃銷測試(trail making test A and B,TTA&TTB)、Ruff形象流暢測試(ruff figural fluency test,RFFT)等 NCT 測驗(Subramanian et al.,2015)和d2-R紙筆測試(區(qū)分d和p的劃銷測試)(Schmidt et al.,2016);其他測試任務還有評價學生對細微變化覺察能力的5 min心理警覺任務(five-minute psychomotor vigilance task,PVT)(Wilson et al.,2016),以及測量學生抑制習慣性行為的Stroop能力傾向測驗(Van der Neit et al.,2016)等注意功能測試。雖然上述測驗與范式均可在一定程度上反映個體認知水平的變化,但在評價內容、評價原理以及結果解釋上并不完全相同,無法調解不同研究結果之間存在的矛盾。與此同時,兒童青少年正處于身心、情智發(fā)展的快速階段,樣本性別、年齡、身心發(fā)展水平和學業(yè)基礎等差異(Novak et al.,2018)均有可能影響學業(yè)效益評價的準確性與有效性。
除了評價工具本身存在的問題,當前體智融合教學學業(yè)效益的分析延續(xù)了實驗室運動認知研究的統計方案,但作為教學應用研究,還需找出干預方案與原有教育教學環(huán)境因素的聯系,籍此探究體智融合教學的獨特學業(yè)貢獻,對于厘定體智融合教學的學業(yè)促進效益、澄清效益特質及來源、挖掘影響因素具有重要意義。已有體智融合干預研究通過篩選、匹配等方式對來源于不同家庭社會經濟狀況、學業(yè)水平、智力發(fā)展水平的學生之間的差異進行分類比較,部分研究還以結構方程模型建立了運動、認知、學業(yè)結果的路徑分析模型,或通過協變量控制部分教學因素對學習結果的影響,然而由于這些研究更多關注學生個體層面存在的差異,忽略了針對教學水平、師資質量、課時安排等造成學業(yè)質量校間差異的學校層面關鍵變量的分析,使其中大多數研究結果無法揭示體智融合教學與原有教育系統內部要素的聯動影響及其作用路徑,因此也就無從開展對體智融合教學學業(yè)效益來源、影響范圍、方案完善等關鍵內容的探討。如PAAC項目采用學業(yè)周期監(jiān)測(Child Academic Monitoring System,CAMS)工具和標準化測試工具對荷蘭54所小學二至三年級小學生的數學能力和運算速度進行測量,階段性測驗結果顯示學業(yè)效益顯著,但3年全程干預結束時,干預組與對照組學生的學業(yè)表現均有提升,但組間未達到統計學顯著差異(Donnelly et al.,2009,2013,2017);TWM-E項目與PAAC項目相同,其小樣本和大樣本結果均顯示所實施的運動干預對小學生語言學業(yè)表現具有促進作用,但其小樣本學生的學業(yè)進步體現在拼寫能力上,而大樣本研究結果則表現為語法和標點運用的邏輯性進步。由于以上研究未能有效納入教育教學層面的學業(yè)質量影響因素,故其在評價組間和跨校樣本間矛盾結果的時候,只能從測量工具效力不足、評價內容脫靶、知識能力增長動態(tài)變化或取樣差異等角度進行解釋,而無法通過學校教學水平、課時安排、教學進度等校間差異因素作出更為深入的探討。
當前的兩項研究假說在研究證據和機制解釋上均不盡完善,各自無法獨立解釋體智融合教學學業(yè)效益背后運動刺激-學業(yè)表現的發(fā)生機制。后續(xù)研究可從心理與行為二者間的聯系入手,貫通認知提升與課堂行為改善兩項假說,并加入生理指標,構建心理-行為-生理的完整效益來源解釋模型以備實證研究檢驗。
以心理學取向為主的運動認知功能提升假說和以教育學取向為主的運動學習行為優(yōu)化假說分別從心理機制和學習行為兩方面對運動刺激-學業(yè)表現進行了解釋,二者的分歧在于學業(yè)成就的主要來源,而非發(fā)展觀與教育觀上的對立,因此可以從心理與行為的表里聯系入手,加以整合?;趯W業(yè)成績是個體認知水平外化構建的運動認知功能提升假說認為,認知水平的增長是體智融合教學學業(yè)效益發(fā)生的關鍵。然而,認知水平的發(fā)展雖然是一個連續(xù)復雜的過程,但個體在特定的年齡階段所能達到的認知發(fā)展水平是相對穩(wěn)定的,包括運動干預在內的認知干預或認知訓練一般無法突破個體本身發(fā)展階段的限制。同時,認知發(fā)展水平并非兒童學業(yè)成績的唯一決定因素,因此,運動—認知—學業(yè)效益路徑雖然符合運動益智論等理論的推導,但在一定程度上脫離了兒童青少年學習和成長的特點。相對而言,運動的學習行為優(yōu)化假說構建的運動—課堂專注—學業(yè)效益路徑則強調課堂行為變化與學業(yè)表現的影響,認為學業(yè)成績源于個體的學習行為,從本質上支持認知發(fā)展水平具有階段穩(wěn)定性的觀點,但未否定運動對樣本內認知發(fā)展水平不均衡的改善作用,因此并未從根本上否定認知發(fā)展差異造成學業(yè)水平差異的可能。事實上,認知水平與學習行為都是影響個體學業(yè)成就的重要因素,二者密切相關,但并非完全對應。如學生運動后課堂專注行為的變化可以作為評價個體注意行為和抑制功能變化的重要外顯指標(Mavilidi et al.,2020;Lassiter et al.,2019;Stapp et al.,2018),而體智融合教學提升個體任務集中性、減少分心行為(95%CI:0.20,1.00)、促進學業(yè)表現[standardized mean difference=1.03(95%CI:0.22,1.84)]的現象與個體認知功能的改善并不存在顯著的相關性[standardized mean difference=0.33(95%CI:-0.11,0.77)](Watson et al.,2017),提示,認知水平、學習行為和學業(yè)表現三者之間存在復雜的關聯性,有待更為綜合的心理-行為假說指導隨機對照實驗和區(qū)域數據分析,以便對運動刺激-學業(yè)表現的效益來源加以解釋。
此外,基于運動、認知、健康、學業(yè)之間復雜的相關關系,后續(xù)理論模型的構建可嘗試納入具有健康評價意義的生理指標(Aibar et al.,2020;Basch,2011;Feter et al.,2019;Donnelly et al.,2016;Sigfúsdóttir et al.,2007;Syv?oja et al.,2018;Voss et al.,2016),以進一步探討體智融合教學學業(yè)效益背后的生理學基礎,增加對運動刺激-學業(yè)表現之間生理學基礎的解釋。雖然穿戴設備可顯著提高干預劑量的精細化水平和客觀化水平,但基于個體身體素質與健康水平的差異,不同個體對運動的耐受程度有所不同,所產生的生理變化亦存在相應差異。雖然個體生理指標監(jiān)測比穿戴設備監(jiān)控成本更高、操作難度更大,但其進一步量化了對受試群體的個體差異,有助于提升運動劑量分析的精細化水平和學業(yè)效益來源機制探討的綜合性。最大攝氧量是運動學業(yè)效益分析中常用的健康評價指標之一,具有年齡增長性和后天可訓練的特點,并可在一定程度上反映中樞和外周對有氧運動的耐受水平與改善程度(Verburgh et al.,2013)。最大攝氧量水平越高,個體伊利諾伊閱讀與數學學業(yè)測試表現越佳(Raine et al.,2018;Oberer et al.,2018)。隨著漸進性有氧耐力跑測試逐漸替代跑臺力竭實驗(Grieco et al.,2016;Hillman et al.,2012;Sj?wall et al.,2017),有氧能力測試的安全性和便利性顯著提高,以之為運動干預評價測試的實驗和截面數據分析逐年增加(ávila-García et al.,2020;Wang et al.,2019)。除最大攝氧量,肥胖的評價作用也得到相關研究的肯定。以腰圍作為肥胖評級指標的3年期追蹤研究表明,腰圍與學業(yè)成績呈負相關,且身體活動與久坐對兒童青少年學業(yè)成績的影響受個體腰圍變化的調節(jié)(Lima et al.,2019)。
目前,有關體智融合教學干預效益研究的干預劑量主要問題:1)運動劑量的設置缺乏研究證據和運動處方的支撐;2)由于關鍵變量的設計融入過多主觀評價,且與已有行為或生理證據缺乏交叉驗證,從而限制了對研究結果的解釋(Pascoe et al.,2020)。因此,后續(xù)研究應從優(yōu)化操作變量入手,以運動推薦量和前人研究經驗提升干預劑量的合理性和有效性,以生理評價指標量化干預質量,分離個體差異對干預結果的影響,解決當前干預劑量設置與落實存在的問題。
首先,在干預劑量的設計上,應當以前人經驗為基礎,結合運動處方劑量規(guī)劃和項目選擇的依據與原則,進一步提升干預劑量的科學性和有效性。在單次劑量的規(guī)劃上以10~20 min中等強度運動為宜,避免干預時長過短導致MVPA累積時長過短而無法達到生理喚醒、影響認知與行為的干預目標,同時也應避免因運動強度過大而造成學生過度興奮或疲勞,影響認知表現及后續(xù)課堂及課外學業(yè)表現(Samuel et al.,2017;Verhagen,2020)。雖然目前尚未形成運動項目、運動劑量、學業(yè)效益的計量研究成果,但已有研究表明,10~20 min的干預劑量可在一定程度上優(yōu)化隨后的課堂表現,減緩課堂注意衰減。同時,干預方案的設計還需綜合考慮單次時長、單周頻率并設計運動方式,結合學校體育固有內容實現兒童青少年運動健康發(fā)展建議,提升運動劑量規(guī)劃的整體性。劑量規(guī)劃后,還可嘗試通過小樣本實時監(jiān)測劑量落實、調整干預方案。近年開展的跨校、跨區(qū)域大樣本研究多從干預樣本中選擇部分研究對象作為運動劑量矯正與學業(yè)、注意行為、認知效益分析的校驗樣本,為量化干預質量、分析學業(yè)效益與身體活動水平的關系提供便利。
其次,引入相關生理評價指標,保障干預劑量的落實。在后續(xù)干預方案的設計過程中,研究者可從確定學業(yè)、認知的靶向生理學指標入手,量化運動干預方案的生理喚醒與變化水平,為心理效益的獲得提供量化分析基礎。目前可供參考、選用的生理學指標除最大攝氧量、腰圍指數、BMI等,還包括腦源性神經營養(yǎng)因子(brain-derived neurotrophic factor,BDNF)、血清兒茶酚胺(plasma catecholamines)等認知相關神經遞質(Azad et al.,2015;Chang et al.,2012;Feter et al.,2019;McMorris et al.,2015;Vaynman et al.,2015),以及功能磁共振成像(fMRI)、事件相關電位(ERP)、腦電圖(EEG)、功能性近紅外光譜技術(fNIRS)等腦結構或腦功能相關的神經心理學檢測技術(Hillman et al.,2008,2012)。此外,汗液采集等體液采集穿戴設備的技術進展(Han et al.,2018;Koh et al.,2016)亦值得關注;量化評價學生課堂注意行為亦可使用便攜式Tobii等設備采集學生課堂眼動數據。
基于當前體智融合教學在測量不等值和測量框架不完整兩方面的問題,后續(xù)研究應從優(yōu)化測量效力、豐富評價指標、擴大樣本等方面入手,構建更為完整的數據采集與分析方案。
首先,在測量等值問題上,后續(xù)研究應明確評價目標,審慎選擇評價工具。研究者應立足研究目的,區(qū)分是以學業(yè)能力發(fā)展為評價對象還是以知識技能習得為評價對象,選擇恰當的教學效果評價工具。其次,無論是選擇學業(yè)評價工具還是認知水平測驗均應基于對學業(yè)領域、具體學業(yè)能力維度、具體認知過程間的相互關聯性及其與運動關系的研究證據,合理選擇靶向學科、認知功能及其研究范式,精細化定量分析,降低測驗盲目多選造成的差異與浪費,從而提升研究效率。如綜合考慮有氧運動對學生注意、記憶、執(zhí)行功能的提升效益,以運動過程對個體計劃、設定并控制行為指向目標、刷新環(huán)境信息認知功能的訓練與提升效益(Koutsandréou et al.,2016;Tomporowski et al.,2015)為靶向或以視覺短時記憶為靶向探討運動對學業(yè)表現的影響(Beck et al.,2016)。
其次,嘗試構建體智融合教學學業(yè)效益分析數據庫。研究者可以在干預的同時采集個體背景信息、生理健康指標、認知功能指標、個體學業(yè)表現與學業(yè)興趣、學校教育因素等信息,通過連續(xù)2~3年的施測,形成完整的追蹤數據庫,整合運動與學生學業(yè)表現(Kern et al.,2018)、運動與生理變化、運動與認知能力(Van der Niet et al.,2015)、生理變化與認知效益、認知能力與學業(yè)表現(Oberer et al.,2018)之間的關系,分離學生學習興趣、自我效能感、情緒體驗、家庭社會經濟狀況、身心發(fā)展水平與發(fā)展速度等學生因素(Mullender-Wijnsma et al.,2016;Owen et al.,2018;Shore et al.,2020;Verhagen,2020),及教師配合、教師培訓質量、教師教學水平等學校層面因素(Calvert et al.,2019;Carlson et al.,2017;Dinkel et al.,2016;Routen et al.,2018;Webster et al.,2015)對體智融合教學干預效果的影響,客觀描述體智融合教學對學生學業(yè)發(fā)展與身心健康促進的綜合作用(De Greeff et al.,2016b;Seljebotn et al.,2019),闡述運動刺激-學業(yè)表現的效益來源,從而揭示體智融合教學學業(yè)效益的內在機制,為進一步提升后續(xù)研究的干預質量乃至教育相關性身心發(fā)展與促進效益,提供研究支撐。
在樣本的選擇上,除了擴大樣本數量,還需盡可能拓展樣本覆蓋的人群,以定位體智融合教學最適宜的應用人群,挖掘其在不同人群中實施的關鍵影響因素,提高教學干預的精準性。在進行小樣本教學實驗時,應當注意區(qū)組匹配,增加組內同質性,提高干預方案設計的針對性,從而提升干預效果評價的準確性。