首新 胡衛(wèi)平 劉念
[摘 ? 要] 發(fā)展高層次思維已成為STEM跨學(xué)科教學(xué)的重要目標(biāo),但如何評估STEM學(xué)習(xí)中的高層次思維,仍沒有可行的工具。本研究采用問卷調(diào)查、專家咨詢等研究方法,運(yùn)用探索性結(jié)構(gòu)方程模型(ESEM)、層次分析(AHP)、擬合Rasch模型等手段,建立測評模型、確定指標(biāo)權(quán)重、開發(fā)測評工具。數(shù)據(jù)分析顯示,中小學(xué)STEM學(xué)習(xí)中高層次思維測評工具具有良好的信度和結(jié)構(gòu)效度。正式測量發(fā)現(xiàn),小學(xué)階段學(xué)生STEM學(xué)習(xí)中高層次思維整體呈現(xiàn)波動增長,性別、地域等因素影響較小。測評模型對評估中小學(xué)STEM教育項(xiàng)目具有應(yīng)用價(jià)值。
[關(guān)鍵詞] STEM教育; 高層次思維; 測評; Rasch模型; 義務(wù)教育階段
[中圖分類號] G434 ? ? ? ? ? ?[文獻(xiàn)標(biāo)志碼] A
[作者簡介] 首新(1987—),男,重慶梁平人。講師,博士,主要從事科學(xué)教學(xué)心理研究。E-mail:346532216@qq.com。胡衛(wèi)平為通訊作者,E-mail:weipinghu@163.com。
一、研究背景
發(fā)展高層次思維(Higher Order Thinking)是STEM跨學(xué)科學(xué)習(xí)區(qū)別于傳統(tǒng)學(xué)科知識和技能導(dǎo)向?qū)W習(xí)的重要特征。隨著跨學(xué)科課程改革的不斷推進(jìn)以及核心素養(yǎng)培養(yǎng)目標(biāo)的確立,STEM教育理念下的高層次思維培育在世界范圍內(nèi)得到了高度重視。那么,何為高層次思維呢?早期Bartlett認(rèn)為,高層次思維過程是個(gè)體為彌補(bǔ)先驗(yàn)知識不足而進(jìn)行改補(bǔ)、推斷、重新解釋的過程[1]。這一界定帶有濃郁的教育哲學(xué)意味,是從統(tǒng)整的視角看待新知識對先驗(yàn)經(jīng)驗(yàn)的“間隙填充”。Resnick認(rèn)為,若問題解決過程沒有固定的規(guī)則路徑,需要應(yīng)用多個(gè)判斷標(biāo)準(zhǔn),且常常涉及不確定性,那么,高層次思維必定參與問題解決過程[2]。Lewis等人對Resnick的觀點(diǎn)進(jìn)行了心理學(xué)視角的詮釋,認(rèn)為高層次思維是個(gè)體面對復(fù)雜情境探求信息的過程中,記憶中的已知信息與尋求到的新信息之間相互影響或(和)重新組合、延伸整合后達(dá)成某一目標(biāo)的過程[3]。Goodson認(rèn)為,當(dāng)個(gè)體面臨的情境是不熟悉的,要解決的是不確定的、或兩難的問題,高層次思維便被激活了,其表現(xiàn)是能進(jìn)行正確的解釋、決策以及形成創(chuàng)造性的產(chǎn)品[4]。從外在表現(xiàn)描述學(xué)習(xí)效果為高層次思維培養(yǎng)找到了突破口,導(dǎo)致教育目標(biāo)從識字、記憶等發(fā)展到了推理、判斷、創(chuàng)新等積極的心智建構(gòu)[5]。Richland認(rèn)為,高層次思維是一種關(guān)系結(jié)構(gòu)映射(A Relational Structure Mapping)[6],反映出學(xué)科內(nèi)容與能力的映射關(guān)系:跨學(xué)科的信息分離和整合發(fā)展出更復(fù)雜的關(guān)系,學(xué)習(xí)這些關(guān)系(如相似、不同、因果關(guān)系等)必定涉及問題解決、推理等高層次思維。在當(dāng)前STEM跨學(xué)科整合趨勢下,這一觀點(diǎn)回應(yīng)了高層次思維與學(xué)科內(nèi)容之間的關(guān)系,二者表現(xiàn)出映射結(jié)構(gòu)。
測評高層次思維由來已久。Ross等人較早依據(jù)布盧姆教育目標(biāo)認(rèn)知過程中的分析、綜合、評價(jià)層級,開發(fā)了篩選4—6年級天才學(xué)生的高層次思維量表(The Ross Test of Higher Cognitive Processes)[7],但是后來由于這一認(rèn)知過程理論飽受爭議,因此,使用逐漸較少。為回應(yīng)學(xué)校教育檢驗(yàn)高層次思維的需求,Piaw等人設(shè)計(jì)了創(chuàng)造—批判思維測驗(yàn)(Creative-Critical Thinking Styles Test)[8],但該量表將批判性思維與創(chuàng)造性思維相對立,這一觀點(diǎn)仍有待進(jìn)一步商榷。國內(nèi)也進(jìn)行了相關(guān)研究,如楊翊等人也基于布魯姆教育目標(biāo)認(rèn)知過程構(gòu)建了高階思維測評框架[9],但理解、應(yīng)用階段是否蘊(yùn)含高層次認(rèn)知過程,目前仍有爭議;姜玉蓮等人利用數(shù)據(jù)驅(qū)動的因素分析顯示,高層次思維包括創(chuàng)新性思維、決策能力、元認(rèn)知與反思性評價(jià)、問題解決能力、同伴情感支持、自我效能感、批判性思維、自我調(diào)節(jié)學(xué)習(xí)等8個(gè)要素[10]。目前,國內(nèi)研究者多關(guān)注某一特定思維(如復(fù)雜問題解決、創(chuàng)造性思維等)的測評研究,專門用于中小學(xué)STEM學(xué)習(xí)活動中測評高層次思維的工具在已有文獻(xiàn)中很少提及。
以往研究成果對明晰高層次思維結(jié)構(gòu)、測量模型等具有參考價(jià)值,但仍存有較大的完善空間。第一,高層次思維結(jié)構(gòu)確立方法有待精準(zhǔn)化。大多數(shù)研究通過分析已有測評模型、解讀課程標(biāo)準(zhǔn)等手段建立高層次思維結(jié)構(gòu),這容易忽略文化、學(xué)生學(xué)習(xí)特征的影響,以及期望課程與實(shí)際課程的差異[11]。第二,高層次思維的學(xué)科化測評框架有待明晰。研究者普遍認(rèn)為,高層次思維具有領(lǐng)域特殊性(Domain-specific Construct)[12],學(xué)科內(nèi)容對其有關(guān)鍵作用。因此,基于學(xué)科內(nèi)容建立測評框架是未來研究的趨勢,這可以了解學(xué)生在具體課程方案中的高層次思維狀況,以便改進(jìn)課程。第三,大規(guī)模高層次思維測評理論有待豐富。雖然高層次思維評價(jià)得到空前重視,但一些大型國際測評項(xiàng)目如PISA、TIMSS目前并沒有單獨(dú)的評估高層次認(rèn)知過程。因此,PISA(2021)擬單獨(dú)評估15歲青少年的創(chuàng)造性思維,這為建立大規(guī)模高層次思維測試模型奠定了基礎(chǔ)。
為彌補(bǔ)上述高層次思維測評研究的不足,方法上,本研究通過數(shù)學(xué)建模確立面向STEM學(xué)習(xí)的高層次思維測評模型(STEM Based Higher Order Thinking Assessment Model),以提高研究過程的標(biāo)準(zhǔn)化程度,增強(qiáng)測評的規(guī)范性和實(shí)用性。測試任務(wù)設(shè)計(jì)過程中,以STEM跨學(xué)科內(nèi)容為情境設(shè)計(jì)試題,確保對STEM學(xué)習(xí)過程具有診斷、調(diào)節(jié)和監(jiān)督功能,進(jìn)而以評價(jià)結(jié)果“返哺”STEM學(xué)習(xí)過程,促進(jìn)學(xué)生高層次思維可持續(xù)發(fā)展。
二、研究過程和方法
首先,依據(jù)文獻(xiàn)分析,同時(shí)結(jié)合小學(xué)、初中科學(xué)課程標(biāo)準(zhǔn)(2017、2011),以及STEM跨學(xué)科學(xué)習(xí)特征,析出高層次思維測評指標(biāo),解決測評指標(biāo)僅僅依靠課標(biāo)解讀或簡單移植的弊病;其次,進(jìn)行專家咨詢,確定指標(biāo)權(quán)重,解決測評指標(biāo)之間動態(tài)關(guān)系不明的問題;最后,遵循測評指標(biāo)及其權(quán)重,依據(jù)情境化試題設(shè)計(jì)過程,開發(fā)測評工具,并進(jìn)行初步檢驗(yàn),驗(yàn)證測評工具的信效度。
(一)確定測評指標(biāo)
目前,從STEM學(xué)習(xí)情境中測評高層次認(rèn)知過程的工具并不多見。以前研究者普遍認(rèn)可的高層次思維要素包括創(chuàng)造性思維、批判性思維、問題解決過程、決策思維、元認(rèn)知等,我們擬利用STEM學(xué)習(xí)中的具體內(nèi)容和行為來間接表征上述要素。同時(shí),我們也考慮了STEM學(xué)習(xí)中的科學(xué)探究策略、學(xué)習(xí)動機(jī)、態(tài)度等思維傾向,因?yàn)橐院献魈骄繛橹鞯腟TEM活動中,同伴間的社會建構(gòu)對個(gè)體高層次思維發(fā)展具有重要作用[13]。
在具體操作過程中,我們參考了國內(nèi)外高層次思維通用框架、領(lǐng)域化測評框架中的認(rèn)知過程條目。如“Kaufman領(lǐng)域創(chuàng)造力量表”中的日常、學(xué)術(shù)、科學(xué)題目[14];Borich評估美國中小學(xué)生高級思維的“高階思維和問題解決核查表”[15];“Halpern 批判性思維評價(jià)”中涉及STEM學(xué)科的題目[16];改編大學(xué)生批判性思維傾向問卷[17]、問題解決能力評分指標(biāo)[18]、典型行為創(chuàng)造性思維能力測驗(yàn)[19]、高階思維結(jié)構(gòu)調(diào)查問卷[20],加入STEM課堂背景,刪除與中小學(xué)生學(xué)習(xí)不相關(guān)的題目;截取“中學(xué)生社會問題解決能力量表”中的社會科學(xué)問題[21]。同時(shí),還參考成熟的“加利福尼亞批判性思維傾向問卷”“Torrance創(chuàng)造性思維測驗(yàn)”中有關(guān)學(xué)習(xí)行為的測查指標(biāo)。另外,還借鑒了“科學(xué)學(xué)習(xí)動機(jī)量表”[22]、“對科學(xué)學(xué)習(xí)的態(tài)度量表”[23]、“物理實(shí)驗(yàn)元認(rèn)知水平問卷”[24]中有關(guān)高層次思維傾向的觀測指標(biāo)。最終,初步形成117項(xiàng)測評條目。
利用調(diào)查樣本對測評條目進(jìn)行降維,析出測評指標(biāo)。調(diào)查對象來自某直轄市451名中小學(xué)生,其中,男生占55.4%、女生占44.6%;農(nóng)村學(xué)生占59.8%,城鎮(zhèn)學(xué)生占40.2%。使用SPSS 22、MPLUS 7.4進(jìn)行數(shù)據(jù)處理。
(二)確定指標(biāo)權(quán)重
結(jié)合專家咨詢意見,使用AHP法梳理指標(biāo)的權(quán)重。咨詢對象是高等院校15名科學(xué)教育、學(xué)科課程與教學(xué)的專家和科學(xué)教育學(xué)博士。邀請專家對測評指標(biāo)按照經(jīng)驗(yàn)進(jìn)行兩兩比較(i,j),形成重要性比例標(biāo)度(aij,1-9的數(shù)值,1表示ai與aj同樣重要,3表示ai比aj略微重要,5表示ai比aj重要,7表示ai比aj明顯重要,9表示ai比aj絕對重要;2、4、6、8表示兩個(gè)相鄰判斷的中間值)。根據(jù)aij值形成專家判斷矩陣,計(jì)算特征向量和最大特征值,并進(jìn)行一致性檢驗(yàn),最終通過層次總排序得出測評指標(biāo)權(quán)重值。
(三)形成測評工具
依據(jù)測評指標(biāo)及其權(quán)重,設(shè)計(jì)情境化試題考查STEM跨學(xué)科背景下的高層次認(rèn)知過程。測試題設(shè)計(jì)包括背景材料、知識內(nèi)容、認(rèn)知過程等三個(gè)要素。背景借鑒了PISA(2015)劃分的個(gè)人、地區(qū)/國家、全球等三層級背景,是帶有科學(xué)意義的現(xiàn)象、觀點(diǎn)或規(guī)范。知識內(nèi)容具有跨學(xué)科性,旨在建立認(rèn)知過程的起點(diǎn),以此形成思維能力主導(dǎo)、必備知識引導(dǎo)、認(rèn)知過程參與、情感態(tài)度支持的心理表征過程。另外,知識內(nèi)容還充當(dāng)喚醒某一認(rèn)知過程的作用。
采用如下程序形成測評工具:(1)修訂①、自編題目,組成試卷初稿。(2)邀請1名科學(xué)教育專家、2名科學(xué)教育研究生、2名高級科學(xué)教師評估題目與測試指標(biāo)的一致性、題目難度,以及術(shù)語表述、語言陳述等方面的問題。研究者本人也結(jié)合自身專業(yè)判斷對有爭議的題目進(jìn)行進(jìn)一步修訂。(3)建立Rasch模型進(jìn)行3輪測試,完善測評工具的信效度。(4)利用工具進(jìn)行大規(guī)模測試,評估STEM學(xué)習(xí)中的高層次思維。
評估測評工具信效度的調(diào)查對象來自某直轄市4所普通小學(xué)2—6年級516名學(xué)生,見表1。采用Winsteps3.72.3軟件分析測評工具信效度,應(yīng)用SPSS 22 軟件分析STEM學(xué)習(xí)中高層次思維狀況及影響因素。
三、研究結(jié)果
(一)中小學(xué)STEM學(xué)習(xí)中高層次思維測評指標(biāo)
首先進(jìn)行正態(tài)分布、信度和效度檢驗(yàn)。偏峰度檢驗(yàn)顯示,偏度系數(shù)和峰度系數(shù)大部分小于1,基本符合正態(tài)分布;Cronbachs Alpha信度系數(shù)0.921;采用KMO和Bartlett球形檢驗(yàn),顯示KMO值0.917,χ2=21060.949,df=6786,p<0.01,初步判定可進(jìn)行探索性因素分析。
按照因子載荷大于0.45的標(biāo)準(zhǔn),逐步刪除載荷小于0.3,或者僅有3個(gè)以下指標(biāo)構(gòu)成的公因子項(xiàng),最后刪除66個(gè)條目,保留51個(gè)條目,此時(shí)Cronbachs Alpha信度系數(shù)0.960,Guttman半分信度0.900,KMO和Bartlett球形檢驗(yàn)顯示,KMO值0.959,χ2=9140.169,df=1275,p<0.01,問卷信度較好。最終,共抽取9個(gè)公因子,其共同性大于0.5,累計(jì)方差貢獻(xiàn)率達(dá)到54.751%。
再利用MPLUS 7.4 進(jìn)行探索性因素分析(EFA),驗(yàn)證抽取9個(gè)公因子的合理性。MPLUS 進(jìn)行EFA也可以提供模型擬合指標(biāo),從而判斷模型擬合情況,當(dāng)抽取8、9、10個(gè)公因子時(shí),擬合指標(biāo)見表2,各指標(biāo)的含義可見相關(guān)文獻(xiàn)[25]??梢园l(fā)現(xiàn),抽取9個(gè)公因子時(shí),模型擬合指標(biāo)較好。
采用探索性結(jié)構(gòu)模型(ESEM)和驗(yàn)證性因子分析(CFA)進(jìn)行驗(yàn)證性因素分析。ESEM吸納了探索性和驗(yàn)證性因素分析、結(jié)構(gòu)方程模型的特點(diǎn),兼具有目的的探索和驗(yàn)證功能。抽取9個(gè)公因子時(shí),ESEM和CFA模型擬合情況見表3??梢园l(fā)現(xiàn),ESEM擬合較好。這和兩個(gè)模型的假設(shè)有關(guān),CFA會限制某些因子載荷為0而高估其中一個(gè)或幾個(gè)因子的載荷,以及因子與外部變量的關(guān)系,因此,擬合指標(biāo)相對不太理想。但總體而言,提取9個(gè)公因子能很好地說明高層次思維的結(jié)構(gòu)。
利用ESEM和CFA抽取9個(gè)公因子所包含的條目基本一致,稍有不同的是,ESEM使某些條目在幾個(gè)公因子中出現(xiàn)了跨載荷的情況,且ESEM提取的某些條目的載荷較低。對于抽取結(jié)果有差異的、ESEM因子載荷低于0.3的以及跨載荷的條目,我們通過查看條目內(nèi)容判斷是否刪除、修訂以及變更。因?yàn)镃FA分析顯示,因子載荷都在0.5以上,說明前期EFA分析結(jié)果較為可靠。最終,修訂條目A36、A41、A28、A8、A40、A50、A2、A12,再進(jìn)行驗(yàn)證性因素分析,如圖1所示,模型擬合良好。
最終,中小學(xué)STEM學(xué)習(xí)中高層次思維測評指標(biāo)為9個(gè):第一個(gè)命名為“問題解決”,闡述的是學(xué)生的探究學(xué)習(xí)過程;第二個(gè)命名為“元認(rèn)知與反省”,闡述的是STEM學(xué)習(xí)的計(jì)劃、組織、信息解釋、反思等過程;第三個(gè)命名為“創(chuàng)造性思維”,解釋了從多角度、應(yīng)用創(chuàng)新的方法解決問題;第四個(gè)命名為“批判性思維”,闡述的是STEM學(xué)習(xí)中對不同觀點(diǎn)的論證、評價(jià)以及交流的能力;第五個(gè)命名為“決策思維”,闡述的是STEM學(xué)習(xí)中的推理、合理選擇、適時(shí)分析與預(yù)測的過程;第六個(gè)命名為“自我監(jiān)控”,解釋了STEM學(xué)習(xí)中自我管理過程;第七個(gè)命名為“遷移與應(yīng)用”,闡述的是將STEM學(xué)習(xí)中形成的行為規(guī)范、知識、方法等遷移到真實(shí)情境或其他領(lǐng)域;第八個(gè)命名為“科學(xué)方法”,闡述的是STEM學(xué)習(xí)中形成的思路、標(biāo)準(zhǔn)、規(guī)范、技能、模式等;第九個(gè)命名為“自我調(diào)節(jié)”,闡述的是STEM學(xué)習(xí)中面對不合理因素的自我反應(yīng)。具體說明見表4。
(二)中小學(xué)STEM學(xué)習(xí)中高層次思維測評指標(biāo)權(quán)重
中小學(xué)STEM學(xué)習(xí)中高層次思維測評指標(biāo)的重要性各不相同,為了客觀呈現(xiàn)重要性比例標(biāo)度(aij),邀請15位專家評分,取平均值建立判斷矩陣,權(quán)重向量見表5,同時(shí)計(jì)算出指標(biāo)權(quán)重、最大特征根λmax和檢驗(yàn)系數(shù)CR。
綜合中小學(xué)STEM學(xué)習(xí)中高層次思維測評指標(biāo)及其權(quán)重值,可以構(gòu)建測評模型的數(shù)學(xué)方程式:
公式中,Y為STEM學(xué)習(xí)中高層次思維能力的綜合評價(jià)值,Wi為第i項(xiàng)指標(biāo)的權(quán)重,Ri為學(xué)生在第i項(xiàng)測評指標(biāo)中的分?jǐn)?shù)。Y值越大,表明高層次思維能力越強(qiáng)。
(三)中小學(xué)STEM學(xué)習(xí)中高層次思維測評工具的開發(fā)
編制題目是工具開發(fā)的重點(diǎn),遵循以下原則:嚴(yán)格遵循測評指標(biāo)和權(quán)重,題目反映某一高層次認(rèn)知過程,題目具有STEM跨學(xué)科背景,內(nèi)容基于每個(gè)年級學(xué)生所學(xué)知識,題目之間相互獨(dú)立,題目以開放題為主,并建立良好的評分標(biāo)準(zhǔn)。工具最初包括39個(gè)題目,建立部分賦值Rasch模型,根據(jù)擬合度、題目難度—被試能力圖(Item-Person Map)、等級概率值等指標(biāo)對部分題目(共10個(gè))進(jìn)行修訂,最終,正式測評工具包括39個(gè)題目(10個(gè)選擇題,29個(gè)主觀構(gòu)造題)。選擇題采用0、1記分,針對開放題,根據(jù)部分賦值Rasch模型提供的等級概率曲線對評分標(biāo)準(zhǔn)進(jìn)行修訂,部分賦值Rasch模型的優(yōu)勢是可以針對每個(gè)題的等級評分進(jìn)行參數(shù)估計(jì),從而更加直觀地判斷評分的合理性。修訂之后,開放題記分0、1、2,或0、1、2、3,或0、1、2、3、4。
正式測評顯示題目質(zhì)量良好:測試工具的Alpha信度系數(shù)為0.94,所選被試能力信度為0.77,題目難度—被試能力圖顯示,被試能力絕大多數(shù)都有試題群與之對應(yīng),說明題目有較好的代表性,避免了天花板效應(yīng)和地板效應(yīng),被試能力和題目難度基本呈正態(tài)分布。但也發(fā)現(xiàn),某些能力水平的被試并沒有合適的題目匹配,如Rasch值為-0.59~-0.21間的被試(即題MI3與題PR6之間)沒有靶向題目,從經(jīng)典測量理論來看,需要進(jìn)一步增加難度值在0.55~0.65之間的題目。
進(jìn)一步利用ESEM模型驗(yàn)證39個(gè)題目與測試指標(biāo)之間的關(guān)系,當(dāng)公因子設(shè)定為9時(shí),顯示模型擬合良好(χ2/df=1.418,TLI=0.938,CFI=0.965,SRMR=0.021,RMSEA=0.031),說明題目的載荷與理論預(yù)設(shè)(如指標(biāo)權(quán)重)具有高度一致性。少部分題目出現(xiàn)了跨因子現(xiàn)象,即某一題目可能涉及兩個(gè)或兩個(gè)以上高層次認(rèn)知過程,這正是ESEM模型的優(yōu)勢所在,雖然我們設(shè)計(jì)一個(gè)題目時(shí)盡量只關(guān)注一個(gè)指標(biāo),但高層次思維指標(biāo)之間本身就具有相關(guān)性,可進(jìn)一步對跨因子的題目進(jìn)行修訂。
(四)中小學(xué)STEM學(xué)習(xí)中高層次思維總體狀況及差異
1. 中小學(xué)STEM學(xué)習(xí)中高層次思維狀況
測試工具包括5個(gè)鏈接題,利用鏈接題可將各年級的高層次思維測評結(jié)果固定在同一量尺上進(jìn)行發(fā)展?fàn)顩r分析。如圖2所示,二到六年級學(xué)生在STEM學(xué)習(xí)中的高層次思維差異顯著,F(xiàn)(2,249)=19.580,p<0.01,整體呈現(xiàn)上升趨勢,在四年級有所回落,但二、四年級無顯著差異(p=0.646)。這一結(jié)果與其他高層次思維測量研究基本一致,如董奇等人發(fā)現(xiàn)兒童發(fā)散思維能力在一至三年級呈現(xiàn)上升趨勢,在四年級開始下降,五年級后又逐漸上升[26]。
2. 中小學(xué)STEM學(xué)習(xí)中高層次思維差異分析
采用2(性別:男、女)×2(地域:城市、鄉(xiāng)村)兩因素組間設(shè)計(jì)、單因變量方差分析法(Unvariate)分析性別、地域?qū)TEM學(xué)習(xí)中高層次思維的影響。結(jié)果見表6,性別、地域的主效應(yīng)不顯著(p>0.05),說明男女之間、城市和鄉(xiāng)村之間學(xué)生STEM學(xué)習(xí)中的高層次思維無顯著性差異,但總體而言,女生略高于男生(-0.189>-0.346)①,城市略高于農(nóng)村(-0.242>-0.295)。另外,性別、地域以及二者交互作用的效應(yīng)值(ηp2)都很小,如性別差異僅能解釋STEM學(xué)習(xí)中高層次思維1.5%的變異,地域差異僅能解釋0.1%的變異,這也說明男女生、城市和鄉(xiāng)村之間差異不大。這主要是由于本研究樣本年齡跨度較大,而中小學(xué)生的認(rèn)知經(jīng)驗(yàn)處于不斷修正和發(fā)展之中,高層次認(rèn)知過程在不斷完善,雖然在各年齡段有所差異,但總體而言,男女生都表現(xiàn)出不斷向前發(fā)展,導(dǎo)致差異較小。
四、討論與分析
(一)中小學(xué)STEM學(xué)習(xí)中高層次思維測評指標(biāo)及其權(quán)重清晰
研究結(jié)果顯示,雖然驗(yàn)證性因素分析顯示因子載荷均大于0.5,但采用探索性結(jié)構(gòu)模型(ESEM)發(fā)現(xiàn),某些條目出現(xiàn)了跨載荷的現(xiàn)象,這顯示了ESEM的分析優(yōu)勢,同時(shí)也說明了STEM學(xué)習(xí)中的高層次思維要素之間存在緊密聯(lián)系。進(jìn)一步采用二階因子模型(Second Order Confirmatory Factor Analysis)分析發(fā)現(xiàn),決策思維(S5)是一個(gè)跨載荷指標(biāo)(載荷分別是0.440、0.491),這和決策思維本身所蘊(yùn)含的復(fù)雜的高層次認(rèn)知過程不無關(guān)系。針對預(yù)期目標(biāo),在一定約束條件下,從諸多方案中選其一,并付諸實(shí)施,稱為決策[27]。從其定義可以推論,決策思維與問題解決、創(chuàng)造性思維、批判性思維、科學(xué)方法等指標(biāo)有強(qiáng)烈關(guān)系。其他指標(biāo)之間也有較強(qiáng)的關(guān)聯(lián),只是沒有達(dá)到因素分析的顯著水平,對測量指標(biāo)進(jìn)行相關(guān)分析,發(fā)現(xiàn)各指標(biāo)間的Pearson相關(guān)系數(shù)在0.710~0.908之間。
指標(biāo)權(quán)重確定過程中顯示出了專家觀點(diǎn)與數(shù)據(jù)驅(qū)動結(jié)果之間的差異。層次分析顯示,決策思維、問題解決、創(chuàng)造性思維、批判性思維擁有較大權(quán)重,這與大多數(shù)研究者的觀點(diǎn)基本一致,都認(rèn)可這四個(gè)指標(biāo)屬于高層次思維。但由于STEM學(xué)習(xí)活動本身的獨(dú)特性,增加了科學(xué)方法、遷移與應(yīng)用、自我調(diào)節(jié)等指標(biāo),但有些指標(biāo)并沒有得到專家的認(rèn)同,如有專家認(rèn)為自我調(diào)節(jié)、自我監(jiān)控不應(yīng)納入STEM學(xué)習(xí)中高層次認(rèn)知過程,但STEM學(xué)習(xí)過程多以小組合作、相互交流、自主探究的方式進(jìn)行,基于同伴互動的自我調(diào)節(jié)和監(jiān)控在合作學(xué)習(xí)中顯然尤為重要。最終,綜合專家意見確定的某些指標(biāo)權(quán)重較小。
綜上所述,通過建立測評指標(biāo)、確定指標(biāo)權(quán)重等過程,我們將STEM學(xué)習(xí)中的高層次思維進(jìn)行了適宜的操作化分解和降維,進(jìn)而建立了中小學(xué)STEM學(xué)習(xí)中高層次思維測評模型,這一模型為后續(xù)建立測評工具提供了理論基礎(chǔ)和操作準(zhǔn)則。
(二)中小學(xué)STEM學(xué)習(xí)中高層次思維測評工具的信效度良好
研究結(jié)果顯示,利用Rasch模型進(jìn)行三輪測試題修訂之后,試題質(zhì)量提高,測評工具信效度良好。在測評工具修訂過程中反映出某些學(xué)科課程內(nèi)容計(jì)劃與學(xué)生思維發(fā)展水平存在不一致。進(jìn)一步使用Rasch模型建立STEM學(xué)習(xí)中高層次思維進(jìn)階層級發(fā)現(xiàn),高年級學(xué)生處于高水平思維層級的占62.34%,比例明顯提高;題項(xiàng)分析發(fā)現(xiàn),這些高水平學(xué)生通常能夠熟練運(yùn)用該階段的知識處理事物之間的相互關(guān)系,并且能夠清晰地描述、推斷其中的緣由,如探索鐵制大門的下部分為何更容易生銹時(shí),他們能夠較好地考慮鐵生銹的影響因素、鐵門下端和上端在接觸人和物體上的差異等。高水平學(xué)生比例過高,很可能源于教科書內(nèi)容安排不適合學(xué)生思維發(fā)展水平,因?yàn)槲覀冊O(shè)計(jì)的測試題是基于學(xué)段課程內(nèi)容的,因此,測試結(jié)果能反映出學(xué)生思維水平與學(xué)科課程內(nèi)容之間的關(guān)系??傮w而言,中低學(xué)段學(xué)生高層次思維呈現(xiàn)正態(tài)分布,但隨著年級升高,STEM學(xué)習(xí)中高層次思維水平呈偏正態(tài)分布,可以推斷,隨著學(xué)生認(rèn)知水平的發(fā)展,高年級的某些學(xué)科內(nèi)容并沒有與之相適應(yīng)。
利用經(jīng)典測量理論進(jìn)一步驗(yàn)證了試題與測評指標(biāo)的對應(yīng)關(guān)系。某些題目的跨因子現(xiàn)象一方面說明了分解STEM學(xué)習(xí)中高層次思維的復(fù)雜性,另一方面也提示我們需要進(jìn)一步修訂測試題。根據(jù)試題設(shè)計(jì)原則,題目之間應(yīng)該保持相對的獨(dú)立性,但由于指標(biāo)之間具有較高的相關(guān)性,也不能完全接受數(shù)據(jù)驅(qū)動的結(jié)果。鑒于此,后續(xù)研究將抽取跨因子題目進(jìn)行具體分析,結(jié)合理論對某些題目進(jìn)行修改,以進(jìn)一步提高試題質(zhì)量。
(三)中小學(xué)STEM學(xué)習(xí)中高層次思維發(fā)展趨勢
研究結(jié)果顯示,中小學(xué)STEM學(xué)習(xí)中高層次思維總體呈現(xiàn)上升趨勢,但在小學(xué)中段有所回落,這可能有兩方面的原因:第一,隨著學(xué)生認(rèn)知水平的快速發(fā)展,過往的認(rèn)知經(jīng)驗(yàn)已經(jīng)不能解釋現(xiàn)象或阻礙了問題解決過程,因此,認(rèn)知結(jié)構(gòu)可能面臨重構(gòu),小學(xué)中段恰好處于這一階段[26],表現(xiàn)出不能理解知識之間的聯(lián)系,進(jìn)而影響了測評表現(xiàn)。第二,逐漸感受到的學(xué)業(yè)壓力抑制了某些高層次思維要素的發(fā)展。傳統(tǒng)的學(xué)校教育要求學(xué)生接受知識、鞏固知識,而對于知識、信息缺乏批判性的思考和創(chuàng)造性應(yīng)用[28],這限制了高層次認(rèn)知過程的發(fā)展。受制于自身的認(rèn)知局限和外部的學(xué)業(yè)壓力,最終導(dǎo)致了小學(xué)中段STEM學(xué)習(xí)中高層次思維的下滑。
研究結(jié)果顯示,中小學(xué)STEM學(xué)習(xí)中高層次思維無顯著的性別差異,男生略低于女生。但后續(xù)建立思維進(jìn)階層級發(fā)現(xiàn),不同思維水平下的性別差異顯著,水平越高,男女生之間的差異越大。這提示教師在進(jìn)行STEM教學(xué)時(shí),應(yīng)根據(jù)思維發(fā)展的性別差異合理安排小組活動,如鼓勵女生充分表達(dá)觀點(diǎn)、推陳出新的同時(shí),也要引導(dǎo)她們進(jìn)行反思;另一方面,要鼓勵男生發(fā)表對問題的看法,引導(dǎo)他們進(jìn)行創(chuàng)造性的設(shè)計(jì)和論證。
五、結(jié) ? 語
通過文獻(xiàn)分析、問卷調(diào)查、專家咨詢等,并結(jié)合實(shí)證數(shù)據(jù)分析,本研究構(gòu)建了中小學(xué)STEM學(xué)習(xí)中高層次思維測評指標(biāo)及其權(quán)重,形成了測評模型。九個(gè)測評指標(biāo)是:問題解決、元認(rèn)知與反省、創(chuàng)造性思維、批判性思維、決策思維、自我監(jiān)控、遷移與應(yīng)用、科學(xué)方法、自我調(diào)節(jié),其大致權(quán)重分別為19.55%、5.18%、15.90%、13.47%、25.69%、3.42%、7.73%、5.39%、3.67%。以此測評指標(biāo)及權(quán)重開發(fā)了測評工具,通過項(xiàng)目反應(yīng)理論和經(jīng)典測量理論修訂后,工具具有較好的信度、結(jié)構(gòu)效度。針對我國目前如火如荼開展的各級各類中小學(xué)STEM教育項(xiàng)目,亦可使用本研究的測評指標(biāo)、測評工具評估“發(fā)展學(xué)生高層次思維”的STEM教學(xué)目標(biāo)。
[參考文獻(xiàn)]
[1] BARTLETT F C. Thinking: an experimental and social study [M]. London: Allen & Unwin, 1958.
[2] RESNICK L B. Education and learning to think[M]. Washington DC: National Academy Press, 1987.
[3] LEWIS A, SMITH D. Defining higher order thinking[J]. Theory into practice, 1993, 32(3):131-137.
[4] GOODSON L, ROHANI F. Higher order thinking skills:definition, teaching strategies, assessment[EB/OL]. (2002-04-17) [2020-01-23]. http://cala.fsu.edu/files/higher_order_thinking_skills.pdf.
[5] 鐘志賢.促進(jìn)學(xué)習(xí)者高階思維發(fā)展的教學(xué)設(shè)計(jì)假設(shè)[J]. 電化教育研究, 2004(12):21-28.
[6] RICHLAND L, SIMMS N. Analogy, higher order thinking, and education[J]. Wiley interdisciplinary reviews cognitive science, 2015, 6(2):177-192.
[7] ROSS J D, ROSS C M. Ross test of higher cognitive processes: administration manual[M]. Novato, CA: Academic Therapy Publications, 1967.
[8] PIAWA C Y. Building a test to assess creative and critical thinking simultaneously[J]. Procedia-social and behavioral sciences, 2010, 2(2):551-559.
[9] 楊翊, 趙婷婷. 中國大學(xué)生高階思維能力測試藍(lán)圖的構(gòu)建[J]. 清華大學(xué)教育研究, 2018, 39(5):59-67.
[10] 姜玉蓮, 解月光. 基于ESEM的高階思維結(jié)構(gòu)測量模型研究[J]. 現(xiàn)代遠(yuǎn)程教育研究, 2017(3):96-106.
[11] 李化俠.小學(xué)生統(tǒng)計(jì)思維測評模型構(gòu)建[J].教育研究與實(shí)驗(yàn),2018(2):77-83.
[12] KUNCEL N R. Measurement and meaning of critical thinking.The National Research Council's 21st Century Skills Workshop, Irvine, California, February 10-11, 2011[C/OL].[2020-06-29].https://atecentral.net/downloads/209/Kuncel_Measuring%20Critical%20Thinking_Paper.pdf.
[13] 祝智庭, 雷云鶴. STEM教育的國策分析與實(shí)踐模式[J]. 電化教育研究, 2018, 39(1):75-85.
[14] KAUFMAN J C. Counting the muses: development of the kaufman domains of creativity scale(K-DOCS)[J]. Psychology of aesthetics creativity & the arts, 2012, 6(4):298-308.
[15] BORICH G D, TOMBARI M L. Education psychology: a contemporary approach[M]. 2nd ed. New York: Longman, 1997.
[16] HALPERN D F. Thought and knowledge: an introduction to critical thinking[M]. 5th ed. New York: Psychology Press, 2014.
[17] 劉義. 大學(xué)生批判性思維研究:概念、歷史與實(shí)踐[D]. 武漢:華中科技大學(xué), 2010.
[18] 余林. 課堂教學(xué)評價(jià)[M]. 北京:人民教育出版社, 2007.
[19] 駱方. 中學(xué)生創(chuàng)造性思維能力測評問卷的編制——一個(gè)典型表現(xiàn)測驗(yàn)[D]. 北京:北京師范大學(xué), 2003.
[20] 姜玉蓮. 技術(shù)豐富課堂環(huán)境下高階思維發(fā)展模型建構(gòu)研究[D].吉林:東北師范大學(xué),2017.
[21] 楊穎. 中學(xué)生社會問題解決能力的結(jié)構(gòu)、特點(diǎn)與功能[D]. 北京:北京師范大學(xué), 2009.
[22] TUAN H L, CHIN C C, SHIEH S H. The development of a questionnaire to measure students' motivation towards science learning [J]. International journal of science education,2005, 27(6): 639-654.
[23] HONG Z R, LIN H S, WANG H H, et al. Promoting and scaffolding elementary school students' attitudes toward science and argumentation through a science and society intervention[J]. International journal of science education, 2013, 35(10):1625-1648.
[24] 物理實(shí)驗(yàn)元認(rèn)知水平問卷[EB/OL]. [2019-11-09] https://www.wjx.cn/jq/2159007.aspx.
[25] 王孟成. 潛變量建模與Mplus應(yīng)用[M]. 重慶:重慶大學(xué)出版社, 2014.
[26] 董奇. 兒童創(chuàng)造性思維發(fā)展心理[M]. 杭州:浙江教育出版社, 1998.
[27] 原道謀. 決策思維初探[J]. 政治學(xué)研究, 1986(10):60-64.
[28] 吳亞婕,姜姍姍. 學(xué)生學(xué)習(xí)過程、批判性思維與學(xué)業(yè)成就的關(guān)系研究[J].電化教育研究,2015,36(12):90-97.