国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

深度解讀學(xué)前教育質(zhì)量評(píng)價(jià)的信度、效度和公平性

2024-02-19 11:38:38陳德枝
幼兒教育·教育科學(xué)版 2024年2期
關(guān)鍵詞:公平性效度信度

【摘要】信度、效度和公平性是學(xué)前教育質(zhì)量評(píng)價(jià)的三個(gè)基本測(cè)量學(xué)屬性。本文基于《教育與心理測(cè)量標(biāo)準(zhǔn)》中信度、效度和公平性的基本內(nèi)涵,結(jié)合學(xué)前教育質(zhì)量評(píng)價(jià)的基本特點(diǎn),闡述學(xué)前教育質(zhì)量評(píng)價(jià)的信度、效度和公平性以及三者間的相互關(guān)系,并針對(duì)當(dāng)前學(xué)前教育質(zhì)量評(píng)價(jià)測(cè)量學(xué)屬性研究進(jìn)展,進(jìn)一步指出未來信度、效度和公平性探索的主要方向和方法。

【關(guān)鍵詞】學(xué)前教育質(zhì)量評(píng)價(jià);信度;效度;公平性

【中圖分類號(hào)】G610 【文獻(xiàn)標(biāo)識(shí)碼】A? ?【文章編號(hào)】1004-4604(2024)1/2-0063-06

學(xué)前教育質(zhì)量評(píng)價(jià)是學(xué)前教育事業(yè)改革和發(fā)展的重要議題。 信度(Reliability)、效度(Valiability)和公平性(Fairness)作為學(xué)前教育質(zhì)量評(píng)價(jià)的基本測(cè)量學(xué)屬性,是評(píng)價(jià)科學(xué)性和權(quán)威性的重要基礎(chǔ)和基本保障。本文基于2014年美國教育研究學(xué)會(huì)、美國心理學(xué)會(huì)和美國國家教育測(cè)量委員會(huì)頒布的《教育與心理測(cè)量標(biāo)準(zhǔn)》中對(duì)信度、效度和公平性的界定,探索學(xué)前教育質(zhì)量評(píng)價(jià)的基本測(cè)量學(xué)屬性,旨在為幼兒園保育教育質(zhì)量細(xì)則的構(gòu)建、學(xué)前教育質(zhì)量評(píng)價(jià)方法和過程的規(guī)范以及幼兒園保育教育質(zhì)量的提升提供方向指引。

一、學(xué)前教育質(zhì)量評(píng)價(jià)的信度及研究進(jìn)展

1.學(xué)前教育質(zhì)量評(píng)價(jià)的信度

信度指重復(fù)測(cè)試結(jié)果的一致性。〔1〕學(xué)前教育質(zhì)量評(píng)價(jià)的信度指評(píng)價(jià)者采用相同的標(biāo)準(zhǔn)對(duì)幼兒園進(jìn)行重復(fù)評(píng)價(jià),以使結(jié)果趨于一致或穩(wěn)定?;趯W(xué)前教育質(zhì)量評(píng)價(jià)目前采用的評(píng)價(jià)方法,信度的影響因素主要來自評(píng)價(jià)內(nèi)容和評(píng)價(jià)者。學(xué)前教育質(zhì)量評(píng)價(jià)通常圍繞評(píng)價(jià)量表或標(biāo)準(zhǔn)展開,因此評(píng)價(jià)量表或標(biāo)準(zhǔn)的可信性也是質(zhì)量評(píng)價(jià)信度的影響因素之一。另外,學(xué)前教育質(zhì)量評(píng)價(jià)多采用評(píng)價(jià)者現(xiàn)場(chǎng)測(cè)評(píng)的方式。雖然對(duì)評(píng)價(jià)者進(jìn)行了統(tǒng)一、嚴(yán)格的測(cè)評(píng)培訓(xùn),但由評(píng)價(jià)者主觀評(píng)價(jià)引起的誤差依然是影響測(cè)評(píng)結(jié)果準(zhǔn)確性的重要因素?!?-5〕

2.學(xué)前教育質(zhì)量評(píng)價(jià)信度的研究進(jìn)展

短時(shí)間內(nèi)有規(guī)模地組織評(píng)價(jià)者對(duì)幼兒園進(jìn)行重復(fù)測(cè)評(píng)具有一定難度。當(dāng)前有關(guān)保教質(zhì)量評(píng)價(jià)的信度估計(jì)主要采用經(jīng)典測(cè)量理論信度系數(shù)估計(jì)的常見方法,如內(nèi)部一致性α系數(shù)、概化系數(shù)、評(píng)分者一致性百分比等。幾種常見的國內(nèi)外保教質(zhì)量評(píng)價(jià)工具,如中國托幼機(jī)構(gòu)教育質(zhì)量評(píng)價(jià)量表(C?ECERS)、〔6〕中國幼兒園教育質(zhì)量評(píng)價(jià)量表、〔7〕幼兒園教育質(zhì)量評(píng)價(jià)手冊(cè)、〔8〕走向優(yōu)質(zhì)——中國幼兒園教育質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)、〔9〕幼兒學(xué)習(xí)環(huán)境評(píng)量表(Early Childhood Environmental Rating Scale)系列、〔10,11〕課堂評(píng)估評(píng)分系統(tǒng)(CLassroom Assessment Scoring System)、〔12,13〕照料者參與性評(píng)量表(Caregiver Involvement Scale)、〔14〕幼兒園教育質(zhì)量評(píng)估(Presc?

hool Program Quality Assessment)〔15〕以及持續(xù)共享思維和情緒情感健康評(píng)量表(Sustained Shared Thinking and Emotional Wellbeing scale)〔16〕等均采用α系數(shù)表征量表評(píng)價(jià)內(nèi)容的一致性。中國托幼機(jī)構(gòu)教育質(zhì)量評(píng)價(jià)量表還采用概化系數(shù)分析量表內(nèi)容的信度?!?7〕評(píng)分者一致性百分比或評(píng)分者相關(guān)系數(shù)是學(xué)前教育質(zhì)量評(píng)價(jià)報(bào)告中評(píng)價(jià)者一致性的常用統(tǒng)計(jì)量,如中國托幼機(jī)構(gòu)教育質(zhì)量評(píng)價(jià)量表、幼兒學(xué)習(xí)環(huán)境評(píng)量表系列和課堂評(píng)估評(píng)分系統(tǒng)等均采用該方法估計(jì)評(píng)分者一致性等?!?8-21〕另外,近年來項(xiàng)目反應(yīng)理論(IRT)也逐步被用于質(zhì)量評(píng)價(jià)信度分析,如多側(cè)面拉希模型(MFRM)方法多被用于中國托幼機(jī)構(gòu)教育質(zhì)量評(píng)價(jià)量表的評(píng)價(jià)者信度等。〔22〕

二、學(xué)前教育質(zhì)量評(píng)價(jià)的效度及研究進(jìn)展

1.學(xué)前教育質(zhì)量評(píng)價(jià)的效度

效度指測(cè)評(píng)結(jié)果被實(shí)證和理論支持所解釋的程度。〔23〕學(xué)前教育質(zhì)量評(píng)價(jià)的效度是指評(píng)價(jià)結(jié)果被來自幼兒園保教質(zhì)量的實(shí)證和理論支持所解釋的程度。具體而言,學(xué)前教育質(zhì)量評(píng)價(jià)的效度通常圍繞學(xué)前教育質(zhì)量評(píng)價(jià)內(nèi)容及內(nèi)在結(jié)構(gòu)、評(píng)價(jià)過程、評(píng)價(jià)結(jié)果與其他變量的關(guān)系、評(píng)價(jià)結(jié)果的解釋和應(yīng)用五個(gè)方面展開。而在實(shí)踐中則圍繞內(nèi)容效度、反應(yīng)過程效度、結(jié)構(gòu)效度和校標(biāo)關(guān)聯(lián)效度四個(gè)方面展開。

內(nèi)容效度以評(píng)價(jià)項(xiàng)目或指標(biāo)的表述、呈現(xiàn)形式、管理和評(píng)分規(guī)則等為取證來源,并以專家判斷為依據(jù)。反應(yīng)過程效度的取證主要來自評(píng)價(jià)者的評(píng)分過程與測(cè)評(píng)結(jié)果預(yù)期解釋的一致性程度。結(jié)構(gòu)效度指評(píng)價(jià)內(nèi)容的內(nèi)在結(jié)構(gòu)與預(yù)先假設(shè)的結(jié)構(gòu)是否一致,通常采用實(shí)證研究來探索和驗(yàn)證結(jié)構(gòu)效度。校標(biāo)關(guān)聯(lián)效度常把兒童發(fā)展水平作為與其他變量的關(guān)系取證。已有研究一般采用兒童語言、數(shù)學(xué)和情感社會(huì)性發(fā)展水平為其他變量,探討質(zhì)量與這些發(fā)展變量的關(guān)系來佐證質(zhì)量評(píng)價(jià)的有效性。〔24-29〕

2.學(xué)前教育質(zhì)量評(píng)價(jià)效度的研究進(jìn)展

一直以來作為學(xué)前教育質(zhì)量評(píng)價(jià)效度研究的關(guān)注點(diǎn),結(jié)構(gòu)效度通常采用探索性因素(EFA)和驗(yàn)證性因素(CFA)分析學(xué)前教育質(zhì)量評(píng)價(jià)工具的潛在內(nèi)部結(jié)構(gòu)。如探索性因素和驗(yàn)證性因素的分析結(jié)果表明,幼兒學(xué)習(xí)環(huán)境評(píng)量表主要評(píng)價(jià)兩個(gè)潛在因子:結(jié)構(gòu)性質(zhì)量和過程性質(zhì)量。〔30〕由于評(píng)價(jià)量表和樣本量的不同以及探索性因素方法本身的限制,研究所得結(jié)論可能有所不同。有研究結(jié)果顯示幼兒園保教質(zhì)量由兒童課程和活動(dòng)的結(jié)構(gòu)與支持、教職人員與幼兒間的互動(dòng)及對(duì)教師專業(yè)成長(zhǎng)和家長(zhǎng)需求的支持三個(gè)潛在結(jié)構(gòu)組成?!?1〕

來自與其他變量關(guān)系的效度取證研究也是學(xué)前教育質(zhì)量評(píng)價(jià)效度研究的熱點(diǎn)。受兒童情感社會(huì)性測(cè)量等所限,當(dāng)前效度取證的其他變量更多采用的是兒童語言和數(shù)學(xué)認(rèn)知發(fā)展,并通過求取這些變量與質(zhì)量評(píng)價(jià)結(jié)果的關(guān)系來探討效度。采用的分析方法由簡(jiǎn)單的二元相關(guān)到復(fù)雜的回歸分析,如多水平回歸模型等?!?2,33〕近年來,幼兒園保教質(zhì)量的縱向追蹤和增值評(píng)價(jià)已成為學(xué)前教育質(zhì)量評(píng)價(jià)效度研究的一大趨勢(shì)。〔34-36〕

內(nèi)容效度主要用于統(tǒng)計(jì)和分析專家評(píng)判結(jié)果的一致性。另外,已有文獻(xiàn)中僅有少量研究對(duì)過程效度進(jìn)行了初步探討。這些研究主要采用項(xiàng)目反應(yīng)理論的等級(jí)反應(yīng)模型(Grade Response Model)、一般分步評(píng)分模型(Generalized Partial Rating Model)等多級(jí)計(jì)分方法探討照料者參與性評(píng)量表和幼兒學(xué)習(xí)環(huán)境評(píng)量表的過程效度?!?7-39〕過程效度之所以被忽略,一方面可能是因?yàn)檫^程效度的分析方法還不夠簡(jiǎn)便和大眾化;另一方面則是因?yàn)檫^程效度概念本身還未引起足夠的重視。

在評(píng)價(jià)結(jié)果解釋和應(yīng)用的有效性方面,美國的質(zhì)量評(píng)價(jià)和提升系統(tǒng)(Quality Rating and Imp?

roving System)不僅涉及不同的評(píng)價(jià)工具,同時(shí)還對(duì)來自不同地區(qū)和不同文化背景的幼兒園進(jìn)行評(píng)價(jià)和比較,為學(xué)前教育政策制定和質(zhì)量提升提供參考。〔40〕國內(nèi)也有對(duì)來自全國各地區(qū)各類不同樣態(tài)的幼兒園進(jìn)行學(xué)前教育質(zhì)量和幼兒園課程質(zhì)量的比較工作?!?1-43〕以上都是對(duì)測(cè)評(píng)結(jié)果解釋和應(yīng)用的宏觀關(guān)注,具體針對(duì)某所幼兒園或某個(gè)班級(jí)質(zhì)量評(píng)價(jià)結(jié)果的診斷性解釋以及用于改進(jìn)和提升保育教育質(zhì)量的應(yīng)用,還有待實(shí)踐的深入探索。

三、學(xué)前教育質(zhì)量評(píng)價(jià)的公平性及研究進(jìn)展

1.學(xué)前教育質(zhì)量評(píng)價(jià)的公平性

公平性指測(cè)試對(duì)所有預(yù)測(cè)個(gè)體具有相同的結(jié)構(gòu)和意義?!?4〕學(xué)前教育質(zhì)量評(píng)價(jià)的公平性是指評(píng)價(jià)的結(jié)構(gòu)和意義不會(huì)隨著參評(píng)幼兒園的類型或所在地等的不同而發(fā)生變化。即無論是具有不同的類型特征還是來自不同的群組,最終都有相同的質(zhì)量評(píng)價(jià)結(jié)構(gòu)和意義?;跍y(cè)量標(biāo)準(zhǔn)對(duì)公平性的界定,學(xué)前教育質(zhì)量評(píng)價(jià)的公平性主要包含以下四個(gè)方面:評(píng)價(jià)過程的公平性;沒有評(píng)價(jià)偏差;評(píng)價(jià)結(jié)構(gòu)的公平性;評(píng)價(jià)結(jié)果解釋的有效性。

具體而言,評(píng)價(jià)過程的公平性指在評(píng)價(jià)內(nèi)容的設(shè)計(jì)、開發(fā)和管理,乃至評(píng)價(jià)流程和賦分規(guī)則等方面,都要最大限度地減少對(duì)測(cè)評(píng)結(jié)果解釋有效性的影響。因此,在學(xué)前教育質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)的開發(fā)和應(yīng)用中,要明確說明評(píng)價(jià)結(jié)果的有效性解釋,并界定參評(píng)幼兒園的個(gè)體和群體特征,如幼兒園規(guī)模、幼兒園辦園性質(zhì)和幼兒園所在地(城鎮(zhèn)和鄉(xiāng)村)等,以減少這些特征和群組變量對(duì)評(píng)價(jià)公平性的影響。公平性意味著沒有測(cè)評(píng)偏差,是學(xué)前教育質(zhì)量評(píng)價(jià)結(jié)果有效性解釋的基本保障。然而,實(shí)踐中無法完全消除測(cè)評(píng)偏差,通常是將偏差大小界定在可接受的范圍內(nèi)。學(xué)前教育質(zhì)量評(píng)價(jià)測(cè)評(píng)內(nèi)容的潛在結(jié)構(gòu)主要包含結(jié)構(gòu)性和過程性質(zhì)量?!?5〕評(píng)價(jià)結(jié)構(gòu)的公平性指確保該結(jié)構(gòu)對(duì)所有參評(píng)幼兒園是相同的。公平性還包含測(cè)評(píng)結(jié)果解釋的有效性。為保障學(xué)前教育質(zhì)量評(píng)價(jià)的公平性,評(píng)價(jià)開發(fā)人員和研究者還需收集和提供支持評(píng)價(jià)公平性的相關(guān)依據(jù),并根據(jù)評(píng)價(jià)本身的局限性明確表達(dá)評(píng)價(jià)結(jié)果的預(yù)期解釋和用途。由于評(píng)價(jià)項(xiàng)目或指標(biāo)編制的有限性以及評(píng)價(jià)方法和流程本身的局限性等,評(píng)價(jià)的公平性會(huì)因此受到影響。如學(xué)前教育質(zhì)量評(píng)價(jià)通常采用觀察法,評(píng)價(jià)結(jié)果中往往都存在評(píng)價(jià)者的主觀性,因而對(duì)評(píng)價(jià)結(jié)果的解釋和應(yīng)用都需綜合且慎重考慮這些因素??梢?,測(cè)評(píng)結(jié)果解釋的有效性主要強(qiáng)調(diào)對(duì)測(cè)評(píng)工具、人員和過程等進(jìn)行基本的公平性支持,以保障效度探討中提及的測(cè)評(píng)結(jié)果解釋和應(yīng)用的有效性。

2.學(xué)前教育質(zhì)量評(píng)價(jià)公平性的研究進(jìn)展

學(xué)前教育質(zhì)量評(píng)價(jià)的公平性目前還未引起廣泛關(guān)注,相應(yīng)的研究探索也未真正起步。盡管如此,研究者在編制和開發(fā)評(píng)價(jià)內(nèi)容時(shí),對(duì)測(cè)評(píng)內(nèi)容的界定和應(yīng)用范疇的考量以及說明均關(guān)注了評(píng)價(jià)過程的公平性。如各量表手冊(cè)的操作說明等都附有詳細(xì)的指標(biāo)解讀或賦分說明,有些還標(biāo)注了不適用的指標(biāo)或項(xiàng)目等?!?6,47〕另外,在有關(guān)測(cè)評(píng)結(jié)構(gòu)的公平性方面,有研究針對(duì)不同類型幼兒園(如城市和鄉(xiāng)村幼兒園)的測(cè)評(píng)潛在結(jié)構(gòu)進(jìn)行了討論。與已有研究結(jié)果一致,不同類型的學(xué)前教育質(zhì)量評(píng)價(jià)具有相同的潛在結(jié)構(gòu)。〔48〕在測(cè)評(píng)結(jié)果解釋的有效性方面,如美國的質(zhì)量評(píng)價(jià)和提升系統(tǒng)在兩個(gè)不同的州展開質(zhì)量測(cè)評(píng),在測(cè)評(píng)標(biāo)準(zhǔn)和流程、參與者和政策決策者等方面提出測(cè)評(píng)建議,即提供測(cè)評(píng)公平性的信息依據(jù)和支持,以最終保障測(cè)評(píng)結(jié)果解釋的有效性。〔49〕而在有關(guān)測(cè)評(píng)偏差的公平性上,已有文獻(xiàn)還鮮有報(bào)告。這不僅表明學(xué)前教育質(zhì)量評(píng)價(jià)的公平性還有大量空白有待探索,也從另一角度說明學(xué)前教育質(zhì)量評(píng)價(jià)的科學(xué)性還需公平性方面的補(bǔ)充和鞏固。

四、學(xué)前教育質(zhì)量評(píng)價(jià)三個(gè)測(cè)量學(xué)屬性間的相互關(guān)系

信度、效度和公平性三個(gè)測(cè)量學(xué)屬性間存在相互制約、相輔相成的關(guān)系。首先,良好的信度是評(píng)價(jià)有效性的前提。學(xué)前教育質(zhì)量評(píng)價(jià)的信度包含評(píng)價(jià)內(nèi)容的可信性和評(píng)價(jià)過程的可信性。評(píng)價(jià)過程的可信性主要指由評(píng)價(jià)者的主觀評(píng)價(jià)造成的評(píng)價(jià)誤差。因而,減少評(píng)價(jià)誤差和提高評(píng)價(jià)者信度是提高學(xué)前教育質(zhì)量評(píng)價(jià)信度和效度的重要舉措。反過來,學(xué)前教育質(zhì)量評(píng)價(jià)的效度也會(huì)影響其信度,評(píng)價(jià)效度高意味著評(píng)價(jià)結(jié)果信度越高。

其次,學(xué)前教育質(zhì)量評(píng)價(jià)的效度是公平性的重要前提,同時(shí)公平性又是評(píng)價(jià)效度的重要體現(xiàn)。學(xué)前教育質(zhì)量評(píng)價(jià)的效度不僅指評(píng)價(jià)內(nèi)容、評(píng)價(jià)過程和其他變量關(guān)系的有效性,還包含評(píng)價(jià)結(jié)構(gòu)和評(píng)價(jià)結(jié)果解釋的有效性等。而測(cè)評(píng)同結(jié)構(gòu)性和評(píng)價(jià)結(jié)果解釋的有效性也是評(píng)價(jià)公平性的重要內(nèi)涵。因此,學(xué)前教育質(zhì)量評(píng)價(jià)的效度與公平性相輔相成,相互影響。

最后,信度和公平性之間也會(huì)互相影響。一方面,學(xué)前教育質(zhì)量評(píng)價(jià)的信度是測(cè)評(píng)同結(jié)構(gòu)性和評(píng)價(jià)結(jié)果解釋有效性的重要前提。評(píng)價(jià)的信度低將直接影響評(píng)價(jià)結(jié)構(gòu)和評(píng)價(jià)結(jié)果解釋的有效性。與此同時(shí),信度也是減少測(cè)評(píng)偏差的重要基礎(chǔ)。隨著評(píng)價(jià)內(nèi)容和評(píng)價(jià)者信度的提高或評(píng)價(jià)誤差的減少,質(zhì)量評(píng)價(jià)的公平性會(huì)有所增強(qiáng)。另一方面,學(xué)前教育質(zhì)量評(píng)價(jià)的公平性也會(huì)影響其信度。公平性高意味著評(píng)價(jià)內(nèi)容、評(píng)價(jià)過程和評(píng)價(jià)技術(shù)等的可信性和有效性高,測(cè)評(píng)偏差比較小,間接表明測(cè)評(píng)信度高(見圖1)。

只有同時(shí)提高信度、效度和公平性才能真正保障保教質(zhì)量評(píng)價(jià)的科學(xué)性和權(quán)威性,才能為學(xué)前教育質(zhì)量提升提供堅(jiān)實(shí)的測(cè)量學(xué)依據(jù)。

五、學(xué)前教育質(zhì)量評(píng)價(jià)測(cè)量學(xué)屬性的研究展望

1.學(xué)前教育質(zhì)量評(píng)價(jià)信度的研究展望

信度的估計(jì)通常采用內(nèi)部一致性系數(shù)或概化系數(shù),由于這兩種分析和估計(jì)信度的方法都基于經(jīng)典測(cè)量理論(CTT),所以存在著信度估計(jì)值隨著樣本量而發(fā)生變化的問題。而這會(huì)給評(píng)價(jià)工具或標(biāo)準(zhǔn)的使用帶來不小的挑戰(zhàn)。首先,每次使用都要估計(jì)信度大小,尤其是當(dāng)樣本量不夠大或針對(duì)單所幼兒園評(píng)價(jià)時(shí),基于經(jīng)典測(cè)量理論的方法就顯得十分有限。其次,內(nèi)部一致性系數(shù)或概化系數(shù)都基于總量表或其中的子量表,無法估計(jì)某個(gè)具體的評(píng)價(jià)項(xiàng)目或指標(biāo)的可信性,難以為評(píng)價(jià)項(xiàng)目或標(biāo)準(zhǔn)的修訂和規(guī)范提供詳細(xì)的信度信息。學(xué)前教育質(zhì)量評(píng)價(jià)中評(píng)價(jià)者信度受到越來越多的關(guān)注,如評(píng)價(jià)者一致性百分比或評(píng)價(jià)結(jié)果的相關(guān)系數(shù)常常用于報(bào)告評(píng)價(jià)者間的一致性。嚴(yán)格來說,這些方法都無法準(zhǔn)確評(píng)估評(píng)價(jià)者信度,只能統(tǒng)計(jì)評(píng)價(jià)者間的一致性,而評(píng)價(jià)者間的一致性和評(píng)價(jià)者信度是兩個(gè)完全不同的概念。

近年來,項(xiàng)目反應(yīng)理論在學(xué)前教育質(zhì)量評(píng)價(jià)屬性分析中的應(yīng)用逐漸增多。這不僅為某個(gè)具體項(xiàng)目或指標(biāo)的信度估計(jì)提供了可實(shí)現(xiàn)的方法和技術(shù),也為估計(jì)評(píng)價(jià)者信度提供了相應(yīng)的方法和技術(shù)。但是,已有研究主要是用參數(shù)方法進(jìn)行分析,并且都需要建立在很強(qiáng)的數(shù)學(xué)假設(shè)前提下。不同于參數(shù)方法需要建立于強(qiáng)假設(shè),非參數(shù)方法假設(shè)弱,且適合于小樣本等情況,用于分析學(xué)前教育質(zhì)量評(píng)價(jià)的信度或是將來更合適的選擇。

2.學(xué)前教育質(zhì)量評(píng)價(jià)效度的研究展望

內(nèi)容效度、結(jié)構(gòu)效度和實(shí)證效度以及與其他變量的關(guān)系等是目前學(xué)前教育質(zhì)量評(píng)價(jià)效度研究的主要內(nèi)容。未來可以考慮不同領(lǐng)域或方向的研究者對(duì)內(nèi)容效度的理解與思考,為內(nèi)容效度的取證提供更充實(shí)的測(cè)量學(xué)依據(jù)。

在討論學(xué)前教育質(zhì)量評(píng)價(jià)的內(nèi)在結(jié)構(gòu)效度時(shí),已有研究常常采用探索性因素法(EFA)和驗(yàn)證性因素法(CFA)。與信度估計(jì)方法相同,這些方法都是基于經(jīng)典測(cè)量理論。因而,同樣存在著依賴隨機(jī)抽樣和無法適應(yīng)樣本量小的實(shí)際應(yīng)用情景問題。另外,探索性因素法方法在公因子抽取個(gè)數(shù)和命名中存在一定的主觀色彩,也是學(xué)前教育質(zhì)量評(píng)價(jià)的內(nèi)在結(jié)構(gòu)目前還存在其他觀點(diǎn)的主要原因。未來在探索內(nèi)在結(jié)構(gòu)方面可以嘗試其他方法,如探索性因素法和項(xiàng)目反應(yīng)理論相結(jié)合的全息項(xiàng)目因素分析(FIFA)。更重要的是未來需結(jié)合中國文化背景和中國幼兒園保育教育特點(diǎn),構(gòu)建具有中國文化特色的學(xué)前教育質(zhì)量?jī)?nèi)在結(jié)構(gòu)。

與其他變量的關(guān)系是學(xué)前教育質(zhì)量評(píng)價(jià)效度研究的重點(diǎn)。如前文所述,已有的大量討論均集中在保育教育質(zhì)量與兒童發(fā)展,如語言、數(shù)學(xué)和情感社會(huì)性等方面的關(guān)系。依據(jù)兒童發(fā)展的生態(tài)觀,未來在討論時(shí)可適當(dāng)兼顧其他變量,如家庭結(jié)構(gòu)、家庭經(jīng)濟(jì)收入以及社區(qū)環(huán)境等對(duì)兒童發(fā)展的影響。與此同時(shí),還需關(guān)注到學(xué)前教育質(zhì)量對(duì)兒童發(fā)展的長(zhǎng)期影響和效應(yīng),即追蹤探索。另外,在方法上基于項(xiàng)目反應(yīng)理論展開學(xué)前教育質(zhì)量和兒童發(fā)展的長(zhǎng)期追蹤與監(jiān)測(cè)或是未來的一大趨勢(shì)。

學(xué)前教育質(zhì)量評(píng)價(jià)的效度研究雖然有大量的實(shí)證支持,但這些取證主要來自內(nèi)容效度和結(jié)構(gòu)效度,而在評(píng)價(jià)過程和結(jié)果解釋的有效性上仍存在大量空白。未來,評(píng)價(jià)過程的有效性,尤其是評(píng)價(jià)者的有效性或許是學(xué)前教育質(zhì)量評(píng)價(jià)測(cè)量學(xué)屬性研究的重點(diǎn)之一。這將為學(xué)前教育質(zhì)量評(píng)價(jià)評(píng)委庫的建立和培訓(xùn)等提供測(cè)量學(xué)屬性參考。對(duì)評(píng)價(jià)結(jié)果的有效解釋和應(yīng)用通常是學(xué)前教育質(zhì)量評(píng)價(jià)容易被忽略的環(huán)節(jié)。因此,如何通過解釋評(píng)價(jià)結(jié)果促進(jìn)學(xué)前教育質(zhì)量不斷改進(jìn)和提升,是效度研究即將面臨的一大挑戰(zhàn)。

3.學(xué)前教育質(zhì)量評(píng)價(jià)公平性的研究展望

縱觀已有文獻(xiàn),學(xué)前教育質(zhì)量評(píng)價(jià)的公平性探索剛剛起步。未來一段時(shí)間內(nèi),基于測(cè)量學(xué)視角探討公平性將是學(xué)前教育質(zhì)量評(píng)價(jià)測(cè)量學(xué)屬性研究的重要內(nèi)容。這些研究將會(huì)聚焦于以下幾個(gè)方面。首先是基于測(cè)量學(xué)的學(xué)前教育質(zhì)量評(píng)價(jià)公平性的界定,包括對(duì)評(píng)價(jià)內(nèi)容、評(píng)價(jià)方法、評(píng)價(jià)過程和結(jié)果等的公平性界定。其次是衡量公平性大小的分析方法。目前,已有分析方法主要圍繞評(píng)價(jià)項(xiàng)目或指標(biāo)、評(píng)價(jià)量表和評(píng)價(jià)者三個(gè)不同方面對(duì)測(cè)評(píng)偏差進(jìn)行分析。例如,項(xiàng)目功能差異(Different Item Function)檢驗(yàn)方法針對(duì)測(cè)評(píng)項(xiàng)目的功能性差異進(jìn)行檢驗(yàn),而測(cè)驗(yàn)功能性差異(Different Testing Function)和評(píng)價(jià)者功能性差異(Different Rater Function)則針對(duì)量表和評(píng)價(jià)者的公平性進(jìn)行檢驗(yàn)。未來,這些不同角度的分析方法將是探討學(xué)前教育質(zhì)量評(píng)價(jià)公平性的基本思路和技術(shù)。再次,測(cè)評(píng)內(nèi)在結(jié)構(gòu)對(duì)所有測(cè)評(píng)對(duì)象的同一性不僅是學(xué)前教育質(zhì)量評(píng)價(jià)效度研究的主要內(nèi)容,也是公平性的主要表征。消除測(cè)評(píng)對(duì)象如幼兒園的特征變量和組群變量的影響,提高測(cè)評(píng)的公平性也是未來公平性屬性研究的主要方向。最后,相同評(píng)價(jià)結(jié)果解釋的有效性是公平性的重要保障,如何有效、公平地解釋和應(yīng)用評(píng)價(jià)結(jié)果將是學(xué)前教育質(zhì)量評(píng)價(jià)未來不可或缺的內(nèi)容。

參考文獻(xiàn):

〔1〕〔23〕〔44〕ASSOCIATION,A. E.Standards for educational and psychological testing〔M〕.Washing,DC:American Educational Research Association,2018:11-50.

〔2〕〔17〕CHEN D,HU B Y,F(xiàn)AN X,et al.Measurement quality of the Chinese Early Childhood Program Rating Scale:An investigation using multivariate generalizability theory〔J〕.Journal of Psychoeducational Assessment,2014,32(3):236-248.

〔3〕〔22〕陳德枝,秦金亮,李克建.托幼機(jī)構(gòu)教育質(zhì)量評(píng)價(jià)中評(píng)委偏差的多側(cè)面 Rasch 分析 〔J〕.心理科學(xué),2016,39(3):628-636.

〔4〕ENGELHARD JR G,WIND S A.Introduction to the special issue on rater?mediated assessments〔J〕. Journal of Educational Measurement,2019,56(3):475-477.

〔5〕WIND S A.Examining the impacts of rater effects in performance assessments 〔J〕.Applied Psychological Measurement,2019,43(2):159-171.

〔6〕〔18〕〔24〕〔33〕LI K,ZHANG P,HU B Y,et al.Testing the ‘thresholds’ of preschool education quality on child outcomes in China〔J〕.Early Childhood Research Quarterly,2019(47):445-456.

〔7〕劉焱,潘月娟.《幼兒園教育環(huán)境質(zhì)量評(píng)價(jià)量表》的特點(diǎn)、結(jié)構(gòu)和信效度檢驗(yàn) 〔J〕.學(xué)前教育研究,2008(6):60-64.

〔8〕中央教育科學(xué)研究所學(xué)前教育研究室.幼兒園教育質(zhì)量評(píng)價(jià)手冊(cè) 〔M〕.北京:教育科學(xué)出版社,2009.

〔9〕〔19〕陳德枝,李克建,周兢.《走向優(yōu)質(zhì)——中國幼兒園教育質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)》的測(cè)量學(xué)屬性分析:基于我國100所幼兒園與1670名兒童的測(cè)評(píng)數(shù)據(jù) 〔J〕.學(xué)前教育研究,2021(1):3-16.

〔10〕〔20〕SAKAI L M,WHITEBOOK M,WISHARD A,et al.Evaluating the Early Childhood Environment Rating Scale (ECERS):Assessing differences between the first and revised edition〔J〕.Early Childhood Research Quarterly,2003,18(4):427-445.

〔11〕〔21〕〔31〕PERLMAN M,ZELLMAN G L,LE V?N.Examining the psychometric properties of the early childhood environment rating scale?revised (ECERS?R)〔J〕.Early Childhood Research Quarterly,2004,19(3):398-412.

〔12〕PIANTA R C P K,HAMRE B K.Classroom assessment scoring system:Manual K?3〔M〕.Baltimore:Paul H Brookes Publishing,2008.

〔13〕〔34〕〔37〕VERNON?FEAGANS L,MOKROVA I L,CARR R C,et al.Cumulative years of classroom quality from kindergarten to third grade:Prediction to children’s third grade literacy skills〔J〕.Early Childhood Research Quarterly,2019(47):531-540.

〔14〕〔25〕COLWELL N,GORDON R A,F(xiàn)UJIMOTO K,et al.New evidence on the validity of the Arnett Caregiver Interaction Scale:Results from the early childhood longitudinal study?birth cohort 〔J〕.Early Childhood Research Quarterly,2013,28(2):218-233.

〔15〕〔26〕FORM A.Infant?toddler program quality assessment〔M〕.Michigan:HighScope Press,2011.

〔16〕〔27〕HOWARD S J,SIRAJ I,MELHUISH E C,et al.Measuring interactional quality in pre?school settings:Introduction and validation of the Sustained Shared Thinking and Emotional Wellbeing (SSTEW) scale〔J〕.Early Child Development and Care,2020,190(7):1017-1030.

〔28〕〔38〕GORDON R A,HOFER K G,F(xiàn)UJIMOTO K A,et al.Identifying high?quality preschool programs:New evidence on the validity of the Early Childhood Environment Rating Scale?Revised (ECERS?R) in relation to school readiness goals〔J〕.Early Education and Development,2015,26(8):1086-1110.

〔29〕〔32〕HUANG R,SIRAJ I.Profiles of Chinese pres?

choolers’ academic and social?emotional development in relation to classroom quality:A multilevel latent profile approach 〔J〕.Child Development,2023,94(4):1002-1016.

〔30〕〔45〕CASSIDY D J,HESTENES L L,HANSEN J K,et al.Revisiting the two faces of child care quality:Structure and process〔J〕.Early Education and Development,2005,16(4):505-520.

〔35〕李琳,范潔瓊,任麗欣.幼兒園班級(jí)質(zhì)量追蹤評(píng)估與改進(jìn)探索:以上海市12所幼兒園20個(gè)班級(jí)3年追蹤評(píng)估為例 〔J〕.幼兒教育(教育科學(xué)),2022,915/916(7/8):20-26.

〔36〕李琳,李孜佳,范潔瓊,等.幼兒園教育質(zhì)量對(duì)兒童發(fā)展增值的影響 〔J〕.學(xué)前教育研究,2021(4):31-47.

〔39〕KIRBY G,CARONONGAN P,MALONE L M,et al.What do quality rating levels mean:Examining the implementation of QRIS ratings to inform validation〔J〕.Early Childhood Research Quarterly,2015(30):291-305.

〔40〕CONNORS M C,MORRIS P A.Comparing state policy approaches to early care and education quality:A multidimensional assessment of quality rating and improvement systems and child care licensing regulations〔J〕.Early Childhood Research Quarterly,2015(30):266-279.

〔41〕劉穎,虞永平.我國幼兒園管理質(zhì)量的現(xiàn)狀,類別及其影響因素:基于潛在剖面分析的結(jié)果〔J〕.學(xué)前教育研究,2021(1):12.

〔42〕原晉霞.我國幼兒園課程質(zhì)量現(xiàn)狀探索與提升建議 〔J〕.學(xué)前教育研究,2021(1):43-56.

〔43〕吳瓊.我國幼兒園師資保障質(zhì)量評(píng)估與提升策略 〔J〕.學(xué)前教育研究,2021(1):57-66.

〔46〕SYLVA K,TAGGART B.ECERS?E:The four curricular subscales extension to the early childhood environment rating scale (ECERS?R)〔M〕.New York:Teachers College Press,2010.

〔47〕LI K,HU B Y,PAN Y,et al.Chinese Early Childhood Environment Rating Scale (trial) (CECERS):A validity study〔J〕.Early Childhood Research Quarterly,2014,29(3):268-282.

〔48〕WOLF S,RAZA M,KIM S,et al.Measuring and predicting process quality in Ghanaian pre-primary classrooms using the Teacher Instructional Practices and Processes System (TIPPS) 〔J〕.Early Childhood Research Quarterly,2018(45):18-30.

〔49〕LAHTI M,ELICKER J,ZELLMAN G,et al.Approaches to validating child care quality rating and improvement systems(QRIS):Results from two states with similar QRIS type designs 〔J〕.Early Childhood Research Quarterly,2015(30):280-290.

Deeply Interpreting the Reliability, Validity, and Fairness of Preschool Education Quality Assessment: Based on the Education and Psychological Measurement Standards

Chen Dezhi

(College of Children Development and Education, Zhejiang Normal University, Hangzhou, Zhejiang, 311231)

【Abstract】Reliability, validity, and fairness are the three fundamental attributes of quality assessment in preschool education. This article explores the basic connotations of these attributes, as outlined in the Education and Psychological Measurement Standards, and combines them with the unique characteristics of preschool education quality assessment. We provide an in?depth discussion of the reliability, validity, and fairness of preschool education quality assessment, as well as the interrelationships among them. Additionally, we highlight the main directions and methods for exploring reliability, validity, and fairness in future research, based on the current progress in the measurement attributes of preschool education quality assessment.

【Keywords】preschool education quality assessment; reliability; validity; fairness

*本文為浙江省教育考試院“十四五”規(guī)劃課題“基于評(píng)分者介導(dǎo)式評(píng)價(jià)IRT模型的學(xué)前教育質(zhì)量評(píng)價(jià)的測(cè)量學(xué)研究”(課題編號(hào):ZJEEA14529)和浙江省哲學(xué)社會(huì)科學(xué)規(guī)劃重點(diǎn)課題“基于認(rèn)知診斷的幼兒教師隱性知識(shí)的情景判斷性測(cè)驗(yàn)研究”(課題編號(hào):20NDJC07Z)的研究成果之一。

**通信作者:陳德枝,浙江師范大學(xué)兒童發(fā)展與教育學(xué)院副教授,電子郵箱:cdezhi@zjnu.cn

猜你喜歡
公平性效度信度
《廣東地區(qū)兒童中醫(yī)體質(zhì)辨識(shí)量表》的信度和效度研究
慈善募捐規(guī)制中的國家與社會(huì):兼論《慈善法》的效度和限度
一種提高TCP與UDP數(shù)據(jù)流公平性的擁塞控制機(jī)制
公平性問題例談
科技成果評(píng)價(jià)的信度分析及模型優(yōu)化
體育社會(huì)調(diào)查問卷信度檢驗(yàn)的方法學(xué)探索——基于中文核心體育期刊163篇文章分析
被看重感指數(shù)在中國大學(xué)生中的構(gòu)念效度
關(guān)于公平性的思考
外語形成性評(píng)估的效度驗(yàn)證框架
中文版腦性癱瘓兒童生活質(zhì)量問卷的信度
吉安县| 昌平区| 大庆市| 桂东县| 朝阳区| 灵山县| 民县| 安塞县| 新疆| 栖霞市| 仙游县| 肇庆市| 西安市| 乳源| 闽清县| 舒兰市| 外汇| 崇文区| 赤城县| 井陉县| 张掖市| 印江| 乐业县| 佳木斯市| 河北区| 那坡县| 石家庄市| 石屏县| 昌图县| 施甸县| 怀柔区| 罗源县| 旬阳县| 安义县| 若羌县| 三门县| 涟源市| 信宜市| 郎溪县| 安庆市| 长治市|