學(xué)會學(xué)習(xí)測驗的本土化研究

2023-04-01 03:07:26楊向東郭少陽

全球教育展望 2023年1期

張潔楊向東郭少陽

一、引言

在信息社會，知識與技能更替速度加快，如果學(xué)校還像原來一樣局限于傳授一些具體學(xué)科內(nèi)容，將導(dǎo)致學(xué)生在離開校園后難以適應(yīng)社會[1][2]。為改變這一困境，早在20世紀(jì)70年代，聯(lián)合國教育科學(xué)文化組織就提出“學(xué)會學(xué)習(xí)”的口號，并將其確立為教育的四大支柱之一[3]?？缛?1世紀(jì)后，學(xué)會學(xué)習(xí)作為新世紀(jì)人才的必備素養(yǎng)，獲得了更為廣泛的重視[4][5]。然而，學(xué)會學(xué)習(xí)所受到的廣泛關(guān)注與該研究領(lǐng)域的進展不相稱。盡管當(dāng)前幾乎找不到反對學(xué)會學(xué)習(xí)的聲音，但它至今沒有一個統(tǒng)一的定義[6][7]！

學(xué)會學(xué)習(xí)的概念有廣義和狹義之分[8][9][10]。狹義的學(xué)會學(xué)習(xí)是指學(xué)習(xí)者通過掌握學(xué)習(xí)策略、技巧、方法等來改善學(xué)業(yè)成績。這類學(xué)會學(xué)習(xí)通常由教師主導(dǎo)，且面向低年級或成績差的學(xué)生。[11][12]而廣義的學(xué)會學(xué)習(xí)是指學(xué)習(xí)者掌握了可以適用于未來學(xué)習(xí)的更一般、更高階的能力，目的是使學(xué)生成為終身學(xué)習(xí)者。廣義的學(xué)會學(xué)習(xí)要求所有學(xué)習(xí)者探索自身的學(xué)習(xí)過程[13][14][15]，教師只是扮演促進者的角色。進入21世紀(jì)，越來越多的研究者開始關(guān)注廣義的學(xué)會學(xué)習(xí)。然而對于學(xué)會學(xué)習(xí)應(yīng)該包含哪些能力，研究者有多種看法。有研究者從認(rèn)知角度出發(fā)，認(rèn)為學(xué)會學(xué)習(xí)像智力一樣，是一種通用能力，在其他的技能和能力背后，控制著更具體的結(jié)構(gòu)系統(tǒng)(如空間想象、數(shù)量關(guān)系等)的運作。[16]有研究者把學(xué)會學(xué)習(xí)看作元認(rèn)知，認(rèn)為其是提高對學(xué)習(xí)的覺察和監(jiān)控能力。[17]另有研究者將學(xué)會學(xué)習(xí)與自我調(diào)節(jié)學(xué)習(xí)等同起來[18]，認(rèn)為學(xué)會學(xué)習(xí)是學(xué)習(xí)者能夠采取策略管理自身的學(xué)習(xí)過程，從而更好地實現(xiàn)學(xué)習(xí)目標(biāo)[19][20]。從這些爭議可見，由于所依據(jù)的理論不同，研究者們提出的學(xué)會學(xué)習(xí)內(nèi)涵差異很大。不過，隨著研究進展，目前越來越多的研究者認(rèn)同學(xué)會學(xué)習(xí)是一個包含認(rèn)知、情感、元認(rèn)知等多個維度的復(fù)雜概念[21][22]。

測評是學(xué)會學(xué)習(xí)研究的重點問題，也是教育質(zhì)量監(jiān)測的難點問題[23]。由于缺乏統(tǒng)一的定義，學(xué)會學(xué)習(xí)的測評工具十分混亂。當(dāng)前許多以學(xué)會學(xué)習(xí)為名的測評工具所評估的并不是學(xué)會學(xué)習(xí)本身，而只是與之相關(guān)的一些概念，如學(xué)習(xí)風(fēng)格、學(xué)習(xí)概念、學(xué)科成績、學(xué)業(yè)表現(xiàn)等[24][25][26][27]。學(xué)會學(xué)習(xí)的復(fù)雜性還帶來了測評內(nèi)容代表性的問題。一些學(xué)會學(xué)習(xí)測驗盡管測量了學(xué)會學(xué)習(xí)，但僅憑經(jīng)驗或需要選取了幾個成分，如學(xué)習(xí)動機、學(xué)習(xí)重要性、學(xué)習(xí)場所、學(xué)習(xí)策略[28]，或成就動機、學(xué)習(xí)問題、理解性學(xué)習(xí)、意義取向、運用邏輯操作[29]等，來指代學(xué)會學(xué)習(xí)。然而，由于缺乏對學(xué)會學(xué)習(xí)概念領(lǐng)域的系統(tǒng)分析，難以保證所選取成分的代表性。類似地，PISA中也有一部分測驗涉及學(xué)會學(xué)習(xí)[30]，但由于其內(nèi)容僅涉及學(xué)生參與、學(xué)習(xí)方法和學(xué)習(xí)習(xí)慣等方面，因而也不是一個完整的學(xué)會學(xué)習(xí)測評[31]。目前，基于對學(xué)會學(xué)習(xí)研究的系統(tǒng)分析以及學(xué)會學(xué)習(xí)的多個維度開發(fā)的綜合性學(xué)會學(xué)習(xí)測評工具包括：大學(xué)生學(xué)會學(xué)習(xí)能力問卷(QELtLCUS questionnaire)[32]、學(xué)會學(xué)習(xí)能力問卷[33]、歐洲學(xué)會學(xué)習(xí)測驗(European learning to learn test)[34]、芬蘭學(xué)會學(xué)習(xí)測驗(Finnish learning to learn test)[35]。

西班牙瓦倫西亞大學(xué)的加加洛-洛佩斯(Gargallo-López)等人開發(fā)的大學(xué)生學(xué)會學(xué)習(xí)能力問卷經(jīng)過理論論證和實證檢驗，是比較可信的學(xué)會學(xué)習(xí)測評工具。該問卷包括認(rèn)知、元認(rèn)知、情感動機、社會關(guān)系、倫理等5個主維度，共包括85個問題。所有問題均采用五點李克特測驗形式，從“完全不同意”到“完全同意”。目前該問卷已在西班牙采用1237人的大學(xué)生樣本做了測量學(xué)檢驗，驗證性因素分析顯示這五個維度的模型擬合良好，信度系數(shù)在0.86—0.90之間。[36]不過，該問卷針對的是大學(xué)生群體，無法適用于基礎(chǔ)教育階段的學(xué)會學(xué)習(xí)測評。

我國孫妍妍等人開發(fā)了一個適用中小學(xué)生的學(xué)會學(xué)習(xí)能力問卷。該問卷借鑒已有學(xué)會學(xué)習(xí)評估框架，將學(xué)會學(xué)習(xí)分成認(rèn)知、情感和元認(rèn)知三個維度，并基于美國國家研究中心的NCRIFFAL問卷和密歇根大學(xué)的動機策略測驗[37]，構(gòu)造了一個包含36個題目自我報告問卷。所有題目采用五點李克特形式，從“完全不符合”到“完全符合”。盡管該問卷的信度和效度經(jīng)過檢驗均達到了可接受水平，但由于缺乏堅實的理論基礎(chǔ)，其測評框架存在一定的問題。如“學(xué)習(xí)過程”被列為認(rèn)知維度下的子維度，但按照其定義“學(xué)生對學(xué)習(xí)中認(rèn)知過程的把控能力”，該維度應(yīng)該歸屬于元認(rèn)知，這從其參考文獻[38]中也能一瞥端倪。再如其將“自我調(diào)節(jié)”和“學(xué)習(xí)習(xí)慣”作為元認(rèn)知維度下的兩個子維度，與已有研究不符[39][40][41]。因此，盡管該問卷的主要維度具有一定的綜合性，但其具體框架的合理性仍有待考察。

歐盟終身學(xué)習(xí)委員會專家組在借鑒歐盟多國已有研究的基礎(chǔ)上，開發(fā)出包含認(rèn)知、情感和元認(rèn)知三個維度的學(xué)會學(xué)習(xí)測驗。其認(rèn)知維度來源于芬蘭學(xué)會學(xué)習(xí)測驗的認(rèn)知維度以及荷蘭的跨學(xué)科測驗，包含識別假設(shè)、運用規(guī)則、測試規(guī)則和假設(shè)、運用思維工具等四個子維度。其情感維度來源于芬蘭學(xué)會學(xué)習(xí)測驗的情感維度以及英國的學(xué)習(xí)能量測評，包含學(xué)習(xí)動機、學(xué)習(xí)策略、有關(guān)變化的取向、學(xué)業(yè)自我概念和自尊、學(xué)習(xí)環(huán)境等五個子維度。其元認(rèn)知維度借鑒了西班牙馬德里大學(xué)的元認(rèn)知測驗，包含問題解決、元認(rèn)知精確性和元認(rèn)知自信三個子維度。該測驗全部采用自我報告問卷形式，但對歐盟國家14歲學(xué)生的試測發(fā)現(xiàn)，其測量學(xué)水平有限，仍需進一步調(diào)整[42]。

芬蘭赫爾辛基大學(xué)教育評估中心的豪塔邁基等人在對已有文獻進行廣泛分析的基礎(chǔ)上，開發(fā)了適用中小學(xué)生的學(xué)會學(xué)習(xí)測驗。該測驗把學(xué)會學(xué)習(xí)分成學(xué)習(xí)能力、我相關(guān)的信念、環(huán)境相關(guān)的信念三個方面。學(xué)習(xí)能力對應(yīng)認(rèn)知和元認(rèn)知維度，而自我和環(huán)境相關(guān)的信念對應(yīng)學(xué)習(xí)的情感維度。信念部分的測驗共有93題，采用七點李克特形式的自我報告問卷。但與前述三個測驗全部采用問卷形式不同，芬蘭學(xué)會學(xué)習(xí)測驗中的學(xué)習(xí)能力測驗采用了認(rèn)知測驗任務(wù)的形式。為適應(yīng)不同學(xué)段的需要，芬蘭學(xué)會學(xué)習(xí)測驗的認(rèn)知任務(wù)包含多個版本，分別適用于6、9、12年級。在1996—2017年，芬蘭學(xué)會學(xué)習(xí)測驗在芬蘭國內(nèi)進行過多次測試，信度0.5—0.9[43][44]，且效標(biāo)效度良好；該測驗的高中版也在瑞典得以驗證[45]。

學(xué)會學(xué)習(xí)是一個復(fù)雜概念，因此其測驗開發(fā)的時間及人力成本巨大。相比之下，對測驗進行編譯更為可行。從上述分析可知，芬蘭學(xué)會學(xué)習(xí)測驗是目前適用基礎(chǔ)教育階段的最為可信的學(xué)會學(xué)習(xí)測評工具。為此，本研究對芬蘭學(xué)會學(xué)習(xí)測驗加以本土化，以期為我國基礎(chǔ)教育階段的學(xué)會學(xué)習(xí)測評提供可靠工具。

二、芬蘭學(xué)會學(xué)習(xí)測驗

為響應(yīng)國家教育改革號召，豪塔邁基等人將學(xué)會學(xué)習(xí)放在了教育結(jié)果評估的中心位置并將其定義為“適應(yīng)新任務(wù)的能力和意愿”。能力指將一般程序和已有知識應(yīng)用于新的情境和任務(wù)中，意愿指一種希望觀；能力和意愿分別對應(yīng)心理學(xué)中的認(rèn)知和情感維度。認(rèn)知維度測量能夠用于解決新任務(wù)的一般能力，包括學(xué)習(xí)和推理兩個領(lǐng)域?？紤]到學(xué)會學(xué)習(xí)是學(xué)生面對新任務(wù)時的表現(xiàn)，為保證任務(wù)新穎性，認(rèn)知測驗考察的內(nèi)容雖與學(xué)校教學(xué)有關(guān)，但采用的形式與學(xué)校任務(wù)不同。情感維度分為自我有關(guān)的信念和與環(huán)境有關(guān)的信念，它們是多層次、多水平的。其中，與自我有關(guān)的信念中比較核心的是動機信念、控制信念、自我評價等，與環(huán)境有關(guān)的信念中比較核心的是重要他人支持等(見表1)。

表1 芬蘭學(xué)會學(xué)習(xí)測驗的結(jié)構(gòu)

根據(jù)這一評估框架，豪塔邁基等人構(gòu)建起了英文版學(xué)會學(xué)習(xí)測驗，包括背景信息、認(rèn)知測驗和情感問卷三大部分。背景信息用于了解被試的性別、年齡、社會經(jīng)濟狀況、父母和個人教育期待、自評學(xué)業(yè)成績等。認(rèn)知測驗任務(wù)涉及學(xué)習(xí)和推理兩個領(lǐng)域：學(xué)習(xí)領(lǐng)域包括閱讀和數(shù)學(xué)等與學(xué)校學(xué)習(xí)內(nèi)容有關(guān)但形式不同的任務(wù)；推理領(lǐng)域測量對學(xué)校學(xué)習(xí)有影響但并不涉及學(xué)校學(xué)習(xí)的內(nèi)容。所有認(rèn)知任務(wù)的問題都采用單項選擇題形式。情感問卷采用七級李克特自我報告問卷，評分等級從1(完全不符合)到7(完全符合)。

芬蘭學(xué)會學(xué)習(xí)測驗的評估框架是一個一般性框架，針對不同學(xué)段設(shè)計了不同的認(rèn)知任務(wù)。自開發(fā)后，其各學(xué)段版本經(jīng)過了多次修改和測試，在實際測試過程中需根據(jù)學(xué)段選擇相應(yīng)量表開展評估?？紤]到義務(wù)教育涉及面廣，關(guān)系著我國國民的基礎(chǔ)學(xué)力，本研究選取芬蘭學(xué)會學(xué)習(xí)測驗初中學(xué)段的最新版本，用于測評接受義務(wù)教育后學(xué)生的學(xué)會學(xué)習(xí)水平。在該版本中，認(rèn)知測驗包括：兩個不同形式的閱讀理解測驗“在旅行社”(At the Travel Agency)和“美國”(USA)；兩個數(shù)量關(guān)系理解測驗“算術(shù)運算”(Arithmetical Operations)和“數(shù)學(xué)概念”(Mathematical Concepts)，分別考察基本數(shù)學(xué)運算能力和數(shù)學(xué)規(guī)則概括能力；一個考察控制變量法的推理測驗“一級方程式賽車”(Formula 1)。情感測驗共有93個問題，分成了兩部分：第一部分主題為“我、學(xué)校和學(xué)習(xí)1”，包含48道題；第二部分主題為“我、學(xué)校和學(xué)習(xí)2”，包含45道題。

由于內(nèi)容較多，原版芬蘭學(xué)會學(xué)習(xí)測驗分兩次施測，其間需要間隔一段時間，本研究也遵循這一實施方式。第一次測驗主題包括：“背景信息”“數(shù)學(xué)概念”“一級方程式賽車”“我、學(xué)校和學(xué)習(xí)1”；第二次測驗主題包括“美國”“算數(shù)運算”“我、學(xué)校和學(xué)習(xí)2”。

三、芬蘭學(xué)會學(xué)習(xí)測驗的編譯

測驗本土化的第一階段是將原版測驗編譯為對應(yīng)的中文版，包括測驗翻譯和目標(biāo)群認(rèn)知訪談兩個步驟。

(一) 測驗翻譯

為確保測驗的目標(biāo)版本和原版本之間的對應(yīng)，測驗翻譯按照順譯、回譯、評審這三個環(huán)節(jié)實施[46][47][48]。首先，兩名熟悉測驗開發(fā)、雅思英語在6.0以上的翻譯人員遵循先單獨翻譯、后討論差異之處的步驟，將原版學(xué)會學(xué)習(xí)測驗翻譯成中文版。其間，為保證測驗的內(nèi)容效度，兩名翻譯人員對原版測驗中的人名、地名或句子形式等進行了必要的本土化調(diào)整(見表2)。然后，為保證回譯過程的客觀、準(zhǔn)確，一名來自第三方機構(gòu)、具有英語專業(yè)學(xué)位和資質(zhì)的翻譯人員將上一階段的中文版測驗回譯成英文。最后，由母語為英語、對研究內(nèi)容不熟悉的一名評審人員對原版和回譯版加以比較。評審結(jié)果表明，原版與回譯版的大部分內(nèi)容保持一致，僅有個別句子表述存在差異。根據(jù)評審者的建議，本研究對這些句子做了調(diào)整。

表2 芬蘭學(xué)會學(xué)習(xí)測驗在翻譯為中文過程中所做調(diào)整

(二) 測驗項目質(zhì)量的初步檢驗

研究通過對目標(biāo)群體開展試測和認(rèn)知訪談，初步檢驗編譯后的學(xué)會學(xué)習(xí)測驗中文版項目的質(zhì)量。目標(biāo)群體的確定分兩條路線：一是教師審查。研究選取5名來自語文、數(shù)學(xué)、物理學(xué)科的中學(xué)教師評價測驗所適用的目標(biāo)群體。二是學(xué)生試測。學(xué)生試測共經(jīng)歷了兩輪。為與原版測驗的目標(biāo)群體一致，研究第一輪試測選取了剛完成義務(wù)教育不久的30名高一學(xué)生作為試測對象。測驗結(jié)果表明，高一學(xué)生平均能夠答對3/4的題目。這與原版測驗所設(shè)定的“具有一些挑戰(zhàn)性”的要求[49]不一致。第二輪試測選擇了26名八年級學(xué)生作為試測對象。測評結(jié)果表明，除“在旅行社”仍過于簡單外，其他任務(wù)難度中等。綜合教師審查和學(xué)生試測結(jié)果，本研究目標(biāo)群體確定為八年級學(xué)生，并在后繼測驗中刪除“在旅行社”這一閱讀任務(wù)。

認(rèn)知訪談旨在從思考過程的角度深入探查學(xué)生對測驗的反應(yīng)是否符合預(yù)期。研究根據(jù)上述26名八年級學(xué)生的作答情況，抽取作答錯誤有一定代表性的8名學(xué)生作為訪談對象。認(rèn)知訪談結(jié)果顯示，學(xué)生能夠正確理解各個任務(wù)和問題，具備完成該任務(wù)的已有知識；同時，學(xué)生感到任務(wù)比較新穎。這與原版測驗的設(shè)計的初衷一致。此外，學(xué)生對題目格式和表述問題提出了修改意見。根據(jù)訪談結(jié)果，本研究對測驗做了相應(yīng)的調(diào)整(見表3)。

表3 認(rèn)知訪談主要結(jié)果及其推論

四、編譯后的學(xué)會學(xué)習(xí)測驗中文版的測量學(xué)質(zhì)量

為了檢驗編譯后的學(xué)會學(xué)習(xí)測驗中文版的測量學(xué)質(zhì)量，本研究選取我國東部和中部地區(qū)的初中和職業(yè)高中358名學(xué)生進行了施測。其中初中學(xué)生327名，職業(yè)高中學(xué)生31名；初中學(xué)生中7年級學(xué)生105名，8年級學(xué)生222名。施測學(xué)生年齡跨度在11—18歲，平均年齡13.51歲，男生占比56.7%。

(一) 效度驗證

采用驗證性因素分析來檢驗編譯后的學(xué)會學(xué)習(xí)測驗中文版與原版測驗的理論模型的一致性。采用穩(wěn)健加權(quán)最小二乘法(WLSMV)估計模型參數(shù)[50]。同時，參考集約校正(RMSEA等)、相對擬合(CFI等)和絕對擬合(SRMR等)方面的多個指標(biāo)來確定模型擬合情況[51]。

有必要指出的是，在模型擬合過程中刪除了不符合模型假設(shè)的項目。其中，文本理解維度有4個題目(題3、10、15、16)；算數(shù)運算有一個題目(題10)因子負(fù)荷不顯著；動機信念和控制信念各有3個題目(“我、學(xué)校和學(xué)習(xí)2”的題3、8、15以及題21、39、45)存在跨因子負(fù)荷。

最終的學(xué)會學(xué)習(xí)測驗的模型擬合情況如表4所示，學(xué)會學(xué)習(xí)測驗的總體擬合情況良好(χ2/df=2.08，RMSEA=0.06，CFI=0.98，TLI=0.97，SRMR=0.06)。除科學(xué)推理(χ2/df=8.81，RMSEA=0.27，CFI=0.84，TLI=0.74，SRMR=0.29)外，學(xué)習(xí)能力和學(xué)習(xí)信念兩個子領(lǐng)域及其分測驗的模型均基本擬合。

表4 編譯后的學(xué)會學(xué)習(xí)測驗中文版的模型擬合情況

(二) 信度分析

表5顯示了編譯后的學(xué)會學(xué)習(xí)測驗中文版的內(nèi)部一致性信度?？梢钥闯觯幾g后的學(xué)會學(xué)習(xí)測驗中文版具有較高的整體信度(克隆巴赫α系數(shù)0.94)，學(xué)習(xí)能力和學(xué)習(xí)信念這兩個子領(lǐng)域也具有較好的信度(克隆巴赫α系數(shù)0.79，克隆巴赫α系數(shù)0.93)。除文本理解分測驗的信度(克隆巴赫α系數(shù)0.53)低于一般測驗所要求的最低范圍[52][53][54]，有必要予以修訂。

表5 編譯后的學(xué)會學(xué)習(xí)測驗中文版的信度

綜上，編譯后的學(xué)會學(xué)習(xí)測驗中文版整體及大部分測驗的效度和信度符合相應(yīng)的測量學(xué)要求，但有兩個維度存在問題，其中文本理解測驗的信度低于可接受水平，科學(xué)推理測驗無法擬合原模型，因而需要進一步加以修訂。

五、修訂后的學(xué)會學(xué)習(xí)測驗中文版的測量學(xué)質(zhì)量

為保證修訂后的學(xué)會學(xué)習(xí)測驗中文版與原版的一致性，本研究在原版測驗的測量建構(gòu)基礎(chǔ)上，結(jié)合編譯后的中文版測驗的測量學(xué)分析結(jié)果，制定測驗修訂方案。請來自語文、數(shù)學(xué)和科學(xué)方向的三位命題專家根據(jù)方案進行題目命制，新命制的題目共55題。隨后，選取學(xué)業(yè)成績具有一定跨度的133名八年級學(xué)生對新命制的題目進行試測，結(jié)果表明測驗的修訂符合預(yù)期方向。根據(jù)試測數(shù)據(jù)分析結(jié)果選取38個新命制的題目，與編譯后的中文版加以整合形成了修訂后的中文版測驗。為確定修訂后的中文版測驗的測量學(xué)特征，選取我國東部地區(qū)919名八年級學(xué)生進行正式測試。正式測試樣本男女比例基本均等(男生比例51.53%)，年齡在12.33—14.92歲(平均13.71歲)。

(一) 建構(gòu)效度

與編譯后的中文版測驗一樣，采用驗證性因素分析來檢驗修訂后的學(xué)會學(xué)習(xí)測驗中文版與理論框架之間的一致性。表6顯示了學(xué)會學(xué)習(xí)測驗的驗證性因素分析的結(jié)果，可以看出修訂后的學(xué)會學(xué)習(xí)測驗整體擬合較好(χ2/df=4.44，RMSEA=0.061，CFI=0.98，TLI=0.97，SRMR=0.04)，學(xué)習(xí)能力和學(xué)習(xí)信念這兩個領(lǐng)域以及各分測驗的模型均擬合較好。

表6 修訂后的學(xué)會學(xué)習(xí)測驗中文版的模型擬合情況

表7顯示了學(xué)會學(xué)習(xí)測驗各個維度之間的相關(guān)關(guān)系，可以看出，除閱讀理解外，學(xué)會學(xué)習(xí)各測驗之間存在顯著相關(guān)，這與預(yù)期一致。但閱讀理解只與其他認(rèn)知測驗相關(guān)，與大部分信念測驗的相關(guān)均不顯著。

(二) 效標(biāo)效度

以認(rèn)知、非認(rèn)知學(xué)習(xí)結(jié)果及人格測驗為效標(biāo)，檢驗修訂后的學(xué)會學(xué)習(xí)測驗中文版的效標(biāo)效度。已有研究認(rèn)為，學(xué)會學(xué)習(xí)對改善學(xué)業(yè)成就——包括認(rèn)知和非認(rèn)知兩個方面[55]——具有重要作用[56][57]。此外，人格也影響學(xué)業(yè)成就，大五人格中的盡責(zé)性和開放性人格與學(xué)業(yè)成就間的關(guān)系最為密切，與學(xué)業(yè)成就之間存在正相關(guān)[58]。在本研究中，認(rèn)知學(xué)習(xí)結(jié)果采用學(xué)生的語文、數(shù)學(xué)和英語三門學(xué)科成績的平均值表示；非認(rèn)知學(xué)習(xí)結(jié)果采用學(xué)生幸福感問卷中的學(xué)校情感測驗[59]；人格測驗采用與學(xué)業(yè)成就最為密切的盡責(zé)性和開放性兩個方面[60]。學(xué)校情感測驗和人格測驗的題目形式均為五點李克特，評分等級從1(“完全不同意”)到5(“完全同意”)這四個效標(biāo)的信度依次為學(xué)業(yè)成績0.90，學(xué)校幸福感測驗0.83，盡責(zé)性0.86、開放性0.82。

表7 修訂后的學(xué)會學(xué)習(xí)測驗中文版的各維度與效標(biāo)的相關(guān)關(guān)系

從表7中各學(xué)會學(xué)習(xí)分測驗與效標(biāo)的相關(guān)可以看出，除閱讀理解外，其余各分測驗與學(xué)業(yè)成績、學(xué)校情感、盡責(zé)性人格和開放性人格均存在顯著相關(guān)。由此，修訂后的學(xué)會學(xué)習(xí)測驗中文版的效標(biāo)效度得以基本驗證。

(三) 信度

表8顯示了修訂后的學(xué)會學(xué)習(xí)測驗中文版的信度，可以看到，學(xué)會學(xué)習(xí)測驗總體信度、學(xué)習(xí)能力和學(xué)習(xí)信念的信度均極好，各個維度的信度均可接受水平，且大多在0.8以上。

表8 修訂后的中文版學(xué)會學(xué)習(xí)測驗的信度

六、結(jié)論與討論

本研究選擇芬蘭學(xué)會學(xué)習(xí)測驗加以本土化，通過對測驗翻譯、確定目標(biāo)群體、開展認(rèn)知訪談等，獲得了與原版相應(yīng)的學(xué)會學(xué)習(xí)測驗中文版。與原版相比，編譯后的學(xué)會學(xué)習(xí)測驗中文版有多處調(diào)整。首先，在測驗翻譯過程中，對測驗題目的名稱、內(nèi)容、形式加以調(diào)整，以保證中文版測驗的內(nèi)容與原版測驗所考察的建構(gòu)保持一致，不受無關(guān)因素干擾。其次，通過對目標(biāo)群體試測發(fā)現(xiàn)，閱讀任務(wù)“在旅行社”過于簡單，故在隨后測試中刪除。另外，在模型擬合過程中，刪除了多個因子負(fù)荷過低或存在跨因子負(fù)荷的題目。

對編譯后的學(xué)會學(xué)習(xí)測驗中文版的測試分析結(jié)果表明，除科學(xué)推理分測驗外，編譯后的學(xué)會學(xué)習(xí)測驗中文版與原版測驗的理論模型基本擬合；除閱讀理解分測驗外，測驗整體及各維度的信度均達到可接受水平，且大部分在0.7以上，信度較好。由于原版學(xué)會學(xué)習(xí)測驗對各分測驗的結(jié)構(gòu)缺少實證檢驗(1)這一點經(jīng)文獻檢索以及與學(xué)會學(xué)習(xí)測驗的開發(fā)團隊(芬蘭赫爾辛基大學(xué)教育評估中心)的負(fù)責(zé)人里斯托·霍圖萊寧(Risto Hotulainen)教授的郵件溝通得以確認(rèn)。，因此，在編譯后的中文版測驗中，科學(xué)推理分測驗結(jié)構(gòu)與假設(shè)的不同既有可能是由兩國文化不同導(dǎo)致的，也有可能是原版測驗題目本身的問題。不過，芬蘭于2001年和2012年對九年級學(xué)生開展了測評，閱讀理解任務(wù)的信度分別為0.67和0.68[61]，這一結(jié)果顯然優(yōu)于編譯后的中文版。因此，閱讀理解測驗信度不足的問題更有可能是文化差異所致。

基于這種考慮，本研究對編譯后的中文版測驗進行了修訂，并對修訂后的學(xué)會學(xué)習(xí)測驗的測量學(xué)質(zhì)量進行了測試和分析。測試結(jié)果表明，修訂后的學(xué)會學(xué)習(xí)測驗中文版的整體及各分測驗的模型均擬合良好，所有分測驗的信度都達到可接受水平，且大部分都在0.8以上，信度較好。由此，修訂后的學(xué)會學(xué)習(xí)測驗中文版可以為我國義務(wù)教育階段評價、科研和實際應(yīng)用提供工具基礎(chǔ)。

需要指出的是，芬蘭學(xué)會學(xué)習(xí)測驗有小學(xué)、初中和高中學(xué)段三個版本，本研究僅探究了初中版本，另兩個版本在我國的適用性有待進一步檢驗。此外，用于修訂學(xué)會學(xué)習(xí)測驗中文版的學(xué)生群體樣本僅限于我國東部的部分城市，在推廣到我國其他地區(qū)時，需要進一步驗證其適用性。雖然如此，修訂后的學(xué)會學(xué)習(xí)測驗中文版對于開展基礎(chǔ)教育階段學(xué)生學(xué)會學(xué)習(xí)能力方面的相關(guān)研究，進行本土教育教學(xué)實踐以及開展相關(guān)方面的跨文化比較，奠定了一定的研究基礎(chǔ)。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡