張 潔 楊向東 郭少陽
在信息社會,知識與技能更替速度加快,如果學(xué)校還像原來一樣局限于傳授一些具體學(xué)科內(nèi)容,將導(dǎo)致學(xué)生在離開校園后難以適應(yīng)社會[1][2]。為改變這一困境,早在20世紀(jì)70年代,聯(lián)合國教育科學(xué)文化組織就提出“學(xué)會學(xué)習(xí)”的口號,并將其確立為教育的四大支柱之一[3]??缛?1世紀(jì)后,學(xué)會學(xué)習(xí)作為新世紀(jì)人才的必備素養(yǎng),獲得了更為廣泛的重視[4][5]。然而,學(xué)會學(xué)習(xí)所受到的廣泛關(guān)注與該研究領(lǐng)域的進展不相稱。盡管當(dāng)前幾乎找不到反對學(xué)會學(xué)習(xí)的聲音,但它至今沒有一個統(tǒng)一的定義[6][7]!
學(xué)會學(xué)習(xí)的概念有廣義和狹義之分[8][9][10]。狹義的學(xué)會學(xué)習(xí)是指學(xué)習(xí)者通過掌握學(xué)習(xí)策略、技巧、方法等來改善學(xué)業(yè)成績。這類學(xué)會學(xué)習(xí)通常由教師主導(dǎo),且面向低年級或成績差的學(xué)生。[11][12]而廣義的學(xué)會學(xué)習(xí)是指學(xué)習(xí)者掌握了可以適用于未來學(xué)習(xí)的更一般、更高階的能力,目的是使學(xué)生成為終身學(xué)習(xí)者。廣義的學(xué)會學(xué)習(xí)要求所有學(xué)習(xí)者探索自身的學(xué)習(xí)過程[13][14][15],教師只是扮演促進者的角色。進入21世紀(jì),越來越多的研究者開始關(guān)注廣義的學(xué)會學(xué)習(xí)。然而對于學(xué)會學(xué)習(xí)應(yīng)該包含哪些能力,研究者有多種看法。有研究者從認(rèn)知角度出發(fā),認(rèn)為學(xué)會學(xué)習(xí)像智力一樣,是一種通用能力,在其他的技能和能力背后,控制著更具體的結(jié)構(gòu)系統(tǒng)(如空間想象、數(shù)量關(guān)系等)的運作。[16]有研究者把學(xué)會學(xué)習(xí)看作元認(rèn)知,認(rèn)為其是提高對學(xué)習(xí)的覺察和監(jiān)控能力。[17]另有研究者將學(xué)會學(xué)習(xí)與自我調(diào)節(jié)學(xué)習(xí)等同起來[18],認(rèn)為學(xué)會學(xué)習(xí)是學(xué)習(xí)者能夠采取策略管理自身的學(xué)習(xí)過程,從而更好地實現(xiàn)學(xué)習(xí)目標(biāo)[19][20]。從這些爭議可見,由于所依據(jù)的理論不同,研究者們提出的學(xué)會學(xué)習(xí)內(nèi)涵差異很大。不過,隨著研究進展,目前越來越多的研究者認(rèn)同學(xué)會學(xué)習(xí)是一個包含認(rèn)知、情感、元認(rèn)知等多個維度的復(fù)雜概念[21][22]。
測評是學(xué)會學(xué)習(xí)研究的重點問題,也是教育質(zhì)量監(jiān)測的難點問題[23]。由于缺乏統(tǒng)一的定義,學(xué)會學(xué)習(xí)的測評工具十分混亂。當(dāng)前許多以學(xué)會學(xué)習(xí)為名的測評工具所評估的并不是學(xué)會學(xué)習(xí)本身,而只是與之相關(guān)的一些概念,如學(xué)習(xí)風(fēng)格、學(xué)習(xí)概念、學(xué)科成績、學(xué)業(yè)表現(xiàn)等[24][25][26][27]。學(xué)會學(xué)習(xí)的復(fù)雜性還帶來了測評內(nèi)容代表性的問題。一些學(xué)會學(xué)習(xí)測驗盡管測量了學(xué)會學(xué)習(xí),但僅憑經(jīng)驗或需要選取了幾個成分,如學(xué)習(xí)動機、學(xué)習(xí)重要性、學(xué)習(xí)場所、學(xué)習(xí)策略[28],或成就動機、學(xué)習(xí)問題、理解性學(xué)習(xí)、意義取向、運用邏輯操作[29]等,來指代學(xué)會學(xué)習(xí)。然而,由于缺乏對學(xué)會學(xué)習(xí)概念領(lǐng)域的系統(tǒng)分析,難以保證所選取成分的代表性。類似地,PISA中也有一部分測驗涉及學(xué)會學(xué)習(xí)[30],但由于其內(nèi)容僅涉及學(xué)生參與、學(xué)習(xí)方法和學(xué)習(xí)習(xí)慣等方面,因而也不是一個完整的學(xué)會學(xué)習(xí)測評[31]。目前,基于對學(xué)會學(xué)習(xí)研究的系統(tǒng)分析以及學(xué)會學(xué)習(xí)的多個維度開發(fā)的綜合性學(xué)會學(xué)習(xí)測評工具包括:大學(xué)生學(xué)會學(xué)習(xí)能力問卷(QELtLCUS questionnaire)[32]、學(xué)會學(xué)習(xí)能力問卷[33]、歐洲學(xué)會學(xué)習(xí)測驗(European learning to learn test)[34]、芬蘭學(xué)會學(xué)習(xí)測驗(Finnish learning to learn test)[35]。
西班牙瓦倫西亞大學(xué)的加加洛-洛佩斯(Gargallo-López)等人開發(fā)的大學(xué)生學(xué)會學(xué)習(xí)能力問卷經(jīng)過理論論證和實證檢驗,是比較可信的學(xué)會學(xué)習(xí)測評工具。該問卷包括認(rèn)知、元認(rèn)知、情感動機、社會關(guān)系、倫理等5個主維度,共包括85個問題。所有問題均采用五點李克特測驗形式,從“完全不同意”到“完全同意”。目前該問卷已在西班牙采用1237人的大學(xué)生樣本做了測量學(xué)檢驗,驗證性因素分析顯示這五個維度的模型擬合良好,信度系數(shù)在0.86—0.90之間。[36]不過,該問卷針對的是大學(xué)生群體,無法適用于基礎(chǔ)教育階段的學(xué)會學(xué)習(xí)測評。
我國孫妍妍等人開發(fā)了一個適用中小學(xué)生的學(xué)會學(xué)習(xí)能力問卷。該問卷借鑒已有學(xué)會學(xué)習(xí)評估框架,將學(xué)會學(xué)習(xí)分成認(rèn)知、情感和元認(rèn)知三個維度,并基于美國國家研究中心的NCRIFFAL問卷和密歇根大學(xué)的動機策略測驗[37],構(gòu)造了一個包含36個題目自我報告問卷。所有題目采用五點李克特形式,從“完全不符合”到“完全符合”。盡管該問卷的信度和效度經(jīng)過檢驗均達到了可接受水平,但由于缺乏堅實的理論基礎(chǔ),其測評框架存在一定的問題。如“學(xué)習(xí)過程”被列為認(rèn)知維度下的子維度,但按照其定義“學(xué)生對學(xué)習(xí)中認(rèn)知過程的把控能力”,該維度應(yīng)該歸屬于元認(rèn)知,這從其參考文獻[38]中也能一瞥端倪。再如其將“自我調(diào)節(jié)”和“學(xué)習(xí)習(xí)慣”作為元認(rèn)知維度下的兩個子維度,與已有研究不符[39][40][41]。因此,盡管該問卷的主要維度具有一定的綜合性,但其具體框架的合理性仍有待考察。
歐盟終身學(xué)習(xí)委員會專家組在借鑒歐盟多國已有研究的基礎(chǔ)上,開發(fā)出包含認(rèn)知、情感和元認(rèn)知三個維度的學(xué)會學(xué)習(xí)測驗。其認(rèn)知維度來源于芬蘭學(xué)會學(xué)習(xí)測驗的認(rèn)知維度以及荷蘭的跨學(xué)科測驗,包含識別假設(shè)、運用規(guī)則、測試規(guī)則和假設(shè)、運用思維工具等四個子維度。其情感維度來源于芬蘭學(xué)會學(xué)習(xí)測驗的情感維度以及英國的學(xué)習(xí)能量測評,包含學(xué)習(xí)動機、學(xué)習(xí)策略、有關(guān)變化的取向、學(xué)業(yè)自我概念和自尊、學(xué)習(xí)環(huán)境等五個子維度。其元認(rèn)知維度借鑒了西班牙馬德里大學(xué)的元認(rèn)知測驗,包含問題解決、元認(rèn)知精確性和元認(rèn)知自信三個子維度。該測驗全部采用自我報告問卷形式,但對歐盟國家14歲學(xué)生的試測發(fā)現(xiàn),其測量學(xué)水平有限,仍需進一步調(diào)整[42]。
芬蘭赫爾辛基大學(xué)教育評估中心的豪塔邁基等人在對已有文獻進行廣泛分析的基礎(chǔ)上,開發(fā)了適用中小學(xué)生的學(xué)會學(xué)習(xí)測驗。該測驗把學(xué)會學(xué)習(xí)分成學(xué)習(xí)能力、我相關(guān)的信念、環(huán)境相關(guān)的信念三個方面。學(xué)習(xí)能力對應(yīng)認(rèn)知和元認(rèn)知維度,而自我和環(huán)境相關(guān)的信念對應(yīng)學(xué)習(xí)的情感維度。信念部分的測驗共有93題,采用七點李克特形式的自我報告問卷。但與前述三個測驗全部采用問卷形式不同,芬蘭學(xué)會學(xué)習(xí)測驗中的學(xué)習(xí)能力測驗采用了認(rèn)知測驗任務(wù)的形式。為適應(yīng)不同學(xué)段的需要,芬蘭學(xué)會學(xué)習(xí)測驗的認(rèn)知任務(wù)包含多個版本,分別適用于6、9、12年級。在1996—2017年,芬蘭學(xué)會學(xué)習(xí)測驗在芬蘭國內(nèi)進行過多次測試,信度0.5—0.9[43][44],且效標(biāo)效度良好;該測驗的高中版也在瑞典得以驗證[45]。
學(xué)會學(xué)習(xí)是一個復(fù)雜概念,因此其測驗開發(fā)的時間及人力成本巨大。相比之下,對測驗進行編譯更為可行。從上述分析可知,芬蘭學(xué)會學(xué)習(xí)測驗是目前適用基礎(chǔ)教育階段的最為可信的學(xué)會學(xué)習(xí)測評工具。為此,本研究對芬蘭學(xué)會學(xué)習(xí)測驗加以本土化,以期為我國基礎(chǔ)教育階段的學(xué)會學(xué)習(xí)測評提供可靠工具。
為響應(yīng)國家教育改革號召,豪塔邁基等人將學(xué)會學(xué)習(xí)放在了教育結(jié)果評估的中心位置并將其定義為“適應(yīng)新任務(wù)的能力和意愿”。能力指將一般程序和已有知識應(yīng)用于新的情境和任務(wù)中,意愿指一種希望觀;能力和意愿分別對應(yīng)心理學(xué)中的認(rèn)知和情感維度。認(rèn)知維度測量能夠用于解決新任務(wù)的一般能力,包括學(xué)習(xí)和推理兩個領(lǐng)域??紤]到學(xué)會學(xué)習(xí)是學(xué)生面對新任務(wù)時的表現(xiàn),為保證任務(wù)新穎性,認(rèn)知測驗考察的內(nèi)容雖與學(xué)校教學(xué)有關(guān),但采用的形式與學(xué)校任務(wù)不同。情感維度分為自我有關(guān)的信念和與環(huán)境有關(guān)的信念,它們是多層次、多水平的。其中,與自我有關(guān)的信念中比較核心的是動機信念、控制信念、自我評價等,與環(huán)境有關(guān)的信念中比較核心的是重要他人支持等(見表1)。
表1 芬蘭學(xué)會學(xué)習(xí)測驗的結(jié)構(gòu)
根據(jù)這一評估框架,豪塔邁基等人構(gòu)建起了英文版學(xué)會學(xué)習(xí)測驗,包括背景信息、認(rèn)知測驗和情感問卷三大部分。背景信息用于了解被試的性別、年齡、社會經(jīng)濟狀況、父母和個人教育期待、自評學(xué)業(yè)成績等。認(rèn)知測驗任務(wù)涉及學(xué)習(xí)和推理兩個領(lǐng)域:學(xué)習(xí)領(lǐng)域包括閱讀和數(shù)學(xué)等與學(xué)校學(xué)習(xí)內(nèi)容有關(guān)但形式不同的任務(wù);推理領(lǐng)域測量對學(xué)校學(xué)習(xí)有影響但并不涉及學(xué)校學(xué)習(xí)的內(nèi)容。所有認(rèn)知任務(wù)的問題都采用單項選擇題形式。情感問卷采用七級李克特自我報告問卷,評分等級從1(完全不符合)到7(完全符合)。
芬蘭學(xué)會學(xué)習(xí)測驗的評估框架是一個一般性框架,針對不同學(xué)段設(shè)計了不同的認(rèn)知任務(wù)。自開發(fā)后,其各學(xué)段版本經(jīng)過了多次修改和測試,在實際測試過程中需根據(jù)學(xué)段選擇相應(yīng)量表開展評估??紤]到義務(wù)教育涉及面廣,關(guān)系著我國國民的基礎(chǔ)學(xué)力,本研究選取芬蘭學(xué)會學(xué)習(xí)測驗初中學(xué)段的最新版本,用于測評接受義務(wù)教育后學(xué)生的學(xué)會學(xué)習(xí)水平。在該版本中,認(rèn)知測驗包括:兩個不同形式的閱讀理解測驗“在旅行社”(At the Travel Agency)和“美國”(USA);兩個數(shù)量關(guān)系理解測驗“算術(shù)運算”(Arithmetical Operations)和“數(shù)學(xué)概念”(Mathematical Concepts),分別考察基本數(shù)學(xué)運算能力和數(shù)學(xué)規(guī)則概括能力;一個考察控制變量法的推理測驗“一級方程式賽車”(Formula 1)。情感測驗共有93個問題,分成了兩部分:第一部分主題為“我、學(xué)校和學(xué)習(xí)1”,包含48道題;第二部分主題為“我、學(xué)校和學(xué)習(xí)2”,包含45道題。
由于內(nèi)容較多,原版芬蘭學(xué)會學(xué)習(xí)測驗分兩次施測,其間需要間隔一段時間,本研究也遵循這一實施方式。第一次測驗主題包括:“背景信息”“數(shù)學(xué)概念”“一級方程式賽車”“我、學(xué)校和學(xué)習(xí)1”;第二次測驗主題包括“美國”“算數(shù)運算”“我、學(xué)校和學(xué)習(xí)2”。
測驗本土化的第一階段是將原版測驗編譯為對應(yīng)的中文版,包括測驗翻譯和目標(biāo)群認(rèn)知訪談兩個步驟。
為確保測驗的目標(biāo)版本和原版本之間的對應(yīng),測驗翻譯按照順譯、回譯、評審這三個環(huán)節(jié)實施[46][47][48]。首先,兩名熟悉測驗開發(fā)、雅思英語在6.0以上的翻譯人員遵循先單獨翻譯、后討論差異之處的步驟,將原版學(xué)會學(xué)習(xí)測驗翻譯成中文版。其間,為保證測驗的內(nèi)容效度,兩名翻譯人員對原版測驗中的人名、地名或句子形式等進行了必要的本土化調(diào)整(見表2)。然后,為保證回譯過程的客觀、準(zhǔn)確,一名來自第三方機構(gòu)、具有英語專業(yè)學(xué)位和資質(zhì)的翻譯人員將上一階段的中文版測驗回譯成英文。最后,由母語為英語、對研究內(nèi)容不熟悉的一名評審人員對原版和回譯版加以比較。評審結(jié)果表明,原版與回譯版的大部分內(nèi)容保持一致,僅有個別句子表述存在差異。根據(jù)評審者的建議,本研究對這些句子做了調(diào)整。
表2 芬蘭學(xué)會學(xué)習(xí)測驗在翻譯為中文過程中所做調(diào)整
研究通過對目標(biāo)群體開展試測和認(rèn)知訪談,初步檢驗編譯后的學(xué)會學(xué)習(xí)測驗中文版項目的質(zhì)量。目標(biāo)群體的確定分兩條路線:一是教師審查。研究選取5名來自語文、數(shù)學(xué)、物理學(xué)科的中學(xué)教師評價測驗所適用的目標(biāo)群體。二是學(xué)生試測。學(xué)生試測共經(jīng)歷了兩輪。為與原版測驗的目標(biāo)群體一致,研究第一輪試測選取了剛完成義務(wù)教育不久的30名高一學(xué)生作為試測對象。測驗結(jié)果表明,高一學(xué)生平均能夠答對3/4的題目。這與原版測驗所設(shè)定的“具有一些挑戰(zhàn)性”的要求[49]不一致。第二輪試測選擇了26名八年級學(xué)生作為試測對象。測評結(jié)果表明,除“在旅行社”仍過于簡單外,其他任務(wù)難度中等。綜合教師審查和學(xué)生試測結(jié)果,本研究目標(biāo)群體確定為八年級學(xué)生,并在后繼測驗中刪除“在旅行社”這一閱讀任務(wù)。
認(rèn)知訪談旨在從思考過程的角度深入探查學(xué)生對測驗的反應(yīng)是否符合預(yù)期。研究根據(jù)上述26名八年級學(xué)生的作答情況,抽取作答錯誤有一定代表性的8名學(xué)生作為訪談對象。認(rèn)知訪談結(jié)果顯示,學(xué)生能夠正確理解各個任務(wù)和問題,具備完成該任務(wù)的已有知識;同時,學(xué)生感到任務(wù)比較新穎。這與原版測驗的設(shè)計的初衷一致。此外,學(xué)生對題目格式和表述問題提出了修改意見。根據(jù)訪談結(jié)果,本研究對測驗做了相應(yīng)的調(diào)整(見表3)。
表3 認(rèn)知訪談主要結(jié)果及其推論
為了檢驗編譯后的學(xué)會學(xué)習(xí)測驗中文版的測量學(xué)質(zhì)量,本研究選取我國東部和中部地區(qū)的初中和職業(yè)高中358名學(xué)生進行了施測。其中初中學(xué)生327名,職業(yè)高中學(xué)生31名;初中學(xué)生中7年級學(xué)生105名,8年級學(xué)生222名。施測學(xué)生年齡跨度在11—18歲,平均年齡13.51歲,男生占比56.7%。
采用驗證性因素分析來檢驗編譯后的學(xué)會學(xué)習(xí)測驗中文版與原版測驗的理論模型的一致性。采用穩(wěn)健加權(quán)最小二乘法(WLSMV)估計模型參數(shù)[50]。同時,參考集約校正(RMSEA等)、相對擬合(CFI等)和絕對擬合(SRMR等)方面的多個指標(biāo)來確定模型擬合情況[51]。
有必要指出的是,在模型擬合過程中刪除了不符合模型假設(shè)的項目。其中,文本理解維度有4個題目(題3、10、15、16);算數(shù)運算有一個題目(題10)因子負(fù)荷不顯著;動機信念和控制信念各有3個題目(“我、學(xué)校和學(xué)習(xí)2”的題3、8、15以及題21、39、45)存在跨因子負(fù)荷。
最終的學(xué)會學(xué)習(xí)測驗的模型擬合情況如表4所示,學(xué)會學(xué)習(xí)測驗的總體擬合情況良好(χ2/df=2.08,RMSEA=0.06,CFI=0.98,TLI=0.97,SRMR=0.06)。除科學(xué)推理(χ2/df=8.81,RMSEA=0.27,CFI=0.84,TLI=0.74,SRMR=0.29)外,學(xué)習(xí)能力和學(xué)習(xí)信念兩個子領(lǐng)域及其分測驗的模型均基本擬合。
表4 編譯后的學(xué)會學(xué)習(xí)測驗中文版的模型擬合情況
表5顯示了編譯后的學(xué)會學(xué)習(xí)測驗中文版的內(nèi)部一致性信度??梢钥闯觯幾g后的學(xué)會學(xué)習(xí)測驗中文版具有較高的整體信度(克隆巴赫α系數(shù)0.94),學(xué)習(xí)能力和學(xué)習(xí)信念這兩個子領(lǐng)域也具有較好的信度(克隆巴赫α系數(shù)0.79,克隆巴赫α系數(shù)0.93)。除文本理解分測驗的信度(克隆巴赫α系數(shù)0.53)低于一般測驗所要求的最低范圍[52][53][54],有必要予以修訂。
表5 編譯后的學(xué)會學(xué)習(xí)測驗中文版的信度
綜上,編譯后的學(xué)會學(xué)習(xí)測驗中文版整體及大部分測驗的效度和信度符合相應(yīng)的測量學(xué)要求,但有兩個維度存在問題,其中文本理解測驗的信度低于可接受水平,科學(xué)推理測驗無法擬合原模型,因而需要進一步加以修訂。
為保證修訂后的學(xué)會學(xué)習(xí)測驗中文版與原版的一致性,本研究在原版測驗的測量建構(gòu)基礎(chǔ)上,結(jié)合編譯后的中文版測驗的測量學(xué)分析結(jié)果,制定測驗修訂方案。請來自語文、數(shù)學(xué)和科學(xué)方向的三位命題專家根據(jù)方案進行題目命制,新命制的題目共55題。隨后,選取學(xué)業(yè)成績具有一定跨度的133名八年級學(xué)生對新命制的題目進行試測,結(jié)果表明測驗的修訂符合預(yù)期方向。根據(jù)試測數(shù)據(jù)分析結(jié)果選取38個新命制的題目,與編譯后的中文版加以整合形成了修訂后的中文版測驗。為確定修訂后的中文版測驗的測量學(xué)特征,選取我國東部地區(qū)919名八年級學(xué)生進行正式測試。正式測試樣本男女比例基本均等(男生比例51.53%),年齡在12.33—14.92歲(平均13.71歲)。
與編譯后的中文版測驗一樣,采用驗證性因素分析來檢驗修訂后的學(xué)會學(xué)習(xí)測驗中文版與理論框架之間的一致性。表6顯示了學(xué)會學(xué)習(xí)測驗的驗證性因素分析的結(jié)果,可以看出修訂后的學(xué)會學(xué)習(xí)測驗整體擬合較好(χ2/df=4.44,RMSEA=0.061,CFI=0.98,TLI=0.97,SRMR=0.04),學(xué)習(xí)能力和學(xué)習(xí)信念這兩個領(lǐng)域以及各分測驗的模型均擬合較好。
表6 修訂后的學(xué)會學(xué)習(xí)測驗中文版的模型擬合情況
表7顯示了學(xué)會學(xué)習(xí)測驗各個維度之間的相關(guān)關(guān)系,可以看出,除閱讀理解外,學(xué)會學(xué)習(xí)各測驗之間存在顯著相關(guān),這與預(yù)期一致。但閱讀理解只與其他認(rèn)知測驗相關(guān),與大部分信念測驗的相關(guān)均不顯著。
以認(rèn)知、非認(rèn)知學(xué)習(xí)結(jié)果及人格測驗為效標(biāo),檢驗修訂后的學(xué)會學(xué)習(xí)測驗中文版的效標(biāo)效度。已有研究認(rèn)為,學(xué)會學(xué)習(xí)對改善學(xué)業(yè)成就——包括認(rèn)知和非認(rèn)知兩個方面[55]——具有重要作用[56][57]。此外,人格也影響學(xué)業(yè)成就,大五人格中的盡責(zé)性和開放性人格與學(xué)業(yè)成就間的關(guān)系最為密切,與學(xué)業(yè)成就之間存在正相關(guān)[58]。在本研究中,認(rèn)知學(xué)習(xí)結(jié)果采用學(xué)生的語文、數(shù)學(xué)和英語三門學(xué)科成績的平均值表示;非認(rèn)知學(xué)習(xí)結(jié)果采用學(xué)生幸福感問卷中的學(xué)校情感測驗[59];人格測驗采用與學(xué)業(yè)成就最為密切的盡責(zé)性和開放性兩個方面[60]。學(xué)校情感測驗和人格測驗的題目形式均為五點李克特,評分等級從1(“完全不同意”)到5(“完全同意”)這四個效標(biāo)的信度依次為學(xué)業(yè)成績0.90,學(xué)校幸福感測驗0.83,盡責(zé)性0.86、開放性0.82。
表7 修訂后的學(xué)會學(xué)習(xí)測驗中文版的各維度與效標(biāo)的相關(guān)關(guān)系
從表7中各學(xué)會學(xué)習(xí)分測驗與效標(biāo)的相關(guān)可以看出,除閱讀理解外,其余各分測驗與學(xué)業(yè)成績、學(xué)校情感、盡責(zé)性人格和開放性人格均存在顯著相關(guān)。由此,修訂后的學(xué)會學(xué)習(xí)測驗中文版的效標(biāo)效度得以基本驗證。
表8顯示了修訂后的學(xué)會學(xué)習(xí)測驗中文版的信度,可以看到,學(xué)會學(xué)習(xí)測驗總體信度、學(xué)習(xí)能力和學(xué)習(xí)信念的信度均極好,各個維度的信度均可接受水平,且大多在0.8以上。
表8 修訂后的中文版學(xué)會學(xué)習(xí)測驗的信度
本研究選擇芬蘭學(xué)會學(xué)習(xí)測驗加以本土化,通過對測驗翻譯、確定目標(biāo)群體、開展認(rèn)知訪談等,獲得了與原版相應(yīng)的學(xué)會學(xué)習(xí)測驗中文版。與原版相比,編譯后的學(xué)會學(xué)習(xí)測驗中文版有多處調(diào)整。首先,在測驗翻譯過程中,對測驗題目的名稱、內(nèi)容、形式加以調(diào)整,以保證中文版測驗的內(nèi)容與原版測驗所考察的建構(gòu)保持一致,不受無關(guān)因素干擾。其次,通過對目標(biāo)群體試測發(fā)現(xiàn),閱讀任務(wù)“在旅行社”過于簡單,故在隨后測試中刪除。另外,在模型擬合過程中,刪除了多個因子負(fù)荷過低或存在跨因子負(fù)荷的題目。
對編譯后的學(xué)會學(xué)習(xí)測驗中文版的測試分析結(jié)果表明,除科學(xué)推理分測驗外,編譯后的學(xué)會學(xué)習(xí)測驗中文版與原版測驗的理論模型基本擬合;除閱讀理解分測驗外,測驗整體及各維度的信度均達到可接受水平,且大部分在0.7以上,信度較好。由于原版學(xué)會學(xué)習(xí)測驗對各分測驗的結(jié)構(gòu)缺少實證檢驗(1)這一點經(jīng)文獻檢索以及與學(xué)會學(xué)習(xí)測驗的開發(fā)團隊(芬蘭赫爾辛基大學(xué)教育評估中心)的負(fù)責(zé)人里斯托·霍圖萊寧(Risto Hotulainen)教授的郵件溝通得以確認(rèn)。,因此,在編譯后的中文版測驗中,科學(xué)推理分測驗結(jié)構(gòu)與假設(shè)的不同既有可能是由兩國文化不同導(dǎo)致的,也有可能是原版測驗題目本身的問題。不過,芬蘭于2001年和2012年對九年級學(xué)生開展了測評,閱讀理解任務(wù)的信度分別為0.67和0.68[61],這一結(jié)果顯然優(yōu)于編譯后的中文版。因此,閱讀理解測驗信度不足的問題更有可能是文化差異所致。
基于這種考慮,本研究對編譯后的中文版測驗進行了修訂,并對修訂后的學(xué)會學(xué)習(xí)測驗的測量學(xué)質(zhì)量進行了測試和分析。測試結(jié)果表明,修訂后的學(xué)會學(xué)習(xí)測驗中文版的整體及各分測驗的模型均擬合良好,所有分測驗的信度都達到可接受水平,且大部分都在0.8以上,信度較好。由此,修訂后的學(xué)會學(xué)習(xí)測驗中文版可以為我國義務(wù)教育階段評價、科研和實際應(yīng)用提供工具基礎(chǔ)。
需要指出的是,芬蘭學(xué)會學(xué)習(xí)測驗有小學(xué)、初中和高中學(xué)段三個版本,本研究僅探究了初中版本,另兩個版本在我國的適用性有待進一步檢驗。此外,用于修訂學(xué)會學(xué)習(xí)測驗中文版的學(xué)生群體樣本僅限于我國東部的部分城市,在推廣到我國其他地區(qū)時,需要進一步驗證其適用性。雖然如此,修訂后的學(xué)會學(xué)習(xí)測驗中文版對于開展基礎(chǔ)教育階段學(xué)生學(xué)會學(xué)習(xí)能力方面的相關(guān)研究,進行本土教育教學(xué)實踐以及開展相關(guān)方面的跨文化比較,奠定了一定的研究基礎(chǔ)。