【摘 要】試卷質(zhì)量分析可以從試卷的信度、效度、難度、區(qū)分度等幾個方面加以衡量,SPSS在進行信度分析、效度分析、難度、區(qū)分度計算中有很高的效率。以高等數(shù)學(xué)考試試卷質(zhì)量分析為例,列舉了SPSS在克隆巴赫系數(shù),Pearson積差相關(guān)法效度計算、難度、區(qū)分度計算等方面的具體應(yīng)用。
【關(guān)鍵詞】信度;效度;難度;區(qū)分度;SPSS
【中圖分類號】G424.79 【文獻標識碼】A
【文章編號】2095-3089(2018)15-0005-01
試卷質(zhì)量分析意在從考試得分、失分情況以及某些部分之間的比較、分析,發(fā)現(xiàn)教師命題的成功與不足之處,并針對存在問題提出改進意見,為真實、可靠地衡量學(xué)生的實際學(xué)習(xí)情況提供保證。利用SPSS對試卷的信度、效度、難度、區(qū)分度等幾個方面加以測算與檢驗,可以對試卷的質(zhì)量分析提供可靠的量化依據(jù)。
一、試卷信度分析
信度表示測量的一致性、穩(wěn)定性和測量結(jié)果的可靠性。它要回答用這個測量工具在同一條件下對同一人進行測試,每次測試的結(jié)果是否相同的問題。信度包括重測信度、復(fù)本信度、同質(zhì)性信度、分半信度等,常用信度系數(shù)表示,其值在0~1之間[1]。內(nèi)部一致性信度估計,根據(jù)的是在單次測驗中,這個測驗的題目之間的相關(guān)系數(shù)的平均值。它顯示了所有測驗題目在多大程度上測量的是同一特質(zhì)。克隆巴赫系數(shù)是最為常用的內(nèi)部一致性信度的估計,其計算公式為:
〖XC15.JPG;%30%30〗
其中k為評估項目數(shù),r〖TX-〗為k個項目相關(guān)系數(shù)的均值。a取值為0∶1(越接近1,信度越高)。
高等數(shù)學(xué)試卷SPSS信度分析操作步驟:
(1)選擇[Analysis]→[Scale]→[Reliability Analysis],選擇所有的題目,將所選題目移至Items框。
(2)點擊Statistics,選擇Scale if item deleted(項刪除后的標度)。
(4)點擊Continue,然后點擊OK。
結(jié)果分析:
〖XC16.JPG;%35%35〗
通常a要求值至少達到0.7[2];從表1看出本試卷達到0.861,認為一致性信度較好,測試的可靠性比較高。
〖XC17.JPG;%35%35〗
從最后一列數(shù)據(jù)看出是非題刪除后a值變大,信度提升為0.871。故應(yīng)對是非題作相應(yīng)修改。
二、試卷的效度分析
效度表示測量跟測量目的符合的程度,是測量準確性和有效性的指標。跟測驗?zāi)康臒o關(guān)的因素影響越小,測驗的有效性即效度就越高。效度分為內(nèi)容效度、效標關(guān)聯(lián)效度和結(jié)構(gòu)效度[3]。其中效標關(guān)聯(lián)效度通常以另一比較符合測量目的的測量結(jié)果作為檢測效度的參照標準,通過計算測驗分數(shù)與效標的相關(guān)系數(shù)來估計效標關(guān)聯(lián)效度。
Pearson法SPSS效度分析操作步驟:
(1)選擇[Analysis]→[Correlate]→[Bivariate],將“平時成績”和“總成績”拖入“Variables”中,其中“平時成績”作為效標,分析其與“總成績”的相關(guān)關(guān)系。
(2)選擇“Correlations Coefficients”框下面的“Pearson”檢驗方法,計算效標“平時成績”與“總成績”之間的相關(guān)系數(shù),利用積差相關(guān)法求效度。
〖XC18.JPG;%35%35〗
由表3得到平時成績與總成績的相關(guān)系數(shù)為0.865,說明本次考試與平時成績的相關(guān)性強,即本次考試反映了學(xué)生的真實水平,有效性與準確性較好,符合效度要求。
三、試卷的難度分析
定量刻畫被試作答一個題目所遇到的困難程度的量數(shù)稱為題目的難度系數(shù)。
難度系數(shù)的計算方法有如下三種:(1)以全體被試得分率為難度系數(shù)。(2)以全體被試的通過率為難度系數(shù)。(3)以高分組與低分組被試得分率的均值為難度系數(shù)。通常高分組與低分組人數(shù)各占總?cè)藬?shù)的27%[3]。
四、試卷區(qū)分度分析
區(qū)分度又稱鑒別力,是指試題對所要測量的心理特性的識別程度也就是項目的效度。主要是針對測量表或測試試卷中的單個題目的鑒別度。
計算區(qū)分度的方法有以下幾種:
(1)項目鑒別指數(shù)法(高低分組法),計算公式:
〖XC19.JPG;%35%35〗
式中PH和PL分別表示高分組與低分組的通過率,XH〖TX-〗和XL〖TX-〗分別表示高分組與低分組在特定題目上的平均得分,為該題目的滿分值。
(2)均值比較T檢驗法。
先將試卷按總分高低進行分組,利用獨立樣本T檢驗比較特定題目的高分組與低分組的均值有無顯著差異,從而確定該題目的鑒別力。
(3)相關(guān)分析法——點二列相關(guān)。
該方法適用于題型為是非題,測驗總分為連續(xù)變量的數(shù)據(jù)資料。
對高等數(shù)學(xué)試卷先用T檢驗法計算區(qū)分度
先將各題型成績分為高分組與低分組,用獨立樣本T檢驗法檢驗兩組的均值有無顯著差異,以此判斷各題型的區(qū)分度。檢驗結(jié)果顯示除了是非題差異不顯著(顯著性指標大于0.05),其余題型均為差異顯著(顯著性指標小于0.05)。
五、結(jié)語
以上討論了試卷質(zhì)量分析的幾個重要方面,結(jié)合試卷結(jié)構(gòu)分析和答題情況的描述性統(tǒng)計可以就考試目的和試卷內(nèi)容、結(jié)構(gòu)、形式的合理性、適宜性、有效性和可行性等作出更為全面的評價。
參考文獻
[1][美]Dimiter M.Dimitrov.心理與教育中高級研究方法與數(shù)據(jù)分析[M].北京:中國輕工業(yè)出版社,2015:22-25.
[2]杜強,賈麗艷,嚴先鋒.SPSS統(tǒng)計分析從入門到精通[M].北京:人民郵電出版社,2015:43-47.
作者簡介:劉歡培(1965-),男,副教授,浙江、衢州學(xué)院教師教育學(xué)院,研究方向:應(yīng)用統(tǒng)計。