国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

淺析SPSS軟件在物理試卷分析中的應(yīng)用

2011-07-25 03:21馬功平
物理教師 2011年9期
關(guān)鍵詞:區(qū)分度信度試卷

馬功平

(慈溪市楊賢江中學(xué),浙江慈溪 315300)

美國教育心理學(xué)家布盧姆認(rèn)為,評價是一種獲取和處理用以確定學(xué)生水平和教學(xué)有效性的證據(jù)的方法.測試則是評價的有利工具,高質(zhì)量的試卷能檢驗教學(xué)效果和反映學(xué)生的學(xué)習(xí)能力,從而體現(xiàn)評價的科學(xué)性,有效地對教學(xué)加以監(jiān)督和調(diào)整.鑒于目前多數(shù)教師憑借經(jīng)驗出題,不僅不能保證試卷應(yīng)有的質(zhì)量,不能全面客觀地檢測學(xué)生的學(xué)習(xí)效果,而且由于缺乏必要的簡單統(tǒng)計知識,對考試結(jié)果不能做出正確的解釋,致使考試結(jié)果中蘊藏的大量信息白白浪費.全面的試卷分析往往考試人數(shù)眾多,指標(biāo)算法繁瑣,工作量大,目前尚無較好的試卷分析軟件.本文嘗試使用SPSS統(tǒng)計軟件進(jìn)行試卷分析,其具有實用、簡單、可操作性強等特點,能滿足試卷分析全部指標(biāo)的分析計算,以期拋磚引玉.

1 SPSS軟件簡介

SPSS(Statistic Package for the Social Science)是由美國SPSS軟件公司開發(fā)的大型社會科學(xué)統(tǒng)計軟件包,它集數(shù)據(jù)整理、分析和結(jié)果輸出等功能于一身,是世界上最早的統(tǒng)計分析軟件之一.目前該軟件的版本數(shù)據(jù)管理和分析功能強大,界面友好,操作簡單,全部為視窗菜單式操作、編輯,具有靈活的變量變換和文件交換系統(tǒng),多種統(tǒng)計圖表的結(jié)果輸出,并與Microsoft Office軟件兼容等特點,已經(jīng)廣泛應(yīng)用于醫(yī)學(xué)、心理學(xué)、人文學(xué)、生物學(xué)、教育學(xué)等領(lǐng)域.

2 試卷分析統(tǒng)計指標(biāo)

根據(jù)教育評價理論,試卷分析包括試卷成績分析和試卷質(zhì)量分析兩個部分,結(jié)合試卷分析要求和自身的實踐,試卷分析具體指標(biāo)主要包括以下幾個方面.

2.1 試卷成績分析

涉及指標(biāo)有學(xué)生總數(shù)、參加考試人數(shù),最高分、最低分,平均分與標(biāo)準(zhǔn)差,優(yōu)秀、良好、及格與不及格的人數(shù)分布及百分比等.以上指標(biāo)要求按班級、年級對試卷成績及總評成績進(jìn)行分析.

2.2 試卷質(zhì)量分析

定量指標(biāo):難度指數(shù) P、區(qū)分度D、信度 r、效度等.

定性指標(biāo):試卷覆蓋面、內(nèi)容效度、卷面失分原因分析;試題的表述是否科學(xué)、正確;名詞術(shù)語是否準(zhǔn)確;選擇題備選答案設(shè)計是否合適、排列是否隨機;參考答案是否正確、卷中內(nèi)容是否對答案有提示等.

2.3 成績的差異性檢驗

在進(jìn)行試卷分析時,不能孤立地去看每個班的成績.有必要比較不同班級的成績,不同班級間成績等級分布,從而有助于分析班級間存在的差異.涉及的指標(biāo)有獨立樣本的T檢驗及 χ2檢驗等.

3 SPSS在試卷分析中的應(yīng)用

選取了慈溪市某高中2010學(xué)年同一任課教師任教的高一兩個平行班的物理期末成績?yōu)闃颖?淺析SPSS軟件在物理試卷分析中的具體應(yīng)用.

3.1 課程基本情況及數(shù)據(jù)錄入

3.1.1 課程基本情況及試卷結(jié)構(gòu)(如表 1,表2所示).

表1 課程基本情況

表2 試題分值分布

圖1 數(shù)據(jù)定義

3.1.2 數(shù)據(jù)錄入

數(shù)據(jù)文件的建立可選用Excel、dBase、SPSS等軟件進(jìn)行,Excel、dBase數(shù)據(jù)文件可以轉(zhuǎn)換到SPSS數(shù)據(jù)文件.本文選用SPSS軟件建立數(shù)據(jù)文件,行為記錄,列為變量.單擊Variable view 標(biāo)簽,在Name標(biāo)題下定義:學(xué)號、姓名、題號……期末成績等.其中各題和期末成績均定義成Numeric類型,Decimals(小數(shù)點后長度)為0,其余各項使用默認(rèn)(見圖1).再單擊Data View標(biāo)簽,逐個錄入每個記錄數(shù)據(jù),即學(xué)生信息和每題得分.

3.2 試卷成績分析

3.2.1 成績的基本描述性統(tǒng)計

考試成績的基本描述統(tǒng)計量包括均值(mean)、標(biāo)準(zhǔn)差(Standard Deviation:Std Dev)、偏度(Skewness)和峰度(Kurtosis)等.均值代表數(shù)據(jù)的集中趨勢;標(biāo)準(zhǔn)差可用來描述數(shù)據(jù)的離散程度,標(biāo)準(zhǔn)差越大說明數(shù)據(jù)間的差異越大;偏度和峰度用來描述數(shù)據(jù)分布是否對稱,偏斜程度如何,分布陡緩程度等.

以年級為單位,對試卷進(jìn)行成績的基本描述性統(tǒng)計.步驟如下:①單擊 Analyze→Descriptive Statistics→Descriptives;②將需計算的變量“期末成績”移入Variable(s)框中;③再單擊Options按鈕,選上mean、Std Deviation、Skew ness、Kurtosis四個指標(biāo);④最后點擊OK 按鈕(見圖 2).操作完畢即可得表3的結(jié)果.

圖2

表3 總體成績基本描述性統(tǒng)計

以班為單位,對試卷進(jìn)行成績的基本描述性統(tǒng)計.拆分文件:單擊 Data→Spilt File→Organize Output by Groups,將“班級”變量移入Groups Based框中,再單擊 OK按鈕,即可將數(shù)據(jù)按“班級”拆分.再按上述步驟可完成對不同班級的成績的基本描述性統(tǒng)計.(見圖3)

圖3 班級拆分對話框

3.2.2 成績等級比率統(tǒng)計

在進(jìn)行試卷分析時往往還要統(tǒng)計成績等級的人數(shù)及所占的比例,比如90分以上的,70-80分?jǐn)?shù)段之間有多少人等.步驟如下:①將百分制分?jǐn)?shù)轉(zhuǎn)換成優(yōu)秀(≥80分),良好(79~70),及格(69~60),不及格(<60)4個等級;②單擊Transform→Recode→Intodifferent variables;③將“期末成績”變量移入Numeric Variable→Output Variable框中,并在Output Variable框中輸入“期末成績等級”;④在Name框中單擊Old and New Values按扭,選擇 Range,在其下框中輸入相應(yīng)的分?jǐn)?shù)范圍,在New Value欄中Value的框中輸入相對應(yīng)的分?jǐn)?shù)等級,單擊Add逐個添入;⑤單擊Continue及OK按鈕;⑥單擊 Analyze→Descriptive Statistics→Crosstabs,將行變量“班級”移入到 Row(s)框中,將列變量“期末成績等級”移入到Column(s)框中;⑦單擊Cells按鈕,在Percentages框中選擇 Row、Column和 Total(見圖 4),操作完畢即可得表4.

圖4 成績轉(zhuǎn)換為分?jǐn)?shù)段對話框

表4 各班物理成績等級分布

本卷統(tǒng)計發(fā)現(xiàn),學(xué)生較多集中在及格(30.5%)和不及格(36.9%)段,優(yōu)秀和良好段分布相對較少(占32.6%),說明本試卷適中.

3.3 試卷質(zhì)量分析

3.3.1 試卷的難度系數(shù)

表5 各大題難度系數(shù)

通過試卷各題的難度表可以看出,試卷難度程度為0.65,難易適中,基本能客觀地反映出學(xué)生的學(xué)習(xí)效果.其中題 1、2、3、5、13、16、21題偏易,需適當(dāng)增加難度,而題 9、11、23偏難,期末考試不是選拔性考試,應(yīng)適當(dāng)降低難度.

3.3.2 試卷的區(qū)分度

區(qū)分度是指某次測驗對考生實際水平的區(qū)分程度,用符號D表示,其數(shù)值范圍為[-1.00,+1.00].一般情況下,D≥0.4,具有較好的區(qū)分度;0.3≤D<0.4,良好,如能改進(jìn)更加理想;0.2≤D<0.3,區(qū)分度尚可,但還需加以改進(jìn);D<0.2,區(qū)分度較差,該試題需淘汰.

區(qū)分度的計算方法很多,對于主觀題來說,使用等級相關(guān)分析即采用Serarman相關(guān)分析;對于客觀題來說,看成是非等間距測度的連續(xù)變量,采用皮爾遜(Pearson)相關(guān)分析.在SPSS中單擊Analyze→Correlate→Bivariate,把計算相關(guān)分析的系數(shù)的期末成績,單1、單2等變量選到Variables,選擇Pearson相關(guān)系數(shù).輸出結(jié)果的每小題與期末成績之間的相關(guān)系數(shù)即為區(qū)分度.

經(jīng)整理可知本卷客觀題區(qū)分度一般,題2、3、5、13、16、21的區(qū)分度不夠,需要淘汰或調(diào)整.但整張試卷的區(qū)分度適中,學(xué)生之間的實際差別,學(xué)生之間的差距基本拉開,學(xué)生所掌握的知識范疇及對知識的理解程度、鞏固程度和運用能力就能得到了充分體現(xiàn).

3.3.3 試卷的信度

信度是指同一個測試對同一組測試兩次或多次得分的一致程度,它通常反映了考試的可靠性.在SPSS軟件中一般采用科隆巴赫(Cronbach)α系數(shù),其取值范圍為 0~1,值越大,信度越高.一般認(rèn)為標(biāo)準(zhǔn)化能力測試或升學(xué)測試信度應(yīng)在0.90以上,對于教師自編測試信度達(dá)到 0.60即可.步驟如下:①單擊Analyze→Scale→Reliability Analysis;②在對話框中將所有表示題目的字段全部移入Items框中;③在Model欄中選擇Alpha方法.操作完畢即可得分析結(jié)果Alpha=0.689,可見本次考試的信度一般.為了提高試卷的信度,可以適當(dāng)提升試題的質(zhì)量,保持試題的難度接近正態(tài)分布,提高試題的區(qū)分度,嚴(yán)格監(jiān)考和按評分標(biāo)準(zhǔn)給分等.

3.4 成績的差異性檢驗

在進(jìn)行試卷分析時,對于同一個教師執(zhí)教的平行班的成績差異,除了與兩個班的平均分有關(guān),還與標(biāo)準(zhǔn)差和樣本數(shù)有關(guān).如果要判斷兩個班級的成績差異是否顯著,就需要進(jìn)行均值的差異性統(tǒng)計檢驗——獨立樣本t檢驗.其步驟如下:①單擊Analyze→Compare→Independent-Samples T Test;②將檢驗變量“期末成績”移入 Test Varibles(s)框中;③將總體標(biāo)志變量“班級”移入Grouping Variables框中;④單擊Define Groups按鈕定義“班級”的標(biāo)志值(見圖 5).操作完畢即可得表6.

圖5 兩個班級的獨立樣本t檢驗

表6 兩個班級的期末成績獨立樣本t檢驗結(jié)果

通過獨立樣本t檢驗結(jié)果顯示,Sig.(2-tailed):p=0.10>0.05,說明兩者之間并無顯著差異,由此不難分析出盡管兩班之間的平均分相差2.01分,但兩班成績無顯著差異.

3.5 試卷的綜合分析

綜合分析是在上述統(tǒng)計分析和檢驗結(jié)果的基礎(chǔ)上定出的總體定性結(jié)論.通過利用SPSS軟件得出了該次期末試卷與成績的初步評價,試卷基本上覆蓋了《物理》必修1教材中的主要知識點,且各章節(jié)所占的分?jǐn)?shù)基本上與各章的課時所占的比重成正比,分布合理.本次考試的平均分是65.34分,標(biāo)準(zhǔn)差是14.67,成績基本上符合正態(tài)分布.試卷的難度系數(shù)是0.65,相對比較合理,區(qū)分度適中,基本能區(qū)別學(xué)生的真實水平,另外信度系數(shù)為0.689,信度一般.再則通過兩個班級的期末成績獨立樣本t檢驗表明兩個班級學(xué)生對知識的掌握程度并無顯著差異.總之,本次物理考試的試卷符合新課標(biāo)的要求,題型合理、題量適中、難度一般、區(qū)分度適中,有利于激勵學(xué)生的積極性,能促進(jìn)教師完善教學(xué)手段和方法.

猜你喜歡
區(qū)分度信度試卷
《廣東地區(qū)兒童中醫(yī)體質(zhì)辨識量表》的信度和效度研究
淺談試卷分析常用的幾個參數(shù)及其應(yīng)用
圖形推理測量指標(biāo)相關(guān)性考察*
Module5 A Trip Along the Three Gorges
Module5 Great People and Great Inventions of Ancient China
Module 4 Sandstorms in Asia
Module 1 Europe
淺觀一道題的“區(qū)分度”
科技成果評價的信度分析及模型優(yōu)化
單維參數(shù)型與非參數(shù)型項目反應(yīng)理論項目參數(shù)的比較研究*