国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

以SPSS為工具提升教師數(shù)據(jù)分析能力

2021-07-29 02:20王曉榮錢旭升
中學歷史教學 2021年3期
關(guān)鍵詞:區(qū)分度信度效度

王曉榮 錢旭升

SPSS是世界上最具影響力的統(tǒng)計軟件之一。綜合考慮操作簡易程度與數(shù)據(jù)分析效果,SPSS是幫助歷史教師提高數(shù)據(jù)分析能力的最佳選擇,本文具體采用SPSS20.0中文版。

一、數(shù)據(jù)的來源、錄入

本文數(shù)據(jù)以桐廬富春高中高一期末歷史考試為例。該校學生成績在全縣居于中等水平,其數(shù)據(jù)分析結(jié)論可推論至全縣乃至全市。這是本文以其為數(shù)據(jù)來源的原因。

SPSS的數(shù)據(jù)錄入通過數(shù)據(jù)窗口的變量視圖和數(shù)據(jù)視圖實現(xiàn),有手動輸入和自動導(dǎo)入兩種方式,后者以前者為基礎(chǔ)。數(shù)據(jù)視圖與excel相似,可導(dǎo)入excel,在導(dǎo)入時勾選“從第一行數(shù)據(jù)讀取變量名”。導(dǎo)入后,對自動產(chǎn)生的其他變量屬性做必要修改。教師可根據(jù)要分析的變量的數(shù)量對原excel進行刪減,只保留各題題號、總分作為變量,每位學生作為一個觀察項。可將該excel命名為“高一學生的各題及總分表”。

本次歷史考卷有30道選擇題每題2分,3道材料題各為15分、13分、12分,共100分。參考學生643名。故本次導(dǎo)入SPSS的變量有34個,觀察項有643個,在數(shù)據(jù)視圖中形成34×643個單元格。

二、數(shù)據(jù)的分析

SPSS的操作是手段,讓其跑出我們需要的統(tǒng)計結(jié)果是目的。我們無需學會SPSS的所有功能,甚至無需知道其計算、分析的統(tǒng)計學原理,而只需在明確具體分析目的后正確點擊、勾選、輸入即可。

(一)總分、主觀題得分的頻數(shù)分布分析

總分、主觀題得分是多值的,其頻數(shù)可能呈正態(tài)分布。點擊分析—描述統(tǒng)計—頻率,將“總分”、“t31”、“t32”、“t33”移入“變量”中,點擊圖表—直方圖,勾選“在直方圖上顯示正態(tài)曲線”,跑出直方圖。

觀察可得,總分、31題略顯負偏態(tài),32題、33題為明顯負偏態(tài)。教師也可通過K-S檢驗對正態(tài)分布進行量化判定。點擊分析—非參數(shù)檢驗—單樣本,點擊“運行”跑出結(jié)果。結(jié)果顯示四個sig.的值都小于0.05,所以四個原假設(shè)都被拒絕,即總分、31題、32題、33題的分值頻數(shù)都不呈正態(tài)分布,見表1。

(二)總分、主觀題得分的集中、離散趨勢分析

集中趨勢分析是指用一個代表值來反映一組數(shù)據(jù)的一般水平,常用統(tǒng)計量有均值、中位數(shù)、眾數(shù)。如表2顯示本次考試總分的平均分、中位數(shù)、眾數(shù)分別是47.51分、47分、52分。離散趨勢分析是指用一個特別值來反映一組數(shù)據(jù)相互之間的離散程度,用這個值來說明變量的各個值從這組數(shù)據(jù)的中間位置向兩端離散的程度,常用統(tǒng)計量有全距(又稱極差)、標準差、離散系數(shù)(標準差與均值的比,又稱差異系數(shù))。如表2顯示本次考試總分的全距為76﹣22=54分,標準差為10.231分,離散系數(shù)10.231÷47.51=21.5%。點擊分析—描述統(tǒng)計—頻率,將“總分”、“t31”、“t32”、“t33”移入“變量”中,點擊統(tǒng)計量,勾選集中趨勢下的“均值”、“中位數(shù)”、“眾數(shù)”,勾選離散下的“標準差”、“最小值”、“最大值”,跑出結(jié)果,見表2。

(三)試卷全卷及各題質(zhì)量分析

試卷質(zhì)量分析的指標主要有:難度系數(shù)(P)、區(qū)分度(D)、信度(α)、效度(V)。

1. 難度系數(shù)

難度系數(shù)為平均分與滿分之比。一般認為,p≥0.7為較易,0.4≤p<0.7為中等難度,p<0.4為較難。全卷平均分47.51分,難度系數(shù)0.48,屬中等難度。教師可將各題的平均分、滿分做成一個新excel直接導(dǎo)入SPSS。此時SPSS中有變量2個、觀察項33個,在數(shù)據(jù)視圖中形成2×33個單元格。SPSS可以根據(jù)已有變量“轉(zhuǎn)換”得出新變量。點擊轉(zhuǎn)換—計算變量,在“目標變量”框中輸入:p的值,在“數(shù)字表達式”框中移入或輸入:各題的平均分 / 各題的滿分,跑出結(jié)果,在數(shù)據(jù)視圖增加了一個新變量:p的值。

再對新變量“p的值”進行“轉(zhuǎn)換”,得出另一個新變量:難易程度。點擊轉(zhuǎn)換—重新編碼為不同變量,在“輸出變量”框中輸入:難易程度,點擊舊值和新值,設(shè)置舊值和新值的對應(yīng)關(guān)系:0.7 thru Highest 對應(yīng)3,Lowest thru 0.3999對應(yīng)1,0.4 thru 0.6999對應(yīng)2。然后在變量視圖中設(shè)置新變量“難易程度”的值標簽,1=較難、2=中等難度、3=較易。點擊分析—描述統(tǒng)計—頻率,跑出難易程度的頻率表,見表3。

2. 區(qū)分度

區(qū)分度是指試題對不同水平考生的區(qū)分程度。一般認為,區(qū)分度最好大于0.3。教育統(tǒng)計學中利用某試題得分與總分的相關(guān)關(guān)系作為該試題的區(qū)分度,客觀題用Spearman等級相關(guān)系數(shù),主觀題用Pearson積差相關(guān)系數(shù)。導(dǎo)入excel“高一學生的各題及總分表”,點擊分析—相關(guān)—雙變量,將“t1”到“t30”及“總分”移入“變量”中,勾選相關(guān)系數(shù)下的“spearman”,跑出結(jié)果。主觀題的操作相似,區(qū)別是將“t31”到“t33”及“總分”移入“變量”中,勾選相關(guān)系數(shù)下的“pearson”,得出結(jié)果,見表4。

結(jié)果顯示12、13兩道客觀題的區(qū)分度為負數(shù),3道主觀題區(qū)分度分別為0.707、0.641、0.553。

3. 信度

信度是指測量工具對同一被試進行兩次或多次測量的一致程度,是檢驗試卷反映考生水平可靠性或穩(wěn)定性的指標。信度有內(nèi)在信度、折半信度、重測信度等。教育統(tǒng)計學中通常用Cronbachs Alpha系數(shù)(簡稱α系數(shù))測量試卷內(nèi)部題目一致性來實現(xiàn)對試卷內(nèi)在信度的檢驗。一般認為,α≥0.8時信度較好,0.6≤α<0.8時信度相當,α<0.6時信度較差。導(dǎo)入excel“高一學生的各題及總分表”,點擊分析—度量—可靠性分析,將“t1”到“t33”移入“項目”中,跑出α的值為0.66。

4. 效度

效度是指測量的有效程度,是檢驗試卷是否考查了原定考查內(nèi)容的指標。信度檢驗穩(wěn)定性,效度檢驗精準性,兩者常配合使用。效度有內(nèi)容效度、關(guān)聯(lián)效度。教育統(tǒng)計學中,將結(jié)果與效標之間的一致性程度作為試卷效度,這屬于關(guān)聯(lián)效度。SPSS中具體使用Pearson積差相關(guān)系數(shù),其操作過程與主觀題區(qū)分度的操作相同。以什么為效標,是SPSS中跑出效度的關(guān)鍵。隨著學習推進,會有部分學生進步或退步較大,這會對效度的分析結(jié)果產(chǎn)生一定影響,可利用不同效標多跑幾次Pearson系數(shù),再綜合判定。在效標適當?shù)那闆r下,效度值要求在0.3~0.7之間,不得低于0.3。如以期中歷史考試成績?yōu)樾?,先在excel中將每位學生的期中成績與期末成績成對,刪除因缺考使成績無法成對的學生后剩下學生606位。在SPSS中導(dǎo)入該excel,變量為期末成績、期中成績,觀察項為606位學生,得出效度值為0.679。

三、討論與建議

通過學生成績、試卷質(zhì)量兩個維度的分析,我們可作如下討論與建議:

(1)學生成績??偡帧⒅饔^題分值頻數(shù)都呈負偏態(tài)分布,說明平均分及上下人數(shù)過少,而低于平均分人數(shù)過多尤其是32題、33題。頻率表顯示32題0分有145人占總?cè)藬?shù)22.6%之多。期末考試作為合格性考試,總分、主觀題分值的頻數(shù)應(yīng)呈正態(tài)或正偏態(tài)分布,即中等分值或高分值學生應(yīng)盡量多。

全卷47.51的平均分、0.48的難度系數(shù),偏低偏難。尤其32題、33題的平均分過低,中位數(shù)或眾數(shù)都只有2分、3分,直接影響區(qū)分度。我們建議應(yīng)適當提高難度系數(shù),降低難度。10.231分的標準差、21.5%的離散系數(shù)可以接受,但全距偏大,說明學生的兩極分化比較嚴重,建議教師對低水平學生進行針對性教學。

(2)試卷質(zhì)量。我們認為期末試卷全卷難度系數(shù)控制在0.6~0.7比較適宜。本試卷33道題較易、中等難度、較難的比例為10:15:8,中等難度和較難占比69.7%,應(yīng)增加較易題。我們認為三者比例5:3:2比較合適。

12、13題的區(qū)分度為負數(shù),說明有很多高水平同學反而選錯,需要命題者注意,也需要教師反思教學。3道主觀題的區(qū)分度都較高,說明區(qū)分度在主觀題的內(nèi)部分配不很合理。區(qū)分度與難度系數(shù)有一定關(guān)聯(lián),為提高難度系數(shù)可適當降低區(qū)分度。中等難度題的區(qū)分度高,過易或過難的題都無法將不同水平學生區(qū)分開從而使區(qū)分度偏低。

信度為0.66可以接受。全卷信度與各題的區(qū)分度有一定關(guān)聯(lián),當各題的區(qū)分度提高后,同一水平學生回答同一題的答案趨向一致,全卷信度隨之提升。作為合格性考試,區(qū)分度、信度可適當降低。0.679的效度值,反映了本試卷的效度比較理想。

猜你喜歡
區(qū)分度信度效度
校企融合背景下,思政教師在職業(yè)生涯規(guī)劃教學中的效度探索
談高效課堂下效度的提升策略
巧用模型法提高科學課堂教學的效度
《生物統(tǒng)計》的試卷分析與解讀
大學生積極自我量表初步編制
淺觀一道題的“區(qū)分度”
論高職英語多元化綜合評價模式的效度與信度
利用垂直平分線的定義巧解題
計算機輔助英語測試研究
墨子論度