国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

SPSS軟件分析評價英語測試

2015-07-04 06:25王瑞雪
安徽文學(xué)·下半月 2015年7期
關(guān)鍵詞:試卷分析信度

王瑞雪

摘 要:本文從語言測試相關(guān)理論的角度,對銅陵市第六中學(xué)初二年級某班級期中英語考試進(jìn)行試卷分析,利用SPSS軟件,對試卷的整體結(jié)構(gòu)、信度進(jìn)行分析,并以單項選擇題為客觀題代表進(jìn)行難度及區(qū)分度的統(tǒng)計,以此探究試題質(zhì)量和學(xué)生的表現(xiàn)情況。此項分析與研究不僅有利于審改題目、建立試題庫,更有利于從學(xué)生和教師兩個角度找到最有利于提高學(xué)習(xí)成績和學(xué)習(xí)效率的方法。

關(guān)鍵詞:SPSS軟件 ?語言測試 ?試卷分析 ?信度

一、 引言

語言測試是近幾十年來研究較多的熱門學(xué)科,它屬于應(yīng)用語言學(xué)的范疇,涉及計算機(jī)、教學(xué)法、二語習(xí)得和心理語言學(xué)等多方面領(lǐng)域的知識。通常來說,語言測試針對的是對外語的測試,因此在外語教學(xué)中有著舉足輕重的作用。從歷史發(fā)展的角度來說,語言測試可以分為四個階段,分別是科學(xué)前時期、結(jié)構(gòu)主義時期、社會語言學(xué)時期和交際語言測試時期,四個時期所關(guān)注的測試內(nèi)容和方法都有所不同。

二、信度和試卷分析

信度指測試成績的一致性,充分反映了成績與試題、試題與應(yīng)試者之間的關(guān)系。信度一般受以下因素影響:試題質(zhì)量、測試的組織及最后試卷的評閱情況。為了保證測試的高信度,試卷應(yīng)包含足夠的試題量。一般來說,試題量越大,試卷的信度越高。此外,試卷應(yīng)具備能夠區(qū)分不同成績等級學(xué)生的區(qū)分度。試題的難度應(yīng)適中,太難或太簡單都無法對學(xué)生的水平做出足夠的區(qū)分。最后,試卷的評閱工作應(yīng)保持一致。

試卷分析是指利用計算機(jī)和軟件對測試的結(jié)果進(jìn)行數(shù)據(jù)分析,對提高測試水平和未來的測試準(zhǔn)備工作起著十分重要的作用。測試者可以借此將優(yōu)秀的試題放入試題庫,分析和試題修正之間的相互循環(huán)可以有效地使試題庫更加合理與科學(xué)。正因如此,很多大型考試的組織者會將試卷分析與閱卷評分放在同等重要的位置,并將其作為整個測試過程的重要組成部分。

三、 研究方法

本研究的樣本來自一次八年級學(xué)生的期中英語測試,因此研究對象為此次測試的成績和試卷。在剛過去的半學(xué)期中,該班級學(xué)生對大綱要求的詞匯和語法進(jìn)行了系統(tǒng)的學(xué)習(xí),這也正是本次測試的主要內(nèi)容,目的是為了檢測該班級學(xué)生是否掌握了過去半學(xué)期所應(yīng)該掌握的知識。對于本次研究,此數(shù)據(jù)真實(shí)可靠,具有可信度。

SPSS作為分析測試成績的工具,在測試分析當(dāng)中運(yùn)用十分廣泛。本文首先對試卷的整體結(jié)構(gòu)進(jìn)行概述和分析,包括試題分布,基于原始成績的成績分布直方圖,計算難度與區(qū)分度。作者試圖利用SPSS計算整張試卷的信度,并將單項選擇題作為客觀題代表,進(jìn)行進(jìn)一步分析。通過對其數(shù)據(jù)的統(tǒng)計和F.V.(易度系數(shù)),DI(區(qū)分度)數(shù)值的計算,在分析試題和原因的基礎(chǔ)之上對教學(xué)和試題的設(shè)計提出建議。

四、基于SPSS的具體試卷分析

(一)試卷結(jié)構(gòu)

整份試卷共分為六個部分,分別是單項選擇、完形填空、閱讀理解、詞匯、補(bǔ)全對話和寫作,其中除寫作是主觀題以外,其他五項均為客觀題。雖題型多樣,但試卷所測試的內(nèi)容主體為語法。本次測試是一次期中考試,目的在于測試學(xué)生是否掌握了過去半學(xué)期所學(xué)習(xí)的語法和詞匯,因此將大部分分值的試題設(shè)計成了客觀題,以此來測試學(xué)生的基本知識,整體上來說,試卷的設(shè)計是相對公平合理的,能夠滿足測試的要求和目的。

(二)成績分析

下表反映了本次期中測試的一系列描述性數(shù)據(jù)以及整體成績分布直方圖。從成績分布直方圖來看,比較集中的分?jǐn)?shù)段是40—50、70—90,這兩個分?jǐn)?shù)段之間差距很大,說明學(xué)生的水平之間有很大的差異。任課教師應(yīng)該對低于50分的學(xué)生給予更多的關(guān)注,此水平的學(xué)生基數(shù)比較大,他們?nèi)狈δ軌蚪忸}的足夠基本知識,應(yīng)該在課后多加強(qiáng)基礎(chǔ)知識的練習(xí)。同時,70—90分?jǐn)?shù)段的學(xué)生數(shù)量也比較多,他們多為班級中優(yōu)良等級的學(xué)生,已經(jīng)掌握了大部分的所學(xué)知識,可能這部分學(xué)生需要注意的就是提高練習(xí)和應(yīng)試技巧的問題,任課教師可針對這部分學(xué)生采取一些有效措施,如加強(qiáng)提高練習(xí)、對難點(diǎn)進(jìn)行梳理等。對于整個班級而言,高分組和低分組的同學(xué)結(jié)對互助學(xué)習(xí)也是有效且廣而行之的方法之一。

表一 描述性數(shù)據(jù)

表二 成績分布直方圖

(三)選擇題分析

1.信度

作為客觀題的典型代表,單項選擇題似乎是在無論大型還是小型考試中不可或缺的一種題型。在單項選擇這種題型中,選項和題干的多樣性很容易給學(xué)生造成迷惑,它的目的在于考查學(xué)生對知識的掌握情況,以及學(xué)生分析和辨別的技巧。因此,本文作者特意將單項選擇這一題型作為客觀題代表在SPSS數(shù)據(jù)分析的基礎(chǔ)上深入探討。

表三 ?信度

表四

表三和表四是基于SPSS的統(tǒng)計分析結(jié)果,其中表三顯示的是整個單項選擇的信度,表四反映的是單項選擇題中每道題的信度和整個單選題的信度對比。從表格當(dāng)中可以看出,大部分的選擇題信度都很符合整體的信度值,但其中也不乏少數(shù)相對信度值比較低的題目,因此在建立題庫時,應(yīng)該有所舍棄。

2.D.I. 和FV數(shù)值計算與分析

表五 ?D.I. 和FV

表五給出的是單項選擇題中每道題的D.I.和FV值。理論上易度系數(shù)值應(yīng)該處在0到1之間,易度系數(shù)越高,題目則越簡單。但通常情況下,為了保證題目不會太難或太簡單,理想的易度系數(shù)值應(yīng)控制在0.3到0.7之間。從上表的數(shù)據(jù)來看,大部分的題目則未處于這個理想的范圍內(nèi),且題目設(shè)置過于簡單。然而,結(jié)合之前給出的學(xué)生成績數(shù)據(jù)可看出,學(xué)生并沒有在這一部分得到很高的分?jǐn)?shù),為了探究這其中的原因,作者接下來將會從選擇題中抽取幾個例子來分析。

Item 4: Don't waste water again, or we will ? ? ? ? ?it one day.

A. look out ? B. take out ? C. run out of ? D. get out of

診斷1:在這道題中,四個選項均為關(guān)于out的短語,意義實(shí)則有很大差異,若學(xué)生無法清楚區(qū)分四者之間意義和用法上的區(qū)別,則無法最終選出正確答案,因此這題具有很高的區(qū)分度。

Item 17: She asks me if it ? ? ? ? tomorrow. If it ? ? ? ? ? ?tomorrow, she will go camping with me.

A. will rain; won't rain ? ? ? ?B. will rain; doesn't rain

C.rains; doesn't rain ? ? ? ? ? D.rains; won't rain

診斷2:此題目難度偏高,全班只有約四分之一的學(xué)生選出了正確答案。因為此題有兩小空,所以對學(xué)生來說,兩空都答對難度就自然而然提升。此題是一道高區(qū)分度的題目。

通過對以上兩組抽樣分析,可以發(fā)現(xiàn)一些明顯存在的問題。學(xué)生們普遍對選項中的相似語法點(diǎn)感到迷惑,因而難以做出正確的判斷。對教師而言,應(yīng)該幫助學(xué)生總結(jié)學(xué)習(xí)過程中的這些難點(diǎn),并且在授課過程中結(jié)合相關(guān)練習(xí)加以強(qiáng)化。而對于學(xué)生,也應(yīng)該對自己的學(xué)習(xí)弱點(diǎn)進(jìn)行分析并且花費(fèi)額外的精力去努力克服。

五、 結(jié)語

本文以一項具體的考試為研究對象,對試卷結(jié)構(gòu)和測試結(jié)果進(jìn)行詳細(xì)分析。從分析的結(jié)果以及探究的原因來看,教師和學(xué)生雙方面均存在有待提高的地方。學(xué)生的水平層次不同,因而如何針對不同層次的學(xué)生設(shè)計有效的教學(xué)方法,提高整個班級的水平層次成為了教師最關(guān)心的問題,也許針對不同的學(xué)生布置有區(qū)別性課后提高練習(xí)會是個短期可行的方法之一。試卷分析通過統(tǒng)計數(shù)據(jù),提供了有關(guān)應(yīng)試者和試卷設(shè)計的相關(guān)信息,這些信息對應(yīng)試者、試卷設(shè)計者和教師有著很大的幫助。但從另一方面來說,機(jī)器畢竟是死板的,不能與人相比,正是由于試卷分析呈現(xiàn)出來的結(jié)果對風(fēng)險承擔(dān)者來說十分重要,我們就更應(yīng)該客觀對待這些機(jī)器數(shù)據(jù)。一方面,它有自己的科學(xué)性,另一方面,當(dāng)我們在使用這些數(shù)據(jù)的時候應(yīng)該小心謹(jǐn)慎,不能過于盲目,具體問題具體分析,用試卷分析的數(shù)據(jù)對題目進(jìn)行審查,提高考試的信度,使語言測試達(dá)到其真正最有價值的目的。

參考文獻(xiàn)

[1] Bachman&Palmer.Language Testing in Practice[M].Oxford:Oxford University Press,1996.

[2] Lado,R.Language Testing[M].New York:McGraw-

HillCompanies,1961.

[3] Spolsky,B.Measured Words[M].Oxford:Oxford University Press,1995.

[4] 鄒申,戴煒棟.語言測試(第二版)[M].上海:上海外語教育出版社,2012.

猜你喜歡
試卷分析信度
《廣東地區(qū)兒童中醫(yī)體質(zhì)辨識量表》的信度和效度研究
平衡損失函數(shù)下具有時間效應(yīng)和通脹因子的信度估計
初中數(shù)學(xué)教學(xué)中的對比效應(yīng)
《橋梁工程》課程的試卷分析及教學(xué)改進(jìn)措施
讓試卷分析更貼心
預(yù)科數(shù)學(xué)試卷分析與重難點(diǎn)教學(xué)探索
科技成果評價的信度分析及模型優(yōu)化
耳鳴殘疾問卷中文版的信度和效度檢驗及其臨床應(yīng)用
中文版腦性癱瘓兒童生活質(zhì)量問卷的信度
翻譯測試的評分員信度研究*——TEM8 翻譯項目評分員問卷調(diào)查記略