国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

淺談成就測(cè)驗(yàn)理論對(duì)評(píng)析考試成績(jī)的啟示

2014-05-19 03:09王翠蓮
關(guān)鍵詞:效度

王翠蓮

摘 要:成就測(cè)驗(yàn)用以測(cè)量經(jīng)過一段時(shí)間學(xué)習(xí)和訓(xùn)練后取得的成就。教師自編測(cè)驗(yàn)是成就測(cè)驗(yàn)的一個(gè)分支,在我國(guó)的基礎(chǔ)教育中扮演著重要的角色。其測(cè)驗(yàn)結(jié)果——考試成績(jī)?yōu)樵u(píng)價(jià)學(xué)生的學(xué)習(xí)效果和學(xué)校教育質(zhì)量提供了一個(gè)客觀的指標(biāo)。但對(duì)考試成績(jī)的片面認(rèn)識(shí)和過分追求會(huì)給學(xué)生的發(fā)展帶來很多消極影響?;诖耍ㄟ^剖析成就測(cè)驗(yàn)的理論知識(shí),幫助教師、家長(zhǎng)和學(xué)生形成正確的成績(jī)觀很有必要。同時(shí),在剖析的基礎(chǔ)上對(duì)看待考試成績(jī)及根據(jù)它提高教育質(zhì)量、培養(yǎng)學(xué)生能力提出了個(gè)人的見解。

關(guān)鍵詞:成就測(cè)驗(yàn);效度;標(biāo)準(zhǔn)參照測(cè)驗(yàn);常模參照測(cè)驗(yàn)

中圖分類號(hào):G424.74 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1001-7836(2014)03-0068-02

在基礎(chǔ)教育中,教師和家長(zhǎng)往往以考試成績(jī)的高低評(píng)價(jià)學(xué)生的好壞。由于他們?nèi)狈y(cè)量方面的專業(yè)知識(shí),導(dǎo)致他們過分地看重成績(jī)而忽視其他方面。這種把成績(jī)作為評(píng)價(jià)學(xué)生的唯一標(biāo)準(zhǔn)的做法給學(xué)生的成長(zhǎng)帶來了極大的危害,也對(duì)我國(guó)人才的培養(yǎng)造成了一定的損失。因此,本文旨在通過詳細(xì)地介紹測(cè)量方面的知識(shí),幫助老師、家長(zhǎng)和學(xué)生形成正確的成績(jī)觀。

一、成就及成就測(cè)驗(yàn)的含義

成就是個(gè)人通過學(xué)習(xí)和訓(xùn)練獲得的知識(shí)、學(xué)識(shí)和技能[1]。測(cè)驗(yàn)個(gè)體通過學(xué)習(xí)和訓(xùn)練取得的成就的方法就是成就測(cè)驗(yàn)[2]。在學(xué)校教育中,教師通過各種方法不斷向?qū)W生傳授知識(shí)和技能。但是怎樣才能評(píng)估教與學(xué)的過程中取得的效果呢?為了解決該問題,客觀地評(píng)價(jià)教育取得的效果,在學(xué)校教育過程中逐步形成了教師自編測(cè)驗(yàn),即為了測(cè)驗(yàn)一段時(shí)期的教學(xué)效果,科任教師編制一份試卷,學(xué)校通過組織考試來考察學(xué)生的學(xué)習(xí)效果,最后把考試成績(jī)當(dāng)作教與學(xué)過程中取得的效果的主要指標(biāo)的方法。這種通過考試手段來衡量學(xué)習(xí)效果的方法其實(shí)質(zhì)就是成就測(cè)驗(yàn),旨在測(cè)驗(yàn)學(xué)生在一段時(shí)間的學(xué)習(xí)和訓(xùn)練后取得的成就。這種方法在我國(guó)有著久遠(yuǎn)的歷史,比如我國(guó)古代的科舉考試就是其中之一。

二、成就測(cè)驗(yàn)的分類

成就測(cè)量的分類標(biāo)準(zhǔn)不一,它的類別也多種多樣。根據(jù)分?jǐn)?shù)解釋的參照標(biāo)準(zhǔn)不同,可以把它分為標(biāo)準(zhǔn)參照測(cè)驗(yàn)和常模參照測(cè)驗(yàn)。常模參照測(cè)驗(yàn)關(guān)心的不是一個(gè)人的能力或知識(shí)的絕對(duì)水平,而是個(gè)體在群體的能力或知識(shí)連續(xù)體上的相對(duì)位置[2]。它關(guān)注的是被試之間測(cè)驗(yàn)分?jǐn)?shù)的差異,以最大限度地鑒別出被試間的差異為目的。測(cè)驗(yàn)中個(gè)體分?jǐn)?shù)高低是相對(duì)的,只有與他人比較后才能決定個(gè)體的優(yōu)劣。這種測(cè)驗(yàn)在學(xué)校教育中最典型的表現(xiàn)就是對(duì)學(xué)生的考試成績(jī)進(jìn)行排名。通過排名來確定學(xué)生在其所在群體中的位置。標(biāo)準(zhǔn)參照測(cè)驗(yàn)只能判斷分?jǐn)?shù)是否達(dá)到了某一規(guī)定的標(biāo)準(zhǔn),而與他人的分?jǐn)?shù)高低無關(guān)。其目的是測(cè)量被試對(duì)具體目標(biāo)的掌握情況。這種測(cè)驗(yàn)在學(xué)校教育中最典型的變現(xiàn)形式就是對(duì)考試成績(jī)劃分等級(jí)(比如優(yōu)秀、良好和及格等),確定學(xué)生對(duì)學(xué)習(xí)目標(biāo)的掌握程度。

三、成就測(cè)驗(yàn)的效度及其影響因素

成就測(cè)驗(yàn)的目的就是測(cè)量個(gè)體對(duì)所學(xué)知識(shí)或技能的掌握情況。那么,能不能有效地測(cè)量出個(gè)體掌握的真實(shí)情況,這就涉及測(cè)量的效度問題。所謂效度就是指實(shí)際測(cè)量分?jǐn)?shù)與個(gè)體真實(shí)水平的一致性程度。換句話說,就是測(cè)驗(yàn)?zāi)軌驕y(cè)量它所欲測(cè)的特質(zhì)的程度[3]。在學(xué)校教育中,教師通常通過考試來衡量學(xué)生對(duì)知識(shí)的掌握情況,進(jìn)而推斷學(xué)生的知識(shí)水平和能力。憑借考生成績(jī)來衡量學(xué)生知識(shí)水平和能力的準(zhǔn)確程度就是效度。準(zhǔn)確程度越高,效度越高,反之則越低。測(cè)驗(yàn)效度受到很多因素的影響。

(一)測(cè)驗(yàn)信度會(huì)影響到測(cè)量的效度

信度就是指多次測(cè)量同一特質(zhì)所得到的結(jié)果的一致性程度。它是測(cè)量效度的充分而不必要條件[4]。一個(gè)有高效度的測(cè)量必須以高信度為前提。但一個(gè)測(cè)量?jī)H僅具備高信度無法保證測(cè)量結(jié)果的效度。除信度以外,測(cè)量效度還受其他因素的影響。

(二)測(cè)驗(yàn)量表本身的質(zhì)量對(duì)測(cè)驗(yàn)效度的影響

測(cè)量量表是用來測(cè)驗(yàn)欲測(cè)量目標(biāo)的工具。就學(xué)校組織的教師自編測(cè)驗(yàn)而言,量表就相當(dāng)于考試試卷。要有效地測(cè)量出所欲測(cè)量的目標(biāo),首先應(yīng)該保證測(cè)量量表本身的質(zhì)量。第一,要選取合適的測(cè)驗(yàn)項(xiàng)目。量表由很多項(xiàng)目組成,所選項(xiàng)目是否與欲測(cè)量的目標(biāo)有關(guān)對(duì)測(cè)量效度有直接的影響。如果試題提供了額外的信息,選擇題的答案具有規(guī)律性這類的現(xiàn)象發(fā)生,都會(huì)降低測(cè)驗(yàn)的效度。第二,測(cè)驗(yàn)項(xiàng)目的難度控制。所選項(xiàng)目與欲測(cè)量的目標(biāo)符合不能確保所選項(xiàng)目的絕對(duì)可靠性。因?yàn)闇y(cè)量項(xiàng)目的難度對(duì)測(cè)量效度也有影響。一般要求不同測(cè)量項(xiàng)目的難度呈正態(tài)分布(必要時(shí)可以根據(jù)測(cè)量目的加以調(diào)整)。如果難度過大會(huì)導(dǎo)致受測(cè)者作答困難,所有人分?jǐn)?shù)都很低,從而出現(xiàn)“地板效應(yīng)”。相反,如果測(cè)量項(xiàng)目過于簡(jiǎn)單,會(huì)導(dǎo)致所有受測(cè)者都分?jǐn)?shù)很高,出現(xiàn)“天花板效應(yīng)”,這些都會(huì)影響測(cè)量的結(jié)果??傊?,只有適當(dāng)?shù)乜刂茰y(cè)量項(xiàng)目的難度及其分布,才能提高測(cè)量的效度。

(三)施測(cè)過程及其他因素對(duì)測(cè)量效度的影響

測(cè)量過程對(duì)效度的影響也很重要。就教師自編測(cè)量而言,如果學(xué)生在測(cè)驗(yàn)中作弊或不認(rèn)真作答就會(huì)影響測(cè)量結(jié)果的真實(shí)性。此外,評(píng)分過程中不客觀因素或錯(cuò)誤記分,測(cè)試的環(huán)境以及受測(cè)者個(gè)人的身心狀態(tài)都對(duì)測(cè)驗(yàn)效度有一定的影響。在測(cè)量過程中,要盡量控制這些因素,盡量做到施測(cè)過程和評(píng)分等過程的標(biāo)準(zhǔn)化,才能更準(zhǔn)確地測(cè)量出欲測(cè)量的目標(biāo)。由于測(cè)驗(yàn)效度受諸多因素的影響,而且受到技術(shù)等條件的限制,這些因素往往很難有效控制。所以,一個(gè)測(cè)驗(yàn)往往不可能100%地測(cè)量出被試的真實(shí)水平。

四、成就測(cè)驗(yàn)對(duì)評(píng)析考試成績(jī)的啟示

(一)不能片面地追求分?jǐn)?shù),要關(guān)注學(xué)生的全面發(fā)展

在學(xué)校教育中,為了測(cè)驗(yàn)學(xué)生在學(xué)習(xí)中取得的成就,往往采用教師自己編織的試卷來測(cè)量學(xué)生的學(xué)習(xí)情況。這種方式在統(tǒng)計(jì)學(xué)上叫做教師自編測(cè)驗(yàn),是成就測(cè)量的一種形式。由于受到技術(shù)水平和一些人為因素的限制,測(cè)驗(yàn)試卷的編制、施測(cè)、分?jǐn)?shù)分析方面很難做到標(biāo)準(zhǔn)化。加之測(cè)試對(duì)象與教育目標(biāo)的復(fù)雜性、動(dòng)態(tài)性以及各種測(cè)驗(yàn)誤差因素的影響,測(cè)驗(yàn)無論是在項(xiàng)目?jī)?nèi)容、評(píng)判標(biāo)準(zhǔn)等方面,還是在測(cè)量的技術(shù)分析及測(cè)量理論等方面仍然存在著一些有待改進(jìn)的地方。尤其在教師自編的測(cè)驗(yàn)中,編制老師缺乏測(cè)驗(yàn)編制方面的知識(shí),加之自身水平限制,編制出的試卷往往信度和效度不高。由于受這些因素的影響,考試成績(jī)和個(gè)體取得的成就不是一一對(duì)應(yīng)的。也就是說,僅用一兩次考試成績(jī)來確定學(xué)生的知識(shí)水平是不完全準(zhǔn)確的。當(dāng)然更不能因此而評(píng)價(jià)學(xué)生能力的高低,因?yàn)橐粋€(gè)人的知識(shí)水平和能力也不是一一對(duì)應(yīng)的,能力涉及到知識(shí)的應(yīng)用及其更廣泛的維度。在這種情形下我們?cè)u(píng)析學(xué)生的考試成績(jī)時(shí)一定要慎重。作為教師、家長(zhǎng)和學(xué)生本人都不能片面地追求高分,忽視其他方面的信息。還有,我們的教育目的是培養(yǎng)全面發(fā)展的社會(huì)主義建設(shè)者和接班人。在追求高分?jǐn)?shù)的同時(shí)要注重學(xué)生在德、智、體、美、勞等各方面的全面發(fā)展。千萬不能因考試成績(jī)特別是文化課成績(jī)的高低肯定一些學(xué)生或否定一些學(xué)生。endprint

(二)結(jié)合“標(biāo)準(zhǔn)”和“常?!币约皩W(xué)生所處環(huán)境,更合理地評(píng)價(jià)學(xué)生

考試成績(jī)公布之后,很多學(xué)校會(huì)根據(jù)分?jǐn)?shù)高低對(duì)學(xué)生進(jìn)行排名。這種做法為客觀的評(píng)價(jià)學(xué)生提供了一個(gè)可行的標(biāo)準(zhǔn)。而且排名的方式定位學(xué)生在學(xué)校教育中可以營(yíng)造出競(jìng)爭(zhēng)的環(huán)境氛圍,進(jìn)而激發(fā)學(xué)生的學(xué)習(xí)積極性,促進(jìn)學(xué)生的學(xué)習(xí)主動(dòng)性,達(dá)到提高教學(xué)效率的目標(biāo)。但也會(huì)挫傷有些人的積極性。甚至?xí)驗(yàn)闇y(cè)驗(yàn)過程中存在的一些額外因素造成測(cè)量效度的差異,出現(xiàn)排名不公平,對(duì)學(xué)生做出錯(cuò)誤定位的現(xiàn)象。比如,學(xué)生A學(xué)習(xí)很好,考試過程中也很誠(chéng)實(shí)。而學(xué)生B平時(shí)學(xué)習(xí)馬虎,但考試時(shí)作弊,導(dǎo)致排在A的前面。這種情況下會(huì)出現(xiàn)排名不公平,用排名衡量學(xué)生是不合理的。所以在分析考試成績(jī)時(shí),我們一方面要參照常模,比較排名情況;另一方面也要參照標(biāo)準(zhǔn),了解對(duì)知識(shí)掌握的絕對(duì)水平。這樣更能全面地了解學(xué)生對(duì)知識(shí)的掌握情況。此外,我們還要和學(xué)生過去的情況做縱向比較,了解學(xué)生的進(jìn)步情況。一個(gè)排名靠后,成績(jī)并不優(yōu)秀的學(xué)生,如果在縱向比較中發(fā)現(xiàn)他一直進(jìn)步,這也是一個(gè)值得表揚(yáng)的學(xué)生。

(三)客觀地分析試題、測(cè)試環(huán)節(jié)和評(píng)分程序,科學(xué)地看待考試成績(jī)

成就測(cè)量量表本身編制難度很大,加之教師沒有學(xué)過專業(yè)的測(cè)量量表編制技術(shù)。教師自編的考試試卷中難免選擇不合適的題目。比如有些題目太簡(jiǎn)單,絕大多數(shù)同學(xué)能夠完成,導(dǎo)致“天花板效應(yīng)”。這種情況下,如果題目的形式是選擇題,那么猜測(cè)的可能性就很大,對(duì)考試成績(jī)的可靠性影響甚大;有些題目難度過大,很少同學(xué)能夠完成,這就導(dǎo)致地板效應(yīng)。有時(shí)候編制的項(xiàng)目甚至不是教師想要測(cè)量的內(nèi)容。比如教師打算考察學(xué)生的數(shù)學(xué)應(yīng)用能力,在編制題目時(shí)語言應(yīng)用不太恰當(dāng)引起題意理解困難,學(xué)生在答題的過程中讀不懂題目的要求,最后無法作答該題。很顯然,這種情況下學(xué)生不能順利解答該題是由閱讀理解能力差造成的,就無法考察學(xué)生的數(shù)學(xué)應(yīng)用能力。還有很多因素影響著學(xué)生的最后考試成績(jī)。教師、家長(zhǎng)和學(xué)生要在看到成績(jī)的同時(shí)認(rèn)真地分析試題。結(jié)合考察的知識(shí)點(diǎn)和學(xué)生的成績(jī),科學(xué)分析考試結(jié)果,從中總結(jié)教學(xué)過程中成功的經(jīng)驗(yàn),吸取教學(xué)過程中失敗的教訓(xùn)。教師、家長(zhǎng)和學(xué)生應(yīng)該從考試成績(jī)中反省自己,適當(dāng)改變教與學(xué)的方法。這樣才能從長(zhǎng)遠(yuǎn)的角度不斷提高教學(xué)質(zhì)量以及學(xué)生的知識(shí)水平和能力。

參考文獻(xiàn):

[1]朱志賢.心理學(xué)大詞典:教育心理學(xué)部分[K].北京:北京師范大學(xué)出版社,1989:64-68

[2]馬惠霞,龔耀先.成就測(cè)驗(yàn)及其應(yīng)用[J].中國(guó)心理衛(wèi)生雜志,2003,17(1):60-62

[3]鄭日昌,吳九君.心理與教育測(cè)量[M].北京:人民教育出版社,2010:164-165

[4]杜林致.心理測(cè)量學(xué)[M].天津:南開大學(xué)出版社,2011:66-69.endprint

猜你喜歡
效度
效度驗(yàn)證模式系統(tǒng)整合與效度研究發(fā)展策略
《廣東地區(qū)兒童中醫(yī)體質(zhì)辨識(shí)量表》的信度和效度研究
慈善募捐規(guī)制中的國(guó)家與社會(huì):兼論《慈善法》的效度和限度
效度驗(yàn)證:教育考試亟需補(bǔ)齊的短板
男男性行為者艾滋病風(fēng)險(xiǎn)評(píng)估量表的信度和效度分析
依托激勵(lì)性評(píng)價(jià)提高低學(xué)段口琴口頭作業(yè)效度的實(shí)踐研究
對(duì)外漢語聽力考試的測(cè)試學(xué)效度研究
——以桂林理工大學(xué)2014下半年基礎(chǔ)班漢語聽力期末考試為例
耳鳴殘疾問卷中文版的信度和效度檢驗(yàn)及其臨床應(yīng)用
被看重感指數(shù)在中國(guó)大學(xué)生中的構(gòu)念效度
外語形成性評(píng)估的效度驗(yàn)證框架