国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

英語語言測試預(yù)測效度優(yōu)化研究-以托業(yè)考試為例

2013-08-15 00:47:16米龍龍
長治學(xué)院學(xué)報(bào) 2013年1期
關(guān)鍵詞:效度考試預(yù)測

米龍龍

(西南民族大學(xué) 外國語學(xué)院,四川 成都 610041)

一、引言

隨著我國經(jīng)濟(jì)實(shí)力的不斷增強(qiáng),國際貿(mào)易的迅速發(fā)展,職場招聘中需要應(yīng)聘者掌握基本的英語語言交際能力,使得學(xué)習(xí)英語的群體變得越來越龐大。語言測試可以用來比較學(xué)生成績的好壞,且大型標(biāo)準(zhǔn)化測試多用于人才選拔。部分公司通過大型標(biāo)準(zhǔn)化英語考試,如大學(xué)英語四六級考試,來評判應(yīng)聘者的英語語言能力;部分企業(yè)購買權(quán)威機(jī)構(gòu)出版的語言測試試題來測量其應(yīng)聘者的英語語言能力;還有一些公司自我命題來評價求職者能否勝任英語類相關(guān)工作。英語語言測試被大量使用在評價求職者的綜合英語語言能力,在語言測試?yán)碚撝幸簿褪钦f測試結(jié)果到底在多大程度上能夠預(yù)測出某些將來會發(fā)生的可能性,或者說對學(xué)生未來的行為作出的預(yù)測性的程度有多高[1]250-254。知名語言測試學(xué)專家巴赫曼認(rèn)為語言測試由于受多種復(fù)雜性的因素得影響而具有不穩(wěn)定性,因此其預(yù)測效度的測量非常困難[2]159-162。筆者在全面分析托業(yè)考試的基礎(chǔ)上來分析如何優(yōu)化語言測試預(yù)測效度。

二、語言測試簡介

(一)語言測試的歷史及現(xiàn)狀

語言測試經(jīng)歷了三個發(fā)展階段:第一,前科學(xué)時期;第二,心理測量結(jié)構(gòu)主義語言學(xué)時期;第三,心理語言學(xué)社會語言學(xué)時期[3]234。語言學(xué)家們把二十世紀(jì)六十年代以前的語言測試稱為前科學(xué)時期,該階段語言教師認(rèn)為教授語言就是知識的傳遞,多教授語法、語音和詞匯知識等,對測試結(jié)果沒有具體評判標(biāo)準(zhǔn),多以教師主觀判斷為依據(jù)缺乏科學(xué)性。之后受到結(jié)構(gòu)主義語言學(xué)影響,語言學(xué)家們認(rèn)為語言是一套習(xí)慣可以通過不斷刺激-反應(yīng)的過程來學(xué)習(xí)語言知識,認(rèn)為語言是可分的多采用分離測試來提高測試的信度,主要標(biāo)志是多項(xiàng)選擇題的誕生。七十年代受到心理語言學(xué)和社會語言學(xué)的影響,語言能力被認(rèn)為是一個整體,典型的測試題型是完形填空和聽寫。八十年代后巴赫曼在總結(jié)前人的基礎(chǔ)上提出了交際性語言測試,更多關(guān)注語言交際功能,能夠使用語言進(jìn)行交流是評價語言能力好壞的標(biāo)準(zhǔn)。八九十年代后,各種學(xué)術(shù)研討會日益盛行,日益廣泛的國際交流促進(jìn)了語言測試的發(fā)展。

(二)語言測試的效度

語言測試的好壞很大程度上取決于效度。效度指測試是否測量了它想要測量的內(nèi)容,或者說在多大程度上考察了想要考察的東西。效度是決定語言測試質(zhì)量的重要參考標(biāo)準(zhǔn),一項(xiàng)效度較低的語言測試是沒有價值的[4]11-17。效度種類很多,效度的測量也要具體到每種效度的測量。整體上來說效度一般分為表面效度、內(nèi)容效度、結(jié)構(gòu)效度、共時效度和預(yù)測效度[5]。表面效度就是語言測試在非專業(yè)人士看來是否測量了要考察的內(nèi)容。內(nèi)容效度多與考試大綱相關(guān),即考試是否是嚴(yán)格按照考試大綱來命題的,在多大程度上反映了考試大綱要測量的內(nèi)容。結(jié)構(gòu)效度多與考試的理論基礎(chǔ)有關(guān),如果考試考察的內(nèi)容和考試的理論基礎(chǔ)相互吻合,我們認(rèn)為該考試的結(jié)構(gòu)效度較高。共時效度的重點(diǎn)是共時,即一門考試的結(jié)果與另一門同時或幾乎同時考試的結(jié)果二者之間的一致性程度,也可以具體到同一個評分員對考生的給分情況是否一致,如果一致性較高我們認(rèn)為其共時效度高。預(yù)測效度的核心是預(yù)測二字,也就是說考試的預(yù)測能力,測試在多大程度上能夠預(yù)測出將來發(fā)生某事的可能性,如通過某英語考試的學(xué)生是否能夠到英美國家深造學(xué)習(xí)[6]16-19。

三、語言測試預(yù)測效度測量優(yōu)化分析

預(yù)測效度指測試結(jié)果在多大程度上能夠反映出將來發(fā)生的事情或多大程度上能夠預(yù)測考生未來的行為。預(yù)測效度經(jīng)常用來預(yù)測應(yīng)試者將來做某事的能力或有可能取得的成就。在語言測試中預(yù)測效度可以用來選拔人才或選拔考生進(jìn)高校學(xué)習(xí),考試是否選對了該選拔的考生,有沒有被選錯,這就是預(yù)測效度,即考試有沒有起到預(yù)測性[7]1-4。

預(yù)測效度經(jīng)常需比較二次考試的結(jié)果,比較二者之間一致性,一致性程度越高,預(yù)測效度就越高。若預(yù)測效度二次考試之間的間隔較長,考生可能受到各種因素影響,比如考生在此期間完全沒有學(xué)習(xí)英語,考生認(rèn)真努力學(xué)習(xí)英語不但請專業(yè)老師輔導(dǎo)而且每天堅(jiān)持深入學(xué)習(xí),前后二者的第二次考試的結(jié)果是顯而易見的-努力學(xué)習(xí)的同學(xué)第二次考試的成績會明顯提高。此外,還有很多因素難以控制和平衡,因此許多學(xué)者認(rèn)為預(yù)測效度太難以掌控而較難測量。

(一)預(yù)測效度研究實(shí)例

近年來學(xué)者們開始對預(yù)測效度進(jìn)行了一些研究,國外的研究主要有:Ayres和Peter1999年選取了50名物理和工科類學(xué)生研究托??荚嚨念A(yù)測效度,結(jié)果發(fā)現(xiàn)托??荚嚹軌蜉^好預(yù)測學(xué)生入學(xué)后的學(xué)業(yè)平均分;Almusawi和Al-Ansari在1999年進(jìn)行了預(yù)測效度研究,想要查看托??荚嚭陀⒄Z第一證書考試哪門考試能預(yù)測新生入學(xué)后的學(xué)業(yè)平均分,結(jié)果發(fā)現(xiàn)英語第一證書考試的預(yù)測性更好;Geriser和Studley在2001年通過分析7800名學(xué)生學(xué)術(shù)能力評估考試和學(xué)生學(xué)術(shù)成果之間的關(guān)系,發(fā)現(xiàn)該評估考試能夠較好的預(yù)測到學(xué)生的學(xué)術(shù)成果;J.Daniel House和James J.Johnson選取了236名心理學(xué)專業(yè)的學(xué)生來分析GRE高級心理學(xué)考試對他們學(xué)期末成果的預(yù)測性關(guān)系,結(jié)果發(fā)現(xiàn)該考試能夠準(zhǔn)確地預(yù)測到學(xué)生的學(xué)期末成果;Patricla Dooey和Rhonda Oliver在西澳大利亞某高校進(jìn)行了一項(xiàng)預(yù)測效度研究,發(fā)現(xiàn)雅思成績不能有效的預(yù)測學(xué)生的學(xué)術(shù)成就。國內(nèi)的研究主要有:許之所和張麗芳在2004年在武漢理工大學(xué)進(jìn)行了預(yù)測效度研究,通過收集該校四屆八個英語專業(yè)班學(xué)生的高考成績和他們大一上學(xué)期開設(shè)的專業(yè)課的平均成績,試圖分析高考成績對學(xué)生學(xué)業(yè)成績的預(yù)測作用,結(jié)果發(fā)現(xiàn)4屆學(xué)生的二次成績相關(guān)系數(shù)平均數(shù)在0.5以上,高考英語試卷對學(xué)生的學(xué)業(yè)成績具有較高的預(yù)測性[7]1-4;張繼紅在2006年收集洛陽市600名學(xué)生的高三英語模擬考試成績和他們的高考成績,試圖分析高三英語模擬考試對高考成績的預(yù)測性,發(fā)現(xiàn)高三英語模擬考試成績有較好的預(yù)測作用,模擬考試很多地方需要加以完善,且預(yù)測效度受很多因素的影響需加以控制[8]1-3。

(二)托業(yè)考試預(yù)測效度優(yōu)化分析

在交際性語言測試的影響下,美國教育服務(wù)中心于1979年應(yīng)政府需求和跨國公司要求而設(shè)計(jì)開發(fā)出托業(yè)考試,主要用于測量母語是非英語國家人士的英語交流能力,起初主要在日本和韓國之間實(shí)施考試。經(jīng)過幾十年的發(fā)展,該測試已經(jīng)推廣到全世界許多國家,被大量企業(yè)和機(jī)構(gòu)所采用。我國于2002年將該考試引入國內(nèi),它主要考察考生在日常生活和工作環(huán)境中使用英語進(jìn)行交流的能力,不同于使用英語進(jìn)行學(xué)術(shù)研究的托??荚嚕虼艘脖环Q為“商業(yè)托?!薄T摐y試目前在許多行業(yè)和區(qū)域中使用,作為一重要的評估標(biāo)準(zhǔn)幫助人們做出各種決策,如進(jìn)行人員培訓(xùn)、考核、海外任職、行政管理和招聘員工等。

托業(yè)考試由美國教育服務(wù)中心開發(fā)和設(shè)計(jì),每個題目的選擇均經(jīng)過科學(xué)的鑒定,信度和效度都比較高。它主要考察考生在真實(shí)語言環(huán)境中使用英語進(jìn)行交際的能力,因此該測試的預(yù)測效度也就轉(zhuǎn)化稱為一個問題:通過該測試的考生是否真正具有使用英語進(jìn)行交際的能力。要測量托業(yè)考試的預(yù)測效度極其復(fù)雜,考生往往參加托業(yè)考試后取得成績與到公司上班之間的間隔不等,且在此之間考生究竟做了什么研究者也無法做到心知肚明,還有考生參加考試本來就會受到各種客觀因素的影響我們無法判斷一次托業(yè)考試的成績是否是考生真實(shí)語言能力的表現(xiàn)等等。因此在進(jìn)行托業(yè)考試預(yù)測效度研究的過程中要控制諸多因素,比如最好選擇6月份參加托業(yè)考試的大四畢業(yè)生來縮小考試后和參加工作之間的差距和各種影響因素,選擇來自不同專業(yè)的考生進(jìn)行考察增加受試的多樣化,問卷調(diào)查或者采訪的問題要經(jīng)過權(quán)威專家詳細(xì)審閱且最好能夠進(jìn)行小范圍的前側(cè)尋找問題完善調(diào)查的題目等等;在進(jìn)行托業(yè)考試預(yù)測效度研究的過程中還要考慮清楚很多問題,比如如何來評判托業(yè)考試的效度高低呢?是采用定量的方式還是定性的方式來進(jìn)行統(tǒng)計(jì)?是采用問卷調(diào)查還是訪談或是二者相互結(jié)合?問卷調(diào)查的理論基礎(chǔ)是什么?尋找受試的范圍并決定總體受試的人數(shù)等等;此外在進(jìn)行預(yù)測效度研究過程中,還要時刻提醒自己所分析的語言能力是什么,時刻圍繞該項(xiàng)目進(jìn)行深入探索且避免為了方便就對預(yù)測效度的研究進(jìn)行簡化[1]250-254。由于預(yù)測效度要涉及到多種數(shù)字的分析和比較,所以研究者還需掌握簡單的統(tǒng)計(jì)分析知識,用數(shù)字說明問題,使描述更客觀,更準(zhǔn)確,更有說服力[5]1-180。

在考慮好上述因素后,具體而言筆者認(rèn)為要測量托業(yè)考試的預(yù)測效度,也就是要看是否通過該考試的考生是否具有在英語工作環(huán)境中使用英語的能力,我們需要采取定性和定量相互結(jié)合的方式來實(shí)現(xiàn)。首先需要設(shè)計(jì)問卷,要考生對自我英語應(yīng)用能力進(jìn)行自我評價并進(jìn)行量化處理,分析考生托業(yè)考試的分?jǐn)?shù)和問卷量化后分?jǐn)?shù)二者之間的關(guān)系,若相關(guān)度呈正相關(guān)且較高,那么托業(yè)考試的預(yù)測效度也就高;其次只有考生的自我評價肯定是不全面的,我們還得了解下人事部門相關(guān)人員對員工的評價如何,采訪他們選擇托業(yè)考試作為選擇員工的原因,不同分?jǐn)?shù)段之間員工能力是否有差別,員工是否能勝任和英語相關(guān)的工作等來了解公司領(lǐng)導(dǎo)對員工的評價進(jìn)行定性研究,若評價是積極的,則托業(yè)考試預(yù)測效度高;最后,由于眾多公司為了監(jiān)督管理員工,會定期對員工進(jìn)行英語測試和培訓(xùn),測試的題目均采用美國教育服務(wù)中心為其量身定做的考題。我們可以隨機(jī)抽取員工平時模擬考試的幾次分?jǐn)?shù)求得其平均數(shù)并與進(jìn)公司前的托業(yè)成績進(jìn)行相關(guān)分析,若相關(guān)系數(shù)呈正高度相關(guān),則托業(yè)考試的預(yù)測效度就高。

四、結(jié)語

本文通過分析語言測試的相關(guān)理論,結(jié)合托業(yè)考試具體分析如何優(yōu)化托業(yè)考試的預(yù)測效度。社會上其他英語語言測試亦是如此,只要我們認(rèn)真分析研究問題,深思熟慮并對所研究測試的預(yù)測效度進(jìn)行多方面考慮,控制各種可能影響到結(jié)果的變量,也就能較為理想地測量語言測試的預(yù)測效度。當(dāng)然預(yù)測效度會受到各種因素影響,我們的結(jié)果可能有誤差,但時代在進(jìn)步,研究的步伐不會停止,未來英語語言預(yù)測效度研究會更加科學(xué),更加完善。

[1]J.B.Heaton. Writing English Language Tests[M].Shanghai: Foreign Language Education Press,2009:159-162.

[2]Bachman. Fundamental Considerations in Language Testing[M]. Shanghai:Foreign Language Education Press,1997,250-254.

[3]Robert Wood. Assessment and Testing:A Survey of Research[M]. Beijing: Foreign Language Teaching and Research Press,2001.234.

[4]Weir,C.J. Language Testing and Validation[M].New York:Palgrave Macmillan,2009.11-17.

[5]韓寶成.外語教學(xué)科研中的統(tǒng)計(jì)方法[M].北京:外語教學(xué)與研究出版社,2011.1-180.

[6]武尊民.英語測試的理論與實(shí)踐[M].北京:外語教學(xué)與研究出版社,2010.16-19.

[7]許之所,張麗芳.高考英語試卷預(yù)測效度實(shí)證研究[J].武漢理工大學(xué)報(bào)(社科版),2004,(2):1-4.

[8]張繼紅.高三英語模擬考試的預(yù)測效度研究[J].中國校外教育,2011.1-3.

猜你喜歡
效度考試預(yù)測
無可預(yù)測
黃河之聲(2022年10期)2022-09-27 13:59:46
選修2-2期中考試預(yù)測卷(B卷)
選修2-2期中考試預(yù)測卷(A卷)
慈善募捐規(guī)制中的國家與社會:兼論《慈善法》的效度和限度
Japanese Artificial Intelligence Robotto Take Entrance Examinations
不必預(yù)測未來,只需把握現(xiàn)在
被看重感指數(shù)在中國大學(xué)生中的構(gòu)念效度
你考試焦慮嗎?
外語形成性評估的效度驗(yàn)證框架
準(zhǔn)備考試
凉山| 通道| 海原县| 巢湖市| 朔州市| 易门县| 巨野县| 五台县| 封丘县| 黄平县| 泾源县| 余姚市| 平江县| 石渠县| 皋兰县| 民丰县| 千阳县| 五家渠市| 邢台市| 兰坪| 夹江县| 山东省| 镇平县| 凤城市| 巩留县| 中江县| 淮滨县| 枣强县| 琼海市| 扎赉特旗| 堆龙德庆县| 增城市| 盖州市| 东安县| 丰都县| 盘山县| 永康市| 永春县| 长乐市| 台安县| 博客|