關(guān)寧 陳福明
摘 要:文章從垂直量表化的內(nèi)涵與特點(diǎn)出發(fā),結(jié)合當(dāng)前大學(xué)英語(yǔ)分級(jí)教學(xué)現(xiàn)狀,提出了大學(xué)英語(yǔ)分級(jí)測(cè)試垂直量表體系的構(gòu)建思路,并分析了其構(gòu)建的可行性。
關(guān)鍵詞:大學(xué)英語(yǔ);垂直量表;分級(jí)測(cè)試
中圖分類號(hào):G640 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1002-4107(2016)06-0054-02
近幾年來(lái),為響應(yīng)大學(xué)英語(yǔ)改革的號(hào)召,全國(guó)各高校如火如荼地展開(kāi)大學(xué)英語(yǔ)分級(jí)教學(xué)模式,然而這其中不乏一些鎩羽而歸的高校。究其失敗的原因,很多是因?yàn)槿狈σ惶子行У臏y(cè)試評(píng)價(jià)體系。針對(duì)不同級(jí)別、不同水平的學(xué)生,如果仍采用傳統(tǒng)的“一刀切”式測(cè)試方法,其測(cè)量結(jié)果的有效性和公平性顯然都是不能令人信服的。針對(duì)這樣的問(wèn)題,引入心理測(cè)量學(xué)研究領(lǐng)域中的垂直量表化方法,建立垂直量表體系,能夠?yàn)榻鉀Q大學(xué)英語(yǔ)分級(jí)教學(xué)的測(cè)試評(píng)價(jià)問(wèn)題提供思路。
一、垂直量表化的內(nèi)涵與特點(diǎn)
垂直量表化,又稱垂直等值或跨級(jí)別量表化,是將不同級(jí)別的被試者在構(gòu)念(construct)相同而難度不同的測(cè)試中獲得的分?jǐn)?shù)放到一個(gè)共同的整體性量表中,由此,在某一特定主題測(cè)試中被試者階段性的進(jìn)步能夠得以追蹤并可供實(shí)施測(cè)試者進(jìn)行比較[1]。
Holland和Dorans將兩場(chǎng)測(cè)驗(yàn)中得到的分?jǐn)?shù)進(jìn)行相互轉(zhuǎn)換的過(guò)程稱作鏈接,而鏈接有三大類:預(yù)測(cè)(predicting)、數(shù)值校正(scale aligning)和等值(equating)。預(yù)測(cè)是最早的分?jǐn)?shù)鏈接形式,其目的是使來(lái)自于其他預(yù)測(cè)變量的因變量或標(biāo)準(zhǔn)變量的分?jǐn)?shù)預(yù)期誤差最小化;數(shù)值校正的目的是將不同測(cè)試中獲得的分?jǐn)?shù)轉(zhuǎn)換到一個(gè)共同的量表上;等值對(duì)需要鏈接的測(cè)試要求最為嚴(yán)格,其目的是在兩種形式的測(cè)試之間建立聯(lián)系,使每個(gè)測(cè)驗(yàn)中的分?jǐn)?shù)都可以被看作是出自同一測(cè)試的分?jǐn)?shù),以滿足實(shí)際應(yīng)用的需求。其中垂直量表化是歸屬于第二大類數(shù)值校正中的[2]。
設(shè)計(jì)垂直量表體系時(shí),基本做法是使相鄰組之間有共同的測(cè)試項(xiàng)目,稱之為錨題,以此為基準(zhǔn)建立共同量表。建立共同量表的方法有經(jīng)典測(cè)試?yán)碚摚–CT)和項(xiàng)目反應(yīng)理論(IRT)等,若選用IRT方法,第二個(gè)要考慮的問(wèn)題就是量表校準(zhǔn)方法的選擇:第一種方法是通過(guò)同時(shí)校準(zhǔn)測(cè)試形式的項(xiàng)目和人員參數(shù)以及共同項(xiàng)目;第二種方法是單獨(dú)校準(zhǔn)不同測(cè)試形式的參數(shù),然后使用某種數(shù)值鏈接方法將它們放到同一個(gè)量表上。 其他需要考慮的問(wèn)題包括:共同項(xiàng)目集合的長(zhǎng)度,基準(zhǔn)年的選擇和選用的計(jì)算機(jī)軟件等。
二、大學(xué)英語(yǔ)分級(jí)教學(xué)現(xiàn)狀
2003、2007年我國(guó)教育部相繼推出了大學(xué)英語(yǔ)教學(xué)改革相關(guān)文件《大學(xué)英語(yǔ)課程教學(xué)要求(試行)》和《大學(xué)英語(yǔ)課程教學(xué)要求》,其中根據(jù)學(xué)生入學(xué)時(shí)的不同英語(yǔ)基礎(chǔ)情況,對(duì)大學(xué)英語(yǔ)教學(xué)提出了三個(gè)層次的要求,即一般要求、較高要求和更高要求,分類指導(dǎo)和因材施教是改革的核心思想[3]。分級(jí)教學(xué)正是在這種改革大背景下應(yīng)運(yùn)而生的大學(xué)英語(yǔ)教學(xué)的具體改革措施。
從最早的改革實(shí)施至今已過(guò)去10年多,按照文件要求,全國(guó)大部分學(xué)校已經(jīng)開(kāi)始實(shí)施分級(jí)教學(xué)模式。但是由于各地情況不同,實(shí)施的具體情況也相應(yīng)地有著各自的特點(diǎn)。當(dāng)前爭(zhēng)議的焦點(diǎn)主要存在于分級(jí)后對(duì)學(xué)生學(xué)習(xí)情況進(jìn)行檢驗(yàn)的測(cè)試評(píng)價(jià)體系方面。改革初期,很多高校還處于迷茫的狀態(tài),為了方便起見(jiàn),有的高校在期末測(cè)試時(shí),對(duì)不同級(jí)別的學(xué)生仍采用同一測(cè)試,這就難免會(huì)讓人對(duì)測(cè)評(píng)的公平性產(chǎn)生質(zhì)疑。實(shí)施分級(jí)教學(xué)比較久了的學(xué)校開(kāi)始針對(duì)不同級(jí)別設(shè)計(jì)不同難度的試卷,以提高考試的公平性;但是這也存在相應(yīng)的問(wèn)題:不同級(jí)別的學(xué)生在不同難度的試卷中得出的分?jǐn)?shù)如何進(jìn)行比較?當(dāng)前在我國(guó),很多學(xué)校的考試分?jǐn)?shù)直接影響到學(xué)生的評(píng)獎(jiǎng)評(píng)優(yōu)、入黨以及未來(lái)申請(qǐng)出國(guó)讀書(shū)等學(xué)生的切身利益,因此迫切需要建立起一套客觀、科學(xué)和有效的測(cè)試評(píng)價(jià)體系。
三、大學(xué)英語(yǔ)分級(jí)測(cè)試垂直量表體系構(gòu)建的思路
構(gòu)建大學(xué)英語(yǔ)分級(jí)測(cè)試垂直量表體系一個(gè)總的思路是:在不同級(jí)別的試題設(shè)計(jì)中加入可供鏈接的相同題,即錨題,其次需考慮建立共同量表的方法及選用的計(jì)算機(jī)軟件等問(wèn)題。
(一)錨題設(shè)計(jì)
錨題設(shè)計(jì)中要考慮的基本問(wèn)題是,要在哪部分題中設(shè)計(jì)錨題。當(dāng)前大多數(shù)高校對(duì)學(xué)生的學(xué)習(xí)情況測(cè)評(píng)仍采用筆試形式,而筆試試卷中分為客觀題和主觀題兩種,客觀題通常包括聽(tīng)力和閱讀,主觀題通常指翻譯和寫(xiě)作。主觀題,尤其是寫(xiě)作題,是展現(xiàn)一個(gè)語(yǔ)言學(xué)習(xí)者能力的最佳渠道,對(duì)于A級(jí)學(xué)生來(lái)說(shuō),寫(xiě)作題要設(shè)計(jì)的足夠有深度,以此能看出他們對(duì)語(yǔ)言掌握的高度;但若把給A級(jí)學(xué)生設(shè)計(jì)的寫(xiě)作題拿來(lái)用作錨題,對(duì)于C級(jí)學(xué)生顯然挑戰(zhàn)過(guò)高,同樣,對(duì)于A級(jí)的學(xué)生來(lái)說(shuō),B級(jí)的寫(xiě)作題目似乎也太過(guò)平庸,無(wú)法展現(xiàn)出其作為最高級(jí)別英語(yǔ)學(xué)習(xí)者的水平。同時(shí)也有研究表明,將客觀題選作錨題,在后期的數(shù)值計(jì)算過(guò)程中誤差明顯小于主觀題[4]。
(二)建立共同量表的方法
前面提到建立共同量表的方法主要包括經(jīng)典測(cè)試?yán)碚摵晚?xiàng)目反應(yīng)理論兩種。Loyd 和 Hoover 在1980年首次系統(tǒng)的提出在垂直量表體系中使用項(xiàng)目反應(yīng)理論中的Rasch 模型,許多后期的研究顯示,在數(shù)據(jù)與模型適合良好的情況下,使用Rasch模型建立起的垂直量表體系比起經(jīng)典測(cè)試?yán)碚撓碌哪P?,如百分位?shù)等化法等表現(xiàn)更佳。相比于經(jīng)典測(cè)試?yán)碚?,?xiàng)目反應(yīng)理論方法不單單是在理論上具有更優(yōu)的性質(zhì),同時(shí)在實(shí)際應(yīng)用上具有更強(qiáng)的功能。
接下來(lái)就要考慮校準(zhǔn)方法的選擇,項(xiàng)目和人員參數(shù)以及共同項(xiàng)目參數(shù),究竟選擇同時(shí)校準(zhǔn)還是分別校準(zhǔn)比較好?Hanson和Beguin發(fā)現(xiàn),正確的指定了模型以后,同時(shí)校準(zhǔn)通常比分別校準(zhǔn)能得出更優(yōu)的結(jié)果,Kim和 Cohen(2002)指出,對(duì)于多項(xiàng)分類數(shù)據(jù)來(lái)說(shuō),通過(guò)同時(shí)校準(zhǔn)所得到的真正的多元項(xiàng)目反應(yīng)理論模型參數(shù)值恢復(fù)比起分別校準(zhǔn)加之鏈接項(xiàng)目和能力參數(shù)的值恢復(fù)更具有連貫性和準(zhǔn)確性,盡管這兩者的差別非常細(xì)微[5]。
在量表建立的過(guò)程中,由于涉及多種計(jì)算,不可以有半點(diǎn)疏漏,各種計(jì)算機(jī)軟件的選用也就顯得尤為重要,這一點(diǎn)有學(xué)者做過(guò)詳細(xì)的論述,如在不同的階段選擇何種軟件,軟件的獲取渠道等都有詳細(xì)說(shuō)明,筆者在此不再贅述[6]。
四、大學(xué)英語(yǔ)分級(jí)測(cè)試垂直量表體系構(gòu)建的可行性
為評(píng)估英語(yǔ)學(xué)習(xí)者的進(jìn)步情況而建立相應(yīng)的垂直量表體系,這種做法在美國(guó)是有先例的。2002年美國(guó)布什總統(tǒng)簽署了《不讓一個(gè)孩子掉隊(duì)》法案(No Child Left Behind,簡(jiǎn)稱NCLB),其主要目標(biāo)是縮小幼兒園至12年級(jí)(相當(dāng)于我國(guó)的高中)之中各年級(jí)學(xué)生之間由于擁有參差不齊的教育資源所造成的成績(jī)方面的差距,讓每個(gè)學(xué)生都能享受到高質(zhì)量的教育。法案中有一項(xiàng)要求各州每年從英語(yǔ)聽(tīng)、說(shuō)、讀和寫(xiě)四個(gè)方面對(duì)英語(yǔ)學(xué)習(xí)者的英語(yǔ)語(yǔ)言能力進(jìn)行測(cè)試評(píng)估,相應(yīng)地得出學(xué)生的進(jìn)步情況,并以綜合性報(bào)表向聯(lián)邦政府匯報(bào)。其中最為清晰有效地監(jiān)測(cè)學(xué)生進(jìn)步的方法即是將不同年級(jí)的評(píng)估結(jié)果放到一個(gè)共同的量表中進(jìn)行衡量。
顯然不同年級(jí)的學(xué)生不可能使用相同形式的測(cè)試,應(yīng)對(duì)不同年級(jí)或者不同年齡段的孩子設(shè)計(jì)出適應(yīng)其各自發(fā)展階段的試題。想要將處于不同發(fā)展階段、不同年級(jí)學(xué)生的測(cè)試結(jié)果放到同一個(gè)量表中,最好的辦法就是使用垂直性量表。其具體的操作思路是:首先WIDA(世界級(jí)教學(xué)和測(cè)試公司)將幼兒園至12年級(jí)的學(xué)生分為五個(gè)測(cè)試群,然后從聽(tīng)說(shuō)讀寫(xiě)四個(gè)方面入手設(shè)計(jì)試題,遵循不同題型的特點(diǎn)相應(yīng)地加入錨題。其中建立共同量表的方法選擇的就是項(xiàng)目反應(yīng)理論方法,相應(yīng)的校準(zhǔn)方法選擇的是同時(shí)校準(zhǔn)方法。
前面對(duì)于垂直量表體系的基本理論、我國(guó)大學(xué)英語(yǔ)分級(jí)教學(xué)的基本情況、構(gòu)建體系的大體操作思路和一個(gè)實(shí)際應(yīng)用案例作了簡(jiǎn)單介紹。誠(chéng)然,針對(duì)不同的分級(jí)教學(xué)情況,構(gòu)建出的體系也不可能是完全相同的,各個(gè)高校還是要根據(jù)自身的情況,吸取前人經(jīng)驗(yàn),因地制宜,開(kāi)發(fā)出適合自己學(xué)校情況的體系。
以筆者所在學(xué)校為例,哈爾濱理工大學(xué)自2014年秋季學(xué)期開(kāi)始實(shí)施大學(xué)英語(yǔ)分級(jí)教學(xué)模式。其基本做法是按照一次分級(jí)考試后的成績(jī)排名,在各個(gè)學(xué)院內(nèi)部,將學(xué)生分成A、B和C三個(gè)級(jí)別進(jìn)行教學(xué),在教學(xué)內(nèi)容的深度和廣度上區(qū)分三個(gè)級(jí)別的教學(xué)。改革過(guò)去了一年多,現(xiàn)在各位教學(xué)者面臨的最大問(wèn)題便是如何對(duì)學(xué)生學(xué)習(xí)成果進(jìn)行評(píng)價(jià),當(dāng)前的做法是,期中和期末測(cè)試仍采用同一套試題,但適當(dāng)加大平時(shí)分的比例(平時(shí)、期中和期末分?jǐn)?shù)比例由1:1:3改為2:1:2),對(duì)不同級(jí)別的學(xué)生,采用不同的平時(shí)分計(jì)算方法,A級(jí)要求最高,B級(jí)次之,C級(jí)最低,以此來(lái)調(diào)整期中期末“一刀切”造成的不公平問(wèn)題。但在實(shí)際操作中,教師在給平時(shí)分時(shí)表現(xiàn)出的主觀性又會(huì)對(duì)分?jǐn)?shù)的可信度造成一定影響。所以在哈爾濱理工大學(xué)要建立的垂直量表體系主要是針對(duì)平時(shí)分部分的,讓原本可以人為決定的、較為主觀的分?jǐn)?shù)量化成可以計(jì)算和衡量的客觀分?jǐn)?shù),是哈爾濱理工大學(xué)要解決的首要問(wèn)題。
為實(shí)現(xiàn)公平性的原則,在大學(xué)英語(yǔ)分級(jí)測(cè)試中構(gòu)建垂直量表體系是十分必要的,而具體的理論指導(dǎo)思想和前人經(jīng)典案例又證明了這種做法的可行性。未來(lái)需要投入更多研究的部分一是各高校具體測(cè)評(píng)的方法,二是通過(guò)何種途徑,在英語(yǔ)教學(xué)領(lǐng)域培養(yǎng)出可以將心理測(cè)量學(xué)知識(shí)和大學(xué)英語(yǔ)教學(xué)緊密聯(lián)系起來(lái)的人才。
參考文獻(xiàn):
[1]Dorans N J,Pommerich M,Holland P W.Linking and
Aligning Scores and Scales[Z].New York,U.S.:
Springer Verlag,2007:17.
[2]Davier A A v.Statistical Models for Test Equat-
ing,Scaling,and Linking[Z].New York,U.S.:Springer,
2011:22.
[3]教育部高等教育司.大學(xué)英語(yǔ)課程教學(xué)要求[Z].北京:
外語(yǔ)教學(xué)與研究出版社,2007:1.
[4]陳麗.垂直量表化對(duì)大學(xué)英語(yǔ)分級(jí)教學(xué)測(cè)評(píng)體系弊端的
解析[J].西安外國(guó)語(yǔ)大學(xué)學(xué)報(bào),2014,(6).
[5]Kenyon D M,MacGregor D,Li D Y,Cook H.G.Issues
in vertical scaling of a K-12 English language
proficiency test[J].Language Testing, 2011,(3).
[6]黎光明,張敏強(qiáng).IRT測(cè)驗(yàn)等值流程化操作思路的構(gòu)建
[J].中國(guó)考試,2012,(11).