楊惠中
我國(guó)教育考試規(guī)模大、社會(huì)權(quán)重大,往往成為社會(huì)關(guān)注的熱點(diǎn),“分?jǐn)?shù)面前人人平等”是社會(huì)普遍接受的原則,對(duì)保證教育公平與社會(huì)穩(wěn)定起了重要作用。但是考試作為評(píng)價(jià)學(xué)生知識(shí)和能力水平的唯一手段,尚存在一些目前無法解決的難題。社會(huì)期待考試改革,國(guó)務(wù)院在2014年9月3日發(fā)布的《關(guān)于深化考試招生制度改革的實(shí)施意見》(以下簡(jiǎn)稱《實(shí)施意見》)中明確提出改革考試形式和內(nèi)容,其中加強(qiáng)外語能力測(cè)評(píng)體系建設(shè)首次在國(guó)家層面提出。因此,適時(shí)啟動(dòng)外語能力測(cè)評(píng)體系項(xiàng)目是深化考試改革、提升考試質(zhì)量和功能的重要舉措,有利于考試更好地為教學(xué)服務(wù)。在這一項(xiàng)目確定的五項(xiàng)主要任務(wù)中,制定國(guó)家外語能力量表和制定適合我國(guó)國(guó)情的外語考試質(zhì)量標(biāo)準(zhǔn)是我國(guó)教育考試改革中的基礎(chǔ)工程,這兩項(xiàng)基礎(chǔ)工程的完成將為建立科學(xué)的教育考試制度提供強(qiáng)大的技術(shù)支持,對(duì)我國(guó)語言測(cè)試、語言教學(xué)產(chǎn)生深遠(yuǎn)影響。以下從教育考試學(xué)術(shù)性的角度對(duì)建設(shè)我國(guó)外語能力測(cè)評(píng)體系談幾點(diǎn)看法。
我國(guó)外語能力測(cè)評(píng)體系的建設(shè)涉及國(guó)家、行業(yè)、專業(yè)等方方面面,需要從全局角度,運(yùn)用系統(tǒng)論的方法,對(duì)項(xiàng)目進(jìn)行統(tǒng)籌規(guī)劃,以集中有效資源,高效快捷地實(shí)現(xiàn)既定目標(biāo),因此做好頂層設(shè)計(jì)是這一項(xiàng)目成敗的關(guān)鍵。
在進(jìn)行頂層設(shè)計(jì)時(shí),必須正確處理考試、教學(xué)與考試結(jié)果的使用三者的關(guān)系??荚?、教學(xué)和考試結(jié)果的使用,三者構(gòu)成一個(gè)系統(tǒng),要發(fā)揮系統(tǒng)的作用,三者必須相互協(xié)調(diào),各司其職、各盡其責(zé),做到有效測(cè)試、有效教學(xué)、有效使用,才能取得整個(gè)系統(tǒng)的最佳效果。
一談到教學(xué)改革,談到考試改革,人們往往大談考試的反撥作用和后效,有一種泛化的趨勢(shì),仿佛教育中的一切問題都是考試造成的。事實(shí)上考試的作用是有限的,考試有好壞之分,教學(xué)也有好壞之分,考試結(jié)果的使用還有正確與否、恰當(dāng)與否的區(qū)別,不能一概而論。這里有學(xué)術(shù)問題,也有社會(huì)問題;有測(cè)試問題,也有教學(xué)問題;有測(cè)試的內(nèi)容問題,也有測(cè)試的形式問題。這些問題糾結(jié)在一起,需要擘肌分理,一一澄清,否則無法得出正確的結(jié)論。
“考試內(nèi)部諸因素的關(guān)系,如命題、管理、評(píng)分等,是考試的認(rèn)識(shí)論方面的問題;而考試與其外部諸因素的關(guān)系,主要是與政治、經(jīng)濟(jì)、教育的關(guān)系,是考試社會(huì)學(xué)方面的問題。歷史的經(jīng)驗(yàn)反復(fù)證明,認(rèn)識(shí)論方面的問題,會(huì)決定考試的質(zhì)量,而社會(huì)學(xué)方面的問題,則決定考試的存亡。”[1]因此,外語能力測(cè)評(píng)體系的設(shè)計(jì)既要考慮測(cè)評(píng)體系本身的科學(xué)性問題,同時(shí)還要兼顧考試的社會(huì)學(xué)問題。
我國(guó)的語言教學(xué)環(huán)境和教育體制與其他國(guó)家和地區(qū)存在或大或小的差異,這些差異決定我們不宜直接采用或照搬其他國(guó)家和地區(qū)現(xiàn)成的語言能力等級(jí)量表,而是應(yīng)該立足于我國(guó)語言教學(xué)與測(cè)試的實(shí)際,同時(shí)參照現(xiàn)代先進(jìn)的語言教學(xué)、學(xué)習(xí)和測(cè)試?yán)碚?,從我?guó)國(guó)情出發(fā),注重標(biāo)準(zhǔn)的科學(xué)性、可操作性和前瞻性。[2]
考試的最大政治要求就是公平,這是整個(gè)社會(huì)的期待。我國(guó)有1 300多年科舉考試的歷史,考試在我國(guó)享有很高的威信,公眾普遍接受考試是相對(duì)公平公正的選拔、評(píng)價(jià)和錄用人才的方法,是維護(hù)社會(huì)公平、公正的道德底線,“分?jǐn)?shù)面前人人平等”,考試公平合理,從不質(zhì)疑考試本身的質(zhì)量。但是,如果考試的分?jǐn)?shù)不能準(zhǔn)確反映學(xué)生的能力水平,或者測(cè)量的誤差很大,那么公平就成了問題?!胺?jǐn)?shù)面前人人平等”體現(xiàn)的僅僅是程序公平,測(cè)量公平不能保證,考試的有效性就無從談起。
保證測(cè)量公平,就是要保證考試的科學(xué)性,也就是要做到有效測(cè)試,這里涉及考試的效度、信度、分?jǐn)?shù)可解釋性、分?jǐn)?shù)等值處理等一系列技術(shù)和學(xué)術(shù)問題。一項(xiàng)考試的規(guī)模越大,考試的社會(huì)影響越大,保證考試的科學(xué)性就越重要。
但是在我國(guó)諸多的考試項(xiàng)目中,能達(dá)到上述考試技術(shù)要求的可謂鳳毛麟角。效度是考試的核心問題,開展效度研究并公布效度研究結(jié)果的考試項(xiàng)目極少。關(guān)于考試的信度,我國(guó)的考試項(xiàng)目特別是高利害考試采用的試題幾乎都未經(jīng)試測(cè),試題難度的穩(wěn)定性在考試前無法保證,這就好比用一把沒有校正的尺子,直接用來對(duì)幾十萬、幾百萬考生進(jìn)行測(cè)量,風(fēng)險(xiǎn)不可謂不大;此外,主觀題評(píng)分誤差不能得到有效控制也是影響考試信度的主要因素。關(guān)于分?jǐn)?shù)的可解釋性和可比性,目前國(guó)內(nèi)考試項(xiàng)目大多數(shù)只提供給考生一個(gè)原始分?jǐn)?shù),至于與分?jǐn)?shù)對(duì)應(yīng)的考生的能力和水平無從知曉,再者因?yàn)榉謹(jǐn)?shù)沒有經(jīng)過等值處理,多次考試的結(jié)果無法比較,考生無法知曉自己的進(jìn)步程度,教學(xué)機(jī)構(gòu)也無法針對(duì)考生的情況進(jìn)行有針對(duì)性的教學(xué)。
因此,國(guó)家外語能力測(cè)評(píng)體系在建設(shè)中一定要保證測(cè)量的有效性,整體考慮試測(cè)、等值、主觀題評(píng)分、效度等影響測(cè)量科學(xué)性和公平性的因素。
大規(guī)模高利害考試的設(shè)計(jì)、開發(fā)與實(shí)施是一項(xiàng)浩大的工程,必須達(dá)到一定的質(zhì)量標(biāo)準(zhǔn)。這里所說的標(biāo)準(zhǔn),是指考試機(jī)構(gòu)的行為準(zhǔn)則、考試機(jī)構(gòu)應(yīng)該遵循的專業(yè)質(zhì)量標(biāo)準(zhǔn)。國(guó)家外語能力測(cè)評(píng)體系的建設(shè),要考慮到考試各個(gè)環(huán)節(jié)并制定相應(yīng)的專業(yè)標(biāo)準(zhǔn),以規(guī)范教育考試行為,同時(shí),標(biāo)準(zhǔn)也將為評(píng)價(jià)一項(xiàng)考試及其實(shí)施的后果提供依據(jù)。
我國(guó)有各種國(guó)家工業(yè)標(biāo)準(zhǔn),考試卻缺乏相應(yīng)的國(guó)標(biāo)。美國(guó)1954年就有了《教育與心理測(cè)量標(biāo)準(zhǔn)》,到目前已經(jīng)修訂到第6版。我國(guó)亟需這樣的國(guó)家層面的測(cè)量標(biāo)準(zhǔn),以保證測(cè)試的有效性。
教育考試是國(guó)家的一項(xiàng)基本教育制度,我國(guó)必須建立有中國(guó)特色的、科學(xué)的、符合國(guó)際教育測(cè)量專業(yè)標(biāo)準(zhǔn)的、能夠與國(guó)際接軌的教育考試測(cè)評(píng)體系。
標(biāo)準(zhǔn)化考試始于20世紀(jì)40年代的美國(guó),我國(guó)從1985年開始探索在高考中實(shí)行標(biāo)準(zhǔn)化考試的經(jīng)驗(yàn),取得了很大成績(jī)。時(shí)任教育部考試中心主任的楊學(xué)為說:“所謂標(biāo)準(zhǔn)化考試,我理解,就是各年之間、各科之間的考試,信度、效度、區(qū)分度等各項(xiàng)指標(biāo)都比較穩(wěn)定地符合最佳標(biāo)準(zhǔn)。這樣,雖然各年考題不同,但分值都是相等的;每年可以舉行幾次考試,其分?jǐn)?shù)都等值;這樣,從各年之間考生得分的多少,就可以判斷教育水平的提高或降低,這樣,就不可能出現(xiàn)試題水平忽高忽低,或這一科容易、那一科難等問題,減少了高考對(duì)中學(xué)教學(xué)的消極影響。”這是對(duì)標(biāo)準(zhǔn)化考試的正解,但是還有很多對(duì)標(biāo)準(zhǔn)化考試的誤解,最常見的就是把標(biāo)準(zhǔn)化考試與選擇題等同起來。其結(jié)果,一是以為只要是多項(xiàng)選擇題就等于是標(biāo)準(zhǔn)化考試,甚至還有人為了節(jié)省閱卷成本,主觀題統(tǒng)統(tǒng)不要,搞所謂的“全標(biāo)準(zhǔn)化考試”,也就是全部采用多項(xiàng)選擇題的考試。顯而易見,只有對(duì)教育與心理測(cè)量毫無了解的人才會(huì)有這樣的提法,這種做法背離了科學(xué)的考試;二是以為多項(xiàng)選擇題完全可以考出學(xué)生的實(shí)際能力。實(shí)際上多項(xiàng)選擇題的弊端還是很明顯的,比如無法考查學(xué)生的思維過程,無法考查學(xué)生的表達(dá)能力。美國(guó)早已認(rèn)識(shí)到以選擇題為主的標(biāo)準(zhǔn)化考試的弊端,已逐步在考試中增加主觀題的考查。實(shí)際上要命制好選擇題,不但專業(yè)要求高,而且需要很高的命題技巧。一個(gè)科學(xué)有效的試題往往需要經(jīng)過初審、試測(cè)、項(xiàng)目分析、終審這樣一個(gè)周期,達(dá)到試題難度、區(qū)分度的要求才能在正式考試中使用。
我國(guó)外語能力測(cè)評(píng)體系的建設(shè)要兼顧學(xué)生聽說讀寫譯各方面技能全面協(xié)同發(fā)展,正確理解考試的標(biāo)準(zhǔn)化,同時(shí)要堅(jiān)持考試的標(biāo)準(zhǔn)化。
《實(shí)施意見》明確指出,2015年起高考增加使用全國(guó)統(tǒng)一命題試卷的省份。這一改革方向是正確的,最后應(yīng)過渡到全國(guó)使用同一份試卷。招生考試涉及兩個(gè)方面,招生是政策性問題,考試是學(xué)術(shù)性問題,兩者應(yīng)該分離??荚囀菧y(cè)量工具,應(yīng)該保證它的權(quán)威性和統(tǒng)一性,對(duì)于高考這樣的高利害考試,全國(guó)應(yīng)該用同一把尺子去度量考生,以保證它的專業(yè)標(biāo)準(zhǔn),保證社會(huì)的公平公正。同時(shí),“全國(guó)統(tǒng)考,可以集中全國(guó)最優(yōu)秀的專家,吸取外國(guó)的優(yōu)秀成果,研究考試中的疑難問題,以全國(guó)最優(yōu)秀的成果指導(dǎo)考試工作,集中全國(guó)最優(yōu)秀的教師參加命題,保證試卷質(zhì)量。考試作為一種服務(wù)性產(chǎn)業(yè),其集約化程度越高,專業(yè)化越強(qiáng),其服務(wù)質(zhì)量就可能越高,成本越低。這正是市場(chǎng)的原則——質(zhì)量與效益?!盵3]
由于考試的社會(huì)權(quán)重極大,必須關(guān)注考試的質(zhì)量問題,教育考試是一項(xiàng)學(xué)術(shù)性工作,需要盡快制定測(cè)量工具的標(biāo)準(zhǔn),同時(shí)考慮到考試的高風(fēng)險(xiǎn)性和社會(huì)性,必須對(duì)考試有質(zhì)量監(jiān)控機(jī)制,有審查機(jī)制,以判斷考試是否達(dá)到國(guó)家標(biāo)準(zhǔn),并應(yīng)把質(zhì)量監(jiān)控結(jié)果向公眾公布。
建立中國(guó)英語能力等級(jí)量表和建立適合我國(guó)國(guó)情的外語考試質(zhì)量標(biāo)準(zhǔn)這兩項(xiàng)工作,是我國(guó)教育考試改革中的基礎(chǔ)工程,將起到“車同軌、量同衡”的作用。前者有望能大幅提高中國(guó)人學(xué)習(xí)英語的效率,做到英語學(xué)習(xí)不重復(fù)、不斷線、一條龍;做到分級(jí)教學(xué)、及時(shí)反饋;做到因材施教、循序漸進(jìn)。后者將保證教育考試的專業(yè)質(zhì)量,有利于人才的選拔,保證教育公平和社會(huì)正義。
此外,希望盡快制定我國(guó)教育考試法,以保護(hù)考生權(quán)益、保護(hù)語言測(cè)試工作者正常工作的權(quán)利、保護(hù)考試知識(shí)產(chǎn)權(quán),把滿天飛的模擬試題集之類教育垃圾清理出去,廓清教育市場(chǎng),或許才有可能解決全社會(huì)深惡痛絕的應(yīng)試教育問題,讓教育回歸本質(zhì),還課堂教學(xué)以本來面貌,做到每堂課教有實(shí)效、學(xué)有實(shí)效,讓青年學(xué)生健康成長(zhǎng),讓考試科學(xué)地選拔人才,這是廣大教師和語言測(cè)試工作者樸素的中國(guó)夢(mèng)。
[1][3] 楊學(xué)為.中國(guó)考試改革研究[M].北京:北京大學(xué)出版社,2001:1,351.
[2] 方緒軍,楊惠中,朱正才.制定全國(guó)統(tǒng)一的語言能力等級(jí)量表的原則與方法[J].現(xiàn)代外語,2008(11):380-387.