楊惠中
《中國(guó)語(yǔ)言能力等級(jí)共同量表研究——理論、方法與實(shí)驗(yàn)研究》終于在上個(gè)月由上海外語(yǔ)教育出版社出版,感謝外教社的支持和責(zé)編楊帆的辛苦工作。這是一本只有165頁(yè)的書(shū),但是題目很大。是不是故意戴上去的大帽子呢?倒不是,因?yàn)槔锩嬲f(shuō)的都是實(shí)事,另外,我們對(duì)于這項(xiàng)研究態(tài)度是認(rèn)真的。
建立我國(guó)語(yǔ)言能力等級(jí)共同量表在我國(guó)有著十分迫切而重要的現(xiàn)實(shí)意義。我國(guó)是語(yǔ)言教學(xué)大國(guó),只說(shuō)英語(yǔ)教學(xué),全國(guó)每年學(xué)英語(yǔ)的人數(shù)以?xún)|萬(wàn)計(jì),各種類(lèi)型的英語(yǔ)課程不計(jì)其數(shù)。有教學(xué)就有測(cè)試,于是也就有了各種外語(yǔ)測(cè)試項(xiàng)目,紛繁復(fù)雜,林林總總,不一而足。這種局面還有愈演愈烈之勢(shì)。由于我國(guó)一千三百年科舉考試的傳統(tǒng),考試(包括教育考試)往往被看作是一種行政行為,而不是心理測(cè)量學(xué)范疇的獨(dú)立的學(xué)術(shù)行為。凡行政主管部門(mén),只要一紙紅頭文件就可以啟動(dòng)一項(xiàng)大規(guī)模考試,關(guān)起門(mén)來(lái)命題,試題未經(jīng)預(yù)測(cè)就直接用于實(shí)際考試。在一般人的觀念中,凡教師都能命題,打個(gè)分?jǐn)?shù)就是考試,只要采用多項(xiàng)選擇題,就是標(biāo)準(zhǔn)化考試。這樣做,如果考試的結(jié)果決定學(xué)生一生命運(yùn)的話(huà),后果可能是很?chē)?yán)重的。
我國(guó)的考試,考生人數(shù)往往達(dá)到每年數(shù)十萬(wàn)、數(shù)百萬(wàn)、甚至上千萬(wàn),成為真正意義上的大規(guī)??荚?。但是迄今為止,我國(guó)尚沒(méi)有統(tǒng)一的語(yǔ)言能力等級(jí)共同量表,語(yǔ)言教學(xué)和語(yǔ)言測(cè)試沒(méi)有共同的參照標(biāo)準(zhǔn),甚至連等級(jí)的劃分也相當(dāng)混亂,有的語(yǔ)言測(cè)試項(xiàng)目分為2個(gè)等級(jí),有的分為5個(gè)等級(jí),有的9個(gè)等級(jí),有的則只分初、中、高3個(gè)等級(jí)。不同測(cè)試的等級(jí)劃分五花八門(mén),不同測(cè)試報(bào)告的考生成績(jī)根本缺乏可比性,完全不便于用戶(hù)使用。這種缺乏統(tǒng)一尺度的做法,好比做買(mǎi)賣(mài)的都各自制作自己的磅秤,焉能不亂?對(duì)教學(xué)來(lái)說(shuō),沒(méi)有統(tǒng)一的參照標(biāo)準(zhǔn)也不便于課程的組織和銜接,很容易造成課程的重復(fù)設(shè)置,根本談不上外語(yǔ)教學(xué)實(shí)現(xiàn)“一條龍”。而且考試成績(jī)互不承認(rèn),學(xué)生只好一次次參加考試,徒增學(xué)生學(xué)業(yè)和考試負(fù)擔(dān)。語(yǔ)言測(cè)試領(lǐng)域亂象叢生,解決之道在哪里呢?我們認(rèn)為,必須制定全國(guó)統(tǒng)一的語(yǔ)言能力等級(jí)量表,這是相當(dāng)于“車(chē)同軌、量同衡”的大事。
國(guó)際上在這方面已有成熟的經(jīng)驗(yàn),其中最具影響力的當(dāng)是歐洲語(yǔ)言能力等級(jí)共同量表(CEFR)。歐盟目前有27個(gè)國(guó)家,使用20多種不同的語(yǔ)言,怎樣解決語(yǔ)言交際問(wèn)題,在歐共體成立之初,成了促進(jìn)一體化的重要課題。為此,歐洲委員會(huì)的語(yǔ)言政策部門(mén)(The Language Policy Division)提出了語(yǔ)言教學(xué)應(yīng)當(dāng)實(shí)現(xiàn)分級(jí)的要求,把漫長(zhǎng)的語(yǔ)言教學(xué)過(guò)程劃分成若干個(gè)較小的、能獨(dú)立授予學(xué)分的單元,建立一個(gè)能得到歐洲各國(guó)相互承認(rèn)和采用的共同的參照標(biāo)準(zhǔn)。自上世紀(jì)70年代以來(lái)就展開(kāi)了歐洲語(yǔ)言能力共同量表的研究。經(jīng)過(guò)二十多年的努力,最后形成了“歐洲語(yǔ)言能力等級(jí)共同量表”(CEFR)。歐洲語(yǔ)言能力等級(jí)共同量表共分六個(gè)等級(jí)(A1、A2、B1、B2、C1、C2),每個(gè)等級(jí)都有明白、準(zhǔn)確的語(yǔ)言能力描述,不論何種語(yǔ)言,不論是英語(yǔ)、法語(yǔ)、還是德語(yǔ),學(xué)生只要達(dá)到某個(gè)等級(jí),例如B2級(jí),所反映的是相同的語(yǔ)言能力水平,也就是說(shuō)語(yǔ)言能力的解釋是統(tǒng)一的。這對(duì)于人員之間相互理解與溝通將會(huì)多么方便!CEFR自2001年11月發(fā)布以后,歐洲各國(guó)的語(yǔ)言教學(xué)和語(yǔ)言測(cè)試項(xiàng)目都實(shí)現(xiàn)了與CEFR的關(guān)聯(lián),使考試的分?jǐn)?shù)獲得統(tǒng)一的可解釋性,大大提高了語(yǔ)言教學(xué)和語(yǔ)言測(cè)試過(guò)程的透明度,對(duì)促進(jìn)人員往來(lái)與交流起到了很好的作用。
看來(lái),制定統(tǒng)一的語(yǔ)言能力等級(jí)量表是一項(xiàng)重要的基礎(chǔ)研究項(xiàng)目,涉及語(yǔ)言測(cè)試和語(yǔ)言教學(xué)的一切方面,與大綱設(shè)計(jì)、教學(xué)組織、教材開(kāi)發(fā)、能力鑒定、甚至人才的合理使用無(wú)不密切相關(guān)。我們?yōu)榇藢?xiě)過(guò)文章,呼吁有關(guān)方面組織人力物力開(kāi)展相關(guān)研究。大概因?yàn)檫@樣的研究未必能迅速帶來(lái)看得見(jiàn)的“價(jià)值”,故遲遲未見(jiàn)動(dòng)靜。我們幾位從事語(yǔ)言測(cè)試研究的普通工作者不免內(nèi)心焦急,打算自己?jiǎn)?dòng)前期研究,正在這時(shí)候上海師范大學(xué)的方緒軍老師來(lái)上海交通大學(xué)應(yīng)用語(yǔ)言學(xué)博士后流動(dòng)站進(jìn)行博士后研究,他的加入加強(qiáng)了我們開(kāi)展這項(xiàng)重要研究的決心和力量。方緒軍博士長(zhǎng)期從事對(duì)外漢語(yǔ)教學(xué),在漢語(yǔ)水平考試方面也有豐富的實(shí)踐經(jīng)驗(yàn),于是決定以語(yǔ)言能力等級(jí)量表作為研究方向,申請(qǐng)國(guó)家社科基金項(xiàng)目資助。幸運(yùn)的是,申請(qǐng)很快得到了批準(zhǔn)并立項(xiàng)。在整個(gè)研究過(guò)程中朱正才負(fù)責(zé)實(shí)驗(yàn)設(shè)計(jì)與數(shù)據(jù)分析,方緒軍則在資料整理、文獻(xiàn)分析、數(shù)據(jù)整理、報(bào)告起草等方面做了大量扎實(shí)的研究工作?,F(xiàn)在,方緒軍的博士后研究早已以?xún)?yōu)異成績(jī)順利完成,社科基金項(xiàng)目也早已經(jīng)過(guò)鑒定結(jié)項(xiàng),作為項(xiàng)目成果的《中國(guó)語(yǔ)言能力等級(jí)共同量表研究——理論、方法與實(shí)驗(yàn)研究》一書(shū)終于出版,這些都是值得高興的。
考慮到研究經(jīng)費(fèi)一共只有區(qū)區(qū)幾萬(wàn)元,只好集中力量,著眼在最重要的方面。于是課題組決定把研究重點(diǎn)放在制定我國(guó)統(tǒng)一的語(yǔ)言能力等級(jí)共同量表的理論、原則和方法上。我國(guó)現(xiàn)行的許多考試,對(duì)于語(yǔ)言能力的描述往往缺乏語(yǔ)言學(xué)的理論框架,對(duì)于等級(jí)的劃分也缺乏心理測(cè)量學(xué)的支持,現(xiàn)有的一些量表或大綱在描述語(yǔ)言能力或設(shè)計(jì)考試分?jǐn)?shù)體系方面存在經(jīng)驗(yàn)性、相對(duì)性和任意性的問(wèn)題。制定語(yǔ)言能力等級(jí)量表,必須立足于一定的理論基礎(chǔ)和科學(xué)依據(jù)之上。課題組在全面分析文獻(xiàn)的基礎(chǔ)上,決定采用交際語(yǔ)言能力的理論模型作為制定我國(guó)統(tǒng)一的語(yǔ)言能力等級(jí)量表的語(yǔ)言學(xué)理論框架,采用定性和定量相結(jié)合的方法,對(duì)語(yǔ)言能力進(jìn)行描述,整理和設(shè)計(jì)了一套“能做”描述語(yǔ),對(duì)語(yǔ)言能力的各方面進(jìn)行了分層次、分等級(jí)的描述。我們認(rèn)為一套完善的語(yǔ)言能力描述語(yǔ)是語(yǔ)言測(cè)試和語(yǔ)言教學(xué)的基本操作工具,是語(yǔ)言能力理論的具體體現(xiàn),將為語(yǔ)言測(cè)試和語(yǔ)言教學(xué)提供基本框架。
制定我國(guó)語(yǔ)言能力等級(jí)量表的工作不是紙上談兵,所提出的理論、原則和方法以及具體的描述語(yǔ)是否具有可操作性,需要進(jìn)行大規(guī)模調(diào)查實(shí)驗(yàn)來(lái)證明,這樣的研究就是效度研究。由于條件限制,課題組決定采用上述原則和方法,對(duì)英語(yǔ)口語(yǔ)能力的描述和分級(jí)進(jìn)行一次大規(guī)模實(shí)驗(yàn)研究,以驗(yàn)證其科學(xué)性和可行性,作為建立我國(guó)語(yǔ)言能力等級(jí)共同量表的一種先行性嘗試。
課題組根據(jù)口語(yǔ)交際活動(dòng)的特征,分不同的參數(shù)層級(jí)建立了一個(gè)包括65條描述語(yǔ)的中國(guó)學(xué)生英語(yǔ)口語(yǔ)能力描述語(yǔ)庫(kù)。實(shí)證研究的操作是組織相當(dāng)數(shù)量的有經(jīng)驗(yàn)的教師,提供10位學(xué)生口語(yǔ)考試的實(shí)際視頻樣本,這些考生的能力必須覆蓋設(shè)計(jì)中的能力量表的口語(yǔ)能力全距,請(qǐng)有經(jīng)驗(yàn)的教師根據(jù)所提供的描述語(yǔ)對(duì)考生的口語(yǔ)能力水平逐條進(jìn)行評(píng)價(jià)或描述。研究工作量很大。
本次調(diào)查研究得到了全國(guó)15所大學(xué)的大力支持,共有183位有豐富教學(xué)經(jīng)驗(yàn)的教師參加了調(diào)查,一共生成了1830組數(shù)據(jù),為本項(xiàng)研究的數(shù)據(jù)分析提供了堅(jiān)實(shí)基礎(chǔ)。通過(guò)對(duì)數(shù)據(jù)進(jìn)行因子分析得到三個(gè)顯著性突出的公因子,考察各因子所概括的具體描述語(yǔ),發(fā)現(xiàn)這些描述語(yǔ)大體是從“語(yǔ)言使用的準(zhǔn)確性和豐富性”和“口語(yǔ)交際的有效性”這兩個(gè)側(cè)面來(lái)描述和評(píng)價(jià)口語(yǔ)能力水平的,這些描述語(yǔ)都涉及使用話(huà)語(yǔ)參與或完成交際任務(wù)的有效程度,證明這些描述語(yǔ)能夠充分準(zhǔn)確地反映學(xué)生的英語(yǔ)口語(yǔ)能力。另外,聚類(lèi)分析證實(shí):65條描述語(yǔ)所描述的全部被試的口語(yǔ)能力水平,就本項(xiàng)研究所涉及的考生能力范圍而言,可以劃分為4個(gè)等距的能力等級(jí)。調(diào)查分析的數(shù)據(jù)為語(yǔ)言能力的等級(jí)劃分提供了依據(jù)。
語(yǔ)言測(cè)試研究中最困難的部分是實(shí)證研究,研究結(jié)果是否有效,完全取決于參加者是否認(rèn)真,規(guī)模越大越難保證研究的質(zhì)量。這次研究規(guī)模比較大,但是數(shù)據(jù)檢驗(yàn)證明參加實(shí)驗(yàn)研究的老師都非常認(rèn)真。實(shí)驗(yàn)結(jié)果證明,本項(xiàng)研究所提出的理論和原則是有效的,方法是可行的,可以在將來(lái)開(kāi)展大規(guī)模研究時(shí)采用。我們對(duì)于參加研究的學(xué)校和老師由衷地表示感謝,由于經(jīng)費(fèi)拮據(jù),課題組無(wú)法為參加實(shí)驗(yàn)工作的老師提供分文報(bào)酬,連勞務(wù)費(fèi)也沒(méi)法支付。這些學(xué)校和老師在了解本項(xiàng)研究的重要性后,完全是出于對(duì)教育事業(yè)的奉獻(xiàn)精神,認(rèn)真地完成了工作?,F(xiàn)在書(shū)出版了,我們將向每位參加實(shí)證研究的老師贈(zèng)送一本,謹(jǐn)以此略表謝意。
這里想到一個(gè)問(wèn)題:在當(dāng)前商業(yè)大潮沖擊下,語(yǔ)言測(cè)試被炒作為一個(gè)火紅的“產(chǎn)業(yè)”,一個(gè)牽動(dòng)人心的社會(huì)鏈接。它們既有許多利益相關(guān)者,還有更多的對(duì)英語(yǔ)賦予了許多附加值的社會(huì)關(guān)心者。
有人說(shuō),搞語(yǔ)言測(cè)試是利益驅(qū)動(dòng)。這樣說(shuō)不對(duì)。搞語(yǔ)言測(cè)試只有風(fēng)險(xiǎn),因?yàn)檎Z(yǔ)言測(cè)試工作者處在矛盾沖突的交匯點(diǎn)上,他們的職業(yè)道德要求他們兢兢業(yè)業(yè)、恪盡職守,“精心設(shè)計(jì)、精心組織、精心施考”,但是他們的權(quán)益卻很難得到保障。一方面,考試的專(zhuān)業(yè)質(zhì)量越高,越可能被社會(huì)廣泛使用而被賦于極大的社會(huì)權(quán)重,并由此產(chǎn)生巨大的他們無(wú)法控制的商業(yè)利益,這一切都對(duì)語(yǔ)言測(cè)試工作者造成壓力,甚至使他們處于危險(xiǎn)境地;另一方面,也是因?yàn)槠胀ü姴⒉涣私庹Z(yǔ)言測(cè)試是一項(xiàng)高度專(zhuān)業(yè)性的工作。要說(shuō)利益,恐怕只有編寫(xiě)出版模擬試題集可以迅速牟利,但是這種東西只是樣子像多項(xiàng)選擇題,跟標(biāo)準(zhǔn)化考試風(fēng)馬牛不相及,拿來(lái)考試毫無(wú)用處,拿來(lái)教學(xué)完全無(wú)助于提高學(xué)生語(yǔ)言能力,相反只會(huì)坑害學(xué)生,完全是教育領(lǐng)域中的偽劣商品。嚴(yán)肅的語(yǔ)言測(cè)試工作者都有道德規(guī)范進(jìn)行自律,從來(lái)不去編寫(xiě)出版模擬試題集之類(lèi)的東西去輕松牟利。因此可以說(shuō),在我國(guó)目前的實(shí)際情況下,語(yǔ)言測(cè)試是一項(xiàng)專(zhuān)業(yè)要求高、風(fēng)險(xiǎn)大、零“回報(bào)”的工作,沒(méi)有這個(gè)思想準(zhǔn)備的人,并不適合從事專(zhuān)門(mén)的語(yǔ)言測(cè)試工作。
制定我國(guó)語(yǔ)言能力等級(jí)共同量表是一項(xiàng)浩大的工程,不是幾個(gè)人的綿薄之力就能完成的,必須從實(shí)際出發(fā),考慮我國(guó)目前語(yǔ)言教學(xué)和測(cè)試實(shí)際需求的迫切性和可行性,協(xié)調(diào)各不同語(yǔ)種、不同規(guī)模、不同層次的教學(xué)和測(cè)試機(jī)構(gòu),組織全國(guó)有關(guān)力量,才能實(shí)現(xiàn)制定全國(guó)語(yǔ)言能力等級(jí)共同量表這一總目標(biāo)。我們所做的只是前期的先行性研究。
把考試看作一種行政行為而不是學(xué)術(shù)行為的后果是政學(xué)不分(也是一種政企不分的表現(xiàn)),考試的用戶(hù)和考試的組織者合而為一,缺乏社會(huì)監(jiān)督。其實(shí)考試僅僅是一種測(cè)量工具,是一種專(zhuān)業(yè)性服務(wù)。教育考試是實(shí)現(xiàn)教育公平公正的社會(huì)道德底線(xiàn),為此必須保證教育考試的專(zhuān)業(yè)質(zhì)量。把大規(guī)??荚嚨膶?shí)踐從行政行為轉(zhuǎn)變?yōu)閷W(xué)術(shù)行為,最好的辦法是承認(rèn)考試的心理測(cè)量學(xué)與教育測(cè)量學(xué)的專(zhuān)業(yè)性質(zhì),成立非盈利的專(zhuān)業(yè)機(jī)構(gòu),聚集專(zhuān)業(yè)人才,潛心進(jìn)行研究,來(lái)從事各種考試項(xiàng)目的設(shè)計(jì)、開(kāi)發(fā)與實(shí)施,保證考試的專(zhuān)業(yè)質(zhì)量,供社會(huì)使用。政府部門(mén)則起監(jiān)管作用,政府的行政力量應(yīng)用來(lái)制定并頒布“教育測(cè)量與心理測(cè)量國(guó)家標(biāo)準(zhǔn)”,制定并頒布“中國(guó)語(yǔ)言能力等級(jí)共同量表”,制定并頒布教育考試法以保護(hù)語(yǔ)言測(cè)試工作者的權(quán)益和考試知識(shí)產(chǎn)權(quán)、對(duì)考試結(jié)果的正確使用進(jìn)行監(jiān)管等等。這些重要措施都將有利于教育考試事業(yè)的健康發(fā)展,最終造福千百萬(wàn)莘莘學(xué)子。
這是我們的愿望和期盼。