韋愛云,方雯鑫,李 盈
(廣西師范大學(xué)外國語學(xué)院,廣西桂林,541006)
劍橋商務(wù)英語證書考試(Cambridge Business Certificate,BEC)是根據(jù)公務(wù)商務(wù)工作的實(shí)際需要,從聽說讀寫四個(gè)方面對考生在商務(wù)和一般生活環(huán)境中使用英語的能力進(jìn)行全面考查的一項(xiàng)水平測試。該考試設(shè)有初級(jí)、中級(jí)和高級(jí)三個(gè)級(jí)別,是目前國內(nèi)外衡量商務(wù)英語水平的權(quán)威性考試。
目前對BEC真題集的研究甚少,現(xiàn)有研究多采用內(nèi)省法分析各個(gè)題型,幫助考生有效備考[1-2],針對商務(wù)英語詞匯研究的語料采樣范圍不夠廣,量化的研究方法使用也較少。計(jì)量語言學(xué)將語言視為復(fù)雜的自適應(yīng)系統(tǒng),追求語言研究的精確化,是一個(gè)系統(tǒng)地采用定量方法研究語言的學(xué)科。計(jì)量語言學(xué)對普通英語和科技英語的詞匯量化特征已有較為深入的研究,但對商務(wù)英語詞匯研究較少[3],目前尚未有學(xué)者針對BEC真題文本進(jìn)行專題詞匯研究?;贐EC真題文本進(jìn)行詞匯研究,從而指導(dǎo)BEC考試乃至商務(wù)英語教學(xué)的研究尚未出現(xiàn)。因此,本研究基于計(jì)量語言學(xué)的研究方法,以自建的77933詞的BEC語料庫為語料,對BEC文本詞匯的量化特征進(jìn)行分析。擬圍繞以下三個(gè)問題展開:第一,BEC語料庫的詞長分布呈現(xiàn)出什么特點(diǎn)?第二,BEC語料庫的高頻詞和低頻詞呈現(xiàn)出什么特點(diǎn)?第三,可為商務(wù)英語教學(xué)帶來什么啟示?
本研究分別選取BEC初級(jí)、中級(jí)與高級(jí)真題卷的第二、三、四和五輯作為語料,每一等級(jí)的真題中分別包含真題卷各16套,由劍橋大學(xué)考試委員會(huì)推薦,是歷年考題中經(jīng)過劍橋考試中心解密的題目,具有較高的參考價(jià)值。為了保證語料的標(biāo)準(zhǔn)化,只選取真題中構(gòu)成完整句子的真實(shí)文本(閱讀理解部分)進(jìn)行語言定量分析。將語料校對后計(jì)數(shù),BEC語料庫共包含77933詞,其中初級(jí)13485個(gè),中級(jí)30271個(gè),高級(jí)35268個(gè)。
本研究基于自建的小型語料庫,從詞長和詞頻對BEC語料庫的詞匯進(jìn)行量化研究。宏觀上,將BEC語料庫與其他英語文體語料庫進(jìn)行對比,探究BEC詞匯與其他英語文體的共性和特性;微觀上,對BEC語料庫三個(gè)等級(jí)(初、中和高級(jí))試題文本語料庫進(jìn)行對比,以求多角度探究BEC的詞匯特征。
本研究使用Python分別測量出BEC語料庫中以字母和音節(jié)為單位的詞長和詞頻分布數(shù)據(jù)。
1.平均詞長
詞形還原基于字典,將單詞的復(fù)雜形態(tài)變?yōu)榛A(chǔ)形態(tài)。其中單詞的基礎(chǔ)形態(tài)被稱為詞形。[4]例如,單詞go、goes、going、went和gone構(gòu)成一個(gè)以go為詞形的形態(tài)學(xué)范式。詞形還原對形態(tài)變化豐富的語言來說尤其重要,能減少詞匯量過大導(dǎo)致的標(biāo)注困難和理解困難問題。BEC四個(gè)語料庫平均詞長分布情況見表1。
表1 BEC四個(gè)語料庫平均詞長 單位:個(gè)
由表1可知,詞形還原前,以字母為單位測量詞長時(shí),BEC總語料庫的平均詞長為4.98,大于一般用途英語的平均詞長(4.66)[5],稍大于法律英語語料庫平均詞長(4.84)。[6]而以音節(jié)為單位測量時(shí),總語料庫的平均詞長為1.56。無論是以字母還是以音節(jié)作為測量單位,平均詞長與試題難度均呈正相關(guān)。
詞形還原后,以字母為單位測量詞長時(shí),BEC總語料庫的平均詞長為4.71。以音節(jié)為單位的總語料庫平均詞長為1.51。同樣,兩種方式測量的平均詞長都隨著試題等級(jí)難度的上升而增長。
2.各庫詞長分布情況
對各個(gè)原始語料庫以字母為單位分別測量詞長,圖1為各個(gè)層級(jí)的詞頻分布情況。
圖1 各庫中不同長度(字母)詞匯占比(%)
圖1顯示,各個(gè)語料庫的詞長主要集中在2—4個(gè),其中初級(jí)語料庫中占53.95%,中級(jí)占51.94%,高級(jí)占51.63%,總語料庫中占52.14%。
此外,初級(jí)語料庫中的詞長分布在1—21個(gè),但鮮見詞長為17和19的詞。中級(jí)語料庫詞長范圍為1—27個(gè),其中24與25的詞長缺少。高級(jí)語料庫詞長分布在1—26個(gè),缺少詞長為21、23和25的詞。BEC總語料庫的詞長分布范圍為1—27個(gè),缺少了詞長為25的詞。其中一些特定詞長的詞缺少的主要原因是本文語料庫的樣本量不足,但總體可以反映出BEC考試真題各梯度的詞長分布范圍。
圖2顯示,各庫中多數(shù)詞為單音節(jié)詞,單音節(jié)詞在各庫中的占比均超過60.00%,其中初級(jí)68.00%,中級(jí)65.09%,高級(jí)64.64%,BEC總庫65.39%。結(jié)合統(tǒng)計(jì)數(shù)據(jù)可知,BEC總語料庫的詞長分布范圍為1—10個(gè),其中初級(jí)語料庫的詞長分布范圍為1—7個(gè),中級(jí)為1—8個(gè),高級(jí)的音節(jié)數(shù)分布在1—9個(gè)。
詞頻是測量英語語言中特定詞出現(xiàn)頻率的重要方法。在超過700萬詞的普通英語詞表中從未出現(xiàn)過的詞相較于出現(xiàn)過的詞更不易被使用。[7]同樣,在語料庫中,出現(xiàn)次數(shù)多的詞更易受到關(guān)注。h點(diǎn)是秩頻率分布中功能詞和實(shí)詞之間的模糊分界點(diǎn)。一般來說,h點(diǎn)之前的詞屬于高頻詞,h點(diǎn)之后的詞為低頻詞。h點(diǎn)之前的詞以功能詞居多,但也可能包含該文本的核心詞,通常能反映該文本的特征。
1.BEC與NE高頻詞對比
為探究BEC語料庫與其他英語文體的語料庫的共性與特性,筆者分別選取BEC語料庫與海軍英語(NE)語料庫[2]詞頻表前50的詞進(jìn)行分析。
高頻實(shí)詞與更豐富的世界知識(shí)體系相關(guān)聯(lián)。[8]由表2可知,BEC語料庫中有6個(gè)核心詞,如“公司”company(666)、“業(yè)務(wù)”business(401)、“工作”work(276)、“經(jīng)理”manager(218)、“時(shí)間”time(215)、“顧客”customer(213)。由表5可知,NE語料庫有8個(gè)核心詞,“力量”force(3185)、“海軍的”naval(2442)、“火車”train(2315)、“大?!眘ea(2130)、“船”ship(5589)、“海軍”navy(3954)、“飛機(jī)”aircraft(2014)、“潛艇”submarine(1793)。這些高頻核心詞反映具體領(lǐng)域的目的和活動(dòng)。BEC語料庫中的高頻詞展現(xiàn)出了明顯的商務(wù)英語特征,NE語料庫中的高頻詞也體現(xiàn)出海軍英語特征。
表2 BEC語料庫和NE語料庫詞頻前50詞
就詞匯定制而言,詞可分為實(shí)詞和功能詞。[9]實(shí)詞具有極強(qiáng)的所指性,可單獨(dú)用來描述可感知的實(shí)體(如物體、事件和特征),為每句言語提供主題義。[9]實(shí)詞包括名詞、動(dòng)詞、形容詞和副詞。功能詞在實(shí)詞之間提供語言聯(lián)系,要在小句或句子中與其他詞結(jié)合才構(gòu)成意義。助動(dòng)詞、連詞、介詞和代詞都屬于功能詞。[9]在BEC前50高頻詞中,有38個(gè)功能詞(如the、to、of、a和it)和12個(gè)實(shí)詞(如company、business),分別占76.00%和24.00%。在NE語料庫中,功能詞有22個(gè),占44.00%,實(shí)詞有28個(gè),占56.00%??ǚ綑z驗(yàn)結(jié)果顯示p=0.5>0.05。這表明NE語料庫與BEC語料庫中前50個(gè)高頻詞表中實(shí)詞與功能詞的使用情況并無統(tǒng)計(jì)學(xué)意義上的差異。
2.BEC子語料庫中高頻核心詞對比
表3為三個(gè)子語料庫中的高頻核心詞。結(jié)果表明,試題等級(jí)難度與高頻實(shí)詞的個(gè)數(shù)成正相關(guān)的關(guān)系。隨著試題難度的加大,更高一級(jí)的高頻核心詞中幾乎囊括了前一等級(jí)的高頻核心詞。在中級(jí)高頻核心詞中,初級(jí)的覆蓋率為61.53%;在高級(jí)高頻核心詞中,中級(jí)的覆蓋率為62.50%。“company”(公司)均為三個(gè)子語料庫的最高頻核心詞,該詞也是讀者在商務(wù)英語領(lǐng)域中所期待見到的高頻詞,因?yàn)樵谏虅?wù)英語的文本語境中,公司為進(jìn)行商務(wù)活動(dòng)的主要場所及載體。
表3 初、中、高級(jí)語料庫中的高頻核心詞
高頻實(shí)詞構(gòu)建了文本的語義網(wǎng)絡(luò)。Trier指出,語言之間的界限可以決定其真實(shí)的價(jià)值。[10]詞不應(yīng)被單獨(dú)作為考察對象,而應(yīng)系統(tǒng)分析其語義的相互關(guān)系。以施動(dòng)者為例,初級(jí)語料庫中商務(wù)動(dòng)作執(zhí)行者或參與者為people和customer,在中級(jí)語料庫中擴(kuò)展到了manager與staff,到高級(jí)語料庫中出現(xiàn)了manager的語義功能詞management。結(jié)構(gòu)主義認(rèn)為,某種語言中的所有詞組成的詞庫是語言形式和語義關(guān)系構(gòu)成的關(guān)系網(wǎng)。隨著文本難度梯度的加大,詞匯所構(gòu)建的關(guān)系網(wǎng)愈發(fā)復(fù)雜和精確。
1.BEC與CCBNC低頻詞對比
低頻詞是指在文本中出現(xiàn)少于4次的詞??赏ㄟ^文本測量分析軟件QUITA迅速了解低頻詞占比。本節(jié)將BEC語料庫的低頻詞與CCBNC語料庫低頻詞[11]進(jìn)行對比。
在BEC總語料庫中,僅出現(xiàn)一次的單詞占比2.86%,出現(xiàn)兩次的單詞占比1.80%,出現(xiàn)過3次的單詞數(shù)占比1.44%,低頻詞的總數(shù)僅占文本的6.10%。在CCBNC中,只出現(xiàn)一次的單詞占比35.00%,出現(xiàn)兩次的單詞占比13.00%,出現(xiàn)三次的單詞占比7.00%,低頻詞占文本的55.00%??ǚ綑z驗(yàn)結(jié)果顯示p=000<0.05,表明在兩個(gè)語料庫的低頻詞使用上呈現(xiàn)出顯著差異,BEC語料庫的低頻詞遠(yuǎn)遠(yuǎn)少于CCBNC的低頻詞。CCBNC的研究結(jié)果表明商務(wù)英語的獨(dú)有詞匯一般由低頻詞構(gòu)成,這說明BEC語料庫中含有的商務(wù)英語獨(dú)有詞匯較少,不足以涵蓋整個(gè)商英語域的所有詞匯。
文本中頻次為1的詞被稱為單現(xiàn)詞。Kornai認(rèn)為,某個(gè)文本中將近一半的詞只出現(xiàn)一次。[12]表中數(shù)據(jù)顯示,單現(xiàn)詞的占比僅為2.86%。而黃潔得出的結(jié)論為,商務(wù)英語的單現(xiàn)詞比例為35.00%。[11]CCBNC的單現(xiàn)詞占比35.35%。[3]統(tǒng)計(jì)檢驗(yàn)表明BEC語料庫的單現(xiàn)詞與其余兩個(gè)語料庫出現(xiàn)顯著差異。這表明BEC語料庫的單現(xiàn)詞數(shù)量較少,詞匯豐富度低。這是因?yàn)锽EC試卷通常使用高頻詞來表達(dá)其含義。因此,如果考生掌握了BEC語料庫高頻詞的含義,他們在理解文本方面會(huì)遇到的生詞困難就相對較少,能較為順利地通過BEC考試。這也反映出BEC考試所涉及的詞匯只是商務(wù)英語領(lǐng)域的少量詞匯,要對商務(wù)英語領(lǐng)域的知識(shí)有更深入和準(zhǔn)確的了解,必須努力增加商務(wù)英語方面的詞匯量。
2.BEC子語料庫低頻詞對比
筆者對三個(gè)子語料庫的低頻詞做了統(tǒng)計(jì)。獨(dú)立性檢驗(yàn)結(jié)果顯示p=0.997>0.05,表明BEC三個(gè)子語料庫之間低頻詞的占比并未出現(xiàn)統(tǒng)計(jì)學(xué)意義上的顯著差異,即初、中和高級(jí)語料庫中的低頻詞分布情況相似。這與上節(jié)測出的BEC總語料庫高頻詞占比少的結(jié)論相符。
低頻詞在英語詞匯構(gòu)成中的能產(chǎn)性較強(qiáng)[13],大量新詞的產(chǎn)生和詞法化往往始于低頻詞。此外,單現(xiàn)詞通常能反映文本的詞匯豐富度。三個(gè)子語料庫中TTR的值(初級(jí)0.140,中級(jí)0.099,高級(jí)0.106)與表8中低頻詞的占比波動(dòng)相似,這說明各個(gè)子語料庫的詞匯豐富度普遍較低。理論上,文本的難度梯度越大,詞匯豐富度越高(即TTR與單現(xiàn)詞占比越高)。但是,為何初級(jí)的TTR值和單現(xiàn)詞占比要高于中級(jí)和高級(jí)?筆者認(rèn)為,初級(jí)真題語料有限,但初級(jí)真題中的詞匯必須構(gòu)建完整的商務(wù)環(huán)境語境,從而造成型符與例符的比例變大。
在英語詞匯教學(xué)中,詞長和詞頻看似是極為抽象的概念,但對兩者的研究可為針對BEC考試的詞匯教學(xué)提供可靠數(shù)據(jù)支持。立足前文研究結(jié)果,本節(jié)嘗試為BEC考試教學(xué)與商務(wù)英語教學(xué)提出以下建議。
1.注重單音節(jié)和雙音節(jié)詞匯教學(xué)
詞長因素會(huì)影響英語學(xué)習(xí)者的詞匯學(xué)習(xí)。[14]BEC平均詞長與真題難度呈正相關(guān)。大部分BEC詞匯主要由2—4個(gè)字母構(gòu)成,分布范圍多集中于單音節(jié)和雙音節(jié)詞。教師在詞匯教學(xué)中應(yīng)特別注重教學(xué)文本中單音節(jié)和雙音節(jié)詞匯的教授。
2.引導(dǎo)學(xué)生通過掌握基本詞形主動(dòng)學(xué)習(xí)詞匯
在進(jìn)行BEC考試詞匯教學(xué)時(shí),教師應(yīng)從詞匯的基本形態(tài)抓起。多數(shù)詞匯的基本形態(tài)較簡單,易于記憶習(xí)得。[15]多數(shù)商務(wù)英語詞匯由基本的普通英語詞匯詞形構(gòu)成,主要通過復(fù)合詞和派生詞進(jìn)行詞匯構(gòu)建。[16]此外,BEC考試的備考對象多為以高效完成商務(wù)活動(dòng)為目的的社會(huì)人士和商務(wù)英語專業(yè)學(xué)生,具有較強(qiáng)的學(xué)習(xí)動(dòng)機(jī)和邏輯思維能力。教師應(yīng)引導(dǎo)學(xué)生掌握基本詞形,同時(shí)將構(gòu)詞法的知識(shí)融入詞匯教學(xué),以此提高學(xué)生構(gòu)建其詞匯語義網(wǎng)絡(luò)的能力,達(dá)到一詞記多詞的效果。
3.高頻詞詞表制作與教材選擇
高頻詞詞表的生成可減輕教與學(xué)的負(fù)擔(dān)。因此,BEC備考的教材應(yīng)盡可能涵蓋商務(wù)英語專業(yè)詞匯,尤其是高頻詞。此外,教師課后應(yīng)安排相關(guān)任務(wù),如造句、根據(jù)場景使用新詞匯進(jìn)行對話,鼓勵(lì)學(xué)生使用當(dāng)天學(xué)習(xí)的詞匯,提高詞匯使用率。
4.進(jìn)行課外知識(shí)補(bǔ)充,擴(kuò)大學(xué)生商務(wù)英語詞匯量
對BEC語料庫低頻詞的研究表明,BEC真題的詞匯豐富度較低。這說明BEC真題涵蓋的商務(wù)英語語域詞匯較少,詞匯覆蓋率較低。任何教材都無法將一個(gè)語域中的詞匯包羅萬象。[18]適當(dāng)選取課外讀物進(jìn)行教學(xué),可提高學(xué)生的閱讀能力,增加學(xué)生商務(wù)英語語域的詞匯量。在讀物的選取上,應(yīng)盡量選擇真實(shí)文本,如商務(wù)英語信函、英文合同等。
本文基于自建的BEC語料庫,借助計(jì)量語言學(xué)的相關(guān)指標(biāo),結(jié)合質(zhì)性分析手段,有以下幾個(gè)方面發(fā)現(xiàn)。
BEC語料庫平均詞長隨著真題難度梯度的不斷上升而增加,其中多為單音節(jié)詞和雙音節(jié)詞。初級(jí)與中、高級(jí)詞長的難度跨度相差明顯。中級(jí)真題中不同音節(jié)詞匯的音節(jié)數(shù)最長。
在與NE和商務(wù)英語語料庫的對比中,BEC語料庫與NE語料庫的前50個(gè)高頻詞都具有各自的語言特色。BEC語料庫與商務(wù)英語語料庫的前10個(gè)高頻詞均為功能詞。對比內(nèi)部三個(gè)語料庫后發(fā)現(xiàn),試題等級(jí)難度與高頻實(shí)詞的個(gè)數(shù)呈正相關(guān),更高一級(jí)文本語料庫的高頻核心詞中幾乎涵蓋了前一等級(jí)文本語料庫的高頻核心詞。
BEC語料庫中低頻詞所占比例遠(yuǎn)遠(yuǎn)低于CCBNC語料庫,說明BEC語料庫中單現(xiàn)詞的比例較低,詞匯豐富度較低。此外,三個(gè)子語料庫的低頻詞和單現(xiàn)詞占比均較低。
本文最后提出BEC詞匯教學(xué)的建議:第一,教師應(yīng)在備考教學(xué)中注重單音節(jié)和雙音節(jié)詞匯教學(xué);第二,引導(dǎo)學(xué)生通過掌握基本詞形主動(dòng)學(xué)習(xí)詞匯;第三,制作高頻詞詞表,選擇高頻詞出現(xiàn)多的教材以及布置針對性的課后作業(yè)加深記憶;第四,進(jìn)行課外知識(shí)補(bǔ)充,擴(kuò)大學(xué)生商務(wù)英語詞匯量。