焦子桓 艾紅娟
(西南大學(xué)文學(xué)院 重慶 400715)
“中型語文詞典可以分為內(nèi)向型詞典和外向型詞典,內(nèi)向型詞典是供母語為本族語學(xué)習(xí)者使用的詞典,外向型詞典是供母語為非本族語學(xué)習(xí)者使用的詞典?!盵1]本文涉及的內(nèi)向型漢語詞典有:《現(xiàn)代漢語詞典》(第7版)、《現(xiàn)代漢語規(guī)范詞典》(第3版)、《現(xiàn)代漢語學(xué)習(xí)詞典》;外向型漢語詞典有:《當(dāng)代漢語詞典》、《現(xiàn)代漢語學(xué)習(xí)詞典》(孫全州版)、《商務(wù)館學(xué)漢語》;內(nèi)向型英語詞典有:《牛津簡明英語詞典》(第10版)、《韋氏大學(xué)詞典》(第10版)、《柯林斯英語詞典》(第13版);外向型英語詞典有:《牛津高階英語詞典》(第9版)、《韋氏高階英語學(xué)習(xí)詞典》、《柯林斯高階英語學(xué)習(xí)詞典》(第9版)。
義項(xiàng)精細(xì)度是指語文詞典中多義詞義項(xiàng)劃分的粗疏與細(xì)密程度。本文以李仕春《漢英中型語文性詞典義項(xiàng)精細(xì)度對比研究》“中型語文性詞典義項(xiàng)精細(xì)度比較表”為參照對象[2],建立“漢英內(nèi)外型詞典義項(xiàng)精細(xì)度比較表”,分別統(tǒng)計(jì)出100核心詞在漢英內(nèi)外型詞典中的義項(xiàng)精細(xì)度,并分析造成漢英詞典義項(xiàng)精細(xì)度差別的原因。
《現(xiàn)代漢語詞典》是我國第一部真正意義上的現(xiàn)代語文詞典,主要是為推廣普通話,促進(jìn)漢語規(guī)范化服務(wù)的,具有“共時(shí)性、簡明性、語文性和規(guī)范性”[3]的特點(diǎn),該詞典初版于1978年,第7版于2016年出版?!冬F(xiàn)代漢語規(guī)范詞典》是一部以促進(jìn)全面推廣語言文字規(guī)范標(biāo)準(zhǔn)為中心工作的詞典,該詞典初版于2004年,第3版于2014年出版。2010年出版的《現(xiàn)代漢語學(xué)習(xí)詞典》與通用型詞典功能不同,它是以指導(dǎo)學(xué)生學(xué)習(xí)應(yīng)用漢語為主旨的,立足于實(shí)用,目前還沒有修訂版。100核心詞在以上三部詞典中的平均義項(xiàng)如下:
100核心詞在《現(xiàn)代漢語詞典》中共有549個(gè)義項(xiàng),平均每個(gè)詞有5.49個(gè)。
100核心詞在《現(xiàn)代漢語規(guī)范詞典》中共有568個(gè)義項(xiàng),平均每個(gè)詞有5.68個(gè)。
100核心詞在《現(xiàn)代漢語學(xué)習(xí)詞典》中共有590個(gè)義項(xiàng),平均每個(gè)詞有5.9個(gè)。
上述三部內(nèi)向型詞典編纂目的是不同的,這應(yīng)在辭書文本中有所體現(xiàn),但上述數(shù)據(jù)顯示它們的義項(xiàng)精細(xì)度非常接近。
從詞典微觀方面分析,我們發(fā)現(xiàn)上述三部詞典不但義項(xiàng)數(shù)量非常相近而且義項(xiàng)相似度也很高。究其原因在于:“經(jīng)典辭書的影響力和權(quán)威性大,后出產(chǎn)品的智力投放很難超越積累多代人智慧的經(jīng)典辭書?!盵4]這就有可能造成了后起的辭書借鑒之前出現(xiàn)的優(yōu)秀辭書。我們隨機(jī)選取了30個(gè)詞,將上述三部詞典相同詞目的釋義進(jìn)行對比,發(fā)現(xiàn)《現(xiàn)代漢語學(xué)習(xí)詞典》《現(xiàn)代漢語規(guī)范詞典》與《現(xiàn)代漢語詞典》的釋義相似度都分別高達(dá)80%以上。這表明《現(xiàn)代漢語規(guī)范詞典》與《現(xiàn)代漢語學(xué)習(xí)詞典》的釋義在很大程度上借鑒了《現(xiàn)代漢語詞典》。
1995年出版的《現(xiàn)代漢語學(xué)習(xí)詞典》是我國較早一批的對外漢語學(xué)習(xí)詞典,收錄詞語約23000個(gè),它最大的特色是將漢語語法歸納為幾十個(gè)句法模式,并配有詳細(xì)的說明,有學(xué)者稱其“填補(bǔ)了我國對外漢語學(xué)習(xí)詞典的空白”[5]。2005年出版的《當(dāng)代漢語詞典》是一部為外國學(xué)習(xí)者編纂的初級漢語學(xué)習(xí)詞典,主要收錄《漢語水平詞匯與漢字等級大綱》中的甲、乙級詞。在體例上對詞不做釋義,而是通過示例使讀者理解詞義、掌握語法?!渡虅?wù)館學(xué)漢語》是2007年出版的新作,被譽(yù)為 “迄今為止我國第一部專門為具有中級漢語水平的外國人編的漢語語文詞典”[6]。這三部外向型詞典到目前為止尚無修訂版。100核心詞在以上三部詞典中的平均義項(xiàng)如下:
100核心詞在《現(xiàn)代漢語學(xué)習(xí)詞典》中共有456個(gè)義項(xiàng),平均每個(gè)詞有4.56個(gè)。
100核心詞在《當(dāng)代漢語詞典》中共有153個(gè)義項(xiàng),平均每個(gè)詞有1.53個(gè)。
100核心詞在《商務(wù)館學(xué)漢語》中共有330個(gè)義項(xiàng),平均每個(gè)詞有3.3個(gè)。
上述數(shù)據(jù)顯示,漢語外向型詞典中100核心詞義項(xiàng)收錄的非常少。這是因?yàn)闈h語外向型詞典的義項(xiàng)通常是在漢語內(nèi)向型詞典基礎(chǔ)上刪減而來的。以“壞”字為例,對比《商務(wù)館學(xué)漢語》《現(xiàn)代漢語學(xué)習(xí)詞典》和《現(xiàn)代漢語詞典》的釋義:
更多類似例子顯示,《商務(wù)館學(xué)漢語》《現(xiàn)代漢語學(xué)習(xí)詞典》等外向型詞典在很大程度上沿襲了《現(xiàn)代漢語詞典》相同詞目的釋義。正如章宜華所說:“《現(xiàn)代漢語詞典》作為內(nèi)向型普通語言詞典,其釋義的科學(xué)性和規(guī)范性使之成為漢語辭書的典范,在學(xué)界和廣大用戶中最具權(quán)威性,而這種權(quán)威性在辭書編纂中產(chǎn)生了很強(qiáng)的‘藍(lán)本效應(yīng)’,無論是漢語學(xué)習(xí)詞典、對外漢語詞典、還是漢外雙語詞典的編纂大多以《現(xiàn)代漢語詞典》為‘藍(lán)本’,不管它是否符合潛在用戶的實(shí)際需求?!盵7]因?yàn)樽鳛椤八{(lán)本”的《現(xiàn)代漢語詞典》自初版以來義項(xiàng)幾乎沒有明顯增長,從而間接使得以它為“藍(lán)本”的其他詞典在義項(xiàng)收錄上也難以取得進(jìn)展。
《牛津簡明英語詞典》初版于1911年,第12版于2011年出版?!俄f氏大學(xué)詞典》初版于1898年,第11版于2003年出版?!犊铝炙褂⒄Z詞典》被稱為“英國詞典的里程碑”,因?yàn)樗堑谝徊坎捎糜?jì)算機(jī)數(shù)據(jù)庫編纂和排版的詞典。該詞典初版于1979年,第13版于2018年出版。100核心詞在以上三部詞典中的平均義項(xiàng)如下:
100核心詞在《牛津簡明英語詞典》中共有1284個(gè)義項(xiàng),平均每個(gè)詞有12.84個(gè)。
100核心詞在《韋氏大學(xué)詞典》中共有2395個(gè)義項(xiàng),平均每個(gè)詞有23.95個(gè)。
100核心詞在《柯林斯英語詞典》中共有1982個(gè)義項(xiàng),平均每個(gè)詞有19.82個(gè)。
上述數(shù)據(jù)顯示,英語內(nèi)向型詞典義項(xiàng)較多,均在10個(gè)以上,且數(shù)量相差較大。這主要是因?yàn)椋阂?、?nèi)向型詞典面向母語用戶,需要“廣泛收錄消極型詞匯,義項(xiàng)的收錄要考慮用戶閱讀會(huì)涉及的語義范圍,因此它的義項(xiàng)一般要比積極型詞典多得多”[8]。二、各品牌詞典義項(xiàng)的分合有各自的認(rèn)定標(biāo)準(zhǔn),雖然會(huì)相互借鑒,但總體上都保持著自身的釋義特色,避免被其他詞典同化。
《牛津高階英語詞典》首開外向型詞典編纂先河,該詞典初版于1948年,第9版于2016年出版?!犊铝炙垢唠A英語學(xué)習(xí)詞典》被譽(yù)為“語料庫驅(qū)動(dòng)的詞典編纂的最早習(xí)作”[9]。它的面世標(biāo)志著外向型詞典開始了激烈的競爭。該詞典初版于1987年,第9版于2018年出版。100核心詞在以上三部詞典中的平均義項(xiàng)如下:
100核心詞在《牛津高階英語詞典》中共有1046個(gè)義項(xiàng),平均每個(gè)詞有10.46個(gè)。
100核心詞在《韋氏高階英語學(xué)習(xí)詞典》中共有1308個(gè)義項(xiàng),平均每個(gè)詞有13.08個(gè)。
100核心詞在《柯林斯高階英語學(xué)習(xí)詞典》中共有796個(gè)義項(xiàng),平均每個(gè)詞有7.96個(gè)。
從上述數(shù)據(jù)可以看出,英語類詞典收錄的義項(xiàng)普遍較多,其中一個(gè)很重要的原因是英語詞典修訂者非常重視利用語料庫技術(shù)來發(fā)現(xiàn)新的義項(xiàng)。李仕春從歷時(shí)的角度統(tǒng)計(jì)了《牛津高階英語詞典》1-8版100核心詞的平均義項(xiàng)數(shù)量分別是:7.55、7.91、7.03、8.25、8.47、10.2、10.47、10.61個(gè)。發(fā)現(xiàn)《牛津高階英語詞典》從第4版開始義項(xiàng)數(shù)量有了明顯變化,到第6版時(shí)義項(xiàng)數(shù)量趨于穩(wěn)定。從出版時(shí)間來看,第4版出版時(shí)處于20世紀(jì)80年代末,這個(gè)時(shí)期牛津大學(xué)出版社開始為詞典編纂建立大型語料庫,并將利用語料庫技術(shù)豐富和補(bǔ)充常用詞的義項(xiàng)作為修訂重點(diǎn)。到21世紀(jì)初,第6版出版之時(shí),已經(jīng)完成了利用語料庫技術(shù)豐富和補(bǔ)充常用詞義項(xiàng)的工作。
“與傳統(tǒng)憑借語感編纂的詞典相比,建立在語料庫技術(shù)基礎(chǔ)上的英語類中型語文詞典在多義詞義項(xiàng)的劃分方面更加細(xì)化、義項(xiàng)的收錄更加全面,在詞典編纂史上實(shí)現(xiàn)了里程碑式的跨越發(fā)展。”[10]應(yīng)用語料庫編纂詞典的歷史可追溯到塞繆爾· 約翰遜編纂《英語詞典》時(shí)期,他利用前人在150年間收集的資料建立了第一個(gè)用于詞典編纂的大型手工語料庫[11]。200多年后,這種詞典編纂方法被《牛津英語詞典》沿用,來自世界各地的2000多名志愿者為《牛津英語詞典》的編纂貢獻(xiàn)了超過500萬張?jiān)~語卡片,主編默里甚至為整理將近2噸重的卡片專門搭建了“繕寫室”。上世紀(jì)50年代以后,隨著現(xiàn)代計(jì)算機(jī)技術(shù)的發(fā)展,使語料庫從手工收集轉(zhuǎn)向鍵盤輸入成為了可能。第一個(gè)具有代表性的百萬級計(jì)算機(jī)語料庫——布朗語料庫于1964年在布朗大學(xué)建立。 隨后,各大出版公司陸續(xù)建立了自己的詞典語料庫,例如柯林斯出版公司和伯明翰大學(xué)聯(lián)合開發(fā)的語料庫(The English Bank)已積累了超過64500萬詞次,內(nèi)容涉及英、美、奧、加等國家的英語,取材覆蓋書刊雜志、電視廣播、日常交談等正式或非正式語體;麥克米倫出版公司依托含詞2億的“世界英語語料庫”(World English Corpus);朗文和牛津出版公司使用擁有1.17億詞匯的“英語國家語料庫”(British National Corpus),此外朗文公司還自建擁有3000萬詞匯的“朗文蘭開斯特語料庫”(Longman Lancaster Corpus)和擁有500萬詞匯的“朗文學(xué)習(xí)者語料庫”(Longman Learner’s Corpus);韋伯斯特出版公司依托超過1億語詞的引語數(shù)據(jù)庫。“這些語料庫以多元的語料題材、驚人的信息存量、超強(qiáng)的客訴能力、高超的反應(yīng)技術(shù)、簡易的分檔歸類、便利的檢索引導(dǎo)、穩(wěn)定的工作性能等為特征,從根本上顛覆了傳統(tǒng)的詞典編纂理念,使詞典編纂方式發(fā)生了革命性的轉(zhuǎn)變”[12]。因此,王宗炎指出:“現(xiàn)代新出的重要英語辭書,一般都有個(gè)龐大的語料庫做依據(jù)”[13]。
從上文的統(tǒng)計(jì)數(shù)據(jù)可以看出,英語內(nèi)向型詞典的義項(xiàng)精細(xì)度約是漢語內(nèi)向型詞典的3倍,英語外向型詞典的義項(xiàng)精細(xì)度也是漢語外向型詞典的3倍。出現(xiàn)這樣巨大差距的原因在于漢語詞典漏收了大量的義項(xiàng)。為此,李仕春先后撰寫了《語料庫視野下的現(xiàn)代漢語“綠”字義項(xiàng)分布研究》[14]《語料庫視野下的現(xiàn)代漢語“黃”字義項(xiàng)分布研究》[15]《語料庫視野下的現(xiàn)代漢語“狗”字義項(xiàng)分布研究》[16]等一系列論文,證明:“現(xiàn)代漢語中100核心詞和現(xiàn)代英語中對應(yīng)的100核心詞的平均義項(xiàng)數(shù)目基本相當(dāng)(也即漢英中型語文性詞典中100個(gè)對應(yīng)核心詞的平均義項(xiàng)數(shù)目基本一致),出現(xiàn)差距的原因在于英語詞典編纂者在修訂詞典時(shí)有意識(shí)地注意運(yùn)用語料庫技術(shù)豐富并補(bǔ)充常用詞的義項(xiàng),而漢語詞典編纂者對此沒有意識(shí)。”
從詞典修訂的頻率來看,語料庫技術(shù)的應(yīng)用在很大程度上縮短了詞典修訂周期。以《柯林斯高階英語學(xué)習(xí)詞典》為例,從它的英文名稱《Collins COBULD Advanced Learner’s English Dictionary》可以看出,這是一部基于語料庫生成的學(xué)習(xí)詞典,21世紀(jì)以來,《柯林斯高階英語學(xué)習(xí)詞典》以平均2.5年/周期的速度修訂,在激烈的詞典市場中占盡先機(jī)。相比之下,我國詞典市場顯得非常被動(dòng),本文分析的漢語類詞典,除了《現(xiàn)代漢語詞典》《現(xiàn)代漢語規(guī)范詞典》還在以穩(wěn)定的步伐進(jìn)行修訂外,其他詞典至今都沒有修訂版,這就意味著那些沒有信息更新的詞典很快會(huì)被市場淘汰掉。事實(shí)上,我國自上個(gè)世紀(jì)90年代起,就相繼建立了一批漢語語料庫,如國家語委的“現(xiàn)代漢語平衡語料庫”,北京大學(xué)的“CCL語料庫”和“BCC語料庫”,其中“BCC”語料庫已超過150億字符,語料涉及口語、書面語、科技、政治、經(jīng)濟(jì)、法律、文學(xué)、報(bào)紙等多個(gè)領(lǐng)域,按張志毅先生“學(xué)習(xí)詞典必須以足量、平衡、針對的語料為前提。收10000條、20000條、30000條的初級、中階、高階學(xué)習(xí)詞典,其語料必須3億、6億、9億字符”[17]的說法,BCC語料庫已經(jīng)能夠勝任國內(nèi)任何足本語文詞典編纂的重任。然而遺憾的是,到目前為止,國內(nèi)尚無一部真正基于漢語語料庫開發(fā)的漢語詞典。正是因?yàn)闆]有對語料庫技術(shù)的足夠重視,導(dǎo)致我國的詞典編纂水平遠(yuǎn)遠(yuǎn)落后于發(fā)達(dá)國家。
通過漢英內(nèi)外型詞典義項(xiàng)精細(xì)度的對比,可以說明基于語料庫編纂的英語詞典義項(xiàng)收錄更加全面,義項(xiàng)劃分更加細(xì)化,更具科學(xué)性。不僅如此,語料庫在詞典編纂中對義項(xiàng)描寫,使用頻率統(tǒng)計(jì),語法信息描述等方面也具無可比擬的優(yōu)越性。在英美等辭書強(qiáng)國,幾乎所有著名品牌的英語詞典都是基于語料庫技術(shù)編纂而成的,語料庫技術(shù)早已把詞典編纂推向了一個(gè)新的高度,事實(shí)證明建立語料庫已經(jīng)是編纂當(dāng)代原創(chuàng)性詞典的必要條件。然而,在我國這方面的技術(shù)還處于初級階段,利用語料庫技術(shù)編纂詞典還沒有引起詞典編纂者的足夠重視,真正符合詞典編纂標(biāo)準(zhǔn)的大型語料庫又屈指可數(shù),這一現(xiàn)狀與辭書強(qiáng)國形成強(qiáng)烈的反差。把語料庫技術(shù)和詞典編纂結(jié)合起來成規(guī)模地、系統(tǒng)地研究現(xiàn)代漢語常用詞的義項(xiàng)分布規(guī)律問題,是一項(xiàng)待展開的、需要成千上萬人參與的重大基礎(chǔ)應(yīng)用研究項(xiàng)目,它是一項(xiàng)非常宏大的工程。