邵 斌 王文斌
(浙江大學(xué),杭州,310058/浙江財經(jīng)學(xué)院,杭州,310018;寧波大學(xué),寧波,315211)
“國際語料庫語言學(xué)協(xié)會”①(即International Computer Archive of Modern and Medieval English,簡稱ICAME)自成立以來,見證著語料庫語言學(xué)的快速成長和發(fā)展。第33屆ICAME年會于2012年5月30日至6月3日在比利時魯汶大學(xué)(Katholieke Universiteit Leuven)召開,來自全球22個國家和地區(qū)的204名代表與會。大會主旨發(fā)言共5場,論文88篇,工作坊論文39篇,海報論文20篇,在研項目及軟件示范26種。與2000年的ICAME 21相比(何安平2001),不論是人數(shù)抑或論文數(shù),本次會議均增加了兩倍。與去年的ICAME 32相比(楊李香2012),論文總數(shù)亦有所增加。由此可見,語料庫語言學(xué)已成為新世紀語言研究的熱點,研究隊伍穩(wěn)定且不斷壯大。
本次年會的主題是“英語語言學(xué)核心與交叉研究中的語料庫運用”(Corpora at the Center and Crossroads of English Linguistics)。大會論文可分以下6大議題:(1)基于語料庫的英語語言諸層面研究;(2)基于語料庫的語言對比及翻譯研究;(3)英語變體的語料庫研究;(4)社會語言學(xué)、認知語言學(xué)的語料庫運用;(5)語料庫與英語教學(xué);(6)語料庫的建設(shè)、軟件和統(tǒng)計方法。本次年會體現(xiàn)了英語語料庫語言學(xué)領(lǐng)域的最新發(fā)展,本文第一作者作為中國大陸的唯一代表出席了本次會議。我們現(xiàn)擬對大會的主旨報告和小組報告做較為詳細的介紹。
五場主旨報告發(fā)言人中有歷時語言學(xué)和詞匯語義學(xué)的專家,也有心理學(xué)、認知語言學(xué)和社會語言學(xué)方面的學(xué)者,這充分體現(xiàn)了語料庫語言學(xué)的跨學(xué)科發(fā)展態(tài)勢。
Ewa Dabrowska是《認知語言學(xué)》雜志的主編,其發(fā)言題目是“從外化語言到內(nèi)化語言再回到外化語言”(From E-language to I-language—and back)。外化語言是語言群體的文本,內(nèi)化語言是內(nèi)化在人腦中的心理語法。這對概念原先由喬姆斯基(Chomsky 1986)提出,他認為語言的研究對象是內(nèi)化語言。Dabrowska對此持不同看法。她通過對波蘭語的與格和屬格以及英語的“長距離依存疑問句”(questions with long distance dependencies)三個個案的分析,指出基于使用的研究方法在探索語言習(xí)得過程中具有重要作用。她提出,有必要把個人和社會兩個層面結(jié)合起來探索語言系統(tǒng),否則只會盲人摸象,僅見局部而難見整體。
Brian MacWhinney來自美國卡內(nèi)基梅隆大學(xué),其發(fā)言題目是“語料庫語言學(xué)的新天地”(The expanding horizons of corpus linguistics)。他認為,語料庫語言學(xué)的擴展基于以下理論建構(gòu):語言結(jié)構(gòu)的形成要歷經(jīng)八個主要時段,即語言處理、話輪轉(zhuǎn)換、語言活動、語言習(xí)得、語言社會性、語體、歷時性和語言發(fā)生學(xué)。他以口語語料庫TalkBank為佐證,闡述語料庫若能高效捕捉到大量話語的上述八個時段,研究上述過程的相互作用便有可能。要實現(xiàn)該目標,必須開發(fā)出一系列語料庫分析工具,如詞匯分析、定量數(shù)據(jù)分析、自動標注、錯誤分析、對話分析等。
Terttu Nevalainen來自芬蘭赫爾辛基大學(xué),其發(fā)言題目是“語料庫語言學(xué)與語言演變”(Corpus linguistics and language change),主要闡發(fā)兩個問題:一是語言變化的模型,二是歷時語料庫的語類配對。她以主語you的泛指功能、Youwas的使用以及“Therewas+復(fù)數(shù)名詞”結(jié)構(gòu)的歷時變化為例,展示了“赫爾辛基歷時英語語料庫”在研究語言變化中的作用。她強調(diào)了在歷時語料庫建設(shè)中實現(xiàn)不同時代的語類均衡以及文本和語類配對所存在的難度,提出通過定量分析來確定文本語類的方法,著重介紹TVE(Text Variation Explorer)軟件的使用②。該軟件界面能呈現(xiàn)文本的三個語言特征數(shù)據(jù),即類符形符比、單頻詞比例以及平均詞長,并根據(jù)主成分分析法確定文本語類,借此從定量角度部分解決文本歸類的難題。
Anne O’Keeffe來自愛爾蘭利莫瑞克大學(xué),其發(fā)言題目是“語料庫語言學(xué)的應(yīng)用”(The application of corpus linguistics)。她認為,語料庫已經(jīng)應(yīng)用于各個領(lǐng)域和學(xué)科,比如話語分析、文體分析、法律語言學(xué)、語用學(xué)、語音技術(shù)、醫(yī)患溝通、翻譯研究、人工智能等等。同時,她還分析了語料庫的容量、頻率、代表性和理論等四大問題。她特別強調(diào)小型專門語料庫對研究某一語類的作用,她以涉及酒店管理的語料庫CLAS(Cambridge, Limerick and Shannon Corpus)為例說明,小型語料庫有助于研究者更細致地觀察特定語言的使用。在發(fā)言的主要部分,她以“劍橋?qū)W習(xí)者語料庫”(Cambridge Learner Corpus)為例來說明,該語料庫只是代表了非英語母語學(xué)習(xí)者的英語能力情況,并探討了其在“歐洲語言共同參考框架”標準制定中的作用。
John R.Rickford來自美國斯坦福大學(xué),其發(fā)言題目是“關(guān)系連詞的省略和語言及社會約束的獨立性”(Relativizer omission and the independence of linguistic and social constraints)。關(guān)系連詞,即定語從句中wh-和that關(guān)系詞的省略,是近20年來的一個研究熱點。他依憑語料庫探討巴巴多斯、圭亞那、牙買加的英語、美國黑人英語和阿巴拉契亞地區(qū)英語以及4種英國英語方言等9種英語變體中關(guān)系連詞的省略。通過建立邏輯回歸模型對數(shù)據(jù)進行分析,并引入了“階層”和“性別”這兩個社會因素變量,借以觀察社會因素和語言約束之間的交互影響。
各分會場報告的主題也緊扣本年會的6大議題,因篇幅所限,下文將擇要介紹部分重要論文。
語料庫語言學(xué)不僅提供了定量分析的方法,也為重新審視和定義某些傳統(tǒng)語言學(xué)概念提供了可能。英國伯明翰城市大學(xué)的Antoinette Renouf做了題為“英語新詞的新定義”的報告,她把《衛(wèi)報》(1984-2011)文本做成歷時語料庫,觀察頻率劇增的新詞形式及其語義。新詞被定義為:舊詞的激增使用、傳播和新的語義或用法。她以語料庫檢測到的bigsociety、squeezedmiddle等詞在近年的高頻使用和outreach、stakeholder等詞的語域轉(zhuǎn)移來分析各種新詞類別。而挪威經(jīng)濟學(xué)院的Gisle Andersen則采用語料庫對照方法來研究倫敦青年人英語口語中的新詞。比如kinda一詞出現(xiàn)在2008年建成的新語料庫中,而1993年的舊語料庫中此詞未曾出現(xiàn),如此可以跟蹤新詞新語,并通過語境觀察,解釋其產(chǎn)生的原因和機制。
英語構(gòu)式的研究也是熱點之一。德國海德堡大學(xué)的Sandra Mollin研究了英語“成對詞”可逆性的歷時嬗演。“成對詞”是用and把兩個詞連接起來,表示一個完整的概念,比如odds and ends,但一般不可逆向使用為*ends and odds。她從Google Book中提取214個“成對詞”,借助數(shù)學(xué)方法計算其可逆性值,將其制成歷時演變曲線,并對其變化原因進行分析。此外還有論文基于語料庫探討英語情態(tài)構(gòu)式noway的句法語義,或從語料庫提取數(shù)據(jù)來研究Go-and-V構(gòu)式等。對于“強調(diào)詞”(intensifier)的研究也是熱點之一。如從BNC中提取數(shù)據(jù)對quite和rather這對近義“強調(diào)詞”進行多重對應(yīng)分析,或研究當代英語中的dead作為“強調(diào)詞”的分布特征等。句法層面則有探討含有關(guān)系從句的存現(xiàn)句,“后期現(xiàn)代英語”中的現(xiàn)在完成時演化等。
基于語料庫的語言對比及翻譯研究是近些年學(xué)界的另一熱點。法國里爾第三大學(xué)的Maarten Lemmens研究了OK一詞在英語、荷語和瑞典語中的語法化歷程。通過語料庫可以發(fā)現(xiàn),自19世紀以來,OK在英語中經(jīng)歷了三個階段的語法化演進:從插入語到表語形容詞,最后到定語形容詞。而荷語口語語料庫和瑞典語語料庫也顯示,OK作為上述語言中的借詞,也經(jīng)歷了類似演變。Lemmens認為,OK所歷經(jīng)的語法化在評價性短語的演進過程中具有典型性和普遍性。瑞典哥德堡大學(xué)的Karin Aijmer和隆德大學(xué)的Bengt Altenberg通過“英語-瑞典語平行語料庫”,研究了瑞典語中g(shù)arna一詞在英語中的對應(yīng)詞,從而展示了該副詞的多種意義和功能,證明基于語料庫的翻譯研究能促進詞語多義和同義現(xiàn)象的理解。此外,還有論文通過自建英語、法語和荷語的財經(jīng)新聞可比語料庫,研究上述三種語言中概數(shù)表達方式間的異同,研究英語和捷克語平行語料庫中的“become類”系動詞的對應(yīng)翻譯,對比加拿大的英語和法語新聞中的Nationalism和Canadian兩詞的語義韻等等。
英語變體研究也是學(xué)界近年的關(guān)注點之一,特別是“國際英語語料庫”(ICE)各分庫的建成使得英語變體的對比研究成為可能,由此,“語料庫和世界英語”也成為大會的重要議題。共有16篇論文涉及到各種新英語變體,如印度英語、菲律賓英語、新加坡英語和香港英語等。澳大利亞新南威爾士大學(xué)的Peter Collins以“菲律賓-布朗語料庫”(Phil-Brown,即參照布朗語料庫設(shè)計的菲律賓英語語料庫)和“國際英語語料庫菲律賓分庫”(ICE-Phil)為基礎(chǔ),研究了wh-和that從句在1960至1990三十年間的頻率變化,得出菲律賓英語有美國化和口語化發(fā)展趨勢的結(jié)論。芬蘭坦佩雷大學(xué)Juhani Klemola研究了新加坡、印度和菲律賓英語中表義務(wù)和必要意義的情態(tài)動詞,他們借用ICE分庫以及“圣芭芭拉美國英語口語語料庫”研究了should、must、haveto、havegotto以及supposedto的頻率和語義變化。結(jié)果發(fā)現(xiàn),英國和美國英語中上述情態(tài)動詞使用頻率明顯減少,而亞洲英語變體中should和must的使用頻率仍很高。作者認為這和亞洲社會強調(diào)權(quán)威和責(zé)任不無關(guān)系。新加坡國立大學(xué)的Peter Tan介紹了新加坡歷時語料庫的建設(shè)情況,并基于此語料庫對1950至1960年代新加坡英語中的詞匯借用和結(jié)構(gòu)本土化進行了考察。此外,還有探討世界英語中的進行時態(tài),世界英語中的話語標記詞like的遞演等等。
社會語言學(xué)領(lǐng)域采用語料庫方法的研究也日漸增多。香港科技大學(xué)的Lynne Flowerdew討論了語料庫語言學(xué)、社會語言學(xué)和話語分析相結(jié)合的理論問題。社會語言學(xué)方面的語料庫分析通常采用變異研究和互動研究兩種渠道。變異研究對某一群體的語言使用進行定量分析,其變量包括年齡、性別和社會階層等。而互動研究則側(cè)重定性方法,對言語行為的交際互動進行分析。Flowerdew使用語料庫研究了社會語言學(xué)中的互動范式,探討了從語料庫數(shù)據(jù)中發(fā)現(xiàn)程式化言語行為以及對話語進行解讀的可能性。此外,還有使用ICE語料庫研究女性使用“強調(diào)詞”的情況,探索表語從句連接詞that省略的社會語言學(xué)因素等等。
語料庫作為認知語言學(xué)研究的一種重要方法,近些年受到較多重視。來自荷蘭阿姆斯特丹自由大學(xué)的Tina Krennmayr介紹了該大學(xué)開發(fā)的“隱喻語料庫在線”③(Metaphor Corpus Online)。該語料庫從BNC中分離出新聞、小說、學(xué)術(shù)文本和會話等四種語類,然后對其中19萬字的文本進行了隱喻標注,可用于隱喻研究。她依托該隱喻語料庫探尋了不同語體中隱喻的特點,比如新聞?wù)Z體中動詞隱喻的高頻性。德國弗萊堡大學(xué)的Martin Hipert從“美國歷時英語語料庫”(COHA)中提取了although、though、if和while所構(gòu)成的4種讓步構(gòu)式,研究其在過去150年里的歷時演變,發(fā)現(xiàn)它們整體呈現(xiàn)出較大的差異性,從而對Traugott提出的抽象“宏觀結(jié)構(gòu)”假設(shè)提出質(zhì)疑。該研究的亮點之一是借助“度量的多維標定法”對數(shù)據(jù)進行量化分析,并借用Googlevis工具來觀察這4種讓步構(gòu)式的4條動態(tài)曲線,以此窺探其歷時嬗演。隆德大學(xué)的Dylan Glynn以Langacker的“認知語法”為理論框架,以自建語料庫為數(shù)據(jù)來源,通過多因子語料庫驅(qū)動方法研究英語的“認識立場構(gòu)式”(epistemic stance construction)。
語料庫在英語教學(xué)中的應(yīng)用,尤其是學(xué)習(xí)者語料庫的建設(shè),也是近些年的關(guān)注點之一。但和書面語相比,英語作為口語中介語的研究則相對滯后,本次大會非常重視口語中介語的研究。法語魯汶大學(xué)的Ga?tanelle Gilquin對學(xué)習(xí)者口語和書面語英語中的動詞短語進行了對比研究,她所使用的語料庫分別為魯汶大學(xué)的“國際學(xué)習(xí)者英語語料庫”和“魯汶國際英語學(xué)習(xí)者口語語料庫”,前者為書面語,后者為口語。數(shù)據(jù)表明,學(xué)習(xí)者對up和down構(gòu)成的動詞短語使用與母語者的使用相比明顯偏少,在口語中使用又比書面語偏少,這與母語者的使用恰恰相反。作者認為,這和學(xué)習(xí)者缺乏語體意識有所關(guān)聯(lián)。德國吉森大學(xué)的Sandra Gotz則基于語料庫對以英語為母語、二語和外語的三種人群口語中的填充性停頓進行了對比研究。其聚焦點是er、erm、uh和uhm四個停頓詞。結(jié)果發(fā)現(xiàn),填充性停頓在數(shù)量上形成斜坡,第一人群最少,第三人群最多。三個群體使用停頓目的有明顯差異,比如母語者多用它來強調(diào)重要信息,而外語者則多用其充當短語內(nèi)的詞匯空缺。此外,還有論文涉及異步聊天(asynchronous chats)語料庫的學(xué)習(xí)者英語特點,二語習(xí)得中的多詞單位等等。
美國楊伯翰大學(xué)的Mark Davies探討了含有1550萬詞的Google Books作為歷時語料庫(1810-2010)的可行性。他設(shè)計了Google Books的語料庫界面,使之便于檢索。Davies以sublime、steamship和teenager三詞為例,發(fā)現(xiàn)它們在Google Books中兩百年間的頻率變化曲線與COHA中的相似度很高,可見其作為超大型歷時語料庫具備一定的可行性。美國加州大學(xué)圣芭芭拉分校的Stefan Th.Gries提出一種新的計算詞語搭配力的方法。以往計算搭配強度的統(tǒng)計方法,如互信息、T值、對數(shù)似然值等方法,僅能反映搭配中詞1和詞2之間的相互聯(lián)系,但Stubbs(2001:29)的研究表明,搭配具有方向性,比如在bonsaitree搭配中,bonsai之后加tree的可能性要比tree之前加bonsai的可能性大得多。基于此,Gries經(jīng)研究發(fā)現(xiàn),“搭配并非一定是雙向性”。他還進一步提出測試搭配方向性的統(tǒng)計方法ΔP。其計算公式如下:
ΔP2|1=p(word2|word1=present)-p(word2|word1=absent)
ΔP1|2=p(word1|word2=present)-p(word1|word2=absent)
ΔP若大于零,則說明兩詞之間是正聯(lián)系;ΔP若小于零,則說明兩詞之間是負聯(lián)系,數(shù)值能反映出搭配的方向性。該實證研究具有可操作性,為搭配研究提供了嶄新思路。此外,還有研究探討“伯明翰博客語料庫”的語用信息標注、面向語言地圖項目的語料庫、各種語料庫工具之間的互操作性、用統(tǒng)計手段對古英語文本進行分類等。
綜上所述,我們可以看出ICAME 33展示了英語語料庫語言學(xué)的最新發(fā)展動態(tài)和幾大熱點問題:(1)歷時語料庫跨度上至古英語、下至21世紀英語,這使得語言演變研究成為焦點,這也是ICAME 32的熱點(楊素香 2012);(2)各種英語變體語料庫的建成,使得英語變體對比研究成為熱點,這一點在今年大會非常凸顯。經(jīng)簡單統(tǒng)計,使用ICE可比語料庫的論文數(shù)高達23篇;(3)通過定量方法實現(xiàn)文本和語類的自動配對,這在去年大會中未曾提及,而今年則成為焦點話題之一;(4)隨著英語成為全球通用語,學(xué)習(xí)者語料庫的建設(shè)日顯重要,這也是中國學(xué)者大有可為的領(lǐng)域。
歷時五天的大會最后補選了Hilde Hasselgard、John Kirk、Michaela Mahlberg和Ute Romer等學(xué)者為ICAME執(zhí)行委員會的新成員。大會還決定第34屆ICAME年會將于明年5月在西班牙圣地亞哥·德孔波斯代拉大學(xué)舉行。所確定的年會主題是:“前進中的英語語料庫語言學(xué):應(yīng)用及其意義”(English corpus linguistics on the move: Applications and implications)。我們有理由相信,作為語言研究的重要方法和新興領(lǐng)域,語料庫語言學(xué)將在未來的英語教學(xué)與研究中發(fā)揮越來越大的作用。
附注:
① ICAME成立于1977年,是歐美語料庫語言學(xué)的開拓者,其發(fā)起人有Geoffrey Leech、Stig Johansson等著名學(xué)者,其主要研究對象是英語語料庫語言學(xué),目前已成為語料庫語言學(xué)的國際性權(quán)威學(xué)術(shù)組織。自1979年起,該協(xié)會每年輪流在世界各大學(xué)召開年會交流研究成果,并辦有協(xié)會期刊ICAMEJournal,詳情可見網(wǎng)站介紹:http://icame.uib.no。關(guān)于該協(xié)會的漢譯名,何安平(2001)首次簡介時將其意譯為“國際語料庫語言學(xué)協(xié)會”,并在2003年和2005年綜述年會時沿用該譯名。楊素香(2012)綜述2011年年會時則按字面將其譯為“國際現(xiàn)代及中古英語計算機檔案中心”。我們認為,宜將這一協(xié)會的名稱譯為“現(xiàn)代和中古英語語料庫國際研究協(xié)會”,但鑒于何安平的譯名在中國學(xué)界已有影響,所以本文不另譯新名。
② 該軟件下載網(wǎng)址為:http://www.uta.fi/sis/tauchi/virg/projects/dammoc/tve.html。
③ 該文本可在“牛津文本檔案庫”下載,網(wǎng)址為:http://ota.ahds.ac.uk/catalogue/index.html。
Chomsky, N.1986.KnowledgeofLanguage[M].New York:Praeger.
Stubbs, M.2001.WordsandPhrases:CorpusStudiesofLexicalSemantics[M].Oxford:Blackwell.
何安平.2001.談?wù)Z料庫語言學(xué)應(yīng)用的新發(fā)展——ICAME 2000年悉尼國際語料庫語言學(xué)研討會綜述[J].外國語(2):75-78.
楊素香.2012.語料庫語言學(xué)的傳統(tǒng)與趨勢——ICAME 32國際會議研究熱點分析[J].外語教學(xué)與研究(3):460-466.