国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

網(wǎng)絡語料庫:英語研究的方便之門
——《運用網(wǎng)絡語料庫探索英語》述評

2011-04-03 03:49:15
當代外語研究 2011年11期
關(guān)鍵詞:語言學語料庫話語

邵 斌

(浙江大學/浙江財經(jīng)學院,杭州,310018)

1. 引言

語料庫語言學研究業(yè)已滲透到語言研究和語言教學的方方面面。語料庫語言學的“研究話題從詞匯、語法和詞典學擴展到語言教學、二語習得、翻譯、自然語言處理、話語分析、認知語言乃至抽象的理論語言學問題探索等廣泛的領域”(甄鳳超2010:36)。另外,由于出現(xiàn)了許多網(wǎng)絡語料庫(Online Corpora),世界各地的語言研究者和學習者可以通過在線使用這些網(wǎng)絡語料庫開展各種形式的語言研究。

溫蒂·安德森(Wendy Anderson)和約翰·考伯特(John Corbett)撰寫的《運用網(wǎng)絡語料庫探索英語》一書于2009年由帕爾格雷夫·麥克米倫出版公司(Palgrave Macmillan)出版,是一本講解網(wǎng)絡語料庫使用的入門教材??疾厥翘K格蘭格拉斯哥大學的應用語言學教授,主持建設了“蘇格蘭英語語料庫”(Scottish Corpus of Texts & Speech,簡稱SCOTS);另一作者安德森為該校講師,是語料庫中心的研究人員。該書詳細展示了如何使用網(wǎng)絡語料庫來研究英語,涉及其詞匯、語法、話語、語音、語境等各個層面。該書在語言上淺顯易懂,以解決研究問題為目的,是網(wǎng)絡語料庫應用方面的一本入門好書。下面簡單介紹其主要內(nèi)容并予以評述。

2. 內(nèi)容簡介

第一章總體介紹了網(wǎng)絡語料庫。本書開宗明義提出:過去四十年來英語研究中最激動人心的事件便是大量的電子文本(即語料庫)得以在計算機里存儲并能通過軟件快速處理,語料庫的利用改變了語言研究的工作方式。接下來作者簡單介紹了語料庫的概念和性質(zhì),如代表性、規(guī)模、種類、標注和發(fā)展史。

之后,作者又介紹了五個常用的網(wǎng)絡語料庫,即英語國家語料庫(British National Corpus,簡稱BNC)、當代美國英語語料庫(Corpus of Contemporary American English,簡稱COCA)、時代周刊語料庫(TIME Corpus)、密歇根大學英語學術(shù)口語語料庫(Michigan Corpus of Academic Spoken English,簡稱MICASE)和“蘇格蘭英語語料庫”。其中第二、三個語料庫都由美國楊伯翰大學Mark Davies教授開發(fā)。此外,他還開發(fā)了BNC語料庫對用戶友好的界面,使之更適合語言研究。本書的數(shù)據(jù)主要基于上述這些網(wǎng)絡語料庫。

第二章談如何解讀語料庫數(shù)據(jù)。本章目標有四:一是比較定量分析和定性分析的相對優(yōu)勢,二是解釋相關(guān)的統(tǒng)計術(shù)語,三是介紹簡單的統(tǒng)計工具,四是分析利用統(tǒng)計手段來進行文本分析的優(yōu)勢和劣勢。作者認為定量分析和定性分析分屬語言研究的兩大陣營:語言的科學性和語言的人文性。前者注重語言經(jīng)驗證據(jù),強調(diào)客觀分析;后者看重個人洞察力和個人解讀。與常人把語料庫研究歸于定量的科學研究不同,本書作者認為,“數(shù)據(jù)總需要分析”,“優(yōu)秀的語料庫語言學者同時需要能駕馭定性分析和定量分析”。這也是很多語料庫語言學家的共同觀點,比如Leech(2004:62)就認為語料庫語言學絕不僅僅是收集資料和描述語料,而應包括三個不同層面的研究:語料收集、語言描述和理論構(gòu)建。定性分析是理論建構(gòu)層面上必不可少的一個部分。接下來作者談了語料庫的“代表性”問題,認為所有的統(tǒng)計分析都要基于“樣本代表群體”這一原則。他們細致分析了幾個重要的統(tǒng)計概念:平均值(mean)、標準差(standard deviation)、頻數(shù)(frequency)、頻數(shù)標準化(normalization of frequency)、互信息(Mutual Information)和關(guān)鍵詞(key words)。此外還簡單介紹了一些語料庫工具軟件,如WordSmith、Micro-OCP以及TAPoR等等。這一章的概述有詳有略,既介紹了必要的統(tǒng)計概念,又點到為止,不至于讓讀者感到枯燥乏味或無所適從。

第三章介紹如何使用網(wǎng)絡語料庫開展詞匯研究。作者認為與語言其他層面相比,詞匯研究最適合使用語料庫方法。一是詞的概念較易把握,二是語料庫無論是否經(jīng)過標注都可用于詞匯研究。作者簡單介紹詞形(word form)和詞目(lemma)的區(qū)別后,展示了如何通過語料庫索引行(concordance)獲取詞匯信息以及如何分析數(shù)據(jù)。之后作者把詞置于詞匯語法語境(lexico-grammatical environment)中進行研究,討論了語料庫中的固定表達、習語、搭配和類聯(lián)接。例如,通過分析習語“What is sauce for the goose is sauce for the gander”的變體,展示了習語在具體語境中的變化;通過分析tangible和palpable這對近義詞的搭配來探索其語義差異;通過分析“a matter of”的語法結(jié)構(gòu)來探索類聯(lián)接。作者還運用語料庫進行了詞匯的語義韻研究、詞匯和文體以及詞匯和語體之間關(guān)系的研究。

第四章介紹如何使用網(wǎng)絡語料庫開展語法研究。作者首先按照傳統(tǒng)語法,把詞類分成實詞和虛詞,然后通過語料庫來分別研究實詞和虛詞。之后研究層面由詞匯擴大到短語,如名詞短語、介詞短語、動詞短語、形容詞短語和副詞短語。再由短語擴大到分句,主要探討了四類不同的動詞句式。語料庫揭示了一些有趣的發(fā)現(xiàn),如有些不及物動詞可加賓語(“He sneezed himself back to life”中的sneeze一詞即屬此類用法),讓讀者耳目一新。作者還探討了口語和書面語語法的異同,如口語中虛化動詞(delexicalized verb)的使用。此外還探討了正式和非正式的被動句(前者為be-passives,后者為get-passive)之間的微妙差異。

第五章介紹如何使用網(wǎng)絡語料庫研究話語。作者將“話語”限定為“句子層面之上的語言組織層面”。作者指出應用語料庫研究話語尚處于初始階段,并提出了兩種研究方法選擇,一種是下載語料庫文本,然后進行“話語標注”(discourse tagging),另一種是以語言表面特征(比如詞匯)為起點進行話語探索,而第二種較為可行。比如可以通過口語語料庫檢索ah和erm,從而分析其在話語中的不同功能。接下來作者把話語分為口語話語和書面語篇,并分別加以討論??谡Z話語中討論了“相鄰對”(adjacency pairs)和語用意義,書面語篇中討論了“銜接手段”,特別是連詞銜接和實詞銜接,最后還討論了基于語料庫的互文性研究??傊?這一章節(jié)提供了與傳統(tǒng)話語研究方法形成互補的新方法,頗給人啟發(fā)。

第六章介紹如何使用網(wǎng)絡語料庫研究語音。作者先介紹了帶有語音標注的網(wǎng)絡語料庫,如除了上文介紹過的“密歇根大學英語學術(shù)口語語料庫”和“蘇格蘭英語語料庫”外,還有“英語口音語料庫”(Speech Accent Archive)、“英國學術(shù)口語語料庫”(The British Academic Spoken English corpus,簡稱BASE)、“作為第二語言應用的英語訪談語料庫”(English Language Interview Corpus as a Second-Language Application,簡稱ELISA)等。接下來作者通過語料庫分析了兩個輔音個案,一個是詞尾和輔音前的/r/的發(fā)音的地區(qū)差異,另一個是在蘇格蘭英語中l(wèi)och等詞中的/x/音的變化。在元音部分,作者利用“英語口音語料庫”和“蘇格蘭英語語料庫”探索了不同地區(qū)的元音發(fā)音,如單元音、雙元音、音長和語調(diào)等方面的差異。

第七章探討了語料庫文本的語境化。作者首先區(qū)分了“上下文”(co-text)和“語境”(context),前者指的是被考察的某語言要素周圍的語言材料,后者指影響語言使用的所有環(huán)境特征的總和,范圍要大得多。作者指出語料庫中的“元數(shù)據(jù)”(metadata)對語境研究至關(guān)重要。元數(shù)據(jù)以標簽的形式存在,用于標識所有語料的信息,所以被稱為“數(shù)據(jù)的數(shù)據(jù)”,如果把語料庫比作“文本博物館”,那么元數(shù)據(jù)則像是提供背景知識的標牌,其重要性由此可知。這一章的第二部分關(guān)注文本語境的具體方面,比如基于語言使用者的語言差異,如其年齡、地區(qū)、職業(yè)對其語言的影響,以及基于語域的語言變體,如因語場、語旨、語式不同而導致的語言使用的差異。

第八章為結(jié)論部分,作者對網(wǎng)絡語料庫在英語教學研究中的運用做了總結(jié)。作者認為語料庫中大量的真實文本為英語教師提供了豐富的教學資源,無論是把英語作為母語、二語還是外語的語言教學者都能從中獲益。特別是對把英語作為外語的教師而言,語料庫的應用更為廣泛。語料庫可以作為一種課堂組織的模式而存在,教師分配一個交際任務給學生,學生在完任務的成過程中,可以和語料庫數(shù)據(jù)相對照,然后尋找差異,從語料庫中習得語言知識,這就是以過程為導向的課堂,和傳統(tǒng)的以結(jié)果為導向的課堂截然不同,激發(fā)了學生學習的積極性。作者還進一步總結(jié)了基于語言使用的語料庫語言學家和強調(diào)內(nèi)省的理論語言學家的區(qū)別,前者關(guān)注語言使用,而后者關(guān)注語言能力,前者會問“這(語言現(xiàn)象)很有意思,但它是真實的嗎?”后者會問“這是真實的,可這有意思嗎?”作者指出,理想的語言學家是內(nèi)省式和語料庫語言學家的結(jié)合體。最后作者還展望了語料庫語言學的未來,認為未來英語語料庫可能會朝著以下的方向發(fā)展:大型的國家英語語料庫、小型的特殊英語語料庫、非標準英語語料庫、世界英語語料庫、平行語料庫、歷時語料庫和多媒體語料庫。

3. 評述

與目前常見的語料庫語言學著作相比,本書頗具特色,如所闡釋的話題較新穎,內(nèi)容實用、可操作性強等等。

第一,話題新穎。涉及語料庫研究的書籍很多,但筆者在亞馬遜網(wǎng)上書店中以“online corpus(corpora)”作為主題詞進行搜索,只搜索到該書,可見就“網(wǎng)絡語料庫”話題進行較為深入細致而又廣泛的研究,在西方語言學界也尚不多見。此前語言研究所基于的語料庫,如BROWN、LOB、ICE、Bank of English等,并不免費向公眾開放,使得這些研究頗具“自說自話”之嫌。而網(wǎng)絡語料庫則彌補這一不足,書中著重推薦了5個網(wǎng)絡語料庫,在附錄中還介紹了另外18個網(wǎng)絡語料庫,為語言研究者打開了研究英語語言的“方便之門”。此外,以往基于語料庫的研究大多局限詞匯和語法層面,本書則把語料庫的應用范圍擴大到話語、語境等較高的語言層面,并且也涉及語音和口音等以往較少研究的層面,頗有新意。

第二,讀者友好。本書并不過多探討語料庫語言學的理論問題,而是借助網(wǎng)絡語料庫對英語語言開展了多個層面的分析。本書以解決實際問題為導向,在內(nèi)容上以實用為目的,在寫法上注重讀者友好。作者在每一章節(jié)的開頭都提出一系列問題,然后引領讀者通過語料庫去解決問題。在每一小節(jié)中,作者還設計了具體的操作任務,并置以方框內(nèi)單獨列出,然后指引著讀者來完成操作,達到解決問題的目的。另外,作者在借助網(wǎng)絡語料庫分析每種語言現(xiàn)象時,如搭配和類聯(lián)接,會提綱挈領地介紹該研究話題的定義和來龍去脈,幫助讀者理解研究對象。因此,無論是內(nèi)容還是寫法,作者都注重讀者友好。

第三,可操作性強。作者列舉的每個任務、每個例證都是可以通過網(wǎng)絡實現(xiàn)的。按照作者提供的網(wǎng)址和操作步驟,讀者能按圖索驥,尋找到類似的答案,因此本書的任務可操作性非常強,具有可重復性,這也有別于很多基于內(nèi)部使用的語料庫或自建語料庫的研究。正因其可操作性強,讀者會感覺到語料庫是一種非常有用的手段,并且能夠掌握這種研究手段。這給語料庫初學者帶來信心,激發(fā)了他們探索語言的好奇心,增強了他們語言學習的興趣。

第四,立論公正。本書作者雖然強調(diào)語料庫的價值,但也同時會不時指出語料庫的不足之處。比如談到語料庫的代表性問題,作者指出“語料庫只能肯定某種結(jié)構(gòu)或用法的存在,也就是說,它無法告訴我們前人沒說過或沒寫過的內(nèi)容”。作者認為一個優(yōu)秀的語料庫語言學家應該將定量分析與定性分析結(jié)合起來,而且理想的語言學家應該是善于內(nèi)省的語言學家(以喬姆斯基為代表)和語料庫語言學家的結(jié)合體??梢娮髡邚娬{(diào)語料庫研究的重要性,但對于其他語言研究方法絕不忽視和排斥,不過分夸大語料庫的作用,體現(xiàn)了作者兼收并蓄的思想。

當然,本書也有一些不足之處。由于兩位作者都是“蘇格蘭英語語料庫”的設計者,書中的很多例子都來源于該語料庫,特別是涉及語音及語境研究的時候,而一般的以英語為外語的讀者更關(guān)心的無疑是英國英語和美國英語的一些特征,而本書在這方面的探索則顯得不夠充分。此外,有些探索還不夠深入,比如用語料庫探索語法這一章節(jié),作者就沒有談到基于語料庫的語法化研究。

綜上所述,本書是一本較為理想的網(wǎng)絡語料庫入門著作。當然,如果學習者對語料庫語言學想有更系統(tǒng)的了解,在學完本書后,還需要選擇幾本全面介紹語料庫語言學的著作進行研讀。本書作者在每個章節(jié)后都提供了進一步閱讀的書目,我們可以通過網(wǎng)絡語料庫這扇“方便之門”,繼而走進語言研究的殿堂。

Leech, G. 2004. Recent grammatical change in English: Data, description, theory [A]. In K. Aijmer & B. Altenberg (eds).AdvancesinCorpusLinguistics[C]. Amsterdam: Rodopi. 61-81.

Liu Dilin. 2010. Is it a chief, main, major, primary, or principal concern? A corpus-based behavioral profile study of the near-synonyms [J].InternationalJournalofCorpusLinguistics15 (1): 56-87

甄鳳超.2010.語料庫語言學在中國的成長與發(fā)展[J].當代外語研究(3):36-41.

猜你喜歡
語言學語料庫話語
現(xiàn)代美術(shù)批評及其話語表達
河北畫報(2021年2期)2021-05-25 02:07:18
《語料庫翻譯文體學》評介
把課文的優(yōu)美表達存進語料庫
認知語言學與對外漢語教學
基于JAVAEE的維吾爾中介語語料庫開發(fā)與實現(xiàn)
語言與翻譯(2015年4期)2015-07-18 11:07:45
話語新聞
浙江人大(2014年6期)2014-03-20 16:20:34
話語新聞
浙江人大(2014年5期)2014-03-20 16:20:20
“那什么”的話語功能
當代修辭學(2014年1期)2014-01-21 02:30:20
語言學與修辭學:關(guān)聯(lián)與互動
當代修辭學(2011年2期)2011-01-23 06:39:12
語料庫語言學未來發(fā)展趨勢
桦甸市| 云梦县| 贺州市| 湖北省| 深圳市| 南安市| 吴堡县| 乌拉特后旗| 乌鲁木齐市| 罗田县| 田阳县| 永昌县| 清原| 鞍山市| 双辽市| 萝北县| 齐河县| 韶山市| 绵竹市| 平果县| 濮阳市| 古田县| 金坛市| 娄烦县| 嘉禾县| 乌兰察布市| 清河县| 襄樊市| 中超| 启东市| 荥阳市| 汉阴县| 昆山市| 元谋县| 永吉县| 增城市| 韶山市| 无为县| 翁牛特旗| 保德县| 府谷县|