王敏 李麗霞
摘 要: 近年來,專門用途語料庫的研究與建設(shè)逐漸成為語料庫語言學(xué)研究領(lǐng)域的一大熱點(diǎn),眾多專門用途語料庫都在紛紛籌建之中,為專門用途英語的發(fā)展及教學(xué)研究提供了幫助。然而,作為專門用途英語教學(xué)中的重要部分,農(nóng)業(yè)英語教學(xué)卻缺乏對應(yīng)的語料庫建設(shè)和研究。本文在簡述建設(shè)FAO農(nóng)業(yè)英語語料庫的背景和意義的基礎(chǔ)上,探討了FAO農(nóng)業(yè)英語語料庫的創(chuàng)建思路和技術(shù)支撐,指出了其建設(shè)的可行性;并總結(jié)了其在教學(xué)中的應(yīng)用價(jià)值及其建設(shè)的必要性。
關(guān)鍵詞: 語料庫 FAO農(nóng)業(yè)英語語料庫 建設(shè) 應(yīng)用
1.概述
1.1語料庫和語料庫語言學(xué)。
語料庫(corpus,復(fù)數(shù)為corpora)一詞來源于拉丁語,本意為body。它是一個按照一定采樣標(biāo)準(zhǔn)采集而來的、能夠代表一種語言或者某語言的一種變體或文類的電子文本集。語料庫是建立在計(jì)算機(jī)上的,必須以電子計(jì)算機(jī)為載體存放語料,且這些語料均在實(shí)際使用中出現(xiàn)過,因此可以真實(shí)地反映語言現(xiàn)象。語料庫使大規(guī)模真實(shí)文本的自動處理得以實(shí)現(xiàn),可以為語言研究提供更加豐富、更加詳盡的語料,同時為語言研究提供另外一種客觀的方法,即基于實(shí)驗(yàn)和統(tǒng)計(jì)的方法(譚鍵,2005)。它改變了傳統(tǒng)的語言研究方法,有助于克服語言研究過程中的主觀性和片面性。此外,語料庫對于詞典編纂、字頻統(tǒng)計(jì)、詞頻統(tǒng)計(jì)、語法研究等具有巨大的推動作用。
語料庫語言學(xué)(Corpus linguistics)是在語料庫的基礎(chǔ)上對語言進(jìn)行分析和研究的科學(xué)(許家金,2003;衛(wèi)乃興,2009)。傳統(tǒng)的語言學(xué)家收集資料的方法基本為手工收集,進(jìn)而在此基礎(chǔ)上進(jìn)行分析與研究,最后得出結(jié)論。手工收集到的資料有限且主觀性較強(qiáng),具有很大局限性,而語料庫語言學(xué)使大量地、詳盡地收集語料成為可能,可以使我們更為深刻、更為全面地研究語言現(xiàn)象。總之,語料庫語言學(xué)的產(chǎn)生,將改變語言研究的觀念,使語言研究日趨深入、精細(xì)。
1.2專門用途英語語料庫。
在語料庫語言學(xué)中,專門用途語料庫,是指出于某種特定研究目的需要,只收集某特定領(lǐng)域的語料樣本建成的語料庫(梁茂成,2010)。隨著語料庫在各領(lǐng)域研究的深入,通用語料庫,盡管容量巨大,還是無法滿足各專業(yè)領(lǐng)域研究的需要,如語言習(xí)得、語用語體、法律語言學(xué)研究等,這就要求研究者建立自己的專用語料庫,以進(jìn)行某個特殊領(lǐng)域的研究。在大型通用語料庫不斷擴(kuò)建的同時,研制更多的小型專用語料庫將是一大趨勢(何中清,2011)。隨著語料庫語言學(xué)的發(fā)展和完善,語料資源將會越來越豐富,通用語料庫的容量也會越來越大。此外,隨著語料庫研究在各個領(lǐng)域的縱深發(fā)展,小型的專門用途英語語料庫必然會成為一種發(fā)展趨勢,研究的越深入、專業(yè)性越強(qiáng),專門用途英語語料庫越必不可少。
近年來,專門用途語料庫發(fā)展迅速,許多與專業(yè)相結(jié)合的專用英語語料庫紛紛建設(shè)起來(黃大網(wǎng),秦羿,許賽穎,2010),然而,作為專門用途英語教學(xué)的重要組成部分,農(nóng)業(yè)英語教學(xué)仍然沒有得到足夠重視,缺乏對應(yīng)的語料庫建設(shè)和研究,不利于農(nóng)業(yè)英語教學(xué)的發(fā)展與進(jìn)步。目前,國內(nèi)已經(jīng)有建成的或建設(shè)中的眾多與專業(yè)英語相結(jié)合的專門用途英語語料庫,如航空航天英語語料庫、醫(yī)學(xué)英語語料庫、學(xué)術(shù)英語語料庫、商務(wù)英語語料庫(梁燕,馮友程,良坤,2004;劉滿堂,2004),這些語料庫的建立及其研究成果,推動了專門用途英語教學(xué)(English for specific purpose,ESP)的發(fā)展,對提高國內(nèi)專門英語教學(xué)水平有重要意義,同時為我們進(jìn)一步完善建成農(nóng)業(yè)英語語料庫提供了寶貴借鑒。目前,國家農(nóng)林院校擁有農(nóng)學(xué)、林學(xué)、植物保護(hù)、動物科學(xué)和生命科學(xué)等優(yōu)勢學(xué)科和專業(yè),如果這一優(yōu)勢能夠和專門用途英語教學(xué)相結(jié)合,建立相應(yīng)的農(nóng)業(yè)英語語料庫,則將大大推動農(nóng)業(yè)英語教學(xué),尤其是詞匯教學(xué),將邁向新的臺階,對解決目前農(nóng)業(yè)院校外語教學(xué)中存在的諸多問題具有重要意義。同時,農(nóng)業(yè)語料庫的建成,也將豐富和完善語料庫的類型,推動語料庫語言學(xué)在農(nóng)業(yè)詞匯、短語及語篇等方面的發(fā)展。
2.研究意義
本研究力圖建設(shè)FAO農(nóng)業(yè)英語語料庫,作為農(nóng)業(yè)英語語料庫下的一個子庫,并在此基礎(chǔ)之上進(jìn)行農(nóng)業(yè)英語語言特點(diǎn)方面的研究,這一研究將有助于填補(bǔ)學(xué)科專業(yè)語料庫的空白,豐富專門用途語料庫的研究內(nèi)容,提高農(nóng)林院校專業(yè)英語的教學(xué)水平,具有重要的現(xiàn)實(shí)意義和應(yīng)用價(jià)值;為農(nóng)業(yè)專業(yè)英語教學(xué),特別是詞匯教學(xué),提供新途徑,對探索圍繞某一主題、以語義聯(lián)想為中心的農(nóng)業(yè)英語詞匯學(xué)習(xí)有一定的幫助作用,對提高教學(xué)和學(xué)習(xí)的效率有重要意義;通過詞匯范疇的分析,讓專業(yè)學(xué)生及時把握農(nóng)業(yè)熱點(diǎn)領(lǐng)域,同時獲得更多的擴(kuò)展學(xué)習(xí)資源;探索解決目前農(nóng)業(yè)專業(yè)英語教學(xué)中存在的問題,推廣語料庫驅(qū)動型教學(xué)模式,順應(yīng)專門用途英語(ESP)教學(xué)改革的熱潮,對提高農(nóng)林院校農(nóng)業(yè)專業(yè)英語教學(xué)水平具有實(shí)用價(jià)值;通過對專業(yè)詞匯的準(zhǔn)確把握,提高各專業(yè)教師和學(xué)生的論文寫作質(zhì)量,進(jìn)一步保障其在SCI等國際期刊中論文發(fā)表的成功率,提高學(xué)校的國際影響力,與建設(shè)世界一流農(nóng)業(yè)大學(xué)的目標(biāo)相呼應(yīng);有利于提高農(nóng)林院校教師和學(xué)生的專業(yè)農(nóng)業(yè)英語翻譯水平,對服務(wù)于歷年一次的國際農(nóng)業(yè)高新技術(shù)博覽會有重要意義,培養(yǎng)農(nóng)業(yè)英語高水平人才,加快與世界農(nóng)業(yè)科技接軌的步伐。
3.研究設(shè)計(jì)
3.1研究對象。
以聯(lián)合國糧食及農(nóng)業(yè)組織(Food and Agriculture Organization of the United Nations)官方網(wǎng)站上的涉農(nóng)新聞報(bào)道為文本來源建設(shè)FAO農(nóng)業(yè)英語語料庫,文本選自于2008年至2013年的農(nóng)業(yè)新聞報(bào)道,涉及農(nóng)業(yè)、畜牧業(yè)、生物科技、食品安全等18個農(nóng)業(yè)新聞主題,語料庫總量為234696個形符,共423篇。
聯(lián)合國糧食及農(nóng)業(yè)組織是聯(lián)合國系統(tǒng)內(nèi)最早的常設(shè)專門機(jī)構(gòu),其宗旨是提高人民的營養(yǎng)水平和生活標(biāo)準(zhǔn),改進(jìn)農(nóng)產(chǎn)品的生產(chǎn)和分配,改善農(nóng)村和農(nóng)民的經(jīng)濟(jì)狀況,促進(jìn)世界經(jīng)濟(jì)的發(fā)展并保證人類免于饑餓。其官方網(wǎng)站的新聞報(bào)道涉及面廣,緊扣其工作重心,主要向全世界人民介紹當(dāng)下的農(nóng)業(yè)熱點(diǎn)和糧食問題、對于向欠發(fā)達(dá)地區(qū)推廣農(nóng)業(yè)新技術(shù)和解決當(dāng)?shù)氐募Z食短缺問題起到重要的推動作用,如政府有關(guān)農(nóng)業(yè)、農(nóng)村、農(nóng)民方面的政策;農(nóng)業(yè)生產(chǎn)實(shí)踐中的新發(fā)展、新發(fā)明、新成果;農(nóng)業(yè)科研方面的新問題、新進(jìn)展及新經(jīng)驗(yàn);農(nóng)業(yè)科技戰(zhàn)線上杰出的人物、事跡等;農(nóng)業(yè)新技術(shù)推廣的新辦法、新途徑、效果及社會效益等。
3.2技術(shù)支撐。
3.2.1清潔工具。借助PowerGrep等文本編輯工具中的查找功能,清潔收集到的語料,處理全角標(biāo)點(diǎn)、全角字母和數(shù)字、全角空格、跳格、行尾和文中多余空格、多余空行等問題,保證語料文本由清潔文本構(gòu)成,保證自動詞性賦碼的準(zhǔn)確性,進(jìn)而保證檢索結(jié)果的準(zhǔn)確性(梁茂成,李文中,許家金,2010)。以往的MicrosoftWord雖然也能清潔文本,但是只能處理單個文本,PowerGrep既可以處理單個文本,又可以進(jìn)行批量處理。
3.2.2標(biāo)注工具。一方面,可以通過BFSU Qualitative Coder1.1語料庫軟件進(jìn)行元信息的批量標(biāo)注,對每篇文本的標(biāo)題、發(fā)表時間、來源、作者、期刊名稱、發(fā)表時間、建庫人和組織信息等信息進(jìn)行標(biāo)注,以便使用者清楚地知道文本信息的信息,也便于應(yīng)用者單文本的查找。另一方面,為了對語料進(jìn)行詞性和句法結(jié)構(gòu)等方面的深度研究,也為了對語料庫數(shù)據(jù)分析能夠更加系統(tǒng)精確,對特殊數(shù)據(jù)信息進(jìn)行提取和處理,本研究擬對生文本語料進(jìn)行詞語切分和詞性賦碼標(biāo)注。經(jīng)過比選,本語料庫的創(chuàng)建選用了比較成熟的Helmut Schmid設(shè)計(jì)的TreeTagger詞性賦碼軟件,TreeTagger詞性賦碼軟件可以根據(jù)概率的原則,用計(jì)算機(jī)進(jìn)行自動化處理,是目前最權(quán)威的英語語料賦碼軟件之一。將清潔文本用Treetagger進(jìn)行詞性標(biāo)注,標(biāo)注后的文本可以進(jìn)行微觀的詞匯研究,通過檢索軟件可以得到相應(yīng)的形成名詞詞表、動詞詞表等。
3.2.3重命名工具。由于文本處理過程中運(yùn)用到了詞性標(biāo)注軟件,詞性標(biāo)注軟件在對文本進(jìn)行詞性標(biāo)注的同時,對文本的域名也進(jìn)行了批量改寫,域名從原來的“.txt”改為了“.txt.pos”。因此必須運(yùn)用重命名軟件將域名改回原來的“.txt”,才能被接下來的檢索軟件識別。因此,本研究可以利用Super Batch Renamer語料庫軟件進(jìn)行批量改名。
3.2.4檢索工具。日本早稻田大學(xué)Laurence Anthony設(shè)計(jì)的Antconc,許家金和賈云龍(2013)研制開發(fā)的PowerConc軟件,英國利物浦大學(xué)Mike Barlow設(shè)計(jì)的Word smith Tools,北京外國語大學(xué)中國外語教育研究中心設(shè)計(jì)的PatCount等語料庫軟件,都可以進(jìn)行單詞或者多詞的檢索,包含詞匯索引、詞表生成、主題詞計(jì)算等功能,這樣就為農(nóng)業(yè)科學(xué)學(xué)術(shù)英語的高頻詞進(jìn)行量化分析提供了充分的技術(shù)保障,尤其是近來,許家金和賈云龍(2013)又研制開發(fā)了PowerConc軟件,PowerConc對傳統(tǒng)的詞匯索引、詞表生成、主題詞計(jì)算等功能進(jìn)行了重構(gòu)、擴(kuò)展和優(yōu)化,正則表達(dá)式(regular expressions)的N元組(N-gram)為基礎(chǔ)二者的有機(jī)結(jié)合,功能強(qiáng)大,為我們利用正則表達(dá)式檢索被動語態(tài)和名物化的形式提供了強(qiáng)有力的技術(shù)支撐。此外,還有BFSUCollocator搭配分析軟件,BFSUcolligator類連接分析專用工具,SPSS,Excel等統(tǒng)計(jì)分析工具,都具有免費(fèi)使用、功能強(qiáng)大、準(zhǔn)確率高等特點(diǎn),都為本研究提供了技術(shù)支撐,能夠保證本語料庫的建設(shè)和研究順利完成。
同時,國內(nèi)已經(jīng)有建成的眾多與專業(yè)英語相結(jié)合的專門用途英語語料庫和學(xué)術(shù)英語語料庫,如航空航天英語語料庫、醫(yī)學(xué)英語語料庫、旅游英語語料庫、商務(wù)英語語料庫,這些語料庫的建立及其研究成果,都給建設(shè)農(nóng)業(yè)科學(xué)學(xué)術(shù)英語語料庫提供了研究方法上的寶貴借鑒。
4. FAO農(nóng)業(yè)英語語料庫在農(nóng)業(yè)英語教學(xué)中的價(jià)值
4.1完善專門用途英語語料庫的建設(shè),促進(jìn)教學(xué)改革。
建立國內(nèi)首個FAO農(nóng)業(yè)英語語料庫,改變農(nóng)業(yè)英語專用語料庫發(fā)展滯后的現(xiàn)狀,完善專門用途英語語料庫的建設(shè),為今后建立大規(guī)模農(nóng)業(yè)英語語料庫提供范例。語料庫可以提供大量可靠性高的參照數(shù)據(jù)和新鮮實(shí)例,使語言研究更具概括性和說服力,將給以往的教學(xué)材料帶來沖擊,為今后農(nóng)業(yè)英語教學(xué)提供直接的、可操作的、可靠性強(qiáng)的素材;FAO農(nóng)業(yè)英語語料庫將提供基于語料庫的農(nóng)業(yè)科技英語詞典編撰、基于語料庫和計(jì)算機(jī)的多媒體課件開發(fā)等,傳統(tǒng)的編寫方式比較固定,大多是依靠他人資料和個人經(jīng)驗(yàn)編寫而成,而自語料庫出現(xiàn)之后,教材的編寫處于新的形勢,這將幫助教授農(nóng)業(yè)英語的英語專業(yè)教師更好地向?qū)iT用途英語教師方向轉(zhuǎn)變,促進(jìn)專門用途英語教學(xué)改革(蔡基剛,2004)。
4.2改變教師的傳統(tǒng)教學(xué)模式。
英語教師一旦掌握了語料庫研究的使用技能,就可以通過語料庫進(jìn)行農(nóng)業(yè)英語和通用英語詞匯、句法等方面的比較,進(jìn)行主題分析、例句援引、詞語搭配、詞素分析、話語分析等,從而在掌握學(xué)生語言學(xué)習(xí)情況的過程中,根據(jù)語料樣本解決學(xué)生語言學(xué)習(xí)中遇到的問題,這種數(shù)據(jù)驅(qū)動學(xué)習(xí)的教學(xué)模式,把建成之后的FAO農(nóng)業(yè)英語語料庫直接應(yīng)用于課堂教學(xué),解決了英語教師缺乏農(nóng)業(yè)專業(yè)知識和專業(yè)詞匯,很難開展結(jié)合農(nóng)業(yè)特色的英語教學(xué)的矛盾,縮小了實(shí)際使用與課堂教學(xué)的差距(程世祿,張國揚(yáng),1995)。如課前,教師可以根據(jù)課程需求和學(xué)生英語掌握水平,從FAO農(nóng)業(yè)英語語料庫中選取與課堂教學(xué)相關(guān)的語言信息,可以是短語,也可以是例句,建立微型文本,有針對性地為學(xué)生提供大量豐富的語例,有效解決普通教材語例復(fù)現(xiàn)率低的弊端,更符合英語學(xué)習(xí)規(guī)律;課中,教師可以指導(dǎo)學(xué)生觀察更多語料,逐步修正完善規(guī)則,掌握目標(biāo)知識。由于微型文本中所選的語例都是來源于FAO官方網(wǎng)站,語料真實(shí)、準(zhǔn)確,不僅可以提高學(xué)生的語言實(shí)際運(yùn)用水平,更有利于鍛煉其探究型學(xué)習(xí)能力;課后,教師可以將微型文本共享,方便學(xué)生進(jìn)行課后復(fù)習(xí)查閱,并依據(jù)學(xué)生課堂表現(xiàn),從FAO農(nóng)業(yè)英語語料庫中抽取其他語例,編制測試題目,鞏固課堂教學(xué)內(nèi)容,很大程度上避免了出題過難、過偏或者脫離語言實(shí)際使用等情況。
4.3促進(jìn)學(xué)生更有效地學(xué)習(xí)。
課中,學(xué)生可以以個體或者小組的形式,結(jié)合語料庫驅(qū)動的方法,開展基于微型文本語言實(shí)例的自主學(xué)習(xí)或合作學(xué)習(xí),讓學(xué)生作為活動和研究的主體,探究學(xué)過文章的詞塊、語法及語篇特點(diǎn),觀察語言搭配,在閱讀和搜索中獲得專業(yè)知識。在這一過程中,學(xué)生運(yùn)用語料庫軟件自主觀察真實(shí)語料,從大量語料中觀察某一語言現(xiàn)象的呈現(xiàn)規(guī)律,然后反思、討論、分享這一過程中的發(fā)現(xiàn),對某個語言現(xiàn)象的規(guī)則進(jìn)行歸納;課后,語料庫能讓學(xué)習(xí)者在掌握了相關(guān)技術(shù)之后,根據(jù)自己的具體情況,利用已經(jīng)建成的農(nóng)業(yè)科學(xué)國際期刊論文語料庫進(jìn)行操練,在沒有教師指導(dǎo)答疑的情況下,借助語料庫的相關(guān)功能同樣可以解決疑問,直到最終掌握相關(guān)的內(nèi)容,這也體現(xiàn)了人本主義教育思想,值得國內(nèi)農(nóng)林院校大力探索和提倡。
5.結(jié)語
借助宏大的計(jì)算機(jī)數(shù)據(jù)庫——語料庫,F(xiàn)AO農(nóng)業(yè)英語語料庫的建成,為農(nóng)業(yè)英語教學(xué)人員提供了一個分析、研究、描述和應(yīng)用農(nóng)業(yè)英語的載體,為農(nóng)業(yè)英語教學(xué)、編寫農(nóng)業(yè)英語辭典、研究動物科學(xué)英語語言特點(diǎn)、各種論文寫作教材編寫提供了重要的語料源,而且為農(nóng)業(yè)英語研究、農(nóng)業(yè)英語教師發(fā)展和農(nóng)業(yè)學(xué)生學(xué)習(xí)專業(yè)英語提供了全新途徑。由于客觀原因,F(xiàn)AO農(nóng)業(yè)英語語料庫的建設(shè)和應(yīng)用仍然存在缺陷,主要表現(xiàn)在語料采集的深度和廣度不夠,但是語料庫不是一次成品,相信在今后的研究中,F(xiàn)AO農(nóng)業(yè)英語語料庫會更加發(fā)展成熟完善,為農(nóng)業(yè)專業(yè)其他學(xué)科的語料庫建設(shè)打下基礎(chǔ),為國內(nèi)同行的類似研究提供一定的啟發(fā)。
參考文獻(xiàn):
[1]蔡基剛.ESP與我國大學(xué)英語教學(xué)發(fā)展方向[J].外語界,2004(2).
[2]程世祿,張國揚(yáng).ESP教學(xué)的理論和實(shí)踐[J].外語教學(xué)與研究,1995(4).
[3]何中清,彭宣維,英語語料庫研究綜述:回顧、現(xiàn)狀與展望[J].外語教學(xué),2011(1).
[4]黃大網(wǎng),秦羿,許賽穎.專門用途英語語料庫:挑戰(zhàn)、理據(jù)與愿景[J].寧波大學(xué)學(xué)報(bào)(人文科學(xué)版),2010(5).
[5]梁茂成,李文中,許家金.語料庫應(yīng)用教程[M].北京:外語教學(xué)與研究出版社,2010.
[6]梁燕,馮友程,良坤.近十年我國語料庫實(shí)證研究綜述[J].解放軍外國語學(xué)院學(xué)報(bào),2004(6).
[7]劉滿堂.近40年英語語料庫及語料庫語言學(xué)研究的回顧與展望[J].陜西教育學(xué)院學(xué)報(bào),2004(1).
[8]譚鍵.語料庫及語料庫語言學(xué)的發(fā)展與應(yīng)用[J].西北工業(yè)大學(xué)學(xué)報(bào):社會科學(xué)版,2005,25(1):61-63.
[9]衛(wèi)乃興.語料庫語言學(xué)的方法論及相關(guān)理念.外語研究,2009:36-42.
[10]許家金.語料庫語言學(xué)的理論解析[J].外語教學(xué),2003(6).
基金項(xiàng)目:2013年西北農(nóng)林科技大學(xué)人文社科重點(diǎn)項(xiàng)目資助(項(xiàng)目編號:2013RWZD05)
通訊作者:李麗霞