肖庚生 陳 欣
(南華大學(xué) 外國語學(xué)院,湖南 衡陽 421001)
旅游漢英雙語平行語料庫的建設(shè)與應(yīng)用
肖庚生 陳 欣
(南華大學(xué) 外國語學(xué)院,湖南 衡陽 421001)
文章在綜述現(xiàn)有旅游語料庫的基礎(chǔ)上,介紹了自建的衡陽旅游漢英平行語料庫的建庫步驟,即語料的取樣、英譯、標注與對齊,并闡述了該庫在旅游文本語言特征、旅游翻譯、旅游英語及旅游翻譯教學(xué)研究中的應(yīng)用價值。該庫的建設(shè)與應(yīng)用既能充分滿足研究需要,亦能促進導(dǎo)游、翻譯等英語人才的培養(yǎng),進而推動當?shù)芈糜萎a(chǎn)業(yè)的發(fā)展及跨文化傳播。
旅游語料庫;雙語平行語料庫;旅游英語
近30年來,語料庫及語料庫語言學(xué)從無到有、蓬勃發(fā)展?;谡Z料庫的語言學(xué)及應(yīng)用語言學(xué)研究應(yīng)運而生,語料庫這一研究工具與方法業(yè)已廣泛應(yīng)用于詞匯、句法、語義、語言對比、詞典編撰、二語習(xí)得、翻譯等領(lǐng)域的研究之中, 并取得了累累碩果。[1]為了研究或應(yīng)用的需要,國內(nèi)外先后創(chuàng)建了跨學(xué)科、多語言、內(nèi)容迥異、庫容不一的眾多語料庫。近年來,雙語平行語料庫由于其獨特的優(yōu)勢備受關(guān)注,其建設(shè)與應(yīng)用正如火如荼地進行。不過,迄今為止,國內(nèi)外高校與研究機構(gòu)所研制的平行語料庫主要是通用型的雙語平行語料庫以及文學(xué)翻譯類型的平行語料庫,以某一專門用途為導(dǎo)向的平行語料庫仍較為鮮見。此外,基于平行語料庫的相關(guān)研究主要側(cè)重于對個別語言或翻譯現(xiàn)象的探討。鑒于這一研究現(xiàn)狀,我們擬以課題研究為契機,建設(shè)衡陽旅游漢英雙語平行語料庫,在此基礎(chǔ)上,力圖摸索其在漢語與英語的旅游文本語言特征、旅游漢英翻譯、旅游英語與旅游翻譯教學(xué)研究中的應(yīng)用。
雙語語料庫最早創(chuàng)建于上世紀90年代中后期,迄今為止國內(nèi)外業(yè)已建立多種類型的雙語平行語料庫。早在 1995年,曼徹斯特大學(xué)研制了世界上首個翻譯語料庫,主要收集從各國語言翻譯成為英文的文本,如今庫容已達千萬詞。但是它并非嚴格意義上的雙語平行語料庫,因為它并沒有實現(xiàn)雙語對齊,只能稱其為對比語料庫。目前國際上比較知名的平行語料庫有挪威的“英語-挪威語平行語料庫”、英國的“德語-英語文學(xué)文本平行語料庫”等等。而由北京外國語大學(xué)中國外語教育研究中心于2004年啟動創(chuàng)建的“新型雙語對應(yīng)語料庫”(含漢英、漢日兩個雙語平行語料庫),庫容為3000萬詞次。其中,漢英雙語平行語料庫的文本類型主要涵蓋人文類、社科類和科技類。該語料庫的建設(shè)得到了國家社科基金重大規(guī)劃課題的資助,目前正為1億詞次的超大庫容做進一步的擴容努力。此外,國內(nèi)比較知名的雙語平行語料庫還包括:李德俊以漢英詞典研編為主要目的,主持建設(shè)2000萬詞次的英漢平行語料庫;衛(wèi)乃興以研究探討英漢對等表達為目的,主持建設(shè)900萬詞次的英漢平行語料庫;哈爾濱工業(yè)大學(xué)所創(chuàng)建的庫容為40萬對的英漢雙語平行語料庫;紹興文理學(xué)院創(chuàng)建的中國古典文學(xué)英譯雙語平行語料庫等等。上述雙語平行語料庫多數(shù)以文學(xué)文本為主,抑或以收集百科文本(含文學(xué)與非文學(xué)作品)為特色,而針對某一特定文類或某一地域特色而專門建構(gòu)的專門用途雙語平行語料庫仍較為鮮見。
近年來,隨著交通與通訊技術(shù)的日新月異,世界各地人們之間的科技、文化、商務(wù)交流、合作與往來日益頻繁。更為重要的是,各國人們紛紛走出國門,暢游世界,體驗世界各地的異域風(fēng)情,許多國家的旅游產(chǎn)業(yè)獲得了飛速發(fā)展。為更好地發(fā)展旅游產(chǎn)業(yè)、傳播旅游資訊、吸引外國游客,同時亦為了滿足語言學(xué)及應(yīng)用語言學(xué)研究需要,旅游專門語料庫應(yīng)運而生。
到目前為止,國內(nèi)外最知名的旅游語料庫有如下四庫:一是芬蘭薩翁林納翻譯研究學(xué)院語言教師 Michael Wilkinson所創(chuàng)建的庫容為67萬詞的英語旅游文本語料庫,旨在為芬蘭學(xué)生在將芬蘭旅游文本英譯時提供參考標準;二是英國埃塞克斯大學(xué)研究生Carlota Alcantar于2007年創(chuàng)建的庫容為 37,795詞的英語旅游文本語料庫,其內(nèi)容包括旅游行政機構(gòu)的介紹、酒店及旅行社信息等,旨在為旅游英語教學(xué)總結(jié)旅游寫作常用的詞匯與短語;三是日本大學(xué)Kiyomi等人于2006年所構(gòu)建的“京都旅游語料庫”。該庫為英語單語語料庫,收集的材料均為用英文撰寫的有關(guān)京都旅游介紹的文本,共885篇,建庫目的在于總結(jié)適合于日本旅游市場(尤其是京都地區(qū))常用旅游英語詞匯,為旅游英語課程提供教學(xué)參考;四是香港理工大學(xué)中文及雙語學(xué)系所創(chuàng)建的新型雙語平行旅游語料庫,是中國第一個較大庫容的英漢/漢英旅游語料庫,它由一個雙語旅游翻譯對應(yīng)語料庫與一個雙語旅游翻譯類比語料庫組成,庫容為各 100萬字/詞。旨在促進香港旅游翻譯研究以及旅游英語教學(xué)。
盡管世界各地的旅游語料庫建設(shè)工作取得了豐碩的成果,但鑒于各地有著各自獨特的自然與人文景觀,各地旅游資源迥異,因此旅游語料庫的本土化至關(guān)重要。為了對衡陽旅游資源進行跨文化傳播,并滿足語言學(xué)與應(yīng)用語言學(xué)研究需要,促進在衡高校旅游英語及旅游英漢互譯教學(xué),我們自建了衡陽旅游漢英雙語平行語料庫(Hengyang Tourism Chinese & English Bilingual Parallel Corpus,HTCEBPC)。
HTCEBPC是一個開放式的語料庫,也就是說,其庫容將會隨著旅游宣傳或研究需要不斷得到擴充。HTCEBPC的內(nèi)容主要涵蓋以下幾個方面:衡陽自然景觀、人文景觀的介紹;介紹衡陽旅游資源的觀光小冊子;衡陽本土酒店、旅館、餐飲業(yè)及娛樂場所與設(shè)施的介紹;與衡陽旅游業(yè)相關(guān)的其它行業(yè)的文本,如交通運輸、導(dǎo)游服務(wù)、旅行社業(yè)務(wù)、貨幣兌換、投訴處理、景區(qū)公示語及旅游管理部門的宣傳等相關(guān)的文本。HTCEBPC的建庫工程主要包括以下三個步驟:
首先是對漢語語料的取樣。語料的選擇主要借鑒Maia[2]的標準,依據(jù)社會語域(如分為景點介紹、觀光介紹、景點公示語、旅游配套設(shè)施介紹等若干類),將分層抽樣、均衡抽樣和比例抽樣有機結(jié)合使用,以確保入庫語料的代表性。語料來源既包括正式出版物(圖書、論文、音像制品等),非出版物(網(wǎng)頁、各類旅游宣傳材料如酒店介紹、旅行社介紹、景點旅游宣傳冊等)。我們在建庫過程中充分利用衡陽市旅游局與衡陽市旅游協(xié)會的官方網(wǎng)站-衡陽旅游網(wǎng)(www..hyly.com)以及南岳衡山官方網(wǎng)站(www.nanyue.net.cn/)等權(quán)威網(wǎng)站的網(wǎng)頁內(nèi)容。此外,我們亦深入5A級景點南岳衡山以及回雁峰、石鼓書院、王船山故居、蔡侯祠等著名景點進行實地考察,獲取關(guān)于景點介紹、景區(qū)標識語等信息的第一手語料,并進行錄入。同樣,我們亦通過利用網(wǎng)絡(luò)資源與實地調(diào)研相結(jié)合的方式獲取有關(guān)衡陽林隱假日酒店、神龍大酒店等旅游配套設(shè)施的相關(guān)語料。實現(xiàn)衡陽旅游漢語文本的數(shù)字化,建成衡陽旅游漢語語料庫(Hengyang Tourism Chinese Corpus, HTCC)。
接著我們在完成漢語語料的取樣基礎(chǔ)上對衡陽旅游漢語文本進行英譯。筆者曾于2009年參加了南岳衡山申遺活動中的口、筆譯工作,發(fā)現(xiàn)當前南岳景區(qū)建設(shè)中明顯滯后的一個環(huán)節(jié)就是其英譯工作,景區(qū)中許多景點介紹、標識牌等缺乏中英對照文本,即使有,也是錯誤百出。其他景區(qū)的旅游英譯則更是一塊未曾開墾的處女地。我們以Verschueren[3]所提出的順應(yīng)論為翻譯實踐的理論指導(dǎo),將旅游文本英譯的全過程視為一個不斷順應(yīng)和選擇的過程。我們在理解原文的階段,運用順應(yīng)理論,可以通過認知語境進行推理和探究,找出原語中的心理因素和文化特質(zhì),從而加深對旅游文本交際意圖的理解。與此同時,在用譯語進行重新編碼時,運用動態(tài)順應(yīng)的原理,在眾多的語言選擇中,找出最能讓譯語讀者接受的語項,從而順利地完成滿足譯語讀者需求的翻譯任務(wù)。盡管對旅游文本的漢譯英是一項艱巨浩大的工程,但慶幸的是,筆者所在的課題組其組員普遍英語技能較高、翻譯能力較強、理論功底扎實,他們發(fā)揚精誠合作的精神,順利完成相關(guān)語料的漢譯英工作,建成衡陽旅游英語語料庫(Hengyang Tourism English Corpus,HTEC)。
最后則實現(xiàn)語料的標注、對齊。語料標注分為詞性標注與修辭標注兩類。HTCC的詞性標注將通過運用SVMTool得以實現(xiàn),SVMTool在中文詞性標注中具有較高的準確率。而HTEC的標注則以CLAWS7來得以實現(xiàn),它的標注準確率已達到96%以上。而修辭標注則無現(xiàn)成的電腦軟件進行輔助,完全需要人工進行。HTCEBPC中、英文語料都首先啟用Paraconc 軟件以句為單位進行粗略對齊,輔之以人工校對,以備concordancer 檢索所用。而中文語料還通過利用中科院計算所研制的“漢語詞匯分析系統(tǒng)”(ICTCLAS)進行切分。不過需指出的是,我們在順應(yīng)論的指導(dǎo)下,對旅游文本的翻譯并非完全按照句對句的原則,我們靈活采納摘譯、擴譯或省譯等翻譯策略。故軟件在某些地方難以實現(xiàn)一對一的對應(yīng)。我們便在運用concordancer檢索相關(guān)的句子時,設(shè)定同時出現(xiàn)相對應(yīng)的句子的相鄰的幾個句子,通過提供詳盡的語境,能較為準確地了解是哪一不奮斗原文被改動。在語料實現(xiàn)對齊后,文本轉(zhuǎn)換為XML格式,這樣就能讓語料庫以多種語言格式編碼,以便傳播與檢索。
目前,本旅游語料庫只是初步建成,今后將會逐步增加語料擴充庫容,并考慮將語料庫上網(wǎng)或制作為可供檢索的光盤。同時,我們還將不斷完善對語料庫的標注,依據(jù)教學(xué)與研究需要,進行語義與句法方面的標注,最大限度地挖掘語料庫的應(yīng)用潛能。我們業(yè)已或?qū)⒁谝韵聨讉€方面開展基于HTCEBPC的研究,以實現(xiàn)其應(yīng)用價值。
首先,旅游文本語言特征研究。旅游雙語平行語料庫的構(gòu)建為我們提供了鮮活、真實、海量的有關(guān)景點介紹、景區(qū)公示語、酒店文宣等內(nèi)容的語料。對這些旅游文本的分析有助于揭示漢英兩種語言旅游文本在詞匯、句法、語篇以及文體上的語言特征的共性和差異。借助于語料庫定量數(shù)據(jù)分析,我們可以得到旅游文本標準化類符/型符比,平均詞長、平均句長、詞類的出現(xiàn)頻次與頻率、詞塊的出現(xiàn)頻次與頻率等定量數(shù)據(jù)信息。我們已初步發(fā)現(xiàn),英語旅游文本通常具有用詞平易、豐富、通俗易懂,注重語篇銜接,強調(diào)呼喚功能等特點,而漢語旅游文本則表現(xiàn)為數(shù)量表達使用過于頻繁,慣于堆徹華麗辭藻,常用隱性語篇銜接手段。這種基于語料庫的實證研究,可以避免傳統(tǒng)語言學(xué)研究中思辨法或內(nèi)省法過于經(jīng)驗主義的缺陷,具有較高的信度。
其次,旅游翻譯研究?;诼糜纹叫姓Z料庫的翻譯研究涵蓋微觀與宏觀兩個層面。從微觀層面來講,主要側(cè)重于旅游文本翻譯過程中詞法和句法層面的轉(zhuǎn)化規(guī)律與機制,前者如詞類轉(zhuǎn)換情況,后者如各種句式的轉(zhuǎn)換情況。從宏觀層面來講,通過實證與量化的方式對旅游文本翻譯的文體、風(fēng)格、翻譯共性進行研究,依據(jù)海量語料對譯者個人偏好的語言表達形式加以分析,從中發(fā)現(xiàn)更有說服力的翻譯文體/風(fēng)格表征及其表現(xiàn)手段。這種基于雙語平行語料庫的研究方法能直觀地揭示漢英兩種語言旅游文本從詞匯到語篇各個語言層面的共性與差異,有助于提煉旅游文本獨特的漢英互譯策略。李德超、王克非[4]曾基于漢英平行語料庫,分析與歸納中英文酒店文宣材料在文本慣例上所呈現(xiàn)的不同特點,并提出切實可行的酒店文宣翻譯策略,旨在實現(xiàn)譯文與目標語平行文本間的“文本內(nèi)連貫”。基于平行語料庫的旅游文本翻譯研究其成果有助于解決當前許多地方景點名稱、景點介紹、景區(qū)公示語、酒店文宣等文本翻譯中存在的語言不規(guī)范、譯名混亂、譯文可接受性差等諸多問題,為衡陽本地乃至全國旅游翻譯實踐提供富于價值的參考。[5]
最后,旅游英語以及旅游翻譯教學(xué)研究。該庫的建設(shè)為旅游英語以及旅游翻譯教學(xué)提供了非常真實、鮮活、直觀而且豐富的教學(xué)素材,通過引導(dǎo)學(xué)習(xí)者檢索與考察語料庫內(nèi)容,促進學(xué)習(xí)者對漢英旅游文本的微觀層面(字、詞)到宏觀層面(句子間聯(lián)系、語篇結(jié)構(gòu)以及修辭特點)的理解,鼓勵他們閱讀與討論漢英平行語料間語言特征的異同并歸納切實可行的翻譯策略。[6]基于漢英雙語平行語料庫的旅游英語以及旅游翻譯教學(xué)其形式由傳統(tǒng)的單純由教師講授轉(zhuǎn)變?yōu)閷W(xué)生主動發(fā)現(xiàn)、學(xué)習(xí)與總結(jié)輔之以教師點評這種多樣化形式,這一新型教學(xué)模式有助于引導(dǎo)學(xué)習(xí)者開展“歸納式學(xué)習(xí)”(inductive learning),促進學(xué)生在自主學(xué)習(xí)中積極挖掘與批判性思考,能有效活躍課堂氣氛、充分激發(fā)學(xué)生的學(xué)習(xí)興趣。[7]此外,值得一提的是,衡陽旅游漢英雙語平行語料庫具有鮮明的本土特色,其語料主要來源于衡陽地區(qū)景點介紹、景區(qū)公示語、酒店文宣及其他旅游配套相關(guān)文本,因此,在當?shù)馗咝B糜斡⒄Z或旅游翻譯教學(xué)中,這些教學(xué)素材的應(yīng)用無疑有助于提升學(xué)習(xí)者對本土歷史、地理、文化的了解,亦有助于增強學(xué)習(xí)者跨文化交際能力。因此,該庫的建設(shè)與應(yīng)用對培養(yǎng)立足衡陽、面向世界的導(dǎo)游、翻譯人才具有極大的推動作用。
綜上所述,我們通過語料取樣、文本英譯、語料標注、文本對齊等步驟初步創(chuàng)制衡陽旅游漢英雙語平行語料庫,并將其應(yīng)用于旅游文本語言特征、旅游翻譯、旅游英語及旅游翻譯教學(xué)研究之中。該庫的建設(shè)與應(yīng)用既能充分滿足語言學(xué)及應(yīng)用語言學(xué)研究需要,而且被初步證明有助于推動培養(yǎng)兼具本土化與國際化特點的英語人才,進而促進當?shù)芈糜挝幕a(chǎn)業(yè)發(fā)展和跨文化傳播。
[1]梁茂成,李文中,許家金.語料庫應(yīng)用教程[M].北京:外語教學(xué)與研究出版社,2010.
[2]Maia,B.“Some languages are more equal than others”:Training translators in terminology and information retrieval using comparable and parallel corpora[A].In F.Zanettin,S.Bernardini&D.Stewart(eds.).Corpora in Translator Education[C].Manchester:St.Jerome,2003.
[3]Verschueren,J.Understanding Pragmatics[M].London:Edward Arnold,1999.
[4]李德超,王克非.平行文本比較模式與旅游文本的英譯[J].中國翻譯,2009,(4):54-58.
[5]烏永志.文化遺產(chǎn)類旅游景點名稱漢英翻譯規(guī)范研究[J].外語教學(xué),2012,(2):93-97.
[6]余軍,王朝暉.基于比較翻譯教學(xué)法的教學(xué)型語料庫構(gòu)建與應(yīng)用[J].中國翻譯,2010,(5):57-62.
[7]李德超,王克非.基于雙語旅游語料庫的DDL翻譯教學(xué)[J].外語電化教學(xué),2011,(1):20-26.
H030
A
1673-2219(2012)10-0163-03
2012-08-26
衡陽市社科基金項目“順應(yīng)論視閾下衡陽旅游漢英雙語平行語料庫的建設(shè)與應(yīng)用研究”(項目編號2011C011);全國教育科學(xué)規(guī)劃課題“基于語料庫的大學(xué)英語教學(xué)平臺建設(shè)與研究”(項目編號GPA105029)階段性成果。
肖庚生(1980-),男,湖南衡陽人,講師,應(yīng)用語言學(xué)博士生,主要研究方向為語料庫語言學(xué)。陳欣(1983-),女,湖南郴州人,講師,語言學(xué)碩士,主要研究方向為翻譯理論與實踐。
(責(zé)任編校:王晚霞)