張立柱
(中國礦業(yè)大學 外文學院,江蘇 徐州 221116)
?
小型雙語平行語料庫的研制以及在翻譯教學中的應用
張立柱
(中國礦業(yè)大學 外文學院,江蘇 徐州 221116)
語料庫技術與翻譯教學的結合是翻譯教學領域里的一次革新,逐漸成為一種新的研究范式。文章論述了語料庫在翻譯教學中的優(yōu)勢以及自建小型雙語平行語料庫的過程和方法,并以此為基礎嘗試運用語料庫驅動的方法開展大學英語翻譯教學模式的改革。
雙語平行語料庫;語料庫驅動;翻譯教學
現(xiàn)代信息技術對教育發(fā)展具有革命性影響,語料庫是其中的重要組成部分。它以前所未有的巨量語言信息儲備、高速精確的計算機提取方式和鮮明突出的語境共現(xiàn)界面取勝,一方面為語言教育教學提供大量優(yōu)質(zhì)資源,另一方面可創(chuàng)設大信息量、多維演示的立體教學和人機互動的優(yōu)質(zhì)教學平臺[1]。自20世紀90年代以來,語料庫已經(jīng)逐漸應用到翻譯研究的各個層面,成為一種新的研究范式。其中,語料庫與翻譯教學的結合是翻譯教學領域的一次革新,隨著計算機的日益普及和互聯(lián)網(wǎng)的不斷發(fā)展,利用語料庫開展翻譯教學將具有巨大的發(fā)展?jié)摿Α?/p>
在國內(nèi),傳統(tǒng)翻譯教學多基于教師的經(jīng)驗式、感悟式、師徒式的傳授方法,在翻譯教材、課堂講授和學生自主學習等方面都存在不足之處。語料庫的出現(xiàn)在某種程度上恰好能彌補這一不足。在語料庫教學環(huán)境中,學生通過發(fā)現(xiàn)式學習和數(shù)據(jù)驅動的學習方式訓練掌握翻譯技巧、提高翻譯技能、熟悉翻譯職業(yè)特征[2]。
Zanettin指出了小型雙語語料庫在翻譯課堂教學中對于促進原文理解和譯文表達能力的價值[3]。Bowker認為語料庫可以幫助翻譯教師評判譯文質(zhì)量,指導翻譯教學[4]。黎士旺論證了基于語料庫的翻譯教學與傳統(tǒng)的翻譯教學模式相比,具有文本電子化、學習直觀化、分析多元化、結論科學化、成果有機化等五大方面的優(yōu)勢[5]。胡開寶認為基于語料庫的翻譯教學模式具有一些不可替代的優(yōu)勢,可以提高學生在翻譯教學中的參與程度,以學生為中心進行翻譯教學,強調(diào)翻譯理論與翻譯實踐的有機結合,并能實現(xiàn)翻譯教學的真實化和社會化[6]。
平行語料庫(也稱為對應語料庫或雙語對應語料庫)是“由原文文本及其平行對應的譯語文本構成的雙語語料庫,其雙語對應程度可有詞級、句級和段級幾種”[7]。胡開寶認為雙語平行語料庫與翻譯教學的關系最為緊密,它為翻譯教學提供了豐富的教學資料和便捷的教學手段,可以提供動態(tài)語境,幫助學生學習翻譯策略并形成自己的翻譯觀以及驗證教師自己的語感[6]。王克非等更加肯定了語料庫的作用,指出雙語語料庫與翻譯教學存在天然切合點,語料庫可為學習者提供經(jīng)驗數(shù)據(jù),學習者可以藉之自主學習、發(fā)揮潛能,提升學習的效率和效果[8]。王克非總結了平行語料庫在翻譯教學中運用的基本原則,那就是觀察先于歸納、呈現(xiàn)先于講解、學生自導先于教師指導,指出了與傳統(tǒng)翻譯教學模式相比的優(yōu)勢是把學習者視為是發(fā)現(xiàn)者,甚至是研究者,更易于加強學習者學習的自主性和主動性[9]。
依賴語料庫的研究方法可以分為三類,分別為語料庫指導的方法(corpus-informed approach),基于語料庫的方法(corpus-based approach)和語料庫驅動的方法(corpus-driven approach)。其中在語料庫驅動的方法中,研究者可以根據(jù)自己的興趣在語料庫中觀察語言現(xiàn)象,對數(shù)據(jù)進行分類和歸納,最終得出自己的結論,數(shù)據(jù)驅動學習的基本理念符合“以學習者為中心”的思想[10]。利用平行語料庫,開展翻譯教學中的數(shù)據(jù)驅動學習將有利于充分發(fā)揮學習者的主觀能動性,解放教師,實現(xiàn)課堂真正意義上的“翻轉”。
目前,國內(nèi)雖然已經(jīng)建成了一些大型雙語平行語料庫,如北京外國語大學的“漢英對應語料庫”,北大計算語言研究所開發(fā)的“Babel漢英平行語料庫”,英國蘭卡斯特大學的“巴比倫英漢平行語料庫”,但由于版權等原因這些語料庫并沒有完全免費開放或實現(xiàn)在線檢索。此外,這些語料庫有些主要是用于語言對比、翻譯研究、詞典編撰等,而不是翻譯教學,并不能直接拿來用于課堂教學。因此,很多時候,翻譯教師有必要根據(jù)不同教學研究的需要,自建小型語料庫。
肖維青很早就曾指出,“翻譯教師自建小型語料庫并不是天方夜譚,建設者只要有一些基礎計算機知識,并學會一些語料庫檢索軟件,就可以建立應用于翻譯教學的平行語料庫并不斷擴容,縱深開發(fā)”[11]。
由于互聯(lián)網(wǎng)的普及,通過網(wǎng)絡搜索獲取資料變得越來越便捷,教師在備課的時候可以通過查找,收集原文以及不同譯文的電子版本,尤其是一些經(jīng)典文學著作,通常會有很多譯本, 建立一次性語料庫(disposable corpus)用于課堂的教學展示或課外學習任務,也可以指導學生自己建庫,用于以后的翻譯自學。由于語料庫提供真實環(huán)境下的語言材料,不僅可以使學生掌握語言技巧和翻譯技巧,還可以使他們在社會文化和語言交際背景下獲得關于翻譯的感悟和體驗[6]。
文章將以朱自清的經(jīng)典散文《匆匆》的三個譯本為例,闡述如何制作小型雙語平行語料庫用于課堂教學。
1. 收集文本
通過網(wǎng)絡檢索、文本電子掃描(OCR)、網(wǎng)上數(shù)字圖書館以及人工錄入等方式采集所需要文本的電子版,由于網(wǎng)絡上的資源良莠不齊,需要教師予以仔細甄別、把控文本質(zhì)量。比如,通過網(wǎng)絡檢索,很容易就能找到朱自清《匆匆》的原文和三個譯本的電子版,而且三個譯本都已經(jīng)在正式刊物或出版社發(fā)表,具有權威性,質(zhì)量比較有保證。按照時間順序,分別為朱純深1994年發(fā)表于《中國翻譯》上的譯作“Rush”,張培基1999年譯注的《英譯中國現(xiàn)代散文選》一書中的“Transient Days”以及張夢井等1999年編譯出版《中國名家散文精譯》中的“Days Gone By”。這三個譯本都是同一個年代的,所以可以基本排除時間因素對譯本的影響。
如果所獲取的文本不是word或txt格式的,還需要對其進行格式轉換。ABBYY FineReader是一款實用并且功能強大的軟件,可以把網(wǎng)上大部分pdf以及圖片格式的文件掃描轉換成word格式。獲取文本之后,把原文以及三個譯文分別命名,使用ANSI編碼保存成四個txt格式的文件,為下一步文本清潔做準備。
考慮到不同學生的水平和接受程度不同,收集完文本后,可以用一款Paul Nation開發(fā)的Range軟件初步分析英文譯文的詞匯難度是否適合課堂教學[10]。該軟件包含三級詞匯底表,其中前兩級詞表包含比較常用的兩千詞簇(word families),第三級詞表包含570個源自“學術英語詞表”的詞簇。第三級和詞表外詞匯,特別是第三級詞表對文本整體的詞匯難度有較好的判別能力。通過使用Range軟件對《匆匆》的三個英文譯文分析得出,朱純深、張培基、張夢井譯本中第三級詞表詞簇分別為14、17、15,類符百分比分別為7.02%、7.98%、7.77%。由此可見,三個譯本的難度相當,都不算大,比較適合大學英語翻譯課的教學。
2. 文本整理與清潔
由于所收集文本的電子版可能存在多余的空行、空格、標點符號全角半角混亂等格式問題,人工整理非常耗時耗力,可以使用一款名為“文本整理器”的免費軟件。根據(jù)不同的文本,需要采用不同的整理方案,該軟件有一個“批量整理”功能,包含“空格”、“段落”、“標點”、“內(nèi)碼”、“調(diào)整”、“替換”等方案,使用者可以自己根據(jù)所需選擇設計不同的方案。通過觀察,筆者所收集的這幾個文本基本符合要求,不需要做過多調(diào)整,但由于下面所使用的對齊軟件ParaConc不能識別中文的全角標點符號,所以首先需要把中文版《匆匆》中的所有標點從“全角”轉換為“半角”。此外,因為ParaConc默認的句子定界符標記(delimiter)標注為“seg”,為了實現(xiàn)句子的初步對齊,可以在所有文本的句末標點后插入標注“
3. 文本分詞與標注
由于中文的字詞之間沒有空格,ParaConc不能識別,所以需要對中文語料進行分詞處理,可以使用中國科學院計算技術研究所研制的ICTCLAS軟件。如果同時需要詞性標注,可以分詞與標注同時進行。英文語料一般不需要分詞,如果需要詞性標注可以使用一款名為TreeTagger的免費軟件。
4. 文本句子對齊
以上準備工作做完之后,就可以使用ParaConc進行文本的對齊。ParaConc一次能同時加載四個文件,可以實現(xiàn)一個原文分別和另外三個譯本的兩兩對齊。由于已經(jīng)在所有的句子末位插入了標注“
對齊后,每一句都會用橫線隔開,如果對齊單位是兩句話或以上,ParaConc會用不同的顏色顯示不同的句子,所以非常方便觀察。如果在課堂上給學生演示的時候,也可以通過改變中文或英文文本的字體格式以達到最佳顯示效果。接下來,就可以利用ParaConc進行關鍵詞的平行檢索、搜索熱詞、進行不同譯本的詞頻統(tǒng)計等。
比如,以助詞“的”為關鍵詞,運用ParaConc進行檢索,可以方便快捷地看到三位譯者所采用的不同處理方法。
圖1 朱自清散文《匆匆》平行語料庫中“的”字檢索結果截圖
如果是布置給學生作為課外自學材料,以上句對齊工作完成后基本就可以布置任務了,比如觀察原文結構助詞“的”字的翻譯方法或帶有時態(tài)助詞“了”字的漢語句子翻譯成英語句子所用的時態(tài)。但如果要在課上講解分析,還需要教師提前觀察譯本,做好數(shù)據(jù)的整理和分析。
在詞匯層面上,可以通過對高頻詞的檢索來觀察分析不同譯本的差異。例如,根據(jù)詞頻統(tǒng)計,在原文所用的實詞里“匆匆”屬于高頻詞,除了標題外,正文中一共出現(xiàn)了四次。通過ParaConc進行檢索,可以清楚地比較三個譯本的差異。
朱純深:Rush(標題),swift in such a rush,haste,rush,rush
張培基:Transient Days(標題),swift,fleeting presence,live a transient life,fleeting days
張夢井:Days Gone By(標題),hurried,hurriedly,hurry,hurried days
在句子層面上,運用ParaConc也可以非常直觀清楚地觀察到譯文對原文句子所做的調(diào)整。例如,原文開頭的第一句話:
原文:燕子去了,有再來的時候;楊柳枯了,有再青的時候;桃花謝了,有再開的時候。
張培基譯文:If swallows go away, they will come back again. If willows wither, they will turn green again. If peach blossoms fade, they will flower again.
這里,張培基把原文的三個分號轉換成了三個句號,而其它兩個譯本則保留了原文的三個分號,還是譯成了一句話。
“工欲善其事必先利其器”。自制的小型雙語平行語料庫為翻譯教師提供了有效的教學工具,更貼合翻譯課堂教學的實際,有利于開展數(shù)據(jù)驅動學習,使課堂教學實現(xiàn)“以教師為中心”向“以學生為中心”的轉向,從而實現(xiàn)“翻轉課堂”和教學效果的提高。
[1] 何安平. 語料庫輔助英語教學入門[M]. 北京:外語教學與研究出版社,2010.
[2] 穆雷, 劉康龍. 語料庫與譯者培養(yǎng):導讀 [R]. F. Zanettin, S. Bernardini, D. Stewart(編). 語料庫與譯者培養(yǎng)[C]. 北京:外語教學與研究出版社,2007:vii-xii.
[3] Zanettin, F. Bilingual Comparable Corpora and the Training of Translators [J]. Meta,1998, 43(4):616-630.
[4] Bowker, L. Corpus-based Applications for Translator Training: Exploring the Possibilities [A]. In Granger et al. (eds.). Corpus-based Approaches to Contrastive Linguistics and Translation Studies [C]. Amsterdam: Rodopi,2003:169-183.
[5] 黎士旺. 語料庫與翻譯教學 [J]. 中國科技翻譯,2007,(3):46-49.
[6] 胡開寶. 語料庫翻譯學概論[M]. 上海:上海交通大學出版社,2011.
[7] 王克非等. 雙語對應語料庫:研制與應用[M]. 北京:外語教學與研究出版社,2004.
[8] 王克非,秦洪武. 論平行語料庫在翻譯教學中的應用[J]. 外語教學與研究,2015,(5):763-772.
[9] 王克非. 語料庫翻譯學探索[M]. 上海:上海交通大學出版社,2012.
[10] 梁茂成,李文中,許家金. 語料庫應用教程[M]. 北京:外語教學與研究出版社,2010.
[11] 肖維青. 平行語料庫與應用翻譯研究 [J]. 中國科技翻譯,2007,(3):25-28.
責任編輯:陳君丹
Construction of Small-sized Bilingual Parallel Corpora and Related Application to Translation Teaching
ZHANG Li-zhu
(School of Foreign Studies, China university of Mining and Technology, Xuzhou Jiangsu 221116, China)
The combination of corpus technology and translation teaching is an innovation and has gradually become a new paradigm in the field of translation. The paper expounds the great advantage of applying corpora to translation teaching and the procedure as well as related methods pertaining to the construction of small-sized bilingual parallel corpora, which forms the basis of the following corpus-driven approach to the reform of college English translation teaching.
bilingual parallel corpora; corpus-driven approach; translation teaching
2016-05-03
中國礦業(yè)大學教育教學改革與建設基礎課項目(2015JC10)
張立柱(1982-),男,河南周口人,講師,碩士,研究方向為語料庫翻譯學、翻譯教學。
G642.4; H315.9
A
1674-344X(2016)09-0129-04