,
(天津大學外國語言與文學學院,天津300350)
隨著科學技術的發(fā)展,語料庫翻譯學作為一門新興學科迅速發(fā)展起來。語料庫翻譯學為研究翻譯、語言特征提供了新的視角。它以語言理論和翻譯理論為研究上的指導,以概率和統(tǒng)計為手段,以大規(guī)模雙語真實語料為對象,采用語內(nèi)對比與語際對比相結合的方法,對翻譯現(xiàn)象進行歷時或共時的描寫和解釋,探索翻譯的本質(zhì)[1]。
英國曼徹斯特大學的Mona Baker較早采用了以語料庫為基礎的分析方法。1993年,她發(fā)表了第一本關于語料庫翻譯學的著作《語料庫語言學與翻譯研究:啟示和應用》。同年,國內(nèi)的楊惠中教授發(fā)表了《語料庫語言學與機器翻譯》一文,開啟了國內(nèi)語料庫研究的篇章。此后,語料庫研究方法逐漸開始在語言特征、譯者風格、口譯等方面得到廣泛運用。以語料庫為基礎的詞匯分析主要集中在宏觀詞匯特征、微觀詞匯使用、詞匯搭配、語義韻等方面。王克非利用北外“通用漢英對應語料庫”對翻譯漢語不同于原生漢語的詞匯特征進行了分析[2]。武光軍通過對比2011年我國政府工作報告和美國國情咨文,提出我國政府工作報告應當增加動詞、小詞等詞類的使用[3]。覃梅通過分析漢語新聞翻譯及英語新聞翻譯的特征,驗證翻譯共性是否在英漢兩種語言中普遍存在的問題[4]。朱一凡和胡開寶以“被”字句為出發(fā)點,對比了其在新聞漢譯語料和原創(chuàng)語料中的語義韻差異[5]。
1. 研究目的
借助語料庫技術,以英語原語新聞為參照語料,以翻譯新聞為觀察語料,一方面驗證Baker等人提出的簡化等翻譯共性,另一方面在對比中找出漢譯英翻譯新聞的不足之處,提出解決措施,以期提高英語翻譯新聞的水平,在新聞方面增強對外宣傳能力。
2. 研究步驟
為了將漢英翻譯新聞與英語原語新聞進行對比,收集了78篇國內(nèi)新聞、78篇國內(nèi)新聞的英語翻譯(translated English news,TEN)、78篇同樣內(nèi)容的英語原語新聞報道(non-translated English news,NTEN)。新聞類型廣泛,涉及政治、經(jīng)濟、文化、科技、社會等多種題材。翻譯新聞和原生新聞均來自權威網(wǎng)站,其中翻譯新聞來自愛語吧雙語新聞、中國日報、Global times等網(wǎng)站,原生新聞來自dailymail、BBC、mirror等網(wǎng)站。
基于上述材料,筆者自建了兩個小型單語語料庫,第一個語料庫包含翻譯新聞,共計20 159個字,第二個語料庫包含原生新聞共計17 474個字。
第一步,將這兩個文件轉為txt文本,命名為TEN.txt和NTEN.txt。
第二步,在線用CLAWS7軟件對文本進行詞性賦碼,將賦碼后的文本分別復制到新建的兩個word文檔、兩個文本文檔中,命名為Tag-TEN.docx、Tag-NTEN.docx、Tag-TEN.txt、Tag-NTEN.txt。
第三步,利用word文檔的“查找”功能找出某一詞性的詞(如用_N查找名詞)的個數(shù),除以文檔總字數(shù)得到這一詞性的分布比例。利用wordsmith分析TEN.txt、NTEN.txt、Tag-TEN.txt、Tag-NTEN.txt,得到文本的總體特征參數(shù),并形成詞頻表。
1. 總體特征
類符形符比(type/token ratio, TTR)是衡量文本語言復雜程度的標準之一。類符指語料中不同詞的數(shù)量,形符指語料中所有詞的數(shù)量。類符形符比比值越高,語料復雜程度越高。但由于一定時期內(nèi)語言的詞匯量是有限的,即類符是有限的,而形符卻隨著文本大小的變化而變化。文本越長,形符越大,在類符一定的情況下類符形符比越小。因此,比較規(guī)模不同的語料庫時,常用“標準類符形符比(standard type/token ratio, STTR)”作為衡量標準,即計算文本中每1 000詞的形符類符比。利用wordsmith 4.0的統(tǒng)計功能,得到翻譯新聞和原生新聞的數(shù)據(jù)(見表1)。
表1 翻譯新聞與原生新聞總體特征對比
這些指標反映了文本的詞語變化[2]。由表1可知,相比原生新聞,翻譯新聞的STTR值較小,但與原生新聞的差距僅為0.4,這表明翻譯新聞的詞語豐富度雖然低于原生新聞,但差別并不十分明顯。這一情況可能是由于本語料庫中的翻譯新聞均選自國內(nèi)英語學習權威網(wǎng)站,翻譯質(zhì)量受網(wǎng)站審校人員的嚴格把關,且一些網(wǎng)站,如China Daily等均有英語母語者作為審校人員,因而譯文水平有所保障。從STTR標準差來看,翻譯新聞STTR的離散程度要高于原生新聞,表明國內(nèi)不同網(wǎng)站的漢英翻譯新聞詞匯豐富度參差不齊,差別較大,而國外網(wǎng)站的用詞普遍比國內(nèi)網(wǎng)站較為豐富。
許偉指出,常見文本的平均詞長為4左右,如果遠低于4,意味著文章的語言比較淺顯,如果高于4,意味著文章的語言比較復雜深奧[6]。由表1可知,翻譯新聞與原生新聞的平均詞長均為5,說明兩類文本都有一定的閱讀難度。這一情況可能是因為兩個語料庫的語料均出自國內(nèi)外知名網(wǎng)站,如China Daily、mirror等,這類網(wǎng)站的譯者或記者的語言應用能力強,文章質(zhì)量也較高。但翻譯新聞與原生新聞的平均詞長僅比常見文本的平均詞長高出1個字母,說明兩者都在保障文章質(zhì)量的同時,考慮到了新聞的文體特征,不使用過于復雜的詞匯,滿足讀者的閱讀需求。
Halliday指出,詞匯密度也是衡量文本復雜程度的一項指標,反應了文本包含的信息量。采用Michael Stubbs提出的計算詞匯密度的方法,即計算實詞形符包括動詞、名詞、形容詞、副詞在總形符中的比例。用CLAWS 7軟件對翻譯新聞和原生新聞進行詞性標注后,對照CLAWS 7 POS Tageset詞性賦碼集,利用word的查找功能計算出兩個文本的詞匯密度(見表2)。
表2 翻譯新聞與原生新聞各類實詞頻率對比
Ure指出,詞匯密度(實詞在總詞數(shù)中的比例)在口語表達中一般低于40%,在書面文本中則高于40%[7]。而根據(jù)UE.COM,詞匯密度在60%~70%之間的可視為詞匯密度高的文本,在40%~50%之間的詞匯密度相對較低。由表2可知,翻譯新聞和原生新聞均為信息量高的文本。翻譯新聞的詞匯密度略低于原生新聞,支持翻譯共性假設中的“簡化”特征。
2. 動詞特征
由表2中的“差”一欄可知,翻譯新聞與原生新聞各類實詞最明顯的差異在于動詞的使用。進一步根據(jù)CLAWS 7 POS Tageset詞性賦碼集的動詞分類標準,檢驗各類動詞的頻率,其中翻譯新聞和原生新聞差異最大的前五位動詞(見表3)。
表3和表4綜合反映了翻譯新聞與原生新聞在時態(tài)、情態(tài)動詞運用方面的差異?!皠釉~過去式”代表一般過去時,“過去分詞been”代表完成時(過去完成時和現(xiàn)在完成時),“動詞原形”一方面與“情態(tài)動詞+動詞原形”的結構有很大關系,另一方面也體現(xiàn)了一般現(xiàn)在時、to不定式的使用,“will”和“would”代表將來時。由表中數(shù)據(jù)可知,翻譯新聞與原生新聞都以一般過去時為主要時態(tài),且兩者之間一般過去時的差異最大。返回翻譯新聞與原生新聞文本中發(fā)現(xiàn)一般過去時的例子如下。
表3 翻譯新聞與原生新聞各類動詞頻率對比
表4 翻譯新聞與原生新聞情態(tài)動詞頻率對比
例1 翻譯新聞:Pictures alongside her post showed the textbook featured not only illustrations of the reproductive organs and of two people having sex, but also portrayed discussions about sexual harassment.
原生新聞:The book initially came to public attention when a mother took a picture of her child’s book, where a woman says to a man: “Can you show me your penis?”
例2 翻譯新聞:…while others welcomed what they said was a long overdue infusion of sex education in the country.
原生新聞:But many people also objected to this criticism, arguing that this was an advanced move for China’s sexual education.
例1中,翻譯新聞用3個過去式動詞描述了一位媽媽因兒童性教育課本“尺度太大”在網(wǎng)上發(fā)聲的事情,在原生新聞中,作者則用一般現(xiàn)在時的定語從句引出了課本的內(nèi)容,前者強調(diào)事件發(fā)生的時間,后者強調(diào)事件的客觀真相。例2中,翻譯新聞同樣用了兩個過去式動詞表明網(wǎng)友對此的態(tài)度,而原生新聞在用過去式動詞表明一部分人的態(tài)度時,用現(xiàn)在分詞進行進一步解釋說明。
由表3可知,情態(tài)動詞的差異居第二位。進一步將情態(tài)動詞細化可得表4。
情態(tài)動詞中“would”使用頻率差異最大,經(jīng)筆者檢驗,翻譯新聞和原生新聞中都只有一個would like短語,其余的would均表示過去將來時。這表明原生新聞過去將來時使用較多,而翻譯新聞一般將來時使用較多(由“will”一詞的差別可知)。其次差異比較明顯的是“could”。這表明,翻譯新聞使用情態(tài)動詞would和could較少。
由表3可知,翻譯新聞與原生新聞在現(xiàn)在分詞的使用上也有較大差異。現(xiàn)在分詞表示主動,表達主語與謂語之間的關系。日常交流中,語言使用者由于默認動作發(fā)出者與分詞表示的動作之間的主謂或動賓關系,簡化了句子結構。這種構句方式依靠的是內(nèi)在的語義或語序,是一種意合的隱形銜接[8]。當現(xiàn)在分詞在句中充當表語時,句子表現(xiàn)為依靠系動詞構成的顯性銜接;當現(xiàn)在分詞充當定語、狀語以及構成復合結構(即動詞短語)時,句子表現(xiàn)為隱形銜接。經(jīng)過篩選,排除動名詞以及非現(xiàn)在分詞的詞(如steven hawking中的hawking),翻譯新聞與原生新聞的現(xiàn)在分詞分布(見表5)。
表5 翻譯新聞與原生新聞現(xiàn)在分詞對比
由表5可知,翻譯新聞與原生新聞都呈現(xiàn)出顯性銜接與隱形銜接相結合的特征。翻譯新聞中現(xiàn)在分詞作表語的百分比與原生新聞基本相同,現(xiàn)在分詞作定語、狀語、構成復合結構的百分比比原生新聞高出0.1個百分點,表明翻譯新聞的意合程度高于原生英語新聞。這一現(xiàn)象可能是由于翻譯新聞受到翻譯源語的干擾而出現(xiàn)的。反觀翻譯新聞存在現(xiàn)在分詞的句子及其對應的漢語,發(fā)現(xiàn)有很大一部分都是漢語中的“連動句”見例3。
例3 翻譯新聞:User @Liulangxiaowu agreed, noting that “teenagers would otherwise resort to other improper methods, including watching pornography, to get the information if we hold back appropriate sex education all the time.”
漢語新聞:另一位名為“流浪小屋”的用戶則表示贊同,表示:“如果不適當進行性教育,孩子們很可能會另辟不恰當途徑,比如看色情片等來獲取相關信息?!?/p>
漢語新聞用“贊同”和“表示”兩個連續(xù)的動詞表示網(wǎng)友的觀點,而翻譯新聞則把后一個動詞化為現(xiàn)在分詞,作為伴隨狀語在句中出現(xiàn),表現(xiàn)出隱形銜接的特征。
用語料庫手段結合語料庫分析軟件對比分析翻譯新聞與原生新聞之間的差異,可以使我們從大數(shù)據(jù)中了解翻譯新聞的不足,進而改進國內(nèi)新聞翻譯。通過系統(tǒng)研究,得出以下幾點結論:第一,翻譯新聞和原生新聞的閱讀難度都適中,符合讀者的閱讀需求;第二,相對原生新聞而言,翻譯新聞具有簡化特征,表現(xiàn)為詞匯密度略低;第三,翻譯新聞情態(tài)動詞使用不足、時態(tài)使用較為單一、受翻譯源語影響意合特征比較明顯。在此基礎上,國內(nèi)新聞的譯者應注意以上差別,繼續(xù)保持現(xiàn)有新聞的閱讀難度,從詞匯入手,使用多種情態(tài)動詞和時態(tài),逐步提高翻譯新聞的質(zhì)量,達到預期的宣傳效果。
但值得注意的是,翻譯新聞與原生新聞之間的差異并不懸殊,表明我國外宣翻譯文本,特別是新聞翻譯,質(zhì)量已經(jīng)有所保障,有利于對外宣傳。在以后的研究中,研究人員可建立更大容量的語料庫,系統(tǒng)研究我國翻譯新聞的各類特征,進一步找出差距,為樹立中國形象、讓世界認識中國、了解中國打下良好的基礎。
[1] 王克非, 黃立波. 語料庫翻譯學的幾個術語[J]. 四川外語學院學報, 2007(6): 101-105.
[2] 王克非, 胡顯耀. 基于語料庫的翻譯漢語詞匯特征研究[J]. 中國翻譯, 2008(6): 16-21,92.
[3] 武光軍.基于語料庫的我國《政府工作報告》英譯本的語體特征分析[J].西安外國語大學學報,2014,22(4):118-121.
[4] 覃 梅. 基于語料庫的漢英新聞翻譯變體特征對比分析[D]. 重慶:西南大學外國語學院, 2015.
[5] 朱一凡,胡開寶.“被”字句的語義趨向與語義韻:基于翻譯與原創(chuàng)新聞語料庫的對比研究[J].外國語:上海外國語大學學報, 2014,37(1):53-64.
[6] 許 偉. 平行語料庫在翻譯批評中的應用:以培根Of Studies的不同譯本為例[J]. 外語研究, 2006(2): 54-59.
[7] Ure J. Lexical density and register differentiation[C]// In Perren G E, Trimm J L M.ApplicationsofLinguistics:SelectedPapersofthe2ndInternationalCongressofAppliedLinguists. Cambridge:Cambridge University Press, 1971: 443-452.
[8] 任東升, 馬 婷. 基于語料庫的《水滸傳》沙博理英譯本意合句式研究[J]. 外語研究, 2015(1): 64-70.
[9] 趙秋榮,肖忠華.基于語料庫的翻譯研究:現(xiàn)狀與展望:第四屆“基于語料庫的語言對比與翻譯研究”國際學術研討會綜述[J].中國翻譯,2015,36(2):69-71.