趙昌彥, 武 俊
(淮陰師范學(xué)院 外國語學(xué)院, 江蘇 淮安 223001)
20世紀(jì)80年代末,隨著第三次科技革命的迅猛發(fā)展,以計(jì)算機(jī)信息技術(shù)為代表的新興行業(yè)逐漸興起。傳統(tǒng)的翻譯領(lǐng)域開始嘗試與計(jì)算機(jī)信息技術(shù)相結(jié)合,通過計(jì)算機(jī)技術(shù)來輔助翻譯任務(wù)。新技術(shù)的運(yùn)用極大地提高了翻譯效率,給翻譯界帶來了一場重大的革新。中國,這一最具活力的經(jīng)濟(jì)體,在全球市場舉足輕重。亞投行、“一帶一路”、人類命運(yùn)共同體……中國在發(fā)展自己的同時(shí)不斷向世界貢獻(xiàn)中國力量和智慧。為推動(dòng)全球貿(mào)易的發(fā)展,中國投入大量資金引進(jìn)并研發(fā)計(jì)算機(jī)輔助翻譯技術(shù),即CAT(Computer-aided Translation),用于國家間經(jīng)濟(jì)與文化交流所需文獻(xiàn)資料的翻譯。其中以Trados、雅信、Wordfast、DejaVu等為代表的計(jì)算機(jī)輔助翻譯軟件因其省時(shí)高效迅速占領(lǐng)了全球翻譯市場。聯(lián)合國、歐盟等國際組織,以及微軟、大眾、英特爾、華為、中興、聯(lián)想等全球大型跨國公司為提高效率,紛紛使用CAT軟件進(jìn)行文獻(xiàn)間的翻譯工作。CAT技術(shù)能在翻譯領(lǐng)域的廣泛運(yùn)用與蓬勃發(fā)展,翻譯記憶庫即TM(Translation Memory)功不可沒。TM作為CAT軟件的核心模塊CPU(Central Processing Unit),是產(chǎn)出高質(zhì)量高數(shù)量譯文的關(guān)鍵。然而中國譯界對翻譯記憶庫的研究卻相對滯后。有鑒于此,文章對TM技術(shù)在中國的研究情況作了仔細(xì)梳理與反思,以引起中國譯界對CAT軟件中CPU模塊—TM研究的重視,從而帶動(dòng)CAT技術(shù)在整個(gè)中國翻譯領(lǐng)域的大發(fā)展,進(jìn)一步助推國家經(jīng)濟(jì)、貿(mào)易、文化的交流與繁榮。
翻譯記憶庫如同電腦的中央處理器,是諸如Trados等計(jì)算機(jī)輔助翻譯軟件的核心模塊,是“譯者運(yùn)用計(jì)算機(jī)程序部分參與翻譯過程的一種翻譯策略”[1]。其工作原理是:“譯員利用已有的原文和譯文,建立起一個(gè)或多個(gè)翻譯記憶庫,在翻譯過程中,系統(tǒng)將自動(dòng)搜索翻譯記憶庫中相同或相似的翻譯資源(如短語、句子、段落等),然后給出參考譯文供譯員選擇, 對于給出的參考譯文,譯員可以完全照搬,也可以修改后使用,如果覺得不滿意,還可以棄之不用。這樣譯員就可以避免無謂的重復(fù)勞動(dòng),專注于新內(nèi)容的翻譯。而翻譯記憶庫同時(shí)在后臺不斷學(xué)習(xí)并自動(dòng)儲存新的譯文,變得越來越聰明,效率越來越高”[2]。所以,從某種程度上來說,記憶庫質(zhì)量的高低直接決定了譯文質(zhì)量的好壞。擁有門類齊全、質(zhì)量上乘的記憶庫可以有效提高翻譯效率,降低譯員及公司的翻譯成本。因此,記憶庫的開發(fā)及研究尤為重要。
筆者在中國知網(wǎng)CNKI期刊全文數(shù)據(jù)庫(1998—2017年)中分別輸入“計(jì)算機(jī)輔助翻譯”“翻譯記憶”“Trados”詞頻依次進(jìn)行篇名、主題及關(guān)鍵詞三種類別的精確檢索,檢索結(jié)果統(tǒng)計(jì)情況如表1所示:
表1 1998—2017年不同詞頻分類檢索結(jié)果統(tǒng)計(jì)
計(jì)算機(jī)輔助翻譯技術(shù)經(jīng)過30多年的發(fā)展,已成為全球翻譯市場的翹楚,尤其是以Trados等為代表的輔助軟件更是行業(yè)的佼佼者。但是在中國譯界對它的研究卻相當(dāng)滯后。上表中以“計(jì)算機(jī)輔助翻譯”為篇名的研究文獻(xiàn)共有105篇,而以“Trados”為篇名的僅為23篇。這與中國的經(jīng)濟(jì)發(fā)展水平與規(guī)模遠(yuǎn)不相稱。尤其是對TM-CAT的CPU模塊的研究現(xiàn)狀更是不容樂觀。筆者對20年間的研究成果用“翻譯記憶”一詞作了篇名的詞頻檢索,結(jié)果25篇文獻(xiàn)按照理論研究、技術(shù)探討、工具介紹、教學(xué)研究、應(yīng)用研究進(jìn)行分類,統(tǒng)計(jì)結(jié)果如表2:
表2 “翻譯記憶”為篇名的文獻(xiàn)分類結(jié)果統(tǒng)計(jì)
1.2.1 理論層面
國內(nèi)有關(guān)TM的理論研究相對薄弱。蘇明陽[3]詳細(xì)梳理了現(xiàn)有的翻譯記憶系統(tǒng),介紹了翻譯記憶的歷史與發(fā)展現(xiàn)狀,指出當(dāng)前翻譯記憶技術(shù)的局限性,總結(jié)其發(fā)展趨勢,并對中國翻譯記憶方面的研究與應(yīng)用提出建設(shè)性建議;王正[4]從語境角度研究翻譯記憶的匹配機(jī)制。這些方面的研究可以拓寬我們的視界,指導(dǎo)我們的TM翻譯實(shí)踐。雖然數(shù)量很少,但意義重大。
1.2.2 技術(shù)層面
技術(shù)層面的研究體現(xiàn)在對TM技術(shù)具體模塊功能及與平行語料庫技術(shù)的對比研究及探討方面。如武曉山[5],王正、孫東云[6],李毅鵬[7]等人主要集中探討了平行語料庫與翻譯記憶庫的差異。翻譯記憶庫具體模塊功能的研究表現(xiàn)為:吳松林[8]探討翻譯記憶庫中非標(biāo)準(zhǔn)化TMX文件格式的使用;周文、徐國梁[9]探討了翻譯記憶庫中語句相似度的計(jì)算方法;徐小娟、黃新、徐幫耿[10]從語義的角度分析了翻譯記憶系統(tǒng)的設(shè)計(jì);徐小娟、徐國梁、黃新[11]從知識本體CSO來探討匹配率的提高途徑;趙善祥、劉萬軍[12]主要探討了幾種數(shù)據(jù)篩選方法來提高翻譯記憶的相似度;王菁[13]探討了影響翻譯記憶中相似度的因素;塔依爾江、尼加提等人[14]探討了維文—中文記憶庫的創(chuàng)建與設(shè)計(jì)。
1.2.3 工具層面
工具層面的探討主要集中在TM的工作原理、特點(diǎn)、應(yīng)用及與MT的差異比較方面。作為Trados公司駐京代表的施韻濤[15]從翻譯資料的重復(fù)率角度介紹了使用TM技術(shù)的便利性及使用TM技術(shù)的Trdoas軟件的功能推介;專業(yè)譯員弈風(fēng)[16]則聚焦于TM系統(tǒng)的強(qiáng)大功能的介紹及其給譯員所帶來的巨大便利上;《中國信息界》編輯部[17]在雜志首頁概述了TM技術(shù)的發(fā)展演變及其相關(guān)功能;王金銓[18]比較了MT與CAT技術(shù)中的TM的異同,著重論述了翻譯記憶軟件的工作原理、特點(diǎn)及應(yīng)用;傅彥夫[19]在比較了MT與TM異同的同時(shí)著重論述了基于翻譯記憶技術(shù)的幾款常用軟件的工作原理、特點(diǎn)及應(yīng)用。
作為技術(shù)與工具層面的研究所占比例超過了50%以上。這一方面的研究很多涉及專業(yè)技術(shù)領(lǐng)域,需要專業(yè)領(lǐng)域及翻譯行業(yè)的共同合作。對TM功能模塊的探索有利于其軟件系統(tǒng)的推廣、更新與完善,從而有利于進(jìn)一步推動(dòng)翻譯產(chǎn)業(yè)的發(fā)展。
1.2.4 教學(xué)層面
教學(xué)層面的研究與探討的文獻(xiàn)數(shù)量相對不多,反映出TM技術(shù)在教學(xué)方面研究的不足。武曉山[20]主要探討了TM技術(shù)應(yīng)用于英語專業(yè)翻譯教學(xué)的必要性及對相關(guān)軟硬件設(shè)施的要求;王正、孫東云[21]分析了TM技術(shù)在教學(xué)中的優(yōu)勢與局限性;梅冰[22]介紹了TM系統(tǒng)在翻譯教學(xué)中的必要性、可行性、操作流程及優(yōu)缺點(diǎn);王梅[23]從必要性方面探討了TM系統(tǒng)在教學(xué)中的應(yīng)用。這些研究成果目前雖然相對較少,但是隨著中國翻譯本科和碩士專業(yè)的開設(shè),這方面的研究成果會逐漸增多。
1.2.5 應(yīng)用層面
TM技術(shù)在實(shí)踐層面的應(yīng)用研究涉及領(lǐng)域廣泛。如《民用飛機(jī)維護(hù)領(lǐng)域中的機(jī)器翻譯、翻譯記憶與電子文檔》[24]、《翻譯記憶庫在科技翻譯中的運(yùn)用以及雅信軟件中翻譯記憶庫的評估》[25]以及呂春艷[26]探討了翻譯記憶軟件在具體企業(yè)的實(shí)施方案及取得的實(shí)際效果。隨著翻譯記憶庫的日趨完善、使用TM系統(tǒng)的CAT技術(shù)的不斷發(fā)展及翻譯本地化與全球一體化的交流與合作,TM技術(shù)在具體領(lǐng)域的實(shí)踐應(yīng)用方面的探索會越來越多。
TM作為CAT的核心模塊系統(tǒng)伴隨著CAT軟件在中國的廣泛使用而日益引起譯界研究上的重視。從1998年到2017年的20年間,研究的重點(diǎn)主要集中于TM相關(guān)理論研究的探索、技術(shù)工具本身的工作原理、特點(diǎn)及應(yīng)用介紹、TM與教學(xué)關(guān)系的磨合上以及在一些具體領(lǐng)域的實(shí)踐應(yīng)用等方面,雖然文獻(xiàn)的數(shù)量相對較少,但是意義重大,為TM及基于TM的CAT軟件在中國的發(fā)展進(jìn)行了大膽有益的嘗試。這些研究也暴露出TM技術(shù)一些需要改進(jìn)與完善的地方,值得譯界反思。
譯文的質(zhì)量是眾多國際機(jī)構(gòu)及跨國公司將翻譯任務(wù)外包時(shí)對翻譯公司提出的硬性要求。有的甚至直接要求外包翻譯公司必須使用CAT軟件進(jìn)行翻譯。“100%的制造業(yè)企業(yè)都會優(yōu)先選擇使用CAT軟件的翻譯服務(wù)供應(yīng)商,80%以上的機(jī)械企業(yè)在翻譯外包過程中要求翻譯服務(wù)供應(yīng)商必須使用CAT軟件”[27]。之所以要選擇CAT軟件,他們正是看中了CAT軟件的“翻譯質(zhì)量有效提升、翻譯效率提高、解決術(shù)語統(tǒng)一”[28]這些功能。而完成所有這一切的前提必須得有一個(gè)高質(zhì)量的翻譯記憶庫。翻譯記憶庫的獲得可以通過以下幾種方式:一是客戶自行提供給翻譯公司,翻譯公司只需通過網(wǎng)絡(luò)協(xié)同系統(tǒng)將之導(dǎo)入CAT操作平臺;二是翻譯公司組織人力分工協(xié)作,譯前建立記憶庫;三是從第三方購買記憶庫;四是從公開的免費(fèi)語料庫平臺獲取。第一種情況下,利用客戶提供的記憶庫,譯文的質(zhì)量相對要高。但是,并非所有的客戶都會提供記憶庫給翻譯公司。第二種情況下,相比較而言,會增加翻譯公司的成本,同時(shí)對記憶庫的質(zhì)量產(chǎn)生某種程度上的影響。第三種情況下,由于行業(yè)保密協(xié)議及知識產(chǎn)權(quán)的原因,很多大公司的翻譯記憶庫一般都不對外公開,一些公開的要么價(jià)格不菲要么就是質(zhì)量不過關(guān)。第四種情況下,記憶庫的質(zhì)量就更難保證了。
因此,記憶庫的來源及其質(zhì)量控制是擺在每一個(gè)翻譯公司及個(gè)體譯員面前首要的難題。由于牽涉的因素眾多,不可能僅依靠某一方就能單獨(dú)解決,需要各方的共同努力。中國譯聯(lián)可以借助行業(yè)聯(lián)合會的優(yōu)勢整合分散的翻譯行業(yè),投入相關(guān)人力與財(cái)力加強(qiáng)對翻譯記憶庫的規(guī)范建設(shè)與有效運(yùn)作。
對于翻譯公司來說,無論是自主建立某個(gè)項(xiàng)目的記憶庫抑或是從第三方購買,都是一筆不小的開支。而對于個(gè)體譯員來說,成本就更高了。對于從網(wǎng)絡(luò)免費(fèi)共享語料庫平臺獲取的記憶庫資料,涉及門類旁多,需要篩查甄選、排版對齊、歸類建檔。后期的定期更新與維護(hù)也需要一定的人力與財(cái)力。這些也是擺在每一個(gè)翻譯公司及個(gè)體譯員面前的又一難題。
翻譯記憶庫的強(qiáng)大記憶功能在減輕譯員繁重負(fù)擔(dān)的同時(shí),也容易使譯員滋生一種對技術(shù)的依賴性,過于相信與依賴記憶庫,會限制譯員創(chuàng)造性思維的培養(yǎng)與發(fā)展。在教學(xué)實(shí)踐中,主要表現(xiàn)為會限制學(xué)生主動(dòng)性及創(chuàng)造性的發(fā)展,不利于培養(yǎng)適用性強(qiáng)的研究型翻譯人才。這一點(diǎn)在培訓(xùn)和使用CAT技術(shù)時(shí)務(wù)必要明確,技術(shù)只是輔助性工具,而不應(yīng)成為譯員創(chuàng)造性思維的羈絆。
就某一翻譯項(xiàng)目而言,翻譯記憶庫要么是客戶提供給翻譯公司或個(gè)體譯員,要么就是翻譯公司或個(gè)體譯員自行組織人力在譯前或譯中構(gòu)建。當(dāng)該翻譯項(xiàng)目結(jié)束時(shí),就會產(chǎn)生翻譯記憶庫版權(quán)歸屬的問題。翻譯記憶庫的版權(quán)到底是屬于翻譯公司或個(gè)體譯員,還是屬于客戶,往往會產(chǎn)生法律糾紛。一些大型跨國公司或國際組織出于行業(yè)保密的原因,往往會和翻譯公司或個(gè)體譯員簽訂保密協(xié)議,要求他們刪除或不允許在其他項(xiàng)目中使用自己提供的翻譯記憶庫。但翻譯公司或個(gè)體譯員自行構(gòu)建的記憶庫能否在以后的其他類似翻譯項(xiàng)目任務(wù)中使用,是一個(gè)急需解決的問題。翻譯記憶庫版權(quán)歸屬問題解決的妥善與否直接影響著翻譯記憶庫長遠(yuǎn)的建設(shè)與發(fā)展。
CAT技術(shù)作為一種全新的翻譯形式,自20世紀(jì)80年代產(chǎn)生以來,解決了傳統(tǒng)人工費(fèi)時(shí)低效甚至不可能完成的“互聯(lián)網(wǎng)+”大數(shù)據(jù)時(shí)代的翻譯任務(wù),極大地減輕了譯員的負(fù)擔(dān),提高了翻譯效率,創(chuàng)造了巨大的經(jīng)濟(jì)效益,增進(jìn)了國家間的融合與發(fā)展。雖然對于CAT技術(shù)核心CPU模塊—TM的研究尚有不盡如人意需要改進(jìn)與提高的地方,但是相信在廣大技術(shù)研發(fā)人員、語言工作者及所有相關(guān)部門的共同努力下,其建設(shè)與維護(hù)會日趨完善,它也會為國家間經(jīng)濟(jì)文化交流提供更大的助力。