趙足娥 吳年利 李培隆
摘? 要: 論文、學(xué)術(shù)著作中外文資料比例越來越大,學(xué)習(xí)先進的技術(shù)知識需要更高的英語水平。而人工翻譯成本高、效率低,已經(jīng)無法適應(yīng)發(fā)展需求,于是需要在科技英語的輔助系統(tǒng)上尋求突破口。Trados作為現(xiàn)今主流輔助翻譯軟件,可大幅度提高翻譯效率和質(zhì)量,同時降低翻譯成本。文中基于Trados系統(tǒng)研究一種適應(yīng)科技英語特性的高效輔助系統(tǒng)設(shè)計,提出翻譯記憶模型,采用精準(zhǔn)對齊的方式實現(xiàn)記憶庫查詢與校驗操作。同時建立相似度規(guī)劃算法,以“編輯距離”估算語言模糊匹配,實現(xiàn)更貼近語境語義的翻譯效果。最后進行語料翻譯測試,其數(shù)據(jù)結(jié)果表明,該種基于Trados平臺開發(fā)的輔助翻譯系統(tǒng)在科技英語翻譯方面,詞法準(zhǔn)確率與專業(yè)性均較高。
關(guān)鍵詞: Trados平臺; 輔助翻譯; 系統(tǒng)設(shè)計; 科技英語; 翻譯記憶模型; 翻譯測試
Abstract: Due to the increasing proportion of foreign language materials in papers and academic works, learning advanced technical knowledge requires a higher level of English. In allusion to the manual translation can no longer meet the development needs on account of the high cost and low efficiency, a breakthrough in the auxiliary system of the scientific English need to be found. As the mainstream assistive translation software, Trados can greatly improve translation efficiency and quality while reducing translation costs. A design of the efficient auxiliary system adapted to the features of scientific English is studied based on the Trados system. The translation memory model is proposed, and the memory query and verify operation are achieved by means of the precise alignment method. The similarity programming algorithm is established, and the language fuzzy matching is estimated by "editing distance", so as to achieve the translation effect that is closer to the context semantics. The translation test of corpus was conducted. The data results show that the auxiliary translation system developed based on the Trados platform has a higher lexical accuracy and professionalism in the translation of scientific English.
Keywords: Trados platform; aided translation; system design; scientific English; translation memory model; translation test
0? 引? 言
隨著世界一體化發(fā)展趨勢,各國交流日益密切,學(xué)術(shù)圈子已經(jīng)覆蓋到全球各國。而科技英語作為學(xué)術(shù)通用語言,其翻譯質(zhì)量決定著學(xué)術(shù)思想、成果的傳遞效率。傳統(tǒng)的純?nèi)斯しg成本代價過高且效率低,無法滿足日益增長的翻譯需求[1]。再加上萬物互聯(lián)時代下,人工智能大數(shù)據(jù)的蓬勃發(fā)展,計算機翻譯已然成為發(fā)展的必然趨勢,也是翻譯效率提升的突破口。為此,人們對現(xiàn)行的輔助翻譯系統(tǒng)提出了新的需求。
現(xiàn)今,國內(nèi)主流輔助翻譯軟件有SDL Trados,DAVU,CAT等,其中Trados市場占有率最高[2],達到78%。另外,Trados充分利用了“翻譯記憶”的理念,將翻譯過的文本儲存到記憶庫中,遇到類似的文本便可綜合以前的翻譯結(jié)果,從而得到更加精準(zhǔn),且貼合語義的翻譯結(jié)果。結(jié)合計算機強大的儲存與檢索能力,其記憶庫的樣本可以無限增長,從而實現(xiàn)類學(xué)習(xí)模型的翻譯質(zhì)量提升[3]。本文基于Trados這一良好的系統(tǒng)平臺,進一步開發(fā)符合科技英語特性的輔助系統(tǒng),來尋求更高效、高質(zhì)的論文翻譯方法。
1? 系統(tǒng)關(guān)鍵模塊分析
1.1? 翻譯記憶庫
記憶數(shù)據(jù)庫負(fù)責(zé)對已翻譯、待翻譯的文本進行儲存記憶或再提取,是系統(tǒng)的核心模塊,也是系統(tǒng)實現(xiàn)更高翻譯質(zhì)量的分析依據(jù)。其按照類別又可細(xì)分為句料庫和術(shù)語庫。每次翻譯流程中,相似度計算、內(nèi)容檢索、譯文翻譯和修正均要圍繞著翻譯記憶庫實現(xiàn)[4]??梢哉f記憶庫的數(shù)據(jù)管理、分類方式是系統(tǒng)性能的直接關(guān)聯(lián)因素,需要合理規(guī)劃。本文依據(jù)科技英語句式分布和詞匯頻率特性,設(shè)計一種根據(jù)句子級別對齊的分類方式。記憶庫結(jié)構(gòu)設(shè)計如表1所示。
此外,本模塊還需完成相應(yīng)的信息檢索、添加、增刪等操作。同時,數(shù)據(jù)庫需要動態(tài)更新、實時提取,以保持較高的文本活性。
1.2? 翻譯檢索模塊
翻譯檢索模塊是為了簡化翻譯匹配流程,提升翻譯質(zhì)量和速度的參考模塊。具體流程為,首先,從記憶庫中檢索得到歷史文本,通過相似度匹配翻譯句式。檢索得到的實例越貼合待翻譯句子,則前期的句式與詞法翻譯過程將得到更大程度的簡化。
檢索機制的核心在于相似度匹配算法,本文采用“最短編輯距離”來估算并劃分相似程度[5]。由于科技英語具備用詞精準(zhǔn)、規(guī)范術(shù)語、措辭正式、科學(xué)嚴(yán)謹(jǐn)、邏輯性以及專業(yè)性強的特點,且部分語句還具有獨特的詞匯體系和句法特征。因此,詞匯量大、句段間關(guān)系復(fù)雜、知識高度細(xì)化、層次清晰、關(guān)系緊密。這也使得對翻譯的精準(zhǔn)度和語境語義貼合度要求極高,否則將無法精確解析句子表達的含義。以此為前提,本輔助翻譯系統(tǒng)在檢索匹配模塊句子時,采用模糊匹配算法,通過相似度提高準(zhǔn)確性。如,A,B兩句子間的相似度計算公式為:
式中:A代表目標(biāo)翻譯句子;B代表記憶庫歷史參考翻譯。
1.3? 翻譯編輯環(huán)境
翻譯編輯環(huán)境為系統(tǒng)的前端部分,主要提供給翻譯人員內(nèi)部數(shù)據(jù)記憶庫的入口和過濾器操作,對應(yīng)格式文件的錄入與系統(tǒng)自動的句段分割、句法分析等。也可以稱之為系統(tǒng)預(yù)編譯或預(yù)處理模塊,其功能旨在提供前期的準(zhǔn)備工作,簡化人工校驗的流程[6]。此外,在系統(tǒng)編輯環(huán)境下,可一鍵實現(xiàn)模糊匹配篩選。通過二分法查找已有詞匯,自動匹配相似句子或短語,插入譯文提供給翻譯人員。經(jīng)人工修正后,可導(dǎo)出為源文檔格式譯文。
2? 系統(tǒng)設(shè)計與實現(xiàn)
2.1? 系統(tǒng)流程設(shè)計
系統(tǒng)整體采用C#實現(xiàn),數(shù)據(jù)存儲于SQL Server中,運行主界面由Bootstrap和Jquery搭建可視區(qū)域[7]。根據(jù)功能劃分為三部分,分別為左上的記憶庫動態(tài)匹配句段、右上的參考詞匯表和下部的輔助參考譯文。這一部分可直接編輯修改譯文,或添加新的翻譯段落。此外,系統(tǒng)支持記憶庫的句段查詢和詞匯表查詢,從而省去了再通過其他途徑查詢術(shù)語詞匯的過程。系統(tǒng)整體風(fēng)格簡易,使用功能明確。
目標(biāo)翻譯文本錄入系統(tǒng)后,其翻譯流程如圖1所示。
待譯文本通過系統(tǒng)識別,確定文本類型后,經(jīng)由預(yù)處理模塊詞法解析和預(yù)編譯后產(chǎn)出第一次翻譯樣例。原文與翻譯文本句子對齊存儲方式為:XML語言編碼,以“翻譯單元”形式存儲,文本和翻譯待定項逐一對應(yīng),通過ID標(biāo)記進行描述[8]。此外,可調(diào)用Trados檢索模塊和記憶庫,自動建立語料信息資源庫,再引用Trados自帶的術(shù)語庫進行功能管理,從而可進一步提高產(chǎn)出效率和匹配精準(zhǔn)度[9]。
2.2? 測試用例分析
本文從1 000份的語料中隨機抽取了多份語料文獻,文章類型涵蓋了大部分的科技英語形式,并將其分為3大類。其中測試集1為旅游、財經(jīng)類內(nèi)容,測試集2為科技類內(nèi)容,測試集3為娛樂類內(nèi)容,每個測試集隨機選取6份不同數(shù)量的語料文件進行測試。此外,討論內(nèi)容也選取不同方向,力求進行一次全面測試。對語料進行過濾分類后,通過輔助翻譯系統(tǒng)進行語段詞法解析。直接收集分類結(jié)果,統(tǒng)計準(zhǔn)確率、精確率、語境貼合度等評價指標(biāo)[10],其結(jié)果匯總?cè)绫?所示。
從表中可知,分類準(zhǔn)確率最高可達90%左右,且詞法精確率有83%。各分支類型中較為生僻的旅游、財經(jīng)平均翻譯精準(zhǔn)度最低,但仍有80%的詞法精準(zhǔn)率。由此反映出,本文所提出的基于Trados平臺開發(fā)適用于科技英語領(lǐng)域的輔助翻譯系統(tǒng)具備較好的適用度及可擴展性。其只要將記憶庫中的參考譯文進行再豐富,并加強生僻冷門術(shù)語和學(xué)科的詞法引用,翻譯的精準(zhǔn)度將會大幅提升,達到學(xué)術(shù)級要求。
3? 結(jié)? 語
本文提出一種搭建在Trados輔助翻譯系統(tǒng)平臺上的、適應(yīng)科技英語特性的語料翻譯系統(tǒng)。系統(tǒng)旨在實現(xiàn)對學(xué)術(shù)性、專業(yè)性、精準(zhǔn)率要求均較高的學(xué)術(shù)論文或?qū)W術(shù)著作的高質(zhì)輔助翻譯。尤其對于歷史記憶語段豐富的詞法結(jié)構(gòu),可保證絕對準(zhǔn)確的翻譯和語境貼合度,大幅減少了人工成本投入。文中從系統(tǒng)的核心模塊分析,關(guān)鍵技術(shù)討論著手,細(xì)致說明了系統(tǒng)的設(shè)計與實現(xiàn)過程。最終以實例數(shù)據(jù)結(jié)果表明,本系統(tǒng)具備較高的輔助翻譯質(zhì)量和準(zhǔn)確率,可充分滿足學(xué)術(shù)專業(yè)文獻的翻譯需求,且具備良好的擴展與二次開發(fā)性。
參考文獻
[1] 錢多秀.計算機輔助翻譯[M].北京:外語教學(xué)與研究出版社,2011.
[2] 李丹,許霄羽,楊悅.基于語義網(wǎng)技術(shù)的網(wǎng)絡(luò)機器翻譯研究[J].現(xiàn)代電子技術(shù),2011,34(4):107?109.
[3] 李長栓.非文學(xué)翻譯[M].北京:外語教學(xué)與研究出版社,2009.
[4] 宋淑彩,龐慧,丁學(xué)鈞.GA?SVM算法在文本分類中的應(yīng)用研究[J].計算機仿真,2011,28(1):222?225.
[5] 諶婉瑩.TRADOS翻譯軟件運用中術(shù)語收詞問題研究[D].重慶:重慶大學(xué),2016.
[6] 郭轉(zhuǎn)輝.TRADOS翻譯科技英語的譯文質(zhì)量測評[D].重慶:重慶大學(xué),2011.
[7] 李偉.Trados輔助翻譯軟件在科技英語翻譯中的應(yīng)用[D].武漢:華中師范大學(xué),2012.
[8] 王曉鳳,張建偉.科技詞匯的范疇化動因及其語義認(rèn)知與翻譯[J].中國科技翻譯,2011,24(4):1?4.
[9] 閆冰.TRADOS在促進譯者快速學(xué)習(xí)和提高翻譯產(chǎn)出效率方面的積極作用[D].上海:上海外國語大學(xué),2012.
[10] 吳承鳳,劉濤.機器翻譯中的多模糊語義自動判斷方法研究[J].現(xiàn)代電子技術(shù),2017,40(14):75?77.
[11] 于佳弘,莊天賜,昌雨葒.淺談Trados輔助翻譯軟件和語料庫在公開課英文字幕翻譯中的應(yīng)用[J].知識經(jīng)濟,2019(36):103.