談格式化在翻譯及本地化中的重要意義

2012-08-15 00:55付強

山東電力高等?？茖W校學報 2012年5期

付強

曲阜師范大學外語教研部山東曲阜 273165

0 引言

譯者翻譯的往往是文件，而不只是文本。也就是說，譯者收到的不是TXT格式的文件，而是具有一定格式的文本，是用戶可讀的數據以及機器可讀的代碼。由于譯者所翻譯的文件大多采用Word格式，所以人們通常認為格式化與翻譯無關。作為計算機用戶，譯者并不需要“讀”代碼來理解文本，但這并不意味著譯者不需要關注代碼。事實上，了解文件與格式化之間的關系是很有必要的。數字化時代帶來了可處理翻譯的現(xiàn)代技術，主要是翻譯記憶（TM），但同時也帶來了格式化問題?；诜g記憶的文本再利用（text reuse）會產生很高的翻譯效益，但處理格式化問題所花費的時間往往會將該效益抵消。

對于從事本地化工作的譯者而言，格式化顯然是其工作的一部分，但格式化問題并未得到應有的重視。目前開設的各種輔助翻譯課程模塊往往更多地強調技術方案學習，且這些方案通常認為格式化問題只是計算機軟件、翻譯記憶或本地化工具應注意的事項。Bowker（2002:37－39,118－119）和Somers（2003:18－19）只是簡單地提及格式化問題。盡管一些文獻（Reynolds＆Jewtushenko,2005）指出了格式化的重要性，但格式化問題在譯者培訓中基本仍是空白。

譯者關注的核心問題是文本而并非格式。但是，格式化仍是譯者工作的一部分，目前的技術還不能很好地將文件中的文本與格式分開。在實現(xiàn)完全XML方案之前，數字化時代的格式化問題仍相當重要。

1 翻譯行業(yè)特點及格式化趨勢

在翻譯行業(yè)中，譯者的薪水通常不是年薪或月薪，特別是自由譯者，其薪水是按翻譯工作量（字數）結算的。如Chesterman＆ Wagner（2002:1）所言，譯者工作在“文字層面”，要拿出“翻譯文字量”。翻譯行業(yè)的入職門檻較低，受過雙語教育的人經過一定時間的訓練和指導大都可以成為一名譯者，但只有能夠快速翻譯的人才可將翻譯作為職業(yè)。

本地化及翻譯行業(yè)通常需要譯者高質量快速完成大量的翻譯任務。據統(tǒng)計，2005年世界翻譯市場的規(guī)模達到227億美元，其中中國大陸地區(qū)翻譯市場的產值為210億元人民幣，而2007年中國的翻譯市場產值更達到300億元（黃友義，2010:49）。如個體譯者一樣，翻譯公司也是按照其提交給客戶的翻譯字數收費，只有提高生產率才能增加效益。隨著計算機技術的發(fā)展，人們開始采用數字化的翻譯工具提高翻譯生產力，最常用則是利用翻譯記憶工具對文本進行翻譯，并利用本地化工具對程序文件中嵌入的短字符串進行翻譯，通過再利用已有的翻譯文本及其格式獲得生產力。事實上，格式再利用所得效益可能要大于文字再利用所得效益，而對格式化的研究卻并未得到人們的重視。

就本地化而言，其涉及到項目經理、平面設計師、軟件工程師和其他轉換、質量保證、桌面出版調整和測試等人員（Esselink,1998:258－273），而譯者的作用則僅限于自然語言字符串的替換，翻譯也許僅僅占本地化工作量的30%左右。但是，與這些自然語言字符串的格式相關的任務往往是非常巨大的。具有諷刺意味的是，在翻譯研究試圖突破數十年處于主導地位的等價模式之際，本地化行業(yè)及以市場為導向的翻譯理論研究卻朝著相反的方向發(fā)展，在國際化的驅動下，將翻譯規(guī)定性地限定為受控等價（controlled equivalance）（Pym,2004:62－65），從而使譯者增加了額外的負擔。

譯者通常有兩種方法可對格式進行處理。方法之一是覆蓋文件，但如果譯者沒有原始文件的創(chuàng)建程序且不了解該程序，這種方法是難以實施的。即使翻譯的文件比較簡單，將其文本與代碼分開也不是一件容易的事，覆蓋也不能實現(xiàn)已翻譯文本的再利用。另一種方法則比較有意義，即利用翻譯記憶工具，在大多本地化項目中譯者被迫采用這種工具。盡管如此，仍有很多格式問題在翻譯記憶工具中尚未得到解決。譯者在使用這些工具時會遇到很多的格式問題，技術性越強，處理的格式問題就越多。

精確地衡量譯者在格式問題處理中所使用的時間和精力是比較困難的。作為一名譯者，筆者根據自己的經驗可以猜測，文字再利用所節(jié)省的時間和精力會因處理格式而抵消。本文將通過討論當前技術的限制性來驗證這一假說。

2 輔助翻譯工具的功能限制

從理論上講，翻譯記憶工具和本地化工具都是在翻譯之前將文本與代碼分開，然后再將譯文文本與源代碼合并，從而實現(xiàn)格式再利用。在翻譯過程中，利用已翻譯句子和術語庫中的術語就可再利用文本。但是，只有重復的內容可為譯者提供幫助，譯者可將精力用于更具挑戰(zhàn)性的文本，但譯者仍無法逃避格式問題。

格式和代碼處理應是計算機工程師或桌面出版商的核心工作。當譯者對文本進行再利用時，他們往往也不得不對格式進行處理。首先，翻譯記憶庫采用的是專有格式，不允許與其他翻譯記憶庫進行動態(tài)數據交換，而譯者為不同的語言服務商工作時往往需要進行這種數據交換。其次，由于這些句段的數據庫也保持著內聯(lián)格式（文本流內的格式，不是結構格式），文本和格式都正確的句段比只有文本正確的句段更好匹配。

事實上，最終客戶、語言服務商、譯者和翻譯記憶工具之間的純文本交換并不困難，比較困難的是對包含內聯(lián)格式和元數據信息的文本進行處理。從二十世紀九十年代后期開始，Trados所采用的格式在該行業(yè)中已成為事實上的標準，大多數開發(fā)商試圖通過與Trados兼容來解決格式問題。當翻譯記憶交換（TMX）標準出現(xiàn)時，開發(fā)商都聲稱符合TMX標準。但是，與Trados相兼容的各軟件之間翻譯記憶數據的交換過程并不十分完美，甚至支持最新1.4b版本標準的TMX認證產品之間的交換也不完美。事實上，開發(fā)商自己也希望在記憶數據交換過程中減少關鍵數據的丟失。

從文本再利用到格式再利用，問題也會隨之增多。將文件導入任何翻譯工具時都需要經過一個過濾器，將原始文件轉換為翻譯編輯器可讀取的格式。創(chuàng)建這些過濾器以及對過濾器進行定期升級維護對開發(fā)商而言都是資源浪費。這些問題表明，將導出文件時轉換為其原生格式是有必要的。

我們還必須考慮隱錯的可能性（在文件中、過濾器中、編輯器中），具體格式的困難（MIF文件、資源文件），以及后臺運行硬件／軟件的可能干擾。在翻譯中還有文本擴展問題，這往往需要譯后調整，特別是針對DTP文件。

理論上講，譯者和翻譯項目經理比較了解這些翻譯工具的使用情況。真正的困難往往在于出現(xiàn)格式問題時，譯者和經理要有能力解決這些問題。為此需要考慮額外的預算和時間，這有可能會抵消文本再利用所得到的效益。

3 開放標準的優(yōu)越性

格式問題是技術性的，其解決方案也應是技術性的。通過TMX等一系列開放標準，格式問題將逐漸得以解決。在XML技術出現(xiàn)之后，可對文本再利用進行標準化，因為可以適當地設計XML，從而將文件的內容與形式分開。

本地化行業(yè)標準協(xié)會（LISA）于1997年成立了一個專門機構，開發(fā)文本再利用標準，該機構被授權制定形式／內容再利用開放標準（OSCAR）。TMX是出現(xiàn)的第一個此類標準，1.0版本于1997年12月發(fā)布，最新的1.4b版本于2004年10月發(fā)布，1.4b版本支持格式和元數據交換。主流的翻譯記憶工具幾乎都與1.4b標準兼容。同時開發(fā)了術語庫交換標準（TBX），以滿足語言服務商及各種工具之間術語交換的需求。隨后開發(fā)了斷句規(guī)則交換標準（SRX），以實現(xiàn)完美的TMX交換。所以這些OSCAR標準都可處理文本再利用，而這些標準的最大優(yōu)勢則在于格式重復利用。2000年開發(fā)的一個新標準就是被人所熟知的XLIFF（XML本地化交換文件格式），該標準已被結構化信息標準促進組織（OASIS）所接受。1.1版的XLIFF標準已于2003年初成為OASIS規(guī)范。

XLIFF標準用于可譯或本地化文本在不同文件格式之間的交換。采用XLIFF格式，內容就可在翻譯進程中自由交換，而不受其原生文件格式的影響，也不受所使用翻譯記憶工具或本地化工具的影響。XLIFF轉換工具將結構格式變成一個框架文件，然后將原文和譯文的內容及其內嵌的格式斷句分成翻譯單元。翻譯時，XLIFF文件與框架重新合并，以再利用格式。

盡管XLIFF格式中的翻譯單元是雙語，但可以在一個文件中捆綁數個文件來處理多語項目。XLIFF格式不僅僅是與其他文件格式的簡單接口，它還允許可譯文本的最小離散單元句段保存在翻譯記憶數據庫中循環(huán)使用，形成復雜的元數據。該元數據可用來跟蹤每一句段的原始版本，并跟蹤句段所處的工作流程階段，包括數據、作業(yè)標識、客戶、譯者／譯審、備注信息等。XML標準還可進一步擴展，以滿足未來的需求（Reynolds＆Jewtushenko,2005）。

采用XLIFF格式對本地化行業(yè)益處頗多。復雜的項目可能要處理三十多個不同類型的文件，從EXE和DLL編程文件到HTML和XML及其衍生文件，以內容為導向和以設計為導向的DTP程序所生成的格式，以及不同的Microsoft Office應用程序。一旦采用了該標準，則不必為每一種文件格式以及翻譯記憶工具之間交換的數據創(chuàng)建多種過濾器，軟件開發(fā)人員僅需為每一種文件格式開發(fā)一種過濾器，從而允許開發(fā)商轉移資源并精簡算法，使譯文可全面簡單地被再利用。

在XLIFF環(huán)境中，客戶可只將可譯文本傳遞給語言服務商，而保留具有商業(yè)敏感性的代碼。在將XLIFF文件轉換為其原生格式的過程中僅僅需要對其翻譯記憶進行更新。同時，不必再限定于一個特定的語言服務商或某一特定的翻譯工具。對于語言服務商，尤其是高端的多語種服務商，XLIFF標準則意味著節(jié)省管理、設計和DTP成本，而不必將其語言資產限定于一種特定的翻譯記憶工具。對于譯者，XLIFF標準則意味著他們將能夠重新將精力集中在文本方面，而不需過多地關注格式問題，因為文本翻譯才是他們的核心工作。在前數字時代，譯者所需要做的僅僅是文本翻譯，而XLIFF標準則將前數字化時代的優(yōu)勢與數字時代的優(yōu)勢結合在了一起。同時，譯者也不需要被限定于使用某一種特定的工具，擺脫任何第三方的信息，譯者只需擁有并使用任何一種可兼容XLIFF的工具。

4 結語

XLIFF對本地化行業(yè)而言就如同Unicode一樣重要。Unicode可進行多種語言寫入，XLIFF則可在不同語言、不同本地化工具之間將該書寫文本進行傳遞，采用XLIFF可極大地促進脫離客戶管理系統(tǒng)的本地化過程。

但是，XLIFF標準的發(fā)展需要一個長期的過程。目前，其他多種格式和過濾器仍并存使用，一些所謂符合XLIFF標準的工具也存在這些問題，使得所生成的代碼并不易于交換。XLIFF標準已經進入翻譯與本地化行業(yè)，并已在本地化工具（Catalyst,Passolo,WinRC等）和翻譯記憶工具（Trados,Heartsome等）中采用，新開發(fā)的翻譯記憶工具及本地化工具大都接受并已采用XLIFF標準。事實上，可以在一個完全XML方案中，采用更先進的XLIFF標準，實現(xiàn)從文本創(chuàng)作到本地化、出版和歸檔的全過程的無縫隙管理，從而使整個過程都處于項目經理的監(jiān)督之下。

［1］Bowker,L.Computer－Aided Translation Technology:A Practical Introduction ［M］.Ottawa:University of Ottawa Press,2002.

［2］Chesterman,A.＆ Wagner,E.Can Theory Help Translators［M］.Manchester:St Jerome Publishing,2002.

［3］Esselink,B.A Practical Guide to Software Localisation［M］.Amsterdam ＆ Philadelphia:John Benjamins,1998.

［4］Pym,A.The Moving Text.Localization,Translation,and Distribution ［M］.Amsterdam and Philadelphia:John Benjamins,2004.

［5］Reynolds,P.＆ Jewtushenko,T.What Is XLIFF and Why Should I Use It? ［J］.XML Journal,2005 （04）.

［6］Somers,H.Computers and Translation:A translator’s Guide ［M］.Amsterdam／Philadelphia:John Benjamins,2003.