車麗潔,紀衛(wèi)寧
(青島農(nóng)業(yè)大學 外國語學院,山東 青島 266109)
近年來,我國在雙語平行語料庫的構(gòu)建方面取得顯著成就,形成許多大型雙語語料庫,不斷豐富國內(nèi)語料資源,其中,專利文獻語料庫屬于專門用途語料庫。專利文獻是具有特定規(guī)范的科技文獻,涉及各個領(lǐng)域的新發(fā)明、新技術(shù)、新方法、新產(chǎn)品等。[1]相比于傳統(tǒng)的翻譯方法,利用計算機輔助翻譯軟件Transmate,Trados,Tmxmall等輔助翻譯,構(gòu)建專利文獻翻譯平行語料庫,可有效解決傳統(tǒng)模式的弊端,輔助譯員掌握專利文獻的翻譯規(guī)范,統(tǒng)一專業(yè)術(shù)語,提高翻譯效率與質(zhì)量。
基于此,本文結(jié)合專利文獻的自身特點,介紹我校專利文獻翻譯團隊創(chuàng)建專利文獻翻譯平行語料庫的方法和實施過程,探討翻譯平行語料庫對翻譯實踐和翻譯教學的有效作用。
專利文獻的特點為專業(yè)性強,具有固定的語言表達方式,表述嚴謹規(guī)范。譯員在翻譯專利文獻時往往會遇到詞語內(nèi)涵理解錯誤,搭配不當,詞性、語態(tài)轉(zhuǎn)換機械等問題。構(gòu)建專利文獻翻譯平行語料庫,可培養(yǎng)譯員翻譯素養(yǎng),遵守專利翻譯規(guī)范,形成相符翻譯風格。此外,術(shù)語庫及預翻譯功能可統(tǒng)一專業(yè)術(shù)語,提高翻譯質(zhì)量及項目小組合作效率。
譯員在專利翻譯入門階段,由于缺乏相關(guān)的百科知識,無法正確理解原文,會認為專利文獻翻譯難度大。實際上,專利文獻的文本結(jié)構(gòu)和語言句式較為固定,涉及大量慣用詞組。例如,專利文摘的起始句有固定表達格式,The invention relates to/provides/discloses/belongs to;專利名稱后的過渡詞“包括”“其特征在于”“其中”等可分別翻譯為“comprises”“be characterized in”“wherein”等;專利文摘在介紹產(chǎn)品優(yōu)點部分時也需要按固定句型翻譯成 “has the advantages of或that…”。除了具有固定的詞匯以及語法結(jié)構(gòu)特征,專利文獻翻譯又具有其特定的注意規(guī)范和翻譯風格,譯員須明確了解專利翻譯規(guī)范,按照專利文獻的文體特征進行翻譯。專利文獻翻譯平行語料庫的建立可幫助譯員迅速而高效地掌握專利文獻的語言形式特征和翻譯風格和規(guī)范,培養(yǎng)譯員的專利翻譯意識。
術(shù)語管理在專利文獻翻譯中至關(guān)重要。有研究表明,譯者75%的時間用在術(shù)語的翻譯上。[2]專利翻譯中含有大量的術(shù)語,其術(shù)語密度高,要花費譯者較多時間和精力來翻譯。同時,專利翻譯涉及的專業(yè)領(lǐng)域多,不同的專業(yè)領(lǐng)域術(shù)語有不同的譯法,不能望文生義。例如網(wǎng)絡(luò)社區(qū)中為了隱藏身份而注冊的ID稱為 “馬甲”,應譯為“sockpuppet”,而非“waistcoat”;又如,用于集中器和采集器的UART接口“復用”擴展裝置,該句屬于通信領(lǐng)域,復用應為“multiplex”,指多路傳輸?shù)?,而非“reuse”重新使用。此外,專利翻譯中有許多慣用詞組,例如,實用新型,utilitymodel;具有,be provided with;多個,a plurality of等等。此外,專利術(shù)語翻譯的原創(chuàng)性高。專利都是對新發(fā)明的技術(shù)或產(chǎn)品的描述,作者往往會創(chuàng)造一些新的術(shù)語來表達新的概念。這些術(shù)語在工具書中查詢不到,需要譯者根據(jù)原文創(chuàng)造新的術(shù)語進行翻譯。
專利文獻翻譯平行語料庫的建立可以有效解決術(shù)語管理的任務(wù)。我們利用語料庫中Transmate的記憶庫管理功能,可以實現(xiàn)術(shù)語的收集、描述、記錄、存貯、呈現(xiàn)及查詢等工作。啟用預翻譯功能,達到匹配率的記憶庫文本可自動填充到譯文欄中,譯員可將其作為參考譯文,減少譯員查詞的工作量,確保譯稿的術(shù)語統(tǒng)一,實現(xiàn)譯文用詞的一致性,同時大大提高翻譯的效率。
建設(shè)專利文獻翻譯平行語料庫的步驟包括對語料的采集、對齊、整理與加工等。首先應結(jié)合構(gòu)建語料庫的目的,選取不同領(lǐng)域的語料,確保語料庫的豐富性和代表性;再利用計算機輔助翻譯軟件進行雙語語料對齊,其是建立語料庫的核心步驟;最后需對語料庫進行詞性標注,深層次整理加工語料庫。
高質(zhì)量語料的采集對語料庫的構(gòu)建與應用具有重要意義。本項目通過采集外國語學院創(chuàng)譯工作室的知識產(chǎn)權(quán)專利翻譯內(nèi)容作為原始語料,由于其皆是原文與譯文一一對應的段落,且以word文檔形式保存,相比于網(wǎng)上下載的雙語資料,文檔格式轉(zhuǎn)換以及處理選取語料的排版步驟皆可省略。在構(gòu)建該專利文獻翻譯平行語料庫之前,應研究分析農(nóng)學、建筑、醫(yī)學、物理、化學、交通等不同領(lǐng)域的專利文獻中英句式特點,從而總結(jié)出影響語料庫與譯文質(zhì)量的語句是哪些類,譯員在科技文獻翻譯初級階段時易犯哪些錯誤等。據(jù)此,我們根據(jù)合作翻譯公司的質(zhì)檢反饋稿件,選取無語法錯誤、符合專利翻譯規(guī)范的高質(zhì)量文本,保證所選取語料的語言質(zhì)量和翻譯質(zhì)量。
語料采集后,需要對語料進行對齊。在語料對齊時選取句級對齊單位,即由一個或多個自然的中文/英文句子組成且中英文句子間具有翻譯關(guān)系。[3]具體操作辦法如下:
(1)首先登錄網(wǎng)站 http://www.urelitetech.com.cn/免費下載安裝Transmate單機版V7.3.0.1218,相比于雅信,DéjàVu和Trados等CAT軟件,該軟件操作簡單,方便易學。
(2)打開軟件后,點擊【語料管理】—【雙語對齊】—【導入文件】菜單,此時會彈出“導入雙語文件”對話框,選擇文件路徑,導入選取的語料,點擊確定后,成功導入原始語料。
(3)對段落合理分析,進行語句拆分,直至源語言與目標語言一一對齊。
(4)語料對齊工作完成后,點擊菜單【導出到記憶庫功能】,選擇相應的記憶庫,可以將其單獨導出到記憶庫。此外,也可將對齊的語料庫導出為tmx、txt等各種格式的文檔內(nèi),方便共享。
(5)點擊【設(shè)置】—【選項】,在彈出的對話框中可設(shè)置【模糊匹配】,即最低匹配率,在【機器翻譯】選項下,啟用一項在線翻譯,輸入已申請的API(Application Programming Interface,應用程序編程接口)設(shè)置,設(shè)置完畢后,即可準備測試語料庫的應用效果。
雙語語料對齊后,該專利文獻翻譯平行語料庫仍為生語料庫,即沒有經(jīng)過任何處理的電子文件語料庫,而詞性標注可進一步提高語料庫的利用價值。未經(jīng)加工的生語料庫中無法分開檢索不同詞性的同一詞形,即若檢索“焊接”,可為名詞性“焊接裝置”,也可為動詞性“焊接某物”。因此,利用中國科學院計算技術(shù)研究所開發(fā)的ICTCLAS漢語分詞軟件,可對中文詞匯進行賦碼處理,即對不同詞性的詞匯進行標注,再利用Treetagger對英文詞匯進行賦碼處理,最后還需進行人工校對。[4]
此外,該專利文獻翻譯平行語料庫為開放性語料庫,譯員可邊建邊用,其提供編輯功能,即對齊后的源語言與目標語言皆可再編輯修改。因此,譯員可不斷完善語料庫,提高語料庫的實用價值。
語料庫構(gòu)建完成后,其可提供大量專利文獻英漢語言實例,應用于科技英語翻譯教學過程,也可用于培訓譯員的專利翻譯意識,指導譯員進行專利翻譯實踐。此外,計算機輔助翻譯軟件提供翻譯記憶庫功能、術(shù)語萃取及術(shù)語庫管理功能、項目管理功能等,可實現(xiàn)團隊高效率的協(xié)作翻譯。
(1)雙擊軟件圖標,運行 Transmate,點擊【創(chuàng)建項目】建立項目,定義項目,設(shè)置源語言 (source language),即原文的語言與目標語言(target language),即譯員需輸出的語言,填入項目路徑,項目創(chuàng)建完畢。
(2)點擊【我的項目】,選擇需操作的項目,啟用【記憶庫】,即掛庫,雙擊打開需翻譯的原文,進入翻譯界面。也可在已創(chuàng)建項目內(nèi)導入文件,并打開進入翻譯界面,此方法可用于導入txt格式的文檔。
(3)點擊【預翻譯】,設(shè)置參數(shù),包含啟用何種在線翻譯或術(shù)語等,設(shè)置匹配率。
(4)預翻譯完成后,譯員可根據(jù)參考譯文進行修改,再點擊【確認】,保存該句譯文,利用快捷鍵“ctrl+enter”或者點擊【下一句】進入下一句的翻譯。
(5)翻譯文檔完成后,可以導出譯文,也可以導出雙語對照,便于導入記憶庫,存儲于記憶庫內(nèi),擴大語料庫。
Transmate軟件具有術(shù)語萃取及術(shù)語庫管理功能,通過“語料管理”的術(shù)語萃取功能,打開翻譯文件,設(shè)置最小出現(xiàn)頻率,可由系統(tǒng)自動篩選術(shù)語并導入術(shù)語庫,也可在翻譯過程中手動添加專業(yè)術(shù)語,進而建立術(shù)語庫。通過“語料管理”的術(shù)語庫管理功能,譯員可導入所需術(shù)語文件,也可根據(jù)需要自行添加術(shù)語,對術(shù)語進行整理匯總,確保術(shù)語正確性、一致性、無重復性與完整性;此外,譯員可在已建立的術(shù)語庫中檢索所需相關(guān)術(shù)語信息,提高查詢專業(yè)術(shù)語的效率。
相比于句級對齊單位,精確的術(shù)語單位可提高系統(tǒng)的語句匹配率。術(shù)語庫的建立對于多人合作的翻譯項目具有重要作用。在翻譯實踐中,一庫多用,可共享術(shù)語,保證所有譯稿的術(shù)語一致性,提高翻譯團隊的效率。同樣,術(shù)語庫也需不斷修改完善,在應用過程中不斷提出質(zhì)疑,做到定時更新。術(shù)語庫的建立對詞匯處理有以下優(yōu)點:
(1)有些詞匯屬于一詞不可多譯類,譯員在翻譯該類詞匯時,術(shù)語庫會提示譯者相應的譯法,避免其有各自的譯法,導致術(shù)語的不統(tǒng)一,增加譯后整稿的工作量。
(2)有些詞匯屬于一詞可多譯類,術(shù)語庫中會有其相應的分類,可節(jié)省譯員查詢術(shù)語、確定相應領(lǐng)域的時間,例如“下料”是專利翻譯的常見詞匯,若是指鋼板下料,剪切力下料,應用blanking;若是指切割,則用cutting;若是指粉劑流出等的下料,則用discharging。
Transmate網(wǎng)絡(luò)版具有項目管理功能,可實現(xiàn)項目化管理。翻譯項目進行之前,“項目管理”可結(jié)合已有的翻譯記憶庫對翻譯文件分析,預估所需翻譯時間。項目經(jīng)理建立項目后,可通過項目管理端查找譯員、分發(fā)任務(wù),譯員也可從項目管理端接受翻譯任務(wù),從而實現(xiàn)翻譯團隊協(xié)作翻譯?!绊椖抗芾怼笨蓪崿F(xiàn)語料資源在線共享,項目經(jīng)理可實時更新術(shù)語庫,定期分享給譯員,確保譯稿術(shù)語的統(tǒng)一性,提高稿件翻譯質(zhì)量。此外,譯員的翻譯進度以百分比顯示,項目經(jīng)理可通過項目管理端實時監(jiān)控稿件翻譯進度,實現(xiàn)對譯員的管理和監(jiān)督。
相比于傳統(tǒng)的翻譯教學模式,將專利文獻翻譯平行語料庫應用于科技英語翻譯教學中具有以下優(yōu)點:
(1)通過建立翻譯教學案例庫,基于語料庫強大的檢索功能,其可為學生和老師提供豐富翻譯案例,拓展學生思維。學生可在特定的語境下對于不同雙語對譯案例分析,分析詞匯、短語、句式的差異,學習翻譯策略技巧,增強翻譯意識。
(2)基于語料庫的翻譯教學模式,可以增強學生與教師的交流,提高學生在課堂上的參與度。一句多譯可增強學生的思辨能力,學生可賞析譯文,體會不同的譯者風格,針對多種翻譯技巧探討分析,可提高學生的邏輯分析能力,增強學生的主觀能動性,從而有利于提高翻譯教學質(zhì)量。
在建設(shè)專利文獻翻譯平行語料庫過程中,我們對所遇到的各種問題進行分析,提出可參考的解決辦法,以便提高建庫的效率與質(zhì)量。我們將建庫中所遇到的問題及分析方案進行記錄整理,如下:
為了表述的嚴謹性和詳盡性,專利中通常對同一主題或事物的描述放在一句話中。因此,長句是專利文獻的一個重要特點。[5]譯員嚴謹分析選取的專利翻譯文摘,進行合理的語句劃分,便于語料對齊工作,提高預翻譯中語句匹配率。若不對長句做妥善處理,必然導致專利文獻中的部分語句無法逐一對應,增加語料對齊的難度,例如:尤其是一種……的加工結(jié)構(gòu),該句涉及一個長定語,若要拆分成小句,則需改變原文,改為“尤其是一種加工結(jié)構(gòu),其加工結(jié)構(gòu)……且……”從而實現(xiàn)原句與譯句的平行對應。
大段對齊會降低系統(tǒng)的匹配率,不利于快速定位到合適的小句或?qū)I(yè)詞匯。過于精煉的詞匯會增加語料對齊的工作量,而一些專業(yè)術(shù)語的出現(xiàn)頻率并不高。此外,詞匯級對齊任務(wù)難度大、易出錯,因為大多數(shù)自然語言之間往往缺乏一對一的對應關(guān)系[6],因此一般選擇句級對齊單位,其既可提高預翻譯的語句匹配率,又可減少對齊任務(wù)工作量。因此在導入原文前,可將段落拆分成語句,拆分方法如下:打開一篇以txt格式保存的專利文獻原文文檔,使用回車符將每一個句子位于單獨的一行,以此類推,完成段落的拆分。拆分完成后,按上文描述導入文件,打開翻譯界面時,將顯示各個不同的語句,而非一個整體段落。
計算機輔助翻譯軟件具有語料分析功能,系統(tǒng)可統(tǒng)計出高頻詞匯,譯員可據(jù)此建立術(shù)語庫,但需進行篩選和補充,因為譯稿中的一些專業(yè)術(shù)語出現(xiàn)頻率低,不能被系統(tǒng)篩選出,需要譯員自行添加;譯員還需刪除多余的高頻率普通詞匯,例如冠詞a等。因此,創(chuàng)建術(shù)語庫之后,譯員應整理匯總術(shù)語庫,定期更新術(shù)語庫,確保術(shù)語庫的質(zhì)量。高質(zhì)量的術(shù)語庫有助于譯稿的術(shù)語統(tǒng)一,方便質(zhì)檢譯員質(zhì)檢。
使用Transmate時,導入的文件應為其所支持的文檔格式,若源文件格式不支持,可用相應的工具轉(zhuǎn)換成Transmate所支持的格式。語料對齊前,由于專利文獻前具有專利號,可在整理原始語料時將其刪除,或在導入語料庫之后,開始對齊工作前刪除。語料對齊后,可直接導出tmx格式文本,但其不便于整理分析,可將雙語平行語料先導出到記憶庫,再將記憶庫的對齊語料導出,即可導出txt格式的對齊語料,命名后保存在純文本文檔內(nèi),形成雙語平行語料庫文本,便于譯者對語料庫的整理分析。此外,在應用語料庫進行預翻譯時,應將稿件整理為雙語對應的文字形式,可提高利用Transmate進行翻譯的效率。翻譯之后導出的文本也需整理為符合譯文規(guī)范的標準格式。
計算機輔助翻譯軟件有助于譯者提高翻譯效率和翻譯的準確性。專利文獻翻譯平行語料庫的建設(shè)可用于指導譯員進行專利翻譯實踐,減少譯員確定和統(tǒng)一術(shù)語的環(huán)節(jié),提高翻譯實踐的效率和質(zhì)量。目前機器輔助翻譯已代替?zhèn)鹘y(tǒng)的人工翻譯成為翻譯行業(yè)的主流翻譯模式,譯員提前了解并使用計算機輔助翻譯軟件,也可為以后進入翻譯公司,快速熟悉翻譯流程奠定基礎(chǔ)。此外,專利文獻翻譯平行語料庫也可應用于科技英語翻譯教學過程,老師可隨時調(diào)出所需教學素材的原文及譯文示例用于課堂教學。學生也可根據(jù)語料庫提供的豐富語料,學習翻譯技巧,評估多種譯文,培養(yǎng)自主學習能力和批判性思維能力。