羅季美
(同濟(jì)大學(xué)外國語學(xué)院,上海 200092)
隨著計算機(jī)科學(xué)技術(shù)、語言學(xué)、邏輯學(xué)和信息學(xué)等相關(guān)學(xué)科的發(fā)展,在最近的三十多年中,機(jī)器翻譯研究無論在理論方面還是工程實踐方面都已經(jīng)積累了豐富的經(jīng)驗,取得了顯著的成就,尤其在對受限語言①[1]的處理上,機(jī)器翻譯已達(dá)到了最高的5級適用級別和85%的可翻譯度[2]。本文將以“汽車技術(shù)文獻(xiàn)翻譯語料庫”為基礎(chǔ),對機(jī)器在這一受限語言范疇內(nèi)表現(xiàn)出的術(shù)語翻譯錯誤進(jìn)行歸納、描述和分析,縮小這一限定語言內(nèi)術(shù)語的范疇和詞義,為翻譯系統(tǒng)在原有基礎(chǔ)上提高對這一受限語言范疇內(nèi)的機(jī)器翻譯質(zhì)量提供語言分析基礎(chǔ)。
在受限語言內(nèi)進(jìn)行機(jī)器翻譯也是計算機(jī)翻譯誕生之初人們所限定的機(jī)器翻譯的使用范圍[3]?!稒C(jī)器翻譯后譯文編輯模式研究》②項目組選擇了同濟(jì)大學(xué)汽車學(xué)院“汽車技術(shù)文獻(xiàn)翻譯語料庫”中某一知名品牌汽車操作手冊這一受限語言語料作為研究對象,對十萬句對的英語原語料、機(jī)器翻譯譯文和人工翻譯譯文進(jìn)行了一句英語原文對應(yīng)一句機(jī)器譯文和一句人工譯文的平行對比。其中機(jī)器譯文由“華建機(jī)器翻譯系統(tǒng)”(中國科學(xué)院計算機(jī)語言信息工程研究中心研發(fā))生成獲取,人工譯文來源于同濟(jì)大學(xué)汽車學(xué)院資料翻譯研究所[4]。
筆者作為語料對比的參與者,在人工逐句對比的基礎(chǔ)上,對機(jī)器翻譯中的詞匯、句法和符號等翻譯錯誤進(jìn)行了標(biāo)注、統(tǒng)計。下文將對機(jī)器在詞匯處理中的術(shù)語翻譯錯誤做出歸納、描述和分析說明。
術(shù)語是各門學(xué)科的專門用語。《蘇聯(lián)大百科全書》定義術(shù)語是用來準(zhǔn)確標(biāo)示專門領(lǐng)域內(nèi)的概念及其與其他概念關(guān)系的詞或詞組,是該領(lǐng)域內(nèi)有代表性的事物、現(xiàn)象、其特征與關(guān)系的專業(yè)化的、加以限定的表述[5]。術(shù)語可以是詞,也可以是詞組;術(shù)語不同于語言中的普通詞匯,具有專業(yè)性、科學(xué)性、單義性和系統(tǒng)性特征[6]?!霸谌魏伟l(fā)達(dá)語言中,術(shù)語在詞匯總量中所占的比重都遠(yuǎn)遠(yuǎn)高于普通詞匯?!保?]這一點(diǎn)從《機(jī)器翻譯后譯文編輯模式研究》項目組對機(jī)器譯文詞匯翻譯錯誤概率統(tǒng)計中已得到鮮明的反映。
對本次語料對比的錯譯標(biāo)注進(jìn)行統(tǒng)計發(fā)現(xiàn),在包括詞性錯譯、連詞錯譯、術(shù)語錯譯、縮略詞錯譯、詞匯替代錯譯、詞匯漏譯和詞匯不譯等七類詞匯錯譯中,術(shù)語錯譯率以78.85%高居榜首,而6.45%的縮略詞錯譯率也主要體現(xiàn)在術(shù)語縮略詞的錯誤處理上[4]。兩者相加意味著實際術(shù)語錯譯率高達(dá)85.3%。
術(shù)語的準(zhǔn)確轉(zhuǎn)換不僅是機(jī)器翻譯有待解決的問題,事實上對非翻譯材料所涉及專業(yè)的譯員而言也一直是個瓶頸。術(shù)語問題之所以成為翻譯的巨大障礙,主要原因還在于術(shù)語的單義性只是其在某一專業(yè)范圍內(nèi)的意義單一,而對同一客觀事物或現(xiàn)象等,在不同的學(xué)科和日常生活中可能會用不同的詞語表示,如“unlock”在一般用語中常譯為“開鎖”,而在汽車專業(yè)中則應(yīng)譯為“解鎖”;“memory system”在心理學(xué)中可譯為“記憶系統(tǒng)”,而在汽車專業(yè)中則應(yīng)該譯為“存儲系統(tǒng)”;“terminal”在計算機(jī)領(lǐng)域指“終端”,而在汽車專業(yè)則固定譯為“端子”。其次,由于非術(shù)語詞的術(shù)語化正是術(shù)語創(chuàng)造的主要方式之一,術(shù)語與非術(shù)語的互相轉(zhuǎn)化也為機(jī)器準(zhǔn)確翻譯增加了難度。而大量使用術(shù)語是科技文獻(xiàn)的重要語言特征,本次汽車技術(shù)文獻(xiàn)機(jī)器譯文表現(xiàn)出的術(shù)語及縮略詞翻譯錯誤率也從另一側(cè)面證實了這一點(diǎn)。
通過細(xì)致的譯文對比,我們發(fā)現(xiàn)機(jī)器對術(shù)語的錯誤處理主要有以下三個表現(xiàn):術(shù)語詞義翻譯錯誤涉及多種詞性,術(shù)語縮略詞翻譯錯誤,在同一受限語言中機(jī)器對術(shù)語的處理無法保持一致性。下文將結(jié)合實例對這三類術(shù)語錯譯的表現(xiàn)形式加以描述和說明。
在下文所有例句句對中,英語為汽車操作手冊的原英語語料,A句為機(jī)器譯文,B句為人工譯文。在所給例句中,每次只針對所述錯誤類型的單一翻譯錯誤進(jìn)行比較。因為語料本身的問題或采集時處理不當(dāng),或因為機(jī)器翻譯系統(tǒng)本身的性能問題,所列句對中有些句子可能缺少標(biāo)點(diǎn)、符號或存在文字漏譯等現(xiàn)象。為了嚴(yán)格保持譯文對比的客觀性,下文所引用的例句都保持了語料原始樣本。
1)涉及多種詞性的術(shù)語詞義翻譯錯誤
在英語中一詞多義是較為普遍的現(xiàn)象,譯員只要對其所譯內(nèi)容具有相關(guān)基本知識儲備,在翻譯中一般都能準(zhǔn)確理解;即使譯員不具備相關(guān)基本知識,往往也會因其自身的謹(jǐn)慎態(tài)度去尋求專業(yè)人員的幫助。在機(jī)器翻譯中對術(shù)語詞義的準(zhǔn)確把握卻是一大難題,常常生成錯誤譯文。這種錯譯在科技文本的機(jī)器翻譯中表現(xiàn)得更為突出,在名詞術(shù)語、形容詞術(shù)語和動詞術(shù)語的處理上都存在大量錯譯。
(1)名詞術(shù)語翻譯錯誤
① ACT+(B10-2)— Body ground
A:ACT+(B10-2)— 身體地
B:ACT+(B10-2)— 車身搭鐵
②CHECK HARNESS AND CONNECTOR(ECU—ACTUATOR)
A:檢查馬具和連接器(ECU—激勵器)
B:檢查線束和連接器(ECU—執(zhí)行器)
③CHECK TERMINAL VOLTAGE(TACH TERMINAL)
A:檢查終端電壓(TACH末端)
B:檢查端子電壓(TACH端子)
在①和②中,機(jī)器將“Body ground”“HARNESS”和“ACTUATOR”譯為“身體地”“馬具”和“激勵器”,對比人工譯文可以看到機(jī)器將汽車技術(shù)領(lǐng)域的專用術(shù)語誤譯為日常用語。在③中“TERMINAL”一詞的機(jī)器譯文使用了非汽車行業(yè)的術(shù)語詞“終端”和“末端”。
(2)動詞術(shù)語翻譯錯誤
①TACH signals from the ECM remain interrupted for 1.3 seconds or more.
A:來自ECM的TACH信號保持打斷1.3秒或更長。
B:來自 ECM的 TACH信號持續(xù)中斷達(dá)1.3秒或更長時間。
②Disconnect the throttle body connector and clamp.
A:拆開節(jié)流閥身體連接器和壓板。
B:斷開節(jié)氣門體連接器和卡夾。
③Uniformly loosen and remove the 6 bolts and 4 nuts.
A:均勻,6個螺栓和4顆螺母放松并且遷移了。
B:均勻地擰松并拆下6個螺栓和4個螺母。
用詞準(zhǔn)確嚴(yán)謹(jǐn)是科技英語的一個重要文體特征,在①和③的機(jī)器譯文中,分別用“打斷”和“放松”來解釋“interrupted”和“l(fā)oosen”,與人工譯文選詞“中斷”和“擰松”相比,其選用的詞匯口語性較強(qiáng),缺乏科技術(shù)語的嚴(yán)謹(jǐn)和正式。在②和③的機(jī)器譯文中選用了“拆開”和“遷移”來表示“disconnect”和“remove”之義,與人工譯文選用的“斷開”和“拆下”有明顯的詞義差別,會給譯文讀者造成對原文的誤解。
(3)形容詞術(shù)語翻譯錯誤
①M(fèi)odels with Intelligent AFS:
A:有聰明的AFS的模型:
B:帶智能AFS的車型:
②Reconnect the active control engine mount ECU connector.
A:再接通活躍的控制器ECU連接器山。
B:重新連接主動控制發(fā)動機(jī)支座 ECU連接器。
“Intelligent”在科技文章中與名詞結(jié)合表示物體的智能特性已成為常用詞,①中A句將其譯為“聰明的”顯然構(gòu)成誤譯。②中機(jī)器譯文將修飾“control engine”的“active”譯為“活躍的”,這與 B句中“主動”對“control engine(控制發(fā)動機(jī))”的描述具有性質(zhì)上的差別。
2)術(shù)語縮略詞翻譯錯誤
為使文本更加簡潔明了,科技英語中經(jīng)常會使用術(shù)語縮略詞??s略詞的構(gòu)成方法不一,可以由多個單詞的首字母組成,如“TLD”代表“tension limits detector(張力極限檢測器)”,或由單詞的前幾個字母組成,如“POT”代表“potentiometer(電位計)”,或抽出單詞中的關(guān)鍵字母組成,如“TCPL”或“T/C”代表“thermocouple(熱電偶)”。 也有一些縮略詞由不同的方法混合而成。無論縮略詞以何種方式構(gòu)成,使用縮略詞的目的都是為了使表達(dá)更加簡練,使人易記。但要準(zhǔn)確翻譯縮略詞,必須正確理解其本來面目和詞義。對縮略詞的理解,除“radar”“aids”等一些常用縮略詞外,讀者通常必須將其還原回全稱形式。要求機(jī)器自動還原縮略詞以得到準(zhǔn)確譯文,可行而且比較有效的方法就是建立縮略詞詞典。譯文比較也真實反映了在缺乏縮略詞詞典的狀態(tài)下機(jī)器在縮略詞翻譯上的失敗。
① If the CAN communication malfunctions, the ECU cannot receive the current data from the ECM.
A:如果罐頭通訊故障,ECU不能從ECM得到當(dāng)今的數(shù)據(jù)。
B:如果CAN通信有故障,ECU不能接收來自ECM的當(dāng)前數(shù)據(jù)。
CAN是 Controller Area Network(控制器局域網(wǎng))的首字母縮寫,已成為汽車技術(shù)中的固定術(shù)語?!癈AN”在日常用語中可以表示“罐頭”之義。此處機(jī)器將其譯為“罐頭”,使得整句的譯文質(zhì)量大打折扣,讓讀者不知所云。
另有研究顯示,吃熟食時血液和腸道中白細(xì)胞數(shù)量會出現(xiàn)暫時性增多,這可能與白細(xì)胞參與調(diào)動體內(nèi)酶類消化食物有關(guān),長期、單純的食用熟食,導(dǎo)致免疫系統(tǒng)負(fù)荷增加,可能會降低機(jī)體的殺菌和免疫功能。
②Remove the hood hinge cover RH.
A:除去罩絞鏈蓋住萊茵鋼鐵公司。
B:拆下發(fā)動機(jī)蓋右側(cè)鉸鏈蓋。
RH可以是“Rhinemetal Group”的縮寫,因此在②A句中譯成了萊茵鋼鐵公司,但這樣的譯文使整個句子不知所云。B句將RH譯為右側(cè),因為RH也可以是“right hand”的縮寫,人工譯文因其對“RH”譯文的準(zhǔn)確把握使句子具有實際意義或可理解性。在本次語料中像“RH”這樣出現(xiàn)頻率較高的表示方位的縮略詞術(shù)語還有“LH”(left hand)和“FR”(front)等。
3)術(shù)語翻譯缺乏一致性
在科技文本的翻譯中,保持術(shù)語的一致性是翻譯的基本原則。而此次譯文對比發(fā)現(xiàn)同一術(shù)語出現(xiàn)在不同的上下文中時,機(jī)器在翻譯過程中卻時常不能保持其一致性。
①Install the active control engine mount ECU with the nut.
A:用堅果安裝活躍的控制器ECU山。
B:用螺母安裝主動控制發(fā)動機(jī)支座ECU。
②Remove the 3 nuts and active control engine mount.
A:除去笨和活躍的控制器安裝的這3個。
B:拆下3個螺母和主動控制發(fā)動機(jī)支座。
③Install the active control engine mount with the 3 nuts.
A:用3顆螺母安裝活躍的控制器底座。
B:用3個螺母安裝主動控制發(fā)動機(jī)支座。
在以上三個例句中,機(jī)器對“nut”做翻譯處理時分別選擇了“堅果”“笨”和“螺母”,而從三句人工譯文中可以看到實際上“nut”在這些句子中的意義是一致的,都應(yīng)譯為“螺母”。
④INSTALL ENGINE MOUNTINGBRACKET FR
A:安裝發(fā)動機(jī)騎在馬上方括號FR
B:安裝前發(fā)動機(jī)懸置支架
⑤Install the engine mounting bracket FR with the 4 bolts.
A:安裝這臺發(fā)動機(jī)爬上與這4個螺栓一起FR。
B:用4個螺栓安裝前發(fā)動機(jī)懸置支架。
④和⑤中的“ENGINE MOUNTING BRACKET FR”和“the engine mounting bracket FR”屬于詞組類術(shù)語,在兩句中意義一致,都表示“前發(fā)動機(jī)懸置支架”,但機(jī)器對同一術(shù)語的翻譯完全喪失了保持術(shù)語一致性的原則。機(jī)器對同一技術(shù)文本中同一術(shù)語處理的隨意性所造成的信息失真及給讀者帶來的閱讀障礙是顯而易見的。
大量使用術(shù)語是科技文體的一個重要特征,機(jī)器翻譯在術(shù)語翻譯上出現(xiàn)的近85.3%的錯誤率,不僅會給譯文讀者帶來很多不便,有時甚至?xí)?dǎo)致科學(xué)研究工作的重大失誤。術(shù)語翻譯的錯誤也屬于詞的歧義問題之一。早在機(jī)器翻譯初創(chuàng)期,韋弗(Weaver)就提出詞的歧義問題可以通過具體的語境來解決[7]。語境提供了較充足的信息,在很大程度上可以保證詞義分析的正確性。利用“汽車翻譯語料庫”中的譯文語料進(jìn)行機(jī)器譯文和人工譯文的對比,極大地縮小了這一限定語言內(nèi)術(shù)語的范疇和詞義,為建立汽車專業(yè)技術(shù)文件的術(shù)語詞典提供了便利??紤]到術(shù)語翻譯錯誤在十萬句對機(jī)器譯文中的錯誤率,汽車技術(shù)文件術(shù)語詞典的創(chuàng)建應(yīng)該是提高機(jī)器翻譯系統(tǒng)對這一限定專業(yè)領(lǐng)域內(nèi)文件處理能力的高效便捷途徑。
注釋
①受限語言指為克服語言的復(fù)雜性,語言學(xué)家和工程師對自然語言進(jìn)行一定限制的語言的真子集。目前受控語言已發(fā)展至第三代,其多數(shù)產(chǎn)品屬于面向機(jī)器的受控語言。
②李梅主持的教育部人文社科項目“機(jī)器翻譯后譯文編輯模式研究”(2007—2010年,項目號為07JA740010)。
[1]胡清平.機(jī)器翻譯中的受控語言[J].中國科技翻譯,2005(8):24-27.
[2]張政.計算機(jī)翻譯研究[M].北京:清華大學(xué)出版社,2006:131-162.
[3]Hutchins W J, Somers H L.An Introduction to Machine Translation[M].San Diego: Academic Press, 1992:5.
[4]羅季美,李梅.機(jī)器翻譯譯文錯誤分析[J].中國翻譯,2012(5):84-89.
[5]鄭述譜.關(guān)于術(shù)語及術(shù)語學(xué)[J].外語學(xué)刊,2001(2):5-9.
[6]馮志偉.現(xiàn)代術(shù)語學(xué)引論[M].北京:語文出版社,1997.
[7]Weaver W.Translation [C]//Machine Translation of Languages.Locke W N&Booth A D.New York:John Wiley, 1955:15-27.