国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于錯誤類型的譯前編輯策略探究

2024-12-31 00:00:00王行舟
新楚文化 2024年21期
關(guān)鍵詞:機(jī)器翻譯邊城

【摘要】機(jī)器翻譯在經(jīng)歷了基于實(shí)例、基于統(tǒng)計(jì)、基于神經(jīng)網(wǎng)絡(luò)的三次迭代后,翻譯質(zhì)量在某些領(lǐng)域甚至能和專業(yè)譯員媲美,人機(jī)協(xié)作的翻譯模式因此成為語言服務(wù)市場的主流。譯前編輯作為一種人機(jī)協(xié)作翻譯模式,較少受到國內(nèi)學(xué)者的關(guān)注,卻對減少譯后編輯工作量不可或缺。因此本文著眼于文學(xué)文本的譯前編輯,采用MQM質(zhì)量評估標(biāo)準(zhǔn),對《邊城》機(jī)器翻譯中的錯誤進(jìn)行歸類,提出可行的譯前編輯策略并檢驗(yàn)其對機(jī)翻質(zhì)量的影響,以期為機(jī)器翻譯的領(lǐng)域適應(yīng)和效率提升提供啟示。

【關(guān)鍵詞】機(jī)器翻譯;譯前編輯;神經(jīng)網(wǎng)絡(luò)翻譯;《邊城》

【中圖分類號】H085;I046 " " "【文獻(xiàn)標(biāo)識碼】A 【文章編號】2097-2261(2024)21-0056-04

【DOI】10.20133/j.cnki.CN42-1932/G1.2024.21.014

【基金項(xiàng)目】本文系2022年湖南省社科基金項(xiàng)目“《邊城》英語譯介的湘西敘事重構(gòu)研究”(項(xiàng)目編號:2022YBA200)的階段性研究成果。

一、引言

隨著自然語言處理和人工智能的突飛猛進(jìn),機(jī)器翻譯完成了從基于實(shí)例、基于統(tǒng)計(jì)、基于神經(jīng)網(wǎng)絡(luò)的升級,在翻譯質(zhì)量上得到顯著提升。

2016年谷歌推出神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)并投入商用,機(jī)器翻譯迅速普及走向了產(chǎn)業(yè)化。在某些領(lǐng)域,神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯產(chǎn)出的譯文質(zhì)量甚至可以達(dá)到專業(yè)譯員的水平。然而神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯不免出現(xiàn)漏譯和誤譯現(xiàn)象,人類譯員的把關(guān)仍舊必不可少。

人機(jī)協(xié)作的翻譯模式始于20世紀(jì)50年代,早期從事譯后編輯的人員甚至不需要掌握源語,到80年代譯后編輯才被確立為翻譯過程中的重要一環(huán)。經(jīng)過四十多年的發(fā)展,如今人機(jī)混合翻譯服務(wù)已成為市場主流。

2021年美國CSA Research公司預(yù)測,人機(jī)混合服務(wù)的需求將成為語言服務(wù)行業(yè)發(fā)展的主要推動力,而譯后編輯則是其中的首要需求。王華樹和李智通過調(diào)查發(fā)現(xiàn),受試者中半數(shù)以上的譯員借助機(jī)器翻譯并結(jié)合譯后編輯來完成工作,并表示人機(jī)協(xié)作的翻譯模式能提高11%至70%的翻譯效率[1]。

譯前編輯和譯后編輯同屬人機(jī)協(xié)作的翻譯模式,在學(xué)術(shù)界獲得的關(guān)注卻呈現(xiàn)出顯著差異。譯前編輯僅僅在關(guān)于譯后編輯的討論中被順帶提及,缺少學(xué)者針對性的深入研究。而國內(nèi)外譯后編輯研究則已形成聚類,如“譯后編輯概述、譯后編輯評估研究、機(jī)器翻譯錯誤識別與譯后編輯工具研發(fā)、譯后編輯研究的行業(yè)視角、譯后編輯能力與譯后編輯者的培養(yǎng)”等[2]。

然而,譯前編輯對于減少譯后編輯工作量,避免低質(zhì)機(jī)譯造成的精力損耗有著重要意義。譯前編輯過的原文經(jīng)過機(jī)器翻譯后,產(chǎn)出的原始譯文中需要糾正的錯誤更少。此外,許多文本也存在譯后編輯工作量過大或者無法進(jìn)行譯后編輯的情況,此時(shí)譯前編輯的干預(yù)則尤為重要。

二、譯前編輯概述

譯前編輯涉及使用一套術(shù)語、文體指南或規(guī)則,在翻譯自動化之前準(zhǔn)備原文,以提高原始輸出質(zhì)量。原文準(zhǔn)備中不僅要去除排版錯誤,糾正內(nèi)容中可能出現(xiàn)的錯誤,還要調(diào)整句子長度,使用某些語法結(jié)構(gòu),如簡化語序和減少被動語態(tài),或語義選擇,如使用一致的術(shù)語,或者標(biāo)注某些可能不需要翻譯的術(shù)語,如產(chǎn)品名稱。

相較之下,譯后編輯則致力于修正機(jī)器輸出譯文中的錯誤,使譯文達(dá)到預(yù)期的質(zhì)量標(biāo)準(zhǔn)。如果說譯后編輯是對錯誤產(chǎn)生后的一種被動彌補(bǔ),那么譯前編輯則是主動預(yù)設(shè)可能出現(xiàn)的錯誤。

和譯前編輯較為相似的一個(gè)概念是受控語言,兩者都是通過處理原文以提高機(jī)器翻譯的質(zhì)量,但在應(yīng)用場景、編輯范圍和文本類型方面,兩者仍存在顯著的差異。譯前編輯主要應(yīng)用于機(jī)器翻譯,是針對文本的具體處理,而受控語言除了翻譯之外,還可以運(yùn)用在技術(shù)寫作,翻譯審校等領(lǐng)域,是一套指導(dǎo)文本處理的規(guī)則。

在編輯范圍上,譯前編輯可以對內(nèi)容、格式和印刷方面任何可能出現(xiàn)的錯誤進(jìn)行調(diào)整,而受控語言則主要從詞匯語法和風(fēng)格層面對原文進(jìn)行改寫以使之符合規(guī)范。在應(yīng)用文本層面,譯前編輯可應(yīng)用于多種文本類型,而受控語言常用在技術(shù)文檔的生成和翻譯。

國外對于譯前編輯的研究已有了一些嘗試。不同的語言對和翻譯方向,不同的文本類型和特定機(jī)器翻譯系統(tǒng)都對會對譯前編輯的效率產(chǎn)生影響。Mercader-Alarcon和Sanchez-Matinez[3]以及Miyata和Fujita[4]分別使用基于規(guī)則和基于短語的統(tǒng)計(jì)機(jī)器翻譯進(jìn)行譯前編輯,觀察到原始輸出的機(jī)器翻譯譯文在錯誤率上有了下降。然而譯前編輯對于提升NMT產(chǎn)出譯文質(zhì)量的效力卻并不明確。?ner Bulut和Alimen發(fā)現(xiàn)在英語和土耳其語言對上,譯前編輯并未能減少NMT翻譯用戶指南中的術(shù)語錯誤[5]。Bounaas等人指出,在英語到阿拉伯語的兒童文學(xué)翻譯中,譯前編輯提升了NMT產(chǎn)出譯文的可接受性和可讀性[6]。

目前國內(nèi)對于譯前編輯的關(guān)注較少,但是眾多學(xué)者都已關(guān)注到了譯前編輯的必要性,并將之作為未來的研究方向。馮全功和崔啟亮表示利用受控語言進(jìn)行譯前編輯可以有效地提高機(jī)器翻譯的準(zhǔn)確性。王湘玲和賈艷芳也指出實(shí)施譯前編輯對于減少消極翻譯指征和提高機(jī)器翻譯質(zhì)量有著重要作用[7]。徐紅和黃協(xié)安認(rèn)為,梳理譯前編輯研究有利于傳播該領(lǐng)域新的研究范式,總結(jié)有效的譯前編輯方法,為找到研究突破口提供啟示[8]。也有學(xué)者表示機(jī)器翻譯的廣泛使用和日新月異,相關(guān)研究不僅需要針對特定語言對、特定機(jī)器翻譯系統(tǒng)和特定文本類型進(jìn)行譯前編輯策略的探索,同時(shí)需要對相關(guān)策略進(jìn)行及時(shí)更新。

三、機(jī)器翻譯錯誤類型概述

譯后編輯領(lǐng)域里,機(jī)器翻譯的錯誤類型分類主要服務(wù)于區(qū)分譯后編輯的工作量。分類方法大致可概括為宏觀的編輯過程分類和微觀的語言學(xué)概念分類。宏觀層面,Lacruz I、 Denkowski M和Lavie A將機(jī)器翻譯錯誤分為機(jī)械類(Mechanical)錯誤和遷移類(Transfer)錯誤,不需要參考原文進(jìn)行改正的錯誤為機(jī)械類錯誤,而需要對照原文進(jìn)行修改的錯誤則被定義為遷移類錯誤[9]。

微觀語言學(xué)概念的分類中,國內(nèi)學(xué)者崔啟亮和李聞基于科技文本中的機(jī)器翻譯錯誤,列出了十一類機(jī)器翻譯的錯誤類型,從詞語和句子層面、形式和格式、漏譯誤譯等角度進(jìn)行了錯誤列舉[10]。Temnikova則根據(jù)常見翻譯活動的認(rèn)知努力對主要的錯誤類型進(jìn)行了排名,其中詞語的形式(曲折變化)錯誤和使用了錯誤風(fēng)格的近義詞被劃分為修正較為容易的類別,而詞層面的詞序錯誤和短語層面的詞序錯誤則被認(rèn)定為修正難度最大的類別[11]。

國內(nèi)已有的機(jī)翻錯誤類型研究大多從科技文本著手,涉及法律、醫(yī)藥、機(jī)械等專業(yè)領(lǐng)域,然而某些機(jī)器翻譯錯誤在不同的文本類型、不同的翻譯方向、不同的翻譯目的下可能并不構(gòu)成錯誤或歸屬于其他類別,因此機(jī)器翻譯錯誤的分類標(biāo)準(zhǔn)也受到了特定語言對和文本類型等因素的限定。

四、翻譯多維質(zhì)量標(biāo)準(zhǔn)(MQM)

MQM是一種基于錯誤類型及其嚴(yán)重性進(jìn)行翻譯質(zhì)量評估的框架。該框架定義了7種主要錯誤類型。評估者可以根據(jù)自己的需要定制框架,對某類錯誤的嚴(yán)重性進(jìn)行評級,默認(rèn)嚴(yán)重性級別為無(減0分)、次要(減1分)、主要(減5分)和關(guān)鍵(減25分)。翻譯的質(zhì)量可以通過其獲得的罰分來判斷。嚴(yán)重性定義為無的錯誤一般不需要進(jìn)一步關(guān)注,而嚴(yán)重性高則意味著該錯誤將導(dǎo)致譯文不過關(guān)。

《邊城》機(jī)翻譯文的錯誤類別及其嚴(yán)重性程度將在下文中舉例討論。

五、《邊城》中的主要機(jī)翻錯誤

《邊城》第一章介紹了故事發(fā)生的地理環(huán)境和主要人物翠翠和祖父,句型多為連動無主語句,語言風(fēng)格簡潔但內(nèi)涵豐富,涉及部分文化負(fù)載詞,在內(nèi)容和風(fēng)格上都具有文學(xué)性。因此本文將第一章作為研究文本,利用MQM對原始產(chǎn)出譯文中的錯誤進(jìn)行分類,并以可讀性作為錯誤嚴(yán)重性的劃分標(biāo)準(zhǔn),對各類錯誤罰分并計(jì)算出最后的單字平均罰分。針對原始譯文中出現(xiàn)的錯誤,筆者將提出相應(yīng)的譯前編輯策略,并通過應(yīng)用譯前編輯策略,對比機(jī)翻譯文的錯誤罰分,檢驗(yàn)譯前編輯策略的效率。

根據(jù)MQM標(biāo)準(zhǔn),《邊城》第一章中的單字罰分為0.1574。機(jī)翻錯誤主要出現(xiàn)在術(shù)語(terminology)、準(zhǔn)確性(accuracy)、語言慣例(linguistic convention)、風(fēng)格(style)、本地化(locale convention)、讀者接受度(audience appropriateness)、格式標(biāo)點(diǎn)(design and markup)。其中準(zhǔn)確性錯誤較為突出,大多因?yàn)樵闹袩o主語句和文化特定表達(dá)導(dǎo)致。

例如“代替了天,使他在日頭升起時(shí),感到生活的力量”一句中省略的主語本是指翠翠,然而機(jī)翻譯文中卻譯成“It replaced the sky, allowing him to feel the power of life when the sun rose”中的“it”。又如“管船人卻情不過”被NMT翻譯為“The ship keeper couldn't help it”。其次風(fēng)格層面的錯誤多為譯文中突兀的正式用語和贅余翻譯。

例如“卻依然清澈透明”的譯文“but it is still so clear and transparent”中“transparent”的使用,以及“依然塞到那人手心里去”譯文“stuffed it into the palm of the man's hand”中對“手心”的多譯。術(shù)語層面錯誤多集中于文化負(fù)載詞和專有名詞前后使用不一致兩類。

例如機(jī)翻譯文中用“yellow dog”和“Huang Gou”來稱呼文中的黃狗,以及將“七百錢”翻譯成“seven hundred dollars”。讀者接受角度錯誤則主要由文化差異導(dǎo)致。例如“翠翠在風(fēng)日里長養(yǎng)著,把皮膚變得黑黑的”中“變得黑黑的”被譯為“turning the skin black”?!癇lack”形容皮膚帶有歧視色彩,容易造成目的語讀者的誤會,被曬黑的原意與“tanned”更貼切。

針對《邊城》中第一章中的主要機(jī)翻錯誤,筆者認(rèn)為譯前編輯可從詞匯、句子、文化角度入手。首先詞匯方面,補(bǔ)充隱含的主語,修改不恰當(dāng)?shù)闹髦^和動賓搭配;句子層面,簡化句子結(jié)構(gòu),刪減語義重復(fù)的結(jié)構(gòu),合理斷句減少逗號使用;文化角度,簡化或解釋中文特有文化內(nèi)涵的表達(dá)。經(jīng)譯前編輯后的機(jī)翻譯文的單字罰分為0.129。

六、譯前編輯策略效率分析

通過對比譯前編輯前后的機(jī)翻譯文可以發(fā)現(xiàn),譯前編輯后產(chǎn)出的譯文在錯誤數(shù)量上和總罰分上都有了顯著減少,尤其有效地規(guī)避了機(jī)器翻譯在本地化(locale convention)、讀者接受度(audience appropriateness)和格式標(biāo)點(diǎn)(design and markup)上可能產(chǎn)生的錯誤。

(1)原文:翠翠在風(fēng)日里長養(yǎng)著,把皮膚變得黑黑的

NMT譯文:The greenery has grown up in the wind and sun, turning the skin black

譯前編輯后的原文:翠翠在大自然里長大,她的皮膚曬得黑黑的

NMT譯文:Cuicui grew up in nature, and her skin is tanned

例(1)中譯前編輯通過詞匯層面的補(bǔ)充主語和更換謂語動詞,使得原文語義更加清晰。因此NMT產(chǎn)出的譯文使用了更符合英語母語者閱讀習(xí)慣和接受度的“tanned”,規(guī)避了初次翻譯中“black”的歧視色彩。

此外,術(shù)語、準(zhǔn)確度和風(fēng)格層面的錯誤也有了大幅減少,但仍存在部分譯前編輯難以規(guī)避的機(jī)器翻譯錯誤,或是譯前編輯僅僅帶來了錯誤類型的轉(zhuǎn)移而非消失的情況。

(2)原文:或翠翠與黃狗皆張著耳朵,聽祖父說些城中多年以前的戰(zhàn)爭故事。

NMT譯文:Or Cuicui and Huang Gou both opened their ears, listening to their grandfather telling stories about wars in the city many years ago.

譯前編輯后的原文:有時(shí)翠翠和黃狗都張著耳朵,聽祖父說些城中多年以前的戰(zhàn)爭故事。

NMT譯文:Sometimes Cuicui and Huang Gou open their ears and listen to their grandfather telling stories about wars in the city many years ago.

(3)原文:溪流如弓背,山路如弓弦,故遠(yuǎn)近有了小小差異。

NMT譯文:The stream is like the back of a bow, and the mountain road is like the string of a bow, so there is a slight difference between the distance and the distance.

譯前編輯后的原文:溪流像弓背一樣的曲線,而山路像弓弦一樣的直線,所以走不同的路會有距離的差異。

NMT譯文:The stream is curved like the back of a bow, while the mountain road is straight like a bowstring, so the distance will vary depending on the path.

例(2)中“黃狗”一詞在進(jìn)行過譯前編輯之后仍然被NMT誤譯為“Huang Gou”,與前文所譯的“yellow dog”不一致。例(3)中譯前編輯后的NMT譯文更加忠實(shí)于原文語義,但在風(fēng)格上的平鋪直敘丟失了中文的意境。雖然擺脫了準(zhǔn)確度的錯誤,卻在風(fēng)格上被歸為次要錯誤。

七、結(jié)語

本文借用MQM對《邊城》第一章中的場景和人物描寫的機(jī)器翻譯質(zhì)量進(jìn)行評估,通過對比譯前編輯前后的兩個(gè)版本譯文,筆者發(fā)現(xiàn)譯前編輯整體上顯著減少NMT的翻譯錯誤,與前文中徐紅和Bounaas的研究結(jié)果基本一致。此外本研究發(fā)現(xiàn)譯前編輯策略對于規(guī)避本地化,讀者接受度和格式標(biāo)點(diǎn)層面的機(jī)翻錯誤尤為有效。而在術(shù)語、準(zhǔn)確度和風(fēng)格層面上,部分機(jī)翻錯誤也無法通過譯前編輯策略進(jìn)行規(guī)避,或是嚴(yán)重程度有所減弱,或是錯誤類型有所改變。因此,NMT翻譯質(zhì)量的提升雖極大提高了語言服務(wù)的效率,卻仍然無法完全取代人類譯員。NMT譯文仍然需要譯前編輯和譯后編輯的把關(guān)。

本文僅從詞匯、句子和文化因素三方面對于譯前編輯策略進(jìn)行初步嘗試,未來研究可納入規(guī)模更大的樣本語料,邀請多位評分者評估機(jī)翻譯文質(zhì)量,結(jié)合譯寫和變譯等策略對文學(xué)翻譯的譯前編輯進(jìn)行更靈活的探索。

參考文獻(xiàn):

[1]王華樹,李智.人工智能時(shí)代筆譯員翻譯技術(shù)應(yīng)用調(diào)查——現(xiàn)狀、發(fā)現(xiàn)與建議[J].外語電化教學(xué),2019(06):67-72.

[2]馮全功,崔啟亮.譯后編輯研究:焦點(diǎn)透析與發(fā)展趨勢[J].上海翻譯,2016(06):67-74+89+94.

[3]Mercader-Alarcón J,F(xiàn) Sánchez-Matínez.Analysis of translation errors and evaluation of pre-editing rules for the translation of English news texts into Spanish with Lucy LT[J].Tradumàtica:Tecnologies de La Traducció,2016(14).

[4]Miyata R, A Fujita. Understanding pre-editing for black-box neural machine translation[EB/OL].https://arxiv.org / pdf /2102.02955.pdf,2021.

[5]?ner Bulut S,N Alimen.Translator education as a collaborative quest for insights into the re-positioning of the human translator (educator) in the age of machine translation:The results of a learning experiment [J].The Interpreter and Translator Trainer, 2023(03).

[6]Bounaas C,et al.Effects of pre-editing operations on audiovisual translation using TRADOS:An experimental analysis of Saudi students’translations[J].Texto Livre,2023(16).

[7]王湘玲,賈艷芳.21世紀(jì)國外機(jī)器翻譯譯后編輯實(shí)證研究[J].湖南大學(xué)學(xué)報(bào)(社會科學(xué)版),2018,32(02):82-87.

[8]徐紅,黃協(xié)安.譯前編輯和機(jī)器翻譯研究綜述(1990-2023)[J].外語電化教學(xué),2023(06):43-49+112.

[9]孟福永,唐旭日.效率為先:機(jī)器翻譯譯后編輯技術(shù)綜述[J].計(jì)算機(jī)工程與應(yīng)用,2020,56(22):25-32.

[10]崔啟亮,李聞.譯后編輯錯誤類型研究——基于科技文本英漢機(jī)器翻譯[J].中國科技翻譯,2015,28(04):19-22.

[11]Temnikova I P.Cognitive evaluation approach for a controlled language post-editing experiment[C]//7th International Conference on Language Resources and Evaluation,2010.

作者簡介:

王行舟(1996-),女,漢族,湖南岳陽人,碩士研究生,助教,研究方向:商務(wù)英語教學(xué)與翻譯研究。

猜你喜歡
機(jī)器翻譯邊城
邊城
心聲歌刊(2023年4期)2023-08-18 12:49:34
《邊城之材幽之地》
電影評介(2022年11期)2022-12-11 03:12:56
《邊城游記》
極邊城暖
商周刊(2017年6期)2017-08-22 03:42:39
大庸邊城的蠻與嬌
中國三峽(2017年2期)2017-06-09 08:15:30
互聯(lián)網(wǎng)+新時(shí)代下人機(jī)翻譯模式研究
考試周刊(2017年2期)2017-01-19 09:13:50
“語聯(lián)網(wǎng)+行業(yè)” 助力中國偉大復(fù)興
考試周刊(2017年2期)2017-01-19 09:12:54
大數(shù)據(jù)背景下石油科技翻譯
機(jī)器翻譯不可盲取
基于免費(fèi)在線翻譯工具的機(jī)器翻譯缺陷探討
阳泉市| 万山特区| 连山| 布尔津县| 黄山市| 紫金县| 伊春市| 和静县| 新蔡县| 新巴尔虎左旗| 阿巴嘎旗| 新密市| 通辽市| 隆安县| 河东区| 钟祥市| 龙里县| 巴楚县| 宝清县| 灌云县| 木兰县| 霞浦县| 桂林市| 高安市| 宣汉县| 镇康县| 合江县| 五大连池市| 龙泉市| 江达县| 聊城市| 静海县| 蚌埠市| 同仁县| 孝义市| 鄄城县| 两当县| 即墨市| 宝兴县| 梁平县| 鄯善县|