国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

TAUS指南在快速譯后編輯(LPE)中的應(yīng)用

2022-05-30 10:48:04仲晨陽倪蓉
關(guān)鍵詞:機(jī)器翻譯

仲晨陽 倪蓉

摘要:隨著互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算的飛速發(fā)展,機(jī)器翻譯發(fā)生了巨大變化,機(jī)器翻譯譯后編輯( machine translation post-editing,MTPE)模式也應(yīng)運(yùn)而生,逐漸成為翻譯服務(wù)業(yè)的主流模式。但若要進(jìn)一步提高M(jìn)TPE效率和質(zhì)量,還需要相應(yīng)的規(guī)范和準(zhǔn)則加持,以幫助譯后編輯者識別機(jī)器翻譯錯誤并快速決策機(jī)器譯文是否需要進(jìn)行編輯。通過介紹翻譯自動化用戶協(xié)會( TAUS)的MT-PE指南的相關(guān)實踐準(zhǔn)則,并根據(jù)文本性質(zhì)和受眾選取適用準(zhǔn)則指導(dǎo)進(jìn)行了醫(yī)學(xué)報告的快速譯后編輯(light post-editing,LPE)實踐,對醫(yī)學(xué)報告文本譯后編輯實踐中存在的詞匯錯譯、分詞短語錯譯、從句錯譯以及段落錯譯、漏譯等問題進(jìn)行了分析,并對該指南的實際指導(dǎo)意義進(jìn)行了總結(jié)與評價。

關(guān)鍵詞:機(jī)器翻譯;快速譯后編輯;機(jī)器翻譯譯后編輯指南;醫(yī)學(xué)報告翻譯

中圖分類號:H 059

文獻(xiàn)標(biāo)志碼:A

文章編號:1009 - 895X(2022)03 - 0238 - 07

DOI: 10. 13256/j. cnki:jusst.sse.2022.03 .005

近年來,機(jī)器翻譯質(zhì)量得到了極大改善,信息技術(shù)已經(jīng)與翻譯服務(wù)業(yè)深度融合。同時傳統(tǒng)的純?nèi)斯しg無法滿足全球化和本地化催生的海量翻譯需求,且成本相對較高,新的翻譯業(yè)務(wù)類型與質(zhì)量標(biāo)準(zhǔn)相較以前都有了很多變化,從而促使越來越多的企業(yè)開始用機(jī)器翻譯技術(shù)進(jìn)行初步的翻譯項目處理,也就導(dǎo)致了譯后編輯市場的擴(kuò)大。作為提升機(jī)器翻譯質(zhì)量的新模式,譯后編輯還缺少規(guī)范一致的實踐原則、質(zhì)量評估標(biāo)準(zhǔn)等,因此若要該模式得到有效并廣泛的應(yīng)用,還需要清晰明確的各類指導(dǎo)準(zhǔn)則。2016年,翻譯自動化用戶協(xié)會( Translation Auto-mation User Society,TAUS)發(fā)布了MT Post-edit-ing Guidelines,這是目前可參考的較為完整的機(jī)器翻譯譯后編輯指南。本文根據(jù)該指南對醫(yī)學(xué)報告機(jī)器譯文進(jìn)行了快速譯后編輯實踐,并對其指導(dǎo)意義及存在的問題進(jìn)行了分析。

一、機(jī)器翻譯與譯后編輯

(一)機(jī)器翻譯的發(fā)展及缺陷

機(jī)器翻譯的廣泛應(yīng)用產(chǎn)生了巨大的社會效益和經(jīng)濟(jì)效益。回顧其發(fā)展歷程,主要經(jīng)歷了四個階段:一是基于規(guī)則( RBMT);二是基于例子(EB-MT);三是統(tǒng)計機(jī)器翻譯(SMT);四是神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯( NMT)。神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯利用已有的大規(guī)模的真實語料庫來進(jìn)行深度學(xué)習(xí),從語料庫中自動獲取語言特征和規(guī)則,它是基于大數(shù)據(jù)、使用神經(jīng)網(wǎng)絡(luò)來實現(xiàn)翻譯的機(jī)器翻譯系統(tǒng)[1]。神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯的發(fā)展使機(jī)器譯文質(zhì)量得到了質(zhì)的提升。

但是,即便神經(jīng)機(jī)器翻譯系統(tǒng)使機(jī)器譯文質(zhì)量飛速發(fā)展,機(jī)器譯文仍有很多局限性,自然語言處理仍有許多在實踐中難以解決的問題,比如從句錯譯、詞匯錯譯、譯文調(diào)序失敗、符號錯譯、漏譯等問題[2]。醫(yī)學(xué)報告作為醫(yī)學(xué)文本的一種,其特點就是縮略語、醫(yī)學(xué)術(shù)語使用較多,同時為表達(dá)客觀及行文簡潔準(zhǔn)確,被動語態(tài)以及分詞結(jié)構(gòu)應(yīng)用較多[3]。機(jī)器在翻譯醫(yī)學(xué)文本時,往往會出現(xiàn)術(shù)語錯譯、漏譯和詞匯替代錯譯問題,同時也會出現(xiàn)對被動句以及分詞結(jié)構(gòu)的處理不當(dāng)導(dǎo)致譯文含義與原文出現(xiàn)偏差的現(xiàn)象。具體可見本文第三節(jié)的實踐分析。要克服機(jī)器譯文存在的這些缺陷,使譯文質(zhì)量達(dá)到要求,目前最快捷有效的方法就是對其進(jìn)行人工修改、完善,即進(jìn)行機(jī)器翻譯譯后編輯。

(二)譯后編輯概述

譯后編輯( post-editing)是在語言或格式方面,對機(jī)器翻譯的原始產(chǎn)出,即初始譯文,進(jìn)行加工與修改來提高機(jī)譯產(chǎn)出的準(zhǔn)確性與可讀性[4]。2010年TAUS實踐中的譯后編輯報告將譯后編輯定義為“用最少的人工改進(jìn)機(jī)器生成的翻譯的過程”[5]。而針對不同要求和目的,關(guān)于機(jī)器翻譯譯后編輯的IS0 18 587標(biāo)準(zhǔn)將譯后編輯分為兩個級別:快速譯后編輯( Light Post-editing,LPE)、完全譯后編輯( Full Post-editing,F(xiàn)PE)[6]。機(jī)器翻譯譯后編輯模式充分提高機(jī)器翻譯的速度(效率),也保證發(fā)揮人工翻譯的精度(質(zhì)量),從而既滿足翻譯市場快速發(fā)展的需求,也推動了翻譯技術(shù)的發(fā)展,還促進(jìn)了學(xué)界和業(yè)界的交流與合作,豐富了語言服務(wù)產(chǎn)業(yè)鏈的組成[7]。

不過譯后編輯作為新的翻譯工作模式,在實踐過程中除了要識別并糾正上述機(jī)器譯文各類錯誤之外,還需考慮效率、質(zhì)量要求、成本等各方面因素。因此譯后編輯在發(fā)展過程中還需要獨立、一致的標(biāo)準(zhǔn)來衡量和約束譯后編輯的質(zhì)量,確定譯后編輯工作量等,幫助譯后編輯者更加高效高質(zhì)地完成譯后編輯任務(wù),同時培養(yǎng)出更多高質(zhì)量的譯后編輯人員。但目前機(jī)器翻譯譯后編輯相關(guān)的大部分實踐準(zhǔn)則就比較宏觀,如崔啟亮提出的實踐準(zhǔn)則相對宏觀,進(jìn)行實踐時還需自行確立具體規(guī)則[7]。而Midori Tat-suni提出的對MTPE譯文相關(guān)的部分要求與TAUS類似,但比較寬泛.并未針對不同的質(zhì)量要求進(jìn)行細(xì)致劃分,實際應(yīng)用時還需綜合考慮各種因素進(jìn)行細(xì)化[8]。目前相對具體的實踐準(zhǔn)則是TAUS發(fā)布的MT POST-EDITING GUIDELINES,根據(jù)不同的質(zhì)量要求列出了對應(yīng)的原則,所以本文采用該原則指導(dǎo)所選文本的譯后編輯實踐,以檢驗其是否能有效提高譯后編輯效率。

二、TAUS機(jī)器翻譯譯后編輯指南

TAUS成立于2004年,是全球語言和翻譯行業(yè)的資源中心。該協(xié)會通過自己的數(shù)據(jù)云和質(zhì)量評估服務(wù)為翻譯行業(yè)提供相關(guān)的建議、工具、指標(biāo)、基準(zhǔn)和數(shù)據(jù)等。2016年,該協(xié)會發(fā)行了MTPE指南,旨在促進(jìn)譯后編輯模式的發(fā)展,提升譯后編輯的質(zhì)量和效率,并幫助該行業(yè)選擇、培訓(xùn)高素質(zhì)、高水準(zhǔn)的譯后編輯工作者。 該指南指出,最基本的譯后編輯質(zhì)量評估準(zhǔn)則有兩條,一是機(jī)器生成的譯文質(zhì)量,二是對待翻譯材料的最終質(zhì)量預(yù)期,即譯后編輯工作如何進(jìn)行,取決于機(jī)器生成的原始譯文質(zhì)量及客戶對譯文質(zhì)量的需求[9]。該指南把預(yù)期的最終譯后編輯質(zhì)量大致分為兩個等級,一級為“good enough quality”,另一級為“human translation quality”,其具體要求見表1.

在選擇適用質(zhì)量要求時,主要取決于目標(biāo)讀者或客戶對最終譯文質(zhì)量的需求(包括最終譯文的受眾或使用目的)以及初始機(jī)器譯文的質(zhì)量。而對于初始機(jī)器譯文質(zhì)量的評判,若花費(fèi)太多時間來確定其是否可用會得不償失,降低效率。因此可在決策時間上加一些限制,若在一定時間內(nèi)查看一個機(jī)器翻譯片段(在熟悉源文本和目標(biāo)文本之后),發(fā)現(xiàn)無法輕松理解,那就舍棄機(jī)器譯文。Mesa-Lao在其實驗分析中表明,大部分測試者在初讀機(jī)器譯文上的停留時間為5 - 10秒左右,本文的譯后編輯實踐即以5 - 10秒原則來判斷是應(yīng)該糾正機(jī)器譯文,還是應(yīng)該刪除并重新翻譯低質(zhì)量的片段[10]。同時針對最終譯文質(zhì)量的不同質(zhì)量預(yù)期(是“good enough quality”還是“human translation quality”)以及機(jī)器生成譯文的不同質(zhì)量,采取不同的譯后編輯策略,決定是進(jìn)行LPE還是FPE。

三、基于TAUS指南進(jìn)行的醫(yī)學(xué)文本

譯后編輯實踐分析

醫(yī)學(xué)報告屬于醫(yī)學(xué)類文本,作為科技文本的一種,對MTPE模式的適應(yīng)性較強(qiáng),同時有海量翻譯需求,對翻譯效率要求較高。本文選取了The NewEngland Journal of Medicine上的醫(yī)學(xué)報告來進(jìn)行譯后編輯實踐,這是關(guān)于2019新型冠狀肺炎武漢病例分析的報告,發(fā)布于2020年1月24日,全文約3 000詞。此文的目的是與醫(yī)學(xué)工作者和研究者共享信息以及時有效共同應(yīng)對并預(yù)防疫情。因為該流行病傳染性強(qiáng),傳播速度快,加之如今交通非常發(fā)達(dá),人員流動頻繁,所以此類文本信息翻譯非常注重準(zhǔn)確性和時效性。同時,此類文本譯文目標(biāo)受眾為醫(yī)學(xué)專家或工作者,他們僅需了解原文概述或要點,以幫助自己了解疾病相關(guān)信息,共同做好應(yīng)對準(zhǔn)備并尋找解決辦法,所以可選擇省時高效的LPE模式進(jìn)行MTPE,使最終譯文達(dá)到“good enoughquality”的要求(下文提到的具體準(zhǔn)則均針對“good enough quality”)。

本文所選擇的機(jī)器翻譯引擎為谷歌翻譯,在實踐過程中發(fā)現(xiàn)詞匯錯譯、分詞短語錯譯、從句錯譯以及段落錯譯、漏譯問題較多,而此前一直被視為難點的被動語態(tài)問題已不明顯。基于神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯強(qiáng)大的學(xué)習(xí)能力以及大數(shù)據(jù)的支撐,目前谷歌對被動句的處理表現(xiàn)較為良好,比如,筆者較早時期實踐時發(fā)現(xiàn)的相關(guān)問題,在幾個月之后再次用谷歌生成譯文時,發(fā)現(xiàn)其已經(jīng)對譯文進(jìn)行了改良,符合“good enough quality”的要求,可不再作為難點進(jìn)行分析。其他相關(guān)案例具體分析如下。

(一)詞匯錯譯

例1 In late December 2019, several local healthfacilities reported clusters ofpatients with pneumoniaof unknown cause that were epidemiologically linkedto a seafood and wet animal wholesale market in Wuhan, Hubei Province, China. _We report the re-sults of this investigation, identifying the source of thepneumonia clusters,and describe a novel coronavrrus detected in patients with pneumoma whose specimens were tested by the China CDC at an early stage of the outbreak.

谷歌譯文(2020年8月9日) 2019年12月下旬,幾家地方衛(wèi)生機(jī)構(gòu)報告了一群原因不明的肺炎,其在流行病學(xué)上與中國湖北省武漢市的海鮮和濕動物批發(fā)市場有關(guān)?!覀儓蟾媪诉@項調(diào)查的結(jié)果,確定了肺炎簇的來源,并描述了在疾病爆發(fā)早期由中國疾病預(yù)防控制中心檢測其標(biāo)本的肺炎患者中檢測到的新型冠狀病毒。

修改譯文2019年12月下旬,中國湖北武漢幾家當(dāng)?shù)氐尼t(yī)療機(jī)構(gòu)報告了一群原因不明的肺炎患者,從流行病學(xué)角度看,均與當(dāng)?shù)氐囊患液ur和水產(chǎn)動物批發(fā)市場有關(guān)?!覀儓蟾媪吮敬蔚恼{(diào)查結(jié)果,確定了肺炎患者群體的來源,并描述了在疾病爆發(fā)早期由中國疾病預(yù)防控制中心檢測其標(biāo)本的肺炎患者中檢測到的新型冠狀病毒。

通過5- 10秒原則可快速識別出谷歌關(guān)于 “wet ammals”和“clusters”的翻譯出現(xiàn)了錯誤,導(dǎo)致句意出現(xiàn)偏差,為達(dá)到要求(1)“語義正確”,對這兩處進(jìn)行了編輯,而“clusters”也按照上下文語境選擇正確的詞義。同時對比原文還發(fā)現(xiàn),谷歌譯文出現(xiàn)了信息遺漏的現(xiàn)象,漏譯了“clusters of patients”,因此為達(dá)到TAUS指南要求(2)“確保信息無遺漏”,確保譯文信息無添加或遺漏,在進(jìn)行快速譯后編輯時將遺漏信息補(bǔ)全。

例2

Emerging and reemerging pathogens are global challenges for public health. Coronaviruses are enveloped RNA viruses that are distributed broadly among humans, other mammals, and birds and that cause respiratory, enteric, hepatic, and neurologic di-seases.

谷歌譯文(2020年8月9日) 病原體的出現(xiàn)和重新出現(xiàn)是公共衛(wèi)生的全球性挑戰(zhàn)。冠狀病毒是被包膜的RNA病毒,廣泛分布于人類,其他哺乳動物和鳥類中,并引起呼吸系統(tǒng),腸道,肝臟和神經(jīng)系統(tǒng)疾病。

修改譯文新興和再現(xiàn)病原體是公共衛(wèi)生的全球性挑戰(zhàn)。冠狀病毒是有包膜RNA病毒,廣泛分布于人類、其他哺乳動物以及鳥類宿主中,并可引起呼吸道、腸道、肝臟和神經(jīng)系統(tǒng)疾病。

結(jié)合5 - 10秒原則以及醫(yī)學(xué)文本翻譯的重難點,可觀察到“病原體的出現(xiàn)和重新出現(xiàn)”這里是不夠準(zhǔn)確的?!癳merging”有新興的、出現(xiàn)的、形成的等意思,但在本例中該詞應(yīng)取“新興的”一意,谷歌在選擇詞義時出現(xiàn)錯誤;因此為符合TAUS指南第(1)條要求,對語義不正確的地方進(jìn)行快速譯后編輯,其他部分機(jī)器譯文基本符合TAUS指南的質(zhì)量標(biāo)準(zhǔn),因此按第(4)條要求保留了大部分原始機(jī)器譯文。

例3

Human airway epithelial cell cultures were generated in an air-liquid interface for 4 t0 6 weeks toform well-differentiated, polarized cultures resemblingin vivo pseudostratified mucociliary epithelium.

谷歌譯文(2020年8月9日) 人氣道上皮細(xì)胞培養(yǎng)物在氣液界面上產(chǎn)生4至6周,形成分化良好的極化培養(yǎng)物,類似于體內(nèi)假復(fù)層粘膜纖毛上皮細(xì)胞。

修改譯文在氣液相界面培養(yǎng)人類呼吸道上皮細(xì)胞4至6周,形成分化良好的極化培養(yǎng)物,類似于體內(nèi)假復(fù)層粘膜纖毛上皮細(xì)胞。

借助5 - 10秒原則,本例中的“generate”有“繁殖、產(chǎn)生、發(fā)生”等意思,在本句中應(yīng)取“繁殖”的含義。谷歌在選擇詞義時未能準(zhǔn)確根據(jù)語境識別,使譯文句意產(chǎn)生偏差不易理解,因此在按照TAUS指南要求進(jìn)行快速譯后編輯時對該詞的翻譯進(jìn)行編輯。而此處指的是“人類呼吸道上皮細(xì)胞被繁殖”,因此在譯后編輯時根據(jù)句意將“generate”譯為“培養(yǎng)”。

(二)分詞短語錯譯

例4 More than 20,000 viral reads from indi-vidual specimens were obtained, and most contigs matched to the genome from lineage B of the genus betacoronavirus - showing more than 850-/0 identity with a bat SARS-Iike CoV (bat-SL-CoVZC45, MG77 2933.1) genomepublishedpreviously.

谷歌譯文(2020年8月9日) 從單個標(biāo)本中獲得了20 000多個病毒讀物,并且大多數(shù)重疊群與beta冠狀病毒屬B譜系的基因組相匹配——與蝙蝠SARS樣冠狀病毒(bat-SL-CoVZC45,MG772933.1)的同一性超過85%基因組先前已發(fā)表。

修改譯文從單個標(biāo)本中獲得了20 000多個病毒讀段,大多數(shù)重疊群與β冠狀病毒屬B譜系的基因組相匹配——與之前發(fā)布的蝙蝠SARS樣冠狀病毒( bat-SL-CoVZC45,MG772933.1)基因組的同源性超過85%。

本例中的“published previously”作為bat SARS-like CoV genome的后置定語,谷歌譯文未對語序進(jìn)行調(diào)整,保留了其原文的序位,導(dǎo)致譯文產(chǎn)生歧義,不夠準(zhǔn)確,所以為符合TAUS指南要求(1),對其進(jìn)行了調(diào)整。同時,“reads”一詞既有普通釋義又有專業(yè)釋義,需緊扣上下文關(guān)系,選擇醫(yī)學(xué)釋義[11]。借助5 - IO秒原則也可快速判斷reads在本篇醫(yī)學(xué)報告中譯為“讀物”是不正確的,所以為達(dá)到TAUS指南要求,對其進(jìn)行修改。通過術(shù)語在線查詢該詞,發(fā)現(xiàn)其在生物物理學(xué)領(lǐng)域是“測序片段”“測序讀段”的意思,因此將其譯為“讀段”。

例5

0ur study showed that initial propagation of human respiratory secretions onto human arrway epithelial cell cultures,followed by transmission elec-tron microscopy and whole genome sequencing of cul-ture supernatant,was successfully used for visualiza-tion and detection of new human coronavirus that canpossibly elude identification by traditional approaches.

谷歌譯文(2020年8月9日) 我們的研究表明,人呼吸道分泌物在人氣道上皮細(xì)胞培養(yǎng)物中的初步繁殖,然后通過透射電子顯微鏡和培養(yǎng)物上清液的全基因組測序,已成功用于可視化和檢測新的人冠狀病毒,而這可能無法通過傳統(tǒng)方法進(jìn)行鑒定。

修改譯文我們的研究表明,在人類呼吸道細(xì)胞培養(yǎng)基中對人類呼吸道分泌物進(jìn)行初步繁殖,然后用透射電子顯微鏡觀察并對培養(yǎng)物上清液進(jìn)行全基因組測序,可成功可視化并檢測新型人類冠狀病毒,而這種病毒可能無法通過傳統(tǒng)方法進(jìn)行鑒定。

本例中的分詞短語作插入語,谷歌對該插入語的處理按照原文順序和詞性生成了機(jī)器譯文,但邏輯上不夠連貫造成語義不夠準(zhǔn)確,引起了理解上的困難,無法達(dá)到TAUS指南要求(l)。而Cook曾提出要保證從讀者的認(rèn)知角度看,譯文語篇要連貫以免給讀者的信息提取設(shè)置障礙和干擾[12]。因此在譯后編輯時根據(jù)前后語境補(bǔ)充了語義,并對整個句子進(jìn)行了邏輯重組。此外,本例還存在術(shù)語不一致、詞義選擇錯誤以及代詞指代不清等問題,不符合TAUS相關(guān)指南要求的質(zhì)量,因此均對其進(jìn)行了編輯。

(三)從句錯譯

例6 Four lower resprratory tract samples, in-cluding bronchoalveolar-lavage fluid, were collectedfrom patients with pneumonia of unknown cause who were identified in Wuhan on December 21, 2019, orlater and who had been present at the Huanan Seafood Market close to the time of their clinical presentation.

谷歌譯文(2020年8月9日) 從2019年12月21日或以后在武漢發(fā)現(xiàn)的,原因不明的肺炎患者中收集了四個下呼吸道樣本,包括支氣管肺泡灌洗液,這些樣本在他們離開時已出現(xiàn)在華南海鮮市場臨床表現(xiàn)。

修改譯文我們從2019年12月21日前后在武漢確診的不明原因肺炎患者身上收集了四份下呼吸道樣本(包括支氣管肺泡灌洗液),他們出現(xiàn)臨床癥狀不久前都曾去過華南海鮮市場。

借助5 - 10秒原則,可識別出本句最后一句的機(jī)器譯文是無法理解的,回看原文可發(fā)現(xiàn)本句有兩個定語從句均修飾“patients”,谷歌在處理時并未準(zhǔn)確識別本句邏輯,將第二個從句判定為是修飾句首“samples”的,導(dǎo)致最終生成的譯文句意產(chǎn)生偏差,不符合TAUS指南的要求(1)。因此在譯后編輯時對其進(jìn)行了修改,將第二個從句的譯文予以修正,并為達(dá)到要求(4)對第一個從句的譯文進(jìn)行了LPE處理。

例7

0ur study showed that initial propagationof human respiratory secretions onto human airway epithelial cell cultures, followed by transrmssion elec-tron microscopy and whole genome sequencing of cul-ture supernatant, was successfully used for visualiza-tion and detection of new human coronavirus that canpossibly elude identification by traditional approaches.

谷歌譯文(2020年8月9日) 我們的研究表明,人呼吸道分泌物在人氣道上皮細(xì)胞培養(yǎng)物中的初步繁殖,然后通過透射電子顯微鏡和培養(yǎng)物上清液的全基因組測序,已成功用于可視化和檢測新的人冠狀病毒,這可能無法通過傳統(tǒng)方法進(jìn)行鑒定。

修改譯文我們的研究表明,在人類呼吸道細(xì)胞培養(yǎng)基中對人類呼吸道分泌物進(jìn)行初步繁殖,然后用透射電子顯微鏡觀察并對培養(yǎng)物上清液進(jìn)行全基因組測序,可成功可視化并檢測新型人類冠狀病毒,而這種病毒可能無法通過傳統(tǒng)方法進(jìn)行鑒定。

本句較長,借助5 - 10秒原則可發(fā)現(xiàn)最后一句語義不清晰,易產(chǎn)生歧義。仔細(xì)閱讀原文,發(fā)現(xiàn)谷歌在處理修飾“new human coronavrrus”的定語從句時,沒有明確引導(dǎo)詞的指代,使譯文句意模糊不夠準(zhǔn)確,為達(dá)到TAUS指南要求(l),對該處進(jìn)行了編輯。同時機(jī)器譯文還出現(xiàn)了詞性未能準(zhǔn)確轉(zhuǎn)換導(dǎo)致譯文意思不夠明確的現(xiàn)象,即對“initialpropagation”的處理不夠靈活準(zhǔn)確,所以譯后編輯時將其修改為“進(jìn)行初步繁殖”。

(四)段落錯譯、漏譯問題

例8

Three adult patients presented with severepneumonia and were admitted to a hospital iIl Wuhan on December 27, 2019. Patient l was a 49-year-oldwoman, Patient 2 was a 61-year-old man, and Patient 3was a 32-year-oldrrian.Clinical profiles were avail-able for Patients l and 2.Patient l reported having nounderlying chronic medical conditions but reportedfever (temperature, 37 cC t0 38 cC) and cough withchest discomfort on December 23, 2019. Four daysafter the onset of illness,her cough and chest discom-fort worsened, but the fever was reduced;a diagnosis of pneumonia was based on computed tomographic(CT) scan. ...Patients l and 3 recovered and were dis-charged from the hospital on January 16, 2020. Patient2 died on January 9,2020. No biopsy specimens were obtained.

谷歌譯文(2020年10月7日) 三名患有嚴(yán)重肺炎的成年患者于2019年12月27日人武漢醫(yī)院?;颊?為49歲女性,患者2為61歲男性,患者3為32歲老人患者1和2可獲得臨床資料。患者1報告于2019年12月23日無基本慢性病,但報告有發(fā)燒(溫度37℃至38℃)和咳嗽伴胸口不適。疾病,咳嗽和胸部不適加劇,但發(fā)燒減少;肺炎的診斷基于計算機(jī)斷層掃描(CT)掃描?!颊?和3已康復(fù),并于2020年1月16日出院。患者2于2020年1月9日死亡。未獲得活檢標(biāo)本。

修改譯文 三名患有嚴(yán)重肺炎的成年患者于2019年12月27日人武漢醫(yī)院?;颊?為49歲女性,患者2為61歲男性,患者3為32歲男性?;颊?和2可獲得臨床資料?;颊?報告于2019年12月23日,無基本慢性病,但報告有發(fā)燒(溫度37℃至38℃)和咳嗽伴胸口不適。患者1在發(fā)病四天后,咳嗽和胸部不適加劇,但發(fā)燒減少,肺炎的診斷基于計算機(jī)斷層掃描( CT)掃描?!颊?和3已康復(fù),并于2020年1月16日出院?;颊?于2020年1月9日死亡,未獲得活檢標(biāo)本。

根據(jù)5 - 10秒評價原則,可以快速判定“Pa-tient 3 was a 32-year-old man”的譯文是有問題的,然后對其進(jìn)行了修改。但令人奇怪的是前兩處對于年齡的翻譯處理都很準(zhǔn)確,僅此處譯文出現(xiàn)了問題,為進(jìn)行確認(rèn),筆者使用谷歌在線翻譯引擎嘗試了3-4次,都得到了同樣的結(jié)果。而本段中“Fourdays after the onset of illness”被遺漏了,這里的漏譯僅憑5 - 10秒閱讀機(jī)器生成的譯文是判定不出來的,必須結(jié)合原文進(jìn)行審校檢查。但其實該句句法并不復(fù)雜,鑒于之前谷歌譯文的良好表現(xiàn),筆者為確認(rèn)也進(jìn)行了3-4次的谷歌翻譯嘗試,得出的結(jié)果均相同。鑒于此,筆者認(rèn)為這是阻礙譯后編輯效率提高的一個重要因素,也是機(jī)器翻譯應(yīng)盡快解決的問題。

綜上,在本次實踐過程中發(fā)現(xiàn),相當(dāng)一部分機(jī)器原始譯文已符合TAUS指南中“good enoughquality”的要求,不用做太多修改。且機(jī)器翻譯質(zhì)量在持續(xù)提高,在醫(yī)學(xué)專有名詞、術(shù)語以及被動語態(tài)方面均表現(xiàn)良好,但對一詞多義的詞匯識別還不夠準(zhǔn)確,問題較多,同時對長句、結(jié)構(gòu)復(fù)雜的句子處理較為糟糕,如定語從句、分詞結(jié)構(gòu)等,轉(zhuǎn)換時無法對句子語序進(jìn)行調(diào)整,導(dǎo)致譯文意思出現(xiàn)偏差,甚至在翻譯段落時出現(xiàn)漏譯現(xiàn)象。

通過使用TAUS指南指導(dǎo)LPE的實踐發(fā)現(xiàn),指導(dǎo)性較強(qiáng)的是要求(1)(2)(4),可根據(jù)此三條要求快速做出判斷是否應(yīng)對機(jī)器譯文進(jìn)行LPE。因本次實踐中未遇到文化上不妥和侵犯信息,以及因本文為英譯漢,漢語無拼寫問題,所以要求(3)和(5)關(guān)于文化和拼寫問題不用討論。要求(4)在應(yīng)用時應(yīng)注意盡可能多地保留機(jī)器初始譯文是建立在機(jī)器譯文質(zhì)量較高的基礎(chǔ)上,譯者應(yīng)迅速做出判斷是否舍棄機(jī)器譯文進(jìn)行人工翻譯,否則時間成本反而更高。要求(6)無需進(jìn)行僅跟文風(fēng)相關(guān)的改正和(7)不需僅為改善譯文流暢度進(jìn)行句子重組,就允許我們保留一些不符合中文語言習(xí)慣但句子含義表達(dá)正確的機(jī)器譯文而無需進(jìn)行修改。如例1僅修改了詞匯錯譯的部分,其余均保留機(jī)器譯文,節(jié)約了很多時間。通過使用TAUS指南,在進(jìn)行譯后編輯時會更有目的性,標(biāo)準(zhǔn)更加明確,可盡量避免做一些不必要的修改導(dǎo)致時間成本和人工成本的浪費(fèi)。當(dāng)然,TAUS指南仍有許多不足之處,依舊不夠具體,有待在實踐應(yīng)用中繼續(xù)完善。

四、結(jié)束語

語言服務(wù)行業(yè)采用機(jī)器翻譯譯后編輯模式來提高翻譯效率和翻譯質(zhì)量,也需要統(tǒng)一規(guī)范的標(biāo)準(zhǔn)來幫助評估工作質(zhì)量并定價。同時好的規(guī)范還可以促進(jìn)MTPE模式效率和質(zhì)量的進(jìn)一步提升,如本文按照TAUS指南對“good enough quality”的要求進(jìn)行快速譯后編輯時,目標(biāo)更加明確和清晰,避免譯后編輯過程中因標(biāo)準(zhǔn)不確定進(jìn)行不必要的編輯,導(dǎo)致比純?nèi)斯しg耗時更長的情況發(fā)生。且此類醫(yī)學(xué)報告信息交流的時效性尤為關(guān)鍵,因為流行病的傳播快、傳染性強(qiáng),信息能夠更快實現(xiàn)共享,就可能更早更有效地防控疾病更大范圍傳播,就可能幫助各國醫(yī)務(wù)工作者共同合作更早研究出應(yīng)對方法。因此,采取較高的機(jī)器初始譯文質(zhì)量加清晰的譯后編輯要求(規(guī)則),可幫助譯后編輯者們在更短時間內(nèi)獲得符合預(yù)期的譯文。當(dāng)然本文所遵循的TAUS指南也依舊存在需要改善或進(jìn)一步細(xì)化的地方,相信隨著機(jī)器翻譯譯后編輯的發(fā)展,更加完善的規(guī)范會生成,機(jī)器翻譯譯后編輯模式也會更加成熟高效。

參考文獻(xiàn):

[1] 馮志偉.機(jī)器翻譯與人工智能的平行發(fā)展[J].外國語,2018, 41(6):35 -48.

[2] 羅季美,李梅.機(jī)器翻譯譯文錯誤分析[J].中國翻譯,2012,33 (5): 84-89

[3] 劉玉強(qiáng),賀子瓊.醫(yī)學(xué)英語的文體特征及其翻譯策略[J].英語廣場,2015( 10): 35 -36.

[4] 馮全功,崔啟亮,譯后編輯研究:焦點透析與發(fā)展趨勢[J].上海翻譯,2016(6):67 - 74,89.

[5] TAUS. Post-editing in Practice[EB/OL]. (2010-03-10)[2020-08-20]

https://www. taus net/think-tank/reports/postedit-reports/postediting-in-practice.

[6] ISO. IS0

18587: 2017 Translation services -Post-editing of machine translation output -Require-ments[S]. ISO, 2017.

[7] 崔啟亮.論機(jī)器翻譯的譯后編輯[J].中國翻譯,2014,35 (6): 68-73.

[8] TATSUMI M. Post-editing machine translated text in acommercial setting: observation and statistical analy-sis[D]. Ireland: Dublin City University, 2010.[9]

TAUS. TAUS MT Post-editing guidelines[EB/OL](2016-01-20) [2020-08-20].

https:i/www taus.netithink- tank/reportsipostedit-reports/taus -po st-editing- guidelines.

[10] SANCHIS-TRIIIES G,ALABAU V,BUCK C,et al.Interactive translation prediction versus conventionalpost-editing in practice:a study with the CasMaCatworkbench[J]. Machine Translation, 2014,

28(3):217 - 235.

[11] 李拜華.英漢醫(yī)學(xué)翻譯中的詞義選擇[J].中國翻譯,1995 (1): 16-22.

[12] COOK G.Discourse

and Literature[M]. Shanghai:Shanghai Foreign Language Education Press, 1999.

(編輯:朱渭波)

猜你喜歡
機(jī)器翻譯
海量數(shù)據(jù)機(jī)器單詞中關(guān)鍵語義篩選方法研究
機(jī)器翻譯不可盲取
青春歲月(2017年1期)2017-03-14 11:28:47
信息時代下機(jī)器翻譯的“可譯”與“不可譯”
互聯(lián)網(wǎng)+新時代下人機(jī)翻譯模式研究
考試周刊(2017年2期)2017-01-19 09:13:50
“語聯(lián)網(wǎng)+行業(yè)” 助力中國偉大復(fù)興
考試周刊(2017年2期)2017-01-19 09:12:54
大數(shù)據(jù)背景下石油科技翻譯
智富時代(2016年12期)2016-12-01 17:03:10
機(jī)器翻譯不可盲取
基于免費(fèi)在線翻譯工具的機(jī)器翻譯缺陷探討
漢哈機(jī)器翻譯中的文字轉(zhuǎn)換技術(shù)研究
機(jī)器翻譯句法錯誤分析
陵川县| 吉首市| 文昌市| 道孚县| 溆浦县| 阿尔山市| 阳江市| 神池县| 东安县| 磐安县| 三亚市| 白朗县| 恭城| 多伦县| 嵊州市| 徐州市| 吉水县| 丹东市| 元氏县| 玛曲县| 祥云县| 汉川市| 宝坻区| 青神县| 彰武县| 丁青县| 大方县| 图们市| 通海县| 天镇县| 长沙县| 元阳县| 武川县| 芦溪县| 贵定县| 景东| 苏尼特左旗| 祁连县| 三原县| 潼南县| 卓尼县|