李佳鈺
[摘? 要:通過應(yīng)用機器學(xué)習(xí)和自然語言處理技術(shù),機器翻譯正處于飛速發(fā)展的階段。本文以百度翻譯的《在城崎》譯文為例,旨在通過分析機器翻譯目前的不足之處,提出改進意見,為推動機器翻譯在跨語言、跨文化交流方面的發(fā)展貢獻力量。
關(guān)鍵詞:機器翻譯;日譯漢;日本文學(xué);自然語言處理]
一、引言
“機器翻譯是利用計算機把一種自然源語轉(zhuǎn)換成另一種自然目標(biāo)語言的過程。機器翻譯研究如何利用計算機實現(xiàn)自然語言之間的自動翻譯,是人工智能和自然語言處理領(lǐng)域的重要研究方向之一”(劉洋,2017)。當(dāng)前,隨著經(jīng)濟全球化的深入發(fā)展,各國在經(jīng)濟、貿(mào)易、環(huán)境、教育、文化方面的交流與合作日益頻繁,語言互通的需求愈加強烈。機器翻譯的快速發(fā)展,不僅在外語學(xué)習(xí)中發(fā)揮著越來越大的作用,也正在為跨語言、跨文化交流帶來便利。
在關(guān)于機器翻譯的先行研究中,英漢互譯的相關(guān)研究占多數(shù),而日漢翻譯方面的研究尚且為數(shù)不多。隨著中日兩國不斷加強交流,深化合作,兩國在生產(chǎn)、貿(mào)易、教育、文化等領(lǐng)域的交流越來越密切,日漢翻譯的需求也在不斷擴大。文學(xué)作品是加強對彼此文化理解的重要途徑,機器翻譯能夠快速翻譯大量文本,具有便利高效的特點。
根據(jù)艾瑞PC Web指數(shù),從2020年2月到2021年2月,百度翻譯持續(xù)位列國內(nèi)在線翻譯平臺的月度覆蓋人數(shù)第一名。根據(jù)統(tǒng)計數(shù)據(jù)可得,百度翻譯月平均覆蓋人數(shù)約4000萬人,最高可達4600萬人,是目前國內(nèi)使用人數(shù)最多的在線翻譯平臺。本文以百度翻譯代表,考察機器翻譯在日本文學(xué)方面的譯文質(zhì)量,指出不足之處并提出改進建議。
二、機器翻譯在日本文學(xué)方面的質(zhì)量實證考察
現(xiàn)代機器翻譯應(yīng)用機器學(xué)習(xí)和自然語言處理技術(shù),通過學(xué)習(xí)大量數(shù)據(jù)語料不斷改善。目前,機器翻譯在書面文章類翻譯正確率很高,會話類則較低。(郭亞軍 徐芮,2020)。志賀直哉的心境小說《在城崎》全篇沒有對話,為記敘和作者關(guān)于生死的議論。本文通過《在城崎》的百度翻譯例文為例,分析機器翻譯的不足之處,歸納錯誤類型并列出具有代表性的錯誤例句。
(一)名詞誤譯
1.照搬漢字作為翻譯
(1)原文:山女が沢山集まっている。
誤譯:聚集了很多山女。
確譯:聚集著很多馬蘇大麻哈魚。
「山女」指馬蘇大麻哈魚,可譯為鱒魚或馬蘇大麻哈魚。
(2)原文:植込みの八つ手の花が丁度咲きかけで……
誤譯:花叢里的八只花正在盛開……
確譯:花叢里的八角金盤樹的花剛剛盛開……
「八つ手」指八角金盤樹。
此外,百度翻譯譯文中還出現(xiàn)了將「屋守」“壁虎”譯為“屋守”;「雨樋」“檐漕”譯為“雨樋”的誤譯。
2.名詞識別錯誤
(1)原文:いもりだ。
誤譯:是陰天。
確譯:是蠑螈。
(2)原文:いもりは力なく前へのめってしまった。
誤譯:蝙蝠無力地向前傾倒。
確譯:蠑螈無力地向前倒下。
(3)原文:いもりと自分だけになったような気持ちがしていもりの身に自分がなってその気持ちを感じた。
誤譯:我有一種只剩自己一個人的感覺,在森林里自己也感受到了那種心情。
確譯:似乎世間只剩下我和蠑螈,我感到自己變成了死去蠑螈的替身。
本句中「いもり」一詞出現(xiàn)了兩次,第一次百度翻譯將其漏譯,第二次誤譯成森林。
「いもり」指蠑螈,在文章其他出現(xiàn)了「いもり」的句子中,百度翻譯正確地將其翻譯為蠑螈,證明語料庫中有「いもり」一詞,但在上述四個誤譯句中,百度翻譯沒能將「いもり」完整識別進而翻譯出來,而是錯誤識別成假名拼寫相近的「くもり」(陰天)、「こうもり」(蝙蝠)、「もり」(森林)等詞。
3.名詞詞義翻譯錯誤
(1)原文:兎に角要心は肝心だからといわれて、それで來た。
誤譯:總之重要的是因為重要,所以來了。
確譯:(醫(yī)生說)總之重要的是要注意身體,所以來到了這里。
「要心」的意思是留心,注意。
機器翻譯出現(xiàn)了將漢字直接作為譯文或詞義翻譯錯誤,以及識別錯誤的情況。
(二)動詞誤譯
1.動詞詞義翻譯錯誤
(1)原文:それは大きな鼠を川へなげ込んだのを見ているのだ。
誤譯:那是在看大老鼠掉進河里了。
確譯:那是在看被扔進河里的大老鼠。
「なげ込む」扔進,投入。
2.動詞活用形翻譯錯誤
(1)原文:仕舞に殺されて墓の下にいる、その靜かさを……
誤譯:被殺在墓下的那種安靜……
確譯:最終被殺死后,在墓中長眠的安靜……
(2)原文:自分は下へいってそれを暫く見上げていた。
誤譯:我往下看了一會兒那個。
確譯:我走到下面,仰著頭看了一會它。
句中的動詞て形表示停頓和動作的先后順序,翻譯時應(yīng)注意將動詞活用形翻譯準(zhǔn)確。
(三)形容詞、形容動詞誤譯
(1)原文:フェータルな傷……
誤譯:淡雅的傷……
確譯:致命的傷……
「フェータル」是外來語,致命的,命運的。
(四)擬聲擬態(tài)詞誤譯
(1)原文:カチッカチッと石垣に當(dāng)って跳ね返った。
誤譯:喀嚓一聲撞到石墻上反彈了起來。
確譯:石頭咯當(dāng)咯當(dāng)?shù)刈驳绞瘔ι戏磸椓似饋怼?/p>
(2)原文:スポッ、スポッと石が水へ投げ込まれた。
誤譯:嘩的一聲,石頭扔到了水里。
確譯:“撲通”、“撲通”石頭被扔進水里。
連續(xù)的擬聲詞表示動作持續(xù)的狀態(tài),而“……一聲”只描述了一個動作,與原文不符。
(五)代名詞誤譯
(1)原文:それは三日程その儘になっていた。それは見ていて、如何にも靜かな感じを與えた。
誤譯:那個維持了三天左右。那個看著,給人一種安靜的感覺。
確譯:死去的蜜蜂在那里待了三天,看起來有一種極其安靜的感覺。
(2)原文:自分はそれに対し、感謝しなければすまぬような気もした。
誤譯:我覺得必須要感謝那個。
確譯:我感到自己必須對此心懷感謝。
代名詞翻譯與其他詞性的詞的翻譯不同,并不依靠語料庫,而是需要聯(lián)系上下文進行理解判斷,但機器翻譯只機械地將「それ」、「これ」等代名詞譯為“那個”“這個”等,造成語意不通、語意生硬等問題。
(六)句型翻譯錯誤
1.句型判斷錯誤
(1)原文:半分意識を失った狀態(tài)で、一番大切な事だけによく頭の働いた事は自分でも後から不思議に思った位である。
誤譯:在失去了一半意識的狀態(tài)下,正因為是最重要的事情,所以腦子里經(jīng)常工作的事情,自己后來也覺得不可思議。
確譯:在近乎失去意識的狀態(tài)下,竟還能在腦海中想著最重要的事情,事后自己想起來都覺得不可思議。
「……に頭が働く」精神在……方面活動,「一番大切な事だけによく頭の働いた事」即“腦海中只想著最重要的事情”之意,百度翻譯將句型識別為「だけに」“正因為……”,導(dǎo)致整句譯文偏離原意。
(2)原文:或所迄來ると橋だの岸だのに人が立って何か川の中の物を見ながら騒いでいた。
誤譯:到了某個地方,明明是橋或岸邊卻站著人,一邊看著河里的東西一邊吵鬧著。
確譯:走到某個地方,只見橋上和岸邊擠滿了人,一邊看著河里的東西一邊喧鬧著。
原句中出現(xiàn)的句型是「……だの……だの」,表示列舉,“又是……又是……”,原句的意思是“人們站在橋上和岸邊”,但百度翻譯錯誤識別為「のに」“明明……”,導(dǎo)致譯文錯誤。
2.未識別出句型
(1)原文:然し今は、それが本當(dāng)に何時か知れないような気がして來た。
誤譯:但是現(xiàn)在,我覺得那個真的不知道什么時候來了。
確譯:但是如今,卻漸漸覺得何時死亡確實是不可預(yù)測的。
「気がしてきた」是「気がする」的變形,百度翻譯誤將「きた」單獨拆開,誤譯為“來了”。
(七)定語誤譯
1.定語所修飾的名詞判斷錯誤
(1)原文:虎斑の大きな肥った蜂が天気さえよければ、……
誤譯:虎斑肥大的蜂只要天氣好……
確譯:帶有大片虎斑的肥大的蜜蜂在天氣晴朗的時候……
「虎斑の大きな肥った」是「蜂」的定語,但百度翻譯誤將「肥った」當(dāng)成「虎斑」的定語,導(dǎo)致翻譯錯誤。
2.定語翻譯錯誤
(1)原文:自分は自分の怪我の場合、それに近い自分になった事を思わないではいられなかった。
誤譯:如果自己受了傷,就不能不想起和自己相近的事情。
確譯:我不由得想起自己受傷時,也是像那只老鼠一樣非常拼命的。
「それに近い」是「自分」的定語,所以直譯應(yīng)為“和那相近的自己”,百度翻譯誤譯為“和自己相近”。
(2)原文:自分は円山川、それからそれの流れ出る日本海などの見える東山公園へ行くつもりで宿を出た。
誤譯:我準(zhǔn)備去東山公園,那里能看到圓山川,還有從那里流出的日本海。
確譯:我打算出門去東山公園,在那里能觀賞到圓山川和它匯入的日本海。
「それの流れ出る」是名詞「日本海」的定語,即「円山川が流れ出る」“圓山川流向的”之意,百度翻譯顛倒了流向關(guān)系。
(八)主語賓語判斷錯誤
(1)原文:自分はいもりを驚かして水へ入れようと思った。
誤譯:我嚇了一跳,想把它放到水里。
確譯:我想把蠑螈驚到水里。
動詞「驚かす」的賓語是「いもり」,主語是「自分」,百度翻譯錯把主語當(dāng)成了賓語。
(九)主動被動語態(tài)翻譯錯誤
(1)原文;そしてそういわれても……
誤譯:即使那樣說,……
確譯:即使被這樣告知……
(2)原文:死んだ蜂は雨樋を伝って地面へ流し出された事であろう。
誤譯:死去的蜂是通過雨樋流到地面上的吧。
確譯:死去的蜂順著檐漕被沖到地面上了吧。
文中「いわれて」、「流し出された」都是被動態(tài),百度翻譯中主動被動語態(tài)翻譯錯誤。
(十)肯定否定判斷錯誤
(1)原文:然し気分は近年になく靜まって、落ちついたいい気持がしていた。
誤譯:然而,心情卻近年來安靜下來,心情平靜下來。
確譯:心情卻是近年來沒有的寧靜、平和的好心情。
「なく」是「ない」的活用形,表示否定。
(十一)多義詞誤譯
(1)原文:脇が玄関の屋根で、それが家へ接続する所が羽目になっている。
誤譯:旁邊是玄關(guān)的屋頂,與家連接的地方成了窘境。
確譯:旁邊是玄關(guān)的屋頂,與房間的木墻板相連。
「羽目」有“木墻板”和“窘境”兩個語義,在本句中應(yīng)采用“木板墻”之意。
(2)原文:それが一層そういう気分に自分を誘って行った。
誤譯:那個更加邀請了那樣的心情自己去了。
確譯:這又進一步引發(fā)了這種感覺。
「誘う」有“邀請;引誘;引發(fā)、促使”三個義項,在本句中應(yīng)采用“引發(fā)、促使”的意思。
(3)原文:最初石が當(dāng)たったとは思わなかった。
誤譯:我沒想到第一次碰到石頭。
確譯:最開始完全沒想到是石頭打中了它。
副詞「最初」有“最初,起先;第一次”等意,文中應(yīng)采用“最初,最開始”的義項。句中動詞「當(dāng)たる」有“猜中;擊中;中獎”等多個義項,但文中的意思應(yīng)為“擊中,打中”。
(十二)漏譯
1.謂語漏譯
(1)原文:頭の上に三寸程、咽喉の下に三寸程それが出ている。
誤譯:頭上有三寸左右,喉嚨下面有三寸左右。
確譯:魚簽子在老鼠的頭上方、喉嚨下方各露出三寸左右。
2.定語漏譯
(1)原文:……時考える事は矢張り沈んだ事が多かった。
誤譯:……的時候,思考的事情還是很多的。
確譯:……此時此刻想的也多是令人不快的事。
「事」前的定語「沈んだ」被漏譯。
(2)原文:外界にそれを動かす次の変化が起るまでは死骸は凝然と其処にしているだろう。
誤譯:在外界發(fā)生下一次變化之前,尸體會凝固在那里吧。
確譯:蜜蜂的尸體大概會一直待在那里,直到下一次外界發(fā)生搬動它的變化為止。
「変化」前的定語「それに動かす」被漏譯。
3.狀語漏譯
(1)原文:植込みの八つ手の花が丁度咲きかけで……
誤譯:花叢里的八只花正在盛開……
確譯:花叢里的八角金盤樹的花恰好正盛開著……
修飾動詞「咲きかける」的狀語「丁度」被漏譯。
日語的語序?qū)釉~放在句尾,且多用定語,百度翻譯在翻譯長句時易漏譯句中的定語、狀語和句尾謂語。
(十三)沒有補譯或補譯錯誤
1.沒有補譯
(1)原文:山の手線の電車に跳ね飛ばされて怪我をした、……
誤譯:被山手線電車撞傷,……
確譯:我被山手線電車撞傷,……
百度翻譯沒有補譯主語“我”。
(2)原文:顔の表情は人間にわからなかったが動作の表情に、それが一生懸命である事がよくわかった。
誤譯:雖然人類不知道臉上的表情,但是從動作的表情中,我明白了那是非常拼命的。
確譯:雖然人類無法理解老鼠臉上的表情,但是從老鼠的動作上,我明白了它在拼命掙扎。
「顔の表情」、「動作の表情」的主語都是老鼠,補譯后句意更加完整便于讀者理解。但百度翻譯的譯文沒有適當(dāng)補譯。
2.補譯錯誤
(1)原文:それは見ていて、如何にも靜かな感じを與えた。淋しかった。
誤譯:那個看著,給人一種安靜的感覺。我很寂寞。
確譯:它看起來有一種極其安靜和寂寞之感。
句中的「淋しかった」的主語不是“我”,而是“蜜蜂的尸體”。
(2)原文:いもりはしっぽをそらし、高く上げた。自分はどうしたのかしら、と思って見ていた。
誤譯:蠑螈把尾巴向后仰,高高舉起。我在想自己是怎么了。
確譯:它的尾巴向后卷起來,高高地豎起著。我正想著蠑螈這是怎么了,繼續(xù)在旁邊看著。
原文中「どうしたのかしら」“(蠑螈)這是怎么了”,省略了主語蠑螈。百度翻譯誤將主語補譯成“我”,導(dǎo)致譯文錯誤。
(十四)沒有拆譯
(1)原文:他の蜂が皆巣へ入って仕舞った日暮、冷たい瓦の上に一つ殘った死骸を見る事は淋しかった。
誤譯:在其他蜂都進了巢的日暮,看到在冰冷的瓦上留下的一具尸體很寂寞。
確譯:日暮時,其他蜂都歸巢了,獨留那一具蜜蜂的尸體躺在冰冷的瓦片上,看起來十分寂寞。
(2)原文:狙ってもとても當(dāng)らない程、狙って投げる事の下手な自分はそれが當(dāng)る事などは全く考えなかった。
誤譯:就算瞄準(zhǔn)了也根本打不中,不擅長瞄準(zhǔn)投出的自己完全沒想過會中。
確譯:我知道自己準(zhǔn)頭極差,就是瞄準(zhǔn)了投也打不中,所以完全沒想到自己剛剛的隨手一扔能打中。
翻譯遇到較長的定語時,一般進行拆譯使之符合漢語的語言習(xí)慣。但百度翻譯處理例句中的體言「日暮」、「自分」前的定語時,直接按照原文語序進行翻譯,沒有拆譯,使譯文不流暢自然。
(十五)語序不當(dāng)
(1)原文:自分は自分の怪我の場合、それに近い自分になった事を思わないではいられなかった。
誤譯:如果自己受了傷,就不能不想起和自己相近的事情。
確譯:我不由得想起自己受傷時,也是像那只老鼠一樣非常拼命的。
動詞“想”應(yīng)放在句首主語后。
(2)原文:自分は偶然に死ななかった。いもりは偶然に死んだ。
誤譯:我沒有偶然死去。蠑螈偶然地死了。
確譯:我是偶然活下來的。蠑螈是偶然死的。
“偶然”應(yīng)放在否定之前,即“偶然地沒有死去”,也就是“偶然地活下來”之意。
(十六)搭配不當(dāng)
(1)原文:……道幅が狹くなって路も急になる、流れも同様に急になって、……
誤譯:……道路就變窄了,路也變陡了,水流也同樣變陡了,……
確譯:……道路就變窄了,路也變陡了,水流也變得湍急,……
“水流”的對應(yīng)搭配應(yīng)該為“湍急”。
(十七)語意不通順
(1)原文:鼠はどうかして助かろうとしている。
誤譯:老鼠無論如何都要救過來。
確譯:老鼠拼命想活下來。
「助かる」即「死を免れる」在文中應(yīng)譯為“活下來”。
(2)原文:傍の洗場の前で餌を漁っていた二三羽の家鴨が石が飛んで來るので吃驚し、……
誤譯:在旁邊的洗浴室前捕餌的兩三只家鴨飛來石頭,嚇了一跳,……
確譯:兩三只鴨子正在旁邊的洗手池前覓食,被砸過來的石頭嚇了一跳,……
“家鴨”后接“飛來石頭”語意不通順,應(yīng)適當(dāng)調(diào)整譯文順序。
三、機器翻譯的改進意見
(一)更新并檢查語料庫
實時更新語料庫,檢查語料庫的正確性。完善詞語、句型,并注意動詞活用形的用法。不斷輸入時事新詞,尤其要注意動植物類名詞、人名等專有名詞和外來語、流行語。
(二)提高識別準(zhǔn)確度
即使語料庫中存有詞語和句型,但若是識別不準(zhǔn)也會導(dǎo)致翻譯錯誤。因此,提高識別的精準(zhǔn)度也是提高翻譯正確率的一個重要方法。
(三)完善翻譯算法
機器翻譯通過大量數(shù)據(jù)語料歸納出算法模型并不斷完善,再將算法模型應(yīng)用到翻譯中。目前,機器翻譯的算法模型在以下幾個方面較為薄弱,需要改善加強。
1.擬聲擬態(tài)詞翻譯。將擬聲擬態(tài)詞翻譯為對應(yīng)的象聲詞,并注意譯文句式靈活,貼近原文。
2.定語翻譯。準(zhǔn)確判斷定語修飾的體言。
3.準(zhǔn)確判斷句中的主語賓語、主動被動關(guān)系、肯定否定關(guān)系。
4.減少漏譯。完整翻譯句子各成分,尤其注意句尾的謂語、句中的定語和狀語。
5.應(yīng)用拆譯的翻譯手法,特別在翻譯定語句和長句時,使譯文更符合漢語的語言習(xí)慣。
(四)加強對漢語譯文的檢查
大量輸入漢語語言語料,完善漢語語言模型。利用語言模型檢查翻譯出的漢語譯文是否存在語序不當(dāng)、搭配不當(dāng)、成語運用不當(dāng)、語意不通順等問題并進行改正。
四、結(jié)語
本文以《在城崎》百度翻譯譯文為例,分析了機器翻譯目前的不足之處并提出改進意見,期待機器翻譯今后繼續(xù)不斷改進,提高翻譯準(zhǔn)確率,在突破漢日語言壁壘的道路上繼續(xù)向前邁進,在跨語言、跨文化交流方面發(fā)揮越來越大的作用。
參考文獻
[1]顧明耀.標(biāo)準(zhǔn)日語語法(第二版)[M].北京:高等教育出版社,2004.
[2]劉洋.神經(jīng)機器翻譯前沿進展[J].計算機研究與發(fā)展,2017,(6).
[3]孫澤方.當(dāng)前日譯漢機器翻譯的缺陷及對策——以特朗普就職演講日文版的“Baidu 翻譯”譯文為例[J].現(xiàn)代語文(語言研究版),2017,(5).
[4]郭亞軍,徐芮.Baidu翻譯日譯漢中存在的問題與對策 ——以《綜合日語》為例[J].吉林廣播電視大學(xué)學(xué)報,2020(9).
[5]王鈺.自然語言處理及其在機器翻譯中的應(yīng)用[J].現(xiàn)代語文,2019(5).
[6]祝朝偉.機器翻譯要取代作為人的譯者了嗎?--兼談翻譯人才培養(yǎng)中科技與人文的關(guān)系[J].外國語文,2018,(3).
[7]杜金華,張萌,宗成慶,等.中國機器翻譯研究的機遇與挑戰(zhàn)——第八屆全國機器翻譯研討會總結(jié)與展望[J].中文信息學(xué)報,2013,(4).
西北大學(xué)? 陜西? 西安? 710127