郭亞軍 徐 芮
(長安大學外國語學院,陜西 西安 710064)
隨著中日兩國政治、經(jīng)濟及文化交流的日益頻繁,日漢翻譯的需求也與日俱增。在信息技術(shù)和人工智能技術(shù)飛速發(fā)展之際,機器翻譯應運而生,并在人們的日常生活中扮演著越來越重要的角色?,F(xiàn)代社會幾乎人人都擁有智能手機,非常便于使用各種機器翻譯應用軟件。許多日語學習者,特別是初級水平的學習者,都會頻繁使用手機機器翻譯工具。但是,機器翻譯的效果到底如何,能不能完全依賴于它的翻譯結(jié)果等,這些問題的答案都尚不明確。
目前研究機器翻譯的文章有很多,但主要集中在日英翻譯(吉見,2001;吉見,2003;小田,2019)和漢英翻譯(何,2018;馮,2001;梁,2018;張,2019;張,2008),很少有關(guān)于漢日翻譯的研究。并且選擇研究的文本數(shù)量較少,文本題材也較局限,多為科技類(陳,2005)、報紙類(張,2019)、演講稿類(孫,2017;)等,幾乎沒有以日常生活類文本作為研究對象。此外,提出的對策多從機器翻譯開發(fā)者(王,2007;謝,2004)和職業(yè)翻譯工作者(董,2019;陳,2019)的角度出發(fā),很少有從日語學習者和日語水平較低者的角度進行分析。
本文選擇Baidu 翻譯為研究對象,以大學日語權(quán)威教科書《綜合日語第一冊》為翻譯文本,以教育部2006 年發(fā)布的《機器翻譯評測規(guī)范》為參考準則,通過比較分析文本的Baidu翻譯結(jié)果與教師參考書中的翻譯范本,評估Baidu 翻譯的日漢翻譯特點與質(zhì)量,找出機器翻譯的問題并提出對策。
根據(jù)艾瑞PC Web 指數(shù),2018 年10 月到2019 年10 月,Baidu 翻譯持續(xù)位列在線翻譯領(lǐng)域月度覆蓋人數(shù)第一名。數(shù)據(jù)分析可得,Baidu 翻譯月平均覆蓋人數(shù)約為4167 萬,最高可達4600 萬,且整體呈上升趨勢,是當前在中國使用人數(shù)最多的在線翻譯平臺,知名度較高,使用范圍較廣,接入產(chǎn)品較多。
筆者對長安大學日語專業(yè)學生Baidu 翻譯平臺的使用狀況進行了問卷調(diào)查,發(fā)放問卷78 份,回收78 份,其中有效問卷78 份。問卷結(jié)果表明,78 名受訪者中,關(guān)于Baidu 翻譯的使用頻度,所有的學生均表示在日語學習過程中使用過Baidu 翻譯或其合作方的翻譯功能;關(guān)于Baidu 翻譯的質(zhì)量,有20%的學生對Baidu 翻譯質(zhì)量表示滿意,68%的學生認為Baidu 翻譯的結(jié)果一般,僅12%的學生表示不滿意。由此可見,日語學習者對于Baidu 翻譯總體接受度較高,但對其翻譯質(zhì)量持中立態(tài)度較多。那么Baidu 翻譯的質(zhì)量究竟如何,筆者選取《綜合日語第一冊》作為語料庫進行了考察。
本文將《綜合日語第一冊》的Baidu 翻譯結(jié)果與《綜合日語第一冊教師用書》會話課文的譯文進行對比分析,以2006年教育部發(fā)行的《機器翻譯系統(tǒng)評測規(guī)范》為打分標準。滿分為5 分,根據(jù)翻譯質(zhì)量的優(yōu)劣對翻譯結(jié)果打分。具體標準如下表1:
表1 《機器翻譯系統(tǒng)評測規(guī)范》
《綜合日語第一冊》共有十五課,前四課無課文,因此本文選擇第5-15 課課文展開研究,每課第一、二單元為會話文,第三單元為讀解文;共計22 篇會話文,11 篇讀解文。具體得分如下表2:
從表2 可以看出,讀解文的平均分數(shù)為4.64 分,會話文的平均分數(shù)為3.91 分。換算成百分比即讀解文的平均準確率為92.8%,會話文的平均準確率為78.2%。從得分數(shù)據(jù)可以看出,讀解文分數(shù)較高,會話文分數(shù)較低。即Baidu 翻譯對相對正式的文本翻譯非常準確,而在較口語化的日常會話文本中,水平較低。就總體而言,機器翻譯結(jié)果得分均為3 及以上,即準確率為60%及以上。大部分譯文傳達了原始文本的大概含義,與原文在局部上有所不同。在大多數(shù)情況下都可以參考原文,迅速糾正錯誤。有時甚至無需參考原文也可理解譯文的含義。
1、讀解類文章
讀解類的問題主要是部分詞匯翻譯不準確。例如中日同形詞「大學院」的翻譯結(jié)果仍然是“大學院”,但在中國,并不使用“大學院”一詞,而是“研究學院”?!笟s史學部」一詞的機器翻譯是“歷史學部”,但是中文常使用的是“歷史系”?!复髮W祭」的翻譯結(jié)果是“大學祭”,中文中沒有這樣的詞,應翻譯為文化節(jié)。
雖然讀解類的文章存在一些問題,但大多數(shù)都是不符合漢語習慣、可忽略的小錯誤,不會影響讀者的理解。無需看原文也可猜測到大致意思。因此本文的研究重點主要集中在會話類文章。
2、會話類文章
會話類文章的翻譯結(jié)果扣分的主要問題如下:
表2 文章類得分統(tǒng)計數(shù)據(jù)
(1)語氣詞誤譯。
①原文:鈴木:あれ?知り合いですか。
Baidu 翻譯結(jié)果:那是我認識的人嗎?
參考書翻譯:咦?你們認識呀?
例文選自第5 課第1 單元,會話場景為:高橋?qū)π⊥跽f:“昨天的事情對不起?!庇谑且慌缘拟從締栃⊥酰骸斑祝磕銈冋J識呀?”機器翻譯卻譯為“那是我認識的人嗎?”這里「あれ」的翻譯不正確,此處為語氣詞,表達了說話人輕微的驚訝,應該譯為“咦”,而不是指示詞“那個”。人們可以根據(jù)上下文區(qū)分「あれ」的不同用法,而機器翻譯卻無法做到,常常在翻譯語氣詞時出現(xiàn)錯誤。
②原文:あ、そうですか。
Baidu 翻譯結(jié)果:啊,是嗎?
參考書的翻譯:哦,是這樣啊!
例文選自第5 課第2 單元,會話場景為高橋又拿出來另一張照片,指著照片上的小狗說她的戀人是這個,名字是太郎。小王看完后說:“哦,是這樣??!”此處說話人是一種恍然大悟的語氣。Baidu 翻譯的結(jié)果是一種疑問、不確定的語氣“啊,是嗎”。
(2)省略部分誤譯。
①原文:王:おばあさんは、お母さんのお母さんですか。
高橋:いいえ、父の母です。
Baidu 翻譯結(jié)果:王:奶奶是媽媽的媽媽嗎?
高橋:不,我是爸爸的媽媽。
參考書的翻譯:王:奶奶是母親的母親嗎?
高橋:不,是我父親的母親。
例文選自第5 課第2 單元,會話場景為小王指著照片上的老奶奶,問高橋是她母親的母親嗎?即確認是否為高橋的外婆。參考書翻譯是“不,是我父親的母親?!盉aidu 翻譯結(jié)果是“不,我是爸爸的媽媽?!比照Z原文中高橋的回答省略了主語“奶奶”,因此正確的是“不,(這個照片上的老奶奶)是我父親的母親。”機器翻譯對省略部分的處理往往不能達到令人滿意的效果。
②原文:王:朝8 時からです。午後はだいたい5 時50 分までです。
高橋:そうですか。きょうも?
王:いいえ、きょうは7 時50 分までです。
Baidu 翻譯結(jié)果:王:早上8 點開始。下午大概5 點50 分。
高橋:是嗎?今天也要嘗試一下。
王:不,今天7 點50 分結(jié)束。
參考書的翻譯:王:早上8 點開始。下午大概5 點50 分。
高橋:是嗎?今天也是這樣嗎
王:不,今天7 點50 分結(jié)束。
例文選自第6 課第2 單元,會話場景為小王和高橋走在校園里,高橋問中國的大學每天的第一節(jié)課幾點開始,小王回答,從早上8 點開始到下午大概5 點50 分結(jié)束。高橋問,是嗎,今天也是這樣嗎?小王說,不是的,今天7 點50 結(jié)束。Baidu 翻譯把高橋第二次的提問「きょうも?」翻譯成“今天也要嘗試一下”,但這里的意思是“今天也是這樣嗎?”當省略謂詞時,機器翻譯會自己進行補充,但補充部分常常出錯。
(3)人物性別誤譯。會話中人物被默認譯為男性。
原文:ああ、その人は姉の婚約者です。
Baidu 翻譯結(jié)果:啊,那個人是姐姐的未婚妻。
參考書的翻譯:啊,那個人是姐姐的未婚夫。
例文選自第5 課第2 單元,會話場景為兩個人正在討論各自的家庭,指著照片上一位男士說那個人是姐姐的未婚夫。對于日語中「婚約者」一詞,機器翻譯無法判斷男女,但根據(jù)文中“姐姐的婚約者”可以判斷為男性,應該翻譯成未婚夫。機器翻譯則判斷為女性,錯譯成未婚妻。日語中的許多詞都沒有性別區(qū)分,如「先輩」、「後輩」、「さん」。這種情況在漢語中也會出現(xiàn),如“雨神”這個詞,日語中有男女之分,「雨男」、「雨女」。這是由于詞匯分布的不均勻性導致的。
(4)人稱翻譯生硬。
原文:「高橋さんは鈴木さんのガールフレンドですか?!?/p>
Baidu 翻譯結(jié)果:高橋是鈴木的女朋友嗎?
參考書的翻譯:高橋是你的女朋友嗎?
例文選自第5 課第1 單元,會話場景為小王悄悄問鈴木,高橋是不是他的女朋友。當在對話中與熟識的人面對面交談時,機器翻譯會直接翻譯對方的名字,但是從中文的角度來看,這樣的翻譯非常生硬。最好翻譯成第二個人稱“你”或“您”。這里的小王和鈴木面對面交談,“鈴木さん”直接翻譯成鈴木較為生硬。
(5)特殊詞匯誤譯。
原文:「チーズ!」
Baidu 翻譯結(jié)果:奶酪!
參考書的翻譯:茄子!
例文選自第10 課第1 單元,會話場景為幾個人正準備在北京的一處景點拍照,一起喊「チーズ」,Baidu 翻譯結(jié)果中被翻譯成“奶酪”。但實際情況是拍照喊的口號。因此這里應該翻譯成中國人拍照時喊的“茄子”。
(6)專有名詞誤譯。
原文:それは、トンポーロウです。
Baidu 翻譯結(jié)果:那是龍貓。
參考書的翻譯:那是東坡肉。
例文選自第10 課第2 單元,會話場景為小王品嘗一下正宗的中國菜,其中的一道菜名「トンポーロー」被翻譯成“龍貓”,實際意思為“東坡肉”。東坡肉為菜名,是固有詞匯。語料庫中未包含,因此翻譯錯誤。
(7)多義詞誤譯。
①原文:何時に大學を出ますか。
Baidu 翻譯結(jié)果:幾點大學畢業(yè)?
參考書的翻譯:幾點從學校出來?
例文選自第8 課第2 單元,會話場景為小王問高橋幾點從學校出來,Baidu 翻譯的結(jié)果把這里的動詞「出る」翻譯成畢業(yè)的意思,即離開學校步入社會。但實際上這里的含義是“出來,外出去別的地方”。類似的還有第13 課第1 單元中,原文是「寮は女性が入っていてもいい」。這里的意思是“女性可以進入”。卻被翻譯成“女性可以入住”。
②原文:高橋:ああ、ここですね。あのう、すみません、それから…
趙:はい。
Baidu 翻譯結(jié)果:高橋:啊,在這里呢。那個,對不起,還有…
趙:好的。
參考書的翻譯:高橋:啊,在這里呢。那個,對不起,還有…
趙:你說吧。
例文選自第6 課第1 單元,會話場景為圖書館里,趙媛媛想問高橋洗手間在哪里。高橋有點不好意思,所以先說「あのう、すみません、それから…」,即表示有事情想詢問,趙媛媛回答「はい」,即你說吧。這里的「はい」是一種應答、回應,而不是對前面事情的肯定。翻譯多義詞時常常會發(fā)生錯誤,將錯誤的釋義放入句子中會導致整個文本產(chǎn)生違和感。
機器翻譯的優(yōu)點是可以快速翻譯大量文本,但其翻譯結(jié)果仍然需要檢查,質(zhì)量和準確性也依然落后于人工翻譯。在核對翻譯結(jié)果時,尤其要注意專有名詞,特殊用法詞匯,中日同形詞,人稱,多義詞和人物性別。在會話類譯文不通順的情況下,要通過關(guān)聯(lián)上下文,判斷句子的語氣和省略。日語學習者不可盲目依賴于機器翻譯,如果可以做到合理地利用機器翻譯工具,則可以節(jié)省大量查字典的時間。
通過分析翻譯結(jié)果,可知Baidu 翻譯在翻譯指示代詞,人稱,專有名詞,中日同形詞,多義詞和特殊用法詞匯時的翻譯準確度較低,在判斷人物性別和語氣上仍存在較大問題,從而導致整個文本的翻譯質(zhì)量下降。因此,有以下四種方法可以提高日語機器翻譯的準確率。首先,應擴充語料庫的容量,有必要在語料庫中添加更多專有名詞,例如人名,地名,菜名和書名。其次,對于日語中的多義詞、慣用句和中日同形詞等容易出現(xiàn)錯誤的地方需要添加特殊的語言規(guī)則。此外,在人物性別無法判斷時,應設(shè)置規(guī)則使機器翻譯直譯人物名稱,不翻譯帶有男女性別的稱謂。最后,機器翻譯對于語氣的判斷仍有較大問題,應該把基于統(tǒng)計的機器翻譯方法與傳統(tǒng)的基于規(guī)則的機器翻譯方法結(jié)合起來。
本文分析了《綜合日語》中33 篇文章的Baidu 翻譯結(jié)果,通過統(tǒng)計數(shù)據(jù)可以看出書面文章類翻譯正確率很高,會話類則較低。因此,日語初學者及水平較低者應根據(jù)文章的種類科學合理地使用機器翻譯工具,不可過度依賴機器翻譯,要將機器翻譯容易出現(xiàn)錯誤的地方與原文再次核對。開發(fā)者應對目前出現(xiàn)不足的領(lǐng)域進行改善,提高翻譯精度。