涂王貝,唐爾龍
?
MT在論文摘要翻譯中的應(yīng)用研究
涂王貝,唐爾龍
隨著互聯(lián)網(wǎng)的普及,MT(機器翻譯)也被廣大網(wǎng)民廣泛使用?;谡Z料庫的翻譯軟件由于龐大的存儲信息,使得機器翻譯篇幅短、語言簡潔的論文摘要成為可能。但是機器翻譯的譯文質(zhì)量不高,仍然要通過譯前消歧、譯中比較、譯后潤色三階段的人工干預(yù),才能解決翻譯中存在的切分歧義、語義歧義、文化現(xiàn)象不對應(yīng)等問題。
MT;論文摘要;人工干預(yù)
論文摘要是學(xué)術(shù)論文必不可少的組成部分,是對文章的高度概括。一篇好的摘要不僅能使讀者在最短時間內(nèi)了解文章的內(nèi)容,而且還可為讀者提供快捷的網(wǎng)絡(luò)檢索。在國際化趨勢日益加強的今天,摘要的英文譯文也擔(dān)當(dāng)著同樣的角色。然而,許多中文文章的英文摘要往往文字錯誤百出,翻譯質(zhì)量低劣,這不僅影響了刊物的質(zhì)量,也極大地降低了國際上對中國學(xué)術(shù)水平的信任度,從而影響了國際學(xué)術(shù)交流的效果。
近幾年來,隨著中外學(xué)術(shù)交流的發(fā)展,對于如何翻譯出質(zhì)量上乘的論文英文摘要,學(xué)術(shù)界也進行了諸多探討。筆者通過總結(jié)近10年對論文摘要英譯的研究發(fā)現(xiàn),以往的研究者大多側(cè)重于對翻譯中的英譯錯誤和英譯策略的歸納和總結(jié),如王高生的《論文摘要的撰寫及英譯》[1],王慧博的《漢英摘要翻譯的話語分析理論研究》[2],陳吉榮、趙永青的《論文摘要英譯的翻譯顯化》[3],曾劍平、葉衛(wèi)華的《社科學(xué)術(shù)論文摘要的編譯》[4]94-98,鄧軍濤、許明武的《科技論文摘要漢譯英典型問題探究》[5]等等。目前,雖然互聯(lián)網(wǎng)已經(jīng)普及、大數(shù)據(jù)時代已然來臨,但學(xué)術(shù)界對于如何利用機器輔助翻譯論文摘要,從而提高翻譯的準確性仍是鮮有提及。
機器翻譯(Machine Translation,簡稱MT)是利用計算機實現(xiàn)一種自然語言文本到另一種或多種自然語言文本的翻譯。[6]1機器翻譯在誕生初期的優(yōu)勢就存在于詞對詞的翻譯,進入21世紀后,隨著互聯(lián)網(wǎng)的飛速發(fā)展,基于語料庫的翻譯軟件由于強大的存儲功能和搜索引擎使得翻譯軟件能有效降低詞語錯誤的頻率,同時還能為句子翻譯提供多種句型參考。
然而現(xiàn)階段的機器翻譯還不能達到自主地處理自然語言的翻譯過程,目前機器翻譯在可讀性、連續(xù)性、語法性等方面都面臨諸多挑戰(zhàn), 對于翻譯的文本也有一定的選擇性。因此,機器輔助翻譯在翻譯實踐中運用的更為廣泛。社科學(xué)術(shù)論文摘要既有科技語體嚴謹、客觀的特點,也有文學(xué)語言的修辭特色。此外,由于社科論文摘要所概括的研究對象具有較強的社會性和復(fù)雜性,摘要中不可避免地會使用表示創(chuàng)作者的主觀傾向或者態(tài)度的形容詞或副詞。[4]94因此,仍然需要人工輔助才能進行準確翻譯,翻譯前需要對原文進行切分、斷句,翻譯后要對譯文進行修改潤色,才能達到理想的翻譯效果。本文嘗試在分析MT優(yōu)勢的基礎(chǔ)上,探討如何將MT應(yīng)用于論文摘要翻譯,從而為提高論文英文摘要的質(zhì)量提供有益的借鑒。
上世紀互聯(lián)網(wǎng)誕生,時至今日,互聯(lián)網(wǎng)已經(jīng)滲入到生活的方方面面,給人們的生活帶來巨大便利和變革。根據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心2016年1月發(fā)布的統(tǒng)計報告顯示,截至2015年12月,中國網(wǎng)民規(guī)模達到6.88億,互聯(lián)網(wǎng)普及率達到50.3%,中國居民上網(wǎng)人數(shù)已過半[7]。隨著網(wǎng)民數(shù)量的激增和社交網(wǎng)絡(luò)的興起,互聯(lián)網(wǎng)已經(jīng)成為一個能夠相互交流溝通、相互參與的互動平臺,而這個平臺已經(jīng)跨越了民族、地區(qū)、國家的限制。隨著互聯(lián)網(wǎng)時代的來臨,互聯(lián)網(wǎng)產(chǎn)業(yè)及相關(guān)產(chǎn)業(yè)也迅猛發(fā)展,跨語言交流需求激增,因此翻譯的任務(wù)也隨之激增,傳統(tǒng)的單打獨斗式的個人翻譯已不能滿足需求,使用機器進行翻譯的各種翻譯軟件應(yīng)運而生、蓬勃發(fā)展。
機器翻譯的研究自計算機誕生之初就已被提出。但是,直到20世紀80、90年代,隨著語料庫的發(fā)展而產(chǎn)生的第三代MT方法才使機器翻譯進入了繁榮時期,繼而涌現(xiàn)出大量機器翻譯系統(tǒng)。進入21世紀后,隨著機器翻譯系統(tǒng)的不斷發(fā)展和成熟,使得機器翻譯系統(tǒng)從科研院所走向市場,推出了眾多的在線翻譯軟件,使翻譯工作者的工作量大大減輕,也使廣大網(wǎng)民體驗了自助式的翻譯服務(wù)。
機器翻譯所具有的信息量大、更新快、翻譯時間短、成本低、易操作等特點使機器翻譯深受大眾歡迎。筆者在網(wǎng)上做了一個關(guān)于機器翻譯的問卷調(diào)查,共274人參與,結(jié)果顯示,71.56%的受訪者表示了解機器翻譯,其中6.9%的受訪者對于機器翻譯非常熟悉,68.97%的受訪者使用過機器翻譯。而其中廣大年輕網(wǎng)民對于這些新興事物更為熟悉。根據(jù)國家統(tǒng)計局對年齡段的劃分,18-40歲為青年,41-65為中年,66歲以上為老年。筆者設(shè)置4個年齡組別:青年網(wǎng)民(A組,18-28歲)、中青年網(wǎng)民(B組,29-40歲),中年網(wǎng)民(C組41-55歲)和中老年網(wǎng)民(D組56-65歲)。受調(diào)查的A組和B組對于機器翻譯的了解程度為84.36%,要遠遠高于C組和D組15.66%,其中B組的受調(diào)查者對于機器翻譯的熟悉程度最高,為88.24%表示了解,5.88%非常熟悉。
就本文要討論的論文摘要的英譯而言,目前論文摘要英譯的典型錯誤有:(1)詞不達意;(2)詞語搭配錯誤、詞語使用錯誤;(3) 語法錯誤:句子結(jié)構(gòu)不全、句式紊亂等;(4)中式英語,僵化對譯。[8]
翻譯軟件在誕生初期的優(yōu)勢就存在于詞對詞的翻譯,進入21世紀后,隨著互聯(lián)網(wǎng)的飛速發(fā)展,基于語料庫的翻譯軟件由于強大的存儲功能和搜索引擎使得翻譯軟件能有效降低上述第一種和第二種錯誤的出現(xiàn)頻率,同時,還能為句子翻譯提供多種句型參考。具體來說,MT對于論文摘要的翻譯具有以下的優(yōu)勢。
(一)專有名詞標(biāo)準化
專有名詞的翻譯一直是翻譯工作者的一大難題,對于很多人名、地名、單位名稱等,多個翻譯者可能有多個翻譯版本。專有名詞翻譯應(yīng)統(tǒng)一標(biāo)準,翻譯軟件的強大的搜索功能使統(tǒng)一翻譯標(biāo)準不再困難。例如一篇研究利用核磁共振提高攝像質(zhì)量的論文中提到:核磁共振這一技術(shù)的誕生讓我們?nèi)计饘ξ粗奶浇猓匦驴创@取影像的途徑。“核磁共振”在日常生活中也有接觸,有些場合翻譯為MRI,如醫(yī)院的核磁共振檢查,有些地方則翻譯為NMR。使用多個在線翻譯軟件對“核磁共振”進行翻譯,有道詞典、金山詞霸、Google翻譯、百度翻譯等都將這一翻譯統(tǒng)一為 “Nuclear Magnetic Resonance”簡稱NMR。
(二)新興詞匯概念化
學(xué)術(shù)論文是學(xué)者對自身研究領(lǐng)域的前沿知識的科學(xué)研究,都會涉及到該領(lǐng)域最新的研究成果。傳統(tǒng)的翻譯人員是熟悉兩種語言和文化的語言學(xué)習(xí)者,只是對兩種文化中的常識性知識和文學(xué)性知識有所了解。對于其他領(lǐng)域,尤其是理工科領(lǐng)域,鮮有涉及,更別提這些研究領(lǐng)域的最新成果和最新概念了。而翻譯軟件由于其存儲量大、更新快的特點,彌補了人工翻譯的局限。
例如,在一篇介紹計算機研究領(lǐng)域的論文摘要中談到:“DFA的最小化是有限自動機應(yīng)用及實現(xiàn)方面的重要問題之一。”由于專業(yè)知識的限制,筆者對于這句話中的DFA和有限自動機無法理解,只能求助于翻譯軟件。DFA想必是業(yè)內(nèi)已經(jīng)達成共識的對某一術(shù)語的縮寫,可以套用這一英文縮寫。而對于“有限自動機”Google翻譯軟件將其翻譯為 Finite Automata。由于海量的存儲,翻譯軟件能翻譯任何領(lǐng)域的專有名稱。
另外,對于時下流行的新詞,翻譯軟件同樣與時俱進。在處理類似“低頭黨、剩女”等這類新詞時,還可以借助于中國日報英語點津的新詞(http: //language.chinadaily.com.cn/chineseterm.shtml) 的網(wǎng)絡(luò)輔助翻譯資源,或句酷( http: //www.jukuu.com) 類雙語語料庫,或通過搜索引擎查找特定的信息然后進行人工翻譯等。
(三)提供多種句型參考
由于語料庫的強大記憶功能,翻譯軟件不僅在詞匯翻譯上有強大的優(yōu)勢,而且能提供多種句型供譯者選擇,這樣能在一定程度上突破譯者的思維局限。
例如:一篇談新聞攝影構(gòu)圖的文章摘要中提到:作為一種構(gòu)圖方式,虛實共生可以幫助新聞攝影分清主次,表達動靜,起到“以少勝多”的作用,并且可以提升圖片的藝術(shù)水平和美感。整個句子結(jié)構(gòu)簡單,翻譯難度不大。如何翻譯“以少勝多”,多種軟件提供了多種翻譯版本。Google翻譯和百度翻譯都翻譯為“l(fā)ess is more”, 金山詞霸是對此進行了解釋“use the few to defeat the many”,但是提供了很多含有該詞語的雙語例句,供譯者參考、比較和選擇。
美國著名語言學(xué)家奈達(Nida)的觀點,翻譯可以分為三個層次:第一個層次是源語言與目標(biāo)語言之間的詞匯和語法結(jié)構(gòu)的映射;第二個層次是根據(jù)交際原則來生成目標(biāo)語言;第三個層次是基于特定文化背景的翻譯。[9]3目前機器翻譯優(yōu)勢仍限于詞匯的轉(zhuǎn)換,也就是說僅能處理第一層次的翻譯任務(wù)。學(xué)術(shù)論文摘要翻譯與一般的文學(xué)翻譯存在區(qū)別。學(xué)術(shù)論文屬于議論文,文章重論述,具有客觀性、嚴密性等特點,而論文摘要更是具有高度的概括性,用簡潔的語言介紹文章的主體內(nèi)容。相比較于文學(xué)翻譯的復(fù)雜性和模糊性,比較適合機器翻譯。但是由于論文摘要篇幅短小,語言簡練,尤其是人文學(xué)科領(lǐng)域的論文摘要更是言簡意賅,使機器翻譯遭遇短板.
機器翻譯究其原理,是借助語料庫的技術(shù),包含處理不同文法結(jié)構(gòu)、詞匯辨識、慣用語的對應(yīng)等,實現(xiàn)自然語言的自動翻譯。一般來說,兩種語法規(guī)則相近的語言較為適合機器翻譯,如英語和法語。但是漢語和全球其他語言之間并沒有太多的共通之處,漢語是最大的符號集。英語和漢語之間的語法規(guī)則、形態(tài)變化、語用形態(tài)等方面都存在巨大差異。影響英漢機器翻譯的最大障礙是由于語法和句法差異導(dǎo)致的詞語順序不一致。理想的機器翻譯是可以完全代替人腦進行語言的分析、轉(zhuǎn)換、重組等過程,但是目前的翻譯軟件還遠遠達不到這個水平。因此,現(xiàn)階段,機器翻譯都需要人工輔助才能完成。
同樣在網(wǎng)絡(luò)調(diào)查中,88.75%的受訪者表示機器翻譯的譯文效果不理想。由于機器翻譯軟件無法處理復(fù)雜的語法、文化內(nèi)涵等問題,因此,人工介入必不可少。在筆者的網(wǎng)絡(luò)調(diào)查中,93.75%的受訪者表示機器翻譯的譯文需要人工進行修改。要想使機器翻譯的譯文達到理想的狀態(tài),需要通過以下三個階段來實現(xiàn):
(一)譯前消歧
無論是人工翻譯還是機器翻譯,在翻譯之前都要對原文本進行分析。分析階段一般分為詞法分析、句法分析、語義分析、語境分析等幾個步驟,其中以詞法分析和句法分析為主。[9]43在機器翻譯的分析階段進行人工干預(yù)的主要目的是對文中難以解決的、產(chǎn)生歧義的地方進行消歧。 因此,我們首先對于原文中可能出現(xiàn)歧義的地方進行干預(yù)。
1.切分歧義。 漢語和英語不同,不存在詞的形態(tài)變化,在表達時以漢字為最小單位,沒有分割標(biāo)志,人在閱讀漢語文本時,根據(jù)自身的語言和文化知識進行切分理解。而機器翻譯目前還不能達到人腦的自動分詞水平,因此漢語的自動分詞是使用機器進行漢翻英或其他語種的一個難題。比如“政治局面對我方有利”使用軟件翻譯時可能存在著多種切分情況:
政治/局面/對我/方/有利;
政治局/面對/我方/有利;
政治/局面/對/我方/有利。
以漢語為母語的讀者對于這句話的理解一看就知道是第三種情況,但是目前的機器軟件無法做到這一點,況且,第二種斷句情況我們并不能判斷為錯誤,如“政治局/發(fā)出/新的/號召?!?/p>
2.語義歧義。漢語屬于意合語言,本就存在著多音字、多義詞,由此造成很多歧義現(xiàn)象。如一篇名為《男女大學(xué)生消費觀同異性調(diào)查與分析》的文章,旨在研究大學(xué)生不同的消費觀念。其中的“同異性”就存在歧義,既可以理解為性別的同異性,也可以理解為消費觀念的相同性和不同性。因為文章前面已經(jīng)將男女大學(xué)生在性別上加以區(qū)分,因此,此處應(yīng)該做后者理解,翻譯應(yīng)為“commonness and difference”。
(二)譯中比較
自上世紀90年代,機器翻譯進入新的繁榮期后,機器翻譯軟件蓬勃發(fā)展,大量的翻譯軟件不斷涌現(xiàn)。時至今日,為廣大網(wǎng)民熟知的翻譯軟件有Google翻譯、有道翻譯、百度翻譯、金山詞霸、雅虎翻譯、海詞等。通過問卷調(diào)查發(fā)現(xiàn),參與問卷調(diào)查的274名網(wǎng)民主要傾向于使用有道翻譯(48.86%)、Google翻譯(25%)、百度翻譯(22.73%)這三款翻譯軟件。
筆者對這些翻譯軟件在單詞、專業(yè)術(shù)語、句子、段落、網(wǎng)頁等方面的翻譯進行對比試驗,結(jié)果發(fā)現(xiàn):在單詞翻譯方面詞典類在線工具具有先天優(yōu)勢。便是有些生僻的詞也不在話下,而且釋義周詳,不同詞性的釋義都一一列舉。如金山詞霸包含147本版權(quán)詞典,完整收錄《柯林斯高級英漢雙解詞典》和80萬專業(yè)詞條。有道詞典完整收錄《柯林斯高級英漢雙解詞典》、《21世紀大英漢詞典》等多部權(quán)威詞典數(shù)據(jù),總共覆蓋3700萬詞條和2300萬海量例句。在句子和段落的翻譯方面,Google 翻譯的結(jié)果的可讀性最強,最符合真實的語言規(guī)則。在網(wǎng)頁翻譯方面,有些翻譯軟件不能提供網(wǎng)頁翻譯,如雅虎翻譯,其他幾款軟件比較的結(jié)果得出,Google 翻譯和有道翻譯的中文網(wǎng)頁的準確性比較高,排版布局也沒有錯亂。
例如,一篇題為《鄉(xiāng)情與政治》的論文摘要中提到:民國時期,旅滬皖人遍及上海社會各階層。他們雖身在滬濱,但心系桑梓,時刻關(guān)注著家鄉(xiāng)的時勢發(fā)展和政局變遷。將這句話輸入有道翻譯和Google翻譯分別得到以下譯文:
Anhui tour during the period of the republic of China, Shanghai people in Shanghai all social strata. They are in Shanghai, but heart is the native place, paying attention to The Times development of hometown and political change.(有道翻譯)
Republic of China, Shanghai and Anhui people across all sectors of the Shanghai community. Although they are in Shanghai coast, but the heart of the homeland, always concerned about the current situation of development and political transition home.(Google翻譯)
兩處譯文中都存在語序、語法等多處錯誤,如對“旅滬皖人、心系桑梓”的翻譯都不準確。但有道翻譯的譯文的第一句就存在嚴重的語法錯誤,第二句的“時事發(fā)展”也沒有翻譯準確。Google翻譯的譯文更為連貫、更符合語法規(guī)則。但是對“身在滬濱”的翻譯過于刻板,通過對原文的理解,“滬濱”并不是確指上海的海濱,這里通過上海所處的地理位置來確指上海這個城市。因為前一句也提到了“旅滬皖人遍及上海社會各階層”,就說明了安徽人并不一定都集中在上海的沿海地帶。因此,此處翻譯將“coast”省略更為妥當(dāng)。
由此可見,在翻譯的過程中,并不是將原文直接輸入某個翻譯軟件那么簡單,要通過對多個翻譯軟件的譯文進行對比,這樣也能發(fā)現(xiàn)更多的問題,然后對這些問題進行人工修改、潤色,這也就進入翻譯的下一個階段了。
(三)譯后潤色
雖然經(jīng)過前兩個階段的人工干預(yù),但是機器軟件翻譯的譯文往往還是會存在錯譯、誤譯等問題。機器不能像人腦一樣對原文進行全方位的理解和分析,如前面提到的“身在滬濱”的翻譯,就需要譯者根據(jù)自身對原文的理解來對譯文進行修改。同時,兩種語言中的文化現(xiàn)象也使得翻譯軟件無法處理。隨著社會的不斷發(fā)展,各種新鮮事物不斷涌現(xiàn)。與新的科學(xué)技術(shù)成果有固定的翻譯術(shù)語不同,社會中出現(xiàn)的新的文化現(xiàn)象往往為某一文化所獨有,需要一段時間為其他文化居民所理解和接受。翻譯所要傳達的是語言背后的文化內(nèi)涵和它的使用者的精神,因此絕非唾手可得之事,甚至“越是簡單的文字越不好譯,往往易稿多次,還是不能滿意”。[6]22
例如,大學(xué)生村官是20世紀90年代出現(xiàn)的一個新鮮團體,指的是到農(nóng)村(含社區(qū))擔(dān)任村黨支部書記、村委會主任助理或其他村“兩委”職務(wù)的具有大專及以上學(xué)歷的應(yīng)屆或往屆大學(xué)畢業(yè)生。一篇研究大學(xué)生村官論文首先介紹“大學(xué)生村官是近年來國內(nèi)新出現(xiàn)的一個獨特團體”。將這句話輸入Google 翻譯,除了存在語序錯誤外,大學(xué)生村官直接按照字面翻譯為“student village”,讓人無法理解。因此,需要譯者通過對原文的理解、解釋,然后進行翻譯,筆者認為可以翻譯為college-graduate village official”。
就目前的機器翻譯技術(shù)來說,機譯系統(tǒng)的譯文參照原文進行理解一般可以做到,但難以達到直接輸出譯文稿而無需人工潤色的質(zhì)量,所以后編輯處理在許多情況下都必不可少。只要人工后編輯的工作量遠遠小于直接從原文翻譯的工作量,那么機器翻譯的優(yōu)勢就表現(xiàn)出來了。[9]42
通過以上的探討可知,隨著語料庫的發(fā)展,廣大在線翻譯軟件為論文摘要翻譯提供了多種便利,但是沒有人工干預(yù)的譯文往往漏洞百出、無法理解。因此要保證譯前消歧、譯中比較、譯后潤色三個階段必不可少,這樣才能省時省力的得到較為理想的譯文。機器翻譯是個跨學(xué)科課題,涉及計算機語言學(xué)、自然語言理解與處理、翻譯學(xué)等多個領(lǐng)域,要想提高機器軟件的翻譯的水平,需要各個領(lǐng)域的專家學(xué)者共同努力。希望通過本文,有越來越多的研究者能夠重視機器翻譯在英文摘要翻譯中的優(yōu)勢及其應(yīng)用方法,從而切實提高英文摘要的質(zhì)量和水平。
[1]王高生.論文摘要的撰寫及英譯[J].中國科技翻譯,2005(2):9-12.
[2]王慧博. 漢英摘要翻譯的話語分析理論研究[J].南昌教育學(xué)院學(xué)報外語研究,2011(8):161-163.
[3]陳吉榮,趙永青.論文摘要英譯的翻譯顯化[J].西安外國語大學(xué)學(xué)報,2012(1):122-125.
[4]曾劍平,葉衛(wèi)華. 社科學(xué)術(shù)論文摘要的編譯[J].中國翻譯,2013(3).
[5]鄧軍濤,許明武.科技論文摘要漢譯英典型問題探究[J].中國科技翻譯,2013(2):11-14.
[6]李正栓,孟俊茂.機器翻譯簡明教程[M].上海:上海外語教育出版社,2009(9).
[7]中國互聯(lián)網(wǎng)絡(luò)信息中心.第37次中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告:http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201601/t20160122_53271.htm.
[8]曾祥發(fā),張潔.淺析論文摘要英語翻譯錯誤[J].中國中醫(yī)藥現(xiàn)代遠程教育,2008(6):602-604.
[9]劉建剛,張艷莉.實用文體偽翻譯現(xiàn)象研究[J].上海翻譯,2007(2).
責(zé)任編輯:李應(yīng)青
On the Application of MT of Translating Abstract
Tu Wangbei, Tang Erlong
With the popularity of Internet, MT(machine translation) has been widely used. Owing to the huge storage of the corpus-based translation softwares, it is possible to translate the short, concise abstract by MT. However, the translation quality is not satisfying, so it is necessary for the translator to intervene in pre-translation, the process of translation and post-translation in order to solve the problems like segmentation ambiguity, semantic ambiguity, and not-corresponding cultural phenomenon.
Machine Translation; abstract; translator’s intervention
H319.3
A
1673-1794(2016)04-0039-05
涂王貝,安慶師范大學(xué)外國語學(xué)院講師,碩士,研究方向:翻譯理論與實踐;唐爾龍,安慶師范大學(xué)外國語學(xué)院講師(安徽 安慶 246011)。
教育部英語國家級特色專業(yè)項目(TS12154);安慶師范學(xué)院青年科研基金項目(SK201414)
2015-12-17