彭子航
上海理工大學(xué)
機(jī)器翻譯,又稱自動翻譯,是一種利用計算機(jī)將源語言轉(zhuǎn)換為目標(biāo)語言的翻譯技術(shù)。機(jī)器翻譯自產(chǎn)生以來獲得了巨大的發(fā)展。其中,1980年代末和1990年代初,IBM研究人員提出了統(tǒng)計機(jī)器翻譯的思想,這種以統(tǒng)計學(xué)解決翻譯問題的方法逐漸成為機(jī)器翻譯的主流,極大地推動了機(jī)器翻譯技術(shù)的發(fā)展。
統(tǒng)計機(jī)器翻譯最早由IBM研究人員于20世紀(jì)90年代初提出,他們用兩年時間,在沒有采用人工結(jié)構(gòu)的語言知識的情況下,僅利用語料庫就開發(fā)出了媲美傳統(tǒng)翻譯系統(tǒng)幾十年研究結(jié)果的系統(tǒng),這充分體現(xiàn)了統(tǒng)計機(jī)器翻譯的優(yōu)越性。在統(tǒng)計機(jī)器翻譯中,“翻譯”是一個隨機(jī)事件,源語言句子與目標(biāo)語言句子的匹配是隨機(jī)的,匹配正確的概率稱為翻譯模型。這種翻譯技術(shù)依靠的是嚴(yán)格的數(shù)學(xué)理論,翻譯的規(guī)則以概率的方式呈現(xiàn),(而翻譯中所需要的詞典、規(guī)則都來自于語料庫),翻譯的過程就是尋找最優(yōu)解的過程。
統(tǒng)計機(jī)器翻譯的模型從早期基于詞的模型已經(jīng)過渡到基于短語的模型,短語庫規(guī)模的擴(kuò)大使翻譯系統(tǒng)的性能大大提升。目前,基于句法的模型的研究也正處于火熱中,基于句法的模型成熟后,將大大提高翻譯的精確性。目前,在機(jī)器翻譯領(lǐng)域處于領(lǐng)先地位的谷歌翻譯的大部分語言采用的都是統(tǒng)計機(jī)器翻譯的方法。
目前國際上統(tǒng)計機(jī)器翻譯主要集中在阿拉伯語到英語和漢語到英語兩個方向,當(dāng)前的研究狀況來看,阿拉伯語到英語的準(zhǔn)確率已經(jīng)達(dá)到了很高的水平,而漢語到英語的翻譯準(zhǔn)確率相對較低。
優(yōu)點:
人工成本低、開發(fā)周期短。機(jī)器翻譯系統(tǒng)開發(fā)無需人工編寫和調(diào)試詞典規(guī)則,故人工成本較低,開發(fā)周期較短。
可以迅速遷移到新的語種和領(lǐng)域。由于翻譯的詞典、規(guī)則都來自于語料庫,所以只要語料庫不斷地豐富,統(tǒng)計機(jī)器翻譯就可以擴(kuò)展到其他語種或其他領(lǐng)域。
性能較高。目前較為成熟的基于短語的翻譯模型雖然是一種較為機(jī)械的方法,但是對于現(xiàn)有的計算機(jī),短語庫規(guī)模的擴(kuò)大早已不成問題。所以基于短語的翻譯系統(tǒng)的性能還是比較高的。
新事物。機(jī)器翻譯作為互聯(lián)網(wǎng)的產(chǎn)物,又由于良好的數(shù)學(xué)模型和自學(xué)習(xí)能力等,收到研究者們的青睞,擁有更多關(guān)注的目光,更容易被開放領(lǐng)域的互聯(lián)網(wǎng)世界接納。
缺點:
受限于翻譯模型的好壞和語料庫的覆蓋能力。翻譯中語言的需求十分的大,由于受到語料庫的規(guī)模限制,機(jī)器翻譯難以達(dá)到較高的匹配率。需要縮小到一些專業(yè)領(lǐng)域,翻譯效果才能達(dá)到要求。
無法識別語境。以漢語為例,漢語的詞法、語法、句法的變化和語境的更換十分豐富,一點小的變化,意思就大相徑庭,這種復(fù)雜的變化,機(jī)器翻譯系統(tǒng)是很難理解的。
譯文質(zhì)量較差。機(jī)器翻譯的譯文結(jié)果雖然字字都對,但經(jīng)常讓人很難閱讀。這是機(jī)器翻譯難以避免的弊端。單單依靠翻譯系統(tǒng),很難提高譯文質(zhì)量。
隨著各種機(jī)器翻譯的方法的發(fā)展和翻譯系統(tǒng)的進(jìn)步,機(jī)器翻譯的研究取得了巨大的進(jìn)步和豐碩的成果,機(jī)器翻譯的前途無疑是光明的,在未來,將有很大一部分的翻譯領(lǐng)域是屬于機(jī)器翻譯的,這對翻譯從業(yè)人員勢必會造成一定的影響。
當(dāng)機(jī)器翻譯水平發(fā)展到一定的高度,勢必會替代一部分人工翻譯的工作。尤其是在一些要求較多,限制較窄的專業(yè)領(lǐng)域,以及一些較為基礎(chǔ)的翻譯情景,統(tǒng)計機(jī)器翻譯的研究跟相關(guān)領(lǐng)域的專業(yè)翻譯人員的培養(yǎng)比起來,顯然更節(jié)省時間、金錢、精力,更符合社會發(fā)展的節(jié)奏。這對于社會的發(fā)展雖然是可喜的消息,不過也給翻譯從業(yè)人員產(chǎn)生了或大或小的威脅。
對于個人用戶來說,他們獲取機(jī)器翻譯成果的渠道越來越多,越來越簡單,而往往一般個人用戶對翻譯的要求較低,越來越多的人能夠憑借翻譯軟件以及自身的外語水平解決日常生活中所遇到的翻譯問題,對人工翻譯的需求也就越來越少。
目前雖然機(jī)器翻譯的研究取得了很多成果,但是使用的效果并不能達(dá)到客戶的要求,機(jī)器翻譯系統(tǒng)之后的研究道路還很長。而翻譯系統(tǒng)的完善僅僅依靠研究人員是不可能完成的。因為目前的機(jī)器翻譯中用到的語言知識很少,而翻譯技術(shù)的提升需要對語言更深層次的分析,這便需要專業(yè)的翻譯從業(yè)人員的參與給出更專業(yè)的意見。故機(jī)器翻譯的發(fā)展也給譯者提供了新的機(jī)會,就是參與到機(jī)器翻譯系統(tǒng)的完善工作中。
由于受翻譯模型和語料庫的限制,機(jī)器翻譯的優(yōu)勢僅在一些要求較多的相對專業(yè)的領(lǐng)域得以體現(xiàn),而在一些較為泛化的領(lǐng)域,由于語料庫規(guī)模的不足,機(jī)器翻譯的性能不足以與人工翻譯相比;同時,在一些特定領(lǐng)域,機(jī)器翻譯永遠(yuǎn)無法替代人工翻譯的工作,如文學(xué)翻譯,文學(xué)翻譯是文化交流的重要渠道,注重的是感情的理解和邏輯層面的分析,這些工作是機(jī)器翻譯無法完成的。所以,翻譯人員可以提升自己的工作能力,深化自己在某些領(lǐng)域的技能,以減小機(jī)器翻譯發(fā)展帶來的威脅。
雖然機(jī)器翻譯有優(yōu)點多多,但是在實際的社會發(fā)展中,眾多的使用者對翻譯的質(zhì)量要求是十分高的。所以在多數(shù)重要的翻譯需求的產(chǎn)生之時,公司、政府等仍將首先選擇人工翻譯,人工翻譯仍將是最值得信賴的。而機(jī)器翻譯的使用情景一般為:對翻譯的要求時間很短或是工作量很大的情況。同時,在很多情況下,雖然已經(jīng)使用了機(jī)器翻譯,企業(yè)或政府仍然需要人工翻譯對機(jī)器翻譯的結(jié)果進(jìn)行審核糾正等工作。所以只要工作水平夠高,翻譯人員仍能在機(jī)器翻譯發(fā)展的形勢下找到適合自己的工作。
關(guān)于人工翻譯的關(guān)系,人們的定性思維常常是“人機(jī)大戰(zhàn)”,但是如果我們轉(zhuǎn)變思維為“人機(jī)合作”,便能有不一樣的收獲,人工推進(jìn)機(jī)器翻譯的進(jìn)步,機(jī)器翻譯輔助翻譯人員的工作,減輕負(fù)擔(dān),這樣既能提高效率,還能達(dá)到共贏。
雖然目前統(tǒng)計機(jī)器翻譯的發(fā)展很快,但是基于句法的翻譯模型還不夠完善。有一些不能夠解決的問題,而相關(guān)的研究還需要一些時間,這些都意味著機(jī)器翻譯距離理想使用狀態(tài)相去甚遠(yuǎn),機(jī)器翻譯的研究還有很長的路要走。
即使機(jī)器翻譯發(fā)展到相當(dāng)成熟的階段,翻譯人員仍無需過多擔(dān)心,因為屆時機(jī)器翻譯與人工翻譯所面向的市場并非完全一致,人工翻譯將逐漸轉(zhuǎn)向高端市場,因為在一些重要的文書、經(jīng)濟(jì)合同、政府報告等等翻譯需求出現(xiàn)時,機(jī)器翻譯無法承擔(dān)這些翻譯任務(wù)背后所代表的責(zé)任,機(jī)器翻譯將主要面向一些不那么精確的翻譯情景,屆時反而會出現(xiàn)更為巨大的高端翻譯市場,翻譯人員需要做的是根據(jù)形勢適當(dāng)?shù)剡M(jìn)行轉(zhuǎn)型,向更高級、更專業(yè)的領(lǐng)域的進(jìn)軍,做精尖人才。
不論在什么時候,翻譯從業(yè)人員仍然是不可取代的。再精確的機(jī)器也無法與人的大腦相媲美,尤其是在文學(xué)翻譯這種注重感情的理解的翻譯需求中,機(jī)器翻譯時無法完成任務(wù)的。機(jī)器翻譯的發(fā)展只會淘汰低端的翻譯人員,完全取代人工是不可能的,翻譯從業(yè)人員需要做的是不斷提高自己的專業(yè)技能,主動學(xué)習(xí)并擁抱新技術(shù)。
或許我們對于機(jī)器翻譯與人工翻譯的關(guān)系的理解存在誤區(qū),機(jī)器翻譯與人工翻譯并不是非此即彼,完全否定機(jī)器翻譯和完全夸大機(jī)器翻譯的說法都是不恰當(dāng)?shù)摹C(jī)器翻譯與人工翻譯的最佳關(guān)系應(yīng)當(dāng)是相輔相成,機(jī)器翻譯不會讓人工翻譯的價值變低,而是將人工翻譯轉(zhuǎn)向更值得翻譯的任務(wù)。機(jī)器翻譯和人工翻譯的和諧共存或許才是最終形態(tài)。