国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

機(jī)器翻譯面面觀
——皮姆教授訪談錄

2021-07-06 13:22范夢(mèng)栩安東尼皮姆
山東外語(yǔ)教學(xué) 2021年3期
關(guān)鍵詞:譯員數(shù)據(jù)庫(kù)語(yǔ)言

范夢(mèng)栩 安東尼·皮姆

(1.中央民族大學(xué) 外國(guó)語(yǔ)學(xué)院, 北京 100081 2. 墨爾本大學(xué) 語(yǔ)文及語(yǔ)言學(xué)學(xué)院, 墨爾本 3010)

范夢(mèng)栩(以下簡(jiǎn)稱(chēng)范):皮姆教授您好,非常感謝您接受此次采訪。您的研究領(lǐng)域非常廣泛,對(duì)翻譯技術(shù)等相關(guān)問(wèn)題的挖掘更是翻譯研究的前沿之一。科技影響了我們生活的方方面面,也深刻影響著翻譯實(shí)踐和翻譯研究?,F(xiàn)代翻譯研究越來(lái)越依賴(lài)科技,有的學(xué)者認(rèn)為這種取向符合數(shù)字人文趨勢(shì),值得推廣;也有學(xué)者對(duì)此提出質(zhì)疑,認(rèn)為這種取向不夠重視對(duì)翻譯本體、也就是對(duì)文本的研究。對(duì)于翻譯研究的“科技取向”您怎么看?

皮姆教授(以下簡(jiǎn)稱(chēng)皮):這個(gè)問(wèn)題很好。在人文學(xué)科中,我們應(yīng)該對(duì)所有可用的技術(shù)持開(kāi)放態(tài)度,尤其是將大數(shù)據(jù)方法納入研究。其他學(xué)科正在這樣做,翻譯研究為什么不呢?利用這些技術(shù),我們的部分成果可以呈現(xiàn)為好看的圖表。但是如果研究的問(wèn)題和假設(shè)都沒(méi)有什么意義,再漂亮的圖表也是無(wú)用的。因此,我認(rèn)為僅僅使用技術(shù)是不夠的,必須使用技術(shù)來(lái)解決問(wèn)題——當(dāng)然前提是要有有趣的研究問(wèn)題以及巧妙的解決方法。另外必須承認(rèn),我認(rèn)為翻譯研究的對(duì)象不一定是文本。長(zhǎng)期以來(lái),我都是“翻譯研究以人為本”的推崇者之一,尤其最近我對(duì)研究同樣是人的翻譯讀者很感興趣。數(shù)字人文的陷阱是,我們往往讓數(shù)字控制了自己的思維。我們不應(yīng)忘記,在人文學(xué)科中,我們是與人的特質(zhì)、人與人之間的交流、人的思想以及定性的數(shù)據(jù)打交道。眼動(dòng)追蹤相關(guān)的研究就是一個(gè)很好的例子。這類(lèi)研究產(chǎn)生的數(shù)據(jù)通常比回答研究假設(shè)多得多,但其中也存在數(shù)據(jù)丟失、技術(shù)和方法論等方面的巨大問(wèn)題,因?yàn)橛袝r(shí)候眼睛所至之處并不代表大腦所想,即眼與腦并非時(shí)刻一致。盡管如此,圖表看起來(lái)還是很棒的,我很樂(lè)意使用圖表。

范:機(jī)器翻譯僅有七十年左右的歷史。近二、三十年來(lái),隨著神經(jīng)機(jī)器翻譯的發(fā)展,機(jī)器翻譯質(zhì)量顯著提升。華為公司翻譯中心提供的數(shù)據(jù)顯示,2018年該中心日均純機(jī)器處理、無(wú)人工譯后編輯的翻譯交付量已達(dá)1億字符(任文, 2019),一時(shí)間機(jī)器翻譯會(huì)取代譯員的說(shuō)法甚囂塵上。有些人認(rèn)為這是杞人憂(yōu)天,有些人則嗅出了危機(jī)感。您認(rèn)為機(jī)器翻譯的發(fā)展對(duì)當(dāng)前和未來(lái)的翻譯從業(yè)者意味著什么?

皮:你剛剛提到的華為的數(shù)據(jù)我很感興趣。他們是如何知道機(jī)器翻譯結(jié)果沒(méi)有經(jīng)過(guò)人工譯后編輯的呢?有什么方法可以得知嗎?翻譯后的文本有人去讀嗎?這樣龐大的字符翻譯量中包含多少有效信息呢?例如,我可以用機(jī)器翻譯將整個(gè)網(wǎng)頁(yè)譯為中文,這是很多字符,但是我也許只需要其中的三個(gè)字符組成的一條信息。華為提供的2018年的數(shù)據(jù)甚為驚人,實(shí)際上谷歌翻譯也發(fā)布過(guò)類(lèi)似的數(shù)據(jù)。但是我認(rèn)為我們對(duì)待這些數(shù)字時(shí)一定要格外謹(jǐn)慎,要思考它們究竟代表了什么。首先,這些數(shù)字真的能反映機(jī)器翻譯的使用情況嗎?因?yàn)槿绻梢悦赓M(fèi)把字符交給機(jī)器翻譯系統(tǒng)處理,那么人們使用時(shí)就不會(huì)感到任何交付數(shù)量上的限制。第二個(gè)問(wèn)題,也是最重要的問(wèn)題是,如果機(jī)器翻譯不是免費(fèi)的,那么人們會(huì)把這些字符交由專(zhuān)業(yè)筆譯員或口譯員處理嗎?例如,2000年的一項(xiàng)調(diào)查顯示,人們很少請(qǐng)職業(yè)譯員翻譯在日常生活中能用機(jī)器翻譯處理的字符。因此僅就數(shù)字而言,我認(rèn)為機(jī)器翻譯并不會(huì)對(duì)專(zhuān)業(yè)口筆譯人員構(gòu)成直接威脅?,F(xiàn)在的情況是,整個(gè)翻譯需求的蛋糕變得更大了。盡管譯員所占的份額少于所有翻譯字符數(shù)的1%,他們的工作量依然在不斷增長(zhǎng)。從我們掌握的統(tǒng)計(jì)數(shù)據(jù)看來(lái),在美國(guó)、加拿大、德國(guó)等地,職業(yè)口、筆譯員的雇用數(shù)量都在增長(zhǎng)。也有來(lái)自中國(guó)的數(shù)據(jù),稱(chēng)職業(yè)譯員的數(shù)量以每年10%的速度增長(zhǎng)。因此我尚未見(jiàn)到任何實(shí)質(zhì)性的證據(jù)可以證明機(jī)器翻譯正在取代職業(yè)翻譯。人工翻譯與機(jī)器翻譯的競(jìng)爭(zhēng),本質(zhì)上是人工翻譯與機(jī)器翻譯加譯后編輯、或者說(shuō)與機(jī)器翻譯加人工翻譯之間的競(jìng)爭(zhēng)。一旦翻譯人員習(xí)慣了機(jī)器翻譯,他們的工作效率以及術(shù)語(yǔ)和固定短語(yǔ)的翻譯質(zhì)量將大大提高,我認(rèn)為這一點(diǎn)不難證明。因此,我認(rèn)為問(wèn)題的重點(diǎn)不是人類(lèi)與機(jī)器的對(duì)立,而是人類(lèi)如何有效地使用機(jī)器。

范:有人說(shuō),機(jī)器翻譯在科技翻譯(非文學(xué)翻譯)領(lǐng)域或大有可為,但是利用機(jī)器進(jìn)行文學(xué)翻譯則是“不可能完成的任務(wù)”。請(qǐng)問(wèn)對(duì)此您怎么看?

皮:我認(rèn)為最好的辦法是試試看,也就是運(yùn)用實(shí)證的方法來(lái)探究我們不知道的問(wèn)題,看會(huì)發(fā)生什么。我曾在課上讓學(xué)生們用翻譯機(jī)器將沃爾特·惠特曼(Walt Whitman)的英文詩(shī)譯成中文,最終我們發(fā)現(xiàn)許多機(jī)器翻譯結(jié)果都相當(dāng)成功,反而是部分人工翻譯結(jié)果不盡如人意。可見(jiàn)對(duì)于某種特定程度的復(fù)雜性和難度而言,完全沒(méi)有理由說(shuō)機(jī)器翻譯的結(jié)果比人工翻譯的差,也沒(méi)有任何理由不讓譯員使用翻譯機(jī)器。另外,我也不認(rèn)為文學(xué)與其他類(lèi)型的文本有什么本質(zhì)上的區(qū)別?;萏芈褪且粋€(gè)例子,他的語(yǔ)言非常簡(jiǎn)單。自19世紀(jì)末以來(lái),大多數(shù)西方文學(xué)都有語(yǔ)言越來(lái)越生活化、口頭化的發(fā)展趨勢(shì)。我不太了解中國(guó)文學(xué)的情況,但我推測(cè)可能也是如此。以前我們稱(chēng)之為經(jīng)典的那些文學(xué)作品往往與日常生活相割裂,如今文學(xué)與日常生活越來(lái)越相近了,尤其是詩(shī)歌。因此毫無(wú)疑問(wèn),文學(xué)對(duì)機(jī)器翻譯并無(wú)特殊。不過(guò)還有一點(diǎn)很有趣。我在墨爾本的課堂上、我的同事們?cè)谖靼嘌赖恼n堂上都進(jìn)行過(guò)相關(guān)試驗(yàn),我們發(fā)現(xiàn)當(dāng)學(xué)生使用機(jī)器翻譯系統(tǒng)來(lái)輔助文學(xué)文本的翻譯時(shí)(即先用機(jī)器翻譯然后再進(jìn)行譯后編輯),他們的翻譯質(zhì)量普遍提高了。通過(guò)計(jì)算基本錯(cuò)誤——翻譯錯(cuò)誤和語(yǔ)言錯(cuò)誤等的數(shù)量,可以證明使用機(jī)器翻譯并進(jìn)行譯后編輯的學(xué)生比不使用的學(xué)生表現(xiàn)更好,也譯得更快一點(diǎn)。但是,當(dāng)我們問(wèn)這些學(xué)生“你是否會(huì)繼續(xù)使用譯后編輯”時(shí),很多人說(shuō)“不,我不喜歡對(duì)文學(xué)文本進(jìn)行譯后編輯”或者“機(jī)器無(wú)法翻譯文學(xué)作品”。也就是說(shuō),即使我們可以用數(shù)字告訴他們借助機(jī)器的翻譯效果更好,在思想認(rèn)識(shí)上他們?nèi)匀徊辉甘褂脵C(jī)器翻譯文學(xué)文本。可見(jiàn)問(wèn)題不在于語(yǔ)言事實(shí),而是在于人們?cè)诠逃杏∠笾姓J(rèn)為文學(xué)是常人無(wú)法企及的語(yǔ)言的最高境界,于是對(duì)機(jī)器翻譯持有抗拒心理。

范:也就是說(shuō)這個(gè)問(wèn)題與信任有關(guān)?譯者不夠信任機(jī)器翻譯?

皮:沒(méi)有人應(yīng)該完全相信機(jī)器翻譯,但是我們可以證明人們能用機(jī)器翻譯達(dá)到目的。這是一個(gè)可信度的問(wèn)題,同人與人之間的關(guān)系是一樣的。如果你自問(wèn)“我能信任這個(gè)人嗎”,同時(shí)很快發(fā)現(xiàn)這個(gè)人犯了一兩個(gè)小錯(cuò)誤,可能你就會(huì)告訴自己“他肯定還有很多其他錯(cuò)誤,我不能信任這個(gè)人”。這就像復(fù)雜理論(complexity theory)中的蝴蝶效應(yīng),一兩件小事就能將信任變成不信任,因?yàn)榻⑿湃问呛芾щy的,打破信任卻很容易。這便解釋了為何人們即使會(huì)采納機(jī)器翻譯的一部分結(jié)果,卻仍然認(rèn)為機(jī)器翻譯不好用。對(duì)譯者來(lái)說(shuō),即使他們相信源語(yǔ)文本和目標(biāo)語(yǔ)文本中那些具體的東西,他們也不一定信任機(jī)器翻譯本身。打個(gè)比方的話(huà),也許可以這么想:我并不相信賣(mài)東西的人,但是如果價(jià)格還可以,物品也實(shí)用,我仍然會(huì)從他那里買(mǎi)東西。

范:2019年出版的《勞特里奇翻譯與科技手冊(cè)》(TheRoutledgeHandbookofTranslationandTechnology)中,您撰寫(xiě)了“(翻譯)質(zhì)量”這一章(Pym, 2019)。您在文中提到,人們最常提出的問(wèn)題就是“機(jī)器翻譯能不能翻譯得像人類(lèi)一樣好”,而往往翻譯“好”與“不好”的標(biāo)準(zhǔn)是不確定的。那么在實(shí)際研究中,究竟應(yīng)該如何評(píng)估機(jī)器翻譯的質(zhì)量呢?

皮:首先我需要解釋一下“不確定性”(indeterminacy)。我認(rèn)為對(duì)于一個(gè)給定的翻譯問(wèn)題,并非只有一個(gè)合理的解決方案。由于語(yǔ)言不確定性的本質(zhì),語(yǔ)言間不存在機(jī)械的因果關(guān)系。這意味著針對(duì)同一個(gè)原文本,不同的譯員會(huì)給出不同的翻譯文本,也就是給問(wèn)題找到不同的解決方案,而所有方案都是可接受的。我們這些一直與翻譯打交道的人都很清楚不確定性的存在,即有很多不同的標(biāo)準(zhǔn)可以使用。而我們?cè)u(píng)估機(jī)器翻譯的質(zhì)量時(shí),卻總是使用人類(lèi)的翻譯作為參考答案,并認(rèn)為它是唯一的標(biāo)準(zhǔn)。這就是問(wèn)題所在。不確定性給質(zhì)量評(píng)估帶來(lái)的困難不單單是機(jī)器翻譯的問(wèn)題,也是翻譯研究總體上的問(wèn)題,更是語(yǔ)言評(píng)估中存在的難題。因?yàn)椴淮_定性是語(yǔ)言的本質(zhì)屬性之一,而不是特定于翻譯的。

我在研究中會(huì)盡可能回避翻譯質(zhì)量這個(gè)問(wèn)題,因?yàn)閷?shí)在是困難。就我而言,質(zhì)量的含義是多重的。質(zhì)量評(píng)估就像審美,“情人眼里出西施”嘛。不同的人會(huì)在不同的地方、不同的事物中發(fā)現(xiàn)美,發(fā)現(xiàn)不同的美。那么具體該怎么做呢?一種方法是在承認(rèn)存在不同標(biāo)準(zhǔn)的前提下,人為設(shè)定一個(gè)標(biāo)準(zhǔn)。我們可以根據(jù)自己的研究目的進(jìn)行說(shuō)明,選用某一種翻譯作為正確答案,而其他的都是偏差值。此外,如果幾位評(píng)估者能夠在某些標(biāo)準(zhǔn)上達(dá)成共識(shí),或同意某些譯法是不足甚至錯(cuò)誤的,我們也可以用他們的意見(jiàn)輔助判斷。另一種方法是觀察讀者和他們的實(shí)際反應(yīng),即認(rèn)為翻譯的質(zhì)量取決于人們閱讀后的感受。我們可以通過(guò)問(wèn)卷調(diào)查了解讀者對(duì)譯文的理解或者探尋他們下一步的打算,例如在銷(xiāo)售場(chǎng)景中,讀者愿不愿意購(gòu)買(mǎi)某個(gè)譯本可以作為衡量其質(zhì)量的標(biāo)準(zhǔn)。另外,基于之前提到的信任問(wèn)題,我們也可以讓人們閱讀不同的翻譯,然后問(wèn)他們信任哪個(gè)、不信任哪個(gè)以及為什么。由此你也許會(huì)發(fā)現(xiàn),一些小錯(cuò)誤就會(huì)破壞譯文整體的可信度,導(dǎo)致讀者心目中譯者及其翻譯工作的驟然貶值。總之,我認(rèn)為衡量譯文質(zhì)量的方法有很多,而我們選擇的方法應(yīng)該與自己要在研究中解決的問(wèn)題相對(duì)應(yīng)。

范:同樣在這一章中,您還提到了一個(gè)非常有趣的話(huà)題:翻譯技術(shù)、尤其是機(jī)器翻譯對(duì)譯者工作幸福感和滿(mǎn)足感的影響。就現(xiàn)有的研究而言,請(qǐng)問(wèn)您認(rèn)為是否存在一個(gè)平衡點(diǎn),使譯員在機(jī)器翻譯的幫助下實(shí)現(xiàn)最大程度的滿(mǎn)足?

皮:這個(gè)問(wèn)題很好,但是沒(méi)有確切的答案。很多年前,我有一個(gè)來(lái)自香港的博士生廖鳳明(Liu Fung Ming,Christy),她對(duì)譯者的幸福感進(jìn)行了研究。幸福感是可以衡量的,使公民感到幸福是國(guó)家的義務(wù)之一,因此對(duì)幸福感的研究很有意義,也已有大量前期成果。廖發(fā)現(xiàn),譯者的幸福感很大程度上取決于他們的個(gè)性。不同的人樂(lè)于做不同的事情,幸福并沒(méi)有一定之規(guī)。其實(shí)這一點(diǎn)我們本該心知肚明,但不知為何我們?cè)谟懻撝型怀姓J(rèn)它。廖的研究發(fā)現(xiàn),有些譯員很樂(lè)意與他人面談,面對(duì)面解決問(wèn)題,他們是真正的“調(diào)解人”(mediators);另外一些譯員則喜歡藏在計(jì)算機(jī)后面解決技術(shù)問(wèn)題,查找資料以獲得特定術(shù)語(yǔ)的精確匹配項(xiàng);還有很多譯員介于兩者之間。

那么機(jī)器翻譯如何影響譯者工作滿(mǎn)足感呢?要看情況。例如,有些人比較擅長(zhǎng)直接在電話(huà)上為人解決問(wèn)題,那他們不會(huì)喜歡機(jī)器翻譯,因?yàn)樗鼤?huì)分散他們的注意力,成為障礙,使他們與實(shí)現(xiàn)交流的目的背道而馳。有些人在處理任務(wù)的過(guò)程中,能發(fā)現(xiàn)并更正機(jī)器翻譯的錯(cuò)誤,改進(jìn)數(shù)據(jù)庫(kù)并從中獲得極大的滿(mǎn)足感和幸福感。我雖然不是這樣的人,但的確有人是。如今很多翻譯畢業(yè)生都在進(jìn)行清整數(shù)據(jù)庫(kù)的工作,即檢查并驗(yàn)證輸入到機(jī)器翻譯數(shù)據(jù)庫(kù)中的信息。對(duì)我來(lái)說(shuō)這實(shí)在是乏味得可怕。有一次我與莎倫·奧布萊恩(Sharon O’Brien)討論這個(gè)問(wèn)題,她可以算是翻譯技術(shù)方面最頂尖的學(xué)者了。我說(shuō):“莎倫,你看,很多翻譯畢業(yè)生不得不去做這些無(wú)聊至極的苦力活兒。”她卻說(shuō):“我完全不覺(jué)得啊?!彼跉W洲委員會(huì)的第一份工作就是有關(guān)數(shù)據(jù)庫(kù)的。在那里她學(xué)習(xí)了技術(shù)原理,了解了機(jī)器翻譯的工作方式以及改善人機(jī)交互的方法,所以她并不同意我的意見(jiàn)。她與我性格不同,研究語(yǔ)言的方式也不一樣。數(shù)據(jù)庫(kù)工作令她感到心滿(mǎn)意足,并成為她進(jìn)入翻譯技術(shù)研究領(lǐng)域的切入點(diǎn)。這再次說(shuō)明解決方案因人而異。在我以前的學(xué)生安娜·格伯羅夫(Ana Guerberof)的研究中,我們發(fā)現(xiàn)首次進(jìn)行譯后編輯的人通常會(huì)討厭它,但一旦習(xí)慣之后,討厭它的程度就會(huì)降低。就像我們第一次嘗試任何事情一樣,這只是一種針對(duì)新事物時(shí)最初的負(fù)面反應(yīng)。

范:在科技發(fā)展日新月異的背景下,職業(yè)譯員的倫理問(wèn)題引發(fā)學(xué)界關(guān)注。2020年《山東外語(yǔ)教學(xué)》也刊發(fā)過(guò)“翻譯倫理再考察”專(zhuān)題,探討如何建立譯員職業(yè)道德考核評(píng)價(jià)機(jī)制(任文,2020;王巍巍、余懌, 2020)等問(wèn)題。請(qǐng)問(wèn)您怎樣認(rèn)識(shí)機(jī)器翻譯倫理?

皮:這很難講??偟膩?lái)說(shuō),我們的社會(huì)中存在許多與大數(shù)據(jù)和自動(dòng)化有關(guān)的重要問(wèn)題,我認(rèn)為就翻譯而言這些問(wèn)題并無(wú)不同。正如《中國(guó)語(yǔ)言服務(wù)行業(yè)規(guī)范》(2019)中所規(guī)定的,顯然譯員不能將機(jī)器翻譯的結(jié)果作為人工翻譯來(lái)提交。但這只是良好的商業(yè)慣例,即無(wú)論產(chǎn)品是什么,都要在交付產(chǎn)品時(shí)保持誠(chéng)實(shí)。因此,我不確定是否存在與翻譯相關(guān)的特殊問(wèn)題。但是,我很樂(lè)意概括并討論翻譯界正在發(fā)生的事情。

對(duì)我來(lái)說(shuō),機(jī)器翻譯倫理中最大的問(wèn)題是數(shù)據(jù)庫(kù)的構(gòu)成,因?yàn)樗幌袷侨藗儼袲NA或自己的照片放入一個(gè)巨大的數(shù)據(jù)庫(kù)中,而是拿走了我們的勞動(dòng)成果。當(dāng)我們?cè)诰€工作時(shí),我們的翻譯會(huì)保留在網(wǎng)站上,然后網(wǎng)絡(luò)爬蟲(chóng)會(huì)提取這些翻譯,放入數(shù)據(jù)庫(kù)中;我們使用免費(fèi)的在線翻譯軟件時(shí),軟件會(huì)將我們的操作記錄收入數(shù)據(jù)庫(kù)中。機(jī)器翻譯系統(tǒng)中可供貿(mào)易的存量——其真正有價(jià)值的部分——取決于數(shù)據(jù)庫(kù)的質(zhì)量。機(jī)器翻譯依靠的不是語(yǔ)言學(xué)而是數(shù)學(xué),不僅需要數(shù)量龐大的數(shù)據(jù)庫(kù),更需要由人工生產(chǎn)高質(zhì)量的配對(duì)。換言之,我們免費(fèi)提供了勞動(dòng)力。這是不是一個(gè)倫理問(wèn)題?如果你是一位堅(jiān)定的馬克思主義者,就肯定不會(huì)否認(rèn)這一點(diǎn)。就像資本家建了工廠,工廠利用了工人的勞動(dòng)力,工廠歸資本家所有,工人自愿為資本家提供了剩余價(jià)值,成了資本家獲得資本的方式。數(shù)據(jù)庫(kù)正在做的事與此別無(wú)二致。另一方面,我認(rèn)為作為工人,即譯者、語(yǔ)言工作者或者相關(guān)研究者,如果可以從這筆資本中受益,那也無(wú)可厚非。但是請(qǐng)注意,這其中也涉及數(shù)據(jù)管理、隱私以及為交換某些東西而無(wú)償提供數(shù)據(jù)等倫理問(wèn)題。這樣的倫理問(wèn)題充斥著整個(gè)社會(huì),而翻譯只是其中的一個(gè)領(lǐng)域。

我還想提出另一個(gè)重要的倫理問(wèn)題,因?yàn)槲艺J(rèn)為這對(duì)中國(guó)尤為重要,而涉及中國(guó)的一切都是非常大的數(shù)字。技術(shù)使我們能夠翻譯一切,而技術(shù)界的理念是,如果能夠做,那就去做?,F(xiàn)在有了免費(fèi)的在線機(jī)器翻譯,我們也許更會(huì)這么想。然而,正如邁克爾·克羅寧(Michael Cronin)所指出的那樣,從生態(tài)學(xué)的角度講,無(wú)限制的機(jī)器翻譯是不可持續(xù)的(Cronin,2017)。無(wú)論是從翻譯學(xué)還是生態(tài)學(xué)的角度看,我們不能持續(xù)不斷地利用地球的資源來(lái)存儲(chǔ)數(shù)據(jù),也不能不斷建立數(shù)據(jù)庫(kù)使機(jī)器持續(xù)產(chǎn)生瑣碎無(wú)用的結(jié)果。終有一個(gè)臨界點(diǎn)會(huì)讓我們不得不開(kāi)始思考“不翻譯”,或者說(shuō),思考哪些文本值得利用地球的資源進(jìn)行翻譯而哪些則不需要。我們沒(méi)有馬上意識(shí)到這一點(diǎn),是因?yàn)槭澜缟喜⒉淮嬖谶@樣一個(gè)實(shí)體的“計(jì)算機(jī)農(nóng)場(chǎng)”,肉眼無(wú)法看到其中正在消耗能源接受處理的數(shù)據(jù)。但是這個(gè)生態(tài)問(wèn)題是確實(shí)存在的,我們應(yīng)該思考如何在真正需要技術(shù)的時(shí)候使用它,而不是僅僅因?yàn)樗嬖诰腿ニ烈馐褂谩N易约宏P(guān)于倫理的書(shū)(Pym, 2012)中也提到了這一點(diǎn)。我提出了一個(gè)根本性問(wèn)題:究竟為何要翻譯?實(shí)際上,翻譯是需要理由的。我在書(shū)中舉例說(shuō)明了為什么我認(rèn)為有些文本不應(yīng)該翻譯,不是因?yàn)榈退滓x或其他類(lèi)似的理由,而是因?yàn)榉g它不會(huì)產(chǎn)生任何益處。既然不存在協(xié)作,也就沒(méi)有必要交流。我認(rèn)為我們需要進(jìn)一步思考為什么要翻譯以及為什么不翻譯。

范:剛剛您的回答引人深思。尤其是數(shù)據(jù)管理問(wèn)題,很多時(shí)候我們并沒(méi)有意識(shí)到自己的翻譯成果被用在了其他地方。

皮:是的,這種情況一直都在發(fā)生,甚至比技術(shù)產(chǎn)生得更早。有時(shí)候我會(huì)在一些數(shù)據(jù)庫(kù)、術(shù)語(yǔ)庫(kù)里看到自己的翻譯,兜了一圈又回到我身邊。只要這份勞動(dòng)是用于交換,并且人們能清醒地意識(shí)到自己的成果被利用并同意說(shuō)“我愿意把這個(gè)給你用于交換”,對(duì)我來(lái)說(shuō)就沒(méi)有問(wèn)題。但是如果交換并不平等,那我就不能認(rèn)可了——實(shí)際上這就等于我們被搶劫了。我再舉一個(gè)例子。大概8年前,世界各地的翻譯公司收集了大量語(yǔ)言數(shù)據(jù),用有效的雙語(yǔ)語(yǔ)料建立了數(shù)據(jù)庫(kù)。他們開(kāi)發(fā)了一個(gè)“人類(lèi)語(yǔ)言項(xiàng)目”(the Human Language Project),試圖將全部數(shù)據(jù)匯集起來(lái),齊心協(xié)力解決翻譯問(wèn)題。之前有個(gè)類(lèi)似的項(xiàng)目叫“人類(lèi)基因組計(jì)劃”,是將全世界的科學(xué)家聚集在一起,收集他們的資源繪制人類(lèi)基因組的圖譜,然后把它用于全世界的醫(yī)學(xué)研究,造福所有人。聽(tīng)起來(lái)很棒是不是?但從2016年開(kāi)始,人們逐漸意識(shí)到對(duì)數(shù)據(jù)庫(kù)來(lái)說(shuō)最重要的是它有多干凈而不是它有多大,我們需要的是高質(zhì)量的數(shù)據(jù)庫(kù)。但這些翻譯公司可不會(huì)為了全人類(lèi)的利益而免費(fèi)提供服務(wù),他們開(kāi)始出售那些“屬于他們”的東西:開(kāi)發(fā)人類(lèi)語(yǔ)言項(xiàng)目的組織TAUS(Translation Automation User Society)開(kāi)辦了一個(gè)市場(chǎng),供人們買(mǎi)賣(mài)數(shù)據(jù)庫(kù)或所謂的“語(yǔ)言資產(chǎn)”(language assets)。由于技術(shù)的進(jìn)步,這個(gè)曾經(jīng)偉大的人道主義項(xiàng)目變成了市場(chǎng),一部分人的勞動(dòng)成果被自以為擁有這些成果的另一部分人拿去出售了。這就是一個(gè)倫理問(wèn)題。

范:我有幸在墨爾本大學(xué)訪學(xué)期間旁聽(tīng)過(guò)您的“翻譯與技術(shù)”課程,請(qǐng)問(wèn)您是如何想到要將機(jī)器翻譯融入翻譯教學(xué)的?對(duì)翻譯專(zhuān)業(yè)的學(xué)生來(lái)說(shuō),培養(yǎng)語(yǔ)言能力是重中之重,那么翻譯技術(shù)的教學(xué)應(yīng)放在什么階段、用怎樣的方式進(jìn)行最為合適?去年您還發(fā)表了一篇有關(guān)譯員培訓(xùn)的文章(Pym, 2020)。請(qǐng)問(wèn)您認(rèn)為機(jī)器翻譯會(huì)給譯員培訓(xùn)帶來(lái)什么樣的幫助呢?

皮:這個(gè)問(wèn)題和“為什么要翻譯”差不多。不應(yīng)該因?yàn)榧夹g(shù)就在那里而使用技術(shù),這一點(diǎn)對(duì)翻譯教學(xué)和譯員培訓(xùn)是一樣的。如果學(xué)生已經(jīng)在使用機(jī)器翻譯了,那么就必須教他們?nèi)绾问褂?。否則他們雖然用了但可能使用不當(dāng),或者因?yàn)闆](méi)有意識(shí)到機(jī)器翻譯的局限性而過(guò)于信任它。我實(shí)施教學(xué)和培訓(xùn)時(shí)會(huì)從譯后編輯入手,先讓學(xué)生觀察哪些地方出了問(wèn)題,需要改正什么,為什么要改正它;然后進(jìn)行逆向思考,搞清楚為什么機(jī)器翻譯會(huì)得出錯(cuò)誤答案;最后進(jìn)行譯前編輯,看看是否可以改寫(xiě)源語(yǔ)文本讓機(jī)器翻譯得更準(zhǔn)確。僅通過(guò)這些,我們就學(xué)到了很多有關(guān)機(jī)器翻譯的知識(shí),同時(shí)也可以教授譯后編輯和譯前編輯這兩種技能。我這樣做時(shí),不會(huì)告訴學(xué)生機(jī)器翻譯是好是壞或者進(jìn)行任何事前判斷,他們必須自己去發(fā)現(xiàn)。每年我都做相同的活動(dòng),但是每年都能得到不同的結(jié)果。這其中的原因是機(jī)器翻譯一直在進(jìn)步,翻譯結(jié)果變得越來(lái)越好。教學(xué)應(yīng)當(dāng)鼓勵(lì)學(xué)生自己去發(fā)現(xiàn)機(jī)器翻譯的優(yōu)點(diǎn)和缺點(diǎn)。

范:您能簡(jiǎn)要地向我們介紹一下目前機(jī)器翻譯研究領(lǐng)域的熱點(diǎn)問(wèn)題嗎?

皮:我不知道(笑)。幾年前我寫(xiě)過(guò)一篇論文,其中提到機(jī)器翻譯研究的問(wèn)題是機(jī)器翻譯或者翻譯記憶庫(kù)兩年內(nèi)就會(huì)發(fā)生很大的變化,但是發(fā)表學(xué)術(shù)論文就需要兩年左右的時(shí)間,研究本身可能也需要兩年時(shí)間;如果是博士論文則需要四或五年的時(shí)間,那么從著手研究到將論文發(fā)表成書(shū),可能花費(fèi)五、六年甚至七年。因此最好不要研究機(jī)器翻譯,因?yàn)闄C(jī)器翻譯和翻譯記憶庫(kù)在四、五年后早已與今天不同。如果還是想研究的話(huà),必須抽象到一定高度。不要研究目前已知的東西,比如網(wǎng)絡(luò)在線翻譯的質(zhì)量、西方和中國(guó)的神經(jīng)機(jī)器翻譯系統(tǒng)的比較之類(lèi),它們很快就會(huì)變化。我認(rèn)為研究者需要退后一步,把眼光放在一些不受時(shí)間影響的主題上。例如人對(duì)機(jī)器翻譯的抗拒情緒就很有趣:人們?yōu)槭裁纯咕??如何抗拒?這種抗拒會(huì)如何變化?查閱人們對(duì)機(jī)器翻譯的評(píng)論,解釋其背后的原因,將是帶有社會(huì)學(xué)意義的實(shí)用話(huà)語(yǔ)分析。

還有一個(gè)非常有趣的課題值得學(xué)者研究,也能為行業(yè)提供幫助,就是那些缺乏數(shù)據(jù)的語(yǔ)言。機(jī)器翻譯對(duì)于使用者眾多的語(yǔ)言和有大量電子資源文本的語(yǔ)言相對(duì)有效,因?yàn)檫@些語(yǔ)言有大量電子資源支撐數(shù)據(jù)庫(kù)。但是對(duì)于許多較小眾的語(yǔ)言,資源稀缺,鮮有電子形式的記錄,因而被排除在機(jī)器翻譯本可以帶來(lái)的便利之外。因此我認(rèn)為,深入研究這些語(yǔ)言并思索如何建構(gòu)數(shù)據(jù)庫(kù),如何使其變得可靠,如何在特定領(lǐng)域中使用非常小的數(shù)據(jù)庫(kù)來(lái)產(chǎn)生良好的機(jī)器翻譯結(jié)果,都會(huì)是有趣的研究。我來(lái)自澳大利亞,這里有一種叫努嘎語(yǔ)(Noongar)的土著語(yǔ),是一門(mén)幾乎滅絕的語(yǔ)言,會(huì)講的大約不到100人,但是人們正在努力復(fù)興它。不會(huì)講努嘎語(yǔ)的人,如果他們的父母也不會(huì)的話(huà),就會(huì)去找僅存的還會(huì)這門(mén)語(yǔ)言的人學(xué)習(xí),并用努嘎語(yǔ)做各種各樣的事,比如將莎士比亞翻譯成努嘎語(yǔ)。正巧我今天還看到新聞?wù)f,因?yàn)樗麄兌枷矚g李小龍,就把電影《精武門(mén)》譯成了努嘎語(yǔ),所有去看功夫打斗的孩子們都會(huì)從電影中潛移默化地學(xué)習(xí)努嘎語(yǔ)。他們還開(kāi)發(fā)了努嘎語(yǔ)的百科全書(shū)“Noongarpedia”,這部百科的生成方式類(lèi)似于維基百科(Wikipedia),但使用的是努嘎語(yǔ)。他們還在建設(shè)努嘎語(yǔ)的知識(shí)庫(kù),這需要努嘎語(yǔ)的數(shù)據(jù)庫(kù)和術(shù)語(yǔ)庫(kù)。這是我國(guó)土著語(yǔ)言的例子,世界上還有許多較小、瀕臨滅絕的語(yǔ)言都在進(jìn)行這樣的工作,而技術(shù)確實(shí)可以在這場(chǎng)斗爭(zhēng)中提供幫助。因此,我認(rèn)為不僅僅是機(jī)器翻譯,翻譯本身能對(duì)語(yǔ)言復(fù)興(language revival)起到的作用是很有前景的研究領(lǐng)域。研究應(yīng)當(dāng)如何更好地復(fù)興一門(mén)語(yǔ)言,是我和墨爾本大學(xué)的同事做過(guò)的最美妙的事情。我們做過(guò)一種特別神奇的工作,就是利用語(yǔ)言學(xué)信息使某些語(yǔ)言起死回生,或者教給孩子們連他們的父母都不會(huì)的已逝的語(yǔ)言。我是澳大利亞人,但祖先在歐洲。我們?cè)?jīng)入侵了這個(gè)大陸。出于入侵者的愧疚,我認(rèn)為我們必須這么做,這是我們擺脫愧疚的一種方式。如果技術(shù)能協(xié)助我們,實(shí)在是求之不得。

范:請(qǐng)問(wèn)您是否關(guān)注過(guò)中國(guó)學(xué)者在機(jī)器翻譯研究領(lǐng)域的成果?您曾經(jīng)提過(guò)“語(yǔ)言距離”(distance between languages)這一概念,中文的特性會(huì)使機(jī)器翻譯研究更復(fù)雜嗎?

皮:中文方面我可不是專(zhuān)家,所以也無(wú)法評(píng)價(jià)。我只知道中文也是一種主謂賓結(jié)構(gòu)的語(yǔ)言,和英文相同,但與大多數(shù)亞洲語(yǔ)言不同。所以中文和英文互譯時(shí),句法方面往往不會(huì)像韓文和日文那樣出現(xiàn)重大問(wèn)題。另外,中文擁有龐大而且干凈的數(shù)據(jù)庫(kù),因此我們使用漢英數(shù)據(jù)庫(kù)(漢英機(jī)器翻譯)時(shí)可以得到不錯(cuò)的結(jié)果?;谶@兩個(gè)因素,即句法的相似性和龐大整潔的數(shù)據(jù)庫(kù),漢英互譯的結(jié)果不像人們想象的那么差。關(guān)于另一個(gè)問(wèn)題,首先我想問(wèn)你,你讀過(guò)加拿大翻譯學(xué)者的文章嗎?

范:說(shuō)來(lái)慚愧,讀論文的時(shí)候,我好像很少關(guān)注學(xué)者本身是從哪里來(lái)的。

皮:那么法國(guó)學(xué)者的呢?或者是德國(guó)的、烏克蘭的或澳大利亞的?你應(yīng)該明白我的意思了。我認(rèn)為翻譯研究不是奧林匹克運(yùn)動(dòng),也沒(méi)有那么一支“中國(guó)隊(duì)”。我讀過(guò)的一些論文署名像是中國(guó)人,但其作者可能來(lái)自世界的任何地方。墨爾本和澳大利亞的其他地區(qū)有我的中國(guó)同事在研究機(jī)器翻譯及其應(yīng)用。在機(jī)器翻譯和翻譯技術(shù)研究中心都柏林,也有很多中國(guó)學(xué)生做著出色的研究。香港是翻譯研究重地,有很多翻譯項(xiàng)目,數(shù)不清的中國(guó)學(xué)者都發(fā)表了成果。所以這個(gè)問(wèn)題對(duì)我來(lái)說(shuō)很有意思,因?yàn)槲铱赡懿粫?huì)問(wèn)關(guān)于法國(guó)人的、烏克蘭人的或者加拿大人的研究。再比如,我與北京外國(guó)語(yǔ)大學(xué)的任文教授討論過(guò)倫理和機(jī)器翻譯的問(wèn)題,但我并未覺(jué)得我是在進(jìn)行一種跨越國(guó)界的交流,而只是以翻譯學(xué)者的身份與她溝通。因?yàn)槲覀冋谘芯肯嗤膯?wèn)題,大多數(shù)情況下遵循著相同的學(xué)術(shù)傳統(tǒng),我們之間存在某種共通的文化。

今天我看到一份有關(guān)機(jī)器翻譯的出版物的數(shù)據(jù)(圖1),該圖顯示,微軟和谷歌贊助出版了很多學(xué)術(shù)出版物,然而來(lái)自中國(guó)的公司排名并不高。但是所謂“來(lái)自中國(guó)的研究”究竟是什么?作者有中文名字就算嗎?論文是用中文寫(xiě)的就算嗎?還是為了中國(guó)公司而完成的成果就算在內(nèi)?百度是中國(guó)公司中排名最靠前的,卻僅排在倒數(shù)第四位。因此在這個(gè)領(lǐng)域,并非有人故意忽略中國(guó)學(xué)者的研究,只是恰好有更多來(lái)自西方的研究。上次布里斯班國(guó)際翻譯協(xié)會(huì)(Fédération Internationale des Traducteurs,F(xiàn)IT)的會(huì)議上我做了一個(gè)主旨發(fā)言,在我之前,贊助大會(huì)的一家中國(guó)公司的代表就大數(shù)據(jù)技術(shù)以及中國(guó)在該領(lǐng)域如何領(lǐng)先世界作了重要演講。這是國(guó)際翻譯協(xié)會(huì)的世界級(jí)會(huì)議,可以證明世界并沒(méi)有忽略中國(guó)的研究成果。我覺(jué)得有趣的是,該演講中強(qiáng)調(diào)了大數(shù)據(jù)的重要性,而在我看來(lái),最重要的是干凈的數(shù)據(jù)與這些數(shù)據(jù)的所有權(quán)。因此,對(duì)于同一件事,我們的關(guān)注點(diǎn)可能不同,但無(wú)論對(duì)方來(lái)自哪里或用什么語(yǔ)言,我都很高興與他們坐下來(lái)談?wù)摲g。從許多方面看,這并沒(méi)有太大的區(qū)別。

圖1 Scopus數(shù)據(jù)庫(kù)中有關(guān)機(jī)器翻譯的出版物數(shù)量及獲贊助情況(2010年-2018年6月) (Vasijevs et al,2019:3)

范:如果有學(xué)者想要從事機(jī)器翻譯相關(guān)研究,您可以在方法論方面提供一些建議嗎?

皮:其實(shí)就是剛剛提到的那一點(diǎn):不能把眼光放在那些變化速度太快的對(duì)象上,而是應(yīng)該抽象到一定高度,抽身出來(lái)著眼大局。細(xì)節(jié)問(wèn)題可以交給這個(gè)行業(yè)的專(zhuān)家,或者真正關(guān)注具體數(shù)據(jù)以及其他人動(dòng)態(tài)的那些公司。對(duì)于學(xué)者來(lái)說(shuō),當(dāng)我們討論譯者抗拒機(jī)器翻譯及其原因這類(lèi)問(wèn)題時(shí),與其他實(shí)證研究或思想認(rèn)識(shí)領(lǐng)域的研究沒(méi)有什么不同。因此我認(rèn)為翻譯技術(shù)的討論在方法論領(lǐng)域并沒(méi)有什么特殊之處。

范:在訪談的最后,請(qǐng)問(wèn)您能否推薦一些有關(guān)機(jī)器翻譯的必讀經(jīng)典和前沿之作,供感興趣的研究者們參考學(xué)習(xí)?

皮:不能(笑)。正如之前提到的那樣,出版一本書(shū)要花很久,機(jī)器翻譯卻瞬息萬(wàn)變。我認(rèn)為這個(gè)領(lǐng)域完全可以直接通過(guò)實(shí)踐體驗(yàn),因?yàn)槭褂梅g工具輕而易舉。我們可以親自體驗(yàn)機(jī)器翻譯系統(tǒng),還可以查看運(yùn)營(yíng)機(jī)器翻譯系統(tǒng)的公司發(fā)布的最新文章。當(dāng)然,也不要太把他們的宣傳當(dāng)真,畢竟他們的目標(biāo)讀者群并非翻譯研究者。

范:非常感謝。記得您曾經(jīng)在一次學(xué)術(shù)報(bào)告中說(shuō),“神經(jīng)機(jī)器翻譯對(duì)當(dāng)今社會(huì)最大的貢獻(xiàn)就是每個(gè)人都能使用它,并且從中得到樂(lè)趣。機(jī)器翻譯并不是為了獲得唯一確定的信息,而是一種探索世界的方式”。我非常贊同。您的觀點(diǎn)與翻譯活動(dòng)本身的價(jià)值也有相通之處——擴(kuò)展人們對(duì)世界的探索。希望也相信今后的科技能夠不斷幫助人們實(shí)現(xiàn)這個(gè)心愿。再次感謝您分享關(guān)于翻譯技術(shù)和機(jī)器翻譯的見(jiàn)解,期待今后繼續(xù)與您保持交流。

猜你喜歡
譯員數(shù)據(jù)庫(kù)語(yǔ)言
語(yǔ)言是刀
醫(yī)療口譯中口譯人員角色的動(dòng)態(tài)轉(zhuǎn)換
口譯中的“現(xiàn)場(chǎng)學(xué)習(xí)”
讓語(yǔ)言描寫(xiě)搖曳多姿
口譯中的“陷阱”
數(shù)據(jù)庫(kù)
譯員扮演何種角色?
數(shù)據(jù)庫(kù)
數(shù)據(jù)庫(kù)
數(shù)據(jù)庫(kù)