王永+諶陽敏+侯柯康+王琳妹
【摘 要】隨著科技的進步,大數(shù)據(jù)已引發(fā)了翻譯界的重大變革。以谷歌翻譯、有道翻譯為代表的機器翻譯就是成功借助大數(shù)據(jù)功能進行翻譯的典型。然而,這種翻譯相比較人工翻譯可謂優(yōu)缺點并存。筆者以大數(shù)據(jù)時代機器的石油科技英語翻譯作為切入點進行深入分析。探討大數(shù)據(jù)背景下石油科技翻譯的存在的機遇和問題,以期為大數(shù)據(jù)背景下的石油科技翻譯提供可行性建議,促進石油科技翻譯的高效化和智能化。
【關(guān)鍵詞】大數(shù)據(jù)背景;機器翻譯;石油科技翻譯;應對的建議
在科技進步的推動下,大數(shù)據(jù)時代已經(jīng)到來,它正以前所未有的廣度和深度影響著人類社會?!叭藗儗τ诖髷?shù)據(jù)的挖掘和運用,預示著新一波生產(chǎn)力增長和消費盈余潮的到來”(Manyika J 2011)。翻譯作為推動人類文明進步的重要環(huán)節(jié),不可避免的受其影響。然而,在翻譯界真正結(jié)合大數(shù)據(jù)的研究幾乎空白?;诖?,筆者初步探討大數(shù)據(jù)與翻譯間的關(guān)系和相互影響,構(gòu)架出翻譯與大數(shù)據(jù)間內(nèi)在邏輯關(guān)系和理論框架,探索出如何借助大數(shù)據(jù)進一步推動翻譯的高效化和智能化,推動翻譯為人類文明進步作出更大貢獻。在此,筆者以谷歌翻譯中石油科技翻譯作為切入點,進行深入分析。
一、大數(shù)背景下的翻譯特點
以谷歌翻譯為代表的搜索引擎翻譯是利用大數(shù)據(jù)功能進行翻譯的典型?!案鶕?jù)維基百科公布的數(shù)據(jù),截至2016年1月,谷歌翻譯支持90種語言,每天為超過兩億人提供免費的多種語言翻譯服務”(斯介生 ?2016)。因此,它具有快捷、量大、高效、語種多等特點。但這種大數(shù)據(jù)背景下的翻譯在準確性方面還存在很多缺點和不足。為此,我們從以下幾點進行探討:
首先,大數(shù)據(jù)時代背景下的機器翻譯(以谷歌翻譯為代表),主要是基于大數(shù)據(jù)功能產(chǎn)生,其翻譯質(zhì)量受到平行語料庫數(shù)據(jù)量的制約。而且,語料庫數(shù)據(jù)中存儲樣本量的不同都會影響翻譯質(zhì)量。
再者,大數(shù)據(jù)時代背景下的機器翻譯的模型不能有效識別上下文信息;造成不能識別諸如虛擬語氣、被動語態(tài)等語法信息,要么只能識別部分信息。
其次,大數(shù)據(jù)時代背景下的機器翻譯不能翻譯過長句式的文本。一旦文本句式過長,其翻譯的質(zhì)量就會下降。
最后,大數(shù)據(jù)時代背景下的機器翻譯給出的詞頻不能作為譯者采納的標準。
二、石油科技翻譯語言特點
石油英語的語言基于其特殊的專業(yè)性和歷史發(fā)展,具有其自身特點。筆者以英語為代表進行分析,其具備以下特點:
首先:石油英語具有準確性的特點。這主要表現(xiàn)為:構(gòu)詞的準確性。石油科技英語從拉丁語、希臘語借用大量術(shù)語,以及借助拉丁和希臘詞綴構(gòu)成大量新詞,而由于拉丁語和希臘語本身意義單一,造成其歧義較少,故準確性較強(鄒宇2007)。例如,hydrocarbon(碳氫化合物, 烴類)。詞綴構(gòu)成詞匯較多,如desalting(脫鹽)。抽象名詞廣泛使用,如permeability(滲透率)。
再者,石油科技英語中大量運用嚴密、復雜、條理的復合長句表達理論原理、發(fā)展變化過程。
再者,石油科技英語具有客觀性。被動語態(tài)廣泛使用、現(xiàn)在時態(tài)較頻繁。
其次,石油科技英語具有簡潔性??s略詞大量使用,就是其中最明顯的一個特點。如,EOR(enhanced oil recovery):提高采收率。
最后,石油科技英語具有多重學科背景,而且伴隨著石油業(yè)的不斷發(fā)展,不斷有新詞匯產(chǎn)生,如,timestep(時間步長)。
三、大數(shù)據(jù)背景下石油科技翻譯的建議
首先,我們翻譯界尤其是石油專業(yè)的高校要和石油公司緊密聯(lián)系,獲取豐富的翻譯文本,不斷進行與石油相關(guān)的平行語料庫建設和完善,為大數(shù)據(jù)的數(shù)據(jù)搜索提供原材料。由于石油科技語言的準確簡介性特點決定了只要我們進行充分的詞匯和句式收集就可為大數(shù)據(jù)時代機器翻譯的準確性提供保證。從實踐中提煉出翻譯準確,標準規(guī)范的詞組、句式,繼而通過語料庫進行儲備,然后再通過網(wǎng)絡進行傳播使用,可以有效提升大數(shù)據(jù)搜集的準確性和嚴密性,從而使諸如谷歌之類的翻譯更具可靠性。
再者,基于大數(shù)時代的機器翻譯功能仍未達到成熟水平,不能有效識別上下文語境和復雜長句子。這要求石油科技的翻譯同時要依靠人工翻譯,由譯者去判斷分析句式語法結(jié)構(gòu),去思考英語句子中的邏輯,再結(jié)合譯入語和譯出語的具體語言結(jié)構(gòu)進行恰當翻譯。
其次,基于大數(shù)據(jù)時代機器翻譯時分析搜集出的詞和詞組仍沒有完全結(jié)合語境,其詞頻高低不能作為準確翻譯的標準?!皬姆g理論上分析目的語中普通真實語言的詞頻大小一般不作為譯文的選擇標準,即: 高頻詞不一定適合語境”(倪傳斌 2003)。當然,這種情況也適用于固定搭配。舉例來說,譯者不能由于“petroleum”比“oil ”在真實英語環(huán)境中的使用頻率高,在英譯漢時就不加分析總把“petroleum”作為“石油”。同理,大數(shù)據(jù)搜集出的結(jié)果總是基于詞匯頻率高低,有時高頻的譯入語就不能作為語境的最佳選擇。這就需要譯者在進行大數(shù)據(jù)機器輔助翻譯時,將數(shù)據(jù)搜集結(jié)果結(jié)合語境,結(jié)合其他關(guān)鍵詞進行邏輯分析,以準確把握詞的意義。
再其次,譯者要結(jié)合石油科技語言特點和大數(shù)據(jù)時代的機器翻譯功能原理,主動進行多學科知識積累和儲備;尤其要對大數(shù)據(jù)的原理和功能進行學習掌握,以更有效發(fā)揮其功效。
最后,大數(shù)據(jù)時代的到來,要求譯者必須和計算機、統(tǒng)計學科領域的學者進行密切合作,以開發(fā)出適合特定領域翻譯特點的翻譯軟件和應用程序;對于石油科技英語而言,就要研發(fā)出特定的石油科技翻譯軟件和應用程序,以推進石油科技英語翻譯的高效化和智能化。
四、結(jié)語
綜上所述,大數(shù)據(jù)時代的到來,為石油科技等領域的翻譯打開了一扇門。大數(shù)據(jù)的強大功能將繼續(xù)推動翻譯界的變革。譯者要全面認識大數(shù)據(jù)時代石油科技翻的特點和機理,分析其不足,找準譯者職責新的定位點。既要借助大數(shù)據(jù)的功能又要發(fā)揮譯者翻譯時的主導性;同時,譯者要進行跨學科學習與合作,不斷研發(fā)適合石油科技翻譯的新軟件和應用程序,提升石油科技翻譯的高效化和智能化水平。
【參考文獻】
[1]Manyika J, Chui M, Brown B, Bughin J, Dobbs R, Roxburgh C, Byers AH. Big data: nextfrontierforinnovation ,competition,andproductivity.2011.http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation
[2]倪傳斌 郭鴻杰 趙勇. 論利用互聯(lián)網(wǎng)搜索引擎協(xié)助翻譯的科學性和可行性——兼與朱明炬先生商榷--[J]. 上??萍挤g,2003,04
[3]斯介生 宋大我 李揚. 大數(shù)據(jù)背景下的谷歌翻譯 統(tǒng)計研究[J] .統(tǒng)計研究,2016,05 .
[4] 鄒宇.石油英語的特點及翻譯[J].中國科技翻譯,2007,08.