国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

日本機器翻譯產(chǎn)業(yè)發(fā)展模式對我國的啟示

2018-04-01 11:14:19米彥軍張琳婧
生產(chǎn)力研究 2018年6期
關(guān)鍵詞:詞序專利日本

米彥軍,張琳婧

(山西大學 外國語學院,山西 太原 030006)

一、引言

自從20世紀40年代出現(xiàn)計算機以來,就開始研發(fā)對世界經(jīng)濟具有劃時代意義的機器翻譯的技術(shù),這堪稱是與計算相媲美的一次產(chǎn)業(yè)革命。而今在全球化日趨加深,特別是日本社會少子老齡化問題越來越嚴重這一社會背景下,由于人口減少導致日本產(chǎn)業(yè)對國外的依賴程度越來越大。為了應(yīng)對這一嚴峻形勢,人們對通過機器翻譯這一新型生產(chǎn)力,提高跨過商務(wù)效率的期待越來越高。但是,迄今為止,由于受到種種限制,機器翻譯沒有得到廣泛應(yīng)用。而最近圍繞機器翻譯的環(huán)境及以做翻譯為生的人們對機器翻譯的看法也發(fā)生了變化。在這一過程中,日本的機器翻譯產(chǎn)業(yè)不斷發(fā)展壯大,走到了世界前列。另方面,隨著中國加入WTO、全球經(jīng)濟一體化的不斷加深,“一帶一路”戰(zhàn)略構(gòu)想逐步實施,對外政治、外交、經(jīng)濟、文化等領(lǐng)域的交流不斷深入,對作為與外國交流的橋梁的翻譯的需求越來越大。然而,翻譯服務(wù)產(chǎn)業(yè)在我國起步晚,改革開放初期人工翻譯才開始走上正軌,20世紀90年代,隨著IT業(yè)的發(fā)展機器翻譯才開始萌芽,時至今日發(fā)展很不成熟。他山之石可以攻玉,同屬儒家文化圈的日本機器翻譯產(chǎn)業(yè)的發(fā)展模式對我國有著重要的借鑒意義。

二、日本機械翻譯產(chǎn)業(yè)的技術(shù)革新歷程

早在計算機誕生之初,人們就開始著手研究機器翻譯問題了。就當時的翻譯技術(shù)而言,主要采取了直接翻譯單詞方式,亦即將翻譯對象語言的單詞切換為目的語言的單詞,進而重新排列為符合目的語言的詞序。之后,隨著喬姆斯基等對語法理論研究的加深,語法轉(zhuǎn)換方式成為機器翻譯產(chǎn)業(yè)的主流,亦即根據(jù)語法從句式角度解析作為翻譯對象的語言,依據(jù)對譯詞典、翻譯規(guī)則將其轉(zhuǎn)換為目的語言的句式結(jié)構(gòu),之后形成目的語言的句子。但是,如果使用這一方式,每一對翻譯語言都需要對譯詞典、翻譯規(guī)則,要做到多語言翻譯,需要準備與語言對的組合數(shù)量相應(yīng)的海量知識。為了解決這一問題,需要采取中間語言方式,亦即設(shè)定虛構(gòu)的中間語言,通過句式結(jié)構(gòu)將中間語言內(nèi)容翻譯成目的語言。這樣一來,需要與語言對組合相應(yīng)數(shù)量的詞典、翻譯規(guī)則。只要準備好翻譯對象語言→中間語言的詞典、規(guī)則及中間語言→目的語言的詞典、規(guī)則足矣。

就最初的翻譯方式而言,基本上采用了由能夠理解多種語言的翻譯人員、熟悉語言結(jié)構(gòu)的專家來人工編纂詞典、制定翻譯規(guī)則的規(guī)則基準翻譯方式,故需要花費大量的人力、時間。另外,因翻譯對象領(lǐng)域和文體不同,如果不修改部分詞典、翻譯規(guī)則,很難充分提高翻譯性能,因此增加了成本。到了20世紀80年代后半期,發(fā)明了靈活應(yīng)用過去翻譯的對譯數(shù)據(jù)的翻譯技術(shù)。開展國際業(yè)務(wù)的企業(yè)已經(jīng)積累了大量對譯數(shù)據(jù),內(nèi)容是過去翻譯過的專利申請、操作手冊等,因此,出現(xiàn)了再利用這些資源的傾向。其代表性的方法是統(tǒng)計翻譯技術(shù)。在統(tǒng)計翻譯中,準備了大量的翻譯對象語言目的語的句對。通過這一對譯數(shù)據(jù)庫,將單詞翻譯成哪個單詞、語序怎樣變化,共振的單詞是哪個等作為統(tǒng)計信息來計算,輸出概率最高的翻譯結(jié)果。當初,以單詞為單位的翻譯是主流,而今向運用結(jié)構(gòu)性特征的以短語、句式結(jié)構(gòu)為單位的統(tǒng)計翻譯轉(zhuǎn)變。另外,最近也有人提倡使用深度神經(jīng)網(wǎng)絡(luò)翻譯方法的。

如上所述,近年來,在機械翻譯技術(shù)上發(fā)生了模式轉(zhuǎn)換,但是統(tǒng)計翻譯方式并非在任何語言對中都占優(yōu)勢。如在詞序、詞源等相近的英語和法語語言對中,統(tǒng)計翻譯方式實現(xiàn)了優(yōu)于規(guī)則基準翻譯方式的性能,成為主流。而在詞序、詞源等相近的日語和英語語言對中,在翻譯過程中,詞序和結(jié)構(gòu)會發(fā)生大幅變更,因此如果使用僅能在計算量上進行有限的詞序操作的傳統(tǒng)的統(tǒng)計翻譯方法就不能體現(xiàn)充分的翻譯性能,因此,主流是規(guī)則基準翻譯方式。

但是,近年來發(fā)明了針對日語和英語等詞序迥異的語言對也能實現(xiàn)高性能的統(tǒng)計翻譯方法。比如,有人提出了在將英語翻譯成日語之際,在把英語替換為日語詞序之后將日語詞序的英語逐個詞式地譯成日語的方法。按照這一方法,在專利領(lǐng)域的英日翻譯中 ,在歷史上首次實現(xiàn)了優(yōu)于規(guī)則基準翻譯方式的翻譯質(zhì)量。

三、翻譯產(chǎn)業(yè)對機器翻譯的期待

機器翻譯的技術(shù)進步使得最有希望使用機器翻譯直譯的翻譯產(chǎn)業(yè)及以翻譯為生計者的意識發(fā)生了變化。近幾年,隨著將翻譯工具引進翻譯過程,翻譯產(chǎn)業(yè)發(fā)生了巨變。具體來講,就是對過去翻譯過的大量的數(shù)據(jù)的有效利用。在翻譯與過去翻譯過的領(lǐng)域類似的句子時,過去翻譯的資料就可以作為參考。通過翻譯工具計算今后要翻譯的句子和過去翻譯過的句子的類似性,如果發(fā)現(xiàn)了類似程度在某個閾值以上的翻譯句,就通過一面借用、參照該翻譯句對的一部分,一面翻譯新的句子來實現(xiàn)翻譯的效率化和表述的統(tǒng)一,將這一過去的翻譯經(jīng)歷稱作翻譯記憶功能。就向這樣的翻譯進程過渡而言,如跨國企業(yè)的操作手冊等,假如過去已經(jīng)擁有大量的翻譯資料的話,要求訂購翻譯業(yè)務(wù)的企業(yè)方提供這一對譯數(shù)據(jù),通過翻譯記憶功能進行翻譯,這一方式頻繁進行,給翻譯產(chǎn)業(yè)的業(yè)務(wù)訂購形態(tài)帶來了巨大變化。因此,得到訂單的翻譯公司及譯員不管情愿與否都要使用具有翻譯記憶功能的翻譯工具。眾所周知,應(yīng)用翻譯記憶功能比全部從頭開始翻譯效率更高。這導致訂購翻譯服務(wù)一方和翻頁公司積極引進翻譯記憶功能。

但是,如果通過上述翻譯記憶功能不能發(fā)現(xiàn)一定程度以上的對譯數(shù)據(jù),需要從頭翻譯。因此,針對這些句子以翻譯的效率化為目的靈活運用機器翻譯技術(shù)受到矚目。在翻譯功能已經(jīng)具備的情況下,通過將過去的翻譯履歷應(yīng)用到統(tǒng)計翻譯上就能得到反映了過去的翻譯數(shù)據(jù)的翻譯傾向的翻譯結(jié)果。再有,最近統(tǒng)計翻譯技術(shù)質(zhì)量不斷改善也對此進一步起到了促進作用。

在對將機器翻譯技術(shù)引進翻譯過程的期待高漲的情況下,翻譯產(chǎn)業(yè)通過就機器翻譯技術(shù)進行演講、小組討論,大幅度增加了提供信息的機會。比如日本最大的翻譯產(chǎn)業(yè)團體日本翻譯聯(lián)盟在每年召開一次的翻譯大會上,召開了數(shù)個有關(guān)機器翻譯的會議,會場聽眾爆滿。另外,在該聯(lián)盟的講座上,選機器翻譯作主題,吸引了諸多聽眾。另外,負責產(chǎn)品及服務(wù)說明的專家團體翻譯技術(shù)交流協(xié)會在其主辦的TC學術(shù)研討會上舉辦了數(shù)個有關(guān)機器翻譯應(yīng)用方法的分會。在與機器翻譯產(chǎn)業(yè)相關(guān)的團體亞太機器翻譯協(xié)會主辦的機器翻譯節(jié)上,召開了日本翻譯聯(lián)盟、翻譯技術(shù)交流協(xié)會及機器翻譯協(xié)會分別參加的小組討論會。在日本國外,設(shè)立了會員制組織TAUS,目的是共享提高機器翻譯的應(yīng)用方法、應(yīng)用工具和翻譯數(shù)據(jù),主要的跨國企業(yè)享受會員待遇??梢?,日本社會對機器翻譯產(chǎn)業(yè)的關(guān)注遠遠高于以前。

四、日本機器翻譯專利的現(xiàn)狀及課題

在日本,作為專利文書的翻譯需求而言,大致分為兩類:

(一)為了確認申請的專利的內(nèi)容而進行的翻譯

這類翻譯的主要目的是掌握專利的申請內(nèi)容,因此,只要能夠明白內(nèi)容,多多少少有些翻譯失誤也是可以忍受的。在這個意義上講,就確認申請的專利內(nèi)容的翻譯的用途而言,可以說機器翻譯已經(jīng)達到了靈活應(yīng)用的水準。

(二)日本人向外國申請專利而進行的翻譯

與上述第一種翻譯相比,在日本人向外國申請專利而進行的翻譯中,因為所翻譯的文章原封不動就成為專利的審查對象,因此在翻譯內(nèi)容的準確性、作為專利文書的表述是否合適等方面要求的翻譯質(zhì)量要高得多。因此,就使用機器翻譯而言,考慮到現(xiàn)在的技術(shù)水準,在實施機器翻譯前后,需要人工編輯作業(yè)(包括前期編輯及后期編輯)。

從機器翻譯這一觀點來看專利文章的翻譯,既有利也有弊。有利之處在于存在著大量的多語言數(shù)據(jù)。如上所述,如果是最近廣泛使用的統(tǒng)計翻譯技術(shù)的話,因事前能夠收集多少想翻譯的領(lǐng)域的對譯數(shù)據(jù)的數(shù)量的多寡,對這一領(lǐng)域的文本翻譯的翻譯質(zhì)量也有所不同。在這一點上,就專利文書而言,如果將同一專利向多數(shù)國家提交的話,用母語寫的專利明細應(yīng)該進行翻譯,進而其提交的專利在一定時期以后需要公開。向其他國家提交的同一專利可以通過專利網(wǎng)站信息進行檢索。因此,通過檢索向其他國家提交的大量的專利,使之成為用于學習的對譯數(shù)據(jù),很容易建立面向?qū)@臅慕y(tǒng)計翻譯體系。另外,有關(guān)專利的文章其目的是實現(xiàn)成功申請,因此其文章結(jié)構(gòu)以及表述相對明確,并有所限定。考慮到如果存在表述的多樣性,保證翻譯質(zhì)量會很困難這一機器翻譯的特點,可以說這是有利之處。另外,不僅僅限于專利文章,從其他觀點來看還有譯詞的統(tǒng)一問題。因為,在專利文章中,有必要明確記錄提案方法,如果句子中出現(xiàn)的術(shù)語是指同樣內(nèi)容的話,完全用同樣的表述方式翻譯是最理想的。就這一點而言,在機器翻譯中,對同一個詞使用相同翻譯的傾向很明顯。因此,其優(yōu)勢在于容易做到術(shù)語的統(tǒng)一。

另一方面,就專利中的句子而言,一般來講長句居多。其典型例子就是請求項的句式。句子過長的話,原封不動使用機器翻譯一個句子的話很難得到高質(zhì)量的翻譯結(jié)果。因此,通常來講,要分割句子等,采取各種各樣的事前處理、事后處理措施。再有,如日英翻譯等,在詞序、句子結(jié)構(gòu)迥異的語言間進行翻譯的話,如句子長,次序變換操作就變得困難,翻譯質(zhì)量就會下降。就這一問題而言,如上所述,有人提議使用將詞序作為翻譯的事前處理來重新排列的統(tǒng)計翻譯技術(shù),結(jié)果質(zhì)量逐步改善。另外,基于專利的性質(zhì),主要是關(guān)于新技術(shù)的內(nèi)容,新詞頻繁出現(xiàn)。因此,有必要進行事先發(fā)現(xiàn)生詞,登記其譯詞的處理。不過,如上所述,專利是對譯數(shù)據(jù)的寶庫,通過采用針對大量的對譯數(shù)據(jù)發(fā)現(xiàn)對譯單詞對的辦法,在某種程度上可以事前登記譯詞。向多數(shù)國家提交的專利因為相同內(nèi)容的文書要用多種語言進行翻譯,使用統(tǒng)計翻譯的話具有作為學習數(shù)據(jù)來靈活使用的優(yōu)勢。但是,按照現(xiàn)在的統(tǒng)計翻譯技術(shù)水平,有必要作為學習數(shù)據(jù)賦予其句子對應(yīng)關(guān)系。實際上,以多種語言提交的專利并未賦予其句子對應(yīng)信息,因此,有必要事先讓句子對應(yīng)。另外,在很多情況下,所提交申請的專利的結(jié)構(gòu)因申請國而有所不同,有必要認定適應(yīng)申請國的結(jié)構(gòu)性對應(yīng)關(guān)系。對此,提出了幾個以專利文為對象的對譯句對的自動抽出方法。

由上述可知,隨著翻譯技術(shù)的主流由規(guī)則基準翻譯方式逐漸向統(tǒng)計翻譯方式以及二者的混合模式變化,可以說能夠收集、靈活應(yīng)用大量的對譯數(shù)據(jù)的專利翻譯包括其實用性在內(nèi),對機器翻譯來說是個極為有希望的領(lǐng)域。另外,能夠靈活運用過去的翻譯數(shù)據(jù)意味著和靈活應(yīng)用翻譯記憶功能的翻譯支持工具合作的可能性很高。在歐美各國,因為所要翻譯的語言間的結(jié)構(gòu)相近,與英日翻譯那樣結(jié)構(gòu)較遠的語言間的機器翻譯相比,質(zhì)量要高得多。因此,廣泛地將機器翻譯引進了翻譯過程中。在英日翻譯上,隨著最近翻譯性能迅速提高,機器翻譯開始靈活應(yīng)用到翻譯過程當中。然而,因為英日翻譯遠未達到充分的翻譯性能,因此要將其引進實務(wù)性翻譯過程需要進一步的技術(shù)革新。另外,即便譯文質(zhì)量不夠充分,為了充分利用機器翻譯結(jié)果,現(xiàn)階段有必要研究業(yè)務(wù)流的最佳化。

五、日本機器翻譯產(chǎn)業(yè)發(fā)展模式對我國的啟示

2008年和2010年,中國成功舉辦奧運會和世博會,2020年又將舉辦冬奧會。近兩年作為國策,提出了“一帶一路”戰(zhàn)略,中國“走出去”的步伐更加堅定,這些給翻譯服務(wù)產(chǎn)業(yè)帶來了前所未有的重大機遇,同時倒逼翻譯服務(wù)產(chǎn)業(yè)經(jīng)歷大的變革,增加機器翻譯的比例。但是,我國國內(nèi)機器翻譯產(chǎn)業(yè)無論是在制度上、管理上還是在人才培養(yǎng)等方面,仍存在不少亟待解決的問題。以下在對中國的機器翻譯產(chǎn)業(yè)現(xiàn)狀、成績與不足進行概述的基礎(chǔ)上,談一下如何揚長避短,借鑒日本機器翻譯產(chǎn)業(yè)發(fā)展模式。

(一)中國機器翻譯產(chǎn)業(yè)的現(xiàn)狀

據(jù)研究中國翻譯產(chǎn)業(yè)的權(quán)威數(shù)據(jù)講,截止2010年1月,全國共有從事翻譯的企業(yè)一萬五千多家,企業(yè)注冊數(shù)量和注冊資金與以前相比大幅增加。這些數(shù)據(jù)都說明翻譯服務(wù)外包產(chǎn)業(yè)正在快速成長。為了應(yīng)對日益增加的翻譯業(yè)務(wù),不斷開發(fā)機器翻譯下相關(guān)產(chǎn)品?,F(xiàn)階段,市場上盛行的翻譯服務(wù)產(chǎn)品有谷歌翻譯等,此外,中國國內(nèi)企業(yè)也不斷研發(fā)出一系列新的翻譯軟件系統(tǒng),努力將翻譯記憶功能和機器翻譯技術(shù)進行融合,以達到高效率和高質(zhì)量翻譯的目的。機器翻譯技術(shù)雖然還不成熟,但是正在成為翻譯產(chǎn)業(yè)的新的發(fā)展方向。

(二)中國機器翻譯產(chǎn)業(yè)的成績

不斷增加的翻譯服務(wù)需求使得我國高等院校的專業(yè)翻譯教學成為一門獨立的學科,從外語教學中分離出來。而且,為了培養(yǎng)高層次、應(yīng)用型、專業(yè)化的翻譯人才。為數(shù)眾多的專門從事翻譯教學的院校已經(jīng)開始尋找實踐基地和翻譯項目。具體來講,近年來,廣東外語外貿(mào)大學和天津外國語大學開始摸索產(chǎn)學研相結(jié)合的發(fā)展模式,如廣外、天津外國語大學分別與中國多語工程技術(shù)研究中心共同創(chuàng)建的廣外多語港、天外多語港項目就是其典型案例。

不僅如此,中國正逐步完善翻譯人才培養(yǎng)及評價體系。比如全國翻譯資格證已經(jīng)列入國家職業(yè)資格證書名單,英、法、日、俄、德、西、阿等7個語種的二、三級口譯和筆譯共29種58個科目考試已在全國范圍內(nèi)開展起來。針對從事翻譯教學的教師的正高、副高職稱考評辦法也已經(jīng)制定出來,必定會促進翻譯教學更上一層樓。翻譯資格考試在社會上的影響力越來越大,考生人數(shù)逐年增加。這一翻譯證書考試為科學、客觀、公正地評價翻譯專業(yè)人才能力和水平,規(guī)范翻譯產(chǎn)業(yè)的發(fā)展,加強行業(yè)管理起著重要作用。

(三)中國機器翻譯產(chǎn)業(yè)的不足之處及如何借鑒日本機器翻譯產(chǎn)業(yè)發(fā)展模式

通過對中日兩國機器翻譯產(chǎn)業(yè)的對比可以發(fā)現(xiàn),日本在翻譯人才培養(yǎng)、產(chǎn)學研聯(lián)合、翻譯資格證書考試及人才培養(yǎng)方面不如中國做得到位。究其原因,中國在翻譯服務(wù)產(chǎn)業(yè)方面的強勢源于中國人口眾多,工資水平低,機器翻譯產(chǎn)業(yè)的技術(shù)水平尚未達到令人滿意的程度,因此,非常重視人工翻譯,而在機器翻譯方面投入的人力物力就不如人工翻譯。而日本的情況則有所不同,日本是高度發(fā)達的資本主義國家,工資水平很高,加之老齡少子化現(xiàn)象嚴重更進一步推高了人工翻譯成本,因此,日本不斷加大機器翻譯的研發(fā)力度,在日語與英文、中文等世界各大語種之間的互譯上精益求精,翻譯結(jié)果已經(jīng)相當令人滿意,在這方面我國需要向日本學習。另外,日本從事機器翻譯產(chǎn)業(yè)的公司眾多,還成立了相關(guān)協(xié)會,廣泛應(yīng)用在專利翻譯等領(lǐng)域,促進了經(jīng)濟發(fā)展和科學技術(shù)進步,在世界上處于先進水平,其發(fā)展模式對中國的機器翻譯產(chǎn)業(yè)有著重要的借鑒意義。

六、結(jié)束語

以上通過對日本機器翻譯產(chǎn)業(yè)的歷史進行回顧可以發(fā)現(xiàn),在技術(shù)層面、翻譯產(chǎn)業(yè)的意識層面以及國外對機器翻譯的利用狀況、圍繞日本機器翻譯產(chǎn)業(yè)的環(huán)境發(fā)生了重大變化。近年來,由于少子老齡化導致的人工費用高漲,日本社會對機器翻譯產(chǎn)業(yè)的期望越來越大,提供機器翻譯技術(shù)一方和使用機器翻譯一方進一步合作,一面參考國外案例一面提供解決方案,取得了良好的效果。中國逐漸步入中等收入國家,老齡化日趨加劇,人工翻譯費用高漲,發(fā)展機器翻譯產(chǎn)業(yè)已經(jīng)是大勢所趨,結(jié)合中國的國情,在技術(shù)上、企業(yè)管理模式上借鑒同樣使用漢字的日本的機器翻譯產(chǎn)業(yè)發(fā)展模式是一條捷徑。

猜你喜歡
詞序專利日本
專利
水運工程(2022年7期)2022-07-29 08:37:38
日本元旦是新年
華人時刊(2022年3期)2022-04-26 14:29:08
探尋日本
中華手工(2021年2期)2021-09-15 02:21:08
修改病句的妙招
孩子(2019年12期)2019-12-27 06:08:44
發(fā)明與專利
傳感器世界(2019年4期)2019-06-26 09:58:44
《黃金時代》日本版
電影(2019年3期)2019-04-04 11:57:16
漢語搭配信息對詞匯識別的影響
俄漢語定語對比
影響詞序的“普通重音”規(guī)則
江西教育C(2015年4期)2015-05-25 21:11:27
去日本怎么玩?它告訴你
定边县| 新郑市| 鄂温| 当雄县| 洪江市| 黑河市| 大竹县| 龙海市| 柞水县| 东宁县| 益阳市| 麦盖提县| 敦化市| 双流县| 宜兰市| 北票市| 峡江县| 建水县| 延长县| 榆社县| 正定县| 苏尼特右旗| 明溪县| 深泽县| 金阳县| 天门市| 邢台县| 辰溪县| 蛟河市| 丰顺县| 汉沽区| 晴隆县| 灌云县| 防城港市| 凤山市| 青阳县| 湘潭市| 平果县| 左贡县| 定日县| 荥经县|