国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

計算機輔助翻譯核心技術現(xiàn)狀簡析

2016-12-31 19:07廉勇
數(shù)碼世界 2016年11期
關鍵詞:語料語言學檢索

廉勇

承德石油高等專科學校

計算機輔助翻譯核心技術現(xiàn)狀簡析

廉勇

承德石油高等專科學校

本文通過對翻譯記憶技術實質(zhì)和現(xiàn)狀分析得出了阻礙其發(fā)展的三種矛盾和緩解方式,指出了計算機輔助翻譯未來發(fā)展的方向。

翻譯記憶 數(shù)據(jù)庫模型 引用模型 三種矛盾 緩解方式

計算機輔助翻譯系統(tǒng)的核心是“翻譯記憶”技術,它的發(fā)展及重大突破無疑會引領計算機輔助翻譯技術的革命,使其跨入新的時代。

1 當今翻譯記憶技術的實質(zhì)

“翻譯記憶”技術,是將已翻譯過的源語與目標語對照的文本存入記憶庫中,可再利用于翻譯新的源語文本。然而現(xiàn)實中的翻譯活動種類繁多,層次多樣,變化多端,重復性較少,只有在某些專門的領域中,才有一定的文本重復率,翻譯記憶功能才能有效發(fā)揮。由于語言有無限生成能力,即便是翻譯記憶庫的內(nèi)容再多,模糊搜索的能力再強,仍然無法保證在進行新的翻譯工作時總能從翻譯記憶庫中調(diào)取語料供譯者參考。

2 翻譯記憶技術無實質(zhì)性突破

通過對可獲得的計算機輔助翻譯系統(tǒng)軟件進行歷時與共時的研究,不難發(fā)現(xiàn),雖然現(xiàn)在的計算機輔助翻譯系統(tǒng)軟件對翻譯的輔助功能不斷增強,讓翻譯的分工越來越細,越來越精,團隊協(xié)作性也越來越強,較過去增加了諸如對齊、項目流程管理、質(zhì)量保證和術語提取等多種強大的功能組件與工具,CAT評價標準、翻譯項目科學化管理、校對系統(tǒng)等也有長足進步,但是其核心的翻譯記憶技術卻尚未取得突破性的進展,其檢索能力并沒有實現(xiàn)質(zhì)的飛躍,從而阻止了計算機輔助翻譯技術實現(xiàn)革命性的突破。以下筆者結合蘇明陽的觀點和翻譯記憶技術發(fā)展的現(xiàn)狀對這方面進行了簡析(蘇明陽:2007)。

3 翻譯記憶數(shù)據(jù)存儲的兩種模型

“引用模型”和“數(shù)據(jù)庫模型”的翻譯記憶研究沒有實質(zhì)性進展?,F(xiàn)代研究表明,兩種模型各有優(yōu)勢和不足。它們各自的不足中,有的擁有一定的互補性,如原文和譯文的完整性在數(shù)據(jù)庫模型下被打破并拆散,而在引用模型下文本的完整性卻可以得到留存;而有的缺憾則是兩種模型都無法解決的。如在對語塊或亞句段單位的檢索中,數(shù)據(jù)庫模型下的翻譯記憶系統(tǒng)是以句段為檢索單位的,檢索無法深入到句段以下的層次如亞句段單位,尤其是在漢英互譯中,由于英語和漢語隸屬于截然不同的語系(英語屬于印歐語系,漢語屬于漢藏語系),英語注重形合,漢語注重意合,在譯文中往往英語的一句話會被譯成多句漢語,而漢語的一個短語或成語也會被譯成一句或多句英語。而引用翻譯記憶數(shù)據(jù)存儲方式下檢索雖不受翻譯單元的局限,產(chǎn)生的無用信息卻相對較多(Gow 2003:38),從而大大降低了翻譯的效率。兩者都沒有在深層檢索上實現(xiàn)實質(zhì)性突破。

4 以語言學為突破口的嘗試

雖然研究人員試圖以語言學為突破口,通過增強語言檢索技術來發(fā)展第二代翻譯記憶技術,從而實現(xiàn)計算機輔助翻譯技術的實質(zhì)性突破,但是因為以下兩個原因,翻譯記憶數(shù)據(jù)在數(shù)據(jù)庫中仍然僵硬死板,未得到充分而有效的利用,從而限制了對翻譯記憶從廣度和深度的多角度靈活應用:其一,以語言學為突破口的檢索技術提升極其依賴特定語言的語言學知識與資源,從而建庫難度極大;其二,當前的翻譯記憶語料絕大部分沒有語言學上的標記,TMX作為翻譯記憶數(shù)據(jù)儲存交換標準,雖是以數(shù)據(jù)庫模型為基礎,但它也未針對此方面的問題進行擴展或規(guī)定。

5 翻譯記憶技術發(fā)展面臨的三種矛盾與緩解方式

通過以上的分析不難得出翻譯記憶的發(fā)展因語言的重復而奏效與語言無限生成之間的矛盾,兩種翻譯記憶數(shù)據(jù)存儲模型雖然功能互補但卻無法完全兼容的矛盾以及記憶數(shù)據(jù)的僵硬死板與語言靈活多變之間的矛盾,這三種矛盾未能有效解決是構成計算機輔助翻譯技術未取得突破性、革命性進展的的主因。所以,計算機輔助翻譯技術的發(fā)展必然要盡可能克服這三種矛盾且另辟蹊徑:

(1)翻譯記憶語料資源的“中央”化趨勢與分布式云端翻譯記憶庫和術語庫的產(chǎn)生密切相關,這兩種趨勢的形成與中央服務器的超大型數(shù)據(jù)庫的建立,知識產(chǎn)權的保護,分布式技術以及云計算技術的發(fā)展息息相關,在一定程度上會緩解第一個矛盾,使得個人應用翻譯記憶庫時不再為“無限生成的語言”發(fā)愁,因為中央數(shù)據(jù)庫已經(jīng)最大限度的通過“大數(shù)據(jù)”涵蓋了“無限生成的語言”并且通過“云端”與用戶互動共享(通過協(xié)議,用戶的優(yōu)質(zhì)語言素材也可隨時通過“云端”被中央數(shù)據(jù)庫吸納以供其他用戶參考使用)。

(2)隨著人工智能和云計算技術的突飛猛進,深層檢索分析技術、語音智能識別技術等,自然使得翻譯記憶向開發(fā)翻譯記憶的語料深層檢索和翻譯記憶庫從筆譯服務走向口譯服務發(fā)展,使得計算機輔助翻譯系統(tǒng)向著智能化與自適應方向發(fā)展,在一定程度上會緩解第二個矛盾,使研究人員將翻譯記憶技術研究的突破口從語言學轉向人工智能,讓人工智能技術的深入和普及帶動兩種翻譯記憶數(shù)據(jù)存儲模型的自我完善和突破,從而推動新模型的產(chǎn)生和CAT軟件的全方面智能化提升。

(3)MT與CAT歷時與共時的承前啟后、相互獨立、相輔相成的關系自然也決定了機器翻譯與翻譯記憶的共時性發(fā)展趨勢,高質(zhì)量的并可作為語料庫的翻譯記憶系統(tǒng)自然也可以應用于基于統(tǒng)計與實例的機器翻譯系統(tǒng),所以第三個矛盾也會在一定程度上得到緩解,因為機器翻譯相對僵硬死板,而計算機輔助翻譯因為以人為主體所以靈活多變,再加上人工智能和云計算技術的突飛猛進趨勢更使緩解這一矛盾如虎添翼。

[1]象群網(wǎng)論壇 http://www.xiangqun.net/forum

[2]蘇明陽. 2007.翻譯記憶系統(tǒng)的現(xiàn)狀及其啟示. 外語研究

[3]Gow, Francie. 2003. Metrics for Evaluating Translation Memory Software[D]. University of Ottawa, 34-38

本文系2015年承德市科學技術研究與發(fā)展計劃項目《基于Trados翻譯平臺的承德市旅游文化翻譯項目集約增效管理研究》的部分研究成果,項目編號:20153020。

廉勇(1980-),承德石油高等專科學校英語教師,中國科學技術大學碩士研究生,從事英語翻譯、教學與研究工作。

猜你喜歡
語料語言學檢索
面向低資源神經(jīng)機器翻譯的回譯方法
體認社會語言學芻議
《復制性研究在應用語言學中的實踐》評介
瑞典專利數(shù)據(jù)庫的檢索技巧
在IEEE 數(shù)據(jù)庫中檢索的一點經(jīng)驗
一種基于Python的音樂檢索方法的研究
瀕危語言與漢語平行語料庫動態(tài)構建技術研究
書訊《百年中國語言學思想史》出版
國內(nèi)外語用學實證研究比較:語料類型與收集方法
社會語言學名詞