郭明陽(yáng), 張曉玲, 唐會(huì)玲, 孟慶端,任龍波
(河南科技大學(xué) a.外國(guó)語(yǔ)學(xué)院;b.信息工程學(xué)院;c.電氣工程學(xué)院, 河南 洛陽(yáng) 471023)
1 人工智能在機(jī)器翻譯中應(yīng)用的研究意義
人工智能(artificial intelligence,AI)是指研究、開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門(mén)新的技術(shù)科學(xué)。隨著計(jì)算機(jī)技術(shù)與信息技術(shù)的快速發(fā)展,人工智能對(duì)機(jī)器翻譯進(jìn)行了整體闡述,主要包括自然語(yǔ)言處理、機(jī)器人學(xué)和知識(shí)系統(tǒng)等方面。機(jī)器翻譯是自然語(yǔ)言處理技術(shù)的一個(gè)分支,注重利用計(jì)算機(jī)技術(shù)實(shí)現(xiàn)一種人類語(yǔ)言(源語(yǔ)言)到另外一種人類語(yǔ)言(目標(biāo)語(yǔ)言)的自動(dòng)翻譯或轉(zhuǎn)換。例如,借助于人工智能技術(shù),翻譯者和技術(shù)人員可以首先對(duì)機(jī)器的整體翻譯方案開(kāi)展均勻抽樣;然后采用蒙特卡羅等方法模擬具體文本的翻譯過(guò)程,計(jì)算每種排布方式下的機(jī)器翻譯效率,從而生成大數(shù)據(jù)翻譯樣本供人工智能算法學(xué)習(xí),進(jìn)而采用人工神經(jīng)網(wǎng)絡(luò)高效地?cái)M合出翻譯架構(gòu)排布與機(jī)器翻譯效率之間的關(guān)系;最后結(jié)合遺傳算法尋找機(jī)器翻譯的最優(yōu)排布方式。人工智能技術(shù)已經(jīng)應(yīng)用于以谷歌翻譯、百度翻譯為代表的網(wǎng)絡(luò)即時(shí)翻譯和以譯星、雅信譯霸為代表的專業(yè)翻譯系統(tǒng)中。
人工智能技術(shù)雖然尚處于發(fā)展階段,但其應(yīng)用前景是非常明晰的。2017年7月,國(guó)務(wù)院發(fā)布了《新一代人工智能發(fā)展規(guī)劃》,人工智能已經(jīng)成為重要的國(guó)家戰(zhàn)略。各大經(jīng)濟(jì)體均處于同一起跑線上,對(duì)人工智能的研究和應(yīng)用均處于投入探索階段[1]。結(jié)合中國(guó)國(guó)際貿(mào)易高端人才不足、知識(shí)經(jīng)濟(jì)生產(chǎn)力發(fā)展亟待提速等問(wèn)題,在新經(jīng)濟(jì)時(shí)代人工智能技術(shù)給了中國(guó)難得的趕超機(jī)會(huì)。翻譯能力的核心在于與翻譯過(guò)程中的各方保持積極的活動(dòng)關(guān)系,并生產(chǎn)出符合客戶要求的譯文[2]。人工智能以及機(jī)器翻譯的各項(xiàng)技術(shù)加速發(fā)展,正在不斷地提升人類對(duì)于各種語(yǔ)言信息的處理能力,彌補(bǔ)人工翻譯在速度和成本方面的不足。智能語(yǔ)音、深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯等技術(shù)越來(lái)越成熟,人工智能給許多行業(yè)帶來(lái)了重要影響和挑戰(zhàn)[3]。
伴隨著人工智能的進(jìn)一步發(fā)展,機(jī)器翻譯能夠更好地滿足大多數(shù)一般性翻譯需求,但面對(duì)專業(yè)、多元、細(xì)致并蘊(yùn)含人文情感的復(fù)雜溝通翻譯任務(wù),機(jī)器翻譯目前仍然難以替代人工翻譯。當(dāng)前人工智能發(fā)展中顯現(xiàn)出互為鏡像、互為嵌入和互為信息的人機(jī)關(guān)系趨勢(shì)[4]。因此,目前機(jī)器翻譯會(huì)和人工譯員一起協(xié)同工作。但是,在這種協(xié)作翻譯的關(guān)系中,以前簡(jiǎn)單的“機(jī)器輔助翻譯”模式已經(jīng)越來(lái)越多地被人工智能交互翻譯(artificial intelligence interactive translation,AIIT)所取代,這是翻譯技術(shù)能力的進(jìn)步[5]。機(jī)器翻譯和計(jì)算機(jī)輔助翻譯的很多工作,也將會(huì)由日益完善的人工智能交互翻譯來(lái)完成。
人工智能在機(jī)器翻譯中的廣泛應(yīng)用程度與人工智能技術(shù)的進(jìn)步和機(jī)器翻譯功能的提升有關(guān),這一點(diǎn)在專業(yè)翻譯中體現(xiàn)得尤為明顯。嚴(yán)格意義上來(lái)講,計(jì)算機(jī)網(wǎng)絡(luò)信息本身是一個(gè)龐大的數(shù)據(jù)信息庫(kù),而這個(gè)數(shù)據(jù)庫(kù)又是由海量的子數(shù)據(jù)庫(kù)構(gòu)成的[6]。有些翻譯語(yǔ)料所涉及的領(lǐng)域很多,技術(shù)性和專業(yè)性都很強(qiáng),而且語(yǔ)料內(nèi)容信息豐富,因此文本內(nèi)容會(huì)經(jīng)常出現(xiàn)重復(fù)現(xiàn)象。根據(jù)相關(guān)統(tǒng)計(jì)數(shù)據(jù)顯示,有些需要機(jī)器翻譯的技術(shù)資料相關(guān)內(nèi)容重復(fù)率能達(dá)到40%以上。針對(duì)這種情況,人工智能可以依據(jù)機(jī)器翻譯的基本原理——翻譯記憶自動(dòng)對(duì)重現(xiàn)的語(yǔ)料成分進(jìn)行翻譯,例如對(duì)前文翻譯過(guò)的語(yǔ)句或者語(yǔ)段部分進(jìn)行快速比對(duì),然后高速呈現(xiàn)翻譯結(jié)果,這樣就極大地提高了機(jī)器翻譯的工作效率,并且能夠保證機(jī)器前后翻譯內(nèi)容具有一致性,從技術(shù)層面上保證了譯文具有更高的質(zhì)量。
出于提升翻譯效率和確保翻譯內(nèi)容一致性的考慮, 人工智能在機(jī)器翻譯的應(yīng)用系統(tǒng)中,通常會(huì)設(shè)置系統(tǒng)翻譯組件,例如翻譯記憶庫(kù)和術(shù)語(yǔ)管理組件。翻譯記憶庫(kù)主要是指人工智能在機(jī)器翻譯系統(tǒng)中所構(gòu)建的語(yǔ)料原文和翻譯內(nèi)容相對(duì)應(yīng)的等值語(yǔ)料庫(kù)。當(dāng)機(jī)器翻譯系統(tǒng)開(kāi)始進(jìn)行翻譯工作時(shí),人工智能會(huì)自動(dòng)對(duì)需要翻譯的文本資料在翻譯語(yǔ)料庫(kù)中進(jìn)行存儲(chǔ)和比對(duì),在整個(gè)翻譯過(guò)程中,人工智能通過(guò)對(duì)程序代碼進(jìn)行掃描,發(fā)現(xiàn)有相似或相近的翻譯內(nèi)容時(shí),人工智能系統(tǒng)會(huì)自動(dòng)將其與翻譯語(yǔ)料庫(kù)內(nèi)容進(jìn)行匹配,通過(guò)語(yǔ)境和語(yǔ)言使用系統(tǒng)進(jìn)行確認(rèn)后,就可以快速將最終翻譯結(jié)果呈現(xiàn)在用戶界面。隨著人工智能技術(shù)的不斷提升,能夠支持模糊匹配的機(jī)器翻譯系統(tǒng)也在不斷升級(jí),人工智能系統(tǒng)通過(guò)對(duì)算法的不斷改進(jìn),可以自動(dòng)設(shè)置語(yǔ)料原文和譯文之間的最小匹配值(如60%或者80%)。然后,通過(guò)模糊匹配程序搜索翻譯記憶庫(kù)中的語(yǔ)料,即便是對(duì)于那些不能實(shí)現(xiàn)完全匹配的句型,人工智能也可以通過(guò)機(jī)器翻譯達(dá)到相似的內(nèi)容確認(rèn),再通過(guò)語(yǔ)言使用系統(tǒng)或者人工譯員進(jìn)行確認(rèn),實(shí)現(xiàn)人工智能與人工譯員的互動(dòng)互助。目前,這樣的工作模式既能夠保證高水平的翻譯質(zhì)量,又能夠讓機(jī)器翻譯通過(guò)人工智能的自我學(xué)習(xí)程序提升翻譯的質(zhì)量和效率。
未來(lái),學(xué)習(xí)能力和數(shù)據(jù)處理能力更加強(qiáng)大的人工智能系統(tǒng)將幫助機(jī)器翻譯更好地完成工作?,F(xiàn)有的翻譯記憶庫(kù)通過(guò)人工智能的自我學(xué)習(xí)程序也可以不斷更新,并能夠自動(dòng)識(shí)別和存儲(chǔ)新語(yǔ)料。隨著翻譯記憶庫(kù)數(shù)據(jù)的不斷擴(kuò)大,在大數(shù)據(jù)技術(shù)的支持下,人工智能能夠使機(jī)器翻譯的工作效率不斷提升。通過(guò)網(wǎng)絡(luò)共享功能,人工智能可以通過(guò)對(duì)海量網(wǎng)絡(luò)翻譯數(shù)據(jù)進(jìn)行精確算法分析,從而提升人工智能的自我學(xué)習(xí)能力,使機(jī)器翻譯越來(lái)越接近人工翻譯的質(zhì)量。
進(jìn)入21世紀(jì)以來(lái),人工智能技術(shù)快速發(fā)展,應(yīng)用領(lǐng)域也越來(lái)越廣泛,尤其是專家系統(tǒng)技術(shù)、人工神經(jīng)網(wǎng)絡(luò)和智能決策支持系統(tǒng)在機(jī)器翻譯的研究和應(yīng)用中取得了顯著進(jìn)步。
3.1.1 專家系統(tǒng)技術(shù)在機(jī)器翻譯中的應(yīng)用
從近些年人工智能研究的成效來(lái)看,知識(shí)庫(kù)專家系統(tǒng)和知識(shí)工程成為人工智能研究領(lǐng)域最具有實(shí)踐意義的成果,并進(jìn)行了商業(yè)化運(yùn)作,經(jīng)濟(jì)效益初現(xiàn)。所謂專家系統(tǒng),是指一種基于知識(shí)的系統(tǒng),其實(shí)質(zhì)是使系統(tǒng)的構(gòu)造和運(yùn)行都基于控制對(duì)象和控制規(guī)律的各種專家知識(shí)的數(shù)據(jù)積累。這種人工智能的電腦程序構(gòu)建了一套具有某個(gè)專業(yè)領(lǐng)域?qū)<业闹R(shí)和經(jīng)驗(yàn)水平的集成系統(tǒng),并具備解決實(shí)際專業(yè)問(wèn)題的能力。發(fā)展專家系統(tǒng)的關(guān)鍵在于表達(dá)和運(yùn)用專家知識(shí),即來(lái)自人類專家的且已被證明能夠解決某領(lǐng)域內(nèi)典型問(wèn)題的有用的事實(shí)和過(guò)程[7]。隨著專家系統(tǒng)和翻譯大數(shù)據(jù)技術(shù)的不斷完善,人工智能可以根據(jù)多位翻譯專家分享的翻譯領(lǐng)域知識(shí)、工作經(jīng)驗(yàn)進(jìn)行有效地推理和判斷, 模擬翻譯專家決策的過(guò)程來(lái)解決那些翻譯實(shí)踐中遇到的各種復(fù)雜問(wèn)題。
(2)力學(xué)性能檢測(cè) 試件按照ASME IX卷要求進(jìn)行取樣和力學(xué)性能試驗(yàn),取樣位置如圖1所示,各項(xiàng)檢測(cè)結(jié)果如表6~表9所示。
專家系統(tǒng)技術(shù)在機(jī)器翻譯中的應(yīng)用主要基于翻譯專家的專業(yè)知識(shí)和實(shí)踐經(jīng)驗(yàn),采用知識(shí)表達(dá)翻譯技術(shù),建立翻譯模型和翻譯數(shù)據(jù)庫(kù),利用語(yǔ)言知識(shí)和以往的翻譯工作經(jīng)驗(yàn)進(jìn)行語(yǔ)義推理,制訂翻譯決策控制機(jī)制,為機(jī)器翻譯提供最優(yōu)控制以及決策支持等。翻譯專家系統(tǒng)的出現(xiàn),改變了過(guò)去傳統(tǒng)翻譯單純依靠字對(duì)字、詞對(duì)詞翻譯的落后局面,使知識(shí)模型與翻譯大數(shù)據(jù)進(jìn)行了有機(jī)整合,將知識(shí)信息處理技術(shù)與控制技術(shù)相結(jié)合,使機(jī)器翻譯的效率和準(zhǔn)確率都有了很大程度的提升。
3.1.2 人工神經(jīng)網(wǎng)絡(luò)在機(jī)器翻譯中的應(yīng)用
神經(jīng)網(wǎng)絡(luò)的信息處理是由神經(jīng)元之間的相互作用實(shí)現(xiàn)的:知識(shí)與信息的存儲(chǔ)主要表現(xiàn)為網(wǎng)絡(luò)元件互連間分布式的物理聯(lián)系[8]。近年來(lái),人工神經(jīng)網(wǎng)絡(luò)在機(jī)器翻譯中的應(yīng)用領(lǐng)域取得了很大的進(jìn)步,具體體現(xiàn)在機(jī)器翻譯算法、語(yǔ)言學(xué)習(xí)等方面,并在文字符號(hào)處理、語(yǔ)音識(shí)別、最優(yōu)計(jì)算、語(yǔ)言信息智能處理、翻譯模式識(shí)別等領(lǐng)域不斷取得進(jìn)展。例如谷歌公司的神經(jīng)機(jī)器翻譯(Google’s neural machine translation,GNMT)系統(tǒng),由帶有8個(gè)編碼器和8個(gè)解碼器的深度長(zhǎng)短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)組成,并采用了殘差連接對(duì)梯度、位置信息等進(jìn)行傳遞,在英-西、英-中和英-法等多個(gè)語(yǔ)對(duì)中,與之前的基于短語(yǔ)的機(jī)器翻譯(phrase-based machine translation,PBMT)系統(tǒng)相比,翻譯錯(cuò)誤率降低了60%,已經(jīng)與人類中級(jí)譯員的水平不相上下。
隨著中國(guó)“一帶一路”倡議的提出和逐步實(shí)施,客觀上沿途各國(guó)間的交流溝通有了更廣泛的需求,尤其是在語(yǔ)言轉(zhuǎn)換處理和商務(wù)信息交流方面為機(jī)器翻譯提供了廣泛的市場(chǎng)需要,也蘊(yùn)含著巨大的市場(chǎng)價(jià)值。隨著機(jī)器翻譯功能的不斷提升,在文化教育交流和商務(wù)洽談中需要使用機(jī)器翻譯功能的應(yīng)用場(chǎng)景也越來(lái)越多,互聯(lián)網(wǎng)上語(yǔ)言翻譯的市場(chǎng)需求也愈來(lái)愈大,要對(duì)機(jī)器翻譯系統(tǒng)進(jìn)行有效管理,提升機(jī)器翻譯的效率,保證翻譯的質(zhì)量就需要人工智能,尤其是人工神經(jīng)網(wǎng)絡(luò)。為了使機(jī)器翻譯的各項(xiàng)系統(tǒng)正常運(yùn)轉(zhuǎn)且能降低運(yùn)行成本,提高經(jīng)濟(jì)效益,就要不斷提升機(jī)器翻譯的自動(dòng)控制水平、語(yǔ)言信息快速處理能力和翻譯系統(tǒng)運(yùn)行管理水平。人工智能的自主學(xué)習(xí)和深度學(xué)習(xí)功能,為具有快速學(xué)習(xí)與自適應(yīng)能力的人工神經(jīng)網(wǎng)絡(luò)在系統(tǒng)控制方面提供了監(jiān)督與非監(jiān)督操練。人工神經(jīng)網(wǎng)絡(luò)在機(jī)器翻譯中的應(yīng)用包括練習(xí)語(yǔ)言輸入與輸出集合、調(diào)節(jié)神經(jīng)元加權(quán)系數(shù)、語(yǔ)言信息的分類與自組織,并為機(jī)器翻譯系統(tǒng)的高級(jí)控制奠定了堅(jiān)實(shí)的基礎(chǔ)。
在人工智能的控制下,機(jī)器翻譯能夠按照不同的數(shù)學(xué)建模方式,采用多元化的翻譯策略,根據(jù)不同的信息運(yùn)算和處理原理進(jìn)行實(shí)際運(yùn)作。例如,機(jī)器翻譯能夠自主研究不同語(yǔ)言符號(hào)的特征,構(gòu)建出準(zhǔn)確有效的翻譯算法,并且通過(guò)適時(shí)調(diào)節(jié)翻譯參數(shù)來(lái)確定不同的翻譯標(biāo)準(zhǔn),以適應(yīng)譯文的文化和語(yǔ)言特征,并能夠在人工神經(jīng)網(wǎng)絡(luò)的控制下,對(duì)于智能機(jī)器翻譯設(shè)備的實(shí)時(shí)運(yùn)行動(dòng)態(tài)和語(yǔ)言信號(hào)處理進(jìn)行有效地檢測(cè)、調(diào)節(jié)及故障診斷,進(jìn)而研制出具有高效自主學(xué)習(xí)能力、自主適應(yīng)功能和自主管理功能的創(chuàng)新性的智能自動(dòng)化控制系統(tǒng)。這一系統(tǒng)在機(jī)器翻譯設(shè)備上的有效應(yīng)用極大地提高了機(jī)器翻譯的效能。同時(shí),機(jī)器翻譯控制需要準(zhǔn)確的語(yǔ)言結(jié)構(gòu)仿真模型,以及準(zhǔn)確、靈活的信息處理系統(tǒng)。由于早期機(jī)器翻譯模式的非互聯(lián)性,機(jī)器翻譯的語(yǔ)料信息不能及時(shí)更新,機(jī)器翻譯的控制系統(tǒng)無(wú)法實(shí)現(xiàn)在線運(yùn)行和實(shí)時(shí)更新。而在新的人工神經(jīng)網(wǎng)絡(luò)語(yǔ)言信息翻譯處理模型中,由于采取動(dòng)態(tài)學(xué)習(xí)更新建模的方式,提升了翻譯模型的運(yùn)轉(zhuǎn)效率。并且這類機(jī)器翻譯產(chǎn)品在投放市場(chǎng)時(shí),能夠根據(jù)不同消費(fèi)群體的需要和物價(jià)承受能力,采用個(gè)性化、差異化的機(jī)器翻譯資源和硬件配置,更好地控制了硬件部分的花費(fèi),滿足了更多消費(fèi)者不同的翻譯需求。尤其是更新的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)策略搭載性能具有更強(qiáng)大的信息處理芯片,實(shí)現(xiàn)了真正意義上的神經(jīng)網(wǎng)絡(luò)運(yùn)算和人工智能控制,使機(jī)器翻譯產(chǎn)品的性能不斷提升。由此可以看出:帶有人工神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯產(chǎn)品,在未來(lái)的實(shí)際生活使用中能夠更加貼切地滿足個(gè)人用戶和個(gè)性化需求。同時(shí)智能化的機(jī)器翻譯系統(tǒng)預(yù)示出了人工智能語(yǔ)言學(xué)習(xí)模式的更新,提升了以往機(jī)器翻譯產(chǎn)品的運(yùn)算速度和翻譯質(zhì)量。這一嶄新的機(jī)器翻譯和語(yǔ)言學(xué)習(xí)模式的研發(fā),將會(huì)給不同文化背景和語(yǔ)言使用者帶來(lái)高效率、低花費(fèi)的應(yīng)用體驗(yàn)。
3.1.3 智能決策支持系統(tǒng)在機(jī)器翻譯中的應(yīng)用
伴隨著超級(jí)計(jì)算機(jī)運(yùn)算技術(shù)、網(wǎng)絡(luò)數(shù)據(jù)庫(kù)技術(shù)和物聯(lián)網(wǎng)技術(shù)的高速發(fā)展,智能決策支持系統(tǒng)在機(jī)器翻譯中也開(kāi)始了部分翻譯場(chǎng)景的應(yīng)用。網(wǎng)絡(luò)數(shù)據(jù)庫(kù)技術(shù)、云計(jì)算和深度學(xué)習(xí)使智能決策這一人工智能技術(shù)控制機(jī)器翻譯成為可能,尤其是分布式數(shù)據(jù)庫(kù)和網(wǎng)絡(luò)互聯(lián)計(jì)算技術(shù)的發(fā)展,更有利于將智能決策系統(tǒng)融入到機(jī)器翻譯智能化系統(tǒng)集成中,使得機(jī)器翻譯實(shí)現(xiàn)智能化。
智能決策支持系統(tǒng)整合了超級(jí)計(jì)算機(jī)技術(shù)、人工智能技術(shù)和管理科學(xué)的相關(guān)研究成果,是一種有利于提升機(jī)器翻譯效度和信度的創(chuàng)新性的信息管理技術(shù)。這項(xiàng)人工智能信息管理技術(shù)依托運(yùn)籌學(xué)、管理科學(xué)和控制論行為科學(xué)的最新研究成果,積極采用最新的計(jì)算機(jī)信息挖掘技術(shù),在處理半結(jié)構(gòu)化和非結(jié)構(gòu)化的翻譯決策問(wèn)題中成效顯著。在對(duì)譯文翻譯質(zhì)量的最終控制方面,智能決策支持系統(tǒng)能夠進(jìn)行有效的決策活動(dòng),為機(jī)器翻譯最終產(chǎn)品的呈現(xiàn)提供決策所需要的數(shù)據(jù)、信息和資料,并能夠明確決策目標(biāo)。在針對(duì)不同機(jī)器翻譯問(wèn)題時(shí),智能決策支持系統(tǒng)也能夠?qū)τ龅降姆g問(wèn)題進(jìn)行快速地甄別和認(rèn)知,并建立和整改決策計(jì)算模型,提供盡可能多的翻譯備選譯文。智能決策支持系統(tǒng)可以幫助翻譯機(jī)器對(duì)各種翻譯技術(shù)方案進(jìn)行優(yōu)化,并能夠分析、區(qū)分出不同質(zhì)量的翻譯作品,不斷提升機(jī)器翻譯的決策能力、決策質(zhì)量和決策效益,以產(chǎn)生更大的經(jīng)濟(jì)效益和社會(huì)效益。
3.1.4 人工智能技術(shù)在機(jī)器翻譯中的應(yīng)用場(chǎng)景及優(yōu)缺點(diǎn)對(duì)比分析
基于人工神經(jīng)網(wǎng)絡(luò)技術(shù)的機(jī)器翻譯優(yōu)勢(shì)在于翻譯反應(yīng)速度快、用戶花費(fèi)少,可應(yīng)用于工作量大的翻譯項(xiàng)目,但其自身也存在著一些問(wèn)題。例如,神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)一般包括兩個(gè)遞歸神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN),其中一個(gè)主要用來(lái)接受輸入文本,將輸入的源語(yǔ)言文本轉(zhuǎn)化為表征空間中的向量,另一個(gè)遞歸神經(jīng)網(wǎng)絡(luò)主要是將其轉(zhuǎn)化為目標(biāo)語(yǔ)句??梢詫⑵湟暈橐粋€(gè)語(yǔ)言模型來(lái)預(yù)測(cè)目標(biāo)語(yǔ)言的下一個(gè)詞匯文本信息,而且其概率依賴于源語(yǔ)言,并通過(guò)注意力網(wǎng)絡(luò)連接。但這樣的架構(gòu)需要海量的計(jì)算資源,而且人工神經(jīng)網(wǎng)絡(luò)翻譯系統(tǒng)在應(yīng)對(duì)專業(yè)術(shù)語(yǔ)和非常用翻譯文本方面表現(xiàn)乏力。很多情況下只能對(duì)原文進(jìn)行復(fù)制,而沒(méi)有進(jìn)行任何翻譯操作。在處理冗長(zhǎng)文本信息時(shí),基于人工神經(jīng)網(wǎng)絡(luò)的機(jī)器翻譯會(huì)出現(xiàn)文本信息丟失的現(xiàn)象,甚至?xí)z漏重要的文本信息。所以人工神經(jīng)網(wǎng)絡(luò)一般應(yīng)用于網(wǎng)絡(luò)即時(shí)翻譯場(chǎng)景,主要為了滿足一般性的翻譯需求。神經(jīng)網(wǎng)絡(luò)翻譯技術(shù)還在不斷發(fā)展,例如,隨著大數(shù)據(jù)技術(shù)和波束搜索等技術(shù)的發(fā)展,其翻譯準(zhǔn)確率也在不斷提升。谷歌的神經(jīng)機(jī)器翻譯系統(tǒng)宣稱,在多個(gè)主要語(yǔ)言對(duì)的翻譯中將翻譯誤差降低了55%~85%。
專家系統(tǒng)技術(shù)在機(jī)器翻譯中的應(yīng)用,有效解決了人工神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯存在的許多問(wèn)題,例如,目前的人工神經(jīng)網(wǎng)絡(luò)在文本翻譯時(shí)過(guò)多地只關(guān)注單詞和句子信息的翻譯,而忽視段落結(jié)構(gòu)及文本上下文語(yǔ)境信息的連接,詞匯文本信息在不同語(yǔ)境下的語(yǔ)言含義搜索和識(shí)別效率不高。但專家系統(tǒng)自身也存在著信息更新速度慢、系統(tǒng)構(gòu)建要求高、建設(shè)費(fèi)用投資大、建設(shè)周期長(zhǎng)、應(yīng)用領(lǐng)域過(guò)于細(xì)化等問(wèn)題,所以專家系統(tǒng)技術(shù)多應(yīng)用于專業(yè)領(lǐng)域的高端翻譯場(chǎng)景,在高級(jí)譯員培訓(xùn)、復(fù)雜語(yǔ)言信息識(shí)別、翻譯技術(shù)信息庫(kù)建設(shè)和翻譯技術(shù)資源網(wǎng)站開(kāi)發(fā)等方面應(yīng)用比較廣泛。
隨著經(jīng)濟(jì)發(fā)展模式的不斷創(chuàng)新,新的翻譯需求也呈現(xiàn)多樣性和定制化的特點(diǎn)。智能決策支持系統(tǒng)在垂直領(lǐng)域以及機(jī)構(gòu)定制化機(jī)器翻譯系統(tǒng)中得到了應(yīng)用。翻譯市場(chǎng)對(duì)于機(jī)器翻譯的實(shí)用性和靈活性的要求不斷促使智能決策支持系統(tǒng)對(duì)機(jī)器翻譯、CAT工具、術(shù)語(yǔ)管理等翻譯技術(shù)進(jìn)行整合,尤其是對(duì)本地化工具、翻譯管理系統(tǒng)、計(jì)算機(jī)輔助翻譯等組件進(jìn)行架構(gòu)重組。但由于人工智能技術(shù)還處于不斷發(fā)展的階段,智能決策支持系統(tǒng)的發(fā)展還不甚完善,其建設(shè)過(guò)程還面臨著很多技術(shù)挑戰(zhàn),例如人工智能技術(shù)的不確定性發(fā)展、人機(jī)信任機(jī)制建立等具體問(wèn)題,所以,目前智能決策支持系統(tǒng)主要應(yīng)用于機(jī)器翻譯譯后編輯(machine translation post-editing, MTPE)和機(jī)器翻譯輔助工具的開(kāi)發(fā)。圖像翻譯也有望進(jìn)入智能決策支持系統(tǒng)的應(yīng)用場(chǎng)景。
人工智能在機(jī)器翻譯中的具體實(shí)現(xiàn)主要包括3個(gè)領(lǐng)域:(1)研究會(huì)聽(tīng)、說(shuō)、讀、寫(xiě)和譯的電腦程序, 實(shí)現(xiàn)自然語(yǔ)言處理;(2)研制智能化的翻譯機(jī)器,具有視覺(jué)和聽(tīng)覺(jué)程序處理能力, 并能識(shí)別周?chē)h(huán)境,靈活應(yīng)對(duì)遇到的翻譯問(wèn)題;(3)開(kāi)發(fā)通過(guò)符號(hào)識(shí)別來(lái)模擬人類翻譯專家行為的程序, 即翻譯專家系統(tǒng)。從研究的本質(zhì)來(lái)說(shuō), 人工智能一般可分為理論研究和工程研究?jī)蓚€(gè)領(lǐng)域。理論研究主要是指依據(jù)有關(guān)開(kāi)發(fā)和理解人和機(jī)器智能方面的理論進(jìn)行前瞻性研究和探索, 而工程研究則主要是研發(fā)人工智能的工具和類似翻譯專家系統(tǒng)這樣的實(shí)用商品。人工智能在機(jī)器翻譯中的具體實(shí)現(xiàn)模式包括: 對(duì)于翻譯信息和相關(guān)知識(shí)的人工智能處理、翻譯文字符號(hào)的智能處理以及人工智能對(duì)于翻譯問(wèn)題的智能化處理等方面??梢哉f(shuō), 人工智能在機(jī)器翻譯中的具體實(shí)現(xiàn)模式,就是一種具有靈活信息處理能力和信息演示能力的結(jié)合體。
專家系統(tǒng)、人工神經(jīng)網(wǎng)絡(luò)和智能決策支持系統(tǒng)技術(shù)應(yīng)用于機(jī)器翻譯技術(shù)的開(kāi)發(fā),能夠有效提升機(jī)器翻譯的效率。例如,基于人工神經(jīng)網(wǎng)絡(luò)技術(shù)的機(jī)器翻譯建設(shè)方案,有望解決傳統(tǒng)的基于短語(yǔ)的機(jī)器翻譯系統(tǒng)運(yùn)作效率不高的缺點(diǎn)。翻譯準(zhǔn)確度和速度是翻譯效率的重要觀測(cè)點(diǎn)。通用的機(jī)器翻譯方法主要有兩種:基于規(guī)則的機(jī)器翻譯方法和基于語(yǔ)料庫(kù)的機(jī)器翻譯方法。喬姆斯基(Chomsky)的轉(zhuǎn)換生成語(yǔ)法理論是基于規(guī)則的機(jī)器翻譯方法的理論基礎(chǔ),這種技術(shù)方案主要是采用語(yǔ)言規(guī)則來(lái)對(duì)自然語(yǔ)言的內(nèi)部結(jié)構(gòu)規(guī)律進(jìn)行描述, 并對(duì)自然語(yǔ)言進(jìn)行形式化的處理。首先,要對(duì)輸入的句子進(jìn)行分析,獲得其句法分析樹(shù);然后,根據(jù)轉(zhuǎn)換規(guī)則把源語(yǔ)言句子結(jié)構(gòu)映射到目標(biāo)語(yǔ)句子結(jié)構(gòu)上;最后,根據(jù)目標(biāo)語(yǔ)句子結(jié)構(gòu)對(duì)生成的譯文進(jìn)行最終的語(yǔ)言加工,并可采用直接翻譯法、中間語(yǔ)言法和轉(zhuǎn)換法等模式對(duì)源語(yǔ)言進(jìn)行機(jī)器翻譯。人工智能技術(shù)的高感知和高速運(yùn)算能力對(duì)于上述這些機(jī)器翻譯模式意義重大。
語(yǔ)料庫(kù)語(yǔ)言學(xué)是基于語(yǔ)料庫(kù)的機(jī)器翻譯方法的基礎(chǔ),需要獲取大量語(yǔ)料來(lái)建立語(yǔ)料庫(kù),這就要求通過(guò)大規(guī)模整理互為譯文的雙語(yǔ)語(yǔ)料,并由這些語(yǔ)料的電子格式來(lái)建立支撐機(jī)器翻譯的語(yǔ)料庫(kù),這些語(yǔ)料信息將作為獲取翻譯知識(shí)和統(tǒng)計(jì)數(shù)據(jù)的依據(jù)。也可以直接采用語(yǔ)料庫(kù)進(jìn)行機(jī)器翻譯中的語(yǔ)料分析、轉(zhuǎn)換和生成。從技術(shù)層面來(lái)看,基于語(yǔ)料庫(kù)的機(jī)器翻譯方法主要有兩種:基于實(shí)例的機(jī)器翻譯和基于統(tǒng)計(jì)的機(jī)器翻譯(statistical machine translation,SMT)。其中,基于實(shí)例的機(jī)器翻譯方法主要是指在雙語(yǔ)語(yǔ)料庫(kù)中,通過(guò)編輯或查找與需要翻譯的源語(yǔ)言類似的參考實(shí)例來(lái)對(duì)源語(yǔ)言進(jìn)行翻譯?;诮y(tǒng)計(jì)的機(jī)器翻譯方法主要是指在雙語(yǔ)語(yǔ)料庫(kù)中,通過(guò)使用從語(yǔ)料庫(kù)中建造的概率模型來(lái)對(duì)輸入的需要翻譯的源語(yǔ)言自動(dòng)搜索出一個(gè)相似度概率最高的譯文。這種方法的難度取決于對(duì)源語(yǔ)言和翻譯目標(biāo)語(yǔ)進(jìn)行句對(duì)的對(duì)齊,并通過(guò)詞匯同現(xiàn)可能性的方法將源語(yǔ)言的詞匯映射到目標(biāo)語(yǔ)言詞匯的比對(duì)概率進(jìn)行計(jì)算,進(jìn)而形成與源語(yǔ)言詞匯表達(dá)意義概率學(xué)上最接近的翻譯文本。無(wú)論是高速運(yùn)轉(zhuǎn)的可靠的語(yǔ)料庫(kù)的構(gòu)建和管理,還是進(jìn)行比對(duì)概率的高速運(yùn)算,都離不開(kāi)人工智能技術(shù)的不斷創(chuàng)新。例如,在處理冗長(zhǎng)文本信息的翻譯工作時(shí),谷歌的神經(jīng)機(jī)器翻譯引入了注意力機(jī)制,將解碼器的底層連接到了編碼器的頂層,從而使機(jī)器翻譯系統(tǒng)能夠更為準(zhǔn)確高效地應(yīng)對(duì)這些復(fù)雜信息。殘差連接技術(shù)的應(yīng)用實(shí)現(xiàn)了通過(guò)提升并行性來(lái)降低機(jī)器翻譯訓(xùn)練時(shí)間的目標(biāo)。在推理計(jì)算過(guò)程中,采用低精度運(yùn)算方案,從而能夠更快地為用戶呈現(xiàn)出翻譯結(jié)果。
機(jī)器翻譯在實(shí)際運(yùn)用過(guò)程中要處理很多復(fù)雜問(wèn)題,尤其是要時(shí)刻應(yīng)對(duì)語(yǔ)言知識(shí)復(fù)雜性和文化背景多樣性的挑戰(zhàn)。在應(yīng)對(duì)這些翻譯難題時(shí),要利用現(xiàn)代技術(shù)手段[9]。從技術(shù)層面上來(lái)看,機(jī)器翻譯要同時(shí)處理兩種或者兩種以上的語(yǔ)言信息符號(hào),這就需要翻譯機(jī)器能夠?qū)υ凑Z(yǔ)言進(jìn)行語(yǔ)言分析,這是第一步要做的?;谡Z(yǔ)法或者語(yǔ)義的中間結(jié)構(gòu)在理解分析源語(yǔ)言過(guò)程中發(fā)揮著重要作用。之后,翻譯機(jī)器要對(duì)介于源語(yǔ)言和目標(biāo)語(yǔ)言的中間語(yǔ)言結(jié)構(gòu)進(jìn)行進(jìn)一步分析,為下一步進(jìn)行目標(biāo)語(yǔ)言的語(yǔ)法或者語(yǔ)義的中間結(jié)構(gòu)的轉(zhuǎn)換打好基礎(chǔ)。在完成上述程序后,才能最終進(jìn)行語(yǔ)言符號(hào)的梳理轉(zhuǎn)換,形成最終的目標(biāo)語(yǔ)言的呈現(xiàn)表述。由此可見(jiàn),語(yǔ)言分析對(duì)于機(jī)器翻譯作用明顯,語(yǔ)言分析的能力直接影響著機(jī)器翻譯的質(zhì)量,毫無(wú)疑問(wèn),具有人工智能的機(jī)器翻譯在進(jìn)行語(yǔ)言分析時(shí),具有更多的優(yōu)勢(shì)。
不同語(yǔ)言之間一般具有明顯的差異性,尤其體現(xiàn)在語(yǔ)法規(guī)律和表達(dá)習(xí)慣上,不同語(yǔ)言文字符號(hào)系統(tǒng)在詞匯、句子、語(yǔ)法、語(yǔ)義和語(yǔ)境等語(yǔ)言學(xué)信息方面表現(xiàn)出了信息量表述不對(duì)稱性的特點(diǎn),這就使機(jī)器翻譯工作面臨著諸多挑戰(zhàn),也需要借助日益發(fā)展的人工智能技術(shù)來(lái)解決翻譯實(shí)踐中出現(xiàn)的很多具體問(wèn)題。從某種層面上來(lái)說(shuō),具有人工智能的翻譯機(jī)器是在不斷認(rèn)知不同語(yǔ)言系統(tǒng)間各自的運(yùn)作規(guī)律,深入學(xué)習(xí)和辨識(shí)篇章、段落、句群在內(nèi)的各種語(yǔ)境信息,并對(duì)上述相關(guān)信息進(jìn)行快速準(zhǔn)確地解碼和編碼的過(guò)程。除了語(yǔ)言內(nèi)部系統(tǒng)的差異,機(jī)器翻譯還要在人工智能的控制下考慮到因?yàn)槲幕尘安町? 導(dǎo)致不同自然語(yǔ)言系統(tǒng)對(duì)一些類似或相近語(yǔ)義信息表達(dá)時(shí)出現(xiàn)相當(dāng)大的差異性。除此之外,機(jī)器翻譯還需要處理不同語(yǔ)言詞匯之間相近意義表述的翻譯,不同語(yǔ)言文化中隱喻的認(rèn)知,不同語(yǔ)言系統(tǒng)對(duì)于不同使用習(xí)慣的詞匯表達(dá)的信息處理,容易拼寫(xiě)錯(cuò)誤或者翻譯存在誤差的詞語(yǔ)的使用,詞語(yǔ)使用和語(yǔ)言的不同搭配習(xí)慣,在不同語(yǔ)境下同形異義詞的使用等問(wèn)題。語(yǔ)言搭配是指詞語(yǔ)或者固定短語(yǔ)之間自由組合并具有規(guī)律性呈現(xiàn)的語(yǔ)言現(xiàn)象。在機(jī)器翻譯等自然語(yǔ)言處理任務(wù)中,語(yǔ)言搭配發(fā)揮著重要作用。機(jī)器翻譯的質(zhì)量往往和語(yǔ)言搭配語(yǔ)料資源的質(zhì)量和應(yīng)用相關(guān)。高效且容量較大的語(yǔ)料庫(kù)搭配資源能夠極大地提升自然語(yǔ)言處理的效率。
翻譯能力的發(fā)展是一個(gè)動(dòng)態(tài)的互動(dòng)過(guò)程,與語(yǔ)言學(xué)習(xí)一樣[10]。翻譯不是單純由漸次輸入引導(dǎo)的線性過(guò)程,而是充滿高峰、低谷、前進(jìn)、倒退、停滯、甚至跳躍式前進(jìn)的動(dòng)態(tài)系統(tǒng)行為[11]。機(jī)器翻譯在認(rèn)知和處理不同語(yǔ)言中的隱喻現(xiàn)象時(shí),往往遇到極大的困難。這不僅僅是由于隱喻是一種語(yǔ)言修辭方法,而且還是一種思維模式,它體現(xiàn)了不同人群進(jìn)行思維和行動(dòng)的觀念系統(tǒng)的本質(zhì)特征,是不同人群認(rèn)知、思維乃至語(yǔ)言表述和寫(xiě)作的基礎(chǔ)。機(jī)器難以具備直覺(jué)能力、想象能力、靈感和審美能力[12]。由于文化背景、宗教信仰、 生活生產(chǎn)方式、神話傳說(shuō)、認(rèn)知模式、社會(huì)風(fēng)俗、文學(xué)作品和自然環(huán)境等存在差異,不同語(yǔ)言系統(tǒng)對(duì)于隱喻的理解也存在著巨大差異。這就需要具有高速運(yùn)算能力的人工智能能夠快速辨認(rèn)、認(rèn)知、理解、儲(chǔ)存、比對(duì)這些隱喻信息,并將這些海量語(yǔ)言信息進(jìn)行高速數(shù)據(jù)處理,建立語(yǔ)法隱喻模式集和詞匯隱喻模式集,并通過(guò)常規(guī)或?qū)嵗姆椒? 或是推理和統(tǒng)計(jì)的方法進(jìn)行隱喻信息數(shù)據(jù)計(jì)算,從而幫助翻譯機(jī)器有效地辨識(shí)和理解不同語(yǔ)言中存在的隱喻現(xiàn)象,進(jìn)而更好地完成翻譯任務(wù)。
機(jī)器翻譯的語(yǔ)義理解能力直接與翻譯產(chǎn)品的質(zhì)量密切相關(guān)。人工智能可以很大程度上提升機(jī)器翻譯的語(yǔ)義理解能力。一般認(rèn)為,語(yǔ)義理解能力包含3個(gè)方面:(1)基于相關(guān)語(yǔ)言知識(shí)基礎(chǔ)的語(yǔ)言層級(jí)理解;(2)基于人類知識(shí)系統(tǒng)基礎(chǔ)的知識(shí)面層級(jí)的知識(shí)層次理解;(3)基于當(dāng)時(shí)參與語(yǔ)言交流的人員的語(yǔ)用層次理解。在多種語(yǔ)言認(rèn)知和處理過(guò)程中可以發(fā)現(xiàn),針對(duì)同一種事物,不同自然語(yǔ)言對(duì)其表述存在很大的差異。也就是說(shuō),自然語(yǔ)言語(yǔ)義對(duì)應(yīng)存在著很多語(yǔ)義偏移現(xiàn)象,即一種事物在一種自然語(yǔ)義中的映射與其在另外一種自然語(yǔ)言中的語(yǔ)義模塊存在偏移,并不是一一對(duì)應(yīng)的。由此可見(jiàn),能否對(duì)這些現(xiàn)象進(jìn)行快速準(zhǔn)確有效地理解和辨析,并能夠進(jìn)行相對(duì)應(yīng)的翻譯處理,考驗(yàn)著機(jī)器翻譯的工作能力。目前,感知智能的發(fā)展已經(jīng)比較成熟, 它通過(guò)數(shù)學(xué)建模和基于大數(shù)據(jù)的深度學(xué)習(xí)等方法對(duì)人類感知能力進(jìn)行模擬, 輔助人類完成任務(wù)[13]。人工智能可以很好地幫助機(jī)器翻譯應(yīng)對(duì)這些挑戰(zhàn)。因?yàn)檎Z(yǔ)言分析能力在機(jī)器翻譯能力構(gòu)建中具有重要作用,所以通過(guò)人工智能來(lái)加強(qiáng)語(yǔ)言的對(duì)比分析并研究相應(yīng)的人工翻譯技術(shù)體系,是機(jī)器翻譯的重點(diǎn)研究領(lǐng)域。原有的機(jī)器翻譯具有很多局限性,例如,對(duì)于自然語(yǔ)言的語(yǔ)言描述與語(yǔ)言知識(shí)分析準(zhǔn)確度不夠高,無(wú)法有效地理解并消除語(yǔ)言歧義的現(xiàn)象,對(duì)于隱喻的辨識(shí)能力不強(qiáng)或者根本無(wú)法辨識(shí),對(duì)于不同自然語(yǔ)言形式描述過(guò)于粗糙、達(dá)不到精準(zhǔn)描述的層級(jí)等,這些問(wèn)題制約著機(jī)器翻譯能力的提升。尤其是能否讓翻譯機(jī)器快速識(shí)別并處理容易誤解、誤譯詞語(yǔ)的形式化研究,是一項(xiàng)亟待解決的技術(shù)難題。這些問(wèn)題的最終解決,離不開(kāi)人工智能技術(shù)的發(fā)展,因?yàn)槿斯ぶ悄芫哂袕?qiáng)大的學(xué)習(xí)能力。學(xué)習(xí)是人類智能的重要特征,是獲得知識(shí)的基本手段,而機(jī)器學(xué)習(xí)也是使計(jì)算機(jī)具有智能的根本途徑[14]。在現(xiàn)有技術(shù)基礎(chǔ)上,人工智能通過(guò)不斷學(xué)習(xí)已經(jīng)在一些機(jī)器翻譯技術(shù)研究方面取得了顯著進(jìn)步。例如,在加強(qiáng)詞對(duì)齊技術(shù)的研究與應(yīng)用方面,提升了從源語(yǔ)言詞匯到目標(biāo)語(yǔ)言詞匯映射研究的精度和廣度,并構(gòu)建了詞對(duì)齊技術(shù)的統(tǒng)計(jì)模型。 通過(guò)數(shù)據(jù)挖掘技術(shù),能夠從文本數(shù)據(jù)中自動(dòng)獲取高質(zhì)量的映射信息,并通過(guò)相應(yīng)的算法把獵取的映射數(shù)據(jù)運(yùn)用到自然語(yǔ)言處理工作中。人工智能技術(shù)還可以幫助翻譯機(jī)器通過(guò)單詞對(duì)齊的搭配技術(shù)自動(dòng)匹配相應(yīng)的算法,取得詞匯搭配概率、位置扭曲概率和詞匯繁殖度概率,并將這些數(shù)據(jù)信息通過(guò)相應(yīng)的匹配運(yùn)算整合到同一個(gè)統(tǒng)計(jì)模型中,以便更加高效地尋找句子中有可能存在的相關(guān)詞匯搭配的可能性。人工智能技術(shù)也可以幫助翻譯機(jī)器在整理和尋找雙語(yǔ)詞對(duì)齊中,經(jīng)過(guò)預(yù)估詞組內(nèi)部的搭配概率來(lái)研判該詞組是否有可能成為一個(gè)整體對(duì)齊,來(lái)制約雙語(yǔ)詞對(duì)齊中多詞單元的對(duì)齊。在機(jī)器翻譯工作中,人工智能技術(shù)能夠經(jīng)過(guò)計(jì)算來(lái)感知短語(yǔ)與待翻譯句子里上下文之間的搭配關(guān)系,判定短語(yǔ)與待翻譯句子的匹配程度,并能夠以此為基礎(chǔ)構(gòu)建出數(shù)據(jù)量大、質(zhì)量高、可擴(kuò)充的語(yǔ)料庫(kù)。在這個(gè)語(yǔ)料庫(kù)中,包含有語(yǔ)義語(yǔ)法模式集、固定搭配以及變量庫(kù)、短語(yǔ)模式集、字面意義模式集、帶有句法語(yǔ)義變量的翻譯模板、句法語(yǔ)義變量和語(yǔ)義類型樹(shù)等子系統(tǒng),這些系統(tǒng)的建立為機(jī)器翻譯的能力提升打下了良好的基礎(chǔ)。由此可見(jiàn),一臺(tái)計(jì)算機(jī)若不會(huì)學(xué)習(xí),就不能被稱為是具有智能的計(jì)算機(jī)[15]。通過(guò)人工智能自身學(xué)習(xí)能力的提升,機(jī)器翻譯的能力也在不斷增強(qiáng)。
人工智能技術(shù)使得世界一體化的翻譯市場(chǎng)的形成成為可能[16]。根據(jù)人工智能技術(shù)發(fā)展的現(xiàn)狀,以及人工智能在機(jī)器翻譯應(yīng)用的趨勢(shì),可以看出現(xiàn)有基于人工智能技術(shù)的機(jī)器翻譯系統(tǒng)主要包含以下組件:(1)基于人工智能技術(shù)的機(jī)器翻譯系統(tǒng)的核心組件和主界面是工作空間,它賦予了機(jī)器翻譯具有跨領(lǐng)域應(yīng)用程序的集成能力,這就使翻譯用戶可以在現(xiàn)有常用瀏覽器風(fēng)格的界面中集中控制所有機(jī)器翻譯組件, 并能在人工智能技術(shù)的控制下對(duì)所有的翻譯項(xiàng)目和工作流程進(jìn)行有效地管理。(2)基于人工智能技術(shù)的機(jī)器翻譯系統(tǒng)構(gòu)建一般也會(huì)有一個(gè)翻譯者工作臺(tái),能夠與MSWord XP/2010/2018等軟件操作系統(tǒng)進(jìn)行無(wú)縫對(duì)接,現(xiàn)有的運(yùn)算能力能夠支持多種語(yǔ)言之間的多向互譯。翻譯用戶可以在微軟公司的Word軟件運(yùn)行中進(jìn)行相關(guān)交互翻譯。在人工智能技術(shù)的支持下,翻譯者工作臺(tái)能夠適時(shí)有效地使用后臺(tái)運(yùn)行能力強(qiáng)大的神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)庫(kù),為翻譯工作者和產(chǎn)品用戶儲(chǔ)存并管理源文本和翻譯好的作品,并已經(jīng)實(shí)現(xiàn)對(duì)源文本的自動(dòng)翻譯?;谌斯ぶ悄芗夹g(shù)的機(jī)器翻譯系統(tǒng)也已經(jīng)實(shí)現(xiàn)為用戶動(dòng)態(tài)提示相關(guān)譯文語(yǔ)句,自動(dòng)保留源文本格式,并與其他文本處理應(yīng)用軟件有著良好的兼容性。(3)術(shù)語(yǔ)管理組件也是機(jī)器翻譯系統(tǒng)的重要構(gòu)成組件,其主要功能是通過(guò)人工智能技術(shù)掃描原文中出現(xiàn)的術(shù)語(yǔ),并由計(jì)算機(jī)在機(jī)器翻譯的專業(yè)語(yǔ)料庫(kù)中進(jìn)行搜索和比對(duì)。現(xiàn)代信息技術(shù)和互聯(lián)網(wǎng)的高速發(fā)展推動(dòng)著術(shù)語(yǔ)和計(jì)算機(jī)技術(shù)的結(jié)合日益大眾化[17]?;谌斯ぶ悄艿臋C(jī)器翻譯技術(shù)的原理,決定了其應(yīng)用效率與需要翻譯的文本的內(nèi)容重現(xiàn)率有關(guān)。例如,若是源文本前后內(nèi)容表述具有術(shù)語(yǔ)的一致性或短語(yǔ)的一致性等特點(diǎn),人工智能技術(shù)會(huì)通過(guò)掃描在機(jī)器翻譯語(yǔ)料庫(kù)中相對(duì)應(yīng)的術(shù)語(yǔ),并自動(dòng)匹配出合適的參考譯文。術(shù)語(yǔ)管理組件的功能主要是為了保持相同術(shù)語(yǔ)翻譯的統(tǒng)一性,其翻譯內(nèi)容的質(zhì)量與計(jì)算翻譯中專業(yè)語(yǔ)料庫(kù)的質(zhì)量和規(guī)模有密切關(guān)系。這些組件的工作效率隨著人工智能技術(shù)的進(jìn)步也在不斷提升。(4)為了能夠?qū)C(jī)器翻譯系統(tǒng)中的語(yǔ)料庫(kù)系統(tǒng)進(jìn)行適時(shí)更新,也為了機(jī)器翻譯的作品能夠適應(yīng)不斷變化更新的語(yǔ)言使用現(xiàn)象,人工智能技術(shù)支持機(jī)器翻譯系統(tǒng)具有術(shù)語(yǔ)抽取能力。這一系統(tǒng)能夠在各種海量文本數(shù)據(jù)中自動(dòng)抽取翻譯項(xiàng)目所需的術(shù)語(yǔ),并通過(guò)人工智能強(qiáng)大的自運(yùn)算能力和高效的數(shù)據(jù)運(yùn)算模型,實(shí)現(xiàn)單語(yǔ)或雙語(yǔ)術(shù)語(yǔ)表的自動(dòng)生成。(5)機(jī)器翻譯系統(tǒng)中也會(huì)包括匹配建庫(kù)系統(tǒng)組件,這一功能組件主要是使用戶能夠在人工智能技術(shù)的幫助下對(duì)以往的翻譯成品資料實(shí)現(xiàn)回收,其實(shí)際使用意義是為了將源文本和譯文作品進(jìn)行相關(guān)數(shù)據(jù)的適時(shí)對(duì)比和分析,以計(jì)算出相關(guān)匹配值,并將具有高匹配值的語(yǔ)言翻譯模塊或者單語(yǔ)或雙語(yǔ)術(shù)語(yǔ)表輸入到機(jī)器翻譯系統(tǒng)自建的翻譯記憶庫(kù)中,及時(shí)反饋給翻譯者工作臺(tái)系統(tǒng)使用。在人工智能的管理下,機(jī)器翻譯系統(tǒng)還能夠集成微軟Word軟件的字典功能,從而為更多的語(yǔ)言使用和翻譯者提供功能更為強(qiáng)大的書(shū)寫(xiě)自檢服務(wù)。
隨著全球化和信息化進(jìn)程不斷推進(jìn),海量的翻譯需求給全球語(yǔ)言服務(wù)行業(yè)帶來(lái)了前所未有的機(jī)遇和挑戰(zhàn)[18]。在面對(duì)多語(yǔ)言翻譯任務(wù)時(shí),機(jī)器翻譯應(yīng)用面臨的一大挑戰(zhàn)就是如何快速高效地挖掘不同語(yǔ)言系統(tǒng)的內(nèi)部運(yùn)作規(guī)律。語(yǔ)言服務(wù)業(yè)相信人機(jī)交互才是未來(lái)的發(fā)展趨勢(shì)[19]。人工智能能夠幫助翻譯機(jī)器高效率地發(fā)掘語(yǔ)言系統(tǒng)內(nèi)部的運(yùn)行關(guān)系,從而實(shí)現(xiàn)幫助機(jī)器翻譯提升工作效率的目的。其工作原理是通過(guò)廣泛挖掘數(shù)據(jù),包括句群、段落、篇章、體裁在內(nèi)的各種語(yǔ)言信息的原始數(shù)據(jù),并在設(shè)定好的各種語(yǔ)境狀況下對(duì)這些信息進(jìn)行編碼或解碼。 互聯(lián)網(wǎng)與人工智能蓬勃發(fā)展,信息技術(shù)對(duì)翻譯工作的滲透程度日益深化[20]。人工智能支持在機(jī)器翻譯中發(fā)揮其語(yǔ)言分析的作用,并通過(guò)尋找、定位、解析語(yǔ)言運(yùn)行的各項(xiàng)特征,在經(jīng)過(guò)高速運(yùn)算后對(duì)語(yǔ)言特征進(jìn)行有目的的對(duì)比分析,創(chuàng)新性地研究詞對(duì)齊技術(shù),并將之應(yīng)用到機(jī)器翻譯的工作過(guò)程中,實(shí)現(xiàn)通過(guò)具有高速運(yùn)算能力的人工智能來(lái)重新構(gòu)建詞對(duì)齊技術(shù)的統(tǒng)計(jì)模型。這一模型包含了大規(guī)模、高質(zhì)量、可擴(kuò)充的語(yǔ)義單元庫(kù),這些單元庫(kù)或者語(yǔ)料庫(kù)能夠推動(dòng)機(jī)器翻譯的不斷發(fā)展。若是將相應(yīng)的人工翻譯技術(shù)體系全面應(yīng)用到機(jī)器翻譯系統(tǒng)中,能夠極大地提升機(jī)器翻譯的響應(yīng)速度和工作效率。在大數(shù)據(jù)時(shí)代,搜集和利用網(wǎng)絡(luò)上龐大的數(shù)據(jù)資源已經(jīng)成為亟待解決的問(wèn)題[21]。下一階段,人工智能在利用大數(shù)據(jù)技術(shù)幫助機(jī)器翻譯結(jié)果更符合母語(yǔ)使用者習(xí)慣和特征方面,將會(huì)發(fā)揮更大的作用。