王小遷
(陜西藝術(shù)職業(yè)學(xué)院 基礎(chǔ)教學(xué)部, 陜西 西安 710054)
現(xiàn)有的英語(yǔ)翻譯軟件通過一定的算法對(duì)單詞的詞義進(jìn)行廣義的搜索,而大多計(jì)算機(jī)譯文校準(zhǔn)系統(tǒng)僅注重單詞和短句語(yǔ)法是否翻譯正確,欠缺對(duì)具體語(yǔ)境的考慮[1]。為此,本文提出了一種基于計(jì)算機(jī)智能的英語(yǔ)譯文語(yǔ)境化自動(dòng)校準(zhǔn)系統(tǒng),通過各功能模塊進(jìn)行詞義搜索、用戶行為分析并結(jié)合局部語(yǔ)境進(jìn)行單詞調(diào)整。該系統(tǒng)的研發(fā)大幅提高了英語(yǔ)譯文的整體準(zhǔn)確性和通暢度,適于在英語(yǔ)翻譯領(lǐng)域推廣應(yīng)用。
英語(yǔ)譯文語(yǔ)境化自動(dòng)校準(zhǔn)系統(tǒng)共由6個(gè)部分組成,即工作模塊、翻譯模塊、譯文校準(zhǔn)模塊、用戶模塊、搜索模塊和行為日志,其總體架構(gòu)如圖1所示。
圖1 系統(tǒng)總體架構(gòu)示意圖
系統(tǒng)的自動(dòng)校準(zhǔn)功能是通過對(duì)英語(yǔ)原文的再翻譯實(shí)現(xiàn)的,再翻譯的內(nèi)容由系統(tǒng)從互聯(lián)網(wǎng)中獲取并儲(chǔ)存于工作模塊中,將得到的新譯文與待校準(zhǔn)譯文進(jìn)行對(duì)比,結(jié)合文章的語(yǔ)境信息找出錯(cuò)誤的詞匯并以正確的詞匯將其替代,從而完成文章的自動(dòng)校準(zhǔn)[2]。行為日志用以記錄各功能模塊在工作時(shí)所產(chǎn)生的各種數(shù)據(jù),用以控制譯文校準(zhǔn)過程中出現(xiàn)的錯(cuò)誤,保證校準(zhǔn)結(jié)果的準(zhǔn)確性。工作模塊負(fù)責(zé)系統(tǒng)與用戶的交互,接收來自用戶的操作指令并向下傳遞,翻譯模塊根據(jù)上下文語(yǔ)境對(duì)待校準(zhǔn)譯文中的詞匯進(jìn)行檢驗(yàn),基于詞義的相似度對(duì)得到的選項(xiàng)進(jìn)行排序,從而決定是否需要替換,用戶模塊中存儲(chǔ)了待選詞匯及其排序結(jié)果供用戶進(jìn)行查詢。
搜索模塊用于詞匯特征的提取與分析,系統(tǒng)工作過程中該模塊對(duì)詞匯在各個(gè)領(lǐng)域和各種環(huán)境下的基本含義進(jìn)行搜索,模擬人類大腦記憶存儲(chǔ)的方式不斷地更新和優(yōu)化詞匯特征,為后續(xù)的譯文校準(zhǔn)建立足夠豐富的知識(shí)庫(kù)。用戶發(fā)出操作指令后,為了得到詞匯在特定語(yǔ)境下的不同含義,搜索模塊構(gòu)建出一種映射線程以完成搜索任務(wù)。該線程采取了多映射點(diǎn)的模式,所有的映射點(diǎn)均為不同特定環(huán)境下待校準(zhǔn)詞匯的具體含義。搜索模塊的工作保證了所有含義相近的詞匯全部出現(xiàn)在待選范圍之內(nèi),很大程度上避免了用戶的部分錯(cuò)誤表達(dá)所造成的搜索到無關(guān)結(jié)果的現(xiàn)象。
在系統(tǒng)運(yùn)行的過程中,行為日志負(fù)責(zé)監(jiān)聽用戶的行為并將其全部以數(shù)據(jù)的形式進(jìn)行保存。用戶執(zhí)行譯文校準(zhǔn)時(shí),行為日志會(huì)記錄整個(gè)校準(zhǔn)過程中發(fā)生的事件。若用戶多次對(duì)同一篇文章進(jìn)行校準(zhǔn),則系統(tǒng)將自動(dòng)擴(kuò)大詞匯的搜素范圍,從而獲取更多的待選詞匯以實(shí)現(xiàn)更為精準(zhǔn)的表達(dá),實(shí)現(xiàn)校準(zhǔn)結(jié)果準(zhǔn)確性的進(jìn)一步提高。
英語(yǔ)原文的翻譯和譯文的校準(zhǔn)本質(zhì)上都是兩種不同形式文本之間的轉(zhuǎn)換,譯文校準(zhǔn)實(shí)際上就是一個(gè)再翻譯的過程,將校準(zhǔn)結(jié)果與翻譯結(jié)果進(jìn)行比較和詞匯替換以獲得表達(dá)更為準(zhǔn)確的英語(yǔ)譯文。
(1)
其中,M(D)代表已完成初步校準(zhǔn)的詞匯。由于初始翻譯結(jié)果僅注重單個(gè)詞匯的翻譯準(zhǔn)確性,所以必須通過自動(dòng)校準(zhǔn)的方式對(duì)式(1)進(jìn)行優(yōu)化,以獲得符合文章意境的譯文,具體的優(yōu)化方法[4]為式(2)。
(2)
其中,ε、γ分別為M(H|D)和M(D)各自權(quán)重的數(shù)值。
(3)
在系統(tǒng)軟件部分的設(shè)計(jì)中,利用改進(jìn)后的短語(yǔ)翻譯模型進(jìn)行譯文自動(dòng)校準(zhǔn)的實(shí)現(xiàn)代碼如下。
Start
Terms Form=NEW semanticsblurry;
//初始化待校準(zhǔn)譯文
ashy relevance=NEW semantics theme
//初始化待校準(zhǔn)詞匯權(quán)重
Vocabulary=Englishtranslation(Vocabulary Form)
//匯總詞匯在各種環(huán)境下的含義
Simultaneously(phrasal language envimoment Is Not Empty.){
IF(Vocabularysemanticsblurry best){
Vocabulary=folds cooperate(phrasal message);
//無法在初始譯文中找到,更改權(quán)值在所有詞義中搜索
Otherwise Crunode=phrasal message(Scientific);
//對(duì)初始譯文進(jìn)行對(duì)比分析
Analog=assort compute(Vocabulary, Crunode);
//計(jì)算詞匯語(yǔ)義相似度
Analog_Form. Place(Lauygdbgf Of (Sfgr));
//根據(jù)排序結(jié)果搜索與待校準(zhǔn)詞匯相似度最高且符合語(yǔ)境的詞匯
Vocabulary, freesurface (If (simregrfist). Nbtjuke);
//歸納分詞
END}}
為了對(duì)所提出的譯文自動(dòng)校準(zhǔn)系統(tǒng)功能的可實(shí)現(xiàn)性和有效性進(jìn)行驗(yàn)證,針對(duì)本系統(tǒng)開展英語(yǔ)引文校準(zhǔn)實(shí)驗(yàn),從某短文數(shù)據(jù)庫(kù)中隨機(jī)選取篇幅為400個(gè)詞匯的英語(yǔ)短文及其首次翻譯譯文500篇[6],通過本系統(tǒng)對(duì)初始譯文進(jìn)行校準(zhǔn),系統(tǒng)單個(gè)詞匯的平均校準(zhǔn)速度為25 KB/s,短文平均校準(zhǔn)速度為15 KB/s,將經(jīng)過本系統(tǒng)校準(zhǔn)的譯文準(zhǔn)確度與首次翻譯譯文的準(zhǔn)確度進(jìn)行對(duì)比(譯文標(biāo)準(zhǔn)答案,即準(zhǔn)確度,由專家評(píng)判獲得),具體結(jié)果如圖2所示。
圖2 經(jīng)本系統(tǒng)校準(zhǔn)前后譯文的準(zhǔn)確度對(duì)比
由圖2中的數(shù)據(jù)可見,經(jīng)本文所提出的自動(dòng)校準(zhǔn)系統(tǒng)校準(zhǔn)后,譯文的平均精確度明顯提升。經(jīng)過統(tǒng)計(jì)可知,本文系統(tǒng)翻譯精準(zhǔn)度均值為99.1%,相較于首次翻譯譯文的平均精確度71.4%提高了27.7%,極大地改善了譯文描述的準(zhǔn)確性,從而證明了本文所提出系統(tǒng)的功能有效性。
英語(yǔ)譯文節(jié)控點(diǎn)位的分布情況能夠表征翻譯后的詞匯語(yǔ)義與文章語(yǔ)境的關(guān)聯(lián)程度,節(jié)控點(diǎn)密集度越高,譯文的詞義表達(dá)越準(zhǔn)確,與語(yǔ)境的貼合程度越高且文章越為通順。為了進(jìn)一步驗(yàn)證本文所提出的語(yǔ)境化自動(dòng)校準(zhǔn)系統(tǒng)所具有的性能優(yōu)勢(shì),選擇一種傳統(tǒng)的、注重詞匯和語(yǔ)法的校準(zhǔn)系統(tǒng)進(jìn)行性能對(duì)比。在譯文校準(zhǔn)實(shí)驗(yàn)過程中分別記錄兩種系統(tǒng)的節(jié)控點(diǎn)數(shù)量并分析其各自的節(jié)控點(diǎn)分布情況,具體結(jié)果分別如圖3、圖4所示。
圖3 語(yǔ)境化自動(dòng)校準(zhǔn)系統(tǒng)節(jié)控點(diǎn)分布
圖4 傳統(tǒng)自動(dòng)校準(zhǔn)系統(tǒng)節(jié)控點(diǎn)分布
由圖3可見,本文提出的語(yǔ)境化自動(dòng)校準(zhǔn)系統(tǒng)節(jié)控點(diǎn)分布密集而有序,一方面說明系統(tǒng)輸出的校準(zhǔn)譯文準(zhǔn)確性較高,另一方面則說明譯文中的詞匯與語(yǔ)境相符且文章整體較為通順;反觀圖4中傳統(tǒng)校準(zhǔn)系統(tǒng)的節(jié)控點(diǎn)情況,雖然在部分實(shí)驗(yàn)中節(jié)控點(diǎn)分布較為緊湊,一定程度上保證了詞匯表達(dá)的準(zhǔn)確度,但在詞匯與語(yǔ)境的貼合度方面存在較大缺陷,從而影響了譯文整體的通順性和準(zhǔn)確性。
由于過于注重詞匯與語(yǔ)法的表達(dá)準(zhǔn)確性,忽略了詞匯在不同語(yǔ)境中詞義的差異,傳統(tǒng)英語(yǔ)譯文自動(dòng)校準(zhǔn)系統(tǒng)的校準(zhǔn)效果并不理想。為此,提出并設(shè)計(jì)了一種基于計(jì)算機(jī)智能的英語(yǔ)譯文語(yǔ)境化自動(dòng)校準(zhǔn)系統(tǒng),利用行為日志分析用戶行為,基于改進(jìn)后的短語(yǔ)翻譯模型進(jìn)行英語(yǔ)原文的再翻譯,獲取符合文章語(yǔ)境的新譯文,將其與初始譯文進(jìn)行對(duì)比并替換其中不符合語(yǔ)境的詞匯,從而獲得準(zhǔn)確性更高的譯文。本系統(tǒng)在開發(fā)過程中得到了陜西藝術(shù)職業(yè)學(xué)院計(jì)算機(jī)系教師的幫助,尤其是系統(tǒng)結(jié)構(gòu)、模塊程序編程、系統(tǒng)調(diào)試等方面,計(jì)算機(jī)系教師給予了莫大支持,在此鳴謝。目前,該系統(tǒng)在陜西藝術(shù)職業(yè)學(xué)院得到了應(yīng)用,效果顯著。特別聲明,該系統(tǒng)產(chǎn)權(quán)歸陜西藝術(shù)職業(yè)學(xué)院所有。