田力
摘 要:為了提升漢英機器翻譯的準確率,實現(xiàn)漢英翻譯系統(tǒng)的智能化,提出了一款漢英短語翻譯組合自動翻譯系統(tǒng)的構(gòu)想。運用語義特征分析與短語翻譯組合形式對漢英雙語翻譯算法進行改善;此外還使用交叉編輯與多線程的短語翻譯加載的措施,從而完成了本翻譯系統(tǒng)的智能化設(shè)計。通過相關(guān)實驗仿真表明,此款新設(shè)計漢英短語譯文組合機器自動翻譯系統(tǒng)翻譯準確率與召回率高,很少出現(xiàn)翻譯錯誤,而且還具有較強的智能性。
關(guān)鍵詞:短語翻譯組合;機器自動翻譯系統(tǒng)設(shè)計;實驗仿真
Abstract:In order to improve the accuracy of Chinese-English machine translation and realize the intelligence of Chinese-English translation system, this paper proposes a design of Chinese-English phrase translation combination automatic translation system. The article uses semantic feature analysis and phrase translation combination to improve the Chinese-English bilingual translation algorithm. In addition, cross-editing and multi-threaded phrase translation loading measures are used to complete the intelligent design of the translation system. The relevant experimental simulations show that this new design Chinese-English phrase translation combined machine automatic translation system has high translation accuracy and recall rate, few translation errors, and also has strong intelligence.
Key words:phrase translation combination;machine automatic translation system design;experimental simulation
0 引言
隨著我國互聯(lián)網(wǎng)技術(shù)的快速發(fā)展與普及,促進了很多漢英翻譯系統(tǒng)的產(chǎn)生,從而使得人們獲得漢英翻譯結(jié)果更為方便。漢英翻譯系統(tǒng)能夠依據(jù)自身的算法設(shè)置,再經(jīng)過對全網(wǎng)絡(luò)語議詞匯進行大量的搜索,最后給出相應(yīng)的翻譯結(jié)果。不過這種翻譯系統(tǒng)大部分一個共同的缺點:翻譯結(jié)果準確率不高[1-2]。為了提升漢英翻譯準確率,再隨著計算機信息技術(shù)的不斷發(fā)展與互聯(lián)網(wǎng)的普及,在翻譯系統(tǒng)研發(fā)過程中,廣泛地應(yīng)用計算機集成信息處理,從而使得漢英翻譯系統(tǒng)譯文結(jié)果的準率得到提升。本文設(shè)計新型的翻譯系統(tǒng)的英語詞匯特征通過利用語義分析措施的對其進行分析,結(jié)合語義不確定性匹配與短語自動分析方法,進行有關(guān)詞、句自動翻譯,再靈活運用短語翻譯組合措施,從而使得翻譯結(jié)果更準確。通過對漢英翻譯系統(tǒng)設(shè)計方法的改進,實現(xiàn)了翻譯系統(tǒng)智能化,不但降低了人工翻譯工作量,提高翻譯效率,而且還提升翻譯的準確率。
1 漢英自動翻譯系統(tǒng)的算法設(shè)置
1.1 建立語義本體模型
為了完成英語自動翻譯,運用機器翻譯與語義特征兩者相互結(jié)合的措施,對漢英翻譯系統(tǒng)計算法設(shè)定,建立有關(guān)翻譯模型,此模型為漢英翻譯語義本體模型[3] 。
二元語義信息是指針對某目標(或?qū)ο蟆蕜t)給出的用二元組(siai)來表示的評價值結(jié)果。其元素si和ai的含義描述如下:si為預(yù)先定義好的語言評價集S中的第i個元素,ai稱為符號轉(zhuǎn)移值,表示由計算得到的語言信息與預(yù)先定義的語言信息集S中最貼近語言短語之間的偏差,很顯然它滿足ai∈[-0.5,0.5)。Si∈S是一個語言短語,那么相應(yīng)的二元語義形式可以通過下面的函數(shù)θ獲得[3]式(1)、式(2)。
1.2 短語譯文組合的翻譯算法
立足于前文對漢英翻譯算法改進分析的基礎(chǔ)之上,建立有關(guān)短語譯文組合的措施,如以下矩陣表達式所示:
2 翻譯系統(tǒng)設(shè)計
漢英翻譯系統(tǒng)設(shè)計主要由2部分內(nèi)容構(gòu)成,分別是機器翻譯算法設(shè)計與軟件設(shè)計。該系統(tǒng)設(shè)計是立足于算法的原則上,在嵌入式狀態(tài)下,對漢英翻譯系統(tǒng)進行研發(fā),此軟件設(shè)計重點包含了3大模塊,如圖2所示。
經(jīng)過選取能夠體現(xiàn)此漢英翻譯系統(tǒng)有關(guān)信息,該信息主要指本系統(tǒng)的關(guān)聯(lián)規(guī)則特征,再采用智能化調(diào)度與關(guān)聯(lián)規(guī)則特征的信息融合的相結(jié)合措施,從而使得本系統(tǒng)管理與調(diào)度能夠?qū)崿F(xiàn)智能化[9]。在完全嵌入受控器件內(nèi)部,為特定應(yīng)用而設(shè)計的專用計算機系統(tǒng)的ARM架構(gòu)之下的進行漢英翻譯系統(tǒng)軟件設(shè)計,經(jīng)過由加州大學(xué)伯克利分校開發(fā)的開放源代碼的TinyOS操作系統(tǒng)對漢英翻譯系統(tǒng)的網(wǎng)絡(luò)組件接口進行設(shè)計,在Linux內(nèi)核下對漢英翻譯系統(tǒng)進行控制,其控制主要是該系統(tǒng)的軟件交叉編譯,從而使該系統(tǒng)的管理的智能化得到提升[9]。漢英自動翻譯系統(tǒng)的總體結(jié)構(gòu)模型,如圖3所示。
按照圖3,在B/S組織架構(gòu)下,再進行本翻譯系統(tǒng)設(shè)計,建立此翻譯系統(tǒng)的兩大體系,分別是智能化管理系統(tǒng)網(wǎng)絡(luò)結(jié)體系與數(shù)據(jù)庫體系。漢英自動翻譯系統(tǒng)管理信息系統(tǒng)能夠?qū)υ摲g系統(tǒng)的多種功能進行實現(xiàn),比如信息采信、融合、傳輸、以及集成調(diào)度[10]。
經(jīng)過先進先出的儲存器的緩沖區(qū)對漢英翻譯不確定匹配與狀態(tài)信息特點進行分析,在上位機模塊中控制此系統(tǒng)的管理信息遠距離輸送。該翻譯系統(tǒng)是憑借基礎(chǔ)層、中間層、以及應(yīng)用層三層傳輸體系進行信息輸送?;A(chǔ)層叫硬件模層;中間層也也叫處理層,即對數(shù)據(jù)、信息、以及通信等方面進行處理;應(yīng)用層其實就是使用程序的設(shè)計與加載[11]。該系統(tǒng)的信息傳輸模型,如圖4所示。
最終在TinyOS操作系統(tǒng)下進行本系統(tǒng)的組件接口設(shè)計,該系統(tǒng)通常使用三層結(jié)體系統(tǒng)設(shè)計,實施以下列交叉編譯程序:“event void phrase translation combination.booted(){call Sensor software includes vocabulary init();// In management system control//漢英翻譯系統(tǒng)信息采集初始化call Co program of translation algorithm Controt();//Mount Flash//緩沖。}[12]”
用來為傳感器節(jié)點廣播信息,就是采用在基點進行短語譯文組合信息輸送設(shè)計,通過有關(guān)轉(zhuǎn)換器對數(shù)模進行轉(zhuǎn)換控制。在對翻譯程序進行加載時,通常是運用一種比較特殊的方法,即多線程短語譯文加載與交叉編譯措施[13]。按照前文分析,就完成了本翻譯系統(tǒng)的軟件設(shè)計。
3 實驗仿真與測試驗證
為了對本文新設(shè)計的漢英雙語自動化翻譯系統(tǒng)性能進行檢測、驗證,就需要通過相關(guān)實驗仿真對其進行驗證。本實驗采用Visual DSP++軟件進行仿真,設(shè)置以下列參數(shù),如表1所示。
運用詞匯實體集Hownet,按照前文仿真環(huán)境與有關(guān)參數(shù)設(shè)置,對本文所新設(shè)計系統(tǒng)譯文結(jié)果進行仿真分析,通過兩大檢測評價指標作為對翻譯結(jié)果的評價依據(jù)[14-15],其兩大檢測評價指標分別是準確率與語義信息召回率,如圖5與圖6所示。
從圖5與圖6兩圖可知,本文新設(shè)計的漢英雙語翻譯系統(tǒng)無論在準確率,還是召回率,均比其它相關(guān)文獻模型中的翻譯系統(tǒng)均要高,由此可見本文所設(shè)計的短語譯文組合漢英翻譯系統(tǒng)的翻譯結(jié)果準確性與智能化均得到了提高。
4 總結(jié)
本文立足于漢英翻譯系統(tǒng)中改善設(shè)計措施,為了使?jié)h英語翻譯結(jié)果準確性與智能化得到提升,提出短語文組合的的漢英翻譯系統(tǒng)設(shè)計的新措施,此翻譯系統(tǒng)設(shè)計主要包含了機器翻譯多個方面對漢英翻譯算法進行改進,比如算法設(shè)計、語義特征分析、軟件設(shè)計等。在嵌入式環(huán)境中對漢英翻譯系統(tǒng)的軟件進行設(shè)計等內(nèi)容。最后還通實驗仿真,仿真結(jié)果表明:此文新設(shè)計的短語譯文組合的漢英雙語翻譯系統(tǒng)較之其它翻譯系統(tǒng)翻譯結(jié)果準確性高,智能化性強。
參考文獻
[1] 姜婷婷,肖衛(wèi)東,張翀,等.基于桑基圖的時間序列文件本可視化方法[J].計算機應(yīng)用研究,2016,33(9):2683-2687.
[2] 邢慧慧.基于功能翻譯理論的英語翻譯研究[J].大學(xué)教育,2019,11(1):114-116.
[3] 皮謹煜. 英文語義機器翻譯中的模糊語義選取技術(shù)[J].現(xiàn)代電子技術(shù),2017,22(40):42-44.
[4] 林寒.基于多語言交互的英語翻譯在線輔助系統(tǒng)設(shè)計[J].現(xiàn)代電子技術(shù),2019,13(3):22-25.
[5] 范靜.在線自動評價系統(tǒng)在大學(xué)英語四級翻譯中的應(yīng)用研究[J].考試與評價(大學(xué)英語教研版),2019,6(15):152-155.
[6] 解倩倩,艾山·吾買,吐爾根·依布拉音,等.混合策略的漢維輔助翻譯系統(tǒng)的設(shè)計與實現(xiàn)[J].現(xiàn)代電子技術(shù),2017,8(20):5-9.
[7] 羅霞.海量互聯(lián)網(wǎng)數(shù)據(jù)中英語翻譯術(shù)語高效搜索系統(tǒng)設(shè)計[J].現(xiàn)代電子技術(shù),2017,1(7):134-136.
[8] 崔丹.英語翻譯計算機智能校對系統(tǒng)設(shè)計[J].現(xiàn)代電子技術(shù),2019,2(16):179-182.
[9] 斯·勞格勞.蒙古語固定短語識別算法的設(shè)計與實現(xiàn)[J].中文信息學(xué)報,2017(5):85-91.
[10] 王文輝,吳敏華,駱力明,等.基于相似度算法的英語智能問答系統(tǒng)設(shè)計與實現(xiàn)[J].計算機應(yīng)用與軟件,2017,15(6):62-68.
[11] 粟千.弱化語法規(guī)則下英文機器翻譯的優(yōu)化仿真[J].計算機仿真,2016,15(11):414-417.
[12] 李業(yè)剛,梁麗君,孫福振,等.融入雙語最大名詞短語的機器翻譯模型[J].計算機應(yīng)用研究,2017,15(5):1316-1320.
[13] 郭蕾.基于自然語言處理的英語翻譯計算機智能評分系統(tǒng)設(shè)計[J].現(xiàn)代電子技術(shù),2019,15(2):158-160.
[14] 張岳琢.記憶輔助型長字符英語自動翻譯系統(tǒng)設(shè)計[J].自動化儀器測試,2018,25(10):116-118.
[15] 朱明瑋.基于樞軸語言的漢越短語機器翻譯方法研究[D].昆明:昆明大學(xué),2018.
(收稿日期:2019.09.12)