關(guān)鍵詞:人工智能;自動(dòng)翻譯;處理器
中圖分類號(hào):TP18;TP391.2 文獻(xiàn)標(biāo)識(shí)碼:A
0 引言
在信息化技術(shù)不斷發(fā)展的過(guò)程中,為了提高機(jī)器自動(dòng)翻譯精準(zhǔn)度,可以使用人工智能處理器作為自動(dòng)翻譯系統(tǒng)的載體。自動(dòng)翻譯系統(tǒng)是通過(guò)語(yǔ)義的方式詳細(xì)分析英語(yǔ)詞匯的特征,從而實(shí)現(xiàn)詞匯和語(yǔ)句的自動(dòng)化翻譯,提高翻譯精準(zhǔn)度[1]。
1 系統(tǒng)的架構(gòu)設(shè)計(jì)
圖1 為機(jī)器自動(dòng)翻譯系統(tǒng)的架構(gòu),該系統(tǒng)主要分為翻譯管理、系統(tǒng)管理和用戶應(yīng)用等模塊。通過(guò)翻譯模塊翻譯自然語(yǔ)句,將翻譯結(jié)果傳遞給用戶。用戶在使用系統(tǒng)的過(guò)程中,能夠在翻譯界面輸入相應(yīng)的翻譯請(qǐng)求,利用神經(jīng)網(wǎng)絡(luò)翻譯模型開展操作[2]。
2 機(jī)器自動(dòng)翻譯系統(tǒng)的硬件設(shè)計(jì)
2.1 客戶端設(shè)計(jì)
將需要翻譯的文字內(nèi)容傳輸?shù)绞謾C(jī)中,利用圖片的方式在云端服務(wù)器中上傳翻譯內(nèi)容,或者直接選擇本地圖片庫(kù)中的文字圖片,再在云端服務(wù)器中上傳。利用超文本傳輸協(xié)議(hypertexttransfer protocol,HTTP)將選擇的圖片傳輸?shù)皆贫朔?wù)器,使用光學(xué)字符識(shí)別(optical characterrecognition,OCR)軟件對(duì)圖片進(jìn)行識(shí)別,再編輯文本內(nèi)容。在翻譯過(guò)程中對(duì)源語(yǔ)言文本內(nèi)容進(jìn)行識(shí)別,實(shí)現(xiàn)目標(biāo)語(yǔ)言文本內(nèi)容的翻譯,再將翻譯的內(nèi)容傳輸給用戶。用戶能夠編輯客戶端中的源語(yǔ)言文本和目標(biāo)語(yǔ)言文本,還能夠通過(guò)互聯(lián)網(wǎng)搜索用戶需要的內(nèi)容。結(jié)合客戶端的工作需求和流程,將其功能劃分為在線搜索、圖片編輯、圖片拍照和保存、保存翻譯文本等。在簡(jiǎn)單處理文本內(nèi)容后,將翻譯請(qǐng)求和圖片信息發(fā)送到服務(wù)器中,從而設(shè)計(jì)客戶端,縮短目標(biāo)翻譯文本時(shí)間,并且提高翻譯精準(zhǔn)度。
2.2 人工智能處理器
人工智能處理器的主要特點(diǎn)是計(jì)算密集。要求通過(guò)多臺(tái)人工智能處理器對(duì)用戶服務(wù)請(qǐng)求進(jìn)行處理,從而及時(shí)翻譯。利用人工智能技術(shù)對(duì)文本信息識(shí)別與處理,然后以文本信息提取、定位和分割的算法對(duì)文本信息特征進(jìn)行識(shí)別,從而得出標(biāo)準(zhǔn)編碼,輸出結(jié)果。
通過(guò)Tesseract-OCR 2.3(多格式轉(zhuǎn)化軟件)實(shí)現(xiàn)人工智能處理器的功能。其屬于人工智能引擎,在優(yōu)化之后能夠提高人工智能處理器的精度,并且支持中英文語(yǔ)境。根據(jù)用戶的實(shí)際需求,安排客戶端工作流程,然后對(duì)客戶端架構(gòu)進(jìn)行設(shè)計(jì)。通過(guò)人工智能技術(shù)對(duì)人工智能處理的流程進(jìn)行設(shè)計(jì),然后設(shè)計(jì)系統(tǒng)硬件功能[3]。
3 機(jī)器自動(dòng)翻譯系統(tǒng)的軟件功能設(shè)計(jì)
在機(jī)器自動(dòng)翻譯系統(tǒng)的軟件功能設(shè)計(jì)過(guò)程中,先提取系統(tǒng)的關(guān)聯(lián)規(guī)則信息,再以智能調(diào)度和信息融合等技術(shù)對(duì)系統(tǒng)數(shù)據(jù)進(jìn)行管理。根據(jù)系統(tǒng)各層結(jié)構(gòu)優(yōu)化架構(gòu)體系,要求系統(tǒng)具備翻譯短語(yǔ)的功能。利用模數(shù)轉(zhuǎn)換器將模擬信號(hào)轉(zhuǎn)換為數(shù)字信息,然后設(shè)計(jì)系統(tǒng)的軟件功能。
3.1 自動(dòng)翻譯功能
將翻譯語(yǔ)句劃分為多個(gè)不同的詞匯,然后結(jié)合關(guān)鍵詞匯對(duì)系統(tǒng)數(shù)據(jù)庫(kù)中的信息進(jìn)行調(diào)用。在設(shè)計(jì)自動(dòng)翻譯功能的過(guò)程中,依據(jù)不同的語(yǔ)境選擇合適譯文,在翻譯結(jié)果中加載譯文并且顯示。此外,根據(jù)句子結(jié)構(gòu)的特點(diǎn)優(yōu)化譯文,提高翻譯結(jié)果精確度。自動(dòng)翻譯功能子模塊包括:①索引模塊。索引模塊負(fù)責(zé)創(chuàng)建翻譯文本對(duì),使用索引處理功能自動(dòng)校對(duì)翻譯文本,提高譯文關(guān)聯(lián)性和翻譯效率。②翻譯模塊。翻譯模塊能夠拆分句子,從而形成大量短句并進(jìn)行遍歷,之后通過(guò)系統(tǒng)數(shù)據(jù)庫(kù)匹配較好的翻譯結(jié)果。
3.2 用戶管理功能
用戶管理主要是管理用戶的操作權(quán)限和個(gè)人信息。用戶只有輸入正確的用戶名和密碼后才能夠訪問系統(tǒng),提高系統(tǒng)設(shè)計(jì)的安全性。在管理用戶操作權(quán)限時(shí),要求設(shè)置不同用戶的操作權(quán)限,從而提高系統(tǒng)訪問的安全性。
3.3 項(xiàng)目管理功能
在對(duì)項(xiàng)目管理功能進(jìn)行設(shè)計(jì)時(shí),要求創(chuàng)建譯文和原文。在系統(tǒng)服務(wù)器中設(shè)置譯文傳輸請(qǐng)求操作,系統(tǒng)收到譯文請(qǐng)求后,調(diào)用數(shù)據(jù)庫(kù),自動(dòng)匹配相關(guān)術(shù)語(yǔ),創(chuàng)建索引關(guān)系,以實(shí)現(xiàn)自動(dòng)生成譯文。
3.4 校對(duì)功能
校對(duì)功能通過(guò)校對(duì)語(yǔ)句的長(zhǎng)短和含義一致性,提高系統(tǒng)譯文的精準(zhǔn)度。根據(jù)拆分句子結(jié)構(gòu)的特點(diǎn),對(duì)不同模塊的翻譯情況進(jìn)行對(duì)比。如果句子翻譯前后不同,系統(tǒng)能夠自動(dòng)標(biāo)記翻譯文本,并且為用戶提示錯(cuò)誤,用戶就能夠重新翻譯。假如字段在默認(rèn)的翻譯范圍,系統(tǒng)能夠自動(dòng)生成翻譯結(jié)果。此功能主要包括3 個(gè)層面。
(1)頂層。頂層能夠校對(duì)系統(tǒng)的翻譯結(jié)果,并且下發(fā)翻譯作業(yè)命令,顯示校對(duì)結(jié)果。
(2)中層。中層包括句長(zhǎng)檢測(cè)、情感分析和術(shù)語(yǔ)提取,根據(jù)相應(yīng)邏輯關(guān)系提取術(shù)語(yǔ),并且對(duì)術(shù)語(yǔ)正確性完成校對(duì),這保證了表達(dá)方式的合理性和句子的完整性。
(3)底層。底層為校對(duì)功能基礎(chǔ),能夠處理中英文文本,包括中文分詞、英語(yǔ)句子和詞性標(biāo)準(zhǔn)等。
3.5 檢索和索引功能
系統(tǒng)結(jié)合翻譯操作和數(shù)據(jù)庫(kù),以實(shí)際需求實(shí)現(xiàn)索引關(guān)系的創(chuàng)建,并且調(diào)用翻譯信息,滿足翻譯智能化需求。在開展翻譯工作的過(guò)程中,為了使翻譯結(jié)果精準(zhǔn)度得到提高,要求實(shí)現(xiàn)譯文信息索引的創(chuàng)建。將校對(duì)功能模塊與數(shù)據(jù)庫(kù)進(jìn)行連接,提高命令傳輸?shù)陌踩訹4]。
4 系統(tǒng)運(yùn)行功能測(cè)試
4.1 語(yǔ)料庫(kù)
為了對(duì)本文設(shè)計(jì)的系統(tǒng)翻譯效果進(jìn)行測(cè)試,選擇英漢新聞?lì)I(lǐng)域中的語(yǔ)句進(jìn)行翻譯,其中訓(xùn)練集、開發(fā)集和測(cè)試集各20000 個(gè)。
4.2 系統(tǒng)翻譯性能測(cè)試
為了對(duì)比本系統(tǒng)的翻譯性能,使用本系統(tǒng)對(duì)簡(jiǎn)單陳述句、并列復(fù)合句、一般疑問句等句型進(jìn)行翻譯。由不同句型的翻譯結(jié)果(表1)可知,除了復(fù)雜的從屬?gòu)?fù)合句有一些失誤之外,本系統(tǒng)在單詞、結(jié)構(gòu)和語(yǔ)義等方面的翻譯準(zhǔn)確率可達(dá)100%。
4.3 系統(tǒng)翻譯質(zhì)量
表2 中Q1 為翻譯能力一般的初級(jí)翻譯組,Q2為翻譯經(jīng)驗(yàn)豐富的高級(jí)翻譯組。根據(jù)雙語(yǔ)替換測(cè)評(píng)(bilingual evaluation understudy,BLEU)分?jǐn)?shù),對(duì)比兩個(gè)翻譯組使用本系統(tǒng)前后的翻譯質(zhì)量。BLEU分?jǐn)?shù)是一種評(píng)估機(jī)器翻譯質(zhì)量的度量,其分?jǐn)?shù)范圍為0 ~ 1。分?jǐn)?shù)越高表示機(jī)器翻譯的質(zhì)量越好。由表2 可知,使用本系統(tǒng)后,高級(jí)翻譯組和初級(jí)翻譯組的BLEU 分?jǐn)?shù)明顯提高,表明本系統(tǒng)能夠提高翻譯質(zhì)量,優(yōu)化翻譯效果[5]。
5 結(jié)語(yǔ)
基于人工智能處理器的機(jī)器自動(dòng)翻譯系統(tǒng)以人工智能處理器為基礎(chǔ),設(shè)計(jì)了軟硬件功能。測(cè)試結(jié)果表示,該系統(tǒng)能夠提高句子翻譯的準(zhǔn)確率和質(zhì)量。希望通過(guò)本文研究,為今后自動(dòng)化翻譯系統(tǒng)設(shè)計(jì)提供相應(yīng)的理論基礎(chǔ)。