馬榮琴
(西安培華學(xué)院 國(guó)際教育學(xué)院, 西安 710125)
我國(guó)社會(huì)經(jīng)濟(jì)發(fā)展較為迅速,并且我國(guó)對(duì)外開放也在進(jìn)一步的擴(kuò)大,在此背景下對(duì)于外語(yǔ)專業(yè)人才的需求量也在不斷擴(kuò)大。語(yǔ)言和文化的溝通更加便捷,以此能夠良好的學(xué)習(xí)世界先進(jìn)文化技術(shù)?;谌蚧l(fā)展,科學(xué)技術(shù)也在持續(xù)創(chuàng)新及進(jìn)步,從而實(shí)現(xiàn)多元化的外語(yǔ)學(xué)習(xí)途徑,包括電子翻譯工具發(fā)展,人們對(duì)其的實(shí)用性及功能性也在持續(xù)提高。電子辭典的主要優(yōu)勢(shì)就是智能化、功能全面及便攜化,在Android系統(tǒng)中的移動(dòng)電子辭典使我國(guó)人們能夠更好的學(xué)習(xí)外語(yǔ)。在移動(dòng)網(wǎng)絡(luò)不斷發(fā)展的過(guò)程中,移動(dòng)終端逐漸代替了互聯(lián)網(wǎng)終端,其在現(xiàn)代社會(huì)中發(fā)展較為迅速,所以其潛力也是無(wú)法估計(jì)的,移動(dòng)終端應(yīng)用軟件發(fā)展空間比較大。在電子辭典使用越來(lái)更加廣泛的過(guò)程中,通過(guò)高端信息技術(shù)對(duì)語(yǔ)言轉(zhuǎn)換進(jìn)行輔助處理,能夠使人們有效發(fā)展技術(shù)。人機(jī)界面系統(tǒng)在英語(yǔ)智能法益系統(tǒng)中具有重要的作用,所以要求其能夠滿足人類的語(yǔ)言特點(diǎn)。
翻譯是指國(guó)家和國(guó)家語(yǔ)言之間的轉(zhuǎn)換方式,通過(guò)翻譯能夠?qū)涣鲗?duì)象想要表達(dá)的含義進(jìn)行有效掌握。比如英文及中文,在兩種語(yǔ)言較為過(guò)程中要利用最基本方式實(shí)現(xiàn)轉(zhuǎn)變,包括詞義和語(yǔ)法的轉(zhuǎn)換。但是,由于語(yǔ)言的文化范圍比較廣,而且還因?yàn)楸就廖幕?、思維等多方面的限制,傳統(tǒng)的翻譯中具有多種不足,無(wú)法滿足現(xiàn)代人們對(duì)翻譯的需求。第一,無(wú)法實(shí)現(xiàn)語(yǔ)言思路的有效理解。因?yàn)槲鞣絿?guó)家語(yǔ)言比較開放,在不同語(yǔ)境中詞語(yǔ)具有較多的含義,在對(duì)英語(yǔ)語(yǔ)言內(nèi)在含義分析的過(guò)程中,此方面值得人們重點(diǎn)考慮。第二,在翻譯過(guò)程中的方式。因?yàn)橛⒄Z(yǔ)預(yù)防具有多樣化的特點(diǎn),所以在翻譯過(guò)程中要求利用不同語(yǔ)法實(shí)現(xiàn)辨別,包括如何實(shí)現(xiàn)在短時(shí)間內(nèi)進(jìn)行定位翻譯,此方面是非常難以控制的[1]。
本文在實(shí)現(xiàn)人機(jī)界面系統(tǒng)設(shè)計(jì)過(guò)程中使用功能C/S結(jié)構(gòu),也就是用戶能夠利用Android手機(jī)等客戶端和網(wǎng)絡(luò)端口相互連接,利用服務(wù)器實(shí)現(xiàn)單詞在線翻譯。本文所設(shè)計(jì)系統(tǒng)的額客戶端能夠?qū)Κ?dú)立單詞進(jìn)行翻譯,單絲由于客戶端數(shù)據(jù)庫(kù)及配置等因素的影響,導(dǎo)致客戶端不能夠進(jìn)行翻譯??蛻舳说闹饕獌?yōu)點(diǎn)就是響應(yīng)速度比較快,而且能夠?qū)π畔⑦M(jìn)行實(shí)時(shí)的響應(yīng)。其主要的具體流程為:使數(shù)據(jù)利用客戶端與服務(wù)器相互結(jié)合進(jìn)行工作,假如服務(wù)器響應(yīng)客戶端請(qǐng)求,那么此服務(wù)器就能夠通過(guò)預(yù)定規(guī)則實(shí)現(xiàn)客戶端請(qǐng)求,然后返回結(jié)果,使應(yīng)用服務(wù)器中的運(yùn)行數(shù)據(jù)負(fù)荷得到降低。
以此表示,本文所使研究的系統(tǒng)是在查詢網(wǎng)絡(luò)服務(wù)器端所安裝的,其能夠?qū)⒎?wù)器的處理能管理充分的發(fā)揮出現(xiàn)。在用戶將單詞輸入到手機(jī)客戶端,從而對(duì)數(shù)據(jù)進(jìn)行初步處理,然后接入到服務(wù)器端中,然后以實(shí)際的請(qǐng)求為基礎(chǔ)實(shí)現(xiàn)翻譯。客戶端和服務(wù)器端都能夠?qū)⒆陨碜饔贸浞值陌l(fā)揮出來(lái),以此有效促進(jìn)客戶端相應(yīng),解決收集數(shù)據(jù)存儲(chǔ)量的問(wèn)題。系統(tǒng)網(wǎng)路結(jié)構(gòu),如圖1所示。
圖1 使用C/S網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)圖
翻譯能夠?qū)o(wú)法聽懂的語(yǔ)言轉(zhuǎn)變成為便于理解的語(yǔ)言,使聽者能夠了解語(yǔ)言表達(dá)的含義。比如英語(yǔ)翻譯就是將英語(yǔ)翻譯成為本國(guó)語(yǔ)言,要利用語(yǔ)言轉(zhuǎn)換開展。雖然人工翻譯水平在不斷提高,但是在編制及依法轉(zhuǎn)換等方面具有一定的問(wèn)題。在研發(fā)智能翻譯器的過(guò)程中,其主要目的就是為翻譯人員提供精準(zhǔn)服務(wù),有效提高英語(yǔ)和其他語(yǔ)言處理效率。本文設(shè)計(jì)智能翻譯器系統(tǒng)的優(yōu)勢(shì)為:
其一,具有目標(biāo)性。使用翻譯器的主要目的就是將英語(yǔ)進(jìn)行翻譯,此方面也是智能翻譯器的設(shè)計(jì)目標(biāo)。隨著國(guó)際化的發(fā)展,英語(yǔ)逐漸成為了世界中的主要語(yǔ)言,其具有一定的適應(yīng)性,實(shí)現(xiàn)智能翻譯器的開發(fā)能夠使英語(yǔ)翻譯水平得到有效的提高。
其二,智能性。翻譯器能夠?qū)⒆陨硪延姓Z(yǔ)言翻譯成為理解方便的語(yǔ)言,對(duì)于其中多余語(yǔ)言進(jìn)行簡(jiǎn)單分析進(jìn)行轉(zhuǎn)變,智能翻譯系統(tǒng)以普通翻譯系統(tǒng)為基礎(chǔ),增加了智能模式,只需要以語(yǔ)言音頻為基礎(chǔ),就能夠?qū)崿F(xiàn)和其他語(yǔ)言的及時(shí)轉(zhuǎn)換,具有較高的智能化水平。
其三,功能性。翻譯器自身屬于翻譯機(jī),其也是翻譯聊天及在線翻譯的工具。翻譯工具和翻譯器的結(jié)合,利用人機(jī)界面系統(tǒng)能夠有效服務(wù)于用戶?;赑LC的智能界面系統(tǒng),如圖2所示。
圖2 基于PLC的智能界面系統(tǒng)
智能翻譯器不僅能夠?qū)崿F(xiàn)語(yǔ)言轉(zhuǎn)換,也能夠?qū)崿F(xiàn)字詞、語(yǔ)句含義的校正,保證翻譯之后能夠被聽懂[2]。
2.3.1 系統(tǒng)組成
人機(jī)界面翻譯系統(tǒng)的硬件主要包括顯示器、主機(jī)和圖像采集卡,軟件系統(tǒng)根據(jù)使用功能分為預(yù)處理、特征提取、圖像分割及分類器設(shè)計(jì)4個(gè)模塊。此系統(tǒng)處理的流程詳如圖3所示。
圖3 人機(jī)界面翻譯系統(tǒng)的處理流程
其處理流程為:其一,利用收集卡通過(guò)檢測(cè)系統(tǒng)得到視頻流,使視頻流中的每幀都屬于處理圖像;其二,實(shí)現(xiàn)圖像的灰度化,將背景進(jìn)行去除從而得到二值化圖像,之后實(shí)現(xiàn)切割,從而能夠得到單詞和字符圖像;其三,將字符特征進(jìn)行提取,通過(guò)分類器將單詞識(shí)別結(jié)果進(jìn)行提??;其四,將單詞所對(duì)應(yīng)的中文詞條進(jìn)行展現(xiàn)。
2.3.1 預(yù)處理
因?yàn)榇讼到y(tǒng)所處理的內(nèi)容是通過(guò)收集卡從檢測(cè)主機(jī)接口中得到,并沒有出現(xiàn)失真的情況,大部分的檢測(cè)程序界面也都是通過(guò)表格、字符等構(gòu)成,那么此模塊的主要功能就是將不是字符的內(nèi)容進(jìn)行去除,從而得到二值化文本?;趨^(qū)域灰度差生長(zhǎng)算法實(shí)現(xiàn)描述,分別通過(guò)水平及垂直兩方面對(duì)文本進(jìn)行掃描,在累加值比預(yù)設(shè)閾值大的時(shí)候,那么就表示為表格線條,以此得到二值化文本。
2.3.2 圖像分割
正確分割才能夠得出正確識(shí)別對(duì)象,以此有效實(shí)現(xiàn)圖像分析。如果沒有實(shí)現(xiàn)正確分割,那么之后的工作也就沒有意義。所以,圖像分割在系統(tǒng)中具有較大的意義。為了能夠有效得到單一字符和單詞,一般的方法就是實(shí)現(xiàn)文檔圖像水平投影及垂直投影。水平投影之后得到的行之間間隙也就是空白行,以間隙閾值設(shè)置,實(shí)現(xiàn)字符行的分割。垂直投影能夠?qū)⒆址g間隙進(jìn)行展現(xiàn),實(shí)現(xiàn)間隙閾值設(shè)置,實(shí)現(xiàn)多字符的分割。
對(duì)于重疊字符的切割過(guò)程中,可以使用連通域法、繞切法等,但是此算法比較復(fù)雜,而且耗時(shí)較長(zhǎng),具有較大的計(jì)算量,無(wú)法在此系統(tǒng)中使用。所以,對(duì)于重疊字符可以是回用斷裂字符方式實(shí)現(xiàn)切割。其中陰影的部分屬于字符的重疊部分,此不會(huì)會(huì)導(dǎo)致累積誤差,在進(jìn)行識(shí)別的時(shí)候要對(duì)其全面考慮,從而使識(shí)別正確率得到降低。為了將此陰影部分提出,可以擴(kuò)展陰影部分,使其成為輕微斷裂字符。
2.3.3 特征提取
分類器屬于識(shí)別系統(tǒng)核心,特征提取和分類器設(shè)置都屬于關(guān)鍵內(nèi)容,假如特征提取具備一定的辨識(shí)性,就能夠是分類器設(shè)計(jì)和能力得到簡(jiǎn)化,并且對(duì)特征提取造成制約。為了能夠?qū)崿F(xiàn)各類之間可分性判斷,就提出了多種判據(jù),并且實(shí)現(xiàn)最小特征維數(shù),提高分類器分類的精準(zhǔn)性。將需要是被的樣本及基準(zhǔn)末班之間距離作為分類判決的函數(shù),此種分類器
屬于距離測(cè)度分類器。通過(guò)實(shí)踐表示,此屬于較為直觀且有效的分類方式。以下為特征提取的主要代碼:
int main( int argc, char** argv )
{
IplImage * src= cvLoadImage("E:Download est1.jpg",1);
IplImage* hsv = cvCreateImage( cvGetSize(src), 8, 3 );
IplImage* h_plane = cvCreateImage( cvGetSize(src), 8, 1 );
IplImage* s_plane = cvCreateImage( cvGetSize(src), 8, 1 );
IplImage* v_plane = cvCreateImage( cvGetSize(src), 8, 1 );
IplImage* planes[] = { h_plane, s_plane };
int h_bins = 16, s_bins = 8;
int hist_size[] = {h_bins, s_bins};
cvNamedWindow( "Source", 1 );
cvShowImage( "Source", src );
cvNamedWindow( "H-S Histogram", 1 );
cvShowImage( "H-S Histogram", hist_img );
cvWaitKey(0);
}
通過(guò)分類器識(shí)別得到單一的英語(yǔ)單詞,因?yàn)榉诸愬e(cuò)誤是無(wú)法避免的,所以就要進(jìn)一步處理分類的結(jié)果。分類器實(shí)現(xiàn)分類的過(guò)程中主要是實(shí)現(xiàn)單一字符識(shí)別,并沒有充分使用上下文的信息。對(duì)于重復(fù)字符分割結(jié)果,根據(jù)置信度從高到低順序,將候選的字符融入到單詞中,之后從詞典中查找,在查找成功之后,就表示此為識(shí)別的結(jié)果。如果候選的字符為非法,那么就要對(duì)此字符進(jìn)行拒識(shí)處理。對(duì)于具有拒識(shí)字符的單詞,在實(shí)現(xiàn)單詞查找過(guò)程中進(jìn)行忽略。
為了能夠提高翻譯效果,不僅要逐個(gè)的解釋單詞,還要實(shí)現(xiàn)復(fù)雜長(zhǎng)句的翻譯。那么本文就基于實(shí)際特點(diǎn),將逐句翻譯但是無(wú)法滿足中文語(yǔ)序習(xí)慣的句子或者詞組組合成為整體,實(shí)現(xiàn)有效的識(shí)別。對(duì)于較短的句子,也可以使用以上方法處理。但是對(duì)于較長(zhǎng)的段落或者句子,比如幫助性文檔,如果使用此種處理方式實(shí)現(xiàn)處理無(wú)法滿足系統(tǒng)實(shí)時(shí)性的需求。那么可以使用抽樣匹配的方式實(shí)現(xiàn)全文匹配,最終有效實(shí)現(xiàn)全文翻譯[3]。
其中的檢測(cè)系統(tǒng)界面,畫面變化比較頻繁的就是在實(shí)現(xiàn)數(shù)據(jù)收集,在制定場(chǎng)景中,收集數(shù)據(jù)變化一般不會(huì)影響到場(chǎng)景,而且操作人員在對(duì)于檢測(cè)系統(tǒng)操作過(guò)程中并不頻繁,場(chǎng)景切換也不會(huì)發(fā)生太大變化,以此降低系統(tǒng)負(fù)擔(dān),提高了界面的顯示效果。
在我國(guó)不斷對(duì)外開放的過(guò)程中,對(duì)外交流機(jī)會(huì)也在增加,為了能夠?qū)崿F(xiàn)世界技術(shù)的在線學(xué)習(xí),發(fā)揚(yáng)中華文化,對(duì)外語(yǔ)專業(yè)人才的需求較高,使人們能夠隨時(shí)隨地的使用手機(jī)實(shí)現(xiàn)外語(yǔ)學(xué)習(xí)。智能翻譯系統(tǒng)的設(shè)計(jì)和研發(fā),不僅方便了廣大語(yǔ)言學(xué)習(xí)人員及研究人員的使用需求,還能夠創(chuàng)建功能多樣化的語(yǔ)言轉(zhuǎn)換平臺(tái)。