国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于規(guī)則和統(tǒng)計(jì)的機(jī)器翻譯方法歧義問(wèn)題比較分析

2010-09-05 09:57馬建軍
關(guān)鍵詞:多義詞歧義句法

馬建軍

(大連理工大學(xué)外國(guó)語(yǔ)學(xué)院,遼寧大連116024)

基于規(guī)則和統(tǒng)計(jì)的機(jī)器翻譯方法歧義問(wèn)題比較分析

馬建軍

(大連理工大學(xué)外國(guó)語(yǔ)學(xué)院,遼寧大連116024)

文章通過(guò)對(duì)SYSTRAN和GOOGL E兩個(gè)機(jī)譯系統(tǒng)90句商務(wù)英語(yǔ)英漢翻譯譯文的比較分析,從詞義歧義和句法歧義兩方面,研究基于規(guī)則(RBMT)和基于統(tǒng)計(jì)(SMT)兩種機(jī)器翻譯方法的消歧處理的優(yōu)與劣。研究表明,基于統(tǒng)計(jì)方法詞義消歧強(qiáng)于基于規(guī)則方法,而句法消除歧義能力相當(dāng)。詞義歧義問(wèn)題主要集中在動(dòng)詞多義詞和名詞多義詞,而句法歧義問(wèn)題則集中在定語(yǔ)、狀語(yǔ)和從句。動(dòng)詞與介詞搭配,名詞與介詞搭配作定語(yǔ)和狀語(yǔ),以及具有商務(wù)內(nèi)涵的動(dòng)詞和名詞,成為機(jī)器翻譯的難點(diǎn)。

機(jī)器翻譯;詞義歧義;句法歧義;RBMT;SMT

一、引 言

基于規(guī)則機(jī)器翻譯(RBMT)和基于統(tǒng)計(jì)機(jī)器翻譯(SMT)是機(jī)器翻譯的兩個(gè)主要方法。這兩種方法截然不同,其主要區(qū)別在于是否需要語(yǔ)言知識(shí)庫(kù)。基于規(guī)則機(jī)器翻譯主要依賴(lài)人工提取的規(guī)則所建立的各類(lèi)語(yǔ)言知識(shí)庫(kù),包括詞法、句法、語(yǔ)義及與語(yǔ)言知識(shí)有關(guān)的世界知識(shí);基于統(tǒng)計(jì)機(jī)器翻譯不需要語(yǔ)言知識(shí)庫(kù),而是依賴(lài)大量的雙語(yǔ)語(yǔ)料庫(kù),通過(guò)機(jī)器估計(jì)翻譯模型參數(shù)執(zhí)行翻譯。

根據(jù)2005年NIST機(jī)器翻譯評(píng)測(cè)結(jié)果來(lái)看,基于統(tǒng)計(jì)方法似乎優(yōu)于基于規(guī)則方法[1]?;谝?guī)則機(jī)器翻譯方法的代表性機(jī)譯系統(tǒng)是SYSTRAN,至今已應(yīng)用了30多年,而基于統(tǒng)計(jì)機(jī)器翻譯的代表性機(jī)譯系統(tǒng)是GOOGLE。2005年NIST機(jī)器翻譯評(píng)測(cè)結(jié)果表明, GOOGLE在所有四項(xiàng)測(cè)評(píng)中均名列第1;而SYSTRAN在參加的兩項(xiàng)測(cè)評(píng)中,分列第7和第12[1]。

影響機(jī)器翻譯質(zhì)量的問(wèn)題有許多,但問(wèn)題主要集中在語(yǔ)言學(xué)方面[2][3]。歧義問(wèn)題就是關(guān)鍵問(wèn)題之一,已經(jīng)成為機(jī)器翻譯發(fā)展的瓶頸。然而,機(jī)器翻譯歧義問(wèn)題研究大部分工作是討論理想模式下的歧義問(wèn)題,即語(yǔ)言本身的歧義或因語(yǔ)言不同在翻譯過(guò)程中產(chǎn)生的歧義問(wèn)題,而少有針對(duì)某一具體的機(jī)譯系統(tǒng)或方法[4][5]。

本文擬對(duì)SYSTRAN和GOOGLE機(jī)譯系統(tǒng)英漢翻譯歧義問(wèn)題進(jìn)行比較分析,研究基于規(guī)則和基于統(tǒng)計(jì)兩種機(jī)器翻譯方法的消歧處理的優(yōu)與劣。研究結(jié)果有助于兩種主流機(jī)器翻譯方法找出問(wèn)題所在,突破語(yǔ)言學(xué)方面的發(fā)展瓶頸,從而提高機(jī)器翻譯的質(zhì)量。

二、研究方法

1.歧義項(xiàng)

本文選擇對(duì)英漢翻譯歧義問(wèn)題進(jìn)行分析。歧義問(wèn)題包括詞義和句法兩個(gè)方面[4]。詞義歧義主要研究多義詞詞義、術(shù)語(yǔ)詞義和固定搭配詞義。多義詞既包括本身具有多個(gè)含義的詞,也包括那些引起翻譯歧義的詞,即在源語(yǔ)言中詞義只有一個(gè),但是在目標(biāo)語(yǔ)言中存在多種含義或不同的表達(dá)的詞。如repetition,其英文含義只有一個(gè),即something that you say or do that have already said or done before,但是其相應(yīng)的中文表達(dá)有兩個(gè):重復(fù),或重復(fù)的話(huà),中文含義明顯不同。對(duì)多義詞的判斷本文以COBUILD英漢雙解詞典為準(zhǔn)[6]。多義詞詞義具體細(xì)分為動(dòng)詞詞義、名詞詞義、形容詞詞義、副詞詞義和介詞詞義。其中,為研究方便,動(dòng)詞還包括由“be+adj.”構(gòu)成的謂語(yǔ)動(dòng)詞;形容詞只包括作為名詞修飾語(yǔ)的形容詞;介詞只包括那些本身有具體詞義的介詞,如besides,concerning,till等,而與動(dòng)詞、名詞和形容詞構(gòu)成固定搭配的介詞則在分析動(dòng)詞、名詞和形容詞時(shí)一并考慮。術(shù)語(yǔ)指在具體語(yǔ)境下有特殊含義的短語(yǔ),如bill of lading(提單),the dead freight(空倉(cāng)運(yùn)費(fèi)),contract terms(合同條款)等。固定搭配包括固定短語(yǔ)和習(xí)語(yǔ),如:on account of,with the exception of,in case of等。句法歧義則主要研究從句、定語(yǔ)、狀語(yǔ)和否定四個(gè)方面。

2.評(píng)價(jià)標(biāo)準(zhǔn)

根據(jù)嚴(yán)復(fù)的“信、達(dá)、雅”原則,本文從譯文的忠實(shí)度和流暢度兩個(gè)方面對(duì)歧義問(wèn)題進(jìn)行分析。但是本文認(rèn)為,忠實(shí)度和流暢度并不是相互獨(dú)立的,忠實(shí)度為前提,如果譯文不準(zhǔn)確,無(wú)論表達(dá)有多流暢,多符合目標(biāo)語(yǔ)言的表達(dá)習(xí)慣,其翻譯質(zhì)量為零。因此,本文采用忠實(shí)度和流暢度合并的方法,具體標(biāo)準(zhǔn)如表1所示。

表1 評(píng)價(jià)標(biāo)準(zhǔn)

3.評(píng)價(jià)方法

步驟1:各歧義項(xiàng)得分記為SX,其中X代表所觀察的歧義項(xiàng),具體包括:詞義、句法、多義詞詞義、動(dòng)詞詞義、名詞詞義、形容詞詞義、副詞詞義、介詞詞義、固定搭配詞義、術(shù)語(yǔ)詞義、從句、定語(yǔ)、狀語(yǔ)、否定。其中,詞義包括多義詞詞義、固定搭配詞義和術(shù)語(yǔ)詞義;多義詞詞義包括動(dòng)詞詞義、名詞詞義、形容詞詞義、副詞詞義和介詞詞義;句法包括從句、定語(yǔ)、狀語(yǔ)和否定。它們的關(guān)系用數(shù)學(xué)公式表示如下:

{詞義}={多義詞詞義}{固定搭配詞義}{術(shù)語(yǔ)詞義}

{多義詞詞義}={動(dòng)詞詞義}{名詞詞義}{形容詞詞義}{副詞詞義}{介詞詞義}

{句法}={從句}{定語(yǔ)}{狀語(yǔ)}{否定}

步驟2:每個(gè)具體觀察項(xiàng)取值記為VXi,根據(jù)評(píng)價(jià)標(biāo)準(zhǔn),VXi取值為0,1,或2;

步驟3:觀察項(xiàng)個(gè)數(shù)記為n;取值為0分,1分,或2分的觀察項(xiàng)個(gè)數(shù)分別記為n0,n1,n2;

步驟4:忠實(shí)度記為A,流暢度記為F,準(zhǔn)確率記為P,則:

4.測(cè)試語(yǔ)料

選擇商務(wù)英語(yǔ)作為測(cè)試的語(yǔ)料。商務(wù)英語(yǔ)具有獨(dú)特的語(yǔ)體特征,詞法和句法特點(diǎn)突出,如術(shù)語(yǔ)豐富,長(zhǎng)句結(jié)構(gòu)嚴(yán)謹(jǐn),用詞規(guī)范等[7]。且商務(wù)英語(yǔ)也是對(duì)機(jī)器翻譯需求較多的專(zhuān)業(yè)英語(yǔ)。

本文選擇標(biāo)準(zhǔn)樣本數(shù)為30。為保證測(cè)試語(yǔ)料的隨機(jī)性,且包括難易不同的句子,從自建的有3 000個(gè)雙語(yǔ)句的商務(wù)信函雙語(yǔ)語(yǔ)料庫(kù)中隨機(jī)抽取3個(gè)層次英語(yǔ)句子各30句,共90句。3個(gè)層次的句子分別包含1個(gè)、2個(gè)、3個(gè)及以上謂語(yǔ)動(dòng)詞。商務(wù)信函雙語(yǔ)語(yǔ)料庫(kù)的語(yǔ)料來(lái)自3本商務(wù)英語(yǔ)教材[8][9][10]。

5.人工測(cè)評(píng)

將測(cè)試語(yǔ)料的90個(gè)句子分別輸入2個(gè)機(jī)譯系統(tǒng): SYSTRAN在線(xiàn)翻譯(http://www.systran-software. cn)和GOOGLE翻譯(http://translate.google.cn),對(duì)系統(tǒng)輸出的譯文根據(jù)評(píng)價(jià)標(biāo)準(zhǔn)和評(píng)價(jià)方法進(jìn)行評(píng)測(cè)。

三、研究結(jié)果及分析

1.歧義項(xiàng)基本信息

表2顯示了所觀察的歧義項(xiàng)頻次。表2中的數(shù)據(jù)表明,多義詞是詞義歧義的主要研究對(duì)象,共591次,其中,動(dòng)詞出現(xiàn)頻率最大,名詞居其次。因此,對(duì)動(dòng)詞和名詞多義詞進(jìn)行詞義排歧是詞義消岐的關(guān)鍵問(wèn)題。而在句法歧義中,定語(yǔ)出現(xiàn)頻率最大,狀語(yǔ)和從句次之。因此,研究句法歧義時(shí),應(yīng)重點(diǎn)解決定語(yǔ)、狀語(yǔ)和從句的句法消歧。

表2 歧義項(xiàng)基本信息

2.詞義歧義

(1)GOOGL E在詞義歧義處理上比SYSTRAN好(P=0.021)。根據(jù)表3,GOOGL E在忠實(shí)度、流暢度、準(zhǔn)確率和得分四個(gè)方面均比SYSTRAN好,且SPSS配對(duì)t檢驗(yàn)結(jié)果:P=0.021<0.05,表明差值有意義。其中,GOOGL E流暢度(88.84%)明顯好于SYSTRAN(68.26%)。這表明SYSTRAN在能正確理解的詞義中,仍有31.74%的詞義表達(dá)不符合中文習(xí)慣;而GOOGL E只要能夠正確理解詞義,表達(dá)基本上符合中文習(xí)慣。

表3 詞義消歧結(jié)果

(2)詞義歧義問(wèn)題集中在動(dòng)詞多義詞和名詞多義詞。表4表明了各歧義項(xiàng)得分,出現(xiàn)頻率最大的動(dòng)詞多義詞得分最低(分別為53分和63分),介詞也是難點(diǎn),名詞居其次。GOOGL E在形容詞(81分)和副詞(80分)詞義消歧處理最好,而SYSTRAN則是形容詞(75分)詞義消歧最好。因此,由上面的分析可知, SYSTRAN在固定搭配和術(shù)語(yǔ)詞義消歧方面還存在較大問(wèn)題。

表4 詞義歧義項(xiàng)消歧比較

(3)SYSTRAN和GOOGLE在動(dòng)詞詞義理解存在同樣的問(wèn)題(P=0.382):對(duì)具有商務(wù)內(nèi)涵的動(dòng)詞和與名詞或介詞等構(gòu)成搭配的動(dòng)詞詞義理解有歧義。表5對(duì)得0分的動(dòng)詞進(jìn)行了分析,并對(duì)兩組數(shù)據(jù)進(jìn)行SPSS配對(duì)t檢驗(yàn),P=0.382>0.05,表明兩組數(shù)據(jù)無(wú)差別。

表5 動(dòng)詞歧義問(wèn)題

表5表明,動(dòng)詞詞義理解難點(diǎn)之一就是具有商務(wù)內(nèi)涵的動(dòng)詞,如cover,draw,quote等。例如:

原文:We usually cover shipments against WPA and War Risks.

參考譯文:我們通常將貨物投保水漬險(xiǎn)和戰(zhàn)爭(zhēng)險(xiǎn)。

SYSTRAN:我們通常蓋發(fā)貨反對(duì)WPA和戰(zhàn)爭(zhēng)風(fēng)險(xiǎn)。

GOOGL E:我們通常包括出貨量對(duì)WPA和戰(zhàn)爭(zhēng)險(xiǎn)。

該句的“cover”在普通英語(yǔ)中表示“覆蓋、包括”等含義,而在商務(wù)英語(yǔ)語(yǔ)境中,常表示“投?!敝?。動(dòng)詞詞義理解另一個(gè)難點(diǎn)就是與名詞或介詞等構(gòu)成搭配的動(dòng)詞。例如:

原文:We thank you for your quotation of September 17 and are pleased to place a trial order for your electrical products.

參考譯文:感謝你方9月17日的報(bào)價(jià),現(xiàn)欣然試購(gòu)你方的電器產(chǎn)品。

SYSTRAN:我們感謝您的9月17的引文日和高興地指出您的電子產(chǎn)品的一份審訊令。

GOOGL E:我們感謝您的報(bào)價(jià)9月17日,很高興把審判為了使您的電器產(chǎn)品。

該句中,動(dòng)詞“place”與名詞“a trial order”構(gòu)成搭配,表示“試購(gòu)”,但是SYSTRAN和GOOGLE都沒(méi)能正確理解“place”的含義。又如:

原文:The educational instruments we have just received from you are of very poor quality,which is far below the standard that can be sold in this market.

參考譯文:我們剛從你方收到的教學(xué)儀器質(zhì)量很差,大大地低于可在我方市場(chǎng)銷(xiāo)售的標(biāo)準(zhǔn)。

SYSTRAN:我們從您接受了的教育儀器是非常質(zhì)量差,是遠(yuǎn)低于標(biāo)準(zhǔn)在這個(gè)市場(chǎng)上可以被賣(mài)。

GOOGL E:教育手段,我們剛剛收到你的質(zhì)量非常差,這是遠(yuǎn)遠(yuǎn)低于標(biāo)準(zhǔn),可以在這個(gè)市場(chǎng)上出售。

該句中,“receive sth.from sb.”是一個(gè)很常用且易懂的動(dòng)詞和介詞搭配,表明“從某人收到某物”,人工翻譯一般不會(huì)有問(wèn)題。但是在機(jī)器翻譯中,因?yàn)橹R(shí)庫(kù)不夠豐富,或者因?yàn)榻樵~from與動(dòng)詞receive的距離問(wèn)題,較難通過(guò)統(tǒng)計(jì)方法估計(jì)翻譯模型,動(dòng)詞與介詞的搭配往往成為難點(diǎn)。

(4)SYSTRAN和GOOGL E在名詞詞義理解也存在同樣的問(wèn)題(P=0.184):對(duì)具有商務(wù)內(nèi)涵的名詞理解有歧義。表6對(duì)得0分的名詞進(jìn)行了分析,SPSS配對(duì)t檢驗(yàn)結(jié)果:P=0.184>0.05,表明兩個(gè)機(jī)譯系統(tǒng)存在同樣的問(wèn)題。表6表明具有商務(wù)內(nèi)涵的名詞是機(jī)器翻譯的難點(diǎn),如enquiry(詢(xún)價(jià)),offer(報(bào)盤(pán)),negotiation(議付)等。

表6 名詞歧義問(wèn)題

3.句法歧義

(1)SYSTRAN和GOOGLE在句法歧義處理上沒(méi)有顯著差別(P=0.166)。SPSS配對(duì)t檢驗(yàn)結(jié)果:P =0.166>0.05,表明兩個(gè)機(jī)譯系統(tǒng)句法消歧能力相當(dāng)。但是,表7表明SYSTRAN忠實(shí)度和準(zhǔn)確率都略好于GOOGL E。

表7 句法消歧結(jié)果

(2)句法歧義問(wèn)題集中在從句、定語(yǔ)和狀語(yǔ)。從表8可知,兩個(gè)系統(tǒng)基本上都能夠?qū)⒕浞ńY(jié)構(gòu)區(qū)分開(kāi)來(lái),但是語(yǔ)序處理還需改進(jìn),尤其是狀語(yǔ)的語(yǔ)序(得分最低,分別為61和63分)。SYSTRAN定語(yǔ)歧義處理(83分)好于GOOGL E(73分),而GOOGLE否定歧義處理(94分)要好于SYSTRAN(79分),其余兩個(gè)歧義項(xiàng):從句和狀語(yǔ),兩個(gè)系統(tǒng)分?jǐn)?shù)幾乎一致。

表8 句法歧義項(xiàng)消歧比較

(3)從句歧義主要問(wèn)題在于定語(yǔ)從句的理解。表9分析了得0分的個(gè)數(shù),并與觀察到的從句個(gè)數(shù)相比較。

表9 從句歧義問(wèn)題

從表9可知,SYSTRAN和GOOGL E都沒(méi)能區(qū)分約有50%的定語(yǔ)從句。主要有兩種情況增加了機(jī)譯難度:一是沒(méi)有連詞that的定義從句;二是名詞先行詞在從句中作介詞的賓語(yǔ)。例如:

原文:Please let us know immediately the detailed risks you wish to insure against for your shipment in question.

參考譯文:請(qǐng)你方立即告訴我們對(duì)你方該批貨物要投保的詳細(xì)險(xiǎn)別。

SYSTRAN:請(qǐng)告訴我們立刻您希望保險(xiǎn)反對(duì)為正在考慮中您的發(fā)貨的詳細(xì)的風(fēng)險(xiǎn)。

GOOGL E:請(qǐng)讓我們知道了詳細(xì)的風(fēng)險(xiǎn)立即要投保的運(yùn)送問(wèn)題。

在該句中,從句“you wish to insure against for your shipment in question”修飾名詞“risks”,而兩個(gè)譯文基本上是語(yǔ)無(wú)倫次。又如:

原文:To accept the prices you quote would leave us with only a small profit on our sales since this is an area in which the principal demand is for articles in the medium price range.

參考譯文:如果我們接受你方報(bào)價(jià),我們銷(xiāo)售起來(lái)只能獲得薄利,因?yàn)楸镜貐^(qū)主要需求的是中等價(jià)格范圍的商品。

SYSTRAN:要接受您引述的價(jià)格將留給我們僅小贏利在我們的銷(xiāo)售,因?yàn)檫@是主要需求是為在中等價(jià)格范圍的文章的區(qū)域。

GOOGL E:接受你的價(jià)格競(jìng)標(biāo)將使我們只有一個(gè)小的銷(xiāo)售利潤(rùn),因?yàn)檫@是在這一領(lǐng)域的主要要求是,在中條的價(jià)格范圍。

人工翻譯該句子,是需要將名詞“area”連同“in which”中的介詞“in”還原到從句中,即:the principal demand is for articles in the medium price range in this area,然后再翻譯。很明顯,兩個(gè)機(jī)譯系統(tǒng)都無(wú)法實(shí)現(xiàn)這一點(diǎn)。

(4)定語(yǔ)歧義主要問(wèn)題在于對(duì)介詞與名詞作后置定語(yǔ)的區(qū)分及語(yǔ)序的確定。表10分析了得0分和1分的定語(yǔ)的分布情況,發(fā)現(xiàn)介詞與名詞作后置定語(yǔ)時(shí),問(wèn)題最多。例如:

原文:We thank you for your order of March 8 for electric motors,but regret to inform you that because of our stringent supply position we are unable to make supply immediately.

參考譯文:感謝你方3月8日關(guān)于電動(dòng)機(jī)的訂單,但遺憾地通知你們,由于我們供貨緊張,無(wú)法立即供貨。

SYSTRAN:我們感謝您的行軍序列電動(dòng)機(jī)的8日,但是后悔通知您那由于我們無(wú)法立刻做供應(yīng)的我們的嚴(yán)密供應(yīng)位置。

GOOGL E:我們感謝你為了3月8日的電動(dòng)馬達(dá),但遺憾地通知你,是因?yàn)槲覀儑?yán)格的供應(yīng)狀況,我們無(wú)法作出立即供應(yīng)。

在該句中,“your order of March 8 for electric motors”有2個(gè)介詞與名詞作后置定語(yǔ)修飾名詞“order”,一是:“of March 8”;二是“for electric motors”。SYSTRAN和GOOGL E基本上是語(yǔ)無(wú)倫次,與原義相差甚遠(yuǎn)。另外,介詞連接2個(gè)名詞時(shí),需要確定哪個(gè)名詞是中心詞,哪個(gè)名詞與介詞構(gòu)成定語(yǔ),否則會(huì)引起歧義。例如:

原文:When you place insurance for the shipment of our porcelain ware,please do not forget to include the risk of breakage.

參考譯文:當(dāng)你們?yōu)槲曳竭@批瓷器投險(xiǎn)時(shí),請(qǐng)別忘了包括破碎險(xiǎn)。

SYSTRAN:當(dāng)您安置我們的瓷器的發(fā)貨的時(shí)保險(xiǎn),不要忘記包括破損的風(fēng)險(xiǎn)。

GOOGL E:當(dāng)您在保險(xiǎn)貨物的瓷器,請(qǐng)不要忘記,包括破碎險(xiǎn)。

該句的“place insurance for”決定了其后的名詞應(yīng)是貨物,因此,“the shipment of our porcelain ware”中“porcelain ware”是中心詞,其含義只能是“我方這批瓷器”,而不能是“我們的瓷器的發(fā)貨”,也不能是“貨物的瓷器”。因此,名詞與介詞搭配作定語(yǔ),增加了機(jī)器翻譯的難度。

表10 定語(yǔ)歧義問(wèn)題

(5)狀語(yǔ)歧義主要問(wèn)題在于對(duì)介詞與名詞作狀語(yǔ)以及副詞作狀語(yǔ)的區(qū)分及語(yǔ)序的確定。表11表明,類(lèi)似于定語(yǔ)歧義問(wèn)題,介詞與名詞搭配,又一次增加了機(jī)器翻譯的難度。介詞+名詞除可作定語(yǔ)之外,還可作狀語(yǔ),修飾動(dòng)詞。如:

原文:We have learnt that there is a good demand for groundnuts in your market,and take this opportunity of enclosing our quotation sheet No.5233 for your consideration.

參考譯文:獲悉你地市場(chǎng)對(duì)落花生有較大的需求,現(xiàn)奉上第5233號(hào)報(bào)價(jià)單,供你方參考。

SYSTRAN:我們獲悉有對(duì)落花生的好需求在您的市場(chǎng)上,并且利用附寄我們的您的考慮的報(bào)價(jià)單沒(méi)有這機(jī)會(huì)5233。

GOOGL E:我們已經(jīng)獲悉,有一個(gè)很好的需求,花生中的市場(chǎng),并借此機(jī)會(huì)附上我們的報(bào)價(jià)單的第5233號(hào)為您的考慮。

該句中,“for your consideration”是固定搭配,作目的狀語(yǔ)。此外,兩個(gè)機(jī)譯系統(tǒng)在一些副詞的區(qū)分和語(yǔ)序上也存在著問(wèn)題,如:herewith,regretfully,immediately,kindly,accordingly,here,now,yet,even,just等。

表11 狀語(yǔ)歧義問(wèn)題

四、結(jié) 論

消除詞義歧義和句法歧義是解決機(jī)器翻譯問(wèn)題的關(guān)鍵。基于規(guī)則和基于統(tǒng)計(jì)兩種主流機(jī)器翻譯方法的歧義問(wèn)題比較分析結(jié)果概括如下:

(1)基于統(tǒng)計(jì)方法詞義消歧強(qiáng)于基于規(guī)則方法,而在句法消歧方面能力相當(dāng)。

(2)從譯文質(zhì)量看,基于統(tǒng)計(jì)方法的流暢度好于基于規(guī)則方法。

(3)詞義歧義問(wèn)題主要集中在動(dòng)詞多義詞和名詞多義詞,而句法歧義問(wèn)題則集中在定語(yǔ)、狀語(yǔ)和從句。

(4)動(dòng)詞與介詞搭配,名詞與介詞搭配作定語(yǔ)和狀語(yǔ),成為機(jī)器翻譯的難點(diǎn)。

(5)具體語(yǔ)境下(如商務(wù)英語(yǔ))具有特殊含義的普通詞,如動(dòng)詞和名詞,成為詞義消歧的難點(diǎn)。

總之,為提高機(jī)器翻譯質(zhì)量,基于規(guī)則機(jī)器翻譯方法需豐富知識(shí)庫(kù),解決流暢度問(wèn)題;而統(tǒng)計(jì)機(jī)器翻譯方法則需改進(jìn)統(tǒng)計(jì)建模方法,提高句法消歧能力。

[1]GEER D.Statistical machine translation gains respect[J]. IEEE Computer,2005,(10):18-21.

[2]姚振軍.句法“最簡(jiǎn)方案”與“最簡(jiǎn)模式”機(jī)器翻譯[J].大連理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2005,26(1):86-91.

[3]魯孝賢.機(jī)器翻譯語(yǔ)義排歧的方法[J].中國(guó)科技翻譯, 2007,20(4):20-25.

[4]HUTCHINS J,SOMERS L.An Introduction to Machine Translation[M].London:Academic Press,1992.81-98.

[5]ARNOLD D,BAL KAN L,MEIJ ER S,et al.Machine Translation:an Introductory Guide[M].London:NCC Blackwell, 1994.111-128.

[6]SINCLAIR J.COBUILD英漢雙解詞典[Z].上海:上海譯文出版社,2002.

[7]吳潔.商務(wù)英語(yǔ)的特點(diǎn)及翻譯[J].中國(guó)科技翻譯,2008,21 (4):18-20.

[8]黃水乞.外貿(mào)英文信函范例與常用精句[M].廣州:廣東經(jīng)濟(jì)出版社,2006.62-242.

[9]李爽.國(guó)際商務(wù)函電[M].北京:清華大學(xué)出版社,2008. 1-207.

[10]松尾裕一,增澤史子.英語(yǔ)商務(wù)書(shū)信110[M].大連:大連理工大學(xué)出版社,2003.12-129.

A Comparative Analysis of the Ambiguity Resolution of Two English-Chinese MT Approaches:RBMTand SMT

MA Jian-jun
(School of Foreign Languages,Dalian University of Technology,Dalian 116024,China)

This paper makes a comparative analysis of the ambiguity resolution of two MT approaches:Rule Based Machine Translation(RBMT)and Statistical Machine Translation(SMT),by analyzing the Chinese translation work for 90 English sentences in the domain of business,translated by SYSTRAN and GOOGL E translation systems.The results show that SMT is better than RBMT in terms of lexical ambiguity resolution, while they are the same in terms of structural ambiguity resolution.Lexical ambiguity mainly includes problems that occur when verbs and nouns have more than one sense,such as homographs and polysemes,as well as lexical transfer problems.Structural ambiguity arises in the aspects of modifiers,adverbials,and clauses.Verb+ preposition collocations,noun+preposition collocations,and verbs and nouns with special senses in business domain,remain three difficult problems for disambiguity for MT.

machine translation;lexical ambiguity;structural ambiguity;RBMT;SMT

H085

:A

:1008-407X(2010)03-0114-06

2009-09-01

中央高?;究蒲袠I(yè)務(wù)費(fèi)專(zhuān)項(xiàng)資金資助項(xiàng)目(DUT10RW202)

馬建軍(1972-),女,遼寧海城人,副教授,主要從事機(jī)器翻譯和功能語(yǔ)言學(xué)研究。

猜你喜歡
多義詞歧義句法
體認(rèn)原型范疇視域下多義詞延伸及對(duì)學(xué)科英語(yǔ)研究生培養(yǎng)的啟示
多義詞
述謂結(jié)構(gòu)與英語(yǔ)句法配置
eUCP條款歧義剖析
句法二題
詩(shī)詞聯(lián)句句法梳理
English Jokes: Homonyms
基于關(guān)聯(lián)理論的歧義消除研究
淺議多義詞在語(yǔ)境中的隱喻認(rèn)知
“那么大”的語(yǔ)義模糊與歧義分析
宝坻区| 通道| 嘉禾县| 佛冈县| 开远市| 邯郸县| 湖州市| 广宁县| 昌宁县| 厦门市| 阿克陶县| 红原县| 万全县| 福安市| 周至县| 永和县| 新宁县| 郯城县| 明溪县| 许昌市| 汶上县| 道孚县| 若尔盖县| 丘北县| 乃东县| 广宁县| 望江县| 社会| 得荣县| 浮梁县| 法库县| 比如县| 石门县| 北宁市| 镇巴县| 上饶市| 油尖旺区| 华安县| 平阴县| 杭州市| 平遥县|