国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

英漢機器翻譯中的歧義及消歧方法

2011-12-31 00:00:00楊小勇
考試周刊 2011年87期


  摘 要: 排除語言歧義是機器翻譯中最難的難題,如果語言歧義不能排除,機器翻譯的譯文質(zhì)量就不會有質(zhì)的提高。本文從詞匯歧義和句法歧義兩方面對英語語言中的歧義現(xiàn)象進(jìn)行分析,闡明其形成過程,探析其形成原因,并提出英漢機器翻譯的一些消歧方法,以提高機器翻譯的譯文質(zhì)量。
  關(guān)鍵詞: 機器翻譯 詞匯歧義 句法歧義 消歧方法
  
  一、引言
  機器翻譯(MT)指的是通過計算機系統(tǒng)將源語翻譯成目的語的一種翻譯方法。語言歧義的排除是機器翻譯的難題,歧義現(xiàn)象是自然語言的普遍現(xiàn)象,歧義的處理是提高譯文質(zhì)量的關(guān)鍵。要提高排除語言歧義的效率就必須在深入研究語義變化一般規(guī)律的同時,研究每個多義詞詞義變化的特殊規(guī)律,選擇何種排歧方法要因詞而異,這樣才能提高排歧效率。
  二、英語歧義現(xiàn)象
  一種語言形式能夠傳遞兩種或兩種以上的意義,可以作兩種或兩種以上的解釋,這就是歧義(ambiguity)。一詞多義是自然語言中存在的普遍現(xiàn)象,英語中的名詞、代詞、動詞、形容詞、連接詞、介詞等都存在歧義。
  例1:Tom is a bachelor.
  句中名詞“bachelor”既可以表示“單身漢”(an unmarried man),又可以表示“學(xué)士”(a first university degree),準(zhǔn)確的含義要根據(jù)上下文或語境來確定。又如:
  例2:I ate a fish with a fork. (我用叉子吃魚。)
  例3:I ate a fish with bones. (我吃帶刺的魚。)
  三、英語歧義形成的分析
  (一)詞匯歧義形成的分析
  詞義存在著三個層次:系統(tǒng)詞義(概念詞義)、情景詞義和聯(lián)想詞義。系統(tǒng)詞義是詞義的第一個層次,它是一種抽象的詞義,主要是指一類事物的基本特征;情景詞義是詞義的第二個層次,它是詞的具體所指,屬語言使用中的詞義(當(dāng)然,具有情景詞義的詞主要是實詞,功能詞沒有這種性質(zhì))。聯(lián)想詞義屬詞義的第三個層次,它附屬于概念詞義,呈隱性,埋伏較深,容易被忽略。
  詞義不是單一的,而是錯綜復(fù)雜Sdl3g7F+w3C+sInkSNZMJAeiPr2h26Ldl4i3uxI5TsA=的。在交際中,交際雙方有時雖然都使用同一個詞,但由于各自理解該詞的詞義層次不同,便會產(chǎn)生歧義。詞義的特征之一是它具有民族特點的語言范疇。不同的民族對同一個詞產(chǎn)生的聯(lián)想詞義不一定相同,這也常常造成歧義。例如,“龍”字,在漢語中有很重的文化意義。龍是中華民族的象征,它代表一種氣勢磅礴的民族精神,從古至今,龍所引起的聯(lián)想都是正面意義,中華民族也被稱作“龍的傳人”。然而在西方,“dragon”的文化意義是“怪物、魔鬼、兇殘”等,是罪惡的象征,兩種聯(lián)想意義大相徑庭。
  通過以上分析我們可以發(fā)現(xiàn),由于詞義的多層次性,在交際過程中,如果交際雙方對同一個詞匯的意義作不同層次的理解,便有可能產(chǎn)生歧解。因此,詞義的多層次性是產(chǎn)生詞匯歧義的主要原因之一。
  2.句法歧義形成的分析
  句子意義紛繁復(fù)雜,頭緒眾多。一句話有句法層次結(jié)構(gòu),也有語義層次結(jié)構(gòu)。句子意義的分析有兩種層次框架:第一種是與句法結(jié)構(gòu)相對應(yīng)的語義層次框架(結(jié)構(gòu)框架),第二種是語符與語義之間關(guān)系的框架(符義框架)。
  如果一個句子的結(jié)構(gòu)從語法上可作兩種或兩種以上劃分,每一種劃分便分別對應(yīng)著一種意義,句子便由此產(chǎn)生歧義。
  例4:They kidnapped the old coin collector.
  這個句子所以引起歧義,是因為其中的形容詞轄域(focus scope)不確定。例句中的形容詞old既可以修飾名詞coin,又可以修飾coin和collector兩個名詞組成的組合體,從而使句子產(chǎn)生兩種句義:①他們綁架了那位古幣收藏家;②他們綁架了那位年邁的硬幣收藏家。
  句法歧義的產(chǎn)生有時正是因為句子在同一個表層結(jié)構(gòu)下,有兩個或兩個以上的深層結(jié)構(gòu),由此引出兩個或兩個以上的句子意義。
  例5:The refugees had discarded clothes.
  歧義的產(chǎn)生源于短語had discarded有兩種語法關(guān)系,即兩種語義解釋為:①難民們有了(被別人)拋棄的衣服;②難民們把衣服都拋棄了。
  由于“句法不僅包括已經(jīng)說出來的話,還包括對于已經(jīng)說出來的話還說了什么或暗示什么”,因此,一個句子除了其詞匯、語法意義外,有時還蘊含了發(fā)話者暗含的意義。讀者或受話者若聽話不聽音,錯誤理解其中的蘊含意義,便會產(chǎn)生歧義。
  實際上,結(jié)構(gòu)框架和符義框架是相互聯(lián)系和影響的,兩者的交匯點是句子的總體直接句義。
  四、英語歧義的消除
  (一)詞義消歧方法
  1.選擇最常見涵義
  這個方法的消歧效率非常低,但由于它簡單易行,而目前又沒有其他非常有效的方法可用,因此大多數(shù)翻譯系統(tǒng)采用這一方法。
  2.利用詞類進(jìn)行詞義消歧
  比如,在句子“We can what he can eat.”中的第一個“can”應(yīng)該為動詞,所以可以確定其涵義為“把……裝罐”。但是當(dāng)兩個義項屬于同一個詞類時,這種方法就無法消歧。例如,對于“The man is rather old.”一句中的“old”這種方法就不能確定到底該譯為“這個人很舊了”還是應(yīng)該譯為“這個人很老了”,因為“舊”和“老”兩個義項同屬于形容詞。不過這種方法能夠有效地縮小詞義選擇范圍,所以可以配合其他消歧方法一起使用。
  3.基于選擇限制詞義消歧
  上例中“old”表示“老”時,要求主語是生物,而表示“舊”則要求主語為非生物。國內(nèi)外對于這種消歧方法研究得比較深入,比如普林斯頓大學(xué)認(rèn)知科學(xué)實驗室開發(fā)的詞網(wǎng)(Word-Net)軟件,國內(nèi)中科院董振東先生建立了知網(wǎng)(How-Net),等等。這些研究成果都為基于選擇限制詞義消歧做出了很大貢獻(xiàn)。
  4.基于共現(xiàn)特征的詞義消歧
  多義詞的每個義項一般都與另外一些詞一起出現(xiàn),例如,“bank”是多義詞,在“The flood destroyed the river bank.” 一句中出現(xiàn)的“flood”和“river”一般與“bank”的“堤”義項一起出現(xiàn),所以“flood”和“river”可以幫助消歧。
  5.無指導(dǎo)的詞義消歧
  這種方法先通過對大量的語料進(jìn)行計算統(tǒng)計,得出任意兩個詞的共現(xiàn)頻率,然后對共現(xiàn)頻率比較高的任意兩個詞進(jìn)行計算統(tǒng)計,篩選出大于一定共現(xiàn)頻率的數(shù)據(jù),形成共現(xiàn)頻率表。
  6.基于詞典的詞義消歧
  這種方法首先計算上下文中相鄰詞定義間的相似度,然后選擇定義相似度較高的義項。例如在“I ate a fish with a fork.”一句中“with”是個多義詞。如果在計算機可讀詞典中“fork”定義為:“an instrument for eating food”并且“with”定義為①instrument;②part of ...兩個詞的定義中都出現(xiàn)了“instrument”那么這句中的“with”就應(yīng)該取“instrument”的涵義,而不應(yīng)該取“part of”的涵義。這種方法的主要缺點是計算機可讀詞典中的每個詞的定義通常太短,無法為詞義消歧提供足夠的信息資源(馮志偉,2004:594)。
 ?。ǘ┫鐟?yīng)因詞而異
  在研究過程中發(fā)現(xiàn),根據(jù)多義詞的情況不同,適用的消歧方法也不同。比如,區(qū)分“old”的兩個義項“老”和“舊”時,基于選擇限制的詞義消歧特別有效。這里基于共現(xiàn)特征的詞義消歧則不適用,因為屬于人類和非人類的詞太多。而另一種情況下基于選擇限制的詞義消歧則可能完全派不上用場,例如“bank”的第17個義項“封(爐,火)”要求“bank”做及物動詞,并且賓語為“爐”或者“火”,選擇限制利用詞的具體分類不可能具體到包括“爐、火類”的程度。在這種情況下,基于共現(xiàn)特征的詞義消歧方法卻十分有效,只要給出“fire”,“flame”,“furnace”等共現(xiàn)詞,并要求這些共現(xiàn)詞出現(xiàn)的結(jié)構(gòu)中與“bank”發(fā)生密切關(guān)系,就可以判定在該語境中使用的是這一義項?;诠铂F(xiàn)特征的詞義消歧由于不能因詞而異,因而經(jīng)常導(dǎo)致失敗。在基于共現(xiàn)特征的詞義消歧時,要具體規(guī)定共現(xiàn)詞出現(xiàn)在什么位置、什么結(jié)構(gòu)中,如果不規(guī)定而根據(jù)窗口大小判定,很可能導(dǎo)致語義消歧的失敗。上面例子對于“封(火)”這一義項可以這樣判定:如果“bank”做及物動詞且后面賓語為“fire”,“flame”,“furnace”等,或者當(dāng)“fire”,“flame”,“furnace”等為主語且后面出現(xiàn)“be+banked”謂語時,“bank”表示“封(火)”。另外,該方法只注意到共現(xiàn)詞,沒注意到其他共現(xiàn)特征。比如“bank”的最常見涵義“銀行”,使用這一義項時,上下文并不一定出現(xiàn)“money”,“account”等共現(xiàn)詞,也不能用基于選擇限制的方法,但是有一個非常明顯的卻沒被發(fā)現(xiàn)有消歧方法考慮到的特征:“bank”往往首字母大寫,而且常出現(xiàn)于“Bank of”,后面再跟上首字母大寫的另一個單詞;還有一種情況是“bank”首字母大寫,前一個詞也是首字母大寫。這一特征與“銀行”這一義項有極密切的共現(xiàn)關(guān)系,而字母的大小寫往往在語義消歧中被忽略了。
  由此可見,常用的消歧方法過于追求詞義變化規(guī)律的普遍性和消歧方法的通用性,而忽略了多義詞詞義變化是沒有普遍規(guī)律可言的事實,所以不能最終解決語義消歧的難題。
  五、結(jié)語
  語義消歧是機器翻譯中最困難的問題,也是決定譯文質(zhì)量的關(guān)鍵問題。因為每個多義詞的詞義變化規(guī)律都各不相同,所以在研究語義消歧的過程中沒有什么捷徑可求,只能因詞而異,一個詞一個詞地去研究。這任務(wù)雖然看似在編寫一部雙語詞典,事實上要比編寫一部雙語詞典難幾十倍,因為每個多義詞的消歧都需要耗費研究者大量的時間和精力。不過,如果能解決作為當(dāng)代科技十大難題之一的機器翻譯問題,意義將是非常深遠(yuǎn)的,這方面的商業(yè)價值也不可估量。
  
  參考文獻(xiàn):
 ?。?]馮志偉.機器翻譯研究[M].北京:中國對外翻譯出版公司,2004.
 ?。?]王揚.略論語境與詞義的理解[J].國外外語教學(xué),1999.
 ?。?]廖定中,蔣澄生.英語句法歧義簡議[J].四川外語學(xué)院,1998.
 ?。?]史曉亮.英漢機器翻譯中語言陷阱的自動檢索標(biāo)識方法[J].科技信息,2011.
 ?。?]魯孝賢.機器翻譯語義排歧的方法[J].中國科技翻譯,2007.

伊宁县| 阳高县| 雅江县| 北流市| 博野县| 辽宁省| 射阳县| 云龙县| 辽阳县| 耿马| 淮北市| 洪洞县| 南川市| 天水市| 桐城市| 东山县| 长寿区| 改则县| 庆阳市| 普兰县| 深水埗区| 淳安县| 二连浩特市| 柳江县| 新郑市| 庆元县| 苏尼特右旗| 泽州县| 石渠县| 鹰潭市| 望都县| 重庆市| 博爱县| 阜南县| 临西县| 社旗县| 且末县| 宁海县| 庆元县| 桐城市| 北辰区|