国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向自然語言處理的英語中旬蛻現(xiàn)象研究

2019-12-16 01:48:12雷樹杰
電腦知識與技術 2019年29期
關鍵詞:英語

雷樹杰

摘要:英語中存在很多從句和非謂語現(xiàn)象,這類復雜的語言結構為機器處理語言帶來了較多困難。通過總結概念層次網(wǎng)絡(hierarchical network oFconcepts,HNC)中的句蛻理論,并用這種句蛻理論來分析英語中的句蛻現(xiàn)象,將英語中的句蛻現(xiàn)象的知識和不同于中文的特點加以總結,得到了很多新的發(fā)現(xiàn)。該研究不僅將英語中的句蛻現(xiàn)象進行了總結,其分析結果還有助于將這類復雜現(xiàn)象進行形式化,從而幫助機器分析和處理語言,尤其是從句和很多非謂語現(xiàn)象這類復雜的結構。

關鍵詞:HNC;英語;句蛻現(xiàn)象

中圖分類號:TP311 文獻標識碼:A

文章編號:1009-3044(2019129-0253-03

1概述

句法分析是自然語言處理(Natural Language Processing,NLP)中非常重要和基礎的任務。對一個句子的語義進行理解就必須對句子的句法結構進行正確的分析,從而一定程度上消解句子的歧義現(xiàn)象。而在語言中,存在大量的省略、多義和嵌套現(xiàn)象,這為正確分析句子提出了挑戰(zhàn)。

語言中的嵌套現(xiàn)象是由于語言的遞歸性導致的,即一個句子成為另一個句子一部分。如果不能正確處理句子中的嵌套現(xiàn)象,就不能對一個句子做出正確地分析和理解。而一個句子成為另一個句子中的一部分有多種形式,可以是直接以原句子的形式進行嵌套,也可以是原句子變換一下形式后嵌套。為了處理語言的嵌套現(xiàn)象,HNC理論提出了句蛻理論。

HNC理論最初是針對漢語提出的一套體系,但由于其建立在概念層面,因而能很方便地遷移到其他語言中。本文將HNC理論遷移到英語中,并針對英語中的“句蛻”現(xiàn)象進行研究,從而為英語的自然語言處理提供支持。本文的研究方法可以很方便地遷移到其他語言中去。

2句蛻介紹

句蛻是概念層次網(wǎng)絡理論中一個十分重要的現(xiàn)象。要了解句蛻,必須先了解語義塊的概念。語義塊也是HNC理論中的一個概念,其是指句子的下一級語義構成單位,其可以分為主語義塊(句子語義必要的、主干的部分)與輔語義塊(句子語義次要的、可選的成分)兩類。而句蛻是指一個句子蛻化為語義塊或語義塊的一部分,其是語義塊復雜構成的特殊形式。一般而言,大多數(shù)語言中都存在有句蛻現(xiàn)象。

句蛻有兩種基本類型,即原型句蛻與要素句蛻。原型句蛻是指在句蛻現(xiàn)象中,一個句子蛻化后仍保持原來的形式,形式上和原句相同。如,在“錢學森說他愛中國”這句話中,這個句子的JK2就是由句子“他愛中國”蛻化而來,但形式上卻與原句相同,是為原型句蛻。而要素句蛻是指以某個語義塊要素為中心語,其他語義塊為修飾語的句蛻,其中,以廣義對象語義塊為中心語的要素句蛻稱為JK要素句蛻,以特征語義塊要素為中心語的要素句蛻為EK要素句蛻。如,在“老師講了愛中國的錢學森的故事”這句話中,這個句子的JK2是由句子“錢學森愛中國”蛻化而來,,蛻化后原句的JKl(錢學森)成為語義塊的中心語,另外兩個語義塊JK2(中國)與EK(愛)成為修飾部分,該句為JK要素句蛻。此外,在“老師講了愛中國的錢學森的故事”這句話中,還加了“的故事”這樣一個部分,像這種在基本句蛻的前面或后面加上別的成分的現(xiàn)象叫作包裝句蛻。其中,原型句蛻加包裝成為原型包裝句蛻,要素句蛻加包裝稱為要素包裝句蛻。

句蛻現(xiàn)象的普遍存在為自然語言處理帶來很多困擾,這是因為當存在句蛻現(xiàn)象時,要對一個句子進行正確的理解,就必須把句蛻當作一個句子來分析和理解,而不能僅僅作為一個定中之類的短語結構來分析和理解。只有這樣,機器才能對句子結構有一個正確的分析,從而正確分析出其表達的含義。

3英語語言特點

HNC理論是黃曾陽先生針對中文提出的一套理論,但由于其上升到了概念層次,而不是局限于一個一個的詞,因此,該理論可以很方便地遷移到其他語言當中,當然要根據(jù)語言特點做一定程度的修改和調整。

對于英語來說,其規(guī)則性要比中文強很多,筆者總結主要有以下幾點。

一是英語的詞匯之間用空格進行了分割,這樣的語言特點使得英語的分詞任務相對于中文來說要簡單很多,其主要的著力點在于對于一些符號的處理,如“.”在文中究竟是省略形式的一部分還是句子之間的分界線。而作為自然語言處理的第一步而言,分詞任務的影響不僅僅在于該任務本身,還在于分詞的準確程度會直接影響到后續(xù)任務的開展。這是由于在很多時候,自然語言處理任務是一個線性流程f當然也有一些例外),而作為自然語言處理的初始任務的分詞,其影響會當然地帶到后續(xù)處理過程中。

二是英語存在時態(tài)和數(shù)的概念。英語中的動詞會隨著事件發(fā)生的時間的不同而產(chǎn)生形式上的變化,這雖然為學習語言帶來的很多困擾和不變,但對于機器處理語言而言,這種形式上的變化其實已經(jīng)將句子內涵的一些信息外顯出來了。數(shù)的現(xiàn)象也同樣如此。

三是英語中的從句一般要加從屬連詞,名詞前也存在“the”“a”這樣的標記符號。這種從屬連詞對于計算機而言是一種信號,可以輔助機器對語言做出正確的理解,而在中文中則不存在這種類型的標記符號。當然,在英語中,從屬連詞有時也可以省略,從句也可以轉化為非謂語形式,這種變化上的靈活性也為機器處理語言帶來很大的不確定性。

這些特點都對HNC理論向英語中的遷移帶來了不同于中文的變化。其中非常重要的一個特點就是,無論是詞匯用空格進行分割、存在時態(tài)和數(shù)的概念還是從句與名詞前標記符號的出現(xiàn),都使得英語相對于中文而言要更加形式化。對語言的理解,很大程度上取決于對句子結構的分析,而英文這樣形式化強的語言,為句子結構的分析帶來了很多方便之處。而HNC理論就是將模糊的語言加以形式化,正如HNC理論的創(chuàng)立者所說“HNC理論的目標是,以概念聯(lián)想脈絡為主線,建立一種模擬大腦語言感知過程的自然語言表述模式和計算機理解處理模式,使計算機獲得消解模糊的能力?!庇⒄Z形式化較強的特點使得英語在使用HNC理論方面要更加方便,我們從下文的英語中的句蛻現(xiàn)象的分析中就可以看出來。

4英語中的句蛻現(xiàn)象

句蛻現(xiàn)象的出現(xiàn)歸根結底是由于語言的嵌套性所導致的。在英語中,同樣存在著原型句蛻與要素句蛻兩種現(xiàn)象。

4.1英語原型旬蛻

原型句蛻舉例如下:

(1)My opinion is that you should work hard.(我的意見是你應該努力工作。)

(2)That he will come to our village tomorrow surprises us all.(他要來我們村,讓我們都感到很驚訝。)

(3)When it rains,I usually go toschool by bus.(下雨時,我通常坐公共汽車去上學。)

(4)if he comes tomorrow,you will see him.(如果他明天來,你就可以看到他了。)

(5)It is very lucky that he doesnt come.(他沒來真是太幸運了。

(6)He said that he was going to quit.(他說他想退出。)

從上述例子中可以看出,英語中的原型句蛻現(xiàn)象通常存在于主語從句(2)、賓語從句(6)、狀語從句(3,4)、表語從句(1)和形式主語結構(5)中。其中,在主語從句中,則一般通過加連詞“that”來進行轉化;在狀語從句中,則一般通過加連詞“how”、“when”等來進行轉化;在表語從句和賓語從句中,一般是通過加連詞“that”加以轉換,但賓語從句和表語從句中的連詞往往可以省略;在形式主語結構中,“it”作為形式主語指代后面的不定式結構或從句,在指代從句的情況下,為原型句蛻,在指代不定式的情況下,為下面要講的要素旬蛻。

在狀語從句中,英語原型句蛻一般作為輔語義塊,而在其他幾種情況中,英語原型句蛻一般作為主語義塊。這是英語中原型句蛻現(xiàn)象的句類知識。

4.2英語要素句蛻

除了原型句蛻,英語中同樣存在這要素句蛻現(xiàn)象。要素句蛻舉例如下:

(7)I think we can leave with our heads held high.(我們可以昂首離開。)

(8)With you to lead us,our group is sure to succeed.(有你幫助我們,我們團隊一定會成功。)

(9)I am glad to have seen your mother.(見到你母親我很開心。)

(10)Seeing nobody at home,she decided to leave them anote(見家里沒人,她決定給他們留一張便簽。)

(11)Their coming to help was a great encouragement to us.(他們的到來和幫助對我們而言是一個巨大的鼓勵。)

(12)She hates people losing their mind.(她痛恨人們丟失了理智。)

(13)He sat there thinking,with his chin on his hand.(他坐在那兒沉思,她的臉頰支撐在手上。)

(14)With you helping me,I feel very obliged to you.(你幫助了我,真是太感激你了。)

(15)Theboyswho are playing football arefromClassOne.(踢足球的男孩們是一班的。)

(16)Football is a game which is liked by most boys.(足球是一項大多數(shù)男孩喜歡的運動。)

從上述例子中可以看出,英語中的要素句蛻以非謂語結構(9,10,11,12)、獨立主格結構(7,13,14,8)和、定語從句(15,16)為主。在非謂語結構中,通過使用動名詞結構或者不定式結構,從而將句子轉化為句蛻塊,其通常是EK要素句蛻。如在例9與例11中,就是將“I have seen your mother”與“They come tohelp us”轉化為相應的“to have seen your mother”與“Their com-ing to help”,進而將句子轉化為句蛻塊;在獨立主格結構中,通過“with”與非謂語形式(或者其他形式,如“名詞+名詞”,“名詞+副詞”,“名詞+過去分詞”等),將句子轉化為句蛻塊。如在例7中,就是將句子“Our heads are held high”通過“with+名詞+過去分詞”形式,轉化成了句蛻塊,在例13中,就是將句子“His chinis on his hand”通過“with+名詞+介詞短語”的形式,轉化成了句蛻塊,為EK要素句蛻;在定語從句中,通常通過加入關系詞(關系代詞或關系副詞),從而將句子轉化為定語從句形式的句蛻塊。如在例15與例16中,就是將“Boys are playingfootball”與“A game is liked bv most boys”這兩個句子,通過加關系詞“who”與"which”的形式轉化為句蛻現(xiàn)象。這一點與中文相似,雖然英語的定語從句中保留了原來句子的成分,但轉化為定語從句后,句子的中心語發(fā)生了變化,變成了先行詞,這樣就構成了JK要素句蛻。

在非謂語結構中,英語要素句蛻一般為主語義塊,而在獨立主格結構中,英語要素句蛻一般為輔語義塊。在定語從句中,英語要素句蛻也一般為主語義塊。這是英語中要素句蛻的句類知識。

4.3英語包裝句蛻

此外,英語中也存在包裝句蛻現(xiàn)象。包裝句蛻舉例如下:

(17)The news that he will leave for Shanghai is true.(他將要去上海的消息是真的。)

(18)They were delighted at the news that their team had won.(當聽到他們的球隊贏了的消息時,他們欣喜若狂。)

(19)I have no idea what color she wants.(我不知道她想要什么顏色。)

從上述例子可以看出,英語包裝句蛻主要存在于同位語從句中,而在英語中,能伴有同位語從句的名詞通常是需要做特殊說明的名詞,如idea,fact,news,hope,belief suggestion,word,thought,doubt,truth,possibility,promise,order等有一定內涵的名詞。這就使得英語的包裝句蛻的詞也是上述這些通常需要做特殊說明的名詞。而英語中能引導同位語從句的連詞通常有連詞that、whether,連接代詞that、who,連接副詞why、when、where等。值得注意的是,if并不能引導同位語從句。

在同位語從句中,從句通常是對其所修飾名詞的具體說明,這樣就相當于在原型句蛻的前面加上了其他成分,構成了原型包裝句蛻。如在例17與例18中,“hewillleavefor Shang-haiistrue”與“theirteamhadwon”就是原型句蛻,但在這兩句話中,這兩個原型句蛻前面就加了“the news”作為其他成分,因此構成了原型包裝句蛻。

另外一點比較重要的就是,英語中不存在要素包裝句蛻,這是由于英語的語法規(guī)定所致。在英語的同位語從句中,關聯(lián)詞不可省略,同樣,同位語從句也就不能轉化為非謂語結構、獨立主格結構與定語從句形式,這使得其只能是原型包裝句蛻。

4.4英語句蛻塊的特點

由于英語存在時態(tài)和數(shù)的概念,這使得英語句子在蛻化成句蛻塊之后還必須進行時態(tài)上的變換,而中文由于沒有(或較少)時態(tài)和數(shù)的形式變換,使得中文不需要考慮轉換后的時態(tài)和數(shù)的變換問題。這是英語與中文一個很大的不同點。

英語中句蛻現(xiàn)象的時態(tài)變換主要存在于賓語從句和狀語從句。其他幾類句蛻現(xiàn)象,要么由于是非謂語形式,不存在時態(tài)變化問題,要么與原來句子一致,如定語從句和主語從句。

而在賓語從句中,主要變化在于,如果主句是過去式與將來時,則從句要根據(jù)主句的時態(tài)做出相應的調整。如表1所示。

另外一個比較特殊的就是英語中的虛擬語氣。虛擬語氣存在于狀語從句和賓語從句當中。在狀語從句中,一般由if引導,其時態(tài)變換如表2所示。

此外,在賓語從句中,當主句謂語是wish和表示“要求、建議、命令”的動詞,如advise,direct,ask,demand,order,suggest等時,從句的謂語動詞用"should+動詞原形”,其中should可以省去。如例20。

(20)I insisted that he(should)g0with us.(我堅持讓他和我們一起去。)

這是英語句蛻現(xiàn)象中時態(tài)的特點,這一特點不同于中文,需要我們對轉化后的句蛻塊的時態(tài)做出調整。

5結束語

本文以HNC理論分析英語中的句蛻現(xiàn)象,將句蛻這一現(xiàn)象遷移到英語當中,總結了英語當中句蛻現(xiàn)象的知識和不同于中文的特點。由于HNC理論本就是面向自然語言處理而開發(fā)的一套形式化概念體系,本文通過這樣的分析,可以將英語中復雜的語言嵌套現(xiàn)象形式化出來,從而使得機器更好地處理和分析語言。

猜你喜歡
英語
玩轉2017年高考英語中的“熟詞僻義”
英語
讀英語
酷酷英語林
英語大show臺
興趣英語(2013年12期)2014-02-11 03:21:38
悠閑英語(86)感恩與忘恩
海外英語(2013年11期)2014-02-11 03:21:02
英語大show臺
興趣英語(2013年3期)2013-05-13 09:21:06
英語大show臺
興趣英語(2013年2期)2013-04-25 01:50:06
凤山县| 西乌珠穆沁旗| 咸丰县| 霍邱县| 元朗区| 德格县| 西城区| 连南| 修武县| 石棉县| 土默特左旗| 囊谦县| 乐安县| 会宁县| 呼玛县| 江都市| 利川市| 江山市| 漳州市| 佛教| 彰化县| 龙州县| 罗江县| 廉江市| 永定县| 库尔勒市| 读书| 铜陵市| 腾冲县| 新野县| 达尔| 平潭县| 黄大仙区| 海安县| 广安市| 江华| 德惠市| 江津市| 曲水县| 丹寨县| 盐池县|