国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于特征結(jié)構(gòu)的漢語(yǔ)主謂謂語(yǔ)句語(yǔ)義標(biāo)注研究

2012-07-09 03:17:58姬東鴻
中文信息學(xué)報(bào) 2012年3期
關(guān)鍵詞:謂語(yǔ)主語(yǔ)短語(yǔ)

陳 波,姬東鴻,呂 晨

(1. 湖北文理學(xué)院 文學(xué)院, 湖北 襄陽(yáng) 441053; 2. 武漢大學(xué) 計(jì)算機(jī)學(xué)院,湖北 武漢 430072)

1 前言

語(yǔ)義分析是現(xiàn)代語(yǔ)言學(xué)和計(jì)算語(yǔ)言學(xué)領(lǐng)域最具挑戰(zhàn)性的課題之一,也是當(dāng)前制約語(yǔ)言信息技術(shù)大規(guī)模應(yīng)用的主要瓶頸。 在眾多語(yǔ)義分析的問(wèn)題中,短語(yǔ)和句子級(jí)的語(yǔ)義分析是一項(xiàng)最基本的任務(wù)。漢語(yǔ)由于具有語(yǔ)序靈活、重視虛詞等獨(dú)特的特點(diǎn),與英語(yǔ)法語(yǔ)相比,它的語(yǔ)義分析更具挑戰(zhàn)性。在自然語(yǔ)言處理(Natural Language Processing,NLP)中,對(duì)漢語(yǔ)語(yǔ)句的語(yǔ)義標(biāo)注,一直是一個(gè)難點(diǎn)。其中,對(duì)于漢語(yǔ)特殊句型的語(yǔ)義標(biāo)注,更是難中之難,例如,“連動(dòng)句”、“兼語(yǔ)句”、“主謂謂語(yǔ)句”、“把字句”、“被動(dòng)句”等。這些句型,在語(yǔ)言學(xué)界它們本身的界定都存在很多爭(zhēng)議,在NLP學(xué)界,處理的時(shí)候通常運(yùn)用的是傳統(tǒng)的分析方法。

在語(yǔ)言學(xué)界,主謂謂語(yǔ)句是漢語(yǔ)中一種具有獨(dú)特特點(diǎn)的句型。作為漢語(yǔ)主謂句的下位句型,它的特點(diǎn)是由主謂短語(yǔ)做句子的謂語(yǔ)。語(yǔ)言學(xué)領(lǐng)域關(guān)于主謂謂語(yǔ)句的研究有80余年,至今什么是主謂謂語(yǔ)句、主謂謂語(yǔ)句有哪些類(lèi)型尚未定論,這些爭(zhēng)端包括:句中的成分誰(shuí)是大主語(yǔ)誰(shuí)是小主語(yǔ)的問(wèn)題?倒裝句是不是主謂謂語(yǔ)句的問(wèn)題?

如何尋找一種較為有效的方法,可以對(duì)這些漢語(yǔ)特殊句型進(jìn)行更好的語(yǔ)義標(biāo)注,對(duì)于語(yǔ)言學(xué)界和NLP學(xué)界,都具有重要意義。本文提出了一種新穎的“特征結(jié)構(gòu)”(Feature Structure)理論的方法,進(jìn)行了大規(guī)模的語(yǔ)義標(biāo)注,建立了一個(gè)具有近兩萬(wàn)句的漢語(yǔ)語(yǔ)義標(biāo)注資源庫(kù)。在此基礎(chǔ)上,選取漢語(yǔ)主謂謂語(yǔ)句進(jìn)行進(jìn)一步語(yǔ)義分析,得到了比較好的結(jié)果。

2 漢語(yǔ)主謂謂語(yǔ)句在語(yǔ)言學(xué)和NLP中研究現(xiàn)狀

2.1 語(yǔ)言學(xué)界漢語(yǔ)主謂謂語(yǔ)句研究現(xiàn)狀概述

主謂謂語(yǔ)句的語(yǔ)言學(xué)本體研究成果相當(dāng)豐富,但是各位專(zhuān)家學(xué)者的觀點(diǎn)卻不盡相同。最早對(duì)主謂詞組做謂語(yǔ)的論述可追溯到1921年的陳承澤,“主謂謂語(yǔ)句” 概念的正式提出源于1984年《中學(xué)教學(xué)語(yǔ)法系統(tǒng)提要》。幾十年來(lái),各家學(xué)者的探討主要集中在對(duì)其范圍的確定、結(jié)構(gòu)的分析、性質(zhì)及生成的探討上。

在語(yǔ)言學(xué)界,主謂謂語(yǔ)句語(yǔ)形表示為:“Nx+N+V/A”。Nx指句子的主語(yǔ),也稱(chēng)作“大主語(yǔ)”,N指充當(dāng)句子謂語(yǔ)的主謂短語(yǔ)中的主語(yǔ),也稱(chēng)作“小主語(yǔ)”,V/A指充當(dāng)句子謂語(yǔ)的主謂短語(yǔ)中的謂語(yǔ)。充當(dāng)大主語(yǔ)Nx的成分一般是名詞、代詞、動(dòng)賓短語(yǔ)、小句等;充當(dāng)小主語(yǔ)N的成分一般是名詞、代詞、動(dòng)賓短語(yǔ)等;充當(dāng)V/A的成分一般是不及物動(dòng)詞、及物動(dòng)詞、動(dòng)賓短語(yǔ)、形容詞等。

主謂謂語(yǔ)句中,大主語(yǔ)、小主語(yǔ)和小謂語(yǔ)之間存在著復(fù)雜的語(yǔ)義關(guān)系,具體有多少類(lèi)型難以判定。本文并不試圖對(duì)這些語(yǔ)義關(guān)系進(jìn)行純語(yǔ)言學(xué)理論的分類(lèi),而是研究其面向NLP的語(yǔ)義表示方法。語(yǔ)言學(xué)領(lǐng)域里主要討論過(guò)十三種語(yǔ)義關(guān)系[1-6],大致上包括:

1. Nx與N具有領(lǐng)屬關(guān)系;Nx不和V/A直接發(fā)生關(guān)系,只和(N+V/A)整體產(chǎn)生關(guān)系。(N+V/A)整體是對(duì)Nx的一個(gè)陳述。這里的小謂語(yǔ)可以是單詞也可以使形容詞。例如,

[1]他性格堅(jiān)強(qiáng)。

2. Nx前可以加上介詞,與Nx構(gòu)成介賓短語(yǔ)。例如,

[2]這個(gè)問(wèn)題我有不同意見(jiàn)。

3. Nx與N具有施受關(guān)系,例如,

[3]那個(gè)人我認(rèn)識(shí)。

4. Nx或N的施事具有周遍性,例如,

[4]他一句話(huà)也不說(shuō)。

5. 句中包含復(fù)指成分,例如,

[5]這樣的好同志,我們喜歡他。

6. Nx與NV具有總分關(guān)系,例如,

[6]他寫(xiě)的字,有的大,有的小。

7. Nx后的兩個(gè)N是對(duì)舉的,例如,

[7]咱倆誰(shuí)也別忘了誰(shuí)。

8. Nx表處所,例如,

[8]北京城里樹(shù)木很多。

9. Nx表時(shí)間,例如,

[9]工作時(shí)間你嚴(yán)肅一點(diǎn)好嗎?

10. Nx后是組熟語(yǔ),例如,

[10]他這個(gè)人,事事領(lǐng)先人人夸好。

11. Nx是N的工具,例如,

[11]這間屋子我們堆東西。

12. N是數(shù)量結(jié)構(gòu),例如,

[12]這種布,一尺五毛錢(qián)。

13. N(動(dòng)詞短語(yǔ))與Nx可以構(gòu)成主謂關(guān)系,例如,

[13]你做事認(rèn)真。

2.2 NLP中漢語(yǔ)主謂謂語(yǔ)句語(yǔ)義標(biāo)注現(xiàn)狀及問(wèn)題分析

對(duì)于語(yǔ)言分析,有兩種傳統(tǒng)方法:短語(yǔ)結(jié)構(gòu)分析和依存語(yǔ)法分析。目前的漢語(yǔ)標(biāo)注方法主要運(yùn)用的就是這兩種方法。但是運(yùn)用這兩種方法來(lái)標(biāo)注漢語(yǔ)的特殊句型的語(yǔ)句都會(huì)遇到一些問(wèn)題,如圖1所示。

例[7]的特點(diǎn)是,大主語(yǔ)與充當(dāng)謂語(yǔ)的主謂句中的主語(yǔ)和賓語(yǔ)之間是任指的關(guān)系,“咱倆”任指“誰(shuí)1”、“誰(shuí)2”。這是一個(gè)很重要的語(yǔ)義信息。而且如果已知“誰(shuí)1”、“誰(shuí)2”與“忘”之間的語(yǔ)義關(guān)系,再加上“咱倆”與“誰(shuí)1”、“誰(shuí)2”任指關(guān)系,可以通過(guò)語(yǔ)義傳遞,推知“咱倆”與“忘”之間的語(yǔ)義關(guān)系。因此,如果在語(yǔ)義分析中丟失了這三個(gè)詞之間的語(yǔ)義信息,將會(huì)為語(yǔ)言處理帶來(lái)困難。例[12]的特點(diǎn)是,該句由三個(gè)名詞短語(yǔ)組合而成,沒(méi)有謂語(yǔ)動(dòng)詞。傳統(tǒng)的依存語(yǔ)法的標(biāo)注方法,在標(biāo)注例[7]、例[12]的時(shí)候?qū)τ谝恍┰~語(yǔ)之間語(yǔ)義關(guān)系,無(wú)法處理,丟失了很多詞語(yǔ)與詞語(yǔ)之間的語(yǔ)義信息。

圖1 主謂謂語(yǔ)句句法分析圖

可見(jiàn),目前現(xiàn)有的分析方法在分析主謂謂語(yǔ)句時(shí),主要遇到的問(wèn)題有以下幾個(gè)。

1. 句子表層句法結(jié)構(gòu)易于描述,但是深層的句子中各個(gè)成分之間的語(yǔ)義關(guān)聯(lián)難于描述出來(lái);

2. 即使描述了一部分的語(yǔ)義關(guān)系,如依存分析,得到的語(yǔ)義信息卻不完整。即丟失了一部分的語(yǔ)義信息。丟失的這些語(yǔ)義信息有時(shí)可能正是語(yǔ)句中的關(guān)鍵信息,將為語(yǔ)言處理帶了困難;

3. 現(xiàn)有的方法過(guò)份依賴(lài)于句法結(jié)構(gòu),由于主謂謂語(yǔ)句句式的特殊性,長(zhǎng)距離的詞語(yǔ)之間的語(yǔ)義關(guān)系存在無(wú)法標(biāo)注或錯(cuò)誤標(biāo)注的情況。

3 特征結(jié)構(gòu)理論

特征結(jié)構(gòu) (Feature Structure)在現(xiàn)代語(yǔ)言學(xué)和計(jì)算語(yǔ)言學(xué)領(lǐng)域并不是一個(gè)新術(shù)語(yǔ)。語(yǔ)音學(xué)很早就采用類(lèi)似特征結(jié)構(gòu)的機(jī)制描述音節(jié),后來(lái)形式句法理論如GPSG和LFG又采用復(fù)雜特征集描述句法結(jié)構(gòu),復(fù)雜特征集也類(lèi)似于特征結(jié)構(gòu)。這兩種情況都是定義一組特征用以區(qū)分音節(jié)和句法結(jié)構(gòu),分別在生成語(yǔ)音學(xué)和生成語(yǔ)法領(lǐng)域產(chǎn)生了很大影響??墒侵两駷橹?,還未見(jiàn)到利用特征結(jié)構(gòu)進(jìn)行大規(guī)模的語(yǔ)義描述及語(yǔ)義分析的嘗試。

針對(duì)語(yǔ)義分析的兩種傳統(tǒng)方法分析漢語(yǔ)時(shí)遇到的難題,我們提出了“特征結(jié)構(gòu)”方法來(lái)解決。

通常,一個(gè)短語(yǔ)或句子可以用一個(gè)特征三元組集合來(lái)表示:[實(shí)體,特征,特征值],我們稱(chēng)之為這個(gè)短語(yǔ)結(jié)構(gòu)或句子結(jié)構(gòu)的“特征結(jié)構(gòu)”集合。正如語(yǔ)言中有很多詞語(yǔ)描述實(shí)體概念一樣,語(yǔ)言中也有很多詞語(yǔ)描述實(shí)體的特征。這些詞通常稱(chēng)為特征詞。英語(yǔ)WordNet和漢語(yǔ)的同義詞詞林都有一部分專(zhuān)門(mén)列出這些特征詞。這里說(shuō)的“特征”并不僅限于嚴(yán)格意義上的特征詞,也包括那些抽象名詞和虛詞等,只要它們用來(lái)反映概念關(guān)聯(lián),在特征結(jié)構(gòu)中就作為特征[7-9]。

[14]紅顏色汽車(chē)

[15]紅汽車(chē)

在例[14]中,“汽車(chē)”是實(shí)體(entity),“顏色”是“汽車(chē)”的特征(feature),“紅”是特征“顏色”的值(value)。“顏色”一邊聯(lián)系“汽車(chē)”,一邊聯(lián)系“紅”,因此它可作為“汽車(chē)”和“紅”概念關(guān)聯(lián)種類(lèi)的標(biāo)記。這樣,例[14]表示成一個(gè)三元組如[14]′:

[14]′ [汽車(chē),顏色,紅]

在例[15]中,“汽車(chē)”是實(shí)體,“紅”是特征“顏色”的值,值得注意的是,這里“汽車(chē)”的特征詞“顏色”并沒(méi)有出現(xiàn)。這種情況下,我們約定其特征結(jié)構(gòu)中的特征為空。這個(gè)約定的好處在于不必去設(shè)計(jì)一個(gè)一般性的特征詞表,而是根據(jù)具體應(yīng)用的需求而制定相應(yīng)的特征詞表。特征詞表牽涉到泛語(yǔ)言的范疇(包括語(yǔ)義格等),如果脫離具體應(yīng)用而試圖設(shè)計(jì)一個(gè)一般性的特征詞表,就如設(shè)計(jì)格系統(tǒng)一樣會(huì)有很多爭(zhēng)議。另一方面,在具體應(yīng)用中只需標(biāo)注少許例子,這些空的特征就可以從這些標(biāo)注例子中被激活出來(lái)。根據(jù)此約定例[15]表示成 [15]′:

[15]′ [汽車(chē), ,紅]

[16]他說(shuō)他是大學(xué)教師。

該句的特征三元組表示為:

[說(shuō), ,他]; [說(shuō), ,他是大學(xué)教師]; [是, ,教師]; [教師, ,大學(xué)]; [是, , 他]

從例[16]我們可以發(fā)現(xiàn),特征和特征值都可以作為實(shí)體出現(xiàn)在特征結(jié)構(gòu)中。這從它們都可帶一定修飾語(yǔ)判斷出來(lái)?!八?是“說(shuō)”的特征值。“他是大學(xué)教師”是“說(shuō)”的另一個(gè)特征值。 這里 “他是大學(xué)教師”是作為一個(gè)整體,和“說(shuō)”產(chǎn)生語(yǔ)義關(guān)聯(lián)。并且,特征值“他是大學(xué)教師”本身也是一個(gè)特征結(jié)構(gòu)。其中,“是”是實(shí)體,“大學(xué)教師”是特征值,“他”是“是”的另一個(gè)特征值。另外,特征值的節(jié)點(diǎn)“大學(xué)教師”本身也是一個(gè)特征結(jié)構(gòu),“教師”是實(shí)體,“大學(xué)”是它的特征值。

形式上,一個(gè)三元組可看作兩個(gè)“點(diǎn)”(node)和連接它們的“邊”(edge),其中的“節(jié)點(diǎn)”表示實(shí)體或特征值,“邊”表示特征。特征一定是某個(gè)節(jié)點(diǎn)的特征,這個(gè)節(jié)點(diǎn)就作為特征擁有者,另一個(gè)節(jié)點(diǎn)就作為特征值。于是一個(gè)特征結(jié)構(gòu)可看作一個(gè)圖,而且是無(wú)向圖(undirected graph)??紤]到特征值也可是另外一個(gè)特征結(jié)構(gòu),因此特征結(jié)構(gòu)可看作一個(gè)遞歸圖,意即節(jié)點(diǎn)本身又可是一個(gè)圖。

簡(jiǎn)言之,同句法結(jié)構(gòu)相比,特征結(jié)構(gòu)和依存結(jié)構(gòu)類(lèi)似,都主要描述詞匯之間的關(guān)系,因此不用定義句法范疇。即便在遞歸性的特征結(jié)構(gòu)中,也不用定義特征結(jié)構(gòu)的類(lèi)別。和依存結(jié)構(gòu)相比,特征結(jié)構(gòu)一方面允許嵌套,另一方面允許多重關(guān)聯(lián);另外特征結(jié)構(gòu)既注重描述概念是否關(guān)聯(lián),也同時(shí)注重關(guān)聯(lián)的種類(lèi)。

4 基于特征結(jié)構(gòu)理論的漢語(yǔ)主謂謂語(yǔ)句標(biāo)注

4.1 主謂謂語(yǔ)句的特征結(jié)構(gòu)標(biāo)注

以例[1]、例[2]為例,本節(jié)把語(yǔ)言學(xué)界討論過(guò)的十三種語(yǔ)例分別運(yùn)用特征結(jié)構(gòu)模型進(jìn)行了語(yǔ)義分析,詳細(xì)地標(biāo)注了每一種語(yǔ)例中詞語(yǔ)和詞語(yǔ)之間的語(yǔ)義關(guān)系,并畫(huà)出了特征結(jié)構(gòu)圖。然后將這些特征結(jié)構(gòu)圖進(jìn)行對(duì)比分析,整理歸納出主謂謂語(yǔ)句的語(yǔ)義關(guān)系類(lèi)型及其表示方法。

例[1] 他性格堅(jiān)強(qiáng)。

大謂語(yǔ)“性格堅(jiān)強(qiáng)”是對(duì)大主語(yǔ)“他”的陳述和說(shuō)明。小主語(yǔ)“性格”是大主語(yǔ)“他”的一個(gè)內(nèi)在屬性,“性格堅(jiān)強(qiáng)”可以成立,“他堅(jiān)強(qiáng)”也可以成立。小謂語(yǔ)“堅(jiān)強(qiáng)”既是“性格”的值,也可以說(shuō)是“他”的值。因此,在這里,小主語(yǔ)“性格”是大主語(yǔ)的一個(gè)特征,小謂語(yǔ)“堅(jiān)強(qiáng)”是特征“性格”的值。

它的特征結(jié)構(gòu)三元組和特征結(jié)構(gòu)圖(圖2)如下:

[他,性格, 堅(jiān)強(qiáng)]

圖2 例[1]的特征結(jié)構(gòu)圖

例[2] 這個(gè)問(wèn)題我有不同意見(jiàn)。

該例中,大謂語(yǔ)是一個(gè)完整的句子,內(nèi)含主謂賓。大主語(yǔ)問(wèn)題前可以加上介詞“關(guān)于”、“對(duì)”等。從語(yǔ)義關(guān)聯(lián)上說(shuō),大主語(yǔ)和小賓語(yǔ)之間有語(yǔ)義關(guān)聯(lián)。它的特征結(jié)構(gòu)三元組和特征結(jié)構(gòu)圖(圖3)如下:

圖3 例[2]的特征結(jié)構(gòu)圖

4.2 主謂謂語(yǔ)句的特征結(jié)構(gòu)類(lèi)型

基于特征結(jié)構(gòu)理論,我們運(yùn)用標(biāo)注軟件對(duì)這13類(lèi)主謂謂語(yǔ)句的語(yǔ)料進(jìn)行了語(yǔ)義關(guān)系的標(biāo)注,共概括出了六類(lèi)標(biāo)注圖,如表1所示。

表1 主謂謂語(yǔ)句的特征結(jié)構(gòu)類(lèi)型表

續(xù)表

4.3 不同理論的主謂謂語(yǔ)句標(biāo)注分析比較

我們以例[2]和例[7]為例,進(jìn)行特征結(jié)構(gòu)分析與傳統(tǒng)依存分析,將分析結(jié)果進(jìn)行對(duì)比,來(lái)評(píng)測(cè)對(duì)主謂謂語(yǔ)句的語(yǔ)義分析效果。

例[2] 這個(gè)問(wèn)題我有不同意見(jiàn)。

表2 例[2]的兩種分析圖

表3 例[2]的兩種分析結(jié)果對(duì)比表

如表2、表3所示,傳統(tǒng)依存分析結(jié)果沒(méi)有把“意見(jiàn)”和“問(wèn)題”的語(yǔ)義關(guān)系表示出來(lái)。把沒(méi)有語(yǔ)義關(guān)系的“有”和“問(wèn)題”卻表示了出來(lái)。因此它漏掉了一個(gè)語(yǔ)義關(guān)系對(duì),還標(biāo)注了一個(gè)沒(méi)有語(yǔ)義關(guān)系的語(yǔ)義關(guān)系對(duì)。

例[7] 咱倆誰(shuí)1也別忘了誰(shuí)2。*對(duì)于句中重復(fù)出現(xiàn)的詞語(yǔ),我們依照出現(xiàn)順序分別下標(biāo)為1,2,3,依次類(lèi)推。

如表4、表5所示,傳統(tǒng)依存分析結(jié)果沒(méi)有把“咱倆”和“誰(shuí)1”、“咱倆”和“誰(shuí)2”的語(yǔ)義關(guān)系表示出來(lái),把沒(méi)有語(yǔ)義關(guān)系的“咱倆”和“忘”卻表示了出來(lái)。

表4 例[7]的兩種分析圖

表5 例[7]的兩種分析結(jié)果對(duì)比表

因此它漏掉了兩個(gè)個(gè)語(yǔ)義關(guān)系對(duì),還標(biāo)注了一個(gè)沒(méi)有語(yǔ)義關(guān)系的語(yǔ)義關(guān)系對(duì)。

特征結(jié)構(gòu)模型能夠描述更多的語(yǔ)義關(guān)系對(duì),因此包含更加豐富的語(yǔ)義信息。

1) 傳統(tǒng)依存語(yǔ)法無(wú)法表示主謂謂語(yǔ)句中大主語(yǔ)與小主語(yǔ)或小賓語(yǔ)之間的語(yǔ)義關(guān)系,如復(fù)指、分指等。特征結(jié)構(gòu)模型可以完整地表示主謂謂語(yǔ)句中大主語(yǔ)與小主語(yǔ)或小賓語(yǔ)之間的語(yǔ)義關(guān)系。如例句:這個(gè)問(wèn)題我有不同意見(jiàn)。咱倆誰(shuí)也別忘了誰(shuí)。勤奮的小王,我們喜歡他。

2) 主謂謂語(yǔ)句中大主語(yǔ)和小謂語(yǔ)之間,有時(shí)存

在語(yǔ)義關(guān)系,有時(shí)不存在語(yǔ)義關(guān)系。傳統(tǒng)依存語(yǔ)法無(wú)法辨析這兩種情況,而是無(wú)論實(shí)際的語(yǔ)義關(guān)系是否存在,但是傳統(tǒng)依存語(yǔ)法總是處理為兩者存在語(yǔ)義關(guān)系。特征結(jié)構(gòu)模型可以按照語(yǔ)言實(shí)際情況,如實(shí)地反映大主語(yǔ)和小謂語(yǔ)之間的語(yǔ)義關(guān)系。如例句:小王技術(shù)很好?!靶⊥酢焙汀昂谩敝g沒(méi)有語(yǔ)義關(guān)系,但是傳統(tǒng)依存分析卻標(biāo)注為有語(yǔ)義關(guān)系。

5 結(jié)論及展望

我們可以看到,運(yùn)用特征結(jié)構(gòu)對(duì)句子進(jìn)行標(biāo)注可反映出哪些成分充當(dāng)實(shí)體,哪些充當(dāng)特征,哪些充當(dāng)特征值,這些詞語(yǔ)之間的語(yǔ)義關(guān)系也很清晰地反映出來(lái)。今后運(yùn)用特征結(jié)構(gòu)標(biāo)注的資源,通過(guò)訓(xùn)練,就有可能抽取出句子中隱含的語(yǔ)義關(guān)系。

特征結(jié)構(gòu)分析有如下優(yōu)點(diǎn)。

1) 標(biāo)注的是語(yǔ)義關(guān)聯(lián),而非句法關(guān)聯(lián)。我們標(biāo)注的是句中詞語(yǔ)與詞語(yǔ)之間的語(yǔ)義關(guān)聯(lián),跟句子表層的句法結(jié)構(gòu)無(wú)關(guān),因此跳過(guò)了句法層面的分析;

2) 標(biāo)注的是“關(guān)聯(lián)”而非“依存”。我們表示的是語(yǔ)義上的關(guān)聯(lián),而不是傳統(tǒng)的依存關(guān)系。因此我們的標(biāo)注圖用“無(wú)向圖”表示,也弱化了中心詞的概念;

3) 標(biāo)注效率更高。特征結(jié)構(gòu)的方法不牽涉詞性爭(zhēng)議、結(jié)構(gòu)歧義等問(wèn)題,也無(wú)需判斷中心詞,因此標(biāo)注效率比句法標(biāo)注和依存標(biāo)注要高;

4) 標(biāo)注的結(jié)果一致性高。我們的判斷標(biāo)準(zhǔn)是基于關(guān)聯(lián),經(jīng)過(guò)人工標(biāo)注,最后得到的標(biāo)注結(jié)果分歧較少;

特征結(jié)構(gòu)的理論是我們的一個(gè)新嘗試,現(xiàn)在我們已經(jīng)建立了特征結(jié)構(gòu)的基本概念和描述框架,建構(gòu)了一個(gè)大規(guī)模的漢語(yǔ)語(yǔ)義資源,并且應(yīng)用到了食譜分析、國(guó)家安全信息收集和分析、汽車(chē)市場(chǎng)情報(bào)分析等領(lǐng)域,取得了比較好的效果。

但是在標(biāo)注過(guò)程中,仍然存在一些不可避免的難題,例如,不斷發(fā)展變化的語(yǔ)言永遠(yuǎn)無(wú)法窮盡列舉,真實(shí)語(yǔ)料中會(huì)出現(xiàn)很多語(yǔ)言的臨時(shí)用法和特例,針對(duì)這類(lèi)極少部分的語(yǔ)例,我們?cè)撊绾沃贫ㄒ?guī)則確定特征結(jié)構(gòu)?這是我們下一步工作要解決的問(wèn)題。

[1] 陸儉明.新中國(guó)語(yǔ)言學(xué)50年[J].當(dāng)代語(yǔ)言學(xué),1999, (4): 1-13.

[2] 朱德熙.語(yǔ)法講義[M].北京:商務(wù)印書(shū)館,1982: 95-110.

[3] 李臨定.現(xiàn)代漢語(yǔ)句型[M].北京:商務(wù)印書(shū)館,1986:302-307.

[4] 呂叔湘.主謂謂語(yǔ)句舉例[J].中國(guó)語(yǔ)文,1986,(5):334.

[5] 胡裕樹(shù).現(xiàn)代漢語(yǔ)[M].上海:上海教育出版社,1981:353.

[6] 洪維.主謂謂語(yǔ)句研究綜述[J].呼蘭師專(zhuān)學(xué)報(bào),1998, (2): 70-76.

[7] B. Chen,D. Ji. Chinese Semantic Parsing Based on Dependency Graph, Feature[C]//Proceedings of the First International Conference on Electronic & Mechanical Engineering and Information Technology(EMEIT 2011), Haerbin, China. 2011:1730-1734.

[8] B. Chen, D. Ji, C. Lv. Semantic Labeling of Chinese Subject-Predicate Predicate Sentence Based on Feature Structure [C]//Proceedings of the 11th Chinese National Conference on Computational Linguistics(CNCCL2011), Luoyang, China.2011: 161-166.

[9] 陳波.特征結(jié)構(gòu)及其漢語(yǔ)語(yǔ)義資源建設(shè)[D].武漢:武漢大學(xué),2011.

猜你喜歡
謂語(yǔ)主語(yǔ)短語(yǔ)
談?wù)勔龑?dǎo)主語(yǔ)從句的連接詞的用法
巧用無(wú)靈主語(yǔ),讓續(xù)寫(xiě)更靈動(dòng)
非謂語(yǔ)動(dòng)詞
非謂語(yǔ)動(dòng)詞
非謂語(yǔ)動(dòng)詞題不難答 石娟
非謂語(yǔ)動(dòng)詞
盤(pán)點(diǎn)高考中的特殊句式(二)
英語(yǔ)中的虛主語(yǔ)“it”和漢語(yǔ)中的虛主語(yǔ)“他”異同之比較
巴楚县| 兴安县| 崇州市| 岑巩县| 高邮市| 改则县| 海宁市| 台江县| 吉林省| 武穴市| 镇安县| 浑源县| 阜宁县| 兴和县| 塔河县| 肥城市| 沈阳市| 武乡县| 涿州市| 民县| 上高县| 邓州市| 麻城市| 多伦县| 阿瓦提县| 万山特区| 郎溪县| 峨边| 龙南县| 马公市| 昌邑市| 页游| 东海县| 澄江县| 康乐县| 海淀区| 咸宁市| 涟源市| 寿光市| 苏尼特右旗| 云和县|