国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

名詞詞義描寫和研究需要什么樣的語義學(xué)知識?

2015-04-21 10:39袁毓林
中文信息學(xué)報(bào) 2015年5期
關(guān)鍵詞:語義學(xué)詞庫基元

李 強(qiáng),袁毓林

(北京大學(xué) 中文系 中國語言學(xué)研究中心 計(jì)算語言學(xué)教育部重點(diǎn)實(shí)驗(yàn)室,北京 100871)

?

名詞詞義描寫和研究需要什么樣的語義學(xué)知識?

李 強(qiáng),袁毓林

(北京大學(xué) 中文系 中國語言學(xué)研究中心 計(jì)算語言學(xué)教育部重點(diǎn)實(shí)驗(yàn)室,北京 100871)

該文主要討論名詞的詞義描寫和研究問題。首先通過對幾種主要的詞匯語義學(xué)理論(包括結(jié)構(gòu)主義語義學(xué)、生成主義語義學(xué)、概念語義學(xué)和自然語義元語言理論)進(jìn)行介紹和評述,指出它們在對名詞進(jìn)行語義刻畫方面存在缺陷和不足;然后,重點(diǎn)引入生成詞庫理論的物性結(jié)構(gòu)的描寫方式,闡明它與前幾種理論的區(qū)別及其自身的特點(diǎn);最后,在生成詞庫理論的基礎(chǔ)上,展示物性結(jié)構(gòu)知識在有關(guān)名詞分析中的四個(gè)研究案例(詞語缺省、隱喻義生成、供用句、中動(dòng)句)和在自然語言處理中的可能應(yīng)用。

詞匯語義學(xué)理論;生成詞庫理論;物性結(jié)構(gòu);名詞分析;自然語言處理

1 引言

句法語義研究中的“動(dòng)詞中心論”主張促使已有的多數(shù)詞匯語義學(xué)流派將研究重心放在動(dòng)詞上,因而產(chǎn)生了不少關(guān)于如何描述動(dòng)詞語義信息的理論和看法;在關(guān)于動(dòng)詞和名詞研究的天平上,指針總是向動(dòng)詞傾斜。而實(shí)際的研究情況顯示,作為數(shù)量最多、使用最廣的兩種詞類范疇,名詞也具有同動(dòng)詞一樣的研究價(jià)值,名詞詞義結(jié)構(gòu)的描寫和刻畫的精度在一定程度上制約了名詞句法語義研究的深度。名詞的語義句法相關(guān)研究甚多,但缺乏一種有效的對名詞詞義結(jié)構(gòu)進(jìn)行描寫的方式。本文就著力探討這一問題,在對幾種不同的詞匯語義學(xué)理論進(jìn)行介紹和評述的基礎(chǔ)上,說明它們在對名詞語義信息的描寫上存在不足,進(jìn)而重點(diǎn)引入生成詞庫理論的詞義描寫方式,闡明它與之前的幾種理論的區(qū)別及其自身的特點(diǎn)。本文的相關(guān)研究意在指出: 生成詞庫理論在一定程度上彌補(bǔ)了現(xiàn)有詞匯語義學(xué)理論在對名詞進(jìn)行語義刻畫方面的缺陷和不足,極大地拓寬了詞匯語義學(xué)的研究領(lǐng)域和范圍,為語義學(xué)提供了一種新的研究范式;同時(shí),生成詞庫論的形式化描寫方案也對涉及名詞的自然語言處理研究具有一定的啟發(fā)性作用。

2 結(jié)構(gòu)主義語義學(xué)對名詞詞義的描述

結(jié)構(gòu)主義理論對詞匯語義學(xué)的發(fā)展進(jìn)程產(chǎn)生了非常重要的影響,其核心思想是把語言看成一個(gè)秩序井然的系統(tǒng),而不僅僅是一堆散落雜亂的詞語。它主要通過三種理論方法,即詞匯場、義征分析和關(guān)系語義對名詞詞義進(jìn)行分析。其中,詞匯場理論和關(guān)系語義學(xué)研究的是詞語之間的聚合關(guān)系,前者注重同義詞的聚合,而后者不僅關(guān)注同義詞,還關(guān)注詞語之間的其他語義關(guān)系,如上下義關(guān)系、反義關(guān)系、整體-部分關(guān)系等;與這兩種方法相比,義征分析為詞義構(gòu)成和分解提供了一種技術(shù)性較強(qiáng)的分析手段,能夠?qū)γ~的語義信息進(jìn)行描寫,為人們經(jīng)驗(yàn)性地判斷不同詞語是否屬于同一詞匯場,或是否存在語義關(guān)系提供可靠的分析途徑。

結(jié)構(gòu)主義的研究對象是“語言”,而不是“言語”,因此它只關(guān)注語言內(nèi)部的結(jié)構(gòu),希望在對詞義進(jìn)行描寫時(shí)能在詞匯的語言知識和百科知識之間劃出一道清晰的分界。但是,僅僅圍繞構(gòu)成語義知識的語言內(nèi)部結(jié)構(gòu)來劃定界限并不是一件容易的事。無論是詞匯場理論、關(guān)系語義學(xué),還是義征分析方法都無法與百科知識劃清界限。詞匯場理論將不同詞語納入到場結(jié)構(gòu)之中,但不同詞匯場之間,甚至在同一詞匯場內(nèi)部,都會(huì)出現(xiàn)模糊的情況。例如,一個(gè)詞語可能同時(shí)屬于兩個(gè)詞匯場,或者屬于一個(gè)詞匯場的邊緣成分;面對這種情況,要對它進(jìn)行判定就必然依賴于百科知識。關(guān)系語義學(xué)聲稱詞匯意義就是詞匯之間的關(guān)系,但正如Murphy[1]所指出的,意義關(guān)系在本質(zhì)上是元語言的,并不是闡釋詞匯意義的基礎(chǔ),而是對詞匯語義的一種認(rèn)識。更為重要的是,意義關(guān)系并不存在于詞語與指稱物之間,而存在于詞語與對其進(jìn)行解讀的具體語境之間,因?yàn)檎Z境因素對詞語的意義關(guān)系具有重要的影響;那么,既然需要語言系統(tǒng)內(nèi)部之外的因素參與確定不同詞語之間的意義關(guān)系,關(guān)系語義學(xué)認(rèn)為意義關(guān)系可以對詞語進(jìn)行“內(nèi)容描寫”的觀點(diǎn)就很難成立;同時(shí),這也意味著,詞語意義的解讀是離不開百科知識幫助的。義征分析方法的基礎(chǔ)是語義特征,而語義特征恰恰是從我們對所指事物的概念化認(rèn)識中提取出來的,這種概念化認(rèn)識無疑應(yīng)該被納入到百科知識的范疇之中。

簡而言之,雖然結(jié)構(gòu)主義希望能在語言知識和百科知識之間做出清晰的區(qū)分,但它所提出來的研究方法都無法避免要牽涉到百科知識,百科知識或多或少地都會(huì)參與到我們對名詞語義的描寫和識解之中。此外,在結(jié)構(gòu)主義的背景下,語義學(xué)研究的重心仍然在單個(gè)詞語的意義分解和詞義的聚合性上,而關(guān)于詞義的組合性特征則很少涉及,這也在一定程度上限制了語義學(xué)的研究范圍。不過,在自然語言處理領(lǐng)域,結(jié)構(gòu)主義所提出的這種詞義特征分解和意義聚合的理念具有相當(dāng)重要的價(jià)值,它直接對一些機(jī)器詞典,如WordNet等語義知識資源的建造具有啟發(fā)性作用。

3 生成主義語義學(xué)對名詞詞義的描述

在結(jié)構(gòu)主義語義學(xué)的義征分析方法的基礎(chǔ)上,Katz和Fodor[2]創(chuàng)立了生成主義語義學(xué)(亦稱為“卡茨語義學(xué)”)。生成主義語義學(xué)體現(xiàn)了對結(jié)構(gòu)主義語義學(xué)的整合和超越,它將義征分析引入到生成語法之中,使得語義分析具有形式化的描寫框架。它不像結(jié)構(gòu)主義那樣通過語義特征對同一語義場的詞語進(jìn)行對比分析,而是盡量使單個(gè)詞語的不同意義可以形式化地表征為形式語法的一部分。以名詞bachelor的描寫為例, 如圖1所示。

圖1 生成語義學(xué)對名詞bachelor的描寫

在圖1中,除了詞形和詞類之外,主要有兩類語義成分: 語義標(biāo)記(semantic marker)和辨義成分(distinguisher)。前者由圓括號表示,后者由方括號表示。而這兩類語義成分決定了詞語在句法和語義上組合的可能性。例如,“bachelor”雖然有不同的意義,但在“The old bachelor finally died”這個(gè)句子中,它只能表示“單身漢”,而不能表示其他意義。這受到了語義標(biāo)記的影響,因?yàn)橹挥斜硎尽皢紊頋h”意義的語義標(biāo)記才與“old”在語義上協(xié)調(diào),而表示其他意義的語義標(biāo)記都與“old”相互排斥。由此可見,生成主義的詞義描寫方法可以將詞語的詞匯意義組合投射到短語結(jié)構(gòu)的意義之中,從而能夠?qū)υ~項(xiàng)之間在句法和語義組合上的選擇限制進(jìn)行操作。相對于結(jié)構(gòu)主義過分注重詞義的聚合描寫,生成主義語義學(xué)的這種詞義描寫方法為詞義的組合性研究打開了通道,進(jìn)一步拓寬了語義學(xué)研究的范圍。更為重要的是,這樣一種詞義分解的方法也為計(jì)算機(jī)處理自然語言提供了重要的理論支撐,在詞義消歧、機(jī)器翻譯等方面能夠發(fā)揮積極的作用。

不過,在對待語言知識和百科知識的問題上,生成主義語義學(xué)依舊遵循結(jié)構(gòu)主義的基本傾向,試圖在語言知識和百科知識中做出區(qū)分。Katz 和Fodor[2]認(rèn)為語言研究的重點(diǎn)應(yīng)當(dāng)集中在語言知識上,而不是世界知識上,對語義設(shè)置一個(gè)上限范圍很有必要,要把語義研究與情景因素等隔離開來。但是,從生成語義學(xué)對詞義的處理范式可以發(fā)現(xiàn),百科知識仍然在詞義描寫中留有痕跡,上圖bachelor的詞義描寫中的那些語義標(biāo)記正是這樣一種反映,它們是從詞義所指事物的百科知識中所抽取出來的語義標(biāo)簽。

此外,從圖1對bachelor的語義描寫可以發(fā)現(xiàn),生成語義學(xué)對詞語的多義性問題也給予了關(guān)注,這體現(xiàn)了生成主義對于詞義的原子論(atomism)處理態(tài)度,即把詞義分解為多個(gè)不可再分的最小詞義單位。然而,生成主義對于多義詞詞義的處理是一種靜態(tài)式的羅列,因?yàn)檫@些最小詞義單位之間是分割開來的、互不聯(lián)系的,它們之間的動(dòng)態(tài)關(guān)系,即多義詞的不同義項(xiàng)是如何在句子中推導(dǎo)產(chǎn)生的,這一點(diǎn)并不能通過生成語義學(xué)的描寫方法展現(xiàn)出來。而對于多義詞不同義項(xiàng)之間的內(nèi)在邏輯關(guān)系以及詞匯的創(chuàng)造性使用特點(diǎn)的研究,可能更加有助于窺探人們是如何識別詞義以及對于句子意義進(jìn)行理解的,同時(shí)對于詞義消歧等計(jì)算機(jī)語言處理任務(wù)來說都會(huì)有一定的作用。

4 概念語義學(xué)對名詞詞義的描述

概念語義學(xué)由Jackendoff創(chuàng)立。在他看來,意義就是外部世界在人們心理所形成的一種表征方式,這種表征方式可以被稱為概念結(jié)構(gòu),它充當(dāng)了語言與世界的接口。概念結(jié)構(gòu)由一些概念基元構(gòu)成,例如,EVENT(事件)、STATE(狀態(tài))、THING(物體)、PATH(路徑)、PLACE(方位)、PROPERTY(屬性)等,而這些概念基元在說不同語言的民族中都是共通的,具有普適性。在這些概念基元的基礎(chǔ)上,可以形成各種簡單或者復(fù)雜的概念結(jié)構(gòu),再由概念結(jié)構(gòu)投射到語言層面,形成各種各樣的句子。因此,在概念語義學(xué)對詞項(xiàng)的描寫框架中,我們可以看到詞匯語義與句法框架的結(jié)合。以動(dòng)詞“run”的描寫框架為例,如圖2所示。

圖2 概念語義學(xué)對動(dòng)詞“run”的描寫

詞項(xiàng)下方的第一行是詞類標(biāo)記,第二行是詞項(xiàng)出現(xiàn)的句法環(huán)境,第三行是詞項(xiàng)的概念結(jié)構(gòu),而概念結(jié)構(gòu)實(shí)際上就對應(yīng)了“run”所表達(dá)的語義: 一個(gè)事件中的某物(主語)沿著介詞短語所表示的可選路徑移動(dòng)。從概念語義學(xué)對詞項(xiàng)的描寫方式可以發(fā)現(xiàn),它對于詞義的處理基本上采取的是一種分解式的態(tài)度,即把詞義分解為若干個(gè)概念基元,而究竟用什么樣的概念基元進(jìn)行描寫則完全取決于詞項(xiàng)本身在現(xiàn)實(shí)世界中的表征方式。因此,從這個(gè)角度看,概念語義學(xué)試圖將語言知識與百科知識結(jié)合起來,而不是對立,從而界定兩者之間的可能分工。

從自然語言處理的角度看,概念語義學(xué)對于詞條的描寫框架與Fillmore所創(chuàng)立的“框架語義學(xué)”(Frame Semantics)*框架語義學(xué)是Fillmore提出的研究詞語意義和句法結(jié)構(gòu)意義的語義理論方法,該理論主張對于詞語意義的描述必須聯(lián)系特定的語義框架,因?yàn)榭蚣苁切叛觥?shí)踐、制度、想象等概念結(jié)構(gòu)或概念模式的圖式表示,是言語社團(tuán)中人們相互交流的概念基礎(chǔ)[6]。具有相似之處,前者的“概念結(jié)構(gòu)”其實(shí)對應(yīng)的就是后者的“概念框架”,通過描述概念結(jié)構(gòu)中的參與者元素在句法上的位置實(shí)現(xiàn),建立特定詞項(xiàng)的句法和語義框架;利用這樣一種方法所建立的知識資源庫(如FrameNet*FrameNet是由加州大學(xué)伯克利分校所建立的框架網(wǎng)項(xiàng)目,是基于框架語義學(xué)、并以語料庫為基礎(chǔ)建立的在線英語詞匯資源庫。關(guān)于該資源庫的具體介紹,可參見袁毓林、李強(qiáng)[7]。)在機(jī)器翻譯、人工智能等領(lǐng)域起到了重要的作用。

此外,概念語義學(xué)主要是對單一或復(fù)雜的事件進(jìn)行描寫,EVENT和STATE是兩個(gè)最基本的概念情景,而其他概念基元都是這兩個(gè)情景的參與者。因此,對于由名詞充當(dāng)?shù)腡HING這一概念基元來說,概念語義學(xué)只能以[±bound]和[±internal structure]這兩對語義特征來加以界定[3]。換而言之,概念語義學(xué)對于名詞的語義信息描寫是非常不足的,這也是多數(shù)語義學(xué)理論的相同點(diǎn)。因此,發(fā)展出一套能對名詞的語義信息進(jìn)行描寫的框架是非常有必要的。

5 自然語義元語言理論對名詞詞義的描述

由Wierzbicka[4]創(chuàng)立的自然語義元語言理論秉持著這樣一種假設(shè): 詞語的意義隱含在基元詞中,基元詞是基元概念的表征形式,基元概念本身無須界定。這樣一種假設(shè)的認(rèn)識論基礎(chǔ)是: 如果一種語言里的所有詞語都用其他詞語來定義,那么就可以保持在語言和世界之間不發(fā)生任何聯(lián)系,語言內(nèi)部就是一個(gè)純凈的系統(tǒng)。在該理論中,最為基本和核心的概念就是基元概念,它被認(rèn)為具有普遍性,是不同種族人群都具有的;并且這些概念在所有語言中都是以某個(gè)特定詞語或至少某個(gè)特定形式來表達(dá)。根據(jù)Goddard[5]的統(tǒng)計(jì),已經(jīng)識別的語義基元有 62個(gè),這些語義基元在不同的語言中具有不同的表征形式。因此,根據(jù)自然語義元語言理論,對于詞語意義的界定,就可以通過這些語義基元來加以說明。以動(dòng)詞break為例,它可以按照下面這種方式定義:

Person-X broke Y(e.g. Peter broke the window)=

X did something to Y

because of this, something happened to Y at this time

because of this, after this Y was not one thing any more

上面這個(gè)定義所用的所有詞語都是從語義基元中抽取出來的,自然語義元語言理論正是試圖通過這樣有限的、為數(shù)不多的語義基元來對語言中的所有詞語進(jìn)行定義。

很顯然,自然語義元語言理論的主體思想是從結(jié)構(gòu)主義所提出的語義特征那里繼承而來的;不過,與語義特征數(shù)目的無規(guī)定性和無限性不同,這種理論方法假定,只需要從數(shù)量固定的概念基元的集合中抽取其中的一小部分,再通過組合操作就可以對詞義進(jìn)行描寫。這種假設(shè)類似于化學(xué)中的元素學(xué)說: 世界上的事物千變?nèi)f化,但都是由一百多個(gè)元素通過化學(xué)物理反應(yīng)組合轉(zhuǎn)化而成的。

但是,這樣一種詞義描寫方式存在方法論上的問題。在對詞語進(jìn)行語義描寫的過程中,選取什么樣的概念基元和怎樣對概念基元進(jìn)行組合會(huì)在很大程度上影響詞義描寫的精確性;另外,概念基元本身是否可進(jìn)行再分解,分解的標(biāo)準(zhǔn)是什么,不可分解的標(biāo)準(zhǔn)是什么,這些都不容易確定。最根本之處還在于: 這些語義基元是通過對自然語言的意義進(jìn)行描寫的過程中所假定的,目前并沒有任何證據(jù)顯示這些語義基元具有普遍性;因此,也就不能確定這樣一套詞義描寫方法對于所有語言來說具有普遍的效力。利用語義基元給詞語所下的定義的準(zhǔn)確性也就值得懷疑。例如,Wierzbicka[8]在對“杯子”的意義進(jìn)行說明時(shí)提到:

一只中國杯子,不管它大小、厚薄、優(yōu)美與否,是否有把子或者托盤,只要它明顯地適合人們喝熱水,在正常環(huán)境下能夠用一只手舉到嘴邊,都可以稱為“杯子”。

從這段定義中可以發(fā)現(xiàn),Wierzbicka認(rèn)為“杯子”的本質(zhì)核心概念是“能夠從中喝熱的液體”和“可以供人們用一只手舉到嘴邊”。但是,這樣的定義準(zhǔn)確嗎?如果抽屜里有一個(gè)裝滿夾子和鉛筆的近似于杯子形狀的容器,雖然它也具有上面兩種核心概念,但和我們所說的“杯子”很顯然不是同一個(gè)事物。由此可見,自然語義元語言理論采用概念基元對詞語所下的定義還是存在一些問題。

此外,從語言與世界的關(guān)系來看,雖然該理論的倡導(dǎo)者希望用詞語定義詞語的描寫方式來與世界知識劃清界限,但它并沒有解決語義基元是否與外部世界相聯(lián)系的問題。正如Geeraerts[9]所言: “像touch之類的基元,感知體驗(yàn)必須加以考慮,以免我們把語言看作一個(gè)理想的獨(dú)立王國,而與語言之外的世界完全隔絕開來”。

6 生成詞庫理論對名詞詞義的描述

由Pustejovsky[10-11]創(chuàng)立的生成詞庫理論被譽(yù)為“當(dāng)代語義學(xué)中最精細(xì)的形式化分析范式”[9],在詞匯語義學(xué)的研究中引起了極大的關(guān)注。生成詞庫理論認(rèn)為詞義并不是靜態(tài)地、缺乏聯(lián)系地被列舉出來,而是具有動(dòng)態(tài)生成性特征,即詞語在不同語境下的意義都可以通過一套語義生成機(jī)制被生發(fā)出來。生成詞庫理論所要達(dá)到的目標(biāo)就是要挖掘出這種語義生成機(jī)制,這是該理論對詞義研究所做出的最大貢獻(xiàn)。Pustejovsky 等[12]更為明確地將這種理論目標(biāo)概括為:

開發(fā)生成詞庫的目的在于提供一種成分組合語義學(xué),對源自現(xiàn)實(shí)語言使用中的意義進(jìn)行語境調(diào)制。

以這種目標(biāo)為導(dǎo)向,生成詞庫解釋了語義研究的基本內(nèi)容:

(a) 解釋語言的多樣性本質(zhì);

(b) 刻畫自然語言話語的語義系統(tǒng);

(c) 解釋詞語在新語境下的創(chuàng)造性用法;

(d) 發(fā)展出一套更為豐富的共同組合的語義表征體系。

伴隨上述語義研究的目標(biāo)和內(nèi)容,生成詞庫理論首先著眼于構(gòu)建一套嶄新的詞義描寫方法,這套詞義描寫方法是由四個(gè)層面的語言知識所組成的一個(gè)層級體系;并且,由于生成詞庫論的創(chuàng)始人Pustejovsky教授的研究興趣重點(diǎn)在自然語言處理方面,所以,這套詞義描寫方法自創(chuàng)立之始就深深地打上了自然語言處理的烙印,以一種形式化的方式表征出來,由圖3所示。

圖3 生成詞庫理論對詞項(xiàng)的描寫框架

在圖3中,ARGSTR代表論元結(jié)構(gòu),主要描寫論元的數(shù)量、類型以及句法層面的實(shí)現(xiàn);EVENTSTR代表事件結(jié)構(gòu),主要描寫動(dòng)詞語義中的事件信息,包括狀態(tài)、過程、遷移等;QUALIA代表物性結(jié)構(gòu),是一套關(guān)于詞匯本體知識的描述體系,主要包括四種物性角色: 形式角色(formal role,F(xiàn)ORMAL)、構(gòu)成角色(constitutive role,CONST)、施成角色(agentive role,AGENTIVE)和功用角色(telic role,TELIC)。此外,未在上圖中展示出來的詞匯類型結(jié)構(gòu)(Lexical Typing Structure)也是生成詞庫論對詞項(xiàng)的描寫內(nèi)容之一,主要用來說明一個(gè)詞項(xiàng)在一個(gè)類型系統(tǒng)中的位置,以及與其他詞項(xiàng)的語義關(guān)聯(lián)方式,例如,上下位關(guān)系、整體部分關(guān)系等。這里,我們需要重點(diǎn)對物性結(jié)構(gòu)進(jìn)行說明,因?yàn)樗巧稍~庫理論最為核心的內(nèi)容,同時(shí)也是構(gòu)建詞義的基礎(chǔ),為語言知識和百科知識的表征提供了接口。

物性角色的根基源于亞里士多德的“四因”說,在亞氏看來,世界上的萬事萬物都具有四個(gè)方面的屬性,即形式因、質(zhì)料因、動(dòng)力因和目的因,這四個(gè)方面屬性匯聚了我們對于事物的一般性、常規(guī)性的認(rèn)識和看法,反映了我們對于事物最為樸素和深刻的概念化理解方式。換而言之,這四因其實(shí)就是一種百科知識,在此基礎(chǔ)上所創(chuàng)立的物性結(jié)構(gòu)描寫體系,旨在以一種系統(tǒng)化、條理化的方式對詞項(xiàng)(主要是名詞)的語義結(jié)構(gòu)進(jìn)行描寫,以求能夠更為直接地反映我們對于詞項(xiàng)單位的基本感受和認(rèn)識。Puste-jovsky希望通過這套物性結(jié)構(gòu)體系,能夠?qū)喪纤偨Y(jié)的百科知識以形式化的方式直接和語言平面掛鉤,并使之參與到我們的言語理解和話語建構(gòu)之中。對應(yīng)于亞氏的“四因”,上述四種物性角色的定義分別如下:

形式角色(formal role): 描寫對象在更大的認(rèn)知域內(nèi)區(qū)別于其他對象的屬性,包括方位、大小、形狀、維度和顏色等;

構(gòu)成角色(constitutive role): 描寫一個(gè)物體與其組成部分之間的關(guān)系,包括材料、重量、部分與組成成分等;也指物體在一個(gè)更大的范圍內(nèi)構(gòu)成或組成其他物體;

施成角色(agentive role): 描寫對象怎樣形成或產(chǎn)生的,如創(chuàng)造、因果關(guān)系等;

功用角色(telic role): 描寫對象的用途和功能。

這四種物性角色展示了名詞指稱事物所涉及的百科知識,極大地豐富了名詞的語義內(nèi)涵,對于深入刻畫名詞的語義結(jié)構(gòu)和信息具有重要的指導(dǎo)作用;同時(shí),它們都是名詞所涉及的基本角色,有著很強(qiáng)的心理現(xiàn)實(shí)性。更為重要的是,它們將人們對于名詞指稱事物的基本感受和認(rèn)識以形式化和圖式化的方式展示出來,讓名詞的語義信息變得不再飄忽不定從而難以把握。

從生成詞庫理論對詞義的描寫框架中,可以明確以下幾點(diǎn): 1.結(jié)構(gòu)主義理論、生成主義理論和自然語義元語言理論認(rèn)為語言知識和百科知識應(yīng)當(dāng)劃清界限,而生成詞庫理論的態(tài)度與它們截然不同,強(qiáng)調(diào)百科知識與語言知識沒有界限;在生成詞庫的框架下,語義問題不是局限于語言系統(tǒng)內(nèi)部所討論的對象,而是牽涉到人們對于世界的了解和認(rèn)識狀態(tài),這種百科知識會(huì)對話語的理解和建構(gòu)、話語形式的塑造產(chǎn)生重要的影響。其中,而物性角色為百科知識的描寫提供了一種形式化很高、操作性很強(qiáng)的解決手段*對于生成詞庫將百科知識納入到名詞詞義描寫的做法,一些學(xué)者也提出了質(zhì)疑和批評。比如,F(xiàn)odor & Lepore[15]就曾極端地認(rèn)為: 如果詞項(xiàng)能夠表達(dá)意義,那么詞庫中應(yīng)該保留的是關(guān)于詞項(xiàng)的信息,而不是關(guān)于世界的信息;詞義的內(nèi)容應(yīng)該嚴(yán)格區(qū)分語言知識和世界知識,語言之外的推理性因素(指物性角色)不應(yīng)該被納入到詞義描寫的框架之中。此外,生成詞庫的做法也與以Katz為代表的語義分解派相抵觸,后者同樣認(rèn)為詞義具有客觀性,在分析語義時(shí)必須將語言知識和人的百科知識分開。總之,諸如語言知識和百科知識的區(qū)分、語言研究,特別是語義研究是否應(yīng)該引入百科知識等問題,一直都在引起廣泛的討論。;2. 從Katz 和Fodor所創(chuàng)立的生成語義學(xué)理論來看,生成詞庫很明顯地受到了它的影響,也試圖為詞義提供一個(gè)可分解的模式。不過,生成詞庫的理論目標(biāo)決定了它與生成語義對詞義的處理策略是不同的: 生成主義對多義詞的詞義采取的是靜態(tài)羅列的手段,詞義之間是分割開來、互不聯(lián)系的,而生成詞庫則認(rèn)為多義詞的詞義之間具有內(nèi)在的邏輯關(guān)系,詞匯具有創(chuàng)造性使用的特點(diǎn),詞語在組合過程中所浮現(xiàn)的語義,即詞義在不同語境下的動(dòng)態(tài)生成,可以通過物性結(jié)構(gòu)對詞匯的描寫實(shí)現(xiàn)。這一點(diǎn)也與結(jié)構(gòu)主義僅僅關(guān)注單個(gè)詞語的意義分解和詞義的聚合性問題大不一樣,生成詞庫對于詞義組合性問題的研究拓寬了語義學(xué)研究的范圍和手段;3.與概念語義學(xué)用兩組語義特征對名詞進(jìn)行描寫不同,生成詞庫的描寫更加全面和豐富,名詞所包含的語義結(jié)構(gòu)和信息真實(shí)地反映了人們對名詞所指事物的概念化認(rèn)識。因此,與概念語義將百科知識應(yīng)用到動(dòng)詞(事件)描寫的充分性相對,生成詞庫則是將百科知識充分地應(yīng)用到對名詞(事物)的描寫,彌補(bǔ)了目前語義學(xué)理論描寫名詞的語義結(jié)構(gòu)和詞義信息的不足;4.自然語義元語言理論利用語義基元對詞義進(jìn)行描寫,但一方面,正如上面所看到的它對于“杯子”的定義,這種描寫方法給詞語所下的定義不具有準(zhǔn)確性;另一方面,語義基元并未通過驗(yàn)證,其可靠性值得懷疑。而生成詞庫的語義描寫則是建立在人們對事物可感知、可把握的具體層面之上的,因而具有可靠、真實(shí)的概念基礎(chǔ)。因此,相對于沒有明確任何定義方式的語義基元,生成詞庫對于詞義的描寫信息才是真實(shí)共存于不同民族之中的普遍概念內(nèi)容;5.在自然語言處理領(lǐng)域,雖然結(jié)構(gòu)主義的語義特征和語義場、生成語義的詞義分解、概念語義的概念結(jié)構(gòu)和自然語義元語言的概念基元等都是重要的語義自動(dòng)處理的形式模型,但它們對于名詞語義信息結(jié)構(gòu)的刻畫都存在或多或少的不足,不能以一種全面的形式化的描寫方式被計(jì)算機(jī)學(xué)習(xí)和儲(chǔ)存;而生成詞庫論的相關(guān)主張可以彌補(bǔ)這一不足,為計(jì)算機(jī)建立一個(gè)強(qiáng)可學(xué)性(learnable)的名詞知識資源庫提供基礎(chǔ)的理論支撐。

7 基于生成詞庫理論的有關(guān)名詞分析的案例及其對自然語言處理的啟發(fā)

生成詞庫理論所提出的名詞的物性結(jié)構(gòu)知識及其描寫框架,可以為解釋漢語中的一些復(fù)雜問題,特別是涉及名詞的句法、語義現(xiàn)象提供理論支持;并且,對于這些語言現(xiàn)象在自然語言處理方面的應(yīng)用也能提供一定的啟發(fā)性作用。

7.1 名名偏正結(jié)構(gòu)中的詞語缺省和語義蘊(yùn)含

袁毓林[13]提出“謂詞隱含”的概念,以此說明“的”字結(jié)構(gòu)中的名詞(NP1)和中心語名詞(NP2)之間存在某種述謂關(guān)系(predicative relation);宋作艷[14]也較為詳細(xì)地考察了“的”字結(jié)構(gòu)中謂詞的隱現(xiàn)情況??梢哉f,“謂詞隱含”現(xiàn)象的提出能夠幫助我們還原特定語言結(jié)構(gòu)所隱含的語義內(nèi)容,如例1所示。

例1 a. 紅木的家具→紅木制造的家具 b. 晚間的新聞→晚間播放的新聞 c. 書架上的參考書→書架上擺放的參考書 d. 左手的手套→左手戴的手套

囿于理論的匱乏,當(dāng)時(shí)只能限于指出整個(gè)結(jié)構(gòu)隱含謂詞這一現(xiàn)象,還不能有效地預(yù)測和限定不同的結(jié)構(gòu)具體隱含的是什么樣的動(dòng)詞。但是,現(xiàn)在有了物性結(jié)構(gòu)的理論支撐,我們就可以大膽地對此進(jìn)行預(yù)測: “家具”的施成角色是“制造”,“新聞”的施成角色是“播放”,所以a和b中隱含的動(dòng)詞是“制造”和“播放”;“書架”的功用角色是“擺放”,“手套”的功用角色是“戴”,所以c和d中隱含的動(dòng)詞是“擺放”和“戴”。也就是說,名詞的物性角色決定了上面這些名名偏正結(jié)構(gòu)中能隱含且只能隱含特定的動(dòng)詞。與此相關(guān),在物性角色的基礎(chǔ)上,我們還可以進(jìn)行系統(tǒng)的推廣,以確定某些不同語義類型的名名偏正結(jié)構(gòu)中所隱含的動(dòng)詞。例如,在以a為代表的表示質(zhì)料(材料)義的結(jié)構(gòu)中,隱含的動(dòng)詞是NP2的施成角色,如例2所示;在以b為代表的表示時(shí)間義的結(jié)構(gòu)中,隱含的動(dòng)詞可以是NP2的施成角色,如例3所示;在以c為代表的表示處所義的結(jié)構(gòu)中,隱含的動(dòng)詞可以是NP1的功用角色,如例4所示;在以d為代表的表示非固有領(lǐng)屬義的結(jié)構(gòu)中,隱含的動(dòng)詞可以是NP2的功用角色,如例5所示。

例2 木頭的桌子→木頭制作的桌子

緞子的被面→(用)緞子做/縫的被面

羊肉餡的包子→羊肉餡做的包子

大理石的雕像→大理石刻的雕像

例3 昨天的報(bào)紙→昨天出版的報(bào)紙

中秋的福利→中秋發(fā)放的福利

冬季的運(yùn)動(dòng)會(huì)→冬季舉辦的運(yùn)動(dòng)會(huì)

兔年的火災(zāi)→兔年發(fā)生的火災(zāi)

例4 倉庫的糧食→倉庫儲(chǔ)存的糧食

樓頂?shù)姆靠汀鷺琼斪〉姆靠?/p>

抽屜里的卡片→抽屜里放的卡片

衣架上的衣服→衣架上掛的衣服

例5 小張的鉛筆→小張寫字的鉛筆

小王的衣服→小王穿的衣服

小李的飛機(jī)→小李坐的飛機(jī)

小陳的首飾→小陳戴的首飾

這樣,通過確定名名偏正結(jié)構(gòu)表達(dá)什么樣的語義,就可以利用物性角色來對結(jié)構(gòu)中隱含的動(dòng)詞進(jìn)行補(bǔ)充;而如何還原出名名偏正結(jié)構(gòu)中的動(dòng)詞也是計(jì)算語言學(xué)界研究的重要問題,因?yàn)樗鼘π畔z索、問答系統(tǒng)、機(jī)器翻譯等諸多自然語言處理任務(wù)都有所幫助?,F(xiàn)在有了物性角色這一層語義知識,我們就可以在名詞語義類的基礎(chǔ)上歸納不同語義類組合所形成的釋義模板,而釋義模板中的動(dòng)詞就可以通過物性角色來加以咬合,最終開發(fā)出一套名名偏正結(jié)構(gòu)的釋義系統(tǒng)。

值得一提的是,魏雪[16]以及魏雪、袁毓林[17]利用上述方法構(gòu)建了漢語名名組合的釋義模板庫,并且在這種數(shù)據(jù)庫的基礎(chǔ)上初步實(shí)現(xiàn)了一個(gè)漢語名名組合的自動(dòng)釋義程序,其自動(dòng)釋義的準(zhǔn)確率達(dá)到94.23%。

此外,名詞物性角色還可以對傳統(tǒng)語法框架下不易說明的名名偏正結(jié)構(gòu)的歧義現(xiàn)象進(jìn)行統(tǒng)一的解釋,如例6所示。

例6 a. 魯迅的書——魯迅寫的書/魯迅藏的書/講述魯迅的書 b. 玻璃的碟子——玻璃制造的碟子/玻璃的窗戶——*玻璃制造的窗戶

例6a中,“魯迅”除了作為一個(gè)個(gè)體的普通人之外,還有自己特殊的身份標(biāo)簽“作家”、“文化名人”,所以在“魯迅的書”中,當(dāng)“魯迅”作為一個(gè)普通人時(shí),他可以像很多人一樣“藏書”,“藏”是“書”的處置角色*處置角色(handle role)是袁毓林[18-19]對物性角色的六種擴(kuò)展描述中的一種,意思是: 人或其他事物對名詞所指事物的慣常性的動(dòng)作、行為、影響。例如,對“水”的處置是“打、各、取、蓄、灑、放、排、倒、噴、波、玩兒”等。;當(dāng)他是一位作家時(shí),他還可以“寫書”,“寫”是“書”的施成角色;當(dāng)他是一位文化名人時(shí),他還可以被別人“講述”,“講述”是“書”的功用角色。正是因?yàn)槊~“書”具有不同的物性角色,再加上“魯迅”身份的特殊性,能夠使得上述結(jié)構(gòu)產(chǎn)生歧義。例6b中,“碟子”的構(gòu)成角色和施成角色分別是“玻璃”和“制造”,所以,“玻璃的碟子”可以還原為“玻璃制造的碟子”,與之相對,雖然“窗戶”的施成角色是“制造”,但其構(gòu)成角色不僅僅是“玻璃(面)”,還包括“木頭(框)”,所以,“玻璃的窗戶”不能還原為“玻璃制造的窗戶”,而是“玻璃制造的窗戶的面兒”??梢姡琋P2的構(gòu)成角色會(huì)對“玻璃的NP2”結(jié)構(gòu)解讀為“玻璃制造的NP2”還是“玻璃制造的NP2的NP3”產(chǎn)生限制。

同樣地,面對這類有歧義的名名偏正結(jié)構(gòu),如何識別該結(jié)構(gòu)的多義性及消解歧義也是自然語言處理所面臨的一個(gè)重要問題。不過,可以確信的是,要想真正解決好這類問題,就離不開對名詞語義信息的掌握和描寫,使計(jì)算機(jī)擁有一個(gè)關(guān)于名詞所指事物屬性特征的知識庫,而物性角色在這個(gè)知識庫的構(gòu)建中則能發(fā)揮積極的作用。如例6a所示,如果計(jì)算機(jī)知道“魯迅”有個(gè)特殊的身份“作家”,有其功用角色“寫”;是個(gè)普通的人,有其行為角色“藏”*行為角色(act role)指名詞所指事物的慣常性動(dòng)作、行為、活動(dòng)。例如,“水”的行為是“流、流動(dòng)、奔騰、翻滾、滴、淌、流淌”等。;是個(gè)文化名人,有其處置角色“講述”;并且,在知識庫中還儲(chǔ)存著“書”的施成角色“寫”,處置角色“藏”和功用角色“講述”,那么,通過某種特征加權(quán)機(jī)制和以動(dòng)詞為中心的語義關(guān)聯(lián)機(jī)制,就可以為“魯迅的書”獲得“寫、藏、講述”這些隱含的釋義動(dòng)詞。最終,不僅可以幫助計(jì)算機(jī)完成歧義結(jié)構(gòu)的識別,而且還可以獲得歧義結(jié)構(gòu)的多種語義解讀。再如例6b所示,如果計(jì)算機(jī)具有“碟子是玻璃做的”這一語義知識,即知道“碟子”的材料角色是“玻璃”*材料角色(material role)指創(chuàng)造名詞所指事物所用的材料。例如,“椅子”的材料是“木頭、竹子、藤子、木、竹、藤、鋼、鐵、塑料、硬板”等。,通過識別名名偏正結(jié)構(gòu)中的第一個(gè)名詞也是“玻璃”,就可以在“碟子”的施成角色上定義規(guī)則,解釋該結(jié)構(gòu)的語義是“玻璃制造的碟子”;相反,如果計(jì)算機(jī)知道“窗戶”的材料角色是“玻璃和木頭”,構(gòu)成角色是“面和框”,“面”和“框”分別由“玻璃”和“木頭”制成,通過識別該結(jié)構(gòu)中的第一個(gè)名詞是單獨(dú)的“玻璃”,就可以定義規(guī)則排除“玻璃制造的窗戶”這種語義解釋,而生成“玻璃制造的窗戶面”這一更為準(zhǔn)確的語義。

總而言之,名詞物性角色可以對名名偏正結(jié)構(gòu)中能夠隱含什么樣的動(dòng)詞進(jìn)行簡單、整齊的限定和說明,也能對與之相關(guān)的一些語言學(xué)現(xiàn)象給出深層原因方面的解釋;同時(shí),也能夠?yàn)槊Y(jié)構(gòu)在自然語言處理中的釋義問題提供一定的幫助。

7.2 名詞隱喻義的語義生成

名詞隱喻是語言中廣泛存在的一種語言現(xiàn)象。關(guān)于隱喻義是如何產(chǎn)生的這個(gè)問題,我們一般都是訴諸于對于名詞所指事物的百科知識,依靠經(jīng)驗(yàn)性認(rèn)識嘗試在不同事物之間建立起相似性的關(guān)聯(lián),從而將其中一個(gè)事物的屬性特征轉(zhuǎn)嫁到另外一個(gè)事物之上。名詞物性角色的提出為我們觀察名詞所指事物的內(nèi)在聯(lián)系,以及解釋名詞隱喻義的生成提供了一種方式,如例7(引自李強(qiáng)[20])所示。

例7 a. 工業(yè)是國民經(jīng)濟(jì)發(fā)展的心臟 b. 他是個(gè)猴子 c. 造論文 d. 樹的臂膀

例7a想要表達(dá)的是工業(yè)對于國民經(jīng)濟(jì)發(fā)展的重要性,這個(gè)意義的生成是依靠將喻體名詞“心臟”的物性結(jié)構(gòu)中的功能角色投射到本體名詞“工業(yè)”這一過程實(shí)現(xiàn)的。因?yàn)椤靶呐K”是人體最重要的生命器官,其功用角色是維持生命的基本運(yùn)作;同樣,“工業(yè)”在整個(gè)生產(chǎn)領(lǐng)域也是處于絕對重要的地位,是經(jīng)濟(jì)發(fā)展的推動(dòng)劑。這種功能上的相似性使得“工業(yè)”和“心臟”之間的功用角色的映射容易被激活和提取。因此,我們很容易將“心臟”的功用角色轉(zhuǎn)嫁到“工業(yè)”上,從而完成對“工業(yè)”的隱喻義識解。

例7b想要表達(dá)的是他聰明、靈活,這是依靠將“猴子”物性結(jié)構(gòu)中的形式角色“機(jī)靈聰明”投射到本體名詞“他”這一過程實(shí)現(xiàn)的,從而說明本體名詞“他”也具有類似的特征。

例7c中,“論文”一般都是“寫”出來的,但也可以用“造”,實(shí)際上是因?yàn)槲覀儼颜撐漠?dāng)作是一個(gè)建筑,“建筑”的施成角色“造”投射到“論文”之上,形成“論文”比作“建筑”的隱喻義。

例7d中,“樹”的構(gòu)成角色是“枝干”,“枝干”與“樹”構(gòu)成領(lǐng)屬和被領(lǐng)屬的關(guān)系;“人”的構(gòu)成角色是“臂膀”,“臂膀”和“人”構(gòu)成領(lǐng)屬和被領(lǐng)屬的關(guān)系?;凇皹洹焙汀叭恕痹跇?gòu)成角色上的相似性關(guān)系,我們會(huì)將“人”的特性賦予“樹”上,形成“樹比作人”的隱喻。

從上面的舉例可以看出,名詞物性角色對于我們建立兩個(gè)名詞之間的隱喻式理解起了非常重要的作用。正是在物性角色的基礎(chǔ)上,我們可以在相關(guān)名詞之間建立起內(nèi)在的聯(lián)系,從而確保我們能夠輕松自如地理解一些非常規(guī)的組合形式。同時(shí),深入細(xì)致地刻畫名詞的物性角色信息對于計(jì)算機(jī)理解隱喻這類問題也能起到一定的作用。王治敏[21]在談到漢語名詞隱喻的語義映射分析和名詞隱喻所隱含的思維模式時(shí)就曾指出,隱喻的映射就是把那些已知領(lǐng)域物體的典型特征及相關(guān)屬性映射到相對陌生的事物屬性上?!皀+n”隱喻映射是全方位的,不僅包含名詞的名稱,還包括屬性、功用等寬泛的映射范圍。同時(shí),事物所具有的“長、寬、高、點(diǎn)、線、面、體積”等幾何特征在名詞短語隱喻中都有所體現(xiàn)。最后,他認(rèn)為建立一個(gè)漢語隱喻知識庫,把名詞重要的屬性特征形式化到知識庫中是十分有必要的,這對于計(jì)算機(jī)識別理解隱喻式表達(dá)非常有幫助。

可以預(yù)見,這個(gè)知識庫的建立離不開物性結(jié)構(gòu)的指導(dǎo)作用,只有把隱喻名詞的物性結(jié)構(gòu),或稱為屬性特征刻畫清楚了,才能歸納名詞隱喻的基本類型。

7.3 供用句對中動(dòng)詞的選擇約束

供用句是漢語中一種非常特殊的句式結(jié)構(gòu),表達(dá)“某些存在物被提供給某些人使用”的語義。關(guān)于這種句式的形成機(jī)制問題,已有的研究都存在一個(gè)無法解釋的問題,即為什么供用句對其中的動(dòng)詞有特殊的選擇要求,有些供用句可以成立,而有些則不行。請看例8的對比:

例8 一鍋飯吃十個(gè)人

*一鍋飯做/要十個(gè)人

一張沙發(fā)坐三個(gè)人

*一張沙發(fā)抬/搬三個(gè)人

一只箱子裝五件大衣

*一只箱子蓋五件大衣

兩桶漆刷一面墻

*兩桶漆放一面墻

由這些例子可見,供用句中的動(dòng)詞是有其特殊選擇限制的?,F(xiàn)有研究雖然可以對上面左側(cè)這些“能說”的供用句具有較好的覆蓋面,但無法限定排除右側(cè)這些“不能說”的供用句。因此,有必要從一個(gè)新的角度對供用句的上述差異做出解釋,而名詞物性角色則為解釋這種差異提供了一種有效的手段。

觀察上面這些例子,我們發(fā)現(xiàn): 主語名詞物性角色中的功用角色與供用句中的動(dòng)詞具有高度的一致性:凡是動(dòng)詞為主語名詞的功用角色,這樣的供用句可以成立;相反,如果動(dòng)詞不是主語名詞的功用角色,這樣的供用句則不能成立。例如,“飯”的功用角色是“吃”,而不是“做/要”;“沙發(fā)”的功用角色是“坐”,而不是“抬/搬”;“箱子”的功用角色是“裝”,而不是“蓋”;“漆”的功用角色是“刷”,而不是“放”。這樣,通過物性角色這一概念就可以簡單地為供用句對動(dòng)詞的選擇設(shè)置一條沒有例外的規(guī)定,具有很強(qiáng)的解釋力。

對于自然語言處理任務(wù)來說,供用句給計(jì)算機(jī)自動(dòng)標(biāo)注句子成分的語義角色帶來了困難。汪昌松、靳瑋[22]指出,在對供用句進(jìn)行自動(dòng)語義標(biāo)注過程中,以動(dòng)詞為中心,無論是常規(guī)句還是供用句,計(jì)算機(jī)很容易將動(dòng)詞前的成分標(biāo)注成施事,而將動(dòng)詞后的成分標(biāo)注為受事。但很顯然,這是不正確的。常規(guī)句和供用句動(dòng)詞前后的語義角色剛好相反,在常規(guī)句中,施事成分在前,受事成分在后,而在供用句中,施事成分在后,受事成分在前。因此,這會(huì)對計(jì)算機(jī)自動(dòng)識別語義角色加以干擾?,F(xiàn)在,我們發(fā)現(xiàn)供用句中的動(dòng)詞都是句首名詞的功用角色,這可以為計(jì)算機(jī)自動(dòng)判定句式結(jié)構(gòu),進(jìn)而進(jìn)行自動(dòng)語義角色標(biāo)注任務(wù)提供幫助。如果計(jì)算機(jī)碰到一個(gè)句子中出現(xiàn)雙數(shù)量詞結(jié)構(gòu),并且它們之間通過動(dòng)詞連接,通過自身存儲(chǔ)的有關(guān)名詞物性角色的知識庫來判定動(dòng)詞是否是句首名詞的功用角色,如果是,則判定這個(gè)句子是供用句;如果不是,則判定這個(gè)句子是常規(guī)句。在此基礎(chǔ)上再進(jìn)行下一步的語義角色標(biāo)注任務(wù),就可以實(shí)現(xiàn)語義角色的準(zhǔn)確標(biāo)注。并且,在計(jì)算機(jī)判定句式結(jié)構(gòu)的基礎(chǔ)上,還可以通過一定的語義規(guī)則實(shí)現(xiàn)對供用句這一特殊句式的語義解釋,比如,可以規(guī)定計(jì)算機(jī)碰到“一鍋飯(NP1)吃(V)三個(gè)人(NP2)”這樣的句式,就語義解釋為“一鍋飯(NP1)可以供/讓三個(gè)人(NP2)吃(V)”,這對文本理解、機(jī)器翻譯和信息抽取等方面都是有一定幫助的。

7.4 中動(dòng)結(jié)構(gòu)成立的合格性條件

中動(dòng)結(jié)構(gòu)是不同語言中廣泛存在的一種現(xiàn)象,是“主動(dòng)形式表被動(dòng)意義”[23]。在漢語中動(dòng)句的研究中,一個(gè)引起學(xué)者們普遍關(guān)注的問題是中動(dòng)句中動(dòng)詞的語義性質(zhì)和用法特點(diǎn),例如,Sung[24]和曹宏[25]都曾討論過中動(dòng)句對動(dòng)詞的選擇限制條件。其中,曹宏[25]將漢語中動(dòng)句對動(dòng)詞的選擇限制條件歸納為“只有自主動(dòng)詞中的及物動(dòng)詞才有可能進(jìn)入中動(dòng)句,非自主動(dòng)詞中的及物動(dòng)詞不能進(jìn)入中動(dòng)句”。應(yīng)該說,動(dòng)詞的自主性和非自主性特征的確是中動(dòng)句能否成句的一個(gè)非常重要的條件。但是,我們也發(fā)現(xiàn)有一些例子的合格與否是“自主性”不能完全地加以解決的,如例9—例11所示。

例9 a. 這輛車開起來很容易。 b. *這輛車踢起來很容易。

例10 a. 這件衣服穿起來很舒服。 b. *這件衣服洗起來很舒服。

例11 a. 這種蘋果吃起來很酸。 b. *這種蘋果吃起來很容易。 c. 這種核桃吃起來很容易。

在上面的例9和例10中,每組兩個(gè)句子除了動(dòng)詞不同外,其余成分都相同,所形成的中動(dòng)句存在合格性上的差異。在例11中,a句和b句的主語名詞和動(dòng)詞都相同,而形容詞不同,所形成的中動(dòng)句在合格性上存在差異;而b句與c句相比,更換主語名詞,其余部分不變,所形成的中動(dòng)句又變得能說。這一系列的對比差異告訴我們: 雖然這些句子中的動(dòng)詞都是自主性的及物動(dòng)詞,但有的中動(dòng)句能說,而有的則不能說;其中的原因不可能在于動(dòng)詞是否具有“自主性”這一語義范疇,否則上面這些句子都應(yīng)該合格。

而從名詞的物性角色角度出發(fā)就可以對“自主性”解釋方案做一個(gè)很好的補(bǔ)充,能夠解釋為什么上面的例9a、例10a和例11a、例11c成立,而例9b、10b和11b不成立。在例9a中,“車”的功用角色是供人們“開”的,為了更加方便人們開車,使得人們開起車來感覺更加容易輕松,汽車生產(chǎn)商可以在汽車的構(gòu)造設(shè)計(jì)上下功夫,或者增加一些部件,或者對車的內(nèi)部座椅等設(shè)備進(jìn)行改良等等,以增加車的“易開性”;也就是說,“車”本身的形式角色和構(gòu)成角色與“開起來很容易”這一狀態(tài)具有語義上的關(guān)聯(lián)性和共構(gòu)性,所以,“這輛車開起來很容易”是成立的;與之相對的是例9b,雖然“車”也可以被踢,但“車”的基本功能是供人們開的,它本身沒有任何構(gòu)成部件是為了供人們踢它而設(shè)計(jì)的,也就是說,在我們對“車”的概念化認(rèn)識中,它沒有物性角色與“踢起來容易”在語義上相互關(guān)聯(lián),所以,“這輛車踢起來很容易”也就不合格。在例10a中,“衣服”的功用角色是供人們穿的,衣服的布料、質(zhì)地、柔軟程度等都與人們穿它的體驗(yàn)感覺密切相關(guān),決定是否能夠產(chǎn)生“舒服”的感覺,也就是說,衣服的構(gòu)成角色和形式角色與“穿起來很舒服”具有語義關(guān)聯(lián)性和共構(gòu)性,因此,“這件衣服穿起來很舒服”能夠成立;相反,在例10b中,“衣服”的功用角色不是用來“洗”的,其形式角色和構(gòu)成角色與“洗起來很舒服”這種狀態(tài)之間也沒有語義上的關(guān)聯(lián)性,所以,“這件衣服洗起來很舒服”就不能成立。同樣的分析可應(yīng)用到例11中,“蘋果”的功用角色是用來“吃”的,口味是它的形式角色,因此,“蘋果”本身的形式角色與“吃起來很酸”具有語義關(guān)聯(lián)性,a句成立;在c句中,“核桃”具有堅(jiān)硬的外殼,如果不用工具就很難將外殼剝除,核桃的這一形式角色決定了要想吃它就不是一件容易的事情,換而言之,這種形式角色與“吃起來不容易”所表示的狀態(tài)具有語義共構(gòu)性和關(guān)聯(lián)性,所以c句是合格的;相反,在我們對“蘋果”的概念化認(rèn)識中,它的皮很薄,不具有核桃那種堅(jiān)硬的外殼,也不需要像核桃那樣去除外殼才能吃到里面的果實(shí),所以,蘋果的這一形式角色與“吃起來不容易”所表示的狀態(tài)不具有語義共構(gòu)性和關(guān)聯(lián)性,因而所形成的b句也就不合格。

通過上面幾例的分析,我們可以發(fā)現(xiàn): 從名詞的物性角色角度出發(fā)可以對中動(dòng)句的成立與否做出解釋和說明。在物性角色的基礎(chǔ)上,中動(dòng)句的合格性條件可以總結(jié)為: 主語名詞的物性角色與謂語成分在語義上具有共構(gòu)性和關(guān)聯(lián)性;名詞的物性角色能夠在一定程度上促使謂語成分所表示狀態(tài)的發(fā)生。

在自然語言處理領(lǐng)域,尤其是在問答系統(tǒng)的設(shè)計(jì)中,如何能讓計(jì)算機(jī)自動(dòng)生成上面這些合格的a句,而避免出現(xiàn)像b這些不合格的句子?通過觀察中動(dòng)句的生成方式發(fā)現(xiàn): 人們在概念系統(tǒng)中對于名詞的屬性特征的認(rèn)識在很大程度上決定了后面謂語部分應(yīng)該采取什么樣的動(dòng)詞和形容詞,以實(shí)現(xiàn)它們在語義上的融合。那么,如果能將名詞的這種屬性特征表征為形式化的知識體系存儲(chǔ)在計(jì)算機(jī)中,就應(yīng)該可以為計(jì)算機(jī)生成合格的中動(dòng)句提供一定的幫助。如例9所示,如果計(jì)算機(jī)知道“車”的功能用途是“開”,并且“車”的某些內(nèi)部構(gòu)成部件的功能用途也是為了“提高性能,讓駕駛者得到更加方便、容易的駕車體驗(yàn)”,通過大規(guī)模語料搜索經(jīng)常與“開(車)”這一動(dòng)作行為所關(guān)聯(lián)的感受評價(jià)類形容詞,將這樣一種語義關(guān)聯(lián)信息以指針鏈接的方式存儲(chǔ)在計(jì)算機(jī)中,再輔之以“名詞+動(dòng)詞+起來+形容詞”這樣一種語序規(guī)則,最終就可以按照語序規(guī)則生成“車開起來容易”這樣合格的句子,而不會(huì)出現(xiàn)“車踢起來容易”;相反,如果計(jì)算機(jī)知道“足球”的功能用途是“踢”,通過文本搜索與“踢(球)”語義上相關(guān)的感受評價(jià)類狀態(tài),再通過線性層面上連接相關(guān)成分就可以生成“球踢起來容易”的中動(dòng)句。這樣一種語義關(guān)聯(lián)方式可以圖示化表示為圖4。

圖4 “車”、“足球”、“開”、“踢”、“容易”等成分的語義關(guān)聯(lián)

在調(diào)查大規(guī)模真實(shí)文本語料的基礎(chǔ)上,通過名詞物性角色、動(dòng)詞和形容詞的論元結(jié)構(gòu)描述,可以把上圖中各個(gè)成分通過語義關(guān)系關(guān)聯(lián)起來形成一個(gè)語義網(wǎng)絡(luò),從而為計(jì)算機(jī)自動(dòng)抽取相關(guān)成分并生成合格的中動(dòng)句提供條件。同時(shí),也能為自然語言理解中的復(fù)雜自動(dòng)推理提供一種基于網(wǎng)絡(luò)的匹配。

8 結(jié)語

從以上四個(gè)案例的分析可見,名詞在漢語語法分析中具有非常重要的作用,其地位并不亞于動(dòng)詞和形容詞,對于名詞詞義的描寫有助于相關(guān)語言現(xiàn)象的說明和解釋。生成詞庫理論所提出的名詞的物性結(jié)構(gòu)知識不僅關(guān)注名詞詞義之間的縱向聚合關(guān)系,同時(shí)也關(guān)注名詞和動(dòng)詞之間的橫向組合關(guān)系,尤其是能夠解釋句子中詞語之間根本性的語義組合方式及其組合語義的生成。對于詞語缺省、詞語限定等動(dòng)詞無法解釋或解釋不給力的情況,名詞的物性結(jié)構(gòu)知識更是起到樞紐和支點(diǎn)的作用,可以有效地幫助說明句子中詞語之間的意合方式和運(yùn)作機(jī)制。對于名詞語義結(jié)構(gòu)和詞義信息的形式化刻畫,有助于相關(guān)語言現(xiàn)象的分析,同時(shí)也能為自然語言處理的相關(guān)問題提供重要的語義知識資源支撐。

[1] Murphy M Lynne. Semantic Relations and the Lexicon [M]. Cambridge: Cambridge University Press, 2003.

[2] Katz J Jerrold, Jerry A Fodor. The structure of a semantic theory [J]. Language, 1963, 39(2):170-210.

[3] Jackendoff R Parts, Boundaries[M]. Beth Levin and Steven Pinker. Lexical and Conceptual Semantics. Oxford: Blackwell, 1992:9-45.

[4] Wierzbicka Anna. Semantic Primitives [M]. Frankfurt: Athenaeum, 1972.

[5] Goddard Cliff. Ethnopragmatics: a new paradigm[M]. Goddard. Ethnopragmatics: Understanding Discourse in Cultural Context. Berlin: Mouton de Gruyter, 2006.

[6] Fillmore C J, Johnson C R, Petruck M.R. Background to FrameNet [J]. International Journal of Lexicography, 2003, 16 (3): 236 - 250.

[7] 袁毓林, 李強(qiáng). 怎樣用物性結(jié)構(gòu)知識解決“網(wǎng)球問題”?[J]. 中文信息學(xué)報(bào), 2014, 28(5):1-12.

[8] Wierzbicka Anna. Lexicography and Conceptual Analysis [M]. Ann Arbor, MI: Karoma, 1985.

[9] Geeraerts Dirk. Theories of Lexical Semantics [M]. New York: Oxford University Press Inc, 2010.

[10] Pustejovsky J. The Generative Lexicon [J]. Computational linguistics, 1991, 17(4):409-441.

[11] Pustejovsky J. The Generative Lexicon [M]. Cambridge: MIT Press, 1995.

[12] Pustejovsky J, P Bouillon, H Isahara, et al. Advances in Generative Lexicon Theory [M]. Dordrecht: Springer, 2013.

[13] 袁毓林. 謂詞隱含及其句法后果——“的”字結(jié)構(gòu)的稱代規(guī)則和“的”的語法、語義功能[J]. 中國語文, 1995, 4:241-255.

[14] 宋作艷. 也談與“的”字結(jié)構(gòu)有關(guān)的謂詞隱含[J]. 漢語學(xué)習(xí), 2014, 1:20-28.

[15] Fodor Jerry, Lepore Ernie. The Emptiness of the Lexicon: Reflections on James Pustejovsky’s “The Generative Lexicon” [J]. Linguistic Inquiry, 1998, 29(2): 269-288.

[16] 魏雪. 面向語義搜索的漢語名名組合的自動(dòng)釋義研究[D]. 北京大學(xué)碩士學(xué)位論文, 2012.

[17] 魏雪, 袁毓林. 基于語義類和物性角色建構(gòu)名名組合的釋義模板[J]. 世界漢語教學(xué), 2013, 27(2):172-181.

[18] 袁毓林. 基于生成詞庫論和論元結(jié)構(gòu)理論的語義知識體系研究[J]. 中文信息學(xué)報(bào), 2013, 27(6):23-30。

[19] 袁毓林. 漢語名詞物性結(jié)構(gòu)的描寫體系和運(yùn)用案例[J]. 當(dāng)代語言學(xué), 2014, 16(1):31-48.

[20] 李強(qiáng). 基于物性結(jié)構(gòu)和概念整合的名詞隱喻現(xiàn)象分析[J]. 語言教學(xué)與研究, 2014, 6:44-53。

[21] 王治敏. 漢語名詞隱喻的語義映射分析[J]. 語言教學(xué)與研究, 2009, 3: 89-96.

[22] 汪昌松,靳瑋.從名詞的物性結(jié)構(gòu)看容納句中動(dòng)詞的允準(zhǔn)機(jī)制[R]. 第十六屆漢語詞匯語義學(xué)國際學(xué)術(shù)研討會(huì)論文, 北京師范大學(xué), 2015.

[23] Quirk R. A Grammar of Contemporary English [M]. London: Longman, 1972.

[24] Sung Kuo-ming. Case Assignment under Incorporation [D]. University of California at Los Angeles, 1994.

[25] 曹宏. 中動(dòng)句對動(dòng)詞形容詞的選擇限制及其理據(jù)[J]. 語言科學(xué), 2004, 3(1):11-28.

What Kind of Semantic Knowledge is Neccessary for the Semantic Description and Research of Nouns?

LI Qiang, YUAN Yulin

(Department of Chinese Language and Literature, Research Center of Chinese Linguistics,Ministry of Education Key Laboratory for Computational Linguistics, Peking University, Beijing 100871, China)

This paper mainly discussed the semantic description and the research of nouns. Firstly, several main lexical semantics theories (include structuralism semantics, generative semantics, conceptual semantics and natural semantic metalanguage) were introduced and reviewed, and their defects and deficiencies for semantic description were also discussed. Then, the qualia structure in generative lexicon theory was introduced, and its differences with the theories mentioned above and its features were illustrated. Finally, based on the generative lexicon theory, four examples of analysis on nouns using qualia structure (include word default, metaphor meaning generation, affordance sentence, middle construction) were exhibited and its possible application in natural language processing was shown.

lexical semantics theory; generative lexicon theory; qualia structure; nouns analysis; natural language processing

李強(qiáng)(1988—),博士研究生,主要研究領(lǐng)域?yàn)闈h語句法學(xué)、語義學(xué)和語用學(xué),也涉及計(jì)算語言學(xué)和中文信息處理。E-mail:leeqiang2222@163.com袁毓林(1962—),教授、博士生導(dǎo)師,主要研究領(lǐng)域?yàn)槔碚撜Z言學(xué)和漢語語言學(xué),特別是句法學(xué)、語義學(xué)、語用學(xué),也涉及計(jì)算語言學(xué)和中文信息處理等應(yīng)用性領(lǐng)域的問題。E-mail:yuanyl@pku.edu.cn

1003-0077(2015)05-0009-11

2015-08-15 定稿日期: 2015-10-08

國家自然科學(xué)基金(61375074,61371129)

TP391

A

猜你喜歡
語義學(xué)詞庫基元
論英國學(xué)者的語義學(xué)簡史研究?
基于多重示范的智能車輛運(yùn)動(dòng)基元表征與序列生成
一款低頻偶極子聲源設(shè)計(jì)
條約演化解釋:合法性、語義學(xué)分析及近似概念
一“吃”多用
輸入法詞庫取證比較研究
人體細(xì)胞內(nèi)存在全新DNA結(jié)構(gòu)
事件語義學(xué)框架下“給”句式歧義的形式化描寫
Hiddleston’s Causal Modeling Semantics and the Distinction between Forward-Tracking and Backtracking Counterfactuals*
輸入法詞庫乾坤大挪移
会泽县| 宣恩县| 偏关县| 蓬莱市| 临湘市| 涡阳县| 慈溪市| 新巴尔虎右旗| 舟山市| 抚顺市| 惠来县| 临猗县| 梅河口市| 哈巴河县| 竹溪县| 崇信县| 泰宁县| 邵阳县| 攀枝花市| 赤水市| 察雅县| 大港区| 沧州市| 滦南县| 渭南市| 深圳市| 五华县| 三明市| 潼关县| 韶关市| 高碑店市| 格尔木市| 射洪县| 禹城市| 贺兰县| 乡城县| 即墨市| 鄂尔多斯市| 洮南市| 滕州市| 石渠县|