国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

關(guān)于詞庫(kù)及其運(yùn)行原理的一些假設(shè)

2011-12-08 07:36:06榮鑫閣
關(guān)鍵詞:詞干詞庫(kù)構(gòu)詞

榮鑫閣

(重慶師范大學(xué) 外國(guó)語(yǔ)學(xué)院,重慶 400047)

關(guān)于詞庫(kù)及其運(yùn)行原理的一些假設(shè)

榮鑫閣

(重慶師范大學(xué) 外國(guó)語(yǔ)學(xué)院,重慶 400047)

語(yǔ)言學(xué)中的詞庫(kù)指人腦、識(shí)別、提取以及構(gòu)造字詞的能力。根據(jù)以往的假設(shè),可分為無(wú)序排列式和有序排列式。但無(wú)論是哪一種,都要涉及到詞庫(kù)的基本儲(chǔ)存單位、詞庫(kù)的運(yùn)行原理等問(wèn)題。生成語(yǔ)法學(xué)界以及計(jì)算語(yǔ)言學(xué)界對(duì)這些問(wèn)題也都提出過(guò)一些解釋。筆者贊同詞庫(kù)中的詞匯是依照語(yǔ)義原則組織起來(lái)的一個(gè)網(wǎng)絡(luò),贊同詞典里儲(chǔ)存著詞、詞綴和詞干的假設(shè)。無(wú)論是詞、詞干或詞綴,只要有意義或功能可言,都是語(yǔ)義網(wǎng)絡(luò)中的成員,與其它結(jié)點(diǎn)有這樣或那樣的聯(lián)系。這些聯(lián)系都是語(yǔ)義復(fù)合的重要資源。

詞庫(kù);無(wú)序排列式;有序排列式;儲(chǔ)存單位;語(yǔ)義網(wǎng)絡(luò)

一、引 言

語(yǔ)言學(xué)中的詞庫(kù)指人腦儲(chǔ)存、識(shí)別、提取以及構(gòu)造字詞的能力??紤]到字詞是如何排列的,關(guān)于詞庫(kù)的設(shè)想大體上可分為兩類(lèi):1)無(wú)序排列式,即詞的排列是任意的,無(wú)章法可循;2)有序排列式,即詞庫(kù)是一個(gè)有組織的網(wǎng)絡(luò)系統(tǒng)。但無(wú)論是哪種情況,都涉及到諸如“詞庫(kù)的基本儲(chǔ)存單位是什么”、“詞庫(kù)如何運(yùn)行”等問(wèn)題。關(guān)于這些問(wèn)題,生成語(yǔ)法學(xué)界以及計(jì)算語(yǔ)言學(xué)界都提出過(guò)一些假設(shè)。本文將在第2、3節(jié)中分別介紹詞庫(kù)理論中的無(wú)序觀和有序觀;在第4節(jié)中介紹詞庫(kù)儲(chǔ)存單位以及規(guī)則運(yùn)行的假設(shè);最后,第5節(jié)作評(píng)論。

二、無(wú)序排列式

生成語(yǔ)法的詞庫(kù)是典型的無(wú)序排列式。因?yàn)樯烧Z(yǔ)法把焦點(diǎn)放在詞內(nèi)部的結(jié)構(gòu)特征和詞與詞之間的句法關(guān)系上,從而忽略了詞匯的網(wǎng)絡(luò)關(guān)系。雖然生成語(yǔ)法對(duì)詞庫(kù)的看法也處在不斷發(fā)展變化之中,詞庫(kù)的地位也從附屬到自主顯得越來(lái)越重要,但基本式樣沒(méi)有變,仍保留了以往的主張:詞庫(kù)是一個(gè)無(wú)序排列的字/詞項(xiàng)的清單,詞庫(kù)中的信息只跟字/詞項(xiàng)的特異性有關(guān)。(Chomsky 1965:84)詞庫(kù)應(yīng)提供以下三類(lèi)信息:類(lèi)別特征、次類(lèi)特征、選擇限制。它們都是字/詞項(xiàng)的特異信息,不能由句法推導(dǎo)出來(lái),因此必須在詞庫(kù)中予以注明。類(lèi)別特征是句子結(jié)構(gòu)中最基本的元素:[名詞]、[動(dòng)詞]、[形容詞]等。例如,cat[名詞]、see[動(dòng)詞]、good[形容詞]、in[介詞]。如果不標(biāo)注,可能出現(xiàn)以下病句:

*Good see.

次類(lèi)特征包括[及物]、[不及物]、[單賓語(yǔ)]、[雙賓語(yǔ)]等。例如come、give,除了給它們標(biāo)注[動(dòng)詞]之外,還得給come標(biāo)注[不及物],給give標(biāo)注[雙賓語(yǔ)]。如果不標(biāo)注,可能出現(xiàn)以下病句:

*John came London.

*John gave me.

選擇限制也很重要,它包括動(dòng)詞給主語(yǔ)或賓語(yǔ)設(shè)定語(yǔ)義條件。如elapse,除標(biāo)有[動(dòng)詞]、[不及物],還要求主語(yǔ)是時(shí)間名詞。又如,frighten除標(biāo)有[動(dòng)詞]、[及物],還要求賓語(yǔ)名詞標(biāo)有[有靈]特征。以下句子是合格的:

Three months elapsed.(三個(gè)月的時(shí)間匆匆而過(guò)。)

The cat frightened the mouse.(貓嚇了老鼠一跳。)

如果不標(biāo)注可能出現(xiàn)病句:

*Three girls elapsed.

*The cat frightened sincerity.

生成語(yǔ)法的一個(gè)基本準(zhǔn)則是:詞庫(kù)與句法之間的冗余度越低越好。為保證信息的簡(jiǎn)潔性,有些特征無(wú)需詞庫(kù)提供標(biāo)注。例如give的補(bǔ)語(yǔ)信息只需標(biāo)注[NP,PP]就夠了,其中NP和PP的排序問(wèn)題交給句法去處理。換言之,在動(dòng)詞的次類(lèi)特征中只需說(shuō)明賓語(yǔ)的性質(zhì)和數(shù)量,無(wú)需提供排序信息;句法部門(mén)可以處理VP中的排序問(wèn)題。“中心語(yǔ)前置原則”表明:在英語(yǔ)這樣的語(yǔ)言中,中心語(yǔ)位于補(bǔ)語(yǔ)的前面。該原則來(lái)自普遍語(yǔ)法中的“居邊原則”,即短語(yǔ)中的中心詞出現(xiàn)在X杠的邊緣。如果詞庫(kù)也標(biāo)注動(dòng)-補(bǔ)在VP中的次序,實(shí)為多此一舉。賓語(yǔ)從句的形式也無(wú)須出現(xiàn)在動(dòng)詞的次類(lèi)特征中,動(dòng)詞的語(yǔ)義已包涵了這類(lèi)信息,如“認(rèn)知類(lèi)和斷言類(lèi)謂語(yǔ)帶判斷類(lèi)或陳述類(lèi)補(bǔ)語(yǔ)”。這樣一來(lái),詞庫(kù)的內(nèi)容得到簡(jiǎn)化,而普遍語(yǔ)法規(guī)則也得到了充分利用。

有人建議詞庫(kù)也應(yīng)標(biāo)注題元特征(參見(jiàn)Radford 2000:372)。這個(gè)意見(jiàn)后來(lái)被廣泛接受。較之上面提到的三類(lèi)信息,題元特征與句法結(jié)構(gòu)的關(guān)系更密切。這使得詞庫(kù)承載的句法信息比以往更多也更為復(fù)雜。題元理論認(rèn)為,句子中的主語(yǔ)和補(bǔ)語(yǔ)等成分要獲得合法地位,就必須接受動(dòng)詞指派的題元角色。例如,roll有兩個(gè)次類(lèi)特征:及物和作格。及物的例子有:

John rolled the ball down the hill.(約翰把球滾下了山。)

其中the ball充當(dāng)roll的賓語(yǔ)。作格的例子有:

The ball rolled down the hill.(球滾下了山。)

The ball充當(dāng)roll的主語(yǔ)。這兩種情況在傳統(tǒng)視角下屬不同的語(yǔ)法范疇,其間的聯(lián)系被忽略。但在題元理論中,無(wú)論roll是及物或作格,the ball從roll那里得到的指派相同,即受事(theme)。換言之,盡管以上兩個(gè)例句結(jié)構(gòu)不同,但動(dòng)詞roll指派給the ball的題元角色相同,都是受事。題元理論指出,為保證句子的合法性,題元信息必須如實(shí)投射到句法層面;為保障“如實(shí)投射”,相關(guān)的規(guī)則或原則不可或缺,例如“題元關(guān)系準(zhǔn)則”(Theta Criterion)、“投射原則”(Projection Principle)以及其它一些普遍原則。在生成語(yǔ)法中還沒(méi)有提出一個(gè)“詞項(xiàng)有序排列”的原則。

最近有學(xué)者(如Nelson和Toivonen 2000)暗示詞庫(kù)在某些方面可能是有序排列的,例如那些表示數(shù)目的詞。但不管怎樣,這并不影響生成語(yǔ)法的詞庫(kù)被歸入無(wú)序排列式。時(shí)至今日,生成語(yǔ)法的主流學(xué)者(如Chomsky)并未覺(jué)得非要設(shè)立一個(gè)有序排列的詞庫(kù)不可。在生成語(yǔ)法框架下從事詞法研究的學(xué)者同樣感覺(jué)不到提出“詞庫(kù)有序排列”假設(shè)的必要性。

三、有序排列式

詞之間存在各種語(yǔ)義聯(lián)系是詞庫(kù)有序排列式的基本思想。根據(jù)語(yǔ)義場(chǎng)理論的描述,詞因?yàn)檎Z(yǔ)義上的聯(lián)系形成一個(gè)完整的系統(tǒng),其中某些詞因?yàn)榫哂泄餐恼Z(yǔ)義特征而形成一個(gè)子系統(tǒng),即語(yǔ)義場(chǎng)。例如,英語(yǔ)中表示親屬關(guān)系的詞形成一個(gè)親屬場(chǎng):father、mother、uncle、aunt等。其共同特征是[親屬];表示家畜的詞形成家畜場(chǎng):sheep、cow、horse、pig等,共同特征是[家畜]。場(chǎng)之間不一定涇渭分明,更常見(jiàn)的情形是縱橫交錯(cuò)、上下重疊。從語(yǔ)義聯(lián)系來(lái)看,很難想象一個(gè)詞是孤單單的一個(gè)點(diǎn),與其它點(diǎn)沒(méi)有任何語(yǔ)義聯(lián)系。所有的點(diǎn)之間應(yīng)有許多連線,四通八達(dá),構(gòu)成一個(gè)復(fù)雜的網(wǎng)絡(luò)。這些連線即語(yǔ)義關(guān)系:同義、反義、上義、下義等。由George A.Miller(1985)主持研發(fā)的WordNet可以看作是有序詞庫(kù)的一個(gè)實(shí)例。它在計(jì)算語(yǔ)言學(xué)領(lǐng)域具有很大的國(guó)際影響。至少有六十幾個(gè)不同的語(yǔ)言建立了與之對(duì)應(yīng)的詞網(wǎng)。根據(jù)Wikipedia介紹,WordNet包含155 287個(gè)詞條,分為117 659個(gè)同義組,涵蓋206 941個(gè)語(yǔ)義配對(duì)。雖然不能說(shuō)這就是大腦詞庫(kù)的實(shí)際情況,但較之傳統(tǒng)上按字母或筆畫(huà)排序的詞典,查閱更方便,更快捷,而且擁有一個(gè)龐大的縱向聯(lián)系機(jī)制,更接近大腦詞庫(kù)的式樣。以sheep一詞為例,我們可以在WordNet中看到的信息包括:

表1 :sheep一詞的部分信息(WordNet 3.0)

Ovis,genus ovis: goats Ruminantia,suborder ruminantia:cattle;bison;sheep;goats;antelopes;deer;chevrotains;giraffes; sheep Bovidae,family bovidae:true antelopes;cattle;oxen;sheep; camels Artiodactyla,order Artiodactyla:an order of hooved mammals of the subclass Eutheria(including pigs and peccaries and hippopotami and members of the suborder Ruminantia)having an even num-整件關(guān)系ber of functional toes Eutheria,subclass Eutheria:all mammals except monotremes and marsupials Mammalia,class Mammalia:warm-blooded vertebrates characterized by mammary glands in the female Vertebrata,subphylum Vertebrata,Craniata,subphylum Craniata:fishes;amphibians;reptiles; birds;mammals Chordata,phylum Chordata:comprises true vertebrates and animals having a notochord Animalia,kingdom Animalia,animal kingdom:taxonomic kingdom comprising all living or extinct animals animalia,kingdom animalia,animal kingdom:taxonomic kingdom comprising all living or extinct animals herd:a group of cattle or sheep or other domestic mammals all of the same kind that are herded by humans flock:a group of sheep or goats同義關(guān)系sheep(sense 1):bovid sheep(sense 2):simpleton,simple—(a person lacking intelligence or common sense) sheep(Sense 3):follower—(an ordinary person who accepts the leadership of another) bovid:hollow-horned ruminants bovine:any of various members of the genus Bos Old World buffalo,buffalo:any of several Old World animals resembling oxen including,e.g.,water buffalo;并列下位關(guān)系Cape buffalo bison:any of several large shaggy-maned humped bovi ds having large heads and short horns musk ox,musk sheep,Ovibos moschatus:large shaggy-coated bovid mammal of Canada and Greenland;intermediate in size and anatomy between an ox and a sheep wild sheep:undomesticated sheep goat,caprine animal:any of numerous agile ruminants related to sheep but having a beard and straight horns goat antelope:bovid related to goats but having antelope-like features:mountain goats;gorals;serows;chamois;gnu goats antelope:graceful Old World ruminant with long legs and horns directed upward and backward;includes gazelles;springboks;impalas;addax;gerenuks;blackbucks;dik-diks forest goat,spindle horn,Pseudoryx nghetinhensis:cow-like creature with the glossy coat of a horse and the agility of a goat and the long horns of an antelope;characterized as a cow that lives the life of a goat )

WordNet的優(yōu)點(diǎn)在于為每一個(gè)詞標(biāo)注了豐富的縱向信息,而這些信息正是生成語(yǔ)法的詞庫(kù)中所缺乏的。人工智能研究者熱衷于把這兩種詞庫(kù)結(jié)合起來(lái),甚至想把更多的百科知識(shí)也收錄進(jìn)來(lái),從而建立一個(gè)功能更強(qiáng)大、自動(dòng)化程度更高的詞庫(kù)。但遇到的問(wèn)題之復(fù)雜是可想而知的。

四、儲(chǔ)存單位和運(yùn)行原理

語(yǔ)言中最小的意義單位是語(yǔ)素,最小的自由形式是詞。語(yǔ)素可分為自由語(yǔ)素和黏著語(yǔ)素,詞可分為簡(jiǎn)單詞和復(fù)雜詞。詞庫(kù)里儲(chǔ)存的東西是什么呢?不同的學(xué)者有不同的意見(jiàn)。Bloomfield說(shuō):“要充分描寫(xiě)一個(gè)語(yǔ)言就得羅列出每一個(gè)不由結(jié)構(gòu)或標(biāo)記決定其形態(tài)的形式;這將包括一個(gè)詞庫(kù),或語(yǔ)素清單,其中每一個(gè)語(yǔ)素都標(biāo)明了屬于哪個(gè)詞類(lèi),同時(shí)還包括一個(gè)清單,上面全是形態(tài)上不遵守規(guī)則的復(fù)雜詞。”(1955:269)簡(jiǎn)言之,詞庫(kù)儲(chǔ)存兩樣?xùn)|西:語(yǔ)素和無(wú)規(guī)則可言的復(fù)雜詞。Chomsky(1965:170-174)也認(rèn)為詞庫(kù)里不應(yīng)儲(chǔ)存那些可由規(guī)則生成的復(fù)雜詞,他不贊同語(yǔ)素清單說(shuō),他主張現(xiàn)詞清單,即詞庫(kù)里儲(chǔ)存的是現(xiàn)成的詞。Halle(1973)的想法似乎略有不同。他是生成語(yǔ)法學(xué)派中第一個(gè)提出構(gòu)詞規(guī)則自主運(yùn)行的人。構(gòu)詞任務(wù)以前是句法部門(mén)的事。他認(rèn)為詞庫(kù)中的基礎(chǔ)單位是語(yǔ)素。

圖1 Halle(1973)的詞庫(kù)模型

在這個(gè)模型中,語(yǔ)素清單中羅列著某一特定語(yǔ)言的全部語(yǔ)素;無(wú)論是自由語(yǔ)素、黏著語(yǔ)素還是派生詞綴或屈折詞綴,都處在同一層面上;除了詞綴沒(méi)有標(biāo)注類(lèi)別,其它語(yǔ)素都標(biāo)注類(lèi)別。動(dòng)詞標(biāo)注V:[write]V;名詞標(biāo)注N:[home]N。同時(shí)還標(biāo)注其它語(yǔ)法特征,以[write]V為例,它是一個(gè)根詞[根詞],非拉丁語(yǔ)源[-拉丁源](因而拒絕某些詞綴黏附);它還是一個(gè)強(qiáng)動(dòng)詞[強(qiáng)動(dòng)詞],即屈折變化不規(guī)則,過(guò)去時(shí)是wrote而非writed。如果是詞綴,只標(biāo)注Pref(前綴)或Suf(后綴),不標(biāo)注類(lèi)別:[-ity]Suf.。Halle認(rèn)為只有那些遵守構(gòu)詞規(guī)則并被過(guò)濾器認(rèn)可的復(fù)雜詞才能進(jìn)入詞典。詞典中的詞獲得了可插入句子的資格:[+可入句]。Halle注意到英語(yǔ)中有許多詞不遵守構(gòu)詞規(guī)則,它們?cè)谡Z(yǔ)音、語(yǔ)義或詞位上表現(xiàn)出某些特異性。

星號(hào)表示組合空缺。雖然(1)和(2)都是構(gòu)詞規(guī)則的產(chǎn)物,但兩者不相同。(2a)在語(yǔ)義上呈現(xiàn)特異性;(2b)在語(yǔ)音上呈現(xiàn)特異性;(2c)在組合上呈現(xiàn)特異性。為了避免例外情況太多,Halle建議,構(gòu)詞規(guī)則可自由運(yùn)行于語(yǔ)素清單,而特異性問(wèn)題交過(guò)濾器處理。換言之,由構(gòu)詞規(guī)則生成的詞不都是語(yǔ)言中現(xiàn)實(shí)的詞(actual words);有不少是可能的詞(possible words)。這些“可能的詞”在接受過(guò)濾器的審查時(shí)被貼上[-可入句]標(biāo)簽,因而不能出現(xiàn)在句中。具體拿(2c)中的兩個(gè)詞來(lái)說(shuō),過(guò)濾器不認(rèn)可它們。也就是說(shuō),雖然構(gòu)詞規(guī)則生成了這兩個(gè)詞,但過(guò)濾器認(rèn)定它們不具有任何現(xiàn)實(shí)性,即不可插入句子。故被擋在詞典之外。這樣一來(lái),如圖2所示,詞典就只包括那些符合規(guī)則、無(wú)需過(guò)濾器修改的詞以及那些被過(guò)濾器賦予額外特征的、具有特異性的詞。

圖2 :Halle(1973)構(gòu)詞模型(Scalise 1986:31)

圖2表示friend具有獨(dú)立成詞的特征,故直接進(jìn)入了詞典;boyhood符合構(gòu)詞規(guī)則并不帶有任何特異性,故進(jìn)入了詞典;recital符合構(gòu)詞規(guī)則,在過(guò)濾器中獲得語(yǔ)義上的特異性之后進(jìn)入了詞典;ignoration符合構(gòu)詞規(guī)則,但過(guò)濾器將它定性為“可能的但不現(xiàn)實(shí)的詞”,故沒(méi)有進(jìn)入詞典;mountainal不符合構(gòu)詞規(guī)則,屬于“既不可能也不現(xiàn)實(shí)的”詞,故不能進(jìn)入詞典。不難看出,構(gòu)詞規(guī)則是在語(yǔ)素的層面上運(yùn)行的,詞典里的詞是構(gòu)詞規(guī)則和過(guò)濾器共同作用的結(jié)果。在Halle的模型中,詞庫(kù)實(shí)際上被分為兩個(gè)部分:語(yǔ)素清單和詞典。詞庫(kù)的冗余度太高,例如,所有進(jìn)入詞典的簡(jiǎn)單詞(如friend、boy)同時(shí)也保留在語(yǔ)素清單中,因?yàn)闃?gòu)詞規(guī)則仍需要它們合成新的復(fù)雜詞。

Chomsky(1970)和Postal(1969)為了照顧句法,主張?jiān)~庫(kù)里最小的儲(chǔ)存單位是詞而不是語(yǔ)素。Aronoff(1976)指出,即使從詞法角度來(lái)看,這一主張也是正確的。他不否認(rèn)語(yǔ)素的存在,但強(qiáng)調(diào)很多語(yǔ)素離開(kāi)了合成詞也就失去了意義。例如cranberry和blackberry,其中cran-就很難說(shuō)有什么意義;black雖有獨(dú)立的意義,但與blackberry的詞義沒(méi)有必然的聯(lián)系?!昂谳辈灰欢ㄊ呛谏模锌赡苁撬{(lán)色或紅色的。也就是說(shuō),即使合成詞的部件具有獨(dú)立的意義,在很多情況下也難以斷定部件之間以及部件與整體之間是何種關(guān)系。在面對(duì)拉丁詞干和詞綴時(shí),問(wèn)題會(huì)變得更加棘手。例如:

表2 :詞綴或詞干都缺乏共通義

ad- admit assume adduce per- permit perceive

Aronoff認(rèn)為,試圖給表2任何一列中的詞根提供一個(gè)共通義,那將是徒勞的。例如fer,看不出在七個(gè)例詞中有何共通義。詞綴的情況也是一樣,我們無(wú)法從任何一行中找出一個(gè)共通義。例如re-,雖然其基本意思是‘倒回來(lái)’,但這并不是表2中五個(gè)例詞的共通義。Aronoff由此得出結(jié)論:如果語(yǔ)素缺乏明確的意義,構(gòu)詞規(guī)則也就無(wú)法在語(yǔ)素層面上運(yùn)行。他不僅否認(rèn)語(yǔ)素是屈折構(gòu)詞的基礎(chǔ),也否認(rèn)語(yǔ)素是派生構(gòu)詞的基礎(chǔ)。在他看來(lái),構(gòu)詞規(guī)則是將有意義的成分組合成有意義的詞的一組規(guī)則,只有現(xiàn)成的詞才能充當(dāng)這樣的成分。換言之,詞庫(kù)只能以詞為基本層面。其原理大致如下:

圖3 :Aronoff(1976)的詞庫(kù)模型

圖3表示,詞匯部門(mén)是一個(gè)獨(dú)立自主的模塊,包括詞典和構(gòu)詞規(guī)則;詞典中儲(chǔ)存的是詞;構(gòu)詞規(guī)則包括詞綴與組合規(guī)則;構(gòu)詞規(guī)則能夠辨認(rèn)出詞的句法、語(yǔ)義、形態(tài)以及語(yǔ)音的各種屬性,但從不訴諸句法、語(yǔ)義和語(yǔ)音規(guī)則。詞匯部門(mén)的運(yùn)作無(wú)需其它部門(mén)介入。詞和詞綴分開(kāi)儲(chǔ)存意味著兩者具有本質(zhì)的差別:現(xiàn)詞攜帶了類(lèi)別信息,詞綴只攜帶“關(guān)系”信息,例如boy:名詞;-able:詞綴,只能黏附在動(dòng)詞右邊使之變成形容詞(可表示為V→A)。由于詞典里只有詞,構(gòu)詞規(guī)則只在詞的層面上運(yùn)行,即選擇符合條件的詞充當(dāng)新詞的成分。

不少學(xué)者對(duì)Aronoff的觀點(diǎn)提出異議(如Booij 1977、Botha 1980、Lieber 1980、Williams 1981、Selkirk 1982、Scalise 1986)。他們指出Aronoff的模型僅適合英語(yǔ)這類(lèi)語(yǔ)言,不具普遍性。如果詞典里的詞必須是自由語(yǔ)素,那么瑞典語(yǔ)中的單數(shù)名詞ros(玫瑰花)可以進(jìn)入詞典,而flik-(女孩)則不能進(jìn)入詞典,因?yàn)槠鋸?fù)數(shù)形式是flikor,單數(shù)形式是flika,詞干flik-不是一個(gè)自由語(yǔ)素。這類(lèi)非自由詞干在其他語(yǔ)言中亦不少見(jiàn),如德語(yǔ):pater-(父親);拉丁語(yǔ)lup-(狼);羅馬尼亞語(yǔ):munt-(山);意大利語(yǔ):can-(狗)??上攵?,如果詞典中沒(méi)有這些詞干,又如何生成相應(yīng)的單數(shù)名詞和復(fù)數(shù)名詞呢?可見(jiàn)詞典中只有詞的思路過(guò)于狹窄。根據(jù)批評(píng)者的設(shè)想,詞典中應(yīng)既有詞也有詞干,詞綴也應(yīng)放入詞典。這樣一來(lái),詞典的內(nèi)容變得豐富起來(lái),有自由形式(詞),有黏著形式:詞干、派生詞綴、屈折詞綴。也就是說(shuō),構(gòu)詞規(guī)則同時(shí)在兩個(gè)層面上運(yùn)行:一個(gè)是詞,一個(gè)是不能獨(dú)立成詞的語(yǔ)素。

圖4 :Scalise(1986)的詞庫(kù)模型

五、評(píng) 論

生成語(yǔ)法理論關(guān)注詞庫(kù)應(yīng)該為詞項(xiàng)標(biāo)注哪些句法信息,以便插入句子。對(duì)于這一理論來(lái)說(shuō),詞庫(kù)是否有序排列絲毫不影響短語(yǔ)或合成詞的生成,至少目前還沒(méi)有足夠的理由非得為詞庫(kù)中的詞項(xiàng)設(shè)計(jì)出一種次序。然而無(wú)序清單的設(shè)想并不符合詞匯聯(lián)想測(cè)驗(yàn)的結(jié)果,也不能解釋某些口誤現(xiàn)象。筆者贊同詞庫(kù)中的詞匯是依照語(yǔ)義原則組織起來(lái)的一個(gè)系統(tǒng)。WordNet可以看作有序排列的詞庫(kù)。它以語(yǔ)義關(guān)系為線索將詞匯組織起來(lái),形成一個(gè)縱向關(guān)系網(wǎng)。不過(guò)要建立一個(gè)完善的詞匯網(wǎng)絡(luò),需要考慮的事情相當(dāng)多,例如聯(lián)想義或比喻義等。WordNet中這類(lèi)信息時(shí)有時(shí)無(wú)。若把世界知識(shí)也納入進(jìn)來(lái),勢(shì)必要解決度的問(wèn)題:多少才合適?除此之外,和其它有序排列的詞庫(kù)模型一樣,WordNet沒(méi)有把詞義網(wǎng)絡(luò)與語(yǔ)義復(fù)合聯(lián)系起來(lái)。當(dāng)然,它的目的不在于此,其出發(fā)點(diǎn)也不是語(yǔ)義復(fù)合。但反過(guò)來(lái)看,如果語(yǔ)義復(fù)合的理論看不到詞匯網(wǎng)絡(luò)對(duì)語(yǔ)義復(fù)合的作用,那肯定是一個(gè)非常嚴(yán)重的、需要糾正的錯(cuò)誤。

句子的特點(diǎn)是即生即滅,而字詞需要預(yù)制并長(zhǎng)期保存。一個(gè)人可以不相信世界上有神仙鬼怪,但無(wú)法阻止大腦中的詞庫(kù)儲(chǔ)存“神”、“仙”、“鬼”、“怪”這些詞,也無(wú)法將這些詞從詞庫(kù)中隨意刪除。正常情況下,詞一旦被詞庫(kù)收錄便不能刪除。句子的儲(chǔ)存不具備類(lèi)似的強(qiáng)制性。盡管句子由詞組成,但常見(jiàn)的情形是:李四對(duì)張三說(shuō)了一段話,張三記住了這段話的意思,忘了這段話的形式(即李四的原話)。可謂得其意,忘其形。原因并不在于張三的記性如何差,而在于“得意忘形”是語(yǔ)言交流中的普遍規(guī)律。除非有特殊的目的,人們不會(huì)刻意記住他人的原話。因此,句庫(kù)不具有普遍性,頭腦中能夠儲(chǔ)存或儲(chǔ)存了許多現(xiàn)成句子(如經(jīng)典名句)的人畢竟是少數(shù)。詞庫(kù)具有普遍性。它涉及每一個(gè)人的字詞儲(chǔ)存能力以及字詞判斷能力。

Bloomfield的說(shuō)法顯得過(guò)于籠統(tǒng)。當(dāng)后來(lái)的學(xué)者真想給所有的語(yǔ)素標(biāo)注詞類(lèi)的時(shí)候,問(wèn)題便接踵而至。正如Aronoff所說(shuō)的那樣,不是每一個(gè)語(yǔ)素都有明確的意義或句法特征。特別是在處理拉丁語(yǔ)源或希臘語(yǔ)源的詞干時(shí),意義不清或句法特征不明的情況更為常見(jiàn)。這對(duì)于生成詞法是致命的,因?yàn)樵~庫(kù)中必須標(biāo)注句法特征,它們是生成合成詞的必要條件。這也是Chomsky堅(jiān)持詞庫(kù)必須以現(xiàn)詞為基本儲(chǔ)存單位的一個(gè)重要原因。然而詞庫(kù)僅儲(chǔ)存現(xiàn)詞的觀點(diǎn)卻使得其它語(yǔ)言中不自由詞干(如瑞典語(yǔ)flik-)無(wú)立足之地。有趣的是,很多學(xué)者對(duì)Halle的模型進(jìn)行了一頓批評(píng)之后,卻又回到了他的思路:詞庫(kù)里有詞綴、詞干和詞。不同的是減少了冗余度。筆者贊同詞典里儲(chǔ)存著詞、詞綴和詞干的假設(shè)。尤其漢語(yǔ)中不自由詞干比比皆是:模、機(jī)、版。如果不在詞典中,又如何參與構(gòu)詞呢?我們也沒(méi)有理由否認(rèn),無(wú)論是詞、詞干或詞綴,只要有意義或功能可言,都是語(yǔ)義網(wǎng)絡(luò)中的成員,與其它結(jié)點(diǎn)有這樣或那樣的聯(lián)系。這些聯(lián)系都是語(yǔ)義復(fù)合的重要資源。

[1] Chomsky,N.1965.Aspects of the Theory of Syntax.Cambridge.MIT Press.

[2] Bloomfield,L.1955.Language.George Allen&Unwin.

[3] Halle.M.1973.Prolegomena to a theory of word formation.Linguistic Inquiry.1973(4).

[4] Scalise,S.1986.Generative Morphology.Dordrecht:Foris Publications Holland.

[5] Aronoff,M.1976.Word Formation in Generative Grammar.Cambridge;Mass:MIT Press.

[6] Booij,G.1977.Dutch Morphology:a study of word formation in generative grammar.

[7] Botha,R.1984.Morphological Mechanisms.Oxford;New York;Paris;etc.:Pergamon Press.

[8] Chomsky,N.1970.Remarks on nominalizations.Readings in English Transformational.

[9] Lieber,R.1980.On the Organization of the Lexicon,unpublished doctoral dissertation,MIT.Cambridge(Mass.).

[10] Nelson,D&Toivonen,I.2000.Counting and the grammar:case and numerals in Inari Sami.Leeds working Papers in Linguistics 2000(8):ed.,by D.Nelson&P.

[11] Postal,M.1969.Anaphoric Islands.Papers from the Fifth Regional Meeting,Chicago Linguistic Society.

[12] Radford,A.2000.Transformational Grammar:a first course.Beijing:Foreign Language Teaching and Research Press.

[13] Selkirk,E.1982.The Syntax of Words.Cambridge(MA),MIT Press.

[14] Williams,E.1981a.On the Notions‘Lexically Related’and‘Head of a Word’.Linguistic Inquiry 12.

The Hypotheses about the Lexicon and its Operational Principles

Rong Xinge
(School of Foreign Languages and Literature,Chongqing Normal University.Chongqing 400047,China)

The lexicon refers to the mental ability of word-keeping.According to the hypotheses ever made,words are kept orderly or casually in the lexicon.No matter in which state the lexicon is,the following questions need to be answered:what are the basic units stored in the lexicon?How does the lexicon work?etc.Generative grammar and computer linguistics have offered some assumptions.The author agrees with the idea that the lexicon is a semantically-organized network,which contains words,suffixes and stems as its elements.No matter whether it is a word,suffix or stem,it is a node in the semantic network,a node relating to other nodes in some way.The relations among the nodes are important resources for semantic combination.

the lexicon;the casual-list model;the well-ordered model;lexical units; the semantic network

H03

A

1673-0429(2011)02-0084-09

2011-01-20

榮鑫閣(1959—),男,重慶師范大學(xué)外國(guó)語(yǔ)學(xué)院,副教授。

猜你喜歡
詞干詞庫(kù)構(gòu)詞
從構(gòu)詞詞源看英漢時(shí)空性差異
論柯?tīng)柨俗握Z(yǔ)詞干提取方法
維吾爾語(yǔ)詞綴變體搭配規(guī)則研究及算法實(shí)現(xiàn)
認(rèn)知視野下“好”、“壞”構(gòu)詞的對(duì)稱(chēng)性研究
詞庫(kù)音系學(xué)的幾個(gè)理論問(wèn)題芻議
“分”的音變構(gòu)詞及其句法語(yǔ)義特征
融合多策略的維吾爾語(yǔ)詞干提取方法
基于維吾爾語(yǔ)詞干詞綴粒度的漢維機(jī)器翻譯
環(huán)境變了,詞庫(kù)別變
電腦迷(2014年14期)2014-04-29 00:44:03
QQ手機(jī)輸入法如何導(dǎo)入分類(lèi)詞庫(kù)
電腦迷(2012年15期)2012-04-29 17:09:47
德保县| 丰城市| 台湾省| 泗洪县| 五大连池市| 海盐县| 收藏| 汉寿县| 三都| 广饶县| 龙江县| 临武县| 四会市| 毕节市| 和静县| 新巴尔虎右旗| 增城市| 广州市| 潢川县| 红河县| 韩城市| 来宾市| 会同县| 淮北市| 桃园市| 湛江市| 喀喇沁旗| 鄂伦春自治旗| 五大连池市| 宜黄县| 轮台县| 边坝县| 大洼县| 博罗县| 威宁| 舟山市| 丁青县| 黔西县| 会泽县| 玉树县| 梁河县|