一、引言
呂西安·泰尼埃①(Lucien Tesnière)是20世紀上半期法國著名的語言學家,他于1893年5月13日出生,1954年12月6日逝世,享年61歲。
2014年12月6日是泰尼埃逝世60周年的日子,在本文中,我們回顧泰尼埃的學術(shù)生涯,重溫泰尼埃的語法理論,作為對這位著名的語言學家的紀念。
泰尼埃的主要成就是提出了“結(jié)構(gòu)句法”的一般理論。“結(jié)構(gòu)句法”后人也稱為“依存語法”或“從屬關(guān)系語法”②。為了提出一種普適的語法理論,他作了大量的語言對比研究,涉及的語言有古希臘語、古羅馬語、羅曼語、斯拉夫語、匈牙利語、土耳其語、巴斯克語等。泰尼埃曾在斯特拉斯堡大學和蒙彼利埃大學任教,研究斯拉夫語言和普通語言學。1934年,他在《斯特拉斯堡大學語文系通報》(Bulletinde la Faculté des Lettres de Strasbourg)上,發(fā)表了《怎樣建立一種句法》(Comment construire une Syntaxe),闡述了“依存語法”的基本論點。從1939年起,他開始寫依存語法的巨著《結(jié)構(gòu)句法基礎》(?lément de Syntaxe Structurale),邊寫邊改,歷時十余載,一直到1950年才完成。
1954年,泰尼埃去世之后,他的朋友們整理了他的遺稿,于1959年出了《結(jié)構(gòu)句法基礎》的初版,1965年出了第二版。
《結(jié)構(gòu)句法基礎》一書篇幅近700頁,有5000多個句子(短語)的語例,這些例子選自60余種語言,書中含有句法結(jié)構(gòu)圖式366個。一般認為,泰尼埃是現(xiàn)代“依存語法”和“配價理論”的創(chuàng)始人。
除了《結(jié)構(gòu)句法基礎》一書之外,泰尼埃還編撰過一部小型的“俄語語法”(Petite grammaire russe),其他主要論文有《斯洛文尼亞語中的雙數(shù)形式》(Les formes du duel en Slovene)、《用于研究斯洛文尼亞語雙數(shù)形式的語言地圖》(Atlas linguistique pour servir à létude du duel en slovènel)等等。
《結(jié)構(gòu)句法基礎》一書是用法語出版的,沒有英文譯本,更沒有中文譯本,由于語言的隔絕,很多讀者無法了解到此書的真實內(nèi)容。1978年到1981年,我在法國格勒諾布爾理科醫(yī)科大學留學期間,為了研制多語言機器翻譯系統(tǒng),我曾經(jīng)熟讀過此書的法文原文。在泰尼埃逝世60周年的日子,我愿意根據(jù)自己所熟悉的法文原版來介紹此書,以饗讀者。
二、《結(jié)構(gòu)句法基礎》中的基本概念
《結(jié)構(gòu)句法基礎》一書中最基本的概念是“關(guān)聯(lián)”(connexion)和“轉(zhuǎn)位”(translation)。下面我們介紹這兩個基本概念。
(一)關(guān)聯(lián)
法語句子“Alfred parle”(阿爾弗列德講話)是由“Alfred”和“parle”兩個形式構(gòu)成的。但操法語的人在說這句話時,其意思并不是指一方面有一個人叫阿爾弗列德,另一方面有一個人在講話;而是指阿爾弗列德做了講話這個動作,而講話人是阿爾弗列德,“Alfred”和“parle”之間的這種關(guān)系,不是通過“Alfred”和“parle”這兩個單獨的形式來表達的,而是通過句法聯(lián)系來表達的,這種句法聯(lián)系就是“關(guān)聯(lián)”。是“關(guān)聯(lián)”把“Alfred”和“parle”聯(lián)在一起,使它們成為一個整體。泰尼埃說:“這種情況與在化學中的情況是一樣的,氯和鈉化合形成一種化合物氯化鈉(食鹽),這完全是另外一種東西,它的性質(zhì)不論與氯的性質(zhì)或是與鈉的性質(zhì)都是迥然不同的”。“關(guān)聯(lián)”賦予句子以“嚴謹?shù)慕M織和生命的氣息”,它是句子的“生命線”?!八^造句,就是建立一堆詞之間的各種關(guān)聯(lián),給這一堆詞賦予生命;反之,所謂理解句子,就意味著要抓住把不同的詞聯(lián)系起來的各種關(guān)聯(lián)。”
“關(guān)聯(lián)”要服從于“層次”(hiérarchie)原則,也就是說,關(guān)聯(lián)要建立起句子中詞與詞之間的從屬關(guān)系。這種從屬關(guān)系可用“圖式”(Stemma)來表示。例如,“Alfred mange une pomme”(阿爾弗列德吃蘋果)可用下面的圖式來表示:
圖1:圖式
這里,動詞“mange”(吃)是句子的“結(jié)”(noeud),“Alfred”和“pomme”從屬于動詞“mange”,它們被置于“mange”的下方;“une”從屬于“pomme”,它被置于“pomme”的下方。
泰尼埃認為,動詞是句子的中心,它支配著別的成分, 而它本身卻不受其他任何成分的支配。因此,他把主語和賓語同等看待,把它們都置于動詞的支配之下。
泰尼埃認為,應該把“結(jié)構(gòu)順序”(ordre structurale)和“線性順序”(ordre linaire)區(qū)別開來。例如,詞組“un petit gar?on poli”(一個有禮貌的男孩)有關(guān)相同的結(jié)構(gòu)順序:
圖2:結(jié)構(gòu)順序
名詞“gar?on”在圖中是支配者,形容詞“petit”和“poli”都從屬于這個名詞。但是,這兩個詞組的線性順序卻不同:在“un petit gar?on”中,形容詞在名詞“gar?on”的左側(cè);在“un gar?on poli”中,形容詞在名詞“gar?on”的右側(cè)。顯而易見,結(jié)構(gòu)順序是二維的,而線性順序則是一維的。
句法理論中的一個重要問題,就是確定那些把二維的結(jié)構(gòu)順序改變?yōu)橐痪S的線性順序的規(guī)則,以及那些把一維的線性順序轉(zhuǎn)換為二維的結(jié)構(gòu)順序的規(guī)則?!癵ar?on poli”的順序是離心的或下降的,形容詞“poli”離開中心名詞“gar?on”而下降;而“petit gar?on”的順序是向心的或上升的,形容詞“petit”向著中心名詞“gar?on”而上升。有的語言有向心傾向,有的語言有離心傾向。例如在英語中,名詞的修飾語一般是向著被修飾的中心名詞而上升的,有向心傾向;在法語中,名詞的修飾語有許多是離開被修飾的中心名詞而下降的,有離心傾向。
在表示句子結(jié)構(gòu)順序的圖式中,直接處于動詞結(jié)點之下的,是名詞詞組和副詞詞組。名詞詞組形成“行動元”(actant),副詞詞組形成“狀態(tài)元”(circonstants)。
“狀態(tài)元”的含義是不言自明的,而“行動元”的含義則必須加以界說。
泰尼埃是這樣來定義“行動元”的:
“行動元是某種名稱或某種方式的事或物,它可以通過極簡單的名稱或消極的方式來參與過程”。
行動元的數(shù)目不得超過三個:主語、賓語1、賓語2。例如:
(1)Alfred donne le livre à Charles.
(阿爾弗列德給查理一本書)
在例(1)中,從屬于動詞“donne”的行動元有三個:第一個行動元是“Alfred”,作主語;二個行動元是“l(fā)ivre”,作賓語1;第三個行動元是“Charles”, 作賓語2。其圖式如下:
圖3:行動元
從理論上說,狀態(tài)元的數(shù)目可以是無限的。例如:
(2)Ce soir,je passerai vite,chez lui,en sortant du bureau,pour….
(今晚,我從辦公室出來,將很快地到他家去,為了……)
其中,“Ce soir”“vite”“chez lui”“en sortant du bureau”“pour”等,都是狀態(tài)元。
行動元的數(shù)目決定了動詞的“價”(Valence)的數(shù)目。如沒有行動元,則為零價動詞;如有一個行動元,則為一價動詞;如有兩個行動元,則為二價動詞;如有三個行動元,則為三價動詞。例如:
“零價動詞”(Verbes avalents):
Il pleut 0個行動元
(下雨)
“一價動詞”(Verbes monovalents):
Il dort 1個行動元
(他睡覺)
“二價動詞”(Verbes bivalents):
I1 mange une pomme 2個行動元
(他吃蘋果)
“三價動詞”(Verbes trivalents):
Il donne son livre à Charles 3個行動元
(他把他的書給查理)
(二)轉(zhuǎn)位
泰尼埃提出了四個基本詞類:動詞、名詞、形容詞、副詞。動詞用“I”表示,名詞用“O”表示,形容詞用“A”表示,副詞用“E”表示。它們之間的從屬關(guān)系如下圖所示:
圖4:詞類的從屬關(guān)系
按照圖式的結(jié)構(gòu)層級看,第一級是動詞,第二級是名詞和副詞,第三級是形容詞和副詞。第四級只能是副詞。泰尼埃把這種含有符號的圖式叫作“虛圖式”(stemma virtuel)。泰尼埃認為,這些符號的使用,提供了用代數(shù)方法來計算語法的手段,只不過在這種操作中,是用字母代替了數(shù)字而已。這種類似于代數(shù)操作的方法,為我們提供了一種從無限的、個體的語言材料中抽取有限的、一般的句子結(jié)構(gòu)的手段,即:用一般的公式來代替眾多具體句子的分析。
虛圖式作為一種句子結(jié)構(gòu)的一般模式在泰尼埃的結(jié)構(gòu)句法理論中占有非常重要的地位。從某種意義上說,泰尼埃的結(jié)構(gòu)句法是一種基于虛圖句式的、面向句子分析的理論。泰尼埃理論指導下的句法分析和研究,就是想辦法將所有的句子納入到上面這個圖里。這個圖不但給出了一個句子的合格性條件,也指明了理解句子的目標。
為了能把分析的句子(詞組)納入這種虛圖式,泰尼埃在其理論中引入了“轉(zhuǎn)位”(translation)概念。在詞組“l(fā)e livre de Pierre”(皮埃爾的書)中,“de Pierre”在結(jié)構(gòu)上與“l(fā)ivre”發(fā)生關(guān)系,它起著類似于形容詞的作用。這樣,我們就可以認為,介詞“de”把名詞“pierre”轉(zhuǎn)位為話語中的形容詞。
這種情況如下圖所示:
圖5:介詞把名詞轉(zhuǎn)位為形容詞
這時,“de”是轉(zhuǎn)位者(translateur),“Pierre”是被轉(zhuǎn)位者(translate),它們合起來構(gòu)成一個轉(zhuǎn)位。根據(jù)轉(zhuǎn)位所涉及的詞類,泰尼埃把轉(zhuǎn)位區(qū)分為“一度轉(zhuǎn)位”和“二度轉(zhuǎn)位”。如果轉(zhuǎn)位的被轉(zhuǎn)位者是名詞(O)、形容詞(A)和副詞(E),那么,這種轉(zhuǎn)位就是一度轉(zhuǎn)位。如上例就是一度轉(zhuǎn)位。如果轉(zhuǎn)位的被轉(zhuǎn)位者是動詞(1),動詞本身是支配者而不是被支配者,那么,這種轉(zhuǎn)位就是二度轉(zhuǎn)位。例如:
(3)Je crois que Alfred reviendra
(我相信阿爾弗列德會回來的。)
例(3)中,“Alfred reviendra”代替了名詞的位置,動詞“reviendra”被“que”轉(zhuǎn)位為名詞。所以,這種轉(zhuǎn)位是二度轉(zhuǎn)位。
圖6:動詞被“que”轉(zhuǎn)位為名詞
在一度轉(zhuǎn)位和二度轉(zhuǎn)位的內(nèi)部,泰尼埃還區(qū)分了“簡單轉(zhuǎn)位”和“復雜轉(zhuǎn)位”。如果轉(zhuǎn)位只是把一個成分轉(zhuǎn)位到另一個成分,就是簡單轉(zhuǎn)位,如上述各例都是簡單轉(zhuǎn)位。如果轉(zhuǎn)位可連續(xù)地從一個成分轉(zhuǎn)位到另一個成分,又由這個成分轉(zhuǎn)位到其他成分,也就是先轉(zhuǎn)位為成分C1,再由成分C1轉(zhuǎn)位為成分C2,再由成分C2轉(zhuǎn)位為成分C3……一直轉(zhuǎn)位到成分Cn,那么,這種轉(zhuǎn)位就是復雜轉(zhuǎn)位。例如,在“trancher dans le vif”(割到肉里)中,“vif”一詞的轉(zhuǎn)位就是復雜轉(zhuǎn)位:形容詞“vif”由轉(zhuǎn)位者“l(fā)e”轉(zhuǎn)位為名詞,而“l(fā)e vif”的功能就其對動詞“trancher”的關(guān)系來說相當于副詞,其轉(zhuǎn)位者是“dans”。圖示如下:
圖7:復雜轉(zhuǎn)位
從理論上說,轉(zhuǎn)位有6種類型:
O>A O>E A>O
A>E E>O E>A
泰尼埃在《結(jié)構(gòu)句法基礎》一書中,用了300頁的篇幅來論述“轉(zhuǎn)位”的概念及其應用,這幾乎占了他的著作一半的篇幅。盡管在大多數(shù)語言學家眼里,“轉(zhuǎn)位”的意義和價值遠不如“配價”和“依存”等概念,但我們認為“轉(zhuǎn)位”是基于虛圖式句法分析理論的必要成分:沒有“轉(zhuǎn)位”,基于虛圖的句法結(jié)構(gòu)體系就無法運作,就無法將無限的語句納入有限的句式中,就難以在整個句法體系中實現(xiàn)遞歸操作,就很難將依存規(guī)則限制在一個可控的范圍之內(nèi),就無法將簡單句的規(guī)則推廣到復雜句的分析領域。
因此,“轉(zhuǎn)位”是泰尼埃結(jié)構(gòu)句法的重要組成部分,它對于完整地理解泰尼埃的理論是不可缺少的。
三、《結(jié)構(gòu)句法基礎》對語言學界的影響
《結(jié)構(gòu)句法基礎》在1959年出版之后,泰尼埃的語言學思想逐漸地引起了語言學家的重視,從事語言信息自動處理的語言學家們特別推崇這一理論。這一理論在自動翻譯、人機對話的研究中,顯示出越來越大的作用。
在法國格勒諾布爾理科醫(yī)科大學教授沃古瓦(B.Vauquois,1929~1985)所領導的GETA(Groupe dEtude pour la Trandiction Automatique)自動翻譯實驗室中,采用這一理論來設計多語言自動翻譯系統(tǒng),成果累累。1980年,馮志偉把泰尼埃的依存語法與喬姆斯基的短語結(jié)構(gòu)語法巧妙地結(jié)合起來,在GETA研制了世界上第一個把漢語自動地翻譯成多種外國語的漢-法/英/日/俄/德多語言機器翻譯系統(tǒng),展現(xiàn)了依存語法在自然語言信息處理中強大的生命力。
《結(jié)構(gòu)句法基礎》是在泰尼埃去世5年之后才出版的,他的這部著作被眾多的法國語言學家引用,但遺憾的是一般只是作為一本語言學的經(jīng)典引用一下而已,在法國語言學界并沒有人深入挖掘這本巨著的內(nèi)涵,更談不上進一步的發(fā)展了。
20世紀90年代以來,這種狀況有了一些改善。例如,在瑪?shù)氯R-磊鑫(Madray-Lesihne)和理查-扎佩拉(Richard-Zappella)編輯的《泰尼埃誕生百年學術(shù)紀念文集》中③,大多數(shù)文章就是法國學者用法語寫的。計算語言學界在巴黎第七大學西爾萬·卡恩(Sylvain Kahane) 的努力下,出版了有關(guān)依存語法研究的文集并在巴黎召開了首屆“意義?文本理論”(Meaning ?Text Theory,簡稱MTT)國際會議④。在法國還成立了泰尼埃研究中心(Centre de Recherche, Lucien Tesnière)。這些都有助于泰尼埃的思想在法國的進一步發(fā)展。
除了在法國本土之外,依存語法在德國、北歐、英國、俄羅斯也得到了很大的發(fā)展。
德國語言學家采用短語結(jié)構(gòu)語法來處理德語時遇到了重重困難,因此,他們采用了泰尼埃的依存語法理論來研究德語,特別是接受了“配價”的概念。
第一部采用依存語法的原則來描述德語語法的,是赫林格(Heringer)在1970年發(fā)表的《德語句法理論》(Theorie der Deutschen Syntax)。這部語法著作采用的是一種將短語結(jié)構(gòu)語法和依存語法兩者結(jié)合起來的形式化模型,但一般認為他的這部語法著作可以歸為依存語法。經(jīng)過20多年的努力,赫林格的依存語法已經(jīng)發(fā)展成為一種純粹的依存語法,可讀性也大有改善,在他1996年的語法書《德語依存句法》(Deutsche Syntax Dependentiell)里,再也看不到短語結(jié)構(gòu)語法的影子了。此外,在赫林格等人于1980年編寫的句法教科書中,首次對依存語法進行了較完整的形式化處理,建立了一種依存語法的形式化模型。
20世紀60年代后期,在東德的萊比錫和西德的曼海姆產(chǎn)生了兩個研究配價理論和依存語法的團體,分別形成了萊比錫學派和曼海姆學派。
萊比錫學派的領軍人物是赫爾比希(Gerhard Helbig),他和申克(Schenkel)于1969年編輯出版了第一部德語動詞配價詞典。此后,他們又編輯出版了德語形容詞配價詞典(1974年)和德語名詞配價詞典(1977年)。除發(fā)表了大量的文章之外,萊比錫學派還出版了一些有關(guān)“配價”的論文集,其中赫爾比希在1992年出版的《配價和格理論問題》(Probleme der Valenz-und Kasustheorie)和維爾科(Welke)在1988年出版的《配價和格理論導論》(Einführung in die Valenz-und Kasustheorie)被認為是研究配價理論的入門必讀書。赫爾比希還寫了幾本語言學方面的教科書。這些被廣為使用的教科書對配價理論的普及起到了積極的作用。
萊比錫學派的貢獻主要在配價理論和配價詞典的編撰方面。在他們的影響下,很多德國學者干脆把“依存語法”直接叫作“配價語法”(Valenz Grammatik)。
曼海姆學派的核心人物是恩格爾(Ulrich Engel)。雖然曼海姆的學者們也編輯出版了德語動詞的配價詞典,但是這一學派的主要貢獻在于研究并實現(xiàn)了用依存語法的原則來全面描述德語中主要的語言結(jié)構(gòu)的思想。
恩格爾編寫了兩部德語語法著作分別在1982年和1992年出版,他的這兩部著作可能是語言學歷史上第一次只用依存語法的原則來完整地描述一種語言的語法書籍。
1980年,恩格爾把泰尼埃的依存語法經(jīng)典著作《結(jié)構(gòu)句法基礎》翻譯成了德語,雖然不是全譯,但仍有助于德國學者對泰尼埃經(jīng)典著作的學習和研究,并進一步推動了依存理論在德國的發(fā)展。
萊比錫學派和曼海姆學派的一個共同之處是把配價語法作為“對外德語教學”(Deutsch als Fremdsprache,簡稱DaF)的理論基礎。無論是1969年最早出版的萊比錫德語配價詞典,還是2004年最新出版的曼海姆的德語配價詞典,以及近年來在德國出版的各種配價詞典,都強調(diào)了配價詞典在對外德語教學領域的作用。
德國研究配價語法的學者,并不是全都集中在萊比錫和曼海姆這兩個地方。配價語法研究在德國算得上是遍地開花。
鮑姆(Baum)1976年出版的《依存語法》是目前研究泰尼埃理論起源最好的德文本著作。埃蒙斯(H.W.Eroms)于1981年發(fā)表過大量有關(guān)配價的文章和著作,他在2000年編著的《德語句法》完全建立在依存語法的原則之上,反映了德國學者在這一方面研究的新成果。
在埃蒙斯和其同事們的努力下,世界最著名的語言學出版社之一Walter de Gruyter出版了當今內(nèi)容最全面的配價和依存研究參考書《依存和配價研究手冊》⑤。
1978年,赫爾維希(Peter Hellwig) 在自己的博士論文里,創(chuàng)立了一種基于配價概念的自動語義分析方法,今天這種思想已經(jīng)發(fā)展成了依存語法的代表理論之一:“依存合一語法”。
1975年,昆澤(Kunze)等人從自然語言處理的需要出發(fā),研制了一種面向語言信息處理的依存語法。
1993年,羅賓(Lobin)出版了一本專門研究如何在依存語法的框架下處理語言中的并列結(jié)構(gòu)的專著。
科赫(P.Koch) 是德國的羅曼語學者,他用依存和配價原理來研究羅曼語族語言,1991年編輯了《羅曼語依存和配價研究》。
托依拜特(W.Teubert)于1979年出版了研究名詞配價的專著,首次提出名詞也有“配價”,并且系統(tǒng)地研究了名詞的配價問題。
維爾奈爾(E.Werner)于1993年出版了一本研究泰尼埃的“轉(zhuǎn)位”理論的最全面的著作。
除了按照依存語法原則編寫的德語句法書之外,也有一些用德語寫成的有關(guān)依存語法理論的一般性(導論性)著作。其中最有名的要數(shù)德國計算語言學家韋伯(Weber)發(fā)表于1997年的著作《依存語法》,此書可視為泰尼?!督Y(jié)構(gòu)句法基礎》的濃縮精華本。
依存語法研究的另外一支力量,是歐洲特別是北歐的日爾曼語言學者。
很多北歐學者也像德國學者那樣,把依存語法稱為配價語法。
挪威的阿斯科達爾(J.O. Askedal)從多種角度探討了配價問題,他在2003年發(fā)表的研究泰尼埃“配價和依存”的文章值得每一位研究“依存”和“配價”的學者閱讀;他1996年發(fā)表的關(guān)于美國符號學家皮爾斯(Pierce)和泰尼埃的比較研究的文章,對更深入地認識“依存”和“配價”的普遍性具有十分重要的意義。1979年,他還用挪威語出版過一本《配價語法》,介紹了現(xiàn)有各家的配價思想,其中有兩章是研究句模和助動詞配價的。
芬蘭學者科羅納(J.Korhonen)研究配價的歷時演變,他于1977年和1978年出版了兩本有關(guān)配價和依存的著作,覆蓋面廣,內(nèi)容豐富,資料翔實,直到今天仍是許多研究者的案頭必備書籍。
芬蘭的另外一位學者塔爾萬尼(K. Tarvainen)在1981年出版了一本關(guān)于配價和依存語法理論的教科書,此書也有芬蘭語的版本。
瑞典的尼庫拉(H.Nikula)對配價與語義、語用的關(guān)系進行過深入的研究,他在1986年用瑞典語出版了一本《依存語法》的教科書。
匈牙利學者艾格爾(?gel)不但參與主編了《依存和配價研究手冊》等重要著作,而且在2000年還出版了一本名為《配價理論》的教科書。
日本的自然語言處理研究者在許多系統(tǒng)中采用了依存語法作為句法模型,但在語言學界有關(guān)依存語法的專論卻不多見。
児玉徳美1987年出版的《依存語法研究》⑥是我們所知道的唯一的一本這方面的專著。児玉徳美的著作嚴格說來是一本論文集,全書共九章,其中的四章主要介紹英國語言學家哈德森(Richard Hudson)的“子依存語法”(Daughter dependency grammar)和“詞語法”(Word Grammar);其中兩章介紹依存語法的一般原則和方法;還有一章簡單分析了用依存語法來處理漢語的可能性;其余兩章與依存語法的關(guān)系不大。這本書的貢獻不在于為日本讀者提供了一本含有“依存”字樣的專著,而在于它討論了依存關(guān)系和語言詞序類型的問題,并用日語和漢語的例子進行了說明。
管山謙正在2002年編輯了一本有關(guān)“詞語法”的論文集,所收錄的文章均為英文,七篇文章中有三篇的作者是日本學者。
用英語出版的有關(guān)配價理論的著作不多,最有名的是愛樂彤(Allerton)在1982年出版的《配價和英語動詞》。
安德森(Anderson)在1971年出版的《格語法》(The Grammar of Case:Towards a Localistic Theory)和在1977年出版的《論格語法》(On Case Grammar:Prolegomena to a Theory of Grammatical Relations),雖然從書名看都有“格語法”的字樣,但和我們大家熟知的菲爾摩(Fillmore)的“格語法”不是一回事。安德森的“格語法”是一種結(jié)合了“依存”和“格”的理論,這一理論對斯塔羅斯塔(Stan Starosta)的“詞格理論”(Lexicase)和哈德森(Hudson)的“詞語法”(Word Grammar)都產(chǎn)生過不小的影響。
費舍爾(Fischer)在1997年出版的《德英動詞配價對比研究》雖然是一本用英語寫的著作,但采用了恩格爾(Engel)的框架來進行德-英動詞的比較,對于不懂德語的人來說,這是不錯的參考資料。
索牟斯(Somers)在1987年出版了《計算語言學中的價和格》一書,他認為“價”和“格”是兩個緊密相連的概念。索牟斯在書里介紹了有關(guān)“價”和“格”的主要流派和方法,以及它們在計算語言學中的一些應用,但是還沒有形成一套完整的理論和方法。
2004年赫爾布斯特(Herbst)等主編的《英語配價詞典》是第一部關(guān)于英語的真正意義上的配價詞典。這本詞典所收詞類不但有動詞,還有名詞和形容詞。
四、基于依存關(guān)系的語言學理論
基于依存關(guān)系的語言學理論,目前主要有“詞語法”(Word Grammar,簡稱WG),“意義?文本理論”( Meaning?Text Theory,簡稱MTT),“功能生成描述理論”(Functional Generative Description,簡稱FGD)和“詞格理論”(Lexicase)。
“詞語法”是英國語言學家哈德森(Richard Hudson)在1984年提出的一種語言理論。哈德森認為,語法是由一種語言中所有的詞構(gòu)成的網(wǎng)絡,語法沒有天然的邊界,因此,不存在語法甚至語言模塊;語法網(wǎng)絡只是有關(guān)詞匯知識的整個網(wǎng)絡的一部分,它和這個網(wǎng)絡中有關(guān)百科知識、社會結(jié)構(gòu)、語音等子網(wǎng)絡密切相關(guān)。在“詞語法”中,“語法”和“詞匯”在描寫上沒有什么本質(zhì)的區(qū)別,只不過語法處理的是一般性的模式,詞匯描述的是有關(guān)單詞的事實。從形式上看,一般模式雖然涉及的是有關(guān)詞類方面的事情,但表現(xiàn)方式與描寫具體單詞的方法沒有什么不同。雖然詞間依存是構(gòu)成“詞語法”的基礎,但不能把“詞語法”理論簡單地看成是一種句法理論,而應當看成是一種幾乎涵蓋了共時語言學各個分支的語言學理論,“詞語法”把各個分支的研究領域統(tǒng)一在一面旗幟之下:“語言是一個概念網(wǎng)絡”。
“意義?文本理論”是從蘇聯(lián)早期機器翻譯研究發(fā)展起來的一種形式化程度很高的語言學理論。這是一種分層次的、基于依存關(guān)系的語言理論,多年來,“意義?文本理論”已經(jīng)被用在了眾多的自然語言處理應用上。但總的說來,在生成方面的研究和應用要遠遠多于剖析方面,這可能與“意義?文本理論”創(chuàng)始人之一的梅里楚克(Mel?uk)對于語言的根本看法有關(guān)。梅里楚克認為對語言學家而言,生成過程是可研究的,而理解過程卻因為牽涉到不少非語言的東西,難以做完全徹底的研究。這一點,也可從理論的名字“意義?文本”的先后順序看出。研究“意義?文本理論”的學者主要分布在加拿大、俄羅斯、德國和法國。2003年在巴黎,2005年在莫斯科,2007年在奧地利的克拉根福,召開過“意義?文本理論”的國際會議。
“功能生成描述理論”是以斯加爾(Petr Sgall)為首的一些布拉格數(shù)理語言學家創(chuàng)立的一種分層次、基于依存原則的語言描寫和形式化理論。布拉格的學者在像捷克語這樣的自由詞序的語言的依存語法的形式化理論和計算機實現(xiàn)方面做了許多開拓性的工作。
“詞格理論”是美國夏威夷大學的斯塔羅斯塔(Stan Starosta)于20世紀70年代初創(chuàng)立的一種句法理論,它不但是一種泛詞匯主義的理論,也是一種依存理論。斯塔羅斯塔本人和他的學生已經(jīng)用這種理論分析了大約50種語言的各類問題。遺憾的是在斯塔羅斯塔去世后,這種理論基本處于停滯狀態(tài)。
20世紀80年代初期,我國學者馮志偉以開發(fā)機器翻譯系統(tǒng)的實踐為基礎,研究了“依存樹”(dependency tree)中結(jié)點之間的關(guān)系。他認為,這樣的關(guān)系主要有“支配關(guān)系”(dominance)和“前于關(guān)系”(precedence)兩種。
如果從“結(jié)點x”到“結(jié)點y”有一系列的樹枝把它們連接起來,系列中所有的樹枝從“x”到“y”自上而下都有同一個方向,那么,就說“結(jié)點x”支配“結(jié)點y”,它們之間存在著支配關(guān)系。
依存樹中的兩個結(jié)點,只有當它們之間沒有支配關(guān)系的時候,才能夠在從左到右的方向上排序,這時,這兩個結(jié)點之間就存在著前于關(guān)系。
根據(jù)自然語言處理的要求,特別是根據(jù)機器翻譯研究的實踐,馮志偉提出,依存關(guān)系是兩個詞之間一種有向的、非對稱的關(guān)系;依存關(guān)系具有三個組成部分:支配詞、從屬詞、依存關(guān)系標記;依存樹應該滿足如下五個條件:
1.單純結(jié)點條件:在依存樹中,只有終極結(jié)點,沒有非終極結(jié)點,也就是說,依存樹中的所有結(jié)點所代表的都是句子中實際出現(xiàn)的具體的單詞⑦。
2.單一父結(jié)點條件:在依存樹中,除了根結(jié)點沒有父結(jié)點之外,所有的結(jié)點都只有一個父結(jié)點。
3.獨根結(jié)點條件:一個依存樹只能有一個根結(jié)點,這個根結(jié)點,也就是依存樹中惟一沒有父結(jié)點的結(jié)點,這個根結(jié)點支配著其他的所有的結(jié)點。
4.非交條件:依存樹中的樹枝不能彼此相交,在大多數(shù)語言中,應當滿足映射依存關(guān)系的要求,不容許存在相互交叉的樹枝。
5.互斥條件:依存樹中的結(jié)點之間,從上到下的支配關(guān)系和從左到右的前于關(guān)系是互相排斥的,也就是說,如果兩個結(jié)點之間存在著支配關(guān)系,那么,它們之間就不能存在前于關(guān)系。
馮志偉提出的依存樹的這五個條件,形象地描述了依存樹中各個結(jié)點之間的聯(lián)系,便于在自然語言的計算機處理中運用。
馮志偉提出的第四個條件“非交條件”,要求大多數(shù)語言應當滿足映射依存關(guān)系的要求。這意味著,在少數(shù)自然語言中還存在“非映射依存關(guān)系”(non-projective dependency relation)。對于存在這種非映射依存關(guān)系的語言,句子的依存結(jié)構(gòu)圖中會出現(xiàn)交叉的樹枝。如圖所示:
圖8:出現(xiàn)非映射依存關(guān)系的交叉樹枝
例如,英語句子“I saw a dog yesterday which was a terrier”(昨天我看到一個獵狐狗)中,“yesterday”處于“a dog —— which was a terrier”這個短語之中,而“yesterday”是從屬于動詞“saw”的,這樣會在依存樹中造成交叉的樹枝,出現(xiàn)“非映射依存關(guān)系”。
這種非映射依存關(guān)系在20種語言中的分布情況如下:
圖9:20種語言中非映射依存關(guān)系的百分比⑧
可以看出,在20種語言中,存在這種非映射依存關(guān)系最多的語言是荷蘭語,占6%;存在這種非映射依存關(guān)系最少的語言是漢語,占0%。因此,在馮志偉提出的依存樹的這五個條件中,對于“非交條件”的要求可以適當放寬一些。
用依存語法來進行自動分析是很好的,因為分析得到的依存樹層次不多,結(jié)點數(shù)目少,清晰地表示了句子中各個單詞之間的依存關(guān)系。但是,用依存樹來進行自動生成時,必須把表示句子層次結(jié)構(gòu)的依存樹轉(zhuǎn)變成線性的自然語言的句子,根據(jù)依存樹的第5個條件(互斥條件),依存樹中結(jié)點之間的支配關(guān)系和前于關(guān)系是互相排斥的,從結(jié)點之間的支配關(guān)系不能直接推導出它們之間的前于關(guān)系,所以,還應該按照具體自然語言中詞序的特點,提出適當?shù)纳梢?guī)則,把表示結(jié)構(gòu)關(guān)系的依存樹,轉(zhuǎn)變成表示線性關(guān)系的句子。在這方面,各種自然語言的生成規(guī)則是不盡相同的。例如,漢語的修飾成分一般應置于中心成分之前,而法語的某些修飾成分則置于中心成分之后;漢語主動句的賓語一般應置于謂語之后,而日語的賓語則置于謂語之前。
與短語結(jié)構(gòu)語法相比,依存語法也有它的不足之處,在短語結(jié)構(gòu)語法的成分結(jié)構(gòu)樹中,由于終極結(jié)點之間的前于關(guān)系直接地反映了單詞順序,只要順次取終極結(jié)點上的單詞,就能夠直接生成句子。所以,在自動生成方面,依存樹不如短語結(jié)構(gòu)語法的成分結(jié)構(gòu)樹方便。為了彌補依存樹的這種不足,許多學者在自然語言處理的研究中,把短語結(jié)構(gòu)語法和依存語法結(jié)合起來,較好地解決了句子的自動生成問題。
五、結(jié)語
2011年8月11日至2011年10月12日,我曾在《新浪博客:馮志偉文化博客》(http://blog.sina.com.cn/u/1926267847)上寫過《語言學早期關(guān)于“依存”和“配價”的觀念》《配價理論之父——泰尼?!?,……《配價語法:概率配價模型的可行性》等31篇博文,系統(tǒng)地介紹了依存語法的來龍去脈,有興趣的讀者可以參閱。
泰尼埃的《結(jié)構(gòu)句法基礎》一書奠定了依存語法的理論基礎,泰尼埃是當之無愧的“依存語法之父”。
注釋:
①Tesnière的漢譯目前見到的有特斯尼耶爾、泰尼埃爾、泰尼耶
爾、特尼耶爾、特斯尼埃等,本文依新華社譯名室編的《法語姓名譯名手冊》(商務印書館,2000)譯為泰尼埃。
②在20世紀80年代初期我在《國外語言學》上寫文章介紹
“dependency grammar”的時候,曾經(jīng)把這種語法翻譯為“從屬關(guān)系語法”,其實,“dependency grammar”也可以翻譯成“依存語法”?!皬膶訇P(guān)系語法”和“依存語法”是同義術(shù)語。
③Madray-Lesihne,F(xiàn).,& Richard-Zappella,J.(Eds.)(1995)
Lucien Tesnière aujourd'hui.Actes du Colloque International C.N.R.S. URA-Université de Rouen,16-17-18 Novembro 1992.Louvain/Paris:Editions Peeters.
④“意義?文本理論”實質(zhì)上是一種依存語法理論。
⑤即兩卷本的Dependenz und Valenz: Ein Internationales Handbuch Der
Zeitgen?sischen Forschung。這本手冊兩卷共計1600頁,包括了121篇文章。此書的主編是匈牙利學者艾格爾(?gel),但后期的主要工作是在埃蒙斯領導下進行的。
⑥児玉徳美,《依存文法の研究》,1987。
⑦在馮志偉為自然語言處理而進行的依存分析中,為了操作上的方
便,他也在表示單詞的結(jié)點上面加上了該單詞的詞類信息或語義信息,采用復雜特征,沒有堅持“單純結(jié)點條件”。不過,讀者應當注意到,在泰尼埃的原著中,一般只采用單純結(jié)點;在蓋夫曼和海斯的著作中,除了表示單詞結(jié)點之外,還容許存在表示范疇(詞類)的結(jié)點。這說明在依存語法研究中,實際上并不嚴格遵守“單純結(jié)點條件”。
⑧這里使用了國際標準ISO 639-2:Codes for the Representation
of Names of Languages.http://www.loc.gov/standards/iso639-2/php/code_list.的語言名稱簡寫:Chinese(chi),Japanese(jpn),German(ger),Czech(cze),Danish(dan),Swedish(swe),Dutch(dut),Arabic(ara),Turkish(tur),Spanish(spa),Portuguese(por),Bulgarian(bul),Slovenian(slv),Italian(ita),English(eng),Romanian(rum),Basque(eus),Catalan(cat),Greek(ell),Hungarian (hun)。
參考文獻:
[1]L.Tesnière.?léments de Syntaxe Structurale[M].Paris:
Klinck-sieck,1959.
[2]K.Schubert.Metataxis:Contrastive Dependency Syntax for
MT[M].Dordrecht:Foris,1987.
[3]J.Nivre,Inductive Dependency Parsing[M].Berlin:Springer,
2006.
[4]馮志偉.特斯尼耶爾的從屬關(guān)系語法[J].國外語言學,1983,
(1).
[5]劉海濤.泰尼埃的結(jié)構(gòu)句法理論[J].北華大學學報(社會科學
版),2007,(5).
[6]劉海濤.依存語法的理論和實踐[M].北京:科學出版社,2009.
[7]馮志偉.現(xiàn)代語言學流派(增訂本)[M].北京:商務印書館,
2013.
(馮志偉 浙江杭州 杭州師范大學外國語學院 311121)