何山華 毛眺源
(1.揚州大學 外國語學院,江蘇 揚州 225127;2.蘇州大學 外國語學院,江蘇 蘇州 215006)
自《句法結構》[1]出版至今已有60年,喬姆斯基(Chomsky)無疑依然是語言學領域最有影響力的學者,他當年憑藉此書開創(chuàng)生成語法理論,一舉“根本改變了現(xiàn)代語言學的面貌”[2]1,由此被稱為“現(xiàn)代語言學之父”[3]?!毒浞ńY構》的一個重要貢獻就是提出了語法的形式化思想,它將數(shù)學和邏輯的分析方法引入了語言學研究,使語言學開始向精密科學、自然科學發(fā)展[4]。60年來,生成語法理論的技術內(nèi)涵歷經(jīng)數(shù)次重大變化,但一直秉持了《句法結構》所確立的數(shù)理化的理論原則。
近年來越來越多的西方學者認識到《句法結構》將在語言學史上占有重要一席,投入大量精力對該書的數(shù)理思想內(nèi)容進行總結,并對其形式化思想淵源進行考證。例如,紐邁爾(Newmeyer)[4][5]在描述生成語法歷史時重點分析了《句法結構》的數(shù)理理論特質;馬修(Matthews)[6][7]挖掘出了該書與同時代類似研究的關系;奧特羅(Otero)[8]1-36則將整個20世紀上半葉相關的數(shù)學研究進展均納入《句法結構》數(shù)理淵源的討論;格拉菲(Graffi)[9]甚至將數(shù)理化句法研究的歷史上推至整個19世紀。而較近的重要成果當屬托馬林(Tomalin)[10]的專著《語言學與形式科學——生成語法探源》,系統(tǒng)分析了20世紀上半葉出現(xiàn)的數(shù)學技術及其演化進入生成語法的過程。
如今西方學者已經(jīng)就《句法結構》所涉及的數(shù)理思想內(nèi)容有較全面的認識,如喬姆斯基的學生帕蒂等對語言研究中的數(shù)理思想和數(shù)學方法進行了梳理[11]182,不過國內(nèi)學界還少有涉及。而對于《句法結構》數(shù)理思想的淵源及其影響,中西方學者均有探討,但遠未形成共識,如紐邁爾認為《句法結構》首先在語言研究中使用了數(shù)學方法,引起不少爭議;托馬林則過度強調了來自數(shù)理邏輯領域的影響,忽視了當時心理學和哲學領域的背景[12]97-115;毛眺源等[13]只詮釋了《句法結構》數(shù)理概念對當前語言學發(fā)展的宏觀影響??偟膩碚f,學界目前基本同意《句法結構》的數(shù)理思想奠定了形式語言學的部分認識論和方法論原則,其出現(xiàn)是當時數(shù)學和語言研究融合這一大趨勢所推動的,但其中的數(shù)理知識到底借自何處、其數(shù)理化思想是否由喬姆斯基原創(chuàng),至今仍有爭論,而關于《句法結構》史學價值的討論可以說才剛剛開始。本文擬在西方學者討論的基礎上,對《句法結構》涉及的重要數(shù)理知識進行檢視,對其來源進行分析,并試圖探討這些知識對生成語法后期發(fā)展的影響。
《句法結構》提出可以用一套機器可理解的形式化規(guī)則,產(chǎn)出語言中所有合乎語法的句子,其所借用的工具包括算術中的集合,幾何中的公理系統(tǒng),以及邏輯上的運算等數(shù)理概念。書中最具決定性的創(chuàng)新包括將遞歸函數(shù)理論和公理演繹思想引入了語言生成的分析過程,以及提出喬姆斯基形式語法等級體系。
在喬姆斯基看來,“語言知識是什么”是語言學家必須回答的核心問題之一。他把這一問題叫作“洪堡特問題”(Humboldt’s Problem),并接受洪堡特[14]56-75對這一問題的回答:“語言絕不是產(chǎn)品,而是一種創(chuàng)造性活動”,其核心就是“有限手段的無限使用”。喬姆斯基認為,洪堡特所指出的這種“語言的創(chuàng)造功能”其實就是一種遞歸機制,它使人們可以用有限的語言素材表達無限數(shù)量的思想、感情、意圖等。[15]
遞歸如今是在數(shù)學和計算機科學中一個非常重要的概念。遞歸函數(shù)的基本概念在19世紀甚至更早就已出現(xiàn),但直到20世紀30年代才被丘奇(Church)和哥德爾(Godel)等數(shù)學家正式提出,隨即獲得快速發(fā)展。至50年代時已經(jīng)有學者[16]47-58將其用于自然語言的句法研究。遞歸函數(shù)通常由一個初始值出發(fā),通過循環(huán)計算而定義一類值,其最關鍵的特征在于“自我參照”(self-reference)。[10]61-62比如在數(shù)學上,就可以采用遞歸的方法定義自然數(shù)的集合:“1是一個自然數(shù);每個自然數(shù)都有一個后繼,記作n+1;n+1也是自然數(shù)?!迸c此相類似,在自然語言中也可以使用一定的機制來拓展語言結構。比如英語可以通過在從句中嵌套從句來實現(xiàn)類似遞歸的功能,如“Mr. White is waiting for Mr. Black who is waiting for Ms. Green who is waiting for …”。在理論上,所有的語言都可以通過遞歸的方式使句子變得無限長。
《句法結構》試圖通過數(shù)學方式論證語言的這一屬性。喬姆斯基[1]21假定存在一種語言,只含有字母a和b,句子都是鏡像字符串(1)鏡像字符串是指可以一分為二,左面一半與右面一半由相同的符號組成,但順序正好相反的符串。如abba,babbab,bbabbabb是鏡像字符串,aabb, abab則都不是。。如果使用列舉的方式,顯然無法窮盡該語言所有的句子。但如果利用遞歸機制,就可以通過三個步驟描述這種語言L:(ⅰ)規(guī)定字符串x的初始值,即x等于aa或bb;(ⅱ)給出可以重復執(zhí)行的遞歸步驟,如在X的兩端各添加一個a或者b。(ⅲ)給定約束條件,把所有不是從(ⅰ)和(ⅱ)運算得來的符號串排除之外。這樣,就可以用少量的規(guī)則來描述符合語法的所有語言事實,無須一一列舉。喬姆斯基的學生帕蒂等(Partee)[11]182曾將上述構想具體表達如下:
(ⅰ) aa ∈ L & bb∈ L
(ⅱ)(? x)(x∈L→(axa∈L & bxb ∈ L))
(ⅲ)除了(ⅰ)和(ⅱ)產(chǎn)生的字符串以外,L不包含任何元素。
(注:∈:屬于;?:對于所有;→:如果……那么……)
以上例子很好地說明了《句法結構》有關語言遞歸屬性的觀點:“如果一種語法沒有遞歸機制,就會變得無比復雜;如果有了某種遞歸裝置,就能夠產(chǎn)生無限數(shù)量的句子?!盵1]24喬姆斯基因此認為遞歸性甚至可以說是人類語言唯一至關重要的特性。[17]1569-1579我們可以看出,遞歸機制就是生成語法理論中“生成”概念的基礎,這也解釋了為什么喬姆斯基說生成語法的研究之所以能實現(xiàn),乃是數(shù)學發(fā)展的結果。[15]
公理演繹思想的使用是《句法結構》的一個重要特點。喬姆斯基引入大量的符號,使用公理演繹的方法精確呈現(xiàn)句法的生成過程,從而實現(xiàn)了“對我們有關語言的直覺進行嚴密的描述”[18] 375。
公理系統(tǒng)(axiomatic system)具有與遞歸相似的邏輯結構:從數(shù)量有限的給定初始命題出發(fā),通過反復應用一套推理規(guī)則,推出無限數(shù)量的其他命題。初始命題被稱為公理,而推理出來的命題被稱為定理。公理集合、推理規(guī)則集合以及用于標記這些表達式的字母表,構成一個公理系統(tǒng)。它是一個有序三元組(A, S, P),其中:(ⅰ)A是一個符號的有限集,稱為字母表;(ⅱ)S是A中符號組成的符串的集合,稱為公理;(ⅲ)P是A*中n元關系的集合,也就是生成式或規(guī)則?!毒浞ńY構》中提出的短語結構語法[∑,F]就是一種典型的公理系統(tǒng):∑代表初始符號集,F(xiàn)代表一套改寫規(guī)則,F(xiàn)的形式為X→Y(把X改寫為Y;X可以為一個符號串,但每次改寫只能改動其中一個符號)。[1]29
當需要進行復雜推理的時候,就要引入新的符號集合(即輔助字母表,它只參與推理但不出現(xiàn)在最終結果中,因此也被稱為非終結字符),成為一個擴展的公理系統(tǒng),用(A, B, S, P)表示。如果把擴展的公理系統(tǒng)只應用于字符串重寫,規(guī)定每一次推導的形式都限定為α→β這一生成式(α和β都是符串),那么我們就得到一個半圖厄系統(tǒng)(semi-Thue system)。該系統(tǒng)以首次研究它的挪威數(shù)學家圖厄(Axel Thue)命名,具體來說就是每次推導的生成式都是φxψ→φyψ的形式。
上文所述的[∑,F]語法,就是一個半圖厄系統(tǒng)。∑為初始字符串,不過僅包含一個非終結符號Z;F是生成式,包含兩條規(guī)則:F: Z→ab;Z→aZb。喬姆斯基[1]30假設有一種語言,其具體形式為n個a聯(lián)接上n個b,如ab,aabb或aaabbb,則可以用如下包含三個步驟的[∑,F]語法進行定義:(ⅰ)∑:Z;(ⅱ)F:Z→ab;(ⅲ)Z→aZb。該語法生成的語言可以表示為{anbn∣n≥1}。喬姆斯基[1]31強調,Z只是引入的一個符號,它不是該語言中真正存在的句子,而且正是這個Z使形式句法變得抽象。我們可以看出,這里的Z其實就是擴展公理系統(tǒng)里的輔助字母表。將這一系統(tǒng)應用于自然語言的語法描寫,就可以寫出“the man hit the ball”的生成過程(2)本例中的NP,VP,T,N,Verb等都屬于輔助字母,不出現(xiàn)在最終推理結果中,完整推理過程見Chomsky,N,Syntactic Structures,p.26.:
(ⅰ)Sentence→ NP + VP
(ⅱ)NP→ T+N
(ⅲ)VP→ Verb + NP
(ⅳ)T→ the
(ⅴ)N → man, ball
(ⅵ)Verb → hit, took
喬姆斯基[∑,F]語法所體現(xiàn)的演繹思想是革命性的,使生成語法立即從根本上有別于當時語言學以歸納為主的研究傳統(tǒng),在語言學界引起了廣泛的強烈反響?!毒浞ńY構》基于公理系統(tǒng)為字符串的生產(chǎn)規(guī)定了生成規(guī)則,使語言學可以從確定的前提出發(fā),基于少數(shù)規(guī)則推導出不同語言合乎語法的句子,對當代語言學后來半個多世紀的發(fā)展產(chǎn)生了深遠的影響。
《句法結構》的一個重要貢獻是正式將形式語法引入了語言學研究,用于描述語言的生成過程。喬姆斯基將基于上述公理演繹思想建立的形式語法根據(jù)限定條件不同,分為四種(0型、1型、2型、3型),后來被稱為喬姆斯基等級。[19]有意思的是,喬姆斯基等級如今被納入數(shù)學和計算機理論體系,成為進入這兩個領域的學生的必學內(nèi)容。
喬姆斯基等級的4種文法基于一個擴展的公理系統(tǒng),即G =(A, B, S, P)。如果它的每個產(chǎn)生式α→β中,α含有至少一個輔助字母,而β沒有,則G是一個0型文法,即無限制文法。如果在0型文法的基礎上加上一個限制條件,要求|β|≥|α|,即β的長度都超過α,則變成1型文法,即上下文有關文法。2型文法是在1型文法的基礎上,再要求α都是輔助字母,即上下文無關文法。3型文法是在2型文法的基礎上滿足:A→α|αB(右線性,只往右邊延伸)或A→α|Bα(左線性,只往左邊延伸),即有限狀態(tài)文法。這一體系中0型文法限制最少,生成能力最強,而3型文法生成能力最弱。喬姆斯基在《句法結構》中重點推出的短語結構句法,其實是一種上下文無關文法,不過它規(guī)定α→β這一表達式中α只能包含一個輔助字母,其推導過程無須考慮α出現(xiàn)的上下文。喬姆斯基認為,上下文無關語法盡管有諸多不足,但仍然是最適合用于自然語言的描述文法,這一文法后來也被稱為喬姆斯基文法。
喬姆斯基[1]19認為有限狀態(tài)語法無法描述英語的生成過程,并以馬爾科夫過程(Markov Process)為例進行了說明。馬爾科夫過程實際上是一個典型的隨機過程,它的“現(xiàn)在”與它的“將來”和“過去”都無關,只能通過概率統(tǒng)計來體現(xiàn),因此無法依賴它總是產(chǎn)生符合語法的英語句子?!毒浞ńY構》明確指出,“不可能建立一種有限狀態(tài)的自動機,它能產(chǎn)出并只產(chǎn)出合乎語法的英語”[1]23,并給出“if… then…”和“either… or…”等幾個句型進行說明。后來戴利(Daly)[20]與普盧姆(Pullum)[21]277-296指出喬姆斯基的這種論證遠不夠充分,強調他不但沒有在《句法結構》中,而且在其他著作和論文里也沒有從數(shù)學上認真論證“英語不是有限狀態(tài)語言”這一觀點。更為關鍵的是,當時喬姆斯基在否定馬爾科夫過程的同時,也否定了概率論模型在語言生成方面的適用性,這一點在后來遭到了更多的批評與質疑。
喬姆斯基等級體系中的四種類型的文法后來分別與圖靈機、線性有界自動機、下推自動機和有限自動機等四種類型的自動機建立了對應關系,大大推動了計算語言學對語言識別的研究。語言自動機的功能在于檢驗輸入的符號串是否符合某語法,如果是合法的句子,這個裝置就接受它;如果不是合法的句子,這個裝置就不接受它。喬姆斯基[1]79認為普遍語法的研究對象是“理想化的說話人和聽話人的語言知識”,因此聽話人和說話人同樣重要。說話者通過普遍語法的機制產(chǎn)生語言,聽話者通過它識別合法的語言。生成語法和自動機的關系與此類似:生成語法從生成的角度來描述語言,而自動機從識別的角度來描述語言。這種關于形式語法與自動機的對應關系,反映了語言的生成過程與識別過程的內(nèi)在聯(lián)系,對于后來計算機程序設計、算法分析、圖像識別和人工智能等都產(chǎn)生巨大影響[22]57,已成為計算機處理自然語言以及機器翻譯等研究領域的基石之一??梢哉f,盡管喬姆斯基不是出身于數(shù)學專業(yè),但他借用數(shù)學和邏輯領域的思想進行理論創(chuàng)新,最終又反哺了數(shù)學和邏輯的研究。
《句法結構》或者說生成語法的思想來源較為復雜,其形成背景包括20世紀上半葉西方學界在哲學、心理學、語言學、邏輯與數(shù)學等領域的迅猛發(fā)展,及這些領域在此之前數(shù)百年中的源流演變。[12]毫無疑問,數(shù)理思想是生成語法理論來源的核心成分之一,不過由于喬姆斯基本人并未就此作明確說明,導致學界對此進行了長期的考證與爭論,自90年代起成為一個熱門話題。[4]鑒于喬姆斯基文法主要系其本人原創(chuàng),來源明確,爭論較少,我們此處僅討論遞歸函數(shù)和公理演繹思想這兩個爭議較多的內(nèi)容。
喬姆斯基認識到語言具有“生成”的性質,顯然是受到了洪堡特的影響,但將這一性質用遞歸概念進行顯性化,則是得到了他所處時代其他研究的啟發(fā):“在50年代初期,開始接觸到更多數(shù)理邏輯,特別是遞歸函數(shù)理論和元數(shù)學知識,而這些領域的發(fā)展似乎為更精確地研究自然語言提供了工具。我當時受這些知識啟發(fā)最大。”[23]只是喬姆斯基受何人啟發(fā),又以何種形式、在多大程度上借鑒了其他人的研究成果,至今沒有定論。不過根據(jù)學界的推斷,一般認為喬姆斯基對遞歸機制的使用直接借鑒了波蘭裔美國數(shù)理邏輯學家波斯特(Emil Post)的研究成果。[12][21][24]26-60波斯特(Post)[25]284-316曾提出過一套推理規(guī)則,稱之為“產(chǎn)生式系統(tǒng)”(production system),它實際上是一種遞歸可枚舉集。簡而言之,該系統(tǒng)包含了一套規(guī)則(每一條規(guī)則稱為一個產(chǎn)生式),可以在某一初始字符串的基礎上“產(chǎn)生”(produce)另外一個字符串。換句話說,如果符合規(guī)則,可以在{?1,…, ?n}的基礎上生成?n+1。需要注意的是,波斯特這一操作的對象,正是能夠組成句子的字符串,與《句法結構》中假定的字符串語言[21][26]有異曲同工之處。
喬姆斯基在上述遞歸邏輯基礎上提出的[∑,F]語法與“產(chǎn)生式系統(tǒng)”頗為相似:∑就是初始字符串,F(xiàn)就是“產(chǎn)生式規(guī)則”(production),而且在生成能力的解釋上也是近似的。因此,普盧姆[21]指出《句法結構》中遞歸機制的提出可能是對波斯特成果的借鑒。索林經(jīng)過考證也提出,該成果在1944年就已發(fā)表,6年之后又有羅森布魯姆(Rosenbloom)[26]進行了概括與闡述,喬姆斯基完全有條件接觸到這一內(nèi)容。[12]拉斯尼克等[24]的研究也表明,喬姆斯基的形式化機制是對波斯特算法理論的系統(tǒng)化和一般化。實際上喬姆斯基[23]曾承認“generate”一詞的使用參考了波斯特的“produce”,但言盡于此。索林[12]因此批評喬姆斯基不夠坦誠,對借鑒最多的學者卻提及最少,未能明確指出其思想的來源。鑒于[∑,F]語法與“產(chǎn)生式系統(tǒng)”頗為相似,我們認為喬姆斯基對波斯特的借鑒可能是存在的,甚至是“顯而易見的”[12],保守地判斷,即便喬姆斯基沒有簡單照搬波斯特的成果,也“不能忽視他熟悉波斯特的研究這一事實”[10]61,因此可以認為波斯特的研究應是啟發(fā)喬姆斯基將遞歸概念用于語言生成的最大靈感來源。
在《句法結構》之前,語言研究基本上是遵循歸納思想,即從觀察語言事實出發(fā),通過比較、類推、總結等手段獲得對語言系統(tǒng)的認知?!毒浞ńY構》嘗試用[∑,F]這種公理系統(tǒng)的形式化手段對語言生成的過程進行嚴格的表述,使語言學研究變得精確,進而成為一門“明晰”和“嚴密”的“科學”。[18]也因為如此,《句法結構》被認為是“創(chuàng)造了一個新的時代”[27]36,其巨大影響導致很多人感覺是喬姆斯基首次將公理演繹思想應用于語言學研究。但相關研究表明,將演繹思想引入語言學的首創(chuàng)之功到底應歸于誰,存在不同觀點。托馬林[10]55認為布龍菲爾德的引領起到了重要作用。布龍菲爾德[28]153-164在20世紀20年代指出語言學家應將數(shù)學中的公理-演繹方法用于對語言的研究,以迫使語言學家明白清晰地表達其思想,定義其術語,區(qū)分獨立和依附性元素,并由此建立語言的科學。這一倡議在40年代末50年代初得到了其他語言學家的實質性回應,產(chǎn)生了較多研究成果,至50年代已能借助于形式符號,使用公理-演繹方法進行較為精確的句法分析[10],如“公理句法”(axiomatic syntax)[29]409-413。50年代時,語言學界的很多學者“為了追求‘嚴密’,都急切地盯著數(shù)學”[30]36,對于數(shù)學技術的學習和使用已經(jīng)成為一種思潮。鑒于布龍菲爾德雖然較早提出了倡議,但其本人并未就此進行具體應用,而相關實質性成果直至20年后才開始出現(xiàn),我們認為布龍菲爾德的作用是有限的。
拉斯尼克等[24]曾提出喬姆斯基這一思想直接來自戴維斯(Davis)未出版時的書稿[31],但這種考證鑒于沒有得到當事人的確認,難以令人信服。根據(jù)喬姆斯基的自述,其對于數(shù)學的研究是得自其老師哈里斯(Harris)的建議[23]33,考慮到當時數(shù)學領域內(nèi)對于公理-演繹思想的使用已經(jīng)具有較長的歷史,因此要確定公理-演繹思想的具體來源,甚至唯一來源,是非常困難的。正如巴奇(Bach)[32]9-10所指出的一樣,公理-演繹思想在語言學中的運用,是數(shù)學和語言學兩大學科長期(一百年)相互靠攏的結果。我們認為,要將生成語法中公理-演繹思想的來源歸于某一位數(shù)學家或語言學家是一種過于簡單化的思路;喬姆斯基受彼時風潮影響,必定是從多個來源接受了公理-演繹思想。
喬姆斯基承認自己在數(shù)學方面是完全自學成才[33]6,他所使用的數(shù)理知識基本上來自專業(yè)數(shù)學家,相關來源在數(shù)學領域一般可以找到證據(jù)。對喬姆斯基將數(shù)理知識運用于語言學研究是否為原創(chuàng)的質疑,喬姆斯基的回應是:“我經(jīng)常被邀請參加數(shù)學界的研討會和學術會議,就數(shù)理語言學作報告;從來沒有人質疑我發(fā)言的資格;他們想知道的是我的發(fā)言內(nèi)容?!盵33]6-7我們認為,喬姆斯基將數(shù)理理論創(chuàng)造性地應用于語言研究,對現(xiàn)代語言學的發(fā)展提供了“積極推動作用”[13],而喬姆斯基是否參考了至今未披露的信息來源,將由于他在語言學史上的關鍵地位逐漸成為一個具有史學價值的重要問題,很可能將在喬姆斯基身后繼續(xù)被討論。
《句法結構》的出版和生成語法的創(chuàng)建對于語言學研究的影響可用“革命”[34]16-24和“震蕩”[35]247-270來形容,而其對數(shù)理思想和數(shù)學形式的使用,則被認為是其革命性的一個方面。[5]紐邁爾(Newmeyer)[5]24指出:“在1957年之前,不僅是語言學界,所有人文學科和社會科學領域的人都普遍認為,不可能使用一種形式化的非經(jīng)驗主義的方式對人類屬性進行描述?!?以《句法結構》的出版為標志,喬姆斯基證明了這個做法是可能的,并保持了后來超過半個世紀的蓬勃發(fā)展。(3)至2019年7月1日在谷歌上的查詢結果顯示:《句法結構》自出版以來的被引次數(shù)已達到2.2萬余次,至今熱度不減,2015年以來引用次數(shù)也達3 500余次。不過, 《句法結構》的貢獻與其說是為自然語言的研究提供了堅實的論證和精準的結論,倒不如說是證明了一種新思路的可行性?!毒浞ńY構》中提出的一些結論雖未佐以完善的數(shù)學論證,導致了后來 其他學者關于其中數(shù)學細節(jié)的長期的論爭。[36]后人沿著喬姆斯基指出的方向開展了長達五六十年的探索并取得了巨大的進展,只是這一導向能否引領我們破解人類語言的終極秘密還有待未來繼續(xù)深入探索。有人認為,與其說是《句法結構》實現(xiàn)了語言研究的創(chuàng)新性、明晰化和技術上的一致,不如說是它催化了后來者在這一方向上實現(xiàn)了創(chuàng)造性的突破。[21]隨著生成語法具體理論細節(jié)的多次變化,以及計算機技術發(fā)展對自然語言處理的極大推進,近年來《句法結構》中有關數(shù)理基礎的部分觀點引發(fā)學界的再度反思,本文僅略舉兩例。
學界近年來開始質疑喬姆斯基當時關于有限狀態(tài)語法和概率論模型的批判態(tài)度。喬姆斯基在《句法結構》中認為有限狀態(tài)語法無法用于描述英語,也無法用于描述其他自然語言,因為這一途徑無法解釋最終結果,不得不過度依賴概率統(tǒng)計數(shù)據(jù)?!毒浞ńY構》指出,“合乎語法”與語言結構在語言中出現(xiàn)的概率高低沒有關系,一個人產(chǎn)出和辨識合乎語法的話語的能力并非建立在統(tǒng)計近似值等概念之上的,概率論模型無助于解決句法結構中的一些根本性問題。[1]15-17但后來計算機技術的飛躍使有限狀態(tài)語法以及概率論模型在自然語言識別方面取得了很大的成功,這使得有學者[37]30-33對喬姆斯基的當年的這一立場提出質疑,認為不能因為馬爾科夫模型的限制就否認其他概率模型的可行性。
喬姆斯基似乎確實未能預見概率論在語法能力研究上的作用,是否有誤導語言學研究發(fā)展 方向之嫌?我們認為不能如此理解,喬姆斯基一直認為科學的任務是對世界做出解釋,生成語法的任務則是解釋語言的生成能力,而非預測某個結構出現(xiàn)的概率,統(tǒng)計模型無法提供對現(xiàn)象的 理解。盡管概率模型在搜索引擎、語音識別和機器翻譯等領域取得了較好的表現(xiàn),但正如喬姆斯基所指出的,工程上的成功并非科學研究的終極目的,而且目前大部分取得成功的例子都是與語言的基本屬性結合使用取得的。[37][38][39]我們認為,概率模型所取得的成功并不能證明喬姆斯基觀點的錯誤,概率模型不致力于發(fā)現(xiàn)因果關系,對于解釋語言的本質終究只能提供輔助信息,要理解語言生成的過程規(guī)則依然要依賴于推導式的研究。
相對于早期,句法語義的關系重新受到關注。喬姆斯基在理論形成初期采取了對語義予以排除的做法,《句法結構》指出,“合乎語法”這一概念應與“有意義”(meaningful)、“有意味”(significant)等語義上的概念無關,企圖以語義為基礎來給“合乎語法”這一概念下定義是徒勞的。[1]15喬姆斯基對語義的排除可能是受到了當時數(shù)學和邏輯學界主張的影響。例如,克林(Kleene)[40]在《元數(shù)學導論》(Introduction to Metamathematics)一書中寫道:“意義解讀與形式系統(tǒng)的描寫無關,完全可以將形式符號當做純粹的標記,而非象征或指向某物的符號?!焙髞?,喬姆斯基將語義重新納入語言研究,可見初期對于語義的排除很可能是出于追求純粹形式的考慮。目前,喬姆斯基[41]在最簡方案中關于意義的處理比較巧妙,他用不可解讀特征和可解讀特征區(qū)分了非語義(形式)屬性和語義內(nèi)容。然而,即便喬姆斯基已經(jīng)對語義在語法中的介入留下了一定的空間,他也沒有容許語義左右狹義句法中的運算。
《句法結構》比較成功地運用了數(shù)理工具創(chuàng)立了一種高度形式化的語言處理理論,開創(chuàng)了語言學家們使用數(shù)學方法研究語言的新時代,永遠地“改變了語法研究領域的面貌”[42]226。但另一方面,生成語法長期以來的發(fā)展也一直受到數(shù)學理論發(fā)展的限制,《句法結構》中的部分思想來源如今也受到了質疑,如其數(shù)理思想的原創(chuàng)性等。不過,喬姆斯基[43]69在語言研究中對于數(shù)學的重視是極具啟發(fā)性的:“如果有人問我如何管理一個語言學系,我會主張大量開設數(shù)理語言學的課程,鼓勵學生獲得足夠的數(shù)學背景,至少要緊跟數(shù)學領域的研究動向,并且學生們應努力與純數(shù)學領域的學者保持聯(lián)系。”他對目前數(shù)理語言學所達到的水平仍不滿意,“普遍語法的某種數(shù)學理論與其說是今日的現(xiàn)實,勿寧說是未來的希望”[43]71。數(shù)學和邏輯領域的發(fā)現(xiàn)曾極大推進了語言學的發(fā)展,在未來仍有可能為語言學研究提供突破性推動力。對于《句法結構》數(shù)理思想的剖析及其淵源的考證,有助于我們更為客觀地認識天才人物在科學發(fā)展史中的實際作用,并對我們現(xiàn)在和未來的實際工作提供啟發(fā)。