国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

句法和語(yǔ)義的對(duì)應(yīng)——語(yǔ)義形式化的基石

2016-03-02 01:32林勝?gòu)?qiáng)鄒崇理四川師范大學(xué)政治教育學(xué)院四川成都60068中國(guó)社會(huì)科學(xué)院哲學(xué)研究所北京0073
關(guān)鍵詞:句法語(yǔ)義

林勝?gòu)?qiáng),鄒崇理(.四川師范大學(xué)政治教育學(xué)院,四川成都60068;.中國(guó)社會(huì)科學(xué)院哲學(xué)研究所,北京0073)

句法和語(yǔ)義的對(duì)應(yīng)——語(yǔ)義形式化的基石

林勝?gòu)?qiáng)1,鄒崇理2
(1.四川師范大學(xué)政治教育學(xué)院,四川成都610068;2.中國(guó)社會(huì)科學(xué)院哲學(xué)研究所,北京100732)

[摘要]在我國(guó)的語(yǔ)言學(xué)界和計(jì)算語(yǔ)言學(xué)界,缺乏語(yǔ)義分析的形式化已成為中文信息處理的瓶頸問(wèn)題。要使語(yǔ)義分析形式化,需要建立句法和語(yǔ)義對(duì)應(yīng)的原則,這樣能夠把句法的可計(jì)算性延伸到語(yǔ)義那里。此外,從哲學(xué)角度思考,句法和語(yǔ)義的對(duì)應(yīng)顯示出一些差異現(xiàn)象。這種“差異”的根源之一在于自然語(yǔ)言中存在的非連續(xù)現(xiàn)象。在自然語(yǔ)言某些非連續(xù)現(xiàn)象那里,“特異”的語(yǔ)義成分對(duì)形成整體的語(yǔ)義來(lái)說(shuō)是非組合的,這就是句法和語(yǔ)義對(duì)應(yīng)的“盲區(qū)”,也是語(yǔ)義形式化需要關(guān)注的地方。

[關(guān)鍵詞]句法;語(yǔ)義;語(yǔ)義形式化;自然語(yǔ)言

今天的時(shí)代是計(jì)算機(jī)信息處理的時(shí)代,“大數(shù)據(jù)”和“云計(jì)算”等概念滲透到人類(lèi)生活的方方面面。百度總裁李彥宏在2015年兩會(huì)提出“大腦風(fēng)暴”的設(shè)想,而這立馬涉及到“計(jì)算機(jī)句法分析”和“計(jì)算機(jī)語(yǔ)義理解”等概念。要想計(jì)算機(jī)理解自然語(yǔ)言,必須做到讓自然語(yǔ)言的句法和語(yǔ)義成為可計(jì)算的形式化對(duì)象。上個(gè)世紀(jì)中葉,敏銳的科學(xué)家就已經(jīng)覺(jué)察到這樣的問(wèn)題,他們分別是機(jī)器翻譯之父B.Hillel和數(shù)學(xué)家Lambek以及語(yǔ)言學(xué)界“哥白尼式革命”的倡導(dǎo)者Chomsky,他們創(chuàng)立的范疇語(yǔ)法和轉(zhuǎn)換生成語(yǔ)法各自一定程度解決了自然語(yǔ)言句法的形式化。但自然語(yǔ)言語(yǔ)義的形式化是隨后60-70年代出現(xiàn)的邏輯語(yǔ)法(也叫形式語(yǔ)義學(xué)或語(yǔ)言邏輯)的開(kāi)拓者M(jìn)ontague基于句法和語(yǔ)義對(duì)應(yīng)的原則而提出的。在計(jì)算機(jī)信息領(lǐng)域?qū)ψ匀徽Z(yǔ)言的處理實(shí)踐中,這個(gè)原則面臨許多具體挑戰(zhàn)。本文關(guān)注在處理句法和語(yǔ)義對(duì)應(yīng)關(guān)系時(shí)遭

遇到的自然語(yǔ)言中的非連續(xù)現(xiàn)象,主要從理論上圍繞句法和語(yǔ)義的對(duì)應(yīng)以及語(yǔ)義形式化提出自己的論點(diǎn)。

一、自然語(yǔ)言形式化研究的必要性

語(yǔ)言分為有聲語(yǔ)言和書(shū)面語(yǔ)言,這兩種語(yǔ)言形式的物質(zhì)載體不同,但其句法構(gòu)造和語(yǔ)義所指都是具備的。要想計(jì)算機(jī)理解自然語(yǔ)言,首先要把自然語(yǔ)言的句法構(gòu)造變成可計(jì)算的可推演的對(duì)象。我們先來(lái)看看國(guó)際上句法分析形式化直接作用于計(jì)算機(jī)信息處理的實(shí)例,據(jù)此表明自然語(yǔ)言形式化研究的必要性。

作為范疇類(lèi)型邏輯的蘭貝克演算,對(duì)自然語(yǔ)言句法構(gòu)造進(jìn)行了可證明和可計(jì)算的形式化研究,這是一種應(yīng)計(jì)算機(jī)信息處理需求產(chǎn)生的理論。如英語(yǔ)句“Livia hates someone”的句法構(gòu)造可以分析為蘭貝克演算的證明網(wǎng)。其證明結(jié)構(gòu)為:

圖1和圖2均滿足非循環(huán)性和連通性,表明該句的證明結(jié)構(gòu)是證明網(wǎng),從而判定該句子符合語(yǔ)法的要求。

Grail作為基于Prolog程序的語(yǔ)法分析器,是范疇類(lèi)型邏輯對(duì)自然語(yǔ)言分析的計(jì)算機(jī)實(shí)現(xiàn),這種實(shí)現(xiàn)的基礎(chǔ)就是蘭貝克演算的證明網(wǎng)概念[1]。設(shè)定詞庫(kù)后,Grail可在視窗界面上通過(guò)證明網(wǎng)方式展示對(duì)自然語(yǔ)言的形式化分析過(guò)程。

啟動(dòng)Grail程序后,輸入英語(yǔ)句“Livia hates someone”的符號(hào)串后,視窗界面便由左至右出現(xiàn)對(duì)應(yīng)的范疇np、兩個(gè)復(fù)合范疇的分解樹(shù)和推演期望獲得的目標(biāo)范疇s(圖3)。

其中用黑體標(biāo)記的原子范疇表示具有否定極性的原子公式,用白體標(biāo)記的原子范疇表示具有肯定極性的原子公式,而復(fù)合范疇采取分解樹(shù)的表述方式。這時(shí)根據(jù)肯定公式匹配相應(yīng)否定公式的原則形成若干公理聯(lián)結(jié),于是獲得這樣的證明結(jié)構(gòu):其所有的修正圖滿足非循環(huán)性和連通性。即獲得關(guān)于英語(yǔ)句“Livia hates someone”句法分析的證明網(wǎng)。上述操作程序可以讓計(jì)算機(jī)的Grail語(yǔ)法分析器自動(dòng)地執(zhí)行,最后獲得整個(gè)句子的證明網(wǎng)視窗界面(圖4)。

自然語(yǔ)言能夠產(chǎn)生句法構(gòu)造豐富多樣的語(yǔ)句,人類(lèi)容易理解一定范圍內(nèi)語(yǔ)句的句法構(gòu)造,但是計(jì)算機(jī)要處理更多復(fù)雜的構(gòu)造,卻需要對(duì)此進(jìn)行形式化分析。如果沒(méi)有關(guān)于句法構(gòu)造的形式化描述,計(jì)算機(jī)人工智能體是不能理解自然語(yǔ)言的。因此,自然語(yǔ)言的形式化研究值得邏輯語(yǔ)法和計(jì)算語(yǔ)言學(xué)學(xué)者去關(guān)注。

二、語(yǔ)義形式化的缺失是中文信息處理的瓶頸

關(guān)于自然語(yǔ)言的句法分析形式化問(wèn)題國(guó)內(nèi)外在最近幾十年里取得了不少的進(jìn)展。范疇語(yǔ)法的現(xiàn)代版本之一是基于規(guī)則而關(guān)注語(yǔ)言事實(shí)分析需求的組合范疇語(yǔ)法CCG。CCG的優(yōu)勢(shì)在信息處理上,它所表現(xiàn)的現(xiàn)象比詞匯功能語(yǔ)法、中心語(yǔ)驅(qū)動(dòng)語(yǔ)法等要深,可以更快地評(píng)價(jià)語(yǔ)句中的語(yǔ)詞是否有依存關(guān)系、謂詞-論元關(guān)系等。CCG分析器在分析速度和準(zhǔn)確度上都占優(yōu)勢(shì)。2009年在約翰普金斯大學(xué)舉行的夏季研討班上,研究者采用優(yōu)化的句法分析算法,使CCG句法分析在維基百科語(yǔ)料上達(dá)到每秒超過(guò)100句

的分析速度,且抽樣顯示,其分析精度并沒(méi)有明顯損失,說(shuō)明CCG可以用來(lái)進(jìn)行工業(yè)規(guī)模的句法分析。

在中文信息處理領(lǐng)域,CCG的研究現(xiàn)狀是,計(jì)算語(yǔ)言學(xué)家主要關(guān)心如何根據(jù)中文信息處理的需求構(gòu)建相適應(yīng)的句法規(guī)則,確立詞條的句法范疇的指派,從而實(shí)現(xiàn)更高效、更準(zhǔn)確的自動(dòng)句法分析。據(jù)本課題研究團(tuán)隊(duì)所掌握的關(guān)于CCG的大量文獻(xiàn)來(lái)看,國(guó)外的論著專(zhuān)門(mén)討論語(yǔ)義問(wèn)題的尚且不多,在漢語(yǔ)的計(jì)算語(yǔ)言學(xué)研究領(lǐng)域,幾乎沒(méi)有開(kāi)展語(yǔ)義形式化的工作,語(yǔ)義形式化的缺失現(xiàn)象更為突出。以清華大學(xué)計(jì)算機(jī)專(zhuān)業(yè)博士生導(dǎo)師、微軟亞洲研究院自然語(yǔ)言處理組資深研究員黃昌寧教授為首的研究團(tuán)隊(duì),近年來(lái)致力于從事CCG的漢語(yǔ)信息處理工作。他們把基于轉(zhuǎn)換語(yǔ)法的清華中文樹(shù)庫(kù)轉(zhuǎn)換成基于CCG的中文樹(shù)庫(kù),取得的成績(jī)令人矚目。該團(tuán)隊(duì)主要成員、清華大學(xué)周強(qiáng)教授2012年4月6日在中國(guó)社科院哲學(xué)所做的報(bào)告顯示:CCG的研究在漢語(yǔ)的句法分析方面碩果累累,CCG處置的規(guī)模大約有45,000個(gè)漢語(yǔ)句子和100萬(wàn)個(gè)漢語(yǔ)詞。選擇基于文學(xué)、學(xué)術(shù)、新聞、應(yīng)用四大體裁的平衡語(yǔ)料作為加工對(duì)象,盡可能多地覆蓋了漢語(yǔ)的各種語(yǔ)言現(xiàn)象。但這些真實(shí)文本的CCG分析結(jié)果僅限于句法層面。

為說(shuō)明漢語(yǔ)CCG研究語(yǔ)義缺失所帶來(lái)的問(wèn)題,這里以漢語(yǔ)動(dòng)詞時(shí)間句為例,如周強(qiáng)教授在報(bào)告中提出的漢語(yǔ)句“這個(gè)問(wèn)題我們已研究過(guò)了”的分析樹(shù)圖[2]:

圖5中的“已”、“過(guò)”和“了”都是與時(shí)間有關(guān)的詞條,在語(yǔ)義上,三者是密切關(guān)聯(lián)的,所體現(xiàn)的時(shí)間邏輯語(yǔ)義是一個(gè)整體,構(gòu)成了一個(gè)表示類(lèi)似過(guò)去時(shí)或現(xiàn)在完成時(shí)的時(shí)間算子。但圖5在句法層面的分析卻按照漢語(yǔ)的自然詞序把它們分隔開(kāi),為它們各自指派了不同的范疇以方便句法計(jì)算。這種分析符合漢語(yǔ)的習(xí)慣表達(dá),但沒(méi)有從語(yǔ)義角度考慮問(wèn)題,很難表現(xiàn)出三個(gè)詞條構(gòu)成的語(yǔ)義整體。因而圖1的句法分析是一種為了方便句法計(jì)算而忽略語(yǔ)義理解的簡(jiǎn)單處理,我們很難為這樣的句法分析樹(shù)推演的每一節(jié)點(diǎn)同步匹配合適的語(yǔ)義表達(dá)式。

中文信息處理與印歐語(yǔ)系的語(yǔ)言信息處理有不同之處,中國(guó)工程院院士陳力為對(duì)此概括了五條,我們列舉其中的兩條[3] 6:1.印歐語(yǔ)言多有形態(tài)變化(例如:復(fù)數(shù)、單數(shù),過(guò)去、現(xiàn)在,陰性、陽(yáng)性等等),而漢語(yǔ)缺少形態(tài)變化。計(jì)算機(jī)對(duì)漢語(yǔ)的處理(例如機(jī)器翻譯、人機(jī)接口等)無(wú)法利用形態(tài)變化,只能在句法、語(yǔ)義上找出路。2.漢語(yǔ)語(yǔ)法研究尚未形成規(guī)范化,而且人們習(xí)慣于約定俗成的語(yǔ)法。于是語(yǔ)義研究顯得尤其重要。例如,“吃飯”、“吃大碗”、“吃食堂”的理解只能靠語(yǔ)義來(lái)解決。陳院士的概括強(qiáng)調(diào)了在中文信息處理中語(yǔ)義形式化分析的重要性。北京大學(xué)計(jì)算語(yǔ)言所詹衛(wèi)東教授在句法形式化研究方面取得了豐碩的成果,構(gòu)造了一個(gè)分析現(xiàn)代漢語(yǔ)10類(lèi)短語(yǔ)結(jié)構(gòu)的全局性規(guī)則147條[3] 116。這些規(guī)則在使用中雖然涉及到一些語(yǔ)義因素,且作者認(rèn)為在語(yǔ)義方面也做了一些工作,但距離和句法同步推演的語(yǔ)義形式化還相差甚遠(yuǎn)。在漢語(yǔ)短語(yǔ)結(jié)構(gòu)那里,一個(gè)成分能否跟另一個(gè)成分搭配,取決于句法、語(yǔ)音、語(yǔ)義和語(yǔ)用等多種因素。相對(duì)而言,句法因素可操作性強(qiáng),語(yǔ)義制約因素更復(fù)雜一些。漢語(yǔ)在語(yǔ)義方面的規(guī)律,對(duì)人講述是很容易的,但要以形式化的方式告訴計(jì)算機(jī),卻非常困難。我們感覺(jué),語(yǔ)義形式化是中文信息處理的重點(diǎn),同時(shí)更是難點(diǎn),跟國(guó)際上關(guān)于印歐語(yǔ)言的形式化研究相比,在語(yǔ)義方面做到像句法形式化那樣可計(jì)算確實(shí)是漢語(yǔ)計(jì)算機(jī)處理的瓶頸問(wèn)題。

三、語(yǔ)義形式化的基石:句法和語(yǔ)義的對(duì)應(yīng)

要使語(yǔ)義分析形式化,必須強(qiáng)調(diào)句法和語(yǔ)義對(duì)應(yīng)的原則,這樣才能夠把句法的可計(jì)算性延伸到語(yǔ)義那里,這就是句法和語(yǔ)義對(duì)應(yīng)的價(jià)值,語(yǔ)義形式化的堅(jiān)實(shí)基礎(chǔ)是句法和語(yǔ)義的對(duì)應(yīng)。

句法是語(yǔ)言表達(dá)式之間的排列關(guān)系,是表達(dá)式在空間位置上的移動(dòng)規(guī)律。傳統(tǒng)語(yǔ)言學(xué)所謂句法是指:對(duì)語(yǔ)言符號(hào)串的線形排列進(jìn)行成分分析,語(yǔ)句切分為主謂賓定狀補(bǔ)等句法成分?,F(xiàn)代理論語(yǔ)言學(xué)的Chomsky學(xué)派認(rèn)為,句法就是有關(guān)語(yǔ)言層次結(jié)構(gòu)的由小到大的生成規(guī)則。而在邏輯語(yǔ)法看來(lái),所謂句法不僅是語(yǔ)言層次結(jié)構(gòu)由小到大的生成規(guī)律,更是指一種便于組合性語(yǔ)義解釋的規(guī)則機(jī)制。

語(yǔ)義指語(yǔ)言表達(dá)式的意義,是人們對(duì)語(yǔ)言表達(dá)式的理解或解讀。傳統(tǒng)語(yǔ)言學(xué)所說(shuō)的語(yǔ)義是指語(yǔ)言符號(hào)串的意思,詞義是最基本的意義單位,詞典編纂和訓(xùn)詁釋義是針對(duì)詞義的方法?,F(xiàn)代理論語(yǔ)言學(xué)采用義素分析和語(yǔ)義場(chǎng)等方法研究語(yǔ)義,詞義決定短語(yǔ)和句子的意義。而邏輯語(yǔ)法所謂語(yǔ)義是指跟句法生成相對(duì)應(yīng)的東西,是基于外部世界的一種模型論語(yǔ)義解釋?zhuān)@種語(yǔ)義同句法一樣是可計(jì)算的對(duì)象。

邏輯語(yǔ)法關(guān)于語(yǔ)義的上述理解已經(jīng)包含了句法和語(yǔ)義對(duì)應(yīng)的思想。要想徹底了解句法和語(yǔ)義的對(duì)應(yīng),有必要從其根源——蒙太格語(yǔ)法的通用語(yǔ)法思想說(shuō)起。蒙太格的通用語(yǔ)法認(rèn)為,自然語(yǔ)言的句法基礎(chǔ)是一個(gè)代數(shù)結(jié)構(gòu)〈A,F(xiàn)γ〉γ∈Γ,自然語(yǔ)言的語(yǔ)義基礎(chǔ)也是一個(gè)代數(shù)結(jié)構(gòu)〈B,Gγ〉γ∈Δ。蒙太格給兩個(gè)代數(shù)結(jié)構(gòu)建立了同態(tài)對(duì)應(yīng)關(guān)系[4] 225:

h是從〈A,F(xiàn)γ〉γ∈Γ到〈B,Gγ〉γ∈Δ的同態(tài),當(dāng)且僅當(dāng),(i)〈A,F(xiàn)γ〉γ∈Γ和〈B,Gγ〉γ∈Δ是相似的(即Γ=△并且Fγ與Gγ是同樣位數(shù)的運(yùn)算);(ii)h是以A為定義域和以B的子集為值域的函項(xiàng);(iii)任γ∈Γ,〈αξ〉ξ<β是Fγ的定義域中的任意序列,則h(Fγ〈αξ〉ξ<β=Gγ(〈h(〈αξ〉)〉ξ<β)。

句法代數(shù)中有句法表達(dá)式的集合A,與之對(duì)應(yīng),語(yǔ)義代數(shù)中就有語(yǔ)義值的集合B。句法代數(shù)中有生成句法表達(dá)式的算子Fγ,與之對(duì)應(yīng),語(yǔ)義代數(shù)中就有組合語(yǔ)義值的算子Gγ。h是關(guān)聯(lián)對(duì)應(yīng)兩個(gè)代數(shù)結(jié)構(gòu)的映射。在句法代數(shù)和語(yǔ)義代數(shù)同態(tài)對(duì)應(yīng)的基礎(chǔ)上,蒙太格確立了“句法規(guī)則對(duì)語(yǔ)義規(guī)則”的思想,這是句法和語(yǔ)義對(duì)應(yīng)的實(shí)現(xiàn)。簡(jiǎn)言之,給自然語(yǔ)言制定一條形式化的句法規(guī)則,相應(yīng)就要制定一條形式化的語(yǔ)義規(guī)則。自然語(yǔ)言表達(dá)式的語(yǔ)義離不開(kāi)其句法的構(gòu)造,句法描述自然語(yǔ)言由詞條生成詞組短語(yǔ),再由詞組短語(yǔ)產(chǎn)生句子的規(guī)律,語(yǔ)義順著句法的步調(diào),描述自然語(yǔ)言由詞條的語(yǔ)義組合成詞組短語(yǔ)的語(yǔ)義,再由詞組短語(yǔ)的語(yǔ)義組合成句子的語(yǔ)義。句法的出發(fā)點(diǎn)是詞條,語(yǔ)義的出發(fā)點(diǎn)是詞條的邏輯式,句法由小到大的生成依據(jù)句法運(yùn)算,語(yǔ)義的意義組合依據(jù)相應(yīng)的語(yǔ)義運(yùn)算。例如在蒙太格的PTQ英語(yǔ)語(yǔ)句系統(tǒng)中,句法和語(yǔ)義的對(duì)應(yīng)表現(xiàn)為:

句法規(guī)則:若α是名詞短語(yǔ),β是動(dòng)詞短語(yǔ),則F(α,β)即αβ是句子。

語(yǔ)義規(guī)則:若α′,β′分別是α,β的語(yǔ)義,則G(α′,β′)即α′(β′)是αβ的語(yǔ)義。①上述句法規(guī)則和語(yǔ)義規(guī)則的應(yīng)用實(shí)例:令α=John,β=walk,α′=λPP(j),β′=walk。句法:John是名詞短語(yǔ),walk是動(dòng)詞短語(yǔ),則F (John,walk)即John walks是句子。語(yǔ)義:λPP(j)是John的語(yǔ)義,walk是walk的語(yǔ)義,則G(λPP(j),walk)即[λPP(j)]walk即walk(j)是John walks的語(yǔ)義。在范疇邏輯語(yǔ)法那里,表現(xiàn)出更為嚴(yán)格的句法和語(yǔ)義的對(duì)應(yīng)思想。比如英語(yǔ)句“the short boy walks”的推演,除詞條外的每一節(jié)點(diǎn)都顯示出句法范疇和語(yǔ)義詞項(xiàng)的對(duì)應(yīng),每一步推演都是句法和語(yǔ)義的同步推演:

(圖6) “the short boy walks”的句法語(yǔ)義并行推演樹(shù)

在圖6的推演中,詞條the的語(yǔ)義詞項(xiàng)ι對(duì)應(yīng)句法范疇np/n,詞條short下的語(yǔ)義詞項(xiàng)short對(duì)應(yīng)句法范疇n/n,詞條boy下的語(yǔ)義詞項(xiàng)boy對(duì)應(yīng)句法范疇n,詞條walks下的語(yǔ)義詞項(xiàng)walk對(duì)應(yīng)語(yǔ)義詞項(xiàng)nps。第一步推演:句法范疇n/n和n的推演結(jié)果是n,同時(shí)從語(yǔ)義詞項(xiàng)short和boy推出short(boy);第二步推演:從句法范疇np/n和n推出范疇np,同時(shí)從語(yǔ)義詞項(xiàng)ι和short(boy)推出ι(short(boy));第三步推演:從句法范疇np和nps推出s,同時(shí)從語(yǔ)義詞項(xiàng)ι(short(boy))和walk推出walk ι(short(boy))。

顯然,確立了自然語(yǔ)言句法代數(shù)和語(yǔ)義代數(shù)的同態(tài)映射后,就使句法規(guī)則對(duì)應(yīng)語(yǔ)義規(guī)則成為可能,就使句法推演和語(yǔ)義推演對(duì)應(yīng)起來(lái),就使句法的可計(jì)算性自然延伸到語(yǔ)義那里去,就使語(yǔ)義的形式化成為現(xiàn)實(shí)。一般來(lái)說(shuō),自然語(yǔ)言的句法相對(duì)單純,形式化的操作容易掌控,這就使語(yǔ)言學(xué)家Chomsky創(chuàng)立的

轉(zhuǎn)換生成語(yǔ)法在自然語(yǔ)言的句法形式化分析方面取得了巨大成功。而邏輯學(xué)家Montague不滿足于此,他基于句法和語(yǔ)義對(duì)應(yīng)的思想,把句法的形式化擴(kuò)大成語(yǔ)義的形式化,從而實(shí)現(xiàn)了某種超越。這就是句法和語(yǔ)義對(duì)應(yīng)的理論價(jià)值。

四、句法語(yǔ)義對(duì)應(yīng)的哲學(xué)思考及其問(wèn)題

句法和語(yǔ)義對(duì)應(yīng)的思想對(duì)語(yǔ)義形式化及其自然語(yǔ)言的計(jì)算機(jī)處理具有重要的理論價(jià)值,它在邏輯、語(yǔ)言和計(jì)算三者的跨學(xué)科研究中起到了里程碑的作用,是三學(xué)科交叉領(lǐng)域的地標(biāo)式的建樹(shù)。我們不妨對(duì)此從哲學(xué)角度考量考量,句法和語(yǔ)義的“對(duì)應(yīng)”意味著“一致”和“趨同”的傾向,辯證法告訴我們,“趨同”中有“差異”。在邏輯語(yǔ)法那里,句法代數(shù)和語(yǔ)義代數(shù)之間雖然可以建立同態(tài)映射關(guān)系,但二者畢竟還不是一回事。自然語(yǔ)言的句法規(guī)則刻畫(huà)的是句法表達(dá)式的運(yùn)算,而語(yǔ)義規(guī)則描述的則是語(yǔ)義詞項(xiàng)(內(nèi)涵邏輯式或λ-項(xiàng))的運(yùn)算。這種差異可從蒙太格語(yǔ)法的分析樹(shù)a和分析樹(shù)b的對(duì)比中看出(圖7)。

(圖7) 蒙太格語(yǔ)法的句法分析樹(shù)和語(yǔ)義分析樹(shù)

從自然語(yǔ)言句法生成角度看,圖7中分析樹(shù)a只有兩步:對(duì)詞條love和詞條Mary進(jìn)行運(yùn)算生成短語(yǔ)love Mary,再對(duì)詞條John和短語(yǔ)love Mary進(jìn)行運(yùn)算生成語(yǔ)句John loves Mary;圖7中分析樹(shù)b是對(duì)應(yīng)句法生成的語(yǔ)義翻譯樹(shù)。從語(yǔ)義詞項(xiàng)的組合看,樹(shù)底兩步是跟句法分析樹(shù)a步調(diào)一致的:從詞條love對(duì)應(yīng)的λ-項(xiàng)LOVE和詞條Mary對(duì)應(yīng)的λ-項(xiàng)進(jìn)行運(yùn)算生成短語(yǔ)love Mary對(duì)應(yīng)的λ-項(xiàng)LOVE,再對(duì)詞條John對(duì)應(yīng)的λ-項(xiàng)和短語(yǔ)love Mary對(duì)應(yīng)的λ-項(xiàng)進(jìn)行運(yùn)算生成語(yǔ)句John loves Mary對(duì)應(yīng)的λ-項(xiàng)但樹(shù)頂節(jié)點(diǎn)的語(yǔ)義運(yùn)算卻多出了三步轉(zhuǎn)換,這就是語(yǔ)義計(jì)算不同于句法計(jì)算的“異”,同時(shí)也可以見(jiàn)到語(yǔ)義層面的λ-項(xiàng)包含更多的計(jì)算步驟。

然而,更令人關(guān)注的是,句法和語(yǔ)義對(duì)應(yīng)的另一種“差異”是在對(duì)自然語(yǔ)言所謂非連續(xù)現(xiàn)象的分析中表現(xiàn)出來(lái)的。什么是自然語(yǔ)言中的非連續(xù)現(xiàn)象?組合范疇語(yǔ)法CCG的創(chuàng)立者Steedman認(rèn)為“自然語(yǔ)言中的非連續(xù)結(jié)構(gòu)是范疇語(yǔ)法以及其他語(yǔ)法理論的核心問(wèn)題”[5]。Wood提出如果可作函數(shù)運(yùn)算的兩成分在句法上不相鄰,則無(wú)法直接毗連,這就是不連續(xù)現(xiàn)象[6]。Morrill把非連續(xù)結(jié)構(gòu)定義為句法和語(yǔ)義的不匹配[7]。這里采用蒙太格語(yǔ)法的分析樹(shù)方式并以漢語(yǔ)的某些非連續(xù)表達(dá)式為例來(lái)討論句法和語(yǔ)義對(duì)應(yīng)的“差異”。如下述復(fù)合量化句和介詞方位句:

(1)每個(gè)學(xué)生讀不同一本書(shū)。(2)上海在北京和廣州之間。

就語(yǔ)義分析的方便而言,上面例句的語(yǔ)義分析樹(shù)分別是①跟蒙太格語(yǔ)法的原著不同的是,下面的分析樹(shù)每個(gè)節(jié)點(diǎn)略去了語(yǔ)義類(lèi)型的標(biāo)記,并且用漢語(yǔ)詞的黑體表示該漢語(yǔ)詞對(duì)應(yīng)的邏輯詞項(xiàng)。:

按照通常的做法,蒙太格語(yǔ)法對(duì)例句(1)的句法分析樹(shù)是:

(圖10) 例句(1)的句法分析樹(shù)

例句(2)的句法分析樹(shù)按照通常做法幾乎無(wú)法構(gòu)造。顯然,圖10的句法分析是基于通常自然語(yǔ)言生成順序的兩分法,句法推演方便但無(wú)法對(duì)此配置語(yǔ)義分析。而圖8的語(yǔ)義分析則是方便語(yǔ)義函項(xiàng)計(jì)算的多分法,出發(fā)點(diǎn)是非連續(xù)的復(fù)合詞條。非連續(xù)的復(fù)合詞條是自然語(yǔ)言本身沒(méi)有的句法單位,這里句法分析和語(yǔ)義分析對(duì)應(yīng)不起來(lái)。這些表明在自然語(yǔ)言中,句法和語(yǔ)義對(duì)應(yīng)會(huì)出現(xiàn)一些“盲區(qū)”。本文不打算在這里羅列自然語(yǔ)言句法和語(yǔ)義對(duì)應(yīng)的“盲區(qū)”,只是針對(duì)例句(1)這樣的非連續(xù)復(fù)合量化句進(jìn)行深入剖析,找到問(wèn)題的癥結(jié),提出關(guān)于句法和語(yǔ)義對(duì)應(yīng)的一些新看法。

五、句法和語(yǔ)義對(duì)應(yīng)“盲區(qū)”的思考

為了揭示自然語(yǔ)言分析中句法和語(yǔ)義對(duì)應(yīng)出現(xiàn)的問(wèn)題,考慮語(yǔ)義形式化注重邏輯和計(jì)算的現(xiàn)代品味,我們采用類(lèi)型邏輯語(yǔ)法的方式展示句法生成和語(yǔ)義組合的過(guò)程。例句(1)換用范疇類(lèi)型邏輯的分析推演為:

(圖11) 非連續(xù)復(fù)合量化句的分析樹(shù)

圖11仍是一種多分法的推演,嚴(yán)格講是一種偏重語(yǔ)義函項(xiàng)運(yùn)算的分析。這里句法和語(yǔ)義對(duì)應(yīng)的困境表現(xiàn)在圖7樹(shù)頂排列的詞條順序甚至詞條本身都不是自然語(yǔ)言句法表層所具有的。如果要堅(jiān)持類(lèi)型邏輯語(yǔ)法關(guān)于自然語(yǔ)言的單層結(jié)構(gòu)思想,勢(shì)必在圖11的頂部添加自然語(yǔ)言句法表層的排列作為出發(fā)點(diǎn),這時(shí)句法和語(yǔ)義的對(duì)應(yīng)原則要求從自然語(yǔ)言表層的句法符號(hào)串推出方便語(yǔ)義分析的格局。這樣,首先需要運(yùn)用置換的結(jié)構(gòu)規(guī)則,把作為賓語(yǔ)的量化詞組跟動(dòng)詞交換位置;其次,采用量化詞組的復(fù)合疊置的規(guī)則獲得有助于語(yǔ)義分析的格局。即:

(圖12) 非連續(xù)復(fù)合量化句從句法表層起始的分析樹(shù)

在廣義量詞理論看來(lái),圖12中的Q1是〈1,1〉類(lèi)型的量詞,Q2也是〈1,1〉類(lèi)型的量詞,它們的疊置復(fù)合Q1°Q2=Q[每個(gè)……不同一本…]是〈1,1,2〉類(lèi)型的量詞。令A(yù)=學(xué)生,B=書(shū),R=讀,圖8的疊置復(fù)合概括為:

其語(yǔ)義縮寫(xiě)為:(Q1(A)Q2(B))(R)=Q1°Q2(A,B)(R)。

通常量詞的疊置復(fù)合是可以化歸的,即復(fù)合量詞的涵義可以從單個(gè)量詞的涵義推導(dǎo)出來(lái)。令F是有n個(gè)名詞主目和一個(gè)k-元?jiǎng)釉~主目的量詞Q1,G是有h個(gè)名詞主目和一個(gè)m-元?jiǎng)釉~主目的量詞Q2,那么F與G的疊置F°G是有n+h個(gè)名詞主目和(k+m)-元?jiǎng)釉~主目的量詞,其語(yǔ)義歸結(jié)為:

對(duì)任何A1,…,An,B1,…,Bh哿E和R∈Rk+m而言,

上述定義可見(jiàn),復(fù)合量詞的整體涵義可以化歸為組成它的單個(gè)量詞的涵義。英語(yǔ)句“Most critics reviewed just four films”的分析說(shuō)明了這一點(diǎn)[8] 133~134。

most(critics)(four(film)(reviewed))=(most(critics)°four(film))(reviewed)=[most°four](critics,film)(reviewed)

即“(most(critics)(four(film))(reviewed))”的語(yǔ)義決定量詞疊置復(fù)合后“[most°four](critics,film)(reviewed)”的語(yǔ)義。

但圖12量詞疊置復(fù)合的操作在句法和語(yǔ)義的對(duì)應(yīng)方面出現(xiàn)錯(cuò)位。句法上,單個(gè)量詞“每個(gè)”和單個(gè)量詞“不同一本”在句法上生成復(fù)合量詞(每個(gè),不同一本),語(yǔ)義上在這里卻不是由Q1的語(yǔ)義和Q2的語(yǔ)義組合成Q1°Q2的語(yǔ)義,盡管在其他場(chǎng)合單個(gè)的Q1具有固定的量化意義。Keenan已經(jīng)證明[9] 109~150,像圖12的最后結(jié)果中的量詞疊置復(fù)合是不可化歸的,即Q1°Q2(A,B)(R)的真值條件無(wú)法通過(guò)(Q1(A)Q2(B))(R)推導(dǎo)出來(lái)。就是說(shuō),復(fù)合量詞Q1°Q2的整體涵義是專(zhuān)門(mén)定義的,而不是由Q1和Q2的量化意義推導(dǎo)出來(lái)。在圖12那里,Q1和Q2是一種特異的語(yǔ)義成分,它們單獨(dú)的涵義在量詞的復(fù)合整體涵義中不起作用,復(fù)合量詞Q1°Q2的意義是非組合的。

所以,為推進(jìn)語(yǔ)義形式化,筆者提出:應(yīng)該區(qū)分量詞疊置復(fù)合的兩種形式——組合的和非組合的,進(jìn)而在自然語(yǔ)言中區(qū)分兩種非連續(xù)的現(xiàn)象。非組合的復(fù)合量詞,其單個(gè)的部分量詞擔(dān)當(dāng)?shù)氖撬^語(yǔ)義特異成分的角色,在自然語(yǔ)言量詞疊置復(fù)合的情況下,這些特異的語(yǔ)義成分對(duì)形成復(fù)合量詞整體的語(yǔ)義來(lái)說(shuō)是非組合的。句法上,單個(gè)量詞Q1和Q2生成復(fù)合量詞Q1°Q2,語(yǔ)義上卻不是由Q1的語(yǔ)義和Q2的語(yǔ)義組合成Q1°Q2的語(yǔ)義。這就是句法和語(yǔ)義對(duì)應(yīng)的“盲區(qū)”及其實(shí)質(zhì)。

如果能夠辨認(rèn)并且對(duì)句法和語(yǔ)義對(duì)應(yīng)的“盲區(qū)”進(jìn)行篩選,其價(jià)值在于:第一,能夠知道句法和語(yǔ)義對(duì)應(yīng)原則的局限,這個(gè)原則盡管在語(yǔ)義形式化進(jìn)程中起到巨大作用,但也有其適用范圍,范圍以外只能做特殊處理。第二,句法和語(yǔ)義對(duì)應(yīng)的適用范圍內(nèi)的領(lǐng)域正好順利實(shí)施句法和語(yǔ)義的對(duì)應(yīng)原則,這樣能夠更好地促進(jìn)語(yǔ)義的形式化。

六、結(jié)束語(yǔ)

本文說(shuō)明了形式化方法對(duì)自然語(yǔ)言信息處理的作用,說(shuō)明了語(yǔ)義形式化是中文處理的軟肋,論述了句法和語(yǔ)義的對(duì)應(yīng)是語(yǔ)義形式化的重要基礎(chǔ)。本文尤其關(guān)注句法和語(yǔ)義對(duì)應(yīng)的“盲區(qū)”,提出語(yǔ)義特異成分的概念,指出在對(duì)非連續(xù)的量化句的分析中,量詞的疊置復(fù)合在某些場(chǎng)合下是非組合的,這是句法和語(yǔ)義對(duì)應(yīng)的局限所在。

[參考文獻(xiàn)]

[1] Moot,R.Logic of Categorical grammar[M].Berlin:Springer,2012.

[2]周強(qiáng).組合范疇語(yǔ)法CCG和漢語(yǔ)處理[R].中國(guó)社科院哲學(xué)所學(xué)術(shù)報(bào)告,2012.

[3]詹衛(wèi)東.面向中文信息處理的現(xiàn)代漢語(yǔ)短語(yǔ)結(jié)構(gòu)規(guī)則研究[M].北京:清華大學(xué)出版社,2000.

[4] Montague,Richard.Universal Grammar[M]//R.Thomason.Formal Philosophy.New Haven:Yale University Press,1974.

[5] Steedman,M.J.Combinatory Grammars and Parasitic Gaps[J].Natural Language and Linguistics Theory,1987,(6).

[6] Wood,M.Categorial Grammars[M].London:Routledge,1993.

[7] Morrill.Categorial Grammar:Logical Syntax,Semantics,and Processing[M].Oxford:Oxford University Press,2011.

[8]鄒崇理.邏輯、語(yǔ)言和信息——邏輯語(yǔ)法研究[M].北京:人民出版社,2002.

[9] Keenan,E.L.Unreducible n-ary Quntifiers in Natural Language[M]//Peter Gardenfors.Generalized Quantifiers.Dordrecht:Kluwer Academic Publishers Group,1987.

[責(zé)任編輯:熊顯長(zhǎng)]

[作者簡(jiǎn)介]林勝?gòu)?qiáng)(1963-),男,四川隆昌人,四川師范大學(xué)政治教育學(xué)院教授,主要從事語(yǔ)言邏輯、邏輯哲學(xué)研究;鄒崇理(1953-),男,四川成都人,中國(guó)社會(huì)科學(xué)院哲學(xué)研究所研究員、博士生導(dǎo)師,主要從事自然語(yǔ)言邏輯研究。

[基金項(xiàng)目]國(guó)家社會(huì)科學(xué)基金重大招標(biāo)資助項(xiàng)目:10&ZD073

[收稿日期]2015-09-30

[中圖分類(lèi)號(hào)]B81

[文獻(xiàn)標(biāo)志碼]A

[文章編號(hào)]1001-4799(2016)01-0055-07

猜你喜歡
句法語(yǔ)義
述謂結(jié)構(gòu)與英語(yǔ)句法配置
語(yǔ)言與語(yǔ)義
市場(chǎng)調(diào)查報(bào)告句法特征分析
句法二題
詩(shī)詞聯(lián)句句法梳理
批評(píng)話語(yǔ)分析中態(tài)度意向的鄰近化語(yǔ)義構(gòu)建
“分”的音變構(gòu)詞及其句法語(yǔ)義特征
“社會(huì)”一詞的語(yǔ)義流動(dòng)與新陳代謝
“上”與“下”語(yǔ)義的不對(duì)稱性及其認(rèn)知闡釋
“吃+NP”的語(yǔ)義生成機(jī)制研究