馮志偉
(杭州師范大學(xué),杭州 310036)
●語(yǔ)言學(xué)
〇引進(jìn)與詮釋
R.Hausser的左結(jié)合語(yǔ)法
馮志偉
(杭州師范大學(xué),杭州 310036)
本文在“語(yǔ)表組合線性?xún)?nèi)部匹配”理論和“數(shù)據(jù)庫(kù)語(yǔ)義學(xué)”基礎(chǔ)上,介紹Roland Hausser的“左結(jié)合語(yǔ)法”。 這種獨(dú)具特色的形式語(yǔ)法,對(duì)于自然語(yǔ)言的自動(dòng)分析和自動(dòng)生成具有重要的指導(dǎo)意義。
語(yǔ)表組合線性?xún)?nèi)部匹配;數(shù)據(jù)庫(kù)語(yǔ)義學(xué);左結(jié)合語(yǔ)法
采用計(jì)算機(jī)技術(shù)來(lái)研究和處理自然語(yǔ)言是20世紀(jì) 40 年代末期和50年代才開(kāi)始的。50多年來(lái),這項(xiàng)研究取得長(zhǎng)足的進(jìn)展,成為當(dāng)代語(yǔ)言學(xué)中一個(gè)重要的新興分支——自然語(yǔ)言處理(Natural Language Processing,簡(jiǎn)稱(chēng)NLP)。在信息網(wǎng)絡(luò)時(shí)代,自然語(yǔ)言處理引起包括計(jì)算機(jī)專(zhuān)家和語(yǔ)言學(xué)家在內(nèi)的越來(lái)越多的學(xué)者的重視,成為文科和理科緊密結(jié)合的一門(mén)典型交叉學(xué)科(Manaris 1999)。
由于現(xiàn)實(shí)的自然語(yǔ)言極為復(fù)雜,不可能直接作為計(jì)算機(jī)的處理對(duì)象,為了使現(xiàn)實(shí)的自然語(yǔ)言成為可以由計(jì)算機(jī)直接處理的對(duì)象,在眾多的應(yīng)用領(lǐng)域中,我們需要根據(jù)處理的要求,把自然語(yǔ)言抽象處理為一個(gè)“問(wèn)題”(problem),再把這個(gè)問(wèn)題在語(yǔ)言學(xué)上加以“形式化”(formalism),建立語(yǔ)言的“形式模型”(formal model),使之能以一定的數(shù)學(xué)形式,嚴(yán)密而規(guī)整地表示出來(lái),并且把這種嚴(yán)密而規(guī)整的數(shù)學(xué)形式表示為“算法”(algorithm),建立自然語(yǔ)言處理的“計(jì)算模型”(computational model),使之能夠在計(jì)算機(jī)上實(shí)現(xiàn)。在自然語(yǔ)言處理中,算法取決于形式模型,形式模型是自然語(yǔ)言計(jì)算機(jī)處理的本質(zhì),而算法只不過(guò)是實(shí)現(xiàn)形式模型的手段而已。這種建立語(yǔ)言形式模型的研究是非常重要的,它應(yīng)當(dāng)屬于自然語(yǔ)言處理的基礎(chǔ)理論研究。(馮志偉 2010)
由于自然語(yǔ)言處理的復(fù)雜性,這樣的形式模型的研究往往是一個(gè)“強(qiáng)不適定問(wèn)題”(strongly ill-posed problem),也就是說(shuō),在用形式模型建立算法來(lái)求解自然語(yǔ)言處理的問(wèn)題時(shí),往往難以滿(mǎn)足問(wèn)題解的“存在性”、“唯一性”和“穩(wěn)定性”這3條最基本的要求,有時(shí)是不能滿(mǎn)足其中的一條,有時(shí)甚至3條都不能滿(mǎn)足。因此,對(duì)于這樣的強(qiáng)不適定性問(wèn)題求解,應(yīng)當(dāng)加入適當(dāng)?shù)摹凹s束條件”(constraint conditions),使問(wèn)題的一部分在一定的范圍內(nèi)變成“適定問(wèn)題”(well-posed problem),從而順利地求解這個(gè)問(wèn)題,建立自然語(yǔ)言處理的形式模型,以達(dá)到自然語(yǔ)言處理的目標(biāo)。(張鈸 2007:3-7)
我們?cè)诒疚闹薪榻B的“左結(jié)合語(yǔ)法”(Left-Associative Grammar,簡(jiǎn)稱(chēng)LA)就是一種獨(dú)具特色的自然語(yǔ)言處理的形式模型。
左結(jié)合語(yǔ)法的創(chuàng)始人Roland Hausser是德國(guó)愛(ài)爾蘭根-紐倫堡大學(xué)計(jì)算語(yǔ)言學(xué)教授。他先后出版了《表面組成語(yǔ)法》、《自然人機(jī)交流》、《計(jì)算語(yǔ)言學(xué)基礎(chǔ)-人機(jī)自然語(yǔ)言交流》和《自然語(yǔ)言交流的計(jì)算機(jī)模型》等多部專(zhuān)著,發(fā)表文章近百篇。近年來(lái),Hausser進(jìn)一步提出了“數(shù)據(jù)庫(kù)語(yǔ)義學(xué)”(Database Semantics,簡(jiǎn)稱(chēng)DBS)和完整的“語(yǔ)表組合線性?xún)?nèi)部匹配”理論(Surface Compositional Li-near Internal Matching,簡(jiǎn)稱(chēng)SLIM),創(chuàng)立了左結(jié)合語(yǔ)法,在計(jì)算語(yǔ)言學(xué)界形成了他自己獨(dú)特的風(fēng)格。
我與Hausser曾有一面之交。2002年聯(lián)合國(guó)教科文組織(UNESCO)韓國(guó)委員會(huì)在韓國(guó)首爾舉行了一次關(guān)于“信息時(shí)代的語(yǔ)言問(wèn)題”的學(xué)術(shù)研討會(huì),我和Hausser都被邀請(qǐng)參加了這次會(huì)議,在會(huì)議期間的交談中,我對(duì)于Hausser獨(dú)特的理論有了初步的了解,回國(guó)之后,我又細(xì)讀了他的《計(jì)算語(yǔ)言學(xué)基礎(chǔ)-人機(jī)自然語(yǔ)言交流》一書(shū),對(duì)于他的理論又有了進(jìn)一步的認(rèn)識(shí)。我認(rèn)為Hausser是一位具有獨(dú)創(chuàng)精神的計(jì)算語(yǔ)言學(xué)家。
2006年,Hausser又出版了《自然語(yǔ)言交流的計(jì)算機(jī)模型-數(shù)據(jù)庫(kù)語(yǔ)義學(xué)下的語(yǔ)言理解、推理和生成》一書(shū)(Hausse 2006)。在這本書(shū)中,他系統(tǒng)地分析了自然語(yǔ)言的主要結(jié)構(gòu),以英語(yǔ)為例,分析了聽(tīng)話(huà)人模式(hearer mode)和說(shuō)話(huà)人模式(speaker mode)下的示意推導(dǎo)。聽(tīng)話(huà)人模式下的分析主要討論了如何嚴(yán)格按照時(shí)間線性順序?qū)⒑~-論元結(jié)構(gòu)(hypotaxis)和并列結(jié)構(gòu)(parataxis)編碼為命題因子,并把共指(coreference)作為推理基礎(chǔ)上的二級(jí)關(guān)系來(lái)分析。說(shuō)話(huà)者模式下的分析主要討論如何在詞庫(kù)內(nèi)進(jìn)行以提取內(nèi)容為基礎(chǔ)的自動(dòng)導(dǎo)航,如何按照相應(yīng)語(yǔ)言的語(yǔ)法要求輸出正確的詞形和語(yǔ)序,如何析出適當(dāng)?shù)墓δ茉~,等等。在這本重要的著作中,Hausser構(gòu)建了一個(gè)功能完整但覆蓋面有限的英語(yǔ)交流體系,為我們提供了一個(gè)對(duì)自然語(yǔ)言交流進(jìn)行理論分析的功能框架。
Hausser認(rèn)為,面向未來(lái)的計(jì)算語(yǔ)言學(xué)的中心任務(wù)就是研究一種人類(lèi)可以用自己的語(yǔ)言與計(jì)算機(jī)進(jìn)行自由交流的認(rèn)知機(jī)器。因此,自然語(yǔ)言的人機(jī)交流應(yīng)當(dāng)是計(jì)算語(yǔ)言學(xué)的中心任務(wù)。計(jì)算語(yǔ)言學(xué)研究應(yīng)當(dāng)通過(guò)對(duì)說(shuō)話(huà)人的語(yǔ)言生成過(guò)程與聽(tīng)話(huà)人解釋語(yǔ)言的過(guò)程進(jìn)行建模,在適宜的計(jì)算機(jī)上復(fù)制信息的自然傳遞過(guò)程,從而構(gòu)建一種可與人用自然語(yǔ)言自由交流的自治的認(rèn)知機(jī)器,這樣的認(rèn)知機(jī)器也就是機(jī)器人(robot)。為了實(shí)現(xiàn)這一目標(biāo),我們必須對(duì)于自然語(yǔ)言交流機(jī)制的功能模型有深刻的理解。
Hausser提出的“語(yǔ)表組合線性?xún)?nèi)部匹配”理論以人作為人機(jī)交流的主體,而不是以語(yǔ)言符號(hào)為主體,突出了人在人機(jī)交流中的主導(dǎo)作用,SLIM理論要求通過(guò)完全顯化的機(jī)械步驟,使用邏輯和電子的方式來(lái)解釋自然語(yǔ)言理解和自然語(yǔ)言的生成過(guò)程。因此, SLIM理論與現(xiàn)代語(yǔ)言學(xué)中的結(jié)構(gòu)主義、行為主義和言語(yǔ)行為等理論是不同的,具有明顯的創(chuàng)新特色。
SLIM理論強(qiáng)調(diào)“表層成分”(Surface),以語(yǔ)表組合性作為它的方法論原則;SLIM理論強(qiáng)調(diào)“線性”(Linear),以時(shí)間線性作為它的實(shí)證原則;SLIM理論強(qiáng)調(diào)語(yǔ)言的“內(nèi)部因素”(Internal),以語(yǔ)言的內(nèi)部因素作為它的本體論原則;SLIM理論強(qiáng)調(diào)“匹配”(Matching),以語(yǔ)言和語(yǔ)境信息之間的匹配作為它的功能原則。事實(shí)上,SLIM這個(gè)名字本身就來(lái)自于“表層成分”、“線性”、“內(nèi)部因素”和“匹配”這4項(xiàng)原則的英文名稱(chēng)的首字母縮寫(xiě)。
SLIM理論的技術(shù)實(shí)現(xiàn)手段叫做“數(shù)據(jù)庫(kù)語(yǔ)義學(xué)”(DBS)。DBS是把自然語(yǔ)言理解和生成重新建構(gòu)為“角色轉(zhuǎn)換”(turn-taking)的規(guī)則體系。角色轉(zhuǎn)換指的是從“說(shuō)話(huà)人模式”向“聽(tīng)話(huà)人模式”的轉(zhuǎn)換,或者從“聽(tīng)話(huà)人模式”向“說(shuō)話(huà)人模式”的轉(zhuǎn)換。
在自然語(yǔ)言的實(shí)際交流過(guò)程中,第1個(gè)過(guò)程是聽(tīng)話(huà)人模式中的自然主體從另一個(gè)主體或者語(yǔ)境獲得信息,第2個(gè)過(guò)程是自然主體在自己的認(rèn)知當(dāng)中分析信息,第3個(gè)過(guò)程是自然主體思考如何作出反應(yīng),第4個(gè)過(guò)程是自然主體用語(yǔ)言或者行動(dòng)做出反饋。
DBS的輸入與第1個(gè)過(guò)程相似,要求計(jì)算機(jī)或者機(jī)器人具備外部界面。接下來(lái)匹配語(yǔ)境和認(rèn)知的內(nèi)容,采用左結(jié)合語(yǔ)法(LA)來(lái)模擬第2個(gè)過(guò)程,這個(gè)左結(jié)合語(yǔ)法是處于聽(tīng)話(huà)人模式中的,叫做LA-hear。左結(jié)合語(yǔ)法的第二個(gè)變體負(fù)責(zé)在內(nèi)存詞庫(kù)中搜索合適的內(nèi)容,叫做LA-think,這一部分操作對(duì)應(yīng)于第3個(gè)過(guò)程。左結(jié)合語(yǔ)法的第三個(gè)變體的任務(wù)是語(yǔ)言生成,叫做LA-speak,模擬第4個(gè)過(guò)程。如圖1所示:
圖1 角色轉(zhuǎn)換體系
在圖1中,聽(tīng)話(huà)人模式的LA-hear模擬第2個(gè)過(guò)程,說(shuō)話(huà)人模式的LA-think模擬第3個(gè)過(guò)程,LA-speak模擬第4個(gè)過(guò)程。
DBS的分析結(jié)果用DBS圖(DBS graph)來(lái)表示。DBS圖是一種樹(shù)結(jié)構(gòu),但是,DBS圖的樹(shù)結(jié)構(gòu)與短語(yǔ)結(jié)構(gòu)語(yǔ)法和依存語(yǔ)法的樹(shù)結(jié)構(gòu)有所不同。例如,英語(yǔ)的句子The little girl slept(那個(gè)小女孩睡著了) 用短語(yǔ)結(jié)構(gòu)語(yǔ)法分析后的樹(shù)結(jié)構(gòu)如下:
圖2 短語(yǔ)結(jié)構(gòu)樹(shù)
在這個(gè)短語(yǔ)結(jié)構(gòu)語(yǔ)法的樹(shù)結(jié)構(gòu)中,S(句子)由NP(名詞短語(yǔ))和VP(動(dòng)詞短語(yǔ))組成,NP由DET(限定詞),ADJ(形容詞)和N(名詞)組成,它們分別對(duì)應(yīng)于單詞the, little和girl,VP對(duì)應(yīng)于單詞slept. 句子的層次和單詞之間的前后線性關(guān)系都是很清楚的,但是,在組成S的NP和VP之間,沒(méi)有說(shuō)明哪一個(gè)是中心詞,在組成NP的DET, ADJ和N之間,也沒(méi)有說(shuō)明哪一個(gè)是中心詞,句子中各個(gè)成分的中心不突出。
用依存語(yǔ)法分析后的樹(shù)結(jié)構(gòu)如下:
圖3 依存結(jié)構(gòu)樹(shù)
在這個(gè)依存語(yǔ)法的樹(shù)結(jié)構(gòu)中,全部結(jié)點(diǎn)都是具體的單詞,沒(méi)有S, NP, VP, DET, ADJ和N等表示范疇的結(jié)點(diǎn),各個(gè)單詞之間的依存關(guān)系清楚,這種依存關(guān)系是二元關(guān)系,支配者是中心詞,被支配者的從屬詞。但是,單詞之間的前后線性順序不如短語(yǔ)結(jié)構(gòu)語(yǔ)法的樹(shù)結(jié)構(gòu)那樣明確。
用DBS圖分析后的樹(shù)結(jié)構(gòu)如圖4所示:
圖4 DBS圖的樹(shù)結(jié)構(gòu)
在DBS圖的樹(shù)結(jié)構(gòu)中,著重對(duì)語(yǔ)言?xún)?nèi)容進(jìn)行分析,因此,沒(méi)有表示定冠詞 the 的結(jié)點(diǎn),結(jié)點(diǎn)上的單詞都用原型詞表示。DBS圖最突出的特色在于,DBS圖樹(shù)結(jié)構(gòu)的結(jié)點(diǎn)之間的連線各自有其明確的含義,連線不僅表示結(jié)點(diǎn)之間的依存關(guān)系,還可以根據(jù)連線走向的不同來(lái)表示不同的功能:垂直豎線“|” 表示修飾-被修飾關(guān)系,例如,圖4中l(wèi)ittle與girl用垂直豎線相連,表示little修飾girl;左斜線 “/” 代表主語(yǔ)-動(dòng)詞關(guān)系,例如,圖4中g(shù)irl與sleep用左斜線相連,表示girl是sleep的主語(yǔ)。此外,DBS圖樹(shù)結(jié)構(gòu)還使用右斜線 “” 表示賓語(yǔ)-動(dòng)詞關(guān)系,使用水平線 “-”表示并列關(guān)系。由于連線走向的不同可以表示不同的功能,這樣的樹(shù)結(jié)構(gòu)表示的信息比短語(yǔ)結(jié)構(gòu)語(yǔ)法的樹(shù)結(jié)構(gòu)和依存語(yǔ)法的樹(shù)結(jié)構(gòu)豐富多了。這是DBS圖樹(shù)結(jié)構(gòu)最引人矚目的特點(diǎn)。
上面的DBS圖中表示了little做girl的修飾語(yǔ),girl做sleep的主語(yǔ),表達(dá)的是句子中單詞之間的語(yǔ)義關(guān)系,所以,Hausser把這樣的DBS圖叫做“語(yǔ)義關(guān)系圖”(the semantic relations graph,簡(jiǎn)稱(chēng)SRG)。
如果把DBS圖中每個(gè)結(jié)點(diǎn)上的單詞替換為代表其詞性的字母,那么,語(yǔ)義關(guān)系圖就變成了“詞性關(guān)系圖”(the part of speech signature,或者簡(jiǎn)寫(xiě)為signature)。上一例句的詞性關(guān)系圖如圖5所示:
圖5 詞性關(guān)系圖
語(yǔ)義關(guān)系圖和詞性關(guān)系圖是同一句子內(nèi)容的不同表示,它們表示的內(nèi)容相同,表示的形式不同。
Hausser在2011年的新書(shū)中還提出了另外兩個(gè)圖:一個(gè)是“編號(hào)弧圖”(the numbered arcs graph,簡(jiǎn)稱(chēng)NAG), 一個(gè)是“語(yǔ)表實(shí)現(xiàn)圖”(the surface realization)。這兩個(gè)圖分別表現(xiàn)如何從內(nèi)容生成語(yǔ)言的過(guò)程和結(jié)果。編號(hào)弧圖表示激活語(yǔ)義關(guān)系圖的時(shí)間線性順序,也就是說(shuō),編號(hào)弧圖在某種程度上可以說(shuō)是添加了編號(hào)弧的語(yǔ)義關(guān)系圖。語(yǔ)表實(shí)現(xiàn)圖表示如何按照遍歷順序生成語(yǔ)言的表層形式。
例如,英語(yǔ)句子“The little girl ate an apple”(這個(gè)女孩吃了一個(gè)蘋(píng)果)的語(yǔ)義關(guān)系圖(SRG)如圖6所示:
圖6 語(yǔ)義關(guān)系圖
由于語(yǔ)義關(guān)系圖(SRG)只表示句子的內(nèi)容,所以,在這個(gè)SRG中,沒(méi)有表示定冠詞the的結(jié)點(diǎn),也沒(méi)有表示不定冠詞an的結(jié)點(diǎn),過(guò)去時(shí)形式ate用不定式動(dòng)詞eat來(lái)表示。
這個(gè)句子的詞性關(guān)系圖(signature)如圖7所示:
圖7 詞性關(guān)系圖
在這個(gè)詞性關(guān)系圖中,結(jié)點(diǎn)上的單詞都替換表示其詞性的字母。
這個(gè)句子的編號(hào)弧圖(NAG)如圖8所示:
圖8 編號(hào)弧圖
由于編號(hào)弧圖要表示激活語(yǔ)義關(guān)系圖的時(shí)間線性順序,這種時(shí)間順序用編號(hào)弧表示,編號(hào)弧用虛線標(biāo)出,并在虛線旁邊用數(shù)字注上時(shí)間的線性順序:結(jié)點(diǎn)eat首先激活的結(jié)點(diǎn)girl(編號(hào)弧1);接著,結(jié)點(diǎn)girl激活結(jié)點(diǎn)little(編號(hào)弧2),由于它們之間用垂直豎線“|”相連,因此,可推導(dǎo)出little修飾girl(編號(hào)弧3);由于結(jié)點(diǎn)girl與結(jié)點(diǎn)eat之間用左斜線 “/”相連,因此,可推導(dǎo)出girl是eat的主語(yǔ)(編號(hào)弧4);然后,結(jié)點(diǎn)eat激活結(jié)點(diǎn)apple(編號(hào)弧5),由于結(jié)點(diǎn)apple與結(jié)點(diǎn)eat之間用右斜線 “”相連,因此,可推導(dǎo)出apple是eat的賓語(yǔ)(編號(hào)弧6)。可以看出,所有表示推導(dǎo)的編號(hào)弧的方向都是自底向上的。
這個(gè)句子的語(yǔ)表實(shí)現(xiàn)圖如圖9所示:
圖9 語(yǔ)表實(shí)現(xiàn)圖
圖9中的數(shù)字表示單詞生成的順序。
數(shù)據(jù)庫(kù)語(yǔ)義學(xué)(DBS)有兩個(gè)基礎(chǔ):一個(gè)是左結(jié)合語(yǔ)法(LA-grammar),一個(gè)是單詞數(shù)據(jù)庫(kù)(word bank)。左結(jié)合語(yǔ)法和單詞數(shù)據(jù)庫(kù)在DBS中緊密結(jié)合在一起。Hausser把左結(jié)合語(yǔ)法比作火車(chē)頭,把單詞數(shù)據(jù)庫(kù)比作火車(chē)運(yùn)行必需的鐵路系統(tǒng)。
單詞數(shù)據(jù)庫(kù)存儲(chǔ)單詞的內(nèi)容,其存儲(chǔ)形式是一種非遞歸的特征結(jié)構(gòu),叫做“命題因子”(proplets)。英文 “proplet” 取自 “proposition droplet”,表示命題的構(gòu)成部分。
一個(gè)命題因子是“屬性-值偶對(duì)”的集合。每個(gè)單詞或者句子元素的句法語(yǔ)義信息都體現(xiàn)為相應(yīng)的屬性-值矩陣。例如,漢語(yǔ)“學(xué)生”這個(gè)單詞的屬性-值矩陣如圖10所示:
圖10 屬性-值矩陣
這樣的屬性-值矩陣就是單詞數(shù)據(jù)庫(kù)的“命題因子”。
左結(jié)合語(yǔ)法是按照自然語(yǔ)言的時(shí)間線性順序自左向右結(jié)合進(jìn)行分析與計(jì)算的方法。
具體來(lái)講,每個(gè)句子的第一個(gè)詞為整句分析過(guò)程中的第一個(gè)“句子起始部分”(sentence start),之后輸入下“一個(gè)詞”(next word),二者經(jīng)過(guò)計(jì)算構(gòu)成新的句子起始部分,再繼續(xù)與下一個(gè)輸入的單詞進(jìn)行組合計(jì)算。這樣不斷地進(jìn)行分析,直到句子結(jié)束或者出現(xiàn)語(yǔ)法錯(cuò)誤才終止。當(dāng)出現(xiàn)句法歧義或者詞匯歧義時(shí),左結(jié)合語(yǔ)法允許按照不同的推導(dǎo)路徑并行地繼續(xù)運(yùn)算。
Hausser將左結(jié)合語(yǔ)法與短語(yǔ)結(jié)構(gòu)語(yǔ)法進(jìn)行了對(duì)比分析。他指出,左結(jié)合語(yǔ)法與短語(yǔ)結(jié)構(gòu)語(yǔ)法是同質(zhì)的語(yǔ)言分析方法。它們之間的差異在于:短語(yǔ)結(jié)構(gòu)語(yǔ)法依據(jù)的是“替換原則”(the principle of substitution),而左結(jié)合語(yǔ)法依據(jù)的則是“可接續(xù)性原則”(the principle of continuation)。如果以“a, b, c…” 來(lái)代表語(yǔ)言符號(hào),以“+” 代表串連符,那么,左結(jié)合語(yǔ)法的計(jì)算過(guò)程可以表示如圖11:
圖11 左結(jié)合語(yǔ)法的計(jì)算過(guò)程
左結(jié)合語(yǔ)法在進(jìn)行推導(dǎo)時(shí),總是按照自左向右和自底向上的順序,沿著樹(shù)結(jié)構(gòu)的左側(cè),一步一步地把單詞逐一地結(jié)合起來(lái)的。樹(shù)結(jié)構(gòu)中的推導(dǎo)順序如圖12所示:
圖12 樹(shù)結(jié)構(gòu)中的推導(dǎo)順序
例如,英語(yǔ)句子“Every girl drunk water”(每一個(gè)女孩都喝了水)的推導(dǎo)順序如圖13所示:
圖13 推導(dǎo)順序示例
從這個(gè)樹(shù)結(jié)構(gòu)中可以看出,推導(dǎo)從左側(cè)開(kāi)始,首先把every與girl結(jié)合起來(lái),形成(np),然后把(np)與drank結(jié)合起來(lái),形成(np’v),最后把(np’v)與(sn)結(jié)合起來(lái),形成(v)。
整個(gè)推導(dǎo)過(guò)程遵循時(shí)間線性(time linearity)的原則。所謂“時(shí)間線性”,就是“以時(shí)間為序,與時(shí)間同向”(linear like time and in the direction of time),也就是說(shuō),在推導(dǎo)時(shí),要按照時(shí)間前后的順序進(jìn)行,要沿著時(shí)間的方向推進(jìn)。
顯而易見(jiàn),左結(jié)合語(yǔ)法是一種基于短語(yǔ)結(jié)構(gòu)語(yǔ)法的形式模型,同時(shí)又吸取了依存語(yǔ)法和數(shù)據(jù)庫(kù)語(yǔ)義學(xué)的一些優(yōu)點(diǎn),具有明顯的創(chuàng)新特色。這種獨(dú)具特色的形式模型,對(duì)于自然語(yǔ)言的自動(dòng)分析和自動(dòng)生成具有重要的指導(dǎo)意義。
馮志偉. 自然語(yǔ)言處理的形式模型[M]. 北京:中國(guó)科學(xué)技術(shù)大學(xué)出版社, 2010.
張 鈸. 自然語(yǔ)言處理的計(jì)算模型[J]. 中文信息學(xué)報(bào), 2007(3).
Hausser, R.AComputationalModelofNaturalLanguageCommunication:Interpretation,InferenceandProductioninDatabaseSemantics[M]. Berlin:Springer-Verlag, 2006.
Manaris, B.NaturalLanguageProcessing:AHuman-computerInteractionPerspective[J].AdvancesinComputers, 1999(47).
【責(zé)任編輯謝 群】
Left-AssociativeGrammarofRolandHausser
Feng Zhi-wei
(Hangzhou Normal University, Hangzhou 310036, China )
Based upon Surface Compositional Linear Internal Matching (SCLIM) and Database Semantics (DBS), this paper introduces the Left-Associative Grammar (LA) of Roland Hausser. LA plays important role in automatic analysis and generation in natural language processing.
Surface Compositional Linear Internal Matching; Database Semantics; Left-Associative Grammar
H043
A
1000-0100(2014)02-0030-5
2012-03-27