杜家利, 于屏方
(1. 廣東外語(yǔ)外貿(mào)大學(xué) 詞典中心,廣東 廣州 510420;2. 南京大學(xué) 外國(guó)語(yǔ)學(xué)院,江蘇 南京 210093;3. 廣東外語(yǔ)外貿(mào)大學(xué) 中國(guó)語(yǔ)言文化學(xué)院,廣東 廣州 510420;4. 中國(guó)社會(huì)科學(xué)院 語(yǔ)言研究所,北京 100732)
?
花園幽徑現(xiàn)象理解折返性的數(shù)據(jù)結(jié)構(gòu)分析
杜家利1,2, 于屏方3,4
(1. 廣東外語(yǔ)外貿(mào)大學(xué) 詞典中心,廣東 廣州 510420;2. 南京大學(xué) 外國(guó)語(yǔ)學(xué)院,江蘇 南京 210093;3. 廣東外語(yǔ)外貿(mào)大學(xué) 中國(guó)語(yǔ)言文化學(xué)院,廣東 廣州 510420;4. 中國(guó)社會(huì)科學(xué)院 語(yǔ)言研究所,北京 100732)
該文討論了花園幽徑現(xiàn)象(GPP)的數(shù)據(jù)結(jié)構(gòu)。GPP數(shù)據(jù)結(jié)構(gòu)呈現(xiàn)理解折返的認(rèn)知樹(shù)形結(jié)構(gòu),不同于語(yǔ)法前狀態(tài)的詞集合結(jié)構(gòu)、句子理解的語(yǔ)法線性結(jié)構(gòu)和語(yǔ)義匹配多對(duì)多的歧義圖狀結(jié)構(gòu)。GPP結(jié)構(gòu)的顯著性特征如下:(1)GPP理解初期,數(shù)據(jù)結(jié)構(gòu)呈線性特征;(2)GPP理解中期, 語(yǔ)義觸發(fā)點(diǎn)迫使原解碼模式被推翻,數(shù)據(jù)結(jié)構(gòu)表現(xiàn)為詞集合結(jié)構(gòu);(3)GPP理解末期, 行進(jìn)式錯(cuò)位導(dǎo)致回溯形成,解碼結(jié)構(gòu)最終呈現(xiàn)樹(shù)形結(jié)構(gòu);(4)GPP動(dòng)態(tài)解碼融合了除歧義圖狀結(jié)構(gòu)之外的兩種結(jié)構(gòu)特征,語(yǔ)義觸發(fā)語(yǔ)的激活產(chǎn)生額外認(rèn)知負(fù)擔(dān)。GPP樹(shù)形結(jié)構(gòu)與歧義圖狀結(jié)構(gòu)的不同從數(shù)據(jù)結(jié)構(gòu)角度證實(shí)了兩種語(yǔ)法現(xiàn)象的迥異,從而為計(jì)算語(yǔ)言學(xué)解讀GPP提供了理論支撐。
花園幽徑現(xiàn)象;數(shù)據(jù)結(jié)構(gòu);認(rèn)知;折返性;語(yǔ)義觸發(fā)
花園幽徑現(xiàn)象(Garden Path Phenomenon,GPP)是初始結(jié)構(gòu)被迫調(diào)整引發(fā)語(yǔ)義折返的特殊認(rèn)知現(xiàn)象,其得名于解碼過(guò)程中的迷途知返,就好像在花園中走入了一條不能通達(dá)的幽徑,徑盡路絕,絕而后返。其先期理解貌通而實(shí)不暢。在語(yǔ)義觸發(fā)點(diǎn)出現(xiàn)后,解碼者被迫返回到原來(lái)節(jié)點(diǎn)重新進(jìn)行結(jié)構(gòu)重組以實(shí)現(xiàn)解碼。此現(xiàn)象曾引發(fā)學(xué)者從語(yǔ)法[1-4]、語(yǔ)義[5-7]、語(yǔ)用[8-9]、心理[10-13]、信息處理[14-16]、認(rèn)知[17-21]等其他角度[22-25]進(jìn)行研究。GPP先揚(yáng)后抑的理解折返特性蘊(yùn)涵結(jié)構(gòu)性回溯,可借助數(shù)據(jù)結(jié)構(gòu)知識(shí)進(jìn)行解構(gòu)。
數(shù)據(jù)結(jié)構(gòu)是指系統(tǒng)中數(shù)據(jù)元素間不同關(guān)系的集合,包括離散關(guān)系的集合結(jié)構(gòu)、具有對(duì)應(yīng)關(guān)系的線性結(jié)構(gòu)、多對(duì)多并行的圖狀結(jié)構(gòu)、一對(duì)多單向解讀的樹(shù)形結(jié)構(gòu)。這4種數(shù)據(jù)結(jié)構(gòu)恰好和語(yǔ)法前狀態(tài)詞集合的解讀、句法關(guān)系的線性解讀、語(yǔ)義匹配多對(duì)多的歧義解讀、GPP回溯性結(jié)構(gòu)解讀具有對(duì)應(yīng)關(guān)系。本文借助數(shù)據(jù)結(jié)構(gòu)的不同形式來(lái)討論語(yǔ)言結(jié)構(gòu)的多樣性。為便于直觀有效地比較各種數(shù)據(jù)結(jié)構(gòu)解碼特點(diǎn),例句解讀采用美國(guó)斯坦福大學(xué)自然語(yǔ)言處理中心的Stanford Parser作為解析器(http://nlp.stanford.edu/software)。
非GPP的數(shù)據(jù)結(jié)構(gòu)包括詞集合結(jié)構(gòu)(圖1)、語(yǔ)法線性結(jié)構(gòu)和歧義圖狀結(jié)構(gòu)。前一類因不符合句法關(guān)系而屬于詞匯范疇,后兩類則屬于句法和語(yǔ)義范疇。
2.1 集合結(jié)構(gòu)分析
語(yǔ)法前狀態(tài)的詞集合結(jié)構(gòu)是指元素之間除了同屬于一個(gè)集合外,別無(wú)其他關(guān)系。
圖1 詞集合結(jié)構(gòu)
下面例句所形成的關(guān)系都是詞集合結(jié)構(gòu)關(guān)系,“*”表示此例句不被語(yǔ)法接受。我們利用Stanford Parser在線解析,并將具體代碼和解析結(jié)構(gòu)表示如下:
The/DT; new/JJ; singers/NNS; song/NN;old/JJ; women/NNS; boat/NN; building/NN; window/NN; sun/NN。
例1 *The new singers the song.
(ROOT
(NP
(NP (DT The) (JJ new) (NNS singers))
(NP (DT the) (NN song))))
例 2 *The old women the boat.
(ROOT
(NP
(NP (DT The) (JJ old) (NNS women))
(NP (DT the) (NN boat))))
例 3 *The building window the sun.
(ROOT
(NP
(NP (DT The) (NN building) (NN window))
(NP (DT the) (NN sun))))
如上所示,解碼均未成功,例句最終形成的都是NP結(jié)構(gòu)形式。此類離合結(jié)構(gòu)因不符合語(yǔ)法,處于無(wú)關(guān)聯(lián)的分散狀態(tài),不能形成正確有效的句法生成式。例1 [The new singers]NP+[the song]NP,例2 [The old women]NP+[the boat]NP,例3[The building window]NP+[the sun]NP各認(rèn)知元素相對(duì)獨(dú)立,難以形成完整語(yǔ)義鏈條。此集合結(jié)構(gòu)是語(yǔ)法前狀態(tài)的詞匯累積,不屬于句法范疇。
2.2 線性結(jié)構(gòu)分析
與詞集合狀態(tài)不同,語(yǔ)法線性結(jié)構(gòu)符合語(yǔ)言規(guī)范。句子理解過(guò)程中各認(rèn)知結(jié)構(gòu)元素形成一對(duì)一、如同線性排列的關(guān)系。
在句法分析時(shí),線性結(jié)構(gòu)中的成分具有排列的唯一性,同一元素在句法上不可能同時(shí)具有多種句法功能。如圖2所示,認(rèn)知解碼順序是1-2-3-4-5。集合結(jié)構(gòu)中的例句經(jīng)過(guò)調(diào)整可形成語(yǔ)法線性結(jié)構(gòu)。
圖2 語(yǔ)法線性結(jié)構(gòu)
The/DT; new/JJ; singers/NNS; sing/VBP; the/DT; songs/NNS; old/JJ; women/NNS; sail/VBP; a/DT; boat/NN; building/NN; window/NN; reflects/VBZ; sun/NN。
例 4 The new singers sing the songs.
(ROOT
(S
(NP (DT The) (JJ new) (NNS singers))
(VP (VBP sing)
(NP (DT the) (NNS songs)))))
例 5 The old women sail a boat.
(ROOT
(S
(NP (DT The) (JJ old) (NNS women))
(VP (VBP sail)
(NP (DT a) (NN boat)))))
例 6 The building window reflects the sun.
(ROOT
(S
(NP (DT The) (NN building) (NN window))
(VP (VBZ reflects)
(NP (DT the) (NN sun)))))
如上所示,例4—6所形成的解析結(jié)果均為表示句子終結(jié)的S, 這表明系統(tǒng)認(rèn)定這些句子符合語(yǔ)法條件且能夠成功解讀為完整句。例4中的[The new singers] NP+[[sing]VBP+[the songs]NP]VP,例5中的[The old women]NP+[[sail]VBP+[a boat]NP]VP, 例6中的[The building window] NP+[[reflects]VBZ+[the sun]NP]VP分別充當(dāng)各自的SVO句法功能,先后排列的認(rèn)知元素具有唯一的句法功能,各部分語(yǔ)法結(jié)構(gòu)和位置順序具有清晰性和唯一性,線性理解特征明顯。
我們可依據(jù)以上信息構(gòu)建一個(gè)擴(kuò)充轉(zhuǎn)移網(wǎng)絡(luò)(Augmented Transition Network,ATN)來(lái)解碼例4?!癙USH”表示下推至相關(guān)子網(wǎng)絡(luò);“POP”表示上托回上一級(jí)網(wǎng)絡(luò);“SETR”表示把相關(guān)信息送入寄存器;“I”表示解碼復(fù)雜度為一級(jí)且為初始級(jí)。“A-1”表示編號(hào)為1的弧(Arc)。
表1 線性結(jié)構(gòu)的解碼算法
按照表1和圖3(見(jiàn)下頁(yè)),例4解碼共需要16步,涉及10個(gè)相關(guān)的解碼弧,具體算法如下:
圖3 線性結(jié)構(gòu)的擴(kuò)充轉(zhuǎn)移網(wǎng)絡(luò)
1. Arc-1, 系統(tǒng)S主網(wǎng)絡(luò)試圖解析NP,根據(jù)知識(shí)庫(kù)信息將
2. Arc-4,NP子網(wǎng)絡(luò)啟動(dòng),解析Det
3. Arc-7,解析Adj
4. Arc-5,解析N
5. Arc-6,解析NP
6. Arc-1,S主網(wǎng)絡(luò)將NP結(jié)果整合后送入寄存器;
7. Arc-2,S主網(wǎng)絡(luò)嘗試解析VP并根據(jù)知識(shí)庫(kù)信息將VP
8. Arc-8,VP子網(wǎng)絡(luò)啟動(dòng),解析V
9. Arc-9,VP子網(wǎng)絡(luò)試圖解析NP
10. Arc-4,第三層NP子網(wǎng)絡(luò)啟動(dòng),解析Det
11. Arc-5,解析N
12. Arc-6,第三層NP子網(wǎng)絡(luò)NP
13. Arc-9,NP
14. Arc-10,VP子網(wǎng)絡(luò)成功解析
15. Arc-2,S主網(wǎng)絡(luò)將VP
16. Arc-3,S主網(wǎng)絡(luò)完成解析,將S
以上算法顯示,該句解碼共需要3個(gè)網(wǎng)絡(luò): S主網(wǎng)絡(luò)、NP子網(wǎng)絡(luò)和VP子網(wǎng)絡(luò)。其中NP子網(wǎng)絡(luò)分別在S主網(wǎng)絡(luò)和VP子網(wǎng)絡(luò)中兩次被調(diào)用,這使得該句解碼復(fù)雜度達(dá)到III級(jí)。
2.3 圖狀結(jié)構(gòu)分析
與語(yǔ)法線性結(jié)構(gòu)中各元素一一對(duì)應(yīng)關(guān)系不同,歧義圖狀結(jié)構(gòu)中的各元素可以是多多相對(duì)的關(guān)系,無(wú)論選擇哪種語(yǔ)義對(duì)應(yīng)關(guān)系均能實(shí)現(xiàn)認(rèn)知解讀,也就是說(shuō)認(rèn)知結(jié)構(gòu)中的認(rèn)知元素在語(yǔ)義匹配多對(duì)多的歧義圖狀結(jié)構(gòu)中具有多對(duì)多的語(yǔ)義對(duì)應(yīng)關(guān)系。結(jié)構(gòu)如圖4所示。
圖4 歧義圖狀結(jié)構(gòu)
圖中的認(rèn)知元素具有多重釋義,無(wú)論節(jié)點(diǎn)擴(kuò)展方向指向哪里均可實(shí)現(xiàn)認(rèn)知解碼,只是意義表達(dá)不同而已。請(qǐng)見(jiàn)例7。
例7 Failing student looked hard.
在Stanford Parser中,概率高低是取詞依據(jù),所以在所有圖狀結(jié)構(gòu)中,概率最高的詞義將得到凸現(xiàn)。
(ROOT
(S
(NP (NN Failing) (NN student))
(VP (VBD looked)
(ADJP (JJ hard)))))
如上所示,Stanford Parser默認(rèn)
G={Vn,Vt,S,P}
Vn={S,NP,VP,Adj,Grd,V,N,Adv}
Vt={failing, student, looked, hard}
S=S
P:
表2 多維語(yǔ)義選項(xiàng)的歧義圖狀結(jié)構(gòu)
本句的理解具有多重性,主要體現(xiàn)在failing和hard的意義多維性上。Failing可以作為形容詞(Adj)也可以作為動(dòng)名詞(Grd)兩種狀態(tài)存在,hard也可以具有形容詞(Adj)和副詞(Adv)兩種狀態(tài)。所以,兩個(gè)不確定的語(yǔ)法點(diǎn)相互排列組合就形成4種意義完全不同的解釋。這4個(gè)句子S1/S2/S3/S4的狀態(tài)可以通過(guò)下列語(yǔ)法進(jìn)行分析。
如上面語(yǔ)法所示,形容詞和名詞可以形成名詞詞組,F(xiàn)ailing (adj) student 符合該語(yǔ)法規(guī)則因此可以生成正確的NP生成式。在與具有歧義的hard進(jìn)行匹配時(shí),hard的形容詞狀態(tài)和副詞狀態(tài)的雙重語(yǔ)法特性形成了能構(gòu)筑兩個(gè)不同意義的解碼程序。S1的解碼程序是f-h-b-i-f-d-a。S2的解碼程序是f-h-b-i-j-e-a。兩程序的不同來(lái)源于對(duì)hard詞性選擇的不同。兩種選擇都符合解碼條件,只是生成的句義不同: “落榜生看來(lái)是難的”(S1);“落榜生似乎很努力”(S2)。
同樣,F(xiàn)ailing (Grd) student中,動(dòng)名詞Grd和名詞N可以形成名詞詞組NP。這樣作為動(dòng)名詞用法的failing與具有形容詞和副詞雙重語(yǔ)法功能的hard便形成兩個(gè)新的句義,其各自的解碼途徑也迥異。S3的解碼程序?yàn)間-h-c-i-f-d-a, 意為“讓學(xué)生落榜看來(lái)是難的”。S4的解碼程序?yàn)間-h-c-i-j-e-a, 意為“讓學(xué)生落榜這件事似乎干得很努力”。
由上面分析可知,在上述的CFG語(yǔ)法中,failing具有(f)和(g)的雙重語(yǔ)法功能,因此NP生成可參照(b)和(c)的規(guī)則,具有歧義性。hard具有(f)和(j)的雙重語(yǔ)法功能,VP生成也具有歧義: 既可以參照(d)也可以參照(e)的規(guī)則。這種雙歧義的搭配就形成了四種不同句義解讀。
詞匯語(yǔ)法功能的多樣性和生成規(guī)則的非唯一性決定了語(yǔ)法生成式的多樣性,導(dǎo)致歧義語(yǔ)義產(chǎn)生。歧義特性在數(shù)據(jù)結(jié)構(gòu)上對(duì)應(yīng)的是多對(duì)多的圖狀結(jié)構(gòu)(圖5)。
圖5 “Failing student looked hard”的數(shù)據(jù)結(jié)構(gòu)
為了更直觀地分析歧義產(chǎn)生的圖狀結(jié)構(gòu),可構(gòu)建一個(gè)ATN來(lái)實(shí)例分析語(yǔ)義多維性。
該網(wǎng)絡(luò)由主網(wǎng)絡(luò)S、子網(wǎng)絡(luò)NP和VP組成,共涉及11個(gè)轉(zhuǎn)移弧。歧義出現(xiàn)在弧4/弧5,弧8/弧10。由此產(chǎn)生的解碼算法列表如下:
表3 圖狀結(jié)構(gòu)的解碼算法
圖6 圖狀結(jié)構(gòu)擴(kuò)充轉(zhuǎn)移網(wǎng)絡(luò)
算法共由11步組成,在不考慮概率的情形下生成2×2的矩陣,對(duì)應(yīng)4種不同語(yǔ)義解釋。兩個(gè)歧義點(diǎn)分別出現(xiàn)在第2步對(duì)Adj
1. Arc-1, 主網(wǎng)絡(luò)首先對(duì)NP解碼,根據(jù)知識(shí)庫(kù)信息將
2. Arc-4/ Arc-5, NP子網(wǎng)絡(luò)啟動(dòng),CFG語(yǔ)法中
3. Arc-6,將
4. Arc-7, NP
5. Arc-1,主網(wǎng)絡(luò)將返回的NP
6. Arc-2,主網(wǎng)絡(luò)開(kāi)始解碼VP
7. Arc-9,VP子網(wǎng)絡(luò)啟動(dòng),V
8. Arc-8/ Arc-10, 第二個(gè)歧義點(diǎn)出現(xiàn),子網(wǎng)絡(luò)不論選擇Arc-8或者Arc-10均能通過(guò)CFG語(yǔ)法規(guī)則,遂產(chǎn)生兩個(gè)不同的語(yǔ)義取向;
9. Arc-11, VP
10. Arc-2, 主網(wǎng)絡(luò)將VP
11. Arc-3, 寄存器中第一個(gè)和第二個(gè)歧義點(diǎn)排列組合產(chǎn)生2×2的語(yǔ)義矩陣,可成功生成四種解碼結(jié)果;系統(tǒng)解碼成功。
以上分析可知,語(yǔ)法線性結(jié)構(gòu)和歧義圖狀結(jié)構(gòu)的非GPP結(jié)構(gòu)都具有非折返的單向性特點(diǎn),系統(tǒng)不需要回溯,符合語(yǔ)法的選擇都可以解碼成功,不存在被迫中止的休克現(xiàn)象。
GPP結(jié)構(gòu)與前面3種結(jié)構(gòu)既有相同之處也有不同之處,這些異同分別出現(xiàn)在解碼的不同階段,最終形成的數(shù)據(jù)結(jié)構(gòu)表現(xiàn)為樹(shù)形結(jié)構(gòu)。
GPP理解折返性的樹(shù)形結(jié)構(gòu)是指結(jié)構(gòu)中的元素存在一對(duì)多的數(shù)據(jù)關(guān)系,當(dāng)其中的一種關(guān)系作為認(rèn)知原型進(jìn)行缺省解讀時(shí),就好像由根向節(jié)點(diǎn)進(jìn)行擴(kuò)展,失敗后的解碼模式被迫順原路返回到根,再順著下一個(gè)節(jié)點(diǎn)進(jìn)行解讀,直到結(jié)構(gòu)中的元素得到正確匹配。其結(jié)構(gòu)如圖7所示。
圖7 理解折返的樹(shù)形結(jié)構(gòu)
在圖7中,設(shè)定根元素具有一對(duì)三的認(rèn)知關(guān)系,而且正確解讀的認(rèn)知項(xiàng)是最右側(cè)下方的10號(hào),那么解碼順序是: 1-2-3-3-2-1-4-5-6-6-5-4-1-7-8-9-10。由此可見(jiàn)GPP認(rèn)知解碼具有折返性: “3-2-1”和“6-5-4-1”的出現(xiàn)表明在解碼完成前經(jīng)歷了兩次回溯性折返。這種對(duì)前期理解否定之否定的折返性過(guò)程具有程序上的可驗(yàn)證性。從數(shù)據(jù)結(jié)構(gòu)角度分析,解碼初期(即1-2-3和1-4-5-6)具有線性結(jié)構(gòu)特征,系統(tǒng)解碼按照知識(shí)庫(kù)中原型信息(即概率較高信息)順序解讀;解碼中期(即3-2-1和6-5-4-1)具有集合結(jié)構(gòu)特征。系統(tǒng)在語(yǔ)義觸發(fā)點(diǎn)(即3和6)出現(xiàn)后,原來(lái)的解碼模式被打破,順序解讀的結(jié)果在寄存器中不再是按照語(yǔ)法規(guī)則排序的線性結(jié)構(gòu)而是呈現(xiàn)游離的集合狀態(tài);解碼后期,系統(tǒng)參照回溯信息重新調(diào)整解碼策略,放棄原型的高概率解碼模式,啟用低概率信息,解碼成功的數(shù)據(jù)結(jié)構(gòu)與前期解碼結(jié)構(gòu)共同組成樹(shù)形數(shù)據(jù)結(jié)構(gòu)。下面以實(shí)例解讀GP句(Garden Path Sentence)的數(shù)據(jù)結(jié)構(gòu)分析。
例8 The new record the song.
3.1 GPP解碼初期的線性結(jié)構(gòu)分析
在Stanford Parser中,解析器是按照概率高低進(jìn)行解碼的,高概率的原型信息首先被系統(tǒng)解讀。具體信息如下:
The/DT; new/JJ; record/NN; song/NN;
(ROOT
(NP
(NP (DT The) (JJ new) (NN record))
(NP (DT the) (NN song))))
解碼初期,系統(tǒng)默認(rèn)record為名詞,對(duì)NP
3.2 GPP解碼中期的集合結(jié)構(gòu)分析
解碼中期,線性結(jié)構(gòu)NP
無(wú)序集合結(jié)構(gòu)向再次有序的線性結(jié)構(gòu)(后線性結(jié)構(gòu))的過(guò)渡,使系統(tǒng)產(chǎn)生回溯。
3.3 GPP解碼末期的樹(shù)形結(jié)構(gòu)分析
解碼末期,
G={Vn,Vt,S,P}
Vn={S,NP,VP,Det,Adj,V,N}
Vt={the new record song}
S=S
P:
Processing Procedure(Bottom-Up)
1: The new record the song
SUCCESS
解碼可按照樹(shù)形圖結(jié)構(gòu)進(jìn)行解釋,其正確的認(rèn)知順序?yàn)椋?1-2(f)-3(g)-4(h)-5(d)-6(f)-7(h)-8(c)-8(c)-7(h)-6(f)-5(d)-4(h)-3(g)-9(g)-10(b)-11(i)-12(f)-13(h)-14(c)-15(e)-16(a)。這樣,在規(guī)則3(g)-9(g)中,因?yàn)樯婕皉ecord名詞和動(dòng)詞同形的選擇而成為認(rèn)知折返的根,由其擴(kuò)展出的樹(shù)形節(jié)點(diǎn)包括名詞解釋的節(jié)點(diǎn)3(g)-4(h)-5(d)-6(f)-7(h)-8(c)和動(dòng)詞解釋節(jié)點(diǎn)9(g)-10(b)-11(i)-12(f)-13(h)-14(c)-15(e)-16(a)。兩者在形成過(guò)程中的數(shù)據(jù)結(jié)構(gòu)都是線性結(jié)構(gòu),如圖8所示。
圖8 “The new record the song”的數(shù)據(jù)結(jié)構(gòu)
8(c)不能形成正確的句法生成式,作為線性結(jié)構(gòu)的終端,該點(diǎn)成為認(rèn)知頓悟的語(yǔ)義觸發(fā)點(diǎn)。由8(c)
向3(g)的逐步回溯,即8(c)-7(h)-6(f)-5(d)-4(h)-3(g)就打破原來(lái)生成的線性結(jié)構(gòu),并游離出句子元素,這個(gè)過(guò)程產(chǎn)生了GPP的理解折返性。
游離元素
圖9 樹(shù)形結(jié)構(gòu)的擴(kuò)充轉(zhuǎn)移網(wǎng)絡(luò)
例8樹(shù)形結(jié)構(gòu)ATN包括S主網(wǎng)絡(luò)、NP子網(wǎng)絡(luò)和VP子網(wǎng)絡(luò),涉及11個(gè)弧。以理解折返性回溯(backtracking)為主要特征的解碼算法表如表4所示。
表4 樹(shù)形結(jié)構(gòu)的解碼算法
續(xù)表
ATN解碼算法共包括回溯在內(nèi)的22步。第1—7步,形成的是基于高概率解碼的線性結(jié)構(gòu)?;厮莩霈F(xiàn)時(shí),原結(jié)構(gòu)被打破,游離的句子元素構(gòu)成集合結(jié)構(gòu)。第8—22步,基于低概率解碼的后線性結(jié)構(gòu)形成。綜合來(lái)說(shuō),例8中理解折返的動(dòng)態(tài)數(shù)據(jù)結(jié)構(gòu)是蘊(yùn)涵“線性結(jié)構(gòu)——集合結(jié)構(gòu)——后線性結(jié)構(gòu)”的樹(shù)形結(jié)構(gòu)軌跡圖。
從語(yǔ)法理論角度分析,歧義句和花園幽徑句都涉及結(jié)構(gòu)中部分成分的局部歧義。前者允許多種結(jié)構(gòu)勝出而不折返;后者往往是低頻次選結(jié)構(gòu)顛覆高頻優(yōu)選結(jié)構(gòu)后在某個(gè)解讀不通的觸發(fā)點(diǎn)上折返后勝出,具有排他性。
從線性結(jié)構(gòu)、圖狀結(jié)構(gòu)和樹(shù)形結(jié)構(gòu)的解碼算法可以看出: (1)從復(fù)雜度角度看,歧義句解碼復(fù)雜度是II級(jí),普通句和花園幽徑句的復(fù)雜度是III級(jí),這說(shuō)明歧義句具有多重理解的可能,不論哪種解碼方式均可獲得成功,所以,單純從句法角度來(lái)說(shuō)解碼較為簡(jiǎn)單;(2)從解碼算法角度看,歧義句、普通句和花園幽徑句涉及算法步驟分別是11、16和22,后兩者雖具有相同的復(fù)雜度,但后者解碼涉及的算法步驟較前者多,這說(shuō)明花園幽徑句因蘊(yùn)涵理解折返特性,解碼最困難。
花園幽徑現(xiàn)象是具有語(yǔ)義觸發(fā)機(jī)制的認(rèn)知現(xiàn)象,理解初期產(chǎn)生行進(jìn)式錯(cuò)位并適時(shí)折返,形成解碼模式的否定之否定?;▓@幽徑現(xiàn)象的認(rèn)知數(shù)據(jù)結(jié)構(gòu),不同于語(yǔ)法前狀態(tài)的詞集合結(jié)構(gòu)、句子理解的語(yǔ)法線性結(jié)構(gòu)和語(yǔ)義匹配多對(duì)多的歧義圖狀結(jié)構(gòu),是具有理解折返的認(rèn)知樹(shù)形結(jié)構(gòu)。其動(dòng)態(tài)過(guò)程蘊(yùn)涵“線性結(jié)構(gòu)——集合結(jié)構(gòu)——后線性結(jié)構(gòu)”。通過(guò)對(duì)GPP程序分析和歧義多對(duì)多認(rèn)知匹配的對(duì)比,本文以基于ATN的實(shí)例驗(yàn)證了GPP的非歧義性在于其回溯性結(jié)構(gòu)的存在。
致謝 感謝英國(guó)伯明翰大學(xué)Wolfgang Teubert教授和教育部語(yǔ)言文字應(yīng)用所博士生導(dǎo)師馮志偉教授的指正。
[1] Bever T G. The cognitive basis for linguistic structures[A]//Hayes, J. R. (ed.), Cognition and the Development of Language. New York: John Wiley and Sons, 1970: 279-352.
[2] Pritchett B L. Garden path phenomena and the grammatical basis of language processing[J]. Language, 1988,64: 539-576.
[3] H?ussler J, Bader M. The assembly and disassembly of determiner phrases: Minimality is needed, but not sufficient[J]. Lingua, 2009, 119(10): 1560-1580.
[4] Malsburg T, Vasishth S. What is the scanpath signature of syntactic reanalysis?[J].Journal of Memory and Language, 2011, 65(2): 109-127.
[5] Jin Y H. Semantic analysis of Chinese garden-path sentences[C]//Proceedings of the Fifth SIGHAN Workshop on Chinese Language Processing, 2006,7: 33-39.
[6] Christianson K, Hollingworth A, Halliwell J, et al. Thematic roles assigned along the garden path linger[J]. Cognitive Psychology, 2001,42: 368-407.
[7] Wilson M P, Garnsey S M. Making simple sentences hard: Verb bias effects in simple direct object sentences[J]. Journal of Memory and Language, 2009, 60(3): 368-392.
[8] Foss D J, Jenkins C M. Some effects of context on the comprehension of ambiguous sentences[J]. Journal of Verbal Learning and Verbal Behavior, 1973,12: 577.
[9] Bailey K G D, Ferreira F. Disfluencies affect the parsing of garden-path sentences[J]. Journal of Memory and Language, 2003,49: 183-200.
[10] Bader M, Haussler J. Resolving number ambiguities during language comprehension[J]. Journal of Memory and Language, 2009,61(3): 352-373.
[11] Patson N D, et al. Lingering misinterpretations in garden-path sentences: Evidence from a paraphrasing task[J]. Journal of Experimental Psychology: Learning, Memory, and Cognition, 2009, 35(1), 280-285.
[12] 杜家利,于屏方. 花園幽徑現(xiàn)象頓悟性的認(rèn)知解讀[J]. 外語(yǔ)與外語(yǔ)教學(xué),2011,6: 26-29.
[13] Choi Y, Trueswell J C. Children’s (in)ability to recover from garden paths in a verb-final language: Evidence for developing control in sentence processing[J]. Journal of Experimental Child Psychology, 2010, 106(1):41-61.
[14] 馮志偉. 花園幽徑句的自動(dòng)分析算法[J]. 當(dāng)代語(yǔ)言學(xué), 2003,4: 339-349.
[15] Yu P F, Du J L. Automatic analysis of textual garden path phenomenon: A computational perspective[J]. Journal of Communication and Computer, 2008, 5 (10): 58-65.
[16] 杜家利, 于屏方. 花園路徑現(xiàn)象認(rèn)知解讀的程序化特性分析[J]. 計(jì)算機(jī)工程與應(yīng)用, 2011,47 (21): 5-9.
[17] Malaia E, Wilbur R B, Weber-Fox C. ERP evidence for telicity effects on syntactic processing in garden-path sentences[J]. Brain and Language, 2009, 108(3):145-158.
[18] McMurray B, Tanenhaus M K, Aslin R N. Within-category VOT affects recovery from "lexical" garden-paths: Evidence against phoneme-level inhibition[J]. Journal of Memory and Language, 2009, 60(1): 65-91.
[19] O’Rourke P L, Petten C V. Morphological agreement at a distance: Dissociation between early and late components of the event-related brain potential[J]. Brain Research, 2011, 1392(5): 62-79.
[20] Staub A. Eye movements and processing difficulty in object relative clauses[J]. Cognition, 2010, 116(1): 71-86.
[21] Christensen K R. Syntactic reconstruction and reanalysis, semantic dead ends, and prefrontal cortex[J]. Brain and Cognition, 2010, 73(1): 41-50.
[22] 于屏方, 杜家利. 良構(gòu)子串表在自然語(yǔ)言處理中的程序化應(yīng)用: 以花園幽徑句為例[J]. 中文信息學(xué)報(bào), 2012, 26(5): 107-113.
[23] 宋艷雪, 張紹武, 林鴻飛. 基于語(yǔ)境歧義詞的句子情感傾向性分析[J]. 中文信息學(xué)報(bào), 2012, 26(3): 38-43.
[24] 張仰森, 黃改娟, 蘇文杰. 基于隱最大熵原理的漢語(yǔ)詞義消歧方法[J]. 中文信息學(xué)報(bào), 2012, 26(3): 72-78.
[25] 張祿彭,易綿竹,周云. 中文歧義研究25年——以《中文信息學(xué)報(bào)》論文為例[J]. 中文信息學(xué)報(bào),2012, 26(4): 73-84.
Towards Data Structure Analysis of Half-Returned Feature of Understanding Garden Path Phenomenon
DU Jiali1,2, YU Pingfang3,4
(1. Lexicographical Research Center, Guangdong University of Foreign Studies, Guangzhou, Guangdong 510420, China;2. School of Foreign Studies, Nanjing University, Nanjing, Jiangsu 210093, China;3. Faculty of Chinese Language and Culture, Guangdong University of Foreign Studies, Guangzhou, Guangdong 510420, China;4. Institute of Linguistics, Chinese Academy of Social Sciences, Beijing 100732, China)
This paper discusses data structure of garden path phenomenon (GPP). The data structure of GPP belongs to cognitive tree-liked structure rather than the other structures, e.g. word set structure in pre-grammar condition, linear grammatical structure in syntactic understanding, and ambiguous map-liked structure in semantic-matched multiple cognition. The distinctive structure features of GPP include. (1) In the early understanding, the data structure of GPP shows a linear feature; (2) in the medium-term understanding, semantic trigger point brings the breakdown of the original model, and the data structure of GPP is a word set structure; (3) in the late understanding, processing breakdown results in backtracking and GPP creates a tree-liked data structure at the end; (4)the dynamic understanding of GPP is the integration of two structures except map-liked one, and the activation of semantic trigger point brings additional cognitive load. The difference between tree-liked data structure of GPP and map-liked data structure of ambiguity reflects the dissimilarity between these two syntactic phenomena from the perspective of data structure, which provides the theoretical support for computational linguistics to interpret GPP.
garden path phenomenon; data structure; cognition; half-returned feature; semantic trigger
杜家利(1971—),副教授,主要研究領(lǐng)域?yàn)橛?jì)算詞典學(xué),計(jì)算語(yǔ)言學(xué),句法學(xué)和術(shù)語(yǔ)學(xué)。E?mail:dujiali68@126.com于屏方(1971—),教授,主要研究領(lǐng)域?yàn)樵~典學(xué)和漢外語(yǔ)言對(duì)比。E?mail:yupingfang68@126.com
1003-0077(2015)01-0028-10
2013-01-25 定稿日期: 2013-03-18
國(guó)家社科后期資助項(xiàng)目(12FYY019; 12FYY021);廣東外語(yǔ)外貿(mào)大學(xué)人才引進(jìn)項(xiàng)目(399-X3413012)
TP391
A