国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

語料庫中的隱喻標(biāo)注研究?

2018-10-12 03:45柳超健王軍曹靈美
外語學(xué)刊 2018年2期
關(guān)鍵詞:語料語料庫隱喻

柳超健 王軍 曹靈美

(蘇州大學(xué),蘇州215006/浙江傳媒學(xué)院,杭州310018;蘇州大學(xué),蘇州215006)

提 要:近年來,隨著認知隱喻研究的“實證轉(zhuǎn)向”與“社會轉(zhuǎn)向”,學(xué)界開始不斷關(guān)注語料庫隱喻研究中的兩個基本問題:在方法論層面,創(chuàng)新語料庫中隱喻的檢索與識別方法;在語義學(xué)層面,挖掘隱喻使用的觸發(fā)機制與隱喻選擇的影響因素。然而,當(dāng)前研究尚缺乏或極少探究語料庫中的隱喻標(biāo)注問題。基于目前國內(nèi)外自然語言處理中隱喻識別的相關(guān)研究和諸多具有代表性的隱喻語料庫標(biāo)注實踐,本研究系統(tǒng)提出隱喻標(biāo)注的原則與內(nèi)容,并深入探討其標(biāo)注的模式與方法,以供國內(nèi)外學(xué)者在認知隱喻研究與隱喻語料庫建設(shè)中參考。

1 引言

隱喻標(biāo)注作為隱喻語料庫建設(shè)與研究的重要組成部分,大體上繼承通用語料庫中標(biāo)注的特點與功能。然而,隱喻是人類對抽象概念進行推理的基本機制與認知手段,與其他語言形式相比,蘊含更多隱性或相對不突顯的信息。由于隱喻語言本身及其概念結(jié)構(gòu)的特殊性與復(fù)雜性,隱喻標(biāo)注也必將呈現(xiàn)出諸多不同特性。若將Lakoff等收集的重要隱喻目錄(Master Metaphor List)視為隱喻標(biāo)注研究的起點,經(jīng)過30多年的發(fā)展,它主要有以下特點:研究方法基本能夠相互傳承與借鑒;語料收集覆蓋度高;重視隱喻概念的界定問題。但也存在以下問題:尚未形成科學(xué)、統(tǒng)一且易操作的隱喻識別程序及方法;標(biāo)注內(nèi)容隨意、廣度模糊、深度不足;標(biāo)注模式差異顯著,各自為陣。因此,有效解決上述問題對隱喻標(biāo)注研究意義重大,同時也將對基于語料庫的相關(guān)研究產(chǎn)生直接影響。鑒于此,本研究主要從標(biāo)注原則、標(biāo)注內(nèi)容、標(biāo)注模式與標(biāo)注方法4個層面探討語料庫中的隱喻標(biāo)注問題,以期為隱喻標(biāo)注研究提供相關(guān)借鑒。

2 隱喻標(biāo)注的原則

隱喻標(biāo)注的原則是確保隱喻標(biāo)注過程科學(xué)與規(guī)范的前提,并對隱喻研究的各個層面有重要的制約作用。本研究基于Leech(1993:275)在通用語料庫中提出的標(biāo)注原則,并結(jié)合目前國內(nèi)外自然語言處理中隱喻識別的相關(guān)研究及諸多具有代表性的隱喻標(biāo)注實踐,系統(tǒng)提出隱喻標(biāo)注的5個基本原則:強制性、選擇性、準(zhǔn)確性、一致性和折衷性。早期相關(guān)研究已對語料標(biāo)注的外部信息和結(jié)構(gòu)特征作過較為詳實的論述(Leech 1993,1997;何婷婷2003;Sinclair 2007)。此外,從現(xiàn)代計算機科學(xué)的發(fā)展視角看,Leech在標(biāo)注原則中提到的語料處理技術(shù)已不再是難點問題。因此,本研究提出的原則主要針對隱喻標(biāo)注的內(nèi)容,暫不探討標(biāo)注中如何利用計算機對隱喻語料進行數(shù)據(jù)保存等技術(shù)性問題。

(1)強制性原則。該原則主要針對隱喻標(biāo)注的廣度而言,即,隱喻標(biāo)注必須涵蓋4個基本要素(隱喻性詞匯、源域、目標(biāo)域和概念映射)。從理論上講,隱喻標(biāo)注至少可以從詞匯、語法、語義、語用及語篇等層面進行。然而,語料的標(biāo)注和語料的利用始終是一對矛盾體。從用戶的角度來看,語料標(biāo)注越詳盡越好,而標(biāo)注者則還須考慮標(biāo)注的可行性。因此,任何標(biāo)注模式都是在二者之間求得的一種妥協(xié)的產(chǎn)物(丁信善1998:8)。從目前國內(nèi)外語料庫隱喻標(biāo)注的實踐來看,多數(shù)研究在方法上雖能相互傳承與借鑒,但在標(biāo)注內(nèi)容方面各自為陣,存在較大的隨意性。此外,隱喻具有不同層次的抽象性(Ritchie 2003)。如果語料標(biāo)注無法明確隱喻性詞匯、源域、目標(biāo)域以及相應(yīng)的概念映射,隱喻的識解必將因時、因地、因人而產(chǎn)生較大的差異。若單論此,對隱喻的基本要素進行標(biāo)注就顯得尤為重要。

(2)選擇性原則。隱喻語料庫既可隸屬能夠代表某種語言全貌而建成的通用語料庫,也可以是出于某種特定的研究目的而開發(fā)的專用語料庫。顯然,研究目的不同將導(dǎo)致兩種類型的語料庫在標(biāo)注方面產(chǎn)生差異?;诖?,在遵循強制性原則的基礎(chǔ)上,可適當(dāng)根據(jù)語料庫的研究目的對隱喻語言進行不同層面的選擇性標(biāo)注,如表1所示。

(3)準(zhǔn)確性原則。與隱喻的其他話題相比,學(xué)界對隱喻識別的關(guān)注步伐略晚,但它確屬隱喻研究中一個常被忽略的問題。通過文獻梳理,我們發(fā)現(xiàn)目前研究中對該話題并未達成概念上的統(tǒng)一。其中最根本的問題在于隱喻識別到底應(yīng)該識別什么,是隱喻性詞匯還是源域與目標(biāo)域,又或是概念映射?是否應(yīng)該嚴格區(qū)分隱喻在詞匯層面和概念層面的識別?此外,概念隱喻理論強調(diào)隱喻的概念性本質(zhì)特征,但Lakoff在其諸多論著中始終未談及如何從紛繁的語言隱喻中構(gòu)建或提取概念隱喻的方法或原則。這將直接導(dǎo)致各家在隱喻映射問題上觀點迥異,眾說紛紜。因此,隱喻標(biāo)注不僅需要明確隱喻識別的概念,更要制定或選取一套清晰、科學(xué)且易操作的識別方法。

表1 隱喻的選擇性標(biāo)注內(nèi)容

(4)一致性原則。在隱喻標(biāo)注中,針對同一隱喻概念,不論是語義層面的隱喻規(guī)約性,還是語用層面的隱喻功能,標(biāo)注者之間都應(yīng)達到某種程度上的一致性。因此,在隱喻標(biāo)注之前,不僅要嚴格制定標(biāo)注者的選擇標(biāo)準(zhǔn),還要切實提出或選取一套科學(xué)、嚴密的隱喻標(biāo)注模式和流程,盡可能縮減標(biāo)注者之間的差異,從而確保隱喻標(biāo)注的信度與效度。對于標(biāo)注結(jié)果仍有疑慮的標(biāo)注案例,必須通過小組討論的方式加以解決。若存在無法解決的案例,也應(yīng)明確告知用戶標(biāo)注的置信區(qū)間等相關(guān)信息。

(5)折衷性原則。 Leech(1993:275)認為語料庫標(biāo)注方案不具有真值性,不存在所謂的“標(biāo)準(zhǔn)”模式。因此,任何標(biāo)注方案都不能作為第一或唯一標(biāo)準(zhǔn)。即使存在,也只能通過大量實踐和比較才能得到。鑒于目前學(xué)界尚未制定標(biāo)準(zhǔn)、統(tǒng)一的通用語料標(biāo)注賦碼與規(guī)范,標(biāo)注過程應(yīng)注重實用性并最大限度地為語料庫使用者提供便利。在增強語料使用靈活性的同時,還要盡量選用學(xué)界普遍接受的中立方案,這將有利于語料庫的資源共享。當(dāng)前,國內(nèi)外隱喻語料庫建設(shè)單位在選擇語料標(biāo)注賦碼時也存在上述問題。因此,隱喻標(biāo)注也應(yīng)綜合考察與研究各種標(biāo)注方案,取長補短,并結(jié)合自身的研究目的,制定一種較為折衷的標(biāo)注方案。

3 隱喻標(biāo)注的模式

可擴展性標(biāo)注語言(Extensible Markup Lan?guage,XML)是目前最常見的通用語言標(biāo)注格式。與SGML等早期模式相比,XML不使用預(yù)設(shè)標(biāo)簽,也不注重文本格式的呈現(xiàn),但更關(guān)注對數(shù)據(jù)結(jié)構(gòu)的定義與描寫。因此,用戶可基于不同需求來定義不同領(lǐng)域內(nèi)的標(biāo)記語言。整體而言,XML可彌補HTML的缺陷與不足,具有更強大的文件傳送與處理能力??梢哉f,XML的自身特點與隱喻標(biāo)注的本質(zhì)存在某種程度上的契合。本研究選取XML作為標(biāo)注語言主要基于以下3項既定事實。

(1)XML遵循特定的語法規(guī)則,能夠確保每個文檔形式的完整性。比如,XML的基本結(jié)構(gòu)是層級性的成對標(biāo)簽,即,每個元素必須包含起始標(biāo)簽(start tag)與結(jié)束標(biāo)簽(end tag),并注明屬性及其數(shù)值。這種強制性的語法規(guī)則在很大程度上能夠簡化XML相關(guān)應(yīng)用程序的開發(fā),而不必參照DTD對文件結(jié)構(gòu)進行確認。因此,XML可使隱喻語料更嚴謹,語料觀察更直觀,語料檢索更方便,從而能夠最大限度地確保隱喻標(biāo)注的系統(tǒng)性和完整性。

(2)XML雖有嚴格的定義方法和規(guī)則集,但其文檔建立在基本內(nèi)嵌(nested)結(jié)構(gòu)中某個核心集的基礎(chǔ)之上。當(dāng)語料庫因為添加不同層級的信息而使原來的結(jié)構(gòu)變得復(fù)雜時,這些基本結(jié)構(gòu)就可代表復(fù)雜的信息集合,而不需要改變自身結(jié)構(gòu)。從而,標(biāo)注者需要為內(nèi)部結(jié)構(gòu)的復(fù)雜化程度付出的努力就更少。隱喻的核心內(nèi)容是源域到目標(biāo)域的跨域映射過程。在隱喻標(biāo)注過程中,標(biāo)注者完全可以標(biāo)注隱喻的基本要素為基礎(chǔ),并依據(jù)不同程度的研究目的,選擇性地進行層級標(biāo)注。

(3)XML具有可擴展性。首先,除了XML模式中定義的數(shù)據(jù)類型之外,開發(fā)者可自行創(chuàng)建DTD,并應(yīng)用于多種“可擴展”的標(biāo)志集。其次,通過使用某些附加標(biāo)準(zhǔn),可對XML的核心功能進行擴展。比如,增加樣式、鏈接和參照能力。XML的擴展內(nèi)容為其他可能產(chǎn)生的標(biāo)準(zhǔn)提供堅實的基礎(chǔ)(李薇等1999:24)。不可否認,隱喻的識別、理解與生成是一個動態(tài)變化發(fā)展的過程,因此,在語料標(biāo)注中能夠表征其形式的語言格式也必然不是一成不變的。XML恰好為隱喻標(biāo)注提供一個表征結(jié)構(gòu)化信息的方式,并允許用戶自定義任意標(biāo)記形式,以滿足或改變不同標(biāo)注內(nèi)容的需求。這就突破以往HTML只可描述文本格式的束縛,而且至少在數(shù)量方面極大提高隱喻標(biāo)注的效率。

4 隱喻標(biāo)注的方法

目前現(xiàn)有的語料標(biāo)注方法主要包括人工標(biāo)注、人工標(biāo)注+機器輔助、機器標(biāo)注+人工輔助以及機器全自動標(biāo)注。從宏觀上講,隱喻標(biāo)注可分為隱喻識別與隱喻標(biāo)記兩個過程。隱喻識別是隱喻標(biāo)記的基礎(chǔ),其效度將直接影響隱喻標(biāo)記的質(zhì)量。因此,隱喻標(biāo)注的本質(zhì)是在隱喻識別的基礎(chǔ)上,通過使用某種特定的符號代碼對隱喻各個層面的信息進行加工、處理和記錄的過程。本研究采用Pragglejaz Group(2007)提出的 MIP隱喻識別方法。從理論上講,隱喻標(biāo)注的兩個過程可選取上述任意一種標(biāo)注方法。然而,本研究倡導(dǎo)在隱喻識別階段應(yīng)采用“人工識別+機器輔助”,在隱喻標(biāo)記階段應(yīng)以“機器標(biāo)注+人工輔助”或機器全自動標(biāo)注為宜。之所以采用這兩種方法,主要有以下幾個方面的考量:

(1)隱喻概念的特殊性及復(fù)雜性。盡管La?koff等學(xué)者的跨域映射論為隱喻的分析與闡釋提供基本理論框架,但其心理真實性問題向來受到學(xué)界的質(zhì)疑與挑戰(zhàn)。因此,在自然語篇中,對隱喻的理解須采用多元化、跨學(xué)科的研究視角。比如,可選取語料庫語言學(xué)的基本原理與方法來觀察隱喻的共時與歷時變化;可采用語篇分析法來挖掘隱喻語言的形式、結(jié)構(gòu)與功能;可基于行為學(xué)方法來研究或驗證人類心智對隱喻的認知表征。

(2)隱喻識別的方法論與技術(shù)性問題。語言隱喻與概念隱喻的關(guān)系通常極其復(fù)雜且兩者易融合(conflated),但語言形式畢竟只是表層結(jié)構(gòu),終究無法完整地表征其概念系統(tǒng)(Steen 2007:175)。雖然語言隱喻的識別是概念隱喻構(gòu)建的基礎(chǔ),然而研究過程中對兩者的識別需要對應(yīng)的方法論。從研究現(xiàn)狀來看,現(xiàn)存的隱喻識別程序或集中于識別隱喻性詞匯,或缺乏科學(xué)、系統(tǒng)且易操作的方法來指導(dǎo)隱喻在概念層面的識別,又或是對兩者識別的關(guān)系問題含糊不清。這些問題在很大程度上將影響隱喻形式化與模型化的準(zhǔn)確性與科學(xué)性,不利于隱喻自動識別的發(fā)展。此外,從目前隱喻自動識別研究的個案來看,在語料標(biāo)注規(guī)模及標(biāo)注對象方面依然受到限制,整體標(biāo)注不具有代表性。

(3)隱喻標(biāo)注的指向性問題。隱喻標(biāo)注階段并不涉及文本中的每個詞匯單元或句子,這是由隱喻語料庫的特殊性決定的。這就導(dǎo)致隱喻識別之后,必須借助人工手段對隱喻性詞匯及相關(guān)涉及隱喻概念映射的句子(群)進行篩選、校對與補充。當(dāng)然,這一階段的任務(wù)可以通過開發(fā)相關(guān)計算機程序,并通過手工錄入信息的方式來實現(xiàn)計算機的自動篩選。比如,張冬瑜等(2015)在歸納情感隱喻語料庫理論框架的基礎(chǔ)上,通過對詞條信息進行多重人工檢查及嚴格控制信息更新的方式,設(shè)計出情感隱喻的錄入界面,極大提高隱喻標(biāo)注的效率。由此可見,標(biāo)注階段采用機器錄入的這種方案不僅是為了提高標(biāo)注效率,減輕標(biāo)注者的記憶負擔(dān),更重要的也是為了保證語料標(biāo)注賦碼上的一致性。

5 隱喻標(biāo)注的內(nèi)容

5.1 元信息標(biāo)注

隱喻語料庫的元信息標(biāo)注主要是記錄語料庫中文本的非語言信息,包括外部信息(如語料來源、文本模式、類型、領(lǐng)域、作者、出版時間、標(biāo)注階段、首標(biāo)時間、定標(biāo)時間等)和文本的內(nèi)部結(jié)構(gòu)特征(如標(biāo)題、段落、文獻、伴隨口語的副語言特征等)。這些信息通常置于文件頭部,并通過某種特定的符號編碼與文本建立關(guān)聯(lián)。根據(jù)XML格式,將標(biāo)注內(nèi)容置于尖括號內(nèi),并注明屬性及參數(shù)值。此外,每項標(biāo)注內(nèi)容必須包含獨立的起始標(biāo)簽與結(jié)束標(biāo)簽。具體標(biāo)注格式如下:

<annotator team =“...” name= “...”orgname=“...” > < /annotator> 分別表示“標(biāo)注者起始標(biāo)簽、標(biāo)注團隊、標(biāo)注者、標(biāo)注者單位、標(biāo)注者結(jié)束標(biāo)簽”。

<annodate initial_notated = “...” lastmod =“...” > < /annodate>分別表示“標(biāo)注時間起始標(biāo)簽、首標(biāo)時間、定標(biāo)時間、標(biāo)注時間結(jié)束標(biāo)簽”。

< corpus source = “...” discourse =“...” > < /corpus> 分別表示“語料起始標(biāo)簽、語料來源、類型、語料結(jié)束標(biāo)簽”。

以上標(biāo)注內(nèi)容是用戶獲取隱喻語料庫基本信息的重要窗口。具體來講,它可以幫助用戶按照元信息標(biāo)注參數(shù)檢索出所需要類別的批量文本或?qū)τ谡麄€研究最有某種顯著意義的一些特定文本,也可以用來確定某些元文本參數(shù)之間準(zhǔn)確的統(tǒng)計學(xué)數(shù)據(jù),進而研究它們之間的相關(guān)性(陳虹2012:40)。當(dāng)然,隱喻語料庫開發(fā)者需要根據(jù)不同的研究目的或公開程度來合理選取相應(yīng)的元信息進行標(biāo)注。

5.2 語法標(biāo)注

語法標(biāo)注有時也被稱為詞類賦碼或詞性標(biāo)注,是指對語料庫文本中的每個詞匯單元添加某種標(biāo)簽或記號來表明詞性(Leech 1997:2)。這是一種最基本的語料標(biāo)注方法,也是自然語言處理中相對比較成熟的一種自動標(biāo)注技術(shù)。目前最常見的英語自動詞性賦碼軟件有Claws,TreeTag?ger,Wmatrix等。隱喻語料庫中的語法標(biāo)注主要是針對隱喻性詞匯而言的。因此,在標(biāo)注之前,需要通過某種隱喻識別程序來獲取語料庫中的隱喻性詞匯,然后通過計算機軟件的自動標(biāo)注技術(shù)對這些詞匯進行詞性標(biāo)注,被標(biāo)注的詞匯單元將對應(yīng)于不同的隱喻類型。具體標(biāo)注格式如下:

<p>

<s n=“45”>Container<w NN>group Tiphook yesterday<w VBD>said it was still<w JJ>confident of<w VBG>winning its<w JJ>joint£ 643 million<w NN>bid for Sea Containers even though the<w NN>battle has<w VBN>swung<w IN>towards James Sherwood’s ferries?to?trailers combine.

<s n= “46” > ...

< /p >

以上文本的開頭<p>表示段落的開始,</p>表示段落結(jié)束。 <s n=“45”>和<s n=“46”>分別表示文本中的句序。而尖括號內(nèi)的字母組合代表該詞的詞性,即隱喻類型。比如,<w NN>表示group是一個普通名詞,<w VBN>表示swung是動詞的過去分詞。因此,這兩個詞的隱喻類型分別歸類為名詞性隱喻與動詞性隱喻。

5.3 語義標(biāo)注

認知語言學(xué)通常將隱喻研究劃入認知語義學(xué)研究的范疇。因此,語義標(biāo)注無疑是隱喻語料庫標(biāo)注過程中的重要環(huán)節(jié)。通常情況下,隱喻的語義標(biāo)注主要包含以下5個方面。

(1)基本元素

本研究利用英國蘭卡斯特大學(xué)Paul Rayson開發(fā)的在線語義標(biāo)注工具Wmatrix進行文本中的隱喻識別:程序步驟包括獲取主題語義域、確定候選源域及源域詞匯、識別隱喻形符、確定目標(biāo)域與構(gòu)建概念映射(柳超健 王軍2017)。此外,在概念映射構(gòu)建環(huán)節(jié),本研究還引入目前主流的隱喻語料庫 Master Metaphor List,ATT?Meta data bank,Metalude作為概念映射構(gòu)建的主要參考依據(jù)。當(dāng)然,如果在標(biāo)注過程中無法在上述隱喻語料庫中檢索到相應(yīng)的基本概念映射,標(biāo)注者也可自定義額外的詞匯范疇。具體標(biāo)注格式如下:

<view>

<mapping>LIFE IS A JOURNEY</mapping>

<metuw>road</metuw>

<source domain>journey</source domain>

<target domain>life</target domain>

<source>MML</source>

<original literature>more than cool reason</original literature>

</view>

以上文本的開頭<view>表示隱喻界定的開始,</view>表示隱喻界定的終止;<metuw><source domain><target domain><mapping>分別對應(yīng)于隱喻的基本要素journey,journey,life和LIFE ISA JOURNEY;<original literature>表示該隱喻源于專著More than cool reason;<source>表示該概念映射的主要參考依據(jù)來源于隱喻語料庫Metaphor Master List.

(2)歸約性

正常情況下,在詞匯單元產(chǎn)生隱喻意義時,人們無法有意識地感知其隱喻性,因為絕大多數(shù)隱喻表達式都是高度規(guī)約化的。然而,隱喻的歸約性并非靜止不變,它是一個程度上的問題。隱喻規(guī)約性差異將產(chǎn)生不同的隱喻類別,其中最常見的有常規(guī)隱喻、新奇隱喻和歷史隱喻(etymological metaphor)。隱喻的規(guī)約性程度越高,識別難度也就越大。隱喻的歸約性是語料庫用戶透視隱喻概念的一個重要視窗。具體標(biāo)注格式如下:

<view>

<conventionality>conventional metaphor</conventionality>

<conventionality> novel metaphor< /conven?tionality>

<conventionality>etymological metaphor</conventionality>

</view>

(3)層級性

隱喻具有層級性(gradability),即,不同概念的隱喻性程度之間存在差異。通常情況下,源域和目標(biāo)域所共享的語義特點越多,隱喻程度就越弱。比如,海洋綠洲的隱喻性要低于心智“綠洲”的隱喻性。語義回響值是衡量隱喻性程度的基本指數(shù),可通過觀察語料庫中隱喻使用的實際情況來獲取。當(dāng)不相關(guān)的概念被引入、激活或響應(yīng)語境中的隱性概念時,相應(yīng)的語義回響值就會增大(Hanks 2006:31)。隱喻的層級性從本質(zhì)上講是隱喻性程度的體現(xiàn)。隱喻性程度越高,其顯性程度越低。鑒于目前尚未有可定性的計算方法來界定隱喻性,本研究暫選用從-5到+5的數(shù)值區(qū)間進行量化。數(shù)值越大,隱喻性程度越高。隱喻性程度對于揭示隱喻使用者及隱喻接受者的認知行為具有重要意義。具體標(biāo)注格式如下:

<view>

<metaphoricity>5</metaphoricity>

</view>

(4)間接性

隱喻概念的間接性(indirectness)及歸約性與隱喻的功能存在某種程度的相關(guān)性,并且會影響隱喻接受者的心智模型(Krennmayr 2011:273)。因此,可基于概念的間接性對隱喻進行標(biāo)注。隱喻概念的間接性在語言層面可分為間接隱喻、直接隱喻和明晰隱喻(explicit metaphor)。間接隱喻是概念隱喻中最具有原型意義的類別,即源域的概念結(jié)構(gòu)(比如high wage)通過間接方式來表征目標(biāo)域;直接隱喻無需借助間接概念進行概念轉(zhuǎn)換與表征,最常見的形式為明喻(simile);明晰隱喻主要涉及隱喻的間接回指,即在概念結(jié)構(gòu)中可重新獲取所指概念的隱喻性(Steen et al 2010:33-40)。具體標(biāo)注格式如下:

<view>

< indirectness > indirect metaphor < /indirect?ness>

< indirectness > direct metaphor < /indirect?ness>

< indirectness > explicit metaphor < /indirect?ness>

</view>

(5)標(biāo)記語

某些隱喻的使用通常伴有明確的話語標(biāo)記(marker)或調(diào)節(jié)語(tuning device)(Goatly 1997;Cameron,Deignan 2003),因此可將這類標(biāo)記語作為隱喻識別的文本線索。該標(biāo)注也是隱喻自動識別方法的重要組成部分。鑒于Goatly對隱喻話語標(biāo)記語做過迄今為止最詳盡的分類:包括顯性標(biāo)記語、強調(diào)詞、弱化修飾詞、元語言、擬態(tài)詞等(Goatly 1997:172 -199),本研究主要基于上述分類標(biāo)準(zhǔn),分別為每個類別的隱喻標(biāo)記語進行從字母A到L的標(biāo)注,并記錄其序號和內(nèi)容。具體標(biāo)注格式如下:

<metsignal>

<metsignal N =“11” >

<signal>literally, something of< /signal>

<sigclass>A-L</sigclass>

< /metsignal>

5.4 語用標(biāo)注

隱喻是人類認知世界的基本推理機制,其基本功能是能夠讓我們通過具體、簡單、顯性的經(jīng)驗結(jié)構(gòu)來表征抽象、復(fù)雜、隱性的經(jīng)驗結(jié)構(gòu)。然而,如果從語篇視角研究隱喻的功能,我們需要探討交際中更具體的問題。比如,為什么某種特定的隱喻形式只出現(xiàn)于某類特定的文本或語篇中。這類問題通常與隱喻對現(xiàn)實的表征相關(guān)。具體來說,隱喻具有說服、理解、評價、解釋、突顯、掩蓋、表達情感或信仰、理論化等功能。當(dāng)然,在同種語篇中,也可能出現(xiàn)幾種功能共現(xiàn)的情況。如果從語言交際的視角看,隱喻的功能則主要體現(xiàn)在隱喻使用的刻意性(deliberateness)方面,即,隱喻使用者是否刻意引導(dǎo)話語接受者通過某個事物來理解另一事物,或是隱喻話語接受者在經(jīng)歷刻意性的隱喻話語之后是否改變對當(dāng)前話題的某些觀點(Krennmayr 2011:152)。 具體標(biāo)注格式如下:

<view>

<metfunction>persuasion</metfunction>

< communication > deliberate < /communica?tion>

</view>

6 結(jié)束語

隱喻標(biāo)注在隱喻語料庫建設(shè)與應(yīng)用過程中具有重要意義,是當(dāng)前語料庫隱喻研究的重要課題之一。本研究在以往國內(nèi)外大型隱喻語料庫標(biāo)注實踐的基礎(chǔ)上,深入探討隱喻標(biāo)注的相關(guān)重要問題。在理論指導(dǎo)方面,系統(tǒng)提出隱喻標(biāo)注的基本原則;在標(biāo)注語言方面,論證XML在隱喻標(biāo)注中的優(yōu)勢及可行性;在標(biāo)注方法方面,對隱喻標(biāo)注的概念作出重新定義,并倡導(dǎo)“人工識別+機器輔助”與“機器標(biāo)注+人工輔助”并用的理念;在標(biāo)注覆蓋度方面,對隱喻標(biāo)注內(nèi)容作出具體說明,并建議采用“基本標(biāo)注+選擇性標(biāo)注”的方案。此外,語料庫隱喻標(biāo)注研究依舊任重道遠,對概念隱喻理論中涉及基本隱喻等重要信息的自動提取、識別與標(biāo)注,是重點,更是難點。

猜你喜歡
語料語料庫隱喻
海量標(biāo)注語料庫智能構(gòu)建系統(tǒng)的設(shè)計與實現(xiàn)
基于語料庫的清末民初日源外來詞漢化研究
成長是主動選擇并負責(zé):《擺渡人》中的隱喻給我們的啟示
《紅樓夢》飲食中的隱喻
淺談視頻語料在對外漢語教學(xué)中的運用
可比語料庫構(gòu)建與可比度計算研究綜述
運用語料庫輔助高中英語寫作
對《象的失蹤》中隱喻的解讀
日版《午夜兇鈴》多模態(tài)隱喻的認知研究
語料庫與譯者培養(yǎng)探索
黑龙江省| 晋宁县| 武冈市| 咸宁市| 榆树市| 宜兰市| 大理市| 克东县| 罗江县| 大名县| 涡阳县| 得荣县| 大宁县| 武宁县| 富顺县| 巴楚县| 申扎县| 佛教| 绥德县| 马边| 若羌县| 瓮安县| 偃师市| 巍山| 德江县| 长兴县| 泾川县| 高青县| 边坝县| 馆陶县| 惠东县| 阿拉尔市| 韶山市| 甘泉县| 石柱| 天台县| 武汉市| 甘孜县| 京山县| 漳浦县| 营口市|