鄭媛媛
廣西外國(guó)語(yǔ)學(xué)院廣西南寧530222
基于自建語(yǔ)料庫(kù)的四字格語(yǔ)塊特點(diǎn)研究
鄭媛媛
廣西外國(guó)語(yǔ)學(xué)院廣西南寧530222
語(yǔ)塊是指語(yǔ)言中出現(xiàn)頻率較高,形式和意義較固定,以整體形式儲(chǔ)存在大腦中的一串詞,可整體或稍作改動(dòng)后作為預(yù)制語(yǔ)塊供學(xué)習(xí)者應(yīng)用,具有整體儲(chǔ)存、整體提取、整體使用的特性。本研究借助Antconc3.4.3軟件,以中國(guó)國(guó)家政府報(bào)告英譯本為語(yǔ)料并自建語(yǔ)料庫(kù);提取語(yǔ)料庫(kù)中的四詞語(yǔ)塊,進(jìn)行結(jié)構(gòu)上和功能上的分類(lèi);然后對(duì)庫(kù)中的四詞語(yǔ)塊進(jìn)行分析,最后剖析四詞語(yǔ)塊結(jié)構(gòu)和功能的關(guān)系,探討四詞語(yǔ)塊用詞特征。
語(yǔ)塊;語(yǔ)料庫(kù);特點(diǎn);中國(guó)政府工作報(bào)告
(一)語(yǔ)塊
又稱詞塊,是指語(yǔ)言中出現(xiàn)頻率較高,形式和意義較固定,以整體形式儲(chǔ)存在大腦中的一串詞,可整體或稍作改動(dòng)后作為預(yù)制語(yǔ)塊供學(xué)習(xí)者應(yīng)用。雖然學(xué)術(shù)界對(duì)語(yǔ)塊的定義和稱謂各有差別,如Pawley&Syder(1983)更側(cè)重于其語(yǔ)法功能于作用,把它定義為“具有固定的語(yǔ)法形式和詞匯意義的分句單位”;Biber et al(1999).將其定義為“由三個(gè)或以上的單詞構(gòu)成,在一個(gè)特定的語(yǔ)域里以一種高頻共現(xiàn)的方式出現(xiàn)的結(jié)構(gòu)”;Wray(2002:94)將之稱為程式化序列(formulaic sequence),定義為“作為整體使用和整體儲(chǔ)存的詞語(yǔ)程式”;NattingerandDeCarrico(1990:1)認(rèn)為語(yǔ)塊是“介于句子和詞匯之間的模式化短語(yǔ),是一個(gè)詞匯-語(yǔ)法單位”。
(二)語(yǔ)塊的分類(lèi)和功能
Cortes(2004)把語(yǔ)塊分成九種結(jié)構(gòu),分別是名詞短語(yǔ)+of、名詞短語(yǔ)+that從句、其它名詞短語(yǔ)、介詞短語(yǔ)、介詞短語(yǔ)+of、it+be+adj+that、聯(lián)系動(dòng)詞be+補(bǔ)語(yǔ)結(jié)構(gòu)、動(dòng)詞短語(yǔ)、其它結(jié)構(gòu)。
從功能上看,Biber將語(yǔ)塊分成三大功能:指稱功能、文本銜接功能和態(tài)度立場(chǎng)功能。
(一)研究工具
本文運(yùn)用日本早稻田大學(xué)Laurence Anthony教授研發(fā)的綠色免費(fèi)語(yǔ)料庫(kù)軟件AntConc為工具自建小型語(yǔ)料庫(kù),對(duì)中國(guó)政府工作報(bào)告里的四詞語(yǔ)塊進(jìn)行研究。
(二)研究文本
中國(guó)政府報(bào)告作為一種官方文件,其文體正式,用詞嚴(yán)謹(jǐn),表達(dá)精確,內(nèi)含大量固定的表達(dá)和措辭,以體現(xiàn)政府的權(quán)威性和嚴(yán)謹(jǐn)性。政府報(bào)告的詞塊的提取、歸類(lèi)和分析有助于譯者更直觀、更迅速地保證翻譯的準(zhǔn)確性、流暢性和得體性。本文里的中國(guó)政府報(bào)告英譯本的文本來(lái)源于中國(guó)政府編譯局的官方網(wǎng)站(http://www.cctb.net/),以2012-2014年這三年的政府工作報(bào)告英譯本為例。
(三)研究過(guò)程
文本被建立成庫(kù)前,所有的文本應(yīng)先用文本處理器經(jīng)過(guò)格式的凈化處理,由word文檔模式變成text模式,完成格式處理之后可建庫(kù)如下:
完成語(yǔ)料的建庫(kù)之后,需要從中提取出四詞詞組。在提取過(guò)程中,四詞詞組出現(xiàn)的頻率很重要。一方面,頻率決定著語(yǔ)塊的辨析,某個(gè)結(jié)構(gòu)共現(xiàn)的頻率越高,那么它越有可能會(huì)被識(shí)別稱為語(yǔ)塊以省去使用中的認(rèn)知和加工過(guò)程;另一方面,一旦這個(gè)結(jié)構(gòu)被整體存儲(chǔ)和整體記憶以后,當(dāng)再次表達(dá)相關(guān)意思或概念時(shí),它會(huì)被優(yōu)先使用和表達(dá)(Wray,2002)。
Altenberg(1998)認(rèn)為,任意一個(gè)以固定形式和固定意義出現(xiàn)2次或以上的結(jié)構(gòu)被稱之為語(yǔ)塊;Butler(1997)認(rèn)為語(yǔ)塊至少包含3個(gè)單詞并共現(xiàn)超過(guò)10次以上;DeCock et al (1998)指出語(yǔ)塊的頻率和語(yǔ)塊的長(zhǎng)度成反比,即一個(gè)詞匯短語(yǔ)的長(zhǎng)度越長(zhǎng),頻率越低;因此對(duì)不同長(zhǎng)度的語(yǔ)塊頻率標(biāo)準(zhǔn)也應(yīng)該有所不同:2詞語(yǔ)塊的頻率應(yīng)為9次或以上;三詞語(yǔ)塊的頻率為4次或以上;四詞語(yǔ)塊的頻率為3次或以上;5詞語(yǔ)塊的頻率為2次或以上。因此,本數(shù)據(jù)庫(kù)里,選項(xiàng)“theCluster/N-grams(詞簇)”的參數(shù)被設(shè)定為最小值(Min size)4,頻率(Frequency)3。
(四)研究結(jié)果
本數(shù)據(jù)庫(kù)含有38,416形符(tokens)和3,444類(lèi)符(types)。形符類(lèi)似于我們?nèi)粘Uf(shuō)的“詞”,總形符數(shù)是語(yǔ)料庫(kù)容量的最常用的測(cè)量單位;類(lèi)符作為一個(gè)統(tǒng)計(jì)量,指語(yǔ)料庫(kù)文本中的任何一個(gè)獨(dú)特的詞形,即重復(fù)出現(xiàn)的形符只能記做一個(gè)類(lèi)符,如Gertrude Stein的“Rose is a rose is a rose is a rose”這句話中,形符一共有10個(gè),而類(lèi)符只有3個(gè)(rose,is,a)(梁茂成,李文忠,許家金,2010:9)。按照之前設(shè)定的參數(shù),把一些不合格的四詞結(jié)構(gòu)剔除后,本庫(kù)四詞語(yǔ)塊的總數(shù)為714,由3,203形符以1229的頻率出現(xiàn)在庫(kù)中。下圖為本庫(kù)中出現(xiàn)頻率前15的四詞語(yǔ)塊。
表一
從前15個(gè)高頻出現(xiàn)的四詞語(yǔ)塊分布來(lái)看,動(dòng)詞詞組(we will continue to,we will improve the,deepen reform of the,we will deepen reform,improve the mechanism for,give high priority to,improve the system of)和名詞詞組(economic and social development,the past five years,central and western regions,reform and opening up,agriculture rural areas and,rural areas and farmers,the people’s wellbeing)分別占據(jù)了47%的比例,而介詞短語(yǔ)占據(jù)了余下的大約6%.
1、四詞詞塊的結(jié)構(gòu)性分析
對(duì)所提取的四詞語(yǔ)塊進(jìn)行分析提煉后,結(jié)構(gòu)分布頻率圖如下:(見(jiàn)表二)
本庫(kù)共有符合要求的四詞語(yǔ)塊共714個(gè),比例分布較大的為名詞短語(yǔ)(Other NP)(30%)、動(dòng)詞短語(yǔ)(V)(20%)、介詞類(lèi)(Other PP)(17%);名詞短語(yǔ)+of結(jié)構(gòu)(NP+of)占16%.而其余的結(jié)構(gòu),如名詞短語(yǔ)+that從句(NP+nominal),介詞短語(yǔ)+of(PP+of),其余類(lèi)型(Others)and系動(dòng)詞be+表語(yǔ)/補(bǔ)語(yǔ)成分(V be),分別占據(jù)了整庫(kù)不到10%的比例。值得注意的是在本庫(kù)中,“It+V be+adjective+(clause fragment)”缺失,沒(méi)有出現(xiàn)。
表二
在本庫(kù)中,與名詞相關(guān)的語(yǔ)塊(NP+of,NP+nominal, OtherNP)占據(jù)了將近一半的比例,說(shuō)明政府工作報(bào)告里面涉及到的名詞指稱相當(dāng)龐大和多樣。作為面向全國(guó)的政府工作總結(jié),囊括國(guó)家各行各業(yè)的發(fā)展,更有對(duì)未來(lái)的展望和計(jì)劃,因此名此類(lèi)詞塊獨(dú)占榜首也不足為奇,通常來(lái)說(shuō),名詞類(lèi)結(jié)構(gòu)在文章里主要是解釋概念,指代以及具體化。
介詞短語(yǔ)限定或界定了名詞的范圍,也使得表達(dá)更精確和流暢,由于和名詞關(guān)系密切,因此所占比重也較大。
動(dòng)詞類(lèi)語(yǔ)塊在本庫(kù)中占據(jù)了21%的比例,其中,主動(dòng)語(yǔ)態(tài)高達(dá)93%而被動(dòng)結(jié)構(gòu)結(jié)構(gòu)僅占7%左右,可以看出,雖然政府報(bào)告屬于政論文,但其由總理代表政府述職的形式也影響了語(yǔ)態(tài)的選擇;更重要的是,政府報(bào)告還承擔(dān)著為未來(lái)做計(jì)劃,向人民展示政府的成就、繼續(xù)推進(jìn)改革開(kāi)發(fā)讓人民享受更好的發(fā)展的決心,因此,主動(dòng)語(yǔ)態(tài)成為報(bào)告中的主要語(yǔ)態(tài)。
短語(yǔ)類(lèi)語(yǔ)塊(NP+of,Other NP,PP+of,Other PP,V be,V, Others)和分句類(lèi)語(yǔ)塊(NP+nominal,It+V be+adjective+ clause fragment)相比,短語(yǔ)類(lèi)比重高達(dá)95%,而分句類(lèi)語(yǔ)塊僅占5%;而It+V be+adjective+clause fragment該結(jié)構(gòu)在庫(kù)中甚至是缺失的,這個(gè)研究結(jié)果和前人的研究相符合,即短語(yǔ)類(lèi)語(yǔ)塊比分句類(lèi)語(yǔ)塊要更常見(jiàn),頻率更高(Biber at al, 1999;Biber&Barbieri,2007;Yu 2013)。
2、四詞詞塊的功能性分析
本庫(kù)中的四詞語(yǔ)塊的功能頻率分類(lèi)如下:(見(jiàn)表三)
四詞語(yǔ)塊在本庫(kù)中功能頻率的分布依次為:指稱功能(69%),態(tài)度立場(chǎng)功能(23%),文章銜接功能(8%)。這一結(jié)果和Biber&Barbieri(2007)的研究相符。此前研究發(fā)現(xiàn),幾乎70%的語(yǔ)塊都是指稱類(lèi)的,而語(yǔ)塊的指稱作用也是正式文體中的主功能(Biber&Barbieri 2007:278)。作為官方文件,所述理當(dāng)客觀,不偏不倚,因此態(tài)度立場(chǎng)功能所占比位于指稱功能之下;從態(tài)度立場(chǎng)的子功能里也可看出,認(rèn)知態(tài)度和預(yù)測(cè)態(tài)度占比較大,愿望、職責(zé)和能力態(tài)度所占比極小,體現(xiàn)出了客觀、中立的表述態(tài)度。
表三
3、四詞詞塊的結(jié)構(gòu)和功能的關(guān)系
表四
以上圖表體現(xiàn)了四詞語(yǔ)塊的結(jié)構(gòu)和功能分布頻率的關(guān)系。指稱功能往往由名詞類(lèi)語(yǔ)塊和介詞類(lèi)語(yǔ)塊充當(dāng)(NP+of structure,PP+of structures,NP structures and PP structures)。幾乎所有的表示態(tài)度的功能都由動(dòng)詞類(lèi)語(yǔ)塊充當(dāng)(V be,V),文章的銜接功能則主要由分句類(lèi)語(yǔ)塊實(shí)現(xiàn)(NP+nominal,It +V be+adj),部分由名詞類(lèi)語(yǔ)塊(Other NP)、介詞類(lèi)語(yǔ)塊(Other PP)和其它結(jié)構(gòu)實(shí)現(xiàn)(Others structures)。
從上述分析可看出,中國(guó)政府報(bào)告中的四詞語(yǔ)塊出現(xiàn)頻率較高;從結(jié)構(gòu)上看,最主要的結(jié)構(gòu)是名詞短語(yǔ)語(yǔ)塊(Other NP),共占比30%;頻率較高的還有動(dòng)詞語(yǔ)塊(V),介詞語(yǔ)塊(Other PP)以及名詞+of(NP+of)語(yǔ)塊;由此可見(jiàn),中國(guó)政府工作報(bào)告英譯文偏向于采用包含名詞和介詞的詞塊來(lái)表達(dá)指稱、概念、質(zhì)量以及限定性,側(cè)面展示了報(bào)告內(nèi)容的綜合性、復(fù)雜性和精確;而動(dòng)詞結(jié)構(gòu)多用于表達(dá)政府不遺余力地推動(dòng)經(jīng)濟(jì)改革,改善民生,促進(jìn)社會(huì)公正公平的堅(jiān)定信念和決心,故主動(dòng)語(yǔ)態(tài)以93%的高頻成為譯本的主要語(yǔ)態(tài)。
從功能上看,指稱功能居于首位,隨后是態(tài)度立場(chǎng)功能和文章銜接功能,體現(xiàn)了中國(guó)政府報(bào)告譯文所含的內(nèi)容量的豐富、廣度,文體正式,分析客觀。在本庫(kù)中,指稱功能占比69%,其所包含的子功能里,指稱時(shí)間地點(diǎn)文本的功能(Time/ place/text reference)以及屬性細(xì)化功能(Specification of attribute)占比最重,這一點(diǎn)和結(jié)構(gòu)上多使用名詞類(lèi)以及介詞類(lèi)語(yǔ)塊相呼應(yīng);在篇章銜接功能里,鑒定說(shuō)明(elaboration/clarification)居首位,而這個(gè)功能和指稱功能相互依賴、密不可分。在態(tài)度立場(chǎng)功能的子功能里,分量最重的當(dāng)屬認(rèn)知態(tài)度(epistemic stance)和傾向預(yù)測(cè)態(tài)度(Intentional/prediction stance),這與報(bào)告剖析過(guò)往發(fā)展成就和展望下一年的內(nèi)在屬性息息相關(guān)。
從兩者的關(guān)系上看,某些特定功能的語(yǔ)塊往往由相對(duì)固定的結(jié)構(gòu)實(shí)現(xiàn)。指稱功能往往由帶“of”結(jié)構(gòu)的語(yǔ)塊實(shí)現(xiàn),包括(NP+of,PP+of)名詞類(lèi)語(yǔ)塊和動(dòng)詞類(lèi)語(yǔ)塊也主要體現(xiàn)在指稱功能上;態(tài)度立場(chǎng)功能由動(dòng)詞類(lèi)語(yǔ)塊完成,銜接功能主要由分句類(lèi)語(yǔ)塊體現(xiàn);而前兩類(lèi)功能主要由短語(yǔ)類(lèi)語(yǔ)塊完成。
因此,在對(duì)中國(guó)政府工作報(bào)告進(jìn)行翻譯時(shí),譯者可根據(jù)語(yǔ)塊特點(diǎn)而進(jìn)行針對(duì)性翻譯,如表示實(shí)體或概念指稱作用多用含“of”結(jié)構(gòu)以及名詞、介詞類(lèi)語(yǔ)塊(NP+of,PP+of,other NP,other PP...);對(duì)于動(dòng)作、質(zhì)量的指稱多用(V,V be)語(yǔ)塊;文本銜接常用短語(yǔ)類(lèi)語(yǔ)塊表達(dá)等。對(duì)于一些出現(xiàn)頻率較高的語(yǔ)塊,可整體使用,以保證譯文的準(zhǔn)確、通順、流暢。
最后,本語(yǔ)料庫(kù)建庫(kù)較為簡(jiǎn)單,容量較小,也僅分析了四詞語(yǔ)塊,還有許多亟待完善之處,關(guān)于語(yǔ)塊的學(xué)習(xí)與研究也可在此基礎(chǔ)上不斷深化與改進(jìn)。
[1]Wray.A.Future Directions in Formulaic Language Research[J].Wang Lifei,Advances in Theoretical and Empirical Research on Formulaic Language[C].Shanghai:Shanghai Foreign Language Education Press,2012.
[2]梁茂成,許家金,李文中.語(yǔ)料庫(kù)應(yīng)用教學(xué)[C].北京:外語(yǔ)教學(xué)與研究出版社,2013.
[3]俞苗.不同學(xué)科學(xué)術(shù)語(yǔ)篇中四詞語(yǔ)塊的研究——以食品科學(xué)與教育學(xué)為例[M].大連海事大學(xué),2013.