朱明慧
(上海大學(xué),上海 201900)
近年來(lái),隨著語(yǔ)言學(xué)的各分支學(xué)科的不斷深入發(fā)展,同時(shí)也得益于計(jì)算機(jī)科學(xué)的飛速發(fā)展以及統(tǒng)計(jì)分析方法的日益完善,定量分析研究逐漸引起學(xué)界的廣泛重視,成為對(duì)比語(yǔ)言學(xué)研究的一種趨勢(shì)。而在定量對(duì)比研究中,基于語(yǔ)料庫(kù)的研究方法是最常用的方法之一。許余龍(2009)[1]在對(duì)第五屆國(guó)際對(duì)比語(yǔ)言學(xué)大會(huì)的述評(píng)中指出,大會(huì)的宣讀論文中有60.2%的英語(yǔ)論文選擇使用語(yǔ)料庫(kù)的研究手段,并以此為主要依據(jù)進(jìn)行深入探討。
然而,我國(guó)的對(duì)比語(yǔ)言學(xué)研究尚存在一些不足。王文斌(2019)[2]以近70年內(nèi)國(guó)內(nèi)漢英對(duì)比語(yǔ)言學(xué)研究為對(duì)象,對(duì)其展開了系統(tǒng)的梳理和總結(jié),強(qiáng)調(diào)了多年來(lái)我國(guó)英漢語(yǔ)言對(duì)比研究成績(jī)顯著,問(wèn)題亦不少。在研究方法層面,他指出,目前的研究大多在思辨層面,即使有些實(shí)證研究,也通常是一些數(shù)據(jù)羅列,尚未充分借用語(yǔ)料庫(kù)對(duì)某些語(yǔ)言現(xiàn)象進(jìn)行較為系統(tǒng)而全面的描述。同時(shí),在語(yǔ)言對(duì)比研究方面,中國(guó)學(xué)者國(guó)際化意識(shí)不足。
因此,文章著眼于定量對(duì)比分析中較為常用的基于語(yǔ)料庫(kù)的研究方法,從對(duì)比語(yǔ)言學(xué)國(guó)際領(lǐng)先期刊Languages in Contrast選取了3篇關(guān)于英漢對(duì)比的英語(yǔ)文章,從國(guó)內(nèi)外國(guó)語(yǔ)言類核心期刊選取了2篇漢語(yǔ)文章,對(duì)英漢語(yǔ)言對(duì)比領(lǐng)域的主要研究方法進(jìn)行綜述。文章擬從對(duì)比研究的主要類型、研究設(shè)計(jì)和在數(shù)據(jù)統(tǒng)計(jì)分析過(guò)程進(jìn)行初步探討,進(jìn)而對(duì)英漢語(yǔ)言對(duì)比研究方法得出較為清晰的認(rèn)識(shí),力求對(duì)國(guó)內(nèi)學(xué)者進(jìn)行英漢語(yǔ)言的對(duì)比提供研究方法上的建議。
文章共收錄文章5篇,其中3篇英文文章來(lái)自Languages in Contrast,兩篇漢語(yǔ)期刊分別來(lái)自《解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào)》和《外國(guó)語(yǔ)》。Languages in Contrast是由同行評(píng)審的對(duì)比語(yǔ)言學(xué)學(xué)術(shù)期刊。期刊著重于對(duì)兩種或兩種以上的語(yǔ)言進(jìn)行對(duì)比研究,范圍包含理論語(yǔ)言學(xué)與應(yīng)用語(yǔ)言學(xué)的所有分支,是對(duì)比語(yǔ)言學(xué)領(lǐng)域最為權(quán)威的國(guó)際期刊之一。同時(shí),《解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào)》和《外國(guó)語(yǔ)》也屬于國(guó)內(nèi)外語(yǔ)類的權(quán)威期刊,是國(guó)內(nèi)學(xué)者交流學(xué)術(shù)熱點(diǎn)的重要陣地。
在定量對(duì)比研究中,研究的主要類型、研究設(shè)計(jì)以及數(shù)據(jù)統(tǒng)計(jì)分析過(guò)程是十分重要的部分。
許余龍(2001)[3]提出,根據(jù)語(yǔ)言對(duì)比研究的特點(diǎn),可以將實(shí)證性定量對(duì)比研究分為定量篇章對(duì)比分析研究、語(yǔ)言對(duì)比調(diào)查研究和語(yǔ)言對(duì)比實(shí)驗(yàn)研究。文章所涵蓋的5篇文章均屬于定量篇章對(duì)比分析研究范疇。定量篇章對(duì)比分析研究主要是在對(duì)兩種語(yǔ)言的篇章進(jìn)行對(duì)比分析的基礎(chǔ)上,研究?jī)煞N語(yǔ)言中兩個(gè)相對(duì)應(yīng)的語(yǔ)言系統(tǒng)或項(xiàng)目在使用數(shù)量、分布和用法方面的異同和特點(diǎn)。
McEnery和Xiao(2006)[4]利用4個(gè)獨(dú)立的語(yǔ)料庫(kù),即英語(yǔ)、漢語(yǔ)書面語(yǔ)語(yǔ)料庫(kù)及英語(yǔ)、漢語(yǔ)口語(yǔ)語(yǔ)料庫(kù),從被動(dòng)語(yǔ)態(tài)的長(zhǎng)短、語(yǔ)義層面、語(yǔ)用特征、句法功能以及體裁類型方面,對(duì)英漢語(yǔ)言中的被動(dòng)語(yǔ)態(tài)的使用頻率進(jìn)行了全面的對(duì)比,探討了兩者在被動(dòng)語(yǔ)態(tài)使用的異同,也解釋了兩者產(chǎn)生差異的原因。
Boulin(2017)[5]利用由小說(shuō)文本組成的英漢雙語(yǔ)平行語(yǔ)料庫(kù),每種語(yǔ)言約268000字(不包括翻譯文本),探討了英漢語(yǔ)中的指示副詞now和“現(xiàn)在”的使用頻率、語(yǔ)義范圍和語(yǔ)用功能異同。
Xiao(2011)[6]利用三個(gè)平衡類比語(yǔ)料庫(kù),囊括英語(yǔ)、漢語(yǔ)以及對(duì)應(yīng)英語(yǔ)翻譯,對(duì)英漢語(yǔ)中詞叢和重復(fù)話語(yǔ)標(biāo)記的出現(xiàn)頻次和使用場(chǎng)景的異同,為英漢互譯提供策略上的建議。
吳格奇(2013)[7]以英文和漢語(yǔ)學(xué)術(shù)論文作者如何通過(guò)自稱建構(gòu)身份為研究目標(biāo),利用自建語(yǔ)料庫(kù)進(jìn)行了詳細(xì)的對(duì)比分析。語(yǔ)料庫(kù)包括90篇基于實(shí)驗(yàn)或語(yǔ)料的實(shí)證性研究的英、漢語(yǔ)期刊論文,對(duì)論文作者在自稱時(shí)使用的第一人稱代詞和第三人稱名詞進(jìn)行統(tǒng)計(jì),探討了英漢論文作者身份構(gòu)建方式的異同。
許文勝(2011)[8]借助“英漢文學(xué)名著語(yǔ)料庫(kù)”,以語(yǔ)言類型學(xué)為切入點(diǎn),在文本采樣的基礎(chǔ)上,運(yùn)用檢索軟件對(duì)英漢兩種語(yǔ)言的連詞使用情況展開考查,對(duì)英語(yǔ)和漢語(yǔ)這兩種語(yǔ)言系統(tǒng)在各方面使用的差異和相同之處,包括連詞的使用數(shù)量、分布及用法方面。同時(shí),也考查英漢兩種語(yǔ)言由翻譯對(duì)譯入語(yǔ)造成的潛在影響。
定量研究設(shè)計(jì)的基本原則是控制差異,這一原則與對(duì)比研究的基本原則一致,其目的是確保對(duì)比研究建立在某一共同基礎(chǔ)上。本部分將以選取的5篇以定量篇章對(duì)比分析研究為主的文章為例,來(lái)探討其研究設(shè)計(jì)以及討論其設(shè)計(jì)的合理性。
一種語(yǔ)言內(nèi)部可以有多種類型的不同語(yǔ)言變體。在定量語(yǔ)言對(duì)比研究中,只有控制語(yǔ)言變體和其他方面的不同而帶來(lái)的差異,才能觀察和說(shuō)明所研究的語(yǔ)言之間的差異。在探討定量研究設(shè)計(jì)中如何控制差異時(shí),維爾斯曼(1997)[9]認(rèn)為,有如下四種控制差異的基本方法:隨機(jī)化、保持因子不變、設(shè)定自變量因子以及統(tǒng)計(jì)調(diào)節(jié)。
在5篇論文中,控制差異的主要方法是保持條件或因素不變,縮小變量的變化范圍。例如,Boulin(2017)[5]所采用的語(yǔ)料庫(kù)是由現(xiàn)代小說(shuō)文本組成的平行雙向翻譯語(yǔ)料。英語(yǔ)的語(yǔ)料選自于若干外國(guó)作家的代表作品(Brown,2003[10];Rowling,2007[11])。漢語(yǔ)的語(yǔ)料選自于中國(guó)臺(tái)灣作家鐘文音(2012)的《艷歌行》[12]、吳明益(2013)的《復(fù)眼人》[13]以及巴代(2007)的《女巫笛鸛》[14]。所選取的語(yǔ)料均為相似的文學(xué)文本,同時(shí)語(yǔ)料字?jǐn)?shù)也相似,以考察now和“現(xiàn)在”的使用異同。使用這種方法的好處在于保持了問(wèn)題會(huì)影響研究結(jié)果的因子保持恒定不變。許文勝(2015)[8]也是采用研究文學(xué)作品的方法來(lái)縮小變量的變化范圍。語(yǔ)料來(lái)源為18部英美小說(shuō)及其譯本、26篇現(xiàn)代漢語(yǔ)小說(shuō)、《紅樓夢(mèng)》及其兩個(gè)英譯本。研究的文本為從語(yǔ)料庫(kù)中選擇的著名作家及其代表作,以及在學(xué)界具有一定影響力的翻譯作品。吳格奇(2013)[7]的研究對(duì)象為學(xué)術(shù)論文,自建的語(yǔ)料庫(kù)中涵蓋了90篇期刊論文,英漢論文的數(shù)量相等,各45篇。為了控制差異,選取的所有論文都是獨(dú)立作者展開的實(shí)證性研究。
采用保持因子不變的方法可以較為深入地研究語(yǔ)言之間某一文體中的差異,然而,研究結(jié)果的有效性也因此受到了限制。在所列舉的例子中,英漢兩種語(yǔ)言的差別不再能反映兩種語(yǔ)言的整體差別,而只能反映兩種語(yǔ)言在某一種文體中的使用差別。
在控制差異時(shí),設(shè)定自變量因子也是一種可行的方法。如果既要看語(yǔ)言之間的差異,又要研究語(yǔ)言內(nèi)部不同問(wèn)題之間是否存在差異,可以采用設(shè)定自變量因子的方法。例如,McEnery和Xiao(2006)[4]所選取的語(yǔ)料涵蓋15種不同的體裁,包括冒險(xiǎn)小說(shuō)、科幻類小說(shuō)、新聞報(bào)道等類型,以語(yǔ)料的體裁設(shè)定為自變量因子,分別統(tǒng)計(jì)英漢被動(dòng)語(yǔ)態(tài)在各種體裁中的使用量。
Xiao(2011)[6]也采用了類似的語(yǔ)料,但不同的是,筆者采用了雙向翻譯對(duì)等語(yǔ)料,在部分研究設(shè)計(jì)中把文類設(shè)定為自變量因子,將英語(yǔ)原文語(yǔ)料與對(duì)應(yīng)的漢語(yǔ)譯文語(yǔ)料進(jìn)行對(duì)比。對(duì)體裁這一因子的處理,則采用保持因子不變的方法,在統(tǒng)計(jì)的時(shí)候選用某一類型作為分析的單一體裁語(yǔ)料。
控制差異的最后一種方法是統(tǒng)計(jì)調(diào)節(jié),這一方法通過(guò)對(duì)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行處理來(lái)控制差異,消除控制變量的影響。例如,許文勝(2015)[8]在統(tǒng)計(jì)數(shù)據(jù)是采用每百句和每千詞(字)中連詞頻率作為參數(shù)。McEnery和Xiao(2006)[4]在對(duì)英語(yǔ)文本中被動(dòng)語(yǔ)態(tài)的使用進(jìn)行統(tǒng)計(jì)時(shí),為保證頻率統(tǒng)計(jì)的可比性,數(shù)據(jù)只包括由be/get后面緊跟實(shí)義動(dòng)詞的過(guò)去分詞形式的結(jié)構(gòu),排除了get用作使役動(dòng)詞的情況。同時(shí)筆者不僅將各語(yǔ)料庫(kù)的頻率進(jìn)行了統(tǒng)計(jì),也將每100000詞(字)的被動(dòng)語(yǔ)態(tài)使用情況作為參數(shù)。
在進(jìn)行定量對(duì)比研究的數(shù)據(jù)統(tǒng)計(jì)分析時(shí),極為重要的一點(diǎn)是必須對(duì)數(shù)據(jù)反映什么樣的語(yǔ)言事實(shí)有一個(gè)清楚的認(rèn)識(shí),從而確定數(shù)據(jù)之間的可比性。
McEnery和Xiao(2006)[4]進(jìn)行了多項(xiàng)數(shù)據(jù)的對(duì)比,包括在語(yǔ)料庫(kù)中英、漢語(yǔ)被動(dòng)語(yǔ)態(tài)各自的使用頻率,有施事被動(dòng)句和無(wú)施事被動(dòng)句的使用頻率以及在書面語(yǔ)和口語(yǔ)語(yǔ)料庫(kù)中的差異、在不同體裁中被動(dòng)語(yǔ)態(tài)的使用情況、被動(dòng)語(yǔ)態(tài)在句中所作的成分等。在進(jìn)行了兩種語(yǔ)言內(nèi)部的比較后,筆者轉(zhuǎn)而比較兩種語(yǔ)言之間的差異,得出了兩種語(yǔ)言在總體使用頻率、被動(dòng)語(yǔ)態(tài)的施事者、語(yǔ)義特征、句法功能及體裁類型具有差異,并解釋了產(chǎn)生差異的潛在原因。
Boulin(2017)[5]進(jìn)行了兩個(gè)角度的對(duì)比,包括英語(yǔ)原文和漢語(yǔ)譯文角度以及漢語(yǔ)原文和英語(yǔ)譯文角度進(jìn)行比較。理論上來(lái)說(shuō),在翻譯對(duì)等的語(yǔ)料中,指示副詞now和“現(xiàn)在”在語(yǔ)義結(jié)構(gòu)上應(yīng)該是相同的,因此出現(xiàn)的頻率也應(yīng)一致。分析發(fā)現(xiàn),now在英語(yǔ)原文出現(xiàn)的頻率高于英語(yǔ)譯文,“現(xiàn)在”在漢語(yǔ)譯文中出現(xiàn)的頻率高于漢語(yǔ)原文。在對(duì)應(yīng)圖式和非對(duì)應(yīng)圖式的統(tǒng)計(jì)中,研究發(fā)現(xiàn)now在大多數(shù)情況下不會(huì)被漢譯成“現(xiàn)在”,而“現(xiàn)在”大多被英譯為now。
Xiao(2011)[6]旨在研究語(yǔ)言內(nèi)部及語(yǔ)言間的詞叢和言語(yǔ)重復(fù)標(biāo)記的使用情況及異同,因此結(jié)合英語(yǔ)原文、漢語(yǔ)譯文及漢語(yǔ)原文進(jìn)行了數(shù)據(jù)分析。在分析中,作者指出與漢語(yǔ)相比,英語(yǔ)中使用詞叢的頻率更高。而與漢語(yǔ)原文相比,漢語(yǔ)譯文中詞叢的使用更為常見,使用范圍也更加廣泛。使用言語(yǔ)重復(fù)標(biāo)記時(shí),作者將漢語(yǔ)和英語(yǔ)分開對(duì)比,得出漢語(yǔ)譯文比漢語(yǔ)原文使用頻率更高,英語(yǔ)譯文比英語(yǔ)原文使用頻率更高的結(jié)論。
吳格奇(2013)[7]首先統(tǒng)計(jì)了英漢論文中作者自稱的出現(xiàn)頻次。統(tǒng)計(jì)得出無(wú)論是英語(yǔ)論文還是漢語(yǔ)論文,第一人稱自稱的使用頻次都比第三人稱高。在英漢論文自稱第三人稱使用頻次都較低時(shí),筆者指出,雖然漢語(yǔ)論文中使用第三人稱的頻次稍高與英語(yǔ)語(yǔ)料,但是這種現(xiàn)象不能直接判定漢語(yǔ)論文作者在論文中有更強(qiáng)烈的呈現(xiàn)自我傾向。這里第三人稱的不可比性是文章較為嚴(yán)謹(jǐn)?shù)囊稽c(diǎn)。
許文勝(2015)[8]利用語(yǔ)料庫(kù)和檢索軟件,以英語(yǔ)的語(yǔ)義類型作為視點(diǎn)與漢語(yǔ)的連詞進(jìn)行比較,從英、漢原文文本、英—漢、漢—英譯文文本等方面進(jìn)行定量分析,用數(shù)據(jù)解釋英漢語(yǔ)篇銜接中連詞使用數(shù)量、分布和用法方面的異同,指出理解連詞的重要性,并強(qiáng)調(diào)了連詞在翻譯中的重要作用。
近年來(lái),無(wú)論是理論上還是時(shí)間上,國(guó)內(nèi)外的對(duì)比語(yǔ)言學(xué)研究成果都頗有建樹。在研究方法層面,研究者傾向于利用語(yǔ)料庫(kù)來(lái)獲取更多的語(yǔ)言事實(shí),在描述語(yǔ)言事實(shí)的同時(shí),嘗試深入挖掘語(yǔ)言差異現(xiàn)象。在利用語(yǔ)料庫(kù)進(jìn)行定量對(duì)比分析研究時(shí),要深入思考,并選擇適當(dāng)?shù)难芯款愋停袷匮芯吭O(shè)計(jì)的基本原則,遵循控制差異的四種基本方法,并在數(shù)據(jù)分析過(guò)程中合理運(yùn)用數(shù)據(jù)來(lái)說(shuō)明語(yǔ)言事實(shí)。在基于語(yǔ)料庫(kù)的對(duì)比研究迅猛發(fā)展時(shí),研究者也要注意研究的深度和廣度。研究者應(yīng)充分借用語(yǔ)料庫(kù)對(duì)某些語(yǔ)言現(xiàn)象進(jìn)行較為系統(tǒng)而全面的描述,不能只是簡(jiǎn)單的數(shù)據(jù)羅列。定量分析與定性分析并不矛盾,而是可以看作一個(gè)連續(xù)體(維爾斯曼,1997)[9]。因此,為了避免研究方法過(guò)于單一,未來(lái)研究者可以以語(yǔ)料庫(kù)方法為基礎(chǔ),采用定量對(duì)比分析和定性對(duì)比分析的方法來(lái)探討語(yǔ)言之間,特別是英漢語(yǔ)之間的異同,以達(dá)到研究深度和廣度上的掘深和拓寬。
文章以5篇選自于國(guó)內(nèi)外頂級(jí)期刊的基于語(yǔ)料庫(kù)的定量對(duì)比研究為例,討論了在英漢對(duì)比中定量對(duì)比研究的主要類型、研究設(shè)計(jì)以及數(shù)據(jù)分析過(guò)程。文章選取的案例均為定量對(duì)比篇章分析研究,在研究設(shè)計(jì)上采用多種方法控制差異,并在數(shù)據(jù)分析過(guò)程中合理運(yùn)用數(shù)據(jù)對(duì)語(yǔ)言事實(shí)進(jìn)行闡釋。當(dāng)下,語(yǔ)料庫(kù)技術(shù)在不斷更新發(fā)展,研究者可以充分利用語(yǔ)料庫(kù)為主要依據(jù)和手段,采用定量對(duì)比分析與定性對(duì)比分析相結(jié)合的方法,對(duì)某些語(yǔ)言現(xiàn)象進(jìn)行系統(tǒng)且全面的描述,而國(guó)內(nèi)學(xué)者應(yīng)多重視采用語(yǔ)料庫(kù)的方法進(jìn)行英漢語(yǔ)之間的全面而深入的對(duì)比。