鞏培林 姜 誠(chéng)
(上海理工大學(xué)外語(yǔ)學(xué)院)
在過(guò)去的三十年里,儲(chǔ)存在電腦數(shù)據(jù)庫(kù)里的語(yǔ)料的搜集和分析形成了一種新的學(xué)科——語(yǔ)料庫(kù)語(yǔ)言學(xué)。語(yǔ)料是語(yǔ)言數(shù)據(jù)的集合,或是書(shū)面語(yǔ)或是由口語(yǔ)轉(zhuǎn)寫(xiě)而來(lái)。語(yǔ)料庫(kù)的主要功能是用來(lái)驗(yàn)證關(guān)于語(yǔ)言學(xué)的某種假設(shè)。根據(jù)目的的不同,語(yǔ)料庫(kù)的設(shè)計(jì)、庫(kù)容和語(yǔ)料的特征也不一樣。目前用來(lái)研究語(yǔ)言學(xué)的語(yǔ)料庫(kù)大多數(shù)是通用語(yǔ)料庫(kù),如英國(guó)國(guó)家語(yǔ)料庫(kù)、美國(guó)國(guó)家語(yǔ)料庫(kù)。它們被設(shè)計(jì)用來(lái)研究各種語(yǔ)言層面的問(wèn)題,如韻體學(xué)、詞匯、語(yǔ)法、話(huà)語(yǔ)模式和語(yǔ)用學(xué)。還有一種專(zhuān)門(mén)用途語(yǔ)料庫(kù),如在編纂一本學(xué)習(xí)者詞典時(shí)確定哪些單詞以及單詞的哪些意義應(yīng)該包括在詞典里;在某種工業(yè)領(lǐng)域內(nèi),工人使用最多的是哪些單詞和意義;及某種語(yǔ)言在不同的語(yǔ)境下使用的區(qū)別。
本文的目的旨在研究論文摘要的性質(zhì)、兩種期刊論文摘要的相似和不同。本文基于語(yǔ)料庫(kù)的方法,發(fā)現(xiàn)了在應(yīng)用語(yǔ)言學(xué)論文摘要中使用較多的英語(yǔ)語(yǔ)言模式。本研究的重點(diǎn)為比較形符、類(lèi)符、TTR、詞頻、每種摘要的平均字?jǐn)?shù)、多詞序列等。本研究的結(jié)果可以用來(lái)更好地了解兩種期刊的不同,并為論文摘要的寫(xiě)作提供幫助。
語(yǔ)料庫(kù)是書(shū)面文本或者轉(zhuǎn)錄自口語(yǔ)的書(shū)面語(yǔ)的集合,可以作為語(yǔ)言學(xué)分析和語(yǔ)言描述的基礎(chǔ)(Kennedy,1998)。今天,語(yǔ)料庫(kù)是指文本的集合,這些文本經(jīng)過(guò)選擇集合起來(lái)以便可以在計(jì)算機(jī)上研究語(yǔ)言。
基于語(yǔ)料庫(kù)的研究可以追溯到20世紀(jì)60年代(Sinclair et al.,1969),然而由于語(yǔ)料庫(kù)的研究離不開(kāi)計(jì)算機(jī)技術(shù),所以直到20世紀(jì)80年代,隨著百萬(wàn)級(jí)語(yǔ)料庫(kù)的建成,才成為一門(mén)獨(dú)立的學(xué)科 (Cheng,Warren,Xu,2003)。對(duì)論文摘要進(jìn)行最早研究的是Graetz,他研究了健康科學(xué)、社會(huì)科學(xué)、教育和人類(lèi)學(xué)方面的90篇論文摘要的語(yǔ)法結(jié)構(gòu)。他發(fā)現(xiàn):“the abstract is characterized by the use of the past sense,the third person,passive and the non-use of negatives...It is written by tightly worded sentences,which avoid repetition,meaningless expressions,superlatives,adjectives,illustrations,preliminaries,descriptive details,examples,footnotes.”后來(lái)的語(yǔ)料庫(kù)研究主要集中在語(yǔ)篇組織而不是語(yǔ)言選擇。許多研究者都自建了小型語(yǔ)料庫(kù)。鄭志恒(2007)自建了100萬(wàn)字的新聞?dòng)⒄Z(yǔ)標(biāo)記語(yǔ)料庫(kù)來(lái)研究語(yǔ)料庫(kù)建設(shè)過(guò)程的理論和應(yīng)用以及方法和步驟。Sallager-Meyer(1992)通過(guò)選自論文、案例報(bào)告和評(píng)論文章的84篇醫(yī)學(xué)文章摘要,研究了動(dòng)詞時(shí)態(tài)的分布。他發(fā)現(xiàn)不同的動(dòng)詞時(shí)態(tài)用于不同的功能,過(guò)去時(shí)大部分用來(lái)描述研究目的、方法和結(jié)果;現(xiàn)在時(shí)主要用來(lái)某些發(fā)現(xiàn)、結(jié)論和建議的總結(jié)中。Sallager-Meyer的研究結(jié)果與Tseng(2011)的研究結(jié)果略有不同。Tseng研究了三種應(yīng)用語(yǔ)言學(xué)期刊的90篇論文摘要的move結(jié)構(gòu)以及每種move的動(dòng)詞時(shí)態(tài)。他發(fā)現(xiàn)摘要呈現(xiàn)出four-move的結(jié)構(gòu),現(xiàn)在時(shí)通常用來(lái)描述背景、目的和結(jié)論,過(guò)去時(shí)主要用于描述研究方法和研究結(jié)果。Liu(2012)利用當(dāng)代美國(guó)英語(yǔ)語(yǔ)料庫(kù)和英國(guó)國(guó)家語(yǔ)料庫(kù)的學(xué)術(shù)寫(xiě)作子語(yǔ)料庫(kù),發(fā)現(xiàn)了在一般學(xué)術(shù)寫(xiě)作中使用頻率最高的多詞序列(MWCs)(包括習(xí)語(yǔ)、詞簇、短語(yǔ)動(dòng)詞等)。
為了本研究的目的,作者首先建設(shè)了一個(gè)將近9萬(wàn)字的小型特殊用途語(yǔ)料庫(kù)(見(jiàn)表一)。語(yǔ)料取自應(yīng)用語(yǔ)言學(xué)方向639篇論文的全部摘要,通過(guò)在線(xiàn)數(shù)據(jù)庫(kù)ScienceDirect下載。639篇論文摘要中有367篇摘自English for Specific Purpose,其余 272篇摘要選自Journal of English for Academic Purpose。從發(fā)表時(shí)間上看,所有論文都是在2000年到2013年之間發(fā)表的,從而保證語(yǔ)料的及時(shí)性和最新性。
表一
表一中,平均來(lái)看,EAP期刊每篇論文摘要的字?jǐn)?shù)要多于ESP期刊。從某種程度上我們可以說(shuō),EAP的論文較ESP更加豐富。在“類(lèi)符/形符比”這一列,可以發(fā)現(xiàn)隨著語(yǔ)料庫(kù)庫(kù)容的增加,“類(lèi)符/形符比”逐漸減小。這是因?yàn)椤皌here is more repetition of individual words in longer texts ”(Biber et al,1999)。
本研究的語(yǔ)言分析是利用免費(fèi)語(yǔ)料庫(kù)檢索軟件AntConc 2.3.1,并在三種層次上分別進(jìn)行分析:?jiǎn)卧~、多詞序列和整個(gè)語(yǔ)料庫(kù)水平。在每個(gè)水平上,分別對(duì)EAP和ESP進(jìn)行分析。在單詞水平上,本研究比較了兩種語(yǔ)料庫(kù)的詞頻表。在多詞序列上,考慮到兩種期刊的名稱(chēng)為English for Specific Purposes和English for Academic Purposes,所以本文采用4詞序列。在語(yǔ)料庫(kù)水平上,分別研究了“academic”和“specific”各語(yǔ)料庫(kù)中的分布情況。
表二 詞頻表
詞頻表可以用來(lái)發(fā)現(xiàn)不同語(yǔ)料庫(kù)的差異。表二分別列出了在兩種摘要中出現(xiàn)頻率最高的前十五個(gè)單詞。我們可以看到兩者之間存在驚人的相似,甚至前六個(gè)最高頻的詞排列順序都一樣。總的來(lái)看,出現(xiàn)頻率最高的是功能詞,如 the,of,and,in 和 to。 這也驗(yàn)證了其他語(yǔ)料庫(kù)相關(guān)研究中指出的,虛詞比實(shí)詞出現(xiàn)的頻率更高。從第七個(gè)高頻詞開(kāi)始,我們發(fā)現(xiàn)了不同。EAP 的實(shí)詞(academic,writing,students,english)比ESP中的實(shí)詞(english,reserach)更多。從實(shí)詞的內(nèi)容上,我們還可以看出,EAP更多的是關(guān)注教學(xué)方面,而ESP更多關(guān)注的是研究領(lǐng)域。
在出現(xiàn)次數(shù)最高的四次序列中,有五分之四的多詞序列都包含單詞“academic”。另外,有大量的“university”,“second language”表明 EAP 中的論文主要側(cè)重于教學(xué)方面。而ESP期刊則沒(méi)有表現(xiàn)出這個(gè)特點(diǎn)。
在單詞/短語(yǔ)使用和結(jié)構(gòu)安排上,兩種期刊也表現(xiàn)出不同。在EAP中,作者通常先表明他們論文的目的(如,“Abstract The purpose of...”),而 ESP 中,作者通常傾向于先闡述論文的內(nèi)容和方法論(如,“This paper reports...”)。 請(qǐng)看下例:
The present paper reports an investigation into the use of linking adverbials in the academic writing of Chinese doctoral students.”
除了上述差別外,兩種期刊的摘要也有相同點(diǎn),都使用了大量相同的固定短語(yǔ),如: “the extent to which”,“the ways in which”,“in/on a corpus of”,“in the context of”。
分別用單詞“academic”和“specific”得到兩個(gè)單詞在語(yǔ)料庫(kù)中的分布圖如圖一和圖二。
分析之前,需要知道每一條豎杠代表該單詞出現(xiàn)一次。從第一張圖中可看出,“academic”在EAP中總共出現(xiàn)了535次,在ESP中出現(xiàn)了225次。從圖片上可以直觀地看到,“academic”一詞在EAP的分布要“濃”于 ESP。 也即,“academic”一詞在 EAP中出現(xiàn)的次數(shù)要遠(yuǎn)遠(yuǎn)多于在ESP中出現(xiàn)的次數(shù)。具體從數(shù)字上來(lái)講,“academic”一詞出現(xiàn)在EAP中的頻率是出現(xiàn)在ESP中的兩倍。如果再考慮到每種期刊選取的摘要數(shù)量,這一對(duì)比就更加明顯了:EAP共選取了272篇摘要,也即每篇摘要中出現(xiàn)1.97次;而ESP中每篇摘要只出現(xiàn)了0.69次,只有EAP的三分之一。你也許會(huì)發(fā)現(xiàn)在第一張圖的中間,前半部分豎杠的密度要大于后半部分,這是因?yàn)镋AP的語(yǔ)料位于ESP的語(yǔ)料的前面。
圖二 “Specific”分布
同樣可以得到“specific”的對(duì)比結(jié)果?!皊pecific”在EAP中出現(xiàn)了54次,在ESP中出現(xiàn)了101次。表面上看 “specific”出現(xiàn)在ESP中的頻率是出現(xiàn)在EAP中的兩倍。但當(dāng)考慮到每種摘要的數(shù)量時(shí)就會(huì)發(fā)現(xiàn),其實(shí)“specific”在兩種摘要中出現(xiàn)的頻率大致相同,分別為EAP中的0.202次、ESP中的0.27次。
在本研究中,作者自建了一個(gè)大約9萬(wàn)字的論文摘要小型語(yǔ)料庫(kù),語(yǔ)料選自網(wǎng)絡(luò)數(shù)據(jù)庫(kù)ScienceDirect的兩個(gè)期刊共639篇論文的摘要。利用基于語(yǔ)料庫(kù)的方法發(fā)現(xiàn)了論文摘要的性質(zhì)、兩種摘要的異同。EAP更加側(cè)重于教學(xué)方面,而ESP更多的是關(guān)注研究。此外兩者的結(jié)構(gòu)也有所差異?;谡Z(yǔ)料庫(kù)的研究方法在研究風(fēng)格差異、觀察單詞和搭配使用情況以及識(shí)別重復(fù)使用的語(yǔ)言模式等內(nèi)容時(shí)十分有用。本研究也為論文寫(xiě)作的教學(xué)提供了實(shí)證,其他研究者也可以根據(jù)研究目的的不同重復(fù)該研究采用的方法及借鑒該過(guò)程。
[1]Awal,N.M.,Zainuddin,I.S.&Abdullah,I.H.Use of Comparable Corpus in Teaching Translation[J].Procedia Social and Behavioral Sciences,2011(18):638-642.
[2]Biber,D.,Conrad,S.&Reppen,R.Corpus linguistics[M].Cambridge University Press,2000.
[3]Charles,M.Proper vocabulary and juicy collocations:EAP students evaluate do-it-yourself corpus-building[J].English for Specific Purposes,2012(31):93-102.
[4]Chen,X.X.&Ge,S.L.The Construction of English-Chinese Parallel Corpus of Medical Works Based on Self-Coded Python Programs[J].Procedia Engineering,2011(24):598-603.
[5]Liu,D.L.The most frequently-used multi-word constructions in academic written English:A multi-corpus study[J].English for Specific Purposes,2012(21):25-35.
[6]Supatranont,P.Developing a writing template of research article abstracts:a corpus-based method[J].Procedia-Social and Behavioral Science,2012(66):144-156.
[7]Valipouri,L.&Nassaji,H.A corpus-based study of academic vocabulary in chemistry research articles[J].Journal of English for Academic Purposes,2013(12):248-263.
[8]陳明瑤.ESP與語(yǔ)料庫(kù)建設(shè)[J].外語(yǔ)研究,2000(64):60-61.
[9]王立非,文秋芳.“中國(guó)學(xué)生英語(yǔ)口筆語(yǔ)語(yǔ)料庫(kù)”的建設(shè)與研究評(píng)述[J].外語(yǔ)界,2007(1):118,22-28.
[10]謝家成.小型英漢平行語(yǔ)料庫(kù)的建立與運(yùn)用[J].解放軍外國(guó)語(yǔ)學(xué)院學(xué)報(bào),2004(3):45-48.
[11]楊端和.大學(xué)英語(yǔ)四、六級(jí)考試語(yǔ)料庫(kù)建設(shè)分析[J].外語(yǔ)電化教學(xué),2007(1):113,50-55.
[12]鄭志恒.美英報(bào)刊英語(yǔ)標(biāo)注語(yǔ)料庫(kù)的建設(shè)研究[J].外語(yǔ)研究,2007(2):102,32-38.