宋曉舟
(1.福建師范大學 外國語學院,福州 350007;2.福建工程學院 人文學院,福州 350118)
翻譯的研究早已超越了一門學科的限制,成為了一門交叉學科[1]。語料庫的出現(xiàn)不僅為語言研究者們提供了一種新的研究方法,同時也提供了一種新的思維方式[2]。在1993年Mona Baker率先將語料庫運用在翻譯研究后,各國學者開始了對語料庫翻譯學的研究,二十年來碩果累累[3]。在這二十年中,語料庫翻譯學經(jīng)歷了從研究途徑到方法論,再到一種新研究范式的發(fā)展過程,取得了可觀的成績[4]?!罢Z料庫翻譯研究出現(xiàn)在翻譯研究發(fā)展的關(guān)鍵時刻……整個翻譯研究中的各種爭論都在語料庫翻譯研究中得到了反映?!保?]
對語料庫翻譯學進行知識結(jié)構(gòu)的梳理對了解該領(lǐng)域的發(fā)展動態(tài)具有極高的價值。但是由于國際語料庫翻譯學的研究結(jié)合了語料庫語言學和翻譯學,研究文獻的來源復(fù)雜,傳統(tǒng)的文獻回顧方式很難理清這其中的復(fù)雜網(wǎng)絡(luò)關(guān)系。因此,本研究將應(yīng)用美國德雷塞爾大學(Drexel University)陳超美教授開發(fā)的CiteSpaceⅢ(版本:3.9.R6.64-bit)可視化圖譜分析工具進行分析[6]。該工具是將科學計量學信息可視化方法、文獻計量法和數(shù)據(jù)挖掘算法集成起來,可實現(xiàn)在引文數(shù)據(jù)中根據(jù)提取模式來設(shè)置交互式可視化工具,建立“引文”與“共引”節(jié)點之間的關(guān)聯(lián)性繪制可視化網(wǎng)絡(luò)圖譜信息[6]。因此,利用此軟件繪制出語料庫翻譯學的知識圖譜,將有助于研究者們更加準確地從龐雜的資料中篩選出有價值的信息。
本研究將所需的數(shù)據(jù)定位于美國科學情報研究所(Institute for Scientific Information)所編制的Web of Science(簡稱WoS)核心數(shù)據(jù)庫中SSCI(社會科學引文索引)、A&HCI(人文科學引文索引)和CPCI-SSH(社會科學及人文科學會議錄索引)所收錄的學術(shù)論文(截止至2014年)。借助可視化分析工具CiteSpaceⅢ進行語料庫翻譯學的定量與定性研究。具體通過以下兩個步驟來完成數(shù)據(jù)的采集和編輯:
首先是精確檢索:為了加強數(shù)據(jù)檢索的準確性,本研究采用交集(AND)和并集(OR)為檢索邏輯關(guān)系,在WoS核心數(shù)據(jù)庫中,以主題詞(Topic)=“translat*AND corpus OR corpora”進行精確定位檢索,共得到1 053條檢索結(jié)果。
其次是數(shù)據(jù)精煉:將研究文獻類型定位于“Article”,因此去除其他類型文獻(note,discussion,review 等)和研究領(lǐng)域定位于“Language Linguistics”和“Linguistics”,進一步精煉,最終得到439條文獻材料為本研究分析的元數(shù)據(jù),以純文本的TXT 格式導出。
根據(jù)WoS核心數(shù)據(jù)庫下載的數(shù)據(jù)顯示,語料庫翻譯學最早的文獻出自于1993年。因此,本研究將CiteSpaceⅢ中的時間分區(qū)(Time Slicing)設(shè)置為1993-2014年,以1年為切分閾值對所有數(shù)據(jù)中的標題、摘要和關(guān)鍵詞進行分析。為了全面顯示出每年關(guān)于語料庫翻譯學研究的每個文獻之間的共被引關(guān)系、文獻的核心度和最具代表性的前沿文獻,提取語料庫翻譯學研究的熱門關(guān)鍵詞、核心文獻及其所在的國家和機構(gòu),本研究將其文獻共被引頻次定位在以1年為時間切片,提取每個時間切片區(qū)域中所有的學術(shù)論文。因此將Top N 的閾值設(shè)定為50,Pruning算法選擇最小網(wǎng)格分割的形式(Minimum Spanning Tree)將每個時間分區(qū)提取網(wǎng)絡(luò)的時間細化。視覺可視化效果選擇為靜態(tài)(Cluster View Static)顯示最終的網(wǎng)絡(luò)圖譜效果。
在最終顯示的可視化網(wǎng)格中,每個節(jié)點(N)代表1個作者/機構(gòu)/國家/被引的文獻,連線(E)代表節(jié)點之間的共被引的數(shù)量連接線,共同組合形成一個龐大的共被引網(wǎng)絡(luò)體系[7]。節(jié)點越大表示關(guān)鍵詞/文獻被引的頻次越高,采用國家/研究機構(gòu)進行分析時,則表示所發(fā)表的文獻頻次越多。帶有紫色圓圈標記的節(jié)點表明該節(jié)點是關(guān)鍵節(jié)點,紫色線框越粗其中心權(quán)重值越高。關(guān)鍵節(jié)點是共被引網(wǎng)絡(luò)圖譜中連接2個及以上不同的聚類的過渡點或橋梁,且是中心權(quán)重值和共被引頻次較高的節(jié)點[6]。其代表了一個研究方向(聚類,Cluster)向另一個研究方向(聚類)的躍遷,具有指引研究方向演變過程的作用。
(1)發(fā)文量年份分布 下頁圖1顯示,第一篇語料庫翻譯學的論文出現(xiàn)于1993年,在隨后的10年發(fā)展并不迅速,而2009年是語料庫翻譯學研究的轉(zhuǎn)折點,發(fā)表的論文數(shù)目開始呈顯著的上升趨勢,從2008年的25篇激增至2009年的63篇,隨后雖然數(shù)目略有下降,但已基本趨于平穩(wěn)。
圖1 語料庫翻譯學的年發(fā)文量分布圖
(2)發(fā)文量國家機構(gòu)分布及作者 語料庫翻譯學的分布在全球呈不平衡態(tài)勢。表1顯示,令人意外的是,作為語料庫翻譯學的發(fā)源地英國并不是這一領(lǐng)域的最高產(chǎn)國,西班牙后來居上,成為這一領(lǐng)域最高產(chǎn)的國家,發(fā)文量高達64篇。而英國屈居第二,發(fā)文量為49篇。歐洲已經(jīng)成為語料庫翻譯學的研究重鎮(zhèn),排名前10位的國家有6個都來自于歐洲,其他的4個國家則分別是美國、中國、南非和加拿大。中國學者共發(fā)文27篇,排名第5,也是語料庫翻譯學研究的中堅力量之一。這一領(lǐng)域最高產(chǎn)的作者是Miguel A.Jimenez-Crespo,發(fā)文量為6篇。Jimenez-Crespo博士是美國羅格斯大學(Rugers University)翻譯專業(yè)的副教授,他主要研究領(lǐng)域為翻譯研究、語料庫語言學與翻譯研究、口譯研究及本地化研究。根據(jù)谷歌學術(shù)的數(shù)據(jù),他的所有文章被引數(shù)量高達128次,可以說是目前國際語料庫翻譯學領(lǐng)域的領(lǐng)軍人物之一。發(fā)文量為4篇的學者共有7位,他們分別來自6個不同的國家:西班牙、匈牙利、以色列、美國、英國和德國,其中來自西班牙的作者有2位。而這也與高產(chǎn)國的排名基本相同,說明每個國家都有領(lǐng)跑學者,且學者們的實力分布均衡。
表1 語料庫翻譯學研究最高產(chǎn)的10個國家和排名前10位作者
下頁表2展示了語料庫翻譯學研究發(fā)文量排名前10位的科研機構(gòu)(共12所),其中比利時的根特大學排名第一,西班牙的大學共有4所上榜,這與西班牙發(fā)文量位于全球第一的地位相吻合,也說明西班牙大學的研究實力分布均衡。美國也有2所高校上榜,分別是羅格斯大學和馬里蘭大學。匈牙利和以色列這兩個國家的總發(fā)文量雖未進入前10名,卻各自有一所大學上榜。反之,雖然中國的總發(fā)文量位居全球第五,但沒有一所中國研究機構(gòu)上榜,這說明中國的研究相對分散,并沒有形成很好的研究團隊。
表2 語料庫翻譯學研究排名前10位的研究機構(gòu)
(3)聚類分析 通過聚類分析,我們可以了解全球該領(lǐng)域研究的側(cè)重點(如圖2所示)。西班牙發(fā)文量排名第一,從聚類分析中我們可以看出,他們的研究重點包括科學文獻(#27science documentaries)和術(shù)語變化(#0termiological variation),可以說是側(cè)重于非文學翻譯的研究,而這與排名第十的加拿大(#9hongloumeng)形成了鮮明對比。中國的研究則集中在學生的翻譯用法方面(#5translation students use),美國側(cè)重于理論方面的建設(shè)(#3new framework),而德國的研究重點則在于機器翻譯部分(#4Czech-English phrase-based machine translation),南非的研究關(guān)注譯者策略(#7translators strategies),可以說都有自己所擅長的領(lǐng)域。
而有些總發(fā)文量雖然未進入前10名,但是它們的研究也極具特色,在圖2的聚類中凸顯出來:例如丹麥的研究側(cè)重于翻譯教學(#11classroom teaching),日本更注重源語的影響(#13source language effect),而荷蘭的研究重點在詞匯形態(tài)學(#10lexical morphology)。
圖2 研究力量聚類共現(xiàn)知識圖譜
通過CiteSpaceⅢ對被引文獻進行運算,共得到777篇被引文獻節(jié)點和844條接點連接線,知識來源可追溯到1898年Bosworth Joseph所編著的AnAnglo-SaxonDictionary。
下頁表3顯示,所有被引用文獻中,出現(xiàn)頻率最高的為Toury于1995年所著的《描述翻譯學及其他》(DescriptiveTranslationStudiesandBeyond),且中心度高達0.4。Laviosa指出:“語料庫翻譯研究的問世主要受兩個研究領(lǐng)域的影響,一個是語料庫語言學,另一個是描寫性譯學研究”[8],而Toury正是描寫學派的代表人士。描寫翻譯研究的核心概念在“為什么這樣翻譯”而非“如何翻譯”[9],而Toury的這本著作構(gòu)建了描寫譯學的構(gòu)架,對描寫翻譯研究的概念作了最大程度的發(fā)展,它的出版也標志著翻譯學從規(guī)定性到描寫性的轉(zhuǎn)向。根據(jù)馮佳等的研究,這本書同樣是近二十年來國際翻譯學界引用最高的文獻,是翻譯學發(fā)展史上的標志性文獻[10]。Toury也于2012年推出了全新的修訂版。
被引排名第2、第3和第4的文獻都來自于Mona Baker教授,同時,根據(jù)CiteSpaceⅢ對被引作者的總頻次統(tǒng)計,她的總被引量也是位居所有作者之首。Mona Baker是曼徹斯特大學(The University of Manchester)的教授、翻譯研究中心主任;她是語料庫翻譯學的創(chuàng)始人之一,于1995年創(chuàng)建了世界上第一個可比語料庫(Translational English Corpus)。Baker教授在論文集Textandtechnology:In honourofJohnSinclair中發(fā)表的論文《語料庫語言學與翻譯研究——啟示與應(yīng)用》(Corpus linguistics and translation studies:Implications and applications)[3]一文在所有被引文獻中位居第2;在這篇論文中,Baker提出翻譯共性的概念,并指出翻譯共性包括顯化、消歧、簡化、合乎語法化、避免重復(fù)、凸顯目標語語言特征等[3]。翻譯共性一直是語料庫翻譯學的研究熱點,但是許多學者對翻譯共性的研究是否具有價值也存在著質(zhì)疑[4,11]。
她的另外兩篇論文《翻譯研究中的語料庫:回顧及對未來研究的建議》(Corpora in translation studies:An overview and some suggestions for future research)[12]和《基于語料庫的翻譯研究》(Corpusbased translation studies:The challenges that lie ahead)[13]也都是語料庫翻譯學中的經(jīng)典之作,后者的中心度更是高達0.42。Baker在這兩篇文章中提出了基于類比語料庫(comparable corpus)來進行翻譯共性的研究[12,13],這不同于傳統(tǒng)的雙語對比模式,并未關(guān)注源語對譯語的影響,同樣受到了不少學者的質(zhì)疑[14-16]。Baker與她的同事Olohan合著的《翻譯英語中的that:顯化潛意識處理的證據(jù)?》(Reportingthatin translated English.Evidence for subconscious processes of explicitation?)也排名第9[17]。另外兩位上榜作者Laviosa和Kenny也均為Mona Baker的學生[8,18],他們的文章也都是圍繞同一語言內(nèi)的翻譯共性進行研究,Kenny 更是認為“普遍性是一種總體的傾向,與譯者、語言、文體和時代無關(guān)”[18]。這充分說明了Mona Baker在語料庫翻譯學發(fā)展中的巨大影響力,但如何突破Mona Baker的研究理論和模式則成為后來者的巨大挑戰(zhàn)。
表3 被引用量前10名的文獻
另外值得關(guān)注的文獻是由Quirk主編,1985年出版的《英語語法大全》(AComprehensiveGrammaroftheEnglishLanguage),其被引頻率排名第10。這本書具有“客觀論證的特色”[19],采用語料庫驗證語法例句,是具有權(quán)威性的現(xiàn)代英語語法書。許國璋先生曾經(jīng)這樣評價過這本書:“近時英國學術(shù)史上的一部力作?!保?9]同時,這本書是被引率前10名中唯一一本非翻譯類文獻,表明了語法特征也是研究者們進行翻譯研究的一個重點。
文章的關(guān)鍵詞是一篇論文核心內(nèi)容的高度概括和凝結(jié),關(guān)鍵詞出現(xiàn)的頻率高低可以幫助我們了解這一領(lǐng)域的熱點話題。為了廓清語料庫語言學的研究熱點,我們對文章出現(xiàn)的高頻關(guān)鍵詞進行可視化分析(如圖3所示):節(jié)點越大,則說明該關(guān)鍵詞出現(xiàn)頻率越高。
圖3中最大的五個節(jié)點為:翻譯(translation)、英語(English)、語料庫(corpus)、語料庫語言學(corpus linguistics)和基于語料庫的翻譯(corpus-based translation studies)。而其他的研究熱點還包括:平行語料庫(parallel corpus/corpora)、對比分析(contrastive analysis)、術(shù)語研究(terminology)、機器翻譯(machine translation)、視聽翻譯(audiovisual translation)、明晰化(explicitation)、翻譯共性(translation universals)、新聞翻譯(news translation)和文學翻譯(literary translation)等。
圖3 高頻關(guān)鍵詞共現(xiàn)知識圖譜
對語料庫翻譯學研究前沿的分析,可以幫助研究者們準確地把握該學科的研究前沿和最新進展,并展望未來的研究方向。通過CiteSpaceⅢ的突現(xiàn)詞(burst term)功能分析詞頻的時間分布和動態(tài)變化,提取頻次增長迅速的“突現(xiàn)詞”,可以較為準確地反映和揭示該研究領(lǐng)域的前沿研究。本研究通過CiteSpaceⅢ對語料庫翻譯學的主題詞進行突現(xiàn)詞探測,共出現(xiàn)18個突現(xiàn)詞(如圖4所示)。其中英語翻譯研究(English-translations)和中英翻譯研究(Chinese-English)突現(xiàn)次數(shù)都有5次,這說明英語仍是目前語料庫翻譯學研究的核心,而中文也慢慢開始引起國際學者的注意,這也是未來中國學者可以大展身手的領(lǐng)域。而另一方面,非洲語言(African-languages)在突現(xiàn)詞中出現(xiàn),這也充分說明了語料庫翻譯學研究熱點的轉(zhuǎn)向。研究論文(research-articles)和科普讀物(popular-science)的出現(xiàn)則表明非文學翻譯已成為新的研究熱點;同聲傳譯(simultaneous-interpreting)的出現(xiàn)表明口譯語料庫已成為未來的熱門趨勢。另一方面,譯員培訓(translator-training)、翻譯過程(translation-process)、翻譯能力(translation-competence)的出現(xiàn)也證明了跨學科研究會成為未來語料庫翻譯學的發(fā)展方向,未來結(jié)合心理語言學、認知語言學的研究也將成為主流。
圖4 突現(xiàn)詞共現(xiàn)知識圖譜
雖然語料庫翻譯學的歷史只有短短二十年,但是由于結(jié)合了語料庫語言學和翻譯學的相關(guān)知識,不斷有新的研究方向出現(xiàn),因此其知識結(jié)構(gòu)盤根錯節(jié)。本文借助可視化計量工具CiteSpaceⅢ對Web of Science數(shù)據(jù)庫中所收錄的439篇國際語料庫翻譯學文獻進行分析,挖掘語料庫翻譯學的研究力量分布、研究知識來源、研究熱點和前沿研究,通過可視化圖譜展示了該領(lǐng)域的研究現(xiàn)狀、核心研究課題以及未來的研究熱點,為研究者們了解國際語料庫翻譯學的知識結(jié)構(gòu)以及國際動態(tài)提供了參考。
[1]胡顯耀.語料庫翻譯研究與翻譯普遍性[J].上海科技翻譯,2004,(4):47-49.
[2]Svartvik J.Corpora are becoming mainstream[M]//Thomas J,Short M.Using corpora for language research.London:Longman,1996:3-13.
[3]Baker M.Corpus linguistics and translation studies:Implications and applications[M]//Text and technology:In honour of John Sinclair.Philadelphia and Amsterdam:John Benjamins,1993:233,250.
[4]黃立波,王克非.語料庫翻譯學:課題與進展[J].外語教學與研究,2011,(6):911-923,961.
[5]Tymoczko M.Computerized corpora and the future of translation studies[J].Meta:Journal des traducteurs/Meta:Translators'Journal,1998,(4):652-660.
[6]Chen C,Chen Y.Searching for clinical evidence in CiteSpace[C]//AMIA Annual Symposium Proceedings.American Medical Informatics Association,2005:121-125.
[7]劉 建.元數(shù)據(jù)文獻共引關(guān)系的可視化分析——利用CiteSpaceⅢ進行趨勢分析[J].中國科技資源導刊,2013,(2):80-84.
[8]Laviosa S.Corpus-based translation studies:theory,findings,applications[M].Amsterdam:Rodopi,2002:5.
[9]Holmes J S.The name and nature of translation studies[M]//Holmes J S.Translated!Papers on literary translation and translation studies.Amsterdam:Rodopi,1988:67-80.
[10]馮 佳,王克非,劉 霞.近二十年國際翻譯學研究動態(tài)的科學知識圖譜分析[J].外語電化教學,2014,(1):11-20.
[11]House J.Beyond intervention:Universals in translation?[J].Trans-kom[online],2008,(1):6-19.
[12]Baker M.Corpora in translation studies:An overview and some suggestions for future research[J].Target,1995,(2):223-243.
[13]Baker M.Corpus-based translation studies:The challenges that lie ahead[M]//Somers H.Terminology,LSP and translation.Amsterdam:John Benjamins,1996:175-186.
[14]Teich E,Hansen S,F(xiàn)ankhauser P.Representing and querying multi-layer annotated corpora[C]//Proceedings of the IRCS Workshop on Linguistic Databases.Philadelphia,PA,2001:228-237.
[15]吳 昂,黃立波.關(guān)于翻譯共性的研究[J].外語教學與研究,2006,(5):296-302,320.
[16]黃立波,王克非.翻譯普遍性研究反思[J].中國翻譯,2006,(5):36-40.
[17]Olohan M,Baker M.Reportingthatin translated English.Evidence for subconscious processes of explicitation?[J].Across Languages and Cultures,2000,(2):141-158.
[18]Kenny D.Lexis and creativity in translation:A corpus-based study[M].Manchester:St.Jerome Pubishing,2001:52.
[19]許國璋.再評夸克[J].外國語,1989,(3):3-13.