国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

《論語》漢德平行語料庫的建設

2018-08-21 05:06李小龍
文教資料 2018年4期
關鍵詞:論語

摘 要: 近年來平行語料庫相關研究受到國內(nèi)外學者們的重視。漢德平行語料庫相關研究相對處于起步階段,本文以自建《論語》漢德平行語料庫為例,敘述了漢德平行語料庫的建設步驟、語料對齊,并介紹需使用的軟件。

關鍵詞: 漢德平行語料庫 語料庫建設 《論語》 衛(wèi)禮賢

1.平行語料庫

“平行語料庫”是英語術(shù)語“parallel corpus”翻譯而成,但我國學者對該術(shù)語的翻譯存在差異。國內(nèi)使用較多的術(shù)語是“平行語料庫”,還有“對應語料庫”、“平行對應語料庫”、“對譯語料庫”、“并行語料庫”和“對照語料庫”等表述。本文采用“平行語料庫”這一使用較多的術(shù)語。

雙語平行語料庫自20世紀90年代開始研制,在計算機語言學中蓬勃發(fā)展,并滲透到其他方面。由于平行語料庫既含有源語篇章又含有其平行對應的目的語篇章,因而可用于目的語篇章與源語篇章的對比分析。平行語料庫可為實證研究、對比語言學和翻譯研究提供研究基礎,也可用于雙語詞庫的提取、雙語詞典的編纂、機器翻譯和語言工作領域。

在國外,荷蘭、挪威、英國、美國、加拿大等許多國家都建立了涉及不同語種的規(guī)模不同的平行語料庫。內(nèi)地及港澳臺的不少大學和語言研究中心分別建立了側(cè)重點不同的“英漢雙語語料庫”。北京外國語大學中國外語教學研究中心還推出了漢英、漢日兩個對應庫的大型“雙語平行語料庫”。

國內(nèi)德語界基于漢德平行語料庫的建設和研究幾年前已經(jīng)啟動,標志是錢敏汝2011年主持的“中國科學院自動化研究所模式識別國家重點實驗室與北京外國語大學聯(lián)合開展德漢雙語語料庫研究項目”。目前基于漢德平行語料庫在翻譯方面做出的研究是筆者的博士論文《基于語料庫對<論語>衛(wèi)禮賢德譯本的跨文化研究》,此外,葛囡囡的博士論文《語料庫支持下的專利文獻德漢翻譯探究——一項篇章語用學視角下的研究》也是借助德漢平行語料庫對專利文獻做出的研究。

在筆者的博士論文研究中,通過自建小型《論語》漢德平行語料庫,借助ParaConc軟件,將平行語料庫的檢索和研究方法運用到中國文化特色詞語的翻譯當中,在漢德平行語料庫方面的研究做出了新的嘗試和開拓。

2.《論語》漢德平行語料庫的創(chuàng)建方法

平行語料庫的創(chuàng)建與普通語料庫的創(chuàng)建相比,既有相同之處又有特殊之處。平行語料庫的準備過程與普通語料庫有共同之處,都需將紙質(zhì)語料掃描、轉(zhuǎn)化和校對或?qū)﹄娮诱Z料篩選整理。與普通語料庫不同的是,平行語料庫的創(chuàng)建還需要進行雙語語料之間的對齊,即將源語篇章與目的語篇章建立起段落或者句子層面(甚至是詞語層面)的對應?!罢Z料間的對齊在平行語料庫的建設使用中都是一個關鍵步驟”(McEnery/Xiao/Tono,2006:50)。

2.1建立單語語料庫

建立單語語料庫是建立平行語料庫之前的一個重要步驟,工作量較大,主要涉及篇章的收集、掃描、錄入和反復校對。筆者博士論文研究中自建《論語》漢德平行語料庫的單語純篇章語料庫包括《論語》中文20篇,衛(wèi)禮賢的德語文獻型翻譯20篇,衛(wèi)禮賢的德語工具型翻譯20篇。篇章獲取的來源主要有兩種:一是電子文稿;二是紙質(zhì)印刷體。

《論語》中文版本在網(wǎng)上搜集電子文稿,然后以楊伯峻《論語譯注》為基礎,通過人工校對排除異同。采用楊伯峻的《論語譯注》為本語料庫中文版本有以下幾個考慮:首先,衛(wèi)禮賢翻譯《論語》的參考文獻中列出了《四書會解》《宋本十三經(jīng)注疏》《古經(jīng)解》《皇清經(jīng)解》《鄉(xiāng)黨句解》《困學紀聞》等書籍,但對使用的版本未明確說明,其使用的中文版本在當今學界研究中尚未有明確發(fā)現(xiàn);其次,楊伯峻的《論語譯注》在國內(nèi)外產(chǎn)生過重大影響,“已成為世界上許多大學的文科教材或重要參考書”(楊逢彬,2008:30),而楊伯峻編寫這本書的出發(fā)點是“幫助一般讀者比較容易而正確地讀懂論語,并給有志深入研究的人提供若干線索”(楊伯峻,2010:34)?!墩撜Z》的版本章節(jié)分合本來在“歷代版本和各家注本相互間稍有出入”(同上),楊伯峻在斟酌取舍之后在各篇篇名之下,簡略說明各重要注解本的異同。綜合考慮,筆者認為,楊伯峻的《論語譯注》對于當今普通讀者的閱讀和學習,比朱熹的《四書集注》或者《宋本十三經(jīng)注疏》等更適宜。

德語的譯本采取了Anaconda出版社2007年版本的Konfuzius Gespr?覿che為目的語篇章,該版本以1914年的版本(為衛(wèi)禮賢翻譯出版《論語》的第二版)基礎重印。此版本中衛(wèi)禮賢對漢語源文篇章多同時采取兩種翻譯方法,即文獻型翻譯和工具型翻譯,兩種譯本采用不同的字體和字號加以區(qū)分。

德語單語語料庫的建設具體為:首先用掃描儀將紙質(zhì)版掃描為PDF格式保存在電腦中,借助OCR識別軟件將其轉(zhuǎn)變成可編輯的Word文檔,進行人工校對和復查錯誤,使之成為準確率高的文檔之后,通過人工干預將其分為兩個文檔,一個是文獻型翻譯篇章,一個是工具型翻譯篇章。

在單語語料庫的建設過程中,筆者還參考了朱熹《四書集注》的章節(jié)劃分,也參考了Zweitausendeins出版社出版衛(wèi)禮賢的Die Lehre des Konfuzius一書中的《論語》部分,該書漢語采用的是上海古籍出版社2004年出版折金良年的《論語譯注》;此外,部分參考了外語教學與研究出版社出版的“大中華文庫——漢德對照”《論語》一書,該書漢語部分采用楊伯峻的《論語譯注》,德語部分是衛(wèi)禮賢譯本中的文獻型翻譯部分,工具型翻譯及注釋等并未在該書中出現(xiàn)。

完成中德文篇章的數(shù)字化以后將篇章存儲為純文本文檔,對于不同語言種類的篇章,格式上也有不同要求:中文文本使用的標點符號為中文全角符號,德文文本使用的標點符號是德文符號,其中德文文本在保存的時候需要用Unicode格式保存,否則德語特殊的字母,?覿、?觟、ü和?覻將無法正常顯示。

2.2建立雙語平行語料庫

在經(jīng)過數(shù)字化加工之后的單語純篇章語料庫基礎之上,需要使用軟件進一步處理和手工對齊才能建成可以使用的平行語料庫。需特別注意的是,為了在ParaConc中搜索中文,需要在中文字符之間插入一個空格,否則將無法檢索(在檢索時,如果是兩個或兩個以上中文字,之間需加入空格),可借助Word添加空格的功能在所有字符之間插入一個空格。鑒于漢德兩種語言之間的較大差異,尤其《論語》其先秦古漢語本身的語言特點,兩種語言句子屬性的自動標注是不易實現(xiàn)的。目前還沒有程序可以做到高準確率把中國古漢語的典籍篇章與其德語譯本自動對齊。所以,要做到句子級別上的精準度,大量手工操作是必不可少的。

德語目的語篇章和中文源語篇章在章節(jié)上的差別為:德語版的一個章節(jié)對應漢語版的兩章節(jié)或多章節(jié)共有13處,對待這類情況,筆者按照漢語的章節(jié)將德語譯本的這一部分分成對應的兩部分或多個部分,同時將這一部分德語版本中的德語小標題復制粘貼到后面部分之前作為小標題。其后章節(jié)編號仍承襲之前的編號不變。這種情況下,添加了16個復制的小標題。

此外,還有3處為漢語版一章節(jié)對應德語版的兩章節(jié),這種情況,筆者按照漢語的章節(jié)將德語譯本的兩章節(jié)合并為一章節(jié),同時將第二章節(jié)的德語標題移至第一章節(jié)的德語標題處與第一章節(jié)的標題合并。其后章節(jié)編號仍承襲之前的編號不變。這種情況下,小標題數(shù)量并沒有變化,只是為對齊而調(diào)整了3處位置。

由于漢德語言之間的差異及《論語》本身先秦古漢語的語言特點,對其句子結(jié)構(gòu)屬性的劃分和界定尚且沒有可以借鑒的語言模型套用。鑒于筆者博士論文研究出發(fā)點,在參考前人研究的基礎之上,結(jié)合自建語料庫本身的特點,筆者將句號、分號、感嘆號、句末的轉(zhuǎn)折號及后接直接引語的冒號或逗號作為劃分漢語純文本最小句子單位的依據(jù),并在此基礎上對漢語純文本中界定的句子逐一進行了手工處理。比照漢語純文本的句子分級,可以對德語篇章進行手工處理加工,導入Excel中將兩個文本完成初步的句級對齊,將兩個文本再次以純文本形式分別保存。完成這一步驟之后,再將手工處理完的漢語純文本和德語純文本導入ParaConc軟件,借助其對齊功能多次調(diào)試之后最終可以使兩個文本完成對齊,生成可以使用的平行語料庫。不過由于純文本中會存在手工處理時不易發(fā)現(xiàn)的特殊符號和格式錯誤,因此在對齊過程中軟件會在不能識別處中斷,多次嘗試改進格式錯誤或者特殊符號后,最終可以完成漢語源語篇章和德語文獻型翻譯譯本兩個文本句級層面上的對齊。平行語料庫對齊后,在ParaConc軟件中顯示如下:

平行語料庫建設截圖1

上述是自建平行語料庫中的漢語源語篇章和衛(wèi)禮賢德語文獻型翻譯譯本的處理方式??紤]到筆者的博士論文研究中工具型翻譯譯本和源語篇章的關系,對待某些章節(jié),衛(wèi)禮賢只給出了文獻型翻譯譯本而對應則沒有給出工具型翻譯譯本,或者,為了目的語讀者更好地接受理解目的語篇章,考慮德語受眾的語言和思維習慣,在一些章節(jié)里譯者會對句子順序等進行調(diào)整。鑒于筆者的博士論文研究的出發(fā)點是重點研究特殊文化詞匯的翻譯,同時考慮到平行語料研究中的不同檢索方式,筆者在研究中對衛(wèi)禮賢德語工具型翻譯譯本和漢語源語篇章之間采取了段落間對齊的方式。由于許多漢語源語篇章中許多章節(jié)的段落實則為幾句話組成,因此采取段落對齊方式之后再進行檢索,達到對漢語源語篇章和文獻型翻譯譯本句級對齊方式的一個補充。由于部分章節(jié)衛(wèi)禮賢只采取文獻型翻譯一種譯法而未提供工具型翻譯譯本,此情況下,筆者在其對應處補充“無”一字,以便源語篇章段落和目的語篇章段落對齊。同時,考慮到《論語》中絕大部分章節(jié)均為一個段落,所以對不是一個段落的章節(jié)也人工調(diào)整為一個段落,以便處理,簡化工作。對齊后結(jié)果如下:

平行語料庫建設截圖2

2.3使用軟件

筆者對自建平行語料庫的檢索主要借助ParaConc軟件,該軟件由新西蘭奧克蘭大學應用語言學教授Michael Barlow開發(fā)研制,借助該軟件可以對平行語料庫中源語篇章與目的語篇章進行對應檢索,從而使翻譯研究更加直觀、便捷。關于該軟件在筆者博士論文研究中的具體使用,筆者會在下一篇論文中與具體實例結(jié)合加以說明。

3.結(jié)語

本文詳細介紹了筆者博士論文研究創(chuàng)建《論語》漢德平行語料庫的方法和過程,并簡要介紹了研究中使用的軟件,希望對德語界漢德平行語料庫的建設及研究提供自己的經(jīng)驗和教訓。

參考文獻:

[1]黃立波.基于漢英/英漢平行語料庫的翻譯共性研究[M].上海:復旦大學出版社,2007.

[2]李小龍.基于語料庫對《論語》衛(wèi)禮賢德譯本的跨文化研究.北京外國語大學博士論文,2017.

[3]劉澤權(quán).《紅樓夢》中英文語料庫的創(chuàng)建及應用研究[M].北京:光明日報出版社,2012.

[4]王克非等.雙語對應語料庫研制與應用[M].北京:外語教學與研究出版社,2004.

[5]楊伯峻.論語譯注[M].北京:中華書局,2010.

[6]楊逢彬.《論語(漢德對照)》前言。載:李雪濤(整理).論語(漢德對照)[M].北京:外語教學與研究出版社,2010.

[7]朱熹.四書集注[M].北京:中華書局,1957.

[8]Hunston, Susan. Corpara in Applied Linguistics[M]. Cambridge, 2002.

[9]Konfuzius/van Ess, Hans. Die Lehren des Konfuzius: Die vier konfunianischen Bücher[M]. Frankfurt am Main, 2008.

[10]McEnery, Tony/ Xiao, Richard/ Tono, Yukio. Corpus-based Language Studies: An Advanced Resource Book[M]. London/New York, 2006.

[11]Wilhelm, Richard: Konfuzius Gespr?覿che[M]. K?觟ln, Anaconda, 2007.

猜你喜歡
論語
天天背《論語》,你知道它是怎么來的嗎?
如何讀懂《論語》?
知之為知之,不知為不知
點點讀《論語》
點點讀《論語》
點點讀《論語》
半部《論語》治天下
點點讀《論語》