靳 松
(西北民族大學(xué)外國語學(xué)院 甘肅 蘭州 730030)
國外口譯語料庫的開發(fā)起步于20世紀末,現(xiàn)已建成幾個較為成熟的語料庫。其中最有特色的語料庫有兩個:一是日本名古屋大學(xué)設(shè)計研發(fā)的目前世界上規(guī)模最大的英語、日語雙語同傳語料庫,該語料庫采編的口譯錄音材料為182小時轉(zhuǎn)寫;二是意大利博洛尼亞大學(xué)研究人員開發(fā)的歐洲議會口譯語料庫,該語料庫是一個包含英語、意大利語、西班牙語的多語平行語料庫,庫容量約為18萬字。
國內(nèi)口譯研究起步雖晚(20世紀70年代),但發(fā)展速度較快,各類專著、譯著、研究課題及相關(guān)論文如雨后春筍,異彩紛呈。盡管口譯研究成績斐然,但是口譯語料庫的研究與建設(shè)到2007年后才初現(xiàn)端倪。目前已進入研究和應(yīng)用階段的口譯語料庫是由上海交通大學(xué)研究開發(fā)的以國內(nèi)外新聞發(fā)布會口譯活動為對象的漢英會議口譯語料庫,容量約為54萬字,該語料庫的語料也來自職業(yè)譯員的口譯實踐。另外還有文秋芳教授等人創(chuàng)建的50萬字規(guī)模的中國大學(xué)生英漢、漢英口譯語料庫,該語料庫為了真實反映口譯學(xué)習(xí)者口譯狀況,選取的研究對象為高等院校英語專業(yè)漢族學(xué)生。
隨著口譯語料庫的開發(fā)與建設(shè),基于語料庫的口譯研究也相繼展開,包括對口譯文本、口譯操作方式、口譯策略等問題進行的初步量化描述與分析。目前,基于語料庫的大多數(shù)口譯研究主要遵循“建設(shè)語料庫,研究語料庫”的原則,即依托現(xiàn)有的口譯語料庫,通過數(shù)據(jù)統(tǒng)計和分析,對具體問題進行量化描述。
“語料庫是應(yīng)用計算機技術(shù)對海量自然語言材料進行處理(包括預(yù)處理、語法自動附碼、自動句法分析、語義分析等)、存儲,以供自動檢索(retrieva1)、索引(concordance)以及統(tǒng)計分析的大型資料庫”(李文中,1999:51)。英語語料庫作為口譯教學(xué)的輔助工具,可以提供大量真實的語言材料、豐富的詞匯和語境,而其可獨立操作性可以充分調(diào)動學(xué)生學(xué)習(xí)口譯的積極性。口譯教學(xué)中語料庫的運用對口譯教學(xué)有著巨大的價值,表現(xiàn)在:1.呈現(xiàn)了大量真實的語言材料;2.提供了豐富的詞匯及語境;3.可以獨立操作,從而鼓勵學(xué)生主動思考;4.“語料庫方法注重運用而非能力,重描述(description)而非普遍語法(universals),重量化分析(quantitative analysis) 而非定性分析(qualitative analysis)”(李文中,1999:52)。教師和學(xué)生能夠得到更加具有統(tǒng)計意義的數(shù)據(jù),客觀審視語言的實際運用而不拘泥于書面的文本,這一點對口譯實際操作更具指導(dǎo)意義。由于語料庫中語料的內(nèi)容和形式多樣,教師可根據(jù)各種口譯語料內(nèi)容、形式開展不同的口譯教學(xué)與實踐,這種口譯課堂的教學(xué)內(nèi)容與形式更加多樣,效果更加明顯。而且語料庫中的教學(xué)語料難度各異、語速及口音多樣,教師可在不同的教學(xué)階段為學(xué)生安排相應(yīng)的訓(xùn)練內(nèi)容,并讓學(xué)生體會、適應(yīng)真實的口譯現(xiàn)場,這樣的口譯課堂顯得更加合理,有利于對學(xué)生的培養(yǎng)。對于教師來說,口譯教學(xué)語料庫的資料多樣性、大規(guī)模性、檢索便利性等特點能有效幫助口譯教師增加訓(xùn)練材料,豐富訓(xùn)練內(nèi)容,節(jié)約訓(xùn)練時間。
建設(shè)基于口譯教學(xué)的實際情景的口譯語料庫,不僅可以在很大程度上克服口譯教學(xué)在材料、環(huán)境等方面“非真實性”的缺陷,使口譯學(xué)員更多地獲得“身臨其境”的感受,還可以嘗試新的教學(xué)形式與策略,活躍教學(xué)氣氛,提高教學(xué)效果。與其他類型語料庫不同,口譯教學(xué)語料庫注重材料的現(xiàn)場性和實時性、提取的便利性、語料存儲的多媒體性。主要包括以下幾個方面:
1.口譯教學(xué)語料的收集
口譯教學(xué)語料庫的語料主要來自于利用多媒體設(shè)備對口譯課堂中學(xué)生口譯訓(xùn)練的錄音以及各類會議、會談、訪談、演講等需要進行口譯的現(xiàn)場。收集內(nèi)容涵蓋源語發(fā)言、目標語口譯以及文稿、會議日程等材料,材料以錄音或錄像和文字的形式呈現(xiàn)出來。
2.語料的整理
與其他語料庫不同,口譯教學(xué)語料庫的初始語料多為音頻或視頻,需要對原始語料進行錄音轉(zhuǎn)寫,使口譯教學(xué)語料庫的主體語料應(yīng)至少具備音頻和文字兩種形式以便學(xué)生和教師使用。
3.語料的標注
口譯教學(xué)語料庫需要根據(jù)口譯材料的主題、場合、源語語體、難易程度、語速、時長、來源進行細致的分類。(l)“副語言”標注?!案闭Z言”信息是口譯語料標注的一項關(guān)鍵內(nèi)容,應(yīng)該充分借鑒口語語料庫對口語信息標注的成功經(jīng)驗,探索適合口譯特點的“副語言”標注策略。(2)超語言信息標注。除基本的詞性標注外,口譯語料的超語言標記不僅應(yīng)該包括譯者信息、時間、地點、口譯活動組織者等信息,還應(yīng)考慮包括反映口譯交際特色的其他信息,如源語發(fā)布形式(自由發(fā)言、提綱式發(fā)言、帶稿誦讀等)、場景(會議口譯、社區(qū)口譯等)、工作形式(同傳、交傳等)、口譯聽眾性質(zhì)(知識背景、目的、外語水平等)、技術(shù)設(shè)備(傳統(tǒng)會場形式、遠程口譯、如電視、電話、網(wǎng)絡(luò))等。
4.技術(shù)處理
技術(shù)處理是口譯教學(xué)語料庫建立過程中最為復(fù)雜的環(huán)節(jié),這一環(huán)節(jié)的處理需要與相關(guān)技術(shù)人員的有效配合,對各種語料進行多媒體格式處理、噪音處理、相關(guān)軟件配備,雙語語料的平行對齊處理,檢索工具的開發(fā)等程序。當前,數(shù)碼式錄音、錄像設(shè)備日益普及,不僅可以保證原始口譯語料的采集質(zhì)量,也非常有利于語料的后期校對、時間標記、對齊等工作。同時,語料自動標注技術(shù)也對口譯轉(zhuǎn)寫材料的標注加工有較大的應(yīng)用價值 (參見王克非等,2004:21-22)。此外,自然語言工程領(lǐng)域內(nèi)的語音識別技術(shù)也取得了一定突破,有利于口譯語料的自動轉(zhuǎn)換工作。(參見倪崇嘉等,2009)
口譯語料庫的建設(shè)面臨諸多困難??谧g語料必須由口語轉(zhuǎn)寫為文字形式,而這只能通過人工來進行;而且,實際口譯活動中,如商務(wù)口譯、法庭口譯和會議口譯等,口譯內(nèi)容轉(zhuǎn)瞬即逝,而且常常涉及機密和隱私,不便于公開,這些都增加了口譯語料建設(shè)的難度,具體表現(xiàn)在以下幾點:
1.語料采集與轉(zhuǎn)寫。首先,口譯活動的時間、場所以及人員配合程度(口譯員、會場主辦者等)等因素依然在很大程度上限制著語料收集的順利進行。其次,作為一種特殊的口頭語料,口譯語料涉及源語口語與譯語口語兩種語料,語料的采集、轉(zhuǎn)寫工作更加復(fù)雜、艱辛,面臨著口語語料采集工作的“雙重困難”。(參見楊惠中,2002:57;kedney,2000:80-82)
2.口譯語料標注的特殊性。除對語料進行文本結(jié)構(gòu)和詞性標注等一般性加工處理外,口譯活動的特殊性也給口譯語料的標注帶來了特殊的困難與挑戰(zhàn)。(1)語料時間切分。在口譯活動中,發(fā)言人與譯員的語言表達往往存在一定的時間間隔,這種間隔能較直接地反映出主題熟悉程度、譯員認知素質(zhì)等問題。此外,通過考察原文與譯文在語言形式與語義兩方面的對應(yīng)情況,可有助于確定口譯信息的轉(zhuǎn)換單位,同時也能為客觀分析口譯中的“脫離源語語言外殼”現(xiàn)象(巴黎的釋意派Déverbalisation)提供實證材料。而要實現(xiàn)以上目標,就須對原文和譯文語料進行精確的時間切分與標注,并根據(jù)具體要求進行不同層次的對齊。目前的錄音設(shè)備雖然能對原始語料進行較為精確的標定,但原文與譯文的起始時間差異以及具體對應(yīng)單位的時間關(guān)系,仍需人工確定,很大程度上影響了時間切分的精確性。(2)“副語言”信息標注。如前所述,停頓、支吾語、語音拖長等“副語言”現(xiàn)象在口譯活動中具有重大的意義,但當前的語料標注工具還不能對這些“副語言”現(xiàn)象進行自動標注,仍需進行人工辨別,僅此一項工作就大大增加了口譯語料庫建設(shè)的難度。
3.源語與譯語的對應(yīng)層次??谧g實踐的特點(特別是同傳)要求口譯員在短時間內(nèi)完成源語核心信息的有效傳遞,促成交際雙方的交流與溝通。因此,“字字對譯”或“逐句對應(yīng)”并非口譯實踐的常態(tài),“信息對等”、“功能等效”才是評價口譯質(zhì)量的首選因素(劉和平,2002)。因此,口譯語料庫不應(yīng)進行“字對應(yīng)”,也難以實現(xiàn)在筆譯語料庫中的“句對應(yīng)”(參見王克非,2004)。同時,要想實現(xiàn)口譯語料庫的“信息對應(yīng)”,須首先解決口譯信息單位的劃定標準、量化指標等關(guān)鍵問題,而上述問題迄今尚未形成定論。(參見勒代雷,2001:15一16.蔡小紅,2003)
基于語料庫的口譯教學(xué)能夠適應(yīng)當代學(xué)生的習(xí)慣,注重他們的個人需求,刺激他們的學(xué)習(xí)興趣,有效幫助他們進行口譯訓(xùn)練。將語料庫語言學(xué)與口譯活動進行有機結(jié)合,創(chuàng)建具有教學(xué)與研究多重用途的口譯語料庫,不僅符合翻譯學(xué)科發(fā)展的大方向,更應(yīng)該成為語料庫建設(shè)與應(yīng)用性研究的一個新課題,受到更多的關(guān)注與支持。而且,口譯語料庫的開發(fā)與建設(shè),不僅對提高口譯研究質(zhì)量、促進口譯教學(xué)改革、完善機器口譯研究與應(yīng)用有重大意義,也必然對豐富語料庫類型、擴大語料庫應(yīng)用研究范圍、深化語料庫研究層次起到積極的促進作用。
[1]Bendazzoli,C.,Sandrelli,A.,&Russo,M.Disfluencies in Simultaneous Interpreting:A corpus-based analysis[A].In Kruger,A.,Wallmach,K.&J.Munday(eds.) Corpus-Based Translation Studies:Research and Applications[C].London&New York:Continuum Continuum International Publishing Group,2011.
[2]葉亮.面向教學(xué)的口譯語料庫建設(shè):理論與實踐[J].外語界,2009(2)
[3]北京大學(xué)計算語言學(xué)研究所.北京大學(xué)漢英雙語語料庫標記規(guī)范[J].北京:JournalofChineseLanguageandComputing,2003.
[4]陳振東.口譯課程培養(yǎng)模式探索[J],中國翻譯,2008(4).
[5]李文中,語料庫、學(xué)習(xí)者語料庫與外語教學(xué)[J],外語界,l999(1).
[6]王立非,張巖.基于語料庫的大學(xué)生英語議論文中的語塊使用模式研究[J].外語電化教學(xué),2006(8).
[7]胡開寶.語料庫翻譯學(xué)概論[M].上海:上海交通大學(xué)出版社,2011.
[8]李婧,李德超.基于語料庫的口譯研究:回顧與展望[J].中國外語,2010(5).
[9]楊惠中.語料庫語言學(xué)導(dǎo)論[M].上海:上海外語教育出版社,2002.
[10]張威.口譯語料庫的開發(fā)與建設(shè):理論與實踐的若干問題[J].中國翻譯,2009(3).
[11]張威.近十年來口譯語料庫研究現(xiàn)狀及發(fā)展趨勢[J].浙江大學(xué)學(xué)報,2012(3).