文任彬
自上世紀(jì)50年代以來(lái),以計(jì)算機(jī)技術(shù)為依托的語(yǔ)料庫(kù)研究開(kāi)始出現(xiàn)并快速發(fā)展,最初主要集中于語(yǔ)言學(xué)、詞匯學(xué)、詞典編撰等領(lǐng)域,進(jìn)入20世紀(jì)90年代末,語(yǔ)料庫(kù)開(kāi)始與翻譯研究結(jié)合,為翻譯研究注入了新的靈感和活力,而21世紀(jì)以來(lái),基于語(yǔ)料庫(kù)的翻譯研究的相關(guān)主題受到了越來(lái)越多翻譯學(xué)者和大學(xué)教師的偏愛(ài),大家開(kāi)始嘗試將語(yǔ)料庫(kù)應(yīng)用于各個(gè)具體領(lǐng)域的翻譯實(shí)踐中,例如:建筑英語(yǔ)語(yǔ)料庫(kù)建設(shè),人工智能背景下金融領(lǐng)域的語(yǔ)料庫(kù)建設(shè),《黃帝內(nèi)經(jīng)》英譯語(yǔ)料庫(kù)建設(shè)等等。
在此基礎(chǔ)上,很多學(xué)者也將目光轉(zhuǎn)向了語(yǔ)料庫(kù)研究的微觀方向和技術(shù)層面。語(yǔ)料庫(kù)是按照一定的語(yǔ)言原則,運(yùn)用隨機(jī)抽樣方法,收集自然出現(xiàn)的連續(xù)的語(yǔ)言,運(yùn)用文本或話語(yǔ)片段而建立的具有一定容量的大型電子文本庫(kù)。因此最重要的幾個(gè)關(guān)鍵因素就是對(duì)語(yǔ)料的選擇,對(duì)詞頻的準(zhǔn)確把握和對(duì)文本的標(biāo)識(shí)和賦碼。首先在語(yǔ)料的選擇上,雙語(yǔ)語(yǔ)料庫(kù)建設(shè)者應(yīng)選擇高質(zhì)量的,權(quán)威的英漢翻譯素材,例如專業(yè)課的雙語(yǔ)教材;國(guó)家官方新聞網(wǎng)站的文章;著名翻譯家的譯著等。根據(jù)英語(yǔ)和漢語(yǔ)的特點(diǎn),選擇合適的句子做為數(shù)據(jù)存儲(chǔ)的最小單位,設(shè)定對(duì)齊類型為一對(duì)多(原文對(duì)應(yīng)多段譯文)和多對(duì)一(譯文對(duì)應(yīng)多段原文),最大限度地滿足檢索者對(duì)翻譯學(xué)習(xí)和研究的要求。除了對(duì)語(yǔ)料文本的挑選和處理,翻譯語(yǔ)料庫(kù)的主要建設(shè)工作還包括檢索平臺(tái)的搭建。語(yǔ)言處理人員在導(dǎo)入語(yǔ)料和對(duì)語(yǔ)料進(jìn)行對(duì)齊標(biāo)注之后,軟件支持人員設(shè)計(jì)高性能的檢索語(yǔ)言。以目前使用較多的語(yǔ)料庫(kù)檢索語(yǔ)言SQL為例,需要將語(yǔ)料庫(kù)建設(shè)者導(dǎo)入的素材轉(zhuǎn)化為可以用計(jì)算機(jī)執(zhí)行的SQL語(yǔ)句。經(jīng)過(guò)語(yǔ)料庫(kù)使用者的檢索之后,在最終的用戶界面顯示檢索的結(jié)果,并且能夠進(jìn)行排序、導(dǎo)出、保存等操作。
由于近年來(lái)高校大學(xué)英語(yǔ)課程改革的推進(jìn),翻譯教學(xué)被大學(xué)英語(yǔ)教師們重視,并成為課程體系中重要的一部分。在大學(xué)英語(yǔ)四六級(jí)考試中,翻譯題型占據(jù)相當(dāng)一部分比例的分值,并且學(xué)生在走上工作崗位之后,需要具備一定的英語(yǔ)翻譯技能,這些都要求我們不斷轉(zhuǎn)變和豐富現(xiàn)有的翻譯教學(xué)手段,然而目前的大學(xué)英語(yǔ)翻譯教學(xué)仍然存在一定的問(wèn)題。首先體現(xiàn)在課上部分,由于課堂教學(xué)時(shí)間受課程規(guī)劃的嚴(yán)格限制,不可能給學(xué)生很多的時(shí)間進(jìn)行思考和分析,翻譯教學(xué)主要是以教師為中心來(lái)進(jìn)行,教師盡可能多的將所準(zhǔn)備的翻譯理論知識(shí)和經(jīng)典范例講解給學(xué)生,而學(xué)生在整個(gè)教學(xué)過(guò)程中的大部分情況下只是一個(gè)被動(dòng)的接受者,能夠發(fā)揮主觀能動(dòng)性的時(shí)間很少。
在課下部分,我們會(huì)使用超星學(xué)習(xí)通和U校園平臺(tái)為學(xué)生布置各種形式的線上翻譯作業(yè),例如四六級(jí)真題練習(xí),學(xué)生之間互相批改對(duì)方的翻譯篇章,對(duì)常用漢英翻譯表達(dá)方式的積累等。但由于沒(méi)有一個(gè)相應(yīng)的客觀評(píng)價(jià)體系,學(xué)生無(wú)法正確地對(duì)自己的翻譯水平做出評(píng)價(jià),從而不能達(dá)到翻譯練習(xí)的預(yù)期目的。并且大部分的翻譯練習(xí)為主觀題,教師需要一個(gè)批閱和反饋的周期,由于翻譯本身的難度,學(xué)生翻譯水平的提高也是個(gè)耗費(fèi)漫長(zhǎng)時(shí)間的過(guò)程,綜述以上因素,部分學(xué)生難以堅(jiān)持翻譯練習(xí),慢慢的也就失去了課后進(jìn)行翻譯練習(xí)的興趣。
因此我們亟需尋找新的教學(xué)方法來(lái)改變翻譯教學(xué)的現(xiàn)狀,由于語(yǔ)料庫(kù)自身強(qiáng)大的功能和語(yǔ)料庫(kù)教學(xué)具有的自主性、開(kāi)放性的特點(diǎn),我們相信將語(yǔ)料庫(kù)這一工具引入大學(xué)英語(yǔ)課程可以極大地促進(jìn)學(xué)生的學(xué)習(xí)自主性。目前國(guó)內(nèi)外最具代表性和影響力的大型語(yǔ)料庫(kù)主要有:英國(guó)的翻譯英語(yǔ)語(yǔ)料庫(kù)(TEC);英國(guó)國(guó)家語(yǔ)料庫(kù)(British National Corpus,BNC);布朗語(yǔ)料庫(kù)(Brown Corpus);我國(guó)上海交通大學(xué)的JD-EST 語(yǔ)料庫(kù)等,但是這些大型語(yǔ)料庫(kù)或因?yàn)榫W(wǎng)絡(luò)壁壘的原因,或因?yàn)椴粚?duì)公眾開(kāi)放的原因,目前尚且無(wú)法被普通大學(xué)教師使用。建立大型語(yǔ)料庫(kù)需要輸入至少5000萬(wàn)詞以上的素材,這需要投入大量的人力和資源,普通學(xué)校短期內(nèi)難以做到這一點(diǎn),因此本篇文章主要研究面向本校師生的,小型雙語(yǔ)語(yǔ)料庫(kù)的建設(shè)。在本語(yǔ)料庫(kù)投入使用并不斷完善之后,將面向大眾開(kāi)放,并尋求同類院校的合作,不斷擴(kuò)大該語(yǔ)料庫(kù)的規(guī)模。
在語(yǔ)料庫(kù)設(shè)計(jì)之初,我們首先明確該語(yǔ)料庫(kù)的規(guī)模和服務(wù)對(duì)象。由于人力和資金投入的限制,目前該語(yǔ)料庫(kù)主要服務(wù)對(duì)象為我校本科階段全體非英語(yǔ)專業(yè)學(xué)生,目的是幫助學(xué)生們?cè)诖髮W(xué)英語(yǔ)四六級(jí)考試中的翻譯部分取得理想的成績(jī),并且具備所學(xué)專業(yè)的基本翻譯實(shí)踐能力。語(yǔ)料庫(kù)的內(nèi)容主要分為2013年12月份(題型改革之后)-2022年6月共計(jì)18場(chǎng)次108套大學(xué)英語(yǔ)四六級(jí)翻譯真題,以及結(jié)合我校的專業(yè)特色所總結(jié)的建筑工程、金融財(cái)會(huì)、機(jī)械智能、法律、文史哲五大板塊,我們最終的目標(biāo)詞條為100萬(wàn)詞左右,預(yù)測(cè)可以基本滿足教學(xué)研究與學(xué)生翻譯學(xué)習(xí)的需要。
其次建設(shè)語(yǔ)料庫(kù)最重要的部分之一就是對(duì)語(yǔ)料素材進(jìn)行篩選和存儲(chǔ)。由于目前我們的語(yǔ)料庫(kù)容量有限,所以跳過(guò)了抽樣的環(huán)節(jié),更多地關(guān)注輸入語(yǔ)料的來(lái)源和質(zhì)量。例如目前的四六級(jí)翻譯真題為漢譯英,我們除了選取官方公布的參考答案,本著一對(duì)多的對(duì)齊原則,我們也篩選了一些英語(yǔ)培訓(xùn)機(jī)構(gòu)和網(wǎng)絡(luò)上發(fā)布的質(zhì)量高的英譯版本,每篇被選定的篇章都由至少三名教師進(jìn)行檢查核對(duì),杜絕任何翻譯錯(cuò)誤和用語(yǔ)不規(guī)范現(xiàn)象。而其他五大專業(yè)方向的板塊,素材主要來(lái)源于權(quán)威出版社出版的專業(yè)課雙語(yǔ)教材,相關(guān)行業(yè)的新聞網(wǎng)站和權(quán)威專家的譯著等。為了保證所選素材的實(shí)用性和前沿性,我們咨詢了學(xué)校相關(guān)專業(yè)的專業(yè)課教師,聽(tīng)取了他們對(duì)于行業(yè)教材和著作選取的建議。
將語(yǔ)料庫(kù)素材轉(zhuǎn)換為計(jì)算機(jī)執(zhí)行語(yǔ)言是語(yǔ)料庫(kù)建設(shè)最復(fù)雜和繁瑣的步驟之一。在此主要介紹需要大學(xué)英語(yǔ)教師完成的部分:分詞和賦碼。與英語(yǔ)單詞不同,中文單詞是由一個(gè)或多個(gè)漢字組成。一個(gè)漢字可能代表一個(gè)音節(jié),但它不一定構(gòu)成一個(gè)單詞。所以對(duì)中英文素材進(jìn)行恰當(dāng)?shù)姆衷~是非常必要的。目前,中文文本可以使用Autotag 或 ICTCLAS 3.0 進(jìn)行單詞分詞。前者由臺(tái)灣中文信息處理集團(tuán)開(kāi)發(fā),后者由中國(guó)科學(xué)院計(jì)算技術(shù)研究所開(kāi)發(fā)。為了促進(jìn)該語(yǔ)料庫(kù)的長(zhǎng)期發(fā)展和提高學(xué)生的使用體驗(yàn),賦碼也是非常必要的,綜合比較幾種賦碼方式,我們最后選擇了更適合小型語(yǔ)料庫(kù)的詞類賦碼。目前自動(dòng)詞類賦碼技術(shù)已經(jīng)基本成熟,對(duì)英語(yǔ)基本上可以通過(guò)計(jì)算機(jī)自動(dòng)賦碼,且賦碼正確率在96%~97%左右。不管是分詞還是賦碼過(guò)程,都需要語(yǔ)料庫(kù)創(chuàng)建者們層層把關(guān),并對(duì)數(shù)據(jù)庫(kù)進(jìn)行定期的備份與維護(hù)。
近年來(lái),我校不斷進(jìn)行包括英語(yǔ)課程在內(nèi)的課程體系改革,語(yǔ)料庫(kù)在大學(xué)英語(yǔ)課堂的引入就是我們的一次嘗試和探索,具體分為課上和課下兩個(gè)部分。首先在課堂講授和練習(xí)部分,語(yǔ)料庫(kù)的引入能夠使翻譯教學(xué)的內(nèi)容更加深入和全面,使學(xué)生的課堂學(xué)習(xí)更有效率。教師設(shè)置相應(yīng)的任務(wù),學(xué)生通過(guò)檢索語(yǔ)料庫(kù)快速獲取信息。而語(yǔ)料庫(kù)中積累的大量翻譯教學(xué)素材,能夠使翻譯學(xué)習(xí)者們充分利用英漢雙語(yǔ)平行對(duì)應(yīng)的語(yǔ)料觀察翻譯語(yǔ)言,掌握英漢兩種語(yǔ)言在翻譯過(guò)程中的轉(zhuǎn)換規(guī)律,了解某些特定詞或結(jié)構(gòu)的轉(zhuǎn)換原則。翻譯語(yǔ)料庫(kù)的語(yǔ)料都是來(lái)源于真實(shí)的譯本語(yǔ)言,所以具有時(shí)效性,客觀性和真實(shí)性,學(xué)生在學(xué)習(xí)過(guò)程中不僅能獲得翻譯表達(dá)方式的積累,并且可以潛移默化地掌握翻譯理論及認(rèn)識(shí)翻譯的本質(zhì)。
學(xué)生在接觸一個(gè)新詞匯的用法時(shí),大部分是通過(guò)老師的講解或查閱詞典。但詞典所能提供的例句數(shù)量有限,并且語(yǔ)言情境相對(duì)單一,語(yǔ)料庫(kù)的引入可以填補(bǔ)這部分的空白。例如2021年12月四級(jí)翻譯真題中的句子:“長(zhǎng)久以來(lái),大運(yùn)河對(duì)中國(guó)的經(jīng)濟(jì)發(fā)展發(fā)揮了重要作用,有力地促進(jìn)了……?!边@句話中出現(xiàn)了四級(jí)考試中的高頻詞匯“促進(jìn)了”,通過(guò)對(duì)語(yǔ)料庫(kù)的檢索,學(xué)生不僅可以掌握例如promote;improve;enhance;facilitate;advance;boost等詞的具體用法,還可以了解到在其他試卷中這些詞匯的考察情況。
語(yǔ)料庫(kù)在課下部分引入的最大優(yōu)勢(shì)就是能充分調(diào)動(dòng)學(xué)生翻譯學(xué)習(xí)的自主性和積極性。根據(jù)我們問(wèn)卷調(diào)查的結(jié)果顯示,在四六級(jí)考試中相對(duì)于閱讀和聽(tīng)力題型,翻譯和寫(xiě)作兩個(gè)部分是大部分學(xué)生都認(rèn)為非常重要,但是短時(shí)間內(nèi)又很難提高分?jǐn)?shù)的。翻譯不僅需要學(xué)生具備相當(dāng)數(shù)目的英漢表達(dá)方式的儲(chǔ)備,還需要熟悉各種句型的銜接,并且四六級(jí)考試對(duì)單詞的拼寫(xiě)和語(yǔ)法細(xì)節(jié)都有很高的要求。這需要平時(shí)的積累和不間斷的練習(xí),因此課下學(xué)習(xí)時(shí)間的利用變得尤為重要。教師在向?qū)W生詳細(xì)介紹語(yǔ)料庫(kù)的使用方法之后,通過(guò)小組合作和翻轉(zhuǎn)課堂的形式,以5-8人小組為單位布置開(kāi)放性作業(yè),例如:漢譯英時(shí)某些情況下選擇主動(dòng)或被動(dòng)表達(dá)式的深層原因;通過(guò)詞頻統(tǒng)計(jì)出特定體裁和語(yǔ)境下最常用的翻譯詞匯;四六級(jí)考試和你所學(xué)專業(yè)在句子解構(gòu)和句子復(fù)雜程度方面的偏好等等。學(xué)生通過(guò)使用語(yǔ)料庫(kù)完成任務(wù)之后,教師隨機(jī)抽取小組在課堂上向同學(xué)們分享自己的觀點(diǎn)。
翻譯語(yǔ)料庫(kù)可以使翻譯教學(xué)的內(nèi)容更具真實(shí)性和時(shí)效性,使教學(xué)的形式更加豐富多樣,提升了學(xué)生翻譯學(xué)習(xí)的積極性和學(xué)習(xí)效率。語(yǔ)料庫(kù)的創(chuàng)建涉及到語(yǔ)料庫(kù)的設(shè)計(jì),素材的采集、整理和加工,以及創(chuàng)建語(yǔ)料庫(kù)之后的分詞、賦碼、后期維護(hù)和管理。目前本校語(yǔ)料庫(kù)的建設(shè)仍然處于初級(jí)階段,作為語(yǔ)料庫(kù)的建設(shè)人員任重而道遠(yuǎn),之后我們會(huì)尋求與同類院校進(jìn)行合作,以共享共建為目標(biāo),將語(yǔ)料庫(kù)進(jìn)行橫向和縱深的拓展。我們相信,隨著語(yǔ)料庫(kù)翻譯研究的深入,會(huì)促進(jìn)更多語(yǔ)料庫(kù)的創(chuàng)建以及計(jì)算機(jī)技術(shù)的發(fā)展,語(yǔ)料庫(kù)將在高校翻譯教學(xué)中發(fā)揮更大的作用。