張克金?瞿莉莉
摘 要:本文基于外貿(mào)企業(yè)的B2B的銷售平臺(tái)角度,探討了小型語(yǔ)料庫(kù)的建立的四個(gè)步驟:料采集、格式轉(zhuǎn)換、標(biāo)注及賦碼、語(yǔ)料的整合生成、語(yǔ)料庫(kù)的檢索,將小型語(yǔ)料庫(kù)用于商務(wù)英語(yǔ)翻譯教學(xué),能豐富教學(xué)手段、提高教學(xué)效果。
關(guān)鍵詞:B2B外貿(mào)平臺(tái),商務(wù)翻譯教學(xué),語(yǔ)料庫(kù)
一、B2B外貿(mào)平臺(tái)及小型語(yǔ)料庫(kù)
B2B平臺(tái)為英文Business-to-Business的縮寫,即企業(yè)對(duì)企業(yè),或者說是進(jìn)出口商之間的外貿(mào)電子商務(wù)平臺(tái)。B2B外貿(mào)平臺(tái)是外貿(mào)購(gòu)銷市場(chǎng)的領(lǐng)域的一種,是出口方對(duì)進(jìn)口方的國(guó)際營(yíng)銷關(guān)系,其具體的運(yùn)作方式主要是出口方以會(huì)員的身份在B2B平臺(tái)上用英語(yǔ)發(fā)布公司、銷售產(chǎn)品信息、付款方式及運(yùn)輸?shù)刃畔ⅲM(jìn)口方則可以在外貿(mào)平臺(tái)上發(fā)布采購(gòu)信息,雙方都可以在B2B平臺(tái)看到對(duì)方的信息后向另一方發(fā)Email詢盤或者通過Trade manager等軟件在線交流,從而使得外貿(mào)得以順利進(jìn)行。目前國(guó)內(nèi)著名的B2B外貿(mào)平臺(tái)主要有Global sources Alibaba及Made-in-China等。
小型語(yǔ)料庫(kù)因其靈活適用性在語(yǔ)料庫(kù)的研究中成為一種較熱的研究項(xiàng)目,大型的語(yǔ)料庫(kù)主要是研究范圍較廣的綜合性研究,而小型語(yǔ)料庫(kù)一般是精心采集的,旨在幫助語(yǔ)言學(xué)習(xí)者理解語(yǔ)言現(xiàn)象的語(yǔ)料庫(kù),尤其是在商務(wù)英語(yǔ)專業(yè)翻譯教學(xué)與研究過中,可以充分利用海量網(wǎng)絡(luò)資源及語(yǔ)料庫(kù)工具創(chuàng)建小型翻譯語(yǔ)料庫(kù)以輔助教學(xué)與科研。
二、小型翻譯語(yǔ)料庫(kù)的建立
在創(chuàng)建B2B翻譯的小型語(yǔ)料庫(kù)前,首先應(yīng)根據(jù)該語(yǔ)料庫(kù)國(guó)際貿(mào)易用途及B2B網(wǎng)頁(yè)框架設(shè)定一些基本原則,在日常的商務(wù)翻譯教學(xué)過程中需要編撰一系列專用翻譯素材與教學(xué)輔導(dǎo)素材,如果以B2B平臺(tái)的翻譯為素材,自建小型語(yǔ)料庫(kù),對(duì)翻譯教學(xué)將有較大的幫助。目前小型語(yǔ)料庫(kù)仍未有統(tǒng)一明確的規(guī)范與標(biāo)準(zhǔn),但就其建立過程而言,主要分為料采集、格式轉(zhuǎn)換、標(biāo)注及賦碼、語(yǔ)料的整合生成、語(yǔ)料庫(kù)的檢索四個(gè)主要的過程。
1.語(yǔ)料采集和格式轉(zhuǎn)換
開發(fā)大型的語(yǔ)料庫(kù)是一浩繁的系統(tǒng)工程,需要耗費(fèi)大量的人力物力,對(duì)于一般的商務(wù)英語(yǔ)翻譯教學(xué)而言,只需有針對(duì)性地建立小型語(yǔ)料庫(kù)即可,建立B2B翻譯教學(xué)用小型語(yǔ)料庫(kù)首要工作就是要進(jìn)行語(yǔ)料采集和格式轉(zhuǎn)換,欲善其事,必先利其器,須了解常用的工具件。
信息采集工具:因B2B商務(wù)平臺(tái)主要是網(wǎng)頁(yè)在線信息,故需運(yùn)用一些網(wǎng)絡(luò)語(yǔ)料批采集軟件,常用的網(wǎng)絡(luò)信息收集軟件主要有Wordsmith Tools里面的網(wǎng)頁(yè)資料下載工具Webgetter以及Httrack等軟件;文字編制的軟件主要有Editpad Pro、UltraEdit、EditPlus等軟件。
文字識(shí)別轉(zhuǎn)換工具:常見的文字識(shí)別及轉(zhuǎn)換工具主要有將PDF文檔轉(zhuǎn)換成word格式的Solid Converter PDF軟件;Adobe Acrobat Pro、CAJ Viewer等,如果是要將掃描的文檔傳話識(shí)別成電子文檔還需要ABBYY Finereader軟件。
專門針對(duì)B2B平臺(tái)的網(wǎng)頁(yè)語(yǔ)料采集,一般采用Httrack軟件,將要采集的企業(yè)的B2B平臺(tái)信息采集下載。
2. 語(yǔ)料的賦碼
從網(wǎng)絡(luò)上下載的文本一般還不是清潔文本,需要清除雜質(zhì)與多余的標(biāo)點(diǎn)符號(hào),將清潔前后的文本進(jìn)行分類命名保存。語(yǔ)料賦碼工作的第一步通常是加Text header,即給語(yǔ)料標(biāo)注篇名、作者、字?jǐn)?shù)、領(lǐng)域、文體、來源、關(guān)鍵詞等,一般做法是將上述項(xiàng)目分別填入尖括號(hào)中并放置在文本句首。
目前還沒有自動(dòng)編寫Text header的軟件,需要手動(dòng)編寫,一般的小型與語(yǔ)料庫(kù)是可以根據(jù)個(gè)人實(shí)際需要不編寫Text header。
目前較通用的語(yǔ)料進(jìn)行賦碼的軟件有Tree Tagger自動(dòng)詞性賦碼器,使用該賦碼器對(duì)英語(yǔ)賦碼準(zhǔn)確率在96%~97%之間,以下為基本的操作步驟:
第一步,雙擊打開Tree Tagger軟件。
第二步,點(diǎn)擊左上角的File菜單,選擇其中的“Open File”選項(xiàng)或者“open Direction”選項(xiàng),打開對(duì)話框。
第三步,在對(duì)話框中選取需要詞性賦碼的文檔,選中后點(diǎn)擊“Open”按鈕。
第四步,在界面的上方“English,German,F(xiàn)rench,Italian”語(yǔ)言框中選取文本語(yǔ)言的種類。
第五步,點(diǎn)擊“ Start Tagging”按鈕,軟件就開始對(duì)打開的文本進(jìn)行詞性賦碼。
Tree Tagger軟件對(duì)所選文本詞性賦碼完成后,會(huì)在原文本所在文件夾中生成同名文件,只是擴(kuò)展名已經(jīng)變成了“.pos”, 此文件就是賦碼后的文件。
3.語(yǔ)料的整合
在對(duì)B2B平臺(tái)采集的語(yǔ)料進(jìn)行賦碼后,需要對(duì)這些賦碼的語(yǔ)料進(jìn)行整合后,才能做檢索工作。目前做語(yǔ)料整合檢索的軟件主要有WordSmith,Compulang WordPilot以及Antconc等軟件。在建立一般小型的語(yǔ)料庫(kù)時(shí),我們一般采用wordpilot軟件整合語(yǔ)料庫(kù),具體的步驟如下:
第一步,在“wordpilot”安裝路徑所在系統(tǒng)盤所在文件夾中找到“l(fā)ibraries”子文件夾,在子文件夾中創(chuàng)建一個(gè)自建語(yǔ)料庫(kù)的文件夾,將以上搜集賦碼的B2B清潔語(yǔ)料復(fù)制到該文件夾中。
第二步,雙擊運(yùn)行“wordpilot”軟件,選擇“file”菜單里面的“new”選項(xiàng),出現(xiàn)對(duì)話框,選擇系統(tǒng)文件里面的“l(fā)ibrary”文件夾。
第三步,選擇“Edit”菜單中的“Add text file”選項(xiàng),軟件會(huì)彈出對(duì)話框,在對(duì)話框中找到新建在“l(fā)ibraries”文件夾中的語(yǔ)料庫(kù)純文檔,選擇后對(duì)話框會(huì)自動(dòng)關(guān)閉。
第四步,選擇“File”菜單中文件保存的“Save”選項(xiàng),鍵入自己命名的語(yǔ)料庫(kù)的名詞,比如說“B2B platform”保存即可,這樣一個(gè)小型的語(yǔ)料庫(kù)就生成了。
4.語(yǔ)料的檢索
語(yǔ)料庫(kù)的檢索的目的是導(dǎo)出索引行,以便于研究者觀察類似的語(yǔ)言現(xiàn)象,洞察其中的秘密,這些規(guī)律主要包括這幾個(gè)規(guī)律:①有關(guān)詞語(yǔ)搭配的規(guī)律。一個(gè)詞語(yǔ)慣常與哪些詞語(yǔ)搭配出現(xiàn),詞語(yǔ)的搭配一方面是與意義有關(guān),另一方面是與搭配形式有關(guān),分析詞語(yǔ)的搭配對(duì)翻譯教學(xué)具有重要的意義。②有關(guān)類聯(lián)結(jié)及形式的規(guī)律,搭配研究中主要是考慮詞與詞的共現(xiàn)關(guān)系。根據(jù)檢索的難度系數(shù)來分,可以分為簡(jiǎn)單檢索與復(fù)雜檢索,簡(jiǎn)單檢索的檢索項(xiàng)目主要是檢索一些明確的字面字符串和較為簡(jiǎn)單的通配符, 檢索項(xiàng)中主要是常量檢索,變化形式不大。而復(fù)雜檢索中的檢索項(xiàng)是模糊綜合性的, 檢索表達(dá)式中常包含一系列變量, 比如對(duì)賦碼語(yǔ)料中詞性的檢索。本文主要以Antconc軟件為例說明語(yǔ)料庫(kù)的整合及檢索。Antconc軟件是由日本早稻田大學(xué)科技學(xué)院與工程學(xué)院英語(yǔ)教育中心的Laurence Anthony教授編寫的一款跨平臺(tái)語(yǔ)料處理軟件,該軟件具有索引,詞表生成,主題詞計(jì)算,搭配和詞組提取等多種功能。語(yǔ)料庫(kù)建庫(kù)及檢索過程的具體方法如下:
第一步,點(diǎn)擊file菜單窗口出現(xiàn)“open files”,選擇要打開的語(yǔ)料文件。
第二步,在“Search Term”一欄鍵入要檢索的關(guān)鍵詞詞項(xiàng),如tea,trade term,等等。
第三步,在“Search Window Size”一欄設(shè)置顯示的詞語(yǔ)數(shù)量。
第四步,點(diǎn)擊“start”開始檢索。
三、結(jié)語(yǔ)
語(yǔ)料庫(kù)的建立在我國(guó)目前正在發(fā)展階段,語(yǔ)料庫(kù)的建立及其軟件的應(yīng)用為商務(wù)英語(yǔ)教學(xué)提供了新的教學(xué)方法與教學(xué)手段。通過建立小型的B2B商務(wù)英語(yǔ)語(yǔ)料庫(kù)的建設(shè),可以對(duì)國(guó)際貿(mào)易商務(wù)平臺(tái)上面常用的項(xiàng)目進(jìn)行模塊化,每一個(gè)模塊的語(yǔ)料都有重疊之處,通過建立這樣的語(yǔ)料庫(kù),可以為商務(wù)英語(yǔ)B2B平臺(tái)的翻譯提供有力的教學(xué)與練習(xí)工具,促進(jìn)商務(wù)英語(yǔ)翻譯教學(xué)的發(fā)展。
參考文獻(xiàn):
[1]桂詩(shī)春,楊惠中.中國(guó)學(xué)習(xí)者英語(yǔ)語(yǔ)料庫(kù)[M].上海:上海外語(yǔ)教育出版社,2003.
[2]王克菲.新型雙語(yǔ)對(duì)應(yīng)語(yǔ)料庫(kù)的設(shè)計(jì)與構(gòu)建[J].中國(guó)翻譯,2004(6).
[3]趙宏展.小型翻譯語(yǔ)料庫(kù)的DIY[J]. 中國(guó)科技翻譯,2007(2).
[4]楊惠中.語(yǔ)料庫(kù)語(yǔ)言學(xué)導(dǎo)論[M].上海:上海外語(yǔ)教育出版社,2002.
[5]陽(yáng)光武. 社會(huì)建構(gòu)主義模式與漢英翻譯教學(xué)[J]. 四川外語(yǔ)學(xué)院學(xué)報(bào),2004(2).
[6] 梁茂成,李文中,許家金. 語(yǔ)料庫(kù)應(yīng)用教程[M].北京:外語(yǔ)教學(xué)與研究出版社,2010.
(作者單位:張克金 長(zhǎng)沙師范學(xué)院;瞿莉莉 湖南鐵路科技職業(yè)技術(shù)學(xué)院)