宋亞軍
(河南工學(xué)院 外語系,河南 新鄉(xiāng) 453003)
小型旅游英漢雙語平行語料庫的創(chuàng)建及教學(xué)應(yīng)用
宋亞軍
(河南工學(xué)院 外語系,河南 新鄉(xiāng) 453003)
當(dāng)今語料庫已經(jīng)應(yīng)用在多個學(xué)科領(lǐng)域,也得到學(xué)者們越來越多的重視,但是具有地方特色,能夠服務(wù)地方發(fā)展的小型雙語平行語料庫的獨特優(yōu)勢和應(yīng)用價值還需繼續(xù)挖掘。文章以一個小型旅游英漢雙語平行語料庫的創(chuàng)建及其在教學(xué)中的應(yīng)用表明,雙語平行語料庫在專門用途英語教學(xué)上也有著廣闊的使用前景。關(guān)鍵詞:專門用途英語;雙語平行語料庫;英語教學(xué)
毋庸置疑,語料庫語言學(xué)的持續(xù)發(fā)展不僅加強(qiáng)了學(xué)科之間的聯(lián)系,如語料庫翻譯學(xué)、語料庫與二語習(xí)得、話語研究、機(jī)器翻譯等,同時它也提供了獨具特色的量化研究方法,使得計算機(jī)技術(shù)可快速、準(zhǔn)確、高效地處理大批量數(shù)據(jù),來幫助人們解決多維度、深層次的語言問題。
盡管有些國際學(xué)者對平行語料庫和可比語料庫的概念還存在爭議[1]19,但國內(nèi)普遍認(rèn)為平行語料庫是指收錄某一源語語言文本及其對應(yīng)的目的語文本的語料庫[2]33。王克非也指出平行語料庫是由源語文本及其平行對應(yīng)的譯語文本構(gòu)成的雙語語料庫[3]6。而專門用途雙語平行語料庫是依據(jù)某一特定學(xué)科或?qū)I(yè)領(lǐng)域而建立的雙語對應(yīng)語料庫,其立足點是語料來源于某一學(xué)科或者專業(yè)[4]。相比通用語料庫,專門用途語料庫在專業(yè)詞典編撰、學(xué)科語言研究及教學(xué)方面的優(yōu)勢是很明顯的,但是受限于語料庫資源的匱乏、語料庫建設(shè)困難等原因,專門用途語料庫的建設(shè)和研究發(fā)展緩慢,而且面臨很多的問題和挑戰(zhàn)。本文在梳理國內(nèi)專門用途平行語料庫研究現(xiàn)狀基礎(chǔ)上,詳細(xì)描述建設(shè)專門用途語料庫的具體方法及專門用途語料庫的教學(xué)應(yīng)用。
自從20世紀(jì)90年代世界上第一個雙語平行語料庫——加拿大議會會議錄英法平行語料庫建成后,經(jīng)過20多年的發(fā)展,雙語平行語料庫在技術(shù)開發(fā)、詞典編撰及語言研究方面都取得了很大的發(fā)展。國內(nèi)在平行語料庫建設(shè)方面也有不少建樹,建成了不少大型平行語料庫,如:北京外國語大學(xué)王克非等創(chuàng)建的3000萬字/詞通用漢英平行語料庫,上海交通大學(xué)胡開寶等學(xué)者創(chuàng)建的1000萬字/詞英漢醫(yī)學(xué)平行語料庫[5],以及香港理工大學(xué)和北京外國語大學(xué)學(xué)者共同創(chuàng)建的約100萬字/詞的英漢旅游文本語料庫等[6]。
但這些雙語語料庫出于建庫類型、研究目的及最終用戶等因素的影響,在具體學(xué)科教學(xué)方面尚有限制,筆者在中國知網(wǎng)以“平行語料庫”為主題詞查詢發(fā)現(xiàn),近些年關(guān)于平行語料庫研究雖呈增長趨勢,尤其從2015開始每年論文發(fā)表篇數(shù)都已過百,但和通用語料庫研究相比還存在許多不足之處:(1)語料庫建設(shè)過多,口語及專門領(lǐng)域研究很少;(2)學(xué)科領(lǐng)域分布不均勻,尚有很多學(xué)科沒有適合的語料庫;(3)資源共享困難,存在重復(fù)建設(shè)現(xiàn)象;(4)關(guān)于文學(xué)和翻譯的研究較多,具體學(xué)科教學(xué)實踐的應(yīng)用研究較少。
本課題組地處河南,河南省旅游資源豐富,省政府也十分重視旅游資源的開發(fā)和利用,在河南省國民經(jīng)濟(jì)和社會發(fā)展“十三五”規(guī)劃綱要中也強(qiáng)調(diào)要依托建設(shè)鄭汴洛焦國際文化旅游名城,打造一批文化旅游、鄉(xiāng)村旅游、生態(tài)旅游、紅色旅游、特色旅游精品線路和品牌景區(qū),塑造國際國內(nèi)旅游形象品牌。但河南旅游外宣資料還有不足之處,語言使用還有很多問題[7]。基于此,本研究依托地方資源和優(yōu)勢,試圖建設(shè)適合地方發(fā)展的小型專門旅游雙語平行語料庫,探討面向教學(xué)的平行語料庫建設(shè),以期幫助河南旅游事業(yè)培養(yǎng)更多的后備人才。
雙語平行語料庫建設(shè)不同于單語語料庫建設(shè),在收集語料、語料對齊及整理方面比較復(fù)雜,本研究歷時半年建成了25萬字/詞小型旅游英漢雙語平行語料庫。語料庫的建設(shè)經(jīng)歷了語料庫設(shè)計、語料收集和語料整理三個步驟,現(xiàn)將語料庫建設(shè)情況介紹如下:
2.1 語料庫的總體設(shè)計
語料庫的建設(shè)規(guī)模要依據(jù)研究目的來確定,并非越大越好,小型但具有較強(qiáng)針對性的語料庫也能達(dá)到應(yīng)有的研究目的。Tribble認(rèn)為大型語料庫由于其范圍較廣、數(shù)據(jù)龐雜而并不適合專門用途英語學(xué)習(xí),也無法對教師和學(xué)生提供直接有效的幫助。Flowerdew認(rèn)為一般的小型語料庫規(guī)模達(dá)到25萬字/詞就夠了[8]67。由于本語料庫設(shè)計目的主要是為了研究當(dāng)?shù)芈糜挝谋镜恼Z言特點、揭示翻譯方法和策略,以幫助學(xué)生和教師了解并熟悉行業(yè)用語并提高他們的語言應(yīng)用水平,從而為旅游事業(yè)發(fā)展提供語言支持和幫助。在加上地域和時間的限制,本語料庫所定的初始規(guī)模25萬字/詞應(yīng)該可以滿足教學(xué)需求。
2.2 語料收集
語料收集最主要的問題就是語料的代表性。語料庫的代表性指的是一個語料庫在多大程度上代表一種語言或語言變體中各種不同的語言現(xiàn)象[9]7?;诖?,本語料庫語料來源主要是教材資料、正式出版物及互聯(lián)網(wǎng)資源。紙質(zhì)采集方法主要為掃描輸入,使用的工具為ABBYY FINEREADER12。
2.3 語料處理和加工
語料處理和加工主要包括語料降噪清理、元信息標(biāo)記、分詞處理及語料對齊。語料降噪處理一般包括編碼轉(zhuǎn)換、格式規(guī)范及拼寫檢查等,目的是為了讓計算機(jī)準(zhǔn)確地讀取數(shù)據(jù)。同時每個文本也會添加元信息,以方便記錄、了解文本屬性,如作者、主題、體裁、譯者、時間等信息。語料庫分詞處理和語料對齊對建設(shè)平行語料庫至關(guān)重要,目的是為了讓源語和目的語一一對應(yīng)起來,以方便存儲和提取語言間的對譯轉(zhuǎn)換信息[3]22。
平行語料庫常見的對齊方式是句級對齊,因為對翻譯意義單位提取仍存在技術(shù)困難[10],而分詞處理及句級對齊技術(shù)相對比較成熟。本語料庫所采用的對齊軟件為ABBYY Aligner,并輔助以人工校對,以TMX格式保存。平行語料庫檢索軟件用的是北京外國語大學(xué)中國外語與教育研究中心語料庫團(tuán)隊開發(fā)的ParaConc軟件,為了適應(yīng)軟件需要,還要對生成的TMX文件進(jìn)行分割處理,即利用正則表達(dá)式,把TMX文件分割成ASCII編碼的英語和漢語兩個TXT文本,并確保雙語對齊,以便ParaConc軟件后期檢索使用。
數(shù)據(jù)驅(qū)動學(xué)習(xí)(Data-driving Learning,簡稱DDL)是伯明翰大學(xué)學(xué)者Tim Johns提出來的,它的主要理念是引導(dǎo)學(xué)生基于大量的語料庫數(shù)據(jù),觀察、概括和歸納語言使用現(xiàn)象,自我發(fā)現(xiàn)語法規(guī)則、意義表達(dá)及語用特征[11]25。也就是說通過語料庫索引軟件,以“發(fā)現(xiàn)式”方法學(xué)習(xí)英語,再通過歸納總結(jié)的方法達(dá)到語言知識的建構(gòu)。同傳統(tǒng)外語教學(xué)相比,數(shù)據(jù)驅(qū)動教學(xué)模式具有以下主要優(yōu)勢:以學(xué)生的自主學(xué)習(xí)為主要的過程特征,以真實語言為主要語言輸入,強(qiáng)調(diào)探索和發(fā)現(xiàn)的學(xué)習(xí)過程,主張自下而上的歸納式的學(xué)習(xí)。同時在教學(xué)過程中驅(qū)動學(xué)習(xí)也會以學(xué)生自身需求為導(dǎo)向,鼓勵學(xué)生間的互助合作和共同探索。而對于旅游專業(yè)的學(xué)生而言,雙語平行語料庫可以在專業(yè)詞匯學(xué)習(xí)、翻譯實踐、寫作及口語學(xué)習(xí)方面發(fā)揮一定的作用。本課題研究中所使用的教學(xué)軟件是用于平行語料庫檢索的ParaConc軟件和單語語料庫檢索的PowerConc軟件,二者都是北京外國語大學(xué)中國外語與教育研究中心語料庫團(tuán)隊開發(fā)的可免費使用的軟件。
3.1 平行語料庫用于專業(yè)詞匯學(xué)習(xí)
語料庫的資源和技術(shù)為學(xué)生們提供了一種自下而上的歸納式學(xué)習(xí)方法,學(xué)生首先可以接觸大量的真實語言,然后自己總結(jié)某些專業(yè)詞匯的主要用法和常見含義,并配以翻譯文本,從而達(dá)到雙語詞匯能力提高的目的。比如可以利用主題詞分析的方法,把旅游英語文本語料庫和本族語者的通用語料庫進(jìn)行比對就可以提取旅游文本主題詞,并對重點主題詞進(jìn)行語料庫驅(qū)動的學(xué)習(xí),即學(xué)生們可以自行觀察索引行,通過不同例句猜測其不同意義和用法。如圖1所示。
教師還可以利用ParaConc軟件向大家展示中英同詞不同義或不同譯的情況,利用這些直觀的方式從視覺和聽覺上不斷刺激,達(dá)到讓學(xué)生積累詞匯的目的。
3.2 平行語料庫用于翻譯實踐
由于平行語料庫具有雙語對應(yīng)的特點,對翻譯教學(xué)有著得天獨厚的優(yōu)勢。如利用ParaConc和ABBYY Aligner軟件可以呈現(xiàn)許多真實對譯例句,教師可以讓學(xué)生們觀察例句并發(fā)現(xiàn)和總結(jié)翻譯特點,待學(xué)生們理解后,教師再對翻譯中出現(xiàn)的對譯、增譯、減譯和分譯等情況加以講解,這樣學(xué)生們理解起來就比較容易,再加以練習(xí),就能達(dá)到熟練使用翻譯策略的目的。同樣,平行語料庫還可以起到詞典的作用,學(xué)生有什么不確定的翻譯,可以在語料庫中進(jìn)行查詢,看相同或類似的問題是如何翻譯的,長期使用和學(xué)習(xí)就能提高旅游英語的實際翻譯能力。
圖1 主題詞檢索分析
圖2 同詞不同譯
3.3 平行語料庫用于口語練習(xí)和英語寫作
由于語料庫能提供海量的信息,同時針對本地區(qū)具體實際情況和參照本地區(qū)旅游文本,可以先為學(xué)生布置口語話題,如介紹新鄉(xiāng)市八里溝風(fēng)景區(qū)的概況,讓學(xué)生自行尋找資料進(jìn)行景區(qū)導(dǎo)游詞創(chuàng)作,待學(xué)生完成后再到語料庫中尋找該景區(qū)的介紹資料,并據(jù)此對自己創(chuàng)作的導(dǎo)游詞加以比對和修改,形成相對準(zhǔn)確和適合學(xué)生的英語導(dǎo)游詞,再加以背誦和記憶,學(xué)生的語言功底和英語表達(dá)能力自然會提高,這種能力的提高也會體現(xiàn)在漢語的表達(dá)水平上。
同時導(dǎo)游詞的創(chuàng)作也是提高學(xué)生寫作水平的路徑之一。教師可以首先向?qū)W生介紹旅游文本的體裁特點、寫作原理和技巧,然后通過語料庫對文本在詞匯、語法和語篇層面的發(fā)現(xiàn),達(dá)到熟悉旅游寫作的句法和結(jié)構(gòu)特征的目的。然后進(jìn)入寫作實踐階段,仍以某一地區(qū)景點為話題,通過學(xué)生寫作、自評(與語料庫文本比對)、學(xué)生互評、修正、評估的五個階段實現(xiàn)學(xué)生寫作水平的逐漸提高。
本文介紹了具有地方特色的小型旅游專門雙語平行語料庫的建設(shè)和教學(xué)應(yīng)用的情況,涉及語料庫建設(shè)的具體實施步驟和具體的教學(xué)應(yīng)用,其優(yōu)勢在于為科研工作者的建庫工作提供參考,同時又可以幫助學(xué)生提高詞匯學(xué)習(xí)的效率、掌握翻譯的技巧及策略、提高口譯和翻譯寫作實踐的能力,為地方旅游事業(yè)發(fā)展提供技術(shù)指導(dǎo)和人才服務(wù)支持。當(dāng)然本研究還處于語料庫的初始使用階段,后期還可增加學(xué)生翻譯語料和全國旅游語料,同時還可以對具體翻譯現(xiàn)象,如錯誤翻譯進(jìn)行標(biāo)注,對語料庫進(jìn)行詞性賦碼等,以探討更深層次的語法和翻譯問題,從而更好地服務(wù)日常教學(xué)和地方旅游事業(yè)的發(fā)展。
(責(zé)任編輯 楊文忠)
[1] Tony McEnery and Andrew Hardie. Corpus Linguistics: Method, Theory and Practice [M]. Oxford: Cambridge University Press,2012.
[2] 胡開寶.語料庫翻譯學(xué)概論[M].上海:上海交通大學(xué)出版社,2011.
[3] 王克非.雙語對應(yīng)語料庫:研制與應(yīng)用[M].北京:外語教學(xué)與研究出版社,上海:上海交通大學(xué)出版社,2004 .
[4] 崔維霞,王均松.國內(nèi)學(xué)科專業(yè)語料庫研究現(xiàn)狀及發(fā)展趨勢[J].西安外國語大學(xué)學(xué)報,2013,01(55).
[5] 管新潮,胡開寶,張冠男.英漢醫(yī)學(xué)平行語料庫的創(chuàng)建與初始應(yīng)用研究[J].當(dāng)代外語研究,2011,09(36).
[6] 李艷輝.面向教學(xué)的化工類英漢雙語平行語料庫的構(gòu)建[J].吉林化工學(xué)院學(xué)報,2016,12(58).
[7] 宋亞軍.河南旅游英語外翻資料的語料庫分析[J].河南機(jī)電高等??茖W(xué)校學(xué)報,2016,02(64).
[8] Anne O’Keeffe and Michael McCarthy The Routledge Handbook of Corpus Linguistics[M]. London:Routledge,2010.
[9] 梁茂成.什么是語料庫語言學(xué)[M].上海:上海外語教育出版社,2016.
[10] 李文中.平行語料庫設(shè)計及對應(yīng)單位識別[J].當(dāng)代外語研究,2010,09(26).
[11] 衛(wèi)乃興,李文中,濮建忠,等.語料庫應(yīng)用研究[M].上海:上海外語教育出版社,2005.
The Construction and Application of Small Specialized Bilingual Paralleled Corpus
SONG Ya-jun
(Foreign Languages Department of Henan Institute of Technology, Xinxiang 453003, China)
Nowadays corpus technology has been applied in many areas and more and more scholars have found its value, but the unique advantage and application value of small bilingual paralleled corpus which has local characteristics and can serve local development are still being needed. Many facts indicate that bilingual paralleled corpus has more broadened application and potential value in specialized English teaching.
specialized English; bilingual paralleled corpus; English teaching
H319.3
A
1008–2093(2017)03–0070–04
2017-03-01
河南省教育廳人文社會科學(xué)研究項目(2017-ZDJH-035)
宋亞軍(1980―),男,山東德州人,講師,碩士,主要從事語料庫語言學(xué)及外語教學(xué)研究。