国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

虛擬語料庫在專門用途英語教學與研究中的應用

2018-10-23 02:16:42李華勇
關鍵詞:語料語料庫教學研究

李華勇

(四川文理學院 外國語學院,四川 達州 635000)

一、引言

隨著計算機和網(wǎng)絡技術的不斷發(fā)展,語料庫資源及技術不斷滲透到語言教學與研究中。語料庫技術發(fā)展經(jīng)歷了20世紀上半葉的1.0時期,也稱為前電子語料庫時期;20世紀60年代至今的2.0時期,這一時期委身于功能語言學研究之中[1];在大數(shù)據(jù)技術的推動下,語料庫技術正進入3.0時期,它借助海量、個性化的數(shù)據(jù),將全面影響近一個世紀以來的語言教學、語言描寫和研究范式。專門用途英語(English for Specific Purpose,簡稱ESP)的教學研究就是受語料庫影響的一個重要領域之一。

在國外,語料庫應用于ESP教學研究始于上世紀90年代[2],不僅建立了專門用途語料庫,如Michigan 口語語料庫(The Michigan Corpus of Academic Spoken English),還用語料庫技術提取了學術英語詞匯表,用于ESP閱讀和寫作教材的編寫。在國內(nèi)整體上看,基于計算機信息技術進行的ESP研究屈指可數(shù),落后于國外[3],但是近年來將語料庫技術引入ESP教學實踐和研究逐漸增多[4-5],這些ESP研究使用的語料庫絕大部分都是已經(jīng)建成的靜態(tài)語料庫,它們的容量有限[6],語料的語域有限,標注與統(tǒng)計檢索功能不是專門為ESP教學研究設計服務。ESP學習者和研究人員對這些語料庫的利用受限,難以很好地滿足ESP的多樣化、個性化需求。隨著網(wǎng)絡技術和大數(shù)據(jù)技術的發(fā)展,語料庫3.0時代初現(xiàn)端倪,使個性化虛擬語料庫(Customized Virtual Corpus)的創(chuàng)建和使用變得方便快捷:ESP的學習者和研究人員可以便捷地創(chuàng)建各種專題、特定語域的虛擬語料庫,以滿足各類ESP學習和研究的需求??梢灶A見,虛擬語料庫將對ESP的學習和研究產(chǎn)生重要影響。

二、虛擬語料庫與ESP

虛擬語料庫技術和研究成果應用于ESP教學研究是應用語言學、計算機技術、現(xiàn)代教育技術等交叉融合而開拓的一個新領域。誕生在網(wǎng)絡大數(shù)據(jù)背景下的虛擬語料庫技術及資源,以其個性化、方便快捷、界面友好和動態(tài)性等特征,能很好地適應ESP教學與研究的需求,可以看成是語料庫3.0時代背景下語料庫技術對ESP教學研究支持的全面升級。

(一)虛擬語料庫

虛擬語料庫是在大數(shù)據(jù)、互聯(lián)網(wǎng)和云計算等技術支持之下實現(xiàn)的語料庫3.0版,它能較好地滿足各類語言學習者和研究者的個性化需求。相對于傳統(tǒng)語料庫而言,個性化和虛擬性是虛擬語料庫的第一特征,語料的動態(tài)性和開放性、語料庫資源的隨意再組合性、統(tǒng)計功能的便捷性是虛擬語料庫的重要特征。在傳統(tǒng)語料庫創(chuàng)建時,事先按照一定的抽樣標準、標注標準、檢索標準建庫,盡量做到語言的代表性,做到語料庫的“規(guī)范”——語料的規(guī)范性、權威性。傳統(tǒng)語料庫不可避免地存在一些缺陷:語料資源靜態(tài)、庫容有限、語域固定、呈現(xiàn)語境受限。這些缺限使傳統(tǒng)語料庫在教學研究中的使用領域和范圍大大受限。建立在大數(shù)據(jù)時代“網(wǎng)絡語料庫”(Web as Corpus)[7]之上的虛擬語料庫一方面可以克服“網(wǎng)絡語料”目的性和針對性不強的缺陷,另一方面又可以實現(xiàn)傳統(tǒng)語料庫對數(shù)據(jù)的各種處理功能。虛擬語料庫是采用網(wǎng)絡技術、計算機技術和云計算等技術對網(wǎng)絡語料庫與傳統(tǒng)語料庫的升級,集成這兩類語料庫的優(yōu)勢,人性化地滿足各類人員對語料庫的多樣化、個性化需求。例如,我們可以快捷地在Wikipedia Corpus平臺和Sketch Engine平臺上根據(jù)個性化需求,創(chuàng)建諸如Business語料庫、Biology 語料庫、Investment語料庫、Buddhism語料庫等不同領域和語域的虛擬語料庫,并在這些虛擬語料庫中進行相關教學研究。

(二)ESP的特征

ESP指與特定職業(yè)或學科相關的英語,是以教授學術英語知識和技能為目標,根據(jù)學習者特定職業(yè)或學科需求而開設的英語課程[2]。法律、醫(yī)學、電子工程等ESP課程,其語篇結構、修辭手段和句法形式均各不相同[8]。ESP關注英語在某一專業(yè)領域中的學術詞匯和句法模式等層面的特殊表達形式[9],突出基于學科內(nèi)容的語言學習,在提高學習者英語水平的同時掌握專業(yè)英語技能[10]。ESP有不同于一般通用英語的特征:一是以滿足特定專業(yè)領域的學習者為對象,而不是所有的一般英語學習者;二是學習內(nèi)容與特定專業(yè)、職業(yè)密切相關;三是詞匯、句法、語篇均與特定專業(yè)的學術話語使用關聯(lián);四是具有跨學科的特點,不僅涉及語言本體及語言學的相關理論,還融合了學習者所學的學科專業(yè)知識。不同專業(yè)和學科背景的ESP具有不同的英語學術詞匯及表達方式,ESP學習者主要是學習本專業(yè)實際使用的英語詞匯、英語術語和習慣用法等,這是ESP教師應該講授的重點。ESP的性質和特點給ESP課程的英語教師提出了比一般通用英語更高的要求,教師除了要掌握英語語言學、教育學、心理學等理論知識外,還要求熟悉不同ESP課程所涉及的學科知識、專業(yè)知識、行業(yè)背景知識,以及這些知識的英語學術表述規(guī)范,這給ESP課程英語教師帶來了極大的挑戰(zhàn)。大學英語教師ESP專業(yè)詞匯知識和行業(yè)背景知識缺乏一直是實施ESP教學的瓶頸,很多ESP教師是“語言內(nèi)行的專業(yè)門外漢”。借助虛擬語料庫技術和方法,可以在一定程度上克服ESP學習者和ESP教師所面臨的挑戰(zhàn)與困境。

(三) 虛擬語料與ESP結合的理論背景

語料庫語言學以經(jīng)驗主義為哲學基礎,堅持語言“一元論”思想,體現(xiàn)功能語言學思想,堅持“語境意義觀”(contextual theory of meaning)。語料庫語言學堅持在語言事實挖掘和描述的基礎上,歸納出或然(probable)結論,而不是非黑即白的斷然(possible)結論。語料庫語言學的這些思想或原則要求基于實際觀察到的實用的語言事實或使用行為來描寫、研究和學習語言。語料庫可以作為教學資源和教學手段應用于語言教學[11]。語料庫經(jīng)過不斷的演化和發(fā)展,出現(xiàn)了不同的類型:固態(tài)語料庫和動態(tài)語料庫、離線語料庫和在線語料庫、歷時語料庫和共時語料庫、基于網(wǎng)絡的語料庫(web based corpus)和網(wǎng)絡語料庫(web as corpus)、基于網(wǎng)絡資源的虛擬語料庫(virtual corpus)。傳統(tǒng)語料庫用于ESP教學研究已是常態(tài),但是從某種程度來說,虛擬語料庫有著更適合于ESP教學和研究的優(yōu)勢。虛擬語料庫建庫具有更方便快捷、語料更豐富、語料可以不斷更換等特征。

形成于20世紀60年代的ESP體現(xiàn)了功能主義的語言觀[12]。ESP的教與學應該基于真實語境觀察和語言使用,關注特定學科或職業(yè)的語言使用特征及語言交際功能??梢姡珽SP與語料庫語言學的理論主張一脈相承,語料庫及虛擬語料庫技術應用于ESP教學研究有著深厚的理論基礎和天然的優(yōu)勢:虛擬語料庫能為ESP教學提供“真實”的語料,真實性(authenticity)是ESP教學的靈魂;虛擬語料庫能夠滿足ESP學習者多樣化、個性化的需求;虛擬語料庫技術能夠較好地體現(xiàn)ESP學習的“學生中心”原則——學生自主、按需創(chuàng)建、實時觀察。

三、ESP虛擬語料庫的創(chuàng)建

基于Wikipedia Corpus平臺創(chuàng)建各類ESP虛擬語料庫。Wikipedia Corpus是由美國楊百翰大學(Brigham Young University)的Davies在2015年初創(chuàng)建的語料庫平臺,它是取自維基百科(Wikipedia)英語版440萬篇文章,總詞量達19億,可按需求創(chuàng)建各種類型虛擬語料庫(Virtual Corpora)的平臺。利用該平臺,可以方便快捷地創(chuàng)建適合各類ESP教學研究的虛擬語料。Davies聲稱可以在一分種內(nèi)創(chuàng)建一個50萬~100萬詞,涉及微生物學、經(jīng)濟學、人類學或佛教等主題的ESP虛擬語料庫[13]。

下面以創(chuàng)建一個以“商務英語”為主題的虛擬語料庫(簡稱Business Corpus)為例,說明怎樣在Wikipedia Corpus平臺創(chuàng)建適合各類學生、教師或研究人員需求的虛擬語料庫,具體步驟如下。

第一,進入Wikipedia Corpus平臺,登錄自己的帳號。由網(wǎng)址http://corpus.byu.edu/wiki/進入Wikipedia Corpus,可以進行全庫的各項檢索。要創(chuàng)建虛擬語料庫,首先登錄自己的帳號,沒有帳號可以免費注冊。

第二,由頂端的檢索欄(Search)進入“創(chuàng)建語料庫”(Create Corpus)項。點擊Create Corpus,進入虛擬語料庫創(chuàng)建窗口(Virtual Corpus),在該窗口的“Title Word(s)”欄根據(jù)檢索語法規(guī)則選擇進入虛擬語料庫的語料,其實質是根據(jù)Wikipedia Corpus總庫中440萬篇文章的標題篩選進入虛擬語料庫文本?!癟itle Word(s)”欄可以使用精確的單詞,或詞的部分加通配符(*),或詞加“and”或“or”等邏輯詞來進行各類限定,以篩選出符合創(chuàng)建者需求的文本進入虛擬語料庫。窗口還有三個可選項:(Optional)Words not in Title、(Optional)Words in Pages、(Optional)Words not in Pages,依次可以限定標題中不出現(xiàn)的詞、文本所在頁必須出現(xiàn)的詞、文本所在頁不出現(xiàn)的詞。這里的限定支持詞的部分加通配符*,例如,“electr* engine*”可以代表“electric engine, electrical engineering, electronics engineer, etc”,可以限定這些詞出現(xiàn)或不出現(xiàn)在標題或正文頁中,總之可以讓創(chuàng)建者精準地選擇符合其需求的文本來組建虛擬語料庫。就我們要建的Business Corpus而言,“Title Word(s)”欄輸入“business or trade”;“(Optional) Words not in Title”欄輸入“film”,以排除標題為“Business Is Business (film)”類不符合要求的文本進入要創(chuàng)建的虛擬語料庫;“(Optional) Words in Pages”欄輸入“business”,以確保進入虛擬語料庫的文本中至少出現(xiàn)“business”一次以上;“(Optional) Words not in Pages”欄輸入“TV”,以排除文本中出現(xiàn)“TV”詞的頁面進入虛擬語料庫;“pages”欄設定為1 000,即允許最多有1 000篇符合要求的文章文本進入虛擬語料庫。通過上述一系列限定,可以確保創(chuàng)建的Business Corpus與商務活動具有高度的相關性,為開展與商務英語相關的ESP教學、研究提供可靠保證。

第三,設定好各項進入虛擬語料庫文本的條件限制后,點提交(Submit),進入“語料”編輯頁面,在此頁面可以查看選中文本的字數(shù)、標題、進入正文、增刪文章等操作。進一步瀏覽選中的語料是否符合要求,然后進行增加或刪除等操作。經(jīng)過觀察,認為找到的946篇文本都符合要求,點擊頁面最上面的“Save as”,對創(chuàng)建的虛擬語料庫進行命名保存,也可以用“Add to”把創(chuàng)建的語料庫作為子庫保存在已創(chuàng)建的虛擬語料庫中。我們將其命名為Business Corpus,并進行保存,點“Submit”提交。至此,由946篇文章、910 842詞構成,涉及商務英語的Business Corpus虛擬語料庫創(chuàng)建完成。另外,還可以實時對已建成的虛擬語料庫進行增加、刪除、隱藏等方面的后繼維護操作。

第四,對Business Corpus虛擬語料庫進行檢索。Wikipedia Corpus平臺提供豐富的檢索命令,對已建成的虛擬進行語料檢索:提取索引,提取關鍵詞,提取搭配結構(pattern),設定提取語料參數(shù)等操作,以準確找到各類ESP學習者或研究人員所需的語料庫??傊?,Wikipedia Corpus平臺實現(xiàn)了方便、快捷地創(chuàng)建各類ESP虛擬語料庫,是進行ESP學習實踐或研究的有力助手。

四、虛擬語料庫的ESP應用

(一) 在ESP學習中的應用

ESP涉及的學科、專業(yè)或行業(yè)眾多,現(xiàn)行ESP教材難以滿足ESP學習者的實際需求。通過虛擬語料庫可以很快檢索出特定ESP領域的核心詞匯和表達形式,一方面可以解決ESP英語教師專業(yè)詞匯知識增長的瓶頸,另一方面是解決ESP學習者不能迅速熟悉特定領域詞匯這一老大難問題的較好途徑。專業(yè)領域核心詞匯學習占據(jù)ESP學習的中心位置,通過虛擬語料庫技術提取索引和語境共現(xiàn)功能,為ESP學習者掃除ESP詞匯的障礙,為盡快進入后續(xù)ESP英語專業(yè)知識的學習和能力的培養(yǎng)創(chuàng)造條件。例如,我們根據(jù)前述的ESP虛擬語料庫創(chuàng)建方法,創(chuàng)建一個虛擬“生物學語料庫”(Biology Corpora),實現(xiàn)幾項應用:第一,設定參數(shù)提取生物學英語核心名詞,由于版面限制,只顯示前10個,如表1所示。這些核心名詞基本只用于生物學這個特定的領域,對它們的掌握是迅速進入此領域,開展后閱讀、寫作和學術交流的重要保障。第二,可以在虛擬生物學語料庫中迅速檢索出生物學英語學術話語中核心動詞,它們是在該領域的學術寫作和交流經(jīng)常使用的英語動詞(僅列前10個):index、 abstract、base、synthesize、encode、propose、associate、bind、classify、characterize。第三,可以迅速發(fā)現(xiàn)生物學領域的英語學術話語表達型式“N+N”的具體實現(xiàn)形式有system biology、population genetics、cell biology、impact factor、cell division、model organism、gene expression、cell membrane。對這些形式的理解只放在生物學專業(yè)背景中。第四,發(fā)現(xiàn)生物學領域常見的前10個特有形容詞分別是biological、biochemical、evolutionary、molecular、peer-reviewed、cellular、genetic、metabolic、biomedical、physiological。這些形容詞與通用英語(English for General Purposes,EGP)中使用的形容詞相差很大,對該類形容詞的掌握有助于該領域ESP學習者的閱讀、寫作或學術交流水平迅速提高。

表1 “生物學語料庫”中的生物學英語核心名詞

在Wikipedia Corpus平臺創(chuàng)建的ESP虛擬語料庫還提供了各種快捷鏈接,讓ESP學習者在更大語境中去掌握特定領域的專業(yè)知識。例如,可以對剛才創(chuàng)建的“生物學語料庫”進行“Find Keywords”檢索,發(fā)現(xiàn)“bioinformatics”名詞,進一步雙擊該詞語,然后進入表2“bioinformatics”所在索引,在更大語境中去理解該術語。如果需要進一步理解和掌握“bioinformatics”術語,還可以點擊表2中“Click for More Context”之下的索引所在文章名,鏈接該術語所在具體文獻,有助于ESP學習者在更大篇章中去擴展專業(yè)知識,提高自己的ESP閱讀水平,熟悉特定領域學術語篇建構模式??梢?,在Wikipedia Corpus平臺創(chuàng)建的各種ESP虛擬語料庫一步步引導ESP學習者自主學習,由詞匯、句法、段落到篇章,不斷探索和掌握本領域的ESP語言知識與技能,既有宏觀的專業(yè)領域核心詞匯的感知,也有微觀的專業(yè)術語索引的語境學習,更有權威的Wikipedia上文獻閱讀實踐。

表2 “bioinformatics”在虛擬生物學語料庫中的索引

(二)在ESP教學研究中的應用

通過虛擬語料庫手段可以便捷地實施對特定領域ESP語言特征的研究,尤其是詞匯特征的研究。ESP涉及的專業(yè)領域眾多,以前要研究特定領域ESP的語言特征,需要投入大量的資金和人力來創(chuàng)建相應的語料庫,耗時費力,資源浪費,且受益對象有限。現(xiàn)在通過Wikipedia Corpus平臺創(chuàng)建虛擬語料庫,研究各領域ESP的語言特征,實現(xiàn)了免費、方便、快捷,同時為基于語料庫的寫作學習提供了方便[14]。

通過虛擬語料庫技術可以迅速創(chuàng)建各類ESP教學語料庫資源。建設ESP教學資源語料庫是語料庫語言學由通用語料庫朝著專門用途語料庫發(fā)展的一種新趨勢。通過虛擬語料庫技術,進入課堂的ESP語料資源根據(jù)教學目標和要求重新語境化,使之更符合各類ESP課堂教學的實際需求,實現(xiàn)ESP教學語料資源的適恰性和連貫性,克服現(xiàn)行ESP教材的不足??傊摂M語料庫平臺Wikipedia Corpus或Sketch Engine[15]有助于ESP教師獲取備課資源,建立屬于自己的ESP課程資源體系。

五、結語

虛擬語料庫是云計算、大數(shù)據(jù)和網(wǎng)絡技術發(fā)展的產(chǎn)物,是語料庫進入3.0時代的特征之一。在Wikipedia Corpus或Sketch Engine平臺上,可以便捷地創(chuàng)建各類虛擬語料庫并進行相關檢索、統(tǒng)計和分析。虛擬語料庫技術可以進一步彌補現(xiàn)行ESP教材難以滿足ESP學習者個性化需求的不足,為ESP學習者掃除ESP詞匯障礙,盡快進入后續(xù)ESP專業(yè)知識的學習提供資源。虛擬語料庫技術有助于ESP研究者實施各類ESP語言特征的研究,為免費、便捷地創(chuàng)建各類ESP教學資源庫創(chuàng)造了條件。總之,虛擬語料庫技術可以便捷地滿足學生及研究人員對ESP的多樣化、個性化需求,對ESP的教學研究具有獨特的優(yōu)勢。

猜你喜歡
語料語料庫教學研究
《語料庫翻譯文體學》評介
高中數(shù)學教學研究
把課文的優(yōu)美表達存進語料庫
基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
交替?zhèn)髯g中聽記平衡教學研究
華語電影作為真實語料在翻譯教學中的應用
基于JAVAEE的維吾爾中介語語料庫開發(fā)與實現(xiàn)
語言與翻譯(2015年4期)2015-07-18 11:07:45
《苗防備覽》中的湘西語料
國內(nèi)外語用學實證研究比較:語料類型與收集方法
語文課堂有效教學研究
汾阳市| 鸡泽县| 泰州市| 灌云县| 客服| 增城市| 卢龙县| 聂荣县| 巴林左旗| 广水市| 剑川县| 龙江县| 临安市| 滨海县| 南汇区| 镇平县| 攀枝花市| 南充市| 中江县| 冕宁县| 长宁县| 南澳县| 青州市| 祁门县| 五台县| 视频| 永登县| 重庆市| 武义县| 海兴县| 浏阳市| 商洛市| 含山县| 灌阳县| 阳原县| 赤水市| 汾阳市| 新干县| 福州市| 平谷区| 察哈|