崔維霞王均松
語料庫與語言教育
——思想、方法和技術
崔維霞王均松
語料庫語言學是最近 30年以來在國外迅速發(fā)展起來的跨領域學科,在教學中引入語料庫是當今語言教育發(fā)展的新趨勢。 本文重點探討了語料庫在語言教學中的具體應用:1)語料庫作為教學資源;2)語料庫作為教學手段;3)語料庫作為研究中介語的平臺。目前,語料庫應用于語言教學雖然面臨一系列的問題和挑戰(zhàn),但其未來的發(fā)展前景無限廣闊。
語料庫 語言教育 問題和挑戰(zhàn)
語料庫語言學是20世紀中后期興起的一門語言研究科學。在過去的幾十年中,語料庫不僅用于語言研究,而且在語言學習和教學方面也發(fā)揮了重要的作用。近年來,越來越多的研究人員和教育工作者開始利用語料庫進行語言教學方面的嘗試,并在各自領域取得了一定的成果。本文主要探討語料庫作為語言教學資源、教學手段以及中介語研究平臺三個方面的具體應用,并對語料庫應用于語言教學所面臨的問題和挑戰(zhàn)進行了分析和討論。
在《語料庫語言學導論》一書中,楊惠中指出語料庫是指按照一定的語言學原則,運用隨機抽樣方法,通過收集自然出現的連續(xù)語言運用文本或話語片段,而建成的具有一定容量的大型電子文本庫。根據研究目的、用途、加工程度以及語料庫所代表的語言類型等方面,語料庫可以分為多種類型。黃昌寧和李涓子就曾把語料庫分成四種類型:異質的、同質的、系統(tǒng)的和專用的。此外,按照語料的語種,語料庫也可以分成單語的、雙語的和多語的。按照加工程度,語料庫又可以分為原始語料庫和賦碼語料庫。按照采集語料的時間跨度,語料庫還可以分為共時語料庫和歷時語料庫??傊?,語料庫的類型多種多樣,其在語言教學中的應用也各不相同。
1.語料庫作為教學資源
語料庫是大量真實語言材料的集合,在教學過程中通常被用作教學資源庫。語料庫作為教學資源的一個重要體現就是主要作為大綱設計和教材編寫的依據。何安平指出,在制定教學大綱和編寫教材的過程中,語料庫提供的信息是非常重要的參照,它關系到是否能讓學生在有限的時間內最先學到最常用往往也是最有用的語言知識。比如,Mind 將情態(tài)動詞、將來時表達法和條件句在英語母語語料庫中的分布頻率與這些結構在德國熱門英語教材中的教學次序作了比較,結果發(fā)現:凡是沒有基于語料庫的教材中,這些語言結構的出現順序“往往與人們預想的口語和書面語中的出現情況不一致”。他指出教學大綱的編寫應以實證為依據,而不是以直覺為基礎,要以實際語言使用的頻率數據為指導來安排教學的先后順序。其次,語料庫還可以直接用作課堂教材。在講授某一具體的語言點的時候,教師從語料庫中選取一批實例,根據難易程度稍作篩選之后便可拿到課堂上使用,這樣既能讓學生接觸到大量真實鮮活的語料,還能激發(fā)學生主動探索和學習的積極性。有的老師甚至指導學生自建與日常教學相關的語料庫,然后應用到外語寫作、翻譯、語音和口語等多種課程教學之中。
另一方面,學習者還可以直接利用大量免費在線的語料庫進行自主學習。其中“美國當代英語語料庫”(COCA)是目前世界上最大的英語平衡語料庫,并且免費對公眾開放。該語料庫由楊柏翰大學的 Mark Davies 教授開發(fā),庫容規(guī)模達到 4.5 億詞匯,語料涵蓋了口語、小說、流行雜志、報紙和學術期刊五大類型,時間跨度為 24年(1990—2014),并且每年至少更新兩次。利用該語料庫,學習者只需在檢索框輸入要查詢的詞匯和結構,便可以獲取大量的索引行,通過歸納和總結可以很快地掌握該詞匯或結構在具體語境中的意義和用法。當學習者無法確定某種用法或搭配是否地道或典型時,也可以借助該語料庫進行驗證。此外,該語料庫還可以用于同義詞辨析方面。將需要區(qū)分的同義詞分別輸入檢索項,確定搭配詞的詞類和跨距,然后對搭配詞進行統(tǒng)計和分析。通過比較同義詞的搭配詞可以對二者的意義和用法進行區(qū)別,如果要作進一步的區(qū)分,還可以考查二者在頻率和語域分布方面的差異。
2.語料庫作為教學手段
語料庫不僅能為語言學習提供豐富的教學資源,而且也是一種重要的教學手段,代表了一種先進的教學理念。20世紀 90年代Tim Johns 提出的“數據驅動學習模式”(Data-driven Learning)就是基于語料庫數據的一種新型外語學習方法,它的主要思想是指引語言學習者充分利用網絡和語料庫資源,通過觀察和分析大量客觀真實的語料,發(fā)現語言語法規(guī)則、意義表達及語用特征,積極主動地解決問題。下面以詞匯教學為例來演示這種基于語料庫的數據驅動學習模式。
在一次題為 Pocket Money 的作文互評中,對于短語“such as”是否可以與短語“and so on”連用的問題上學生之間產生了分歧,一部分同學認為可以連用,另一部分同學持相反的意見。經過調查發(fā)現,同學們對于短語“such as”的掌握普遍不夠全面和準確。對此,授課教師要因勢利導,將數據驅動的學習方式引入課堂,引導學生主動探究詞匯的意義和用法。具體步驟如下:
首先,預設問題。除了存在分歧的問題外,教師還要針對語言點的具體用法提出更多問題供學生思考和回答。在這個具體的例子中,預設的問題包括:
1)“such as”是否可以與“and so on”連用?
2)“such as”后面除了接名詞以外,是否還可以接其他句子成分?
3)“such as”列舉事物的數目有沒有限制?
其次,選取語料并觀察。在語料庫中檢索包含短語“such as”的語言實例,并將索引行以關鍵詞居中(KWIC)的形式呈現給學生。在選取語料時,數量既不能太多也不能太少,數量太多會增加觀察的負擔,使學生產生厭煩心理;太少則不具備代表性,影響結論的準確性和客觀性。Sinclair 的做法是對索引行進行抽樣,只取其中的 30 行(一屏)左右進行觀察,必要時進行再次抽樣。索引行的語言難度也要適中,剔除難度過大或不相關的索引行。在觀察的過程中也要給予一定的指導,不僅要左右看還要上下看,注意歸納總結語言使用的規(guī)律和特點。
最后,總結和匯報。將學生分為若干小組(每組 4—5人),針對預設問題進行討論和總結,然后每個小組選出代表進行匯報。在討論的過程中,教師要鼓勵學生勇于探索和發(fā)現,敢于質疑和挑戰(zhàn)傳統(tǒng)詞典和教科書的權威。在討論和匯報結束后,教師還要對討論的過程進行評價,對討論的結果進行總結?;谡Z料庫的數據驗證發(fā)現:1)“such as”和“and so on”的搭配強度很弱,二者連用的頻率非常低;2)“such as”后面除了接名詞以外,還可以接其他的詞類(如代詞、動名詞等)和句子;3)“such as”列舉事物的數目沒有嚴格的限制,既可以是單個,也可以是兩個或多個。
3.語料庫作為研究中介語的平臺
20世紀 90年代, 基于學習者語料庫的中介語對比分析(CIA) 逐漸成為二語習得研究的新方法,這種對比分析方法能為外語教學提供極有價值的資源和信息。學習者語料庫是通過收集語言學習者各種書面語和口語的自然語料而建立的一種學習者語言數據庫,其目的在于對學習者的語言特征和語言發(fā)展進行全面和系統(tǒng)的對比分析,而不僅限于對學習者的錯誤進行分析。例如,比利時學者 Dagncaux 曾基于“國際英語學習者語料庫”(ICLE) 對法國大學兩種不同英語水平的大學生寫作語料進行全面的錯誤類型調查。首先由以英語為母語的教師和以法語為母語的英語教師聯(lián)合批改作文,然后對各種差誤進行半自動的系統(tǒng)標碼,最后通過檢索差誤標碼調查學生的差誤類型和頻率分布。結果發(fā)現,高年級學生無論在總體出錯次數上還是具體某些類別的差錯上都明顯地少于低年級學生。但在差誤類型上則有較大的差異,如低年級學生的出錯集中于助動詞的使用,而高年級的學生的動詞時態(tài)出錯率要多于助動詞。這些信息可以反映學生在不同階段的語言學習的特征以及存在的主要問題,對于教學具有重要的參考價值。
總而言之,學習者語料庫的優(yōu)勢在于能夠提供有關學習者語言發(fā)展的全面信息。在外語學習和教學中,基于學習者語料庫的研究,能提供學習者學習的典型困難以及在某一具體方面的主要障礙的反饋信息。另外,通過對不同類型學習者的語言對比,可以發(fā)現學習者在某一發(fā)展階段的共同特征和個體特征,從而將這些信息反饋到外語教學的大綱設計、教材開發(fā)以及課堂教學等方面,使教學更加適應學習者的需求。
盡管語料庫在語言教育中的重要作用已經得到廣泛的關注和認可,但是依然面臨很多問題和挑戰(zhàn)。首先,語料庫的優(yōu)勢之一就是能夠為語言教學提供頻率信息,然而有學者認為在語言學習中使用語料庫會不恰當地關注高頻語言,而舍棄那些不太常用卻又十分重要的表達法。其次,有的學者贊成使用賦碼語料庫,因為它們可以為語言教學提供充足的信息。同時,有的學者反對使用賦碼語料庫,正是因為它們提供了太多的信息,有些信息甚至是誤導性的。而另一方面,原始語料庫雖然簡潔、真實,但是畢竟提供的信息很有限。再次,將語料庫引入課堂教學是一項費時費力的工作,很多嘗試數據驅動教學模式的教師反映備課時間要比普通備課時間多 1—2 倍。而學生雖然對新的教學模式表現出濃厚的興趣,但是在課下使用語料庫進行自主學習的則寥寥無幾,部分原因是學生對語料庫軟件和操作界面不熟悉,或者是因為從語料庫中檢索出來的語言實例和信息量過大且沒有進行篩選和加工,學生們對此往往是望而生怯,知難而退。此外,目前針對語言教學的語料庫的數量還太少,由于語料來源的版權問題,語料庫的規(guī)模、代表性以及流通的廣泛性都受到了限制,因此如何實現教學語料庫的共建、共享,充分發(fā)揮語料庫在語言教學中的作用是目前亟待解決的一個重要課題。
[1]Mindt,D.:English corpus linguistics and the foreign language teaching syllabus,In J.Thomas& M.Short,(eds.):Using Corpora for Language Research(London:Longman,1996)P232-247.
[2]Johns,T.: “From printout to handout:Grammar and vocabulary teaching in the context of data-driven learning,”English Language ResearchJournal,no.4(1991):P27-45.
[3]Dagncaux,E.,Denness,S.&S.Granger.: “Computer-aided error analysis,”System,(no.26Feb.1998):P163-174.
[4]楊惠中:《語料庫語言學導論》,上海外語教育出版社,2002。
[5]黃昌寧、李涓子:《語料庫語言學》,商務印書館,2007。
[6]何安平:《語料庫語言學與英語教學》,外語教學與研究出版社,2004。
作者單位:崔維霞 西安外國語大學高職部 陜西西安
王均松 西北工業(yè)大學外國語學院 陜西西安
本文為教育部人文社科基金 “基于雙向平行語料庫的話語標記語對比研究”(編號:15YJC740083)、陜西省教育廳項目“話語標記語:基于語料庫的跨語言對比研究”(編號:16JK1623)、西安外國語大學科研基金項目“基于語料庫的專門用途英語主題詞表的創(chuàng)建及應用研究”(編號:11XWB01)的階段性成果。