国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

語料庫在漢語教學(xué)中的應(yīng)用探析

2017-08-10 02:28趙星康冬梅
現(xiàn)代語文 2017年7期
關(guān)鍵詞:教材編寫漢語教學(xué)語料庫

趙星+康冬梅

摘 要:語料庫是經(jīng)科學(xué)選取和加工、標(biāo)引后存儲(chǔ)于計(jì)算機(jī)的大規(guī)模真實(shí)語言的材料庫,從“大規(guī)?!焙汀罢鎸?shí)”這兩個(gè)因素來考察,語料庫是最理想的語言知識(shí)資源。本文結(jié)合前人的研究和實(shí)踐,從漢語教材編寫、漢語學(xué)習(xí)詞典編纂、漢語教學(xué)方法研究和漢語教學(xué)評(píng)估四個(gè)方面論述了語料庫在其中所能發(fā)揮的作用,追蹤相關(guān)語料庫的運(yùn)用實(shí)踐,并提出一些改進(jìn)建議。

關(guān)鍵詞:語料庫 漢語教學(xué) 教材編寫 詞典編纂

隨著計(jì)算機(jī)技術(shù)的發(fā)展,短短五十年間,語料庫的建設(shè)規(guī)模已從第一代的百萬詞級(jí)發(fā)展到現(xiàn)在的億萬詞級(jí)。從服務(wù)于英語語法研究的建設(shè)初衷發(fā)展至今,語料庫與計(jì)算機(jī)的檢索和統(tǒng)計(jì)功能相結(jié)合,在與語言相關(guān)的詞典編纂、機(jī)器翻譯、語言教學(xué)等諸多領(lǐng)域均發(fā)揮了巨大作用。本文主要梳理語料庫在漢語教學(xué)中的應(yīng)用。

語料庫收集、整理和加工大量真實(shí)語言材料,它的顯著優(yōu)勢(shì)在于其語言材料的真實(shí)性、直觀性和豐富性。馮志偉[1]提到:從“大規(guī)?!焙汀罢鎸?shí)”這兩個(gè)因素來考察,語料庫是最理想的語言知識(shí)資源,堪稱語言材料的“大數(shù)據(jù)”庫。隨著計(jì)算機(jī)自動(dòng)標(biāo)引技術(shù)和自主學(xué)習(xí)技術(shù)的不斷進(jìn)步和完善,語料庫便捷的檢索功能、所提供語料的豐富、全面程度,是手工記錄和抄詞卡片無法比擬的。在漢語教學(xué)中,語料庫在漢語教材編寫、漢語學(xué)習(xí)詞典編纂、漢語教學(xué)方法研究和漢語教學(xué)評(píng)估這四個(gè)方面均發(fā)揮切實(shí)作用。

一、語料庫與漢語教材編寫

語料庫對(duì)漢語教材編寫的作用,首先在于語料庫能為教學(xué)大綱的編訂和教學(xué)重點(diǎn)的確定提供客觀科學(xué)的依據(jù)。目前,漢語教學(xué)大綱甲級(jí)詞、乙級(jí)詞、丙級(jí)詞的確定,很大程度上是參考了詞語的使用頻率,而詞頻統(tǒng)計(jì)即是在對(duì)語料庫的研究基礎(chǔ)上得出的。漢語教學(xué)的各種等級(jí)大綱的編訂,是建立在語料庫提供的漢字、詞匯和語法使用頻率的定量統(tǒng)計(jì)基礎(chǔ)上的,因而更具有廣泛性、客觀性、科學(xué)性和權(quán)威性。

其次,利用語料庫的字詞統(tǒng)計(jì)、檢索等功能,可以控制教材難度,為教材課文合理排序。我們可以通過統(tǒng)計(jì)語料庫中候選文本的長度、用字量、用詞量、超綱詞數(shù)量及比率等數(shù)據(jù)來確定候選文本的難度。在課文排序上,可以依據(jù)課文難度來確定課文出現(xiàn)的先后順序,同時(shí)考慮語法點(diǎn)出現(xiàn)的順序以及語法點(diǎn)出現(xiàn)的多少,此外還可以盡量選擇共有字詞比較多的素材來編排課文,提高生字詞的復(fù)現(xiàn)率,從而提高教學(xué)效果。

再次,語料庫能為教材編纂提供真實(shí)豐富的語言素材。漢語教學(xué)的最終目的是培養(yǎng)學(xué)生運(yùn)用漢語進(jìn)行言語交際的能力。如果我們能從大量真實(shí)的口語與書面語中選取素材作為課文,為課文中的生詞配備真實(shí)例句,就能讓學(xué)生學(xué)到自然的、地道的漢語。在教材更新以及教材輔導(dǎo)材料的編寫與補(bǔ)充方面,語料庫技術(shù)也大有可為。

在利用語料庫進(jìn)行漢語教材的編寫方面,學(xué)界目前并沒有出現(xiàn)以語料庫為基礎(chǔ)和依據(jù)來進(jìn)行漢語教材編寫的實(shí)操應(yīng)用,多是對(duì)某一方面的問題進(jìn)行資料統(tǒng)計(jì)并提出具體建議。如郭曙綸[2]提出利用語料庫來改進(jìn)對(duì)外漢語教材中的超綱詞問題。

在歐洲,以英語為第二語言的教學(xué)界已經(jīng)在利用語料庫進(jìn)行教材編制方面作出嘗試,如比利時(shí)魯汶天主教大學(xué)的Meunier&Gouverneur兩位教授開發(fā)了以英語為第二語言的教材語料庫(Corpus of Textbook Material,簡稱Te-Ma),在國際市場(chǎng)上大受歡迎[4]。

利用語料庫進(jìn)行教材編寫,關(guān)鍵問題在于首先要建設(shè)一個(gè)專用于教材編寫的語料庫,收集合適的素材,對(duì)素材的體裁、用詞量、用字量、語法點(diǎn)、詞匯等級(jí)、超綱詞等都做好標(biāo)注。由于人工標(biāo)注成本太高,標(biāo)注最好用計(jì)算機(jī)先自動(dòng)標(biāo)引、人工二次校對(duì)的方式進(jìn)行,因而,標(biāo)注程序和標(biāo)注工具的研發(fā)也是必不可少的。有了好用的素材庫,利用語料庫編寫教材的工作才能順利進(jìn)行。

二、語料庫與漢語學(xué)習(xí)詞典編纂

大型語料庫對(duì)于詞典編纂無疑極有用處。早在1969年,由Houghton Mifflin公司出版的American Heritage Dictionary在編寫過程中就使用了布朗語料庫。而Collins出版社和伯明翰大學(xué)合作編輯出版的Collins Cobuild Dictionary,則完全依賴世界著名的COBUILD語料庫①編訂而成。Collins Cobuild Dictionary從詞條的選定、用法到釋義的先后順序等都依據(jù)了從2億詞次的COBUILD語料庫中統(tǒng)計(jì)出的頻率;詞典中的例詞和例句也均取材于COBUILD語料庫。由于其例句的真實(shí)性和準(zhǔn)確性,Collins詞典如今已連續(xù)出版多個(gè)版本,廣受好評(píng)。著名的Longman英語詞典在編纂時(shí)所依據(jù)的語料庫共包含以下三個(gè)子語料庫:一是朗文/蘭卡斯特語料庫(Longman-Lancaster Corpus),收集了英美各類型書面語3000萬詞;二是朗文學(xué)生語料庫(The Longman Learners Corpus),收集了各國英語學(xué)習(xí)者的書面語;三是英語口語語料庫(The Longman British Spoken Corpus and The Longman Spoken American Corpus)。Longman英語詞典的詞義解釋、所用例句和詞語使用頻率標(biāo)記等都得益于朗文/蘭卡斯特語料庫。世界上知名的詞典出版商無不看重語料庫方法和技術(shù)在詞典編纂中的作用,并紛紛推出了各自基于語料庫的詞典產(chǎn)品。代表性的出版社有Collins、Longman、Cambridge、Oxford等。

目前,大型漢語語料庫建設(shè)也引發(fā)了漢語辭書編纂的變革,漢語語料庫為編寫漢語辭書提供了大量真實(shí)客觀的語料和相關(guān)的語言信息,如詞頻統(tǒng)計(jì)、詞匯分級(jí)、詞性標(biāo)注、詞語搭配、語體特征、詞語用法、語境中的例句等。

國內(nèi)利用語料庫編纂詞典的嘗試也有不少,服務(wù)于漢語學(xué)習(xí)詞典編纂的語料庫②有:商務(wù)印書館的辭書語料庫及編纂系統(tǒng)[3];教育部語言文字應(yīng)用研究所開發(fā)的基于語料庫的數(shù)字化辭書編纂平臺(tái)[4];北京大學(xué)計(jì)算語言學(xué)研究所開發(fā)的基于語料庫的雙語詞典編纂平臺(tái)[5];煙臺(tái)師范學(xué)院建設(shè)的“漢字義類信息庫”“漢語語義構(gòu)詞信息庫”[6];南京大學(xué)開發(fā)的NULEXID語料庫暨雙語詞典編纂系統(tǒng),涉及英漢兩種語言,在《新時(shí)代英漢大詞典》的編纂過程中已經(jīng)起到了重要作用[7];臺(tái)灣地區(qū)于2004年正式成立“詞典及語料庫研究中心”[8],作為詞典、語料庫相關(guān)資源的匯集處,中心網(wǎng)站已構(gòu)建完成,網(wǎng)址為http://dcrc.org.tw[9]。endprint

國內(nèi)基于語料庫編纂的漢語學(xué)習(xí)詞典有以下幾部:《現(xiàn)代漢語頻率詞典》[10],《最新流行語小詞典》[6],《實(shí)用網(wǎng)絡(luò)用語手冊(cè)》[6],《新詞語大詞典》[6],《HSK量詞學(xué)習(xí)詞典》[11],《現(xiàn)代漢語語法信息詞典》[5],《中英文概念詞典》[5],《現(xiàn)代漢語動(dòng)詞例釋》[12],《國語日?qǐng)?bào)名量詞典》[2],《基于語料庫的HSK多功能例解字典》[2],《新時(shí)代英漢大詞典》[7],《對(duì)外漢語新詞語詞典》[13]。

三、語料庫與漢語教學(xué)方法研究

語料庫對(duì)漢語教學(xué)方法的改進(jìn),首先在于教師可以借助語料庫提供的信息確定教學(xué)重點(diǎn)和難點(diǎn)。以往的教科書、字典和語法書通常能顯示某種語言有哪些存在形式,卻無法顯示哪一種形式被本族語者使用得最多或者最少,在什么語體或交際場(chǎng)合出現(xiàn)頻率最高等等。而基于語料庫信息的教學(xué)則能讓學(xué)生學(xué)到目標(biāo)語中最常用的語言形式,把師生有限的時(shí)間和精力用在學(xué)習(xí)最有價(jià)值的知識(shí)上。

其次,運(yùn)用語料庫教授語言有利于將傳統(tǒng)的“以教師為中心的知識(shí)傳授型教學(xué)”轉(zhuǎn)變?yōu)椤耙詫W(xué)生為中心的知識(shí)探索型教學(xué)”[14]。學(xué)生一旦上機(jī)面對(duì)著龐大的語料世界,就如同處于某種探索者和研究者的位置。教師不再直接地給學(xué)生灌輸知識(shí),而是引導(dǎo)他們自己動(dòng)手,在教會(huì)學(xué)生掌握了簡單的查詢、檢索和分類等功能之后,學(xué)生們就能運(yùn)用自己在其他課程中學(xué)到的理論和知識(shí)對(duì)語料進(jìn)行觀察和研究,這種學(xué)習(xí)模式被稱為“受語料驅(qū)動(dòng)的學(xué)習(xí)模式”(data-driven learning)[15]。

再次,對(duì)語料庫資源的深加工也進(jìn)一步促進(jìn)了計(jì)算機(jī)輔助語言教學(xué)(CALL)的發(fā)展[14]。正如Cameron[16]所指出的:以前不少計(jì)算機(jī)輔助語言教學(xué)項(xiàng)目由于缺乏語料資源以及缺少編程人員與語言教師的充分合作而發(fā)揮不了應(yīng)有的作用。而今基于語料庫的計(jì)算機(jī)輔助語言教學(xué)(CALL)不但為較高層次的語言學(xué)和文學(xué)學(xué)習(xí)者提供了語料基地,而且也為一般初、中等程度的第二語言學(xué)習(xí)者提供了豐富而真實(shí)的語言基本模式。

在第二語言習(xí)得及第二語言教學(xué)領(lǐng)域,最重視的語料庫是學(xué)習(xí)者語料庫。學(xué)習(xí)者語料庫是指通過收集語言學(xué)習(xí)者各種書面和口頭的自然語料,建立的一種語言數(shù)據(jù)庫。其目的在于對(duì)語言學(xué)習(xí)者的語言特征和語言發(fā)展進(jìn)行全面而系統(tǒng)的對(duì)比分析,獲得有關(guān)學(xué)習(xí)者的典型困難及在某一具體語言點(diǎn)的障礙,通過不同類型語言學(xué)習(xí)者的語言對(duì)比,發(fā)現(xiàn)學(xué)習(xí)者在某一發(fā)展階段的共同特征和個(gè)體特征,從而將這些信息反映到教學(xué)大綱的制定、教材的編寫以及課堂教學(xué)實(shí)踐等環(huán)節(jié)中,使語言教學(xué)更有針對(duì)性。

影響較大的漢語學(xué)習(xí)者語料庫是2006年底北京語言大學(xué)開發(fā)建成的“HSK動(dòng)態(tài)作文語料庫”[17],它以母語為非漢語的外國人參加高等漢語水平考試(HSK高等)作文考試的答卷內(nèi)容為語料,收集了1992~2005年的部分外國考生的作文答卷。語料庫1.0版收入語料10740篇,約400萬字;語料庫1.1版語料總數(shù)達(dá)到11569篇,共計(jì)424萬字。該語料庫提供網(wǎng)上免費(fèi)使用之后,已有一些學(xué)位論文利用其語料進(jìn)行研究。國內(nèi)還專設(shè)漢語中介語語料庫建設(shè)與應(yīng)用國際學(xué)術(shù)研討會(huì),至今已舉辦四屆。此外,崔希亮、張寶林[18]還提出“全球漢語學(xué)習(xí)者語料庫”的建設(shè)構(gòu)想,胡韌奮等[19]構(gòu)建了一個(gè)規(guī)模約12萬句的話題語料庫,拓展了漢語學(xué)習(xí)者語料庫的廣度和深度。

四、語料庫與漢語教學(xué)評(píng)估

教學(xué)評(píng)估是指以教學(xué)目標(biāo)為依據(jù),制定科學(xué)的標(biāo)準(zhǔn),對(duì)教學(xué)活動(dòng)的過程及其結(jié)果進(jìn)行測(cè)定、衡量,并給以價(jià)值判斷。教學(xué)評(píng)估的結(jié)果是一種反饋信息,它可使教師及時(shí)了解、掌握自己的教學(xué)情況,為教師修訂教學(xué)計(jì)劃、改進(jìn)教學(xué)方法、完善教學(xué)指導(dǎo)、進(jìn)行自我調(diào)節(jié)提供依據(jù),從而間接地提高學(xué)生的學(xué)習(xí)效果;學(xué)生則據(jù)此變更學(xué)習(xí)策略、改進(jìn)學(xué)習(xí)方法、增強(qiáng)學(xué)習(xí)的自覺性[20]。

教學(xué)評(píng)估使用最多的手段是布置練習(xí)題和測(cè)試,語料庫在為測(cè)試題提供試題選擇、增加測(cè)試題的信度和效度方面均能發(fā)揮作用。

首先,作為試題數(shù)據(jù)的來源,語料庫在試題選擇方面有巨大潛力。無論是口頭語還是書面語,它們都是按相關(guān)變數(shù)如來源(出處)、文體、用詞量等等分類,這是大多數(shù)語言測(cè)試的基礎(chǔ),在計(jì)算機(jī)上獲取這些信息可以節(jié)省大量時(shí)間。在那些篇章按難易程度或?qū)W習(xí)者水平的適宜度來規(guī)定的語料庫中,還可以挑選難度適宜的試題為指定考題。

其次,在試題設(shè)計(jì)上,語料庫也能發(fā)揮大的作用。通過語料庫對(duì)語法結(jié)構(gòu)等的檢索,可以得到各種語法結(jié)構(gòu)的典型用法;通過學(xué)習(xí)者語料庫,還可以知道學(xué)生們?cè)趯W(xué)習(xí)過程中在哪些方面容易受到母語的影響,將其確定為考察的重點(diǎn);此外,多數(shù)索引軟件還提供了搜索詞屏蔽功能(zipping),使得教師能夠利用索引輕松地編制填空或選擇練習(xí)。

再次,在試卷分析方面,語料庫也可以發(fā)揮作用。如果創(chuàng)建一個(gè)專門的試卷語料庫,收集某種(包括某門課程)考試的歷年試卷,并對(duì)試卷進(jìn)行必要的標(biāo)注;在此基礎(chǔ)上,就可以對(duì)詞語和考點(diǎn)分布的頻率等作出科學(xué)的分析。

五、結(jié)語

綜上所述,語料庫在漢語教材編寫、漢語學(xué)習(xí)詞典編纂、漢語教學(xué)方法研究和漢語教學(xué)評(píng)估這四個(gè)方面都發(fā)揮著重要作用,基于語料庫的漢語教學(xué)正成為一種趨勢(shì)和發(fā)展方向。各種漢語學(xué)習(xí)的語料庫建設(shè)正如火如荼地進(jìn)行中,編制語料庫,對(duì)各種語料進(jìn)行有意識(shí)地收集、分類和標(biāo)注,是語料庫建設(shè)的重頭工作,尤其是語料的標(biāo)注,一定要事先精心設(shè)計(jì),在標(biāo)注過程中進(jìn)行人工干預(yù)和檢查,語料庫初步建設(shè)完成后,還要考慮后續(xù)的語料更新等問題。

語料庫是創(chuàng)新的產(chǎn)物,在利用它時(shí),必然會(huì)有一些局限性[21]。除了外在原因如技術(shù)問題、師生的計(jì)算機(jī)操作水平、設(shè)備等,語料庫本身未能發(fā)掘得更深刻也是局限之一,比如語料庫并不能標(biāo)注所有的語言特點(diǎn),尤其是部分不規(guī)則的語言點(diǎn)。所有這些局限性還有待語料庫語言學(xué)的進(jìn)一步發(fā)展而加以解決。

注釋:

①網(wǎng)址:http://www.cobuild.collins.co.uk/,但語料庫僅供內(nèi)部使用,外網(wǎng)無法訪問。endprint

②國內(nèi)雙語詞典的語料庫建設(shè)也在如火如荼地進(jìn)行中,本文主要調(diào)查漢語學(xué)習(xí)詞典語料庫的建設(shè),雙語詞典語料庫僅舉了影響較大的南京大學(xué)開發(fā)的NULEXID語料庫和北京大學(xué)開發(fā)的基于語料庫的雙語詞典編纂平臺(tái)。

參考文獻(xiàn):

[1]馮志偉.從語料庫中挖掘知識(shí)和抽取信息[J].外語與外語教學(xué),2010,(4):1-7.

[2]郭曙綸.漢語語料庫的建設(shè)及應(yīng)用[M].上海:上海外語教育出版社,2011.

[3]劉成勇.解析“商務(wù)印書館辭書語料庫及編纂系統(tǒng)”[J].科技與出版,2007,(12):19-20.

[4]靳光瑾.基于語料庫的數(shù)字化辭書編纂平臺(tái)研制與應(yīng)用[A].對(duì)外漢語學(xué)習(xí)詞典學(xué)國際研討會(huì)論文集[C].2005:141-162.

[5]常寶寶,俞士汶.語料庫技術(shù)及其應(yīng)用[J].外語研究,2009,(5):43-51.

[6]亢世勇,李毅,孫道功,張楠.漢語系統(tǒng)語料庫的建設(shè)與詞典編纂[A].2004年辭書與數(shù)字化研討會(huì)論文集[C].2004:143-149.

[7]楊蔚.在比較中探尋NULEXID語料庫系統(tǒng)的未來之路[A].2004年辭書與數(shù)字化研討會(huì)論文集[C].2004:89-104.

[8]泰元.臺(tái)灣地區(qū)成立“詞典及語料庫研究中心”[J].辭書研究,2004,(5):28.

[9]曾泰元.我國臺(tái)灣省“詞典及語料庫研究中心”積極開展學(xué)術(shù)活動(dòng)[J].辭書研究,2007,(1):106-107.

[10]黃昌寧,李涓子.語料庫語言學(xué)[M].北京:商務(wù)印書館,2002.

[11]劉亞菲.語料庫技術(shù)與對(duì)外漢語量詞詞典編纂[D].北京:北京語言大學(xué)碩士學(xué)位論文,2006.

[12]苗傳江.現(xiàn)代漢語動(dòng)詞例釋[M].北京:北京師范大學(xué)出版社,2011.

[13]崔樂.語料庫技術(shù)在外向性詞典元語言控制中的應(yīng)用——以對(duì)外漢語新詞語詞典為例[A].國際漢語學(xué)報(bào)(第3卷第1輯)[M].上海:學(xué)林出版社,2012:230-242.

[14]何安平.語料庫與外語教學(xué)[J].國外外語教學(xué),2001,(3):15-19.

[15]Leech,G.Teaching and Language Corpora:A Convergence[A].(eds.)Anne Wichman et al.Teaching and Language Corpora[M].New York:Longman,1997:10-11.

[16]Cameron,K.(ed.)Introduction[A].Computer Assisted Language Learning(CALL)-Media,Design and Applications[M].Netherlands:Swets&Zeitinger,1999:1,6.

[17]“HSK動(dòng)態(tài)作文語料庫”課題組.“HSK動(dòng)態(tài)作文語料庫”正式開通[J].世界漢語教學(xué),2009,(1):48.

[18]崔希亮,張寶林.全球漢語學(xué)習(xí)者語料庫建設(shè)方案[J].語言文字應(yīng)用,2011,(2):100-108.

[19]胡韌奮,朱琦,楊麗嬌.對(duì)外漢語教學(xué)領(lǐng)域話題語料庫的研究與構(gòu)建[J].中文信息學(xué)報(bào),2015,(6):62-68.

[20]高鐵剛,王馨,寇海蓮.信息技術(shù)環(huán)境下教學(xué)評(píng)價(jià)的理論與方法[M].北京:清華大學(xué)出版社,2011:6-7.

[21]肖依虎,潘翠瓊.語料庫在語言測(cè)試中的應(yīng)用[J].外語教學(xué),2002,(11):93-96.

(趙星 康冬梅 北京師范大學(xué)圖書館 100875)endprint

猜你喜歡
教材編寫漢語教學(xué)語料庫
《語料庫翻譯文體學(xué)》評(píng)介
委婉語教學(xué)研究
文學(xué)理論教材編寫之淺見
否定副詞“不”和“沒”的認(rèn)知分析
新疆高職院校少數(shù)民族漢語教學(xué)的課程設(shè)計(jì)及開發(fā)研究
淺析大學(xué)英語教材編寫存在的問題及措施
高中數(shù)學(xué)教材的心理學(xué)探析
基于JAVAEE的維吾爾中介語語料庫開發(fā)與實(shí)現(xiàn)
語料庫語言學(xué)未來發(fā)展趨勢(shì)