国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

泰語語料庫和語料庫索引在泰語教學中的應(yīng)用

2016-03-16 19:11朱蒙
教育教學論壇 2016年9期
關(guān)鍵詞:語料庫

朱蒙

摘要:語料庫語言學的快速、持續(xù)發(fā)展產(chǎn)生了巨大的語言數(shù)據(jù)資源。語料庫索引又為處理語言數(shù)據(jù)資源提供了新的研究方法和技術(shù)手段。泰國語料庫語言學和語料庫索引雖然還不十分發(fā)達,但已經(jīng)能為泰語教學所用,為傳統(tǒng)的教學模式提供新的視角,注入新的活力。

關(guān)鍵詞:語料庫;語料庫索引;泰語教學

中圖分類號:G642.0 文獻標志碼:A 文章編號:1674-9324(2016)09-0269-03

一、語料庫和語料庫索引

語料庫語言學是20世紀中后期開始發(fā)展的一門新興學科,研究對象為真實的語言數(shù)據(jù),嚴格設(shè)計并創(chuàng)建的語料庫所包含的應(yīng)該是真實文本和真實話語,用統(tǒng)計學方法對語料進行定量分析,并同時加以用歸納法進行定性分析,從一個新的角度揭示自然語言的復雜性,所反映的是最典型和最真實的語言特征,即語言實例在出現(xiàn)頻率上的優(yōu)勢即是對其背后語法體系的概率體現(xiàn)。

在語料庫研究中,對某一搜索詞的語法關(guān)系、用法、以及搭配的分析是通過語境(context)進行的。語料庫索引利用計算機技術(shù)和專用軟件,通過在語料庫電子文本中進行關(guān)鍵詞搜索,把檢索結(jié)果以關(guān)鍵詞為中心、以該詞所在行為語境,按預定跨距(word span)在屏幕上顯示出來。作為語言學研究的一種新方法,語料庫及語料庫索引在18世紀的歐洲就已經(jīng)得到了應(yīng)用,隨著語言學的研究中,利用語料庫對語言進行研究的成果不斷出現(xiàn),語料庫語言學和語料庫索引的應(yīng)用范圍也越來越廣泛。

二、泰國泰語語料庫和語料庫索引建設(shè)

泰國的語料庫建設(shè)起步較晚,由于大部分的語言學研究人員計算機知識的缺乏,造成大部分語言研究和教學人員對語料庫研究和語料庫索引運用的忽略。筆者在2011年赴泰國留學期間,曾就語料庫研究這一問題詢問泰國的學者,一般鮮有人聽說此領(lǐng)域,更無從談起用于泰語教學。就筆者所掌握的資料,目前已經(jīng)完成和能夠供公眾和相關(guān)研究人員進行索引使用的泰語語料庫主要有以下三個:

(一)泰國國家電子計算機技術(shù)中心(NECTEC)開發(fā)建設(shè)的ORCHID語料庫

由于該語料庫沒有對公眾開放,而且容量較小,只有40萬泰語詞匯數(shù)量,并且在所搜集的語料來源類型上也比較單一,只有學術(shù)文獻一種語料來源,所以應(yīng)用范圍有限;

(二)朱拉隆功大學語言學系開發(fā)建設(shè)的泰語語料庫

該語料庫主要用于教學和研究,語料來源類型包括報紙、雜志、文學作品、學術(shù)文獻、法律文獻、演講文稿等,并對公眾提供檢索服務(wù);

(三)泰國國家電子計算機技術(shù)中心和朱拉隆功大學語言學系共同開發(fā)的泰國國家語料庫(TNC)

該語料庫目標語料容量為8000萬泰語詞匯數(shù)量,截止到2013年6月,已收錄語料3190萬泰語詞匯數(shù)量。在詞語類型的劃分數(shù)據(jù)的基本處理規(guī)則上是遵循TEI(Text Encoding Initiatives)和CES(Corpus Encoding Standard),語料來源類型和比例參照英國國家語料庫BNC(British National Corpus),選取原則為語料的內(nèi)容、建立時間和媒介類型,以保證所選取語料的多樣性原則。

以泰國國家語料庫為例,在線可提供的檢索服務(wù)包括關(guān)鍵詞、關(guān)鍵詞與搭配文本的檢索,檢索結(jié)果為:1)關(guān)鍵詞在所有文本中的詞頻,以及在不同文本類型中的分配比例,文本類型包括:小說、報紙、半學術(shù)文本、學術(shù)文本、法律文本和其他;2)在規(guī)定的跨距內(nèi)呈現(xiàn)關(guān)鍵詞所在語境文本,還可以對語境文本根據(jù)文本時間、性別、年齡段的條件對呈現(xiàn)內(nèi)容進行約束。

三、泰語語料庫索引在泰語教學上的運用

Hunston認為語料庫對語言教師的職業(yè)生涯影響體現(xiàn)在兩大方面:一是語料庫會導致對一種語言的新的描寫,從而使教師對教什么的看法產(chǎn)生根本性的轉(zhuǎn)變;二是語料庫本身能被用來開發(fā)新的教學材料,并為新的大綱設(shè)計、教學方法奠定基礎(chǔ)。

(一)從學習者的角度來看,運用泰語語料庫檢索督促學生自學能力的培養(yǎng),完成教師角色的轉(zhuǎn)換

在信息時代,教師不再是全能的課堂控制者,也不再是唯一的信息源。教師的角色開始從信息源(source of knowledge)轉(zhuǎn)換為學習過程的組織者(organizer of tasks or opportunities for learning)在外語學習的過程中,學習者通過語言接觸自己發(fā)現(xiàn)規(guī)則、做出假設(shè),并在語言運用中不斷檢驗和修正自己的假設(shè),這種學習方式又稱為數(shù)據(jù)驅(qū)動學習(Data-driven learning)同傳統(tǒng)外語教學相比,數(shù)據(jù)驅(qū)動學習具有以下主要特征:1)以學生的自主學習為主要的過程特征;2)以真實語言為主要語言輸入;3)強調(diào)探索和發(fā)現(xiàn)的學習過程。

泰語語料庫的出現(xiàn)使學習泰語的學生能夠得到大量真實、針對性強的泰語語料資源,同時這些語料資源通過在線檢索已經(jīng)被整理排序,并根據(jù)所要求的跨距呈現(xiàn)語料所在的上下文語境,對學習者理解語料的前后搭配詞和在真實語料中出現(xiàn)頻率最高的搭配方式有直觀的認識。這和以往泰語學習者只通過查詢字典和利用網(wǎng)絡(luò)搜索引擎的方式獲得例句的方式相比更加有利于對關(guān)鍵詞的理解。因為字典中出現(xiàn)的例句帶有很強的字典編寫人員的主觀性,而利用搜索引擎搜索出的例句重復度很高,常常一個頁面的例句其實都是同一句話,利用語料庫索引搜索可以避免以上情況的發(fā)生。下面以名詞 后是跟表示對象的介詞 還是 為例來說明泰語語料庫索引在泰語教學中的運用:

介詞 和 都可以在名詞 后連接表示對象的名詞性結(jié)構(gòu),學習泰語的學生也常常不知道到底是 正確還是 正確。當有這樣的疑問時,教師就可以讓學生自己利用泰語語料庫來尋找問題的答案。

首先在索引關(guān)鍵詞里輸入 以及搭配詞

,得到表(一):

再在索引關(guān)鍵詞里輸入 以及搭配詞 ,得到表(二):

首先我們想從表一、表二中判斷文體是否對這兩個介詞的選擇具有影響,所以可以采用統(tǒng)計學中的列聯(lián)分析的方法,看分類型變量“文體”和分類型變量“介詞”是否獨立。因此我們給出原假設(shè)H0:在置信度為95%的情況下,行變量“文體”和列變量“介詞”是獨立的。并將上述三個變量“頻數(shù)”、“文體”、“介詞”及相應(yīng)數(shù)據(jù)代入SPSS軟件中,得到如下結(jié)果(表(三)):

從表(三)中學生可以很清楚地看到p=0.000<0.05,所以拒絕原假設(shè),得出結(jié)論:在置信度為95%的情況下,文體和介詞的選擇是不獨立的,即:文體對 后選擇介詞“ ”還是“ ”是有影響的。

另外,還可以利用表(一)和表(二)的數(shù)據(jù)得到反映具體每種文體中使用詞頻的對比柱形圖—表(四)(見上頁)。

從表(四)中可以得出以下結(jié)論:名詞

后既可以用 ,也可以用 ;并且兩個介詞的使用詞頻差別不大;但在文本的有些文體上出現(xiàn)差異較大,在報紙文本中 的使用頻率較高,而在法律文本中 的使用頻率較高。

(二)從教學者的角度來看,運用泰語語料庫檢索對泰語教學的影響

1.語料庫和語料庫索引本身就是真實的、容量巨大的語言數(shù)據(jù)源,可以為泰語教學大綱的設(shè)定、具體課程的備課提供素材。語言是有生命的,是在不斷變化的。以泰國國家語料庫為例,它是動態(tài)的,并不是封閉的,所囊括的語料在持續(xù)擴充中,多類型的文本來源保證了大量的新詞匯被及時吸收進來。這和傳統(tǒng)的從字典和詞典中找例句和素材的方式相比有著時效性的優(yōu)勢。

2.通過泰語語料庫索引所提供的詞頻信息,可以確定泰語中的基本詞匯,即使用頻率最高的詞匯,這些高頻詞匯反映了泰語的典型特征。在制訂教學大綱中就應(yīng)該以這些高頻詞作為教學的重點內(nèi)容。除了制訂教學大綱,在教學、測試和練習中也應(yīng)得到相應(yīng)的體現(xiàn)。

3.泰語語料庫不僅含有大量的詞匯信息,還通過關(guān)聯(lián)詞的搜索功能可以得到大量的詞法和句法資料,對研究泰語語法中的詞匯搭配,詞匯的語義選擇趨向都能提供相應(yīng)的素材支持。

結(jié)語

目前,有很多學者在研究外語教學中語料庫所能夠發(fā)揮的作用,而語料庫語言學和計算機技術(shù)的發(fā)展又給這一研究注入了新鮮的內(nèi)容。學生在教師的引導下以語料庫索引為工具,對語言進行觀察、分析和歸納,與學習的實質(zhì)“探索知識的真諦”相契合。但同時語料庫索引技術(shù)的使用又給教學的實施者教師提出了更高的要求。尤其是在計算機知識方面的要求。在外語教學中,任何新思想、新方法和新技術(shù)的應(yīng)用和實踐,教師發(fā)展始終是主要的瓶頸。泰語教師應(yīng)該消除所謂的“技術(shù)恐懼”,積極利用可供使用的泰語語料庫和語料庫索引資源,從而使泰語教學更富有成效。

參考文獻:

[1]Graeme Kennedy,An Introduction to Corpus Linguistics,1998.

[2]衛(wèi)乃興,李文中,濮建忠.語料庫應(yīng)用研究[J].上海外語教育出版社,2005.

[3]許家金.語料庫語言學的理論解析[J].外語教學,2003.

[4]李文中,濮建忠.語料庫索引在外語教學中的應(yīng)用[J].解放軍外國語學院學報,2001,(2).

[5]楊貝.語料庫在外語教學中的應(yīng)用及應(yīng)注意的問題[J].洛陽師范學院學報,2006,(1).

猜你喜歡
語料庫
《語料庫翻譯文體學》評介
基于語料庫的“はずだ”語義用法分析
基于語料庫“隱秘”的詞類標注初步探究
基于COCA語料庫的近義詞辨析 ——以choose和select為例
基于JAVAEE的維吾爾中介語語料庫開發(fā)與實現(xiàn)
語篇元功能的語料庫支撐范式介入
基于英漢雙語平行語料庫的無根回譯研究
基于語料庫的近義詞辨析研究——以suspect和doubt為例
低碳經(jīng)濟英語語料庫建設(shè)與應(yīng)用
基于網(wǎng)絡(luò)語料庫的“給力”研究