国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于語料庫的文學作品方法探究

2014-07-25 13:33文/李英華
新課程·中旬 2014年5期
關鍵詞:語料庫文學

文/李英華

摘 要:語料庫語言學對于語言研究有著重要意義。其研究范圍可以拓展到文學研究領域。通過對文學文本進行語料庫分析,可以得到更為客觀理性的數(shù)據(jù),對文學作品的人物刻畫、主題思想、情節(jié)脈絡有更為深入的研究。通過對美國著名小說《亂世佳人》的小說文本進行語料庫分析,可以對小說研究提供更為翔實、細致的數(shù)據(jù)。

關鍵詞:《亂世佳人》;語料庫;文學

近年來,語料庫語言學取得了長足的發(fā)展。語料庫研究被應用于教學法、文體學、測試學等多個方面,取得了顯著成效。語料庫語言學的研究范圍同樣可以拓展到文學文本的研究。通過對文學文本的語料庫研究,可以得到更為客觀的數(shù)據(jù),從而為文藝批評作出新的貢獻。

一、文本總體統(tǒng)計特征和分析

《亂世佳人》是美國女作家瑪格麗特·米歇爾的經(jīng)典作品,描述了美國南北戰(zhàn)爭的歷史背景下南方種植園主生活發(fā)生的翻天覆地的改變。學界對該小說的研究主要基于對小說的感性認識。而通過語料庫對小說進行探究,可以加強對小說的理性分析,更好地進行小說研究。下文將通過語料庫工具對小說的基本要素進行研究。在研究中,需要進行分析的重要因素包括:字節(jié)數(shù)、類符形符比、形符數(shù)、類符數(shù)、標準化類符形符比、句子數(shù)、平均句長等研究對象的字節(jié)數(shù)。

對小說《亂世佳人》用Wordsmith工具進行的統(tǒng)計,語篇中形符數(shù)為434 028個詞,類符數(shù)為16 863個詞。句子數(shù)為28 400個句子。高于平均形符數(shù)和句子數(shù)。標準形符類符比為42.75,考慮到BNC語料庫的標準形符類符比為42.66。因此可以看出,該文本詞匯中等,該文本是一個較長的文本,句子的句長為15.0,小于平均句長16.66,說明句子長度比很多簡單文本的句長要小,本小說的句子較為簡單。如果我們把一個字母的詞、兩個字母的詞、三個字母的詞、四個字母的詞相加,就可以知道小于四個字母的詞為284614個詞,而這個文本的形符數(shù)為434 028個詞,這樣詞匯的35%都是多于四個字母的詞,接近于平均值,即多于四個詞匯比例為38%,該數(shù)據(jù)說明該文本詞匯難度中等。

二、主題和情節(jié)檢索與分析

通過語料庫軟件生成作品的詞表,可以判斷在文本中各詞的出現(xiàn)頻率。對詞表的分析,可以使我們把握文本的基本信息。但如果要依據(jù)重要性確定基本信息,就需要選擇關鍵詞(key words)來確定。判斷某個詞是否是語料中較為重要的詞,不僅要看該詞在語料中的出現(xiàn)頻率,也要看該詞在參照語料庫中的出現(xiàn)頻率。例如,不定冠詞a在某一長度為2000詞的語料中出現(xiàn)了100次,出現(xiàn)頻率達到了5%,但不定冠詞a卻不能成為這一語料的關鍵詞。其原因是在任意語料中,定冠詞的出現(xiàn)頻率都是非常高的。因此,我們需要選擇比被檢索語料篇幅更長的參照語料庫按照關鍵值(keyness value)生成關鍵詞詞表,再根據(jù)關鍵詞表確定文本最重要的信息。通過觀察關鍵詞詞表中排在較前位置的關鍵詞,可以得到該文本的最關鍵信息。

文本中關鍵值最高的是小說的女主人公Scarlett,因此可以判定小說的主要內容就是圍繞女主人公的人生經(jīng)歷開展的,Scarlett是小說最重要的女主人公。主題詞表中出現(xiàn)較多的人名為Rhett和Melanie,這說明這兩個人物也是小說中的主要人物。表中Tara關鍵值也很高,說明小說發(fā)生的地點和背景以及土地莊園對于南方人的重要意義。另外,Yankee這個明顯帶有美國南方對北方的蔑稱一詞關鍵值同樣很高,說明了小說的寫作角度是以美國南方人的角度出發(fā)的。描寫了對美國北部人的敵意和蔑視。

Wordsmith工具對于了解文學作品的基本概況具有非常強大的功能。它有獨特的詞圖(plot)功能,可以分析得到文本中詞語出現(xiàn)的基本概況和脈絡。對文本的故事情節(jié)可以有較好的把握。

通過語料庫分析,可以看出小說的女主人公Scarlett出現(xiàn)在小說的全文中,且密度較大,說明小說的情節(jié)都是圍繞她展開的。再看小說中,《亂世佳人》這部小說以南北戰(zhàn)爭為背景描寫了女主人公斯嘉麗的成長歷程。斯嘉麗的少女時代,戰(zhàn)爭經(jīng)歷,戰(zhàn)后重建的艱苦努力成為小說的主線。因此,我們可以分析出斯嘉麗是小說最重要的人物和第一女主人公。小說的男主人公Rhett小說開頭部分分布較少,在高潮和結尾部分分布很多,在小說開始,Rhett在女主人公斯嘉麗心中一直是一個反面人物,女主人公一直心有他屬。但隨著小說的層層推進,Rhett對女主人公的關愛,兩人感情的糾纏使得Rhett的出現(xiàn)頻率越來越高。而Rhett對與小說的情節(jié)走向也越來越重要,逐步取代了阿希禮成為了小說最關鍵的男性。

作者簡介:李英華,女,西安醫(yī)學院英語系,助教,畢業(yè)于中國科學院研究生院,碩士學歷,研究方向:英語語言學。

編輯 謝尾合

endprint

猜你喜歡
語料庫文學
我們需要文學
《語料庫翻譯文體學》評介
基于語料庫“隱秘”的詞類標注初步探究
“太虛幻境”的文學溯源
對“文學自覺”討論的反思
基于JAVAEE的維吾爾中介語語料庫開發(fā)與實現(xiàn)
文學病
我與文學三十年
基于網(wǎng)絡語料庫的“給力”研究
語料庫語言學未來發(fā)展趨勢
平顶山市| 内黄县| 唐海县| 阿城市| 乌拉特中旗| 栾川县| 额尔古纳市| 房产| 平果县| 老河口市| 周口市| 法库县| 德保县| 迭部县| 揭西县| 广西| 罗田县| 峨边| 丹巴县| 香格里拉县| 平谷区| 柏乡县| 历史| 锦屏县| 韶山市| 睢宁县| 荣成市| 博兴县| 苏州市| 宝应县| 察雅县| 广宁县| 敦化市| 吉隆县| 襄樊市| 漳平市| 双江| 东莞市| 凭祥市| 肇庆市| 民权县|