国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

語(yǔ)料庫(kù)在報(bào)刊英語(yǔ)研究中的應(yīng)用

2015-11-07 10:16:56孔霜梅
科技視界 2015年32期
關(guān)鍵詞:語(yǔ)料庫(kù)

孔霜梅

【摘 要】語(yǔ)料庫(kù)語(yǔ)言學(xué)為語(yǔ)言研究與教學(xué)提供了一種全新的方法和思路。報(bào)刊英語(yǔ)語(yǔ)料庫(kù)為語(yǔ)言研究提供了嶄新的研究視角,讓語(yǔ)言研究更加科學(xué)客觀,對(duì)報(bào)刊英語(yǔ)語(yǔ)言的研究和教學(xué)做出了巨大貢獻(xiàn)。 本文主要回顧國(guó)內(nèi)外報(bào)刊英語(yǔ)語(yǔ)料庫(kù)的建設(shè)和應(yīng)用成果,指出國(guó)內(nèi)對(duì)報(bào)刊英語(yǔ)研究的不足之處,同時(shí)展望報(bào)刊英語(yǔ)語(yǔ)料庫(kù)的發(fā)展趨勢(shì)。

【關(guān)鍵詞】語(yǔ)料庫(kù);報(bào)刊英語(yǔ)語(yǔ)料庫(kù);報(bào)刊英語(yǔ)研究

1 語(yǔ)料庫(kù)

20世紀(jì)60年代初夸克(Randolph Quirk)等人創(chuàng)建了現(xiàn)代英語(yǔ)語(yǔ)料庫(kù)?,F(xiàn)代英語(yǔ)語(yǔ)料庫(kù)對(duì)英語(yǔ)語(yǔ)言學(xué)界產(chǎn)生了深遠(yuǎn)的影響。語(yǔ)料庫(kù)是指按照一定的語(yǔ)言學(xué)原則,運(yùn)用隨機(jī)抽樣方法,收集自然出現(xiàn)的連續(xù)的語(yǔ)言文本或話(huà)語(yǔ)片段而建成的具有一定容量的大型電子文庫(kù)[1]。80年代之后,語(yǔ)料庫(kù)語(yǔ)言學(xué)成為一門(mén)新興語(yǔ)言學(xué)分支學(xué)科。語(yǔ)料庫(kù)語(yǔ)言學(xué)是在語(yǔ)料庫(kù)的基礎(chǔ)上對(duì)語(yǔ)言進(jìn)行分析和研究的科學(xué),為語(yǔ)言研究與教學(xué)提供了一種全新的方法和思路。語(yǔ)料庫(kù)語(yǔ)言學(xué)研究語(yǔ)言行為,而不是語(yǔ)言能力,它通過(guò)研究語(yǔ)言在實(shí)際情景中的運(yùn)用來(lái)獲取語(yǔ)言的使用規(guī)律。近年來(lái),隨著第二代大規(guī)模語(yǔ)料庫(kù)的誕生,不斷地涌現(xiàn)出語(yǔ)料庫(kù)研究的相關(guān)成果,研究?jī)?nèi)容涉及到二語(yǔ)習(xí)得、句法和語(yǔ)義、音系學(xué)、翻譯和個(gè)人自主學(xué)習(xí)等方面。語(yǔ)料庫(kù)在現(xiàn)代語(yǔ)言學(xué)研究和語(yǔ)言教育中發(fā)揮著越來(lái)越重要的作用,為語(yǔ)言研究提供了嶄新的思維模式。

報(bào)刊英語(yǔ)語(yǔ)料庫(kù)屬于新聞?dòng)⒄Z(yǔ)語(yǔ)料庫(kù)的一個(gè)重要分支。是根據(jù)統(tǒng)計(jì)學(xué)理論、語(yǔ)料庫(kù)語(yǔ)言學(xué)理論和新聞學(xué)理論,運(yùn)用科學(xué)的抽樣方法,收集報(bào)刊中自然出現(xiàn)的連續(xù)的語(yǔ)言運(yùn)用文本或話(huà)語(yǔ)片段而建成的具有一定容量的大型電子文庫(kù)[2]。隨著科技信息和電腦技術(shù)的發(fā)展,大量的語(yǔ)料庫(kù)應(yīng)用工具使得語(yǔ)言學(xué)工作者在進(jìn)行語(yǔ)料庫(kù)研究的時(shí)候能夠像操作計(jì)算機(jī)文件系統(tǒng)一樣方便的使用語(yǔ)料庫(kù)。報(bào)刊英語(yǔ)語(yǔ)料庫(kù)借助計(jì)算機(jī)處理語(yǔ)料,需要對(duì)語(yǔ)料庫(kù)進(jìn)行文本分析和檢索。語(yǔ)料庫(kù)研究中常用的檢索工具有MicroConcord、Wordsmith Tools、Concordance、TACT (Text Analysis Computing Tools)等,它們的基本功能包括詞表生成、語(yǔ)篇統(tǒng)計(jì)、排序等等[3]。這些語(yǔ)料庫(kù)的檢索工具和分析軟件都能夠應(yīng)用于語(yǔ)料庫(kù), 幫助報(bào)刊英語(yǔ)研究者實(shí)現(xiàn)可行性的研究目標(biāo)。

報(bào)刊英語(yǔ)語(yǔ)料庫(kù)為語(yǔ)言研究提供了嶄新的研究視角,讓語(yǔ)言研究更加科學(xué)客觀,對(duì)報(bào)刊英語(yǔ)語(yǔ)言的研究和教學(xué)做出了巨大貢獻(xiàn)。 本文主要回顧國(guó)內(nèi)外新聞?dòng)⒄Z(yǔ)語(yǔ)料庫(kù)的建設(shè)和應(yīng)用成果,指出國(guó)內(nèi)新聞?dòng)⒄Z(yǔ)研究的不足之處,同時(shí)展望英語(yǔ)報(bào)刊語(yǔ)料庫(kù)的發(fā)展趨勢(shì)。

2 國(guó)內(nèi)外報(bào)刊英語(yǔ)語(yǔ)料庫(kù)研究現(xiàn)狀

2.1 國(guó)外報(bào)刊英語(yǔ)語(yǔ)料庫(kù)的研究現(xiàn)狀

路透社語(yǔ)料庫(kù)于2000年開(kāi)發(fā)完成。收集了從1996年8月20日到1997年8月19日英國(guó)路透社發(fā)布的806791篇新聞樣本,共2億詞次。該語(yǔ)料庫(kù)由路透社開(kāi)發(fā),采用了擴(kuò)展標(biāo)記語(yǔ)言,具有擴(kuò)展性、開(kāi)放性、結(jié)構(gòu)化、互操作性和支持多國(guó)語(yǔ)言的特點(diǎn),為英國(guó)通訊社語(yǔ)言的學(xué)術(shù)研究提供了參照。

北美新聞文本語(yǔ)料庫(kù)由美國(guó)賓夕法尼亞大學(xué)語(yǔ)言學(xué)數(shù)據(jù)協(xié)會(huì)的David Graff組織開(kāi)發(fā)完成。該庫(kù)主要應(yīng)用在信息檢索和語(yǔ)言建模兩方面。該庫(kù)采用標(biāo)準(zhǔn)通用置標(biāo)語(yǔ)言SGML,共3億5千萬(wàn)詞次。庫(kù)樣本主要來(lái)自《洛杉磯時(shí)報(bào)》、《華盛頓郵報(bào)》、 《紐約時(shí)報(bào)》 和路透社從1994到1997年的新聞文本。為新聞報(bào)刊的語(yǔ)言研究提供了參照。

羅斯托克英語(yǔ)報(bào)刊歷史語(yǔ)料庫(kù)由德國(guó)羅斯托克大學(xué)的學(xué)者Kristina Schneider組織開(kāi)發(fā)。該庫(kù)主要用于英語(yǔ)新聞業(yè)的歷時(shí)研究。樣本來(lái)自60家英國(guó)報(bào)紙,時(shí)間自1700年到2000年,以大約30年為間隔進(jìn)行等距抽樣。庫(kù)的結(jié)構(gòu)分布以?xún)蓷l小報(bào)軸線(xiàn)和一條大報(bào)軸線(xiàn)為標(biāo)準(zhǔn),每條軸線(xiàn)上的每個(gè)時(shí)期取樣本2萬(wàn)詞次,全庫(kù)規(guī)模達(dá)60萬(wàn)詞次。該語(yǔ)料庫(kù)為英語(yǔ)新聞?wù)Z言的原型研究和不同時(shí)期不同報(bào)刊語(yǔ)言的平行比較研究提供了參考。

METER語(yǔ)料庫(kù)是由英國(guó)設(shè)菲爾德大學(xué)在英國(guó)工程物理科學(xué)研究會(huì)的資助下開(kāi)發(fā)的一個(gè)對(duì)比語(yǔ)料庫(kù)。庫(kù)樣本來(lái)源于英國(guó)報(bào)聯(lián)社(British Press Association, PA)和9家采用PA原始通訊稿的英國(guó)全國(guó)性報(bào)紙。該庫(kù)幫助研究者對(duì)通訊社新聞文本和英文報(bào)紙新聞文本之間的微妙關(guān)系以及新聞文本再使用的過(guò)程、原則、識(shí)別提供了參考。

蘇黎世英文報(bào)紙語(yǔ)料庫(kù)是個(gè)歷時(shí)語(yǔ)料庫(kù)。 該庫(kù)采樣于1671年至1791年共120年間的英國(guó)報(bào)紙,總詞次達(dá)120萬(wàn)。語(yǔ)料庫(kù)采用標(biāo)準(zhǔn)化SGML體系,分為兩大部分,國(guó)外新聞和國(guó)內(nèi)新聞。所有語(yǔ)料以30年的時(shí)間等分成四部分。該語(yǔ)料庫(kù)不僅促進(jìn)了對(duì)17和18世紀(jì)英文報(bào)紙的研究并且使報(bào)刊語(yǔ)言特點(diǎn)的歷時(shí)比較成為可能。

貝德娜雷克英國(guó)報(bào)紙語(yǔ)料庫(kù)由悉尼大學(xué)語(yǔ)言學(xué)系的Monika Bednarek創(chuàng)建。僅7萬(wàn)詞次,但報(bào)紙和新聞的各個(gè)要素基本上都考慮在內(nèi),而不像大型語(yǔ)料庫(kù)那樣直接收錄不加以區(qū)分。該語(yǔ)料庫(kù)對(duì)英國(guó)的大報(bào)和小報(bào)進(jìn)行了專(zhuān)門(mén)劃分,故有兩個(gè)子庫(kù),大報(bào)庫(kù)和小報(bào)庫(kù)。專(zhuān)門(mén)用于對(duì)英國(guó)報(bào)紙語(yǔ)言進(jìn)行比較話(huà)語(yǔ)分析。

另外,美國(guó)國(guó)防部高級(jí)研究規(guī)劃署開(kāi)發(fā)了《華爾街日?qǐng)?bào)》口語(yǔ)語(yǔ)料庫(kù),英國(guó)劍橋大學(xué)開(kāi)發(fā)了劍橋版英國(guó)口音《華爾街日?qǐng)?bào)》口語(yǔ)語(yǔ)料庫(kù)??谡Z(yǔ)語(yǔ)料庫(kù)用于連續(xù)語(yǔ)音識(shí)別系統(tǒng)研究,為報(bào)刊英語(yǔ)的口語(yǔ)研究提供了參考。

2.2 國(guó)內(nèi)報(bào)刊英語(yǔ)語(yǔ)料庫(kù)的研究現(xiàn)狀

受?chē)?guó)外語(yǔ)料庫(kù)語(yǔ)言學(xué)研究和發(fā)展的影響,國(guó)內(nèi)語(yǔ)料庫(kù)的建設(shè)和研究也呈現(xiàn)出快速發(fā)展的趨勢(shì)。但是報(bào)刊語(yǔ)料庫(kù)的建設(shè)還不完善,基于語(yǔ)料庫(kù)的報(bào)刊語(yǔ)言和教學(xué)的相關(guān)研究卻還在起步階段。

鄭志恒博士開(kāi)發(fā)了國(guó)內(nèi)首個(gè)百萬(wàn)詞級(jí)的報(bào)刊英語(yǔ)語(yǔ)料庫(kù)。該庫(kù)的建設(shè)采用數(shù)據(jù)驅(qū)動(dòng)的實(shí)證主義研究方法,定性和定量相結(jié)合的分析手段。全庫(kù)采用SGML置標(biāo)語(yǔ)言,能夠方便使用Wordsmith Tools等語(yǔ)料庫(kù)分析和檢索軟件進(jìn)行識(shí)別處理。該語(yǔ)料庫(kù)有四個(gè)子庫(kù), 分別為英國(guó)報(bào)刊純新聞報(bào)道文本子庫(kù)、英國(guó)報(bào)刊意見(jiàn)性報(bào)道文本子庫(kù)、美國(guó)報(bào)刊純新聞報(bào)刊文本子庫(kù)和美國(guó)報(bào)刊意見(jiàn)性報(bào)道文本子庫(kù)。

范蓓依據(jù)語(yǔ)料庫(kù)的建庫(kù)原則,以《中國(guó)日?qǐng)?bào)(英文版)》 頭版新聞為語(yǔ)料建立小型語(yǔ)料庫(kù)。該研究主要利用語(yǔ)料庫(kù)回答了兩個(gè)問(wèn)題:《中國(guó)日?qǐng)?bào)》的語(yǔ)言在改革開(kāi)放三十年中有哪些變化? 造成這些變化的原因是什么? 研究結(jié)合歷時(shí)語(yǔ)言學(xué)和社會(huì)語(yǔ)言學(xué)的研究成果,通過(guò)對(duì)詞頻、詞匯搭配、典型句型特征、關(guān)鍵詞對(duì)照等方面進(jìn)行歷時(shí)性研究,展示了語(yǔ)言在不同年代的使用情況,揭示了語(yǔ)言變化格局,佐證了社會(huì)的發(fā)展與變遷[4]。

對(duì)外經(jīng)貿(mào)大學(xué)的徐珺結(jié)合語(yǔ)料庫(kù)技術(shù)和商務(wù)英漢翻譯理論,構(gòu)建財(cái)經(jīng)新聞?dòng)h平行語(yǔ)料庫(kù)。應(yīng)用語(yǔ)料庫(kù)對(duì)財(cái)經(jīng)新聞?dòng)⒆g漢的翻譯語(yǔ)言特征進(jìn)行了研究[5]。該庫(kù)樣本主要來(lái)自《金融時(shí)報(bào)》、《華爾街日?qǐng)?bào)》、《福布斯》、《財(cái)富》及其相應(yīng)中文網(wǎng)站的財(cái)經(jīng)新聞的報(bào)道,時(shí)間范圍是2012年6月至2013年10月,共計(jì)935個(gè)英漢平行文本,全部文本實(shí)現(xiàn)了英漢段落層級(jí)對(duì)齊。

3 結(jié)語(yǔ)

語(yǔ)料庫(kù)不是簡(jiǎn)單的任意話(huà)語(yǔ)的集合,它是依據(jù)科學(xué)的抽樣原則而選擇的有限話(huà)語(yǔ)集,語(yǔ)料庫(kù)要以計(jì)算機(jī)可處理的形式儲(chǔ)存,要具有代表性,而且要最大限度地反映研究對(duì)象的特點(diǎn)[6]。報(bào)刊英語(yǔ)語(yǔ)料庫(kù)同報(bào)刊的大型電子文檔有著最本質(zhì)的區(qū)別。報(bào)刊英語(yǔ)語(yǔ)料庫(kù)實(shí)際上是通過(guò)對(duì)報(bào)刊中自然語(yǔ)言運(yùn)用的統(tǒng)計(jì)學(xué)抽樣,以一定大小的語(yǔ)言樣本代表報(bào)刊英語(yǔ)中所確定的語(yǔ)言運(yùn)用總體[7]。國(guó)內(nèi)的語(yǔ)料庫(kù)被廣泛應(yīng)用于教學(xué)、翻譯、詞匯、語(yǔ)義、詞典和語(yǔ)法等語(yǔ)言研究領(lǐng)域。我國(guó)語(yǔ)料庫(kù)研究已取得了豐碩的研究成果,但同時(shí)也存在一定的問(wèn)題。在今后的研究中,應(yīng)該充分地利用語(yǔ)料庫(kù)對(duì)新聞?lì)愓Z(yǔ)言展開(kāi)更深入的研究,從而促進(jìn)英語(yǔ)報(bào)刊語(yǔ)料庫(kù)建設(shè)和應(yīng)用的發(fā)展。

【參考文獻(xiàn)】

[1]楊慧中. 語(yǔ)料庫(kù)語(yǔ)言學(xué)導(dǎo)論[M].上海: 上海外語(yǔ)教育出版社,2002.

[2]鄭志恒. 英美報(bào)刊英語(yǔ)標(biāo)注語(yǔ)料庫(kù)建設(shè)研究[J]. 外語(yǔ)研究, 2007(2).

[3]余國(guó)良. 語(yǔ)料庫(kù)語(yǔ)言學(xué)的研究與應(yīng)用[M].四川大學(xué)出版社,2009.

[4]范蓓. 基于語(yǔ)料庫(kù)的《中國(guó)日?qǐng)?bào)》語(yǔ)言變化歷時(shí)分析[D]. 上海師范大學(xué),2009.

[5]徐珺, 自正權(quán). 基于語(yǔ)料庫(kù)的英語(yǔ)財(cái)經(jīng)新聞漢譯本的詞匯特征研究[J]. 中國(guó)外語(yǔ),2014(5).

[6]McEnery,T. &A.Wilson.Corpus Linguistics [M].Edinburgh: Edinburgh University Press, 2001.

[7]鄭志恒.報(bào)刊英語(yǔ)語(yǔ)料庫(kù)概論[M]. 南京大學(xué)出版社, 2009.

[責(zé)任編輯:曹明明]

猜你喜歡
語(yǔ)料庫(kù)
《語(yǔ)料庫(kù)翻譯文體學(xué)》評(píng)介
基于語(yǔ)料庫(kù)的“はずだ”語(yǔ)義用法分析
基于語(yǔ)料庫(kù)“隱秘”的詞類(lèi)標(biāo)注初步探究
把課文的優(yōu)美表達(dá)存進(jìn)語(yǔ)料庫(kù)
基于COCA語(yǔ)料庫(kù)的近義詞辨析 ——以choose和select為例
口譯不宜“任性”:基于語(yǔ)料庫(kù)的外事翻譯等效探索
基于JAVAEE的維吾爾中介語(yǔ)語(yǔ)料庫(kù)開(kāi)發(fā)與實(shí)現(xiàn)
基于英漢雙語(yǔ)平行語(yǔ)料庫(kù)的無(wú)根回譯研究
基于語(yǔ)料庫(kù)的近義詞辨析研究——以suspect和doubt為例
低碳經(jīng)濟(jì)英語(yǔ)語(yǔ)料庫(kù)建設(shè)與應(yīng)用
西青区| 鄂托克前旗| 山阴县| 日喀则市| 沙坪坝区| 祁连县| 平罗县| 灵台县| 徐汇区| 安塞县| 南岸区| 南京市| 铜川市| 定远县| 广西| 宁化县| 华宁县| 清徐县| 南城县| 云梦县| 新和县| 镇雄县| 安多县| 清苑县| 温州市| 和硕县| 江川县| 邹平县| 彭泽县| 濉溪县| 龙游县| 文山县| 盘山县| 石首市| 彰化县| 搜索| 渑池县| 潼关县| 台东市| 高阳县| 巴彦淖尔市|