国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

英語新聞主題圖式建?!豁?xiàng)基于TIME 語料庫的實(shí)證研究

2015-12-23 00:54:42陳月娥
關(guān)鍵詞:主題詞圖式語料庫

陳月娥

(安徽建筑大學(xué)外國語學(xué)院,安徽 合肥230001)

一、引言

美國語言學(xué)家薩丕爾曾說:“ 語言不能脫離文化而存在,也就是說不能脫離社會(huì)流傳下來的,它決定我們生活風(fēng)貌和信仰的總體。 ”[1]正是因?yàn)檎Z言中滲透著文化,在學(xué)習(xí)第二語言時(shí),我們必須熟悉與這門語言相關(guān)的文化。 社會(huì)在變化,文化在發(fā)展,而最能及時(shí)反映這些變化和發(fā)展的非新聞莫屬。 因而英語新聞的學(xué)習(xí)也是了解當(dāng)今英美社會(huì)文化的主要手段之一[2]。 然而,英語新聞很多時(shí)候超越了課本和本族傳統(tǒng)文化的視野,這不僅表現(xiàn)在詞匯和文體上,更是體現(xiàn)在新聞報(bào)道內(nèi)容和知識(shí)背景中。 目前國內(nèi)研究者對(duì)英語新聞的研究多集中在其語言詞匯特色和文體風(fēng)格研究上,或者僅僅針對(duì)某一具體主題進(jìn)行研究,如趙國杰[3]對(duì)涉華報(bào)道中的中國特色詞匯研究等, 而很少單獨(dú)提出對(duì)新聞主題總體進(jìn)行研究。本研究擬通基于大規(guī)模真實(shí)新聞?wù)Z料的統(tǒng)計(jì)分析,以圖式構(gòu)建理論為基礎(chǔ), 利用 “語義空間”、“語義場”、“詞語場”的圖式網(wǎng)絡(luò)模型,把大量分散、相對(duì)孤立的關(guān)鍵詞和主題用圖式網(wǎng)絡(luò)的方式歸納、分類,形成脈絡(luò)清晰,結(jié)構(gòu)緊湊的主題圖式模型。 利用語料庫提取的關(guān)鍵詞作為圖式模型的詞匯填充,使得模型具有信息量大,內(nèi)容真實(shí)、豐富、信息量大的特點(diǎn),幫助學(xué)習(xí)者更好地去理解、構(gòu)建和預(yù)測英語新聞的主題圖式。

二、研究的理論基礎(chǔ)

圖式就是知識(shí)在大腦中的儲(chǔ)存單位, 是人腦中一種抽象的、結(jié)構(gòu)化和系統(tǒng)化的知識(shí)表征,它包括各種各樣的知識(shí),圖式的總和便是一個(gè)人的全部知識(shí)。圖式的概念最早來自19 世紀(jì)德國哲學(xué)家康德,他把圖式看成是“原發(fā)想象力”的一種特定形式或規(guī)則。現(xiàn)代圖式理論的主要代表人物Rumelhart[4]認(rèn)為,圖式理論是一種關(guān)于人的知識(shí)如何被表征, 以及對(duì)知識(shí)的表征如何以其特有的方式促進(jìn)知識(shí)應(yīng)用的理論。McCarthy[5]認(rèn)為新知識(shí)必須與現(xiàn)存知識(shí)相聯(lián)系才會(huì)得以處理加工, 高效的讀者通過激活必要的知識(shí)才會(huì)對(duì)所讀文本進(jìn)行解碼。

圖式是一個(gè)知識(shí)框架,圍繞這個(gè)框架,通過已知的背景知識(shí)可以使一定的情景得到解釋, 從而使特定圖式的知識(shí)框架得到擴(kuò)展。圖式不是一成不變的,它是一個(gè)開放的體系。人腦中已有的圖式知識(shí)可以促進(jìn)學(xué)習(xí)者的學(xué)習(xí)。圖式在大腦中形成后會(huì)對(duì)之后獲得的信息重新組織、理解和記憶,依據(jù)人腦中已存的圖式對(duì)新輸入的信息解碼、編碼。 根據(jù)人們的背景知識(shí)結(jié)構(gòu)。 Carrell[6]將圖式分為形式圖式和主題圖式兩種, 其中形式圖式包括語言圖式和語篇圖式;主題圖式則包括了主題知識(shí)、世界知識(shí)和文化知識(shí)。 Carrell 認(rèn)為形式圖式和主題圖式在閱讀中對(duì)某一圖式的激活乃至整個(gè)語篇的理解都起著重大的作用。

三、數(shù)據(jù)提取和結(jié)果

本研究把語料庫詞頻自動(dòng)分析與人工語義分析的方法結(jié)合起來。 觀察語料庫是選取2009 年至2011 年期間在美國出版的77 期美國《時(shí)代周刊》,對(duì)照語料庫是英國國家語料庫, 使用詞性標(biāo)準(zhǔn)軟件CLAWS 對(duì)語料庫進(jìn)行詞性標(biāo)注, 運(yùn)用檢索工具WordSmith4.0 的Keyword 軟件來提取英語新聞詞表中的關(guān)鍵詞, 并使用語料庫Range工具測量它們在基礎(chǔ)詞表上的分布。

(一)語料庫準(zhǔn)備

本研究在提取TIME 文本時(shí)將雜志中重復(fù)出現(xiàn)的一些廣告、網(wǎng)址和語句等與新聞內(nèi)容無關(guān)部分進(jìn)行了剔除,以減少其對(duì)統(tǒng)計(jì)結(jié)果的干擾。 語料庫規(guī)模約為300 萬詞次。 TIME 是美國三大時(shí)事性周刊之一,內(nèi)容廣泛,對(duì)國際問題發(fā)表主張和對(duì)國際重大事件進(jìn)行跟蹤報(bào)道,在美國的媒體中頗有影響力,有世界“史庫”之稱。 本研究使用的對(duì)照詞頻表來自英國國家語料庫。 該語料庫是一個(gè)大型的現(xiàn)代英語書面語及口語的語料庫,約為1 億詞次。該庫的書面語部分主題廣泛,語料庫規(guī)模較大[7]。

(二)新聞?wù)Z料庫的統(tǒng)計(jì)學(xué)描述

觀察語料庫TIME 新聞?wù)Z料庫的形符數(shù)2887551、類符數(shù)73055、類符/形符比(TTR)2.53%;標(biāo)準(zhǔn)類符/形符比(STTR)51.125,大于對(duì)照語料庫的42.66;平均詞長(Mean WL)4.72, 大于對(duì)照語料庫的4.64; 平均句長(Mean SL)18.55 詞/句,小于對(duì)照語料庫的19.57 詞/句。 從這些數(shù)據(jù)可以看出,英語新聞具有句子簡潔,詞量豐富,詞長偏長,句長偏短的特點(diǎn)。

(三)關(guān)鍵詞的提取

關(guān)鍵詞提取的理據(jù)是,當(dāng)語篇圍繞某個(gè)主題展開時(shí),表達(dá)該主題的一些詞匯會(huì)反復(fù)出現(xiàn),在詞頻上的表現(xiàn)是這些詞匯出現(xiàn)頻率顯著高于隨機(jī)發(fā)生概率。 通過計(jì)算觀察語料庫和對(duì)照語料庫的詞頻表,提取出詞頻差異具有統(tǒng)計(jì)學(xué)上顯著性的關(guān)鍵詞。

本研究采用對(duì)數(shù)似然率計(jì)算方法得出Keyness,軟件設(shè)定max.p value=0.000001,Min.Fre >3, 按Keyness 大小排序提取前500 個(gè)候選關(guān)鍵詞。去除一些不需要的符號(hào)、字母和數(shù)字得到485 個(gè)關(guān)鍵詞,其中實(shí)義詞474 個(gè),虛詞11 個(gè)。本文提取關(guān)鍵詞的目的是構(gòu)建新聞?dòng)⒄Z的主題圖式,故去除沒有語義功能的虛詞。利用語料庫Range 工具對(duì)關(guān)鍵詞在Range 自帶有3 個(gè)基礎(chǔ)詞表中的分布情況進(jìn)行統(tǒng)計(jì),結(jié)果如下:

表1:關(guān)鍵詞的Range 工具分析結(jié)果

Range 的3 個(gè)基礎(chǔ)詞表,分別包括最常用的999 個(gè)詞族,次常用的987 個(gè)詞族, 和前兩個(gè)詞頻表之外的、高中和大學(xué)各科教材中最常用的570 個(gè)英語詞族。 從Range統(tǒng)計(jì)結(jié)果來看,有70.4%的關(guān)鍵詞不在基礎(chǔ)詞表之中。尤其是專有名詞,比例達(dá)到了98.2%。這表明新聞?dòng)⒄Z的詞匯難度大,生詞多,理解較困難。

四、語義分析和圖式建模

(一)語義空間、語義場和詞語場

心理語言學(xué)的研究表明: 母語使用者大腦中存在著大量的心理詞庫。 這些詞匯并非雜亂無序, 而是一個(gè)組織嚴(yán)密的詞匯集。 詞語通過語義聯(lián)系結(jié)成網(wǎng)絡(luò), 便于在交際時(shí)被有效快速地提取。 圖式是語義記憶里的一個(gè)結(jié)構(gòu), 它對(duì)一群信息的一般和期望的排列作出規(guī)定[8]。McCarthy[9]曾指出,一個(gè)人在用詞語來表達(dá)真實(shí)世界時(shí),詞與詞之間存在一種譜系關(guān)系。 在這種關(guān)系中, 處于最上層的是“語義空間”,“語義空間”由各種“語義場”組成,后者表達(dá)對(duì)真實(shí)世界的知識(shí)或概念,它們又由“詞語場”來構(gòu)成。 心理圖式就是一個(gè)高度抽象的, 龐大的語義空間,它由語義場組成。 語義場是對(duì)真實(shí)世界的反映,體現(xiàn)為各種主題,由對(duì)應(yīng)的詞語場來實(shí)現(xiàn)[10]。語言空間和語義場就是存在于頭腦中不可見的圖式,是無法直接觀測的。詞語場是由具體詞匯聚合而成,是可觀察到的,可以通過實(shí)證的方法加以統(tǒng)計(jì)。每一個(gè)語義場都應(yīng)該有如下成分:1)主題詞,是知識(shí)和經(jīng)驗(yàn)的抽象,它帶有語義場自身的標(biāo)志性;2)行為詞,表達(dá)一系列動(dòng)作的詞語;3) 行為者,是行為的主體,是行動(dòng)的執(zhí)行者或接受者;4)關(guān)聯(lián)詞,行為的客體,是行動(dòng)的外在事物;5)位置詞,即執(zhí)行動(dòng)作或行為的環(huán)境;6)時(shí)間詞,即執(zhí)行動(dòng)作或行為的時(shí)間;7)修飾詞等,即描述、評(píng)價(jià)、數(shù)量或限定其他詞語的詞語。

(二)關(guān)鍵詞的詞性統(tǒng)計(jì)

表2:關(guān)鍵詞詞性分布表(詞例按詞頻大小排列)

從表2 可以看出:名詞占關(guān)鍵詞的絕對(duì)多數(shù),合計(jì)占了全部的81.2%,其中專有名詞比例最高,為46.8%。 這說明大量使用專有名詞是英語新聞典型的詞語特征。 而且這些專有名詞大多具有較強(qiáng)的內(nèi)容和主題色彩, 與熱點(diǎn)人物、事件有關(guān)。 由Range 工具分析結(jié)果可知,這些詞匯大多是無法在日常用語和教材中獲取,這無疑給二語學(xué)習(xí)者帶來挑戰(zhàn)。而普通名詞占比為34.4%,它們在語料庫中出現(xiàn)頻率高,Range 工具分析也表明它們多為常用詞匯,詞族種類多,詞匯廣度較大。從表中,我們也可以看出修飾詞、時(shí)間詞等數(shù)量均較少。

(三)關(guān)鍵詞的語義分析與標(biāo)注

在下表3 中, 我們對(duì)222 個(gè)專有名詞進(jìn)行人工語義標(biāo)注,按照語義分為人名、地名、國別、機(jī)構(gòu)等7 個(gè)類別。可以看出,人名占據(jù)最大多數(shù),為45.9%。人名中出現(xiàn)頻率最高的是OBAMA。 在2008 年當(dāng)選總統(tǒng)之前,他是一個(gè)名不見經(jīng)傳的人物,在BNC 語料庫中只出現(xiàn)了1 次,而在觀察語料庫中出現(xiàn)次數(shù)多達(dá)2769 次, 關(guān)鍵值達(dá)到19,588.85。在地名中, 美國本土的地名, 如NEW YORK,WASHINGTON,CALIFORNIA 等 位 居 前 列。 在 國 別 中,CHINA 頻繁出現(xiàn)在英語新聞中, 其出現(xiàn)的頻率為1345次,甚至大于出現(xiàn)947 次的AMERICA,可以想象在新聞報(bào)道中關(guān)于中國的話題是非常頻繁的。 當(dāng)然還有可能的原因是美國的英文表達(dá)法不止有AMERICA,還有U.S.等。除此之外,英語新聞中常提及到的機(jī)構(gòu)(如CIA、OSCAR、FBI)、科技(如FACEBOOK、GOOGLE、TWITTER)和組織(如TALIBAN、QAEDA、MUSLIM)的名稱均被提取了出來。

表3:專有名詞分布表(詞例按詞頻大小排列)

在下表4 中,我們對(duì)163 個(gè)普通名詞進(jìn)行詞義標(biāo)注,把主題標(biāo)記性顯著的關(guān)鍵詞進(jìn)行了主題標(biāo)記,共計(jì)10 個(gè)主題101 個(gè)主題詞,對(duì)其余62 個(gè)主題標(biāo)記不明顯的關(guān)鍵詞,根據(jù)詞義屬性分為關(guān)聯(lián)事物和關(guān)聯(lián)人物兩類。

表4:普通名詞主題分布表(詞例按詞頻大小排列)

(四)英語新聞主題圖式的模型構(gòu)建

通過對(duì)關(guān)鍵詞的語義分析, 不難發(fā)現(xiàn)構(gòu)成某語義場核心的是普通名詞中的主題詞, 是特定語義場專有的,具有排他性。 例如,提到NEWS、FILM、MOVIE 等主題詞就會(huì)聯(lián)想想到 “媒體” 語義場, 提到PRESIDENT、GOVERNMENT、STATE 等主題詞就會(huì)聯(lián)想到 “政治”語義場。 其他的詞語場不具有排他性, 可以是多個(gè)語義場所共享的,如關(guān)聯(lián)詞詞語場的WORLD、CITY;時(shí)間詞語場的YEARS、MONDAY;行為詞語場的SAYS;修飾詞語場的BIG、MORE 等。 語義場的這種構(gòu)成形式,可以最大的滿足交際需要,減少記憶負(fù)擔(dān),提高詞匯提取速度。 在心理圖式的作用下,語言使用者在涉及到某一主題時(shí),其對(duì)應(yīng)的語義場即被激活,觸發(fā)一系列詞語場。 由此可見,詞語在大腦中并非雜亂無章地堆砌在一起, 而是按語義邏輯聯(lián)系構(gòu)成一個(gè)組織嚴(yán)密的網(wǎng)絡(luò)圖,共同構(gòu)成學(xué)習(xí)者關(guān)于該話題的心理詞庫和圖式。 不同主題的心理詞庫和圖式內(nèi)容上不相同, 但是結(jié)構(gòu)體系一致。 下圖為所構(gòu)建的主題圖式模型。

(五)英語新聞主題圖式特點(diǎn)

從圖1 可以看出,心理圖式作為一個(gè)語義空間,由若干多個(gè)語義場構(gòu)成,語義場以主題(“媒體”)為聚合中心,由“主題詞”詞語場組成主題詞匯。 例如,“媒體”的“主題詞” 詞 語 場 由 TV、PICTURES、NEWS、FILM、MOVIE、MEDIA 等23 個(gè)關(guān)鍵詞組成, 它們在觀察語料庫中詞頻高,關(guān)鍵度也高。 這表明英語新聞相對(duì)于一般語料而言,“媒體”的主題出現(xiàn)頻率高。 直接與“主題詞”詞語場接觸的是“關(guān)聯(lián)詞”詞語場,“行為詞”詞語場和“行為者”詞語場。這些詞語場之間彼此影響,關(guān)系緊密,相互激活,是構(gòu)成語義場的主體部分。而“位置”詞語場,“時(shí)間”詞語場和“修飾”詞語場位于語義場邊緣,是對(duì)主體部分進(jìn)行修飾和限定,不與“主題詞”詞語場直接接觸。

從數(shù)據(jù)結(jié)果看,10 類主題詞詞語場解釋了21.3%的關(guān)鍵詞。 依據(jù)各主題詞詞語場的關(guān)鍵詞數(shù)量排序, 最多的是傳媒、政治、經(jīng)濟(jì)和軍事,最少的是氣候、體育和教育。 關(guān)聯(lián)詞詞語場解釋了24.5%,其中各類專有機(jī)構(gòu)、組織、和產(chǎn)品等名稱解釋了16.7%的關(guān)鍵詞,關(guān)聯(lián)事物解釋了7.8%, 出現(xiàn)頻率高的關(guān)鍵詞有WORLD、CITY 等在英語新聞各主題中均可能出現(xiàn)的常見詞;行為者詞語場解釋了26.8%,其中專有人名解釋了21.5%的關(guān)鍵詞,出現(xiàn)頻率高的人名有OBAMA、BILL、JOBS, 關(guān)聯(lián)人物解釋了5.3%, 出現(xiàn)頻率高的關(guān)鍵詞有PEOPLE、WOMEN、KIDS等常見人物。 行為詞語場解釋了2.7%,出現(xiàn)頻率高的動(dòng)詞有SAYS、SPENDING、KILLED、FIGHT。 由它們構(gòu)成的語義場主體部分合計(jì)解釋了75.3%的關(guān)鍵詞, 而位于邊緣的“位置”、“時(shí)間”、“修飾”詞語場合計(jì)解釋了24.7%的關(guān)鍵詞。

從圖式模型的填充詞匯中可以看出, 英語新聞的語義場主題鮮明, 關(guān)聯(lián)詞匯中專有名詞眾多, 諸如機(jī)構(gòu)名稱,組織名稱等;行為者詞匯數(shù)量多,大量專有人名出現(xiàn);行為詞較少,最常見的詞是SAYS,這符合新聞報(bào)道常引用第三人稱話語的特點(diǎn);位置詞匯中出現(xiàn)大量專有地名,反映新聞事件的地域特點(diǎn);時(shí)間詞匯中絕大部分為狹義時(shí)間, 如MONDAY、JUNE、THURSDAY, 而廣義時(shí)間較少,反映出新聞事件對(duì)時(shí)間的敏感性和精確性;在修飾詞匯中,數(shù)量詞多為MILLION、BILLION 等,反映新聞事件多具有轟動(dòng)性和影響力大的特點(diǎn)。

五、研究結(jié)論與不足

本研究利用真實(shí)新聞?wù)Z料進(jìn)行大規(guī)模統(tǒng)計(jì)分析,通過對(duì)關(guān)鍵詞的提取,語義分析、加工,對(duì)詞語場進(jìn)行詞語填充, 運(yùn)用圖式理論構(gòu)建英語新聞?wù)Z義網(wǎng)絡(luò)模型。 通過提取出來的關(guān)鍵詞進(jìn)行語義分析和標(biāo)注,來填充詞語場并獲得語義場, 本文最終形成脈絡(luò)清晰的主題圖式模型。 它的構(gòu)建不僅可以幫助語言學(xué)習(xí)者了解英語新聞的熱點(diǎn)和主題分布,而且減輕學(xué)習(xí)者記憶負(fù)擔(dān),豐富學(xué)習(xí)者圖式和心理詞庫,改善詞匯識(shí)別能力,優(yōu)化學(xué)習(xí)者知識(shí)結(jié)構(gòu)和語言認(rèn)知能力,這些對(duì)大學(xué)英語詞匯教學(xué)具有積極的指導(dǎo)意義[11]。

由于本研究中僅采用了共時(shí)語料庫, 沒有考慮圖式內(nèi)容的時(shí)效性,也沒有對(duì)比其與本族語新聞主題圖式的異同性,這些使得本研究具有一定的局限性,這也是未來研究的方向。

[1]周方珠.翻譯多元論[M]. 北京:中國對(duì)外翻譯出版社,2004:4.

[2]周學(xué)藝.美英報(bào)刊文章閱讀[M]. 北京: 北京大學(xué)出版社,2004:12.

[3]范勇.《紐約時(shí)報(bào)》涉華報(bào)道對(duì)中國特色詞匯翻譯策略之研究[J]. 解放軍外國語學(xué)院學(xué)報(bào),2010,(5):82-87.

[4]Rumelhart D.The Architecture of Mind:A Connectionist Approach[M]. Mass: MIT Press,1989

[5]McCarhy.M.Discourse Analysis for Language Teachers[M].Cambridge:Cambridge University Press,1991.

[6]Carrell.P,Devine.J,Eskey.D.Interactive Approaches to Second Language [M]. Cambridge: Cambridge University Press,1988:158.

[7]周江林,張家強(qiáng).基于語料庫的英語空間隱喻研究[J]. 解放軍外國語學(xué)院學(xué)報(bào),2003,(5):27-31.

[8]桂世春.新編心理語言學(xué)[M].上海:上海外語教育出版社,2000:445.

[9]McCarhy.M.Vocabulary [M]. Oxford: Oxford University Press, 1990.

[10]李文中. 基于英語學(xué)習(xí)者語料庫的主題詞研究[J]. 現(xiàn)代外語,2003,(3): 284-293.

[11] 翟雪松, 林莉蘭. 翻轉(zhuǎn)課堂的學(xué)習(xí)者滿意度影響因子分析——基于大學(xué)英語教學(xué)的實(shí)證研究 [J]. 中國電化教育,2014,04:104-109+136.

猜你喜歡
主題詞圖式語料庫
山東漢畫像石鋪首銜環(huán)魚組合圖式研究
《語料庫翻譯文體學(xué)》評(píng)介
把課文的優(yōu)美表達(dá)存進(jìn)語料庫
圖式思維在現(xiàn)代室內(nèi)裝飾設(shè)計(jì)中的應(yīng)用
從驅(qū)動(dòng)-路徑圖式看“V+上/下”的對(duì)稱與不對(duì)稱
基于JAVAEE的維吾爾中介語語料庫開發(fā)與實(shí)現(xiàn)
語言與翻譯(2015年4期)2015-07-18 11:07:45
我校學(xué)報(bào)第32卷第6期(2014年12月)平均每篇有3.00個(gè)21世紀(jì)的Ei主題詞
我校學(xué)報(bào)第32卷第5期(2014年10月)平均每篇有3.04個(gè)21世紀(jì)的Ei主題詞
2014年第16卷第1~4期主題詞索引
《疑難病雜志》2014年第13卷主題詞索引
扶风县| 康乐县| 沛县| 奈曼旗| 会泽县| 柳林县| 六盘水市| 太仆寺旗| 余庆县| 务川| 西乌珠穆沁旗| 遵义县| 大理市| 嘉义市| 包头市| 东乌珠穆沁旗| 嘉祥县| 兴安县| 阆中市| 竹溪县| 靖江市| 鄂托克前旗| 灌南县| 高碑店市| 浮山县| 达孜县| 永安市| 佛坪县| 威远县| 民县| 加查县| 平阳县| 金沙县| 阳泉市| 饶河县| 夏邑县| 三亚市| 延安市| 盐池县| 碌曲县| 泸西县|