閆長紅
(陜西理工學院外國語學院,陜西漢中723001)
基于語料庫的高頻形容詞different詞匯知識研究
閆長紅
(陜西理工學院外國語學院,陜西漢中723001)
利用語料庫研究中國英語學習者對高頻形容詞different的使用情況,并通過和英語母語者對比,探究兩者對該詞的搭配能力運用的異同,從而了解中國英語學習者對該詞詞匯知識掌握的深度,分析了主要原因,并提出了教學啟示。
語料庫;中國英語學習者;詞匯深度;詞語搭配
詞匯是語言的基本成分,對詞匯知識的學習是語言學習的重要內(nèi)容和基本任務之一。
詞匯知識可從深度和廣度兩方面考察。詞匯深度是詞匯的“質(zhì)”的研究,其基本問題是:what is meant to know a word?其基本假設是:Knowing a word is more than just knowing its form and meaning (Richards 1976、Nation1990)[1]。Nation將詞匯知識看成是由不同的成分組成的多維體系,將詞匯知識劃分為形式、位置、功能和意義四大層面以及發(fā)音、書寫、句法特征、搭配、使用頻率、得體性、概念意義、詞間聯(lián)想八個類型;且每個詞匯知識類型又分“接受”和“產(chǎn)出”兩種能力[2]。形容詞表示人或事物的性質(zhì)、狀態(tài),屬性等,對形容詞的運用可以反映語言使用者的思維能力。本文利用語料庫研究中國英語學習者對高頻形容詞different的使用情況,并通過和英語母語者對比,探究兩者對該詞的搭配能力運用的異同,從而了解中國英語學習者對該詞詞匯知識掌握的深度。
(一)在WECCL中考察different作定語時其后的搭配情況
利用AntConc的詞頻排序功能在WECCL(中國學生英語筆語語料庫)中選出different(排在形容詞第三位,總頻數(shù)為1710)。點擊Collocate(搭配詞),然后在Search Term中鍵入different;在Window Span(搭配詞跨距)中設置搭配詞距離檢索詞的位置,本研究設置為從0L到1R(即研究different右邊的第一個搭配詞,左邊為0詞,下同)。然后在Min.Collocate Frequency(最小搭配頻數(shù))中設置為默認值10;最后點擊Start選項卡,顯示出different后的所有搭配。其中和名詞搭配類型共有20項,總頻數(shù)為922,選出頻數(shù)在20次以上的語項進行研究。
(二)在COCA中研究different作定語時其后的搭配情況
查詢different作形容詞時在COCA(美國當代英語語料庫)中出現(xiàn)的總頻數(shù)。在字符串查詢區(qū)(WORD(S))內(nèi)輸入different,選擇DISPLAY一欄的LIST(列表)選項,然后點擊SEARCH(搜索)功能,就可得到總頻數(shù)186649。在字符串查詢區(qū)(WORD(S))內(nèi)輸入different,點擊Collocate(搭配)并在方框內(nèi)輸入[n*],在其后的左右兩個方框分別選0和1(即研究different右邊的第一個搭配詞,左邊為0詞,下同),選擇DISPLAY一欄的LIST(列表)選項;同時在SORTING一欄選擇FREQUENCY(頻數(shù)),最小值為10,然后點擊SEARCH(搜索)功能,就可得到頻數(shù)由高到低排列的前100位(最低頻數(shù)為189)與different搭配的名詞列表(總頻數(shù)為55819),把其中和步驟1中對應的各項選出。
以上兩步的結(jié)果如表1所示。
(三)在COCA中分別研究表1中different后各詞與定語形容詞搭配情況
在字符串查詢區(qū)(WORD(S))內(nèi)輸入people,點擊Collocate(搭配)并在方框內(nèi)輸入[j*],在其后的左右兩個方框分別選1和0,選擇DISPLAY一欄的LIST (列表)選項;同時在SORTING一欄選擇FREQUENCY(頻數(shù)),然后點擊SEARCH(搜索)功能,就可得到頻數(shù)由高到低排列的前100位修飾people的形容詞列表(總頻數(shù)為98881),把其中和different意思相近的頻數(shù)靠前的搭配選出。按照同樣步驟,分別研究其它各詞搭配情況。
(四)在WECCL中分別研究表1中的各詞與定語形容詞搭配情況
點擊Collocates(搭配詞),然后在Search Term中鍵入people;在Window Span(搭配詞跨距)中設置搭配詞距離檢索詞的位置,本研究設置為從1L到0R。然后在Min.Collocate Frequency(最小搭配頻數(shù))中設置為默認值20;最后點擊Start選項卡,顯示出people前的所有搭配,把其中和different意義相近的形容詞搭配選出。按照同樣步驟,分別研究其它幾個詞的搭配情況。
以上兩步的結(jié)果如表2所示。
(一)在WECCL和COCA中different作定語時其后的搭配情況
表1 在WECCL和COCA中different作定語時其后的名詞搭配頻數(shù)結(jié)果
(上表中各英文縮寫代表內(nèi)容如下相對排序; Col搭配;Fre頻數(shù);Fre%頻數(shù)百分比;Nfre標準化頻率。以下各圖表同)。標準化頻率用以比較不同大小的語料庫中某個(些)詞的出現(xiàn)頻數(shù)。頻數(shù)標準化用某個(些)檢索項的實際觀察頻數(shù)除以總體頻數(shù)(通常為文本或語料庫的總詞數(shù))。再次基礎上乘以1千(1萬、1百萬)得到平均每千(萬、百萬)詞的出現(xiàn)頻率。本研究采用每百萬詞計算,即:標準化頻率(每萬詞)=(觀察頻數(shù)/總體頻數(shù))×1000000[3]。
圖1 在WECCL和COCA中以上單詞標準化頻率對比
由上表1可知:
(1)在1289303個詞的WECCL語料庫中,different共出現(xiàn)頻數(shù)為1710次,占整個語料庫比例的0.13%,標準化頻率為1326.30。其中作前置定語和名詞的搭配類型(頻數(shù)在20以上)共有10項,占different總用法的0.58%(10/1710);該10項總頻數(shù)為696,占different使用總頻數(shù)的40.7%(696/1710)。在這10項搭配中,頻數(shù)主要集中于前兩項people和opinion(s)。(2)在容量為464,020,256個詞的COCA語料庫中,different作形容詞時總頻數(shù)為186649,占整個語料庫比例的0.04%,遠低于WECCL中的0.13%;標準化頻率為402.24,同樣遠低于WECCL中的1326.30。其中作前置定語和名詞的搭配類型(頻數(shù)在97以上)共有100項,占different總用法的0.05% (100/186649),遠低于WECCL中的0.58%;該100項總頻數(shù)為55819次,占different使用總頻數(shù)的29.90%(55819/186649),遠低于WECCL中的40.76%。(3)和WECCL相比,COCA中各詞的頻數(shù)大小排序不同。中國學習者使用頻數(shù)最多的people和opinion(s)分別排在母語使用者的第三位和末位;兩者使用頻率最高的前兩個詞的頻數(shù)遠高于其它項,表明兩者對different和名詞的搭配都集中于前兩個詞。同時根據(jù)圖1標準化頻率對比顯示,中國學習者對以上各搭配的使用頻率遠遠高于母語者,屬于超用。
綜上所述:母語者對different的使用頻率遠低于中國學習者,也就是說中國學習者超用了different。母語者對對different作形容詞時的使用范圍遠遠廣于中國學習者,僅頻數(shù)在189以上的搭配就有100項之多,而中國學習者卻只有10項,亦即中國學習者對該詞的使用范圍較為狹窄,詞匯深度遠遠不夠。
(二)在COCA中different后各詞與定語形容詞搭配情況
表2 在COCA和WECCL中different后各詞前定語形容詞搭配頻數(shù)排序結(jié)果
對上表以分析可知:在修飾以上各名詞表達“不同的”這一概念時,母語者和中國英語學習者所使用的頻數(shù)最高詞都是different,亦即中國英語學習者在該用法上和母語者較為一致,用法恰當。但是在標準化頻率方面中國英語學習遠高于母語者,屬于超用。這表明母語者能用來和上述名詞搭配的形容詞范圍很廣,可以用更為詳細具體的詞而不是籠統(tǒng)的different來對名詞修飾,比如對people就用表達不同國籍、年齡、膚色、身份等的詞來修飾;而中國英語學習者受思維所限,能用的就極少,因而在有限的表達范圍內(nèi)不斷重復,使用頻率超高。
同時可以看出對于某些名詞,不論是母語者還是中國英語學習者,所能用來修飾它們的意義相近的形容詞都很有限,這也許表明了不同民族思維的一致性。
中國英語學習者對詞匯知識掌握的深度不夠與其詞匯學習策略以及語言輸入有關(guān)。大多數(shù)學生學習單詞主要是靠詞匯表或查詞典,這種方法脫離語境,對詞匯知識的學習支離破碎,難以有一個較為全面的深刻的把握??衫斫庑哉Z言輸入是語言習得的必要條件,輸入的數(shù)量和質(zhì)量對學習者的語言發(fā)展意義重大。如前所述,多數(shù)學生主要是靠詞匯表或查詞典而不是在具體的語境中學習詞匯,這樣的輸入數(shù)量不足、形式單一,很難提高自己的語言水平。
上述問題可以通過合理利用語料庫來解決。
語料庫擁有大量真實的語言材料,可以保證語言輸入的數(shù)量和質(zhì)量。在課堂中可以引入數(shù)據(jù)驅(qū)動學習法(Data-driven learning,簡稱DDL),這是語料庫應用于語言教學中的一種教學模式(Johns, 1991)。其主要思想是指引學生基于大量的語料庫數(shù)據(jù)觀察、概括和歸納語言使用現(xiàn)象,自我發(fā)現(xiàn)語法規(guī)則、意義表達及語用特征[4]。使用語料庫的檢索工具,探究本族語者的詞匯搭配情況,從而建立詞匯搭配及使用頻率的概念。語境共現(xiàn)行可以在同一個界面上,以檢索詞居中的方式呈現(xiàn)該詞在一個或若干個文本中出現(xiàn)的所有次數(shù)及具體語境,便于學習者集中比較、理解詞匯的多項詞義,領悟其使用特征及語境。學生通過閱讀語境共現(xiàn)行探究目標詞語與語境中其它詞語的聯(lián)系,總結(jié)其搭配規(guī)律,完成詞匯的意義建構(gòu),拓展詞匯知識,提高詞匯學習的效率。
本文利用語料庫研究了中國英語學習者對高頻英語形容詞different的使用情況??傮w來看,中國英語學習者對該詞的使用范圍較為狹窄,作定語時所修飾的頻數(shù)較高名詞只有10個,而英語母語者多達100個以上;大量重復使用該詞,且頻率超高;在表達“不同的”這一概念時,英語母語者所使用的的形容詞多于中國英語學習者,并且在很多情況下會使用更為詳細具體的詞,而中國英語學習者則僅僅局限于“different”,表達較為含糊。這反映了中國英語學習者詞匯知識深度不夠,并且部分搭配不夠恰當。因此教師在教學中可以適當引入語料庫,給學生提供大量真實的語料,引導學生自主探索、發(fā)現(xiàn)、總結(jié)語言規(guī)律,豐富詞匯知識,提高語言水平。
注釋及參考文獻:
[1]肖善香,劉紹龍.論二語詞匯深度習得及其研究的若干問題[J].暨南學報(哲學社會科學),2003(1).
[2]Nation,L.S.P.Teaching and Learning Vocabulary[M].New York:Newbury House Publishers,1990:159-164.
[3]梁茂成,李文中,許家金.語料庫應用教程[M].北京:外語教學與研究出版社,2010.
[4]程春梅.對“語料驅(qū)動學習”模式的研究[J].國外外語教學(FLTA),2007(3):58-64.
[5]何安平.語料庫輔助英語教學入門[M].北京:外語教學與研究出版社,2010.
[6]汪興富,Mark Davies,劉國輝.美國當代英語語料庫(COCA)——英語教學與研究的良好平臺[J].外語電化教學,2008(9).
ACorpus-based Study on Vocabulary of different
YAN Chang-hong
(School of Foreign Language,Shaanxi University of Technology,Hanzhong,Shaanxi 723001)
This paper carries a corpus-based study to explore the Chinese English learners’use of high-frequency adjectives different by contrast with that of native English speakers to probe into their vocabulary knowledge of this word.
corpus;Chinese English learners;vocabulary depth;collocation
H314.2
A
1673-1883(2015)03-0058-03
(責任編輯:周錦鶴)
2015-05-24
閆長紅(1974-),男,漢族,陜西漢中人,講師,碩士,研究方向:應用語言學、語料庫語言學與二語習得。