劉文慧,周世界
(1.中南林業(yè)科技大學班戈學院,長沙 410004; 2.湖南省教育科學綠色教育研究基地,長沙 410004; 3.大連海事大學外國語學院,遼寧大連 116026)
話語標記語(discourse markers)是一種常見的語言現(xiàn)象,它包括部分連詞(如and, therefore, because)、副詞(如actually, frankly)、感嘆詞(如well)以及某些短語或小句(如as a consequence of, I mean)。[1]話語標記語普遍存在于口語和書面語中,它不依附于句法和語義結(jié)構(gòu),在語篇方面有許多整體功能。Qirk在20世紀50年代首次關(guān)注到這種話語標記語現(xiàn)象,但他并沒有對這種語言現(xiàn)象進行深入研究。[2]20世紀70到80年代,話語標記語逐漸開始受到語言研究者的重視。進入20世紀90年代,對話語標記語語義和功能方面的研究開始呈現(xiàn)出系統(tǒng)性。隨著國內(nèi)語料庫語言學的發(fā)展,學界開始關(guān)注話語標記語在二語習得中的作用。目前,國內(nèi)相關(guān)研究多數(shù)是關(guān)于話語標記語定義、特征、語用功能和語法化方面的研究,主要集中于英語習得者對某些特定話語標記語使用情況的研究,并且隨著英語話語標記語在二語習得領(lǐng)域研究的深入,漢語領(lǐng)域話語標記語的研究近些年也繁榮起來,但有關(guān)不同水平外語習得者和本族語者書面語之間、書面語與口語之間的整體性、多維度研究還不多。[3-6]本文通過語料庫方法,對比分析自建的外語習得者書面語語料庫、中國學生英語口筆語語料庫和英國國家語料庫,研究我國大學階段外語習得者書面語中話語標記語的使用情況。
由于研究的出發(fā)點或視角不同,話語標記語出現(xiàn)過多種名稱,如語義聯(lián)加語(semantic conjuncts)、語用標記手段(pragmatic devices)、語用標記語(pragmatic markers)、語用功能詞語(pragmatic function words)等。從諸多名稱不難看出,話語標記語至今還沒有一個公認的確切定義。由于話語標記語缺少確切一致的定義,其分類也多種多樣。Philip按邏輯關(guān)系將話語標記語分為邏輯連接標記語(logical connector type markers)和填充標記語(filler type markers)。邏輯連接標記語是指以邏輯關(guān)系將語篇連接起來的連詞或副詞;填充標記語是指不表達具體信息內(nèi)容,只用于填充停頓的標記語,在話語中具有一定的交際功能和意義。[7]本研究采用這種方法對話語標記語進行分類,表1是在Philip和王立非等[7]的話語標記語分類表格基礎(chǔ)上修改而成,其中邏輯連接標記語類分為13類,填充標記語類根據(jù)書面語特征去掉了無明確含義的填充語,只保留有含義的填充語一類。本研究擬通過對備選語料庫中話語標記語在數(shù)量和類型兩個變量上的研究,調(diào)查我國大學階段外語習得者書面語中話語標記語的使用情況和特征。
表1書面語話語標記語分類
本研究試圖通過語料庫研究回答以下三個問題:
(1)普通水平外語習得者書面語中話語標記語與本族語者之間的異同;
(2)普通水平外語習得者書面語中話語標記語與高水平外語習得者之間的異同;
(3)普通水平外語習得者書面語、高水平外語習得者口語和本族語者口語中話語標記語之間的異同。
本研究采用語料庫語言學的研究方法,備用語料來源于三個語料庫:自建的外語習得者書面語語料庫、中國學生英語口筆語語料庫(SWECCL)和英國國家語料庫(BNC)。
自建的外語習得者書面語語料庫由湖南某高校外語教師共同建立,設(shè)計規(guī)模為100萬詞,目前主要由書面語語料構(gòu)成,反映普通水平外語習得者水平。該語料庫收集了2013年到2017年普通非英語專業(yè)外語習得者的限時作文,文體以議論文為主,基本可以反映普通水平外語習得者的外語寫作水平和特征。本研究分別從大一和大二學生作文庫中隨機抽取約5萬詞,共約10萬詞符作為樣本語料。
中國學生英語口筆語語料庫是一個包括書面語和口語語料的大型外語習得者語料庫,由南京大學與外語教學與研究出版社聯(lián)合開發(fā)。該庫分為書面語語料庫(WECCL)和口語語料庫(SECCL)兩個子庫,總庫容約為200萬詞。SECCL口語子庫主要依托全國英語專業(yè)四級口語考試語料,主要反映高水平外語習得者水平。WECCL筆語子庫的書面語料主要從國內(nèi)9所不同層次高校的英語專業(yè)一到四年級學生中采集,其設(shè)計規(guī)模與SECCL大體相等,均為約100萬詞。本研究從筆語子庫的限時作文子庫和口語子庫的口語文本文件中各隨機抽取約10萬詞符作為樣本語料。
英國國家語料庫是當代最具代表性的英語語料庫之一,在20世紀90年代初由英國政府、牛津大學、蘭卡斯特大學和朗文出版公司等聯(lián)合建立,代表本族語者水平。英國國家語料庫包含書面語和口語兩個子庫,總?cè)萘考s為1億詞,其中書面語子庫約9000萬詞符,占總庫容的90%,口語語料約1000萬詞符,占總庫容的10%。BNC的最新版BNCXML2007,采用國際通用標準化標注體系,使用三級賦碼標注,使標注錯誤率減少到1%。本研究從BNC書面語子庫和口語子庫中各隨機抽取約10萬詞符作為樣本語料。
本研究采用語料庫對比研究的方法,首先從三個備選語料庫中分別隨機抽取約10萬個詞符,之后用文字處理軟件Wordsmith 6.0中的單詞列表(wordlist)和詞匯檢索(concordance)兩個功能分析抽取出的語料,之后提取語料中話語標記語的位置、使用類型、使用總頻數(shù)和每種話語標記語的使用頻率,并對可以表述多種話語關(guān)系的話語標記語進行分類,最后使用統(tǒng)計軟件SPSS 19.0對收集的數(shù)據(jù)進行差異分析。
表2是基于自建書面語語料庫和BNC書面語子庫的話語標記語在數(shù)量和類型兩個變量上的數(shù)據(jù)描述及統(tǒng)計分析。表2數(shù)據(jù)顯示,在自建書面語語料庫中,普通水平外語習得者使用的話語標記語在數(shù)量和類型兩個變量上都大于本族語者,其中外語習得者共使用6636個話語標記語,涉及表1中的話語標記語類型68個,而本族語者共使用4241個話語標記語,涉及表1中的話語標記語類型60個。T-test結(jié)果顯示,普通水平外語習得者與本族語者在話語標記語數(shù)量上存在顯著性差異(Sig.=0.003,遠小于臨界值0.05)。
表2基于問題1的數(shù)據(jù)描述及統(tǒng)計分析
表2數(shù)據(jù)表明,我國普通水平外語習得者話語標記語使用在總體數(shù)量上顯著高于本族語者,甚至某些詞有過度使用的傾向,這個研究結(jié)果與其他研究者的發(fā)現(xiàn)不謀而合。[8-9]例如,陳偉通過對比Lucy語料庫和中國學習者英語語料庫(CLEC)發(fā)現(xiàn),與英國學生相比,中國大學生話語標記語使用在總體頻率上呈現(xiàn)出使用過度的趨勢。[9]但本研究的結(jié)果也與一些研究者的結(jié)論相悖。[10-11]這些研究者注意到,由于受母語和思維方式的影響,中國外語習得者英語寫作的篇章結(jié)構(gòu)缺乏連貫性,在寫作中容易忽視連接性詞語的使用。
在實踐中發(fā)現(xiàn),這兩種看似矛盾的現(xiàn)象在普通水平外語習得者的書面語中確實同時存在。筆者認為,普通水平外語習得者書面語中過多或過少使用話語標記語都是受外語水平限制的結(jié)果。根據(jù)表2中最后一列的差值對比數(shù)據(jù),在14種類型的話語標記語中,除了總結(jié)性標記語和選擇性標記語(差值分別為0和-21),其他12種話語標記語都顯示出普通水平外語習得者使用話語標記語的頻率明顯高于本族語者,有些話語標記語甚至有過度使用傾向,如對比性標記語、因果性標記語、強調(diào)性標記語和資格性標記語的差值分別高達277、636、287和276。普通水平外語習得者由于受到外語水平的限制,寫作過程中常常難以確切充分地表達觀點,此時,他們傾向于使用熟悉的副詞、連詞和短語等話語標記語輔助文章內(nèi)容闡述,結(jié)果常常造成過度使用某些話語標記語。此外,國內(nèi)外語測試對寫作中句子連接詞使用的評判標準也是造成普通水平外語習得者過度使用話語標記語的原因之一,所以普通水平外語習得者的書面語中往往堆砌了過多的副詞或短語,內(nèi)容的連貫性和觀點闡述反而顯得不足。另一方面,在一些普通水平外語習得者的書面語中,表示邏輯關(guān)系的連接詞出現(xiàn)頻率低于本族語者的現(xiàn)象也比較常見。究其原因,漢語是一種注重意合而非形合的語言,普通水平外語習得者外語水平較低且容易受漢語負遷移影響,因而導致其在英語寫作過程中忽視話語標記語的邏輯連接作用。
表3是基于自建書面語語料庫和WECCL語料庫的話語標記語在數(shù)量和類型兩個變量上的數(shù)據(jù)描述及統(tǒng)計分析。表3數(shù)據(jù)顯示,在自建書面語語料庫中,普通水平外語習得者使用的話語標記語在數(shù)量和類型兩個變量上都小于高水平外語習得者,其中普通水平外語習得者共使用6636個話語標記語,涉及表1中的話語標記語類型68個,而高水平外語習得者共使用話語標記語7827個,涉及表1中的話語標記語類型72個。T-test結(jié)果顯示,普通水平外語習得者與高水平外語習得者在話語標記語數(shù)量上不存在顯著性差異(Sig.=0.173,遠大于臨界值0.05)。
表3數(shù)據(jù)表明,普通水平外語習得者與高水平外語習得者的書面語話語標記語在數(shù)量和類型上差異與共性并存。表3最后一列差值對比數(shù)據(jù)表明,普通水平外語習得者在書面語中比高水平外語習得者使用更少的話語標記語,體現(xiàn)了外語水平對話語標記語使用頻率的影響。在分析語料過程中發(fā)現(xiàn),普通水平外語習得者使用的話語標記語不僅在數(shù)量和類型兩個變量上都低于高水平外語習得者,而且大量使用如for example, but, if, I think等難度和復(fù)雜度較低的話語標記語,而as well as, indeed, furthermore這類話語標記語的使用頻率較低。外語水平較高的外語習得者受母語負遷移影響相對較小,在寫作中注意通過使用精準度高的話語標記語體現(xiàn)句子之間的邏輯連接關(guān)系,雖然不能完全排除有堆砌話語標記語的可能性,但實踐經(jīng)驗和諸多研究結(jié)果表明,英語非本族語者的英語寫作水平與話語標記語使用數(shù)量呈正相關(guān),高水平外語習得者能夠更有效、更均衡地使用話語標記語,使內(nèi)容表達更復(fù)雜、更明確。[11-12]
但值得注意的是,普通水平外語習得者與高水平外語習得者書面語語料中的話語標記語之間并不存在顯著性差異,而且較大的Sig值(0.173)說明二者之間的差異較小,更多的是呈現(xiàn)共性的特征。同時,一些研究者也發(fā)現(xiàn)相似的研究結(jié)果。如郭威的研究發(fā)現(xiàn),水平較高的外語習得者作文中話語標記語的數(shù)量高于水平較低的學習者,但不存在顯著性差異。[12]無論是普通水平外語習得者和高水平外語習得者之間的共性還是差別,反映的都是中國外語習得者在外語習得過程中共存的特征。
表4是自建書面語語料庫、SECCL和BNC口語子庫中出現(xiàn)的10個最高頻話語標記語在數(shù)量和類型兩個變量上的數(shù)據(jù)描述。表4數(shù)據(jù)顯示,在自建語料庫中,普通水平外語習得者使用頻率最高的10個話語標記語共涉及7個類型;在SECCL語料庫中,高水平外語習得者使用頻率最高的10個話語標記語也涉及7個類型,與普通水平外語習得者相比缺少因果性標記語和列舉性標記語,多了對比性標記語和有含義的填充語;在BNC口語語料庫中,本族語者使用頻率最高的10個話語標記語涉及6個類型,與普通水平外語習得者相比缺少資格性、時間性和選擇性話語標記語,多了對比性和重復(fù)性話語標記語。從總數(shù)上看,SECCL中高頻話語標記語出現(xiàn)的數(shù)量6874為最高,自建語料庫的4877次之,BNC口語子庫的3595最低。
表3基于問題2的數(shù)據(jù)描述及統(tǒng)計分析
表4基于問題3的10個最高頻話語標記語數(shù)據(jù)描述
表4數(shù)據(jù)結(jié)果表明,普通水平外語習得者書面語中話語標記語與高水平外語習得者口語有很大相似性。自建書面語語料庫與SECCL語料庫相比,and出現(xiàn)的數(shù)量均為最高,if, very, when, after四個話語標記語出現(xiàn)有重合,雖然排序不同但都處于比較靠前的位置。自建書面語語料庫與BNC口語子庫相比,for example, so, and 和also同時出現(xiàn)在10個高頻話語標記語中,但是它們在BNC口語子庫中的位置處于中間靠后,尤其是and,頻數(shù)只有335,排在第6位。
自建外語習得者書面語語料與SECCL語料之間的相似性和與BNC口語語料之間的巨大差異說明,中國外語習得者的書面語表現(xiàn)出較強的口語化傾向,而且口語也表現(xiàn)出書面語的傾向。其他研究者和筆者的實踐觀察都發(fā)現(xiàn),中國外語習得者常?;煜龝嬲Z和口語之間的差別,導致在外語口語中使用一些典型的書面語話語標記語,而外語書面語中容易出現(xiàn)典型的口語話語標記語。[13]此外,筆者之前的研究,通過對比SWECCL和蘭卡斯特大學的LANCAWAE語料庫發(fā)現(xiàn),在筆語詞匯多樣性和復(fù)雜度兩個指標上,我國高水平外語習得者均低于國外雙語習得者和本族語者。[14]本研究結(jié)果中,在使用最頻繁的10個話語標記語上,我國外語習得者在數(shù)量和類型上都遠高于本族語者,說明我國外語習得者存在過度或過少使用某些話語標記語的現(xiàn)象。不同語料庫組合對比產(chǎn)生的相似性和相異性的結(jié)果表明,外語習得者對書面語和口語話語標記語之間的語境差別注意不足,同時也印證了中國外語習得者使用話語標記語的特征。
通過以上研究得到的主要結(jié)論總結(jié)如下:
(1)普通水平外語習得者書面語中話語標記語在頻數(shù)和類型上都超過本族語者,原因可能是受到外語水平的限制,普通水平外語習得者傾向于使用話語標記語彌補表達觀點能力的不足。此外,外語測試寫作的評分標準和母語負遷移也是影響中國外語習得者恰當使用話語標記語的原因。
(2)與高水平外語習得者相比,普通水平外語習得者書面語中話語標記語使用的數(shù)量和類型都較少,但二者之間不存在顯著性差異。高水平外語習得者更多使用難度和復(fù)雜度較高的話語標記語,反映出其外語水平較高,力圖通過使用話語標記語達到邏輯表達更清晰的目的。但是高水平外語習得者與普通水平外語習得者之間的相似性也反映出中國外語習得者在外語習得過程中存在共性的特征。
(3)與本族語者相比,普通水平外語習得者書面語中話語標記語呈現(xiàn)口語化傾向,同時與高水平外語習得者口語中話語標記語在數(shù)量和類型上有較大相似性,二者都呈現(xiàn)出書面語的特征,表明中國外語習得者對書面語和口語中話語標記語之間的語境差別缺乏明確認識。