司園園
(西北大學(xué) 外國(guó)語(yǔ)學(xué)院,陜西 西安 710127)
詞塊指的是在語(yǔ)料文本中反復(fù)出現(xiàn)的兩詞或兩詞以上的結(jié)構(gòu),這些結(jié)構(gòu)不一定是語(yǔ)法和語(yǔ)義上的完整結(jié)構(gòu),如the basis of a。對(duì)詞塊的掌握程度通常被視為英語(yǔ)地道性的重要體現(xiàn),學(xué)習(xí)者運(yùn)用詞塊能力與學(xué)術(shù)寫(xiě)作水平有顯著的正相關(guān)性。鑒于此,本研究基于兩個(gè)自建語(yǔ)料庫(kù):中國(guó)英語(yǔ)學(xué)習(xí)者語(yǔ)料庫(kù)與英語(yǔ)本族語(yǔ)語(yǔ)料庫(kù),對(duì)比分析中國(guó)英語(yǔ)專(zhuān)業(yè)碩士研究生與英語(yǔ)本族語(yǔ)作者在學(xué)術(shù)論文中的四詞詞塊使用情況,以期對(duì)中國(guó)英語(yǔ)專(zhuān)業(yè)碩士研究生英語(yǔ)論文寫(xiě)作研究和教學(xué)提供一些啟示。
國(guó)外對(duì)于學(xué)術(shù)詞塊的研究側(cè)重于從不同語(yǔ)體或?qū)W科來(lái)研究高頻詞塊結(jié)構(gòu)及語(yǔ)用功能,如Biber區(qū)別了程式搭配和程式序列,從結(jié)構(gòu)和功能角度研究了口語(yǔ)和學(xué)術(shù)語(yǔ)體詞塊使用特點(diǎn);[1]Cortes通過(guò)對(duì)比歷史和生物學(xué)學(xué)術(shù)期刊文章發(fā)現(xiàn)不同領(lǐng)域詞塊結(jié)構(gòu)和功能;[2]Hyland指出學(xué)術(shù)詞塊在不同學(xué)術(shù)領(lǐng)域具有差異性;[3]Christin通過(guò)建立大學(xué)英語(yǔ)測(cè)試語(yǔ)料庫(kù)對(duì)比了不同學(xué)科間詞塊結(jié)構(gòu)與功能的區(qū)別。[4]
反觀國(guó)內(nèi),對(duì)于學(xué)術(shù)詞塊的研究還相對(duì)不足,多集中于學(xué)術(shù)文本自身特點(diǎn)的研究,如楊元媛總結(jié)了科技英語(yǔ)四詞詞塊使用特點(diǎn)。[5]也有研究某一具體特征的,如王敏等研究了學(xué)術(shù)論文中立場(chǎng)標(biāo)記詞塊。[6]
雖然國(guó)內(nèi)外學(xué)者對(duì)學(xué)術(shù)論文中所使用的多詞詞塊進(jìn)行了多方面多角度的研究,但鮮有學(xué)者針對(duì)學(xué)術(shù)論文中多詞詞塊使用特征進(jìn)行對(duì)比研究。鑒于此,本文通過(guò)對(duì)比中國(guó)英語(yǔ)專(zhuān)業(yè)碩士研究生與本族語(yǔ)作者使用的高頻四詞詞塊,分析中國(guó)英語(yǔ)專(zhuān)業(yè)研究生學(xué)術(shù)論文寫(xiě)作中四詞詞塊的使用與英語(yǔ)本族語(yǔ)作者的差異。
本研究運(yùn)用語(yǔ)料庫(kù)語(yǔ)言學(xué)的相關(guān)理論及工具,并基于Biber等提出的學(xué)術(shù)詞塊結(jié)構(gòu)分類(lèi),對(duì)比分析中國(guó)英語(yǔ)專(zhuān)業(yè)碩士研究生學(xué)術(shù)論文和語(yǔ)言學(xué)國(guó)際期刊論文中的四詞詞塊使用情況,試圖探討如下問(wèn)題:
(1)兩個(gè)語(yǔ)料庫(kù)中的中四詞詞塊是如何分布的,以及形成這樣分布的原因。
(2)哪些四詞詞塊在兩個(gè)語(yǔ)料庫(kù)中使用頻率最高,這些高頻四詞詞塊在兩個(gè)語(yǔ)料庫(kù)中是否具有顯著性差異,以及顯著差異形成的原因。
(3) 按照結(jié)構(gòu)分類(lèi)的四詞詞塊在兩個(gè)語(yǔ)料庫(kù)中的分布有何差異,以及差異形成的原因。
本研究采用的是語(yǔ)料庫(kù)對(duì)比分析的方法。用該方法分析學(xué)習(xí)者學(xué)術(shù)論文中詞塊的使用情況時(shí),參照語(yǔ)料庫(kù)的語(yǔ)料是英語(yǔ)本族語(yǔ)學(xué)習(xí)者的學(xué)術(shù)論文,還是國(guó)際英文期刊上的論文,學(xué)者界沒(méi)有一致的認(rèn)識(shí)。Bolton等認(rèn)為,學(xué)習(xí)者英文學(xué)術(shù)論文寫(xiě)作應(yīng)以國(guó)際英文期刊上的論文為標(biāo)準(zhǔn)。本研究將采納他的觀點(diǎn)。[7]
學(xué)習(xí)者語(yǔ)料庫(kù)CEPTC由知網(wǎng)上隨機(jī)選取的27篇外國(guó)語(yǔ)言學(xué)及應(yīng)用語(yǔ)言學(xué)專(zhuān)業(yè)碩士研究生2016—2018年畢業(yè)論文組成,總計(jì)461 636字符;參照語(yǔ)料庫(kù)ENJAC是由在語(yǔ)言學(xué)國(guó)際期刊AppliedLinguistics、AnnualReviewofAppliedLinguistics、EnglishLanguage&Linguistics和AnnualReviewofLinguistics上隨機(jī)選取的49篇2016—2018年期刊文章,總計(jì)463 180字符。此外,為確保所搜集到的文本具有代表性,兩個(gè)語(yǔ)料庫(kù)中涉及到的所有論文都刪除了致謝、目錄、圖表、參考文獻(xiàn)等,只保留了英文題目、英文摘要和正文部分。
Biber等人將詞塊的詞長(zhǎng)限制為三詞或多詞的共現(xiàn)組合,包括三詞、四詞、五詞等詞塊。[1]但是部分四詞詞塊在結(jié)構(gòu)上包含三詞詞塊(如as a result of包含as a result),并且四詞詞塊在學(xué)術(shù)論文中更為常用,在結(jié)構(gòu)上更具代表性,因此本研究的研究對(duì)象確定為四詞詞塊。
本研究所使用到的檢索工具 AntConc 3.5.7w(Windows),其詞頻表功能可自動(dòng)計(jì)算出兩個(gè)語(yǔ)料庫(kù)的總形符數(shù)和總類(lèi)符數(shù),而其N(xiāo)-grams功能可檢索出兩語(yǔ)料庫(kù)中的所有四詞詞塊。另外本研究還利用檢驗(yàn)頻數(shù)差異的Chi-Square Calculator(卡方檢驗(yàn))來(lái)計(jì)算兩語(yǔ)料庫(kù)共有詞塊使用頻率的差異顯著性。[8]
第一步,提取本研究的目標(biāo)四詞詞塊。筆者根據(jù)詞塊頻數(shù)每百萬(wàn)詞出現(xiàn)10—40次不等,[2]以及自建語(yǔ)料庫(kù)的實(shí)際庫(kù)容大小,將目標(biāo)四詞詞塊的檢索頻數(shù)設(shè)定為每百萬(wàn)詞出現(xiàn)30次,且同時(shí)出現(xiàn)在不少于5個(gè)文本中,[1]以確保所搜索到的四詞詞塊體現(xiàn)語(yǔ)言學(xué)專(zhuān)業(yè)的學(xué)科特點(diǎn)而非碩士研究生或國(guó)際學(xué)者個(gè)人的論文寫(xiě)作風(fēng)格。關(guān)于此提取標(biāo)準(zhǔn),筆者需要指出,對(duì)詞塊的界定至今仍有爭(zhēng)議,[9]本研究基于經(jīng)驗(yàn),對(duì)目標(biāo)四詞詞塊的界定以每百萬(wàn)詞出現(xiàn)30次的頻率為提取標(biāo)準(zhǔn),這種界定并沒(méi)有一定的統(tǒng)計(jì)學(xué)依據(jù),僅是為了搜索到一定數(shù)量的高頻四詞詞塊。通過(guò)設(shè)定每百萬(wàn)詞出現(xiàn)30次的頻率,得到數(shù)量合理的同時(shí)又具有典型性的四詞詞塊(許家金、許宗瑞,2007)。根據(jù)這樣的標(biāo)準(zhǔn),四詞詞塊頻數(shù)應(yīng)為 30/1 000 000 * 461 636=13.85 或30/1 000 000 * 463 180=13.89,因此在使用檢索工具AntConc3.5.7w(Windows)檢索詞塊時(shí)將最低頻數(shù)設(shè)置為14,文本數(shù)設(shè)置為5。分別檢索出兩個(gè)語(yǔ)料庫(kù)中高頻四詞詞塊,然后手動(dòng)刪除在語(yǔ)法或語(yǔ)義上明顯不連貫的詞塊,如higher than that of,statement the author is等。
第二步,在經(jīng)過(guò)刪選的高頻四詞詞塊中找出兩個(gè)語(yǔ)料庫(kù)共有的高頻四詞詞塊,進(jìn)行卡方計(jì)算,探究中國(guó)英語(yǔ)專(zhuān)業(yè)碩士研究生對(duì)兩庫(kù)中共有的高頻四詞詞塊的使用情況及原因。
第三步,根據(jù)Biber等提出的學(xué)術(shù)詞塊結(jié)構(gòu)分類(lèi)標(biāo)準(zhǔn),[1]本研究分別對(duì)兩個(gè)語(yǔ)料庫(kù)中的目標(biāo)高頻四詞詞塊進(jìn)行結(jié)構(gòu)分類(lèi)與分析,并且分析英語(yǔ)專(zhuān)業(yè)碩士研究生與國(guó)際語(yǔ)言學(xué)作者在學(xué)術(shù)英語(yǔ)四詞詞塊使用方面存在的差異,并總結(jié)歸納英語(yǔ)專(zhuān)業(yè)研究生使用四詞詞塊的特點(diǎn)。
基于本研究對(duì)目標(biāo)四詞詞塊所設(shè)定的檢索標(biāo)準(zhǔn),使用檢索工具AntConc 3.5.7w(Windows)檢索兩個(gè)語(yǔ)料庫(kù)中的高頻四詞詞塊,分別獲得了兩庫(kù)中的高頻英語(yǔ)四詞詞塊,如表1和表2所示。
表1 CEPTC語(yǔ)料庫(kù)高頻四詞詞塊
表2 ENJAC語(yǔ)料庫(kù)高頻四詞詞塊
Biber在1999年所做的研究表明:相比于學(xué)習(xí)者,本族語(yǔ)者在學(xué)術(shù)寫(xiě)作中會(huì)使用更多的詞塊。但是近幾年的研究結(jié)果表明:在學(xué)術(shù)論文寫(xiě)作中中國(guó)英語(yǔ)學(xué)習(xí)者比英語(yǔ)本族語(yǔ)者使用的四詞詞塊更多。從表1可以看出,中國(guó)學(xué)習(xí)者語(yǔ)料庫(kù)提取出的目標(biāo)四詞詞塊為87類(lèi),共2 669個(gè);英語(yǔ)本族語(yǔ)者語(yǔ)料庫(kù)提取出的目標(biāo)四詞詞塊共45類(lèi),共1 053個(gè)。因此可以看出,中國(guó)學(xué)習(xí)者在學(xué)術(shù)論文寫(xiě)作中四詞詞塊的使用量和豐富度均超過(guò)英語(yǔ)本族語(yǔ)者,這與近幾年的研究結(jié)果一致。造成這樣結(jié)果的原因可能是英語(yǔ)專(zhuān)業(yè)碩士研究生作為高級(jí)英語(yǔ)學(xué)習(xí)者,在本科四年及研究生三年共七年的專(zhuān)業(yè)英語(yǔ)學(xué)習(xí)過(guò)程中,通過(guò)大量的閱讀課程及自己的閱讀經(jīng)歷和背誦寫(xiě)作經(jīng)歷,已經(jīng)掌握了大量的英語(yǔ)詞塊。
為了探究中國(guó)英語(yǔ)專(zhuān)業(yè)碩士研究生與英語(yǔ)本族語(yǔ)學(xué)者在學(xué)術(shù)論文寫(xiě)作時(shí),對(duì)四詞詞塊使用的差異顯著度,本研究使用檢驗(yàn)頻數(shù)差異的Chi-Square Calculator(卡方檢驗(yàn)),對(duì)兩個(gè)語(yǔ)料庫(kù)中共有的15個(gè)四詞詞塊進(jìn)行了頻數(shù)差異計(jì)算,結(jié)果見(jiàn)表3。
表3 CEPTC語(yǔ)料庫(kù)(Corpus1)和ENJAC(Corpus2)語(yǔ)料庫(kù)中高頻四詞詞塊卡方檢驗(yàn)結(jié)果
注:“+”代表“過(guò)度使用”,“-”代表“使用不足”;*=significant at P<0.05,**=significant at P<0.01,***=significant at P<0.001)。
由表3可知,這15個(gè)四詞詞塊在顯著度方面可分為有顯著差異的過(guò)度使用詞塊、有顯著差異的使用不足詞塊、無(wú)顯著差異的過(guò)度使用詞塊以及無(wú)顯著差異的使用不足詞塊四種:
(1)無(wú)顯著差異的過(guò)度使用詞塊。
on the basis of(P=0.237>0.05)
as well as the (P=0.327>0.05)
at the end of(P=0.279>0.05)
in terms of the(P=0.094>0.05)
can be used to(P=0.360>0.05)
in the form of(P=0.111>0.05)
the end of the(P=0.991>0.05)
(2)有顯著差異的過(guò)度使用詞塊。
on the other hand(P=0<0.001)
at the same time(P= 0.013<0.05)
on the one hand(P=0.002<0.01)
the results of the(P=0.007<0.01)
in the present study(P=0.038<0.05)
(3)無(wú)顯著差異的使用不足詞塊。
at the beginning of(P=0.869>0.05)
(4)有顯著差異的使用不足詞塊。
the nature of the(P=0.020<0.05)
in the context of(P=0.002<0.01)
通過(guò)對(duì)比英語(yǔ)本族語(yǔ)期刊論文語(yǔ)料庫(kù),中國(guó)英語(yǔ)專(zhuān)業(yè)碩士研究生學(xué)術(shù)論文語(yǔ)料庫(kù)中有12個(gè)詞塊屬于過(guò)度使用詞塊,3個(gè)詞塊屬于使用不足詞塊。在過(guò)度使用的詞塊中有5個(gè)詞塊屬于有顯著差異的過(guò)度使用詞塊,在使用不足的詞塊中有2個(gè)詞塊屬于有顯著差異的使用不足詞塊。這些共有詞塊的使用情況說(shuō)明,中國(guó)英語(yǔ)專(zhuān)業(yè)碩士研究生在學(xué)術(shù)論文中對(duì)詞塊有過(guò)度使用的傾向。造成這一現(xiàn)象的原因可能是英語(yǔ)專(zhuān)業(yè)研究生由于熟知在學(xué)術(shù)論文中大量地使用詞塊可以使自己的論文更完美,所以在論文寫(xiě)作中英語(yǔ)專(zhuān)業(yè)研究生會(huì)大量且刻意地使用詞塊;另一個(gè)原因可能是他們經(jīng)過(guò)多年的專(zhuān)業(yè)英語(yǔ)學(xué)習(xí),已經(jīng)掌握了大量的詞塊。
本研究根據(jù)Biber等人提出的詞塊結(jié)構(gòu)分類(lèi)標(biāo)準(zhǔn),[1]將本研究中的目標(biāo)高頻四詞詞塊分為:動(dòng)詞短語(yǔ)的詞塊、包含從句的詞塊、包含名詞的詞塊和介詞短語(yǔ)的詞塊(見(jiàn)表4)。
表4 CEPTC語(yǔ)料庫(kù)和 ENJAC語(yǔ)料庫(kù)詞塊結(jié)構(gòu)分類(lèi)對(duì)比
從表4可以看出,兩庫(kù)四詞名詞結(jié)構(gòu)和介詞結(jié)構(gòu)比例都比較高,這也證明了Biber和Hyland的觀點(diǎn):學(xué)術(shù)論文大多由含有介詞或者名詞短語(yǔ)的詞塊構(gòu)成。名詞短語(yǔ)承擔(dān)著話(huà)題引導(dǎo)和內(nèi)容陳述的作用。根據(jù)Biber等基于大型語(yǔ)料庫(kù)檢索的研究:名詞詞塊是學(xué)術(shù)寫(xiě)作的基石,代表了學(xué)術(shù)筆語(yǔ)文體的特征;介詞短語(yǔ)則體現(xiàn)了結(jié)構(gòu)組織和信息重組從而使文章系統(tǒng)性更強(qiáng)。[1,3]但是相比于本族語(yǔ)專(zhuān)家,英語(yǔ)專(zhuān)業(yè)研究生對(duì)介詞結(jié)構(gòu)詞塊的使用不足;而就名詞結(jié)構(gòu)四詞詞塊的使用情況而言,英語(yǔ)專(zhuān)業(yè)研究生對(duì)名詞詞塊的使用比例與國(guó)際語(yǔ)言學(xué)學(xué)者對(duì)名詞結(jié)構(gòu)詞塊使用比例都為27%。
it作形式主語(yǔ)的詞塊和被動(dòng)結(jié)構(gòu)詞塊能夠突顯學(xué)術(shù)論文描述的客觀性。從表1和表4可以看到,英語(yǔ)專(zhuān)業(yè)研究生運(yùn)用多樣的it作形式主語(yǔ)結(jié)構(gòu)詞塊,如使用it is obvious/necessary/difficult/likely/that/to;研究生學(xué)習(xí)者也使用多樣豐富的被動(dòng)結(jié)構(gòu)詞塊如can be concluded that, can be seen that,be based on that。
從表1中看到we can see that這一四詞詞塊頻率高達(dá)60次,位列高頻詞塊第五位。但是本族語(yǔ)語(yǔ)料庫(kù)詞塊卻沒(méi)有第一人稱(chēng)主觀性結(jié)構(gòu)詞塊,使用的是author is not aware等第三人稱(chēng)的四詞詞塊。
綜上分析,中國(guó)英語(yǔ)專(zhuān)業(yè)研究生對(duì)名詞詞塊、it作形式主語(yǔ)的詞塊和被動(dòng)結(jié)構(gòu)詞塊使用情況說(shuō)明,英語(yǔ)專(zhuān)業(yè)研究生在英語(yǔ)寫(xiě)作表達(dá)中已基本把握了學(xué)術(shù)文體的特點(diǎn)。但是從介詞詞塊使用不足情況來(lái)看,英語(yǔ)專(zhuān)業(yè)研究生在學(xué)術(shù)論文寫(xiě)作時(shí)的結(jié)構(gòu)組織和信息重組能力等一些加強(qiáng)論文系統(tǒng)性的能力還相對(duì)不足,從第一人稱(chēng)主觀性結(jié)構(gòu)的誤用情況來(lái)看,在學(xué)術(shù)論文寫(xiě)作時(shí)仍然還有口語(yǔ)化的特點(diǎn)。
(1)我國(guó)英語(yǔ)專(zhuān)業(yè)研究生使用高頻四詞詞塊總量超過(guò)語(yǔ)言學(xué)國(guó)際學(xué)者。(2)在共同使用的詞塊中,英語(yǔ)專(zhuān)業(yè)研究生有使用過(guò)度的傾向。(3)在結(jié)構(gòu)上,對(duì)包含介詞短語(yǔ)的詞塊使用不足,it作形式主語(yǔ)的詞塊和被動(dòng)結(jié)構(gòu)詞塊豐富,但多屬誤用第一人稱(chēng)的主觀性結(jié)構(gòu)詞塊。
通過(guò)分析本研究的研究結(jié)果,可以得到以下啟示:第一,本研究通過(guò)對(duì)比中國(guó)學(xué)習(xí)者語(yǔ)料庫(kù)與英語(yǔ)本族語(yǔ)語(yǔ)料庫(kù),發(fā)現(xiàn)了中國(guó)英語(yǔ)專(zhuān)業(yè)碩士研究生在英語(yǔ)論文寫(xiě)作中對(duì)四詞詞塊的使用與本族語(yǔ)作者有很大差距,這些發(fā)現(xiàn)為英語(yǔ)專(zhuān)業(yè)碩士研究生學(xué)術(shù)寫(xiě)作研究提供了實(shí)證依據(jù)。第二,在中國(guó)英語(yǔ)專(zhuān)業(yè)碩士研究生學(xué)術(shù)論文寫(xiě)作教學(xué)中,提高他們學(xué)術(shù)論文寫(xiě)作水平的重要標(biāo)準(zhǔn)是使用詞塊的數(shù)量以及質(zhì)量。通過(guò)分析本研究的研究結(jié)果,發(fā)現(xiàn)目前要解決的不是中國(guó)英語(yǔ)專(zhuān)業(yè)碩士研究生在學(xué)術(shù)論文寫(xiě)作中使用高頻詞塊的數(shù)量問(wèn)題,而是質(zhì)量問(wèn)題,即英語(yǔ)專(zhuān)業(yè)碩士研究生在英語(yǔ)學(xué)術(shù)論文寫(xiě)作中如何恰當(dāng)?shù)厥褂迷~塊的問(wèn)題。要解決這一問(wèn)題,英語(yǔ)專(zhuān)業(yè)碩士研究生可以查看國(guó)際語(yǔ)言學(xué)英文期刊論文并關(guān)注其中所使用的學(xué)術(shù)詞塊特征。教師們可以搜集英語(yǔ)專(zhuān)業(yè)碩士研究生論文和英語(yǔ)本族語(yǔ)作者所寫(xiě)論文,用所搜集到的語(yǔ)料自建兩個(gè)語(yǔ)料庫(kù),并指導(dǎo)讓學(xué)生對(duì)兩個(gè)語(yǔ)料庫(kù)中的四詞詞塊進(jìn)行對(duì)比,從而歸納出哪些是碩士研究生經(jīng)常誤用或使用不當(dāng)?shù)脑~塊,哪些是不符合英語(yǔ)學(xué)術(shù)論文寫(xiě)作要求的詞塊。通過(guò)大量的比較閱讀、記憶和運(yùn)用,加強(qiáng)中國(guó)英語(yǔ)專(zhuān)業(yè)碩士研究生對(duì)學(xué)術(shù)論文中所用詞塊的熟練掌握,進(jìn)而提高他們的英語(yǔ)學(xué)術(shù)論文寫(xiě)作水平。
本研究還存在一些不足的地方。比如,本研究主要采用的定量分析方法,缺乏一定的定性分析。今后可以針對(duì)中國(guó)英語(yǔ)專(zhuān)業(yè)碩士研究生學(xué)術(shù)論文中四詞詞塊的使用情況進(jìn)行更多的定性分析。
黑龍江生態(tài)工程職業(yè)學(xué)院學(xué)報(bào)2020年1期