余 陽
(河南理工大學外國語學院,河南 焦作 454000)
長期以來,學術論文被認為是傳遞學術信息的有效工具和手段,信息性是其第一屬性。然而相關研究顯示,學術論文作者在實現(xiàn)信息傳遞這一基本功能的同時,為了最大限度地讓自身的觀點得到認同和接受,學術論文作者必須使讀者產生“參與感”,感到仿佛在與自己進行學術交流,并在無形中受到文章觀點和內容的影響。在學術寫作過程中,作者的詞簇使用情況能夠明顯反映出學術語篇的種種特征,最明顯之處就在于其一般具有特定的語義特征和結構特征。
Wray(2002:66-67)對所收集到的詞簇相關文獻進行細致的梳理和歸納后發(fā)現(xiàn),有關詞簇的表達就超過50種,其名稱也多種多樣:語義詞組、程式化語言、多詞單位、詞叢、詞簇、預設詞組等。由于國內外眾多學者在研究背景、目的以及方法方面的差異,造成了目前對詞簇名稱方面的“一詞多名”現(xiàn)象。Nattinger & Decarrico(1992:65-69)認為,詞簇就是指長度不一但卻承載某種或多種語用功能的詞語片段。他們進一步對詞簇做了如下闡釋:一種游離于傳統(tǒng)語義與句法間的高頻率復現(xiàn)的多詞現(xiàn)象。每當這些詞語片段一起出現(xiàn)的時候,其代表了特定的語義或語用功能。從Nattinger & Decarrico對詞簇所下的定義來看,詞簇既可以是詞組也可以是從句;既可以是連續(xù)的也可以是不連續(xù)的,無論在形式還是意義方面,詞簇一般都具有其固定范式。事實上,詞簇在數量上雖然與詞匯差別巨大,但其在語言交流和寫作方面具有十分重要的意義。Hyland(2008:4-21)指出,詞簇是保持文章流利性和融合度的基石。Pawley & Syder(1983:191-226)指出,要想達到本族語者的語言使用水平,不僅要掌握一系列語法規(guī)則來衍生出無窮無盡的句子,同時也要去掌握一些約定俗成的句子和表達。對詞簇的掌握能顯示出一個人的語言能力,因為詞簇比單個詞更能體現(xiàn)語言信息和語義信息。
隨著全球化發(fā)展的進一步加劇,國際間學術交流和科學研究日益增多,很多中國研究者也正在用英文撰寫學術論文,旨在增強自身與世界的學術融合度。作為以英語為第二語言的使用者,中國英語學習者所使用的詞簇必定與以英語為母語的寫作者有所差別,并具備其獨特的特征。因此,本研究將借助現(xiàn)代化的分析軟件,采用定量與定性相結合的分析方法,將這些異同點描述和表現(xiàn)出來,以期對我國英語學習者提供有益的指導。
本研究通過自建大型中國學術英語論文語料庫,以過往較少研究的學術英語文本為研究對象,采用多特征、多維度的研究視角,定性與定量相結合的方法對比分析了中國學術英語文本中詞簇的頻數、結構類型等方面的特征。在依托語料庫以及詞簇有關理論的基礎上,借助現(xiàn)代化分析軟件,試圖找到以下問題的答案:中國學術研究者發(fā)表的英語學術論文中詞簇的分布和結構呈現(xiàn)何種獨特特點?
為了實現(xiàn)本研究的目的,我們自建了語料庫:中國學術英語論文語料庫來對中國學術英語論文中詞簇的使用特征進行全面的對比分析。本研究在對數據進行分析的研究過程中將選用Mike Scott設計的WordSmith Tools軟件,借助該軟件可以提取文本中的詞簇、統(tǒng)計詞的頻數、檢索各類型搭配等功能,并對提供以上結果的數據分析。在建設語料庫前對收集到的中國學術英語論文進行了先行處理,即只保留標題以及論文主體部分,刪除掉所有可能對研究數據客觀性產生影響的因素,從源頭上保證了所提取詞簇的純凈度。
本部分中,我們將以選定論文中所包含的所有單詞以及句子的平均長度值為指標來對語料庫整體的文本特征進行研究,并分別選擇了代表美國英語和英國英語整體使用水平的BROWN、LOB兩大權威語料庫當成參照語料庫。這兩個語料庫所包含的詞匯總量與中國學術英語論文語料庫(CCAED)均十分相近,都為百萬詞級別。因此,在與本研究所建立語料庫的可比性較高,對比結果參考意義較大。借助WordSmith強大的統(tǒng)計功能,本研究分別得出了以上各語料庫所包含所有單詞以及句子的平均長度值,具體統(tǒng)計結果如下表所示:
表1 三個語料庫單詞及句子平均長度值對比統(tǒng)計結果
從表1中的對比結果能夠清晰地看到,單詞及句子的平均長度值在本研究所選擇學術文本中的數值均高于參照語料庫BROWN和LOB中的對應數值。從數據對比結果的不同之處我們可以看出:由于CCAED中的文本皆是學術論文,而學術論文作為廣大研究者和學習者學術交流的主要媒介,其中必定使用了一定數量的各學科專業(yè)術語和專門詞匯;同時,為了保證所發(fā)表論文的客觀性和嚴謹性,學術論文中經常使用較多長度長的詞匯和難度大的復合句,以便對特定的現(xiàn)象、結果或者問題進行客觀嚴謹的闡釋說明。相比而言,BROWN和LOB中的文本來源則較為復雜,包含數量眾多的非學術性文本及口語部分,其總體詞匯難度相對小,句式復雜程度較低。因此,這兩類語料庫文本的差別正好解釋了為什么CCAED中單詞及句子的平均長度值皆高于容量相當的BROWN和LOB語料庫。Cortes(2004:397- 423)通過研究發(fā)現(xiàn),語篇的文章難度一般與其文本的詞長和句長的平均值成正比。因此,他的研究結論正好與本研究所得到的結果一致。由于本研究所選取的文本皆為學術論文,較其它一般類型文本難度值高,因此其單詞及句子的平均長度值比一般文本也都要大一些。
基于長期以來細致的研究,Biber在1999年從12個方面對語料庫中的詞簇進行了結構層面的分類。按照他的劃分方法,本研究統(tǒng)計了CCAED中4詞詞簇在這12大結構類型中頻數及所占百分比的情況,下表為本研究統(tǒng)計得到的相關數據:
表2 CCAED高頻4詞詞結構類型統(tǒng)計表
表2結果統(tǒng)計顯示,Biber所劃分的上述12種類型在CCAED所包含文本中都有所體現(xiàn)。在這12種結構劃分中,名詞短語+of短語片段出現(xiàn)頻率最高,達到1316次,超過了六分之一;被動動詞+介詞短語片段出現(xiàn)頻率為1197次,占到了約七分之一,位居第二;介詞短語+內置of短語片段出現(xiàn)了1137次,同樣占據七分之一左右,在這12種分類中位居第三;其它介詞短語片段出現(xiàn)次數為897次,占九分之一左右,位居第四;先行詞it+動詞短語/形容詞短語片段出現(xiàn)658次,排名第五。除去這5種出現(xiàn)頻率較高的結構類型之外,代詞/名詞短語+be(+...)的頻數僅為60,所占比例不到百分之一,在所有類型中出現(xiàn)頻率最低。
如果把這些結構類型重新按照詞性來分類的話,那么出現(xiàn)頻數最高的是動詞類詞簇(31.5%),占總體結構類型的三分之一左右;排在第二位的是介詞類詞簇(26.77%),占四分之一左右;位于第三位的是名詞類詞簇(22.04%),占五分之一左右。
那么出現(xiàn)以上分布情況大致可以歸結為以下原因:學術論文重在闡述論點、表述現(xiàn)象、介紹發(fā)現(xiàn)、分析數據,對語言客觀性的要求比較高,所以學術寫作者常用被動語態(tài)或無主語的句子來表達觀點,避免頻繁使用第一人稱,從而在文本方面增加了論文的可信度、客觀性和說服力?;谝陨显?,動詞類詞簇在CCAED中出現(xiàn)的頻數最高也不足為奇。在本研究中,介詞類詞簇數量排名第二的原因在于:由于英語中大量介詞的使用可以使文章結構顯得更加緊湊,論點表達更加凸顯邏輯,因而對邏輯性和結構性要求都很高的學術論文而言,介詞類詞簇自然得到了廣泛的使用。另外,CCAED中名詞類詞簇的使用頻數也頗高。在學術英語文本中,這類詞簇通常用來實現(xiàn)主題介紹、主體描述等功能。Biber早在1999年關于學術英語的相關研究中就發(fā)現(xiàn)名詞類詞簇較其它類別實詞詞簇出現(xiàn)比例高得多,是表達中不可或缺的詞簇類型,而本研究的相關發(fā)現(xiàn)剛好也印證了Biber結論的正確性。
研究者英語語言運用能力對于學術英語論文的寫作和發(fā)表具有極其重要的作用。長期以來,國內許多學術研究者的優(yōu)秀研究成果無法在國際知名期刊上發(fā)表,究其原因可謂眾多,但其中一個重要原因就在于受到學術論文寫作者自身英語運用能力的制約。隨著語料庫語言學領域研究的不斷深入和拓展,眾多研究者意識到要寫好學術英語論文,詞簇運用是基礎。在此背景下,本研究結果可對目前我國外語教學提供如下啟示:1.眾多研究表明,詞簇對區(qū)分語言使用者應用能力具有至關重要的作用。一個優(yōu)秀的學術英語寫作者,一定具備和英語本族語者相近的詞簇使用能力。因此,中國廣大英語研究者和學習者在撰寫英語論文時應充分認識到詞簇對論文寫作的功能和意義,有意識的樹立詞簇意識,從而提升語言運用能力。2.對國內英語教學而言,廣大教師應逐漸淡化以單詞為中心的傳統(tǒng)詞匯教學法,在教學中嘗試以詞簇為單位的詞匯教學法,將語言表達能力和寫作能力作為教學的主要目標。比如,教師可以依托教材對學生常用英語中的高頻詞簇進行統(tǒng)計、總結、歸納,在記憶的基礎上,讓學生熟悉并理解詞簇在語言表達方面的突出功能。