李艷芳,郭愛萍
(1.喀什大學(xué)外國語學(xué)院,喀什 844000; 2.太原理工大學(xué)外國語學(xué)院,太原 03000)
動(dòng)態(tài)變化是語言的本質(zhì)特征[1]。J.Ahmad強(qiáng)調(diào),科技論文應(yīng)該避免表達(dá)情感信息的詞匯或者其他不正式的語言成分,是一種典型要求文本正式度的文體[2]。然而,Hyland研究發(fā)現(xiàn)學(xué)術(shù)論文正式度呈現(xiàn)降低趨勢(shì),尤其是在自然科學(xué)領(lǐng)域[3]。語言的這種態(tài)勢(shì)促使我們思考中國作者科技論文文本正式度。本研究通過自建中美作者科技論文語料庫,嘗試比較二者在文本正式度方面的差異,為中國學(xué)者寫出合乎科技論文行業(yè)規(guī)范的論文,提出合理化建議,同時(shí)為語料庫視角下文本正式度研究提供多維研究視角。
正式度是一個(gè)相對(duì)概念,往往由語言所產(chǎn)生的情境以及說話者的個(gè)人特點(diǎn)所決定,衡量正式度的標(biāo)準(zhǔn)是情境依賴程度、語言表達(dá)清晰度及介入性表達(dá)[4]。
關(guān)于科技論文正式度,國內(nèi)外研究主要集中在歷時(shí)研究、對(duì)比研究和整體研究。其中,不同學(xué)科英語學(xué)術(shù)論文歷時(shí)研究發(fā)現(xiàn),論文正式度呈現(xiàn)降低的趨勢(shì)[5];對(duì)比研究主要集中在英語本族語和非英語國家;整體研究體現(xiàn)在從正式度出發(fā)概括說明科技論文語體特征。
正式度的衡量指標(biāo)主要有三個(gè)維度:一是詞匯,如詞匯密度、基于詞性文本正式度形容詞的密度;二是通過句法和語法衡量正式度;三是多維分析。Graesser研究結(jié)果表明,文本正式度增加意味著詞匯抽象程度、句法復(fù)雜度、指稱銜接和深層銜接的增加,而文本的敘事性不強(qiáng)。在此基礎(chǔ)上,給出了計(jì)算文本正式度的方法,即Formality=[referential cohesion+deep cohesion-narrativity-syntactic simplicity-word concreteness]/5[6]。
正式度是一個(gè)復(fù)雜的概念,需采用多維、多角度的方法衡量,因此本研究將基于語料庫,采用定量研究的方法,利用Coh-Metrix,以中美作者科技論文為研究對(duì)象,通過分析二者在敘事性、指稱銜接、句法難易度、詞匯體性和深層銜接這五個(gè)維度下文本正式度差異,為語料庫視角下文本正式度的研究提供一個(gè)多維研究視角。
本研究主要回答兩個(gè)問題:其一,中美作者在語體正式度方面有沒有差異,如果有差異,具體體現(xiàn)在哪些指標(biāo)上;其二,造成中美作者語體正式度差異的原因是什么。
本研究的語料選自權(quán)威性核心期刊《Nature》,語料時(shí)間范圍為2014—2016年,選取中國作者科技論文55篇,美國作者50篇,總詞數(shù)為400426個(gè),將中國作者語料庫命名為“Chinese Speaker Corpus”,簡(jiǎn)稱CSC;美國作者語料庫命名為“Native Speaker Corpus”,簡(jiǎn)稱NSC。
將text格式的文本導(dǎo)入Coh-Metrix進(jìn)行分析,提取與文本正式度有關(guān)的50項(xiàng)指標(biāo),使用SPSS20.0進(jìn)行描述性統(tǒng)計(jì)分析,對(duì)相關(guān)數(shù)據(jù)進(jìn)行獨(dú)立樣本T檢驗(yàn),最后對(duì)存在顯著性差異的語言特征逐一分析。
深層銜接體現(xiàn)句子和小句間的連接關(guān)系;指稱銜接作為銜接手段的一種,對(duì)語篇的連貫起著重要的作用,反映的是相鄰句子間和所有句子詞匯重疊情況;句法簡(jiǎn)約性通過句子長度、因果動(dòng)詞和句法結(jié)構(gòu)相似性體現(xiàn)句子難易程度;詞匯具體性指詞匯的意向、豐富性和具體性表;敘事性語言特點(diǎn)生動(dòng)形象,文本句法結(jié)構(gòu)簡(jiǎn)單。由表1可知,中國的深層銜接、指稱銜接比美國高,美國的句法簡(jiǎn)約性、詞匯具體性和敘事性得分比中國高。由此可見,中國正式度比美國高。
表1 各維度得分及總體正式度
1.敘事性維度分析
敘事性維度指的是文本是故事性的而非信息類。敘事性文本中詞匯熟悉程度較高、高頻詞語多、句法結(jié)構(gòu)簡(jiǎn)單。
顯著性差異指標(biāo)包括CELEX所有詞詞頻對(duì)數(shù)、名詞短語前修飾語、詞性最小編輯距離和第一人稱單數(shù)。由表2可知,中國的所有詞的詞頻的對(duì)數(shù)比美國高,且存在統(tǒng)計(jì)學(xué)上的顯著性差異(P=0.04<0.05),由此說明中國作者的高頻詞匯使用比較多,而罕見詞匯使用比較少。
名詞短語前修飾語體現(xiàn)的是對(duì)中心詞語的修飾、限制、補(bǔ)充和說明作用。由表2可知,中國比美國高且存在顯著差異(P=0.04<0.05),究其原因主要是受漢語思維的影響,漢語習(xí)慣用“的”來體現(xiàn)定語,而英語中更加傾向于使用后置修飾語[7]。
第一人稱代詞單數(shù)結(jié)果顯示美國比中國多,作者采取一些評(píng)價(jià)性的語言表達(dá)自己的態(tài)度、觀點(diǎn)以及對(duì)他人觀點(diǎn)的認(rèn)同程度來體現(xiàn)自己的立場(chǎng),文本的互動(dòng)性就會(huì)增強(qiáng),可見中國的文本正式度偏高、互動(dòng)性不高[8]。
Coh-Metrix基于最小編輯距離提供了衡量語義和句法相似性的指標(biāo),由表2可知,美國比中國高,意味句法相似度更高,也就是句法結(jié)構(gòu)更加簡(jiǎn)單[6],而句法越簡(jiǎn)單,文本的正式度就越低,由此推知,中國的文本正式度比美國高。
表2 敘事性維度
2.指稱銜接
指稱銜接是語篇中的指代成分與所指對(duì)象之間的相互解釋關(guān)系,可通過簡(jiǎn)短的指代形式表達(dá)上文已經(jīng)提到的內(nèi)容,從而使語篇銜接更加連貫[9]。
指稱銜接各指標(biāo)的差距不明顯,由表3可知,實(shí)詞重疊和論元重疊中國和美國基本一致,但是反映詞匯多樣性的兩個(gè)指標(biāo)MTLD詞匯多樣性和VOCD詞匯多樣性存在顯著性差異(P=0.028<0.05,P=0.014<0.05),因此,中國作者的詞匯多樣性比美國作者低,在詞匯的深度以及靈活使用方面遠(yuǎn)不如美國作者。詞匯多樣性高,意味著文本詞匯使用豐富多樣,詞匯重疊的概率比較小,因此反映指稱銜接的名詞重疊、實(shí)詞重疊指標(biāo)比較低。
指稱銜接維度下存在顯著性差異的是詞匯的最小編輯距離,指將一個(gè)字符串轉(zhuǎn)化成另一個(gè)字符串所需要的最小編輯操作次數(shù),反映的是句子間的相似度。詞匯的最小編輯距離和指稱銜接和語義銜接相關(guān)性很高,反映的是句法的復(fù)雜度。由表3可知,中國作者的最小編輯距離比美國作者低,說明中國作者的句法相似度高,句法的復(fù)雜度低,從這個(gè)角度也能反映出中國作者的正式度比美國作者高[10]。
表3 指稱銜接維度
3.句法簡(jiǎn)約性
句法簡(jiǎn)約性意味著文本句子長度短、詞匯少、句法間的相似度高。復(fù)雜的句法結(jié)構(gòu)中往往有很多的嵌入結(jié)構(gòu)。難易度可以通過句子長度、謂語動(dòng)詞前平均詞數(shù)和段落間句子相似性體現(xiàn)。
句法簡(jiǎn)約性維度中存在顯著性差異的指標(biāo)有因果動(dòng)詞、段落間句子相似性和謂語動(dòng)詞前平均詞數(shù)。因果動(dòng)詞可以連接句子成分,使句子表達(dá)因果關(guān)系。由表4可知,中國的因果動(dòng)詞比美國少,究其原因主要是中美思維方式和文化的不同,英語中通過因果連接詞或者因果動(dòng)詞來表達(dá)因果關(guān)系,而漢語是通過語意和語句內(nèi)關(guān)系的領(lǐng)悟來實(shí)現(xiàn)詞語和語句間的因果連接。
段落間句子的相似性反映文本句法結(jié)構(gòu)的一致性,句子的相似性高說明句法結(jié)構(gòu)簡(jiǎn)單、文本正式度不高,更容易被讀者加工理解。由表4可知,中國的句法結(jié)構(gòu)的相似度高,可能存在的原因是中國作者作為二語習(xí)得者在句法的靈活變換方面還有待提高。
表4 句法簡(jiǎn)約性
謂語動(dòng)詞前的平均詞數(shù)可以反映句法復(fù)雜度。讀者對(duì)于句法結(jié)構(gòu)復(fù)雜的文本的理解比較困難,當(dāng)文本中謂語動(dòng)詞前的平均詞數(shù)、名詞短語前的修飾語、句子的長度都比較小的時(shí)候,文本的句法結(jié)構(gòu)才容易被人們加工理解[11]。表4中的結(jié)果顯示,中國的謂語動(dòng)詞前的平均詞數(shù)比美國高,由此可以推斷中國的句法結(jié)構(gòu)比較復(fù)雜,因此中國的文本正式度比美國的高。
4.詞匯具體性
詞匯的具體性指的是詞匯意向性、豐富性和具體性。具體的詞匯通常會(huì)喚醒人們的心理表征,激發(fā)讀者的記憶,從而加深對(duì)詞匯的理解和記憶。意向性指的是一個(gè)詞在腦海中的心理想象的構(gòu)建能力,具體性指的是詞匯的具體程度,豐富性指一個(gè)詞匯和其他詞匯的聯(lián)想能力。
由表5可知,中美在詞匯的意向性、具體性和豐富性這三個(gè)指標(biāo)上雖不存在顯著性差異,但整體來看,中國在這三個(gè)指標(biāo)上都比美國低。科技論文詞匯專業(yè)性強(qiáng)、詞匯表達(dá)準(zhǔn)確清晰,中國的詞匯具體性維度得分低,說明中國的詞匯抽象程度高,因此文本的正式度就相對(duì)美國要偏高一些。
表5 詞匯具體性
5.深層銜接
深層銜接指的是句子和小句的邏輯關(guān)系,使讀者能夠準(zhǔn)確把握文中邏輯關(guān)系進(jìn)而預(yù)測(cè)文章結(jié)構(gòu)。主要通過因果連接詞、邏輯連接詞、所有連接詞和時(shí)間連接詞表達(dá)文章邏輯關(guān)系。
由表6可知,中國的邏輯連接詞、所有連接詞、時(shí)間連接詞、目的小品詞和因果小品詞都比美國低,說明中國的深層銜接維度方面不及美國作者,但是不存在顯著性差異,唯一存在顯著性差異的是因果連接詞(P=0.042<0.05)。因果連接詞指的是語義上表示因果關(guān)系的詞語,在促進(jìn)中美兩國作者科技論文的語篇銜接上有重要作用[12],究其原因主要是中國學(xué)者作為二習(xí)得者偏向于使用簡(jiǎn)單句型,而本族語者更多使用復(fù)合句型,所以他們把原本可以用關(guān)系代詞和關(guān)系副詞表示的邏輯關(guān)系用連接詞來體現(xiàn),所以連接詞的數(shù)量整體偏多。
表6 深層銜接
本篇研究采用文本分析工具Coh-Metrix,從敘事性、深層銜接、指稱銜接、詞匯的具體性、句法的簡(jiǎn)約性這五個(gè)維度考察了中美作者科技論文語體正式度差異。研究結(jié)果表明,中國的科技論文的語體正式度比美國作者高,具體體現(xiàn)在名詞短語前的修飾語、CELEX所有詞詞頻對(duì)數(shù)、詞性的最小編輯距離、第一人稱代詞復(fù)數(shù)、詞匯最小編輯距離、VOCD、MTLD詞匯多樣性、因果動(dòng)詞、因果連接詞、段落間句子的相似性和謂語動(dòng)詞前的平均詞數(shù)這些指標(biāo)上。動(dòng)態(tài)變化是語言的本質(zhì)特征,所以,作為二語習(xí)得者的中國學(xué)者應(yīng)該意識(shí)到科技論文語體的變化,以本族語者英語為藍(lán)本,緊隨語體變化的趨勢(shì),使自己的語言表達(dá)更接近于本族語者。