胡春雨
(廣東外語外貿(mào)大學(xué) 國際商務(wù)英語學(xué)院,廣州 510420)
在當(dāng)代語言學(xué)中,主題詞 (keywords)是一個較為模糊的概念,人們往往以隱喻的方式來理解它。意大利語言學(xué)家Marina Bondi認(rèn)為,“語言中的詞各司其職,其地位都是平等的,但在具體文本中,每個詞的地位卻又各不相同。文本中的所有詞都促成意義建構(gòu),但只有部分詞稱得上主題詞,即那些在文本中起著特殊作用的詞”(Bondi,2010:1)。在語料庫語言學(xué)中,只有那些通過“觀察語料庫”(observed corpus)與“參照語料庫”(reference corpus)進(jìn)行對比,使用頻率達(dá)到統(tǒng)計顯著性的詞才叫主題詞 (Scott&Tribble,2006)。需要指明的是,語料庫語言學(xué)研究中的主題詞不同于“文化關(guān)鍵詞”(Williams,1976),甚至不一定是影響文本主體思想的實(shí)義詞,因?yàn)檫@些主題詞主要靠頻數(shù)對比提取。
主題詞分析是語料庫語言學(xué)的核心技術(shù)之一,也常常是調(diào)查專用語料庫的出發(fā)點(diǎn)。就商務(wù)英語研究而言,主題詞分析具有兩大功能:幫助研究者界定商務(wù)英語詞匯并在此基礎(chǔ)上更好地開展商務(wù)英語詞匯的分類研究;幫助研究者找出話語軌跡,挖掘出商務(wù)語篇中隱藏的商務(wù)知識及體裁 (genre)特征,進(jìn)而更好地理解商務(wù)話語及商務(wù)交際的本質(zhì)。鑒于我們已經(jīng)探討過主題詞在商務(wù)英語詞匯研究中的作用 (胡春雨,2011),本文將重點(diǎn)探討主題詞分析在商務(wù)話語研究中的應(yīng)用,并指出開展此類研究時應(yīng)注意的問題。
主題詞的語料庫提取一般遵循以下幾個步驟。首先,根據(jù)研究目的,建立“觀察語料庫” (或“觀察文本”),并選擇合適的“參照語料庫”。參照語料庫一般為通用語料庫,其規(guī)模通常大于觀察語料庫。其次,使用語料庫軟件生成兩個分別基于觀察語料庫和參照語料庫的詞表。由于同一個單詞可能具有多種形式,研究者需要考慮使用語料庫的詞形還原 (lemmatization)功能,將語料庫中詞匯的屈折形式進(jìn)行歸并。譬如,把rise,rises,rose,risen,rising都?xì)w并到RISE中。第三代語料庫分析工具 (如 AntConc,WordSmith Tools等)內(nèi)嵌了詞形還原程序,但需要用戶提供一個用于詞形還原的詞表;第四代語料庫檢索工具 (如Sketch Engine)不但內(nèi)嵌詞形還原程序,還提供用于詞形還原的詞表,研究者只需根據(jù)自己的研究需求選擇Word或Lemma即可。最后,通過對比觀察語料庫和參照語料庫中詞語各自的頻數(shù)及兩個語料庫各自的規(guī)模 (參照表1),就可以把差異顯著的詞語提取出來。
表1 生成主題詞表所依賴的四組數(shù)據(jù)
差異的顯著性通過卡方 (chi-square或X2)檢驗(yàn)或?qū)?shù)似然比 (Log-likelihood ratio,簡稱LL)檢驗(yàn)來確定。X2(或LL)值越高,主題性越強(qiáng)。有時候,我們只需報道X2(或LL)值對應(yīng)的顯著水平的p值即可:p值越低,顯著性水平越高,判斷該詞是主題詞的把握就越大。
圖1 商務(wù)電郵中的主題詞
圖1是以Nelson(2000)所建百萬詞的BEC(Business English Corpus)子庫BEC_emails為觀察語料庫,以一億詞的BNC(British National Corpus)為參照語料庫,所得到的商務(wù)電郵主題詞截圖。其中,第3縱行的Freq.指主題詞在觀察語料庫中的頻數(shù),第4縱行的%指主題詞頻數(shù)在觀察語料庫所有詞中的百分比,第5縱行的RC Freq.指主題詞在參照語料庫中的頻數(shù),第6縱行的RC.%指主題詞頻數(shù)在參照語料庫所有詞中的百分比①。不難看出,在商務(wù)電郵中,除了使用一般電子郵件的常用詞 (dear,yours,sincerely,please等)外,還較多使用和商務(wù)相關(guān)的詞(companyname,registered,F(xiàn)AX,TEL,chamber,invoice等)以及幫助構(gòu)建企業(yè)和客戶關(guān)系的第一人稱代詞復(fù)數(shù) (our,we)。
主題詞分析技術(shù)也被用來提取核心主題詞表。核心主題詞 (key keywords)是指那些在多篇相關(guān)主題文本中以主題詞形式出現(xiàn)的詞。該詞出現(xiàn)的語篇數(shù)越多,關(guān)鍵性越強(qiáng)。圖2是筆者以BEC為觀察語料庫,以BNC為參照語料庫,所得到的商務(wù)英語核心主題詞的截圖。其中,排在第一位的#代表語料庫中的數(shù)字。在構(gòu)成商務(wù)英語語料庫的28個文本中,主題詞business出現(xiàn)的篇數(shù)要明顯高于其他主題詞,說明它與整個語料庫的主題有著更密切的聯(lián)系,因此是BEC的核心主題詞。觀察圖2中的核心主題詞不難發(fā)現(xiàn),除了business,company,customer,product等典型的商務(wù)類詞匯外,還有一些代詞 (如we,our,you)、情態(tài)動詞 (如will)等能體現(xiàn)商務(wù)話語語體特征的詞。進(jìn)一步的研究則需要深入到每一類商務(wù)文本中,從而發(fā)現(xiàn)最能體現(xiàn)該類商務(wù)文本體裁特征的核心主題詞。
圖2 商務(wù)英語中的核心主題詞及其聯(lián)想詞
聯(lián)想詞 (associates)是指和核心主題詞同現(xiàn)在多篇文本中的主題詞。比如business的聯(lián)想詞包括product,sales,financial,companies,#,customers,customer,company;company的聯(lián)想詞包括 our,financial,companies,product,customers,#,sales,business;而另一個核心主題詞market的聯(lián)想詞則包括 share,customers,sales,businesses,business,company,financial等。通過主題詞、核心主題詞及聯(lián)想詞,可以觀察分析商務(wù)英語詞匯群在商務(wù)話語中的功能。
商務(wù)話語是商業(yè)機(jī)構(gòu)開展商務(wù)活動所產(chǎn)生的口頭或書面語的總稱 (Bargiela-Chiappini,et al,2013:3)。商務(wù)話語研究受到會話分析、批評話語分析、語用學(xué)、人種志、體裁理論、組織行為學(xué)、系統(tǒng)功能語言學(xué)、認(rèn)知語言學(xué)、語料庫語言學(xué)等諸多學(xué)科的影響,具有典型的跨學(xué)科特征。語料庫語言學(xué)的三大核心技術(shù) (詞表分析、主題詞分析、索引分析)可以幫助研究者從不同側(cè)面挖掘商務(wù)話語中蘊(yùn)藏的語言信息及商務(wù)信息。限于篇幅,本文只從眾多的研究案例中選擇三個,重點(diǎn)介紹主題詞技術(shù)在商務(wù)話語研究中的作用。
公司使命陳述 (corporate mission statement)是企業(yè)的“理想自我”(ideal self),是企業(yè)品牌形象的內(nèi)部和外部投射。使命陳述型文本常常采用這樣的標(biāo)題:“Our Mission”、“Our Vision”、“Message from the CEO”、“The essence of our company”、“Strategy”等。盡管不同公司的使命陳述存在不同,但因?yàn)樗鼈児蚕硐嗤慕浑H目的而被視作同一體裁。這些交際目的中最為重要的是:對企業(yè)內(nèi)外的利益相關(guān)者(stakeholders)傳遞企業(yè)的抱負(fù)、核心價值 (Fox&Fox,2004:31)。實(shí)現(xiàn)這一交際目的的決定性參數(shù) (defining parameter)通常包括:最高級詞匯 (如“the best customer experience”),absolute quantifiers(“each,”“everywhere”),第一人稱復(fù)數(shù)“we”和道義情態(tài)(“it has been necessary to do so”)(Fox& Fox,2004;Swales& Rogers,1995)。公司使命陳述的體裁特性決定了主題詞分析是研究該類文本的良好切入點(diǎn)。
Koller(2009:51-52)從財富500強(qiáng) (Fortune Global 500)網(wǎng)站中收集2003年的前50強(qiáng)和后50強(qiáng)公司的使命陳述,建立起一個29925詞的小型語料庫。她把所建語料庫上傳到語料庫工具Wmatrix平臺后,選擇BNC樣本作為參照語料庫,生成2012個主題詞。過濾掉公司名稱等專有名詞,最能代表公司核心概念的前15個詞是:innovation,respect,excellence,integrity,performance,trust,teamwork,responsibility,growth,committed/commitments,creativity,competitive,transparency,professionalism,fairness。進(jìn)一步的研究表明,這些主題詞往往用來進(jìn)行積極評價,如:
(1)We will invest in those businesses that promise the greatest value growth.(Continental AG)
(2)The exceptional quality of our workforce is a valuable competitive edge.(Mobil)
企業(yè)決策者經(jīng)常使用BRANDS ARE LIVING ORGANISMS/PEOPLE這樣的隱喻模式。這些詞代表公司話語中居主導(dǎo)地位的價值,因此也是公司品牌人性化 (personality)的特征。
商務(wù)信函是另一類較為常見的商務(wù)文本。主題詞分析對商務(wù)信函中作者-讀者關(guān)系的把握方面很重要。主題詞分析和體裁分析的聯(lián)合使用,提供了理解職業(yè)語境下語言使用特征的強(qiáng)有力的工具。Scott&Tribble(2006:109-129)通過使用小型商務(wù)信函語料庫,探討主題詞分析和語步分析的結(jié)合,這種分析法可以有力地幫助研究者理解語言在專業(yè)背景下的使用狀況。他們首先對商務(wù)信函文本 (信件和傳真)進(jìn)行體裁分析,辨認(rèn)出讀者和寫者之間的關(guān)系。這種關(guān)系可以用以親近 (close)與疏遠(yuǎn) (distant)為橫軸、內(nèi)部 (internal)與外部 (external)為縱軸的坐標(biāo)系來表達(dá)。不同的商務(wù)信函文本根據(jù)其寫者/讀者的關(guān)系而分別被標(biāo)注為“內(nèi)部-親近”、“內(nèi)部-疏遠(yuǎn)”、“外部-親近”、“外部-疏遠(yuǎn)”,并被歸入坐標(biāo)軸四個不同的象限中,如圖3所示:
圖3 商務(wù)信函的分類 (Scott&Tribble,2006:111)
其次,生成商務(wù)信函的主題詞表。考慮到主題詞hope的主題性較高且該詞在構(gòu)建寫者/讀者之間親近遠(yuǎn)疏關(guān)系中的特殊地位,Scott&Tribble對hope在不同類別信函中的用法進(jìn)行了更為深入的探討。圖4展示的是寫給關(guān)系較為疏遠(yuǎn)的讀者的一封信 (其標(biāo)簽為EXT-DIST),其交際目的是‘拒絕’。信函的主體部分 (body)分為三個語步:語步1是對語境的陳述 (statement of context),語步2是‘拒絕’(rejection),語步3則是‘交流渠道的保持’ (channel maintainer)。不難看出,hope后的補(bǔ)語從句是帶有關(guān)系詞that的:
圖4 “外部-疏遠(yuǎn)”類信函示例 (Scott&Tribble 2006:113)
圖5展示的是寫給關(guān)系較為親近讀者的一封信函 (其標(biāo)簽為EXT-CLOSE),其交際目的盡管是也‘拒絕’,但hope之后并不使用that。
圖5 “外部-親近”類信函示例 (Scott&Tribble 2006:114)
總之,Scott和Tribble的研究表明:無論信函屬于哪種類型,主題詞hope都會出現(xiàn)在交流渠道的保持語步中;關(guān)系疏遠(yuǎn)時,使用帶有that的補(bǔ)語從句以保持和讀者之間的距離;關(guān)系較為親近時,使用省略that的補(bǔ)語從句會讓相關(guān)的商務(wù)人士感到舒適。
口頭商務(wù)話語語料較之于企業(yè)使命陳述、商務(wù)信函等書面語料的收集要困難得多,因而此類研究的數(shù)量也要少得多,且主要集中在對商務(wù)會議語言的研究中。商務(wù)會議是企業(yè)的命脈,是企業(yè)得以存續(xù)的重要交流方式 (Bargiela-Chiappini&Harris,1997:6)。商務(wù)會議的研究在過去的很多年內(nèi)主要從管理學(xué)的視角切入,近年來也逐步出現(xiàn)了語言轉(zhuǎn)向 (Clarke,et al,2012),學(xué)者們從跨文化交際、英語作為商務(wù)通用語、商務(wù)會議的語用特征和語用策略等多種視角開展了豐富多彩的研究。從語料庫語言學(xué)的視角切入的商務(wù)會議研究當(dāng)首推英國諾丁漢大學(xué)的語言學(xué)及應(yīng)用語言學(xué)團(tuán)隊(duì)②,主要成員包括 McCarthy,Carter,O'Keeffe,Handford等。該團(tuán)隊(duì)建立了百萬詞的“劍橋與諾丁漢商務(wù)英語語料庫 (Cambridge and Nottingham Corpus of Business English,CANBEC③),開展了一系列卓有成就的研究 (Mc-Carthy& Handford,2004;O'Keeffe,et al,2007),并最終出版了專著The Language of Business Meetings(Handford,2010)。下文將擇其要對該團(tuán)隊(duì)的研究給以介紹。
為了對比商務(wù)口語和學(xué)術(shù)口語、日常會話的區(qū)別,O'Keeffe,et al(2007)分別提取了三類語料庫的主題詞。表2是CANBEC和ACAD(學(xué)術(shù)口語語料庫)的前50主題詞對比。
O'Keeffe,et al(2007:209)注意到CANBEC中的主題詞有以下特征:
1)在CANBEC的前50個主題詞中,第一人稱復(fù)數(shù)代詞 (如we/us/our)非常凸顯,而第一人稱單數(shù)代詞I和第二人稱代詞you都沒有出現(xiàn)在CANBEC的前50個主題詞中。第一和第二人稱代詞在ACAD中都不是主題詞。
2)Need在CANBEC的主題詞表中排名第9,它卻不是ACAD的主題詞。
表2 商務(wù)口語與學(xué)術(shù)口語中的前50個主題詞(O'Keeffe,et al,2007:209)
3)CANBEC中有很多和商務(wù)相關(guān)的 (business-oriented)主題詞 (如 custom(s),sales,product(s),order(s),market(s/ing),company,stock等)。
4)CANBEC的前50個主題詞中包含so和problem,這兩個詞沒有出現(xiàn)在ACAD中。
O'Keeffe,et al(2007:210)把主題詞表看作一個快照(snapshot),研究者不但可以從中發(fā)現(xiàn)與領(lǐng)域相關(guān)的詞匯(如 prices,customs,meetings,paperwork,examples,facts,interpretations等),還可以發(fā)現(xiàn)不同領(lǐng)域文本在功能詞使用中的傾向性 (如第一人稱代詞we,us,our、情態(tài)動詞need等)④。他們認(rèn)為,來自CANBEC的主題詞以及它們所在的語境可以展示口頭商務(wù)話語的三個特征:1)分享日??谡Z交際的特征;2)分享機(jī)構(gòu)話語的一些特征;3)具有日常會話和學(xué)術(shù)話語不具備的特征,這種特征體現(xiàn)的是一種特殊的語域 (register)或體裁,該體裁可通過觀察參與人士的關(guān)系、認(rèn)同感及企業(yè)文化的創(chuàng)造來描述。
O'Keeffe,et al(2007:215)發(fā)現(xiàn),主題詞problem(s)在CANBEC中的頻率是其在另外兩個語料庫ACAD和CONV(日常會話語料庫)中的4倍。他們認(rèn)為,該詞在CANBEC中的高頻,源于商務(wù)會議話語的固有特質(zhì),即:商務(wù)會議召開的主要目的是探討并解決存在的問題。問題必須被評估并按重要性排序,這一點(diǎn)也可以從CANBEC中反復(fù)出現(xiàn)的語塊 (如the main problem,the other problem,a big problem,the biggest problem,the only problem)中得以體現(xiàn)。在評估和探討問題的解決之道時,與會者往往可以使用玩笑、故事、習(xí)語、隱喻等多種方式。O'Keeffe,et al借用以下會話,來分析習(xí)語和隱喻在商業(yè)人士看待問題時的態(tài)度:
[以下商業(yè)會談的主要參與者為S1(一家IT公司的銷售人員)和S2(潛在客戶),他們在討論計算機(jī)服務(wù)器問題]
S1:Erm as you know with application problems you just it it's+
S2:Yeah.
S1:+it's it's
S2:It's a nightmare.
S1:Yeah.[sighs]
S2:Sometimes the experts don't know.
[laughter]
S1:Yeah exactly.But it can be a real+
S2:Okay.
S1:+er can of worms.So.[inhales]
...[6 mins]
S2:+then if there is a problem and it's irretrievable they lose a day's transactions.
S3:Yeah.
S1:Yeah.Yeah.Which you can't+
S2:And that's a nightmare.
S1:Yeah.
...[20 mins]
S2:But we don't get the hosting+
S1:Mm.
S2:+on this particular customer because they we weren't offering a credible twenty four by seven+
S1:Yeah.Yeah.
S2:+erm support.
S1:Sure.
S2:And doing anything on their site is a complete nightmare+
S1:Mm.
...[20 secs]
S2:Because they're running something like sixty sites on one machine.
S1:Yeah.
S3:Wow.
S2:But but it it just is a nightmare.
不難看出,會議參與人員對問題的不同態(tài)度:S1(銷售人員)把problem稱作can of worms,而S2(客戶)卻把problem隱喻為“噩夢” (nightmare)。這種隱喻和習(xí)語的使用反映了商務(wù)交際的特征。
本文介紹了主題詞表及核心主題詞表的語料庫提取技術(shù),并重點(diǎn)綜述了該技術(shù)在三類商務(wù)話語 (公司使命陳述、商務(wù)信函、商務(wù)會議)中的應(yīng)用。不難看出,主題詞技術(shù)本質(zhì)上是計算機(jī)程序把所研究的觀察語料庫分割成詞表,然后和來自參照語料庫的詞表對比,從而把巨量文本分解成很簡單的型式,展現(xiàn)其內(nèi)在的規(guī)律。在商務(wù)話語研究中,主題詞往往體現(xiàn)商務(wù)文本的體裁特征及文本的命題內(nèi)容,是文本意義的重要識別因素,可以促進(jìn)對文本主要觀點(diǎn)的理解。
需要強(qiáng)調(diào)的是,在分析商務(wù)話語的語言特征時,研究者不能只局限于主題詞分析,因?yàn)椤耙粋€主題詞表只提供給研究者語言型式,為了回答特殊的研究問題,研究者必須進(jìn)行深入的闡釋”(Baker,2004:348)。只有把主題詞放到其所產(chǎn)生的上下文語境并對定量的語言型式作定性研究(如體裁分析、會話分析或批評話語分析),才能透過詞匯現(xiàn)象看到話語的本質(zhì),把研究推向深入。此外,考慮到主題詞技術(shù)往往會產(chǎn)生太多的主題詞,研究者也可把主題性分析從主題詞拓展到主題語義域 (Rayson,2008),通過對主題詞自動歸類來減少研究者的分析負(fù)荷。目前這類研究在商務(wù)話語領(lǐng)域尚不多見 (Afida,2007),但將是未來研究的趨勢。
注釋:
①兩個語料庫的詞次不可能完全一樣,所以比較的它們的百分比,然后再看百分比的差別有無顯著性意義。
②此類研究在Bargiela-Chiappini&Harris(1997)中已有所體現(xiàn),該研究的語料來自英國和意大利的18個小時的商務(wù)會議錄音。此外,Poncini(2004)所建成的企業(yè)間會議語料庫也有一定影響力。
③該語料庫收集了包括對英國、歐洲大陸以及日本等多個國家和地區(qū)26家企業(yè)64次商務(wù)會議的全部錄音文字(912734個單詞)。會議類型多樣、規(guī)模不一,既包含企業(yè)間會議,也包含企業(yè)內(nèi)部會議;226與會人員中的80%母語為英語,且多數(shù)為中、高層經(jīng)理。
④后續(xù)研究發(fā)現(xiàn)主題詞we're,we've在企業(yè)外部會議中的使用頻率遠(yuǎn)高于企業(yè)內(nèi)部會議(Handford,2010:108)。
胡春雨.2011.語料庫與商務(wù)英語詞匯研究[J].廣東外語外貿(mào)大學(xué)學(xué)報(2):55-58.
Afida M A.2007.Semantic Fields of Problem in Business English:Malaysian and British Journalistic Business Texts[J].Corpora,2(2):211-239.
Baker P.2004.Querying Keywords[J].Journal of English Linguistics,32(4):346-359.
Bargiela-Chiappini F,Harris S T.1997.Managing Language:The Discourse of Corporate Meetings[M].Amsterdam:John Benjamins.
Bargiela-Chiappini F,C Nickerson,B Planken.2013.Business Discourse(2nded)[M].Palgrave Macmillan.
Bondi M.2010.Perspectives on Keywords and Keyness:An Introduction[C].∥Bondi M,M Scott(eds.).Keyness in Texts.Amsterdam:John Benjamins:1-18.
Clarke I.,Kwon W.& Wodak R.2012.A Context-sensitive Approach to Analyzing Talk in Strategy Meetings[J].British Journal of Management,23(4):455-473.
Fox R,F(xiàn)ox J.2004.Organizational Discourse:A Language-Ideology-Power Perspective[M].Westport,CT/London:Praeger.
Handford M.2010.The Language of Business Meetings[M].Cambridge:CPU.
Koller V.2009.Cutting Across the Senses:Imagery in Wine Speak and Audiovisual Promotion[C].∥Forceville,C & Eduardo Urios-Aparisi,Multimodal Metaphor.Berlin/New York:Mouton de Gruyter:45-73.
McCarthy M J,Handford M.2004."Invisible to us":A Preliminary Corpus-Based Study of Spoken Business English[C]∥Connor U,and Upton T.(eds.)Discourse in the Professions.Perspectives from Corpus Linguistics[C].Amsterdam:John Benjamins,167-201.
Nelson M.2000.A Corpus-based Study of Business English and Business English Teaching Materials[D].Unpublished PhD Thesis.Manchester:University of Manchester.
O'Keeffe A,McCarthy M,Carter R.2007.From Corpus to Classroom:Language Use and Language Teaching[M].Cambridge:Cambridge University Press.
Poncini G.2004.Discursive Strategies in Multicultural Business Meetings[M].Bern:Peter Lang.
Rayson P.2008.From Key Words to Key Semantic Domains[J].International Journal of Corpus Linguistics,13(4):519-549.
Scott M,Tribble C.2006.Textual Patterns:Key words and Corpus Analysis in Language Education[M].Amsterdam:John Benjamins.
Swales J M,Rogers P.1995.Discourse and the Projection of Corporate Culture:The mission statement[J].Discourse and Society,6(2):223-242.
Williams R.1976.Keywords:A Vocabulary of Culture and Society[M].London:Fontana.