国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于語料庫的學(xué)術(shù)論文摘要中的多詞序列研究

2017-12-01 05:36:52鄧林李娜于艷英
關(guān)鍵詞:詞塊學(xué)術(shù)論文介詞

鄧林 李娜 于艷英

(西安石油大學(xué),陜西 西安 710065)

基于語料庫的學(xué)術(shù)論文摘要中的多詞序列研究

鄧林 李娜 于艷英

(西安石油大學(xué),陜西 西安 710065)

以石油類英語學(xué)術(shù)論文為例,通過自建小型語料庫分析學(xué)術(shù)論文摘要中的多詞序列。結(jié)合基于頻率和搭配的方法提取石油類學(xué)術(shù)論文摘要中的多詞序列,既考慮其高頻頻次,又考察其語義完整性,對學(xué)術(shù)英語教學(xué)和教材編撰具有現(xiàn)實(shí)意義和實(shí)用價(jià)值。石油類學(xué)術(shù)論文摘要中的多詞序列有6大類:名詞類、介詞類、動詞類、主謂完整類、狀語類及前置it類。高頻多詞序列的使用體現(xiàn)了學(xué)術(shù)語篇的客觀性。

石油類;學(xué)術(shù)論文;摘要;提??;多詞序列

0 引言

摘要是學(xué)術(shù)論文的重要組成部分,既可以與正文共同構(gòu)成完整的學(xué)術(shù)論文語篇,又可以單獨(dú)構(gòu)成獨(dú)立語篇。摘要可以方便讀者從大量的文獻(xiàn)中快速查找、檢索相關(guān)論文所研究的問題及其方法、結(jié)果等,開闊學(xué)術(shù)視野,提高科研效率,是學(xué)術(shù)交流和信息傳播的重要手段。

按照英語本族語者的思維習(xí)慣和寫作風(fēng)格撰寫英文摘要,是二語學(xué)習(xí)者的學(xué)術(shù)成果快速獲取同行關(guān)注的有效手段。學(xué)術(shù)論文摘要中存在大量的多詞序列(又稱詞塊),這些多詞序列體現(xiàn)了學(xué)術(shù)期刊的偏好和摘要本身的文本結(jié)構(gòu)特點(diǎn)。對于希望達(dá)到本族語者使用本族語的流利性和準(zhǔn)確性的二語學(xué)習(xí)者來說,熟練使用多詞序列是其語言水平和學(xué)術(shù)能力的重要表現(xiàn)。反復(fù)使用這些多詞序列是寫作成熟的標(biāo)志,而缺少這些多詞序列則是新手的特點(diǎn)(Haswell,1991)。[1]

目前,對學(xué)術(shù)論文詞塊的研究主要包括本族語者和非本族語者詞塊對比研究(胡新,2015[2];潘璠,2016[3]等)、基于語類的詞塊研究(李夢驍,劉永兵,2016[4];李國敬,曹雁,2015[5];Cai,2016[6];Cortes,2013[7]等)以及基于專業(yè)學(xué)科的詞塊研究(王芙蓉, 王宏俐,2015[8];Cotos et al.,2017[9];Hyland,2008[10]等),但鮮有研究涉及石油類的學(xué)術(shù)論文英文摘要中的詞塊。

1 多詞序列

多詞序列又稱預(yù)制語塊、詞塊等,國外對其研究最早可以追溯到20世紀(jì)70年代。最初多詞序列被稱為預(yù)制語塊(prefabricated chunks),用來描述重復(fù)出現(xiàn)的詞匯組合現(xiàn)象。目前,學(xué)術(shù)界對詞塊的界定和提取方法還存在一定分歧。

以Biber為代表的學(xué)者們采用基于頻率的方法抽取和研究詞塊,認(rèn)為詞塊是一定語域中連續(xù)共現(xiàn)的詞串或詞叢,頻率是界定詞塊的基礎(chǔ),詞塊的結(jié)構(gòu)和語義通常并不完整。Biber等人(1999)[11]利用計(jì)算機(jī)軟件程序,基于頻率提取口語及書面語中的高頻詞塊,認(rèn)為詞塊必須達(dá)到每百萬詞10頻次,并且必須至少出現(xiàn)在5個(gè)不同文本中。Biber(2004)[12]在提取大學(xué)課堂用語和教材中的詞塊時(shí)采用了更為嚴(yán)格的頻率標(biāo)準(zhǔn),要求詞塊必須達(dá)到每百萬詞40頻次。

也有學(xué)者認(rèn)為,基于頻率提取的高頻詞塊常常因?yàn)榻Y(jié)構(gòu)、語義不完整而不具備教學(xué)價(jià)值,而且采用這種方法會“摧毀直覺認(rèn)為相關(guān)的不同詞塊間的區(qū)別特征”(Simpson-Vlache amp; Ellis,2010[13])。例如,像“on the other hand”和“at the same time”這樣的詞匯序列明顯比“to do with the”和“I think it was”這樣的序列在心理語言層面更為顯著,但是基于頻率的界定卻認(rèn)定這些詞塊地位相當(dāng)。對詞塊的界定只有結(jié)合頻率標(biāo)準(zhǔn)、學(xué)習(xí)者及教學(xué)因素才能使提取的詞塊具有實(shí)用價(jià)值。Simpson-Vlache和Ellis認(rèn)為詞塊的識別、界定必須基于頻率、覆蓋范圍、互信息值并參考教學(xué)者的觀點(diǎn)。此外,基于頻率的詞塊提取方法提取的只能是連續(xù)出現(xiàn)的詞匯序列,而忽略非連續(xù)式出現(xiàn)卻有相對完整語義的詞塊,如“this is det (determiner)+ NP(Noun phrase)”,而這樣的短語搭配在學(xué)術(shù)語篇中大量存在。因此詞塊的界定還要考慮類連接和詞語搭配。

本研究認(rèn)為詞塊的界定和提取應(yīng)基于頻率,并考慮其類連接和詞語搭配。既要保證提取的詞塊出現(xiàn)頻率高,又要確保其教學(xué)價(jià)值。本文采用多詞序列(Multi-word sequences)這個(gè)術(shù)語,因?yàn)槎嘣~序列所指更全面,不僅包括詞匯完全填充的結(jié)構(gòu)(filled sequences),也包括詞匯部分填充的抽象結(jié)構(gòu)(partially-filled sequences),如“NP claim that (det + n + VP)”。 而且多詞序列這個(gè)術(shù)語語義中立,為當(dāng)代語言學(xué)的學(xué)者們廣泛接受。

Wray(2002)認(rèn)為,詞塊是“連續(xù)或者不連續(xù)的話語片段,作為整體儲存在大腦中;出現(xiàn)頻率高,不受語法限制”。[14]以此為基礎(chǔ),本文將多詞序列操作定義為:多詞序列指語篇中經(jīng)常同時(shí)出現(xiàn)的三次及以上的連續(xù)、非連續(xù)的多詞組合,包括各種固定及半固定的結(jié)構(gòu),如俗語、專有名詞、固定搭配、部分填充構(gòu)式等。

本文擬結(jié)合基于頻率和搭配的方法提取石油類學(xué)術(shù)論文摘要中的多詞序列,既考慮其高頻頻次,又考察其語義完整性,以提取對學(xué)術(shù)英語教學(xué)和教材編撰真正具有參考價(jià)值的多詞序列。

2 研究設(shè)計(jì)

2.1 研究對象

本研究旨在回答以下2個(gè)問題:1)石油類英語學(xué)術(shù)論文摘要中的高頻多詞序列有哪些?2)石油類英語學(xué)術(shù)論文摘要中的多詞序列有哪些結(jié)構(gòu)類型?

2.2 語料庫的建立

本研究語料均選自石油工程師協(xié)會(Society of Petroleum Engineers,以下簡稱SPE)在線庫收錄的石油類英文學(xué)術(shù)期刊:International Journal of Offshore and Polar Engineering,Oil and Gas Facilities,Petrophysics,SPE Drilling amp; Completion,SPE Economics amp; Management,SPE Journal,SPE Production amp; Operations,SPE Reservoir Evaluation amp; Engineering。本研究共選取以上期刊2014—2015年間發(fā)表的學(xué)術(shù)論文摘要共355篇,將其摘要PDF格式文檔下載轉(zhuǎn)換成文本文檔格式,并利用文本處理器軟件進(jìn)行清潔,最后形成石油類英文學(xué)術(shù)期刊論文摘要語料庫(Research Article Abstract Corpus in Petroleum Industry),以下簡稱RAACPI。RAACPI共收錄形符100 170個(gè),類符7 499個(gè),每篇摘要平均有282個(gè)詞。

2.3 多詞序列提取

利用語料庫檢索軟件AntConc3.4的n-gram功能,檢索RAACPI中3-6詞多詞序列。由于3-4詞多詞序列數(shù)量較多,本研究采用比較保守的標(biāo)準(zhǔn),要求多詞序列在語料庫中出現(xiàn)的頻率在每百萬詞40詞次以上。同時(shí)為避免由于作者個(gè)人措辭習(xí)慣和期刊語言風(fēng)格對多詞序列提取造成的偏差,要求3-4詞多詞序列必須出現(xiàn)在語料庫選用的8種期刊中的6種以上的期刊。由于5詞及以上多詞序列數(shù)量較少,本研究采取略微寬松的標(biāo)準(zhǔn),要求5詞以上多詞序列出現(xiàn)頻率達(dá)到每百萬詞30詞次以上,并且至少在5種期刊中出現(xiàn)。

3 結(jié)果和討論

通過AntConc檢索,本研究共得到各類多詞序列228個(gè),其中3詞多詞序列179個(gè),占78.5%;4詞多詞序列43個(gè),占18.9%;5詞多詞序列6個(gè),占2.6%,未檢索到6詞及以上的多詞序列。

3.1 高頻多詞序列

根據(jù)AntConc檢索結(jié)果,其中結(jié)構(gòu)和意義相對完整的完全填充的多詞序列133個(gè),占所有多詞序列的58.3%;部分填充的多詞序列95個(gè),占41.7%。對部分填充的多詞序列索引行逐個(gè)進(jìn)行分析,并根據(jù)上、下文對其結(jié)構(gòu)和意義進(jìn)行填充。分析結(jié)果顯示,部分填充的多詞序列中有87個(gè)是以冠詞a/an/the或其他前位限定詞結(jié)尾,缺少名詞成分。由于所缺少名詞成分多為代詞及石油類專業(yè)術(shù)語,這些名詞成分雖種類繁多,但只有簡單的變化,對二語學(xué)習(xí)者一般不會構(gòu)成挑戰(zhàn),所以本研究一概用(det)+N進(jìn)行語法填充。其余8個(gè)以人稱、助動詞、情態(tài)動詞結(jié)尾,缺少動詞部分。學(xué)術(shù)論文摘要中所用動詞多為各類轉(zhuǎn)述動詞,有必要進(jìn)行詞匯填充。對所缺動詞成分用大寫形式對動詞進(jìn)行填充,表示動詞的原形lemma,以方便二語學(xué)習(xí)者進(jìn)行總結(jié)。頻率最高的30個(gè)多詞序列見表1。

表1 高頻多詞序列表

每百萬詞頻次刊物種類范圍多詞序列每百萬詞頻次刊物種類范圍多詞序列113878byuseof30930asaresult74966theuseof30930thispaperpresents58953thebasisof27026canbeusedto57953inthispaper27025isusedto56951onthebasisof26022byuseofa(det)+N56951onthebasis25021thepresenceof45931theeffectof25025thispaperdescribes44935oilandgas41936becauseofthe(det)+N41939canbeused40935useofthe(det)+N39932asellas37932thedevelopmentof25025inthispaperwePRESENT/IDENTIFY/INTRODUCE/DISCUSS/DEMONSTRATE/PROVIDE/PROPOSE/USE/DEVELOP/MODEL

續(xù)表1

每百萬詞頻次刊物種類范圍多詞序列每百萬詞頻次刊物種類范圍多詞序列35933inthisstudy24020(det)+NoftheneN32929useofa(det)+N23019understandingofthe(det)+N32925todeterminethe(det)+N23019afunctionof31930beusedto23019isbasedon30925theperformanceof

這些高頻多詞序列中名詞性結(jié)構(gòu)和介詞結(jié)構(gòu)分別為11個(gè)(占36.7%)和10個(gè)(占33.3%)。高頻名詞性結(jié)構(gòu)除了1個(gè)專業(yè)術(shù)語“oil and gas”和“a function of”以外基本都是“(the) + N + of”的結(jié)構(gòu),多為表示研究手段、背景及結(jié)果方面的抽象名詞,一般由其相應(yīng)動詞形式轉(zhuǎn)化而來,如the use of,the basis of,the effect of,the performance of,the presence of等。高頻介詞結(jié)構(gòu)大部分使用表示研究范圍及研究手段的介詞短語,如in this paper,in this study,in this paper we PRESENT/ IDENTIFY/ INTRODUCE/ DISCUSS/ DEMONSTRATE/ PROVIDE/ PROPOSE/ USE/ DEVELOP/ MODEL,by use of,by use of a (det)+N等。高頻多詞序列中名詞性結(jié)構(gòu)和介詞結(jié)構(gòu)一共占70%,充分體現(xiàn)了學(xué)術(shù)文本摘要的客觀性。

此外,高頻多詞序列中動詞結(jié)構(gòu)有7個(gè),其中4個(gè)為被動語態(tài),3個(gè)為主動語態(tài)。被動語態(tài)略多于主動語態(tài),這也體現(xiàn)了學(xué)術(shù)文本的客觀性。我們還注意到,主動語態(tài)的多詞序列分別是“this paper presents”和“this paper describes”,作者通過物稱主語使自己的描述更加客觀,結(jié)果更令人信服。

3.2 多詞序列的類型

Biber等人(1999)歸納出12種學(xué)術(shù)文本書面語詞塊[11]。本文參考Biber的分類框架,并根據(jù)本研究檢索結(jié)果,將石油類學(xué)術(shù)論文摘要中的多詞序列劃分為6類,包括名詞類、介詞類、動詞類、主謂完整類、狀語類及前置it類,其類型分布見表2。

表2 多詞序列的類型分布

名詞類多詞序列最多,占多詞序列類符總數(shù)的38.6%。如前文所述,這些名詞結(jié)構(gòu)的中心語多為表示研究手段、背景及結(jié)果方面的抽象名詞,一般由其相應(yīng)動詞形式轉(zhuǎn)化而來。這類多詞序列主要分為4類:(1)石油類相關(guān)的專業(yè)術(shù)語,如computational fluid dynamics,steam assisted gravity drainage等,這類多詞序列數(shù)量較少。(2)“the + N1 + of + (det) + (N2)”結(jié)構(gòu),如the performance of ,the properties of,analysis of the (det)+N等,這類多詞序列中的N1種類繁多,一般表示是性質(zhì)、狀態(tài)和研究手段的抽象名詞。N2一般表示研究對象,種類相對較少。(3)“(det) + N + Prep”的機(jī)構(gòu),如a number of , a function of, wide range of等,N主要是number, range, variety,increase等少數(shù)幾個(gè)表示數(shù)量、范圍、變化的名詞,用法相對固定。(4)“N + post-modifier”的結(jié)構(gòu),如,the potential to,(NP) in which the (det) +N等。

介詞類多詞序列占27.19%,這類多詞序列通常表示研究手段、研究范圍等,如by use of,on the basis of,by means of,in addition to the (det)+N,in this study we DEVELOP/ REVIEW/ INVESTIGATE/ USE/ DESIGN/ INTRODUCE/ DISCUSS/ FOCUS ON/ ATTEMPT TO,in the fracture,of hydraulic fracturing等。介詞類多詞序列用法相對固定,通常與名詞性結(jié)構(gòu)共同構(gòu)成更加完整的語義單元。

動詞類多詞序列占類符總數(shù)的22.37%,主要分為4類:(1)動詞的被動結(jié)構(gòu),如can be used to,are compared with,can be applied,caused by the (det)+N等,這類動詞一般表示研究手段、研究方法、形成原因等。(2)“(V) + that-clause”結(jié)構(gòu),如show that the (det)+N,indicate that the (det)+N等,這類動詞通常引出研究結(jié)果和發(fā)現(xiàn)等。(3)“(Verb/adjective) + to-clause”結(jié)構(gòu),這類動詞結(jié)構(gòu)一般表示研究目的,如to account for,to optimize the (det)+N,to understand the (det)+N等。(4)“Copula be + NP/AP”結(jié)構(gòu),包括is possible to,is an important,related to the (det)+N,這類結(jié)構(gòu)中的形容詞用于描述和研究對象的關(guān)系。

主謂完整類多詞序列指包含主謂語的多詞序列,其結(jié)構(gòu)和意義相對完整,這類多詞序列占9.65%,如there is a need,this paper presents a (det)+N,results show that,this paper discusses等。此類多詞序列雖然數(shù)量不多,但卻是構(gòu)成篇章的重要組成部分,對于二語學(xué)習(xí)者學(xué)術(shù)寫作初期的仿寫有著基礎(chǔ)性指導(dǎo)作用。

狀語類多詞和前置it類多詞序列相對較少,但是結(jié)構(gòu)固定,一般不會對二語學(xué)習(xí)者構(gòu)成大的挑戰(zhàn)。前者包括such as the (det)+N,as well as和as well as the (det)+N ,后者包括it is possible和it is possible to。這兩類多詞序列雖然總量少,但是出現(xiàn)頻率卻相對較高,達(dá)到約每百萬詞200頻次。

4 結(jié)語

本研究結(jié)合基于頻率和搭配的方法提取到石油類學(xué)術(shù)論文摘要中的多詞序列共6大類:名詞類、介詞類、動詞類、主謂完整類、狀語類及前置it類。高頻多詞序列的使用體現(xiàn)了學(xué)術(shù)語篇的客觀性。

結(jié)合基于頻率和搭配的方法提取的多詞序列意義相對完整,對學(xué)術(shù)英語教學(xué)和教材編撰更具現(xiàn)實(shí)意義和實(shí)用價(jià)值。對不同結(jié)構(gòu)類型多詞序列的分析可直接應(yīng)用于學(xué)術(shù)英語教學(xué)活動。如教師可設(shè)計(jì)任務(wù)型教學(xué)活動,要求學(xué)生參考名詞類和介詞類多詞序列,描述研究過程和方法。意義相對完整的多詞結(jié)果對二語學(xué)習(xí)者有更顯著的心理現(xiàn)實(shí)性,有助于二語學(xué)習(xí)者提高其語言水平。多詞序列表也能為教材編撰者提供更完整的意義單元,方便教材編撰者設(shè)計(jì)教材內(nèi)容。

[1]Haswell R. Gaining ground in college writing: tales of development and interpretation [J]. CCC,1993,44(2):262-264.

[2]胡新. 中外科技論文英文摘要的語步詞塊特征對比研究[J]. 現(xiàn)代外語, 2015(6):813-822.

[3]潘璠. 語料庫驅(qū)動的英語本族語和中國作者期刊論文詞塊結(jié)構(gòu)和功能對比研究[J]. 外語與外語教學(xué), 2016(4):115-123.

[4]李夢驍, 劉永兵. 基于語料庫的中外學(xué)者學(xué)術(shù)語篇詞塊使用對比研究[J]. 現(xiàn)代外語, 2016(4):507-515.

[5]李國敬, 曹雁. 基于語料庫的英文摘要詞塊結(jié)構(gòu)和功能研究[J]. 中國石油大學(xué)學(xué)報(bào):社會科學(xué)版, 2015(1):80-85.

[6]Cai, J. An exploratory study on an integrated genre-based approach for the instruction of academic lexical phrases [J]. Journal of English for Academic Purposes, 2016(24):58-74.

[7]Cortes V. The purpose of this study is to: Connecting lexical bundles and moves in research article introductions [J]. Journal of English for Academic Purposes, 2013, 12(1):33-43.

[8]王芙蓉, 王宏俐. 基于語料庫的語言學(xué)和工科學(xué)術(shù)英語詞塊比較研究[J]. 外語界, 2015(2):16-24.

[9]Cotos E, Huffman S, Link S. A move/step model for methods sections: Demonstrating Rigour and Credibility [J]. English for Specific Purposes, 2017(46):90-106.

[10]Hyland K. As can be seen: Lexical bundles and disciplinary variation [J]. English for Specific Purposes, 2008, 27(1):4-21.

[11]Biber,D.,Johansson,S.,Leech,G.,Conrad,S.a(chǎn)mp; E.Finegan.Longman Grammar of Spoken and Written English[M].Harlow: Pear-son,1999.

[12]Biber D, Conrad S, Cortes V. If you look at …: Lexical Bundles in University Teaching and Textbooks [J]. Applied Linguistics, 2004, 25(3):371-405.

[13] Simpson-Vlach R, Ellis N C. An Academic Formulas List: New Methods in Phraseology Research [J]. Applied Linguistics, 2010, 31(4):487-512.

[14]Wray A. Formulaic language and the lexicon [M]. Cambridge University Press,2002.

責(zé)任編輯:李增華

ACorpus-basedStudyoftheMulti-wordSequencesinResearchArticlesAbstracts

DENG Lin, LI Na, YU Yan-ying

( Xi’an Shiyou University, Xi’an 710065, China)

Taking Petroleum English academic papers as an example, analyzes the multi word sequences in the abstracts of academic papers by building a small corpus.Combining the frequency-based and collocation-based methods, the identification and extraction of MWCs takes into consideration both the high frequency and semantic integrity of these sequences. Thus, those identified MWSs are of more practical value to academic English pedagogy and teaching material compilation. There are 6 major categories of MWSs in the petroleum research article abstracts: nominal, prepositional, verbal, subject-predicate, adverbial and anticipatory it. The wide use of MWSs embodies the objective feature of research articles.

Petroleum industry; Academic paper; Abstract; Extraction; Multi-wordsequences

10.3969/j.issn.1674-6341.2017.06.054

H319.3

A

1674-6341(2017)06-0148-04

2017-05-26

陜西省教育廳科研計(jì)劃項(xiàng)目“石油行業(yè)英語學(xué)術(shù)論文寫作語料庫建設(shè)與應(yīng)用研究”(15JK1563)。

鄧林(1980—),男,江蘇揚(yáng)州人,在讀博士,講師。研究方向:語料庫語言學(xué)、應(yīng)用語言學(xué)。

猜你喜歡
詞塊學(xué)術(shù)論文介詞
學(xué)術(shù)論文征集啟事
學(xué)術(shù)論文征集啟事
學(xué)術(shù)論文征集啟示
學(xué)術(shù)論文征集啟事
介詞和介詞短語
介詞不能這樣用
高中英語詞塊教學(xué)現(xiàn)狀調(diào)查研究及應(yīng)用策略分析
大學(xué)英語教學(xué)中的詞塊教學(xué)
詞塊在初中英語寫作教學(xué)中的應(yīng)用研究
美國總統(tǒng)就職演說詞中的詞塊研究
忻州市| 丰镇市| 左权县| 齐齐哈尔市| 德州市| 佛学| 武汉市| 安福县| 大新县| 五台县| 壤塘县| 卓尼县| 翼城县| 庆云县| 新乡市| 桑植县| 咸宁市| 英山县| 夏津县| 上饶市| 霞浦县| 黄山市| 瑞昌市| 友谊县| 出国| 临沧市| 大田县| 溧水县| 西乡县| 宜昌市| 三江| 金门县| 昌都县| 霞浦县| 吴川市| 改则县| 和硕县| 集贤县| 永康市| 龙江县| 游戏|