曹靜,曹鳳龍
(蚌埠醫(yī)學(xué)院公共課程部,安徽蚌埠233030)
醫(yī)學(xué)學(xué)術(shù)論文英文摘 要中be done的短語學(xué)特征分析
——基于自然語言處理的研究
曹靜,曹鳳龍
(蚌埠醫(yī)學(xué)院公共課程部,安徽蚌埠233030)
在醫(yī)學(xué)論文英文摘 要中,be done是使用率較高的一類句式。選擇醫(yī)學(xué)論文英文摘 要建立英文純文本語料庫(kù),使用Python程序設(shè)計(jì)語言和自然語言處理工具(NLTK),對(duì)醫(yī)學(xué)論文英文摘 要中be done句式進(jìn)行檢索提取,結(jié)合體裁分析理論,對(duì)其語義分類和語篇功能進(jìn)行研究,旨在為醫(yī)學(xué)論文英文摘 要撰寫提供參考。
be done,醫(yī)學(xué)學(xué)術(shù)論文;摘 要;語義分類;語篇功能
摘 要是研究性論文的一個(gè)重要組成部分,它體現(xiàn)了論文的要點(diǎn)。據(jù)中國(guó)科學(xué)技術(shù)期刊編輯學(xué)會(huì)醫(yī)學(xué)分會(huì)2002年對(duì)全國(guó)700余種醫(yī)學(xué)期刊的調(diào)查,在統(tǒng)計(jì)的591種學(xué)術(shù)類、技術(shù)類和綜合類醫(yī)學(xué)學(xué)術(shù)期刊中,95.5%有英文摘 要,足見英文摘 要的重要性[1]。英文摘 要如此重要引起了國(guó)內(nèi)學(xué)者的研究,他們從不同角度對(duì)醫(yī)學(xué)論文英文摘 要進(jìn)行了研究。這些研究有從宏觀角度展開,例如關(guān)于醫(yī)學(xué)論文英文摘 要的寫作特點(diǎn)或關(guān)于論文中英文摘 要的對(duì)比;也有從微觀搭配特征層面展開,如“基于語料庫(kù)的醫(yī)學(xué)論文摘 要?jiǎng)釉~語言特點(diǎn)探析”[2]、“醫(yī)學(xué)論文英文摘 要中第一人稱代詞使用之分析”[3]、“期刊論文英文摘 要核心動(dòng)詞研究——以醫(yī)學(xué)期刊為例”[4]、“醫(yī)學(xué)英文論文中with使用的常見問題及其修改”[5]、“中外醫(yī)學(xué)論文英文摘 要的語言分析——基于語料庫(kù)的研究”[6]。
但是對(duì)于被動(dòng)語態(tài)be done的系統(tǒng)研究卻是一片空白。眾所周知,在醫(yī)學(xué)論文英文摘 要中,被動(dòng)語態(tài)句式是使用頻率較高的一種句型,因此,能否正確使用be done影響論文摘 要質(zhì)量的高低,是判斷摘 要是否規(guī)范的指標(biāo)之一。本文嘗試建立語料庫(kù),利用自然語言處理技術(shù),對(duì)醫(yī)學(xué)論文英文摘 要中的被動(dòng)語態(tài)進(jìn)行研究,分析be done的分布特點(diǎn)、高頻詞匯及在語篇中發(fā)揮的作用。
作者自建一個(gè)庫(kù)容為815318詞的醫(yī)學(xué)論文英文摘 要語料庫(kù)。為確保數(shù)據(jù)的準(zhǔn)確性和權(quán)威性,選取語料來源于在醫(yī)學(xué)領(lǐng)域?qū)W術(shù)論文出版方面具有一定權(quán)威性的Wiley-Blackwell。這些摘 要涵蓋免疫學(xué)、兒科、神經(jīng)病學(xué)、皮膚病學(xué)、內(nèi)分泌學(xué)、血液學(xué)等學(xué)科,選取期刊有Arthritis Care&Research、Head&NeckSurgery、Catheterization and Cardiovascular Diagnosis、Cephalalgia、Australasian Journal on Ageing、Child:Care,Health and Development、BJU International等。這些摘 要均為醫(yī)學(xué)實(shí)證研究論文的英文摘 要,滿足背景、方法、結(jié)果、討論/結(jié)論(IMRD或IMRC)的結(jié)構(gòu)特點(diǎn)。
為更加精確地進(jìn)行數(shù)據(jù)統(tǒng)計(jì)和分析,作者使用Python程序設(shè)計(jì)語言和自然語言處理工具NLTK,編寫了適用于本研究的統(tǒng)計(jì)分析程序。該程序第一步針對(duì)不同時(shí)態(tài)和語態(tài)情況下be動(dòng)詞的不同存在形式,在語料庫(kù)中搜索be動(dòng)詞之后的各個(gè)單詞,剔除不屬于be done結(jié)構(gòu)的單詞(如“an”“in”“then”等),得到語料庫(kù)中的所有be done結(jié)構(gòu)。第二步則是對(duì)be done進(jìn)行數(shù)據(jù)統(tǒng)計(jì),計(jì)算出其出現(xiàn)頻率,并分別對(duì)be done在引言、方法、結(jié)果及討論/結(jié)論部分出現(xiàn)情況進(jìn)行統(tǒng)計(jì)。
(一)be done的總體分布
作者對(duì)語料進(jìn)行統(tǒng)計(jì)分析后發(fā)現(xiàn),be done大量出現(xiàn)于醫(yī)學(xué)論文英文摘 要中,共計(jì)14721次。be done的大量出現(xiàn)說明醫(yī)學(xué)論文摘 要作為科技論文的一種,具有科技論文典型的語言特點(diǎn),即大量使用被動(dòng)語態(tài)。背景、方法、結(jié)果、討論/結(jié)論(IMRD或IMRC)中均包含be done,但在四部分出現(xiàn)的數(shù)量具有顯著差異(見表1)。出現(xiàn)概率最高的是在摘 要中的方法(Methods)部分,占47.79%。Methods部分如此高的出現(xiàn)率說明在這些頂尖期刊發(fā)表的論文的作者多采用被動(dòng)語態(tài)來描述實(shí)驗(yàn)過程。被動(dòng)語態(tài)的使用首先能突出實(shí)驗(yàn)方法的客觀性,其次其重要性也得以體現(xiàn),因?yàn)閷⒈静辉谥魑唬╰heme)的實(shí)驗(yàn)方法置于主位上,說明論文發(fā)表者希望閱讀者能迅速了解實(shí)驗(yàn)方法,也能使論文審稿人快速了解其研究方法[2]。
表1 be done的總體分布
(二)done的語義分類
運(yùn)用Python程序設(shè)計(jì)語言和自然語言處理工具NLTK,本研究統(tǒng)計(jì)出排名前20位的動(dòng)詞過去分詞以及它們出現(xiàn)的頻率(見表2)。這些動(dòng)詞均為有實(shí)際意義的行為動(dòng)詞。大致可分為以下四類:
第一類為描述過程類動(dòng)詞。一般出現(xiàn)在摘要中的方法(Methods)部分,在其他三部分少量出現(xiàn)。比如use、perform、observe、include、determine、analyze、measure、obtain、collect、conduct等。這類動(dòng)詞出現(xiàn)的語句中,主語多為實(shí)驗(yàn)方法、實(shí)驗(yàn)數(shù)據(jù)、實(shí)驗(yàn)對(duì)象等。例如:Chi-square and independent t-tests、Qualitative data、Patients in pediatric、Serum oxidative stress、liver function、and HBV DNA level。
表2 摘要中done出現(xiàn)頻率最高的前20位動(dòng)詞
第二類為關(guān)聯(lián)比較類動(dòng)詞。這類動(dòng)詞有associate和compare。與associate搭配的主語多為非積極類名詞,如疾病、疼痛等消極意義名詞,因?yàn)檎?要中常會(huì)提及疾病或疼痛的相關(guān)因素。如Severe post-operative bleeding in cardiac surgery、Amino acids(AA)。與compare搭配的主語多為實(shí)驗(yàn)結(jié)果或數(shù)據(jù),例如:Data on patient and tumour characteristics。同時(shí),associate與compare通常與with搭配構(gòu)成短語。
第三類為描述結(jié)果類動(dòng)詞,比如observe、identify、report、seen、increase、need等。這類動(dòng)詞多出現(xiàn)在討論(Discussion)和結(jié)果(Results)部分。搭配主語多為表示實(shí)驗(yàn)結(jié)果的名詞,例如outcome、effect、diagnosis等。
第四類為描述評(píng)價(jià)類動(dòng)詞,如assess、evaluate等。這類動(dòng)詞主要出現(xiàn)在方法(Methods)部分,多表示實(shí)驗(yàn)中對(duì)某種方法的評(píng)估。搭配主語多為實(shí)驗(yàn)對(duì)象,如exclusion rate、cell proliferation、patients等。
(三)be done的語篇功能分析
關(guān)于be done在醫(yī)學(xué)學(xué)術(shù)論文英文摘 要中實(shí)現(xiàn)的語篇功能,作者以排名前20位的過去分詞為例進(jìn)行了探討。參照IMRD(背景、方法、結(jié)果、討論)模型,筆者對(duì)排名前20位的單詞在四語步中的分布進(jìn)行了統(tǒng)計(jì)(見表3)。為分析其在摘 要中的語篇功能,筆者在四類詞中選擇具有代表性的associate、perform、see和need進(jìn)行分析。
be associated是醫(yī)學(xué)論文英文摘 要中出現(xiàn)幾率最高的,排名第1位,共計(jì)896次,這說明associate在語篇構(gòu)建中起到至關(guān)重要的作用。使用統(tǒng)計(jì)分析程序?qū)φZ料庫(kù)進(jìn)行檢索(部分檢索結(jié)果如下),可以發(fā)現(xiàn),be associated搭配主語多表示疾病、癥狀、疼痛(如pro-inflammatory cytokines、post-operative bleeding、Amino acids、kidney injury、maternal intrapartum fever、Pupils'abnormalities)等消極詞匯,這體現(xiàn)了醫(yī)學(xué)論文的學(xué)科特征。從語篇分布來看,be associated主要出現(xiàn)在語步1、語步3和語步4中,并且在這三個(gè)語步中分布相當(dāng),只有極少量出現(xiàn)在語步2中。當(dāng)be associated出現(xiàn)在語步1中時(shí),主要作用為引出相關(guān)研究主題,為介紹研究目的作鋪墊。通常be associated后有The aim of the study is to…,We explore that…,We hypothize that…,We want to investigate that…等表示研究目的的語句。當(dāng)be associated出現(xiàn)在語步3時(shí),用于總結(jié)研究結(jié)果。筆者發(fā)現(xiàn)在醫(yī)學(xué)論文英文摘 要中,當(dāng)be associated出現(xiàn)在結(jié)果(Results)部分時(shí),句中多出現(xiàn)實(shí)驗(yàn)數(shù)據(jù),并且使用significantly、commonly、independently、strongly、positively、strongly、predominantly、inversely等表示情感態(tài)度的單詞來修飾be associated。若be associated介紹當(dāng)前研究結(jié)果,則出現(xiàn)在語步4中。通常句式為be associated with improvements、be associated with a/an…risk of。be associated在極少數(shù)情況下出現(xiàn)在語步2,在此不做討論。be associated在摘 要中的廣泛分布,體現(xiàn)了其多樣的交際功能。
Surgeryinducesinflammation and pro-inflammatory cytokinesare associated withpost-operative complications.
Pre-operativefibrinogenlevelsare negatively associated withpostoperativebleedingincardiacsurgerypatients.
Inmultivariateanalysis,EAwasassociatedwithincreasedrisk with low AS,AOR 1.27(95%CI 1.16–1.39),but not with diagnosis of encephalopathy,1.11(0.96–1.29).
All item-total correlations were rho≥0.20.The ICQ-S demonstrated criterionvalidity,forexample,ICQ andICQ-Swerestronglyassociated(rho=0.86).81%of patients completed the ICQ-S within 5 minutes and 97%found completion‘not difficult’.
IL-37 expressionwas positively associatedwith atopic dermatitis,whereas IFN-α,IL-13,IL-28,and Tbet expressionswerenegativelyassociated with allergic diseases.
The microbial diversity score,that is,sumofdetectedqPCRs,wasinversely associated withrisk of wheezing and was significantly(inverted-U shape)associatedwithsensitizationto inhalant allergens.
Particularly,AUS/FLUScases with focal features suggestive of PTCseemtobeassociatedwithamuch higherriskofmalignancythanother patterns.
Goutwas associated withan increasedriskofdevelopingDMcompared to that in patients with OA after adjustment for potential confounders.
be performed在英文摘 要中共出現(xiàn)574次。盡管在四大語步中均有分布,但絕大部分出現(xiàn)在語步2中(Methods),共計(jì)497次(占總數(shù)的86.59%)。在語步2中,含有be performed的語句主語均為研究方法(statistical analysis、t-test等)。與perform同屬一類的表示描述實(shí)驗(yàn)過程的詞,從表3中可以看出,均有相同特點(diǎn),即主要出現(xiàn)在語步2——方法(Methods)中。
be seen在摘 要中共出現(xiàn)189次,其中140次出現(xiàn)在語步3中,用于總結(jié)研究結(jié)果,其搭配主語與語步1中的研究主題呼應(yīng)。
be needed集中分布在語步4中(154次),其實(shí)現(xiàn)語篇功能和be performed、be seen一樣,較為單一,主要用于對(duì)論文未來研究的展望,因此搭配主語為further work、additional study、further re-search等。
經(jīng)過對(duì)醫(yī)學(xué)論文英文摘 要中be done分析,可以得出以下結(jié)論:
1.be done大量出現(xiàn)在醫(yī)學(xué)論文英文摘 要中,背景、方法、結(jié)果、討論中均有大量be done,其中方法所占比例最重。be done能突出話題焦點(diǎn),使閱讀者快速了解研究問題、方法、結(jié)果等重要信息。
2.不同類別動(dòng)詞出現(xiàn)在摘 要的不同語步中。描述實(shí)驗(yàn)過程類和評(píng)價(jià)類動(dòng)詞主要出現(xiàn)在方法(Methods)部分;描述結(jié)果類的動(dòng)詞主要出現(xiàn)在討論(Discussion)和結(jié)果(Results)部分;表示關(guān)聯(lián)的associate在四語步中均有分布,而表示比較的compare則主要出現(xiàn)在語步2中。
3.be done在四語步中均大量出現(xiàn),承擔(dān)了不同的語篇交際功能。學(xué)術(shù)論文摘 要體裁的主要交際目的是“創(chuàng)建科研空間”,而為了實(shí)現(xiàn)科研空間的創(chuàng)建,需要各個(gè)語步實(shí)現(xiàn)不同的交際目的[7]。在醫(yī)學(xué)論文英文摘 要中,be done廣泛分布于四大語步,并能促成摘 要交際目的的實(shí)現(xiàn),例如引入背景、方法介紹、總結(jié)結(jié)果、展望前景等。
本文通過自建語料庫(kù),對(duì)醫(yī)學(xué)論文英文摘 要中的be done進(jìn)行了研究,檢索提取了be done中排名前20位的高頻動(dòng)詞,并對(duì)這些動(dòng)詞的語義分類以及實(shí)現(xiàn)的語篇功能進(jìn)行分析研究。研究結(jié)果表明be done廣泛出現(xiàn)于醫(yī)學(xué)論文英文摘 要中,IMRD/IMRC四大語步中高頻動(dòng)詞各有不同,以及be done在四語步中實(shí)現(xiàn)了不同的交際目的。希望本文的研究結(jié)果為國(guó)內(nèi)醫(yī)學(xué)工作者撰寫醫(yī)學(xué)論文英文摘 要時(shí)正確使用be done提供參考。
[1]周晴霖,等.論醫(yī)學(xué)期刊英文摘 要編輯中信息的完整性[J].編輯學(xué)報(bào),2012(S1):16-18.
[2]齊暉.基于語料庫(kù)的醫(yī)學(xué)論文摘 要?jiǎng)釉~語言特點(diǎn)探析[J].福建醫(yī)科大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2012(2):68-72.
[3]丁茂平.醫(yī)學(xué)論文英文摘 要中第一人稱代詞使用之分析[J].編輯學(xué)報(bào),2009(6):500-502.
[4]葉瑩.期刊論文英文摘 要核心動(dòng)詞研究——以醫(yī)學(xué)期刊為例[J].南京曉莊學(xué)院學(xué)報(bào),2010(5):35-38.
[5]陳望忠,等.醫(yī)學(xué)英文論文中with使用的常見問題及其修改[J].中國(guó)科技期刊研究,2007(3):527-529.
[6]馬躍珂.中外醫(yī)學(xué)論文英文摘 要的語言分析——基于語料庫(kù)的研究[J].鄭州航空工業(yè)管理學(xué)院學(xué)報(bào):社會(huì)科學(xué)版,2013(4):76-80.
[7]張繼東,儲(chǔ)靜.科技論文引言中搭配框a*of的短語學(xué)特征研究——以醫(yī)學(xué)論文引言為例[J].東華大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2013(2):73-80.
責(zé)任編校 人云
H315
A
2095-0683(2017)01-0110-05
2016-12-06
安徽省高校省級(jí)人文社會(huì)科學(xué)研究重點(diǎn)項(xiàng)目(SK2015A410)
曹靜(1984-),女,安徽安慶人,蚌埠醫(yī)學(xué)院公共課程部講師,碩士;曹鳳龍(1973-),男,安徽渦陽(yáng)人,蚌埠醫(yī)學(xué)院公共課程部教授。