高丹 李秀霞 周娜
(曲阜師范大學(xué)傳媒學(xué)院,日照 276826)
被引頻次指學(xué)術(shù)文獻發(fā)表后的被引用次數(shù),是評價與學(xué)術(shù)文獻有關(guān)的期刊、學(xué)科(專業(yè))、國家(地區(qū))、單位(個人)的一種方法,是反映學(xué)術(shù)文獻的科學(xué)水平和學(xué)術(shù)影響力的重要指標(biāo)[1]。目前,提高被引頻次的重要性已在學(xué)術(shù)界達成廣泛共識。
國內(nèi)外學(xué)者從多個角度對被引頻次的影響因素進行深入探討。國外學(xué)者如Virgo[2]驗證了被引頻次與學(xué)術(shù)文獻重要性的正相關(guān)假設(shè);Webster等[3]指出參考文獻的數(shù)量與被引頻次存在正相關(guān)關(guān)系;Stanek[4]驗證了學(xué)術(shù)文獻的篇幅長短與被引頻次存在相關(guān)關(guān)系,篇幅較長的學(xué)術(shù)文獻被引頻次也相應(yīng)較多;Maliniak等[5]研究男性和女性在學(xué)術(shù)文獻被引頻次和出版量的差異,發(fā)現(xiàn)女性作者的被引頻次整體低于男性作者;Kulkarni等[6]驗證醫(yī)學(xué)領(lǐng)域熱點話題對被引頻次的影響,發(fā)現(xiàn)對行業(yè)有利的觀點,腫瘤學(xué)和心臟病學(xué)等主題與被引頻次有關(guān);Suryani等[7]通過CARS模型對比分析計算機科學(xué)領(lǐng)域中的高被引文獻和低被引文獻,發(fā)現(xiàn)作者需要在引言中闡明研究成果和研究價值,才能使學(xué)術(shù)文獻得到更高的引用頻次。國內(nèi)學(xué)者如姜磊等[8]探討中文學(xué)術(shù)文獻的參考文獻數(shù)量與被引頻次的關(guān)系,表明參考文獻數(shù)量與被引頻次的相關(guān)性不明顯,參考文獻可以作為一個獨立于被引頻次的論文評價指標(biāo);牛昱昕等[9]驗證了單篇論文的下載頻次與被引頻次的相關(guān)性不顯著;蘇芳荔[10]采用符號檢驗與相關(guān)分析的方法,發(fā)現(xiàn)合作發(fā)表論文的影響力明顯高于無合作發(fā)表的論文;簡琳等[11]發(fā)現(xiàn)關(guān)鍵詞個數(shù)對文獻被引頻次存在顯著影響;楊利軍等[12]從引用文獻的時間、類型、數(shù)量3個特征進行分析,得出作者的引用習(xí)慣是影響被引頻次的重要因素之一。
分析已有研究,發(fā)現(xiàn)被引頻次影響因素的研究主要涉及參考文獻數(shù)量、篇幅長短、下載頻次、合作模式、關(guān)鍵詞個數(shù)及作者引用習(xí)慣等,通過計量的方法分析各影響因素與被引頻次的關(guān)系。已有研究大多以外部因素為研究對象,鮮有基于學(xué)術(shù)文獻內(nèi)容結(jié)構(gòu)的研究。
引言是學(xué)術(shù)文獻的重要組成部分,作者需要通過引言引起讀者的閱讀興趣,判定與其研究主題相關(guān)后,才會激發(fā)深度閱讀行為。引言作為學(xué)術(shù)文獻中不可缺少的組成部分,是決定學(xué)術(shù)文獻質(zhì)量的重要因素之一;而被引頻次能揭示學(xué)術(shù)文獻的應(yīng)用價值、參考價值或?qū)W術(shù)影響力,是進行學(xué)術(shù)文獻評價的重要指標(biāo)之一。學(xué)術(shù)文獻的引言與被引頻次密切相關(guān),兩者間的關(guān)系值得深度探索。本文擬將引言的內(nèi)容結(jié)構(gòu)與被引頻次結(jié)合起來,探討引言與被引頻次的關(guān)系,為規(guī)范學(xué)術(shù)文獻的引言寫作、提高其學(xué)術(shù)影響力提供幫助。
美國體裁分析學(xué)家Swalesian學(xué)派的代表人Swales在研究各學(xué)科的學(xué)術(shù)文獻引言部分時,發(fā)現(xiàn)不同學(xué)者在寫作學(xué)術(shù)文獻這一特殊體裁時,內(nèi)容結(jié)構(gòu)等方面普遍一致。Swales[13]認為,語篇具有特定的共同交流目的,這影響并制約文章內(nèi)容和文體風(fēng)格。因此,得出“學(xué)術(shù)文獻的寫作只有符合其特定的體裁模式,才能實現(xiàn)其交流目的。而這種公認體裁模式是不同研究領(lǐng)域進行學(xué)術(shù)交際的最好方法”。
Swales在1990年提出引言結(jié)構(gòu)分析模型,即CARS(Create a Research Space)模型[13],包括確定研究領(lǐng)域、確定研究定位、把握研究契機3個語步(move),以及相應(yīng)語步的步驟(step)。語步是作者寫作目的的總體概況,步驟是為實現(xiàn)語步目的的詳細描述。第一語步,確定研究領(lǐng)域,即通過回顧前人研究成果來闡明研究意義與重要性,包括宣稱中心活躍度、主題概括、綜述以往文獻;第二語步,確定研究定位,通過指出前人研究缺陷再次強調(diào)研究的必要性,包括反駁已有觀點、指出研究不足、提出研究問題和繼承前人研究成果4個循環(huán)步驟;第三語步,把握研究契機,包括概述研究目的、描述研究特征、預(yù)示研究成果、介紹論文結(jié)構(gòu)4個步驟。
Swales的CARS模型為引言提供了普遍意義上的寫作思路和框架,使學(xué)術(shù)文獻做到“言之有序”,學(xué)術(shù)文獻遵循的“序”即引言的框架結(jié)構(gòu)。然而,CARS模型中對語步、步驟的概念定義不夠細致規(guī)范,僅依據(jù)于小部分代表性的句法特征,且應(yīng)用價值較弱,對語類驗證只能采取事后分析的方式,對語步的判定僅依賴使用者的直覺,這樣很難獲得分析的一致性。而且,根據(jù)實際寫作的需要,CARS模型中一些語步和步驟功能相近,略顯冗余,需要進一步整合。
為改善CARS模型的不足,豐富引言結(jié)構(gòu),本文嘗試提出一種新的引言結(jié)構(gòu)詞表,為學(xué)者對引言的規(guī)范寫作提供借鑒和參考。
引言結(jié)構(gòu)詞表數(shù)據(jù)來自Web of Science的科學(xué)引文(SCI-EXPANDED)數(shù)據(jù)庫,隨機選取圖書情報領(lǐng)域的500篇學(xué)術(shù)文獻。通過分析學(xué)術(shù)文獻的引言部分,發(fā)現(xiàn)CARS模型可以簡化為“闡述重要性”“文獻綜述”“研究不足”“研究目的”“預(yù)示重要結(jié)果”“論文結(jié)構(gòu)”6個語步,且語步可自由組合。將文獻引言以此分類,在結(jié)合Swales等體裁分析學(xué)家的語料庫積累上,通過自編程得到引言詞表(見表1)。
引言詞表具有以下優(yōu)勢:①匯總引言部分的高頻單詞,專注引言體裁的檢索需求,為引言的規(guī)范寫作提供參考與借鑒;②實用性強,可利用重合率來進行語類驗證、語步判定,最大程度地滿足讀者的實際需要;③收詞范圍較廣,取材范圍覆蓋學(xué)術(shù)文獻引言所使用的正式和非正式語體,收詞以高頻核心詞為基礎(chǔ),同時適當(dāng)收錄了各體裁分析學(xué)家認為讀者在寫作引言時所必須的部分詞語;④詞性收錄全面,對動詞、名詞、副詞、第三人稱單數(shù)等做了詳細歸納。
引言是學(xué)術(shù)文獻不可或缺的組成部分,起著開篇點題的作用,是決定學(xué)術(shù)文獻質(zhì)量的重要因素之一;被引頻次是反映學(xué)術(shù)文獻的科研水平和學(xué)術(shù)影響力的重要指標(biāo)之一。針對兩者是否存在相關(guān)關(guān)系這一問題,本文提出用語步重合率,即各語步與引言詞表相重合的數(shù)量占各語步總詞數(shù)的比,與論文被引頻次進行相關(guān)性分析,探討CARS模型對論文被引頻次的影響。
為分析引言的內(nèi)容結(jié)構(gòu)與被引頻次的關(guān)系,基于CARS模型構(gòu)建引言詞表,引言詞表的數(shù)據(jù)來源于圖書情報領(lǐng)域的500篇隨機學(xué)術(shù)文獻。為保證樣本檢驗數(shù)據(jù)能正確反映引言詞表對學(xué)術(shù)文獻被引頻次的影響,樣本檢驗數(shù)據(jù)源區(qū)別于引言詞表數(shù)據(jù)源。樣本檢驗數(shù)據(jù)來源于Web of Science的科學(xué)引文(SCI-EXPANDED)數(shù)據(jù)庫,檢索方式采用高級檢索,以“InformationScience & Library Science”為學(xué)科類別,以“knowledge management”為檢索詞,文獻類型為“Article”,限定語言為“English”,發(fā)表時間為2014年,檢索時間為2018年5月24日,共檢索到789篇文獻。隨機抽取25篇文獻作為樣本數(shù)據(jù)。
表1 引言詞表(部分)
將25篇文獻按照被引頻次(排除自引)排序得到表2,每篇學(xué)術(shù)文獻的引言內(nèi)容按照“闡述重要性”“文獻綜述”“研究不足”“研究目的”“預(yù)示重要結(jié)果”“論文結(jié)構(gòu)”6個語步歸類,分別統(tǒng)計每篇引言在各語步中出現(xiàn)的總詞數(shù)m。通過Python編程,以引言詞表分別過濾引言各語步,得到引言中與詞表重合的詞數(shù)n,n/m為各語步與引言詞表相重合的數(shù)量占各語步總詞數(shù)的比,即重合率。
2.2.1 被引頻次與引言各語步重合率的對比分析
為驗證學(xué)術(shù)文獻引言結(jié)構(gòu)對被引頻次的影響,將引言各語步的詞表重合率與被引頻次比較。各語步的詞表重合率與引言寫作的規(guī)范程度有關(guān),重合率越高,表示引言與“引言詞表”更相符,相應(yīng)的引言寫作用詞越規(guī)范。若某篇文獻沒有個別語步,統(tǒng)計時以錯誤值“#N/”代替,橫軸表示25篇引言,縱軸表示各語步與詞表的重合率(見圖1、圖2)。
由圖1發(fā)現(xiàn),“研究不足”“預(yù)示重要結(jié)果”語步的詞表重合率與被引頻次曲線走勢基本一致,被引頻次隨著詞表重合率的降低而降低,但也存在例外(如序號20的學(xué)術(shù)文獻引言“預(yù)示重要結(jié)果”語步的詞表重合率驟然升高)。由圖2可見,“闡述重要性”“文獻綜述”“研究目的”語步的詞表重合率總體一致,皆與被引頻次的曲線走勢有較大的不同,說明這3個語步詞表重合率對被引頻次的影響較弱?!把芯磕康摹闭Z步的平均詞表重合率最高為0.11,其次是“闡述重要性”語步,說明這兩個語步在引言寫作時常用術(shù)語具有更高的穩(wěn)定性。“論文結(jié)構(gòu)”語步的樣本太少,數(shù)據(jù)不納入分析。
表2 引言各語步的詞表重合率與被引頻次的比較
圖1 “研究不足”“預(yù)示重要結(jié)果”語步與被引頻次的比較
圖2 “闡述重要性”“文獻綜述”“研究目的”“研究不足”“論文結(jié)構(gòu)”語步與被引頻次的比較
2.2.2 被引頻次與引言各語步重合率的相關(guān)性分析
為更準(zhǔn)確地呈現(xiàn)被引頻次與引言各語步間的關(guān)聯(lián)性,本文在SPSS環(huán)境下,利用表3的數(shù)據(jù)計算各指標(biāo)間的Spearman相關(guān)系數(shù)。
被引頻次與除“論文結(jié)構(gòu)”外的其他所有語步均呈正相關(guān),其中與“研究不足”語步呈強相關(guān)性,相關(guān)系數(shù)為0.552。被引頻次與“闡述重要性”“預(yù)示重要結(jié)果”語步均呈較強相關(guān),相關(guān)系數(shù)分別為0.451和0.421。由表3還發(fā)現(xiàn),“論文結(jié)構(gòu)”語步與被引頻次呈負相關(guān),相關(guān)系數(shù)為-0.391?!罢撐慕Y(jié)構(gòu)”語步僅簡要概括文獻的各章節(jié),并不包含實質(zhì)學(xué)術(shù)價值和信息,與被引頻次相關(guān)性較低。
表3 被引頻次與引言各語步間的相關(guān)性
(1)“研究不足”語步對被引頻次的影響。“研究不足”語步可以指出前人研究的問題與不足,填補科學(xué)研究的缺陷和空白。在前人提出的研究課題中,雖然已有初步的研究成果,但隨著科學(xué)技術(shù)的不斷發(fā)展,還有待補充、豐富。這種補充性或糾正性的研究課題,強調(diào)當(dāng)前研究的必要性,對社會發(fā)展有著深遠的科學(xué)價值和現(xiàn)實指導(dǎo)意義?!把芯坎蛔恪闭Z步是引言內(nèi)容的重要組成部分,與被引頻次聯(lián)系緊密。
(2)“闡述重要性”語步對被引頻次的影響?!瓣U述重要性”語步的主要作用是聲明研究課題的重要意義,闡述研究主題“重大而主要”的學(xué)術(shù)價值和社會影響,以達到吸引潛在讀者的目的。在開篇引言部分,讀者就可獲知文獻的學(xué)術(shù)價值,從而激發(fā)深度閱讀行為,被引頻次相應(yīng)提高。
(3)“預(yù)示重要結(jié)果”語步對被引頻次的影響?!邦A(yù)示重要結(jié)果”語步說明作者在當(dāng)前研究中的獨創(chuàng)性貢獻,推進或解決某一領(lǐng)域的發(fā)展?!瓣U述重要性”語步與“預(yù)示重要結(jié)果”語步互為關(guān)聯(lián),但兩者側(cè)重點不同。前者強調(diào)研究課題進行的必要性與目的,后者著重研究課題取得的成效和貢獻。學(xué)術(shù)貢獻是一篇學(xué)術(shù)文獻的核心價值,“預(yù)示重要結(jié)果”語步是影響被引頻次的因素之一。
被引頻次是反映學(xué)術(shù)文獻影響力的重要指標(biāo),被引頻次有眾多的影響因素,本文的實驗數(shù)據(jù)驗證了引言語步與被引頻次存在關(guān)系。上述研究發(fā)現(xiàn),改進后的CARS模型中“研究不足”“闡述重要性”“預(yù)示重要結(jié)果”3個引言語步的詞表重合率與被引頻次呈現(xiàn)較強相關(guān)性,引言語步的詞表重合率越高,代表引言寫作越規(guī)范,相應(yīng)的學(xué)術(shù)文獻被引頻次和影響力就高。這表明,引言寫作規(guī)范度與被引頻次呈正相關(guān)關(guān)系,寫作規(guī)范度對文獻的被引頻次影響較大,可作為影響被引頻次的指標(biāo)。因此,為提高學(xué)術(shù)文獻的被引頻次和影響力,學(xué)者應(yīng)選擇合適的引言結(jié)構(gòu)和語步,規(guī)范學(xué)術(shù)文獻的引言寫作。
本文對CARS模型提出改進,并對引言分別建立了“闡述重要性”“文獻綜述”“研究不足”“研究目的”“預(yù)示重要結(jié)果”“論文結(jié)構(gòu)”6個語步的詞表。本研究豐富了引言結(jié)構(gòu)內(nèi)容并提高了其應(yīng)用價值,通過對引言各語步與被引頻次的相關(guān)分析,發(fā)現(xiàn)“研究不足”“預(yù)示重要結(jié)果”“闡述重要性”語步的詞表重合率與被引頻次呈現(xiàn)較強相關(guān)性,表明這3個語步的寫作規(guī)范度可以作為影響被引頻次的指標(biāo),同時表明科學(xué)的引言結(jié)構(gòu)對學(xué)術(shù)文獻的被引頻次有重要影響。
因此,學(xué)者可規(guī)范學(xué)術(shù)文獻的引言寫作,使用CARS模型構(gòu)建合適的引言結(jié)構(gòu),在引言部分重點闡述“原有研究的缺陷”“本課題的重要性”“本課題的學(xué)術(shù)貢獻”,進而提高我國期刊論文的被引頻次,提高其學(xué)術(shù)影響力。
模型構(gòu)建過程中存在以下不足:①本文選取的數(shù)據(jù)樣本范圍單一,只分析了圖書情報領(lǐng)域?qū)W術(shù)文獻的引言,使結(jié)論分析較片面;②構(gòu)建引言詞表模型時,對語料庫的構(gòu)建具有一定的主觀性,使實驗數(shù)據(jù)存在一定誤差。后續(xù)研究中將對引言詞表模型做相應(yīng)的更新,創(chuàng)建學(xué)術(shù)文獻引言結(jié)構(gòu)語料庫,為引言的規(guī)范寫作提供參考與借鑒,從而提高學(xué)術(shù)文獻的應(yīng)用價值和學(xué)術(shù)影響力。