莫嵐 向榮 歐鑌進 劉陵孫
摘要:以中國知網(wǎng)CNKI的中國學術(shù)期刊網(wǎng)絡出版總庫為統(tǒng)計源,運用文獻計量學方法,對數(shù)據(jù)庫收錄(截止2011年)刊載的有關(guān)圖書館信息聚合研究論文進行統(tǒng)計分析,從論文年代分布、第一作者發(fā)文數(shù)、期刊分布、文獻增長規(guī)律進行分析,以揭示我國圖書館RSS的應用進展,推動和促進這圖書館RSS的進一步應用和研究。
關(guān)鍵詞:信息聚合;圖書館;文獻計量
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2015)15-0166-03
Abstract: Bade on CNKI China academic journal network publication database as the statistical source, using the method of bibliometrics, the dataase (end of 2011) related published stem of RSS research of libarary from the paper age distribution, periodical distribution, The first author of the paper quantity,Literature growth Rate to reveal China's progress in the application of RSS in library, promote and facilitate the further research and application of Library RSS.
Key words: RSS; Library; bibliometrics
1 概述
簡易信息聚合(也叫聚合內(nèi)容簡稱信息聚合,縮寫為RSS)是一種描述和同步網(wǎng)站內(nèi)容的格式。RSS可以是以下三個解釋的其中一個: Really Simple Syndication;RDF (Resource Description Framework) Site Summary; Rich Site Summary。但其實這三個解釋都是指同一種Syndication的技術(shù)。RSS目前廣泛用于網(wǎng)上新聞頻道,blog和wiki,主要的版本有0.91, 1.0, 2.0。使用RSS訂閱能更快地獲取信息,網(wǎng)站提供RSS輸出,有利于讓用戶獲取網(wǎng)站內(nèi)容的最新更新。網(wǎng)絡用戶可以在客戶端借助于支持RSS的聚合工具軟件,在不打開網(wǎng)站內(nèi)容頁面的情況下閱讀支持RSS輸出的網(wǎng)站內(nèi)容[1]。
2 文獻數(shù)據(jù)來源分析
2.1 檢索詞分析
利用中國知網(wǎng)CNKI(http://www.cnki.net/)的《中國期刊全文數(shù)據(jù)庫》(簡稱CJFD)(http://acad.cnki.net/Kns55/brief/result.aspx?dbPrefix=CJFQ)為數(shù)據(jù)來源,進入中國學術(shù)期刊網(wǎng)絡總庫標準檢索界面,圖一為檢索界面的截圖。檢索方式檢索項為“主題含圖書館并且包含RSS”或者“篇名含圖書館并且包含RSS”或者“摘要含圖書館并且包含RSS”期刊年限為“不限到2011年”,匹配方式均為模糊匹配,在所有的學科領(lǐng)域中進行檢索,共檢出302條記錄。
2.2 統(tǒng)計方法
首先將檢索結(jié)果以NoteExpress格式進行輸出并導入NoteExpress2.0軟件中進行處理。通過對作者、年份、標題三個字段進行查重(其中3篇文獻重復,其中1篇為作者、年份、標題、期刊、年、卷、期等數(shù)據(jù)均重復,是完全重復數(shù)據(jù);另兩條數(shù)據(jù)不完全重復,作者、年份、標題三個字段完全相同,發(fā)表在不同的期刊上。為了保持統(tǒng)計的完整性,僅剔出完全相同的一條數(shù)據(jù),得到301條有效記錄。在對作者字段進行統(tǒng)計分析時發(fā)現(xiàn)301條記錄中其中有兩條無作者字段,通過進行原文查找發(fā)現(xiàn)這兩篇均為期刊的簡要消息介紹不屬于期刊論文的范疇,定義為無效數(shù)據(jù)將它們從樣本中剔除,最終得到209條完全符合要求的數(shù)據(jù)。借助NoteExpress和Excel統(tǒng)計工具,運用排序、分類匯總和統(tǒng)計分析等功能對數(shù)據(jù)進行分析處理,采用文獻計量學的基本方法對所檢出的論文進行分析。
3 RSS技術(shù)在圖書館的研究論文的統(tǒng)計分析
3.1論文年代分布
從圖1為2004-2011年間我國圖書館RSS研究的相關(guān)文獻分布,經(jīng)文獻檢索2004年前我國無圖書館關(guān)于RSS研究的期刊論文發(fā)表,2004年僅1篇相關(guān)期刊論文發(fā)表,2004到2009年期間該類文獻數(shù)量呈現(xiàn)直線上升。年增長量為(2005,8),(2006,17),(2007,11),(2008,11),(2009,19),(2010,-10),(2011,-3)。其中增長數(shù)量最大的為2009年,比2008增加19篇, 2009年的發(fā)文量為67篇達到該類論文發(fā)表數(shù)量的最高峰。從發(fā)文數(shù)量比例上看2006年的發(fā)文量由2005年的9篇上升到26篇幾乎達到了上一年發(fā)文量的3倍,增加了2倍為上升頻率最快的一年。2010年-2011年發(fā)表相關(guān)論文的趨勢有所減緩,下降的幅度并不算大2010年為57篇,比2009年減少了10篇,2011年為54篇比2010減少3篇。
3.2第一作者分析
對299篇有效論文進行論文作者進行統(tǒng)計,共有作者(不區(qū)分作者排名)383人,其中第一作者共有272人即以第一作者發(fā)表相關(guān)論文的人數(shù)為總作者數(shù)的71%。數(shù)據(jù)表明大部分作者以第一作者的身份發(fā)表文章的數(shù)量僅一篇,表明圖書館界對RSS的研究不深入缺少長期跟蹤和研究該技術(shù)的人員。發(fā)文量最多的作者(第一作者)為武漢大學司莉[2],發(fā)表相關(guān)文章4篇,但4篇文章均為WEB2.0技術(shù)在圖書館應用的調(diào)查與分析的文章,以及對RSS的應用情況進行分析。發(fā)文三篇的作者有南開大學吳一平、福州大學林清。吳一平的文章中其中兩篇文章是對圖書館3.0的應用和技術(shù)進行介紹,另一篇文章題為智能聚合技術(shù)在圖書館個性化信息服務中的應用,主要介紹信息聚合技術(shù)的概念、原理、方法[3] 。林清2009年發(fā)表了三篇關(guān)于利用RSS技術(shù)提升圖書館數(shù)字參考咨詢服務的研究文章[4]。
3.3 論文期刊分布
我國圖書館RSS研究的299篇論文全部都標注了期刊名稱,分布在101種期刊中,平均每種期刊刊載2.96篇。載文量最多的為《科技情報開發(fā)與經(jīng)濟》18篇。表1為期刊載文情況表,其中載文量大于等于10篇的期刊有7中占該類期刊數(shù)約 7%,合計載文量100篇占該類文獻總量的33%。表2列出了刊載圖書館RSS研究的論文數(shù)大于5篇的期刊名稱及其刊載論文的數(shù)量。
4 文獻增長規(guī)律分析
根據(jù)檢索到的有效記錄的發(fā)表時間分年匯總得到該類文獻的時間分布并對這些數(shù)據(jù)進行累計得到表3 RSS技術(shù)在圖書館的研究論文的累積情況表。
根據(jù)表1繪制文獻增長曲線圖如圖2所示,橫軸為時間軸,縱軸為發(fā)文量,藍色曲線為每年論文發(fā)文量的文獻曲線圖,位于圖的下方。紅色曲線為累計發(fā)文量曲線圖。利用EXCEL2007的趨勢分析分別對兩個曲線進行指數(shù)、線性、對數(shù)、多項式分析。
4.1 對每年論文發(fā)文量曲線的分析
表4為對該類文獻累計論文發(fā)文量曲線分別進行指數(shù)、線性、對數(shù)、多項式 分析,得到的公式及R平方值的對應關(guān)系表,其中回歸預測中三項式回歸分析R平方值為0.977,擬合度大于指數(shù)、線性、對數(shù)曲線,冪函數(shù)的擬合度,其中冪函數(shù)R平方值均為0.680,指數(shù)函數(shù)的R平方值均為0.679擬合程度最小,顯然指數(shù)函數(shù)與該類文獻增長情況的擬合度小于多項式的擬合程度。
4.2對累計論文發(fā)文量曲線的分析
表5為對該類文獻累計論文發(fā)文量曲線分別進行指數(shù)、線性、對數(shù)、多項式 分析,得到以下公式及R平方值的對應關(guān)系表其中回歸預測中多項式回歸分析R平方值為0.999,擬合度大于指數(shù)、線性、對數(shù)曲線,其中指數(shù)函數(shù)和冪函數(shù)的R平方值均為0.848,顯然指數(shù)函數(shù)與該類文獻增長情況的擬合度小于多項式的擬合程度。
5 分析
邱均平、劉華華在網(wǎng)絡信息計量學的文獻計量規(guī)律及發(fā)展現(xiàn)狀研究里利用SPSS軟件分析網(wǎng)絡信息計量學文獻增長曲線得到網(wǎng)絡信息計量學文獻增長曲線與冪乘曲線擬合得更好, SPSS 軟件分析顯示其擬合度為0.998,并指出在某一學科發(fā)展的初期,指數(shù)增長規(guī)律并不適用于該學科的文獻增長情況[5]。在本論文的分析中指數(shù)增長規(guī)律也不適用于圖書館RSS研究的文獻增長情況,但也不符合冪函數(shù)規(guī)律。擬合度最好的為三項式曲線,多項式曲線最地反映我國圖書館RSS研究的文獻的增長情況,作者由此猜想學科初期的文獻增長規(guī)律可能會服從不同的函數(shù)的關(guān)系,里面涉及的關(guān)系和問題可以做進一步的分析和探討。
參考文獻:
[1]http://baike.baidu.com/subview/1644/7031575.htm?fr=aladdin.
[2]司莉,譚儀,邢文明,等.Web2.0技術(shù)在美國州立公共圖書館應用的調(diào)查與分析[J].情報科學,2011(7):1036-1040.
[3]吳一平.智能聚合技術(shù)在圖書館個性化信息服務中的應用[J]. 圖書館工作與研究,2008(11).
[4]林清.利用RSS技術(shù)提升圖書館數(shù)字化參考咨詢服務[J]. 情報探索,2009(4).
[5]邱均平,劉華華.網(wǎng)絡信息計量學的文獻計量規(guī)律及發(fā)展現(xiàn)狀研究[J]. 圖書館論壇,2009(6).