,
近年來,由于數(shù)據(jù)庫資源的數(shù)量激增、部分核心外文數(shù)據(jù)庫價格漲幅過高以及人民幣兌外幣匯率波動趨高,導(dǎo)致部分高校缺乏足夠的資金購買所需數(shù)據(jù)庫資源,在數(shù)量和質(zhì)量上已無法滿足學(xué)校教學(xué)科研需求,這給高校圖書館數(shù)字資源建設(shè)提出了嚴(yán)峻挑戰(zhàn)。為了提高數(shù)字資源采購的科學(xué)性, 評價這些數(shù)據(jù)庫的使用顯得尤為重要。
帕累托法則也稱為二八定律或80/20法則,是指在眾多現(xiàn)象中,80%的結(jié)果取決于20%的原因, 這一法則在很多社會領(lǐng)域被廣泛應(yīng)用[1]。Richard L. Trueswell早在1969年首次將帕累托效應(yīng)引入圖書館[2]。 此后,國外有大量的相關(guān)研究[3],如Mangkholien Singson等人在研究印度圖書館采購聯(lián)盟所提供的數(shù)據(jù)庫下載量分布時,發(fā)現(xiàn)電子期刊的使用遵循“80/20” 法則或帕累托效應(yīng)[4]。然而,國內(nèi)學(xué)者在期刊全文數(shù)據(jù)庫的使用率方面的研究[5-9]中,很少結(jié)合帕累托效應(yīng)評估讀者核心需求、指導(dǎo)文獻資源建設(shè),目前僅有暨南大學(xué)的朱前東發(fā)現(xiàn)該校ScienceDirect 數(shù)據(jù)庫的下載量符合帕累托效應(yīng)[10]。驗證Wiley Online Library(WOL)數(shù)據(jù)庫使用中的帕累托效應(yīng)的意義在于通過揭示全文下載量與下載品種之間的不平衡關(guān)系,尋求創(chuàng)新思維意識,體現(xiàn)有所為、有所不為的工作方法[11]。帕累托效應(yīng)的價值主要體現(xiàn)在制定圖書館文獻藏書原則、制定圖書館文獻資源購置比例、圖書館文獻資源共建共享、圖書館文獻剔舊等方面的應(yīng)用[12]。
在數(shù)據(jù)庫中引入帕累托效應(yīng),以動態(tài)發(fā)展的視角,實施文獻資源整合、優(yōu)化、取舍等策略,是圖書館為解決文獻資源購置經(jīng)費短缺性和文獻資源品種多樣性、學(xué)科復(fù)雜性、分布無序性與本單位用戶文獻需求特殊性之間矛盾而產(chǎn)生的一個具有實際意義的研究課題。
本文以中國藥科大學(xué)(以下稱稱“我校”)WOL數(shù)據(jù)庫使用為例, 采用量化的實證法,分析2011 -2015 年全文下載量的期刊分布,并從年下載量的學(xué)科分布情況,SCIE、SSCI 、A&HCI來源期刊收錄情況,我校SCI論文載文情況等方面, 探析了帕累托效形成的原因及對文獻資源建設(shè)、數(shù)據(jù)情報服務(wù)與學(xué)科服務(wù)等方面的啟示。
WOL數(shù)據(jù)庫是John Wiley & Sons Inc 的學(xué)術(shù)出版物在線平臺,提供包括化學(xué)化工﹑生命科學(xué)﹑醫(yī)學(xué)﹑高分子及材料學(xué)等14個學(xué)科領(lǐng)域的學(xué)術(shù)出版物,是中國藥科大學(xué)讀者最熟悉和最常用的外文全文期刊數(shù)據(jù)庫。圖1反映了2011-2015年WOL數(shù)據(jù)庫下載情況。這里的統(tǒng)計數(shù)據(jù)包括訪問網(wǎng)頁(HTML)和下載全文(PDF)兩部分,年下載量按兩部分之和計算。
圖1 中國藥科大學(xué)2011-2015年WOL數(shù)據(jù)庫下載情況
從表1可以看出,我校2011-2015年Wiley全文下載量呈逐年遞增狀態(tài),2011-2015年全文下載量增長了兩倍,可見師生對WOL數(shù)據(jù)庫的使用越來越頻繁。為進一步解析數(shù)據(jù)庫中期刊與下載量之間可能存在的關(guān)系,以至少有一次下載記錄的期刊數(shù)量及網(wǎng)頁訪問為基準(zhǔn)計算。
表1統(tǒng)計了2011-2015年WOL數(shù)據(jù)庫全文下載量前80%的期刊分布情況,分別計算出每年下載量占當(dāng)年下載量80%的期刊總數(shù),及占當(dāng)年已訪期刊總數(shù)之比。結(jié)果表明,10%左右的期刊提供了80%的下載量,2011-2015提分別為9.66%,10.86%,10.47%,7.92%,7.60%。
表1 2011-2015 WOL全文下載占80%下載量分布
以2015年數(shù)據(jù)為例,至少有一次下載記錄的期刊數(shù)量是658種。依據(jù)Wiley提供的數(shù)據(jù),按期刊下載量高到低的順序統(tǒng)計,有50種期刊下載量合計達65 494篇,即占2015全年下載量(81 686篇)的80%。因此,約有7.60%的期刊占全文下載量的80%。
9.3%的期刊產(chǎn)生80%的全文下載,而90.7%的期刊只提供了20%的全文下載。帕累托效應(yīng)理論表現(xiàn)了一種不平衡關(guān)系,即少數(shù)主流的事物可以造成主要的、重大的影響。并非只有20/80的比例才能說明帕累托效應(yīng)出現(xiàn)在了期刊數(shù)據(jù)庫的使用中。帕累托效應(yīng)只說明了一個規(guī)律,而不是絕對的比例分布[13]。由此可見,我校WOL數(shù)據(jù)庫近幾年使用情況基本與帕累托效應(yīng)吻合。為了解釋帕累托效應(yīng),本文下面提到的20%期刊與80%期刊,是指20/80中的20和80部分,并不是實際的數(shù)字。
以WOL數(shù)據(jù)庫收錄的SCIE、SSCI 、A&HCI來源期刊考察下載量與帕累托效應(yīng)可能存在的關(guān)系。本文以2014年的JCR報告為標(biāo)準(zhǔn),以2012-2014年期刊情況為分析對象,統(tǒng)計了2012-2014年WOL數(shù)據(jù)庫使用中的20%和80%期刊分別收錄的SCIE、SSCI 、A&HCI來源期刊的數(shù)量。
這里20%期刊數(shù)量是指下載量達80%的部分,實際并未達到20%,80%期刊數(shù)以此類推。統(tǒng)計結(jié)果見表2。
表2 2012-2014年WOL數(shù)據(jù)庫使用中的20%和80%期刊收錄的來源期刊數(shù)量
由表2可以看出,2012-2014年WOL數(shù)據(jù)庫中20%的期刊收錄SCIE、SSCI、A&HCI來源期刊數(shù)量所占的比例明顯高于其他80%期刊收錄數(shù)量,分別高于80%期刊17.83%、14.56%、10.97%。雖然80%期刊和20%期刊收錄SCIE、SSCI、A&HCI來源期刊的差距逐年縮小,但仍明顯低于20%期刊的收錄情況,說明用戶更傾向選擇質(zhì)量高的全文期刊進行閱讀和下載。這是導(dǎo)致WOL數(shù)據(jù)庫使用中產(chǎn)生帕累托效應(yīng)的部分原因。
當(dāng)SCI來源期刊上刊載了教師或博士研究生的論文時,該來源期刊往往會成為相關(guān)師生的關(guān)注對象。為考察WOL數(shù)據(jù)庫收錄我校SCI論文情況與20%、80%期刊可能存在的關(guān)系,沿用前面關(guān)于20%、80%期刊的表述,通過檢索WOS,統(tǒng)計了2012-2014年20%期刊和80%期刊刊載我校SCI論文情況(表3)。
從表3中可以看出,20%期刊刊載中國藥科大學(xué)論文的期刊數(shù)量和論文的篇數(shù),均遠遠高于80%期刊的刊載數(shù)量和篇數(shù)。2012年20%期刊中刊載我校論文的期刊數(shù)量和刊載的論文篇數(shù)分別為80%期刊的7.5倍和5.4倍,2013年的20%期刊中刊載我校論文的期刊數(shù)量和刊載的論文篇數(shù)分別為80%期刊的3.5倍和2.6倍,2014年20%期刊中刊載我校論文的期刊數(shù)量和刊載的論文篇數(shù)分別為80%期刊的1.5倍和1.83倍。由此可見,雖然20%期刊和80%期刊在刊載論文的期刊數(shù)量和論文篇數(shù)方面的差距逐年減小,但20%期刊刊載我校論文的期刊數(shù)量和論文篇數(shù)上仍要大大高于80%期刊。
表3 2012-2014年WOL數(shù)據(jù)庫20%期刊和80%期刊刊載中國藥科大學(xué)SCI論文
由此可以說明,刊載我校論文的SCI來源期刊更受讀者的關(guān)注和使用,是在WOL數(shù)據(jù)庫使用中產(chǎn)生帕累托效應(yīng)的部分原因。
表4統(tǒng)計了2011-2015年下載頻次前20期刊的下載量,以探析WOL數(shù)據(jù)庫期刊高頻下載的成因。
表4 2011-2015年WOL數(shù)據(jù)庫中前20種期刊的下載量/次
從表4可見,2011-2015年前20名期刊下載總量逐年增加,其中AngewandteChemieInternationalEdition從2011-2015年都占據(jù)全文下載量的第1位,且占全文年下載量的比例逐年遞增;其余年度下載量較高的還有Chemistry-AEuropeanJournal,JournalofPharmaceuticalSciences等期刊。因此,有必要進一步對以上期刊進行數(shù)據(jù)挖掘,探究其高頻下載原因。
我校校內(nèi)師生是全文電子期刊的主要使用者,科研、學(xué)術(shù)討論、發(fā)表學(xué)術(shù)論文、撰寫畢業(yè)論文等都需要下載一定數(shù)量的相關(guān)文獻,所下載的文獻往往與師生所屬的專業(yè)和研究方向有很大關(guān)系。為探尋期刊高頻下載量的成因,本文進對上述24種期刊的研究方向、期刊影響因子等指標(biāo)進行了統(tǒng)計(表5)。
從表5可以看出,出版國別包括英國(10種)、德國(7種)、美國(3種)、瑞士(3種)、日本(1種)。期刊平均影響因子為4.2,按期刊研究方向包括有機化學(xué)(6種)、生物化學(xué)(3種)、分析化學(xué)(8種)、藥理及制藥(8種)、臨床醫(yī)學(xué)(6種)、無機化學(xué)(3種)、納米化學(xué)(1種)、計算化學(xué)(1種)。這與我校學(xué)科設(shè)置及學(xué)科重點發(fā)展方向是一致的。
中國藥科大學(xué)是一所以藥學(xué)為特色的學(xué)校,目前設(shè)有天然藥物活性組分與藥效、藥物代謝動力學(xué)、藥物分子設(shè)計與成藥性優(yōu)化、腫瘤發(fā)生與干預(yù)等重點實驗室及新藥篩選中心。
藥學(xué)為國家重點一級學(xué)科,藥物化學(xué)、生藥學(xué)、藥劑學(xué)、藥物分析學(xué)、藥理學(xué)、微生物與生化藥學(xué)為國家重點二級學(xué)科。由此可,學(xué)術(shù)期刊的主要使用人群,如學(xué)校重點和優(yōu)勢學(xué)科的師生以及實驗室的研究人員,是導(dǎo)致全文電子期刊數(shù)據(jù)庫使用過程中產(chǎn)生帕累托效應(yīng)的重要原因。
表5 2011-2015年WOL24種高頻下載期刊研究方向
通過上述分析,驗證了期刊全文數(shù)據(jù)庫使用中產(chǎn)生的帕累托效應(yīng)。帕累托效應(yīng)也是經(jīng)驗定律。理論上,20%的期刊對應(yīng)80%的下載量;實踐中,80%的下載量對應(yīng)20%的期刊,10%-30%的期刊也可接受。暨南大學(xué)2007-2009年SD數(shù)據(jù)庫全文下載量分布,80%下載量的期刊占期刊總數(shù)比例分別為27.67%、21.03%、23.72%[14];我們統(tǒng)計的2011-2013年WOL數(shù)據(jù)庫80%下載量的期刊占期刊總數(shù)為9.66%、10.86%、10.47%,兩者平均值相差13.81%,均在可接受的范圍,兩者分布符合帕累托法則。本文因受學(xué)科專業(yè)及研究方向等的限制,使分析結(jié)果與綜合性院校暨南大學(xué)有所區(qū)別,但可在醫(yī)藥??圃盒V衅鸬揭欢ǖ氖痉蹲饔谩?/p>
目前,全國醫(yī)學(xué)門類專業(yè)的普通高等本科院校約有280余所,根據(jù)DRAA高校數(shù)字資源采購聯(lián)盟的最新統(tǒng)計,我國引進的醫(yī)學(xué)相關(guān)專業(yè)期刊全文數(shù)據(jù)庫有128個。針對醫(yī)學(xué)院校圖書館引進全文數(shù)據(jù)庫資源,根據(jù)各校的實際情況,應(yīng)充分考慮數(shù)據(jù)庫的質(zhì)量和使用對象。 從WOL數(shù)據(jù)庫使用中產(chǎn)生的帕累托效應(yīng)可以看出,文獻質(zhì)量和使用對象的需求在很大程度上決定了資源的使用情況。因此,醫(yī)學(xué)院校在引進數(shù)字資源時要先評估數(shù)據(jù)庫的質(zhì)量,然后分析試用期間的使用數(shù)據(jù),在綜合考慮數(shù)據(jù)庫質(zhì)量和用戶使用情況后,結(jié)合已購資源學(xué)科分布、重復(fù)情況等因素決定是否購買。中國藥科大學(xué)讀者群體在使用WOL期刊數(shù)據(jù)庫時,帕累托效應(yīng)表現(xiàn)得極為明顯,體現(xiàn)在少于20%的期刊提供了80%的下載量。我校在實際集團采購WOL數(shù)據(jù)庫中選擇了包庫選刊方案。以2015年為例,購買了WOL的82種刊,有近50種刊合計下載量達到了當(dāng)年的80%。這50種刊只占了已訪問刊658種的7.6%。以相對少的經(jīng)費購置了高頻使用的期刊數(shù)據(jù),說明我校的外文全文數(shù)據(jù)庫采購策略是成功的??疾鞌?shù)據(jù)庫使用的分布情況,是圖書館數(shù)據(jù)庫購置策略的一個重要方面。 對于醫(yī)學(xué)??茖W(xué)校而言,選擇一個合適的數(shù)據(jù)庫定價模式越來越重要。 如果20 %的期刊相對集中于某個或數(shù)個學(xué)科, 應(yīng)當(dāng)努力爭取按學(xué)科子庫進行購買。 這樣不僅可以節(jié)省數(shù)字資源購置經(jīng)費, 還可以發(fā)揮數(shù)字資源最大使用價值。
此外,期刊采購是圖書館運行中最繁瑣的內(nèi)容之一,需要投入大量的人力、物力、財力,而帕累托效應(yīng)的分析及應(yīng)用可以給予很大的幫助。對中國藥科大學(xué)WOL數(shù)據(jù)庫使用中產(chǎn)生的帕累托效應(yīng)的觀察和分析,通過高頻下載量分析可以以較快的速度,確定高頻下載期刊數(shù)量、期刊的研究方向,從而制定部分特色館藏明細,避免了枯燥且復(fù)雜的篩選,或浪費大量時間進行數(shù)據(jù)整理和分析。
WOL數(shù)據(jù)庫中有大于80%的期刊只提供了20%的下載量,。在80%期刊中也有部分高質(zhì)量的期刊,圖書館應(yīng)該深度挖掘這部分?jǐn)?shù)據(jù)的價值。在此基礎(chǔ)上,圖書館可以通過各種途徑即時為科研提供全方位、一站式情報服務(wù),包括文獻傳遞、課題調(diào)研、最新資訊推送、專題檢索、收引查新等,提供快速和高效的文獻保障和信息服務(wù),提高低使用率期刊的使用, 充分發(fā)揮數(shù)字資源的最大使用價值。除此之外,圖書館還可以采取網(wǎng)絡(luò)推介、讀者培訓(xùn)、校內(nèi)通告、期刊導(dǎo)航、期刊投稿指南等方式, 讓讀者熟悉并利用這些期刊, 使其在學(xué)校教學(xué)科研活動中,發(fā)揮更大的作用。
針對WOL數(shù)據(jù)庫高頻下載期刊的研究方向及專項課題研究領(lǐng)域,以有機化學(xué)、生物化學(xué)、分析化學(xué)、藥理及制藥、臨床醫(yī)學(xué)、無機化學(xué)、納米化學(xué)、計算化學(xué)等學(xué)科領(lǐng)域的研究論文、學(xué)術(shù)會議和基金項目作為分析框架和檢索目標(biāo),以中國藥科大學(xué)學(xué)科發(fā)展支撐平臺,提供基于CSCD/SCI 核心期刊數(shù)據(jù)庫、ESI 高被引文獻數(shù)據(jù)庫的學(xué)科發(fā)展趨勢以及國家自然科學(xué)基金(NSFC) 重點資助的醫(yī)藥領(lǐng)域、機構(gòu)、項目分布與研究熱點等學(xué)科評估分析報告,為專項團隊的科學(xué)研究和技術(shù)研發(fā)提供有力的保障。