田質(zhì)兵 (南京郵電大學(xué)圖書館 江蘇 南京 210003)
隨著開放存取運動在全球范圍內(nèi)的廣泛發(fā)展,學(xué)術(shù)出版、交流朝著多樣化的方向發(fā)展,除傳統(tǒng)的學(xué)術(shù)期刊之外,開放存取期刊、機構(gòu)知識庫、學(xué)科知識庫等都成為了重要的學(xué)術(shù)信息源,且與傳統(tǒng)學(xué)術(shù)期刊相比,這些信息源基本都免費開放。
Google 是全球知名的搜索引擎公司,2004年,該公司推出了Google Scholar(Beta版)(以下簡稱GS),為用戶搜索互聯(lián)網(wǎng)中的免費學(xué)術(shù)信息資源提供了一條新的途徑。GS以“Stand on the shoulders of giants”(站在巨人的肩膀上)作為宗旨,為所有互聯(lián)網(wǎng)用戶提供學(xué)術(shù)信息搜索。該學(xué)術(shù)搜索引擎不僅可以搜索普通網(wǎng)頁中的學(xué)術(shù)論文,還可以搜索同行評議論文、學(xué)位論文、圖書、預(yù)印本、文摘、技術(shù)報告等多種文獻,文獻來源包括學(xué)術(shù)出版物、專業(yè)學(xué)會網(wǎng)站、預(yù)印本庫、機構(gòu)知識庫,內(nèi)容從醫(yī)學(xué)、物理學(xué)到經(jīng)濟學(xué)、計算機科學(xué)等,橫跨眾多學(xué)術(shù)領(lǐng)域[1]。
GS的推出迅速受到了各方的關(guān)注,尤其是信息管理領(lǐng)域,眾多學(xué)者從不同角度對GS展開了研究。為了解幾年來GS研究的整體狀況,筆者選擇信息管理領(lǐng)域最權(quán)威的文摘數(shù)據(jù)庫LISA(Library and Information Science Abstracts,圖書館學(xué)和情報學(xué)文摘)為文獻源,采用文獻計量學(xué)的方法對搜集到的信息進行計量分析。LISA收錄了自1969年以來的全球60多個國家20多種語言的550多種期刊的摘要,并且每兩個星期更新一次[2]。因此,通過LISA可以較全面、快捷地了解到信息管理領(lǐng)域中GS的研究總貌。
2009年12月25日,筆者通過檢索式“KW =google scholar OR TI =(google AND scholar)”在LISA中進行檢索,共得到文獻203篇,手工剔除相關(guān)性較低的文獻,最后得到文獻189篇。
通過對一個主題的研究論文在時間上分布的分析,可以在一定程度上反映該領(lǐng)域?qū)W術(shù)研究的理論水平和發(fā)展速度。2004年至今的189篇文獻的發(fā)表時間見圖1。
圖1 2004-2009 年GS研究文獻量及發(fā)表時間分布
從圖1可以看出:①GS的推出迅速引起了信息管理領(lǐng)域?qū)W者的廣泛關(guān)注,Google公司于2004年11月推出GS,2005年LISA中就有48篇文獻與此主題緊密相關(guān)就充分說明這一點,而2005年的文獻量是6年來的最高峰。分析其原因,這應(yīng)該與GS定位于學(xué)術(shù)搜索,直指圖書館信息檢索與服務(wù)的核心功能有關(guān)。GS的推出讓圖書館第一時間感受到了競爭的壓力,因此廣泛關(guān)注也不足為奇。最早的文獻是來自于Ralph L S于2004年發(fā)表在North Carolina Libraries的“Two New Search Engines: MSN Search/Beta and Google Scholar ”(兩個新的搜索引擎:MSN搜索和Google Scholar),該文分析了GS和MSN Search兩個搜索引擎的收錄范圍及檢索性能,并討論了這兩個搜索引擎的定位及服務(wù)對象[3]。②2006年至今的文獻量基本保持穩(wěn)定,說明界內(nèi)學(xué)者對GS還在持續(xù)關(guān)注,但是隨著對GS認(rèn)識的加深,界內(nèi)學(xué)者當(dāng)初的壓力及危機感有所緩解,因此文獻量相對于2005年來說,略有下降。
根據(jù)文獻的集中分散規(guī)律,某一研究領(lǐng)域的大部分文獻相對集中在少數(shù)期刊上,而剩余的文獻則依次分散在其他大量的相關(guān)期刊上。因此,分析論文的來源期刊是了解本領(lǐng)域文獻的空間分布特點和掌握本領(lǐng)域核心期刊的最有效方法,同時也有助于人們集中注意力,了解掌握該領(lǐng)域的主要研究成果[4]。
據(jù)統(tǒng)計,189篇論文分別發(fā)表在86份期刊上,其中有49份期刊僅刊載了1篇相關(guān)文獻,占總數(shù)的56.98%,這說明了GS確實引起了廣泛的關(guān)注,同時也在某種程度上表明GS并未受到眾多期刊的持續(xù)關(guān)注。有15份期刊發(fā)表了2篇與此相關(guān)的論文,發(fā)表3篇、4篇和5篇論文的分別有7份、6份和3份期刊。此外,有6份期刊發(fā)表6篇及以上的相關(guān)論文。在此,筆者將這6份期刊作為GS研究領(lǐng)域的核心期刊(見表1)。
表1 GS研究的核心期刊
從表1 可以看出,英國和美國的期刊表現(xiàn)出色,排在首位的是英國期刊,而6份期刊中有4份是美國期刊,因此可以說英美兩國是GS研究的主要陣地。6份期刊中, Online Information Review、 Journal of the American Society for Information Science and Technology和Online均被SSCI(Social Sciences Citation Index,社會科學(xué)引文索引)收錄,2008年在JCR(Journal Citation Reports,期刊引用報告)中的影響因子分別達到1.103、1.954和0.352,在SSCI收錄的信息與圖書館學(xué)的61份期刊中,分別排在第25、12和49位[5]。該主題的研究受到高質(zhì)量期刊的青睞,從期刊的層面上說明了GS研究具備了較好的學(xué)術(shù)水平。
LISA數(shù)據(jù)庫收錄了60多個國家的期刊,包括多種語言。因此,可對論文發(fā)表的語言進行分析,以了解相關(guān)學(xué)者使用語言的特點,并以此管窺GS研究的地域特征。
表2 GS研究論文語種分布
從表2可以看出:①英語毫無爭議地位列第一,是大多數(shù)作者采用的第一語言,189篇中有164篇用英文寫成,占總數(shù)的86.77%。不過應(yīng)當(dāng)注意的是,其中很多文獻是非英語國家的作者用英語撰寫并發(fā)表在英文期刊上的。②其他語言中包括了歐洲國家的丹麥語、德語、荷蘭語、法語、意大利語、波蘭語和西班牙語,說明歐洲是除美國之外的GS研究的主要陣地。③語種當(dāng)中比較意外地出現(xiàn)了波斯語,再一次說明GS在全球范圍內(nèi)引起了廣泛的關(guān)注。④東亞語系中只有日語文章,說明該地區(qū)整體水平不高,尤其是中國,雖然近幾年GS已經(jīng)成為我國圖書情報界研究的熱點之一,但沒有中文文獻被LISA收錄,這固然與LISA的來源期刊有關(guān),但也從一個側(cè)面說明國內(nèi)研究水平有待提高。
對論文作者進行分析有利于了解GS研究的現(xiàn)有狀況和發(fā)展趨勢。檢索得到的189篇文獻中,除去7篇文獻無作者,共涉及到229名作者(包括合作者)。其中,191位作者只被LISA收錄1篇文章,占總數(shù)的83.41%,發(fā)表2篇論文的作者數(shù)為32(見表3)。
表3 GS研究作者人數(shù)表
從表3可以看出,在GS研究的6年歷程當(dāng)中,還是出現(xiàn)了核心作者,在這里,筆者將發(fā)表3篇及3篇以上的作者認(rèn)為是GS研究的核心作者(見下頁表4)。
從表4可以看出:①6位核心作者中,2位來自美國,2位來自德國,還有一位來自瑞士,一位來自伊朗,這說明這幾個國家確實是研究GS的核心國家。②位列首位的是來自美國夏威夷大學(xué)的Peter J,該作者主要關(guān)注的是GS的性能,包括檢索性能及引文分析性能。如分析GS檢索性能的優(yōu)勢與不足,文章在GS中的被引頻次應(yīng)用于計算h指數(shù)時的優(yōu)勢與不足以及與Web of Science、Scopus等數(shù)據(jù)庫的比較。③讓人稍感意外的是,來自伊朗德黑蘭大學(xué)的Kayvan K發(fā)表了3篇關(guān)于GS的研究論文,由于眾所周知的情況(伊朗戰(zhàn)亂),Kayvan K能對GS持續(xù)關(guān)注,實屬不易。該作者關(guān)注的焦點是GS的引文分析功能,作者分別比較了GS與Web of Science、Google Web/URL等的引文功能。④Michael L C關(guān)注的重點是對Web of Science、Scopus及GS三者的引文功能進行比較分析;Christoph N側(cè)重于對GS的檢索性能測評,如文獻覆蓋情況等;Philipp M與Anne-Kathrin W來自同一個單位,論文也均是合作完成,他們關(guān)注的重點同樣是GS的檢索性能,如文獻覆蓋及更新情況等。
表4 GS研究的核心作者
對文獻主題進行分析有助于我們了解該領(lǐng)域的基本特點及重點內(nèi)容,掌握研究發(fā)展的整體趨勢和規(guī)律。筆者通過閱讀論文題名和摘要并查看部分全文,發(fā)現(xiàn)GS研究主要集中在GS的性能評價(檢索性能評價和引文性能評價)、GS對圖書館的影響及圖書館的應(yīng)對策略、GS的應(yīng)用等領(lǐng)域(見表5)。
GS之所以在信息管理領(lǐng)域受到廣泛關(guān)注,其中最主要的原因是GS的推出對圖書館的現(xiàn)有業(yè)務(wù)產(chǎn)生了深遠的影響,對圖書館的發(fā)展提出了強有力的挑戰(zhàn),因此GS對圖書館的影響以及圖書館的應(yīng)對策略成為最受關(guān)注的核心主題,也就不足為奇了。Bowering M L 和Karen A H于2005年對美國研究圖書館協(xié)會(Association of Research Libraries,簡稱ARL)113所高校成員圖書館網(wǎng)站對待GS的態(tài)度進行調(diào)查,在調(diào)查中提出了“GS是否出現(xiàn)在圖書館網(wǎng)站的主頁上”、“GS是否出現(xiàn)在圖書館所列出的數(shù)據(jù)庫列表上”等9個問題。發(fā)現(xiàn)已有部分圖書館采取相應(yīng)的措施與GS進行合作,但總體來說比例較低[6]。2007 年兩位作者又對此重新進行了調(diào)查,發(fā)現(xiàn)比例明顯提升,表明圖書館越來越重視與GS的合作。兩位作者也強調(diào)GS的推出對圖書館既是機遇又是挑戰(zhàn),圖書館唯有跟上時代的腳步并作出相應(yīng)的變革,方可發(fā)展壯大[7]。
表5 GS研究論文主題分析
GS推出的另外一大亮點就是提供引文鏈接。GS通過自動分析和摘錄引文,將引文作為單獨的結(jié)果加以排列,用戶點擊條目下方的“Cited by…”即可搜索引用該條目的文獻。因此,將常用的引文數(shù)據(jù)庫與GS進行比較成為界內(nèi)關(guān)注的熱點。Abhaya V K等比較分析了醫(yī)學(xué)論文在Web of Science、Scopus及GS三者中的被引頻次,結(jié)果顯示,在Scopus及GS中的被引頻次大大高于在Web of Science中的被引頻次,進一步比較發(fā)現(xiàn),相比于Web of Science,Scopus與GS中的施引文獻更多的是非英語文獻[8]。Kayvan K和Mike T以ISI 2001年收錄的生物學(xué)、化學(xué)、物理學(xué)與計算機科學(xué)當(dāng)中的39份開放存取期刊為樣本,分析了其在GS中出現(xiàn)但沒有在Web of Science中出現(xiàn)的引文。結(jié)論認(rèn)為,相比于Web of Science,GS的優(yōu)勢在于其覆蓋文獻更廣,因而引文量相對更高,并且GS覆蓋了更多的開放存取資源,這也可反映開放存取運動的發(fā)展及所產(chǎn)生的學(xué)術(shù)影響[9]。
GS定位于學(xué)術(shù)搜索引擎,因此其檢索性能或者說搜索性能自然受到學(xué)者的關(guān)注,有33篇文獻與此緊密相關(guān),占總數(shù)的17.46%。其中,Peter J認(rèn)為,相比于傳統(tǒng)免費學(xué)術(shù)信息服務(wù),GS的最大優(yōu)點在其覆蓋范圍及內(nèi)容上,提供了全文或者部分全文的鏈接,而不僅僅只是目次信息,其覆蓋范圍包括了許多學(xué)術(shù)出版和大學(xué)出版機構(gòu)的資源、學(xué)術(shù)組織及政府組織所擁有的資源以及許多預(yù)印本知識庫,如arXiv.org、RePEc等。但GS也存在著不足,GS并沒有明確說明其覆蓋范圍,用戶并不知道哪些出版機構(gòu)的資源可以搜索,更不用提具體哪一份期刊或者哪一個網(wǎng)站是否被GS覆蓋[10]。 John J M和 Thomas W C將EI Compendex(工程索引)數(shù)據(jù)庫中上世紀(jì)50年代至2007年的所有文獻在GS中進行檢索,以此來考查GS對工程類文獻資源的覆蓋情況,作者以10年為單位考查GS對文獻資源的覆蓋情況,發(fā)現(xiàn)從上世紀(jì)50年代至今,GS的文獻覆蓋率逐步上升,上世紀(jì)90年代起覆蓋率能接近90%[11]。
信息管理領(lǐng)域的學(xué)者在思考圖書館如何應(yīng)對GS的挑戰(zhàn)的同時,也在思考如何將GS應(yīng)用于學(xué)術(shù)評價當(dāng)中。Bhaskar M利用GS來評價圖書館學(xué)與信息學(xué)的開放存取期刊的學(xué)術(shù)影響力。該作者以17份該學(xué)科領(lǐng)域的開放存取期刊為樣本,用GS來獲取其引文數(shù)量,并以此計算期刊影響因子、期刊自引及即時指數(shù)[12]。Harinarayana N S和Vasantha R N以GS為工具,分析了阮岡納贊(S.R. Ranganathan)的經(jīng)典著作《圖書館學(xué)五定律》(Five Laws of Library Science)、《冒號分類法》(Colon Classification)及《圖書分類法導(dǎo)論》(Prole-gomena to Library Classification)的學(xué)術(shù)影響力,并分析了3本著作的高頻引用作者、機構(gòu),引用年代,高頻引用期刊等[13]。
GS除了可以在學(xué)術(shù)評價中應(yīng)用外,實際上還可以在其他領(lǐng)域中應(yīng)用。Virginia A B利用GS來查找工程學(xué)領(lǐng)域論文的引文之全文可獲取性,發(fā)現(xiàn)樣本中化學(xué)工程學(xué)(Chemical Engineering)領(lǐng)域論文的引文有25%可通過GS獲取原文,機械工程學(xué)(Mechanical Engineering)則有15%。作者認(rèn)為利用GS獲取學(xué)術(shù)原文已經(jīng)成為現(xiàn)實[14]。Michael N等利用Google、GS、 OAIster和OpenDOAR來查找開放存取的論文。結(jié)果表明,GS表現(xiàn)最佳,Google表現(xiàn)其次,而OAIster和OpenDOAR的表現(xiàn)讓人失望。最后筆者指出,GS和Google是查找開放存取論文的便捷免費途徑[15]。
從上述分析可以看出,目前國外對GS的研究呈現(xiàn)出以應(yīng)用為導(dǎo)向的特點。相信隨著時間的推移,圖書館與GS的共同發(fā)展以及如何更好地應(yīng)用GS這一學(xué)術(shù)工具將是界內(nèi)關(guān)注的重點。
[1]董文鴛.數(shù)字科研時代的引文分析——基于被引頻次分析的實證研究[J].大學(xué)圖書館學(xué)報,2007(2): 36-39,106.
[2]華薇娜.網(wǎng)絡(luò)學(xué)術(shù)信息資源檢索與利用[M].北京: 國防工業(yè)出版社,2002:170-171.
[3]Ralph L S. Two New Search Engines: MSN Search/Beta and Google Scholar [J]. North Carolina Libraries, 2004 (4):235-236.
[4]袁順波,董文鴛.新世紀(jì)圖書情報界圖像檢索研究總況探析——LISA數(shù)據(jù)庫收錄文獻計量分析[J].圖書情報工作,2005 (9):40-43.
[5]JCR社會科學(xué)版(2008) [EB/OL]. [2009-12-25] .http://admin-apps.isiknowledge.com/JCR/JCR?SID=3DfD4g1HNGpB9b7i5kL.
[6]Bowering M L, Karen A H. Google Scholar and the Library Web Site: The Early Response by ARL Libraries [J]. College & Research Libraries, 2006 (2): 106-122.
[7]Karen A H, Bowering M L. Google Scholar and Academic Libraries:an Update [J]. New Library World, 2008 (5-6): 211-222.
[8]Abhaya V K, Brittany A, Iffat S, et al. Comparisons of Citations in Web of Science, Scopus and Google Scholar for Articles Published in General Medical Journals [J]. Journal of the American Medical Association, 2009 (10):1092-1096.
[9]Kayvan K, Mike T. Sources of Google Scholar Citations Outside the Science Citation Index: a Comparison Between Four Sciences Disciplines [J]. Scientometrics, 2008 (2):273-294.
[10]Peter J. Google Scholar: the Pros and the Cons [J]. Online Information Review, 2005 (2):208-214.
[11]John J M, Thomas W C. Google Scholar's Coverage of the Engineering Literature: an Empirical Study [J]. The Journal of Academic Librarianship, 2008 (3):196-201.
[12]Bhaskar M. Do Open-Access Journals in Library and Information Science Have Any Scholarly Impact? A Bibliometric Study of Selected Open-Access Journals Using Google Scholar[J]. Journal of the American Society for Information Science and Technology,2009 (3):581-594.
[13]Harinarayana N S, Vasantha R N. Citation Analysis of SRR's Works:a Look Through the Window of Google Scholar [J]. Information Studies, 2009 (3):165-178.
[14]Virginia A B. Using Google Scholar to Search for Online Availability of a Cited Article in Engineering Disciplines [EB/OL].[2009-12-25].http://dialnet.unirioja.es/servlet/articulo?codigo=2 914636&orden=197970&info=link.
[15]Michael N, Charles O, Fytto R. Finding Open Access Articles Using Google, Google Scholar, OAIster and OpenDOAR [J]. Online Information Review, 2008 (6):709-715.