国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

商業(yè)引文數(shù)據(jù)庫(kù)與開(kāi)放獲取引文系統(tǒng)的比較研究*

2016-11-10 07:19:42蔡明月
數(shù)字圖書(shū)館論壇 2016年10期
關(guān)鍵詞:典藏重復(fù)性搜索引擎

蔡明月

(臺(tái)灣政治大學(xué)圖書(shū)資訊與檔案學(xué)研究所,臺(tái)北 116)

商業(yè)引文數(shù)據(jù)庫(kù)與開(kāi)放獲取引文系統(tǒng)的比較研究*

蔡明月

(臺(tái)灣政治大學(xué)圖書(shū)資訊與檔案學(xué)研究所,臺(tái)北 116)

本文旨在以商業(yè)引文數(shù)據(jù)庫(kù)和開(kāi)放獲取引文系統(tǒng)為研究對(duì)象,深入比較兩種學(xué)術(shù)傳播機(jī)制的特色及涵蓋資源的完整性、重復(fù)性與獨(dú)特性。研究以經(jīng)濟(jì)學(xué)開(kāi)放獲取期刊論文系統(tǒng)Research Papers in Economics收錄的2001—2012年共25位諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主的著作為樣本,采用文獻(xiàn)計(jì)量法,交叉比對(duì)兩兩數(shù)據(jù)庫(kù)的重復(fù)性及獨(dú)特性。所選的6個(gè)數(shù)據(jù)庫(kù)及系統(tǒng),包括商業(yè)引文數(shù)據(jù)庫(kù)Web of Science及Scopus,開(kāi)放獲取引文系統(tǒng)Google Scholar、Microsoft Academic Search、OAIster、OpenDOAR。其中,Google Scholar及Microsoft Academic Search為綜合性學(xué)科搜索引擎系統(tǒng),OAIster、OpenDOAR為匯集式機(jī)構(gòu)典藏系統(tǒng)。研究結(jié)果表明:在數(shù)據(jù)完整性、重復(fù)性和獨(dú)特性上,搜索引擎最優(yōu),其次為商業(yè)引文數(shù)據(jù)庫(kù),再次為匯集式機(jī)構(gòu)典藏系統(tǒng)。

商業(yè)性引文數(shù)據(jù)庫(kù);開(kāi)放獲取引文系統(tǒng);數(shù)據(jù)庫(kù)完整性;數(shù)據(jù)庫(kù)重復(fù)率

1 引言

學(xué)術(shù)研究是國(guó)家發(fā)展的重要基礎(chǔ)。隨著傳播媒體及學(xué)術(shù)傳播方式的改變,學(xué)者傳遞知識(shí)的途徑也不斷演進(jìn)。2000年以來(lái),計(jì)算機(jī)及網(wǎng)絡(luò)的快速發(fā)展,促使信息生產(chǎn)、檢索、傳遞和利用發(fā)生很大變化。商業(yè)機(jī)制與開(kāi)放獲取機(jī)制的引文數(shù)據(jù)庫(kù),皆因?qū)W術(shù)傳播而產(chǎn)生,但其產(chǎn)生的目的和方法不同,因此,本研究旨在通過(guò)商業(yè)引文數(shù)據(jù)庫(kù)和開(kāi)放獲取引文系統(tǒng),深入比較兩種學(xué)術(shù)傳播機(jī)制的特色及涵蓋資源的完整性、重復(fù)性與獨(dú)特性,以期為研究者與圖書(shū)館選擇引文索引資料庫(kù)或引文系統(tǒng)提供參考。此外,基于各系統(tǒng)的評(píng)估結(jié)果,提出學(xué)術(shù)評(píng)鑒指標(biāo)與工具的建議。

2 文獻(xiàn)探討

文獻(xiàn)重復(fù)性及獨(dú)特性相關(guān)研究由Bradford于1937年提出,主要探討期刊文獻(xiàn)被索引摘要工具收錄的重復(fù)性,即引用文獻(xiàn)在2個(gè)以上的數(shù)據(jù)庫(kù)同時(shí)出現(xiàn)的情況;Yerkey等提出的分散理論,也指同主題論文分散在不同數(shù)據(jù)庫(kù)中收錄的情況[1]。Martyn利用Bradford提出的重復(fù)性理論,對(duì)其研究的摘要期刊收錄范圍進(jìn)行分析,發(fā)現(xiàn)超過(guò)一半的文獻(xiàn)被收錄在1個(gè)以上的索引與摘要數(shù)據(jù)庫(kù),認(rèn)為索引與摘要數(shù)據(jù)庫(kù)的重復(fù)性會(huì)導(dǎo)致用戶查詢到重復(fù)數(shù)據(jù),造成人力浪費(fèi)[2]。

Wood等從Biological Abstracts、Chemical Abstracts及Engineering Index數(shù)據(jù)庫(kù)選取14 592種期刊,并對(duì)標(biāo)題字段進(jìn)行分析,結(jié)果顯示:1%的期刊同時(shí)被3個(gè)數(shù)據(jù)庫(kù)收錄,27%的期刊同時(shí)被2個(gè)數(shù)據(jù)庫(kù)收錄,72%的期刊被1個(gè)數(shù)據(jù)庫(kù)收錄,顯示其唯一的獨(dú)特性[3]。

Read等針對(duì)圖書(shū)館與信息科學(xué)領(lǐng)域的數(shù)據(jù)庫(kù)Library and Information Science Abstracts(LISA)、Library Literature and Information Science(LLIS)及Information Science Abstracts(ISA),包含CD-ROM和在線兩種類別數(shù)據(jù)庫(kù)進(jìn)行重復(fù)性研究[4]。結(jié)果顯示,LLIS包含的數(shù)據(jù)最多(30 542篇),ISA最少(5 094篇);在重復(fù)性比較上,LISA和ISA數(shù)據(jù)重復(fù)性為12.2%,LISA和LLIS的數(shù)據(jù)重復(fù)性為10.3%,ISA和LLIS的數(shù)據(jù)重復(fù)性為5.8%,3個(gè)數(shù)據(jù)庫(kù)同時(shí)存在的重復(fù)性數(shù)據(jù)低于3%,由此可知,3個(gè)數(shù)據(jù)庫(kù)的數(shù)據(jù)獨(dú)特性很高。

Walters等對(duì)7個(gè)單一學(xué)科數(shù)據(jù)庫(kù)及5個(gè)跨學(xué)科數(shù)據(jù)庫(kù)作內(nèi)容比較,二者分別收集1990—2000年美國(guó)與加拿大出版的later-life migration主題相關(guān)的數(shù)據(jù),經(jīng)檢驗(yàn)后選取155篇進(jìn)行研究[5],發(fā)現(xiàn)5個(gè)跨學(xué)科數(shù)據(jù)庫(kù)中有4個(gè)數(shù)據(jù)庫(kù)收錄的數(shù)據(jù)比任何單一學(xué)科數(shù)據(jù)庫(kù)收錄的數(shù)據(jù)都要完整,不同數(shù)據(jù)庫(kù)間平均重復(fù)率約45%。

Rather等對(duì)Google、AltaVista、HotBot、Scopus、Bioweb 5個(gè)搜索引擎進(jìn)行重復(fù)性研究[6]。結(jié)果表明,HotBot與其他搜索引擎的平均重復(fù)性最高,其次是Google,另外,復(fù)合和復(fù)雜式的檢索查詢會(huì)產(chǎn)生更多重復(fù)結(jié)果。

Esmaeil等研究比較searchenginewatch.com網(wǎng)站介紹的6個(gè)常用搜索引擎系統(tǒng)及數(shù)據(jù)庫(kù)的重復(fù)性[7]。研究發(fā)現(xiàn),在不同的搜索引擎系統(tǒng)中,Yahoo與其他搜索引擎系統(tǒng)的平均重復(fù)率最高(約40%);Curry Guide檢索物理學(xué)類文獻(xiàn)的召回率為77%,與其他5個(gè)系統(tǒng)的平均重復(fù)率約44%。

Wang等以乳腺癌為檢索詞對(duì)Google、Yahoo、Bing和Ask.com進(jìn)行分析比較[8]。研究結(jié)果顯示,4個(gè)搜索引擎對(duì)乳腺癌的6個(gè)標(biāo)準(zhǔn)檢索結(jié)果均排列前30名。從有效性看,Google最好,其次為Bing與Ask.com,最差為Yahoo;從重復(fù)性看,各搜索引擎兩兩對(duì)比,其收錄數(shù)據(jù)重復(fù)性均超過(guò)50%;從內(nèi)容看,4個(gè)搜索引擎皆強(qiáng)調(diào)不同類型的內(nèi)容;從使用者滿意度看,Bing的滿意度最好,其次為Yahoo與Google,最差的是Ask.com。研究認(rèn)為依據(jù)不同的信息類型需求,選取適合的搜索引擎才能事半功倍。

重復(fù)性與獨(dú)特性的研究范圍十分廣泛,既包括出版社、數(shù)據(jù)庫(kù)與搜索引擎等數(shù)據(jù)源提供者,也包括各種數(shù)據(jù)源類型(如期刊、專利、網(wǎng)絡(luò)資源等)。重復(fù)性和獨(dú)特性的優(yōu)劣,是圖書(shū)館選擇索引與摘要數(shù)據(jù)庫(kù)的重要依據(jù)。

3 研究方法

本研究采用文獻(xiàn)探討法及文獻(xiàn)計(jì)量法比較Web of Science、Scopus、Google Scholar、Microsoft Academic Search、OAIster、OpenDOAR數(shù)據(jù)庫(kù)及系統(tǒng),以RePEc的IDEAS系統(tǒng)提供的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主2001—2012年的文獻(xiàn)清單為基準(zhǔn)[9],針對(duì)上述各數(shù)據(jù)庫(kù)及系統(tǒng)進(jìn)行文獻(xiàn)核對(duì);利用Excel工具并輔以人工方式加以查證,評(píng)鑒各數(shù)據(jù)庫(kù)及系統(tǒng)的完整性;再用兩兩交叉比對(duì)的方式比較各數(shù)據(jù)庫(kù)及系統(tǒng)間的重復(fù)性及獨(dú)特性,評(píng)鑒其優(yōu)劣。一般而言,數(shù)據(jù)庫(kù)評(píng)鑒的假設(shè):收錄數(shù)據(jù)越完整,與其他數(shù)據(jù)庫(kù)重復(fù)率越低,說(shuō)明其獨(dú)特性越高,涵蓋數(shù)據(jù)范圍越優(yōu)異。

RePEc用戶使用的界面為IDEAS,IDEAS特別設(shè)置諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主所著的圖書(shū)及各類文獻(xiàn),并在每月的第1天更新諾貝爾得主的文獻(xiàn)清單[10]。本研究考慮期刊文獻(xiàn)為學(xué)術(shù)傳播的主體,因此,圖書(shū)、網(wǎng)站資源、數(shù)字資源等皆不列入本研究范圍。

4 研究結(jié)果

本文就商業(yè)引文數(shù)據(jù)庫(kù)及開(kāi)放獲取引文系統(tǒng)現(xiàn)況與特性、完整性、重復(fù)性與獨(dú)特性進(jìn)行研究分析。

4.1商業(yè)引文數(shù)據(jù)庫(kù)及開(kāi)放獲取引文系統(tǒng)現(xiàn)況與特性

商業(yè)數(shù)據(jù)庫(kù)受營(yíng)利性出版商的建設(shè)和定期維護(hù),具有數(shù)據(jù)完整、學(xué)科范圍多元且選擇數(shù)據(jù)政策嚴(yán)謹(jǐn)?shù)忍厣虼似鋽?shù)據(jù)具有權(quán)威性。

4.1.1商業(yè)引文數(shù)據(jù)庫(kù)

(1)Web of Science為美國(guó)湯森路透(Thomson Reuters)于1997年建立的網(wǎng)絡(luò)版引文索引數(shù)據(jù)庫(kù),提供理、工、醫(yī)、農(nóng)、人文及社會(huì)科學(xué)等各學(xué)科領(lǐng)域的文獻(xiàn)書(shū)目、摘要及引用文獻(xiàn)等資料,收錄期刊超過(guò)1.3萬(wàn)種,更新頻率為1次/周[11]。該數(shù)據(jù)庫(kù)特有的文獻(xiàn)間相互引用關(guān)系檢索,可提供研究人員更完整的研究參考信息,使其可依循前人研究軌跡,進(jìn)一步了解同行及競(jìng)爭(zhēng)對(duì)手的研究。

(2)Scopus是由Elsevier公司于2002年建立,2004年11月正式推出的索引摘要數(shù)據(jù)庫(kù)。截至2016年1月,Scopus收錄超過(guò)2.1萬(wàn)種同行評(píng)審期刊(包含4 200種開(kāi)放獲取期刊),且有超過(guò)5 000條國(guó)際出版社提供的摘要與引文索引(更新頻率1次/天),包括文獻(xiàn)紀(jì)錄6 000萬(wàn)篇,回溯建檔文獻(xiàn)2 200萬(wàn)篇;內(nèi)容包括學(xué)術(shù)期刊、會(huì)議論文及書(shū)評(píng)等。通過(guò)Scopus讀者可檢索到廣泛的人文與藝術(shù)領(lǐng)域、社會(huì)科學(xué)及生命科學(xué)領(lǐng)域等學(xué)術(shù)文獻(xiàn),并通過(guò)單一接口提供整合檢索的功能。Scopus收錄論文除依據(jù)使用者意見(jiàn)外還遵循①收錄文獻(xiàn)必須為學(xué)術(shù)性刊物;②收錄期刊需有同行評(píng)審制度,以確保論文質(zhì)量;③論文必需提供英文摘要,且期刊必須定期出版,以保持資料庫(kù)收錄文獻(xiàn)的穩(wěn)定性[12]。

4.1.2綜合性學(xué)科搜索引擎

(1)Google Scholar于2004年開(kāi)始運(yùn)營(yíng),是免費(fèi)的學(xué)術(shù)文獻(xiàn)檢索系統(tǒng)。其利用爬蟲(chóng)(crawlers)在各合作者的資料庫(kù)和網(wǎng)絡(luò)中漫游獲取文獻(xiàn)資料,包含①許多大型且知名的出版者和大學(xué)機(jī)構(gòu)(如美國(guó)電子電機(jī)工程師學(xué)會(huì)等)的資料庫(kù);②數(shù)位主機(jī)(如HighWire Press、MetaPress、Ingenta等);③政府及其他學(xué)術(shù)組織和政府基金會(huì)(如美國(guó)物理學(xué)會(huì)、國(guó)家衛(wèi)生研究院等);④預(yù)印、重印服務(wù)者(如arXiv.org、Astrophysics Data System、RePEc及CiteBase等)[13]。此外,Google Scholar也歡迎個(gè)人用戶將其作品及個(gè)人資料庫(kù)加入其爬蟲(chóng)清單。Google Scholar收錄資料類型包含同行評(píng)審論文、學(xué)位論文、圖書(shū)、預(yù)印本、摘要、技術(shù)報(bào)告、電子刊物等;按照出版物來(lái)源劃分,包含學(xué)術(shù)出版方、專業(yè)學(xué)會(huì)、預(yù)印本寄存出版商、大學(xué)機(jī)構(gòu)及網(wǎng)絡(luò)資源等;按照提供管道劃分,包含出版社付費(fèi)取用、開(kāi)放取閱信息及圖書(shū)館登入取用信息等[14]。

(2)Microsoft Academic Search是微軟亞洲研究院于2009年開(kāi)發(fā)的開(kāi)放獲取學(xué)術(shù)搜索引擎系統(tǒng)。自2012年不更新系統(tǒng)收錄的內(nèi)容[15],其提供超過(guò)1.5億篇文獻(xiàn),及數(shù)十億學(xué)術(shù)圖、表與文獻(xiàn)的鏈接,以知識(shí)概念和語(yǔ)意網(wǎng)作為其檢索系統(tǒng)的基礎(chǔ),改進(jìn)系統(tǒng)檢索方式,并強(qiáng)化與外部全文的連結(jié)。因此,Microsoft Academic Search的學(xué)術(shù)檢索除提供相關(guān)學(xué)術(shù)文獻(xiàn)外,還在頁(yè)面顯示相關(guān)研究者、研究機(jī)構(gòu)、會(huì)議、期刊等學(xué)術(shù)信息,以構(gòu)建學(xué)術(shù)網(wǎng)絡(luò)社群,推動(dòng)學(xué)術(shù)傳播[16]。另外,與傳統(tǒng)搜索引擎系統(tǒng)相比,其開(kāi)發(fā)時(shí)參考H指數(shù)排名,因此系統(tǒng)能查找到不同領(lǐng)域內(nèi)H指數(shù)較高的科學(xué)家或期刊文獻(xiàn)。

4.1.3匯集式機(jī)構(gòu)典藏系統(tǒng)

(1)開(kāi)放存取知識(shí)庫(kù)名錄(the Directory of Open Access Repositories,OpenDOAR)旨在利用全球性開(kāi)放獲取系統(tǒng)進(jìn)行數(shù)據(jù)搜集、組織及傳遞,提高開(kāi)放獲取資源的取用效益,推動(dòng)開(kāi)放獲取的發(fā)展。OpenDOAR受開(kāi)放社會(huì)研究所、英國(guó)聯(lián)合信息系統(tǒng)委員會(huì)、英國(guó)大學(xué)學(xué)術(shù)圖書(shū)館聯(lián)盟、歐洲學(xué)術(shù)出版與學(xué)術(shù)資源聯(lián)盟資助,由英國(guó)諾丁漢大學(xué)和瑞典蘭德大學(xué)于2005年共同創(chuàng)辦。此外,OpenDOAR和開(kāi)放獲取期刊指南(Directory of Open Access Journals,DOAJ)并列為當(dāng)前開(kāi)放獲取學(xué)術(shù)資源檢索的主要平臺(tái),其數(shù)據(jù)類型包含期刊論文、會(huì)議論文、學(xué)位論文、技術(shù)報(bào)告、專利數(shù)據(jù)、學(xué)習(xí)資源、多媒體資源、數(shù)據(jù)集、工作手稿及數(shù)據(jù)、預(yù)印本等,涵蓋29個(gè)學(xué)科領(lǐng)域[17]。截至2016年6月,有超過(guò)3 000家研究機(jī)構(gòu)參與該系統(tǒng)建設(shè),包含3 099個(gè)數(shù)據(jù)庫(kù),其中有2 621個(gè)數(shù)據(jù)庫(kù)為機(jī)構(gòu)典藏?cái)?shù)據(jù)庫(kù),并以美國(guó)、英國(guó)、日本及德國(guó)的機(jī)構(gòu)典藏?cái)?shù)據(jù)庫(kù)為主,四者共占總數(shù)35.6%[18]。

(2)OAIster為美國(guó)密歇根大學(xué)圖書(shū)館于2002年建立的匯集式機(jī)構(gòu)典藏資源聯(lián)合目錄系統(tǒng)。主要提供數(shù)字資源搜尋服務(wù),其典藏雖非自身產(chǎn)出的數(shù)字內(nèi)容,但目標(biāo)是建立開(kāi)放獲取的數(shù)字資源,使散布在網(wǎng)絡(luò)的學(xué)術(shù)性數(shù)字資源被方便地檢索使用。為擴(kuò)大系統(tǒng)使用率及曝光度,2009年10月,密歇根大學(xué)將OAIster資料移至Online Computer Library Center,使全球使用者可通過(guò)WorldCat.org檢索OAIster的資料。OAIster收錄資料類型包括圖書(shū)、學(xué)位論文、期刊論文、研究報(bào)告、報(bào)紙、手稿、聲音文件、圖片、圖像文件、統(tǒng)計(jì)資料等[19]。OAIster包含全球1 500多所機(jī)構(gòu)提供的數(shù)字資源,數(shù)據(jù)超過(guò)3 000萬(wàn)篇(部分電子全文)。

綜上所述,商業(yè)引文數(shù)據(jù)庫(kù)的成立宗旨是為特定用戶建立,而開(kāi)放獲取引文系統(tǒng)是為全球用戶建立;除Google Scholar無(wú)明確收錄范圍,其他數(shù)據(jù)庫(kù)及系統(tǒng)皆有明確收錄范圍;學(xué)科主題皆為綜合性學(xué)科;從時(shí)間看,Web of Science網(wǎng)絡(luò)版建立最早(1997年),Microsoft Academic Search建立最晚(2009年);各商業(yè)引文數(shù)據(jù)庫(kù)及開(kāi)放獲取引文系統(tǒng)皆為全球性,在語(yǔ)言上均為多種語(yǔ)言,并以英文為主。

4.2商業(yè)引文數(shù)據(jù)庫(kù)與開(kāi)放獲取引文系統(tǒng)完整性分析

2001—2012年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主在期刊發(fā)表文獻(xiàn)1 888篇,在商業(yè)引文數(shù)據(jù)庫(kù)Web of Science中檢索到1 034篇文獻(xiàn),占總量的54.77%;Scopus可檢索到1 117篇文獻(xiàn),占總量的59.16%;可見(jiàn)相較Web of Science,Scopus資源擁有量更多。綜合性學(xué)科搜索引擎系統(tǒng)Google Scholar、Microsoft Academic Search及開(kāi)放獲取引文系統(tǒng)OAIster、OpenDOAR所檢索到的文獻(xiàn)數(shù)占諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主發(fā)表文獻(xiàn)總數(shù)的比例分別為94.86%、93.59%、45.13%和28.81%(見(jiàn)表1)??梢?jiàn),搜索引擎的期刊文獻(xiàn)數(shù)據(jù)最豐富,其次是商業(yè)引文數(shù)據(jù)庫(kù),再次是匯集式機(jī)構(gòu)典藏系統(tǒng)。

表1 商業(yè)引文數(shù)據(jù)庫(kù)及開(kāi)放獲取引文系統(tǒng)期刊文獻(xiàn)完整性比較

4.3商業(yè)引文數(shù)據(jù)庫(kù)與開(kāi)放獲取引文系統(tǒng)重復(fù)性分析

4.3.1Web of Science

Web of Science和Scopus檢索到重復(fù)期刊文獻(xiàn)714篇,重復(fù)文獻(xiàn)量占Web of Science含諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)?wù)甙l(fā)表文獻(xiàn)總量的69%,占Scopus的64%。Web of Science與Google Scholar、Microsoft Academic Search、OAIster、OpenDOAR的交叉比較及重復(fù)情況,具體見(jiàn)表2。其中,Web of Science與Google Scholar檢索到重復(fù)的期刊文獻(xiàn)數(shù)量最多,與OpenDOAR重復(fù)的期刊文獻(xiàn)數(shù)量最少;Web of Science在收錄期刊數(shù)據(jù)重復(fù)性的表現(xiàn)不及Scopus、Google Scholar、Microsoft Academic Search,但優(yōu)于OAIster和OpenDOAR。

表2 Web of Science與其他數(shù)據(jù)庫(kù)及系統(tǒng)重復(fù)性比較

4.3.2Scopus

Scopus和Google Scholar檢索到重復(fù)期刊文獻(xiàn)1 085篇,重復(fù)文獻(xiàn)量占Scopus含諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)?wù)甙l(fā)表文獻(xiàn)總量的97%,占Google Scholar的61%。Scopus與Web of Science、Microsoft Academic Search、OAIster、OpenDOAR的交叉比較及重復(fù)情況,具體見(jiàn)表3。其中,Scopus與Google Scholar檢索到重復(fù)的期刊文獻(xiàn)數(shù)量最多,與OpenDOAR重復(fù)的期刊文獻(xiàn)數(shù)量最少;Scopus在收錄期刊文獻(xiàn)數(shù)據(jù)重復(fù)性的表現(xiàn)遠(yuǎn)不及Google Scholar、Microsoft Academic Search,但優(yōu)于Web of Science、OAIster和OpenDOAR。Web of Science、OAIster和OpenDOAR與Scopus的期刊文獻(xiàn)重復(fù)率均不足70%,說(shuō)明其表現(xiàn)雖較差但仍有其重要性。

4.3.3Google Scholar

Google Scholar和Microsoft Academic Search檢索到重復(fù)期刊文獻(xiàn)數(shù)為1 694篇,重復(fù)文獻(xiàn)量占Google Scholar含諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)?wù)甙l(fā)表文獻(xiàn)總量的95%,占Microsoft Academic Search的96%。Google Scholar與Scopus、Web of Science、OAIster、OpenDOAR的交叉比較及重復(fù)情況,具體見(jiàn)表4。其中,Google Scholar與Microsoft Academic Search檢索到重復(fù)的期刊文獻(xiàn)數(shù)量最多,二者收錄期刊文獻(xiàn)數(shù)據(jù)重復(fù)性相近;與OpenDOAR重復(fù)的期刊文獻(xiàn)數(shù)量最少,整體而言,Google Scholar的重復(fù)性表現(xiàn)優(yōu)于其他檢索數(shù)據(jù)庫(kù)及系統(tǒng)。因此,在檢索文獻(xiàn)數(shù)據(jù)時(shí),幾乎可以使用Google Scholar系統(tǒng)替代其他數(shù)據(jù)庫(kù)及系統(tǒng)。e

表3 Scopus與其他數(shù)據(jù)庫(kù)及系統(tǒng)重復(fù)性比較

表4 Google Scholar與其他數(shù)據(jù)庫(kù)及系統(tǒng)重復(fù)性比較

4.3.4Microsoft Academic Search

從表5可見(jiàn),Microsoft Academic Search與Web of Science、Scopus、Google Scholar的重復(fù)文獻(xiàn)量占Microsoft Academic Search含諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)?wù)甙l(fā)表文獻(xiàn)總量的比例與重復(fù)文獻(xiàn)量占各數(shù)據(jù)庫(kù)及系統(tǒng)的比例相比,Microsoft Academic Search的重復(fù)性遠(yuǎn)低于Web of Science與Scopus,僅超出Google Scholar 1%。

Microsoft Academic Search和OAIster重復(fù)文獻(xiàn)量占Microsoft Academic Search含諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)?wù)甙l(fā)表文獻(xiàn)總量的46%,占OAIster的96%;Microsoft Academic Search和OpenDOAR重復(fù)文獻(xiàn)量占Microsoft Academic Search含諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)?wù)甙l(fā)表文獻(xiàn)總量的30%,占OpenDOAR的96%。

雖然Microsoft Academic Search與Google Scholar重復(fù)性相近,但優(yōu)于Scopus、Web of Science、OAIster及OpenDOAR數(shù)據(jù)庫(kù)及系統(tǒng)。

表5 Microsoft Academic Search與其他數(shù)據(jù)庫(kù)及系統(tǒng)重復(fù)性比較

4.3.5OAIster

OAIster和OpenDOAR檢索到重復(fù)期刊文獻(xiàn)331篇,重復(fù)文獻(xiàn)量占OAIster含諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)?wù)甙l(fā)表文獻(xiàn)總量的39%,占OpenDOAR的61%。OAIster與Web of Science、Scopus、Microsoft Academic Search、Google Scholar的交叉比較及重復(fù)情況,具體見(jiàn)表6。

表6 OAIster與其他數(shù)據(jù)庫(kù)及系統(tǒng)重復(fù)性比較

其中,OAIster收錄期刊數(shù)據(jù)重復(fù)性不佳,只優(yōu)于OpenDOAR系統(tǒng),而OpenDOAR整體表現(xiàn)均不及其他數(shù)據(jù)庫(kù)及系統(tǒng)。

通過(guò)期刊文獻(xiàn)數(shù)據(jù)重復(fù)性比較可見(jiàn),搜索引擎優(yōu)于商業(yè)引文數(shù)據(jù)庫(kù),商業(yè)引文數(shù)據(jù)庫(kù)優(yōu)于匯集式機(jī)構(gòu)典藏系統(tǒng)。搜索引擎Google Scholar優(yōu)于Microsoft Academic Search;商業(yè)引文數(shù)據(jù)庫(kù)Scopus優(yōu)于Web of Science;匯集式機(jī)構(gòu)典藏系統(tǒng)OAIster優(yōu)于OpenDOAR。Google Scholar對(duì)Microsoft Academic Search的重復(fù)率最高,近100%,推測(cè)原因?yàn)镚oogle Scholar及Microsoft Academic Search皆為搜索引擎,互相抓取的數(shù)據(jù)范圍基本相同。

4.4商業(yè)引文數(shù)據(jù)庫(kù)與開(kāi)放獲取引文系統(tǒng)獨(dú)特性分析

從表7可見(jiàn),與Scopus相比,Web of Science獨(dú)有的期刊文獻(xiàn)量占Web of Science含諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)?wù)甙l(fā)表文獻(xiàn)總量的31%,Scopus獨(dú)有的文獻(xiàn)占Scopus含諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)?wù)甙l(fā)表文獻(xiàn)總量的36%,二者獨(dú)特性相差不大。各數(shù)據(jù)庫(kù)及系統(tǒng)兩兩獨(dú)特性交叉比較,Web of Science期刊文獻(xiàn)獨(dú)特性與Google Scholar相比,Web of Science獨(dú)特性為2%,Google Scholar獨(dú)特性為43%,可見(jiàn)Web of Science獨(dú)有的期刊文獻(xiàn)資源不及Google Scholar。此外,Web of Science期刊文獻(xiàn)獨(dú)特性也遠(yuǎn)不及Microsoft Academic Search,但優(yōu)于OAIster和OpenDOAR。

表7 商業(yè)引文數(shù)據(jù)庫(kù)及開(kāi)放獲取引文系統(tǒng)期刊文獻(xiàn)獨(dú)特性比較

Scopus與Google Scholar相比,Scopus獨(dú)有的期刊文獻(xiàn)量為32篇,占Scopus含諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)?wù)甙l(fā)表文獻(xiàn)總量的3%;Google Scholar獨(dú)有的期刊文獻(xiàn)量為706篇,占Google Scholar含諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)?wù)甙l(fā)表文獻(xiàn)總量的39%;Scopus獨(dú)有的期刊文獻(xiàn)資源不及Google Scholar。此外,Scopus期刊文獻(xiàn)獨(dú)特性不及Microsoft Academic Search,但優(yōu)于OAIster和OpenDOAR。

Google Scholar與Microsoft Academic Search期刊文獻(xiàn)獨(dú)特性相近,均優(yōu)于Web of Science、Scopus、OAIster、OpenDOAR。匯集式機(jī)構(gòu)典藏系統(tǒng)OAIster和OpenDOAR獨(dú)特性不及其他4個(gè)數(shù)據(jù)庫(kù)及系統(tǒng);二者相比,OAIster期刊文獻(xiàn)獨(dú)特性略優(yōu)于OpenDOAR,推測(cè)原因?yàn)镺penDOAR所擁有數(shù)據(jù)量最少,故對(duì)應(yīng)其獨(dú)特性最低。

綜上所述,本研究中的商業(yè)引文數(shù)據(jù)庫(kù)及開(kāi)放獲取引文系統(tǒng)期刊文獻(xiàn)獨(dú)特性優(yōu)劣順序?yàn)镚oogle Scholar、Microsoft Academic Search、Scopus、Web of Science、OAIster、OpenDOAR。

5 結(jié)論與建議

本研究主要探討各數(shù)據(jù)庫(kù)及系統(tǒng)特性與現(xiàn)況,歸納其優(yōu)、缺點(diǎn),進(jìn)而分析各數(shù)據(jù)庫(kù)及系統(tǒng)的完整性。此外,還進(jìn)一步交叉對(duì)比兩兩數(shù)據(jù)庫(kù)及系統(tǒng)的重復(fù)性及獨(dú)特性。

(1)搜索引擎數(shù)據(jù)完整性優(yōu)于商業(yè)引文數(shù)據(jù)庫(kù),商業(yè)引文數(shù)據(jù)庫(kù)優(yōu)于匯集式機(jī)構(gòu)典藏系統(tǒng)。搜索引擎Google Scholar與Microsoft Academic Search的數(shù)據(jù)相對(duì)完整;Google Scholar因包含各種子系統(tǒng),所以可檢索到多元數(shù)據(jù),在研究中,Google Scholar最常鏈接到的子系統(tǒng)為Google Book及Google Search;Microsoft Academic Search收錄數(shù)據(jù)也非常完整,二者完整性約95%與94%。商業(yè)引文數(shù)據(jù)庫(kù)完整性次之,兩個(gè)數(shù)據(jù)庫(kù)與搜索引擎數(shù)據(jù)量相差均超過(guò)34%。匯集式機(jī)構(gòu)典藏系統(tǒng)完整性表現(xiàn)最差。各數(shù)據(jù)庫(kù)及系統(tǒng)完整性由高到低的順序?yàn)镚oogle Scholar、Microsoft Academic Search、Scopus、Web of Science、OAIster、OpenDOAR。

(2)各數(shù)據(jù)庫(kù)及系統(tǒng)兩兩對(duì)比重復(fù)率后發(fā)現(xiàn),Google Scholar與其他各數(shù)據(jù)庫(kù)及系統(tǒng)重復(fù)文獻(xiàn)量占Google Scholar含諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)?wù)甙l(fā)表文獻(xiàn)總量的比例均低于重復(fù)文獻(xiàn)量占各數(shù)據(jù)庫(kù)及系統(tǒng)的比例,其重復(fù)性最低。其次是Microsoft Academic Search;Scopus的重復(fù)性低于Web of Science、OAIster與OpenDOAR,卻高于Google Scholar、Microsoft Academic Search;Web of Science的重復(fù)性低于OAIster與OpenDOAR,卻高于Scopus、Google Scholar與Microsoft Academic Search;匯集式機(jī)構(gòu)典藏系統(tǒng)OAIster重復(fù)性只低于OpenDOAR,卻遠(yuǎn)高于其他系統(tǒng)與數(shù)據(jù)庫(kù),即OpenDOAR的重復(fù)性是各數(shù)據(jù)庫(kù)及系統(tǒng)中最高的。

(3)各數(shù)據(jù)庫(kù)及系統(tǒng)兩兩對(duì)比獨(dú)特性后發(fā)現(xiàn),綜合性學(xué)科搜索引擎Google Scholar與Microsoft Academic Search獨(dú)特性優(yōu)于商業(yè)引文數(shù)據(jù)庫(kù)Web of Science與Scopus;匯集式機(jī)構(gòu)典藏系統(tǒng)OAIster與OpenDOAR獨(dú)特性較差,其中OAIster獨(dú)特性略優(yōu)于OpenDOAR;商業(yè)引文數(shù)據(jù)庫(kù)的獨(dú)特性則介于搜索引擎與匯集式機(jī)構(gòu)典藏系統(tǒng)之間,獨(dú)特性低于搜索引擎36%—41%,卻超過(guò)匯集式機(jī)構(gòu)典藏系統(tǒng)11%—33%;其中Scopus獨(dú)特性又優(yōu)于Web of Science。換言之,商業(yè)引文數(shù)據(jù)庫(kù)質(zhì)量不及搜索引擎卻優(yōu)于匯集式機(jī)構(gòu)典藏系統(tǒng)。

[1] YERKEY N,GLOGOWSKI M.Scatter of library and information science topics among bibliographic data bases[J].Journal of American Society for Information Science,1990,41(4):245-253.

[2] MARTYN J.Tests on abstracts journals:coverage overlap and indexing[J]. Journal of Documentation,2013,23(1):45-70.

[3] WOOD J L,F(xiàn)LANAGAN C,KENNEDY H E.Overlap in the list of journals monitored by BIOSIS,CAS,EI[J].Journal of the American Society for Information Science,1972,23(1):36-38.

[4] READ E,SMITH C.Searching for library and information science literature:a comparison of coverage in three database[J].Library Computing, 2000,19(1):118-126.

[5] WALTERS W H,WILDER E I.Bibliographic index coverage of a multidisciplinary field[J].Journal of the American Society for Information Science and Technology, 2003,54(14):1305-1312.

[6] RATHER R A,LONE F A,SHAH G J.Overlap in web search results:a study of five search engines[J].Library Philosophy and Practice,2008(12):1-6.

[7] ESMAEIL S M,KIAIE R M,KETAB F.A comparison between search engines and meta-search engines in retrieving information related to physics and the extent of their overlap[J].Library and Information Studies,2011,22(3):130-140.

[8] WANG L,WANG J,WANG M,et al.Using Internet search engines to obtain medical information:a comparative study[J].Journal of Medical Internet Research,2012,14(3):74.

[9] Nobel Prize.All Nobel Prizes in economic sciences[EB/OL]. http://www. nobelprize.org/nobel_prizes/economic-sciences/laureates.

[10] RePEc. RePEcservices[EB/OL].[2016-08-01].http://repec.org.

[11] Web of Science.Introduction to web of science[EB/OL].[2016-08-01]. http://concert.stpi.narl.org.tw/fdb/Web of Science /index.html.

[12] Scopus.Scopus in Detail: What does it cover?[EB/OL].[2016-08-01]. http://info.scopus.com/detail/what.

[13] O'LEARY M.Google Scholar:what's in it for you?[J].Information Today,2005,22(7):35-39.

[14] Google Scholar[EB/OL].[2016-08-01].https://scholar.google.com.tw.

[15] Microsoft.AcademicSearch[EB/OL].[2016-08-01].http://academic. research.microsoft.com/default.aspx.

[16] Microsoft Academic.Research more, search less[EB/OL].[2016-08-01]. http://academic.research.microsoft.com.

[17] 何琳.OpenDOAR和機(jī)構(gòu)知識(shí)庫(kù)發(fā)展現(xiàn)狀[J].圖書(shū)館工作與研究,2009(2):30-33.

[18] OpenDOAR.The directory of open access repositories[EB/OL].[2016-08-01].http://www.opendoar.org

[19] OCLC.The OAIster? database[EB/OL].[2016-08-01].http://www.oclc. org/oaister.en.html.

A Comparison Study on Citation Index: Commercial Databases and Open Access Systems

CAI MingYue
(Graduate Institute of Library, Information and Archival Studies National ChengChi University, Taibei 116, China)

In this study, scholarly communication system of commercial services and open access will be examined through user interface and comprehensiveness of coverage for commercial citation index databases (Web of Science and Scopus) and open access citation system (Google Scholar, Microsoft Academic Search,OAIster and OpenDOAR). Retrievals will be conducted in the six citation index databases and systems stated above to analyze and compare their retrieval interfaces,and evaluations of each system will be made as well according to the output of retrieval results. Noble laureates in economic sciences from 2001 to 2012 are selected as samples in this study. Bibliographic records of their publications will be retrieved and downloaded from each system, and a computer program will be developed to perform the analytical tasks of sorting, comparison, elimination, aggregation and statistics. Bibliographic records retrieved from the six databases and systems will undertake quantitative analyses and cross references to determine the comprehensiveness of their system coverage. The results of the study may provide better references for libraries to acquire citation index databases, to build institutional repositories, or to create citation index systems on their own in the future. Suggestions on indicators and tools for academic assessment will be presented based on the comprehensiveness assessment of each system as well.

Citation Index Database; Open Access System; Database Coverage; Database Overlap

G255.51;G252.7

10.3772/j.issn.1673-2286.2016.10.004

蔡明月,女,1956年生,臺(tái)灣政治大學(xué)圖書(shū)資訊與檔案學(xué)研究所特聘教授,兼圖書(shū)館館長(zhǎng)暨社會(huì)科學(xué)資料中心主任,研究方向:信息計(jì)量學(xué)、網(wǎng)絡(luò)計(jì)量學(xué)、圖書(shū)情報(bào)學(xué)、用戶研究,E-mail:mytsay@nccu.edu.tw。

(2016-08-19)

猜你喜歡
典藏重復(fù)性搜索引擎
化學(xué)分析方法重復(fù)性限和再現(xiàn)性限的確定
昆鋼科技(2021年2期)2021-07-22 07:46:56
典藏
論重復(fù)性供述排除規(guī)則
往來(lái)·典藏
翻斗式雨量傳感器重復(fù)性試驗(yàn)統(tǒng)計(jì)處理方法
水利信息化(2017年4期)2017-09-15 12:01:21
典藏
網(wǎng)絡(luò)搜索引擎亟待規(guī)范
典藏閣
基于Nutch的醫(yī)療搜索引擎的研究與開(kāi)發(fā)
廣告主與搜索引擎的雙向博弈分析
武城县| 闻喜县| 桓台县| 永定县| 常熟市| 徐水县| 定安县| 元江| 金阳县| 伊春市| 类乌齐县| 安福县| 丰宁| 阿鲁科尔沁旗| 洛隆县| 南郑县| 清水河县| 望城县| 平远县| 尼玛县| 冕宁县| 南溪县| 保靖县| 洪湖市| 青田县| 顺平县| 贵港市| 北宁市| 绥阳县| 泸定县| 承德市| 青铜峡市| 新建县| 武定县| 梨树县| 双桥区| 新巴尔虎右旗| 祁连县| 新宾| 昌宁县| 宁陕县|