王 菁 曹 君 李雪婷
(哈爾濱工業(yè)大學(xué)圖書館,黑龍江?哈爾濱 150001)
·業(yè)務(wù)研究·
三個外文檢索系統(tǒng)的比較研究
王菁曹君李雪婷
(哈爾濱工業(yè)大學(xué)圖書館,黑龍江?哈爾濱 150001)
〔摘要〕資源整合是提高資源利用效率的有效保障。Dialog國際聯(lián)機(jī)檢索系統(tǒng)、Scopus信息導(dǎo)航工具和Summon發(fā)現(xiàn)系統(tǒng)是3個不同的外文檢索系統(tǒng),它們都將大量的異構(gòu)平臺上的資源整合到1個平臺上供讀者使用,它們之間有一些聯(lián)系和不同點(diǎn)。本文從4個方面對它們進(jìn)行了介紹和比較。
〔關(guān)鍵詞〕資源整合;國際聯(lián)機(jī)檢索系統(tǒng);發(fā)現(xiàn)系統(tǒng);信息導(dǎo)航工具
隨著文獻(xiàn)資源的數(shù)量快速增長,數(shù)據(jù)庫技術(shù)和網(wǎng)絡(luò)傳播能力不斷提高,文獻(xiàn)資源的檢索平臺逐步發(fā)展,檢索功能也日益強(qiáng)大。為滿足讀者對不同文獻(xiàn)資源的檢索需求,外文文獻(xiàn)的檢索平臺越來越多,但是這些平臺在系統(tǒng)結(jié)構(gòu)、信息內(nèi)容、呈現(xiàn)界面和使用方法上完全不同,這給讀者在使用時帶來很大困擾,讀者更希望在一個平臺上檢索到更多的文獻(xiàn),甚至是一次性檢索到所有平臺的文獻(xiàn),這就需要一個資源整合系統(tǒng),這個系統(tǒng)或者可以將大量不同數(shù)據(jù)庫中的文獻(xiàn)集中到一個數(shù)據(jù)庫中,或者可以同時實(shí)現(xiàn)跨平臺檢索,總之是可以實(shí)現(xiàn)在一個檢索界面中同時檢索大量資源的一站式檢索。本文介紹了3個外文檢索系統(tǒng),它們是Dialog國際聯(lián)機(jī)檢索系統(tǒng)、Scopus信息導(dǎo)航工具和Summon發(fā)現(xiàn)系統(tǒng),這是3個性質(zhì)不同的系統(tǒng),它們是當(dāng)今圖書館數(shù)字資源整合平臺的代表和典范,它們共同的特點(diǎn)就是海量數(shù)據(jù)、資源有效整合和一站式檢索。
本文將從數(shù)據(jù)庫的結(jié)構(gòu)特點(diǎn)、文獻(xiàn)資源含量、檢索功能、檢索結(jié)果處理4個方面對3個系統(tǒng)進(jìn)行比較。
國際聯(lián)機(jī)檢索是指用戶使用檢索終端設(shè)備,通過通信設(shè)施(如通信網(wǎng)、調(diào)制解調(diào)器、自動呼叫器、通信控制器等),直接與中央計算機(jī)連接,檢索遠(yuǎn)程數(shù)據(jù)庫中的信息資源。在檢索過程中采用的是人機(jī)對話方式,可隨機(jī)或脫機(jī)瀏覽、傳遞所得信息。國際聯(lián)機(jī)檢索系統(tǒng)上的數(shù)據(jù)來自世界各國的檢索系統(tǒng),每個系統(tǒng)的計算機(jī)成為網(wǎng)絡(luò)上的節(jié)點(diǎn),每個節(jié)點(diǎn)連接多個檢索終端,各節(jié)點(diǎn)之間以通信線路彼此相連,網(wǎng)絡(luò)上的任何一個終端都可以聯(lián)機(jī)檢索所有數(shù)據(jù)庫的數(shù)據(jù)。國際聯(lián)機(jī)檢索系統(tǒng)具有檢索范圍廣、檢索速度快、檢索功能強(qiáng)、信息資源龐大、數(shù)據(jù)庫種類多、服務(wù)方式和輸出方式靈活和檢索全面的特點(diǎn)。Dialog國際聯(lián)機(jī)檢索系統(tǒng)是世界上第一個也是最大的聯(lián)機(jī)檢索系統(tǒng),無論從深度、廣度還是準(zhǔn)確性及速度上都是最強(qiáng)大的。2008年Dialog系統(tǒng)加入了Proquest公司。
Scopus數(shù)據(jù)庫是一個集信息檢索、網(wǎng)頁搜索、引文分析、全文鏈接、資源整合及檢索結(jié)果分析功能于一身的超大型文摘數(shù)據(jù)庫。Scopus數(shù)據(jù)庫是Elsevier公司從2002年開始與加拿大多倫多大學(xué)、美國匹茲堡大學(xué)和新加坡國立大學(xué)等21個世界著名大學(xué)及研究機(jī)構(gòu),選擇超過300名科學(xué)家和信息研究人員進(jìn)行了廣泛而密切的合作,以用戶為中心,設(shè)計開發(fā)出的具有獨(dú)特功能的科技信息檢索與導(dǎo)航系統(tǒng)。數(shù)據(jù)來源于國外的信息機(jī)構(gòu),數(shù)據(jù)收集之后重新進(jìn)行標(biāo)引、建庫,形成完整的數(shù)據(jù)庫,檢索字段和檢索方式都有自己的特點(diǎn)。嚴(yán)格來講,Scopus不算一個資源整合系統(tǒng),而是一個集成數(shù)據(jù)庫。
發(fā)現(xiàn)系統(tǒng)是近幾年新開發(fā)出的資源整合系統(tǒng)。和以往資源整合系統(tǒng)不同,發(fā)現(xiàn)系統(tǒng)集成了元數(shù)據(jù)集中索引和實(shí)時跨庫檢索技術(shù)的優(yōu)點(diǎn),既有中央元數(shù)據(jù)倉儲支撐,檢索效率高,檢索結(jié)果準(zhǔn)確清晰,又聯(lián)合了實(shí)時跨庫檢索技術(shù),使檢索范圍更廣,幾乎覆蓋了各種信息資源。發(fā)現(xiàn)系統(tǒng)的工作原理是系統(tǒng)提供商通過與出版社等內(nèi)容提供商的合作,對海量的、來自異構(gòu)資源的元數(shù)據(jù)和部分對象數(shù)據(jù),采用分析、抽取等手段進(jìn)行預(yù)收集,并將這些數(shù)據(jù)按映射轉(zhuǎn)換規(guī)則轉(zhuǎn)換為標(biāo)準(zhǔn)的格式,納入到元數(shù)據(jù)標(biāo)準(zhǔn)體系中,形成一個預(yù)聚合的元數(shù)據(jù)聯(lián)合索引庫,在本地或遠(yuǎn)程中心平臺提供統(tǒng)一的搜索服務(wù)[2]。Summon發(fā)現(xiàn)系統(tǒng)是最早出現(xiàn)的資源發(fā)現(xiàn)系統(tǒng),它是Proquest公司旗下的Serials Solution公司于2009年7月推出的第一款網(wǎng)絡(luò)資源發(fā)現(xiàn)系統(tǒng)。Summon發(fā)現(xiàn)系統(tǒng)和Dialog國際聯(lián)機(jī)檢索系統(tǒng)目前歸屬于同一家公司。Summon數(shù)據(jù)來源很廣,但不使用聯(lián)邦檢索方式。
Dialog國際聯(lián)機(jī)檢索系統(tǒng)在proguest平臺上現(xiàn)在可以利用的有96個通用數(shù)據(jù)庫,40個專利數(shù)據(jù)庫。這些數(shù)據(jù)庫包含了科技工程類、藥學(xué)、專利和商業(yè)新聞??梢哉f覆蓋幾乎網(wǎng)絡(luò)上所有收費(fèi)的和免費(fèi)正規(guī)的、還有一些網(wǎng)絡(luò)上沒有的數(shù)據(jù)庫。其中商業(yè)新聞類包括全球性新聞與商業(yè)信息,競爭情報,公司、產(chǎn)品信息和工業(yè)情報,行業(yè)市場研究報告,這些大多是在網(wǎng)絡(luò)上無法獲取的資源。數(shù)據(jù)最早回溯到1800年,可以說Dialog國際聯(lián)機(jī)檢索系統(tǒng)收錄文獻(xiàn)的年代是最早的,也是最全的。
Scopus數(shù)據(jù)庫的收錄了來自4 000多家出版商的14 000多種期刊、750種會議錄、600種商業(yè)出版物的2 700萬條論文摘要和參考文獻(xiàn)。數(shù)據(jù)最早回溯到1966年,每年新增110萬條記錄,其中還收錄了465種開放獲取(Open Access)期刊;并且,1996年以后發(fā)表的所有文章所附的2.3億條參考文獻(xiàn)均進(jìn)入了數(shù)據(jù)庫。Scopus還與著名的Sciru檢索引擎整合,可以提供1.8億個科技信息(包括專利)網(wǎng)頁的信息[3]。
Summon發(fā)現(xiàn)系統(tǒng)的資源來源于網(wǎng)絡(luò)上的收費(fèi)數(shù)據(jù)庫、免費(fèi)數(shù)據(jù)庫和圖書館的OPAC系統(tǒng)。只要元數(shù)據(jù)是開放的,發(fā)現(xiàn)系統(tǒng)都可以收割到自己的系統(tǒng)之中。目前(截至2014年5月30日),Summon系統(tǒng)包含文獻(xiàn)量10億條,其中報紙含量占57.92%,期刊占20%,專利占7.5%,電子書占3%。英文文獻(xiàn)有8億多條,占79.27%,中文文獻(xiàn)僅占4.42%。
3個系統(tǒng)在包含文獻(xiàn)的內(nèi)容上有很大的重復(fù)度,例如他們都包含EI工程索引的信息,但是回溯的年代范圍不相同。一篇EI工程索引1873年的文獻(xiàn)Back water in streams as produced by dams,在Dialog國際聯(lián)機(jī)檢索系統(tǒng)中有,其他兩個系統(tǒng)中都沒有。而1969年的一篇文章Study of water plant isolation from contamination,3個系統(tǒng)中都有,這是因?yàn)榫W(wǎng)絡(luò)版EI數(shù)據(jù)庫回溯到1969年,而后兩個系統(tǒng)的數(shù)據(jù)都來自于網(wǎng)絡(luò)版EI數(shù)據(jù)庫。
從上面可以看出,3個數(shù)據(jù)庫都是整合不同平臺的信息資源,只是整合的方式不同。
單從數(shù)據(jù)庫的介紹中,我們只能知道每個數(shù)據(jù)庫包含的文獻(xiàn)量,不能了解數(shù)據(jù)庫之間的關(guān)系。為了幫助讀者充分了解數(shù)據(jù)庫包含的文獻(xiàn)情況和他們之間的關(guān)系,我們做了一個測試,選出240份查新報告中從Dialog數(shù)據(jù)庫中檢索到的1 447篇文獻(xiàn),它們來自不同的數(shù)據(jù)庫(見表1)。將這些文獻(xiàn)在Summon系統(tǒng)中和Scopus系統(tǒng)中進(jìn)行檢索,得到結(jié)果如下。
Summon系統(tǒng)中共檢索出1 227篇文獻(xiàn),有220篇沒有檢索到,檢索成功率84.79%。
Scopus系統(tǒng)中共檢索出1 182篇文獻(xiàn),有265篇沒有檢索到,檢索成功率81.68%。
其中有110篇文獻(xiàn)在兩個系統(tǒng)中都沒有,全部檢到成功率92.39%。
表1 3個數(shù)據(jù)庫檢索結(jié)果
表1(續(xù))
3個系統(tǒng)都有簡單檢索和高級檢索功能,只是高級檢索的選項(xiàng)有點(diǎn)不同,這里不做對比,我們只對專家檢索進(jìn)行對比。
專家檢索是指通過輸入由檢索字段代碼、邏輯算符、位置算符和截詞符將檢索詞按照檢索策略組合形成檢索式只需一步得到檢索結(jié)果的一種專業(yè)檢索方式。這種檢索方式可以快速、準(zhǔn)確的獲得檢索結(jié)果。專家檢索在不同的平臺有不同叫法,在Proquest平臺叫命令行檢索,在Scopus平臺叫高級檢索,Summon平臺沒有設(shè)計專門的專家檢索,我們就用簡單檢索的功能框代替專家檢索。
不同的平臺專家檢索的檢索規(guī)則不相同,我們先了解一下每個平臺的檢索規(guī)則和可檢索字段數(shù)量。
表2 3個數(shù)據(jù)庫邏輯算符、通配符與可檢索字段數(shù)量
下面通過實(shí)例來說明3個系統(tǒng)專家檢索的使用方法。
選擇題目為“運(yùn)動界面納米效應(yīng)的液態(tài)軸承轉(zhuǎn)子式微機(jī)械陀螺研究”的一篇2013年做的查新報告。這篇報告中的檢索式是原Dialog檢索平臺使用的檢索式,我們將這個檢索式轉(zhuǎn)換成3個系統(tǒng)分別能夠識別的檢索式,然后查看檢索結(jié)果的數(shù)量和是否覆蓋查新報告中密切相關(guān)文獻(xiàn)。
原Dialog系統(tǒng)檢索式:(micromachined or micro()machined or MEMS) and gyroscope?and (liquid(2n)bearing or moving()(interface or surface) or (suspension or suspend???)(s)rotor??)得到檢索結(jié)果40篇。
首先換成Proquest版Dialog系統(tǒng)檢索式:
其次換成意義相同的Scopus檢索式:
(micromachined OR (micro PRE/0 machined) OR MEMS) W/2 gyroscope*AND ((liquid W/2 bearing) OR (moving PRE/0 (interface OR surface)) OR ((suspension OR suspend*) AND rotor*))全庫檢索得到結(jié)果63篇。
再換成相同意義的Summon發(fā)現(xiàn)系統(tǒng)檢索式:
(micromachined OR (micro AND machined) OR MEMS) AND gyroscope*AND ((liquid AND bearing) OR (moving AND (interface OR surface)) OR ((suspension OR suspend*) AND rotor*))在圖書館具有的數(shù)據(jù)庫中檢索得到2 979篇,文獻(xiàn)太多看不過來,進(jìn)行檢索式的修改。
修改后的檢索式:
(micromachined OR micro-machined OR MEMS) AND gyroscope*AND (″liquid bearing″ OR ″moving interface″ OR ″moving surface″ OR ((suspension OR suspend*) AND rotor*))在圖書館具有的數(shù)據(jù)庫檢索得到589篇文獻(xiàn),限制到英文期刊文獻(xiàn),只有128篇。擴(kuò)展到圖書館沒有的文獻(xiàn)得到7 688篇文獻(xiàn),限制到英文期刊,只有137篇文獻(xiàn)。
以上3個檢索式都是在全字段進(jìn)行檢索,沒有做字段限制,這是因?yàn)椴樾抡n題對查全要求較嚴(yán),當(dāng)全字段檢索的結(jié)果不是很多的時候,不做字段限制。但當(dāng)檢索結(jié)果太多時,還有平時檢索文獻(xiàn)時,可采用字段限制。最好的字段是題目——關(guān)鍵詞——摘要字段,這在Proquest版Dialog系統(tǒng)和Scopus數(shù)據(jù)庫中都有,但Summon系統(tǒng)沒有這個字段,這可以說也是Summon系統(tǒng)的一個缺陷。
本文作者將原來查新報告中給出的密切相關(guān)文獻(xiàn)拿來檢驗(yàn),用以上檢索式在3個系統(tǒng)中檢索得到的結(jié)果都包含查新報告中的密切相關(guān)文獻(xiàn)。結(jié)果證明3個系統(tǒng)外文檢索功能都非常好用,只是檢索者要對3個系統(tǒng)的特點(diǎn)非常熟悉。根據(jù)我們的經(jīng)驗(yàn),如果想要檢索結(jié)果精確些,可以用國際聯(lián)機(jī)檢索系統(tǒng),如果要檢索結(jié)果更全一些,可以用Summon系統(tǒng),如果要以期刊為主,又要檢索功能好一些,可以用Scopus系統(tǒng)。
除常用的3個檢索功能,Scopus系統(tǒng)還設(shè)置了作者檢索和機(jī)構(gòu)檢索功能,利用這兩個功能,可以對特定的作者或機(jī)構(gòu)進(jìn)行檢索。檢索時要注意作者姓名的拼寫方式和機(jī)構(gòu)的拼寫方式,系統(tǒng)可自動識別多種拼寫方式,這是Scopus系統(tǒng)特有的檢索功能,其它兩個系統(tǒng)沒有該兩項(xiàng)功能。
對檢索結(jié)果的處理能力是檢驗(yàn)一個系統(tǒng)功能是否強(qiáng)大的重要方面,下面我們從不同的方面對3個系統(tǒng)對檢索結(jié)果的處理能力做個對比。
表3 3個數(shù)據(jù)庫對檢索結(jié)果進(jìn)行處理的對比
聚類表示可以從不同的方面進(jìn)行數(shù)據(jù)精煉,例如Scopus系統(tǒng)有年份、作者姓名、學(xué)科類別、文獻(xiàn)類型、來源出版物和關(guān)鍵字等10個可聚類的項(xiàng)目。
Scopus系統(tǒng)可以進(jìn)一步做檢索結(jié)果的分析,它可以從7個方面對檢索結(jié)果進(jìn)行分析,它們是年份、來源出版物、作者姓名、歸屬機(jī)構(gòu)名稱、國家/地區(qū)、文獻(xiàn)類型、學(xué)科類別,每一項(xiàng)我們都可以通過圖和表兩種方式看到分析的結(jié)果,這是Scopus系統(tǒng)更高級的服務(wù)。
此外,Scopus系統(tǒng)的作者檢索功能的檢索結(jié)果顯示出6個方面的信息,第一顯示作者信息介紹,包括姓名(各種拼寫方法)、作者ID、作者單位;第二顯示作者發(fā)表的文獻(xiàn)情況,包括發(fā)表文章數(shù)量、引用的參考文獻(xiàn)數(shù)量、被引文獻(xiàn)數(shù)量、高頻因子、合作者、文獻(xiàn)發(fā)表的主要領(lǐng)域以及在WEB上發(fā)表的文獻(xiàn)情況等;第三顯示文獻(xiàn)的歷史,包括發(fā)表時間段、來源出版物以及相關(guān)機(jī)構(gòu)等;第四顯示發(fā)表文章的具體信息;第五顯示被引文獻(xiàn)的詳細(xì)信息;第六顯示合作者的文章發(fā)表情況。通過這些信息,我們可以了解某個作者的科研狀況。Scopus系統(tǒng)的機(jī)構(gòu)檢索功能的檢索結(jié)果同樣可以讓讀者通過機(jī)構(gòu)發(fā)表文章的情況對機(jī)構(gòu)的科研產(chǎn)出做出評價。
因此,從檢索結(jié)果的處理來看,Scopus系統(tǒng)的功能是最強(qiáng)大的。
資源的有效整合是圖書館數(shù)字化建設(shè)的必由之路,社會上不斷出現(xiàn)新的整合系統(tǒng),但到目前為止,外文文獻(xiàn)的整合系統(tǒng)從發(fā)展模式和發(fā)展方向上來看主要是本文研究的3種,其它的系統(tǒng)雖然也有些還在使用,但實(shí)踐之后發(fā)現(xiàn)有很多問題,例如Mylibrary系統(tǒng),Muse系統(tǒng)等。本文研究的3種系統(tǒng)也各有優(yōu)缺點(diǎn),但由于他們的自身優(yōu)勢都很明顯,因此還將會在圖書館界應(yīng)用很久,尤其是Summon系統(tǒng),如果它能有Dialog系統(tǒng)數(shù)據(jù)優(yōu)勢(雖然Summon數(shù)據(jù)量也很大,但覆蓋的專業(yè)范圍有限),Scopus的檢索功能和結(jié)果處理能力,那它將是資源整合比較完美的系統(tǒng)。
參考文獻(xiàn)
[1]謝新洲,滕躍.科技查新手冊[M].北京:科學(xué)技術(shù)文獻(xiàn)出版社,2004.
[2]包凌,蔣穎.圖書館統(tǒng)一資源發(fā)現(xiàn)系統(tǒng)的比較研究[J].情報資料工作,2012,(5):67-72.
[3]葉艷鳴,曹均,黃扶敏,等.基于科學(xué)導(dǎo)航理念的Scopus數(shù)據(jù)庫[J].四川圖書館學(xué)報,2006,(1):24-26.
[4]秦鴻,錢國富,鐘遠(yuǎn)薪.三種發(fā)現(xiàn)服務(wù)系統(tǒng)的比較研究[J].大學(xué)圖書館學(xué)報,2012,(5):5-11,17.
[5]于光.信息檢索(第2版)[M].北京:電子工業(yè)出版社,2014.
[6]路瑩.圖書館資源整合新技術(shù)——探索發(fā)現(xiàn)系統(tǒng)[J].中華醫(yī)學(xué)圖書情報雜志,2013,22(5):28-31.
[7]樊怡菁.SCIE與Scopus數(shù)據(jù)庫之比較[J].圖書情報工作,2006,(1):106-108.
(本文責(zé)任編輯:郭沫含)
Comparative Study on Three Foreign Retrieval System
Wang JingCao JunLi Xueting
(Library,Harbin Institute of Technology,Harbin 150001,China)
〔Abstract〕Resource integration improves the effective protection of resource use efficiency.Dialog international online retrieval system,Scopus information navigation tools and Summon discovery system are three different foreign retrieval systems which integrate a large amount of resources on heterogeneous platforms to one platform for readers’ sake.There are some connection and differences between them,and the article introduced and compared them from four aspects.
〔Key words〕resources integration;international online retrieval system;discovery system;information navigation tools
〔中圖分類號〕G254.92
〔文獻(xiàn)標(biāo)識碼〕A
〔文章編號〕1008-0821(2015)06-0139-05
DOI:10.3969/j.issn.1008-0821.2015.06.026
作者簡介:王菁(1963-),女,副研究館員,研究方向:信息咨詢和科技查新,發(fā)表論文10余篇,參編圖書5部。
收稿日期:2014-06-24