程穎 凃艷玲 李云華
(武漢大學(xué)圖書(shū)館,武漢 430072)
百度學(xué)術(shù)于2014年6月上線,是百度旗下的免費(fèi)學(xué)術(shù)資源搜索平臺(tái)。它收錄了包括中國(guó)知網(wǎng)、維普網(wǎng)、萬(wàn)方數(shù)據(jù)、Elsevier、Springer Nature、Wiley、NCBI等120多萬(wàn)個(gè)國(guó)內(nèi)外學(xué)術(shù)站點(diǎn),索引超過(guò)12億個(gè)學(xué)術(shù)資源頁(yè)面,整合了包括學(xué)術(shù)期刊、會(huì)議論文、學(xué)位論文、專利、圖書(shū)等類型在內(nèi)的6.8億多篇學(xué)術(shù)文獻(xiàn)[1],為科研工作者提供學(xué)術(shù)搜索服務(wù)。2015年百度學(xué)術(shù)發(fā)布“高校圖書(shū)館”計(jì)劃[2-3],與高校圖書(shū)館開(kāi)展合作,以提供連接用戶和圖書(shū)館的知識(shí)發(fā)現(xiàn)服務(wù)[4]。如何應(yīng)用百度學(xué)術(shù),為科研工作者提供更好的學(xué)術(shù)資源服務(wù),是高校圖書(shū)館需要思考的問(wèn)題。
百度學(xué)術(shù)的“高校圖書(shū)館”計(jì)劃擬通過(guò)獲取高校的學(xué)術(shù)資源數(shù)據(jù),為高校圖書(shū)館提供定制的知識(shí)發(fā)現(xiàn)服務(wù)[2]。2015年百度學(xué)術(shù)與北京大學(xué)圖書(shū)館、中國(guó)高等教育文獻(xiàn)保障系統(tǒng)(China Academic Library &Information System,CALIS)簽署合作協(xié)議,三方在高校圖書(shū)館的信息資源建設(shè)、知識(shí)發(fā)現(xiàn)服務(wù)完善、學(xué)術(shù)評(píng)價(jià)體系創(chuàng)新等方面展開(kāi)全面合作,以共同為中國(guó)高等教育提供更優(yōu)質(zhì)的科研服務(wù)[2]。2017年百度學(xué)術(shù)與武漢大學(xué)圖書(shū)館(以下簡(jiǎn)稱“武大館”)簽署《百度武大AI圖書(shū)館合作框架協(xié)議》,將武大館的學(xué)術(shù)資源與百度學(xué)術(shù)的資源進(jìn)行整合[5]。百度學(xué)術(shù)不斷面向?qū)W術(shù)機(jī)構(gòu)開(kāi)展合作,目前已與西安交通大學(xué)[6]、國(guó)家標(biāo)準(zhǔn)館、全國(guó)地質(zhì)資料館等國(guó)內(nèi)高等院校及學(xué)術(shù)機(jī)構(gòu)建立了合作關(guān)系[7]。
高校圖書(shū)館通過(guò)與百度學(xué)術(shù)合作,將已購(gòu)資源和自建資源與百度學(xué)術(shù)的元數(shù)據(jù)進(jìn)行對(duì)接,將傳統(tǒng)圖書(shū)館業(yè)務(wù)和互聯(lián)網(wǎng)搜索產(chǎn)品進(jìn)行深度融合及資源優(yōu)勢(shì)互補(bǔ),為圖書(shū)館用戶提供一個(gè)統(tǒng)一的文獻(xiàn)檢索入口,以及信息集成與推送服務(wù)。筆者于2021年2月調(diào)研了高校圖書(shū)館的網(wǎng)站,發(fā)現(xiàn)北京師范大學(xué)、哈爾濱工業(yè)大學(xué)、浙江大學(xué)、蘭州大學(xué)、廈門大學(xué)等高校的圖書(shū)館均在其主頁(yè)中嵌入了百度學(xué)術(shù)統(tǒng)一檢索入口。其中,國(guó)內(nèi)36所“雙一流”大學(xué)A類高校有17家圖書(shū)館主頁(yè)中嵌入了百度學(xué)術(shù)統(tǒng)一檢索入口,占比47%。可見(jiàn),百度學(xué)術(shù)在重要高校中也得到了一定范圍的應(yīng)用。
國(guó)內(nèi)圖書(shū)館界對(duì)百度學(xué)術(shù)也進(jìn)行了研究。筆者于2021年2月在中國(guó)知網(wǎng)中以篇名包含“百度學(xué)術(shù)”進(jìn)行檢索,獲取25篇論文。這些論文大多從個(gè)體用戶體驗(yàn)的角度研究百度學(xué)術(shù)[3,8-11],缺少高校圖書(shū)館與百度學(xué)術(shù)合作實(shí)踐類的文章。本文以百度學(xué)術(shù)在武大館的應(yīng)用為例,介紹百度學(xué)術(shù)本地化的實(shí)踐經(jīng)驗(yàn),探討存在的問(wèn)題,以期為其他圖書(shū)館應(yīng)用百度學(xué)術(shù)提供參考。
通過(guò)對(duì)百度學(xué)術(shù)的測(cè)試、應(yīng)用與分析,百度學(xué)術(shù)在為高校圖書(shū)館用戶提供服務(wù)時(shí)主要具有以下特點(diǎn)。
(1)實(shí)現(xiàn)中文資源和外文資源的統(tǒng)一檢索。國(guó)內(nèi)公司的發(fā)現(xiàn)系統(tǒng)一般側(cè)重于整合中文資源,整合的外文資源相對(duì)較少。百度學(xué)術(shù)通過(guò)與期刊方的合作[7],豐富了外文資源元數(shù)據(jù),其整合的外文數(shù)據(jù)庫(kù)包括Elsevier、Springer Nature、Wiley、Taylor & Francis、Gale、ProQuest、HeinOnline、EBSCOhost、Brill等知名數(shù)據(jù)庫(kù)。武大館在百度學(xué)術(shù)后臺(tái)中篩選出的外文庫(kù)共有140個(gè)。對(duì)于中文資源,國(guó)外公司的發(fā)現(xiàn)系統(tǒng)一般只整合了萬(wàn)方數(shù)據(jù)、維普網(wǎng)、超星電子圖書(shū)等少數(shù)幾個(gè)中文庫(kù)。百度學(xué)術(shù)依托本土優(yōu)勢(shì)及品牌效應(yīng),相繼與國(guó)內(nèi)圖書(shū)館、標(biāo)準(zhǔn)館、資料館等資源機(jī)構(gòu)合作[7],以補(bǔ)充百度學(xué)術(shù)的中文資源。百度學(xué)術(shù)整合的中文資源包括博看網(wǎng)暢銷期刊數(shù)據(jù)庫(kù)、人大復(fù)印資料、中國(guó)財(cái)經(jīng)報(bào)刊數(shù)據(jù)庫(kù)、國(guó)家哲學(xué)社會(huì)科學(xué)學(xué)術(shù)期刊數(shù)據(jù)庫(kù)、國(guó)內(nèi)標(biāo)準(zhǔn)、地質(zhì)成果報(bào)告等。武大館在百度學(xué)術(shù)后臺(tái)中篩選出的中文庫(kù)共有17個(gè)。百度學(xué)術(shù)共收錄中外文學(xué)術(shù)資源總量逾2億條,其中,中文資源超1.5億條,外文資源超1億條[11]。從總體上看,百度學(xué)術(shù)收錄中外文資源比較齊全,實(shí)現(xiàn)了中文、外文資源的統(tǒng)一檢索。
(2)提供更多全文獲取方式。百度學(xué)術(shù)依賴百度搜索技術(shù),在全網(wǎng)范圍內(nèi)收集和整理了更多的全文獲取方式,包括網(wǎng)絡(luò)免費(fèi)資源、開(kāi)放存取資源、PDF全文直接下載、在線文檔分享平臺(tái)下載、求助全文、單篇購(gòu)買等。即使圖書(shū)館未訂購(gòu)數(shù)據(jù)庫(kù),用戶也可能通過(guò)其他方式獲得所需資源的全文,也可以從多種方式中選擇最便捷的全文獲取渠道。同時(shí),百度學(xué)術(shù)數(shù)據(jù)量大,整合的免費(fèi)資源及OA資源多,共計(jì)幾十萬(wàn)個(gè)OA站點(diǎn),提供1.2億條文獻(xiàn)級(jí)免費(fèi)下載來(lái)源,使用戶更易獲取免費(fèi)資源。
(3)提供快速穩(wěn)定的檢索服務(wù)。百度作為國(guó)內(nèi)知名的搜索引擎技術(shù)公司,具有先進(jìn)的檢索技術(shù)。武大館對(duì)百度學(xué)術(shù)進(jìn)行長(zhǎng)時(shí)間的系統(tǒng)測(cè)試,發(fā)現(xiàn)百度學(xué)術(shù)依托百度服務(wù)器IT系統(tǒng),系統(tǒng)穩(wěn)定,檢索速度快,檢索結(jié)果通常在1秒內(nèi)呈現(xiàn)。而且,百度學(xué)術(shù)沿用百度搜索簡(jiǎn)潔的頁(yè)面風(fēng)格,檢索功能簡(jiǎn)單、易用,符合中國(guó)用戶的檢索習(xí)慣。從武大館應(yīng)用百度學(xué)術(shù)后的用戶反饋來(lái)看,相較于其他發(fā)現(xiàn)系統(tǒng),用戶普遍更喜歡和習(xí)慣使用百度學(xué)術(shù)。
(4)提供個(gè)性化的學(xué)術(shù)資源服務(wù)。百度學(xué)術(shù)對(duì)海量的學(xué)術(shù)資源進(jìn)行大數(shù)據(jù)計(jì)算,提供研究點(diǎn)、學(xué)科、學(xué)者、機(jī)構(gòu)等知識(shí)對(duì)象的可視化關(guān)聯(lián)圖,以及研究背景、研究動(dòng)態(tài)、研究趨勢(shì)等整個(gè)研究點(diǎn)的知識(shí)集成服務(wù),并對(duì)用戶的閱讀習(xí)慣進(jìn)行分析,提供用戶個(gè)性化的論文推薦及熱詞推送的知識(shí)推薦服務(wù)。圖書(shū)館也可以定制本地百度學(xué)術(shù)的名稱、LOGO圖標(biāo),以及數(shù)據(jù)庫(kù)資源和用戶行為的統(tǒng)計(jì),并調(diào)用百度學(xué)術(shù)API接口,以獲取百度學(xué)術(shù)的資源檢索及查找等增值服務(wù)。
百度公司在搜索業(yè)處于技術(shù)領(lǐng)先地位,又有豐富的教育資源。武大館希望通過(guò)引入百度學(xué)術(shù),將圖書(shū)館傳統(tǒng)的學(xué)術(shù)資源與網(wǎng)絡(luò)教育資源、其他機(jī)構(gòu)的學(xué)術(shù)資源相結(jié)合,以深挖圖書(shū)館文獻(xiàn)及服務(wù)發(fā)展的潛力。為推動(dòng)百度學(xué)術(shù)本地化實(shí)踐,武大館成立了百度學(xué)術(shù)項(xiàng)目工作組,主要由3個(gè)部門組成。①資源組織部。主要負(fù)責(zé)項(xiàng)目整體組織、協(xié)調(diào)與資源管理,包括百度學(xué)術(shù)后臺(tái)管理、數(shù)據(jù)庫(kù)配置、與百度公司聯(lián)系等。②咨詢部。主要負(fù)責(zé)百度學(xué)術(shù)的檢索與宣傳,包括百度學(xué)術(shù)網(wǎng)站的檢索、百度學(xué)術(shù)的宣傳、培訓(xùn)、統(tǒng)計(jì)與用戶咨詢等。③系統(tǒng)部。主要負(fù)責(zé)百度學(xué)術(shù)的技術(shù)支持,包括IP地址配置、校外訪問(wèn)的配置、百度學(xué)術(shù)快速搜索入口的配置等。
武大館百度學(xué)術(shù)的實(shí)施流程主要分為十大步驟。①申請(qǐng)開(kāi)通百度學(xué)術(shù)。圖書(shū)館與百度公司簽署合作協(xié)議后,向百度公司申請(qǐng)引入百度學(xué)術(shù),并提交申請(qǐng)資料。百度學(xué)術(shù)工作人員對(duì)申請(qǐng)資料進(jìn)行審核,審核通過(guò)后為圖書(shū)館開(kāi)通百度學(xué)術(shù)后臺(tái)的管理權(quán)限。②用戶管理。圖書(shū)館在百度學(xué)術(shù)后臺(tái)配置管理員,將管理員分為資源管理員、統(tǒng)計(jì)管理員、網(wǎng)頁(yè)管理員及系統(tǒng)管理員4種類型,各管理員各司其職。其中,系統(tǒng)管理員總管其他的管理員,以保障后臺(tái)系統(tǒng)的安全。③配置機(jī)構(gòu)信息。由系統(tǒng)管理員在百度學(xué)術(shù)后臺(tái)配置本地機(jī)構(gòu)的信息,包括本地百度學(xué)術(shù)的名稱、IP地址及電子期刊導(dǎo)航的網(wǎng)址等。④篩選數(shù)據(jù)庫(kù)。由資源管理員在百度學(xué)術(shù)后臺(tái)篩選圖書(shū)館訂購(gòu)的商業(yè)數(shù)據(jù)庫(kù)、OA庫(kù)及網(wǎng)絡(luò)免費(fèi)庫(kù)。⑤設(shè)置校外訪問(wèn)。由系統(tǒng)管理員設(shè)置校園網(wǎng)外用戶訪問(wèn)百度學(xué)術(shù)的方法,并進(jìn)行測(cè)試。⑥圖書(shū)館主頁(yè)中嵌入百度學(xué)術(shù)快速搜索入口。確定圖書(shū)館本地的百度學(xué)術(shù)個(gè)性化名稱,并制作本地LOGO圖標(biāo)。從百度學(xué)術(shù)后臺(tái)的嵌框配置頁(yè)面獲取百度學(xué)術(shù)的嵌框代碼,改編代碼后,在圖書(shū)館主頁(yè)中嵌入百度學(xué)術(shù)快速搜索入口。⑦在圖書(shū)館的其他系統(tǒng)中調(diào)用百度學(xué)術(shù)API接口。將API接口引入圖書(shū)館其他系統(tǒng),可利用百度學(xué)術(shù)的資源檢索、查找免費(fèi)文檔,查詢被引頻次的服務(wù)。如在EDS發(fā)現(xiàn)系統(tǒng)中調(diào)用百度學(xué)術(shù)的檢索服務(wù)API接口,可返回百度學(xué)術(shù)前3條檢索結(jié)果。⑧系統(tǒng)整體測(cè)試。圖書(shū)館配置完本地的百度學(xué)術(shù)后,主要由資源組織部、咨詢部和系統(tǒng)部3個(gè)部門對(duì)百度學(xué)術(shù)進(jìn)行全面測(cè)試,測(cè)試內(nèi)容包括資源檢索、全文獲取、頁(yè)面顯示、資源關(guān)聯(lián)等多個(gè)方面,并匯總測(cè)試中發(fā)現(xiàn)的問(wèn)題,向百度公司反饋,并督促其修改。⑨百度學(xué)術(shù)正式上線。圖書(shū)館測(cè)試百度學(xué)術(shù)滿足正式上線的條件后,制作百度學(xué)術(shù)宣傳海報(bào),發(fā)布上線通知,并開(kāi)展百度學(xué)術(shù)的使用培訓(xùn)。⑩用戶咨詢與統(tǒng)計(jì)。咨詢部負(fù)責(zé)解答用戶對(duì)百度學(xué)術(shù)使用的咨詢問(wèn)題,并匯總用戶意見(jiàn),反饋給百度公司,并開(kāi)展百度學(xué)術(shù)資源與用戶訪問(wèn)的統(tǒng)計(jì)與分析。
百度學(xué)術(shù)后臺(tái)是圖書(shū)館管理百度學(xué)術(shù)的入口,圖書(shū)館通過(guò)后臺(tái)可以對(duì)百度學(xué)術(shù)進(jìn)行六大方面的管理。①機(jī)構(gòu)信息管理。圖書(shū)館在此可準(zhǔn)確配置機(jī)構(gòu)的各種本地信息。②嵌框管理。配置本地百度學(xué)術(shù)的快速搜索入口,以生成本地百度學(xué)術(shù)的嵌框代碼。③數(shù)據(jù)庫(kù)管理。管理百度學(xué)術(shù)知識(shí)庫(kù)中的各種數(shù)據(jù)庫(kù),以便在百度學(xué)術(shù)網(wǎng)站中實(shí)現(xiàn)各種資源的統(tǒng)一檢索。④統(tǒng)計(jì)管理。配置本地資源分析數(shù)據(jù),以及用戶使用統(tǒng)計(jì)數(shù)據(jù)等。⑤接口管理。管理百度學(xué)術(shù)的API接口,以便其他系統(tǒng)可以利用API接口進(jìn)行系統(tǒng)開(kāi)發(fā)。⑥用戶管理。對(duì)后臺(tái)管理員進(jìn)行分類,規(guī)定每類管理員的工作范圍和工作職責(zé),以保障后臺(tái)的安全。
篩選數(shù)據(jù)庫(kù)是百度學(xué)術(shù)本地化實(shí)施的重點(diǎn),也是百度學(xué)術(shù)日常維護(hù)工作的重要內(nèi)容。通過(guò)篩選數(shù)據(jù)庫(kù),用戶在百度學(xué)術(shù)中可及時(shí)發(fā)現(xiàn)圖書(shū)館已購(gòu)資源,既方便用戶下載文獻(xiàn),也方便用戶選擇是全網(wǎng)范圍內(nèi)檢索還是圖書(shū)館范圍內(nèi)檢索。武大館制定了數(shù)據(jù)庫(kù)篩選策略。①針對(duì)商業(yè)庫(kù),篩選原則是“精確”。選擇商業(yè)庫(kù)后,百度學(xué)術(shù)網(wǎng)站中的數(shù)據(jù)庫(kù)名稱后面會(huì)自動(dòng)出現(xiàn)“武漢大學(xué)圖書(shū)館訂購(gòu)”字樣,因此,勾選商業(yè)庫(kù)務(wù)必精確。遴選時(shí)應(yīng)將后臺(tái)中的數(shù)據(jù)庫(kù)描述信息與數(shù)據(jù)庫(kù)商提供的信息進(jìn)行精確比對(duì),比對(duì)項(xiàng)包括數(shù)據(jù)庫(kù)名稱、數(shù)據(jù)庫(kù)商名稱、數(shù)據(jù)庫(kù)網(wǎng)址、資源類型、資源數(shù)量、資源清單等。②針對(duì)OA及免費(fèi)庫(kù),篩選原則是“全面”。OA及免費(fèi)庫(kù)為用戶獲取全文提供了便利,而且名目繁多,因此,選擇此類數(shù)據(jù)庫(kù)時(shí)應(yīng)盡可能全面。首先收集和匯總這類庫(kù)信息,一種可從SFX系統(tǒng)和EDS發(fā)現(xiàn)系統(tǒng)等相關(guān)系統(tǒng)中收集,另一種可從中國(guó)科學(xué)院OAinONE網(wǎng)等圖情機(jī)構(gòu)網(wǎng)站中收集,然后在百度學(xué)術(shù)后臺(tái)中找到這些庫(kù)并確定。而且,后臺(tái)中這類庫(kù)名稱往往包含free、open、OA等字符,通過(guò)檢索這些字符,也可找到一些OA及免費(fèi)庫(kù)。根據(jù)以上策略,在百度學(xué)術(shù)后臺(tái)共篩選出數(shù)據(jù)庫(kù)180個(gè),其中外文庫(kù)140個(gè)、中文庫(kù)17個(gè)、OA及免費(fèi)資源庫(kù)23個(gè)。
2018年起武大館實(shí)施百度學(xué)術(shù)的本地化應(yīng)用,在圖書(shū)館主頁(yè)中嵌入了百度學(xué)術(shù)統(tǒng)一檢索入口。2018—2020年武大館百度學(xué)術(shù)的月度瀏覽量平均值為292 118次,月度瀏覽量峰值達(dá)646 095次;月度訪客數(shù)均值為46 532人次,月度訪客數(shù)峰值達(dá)80 397人次,月度訪客數(shù)如圖1所示。由于受疫情的影響,2020年上半年百度學(xué)術(shù)的訪客數(shù)有所下滑,但從2020年9月開(kāi)始,訪客數(shù)開(kāi)始回升。
武大館主頁(yè)中同時(shí)嵌入了百度學(xué)術(shù)和EDS發(fā)現(xiàn)系統(tǒng)的快速檢索入口,將兩者的訪問(wèn)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行對(duì)比發(fā)現(xiàn),2018—2020年百度學(xué)術(shù)的訪問(wèn)統(tǒng)計(jì)數(shù)據(jù)均優(yōu)于EDS發(fā)現(xiàn)系統(tǒng)。以訪客數(shù)為例,百度學(xué)術(shù)與EDS的年度訪客數(shù)對(duì)比的柱形圖如圖2所示,可以發(fā)現(xiàn)百度學(xué)術(shù)的年度訪客數(shù)與EDS相比,具有較大優(yōu)勢(shì)。
圖1 2018—2020年百度學(xué)術(shù)的月度訪客數(shù)
圖2 2018—2020年百度學(xué)術(shù)與EDS發(fā)現(xiàn)系統(tǒng)的年度訪客數(shù)
從用戶反饋看,武大館用戶在使用本地化的百度學(xué)術(shù)后反映百度學(xué)術(shù)系統(tǒng)比較穩(wěn)定,檢索速度快,界面清晰、易懂,符合中國(guó)用戶的檢索習(xí)慣。而且,百度學(xué)術(shù)數(shù)據(jù)量大,與武大館EDS發(fā)現(xiàn)系統(tǒng)形成資源互補(bǔ)。此外,武大館用戶可以靈活地選擇全網(wǎng)資源范圍內(nèi)檢索,還是武大館內(nèi)資源檢索,可更有效地定位武大館已購(gòu)資源。研究領(lǐng)域的可視化關(guān)聯(lián)分析及論文推送等知識(shí)集成服務(wù)為用戶了解整個(gè)知識(shí)點(diǎn)的研究態(tài)勢(shì)提供了較好的科研體驗(yàn)。
從武大館應(yīng)用百度學(xué)術(shù)及使用情況看,存在一些問(wèn)題,主要表現(xiàn)在以下方面。
目前百度學(xué)術(shù)后臺(tái)的管理功能較簡(jiǎn)單,如個(gè)性化服務(wù)的配置只有設(shè)置本地百度學(xué)術(shù)的名稱和LOGO圖標(biāo)等少數(shù)功能,而不能定制本地百度學(xué)術(shù)網(wǎng)站的風(fēng)格、檢索功能、學(xué)科分類等。后臺(tái)的管理員類型只有“機(jī)構(gòu)管理員”一種選擇,致使所有管理員擁有同樣的操作權(quán)限,不利于百度學(xué)術(shù)系統(tǒng)的操作安全。百度學(xué)術(shù)提供圖書(shū)館的操作權(quán)限有限,如圖書(shū)館沒(méi)有權(quán)限添加后臺(tái)管理員,必須求助于百度公司技術(shù)人員添加。當(dāng)圖書(shū)館發(fā)現(xiàn)后臺(tái)中的數(shù)據(jù)庫(kù)描述有誤、網(wǎng)址鏈接失效等問(wèn)題時(shí),圖書(shū)館也沒(méi)有權(quán)限修改,必須求助于百度公司解決,影響了問(wèn)題處理的效率。因此,從百度學(xué)術(shù)后臺(tái)的總體功能看,百度學(xué)術(shù)賦予圖書(shū)館的權(quán)限和功能較少,圖書(shū)館操作空間非常有限,主要就是篩選數(shù)據(jù)庫(kù)。這種方式雖然能夠加強(qiáng)百度公司對(duì)百度學(xué)術(shù)的集中化管理,減少圖書(shū)館本地維護(hù)的成本,但是,從圖書(shū)館角度,缺乏圖書(shū)館個(gè)體的靈活性和本地的適用性,使圖書(shū)館發(fā)現(xiàn)問(wèn)題時(shí)往往因無(wú)權(quán)限而無(wú)法及時(shí)處理,必須依賴百度公司去解決問(wèn)題。
百度學(xué)術(shù)后臺(tái)的數(shù)據(jù)庫(kù)眾多,篩選數(shù)據(jù)庫(kù)比較困難。造成數(shù)據(jù)庫(kù)篩選困難的原因,一是后臺(tái)中的數(shù)據(jù)庫(kù)描述字段常出現(xiàn)空白、無(wú)效或不匹配等情況。如“數(shù)據(jù)庫(kù)名稱”字段常與數(shù)據(jù)庫(kù)商提供的庫(kù)名不匹配。二是后臺(tái)知識(shí)庫(kù)中收錄的數(shù)據(jù)庫(kù)不全。以外文數(shù)據(jù)庫(kù)為例,武大館有109個(gè)外文庫(kù)在百度學(xué)術(shù)知識(shí)庫(kù)中沒(méi)有找到,外文庫(kù)篩選總量占武大館外文庫(kù)總量56.2%。對(duì)于中文數(shù)據(jù)庫(kù),武大館一共篩選了17個(gè)中文庫(kù),另有78個(gè)中文庫(kù)在百度學(xué)術(shù)知識(shí)庫(kù)中未找到,中文庫(kù)篩選總量占武大館中文庫(kù)總量17.9%。從總體上看,百度學(xué)術(shù)數(shù)據(jù)庫(kù)篩選率并不高,且可勾選的資源類型大多為圖書(shū)和期刊,資源類型不夠豐富,缺少法律報(bào)告、檔案、視頻及音頻等類型的資源。
雖然百度學(xué)術(shù)整合了大量資源,但資源整合不夠精細(xì)和完善。①“全部來(lái)源”中的網(wǎng)址整理雜亂。存在同一資源有多個(gè)網(wǎng)址的情況,如“軟件學(xué)報(bào)”有3個(gè)網(wǎng)址,其中一個(gè)為“軟件學(xué)報(bào)”官網(wǎng),另兩個(gè)為PDF全文下載。存在網(wǎng)址失效的情況,如IP網(wǎng)址失效較多,武大館未購(gòu)買360LINK產(chǎn)品,網(wǎng)址來(lái)源中卻出現(xiàn)了360LINK鏈接,失效網(wǎng)址影響了百度學(xué)術(shù)的用戶體驗(yàn)。此外,網(wǎng)址來(lái)源歸類也存在問(wèn)題,如“全部來(lái)源”中有些免費(fèi)資源并未歸入“免費(fèi)下載”類型中。②需謹(jǐn)慎對(duì)待“求助全文”的法律問(wèn)題?!扒笾摹笔前俣葘W(xué)術(shù)為用戶搭建的學(xué)術(shù)資源免費(fèi)互助平臺(tái),在該平臺(tái)中可向其他用戶發(fā)出文獻(xiàn)求助請(qǐng)求,等其他用戶應(yīng)助后可獲取全文。商業(yè)庫(kù)一般規(guī)定未經(jīng)明確授權(quán)許可,用戶不能將下載論文的全文公開(kāi)傳播,否則侵犯論文的著作權(quán),因此,“求助全文”平臺(tái)是否會(huì)帶來(lái)法律糾紛,有待深思。③單篇購(gòu)買存在安全風(fēng)險(xiǎn)。百度公司聯(lián)合中國(guó)教育圖書(shū)進(jìn)出口公司共同推出了單篇文獻(xiàn)購(gòu)買服務(wù),允許用戶在百度學(xué)術(shù)中用網(wǎng)上支付方式購(gòu)買Wiley、Cambridge、Talor等12家合作數(shù)據(jù)庫(kù)商的1 300多萬(wàn)篇文獻(xiàn)。網(wǎng)絡(luò)支付方式會(huì)存在釣魚(yú)網(wǎng)站、網(wǎng)上支付密碼泄露等安全風(fēng)險(xiǎn)。
百度學(xué)術(shù)的檢索問(wèn)題主要表現(xiàn)在兩個(gè)方面。其一,檢索功能較簡(jiǎn)單。百度學(xué)術(shù)高級(jí)檢索中的檢索選項(xiàng)少,如“出版物”選項(xiàng)中只有期刊和會(huì)議兩種資源類型?!罢Z(yǔ)言檢索范圍”選項(xiàng)中只有中文和英文兩個(gè)語(yǔ)種。高級(jí)檢索未提供布爾運(yùn)算符的組配檢索,也不支持二次檢索、主題詞檢索、ISBN和ISSN號(hào)檢索等其他檢索方式。其二,分面檢索功能不完善。分面檢索提供的列舉項(xiàng)有限,每個(gè)分面最多列舉10個(gè)選擇項(xiàng),如“類型”分面中只列舉了期刊、學(xué)位、會(huì)議、圖書(shū)和專利5項(xiàng),因此,用戶無(wú)法查看這5項(xiàng)之外的其他類型資源。而且,分面檢索內(nèi)的各列舉項(xiàng)間只能單選,不能多選,當(dāng)用戶檢索交叉學(xué)科資源時(shí),則無(wú)法同時(shí)選擇多個(gè)學(xué)科。有的分面檢索名稱不規(guī)范,如“類型”分面中有“學(xué)位”項(xiàng),但實(shí)際為“學(xué)位論文”;“領(lǐng)域”分面實(shí)際為教育部“學(xué)科分類”。此外,有的分面排序不符合圖書(shū)館本地的實(shí)際情況,如百度學(xué)術(shù)中的“領(lǐng)域”分面依據(jù)學(xué)科文獻(xiàn)的數(shù)量進(jìn)行排序,而未依據(jù)檢索詞相關(guān)度進(jìn)行排序。
高校圖書(shū)館在應(yīng)用百度學(xué)術(shù)中存在一定的問(wèn)題,且高校圖書(shū)館對(duì)本地百度學(xué)術(shù)的管理功能有限,因此,高校圖書(shū)館需與百度學(xué)術(shù)在以下方面進(jìn)一步加深合作,并被賦予更多的管理權(quán)限,以促進(jìn)百度學(xué)術(shù)在圖書(shū)館的應(yīng)用更加完善。
對(duì)于百度學(xué)術(shù)后臺(tái)功能較簡(jiǎn)單、圖書(shū)館管理員操作受限的問(wèn)題,圖書(shū)館可以與百度學(xué)術(shù)在以下方面共同商討以完善后臺(tái)功能。①提供更多個(gè)性化的本地定制功能,以便圖書(shū)館可以根據(jù)本地情況自行定制圖書(shū)館的百度學(xué)術(shù)網(wǎng)站風(fēng)格、學(xué)科分類體系、分面瀏覽、館藏資源的深度分析,以及用戶行為的深度分析等。②提供更多百度學(xué)術(shù)應(yīng)用程序API接口,圖書(shū)館可以在OPAC、其他發(fā)現(xiàn)系統(tǒng)、特色數(shù)據(jù)庫(kù)等其他系統(tǒng)中調(diào)用API接口,以便圖書(shū)館的其他系統(tǒng)也能夠充分地利用百度學(xué)術(shù)的增值服務(wù)。③賦予圖書(shū)館管理員更多的后臺(tái)操作權(quán)限,圖書(shū)館管理員就可以更有效地管理本地化的百度學(xué)術(shù)。如添加本地的百度學(xué)術(shù)后臺(tái)管理員,設(shè)置管理員類型及操作權(quán)限,修改有誤的數(shù)據(jù)庫(kù)信息、維護(hù)無(wú)效的網(wǎng)址來(lái)源等。
一方面,高校圖書(shū)館有專業(yè)的編目團(tuán)隊(duì),可以充分利用其編目經(jīng)驗(yàn)與百度學(xué)術(shù)在規(guī)范元數(shù)據(jù)方面展開(kāi)合作??尚薷牟灰?guī)范及易引起歧義的數(shù)據(jù)庫(kù)描述字段名稱,如將描述資源總量的“全部期刊數(shù)”字段名改為“資源總量”;可增加用于匹配數(shù)據(jù)庫(kù)的字段,如增加“數(shù)據(jù)庫(kù)介紹”“收錄年限”等字段,以便圖書(shū)館更易篩選數(shù)據(jù)庫(kù);還可以將百度學(xué)術(shù)后臺(tái)知識(shí)庫(kù)中的數(shù)據(jù)設(shè)為全局描述和本地描述兩種類型,圖書(shū)館可以修改本地描述,以便根據(jù)圖書(shū)館的實(shí)際情況修改不適用于本地及有誤的數(shù)據(jù)。另一方面,高校圖書(shū)館可以上傳館藏紙本資源的書(shū)目數(shù)據(jù)及自建數(shù)據(jù)庫(kù)的元數(shù)據(jù),以實(shí)現(xiàn)圖書(shū)館更多資源的統(tǒng)一檢索。也可利用其中文編目經(jīng)驗(yàn)與百度學(xué)術(shù)在中文元數(shù)據(jù)整合技術(shù)方面展開(kāi)合作,以加大百度學(xué)術(shù)中文資源的收錄力度。
高校圖書(shū)館可以與百度學(xué)術(shù)合作,以更好地梳理百度學(xué)術(shù)收集的各種來(lái)源,保障各來(lái)源的有效性和準(zhǔn)確性。①整理所收集的各種來(lái)源,并將各來(lái)源準(zhǔn)確地歸類。合并各種重復(fù)來(lái)源,使各來(lái)源以唯一形式顯示出來(lái)。②盡可能收集具有OpenURL、DOI等穩(wěn)定網(wǎng)址的來(lái)源,這類網(wǎng)址可保持長(zhǎng)期有效,能減少今后的網(wǎng)址維護(hù)量。③加強(qiáng)網(wǎng)址的監(jiān)管,以保障各來(lái)源網(wǎng)址的有效性。在各網(wǎng)址接入百度學(xué)術(shù)之前,設(shè)定網(wǎng)址入庫(kù)的準(zhǔn)則,檢測(cè)結(jié)果為有效的網(wǎng)址才被允許入庫(kù);在各網(wǎng)址接入百度學(xué)術(shù)之后,將網(wǎng)址監(jiān)測(cè)納入日常的監(jiān)管范圍,制定日常的網(wǎng)址掃描計(jì)劃,并按網(wǎng)址的穩(wěn)定性設(shè)定不同的掃描頻率,對(duì)掃描出的失效網(wǎng)址進(jìn)行清理。此外,高校圖書(shū)館還應(yīng)注意百度學(xué)術(shù)提供的各種服務(wù)是否均在法律允許的范圍之內(nèi),對(duì)于可能帶來(lái)法律問(wèn)題的服務(wù)不予采用,如可能侵犯論文版權(quán)的“文獻(xiàn)互助”服務(wù)可不在高校圖書(shū)館本地化的百度學(xué)術(shù)中出現(xiàn),以避免法律糾紛。
高校圖書(shū)館可運(yùn)用其圖情專業(yè)優(yōu)勢(shì)與百度學(xué)術(shù)深度合作,增強(qiáng)和完善百度學(xué)術(shù)的檢索功能,以滿足用戶深層次的檢索需求??稍诟呒?jí)檢索中增加更多的檢索選項(xiàng),面向各種類型、各種語(yǔ)種的資源,并提供二次檢索、布爾運(yùn)算符組配檢索、多字段檢索、通用命令語(yǔ)言檢索等多種檢索方式。還可以借鑒商業(yè)數(shù)據(jù)庫(kù)、發(fā)現(xiàn)系統(tǒng)和圖書(shū)館集成系統(tǒng)等其他系統(tǒng)的檢索優(yōu)勢(shì),使百度學(xué)術(shù)的檢索功能不僅更符合用戶的檢索習(xí)慣,而且能更精準(zhǔn)地檢索出所需資源。在分面檢索方面,可以增加一些分面類型,擴(kuò)展分面的選項(xiàng),并支持分面選項(xiàng)間的多選,以幫助用戶更精準(zhǔn)地限定檢索范圍。圖書(shū)館還可以根據(jù)本校的實(shí)際情況靈活地調(diào)整百度學(xué)術(shù)的分面排序,如將“收錄”分面調(diào)整為根據(jù)本校對(duì)核心和索引的認(rèn)可度來(lái)進(jìn)行排序。
武大館與百度學(xué)術(shù)合作,在本地應(yīng)用了百度學(xué)術(shù),將圖書(shū)館已購(gòu)資源與百度學(xué)術(shù)的資源進(jìn)行對(duì)接,在圖書(shū)館主頁(yè)提供百度學(xué)術(shù)統(tǒng)一檢索入口,以為武漢大學(xué)師生提供快速、穩(wěn)定的知識(shí)集成與推送服務(wù)。今后,高校圖書(shū)館可以與百度學(xué)術(shù)加深合作,將圖書(shū)館傳統(tǒng)學(xué)術(shù)資源與百度學(xué)術(shù)的網(wǎng)絡(luò)學(xué)術(shù)資源以及其他機(jī)構(gòu)的學(xué)術(shù)資源進(jìn)行深度融合與集成,形成資源優(yōu)勢(shì)互補(bǔ)。高校圖書(shū)館還可以利用員工的圖情專業(yè)優(yōu)勢(shì)提高百度學(xué)術(shù)的元數(shù)據(jù)質(zhì)量,完善檢索功能及知識(shí)集成服務(wù),以期給高校師生提供更好的科研體驗(yàn)。