国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

CADAL數(shù)字資源整合檢索研究
——以清華大學(xué)圖書館OPAC系統(tǒng)為例*

2017-10-11 09:28:07遠(yuǎn)紅亮張蓓張成昱周虹
數(shù)字圖書館論壇 2017年8期
關(guān)鍵詞:調(diào)用清華大學(xué)頁(yè)面

遠(yuǎn)紅亮,張蓓,張成昱,周虹

(清華大學(xué)圖書館,北京 100084)

CADAL數(shù)字資源整合檢索研究
——以清華大學(xué)圖書館OPAC系統(tǒng)為例*

遠(yuǎn)紅亮,張蓓,張成昱,周虹

(清華大學(xué)圖書館,北京 100084)

清華大學(xué)圖書館OPAC系統(tǒng)利用CADAL元數(shù)據(jù)開放接口整合檢索CADAL數(shù)字資源,在頁(yè)面呈現(xiàn)檢索命中記錄的全文訪問(wèn)鏈接,以方便讀者獲取相關(guān)資源,提高CADAL數(shù)字資源呈現(xiàn)和利用率。本文著重描述清華大學(xué)圖書館OPAC系統(tǒng)整合檢索CADAL數(shù)字資源的設(shè)計(jì)和實(shí)現(xiàn)方案,以供同類型圖書館和系統(tǒng)設(shè)計(jì)人員參考借鑒。

OPAC;CADAL;元數(shù)據(jù);開放接口

1 引言

越來(lái)越多的讀者在信息資源查找時(shí)首選網(wǎng)絡(luò)搜索引擎而非圖書館OPAC(Open Public Access Catalogue),一是由于互聯(lián)網(wǎng)技術(shù)不斷發(fā)展以及互聯(lián)網(wǎng)內(nèi)容越來(lái)越豐富等情況改變了讀者查詢資源的習(xí)慣,二是OPAC系統(tǒng)功能不能滿足讀者日益增長(zhǎng)的應(yīng)用需求。因此,近年來(lái)圖書館工作人員不斷嘗試各種混搭應(yīng)用,以期為讀者提供更加多樣化、豐富的功能選擇[1]。清華大學(xué)圖書館將自身資源與大學(xué)數(shù)字圖書館國(guó)際合作計(jì)劃(China Academic Digital Associative Library,CADAL)相關(guān)資源進(jìn)行整合,使讀者可在清華大學(xué)圖書館OPAC系統(tǒng)中檢索到本館資源以及CADAL數(shù)字圖書館的相關(guān)資源,從而提升讀者檢索體驗(yàn)。

CADAL作為國(guó)家教育部公共服務(wù)體系建設(shè)的重要組成部分,在資源、服務(wù)和技術(shù)等方面構(gòu)成我國(guó)高等教育數(shù)字圖書館的重要基礎(chǔ)。經(jīng)過(guò)長(zhǎng)期努力,CADAL已擁有多學(xué)科、多類型、多語(yǔ)種的海量數(shù)字資源,由國(guó)內(nèi)外的圖書館、學(xué)術(shù)組織、學(xué)科專業(yè)人員廣泛參與建設(shè)與服務(wù),是具有高技術(shù)水平的學(xué)術(shù)數(shù)字圖書館,成為國(guó)家創(chuàng)新體系信息基礎(chǔ)設(shè)施之一。CADAL以100萬(wàn)冊(cè)(件)數(shù)字資源為核心,構(gòu)建了由2個(gè)數(shù)字圖書館技術(shù)中心(浙江大學(xué)、中國(guó)科學(xué)院研究生院)和14個(gè)數(shù)字資源中心(北京大學(xué)、清華大學(xué)、浙江大學(xué)、復(fù)旦大學(xué)、南京大學(xué)、中國(guó)科學(xué)院研究生院、上海交通大學(xué)、西安交通大學(xué)、武漢大學(xué)、華中科技大學(xué)、吉林大學(xué)、中山大學(xué)、四川大學(xué)、北京師范大學(xué))組成的分布式資源建設(shè)、組織和傳播體系[2]。截至2015年12月31日,CADAL數(shù)字圖書館資源入庫(kù)量達(dá)2 757 413冊(cè)(件),在線量為2 428 656冊(cè)(件)[3]。

設(shè)計(jì)與實(shí)現(xiàn)清華大學(xué)圖書館OPAC系統(tǒng)整合檢索CADAL數(shù)字資源的功能,能提高CADAL數(shù)字資源的揭示、呈現(xiàn)和利用率,優(yōu)化讀者使用OPAC的檢索體驗(yàn),便于讀者獲取所需資源全文。本文旨在對(duì)清華大學(xué)圖書館OPAC系統(tǒng)整合檢索CADAL數(shù)字資源的設(shè)計(jì)、實(shí)現(xiàn)和應(yīng)用進(jìn)行分析和研究,以期為同行提供參考。

2 分析與設(shè)計(jì)

2.1 需求分析

清華大學(xué)圖書館OPAC系統(tǒng)采用美國(guó)INNOVATIVE公司的INNOPAC/Millennium系統(tǒng),其與CADAL數(shù)字資源平臺(tái)完全獨(dú)立異構(gòu)。清華大學(xué)圖書館OPAC系統(tǒng)主要包括館藏紙本圖書和期刊、部分電子書刊和本校學(xué)位論文等;電子書刊主要以現(xiàn)代圖書為主,來(lái)源于超星、書生之家和方正Apabi等數(shù)字資源庫(kù)。CADAL數(shù)字資源平臺(tái)涵蓋古籍、民國(guó)書刊、現(xiàn)代圖書、學(xué)位論文、其他多媒體資源,是對(duì)OPAC系統(tǒng)資源的有益補(bǔ)充。清華大學(xué)OPAC系統(tǒng)主要服務(wù)本校師生,管理本校數(shù)字資源。

CADAL數(shù)字資源平臺(tái)依據(jù)內(nèi)容版權(quán)要求提供電子版全文借閱服務(wù),無(wú)版權(quán)限制內(nèi)容面向全球用戶服務(wù),有版權(quán)限制內(nèi)容僅面向合作單位用戶服務(wù)。但讀者只能在OPAC系統(tǒng)、CADAL數(shù)字資源平臺(tái)分別進(jìn)行檢索,以獲取所需資源。若要一次性檢索出清華大學(xué)圖書館與CADAL數(shù)字圖書館中的書目信息,避免讀者重復(fù)同樣的操作,兩個(gè)異構(gòu)系統(tǒng)間必須進(jìn)行數(shù)據(jù)交互。OPAC系統(tǒng)在檢索本地?cái)?shù)據(jù)的同時(shí),對(duì)CADAL數(shù)字資源也進(jìn)行相應(yīng)檢索,并將兩部分檢索結(jié)果整合后呈現(xiàn)給讀者。若異構(gòu)系統(tǒng)間沒(méi)有開放接口進(jìn)行元數(shù)據(jù)交互,頁(yè)面分析法是一種解決方案;但這種方案較煩瑣,若被分析頁(yè)面結(jié)構(gòu)發(fā)生變化,相應(yīng)處理程序必須做出修改;不但影響用戶使用,還可能導(dǎo)致系統(tǒng)故障。

異構(gòu)系統(tǒng)間數(shù)據(jù)交互最好通過(guò)開放標(biāo)準(zhǔn)接口實(shí)現(xiàn);清華大學(xué)圖書館OPAC系統(tǒng)沒(méi)有標(biāo)準(zhǔn)的接口可供使用,需通過(guò)客戶端腳本語(yǔ)言JavaScript編寫程序進(jìn)行頁(yè)面處理。CADAL元數(shù)據(jù)開放接口是一套標(biāo)準(zhǔn)化通用接口,服務(wù)器端和客戶端的編程語(yǔ)言均可以調(diào)用接口,方便使用JavaScript語(yǔ)言實(shí)現(xiàn)接口調(diào)用;CADAL開放接口系統(tǒng)中的元數(shù)據(jù)與CADAL數(shù)字資源平臺(tái)中的元數(shù)據(jù)保持一致,通過(guò)元數(shù)據(jù)可組合出CADAL數(shù)字資源的全文訪問(wèn)路徑,通過(guò)CADAL元數(shù)據(jù)開放接口系統(tǒng)可解決OPAC系統(tǒng)與CADAL數(shù)字資源平臺(tái)數(shù)據(jù)交互問(wèn)題;接口系統(tǒng)獨(dú)立于CADAL數(shù)字資源平臺(tái),在整合檢索過(guò)程中不會(huì)影響CADAL數(shù)字資源平臺(tái)自身的訪問(wèn),不會(huì)增加無(wú)謂的訪問(wèn)流量?;谏鲜龇治觯珻ADAL數(shù)字資源開放接口是連接圖書館OPAC系統(tǒng)和CADAL數(shù)字資源平臺(tái)的橋梁。清華大學(xué)圖書館OPAC系統(tǒng)與CADAL數(shù)字資源整合檢索功能,可通過(guò)調(diào)用CADAL數(shù)字資源開放接口實(shí)現(xiàn)。

2.2 接口分析

開放接口是應(yīng)用編程接口(Application Programming Interface,API),其基于HTTP協(xié)議,以XML或JSON等格式返回?cái)?shù)據(jù)和信息,主要為異構(gòu)系統(tǒng)間數(shù)據(jù)資源互換和互操作提供方便。通過(guò)開放接口的方式,可實(shí)現(xiàn)信息和應(yīng)用的關(guān)聯(lián)和再加工[4]。CADAL元數(shù)據(jù)開放接口系統(tǒng)在圖書館OPAC系統(tǒng)和CADAL數(shù)字資源平臺(tái)間架起橋梁,既獨(dú)立于圖書館OPAC系統(tǒng),又獨(dú)立于CADAL數(shù)字資源平臺(tái)。CADAL元數(shù)據(jù)開放接口系統(tǒng)與CADAL數(shù)字資源平臺(tái)保持元數(shù)據(jù)實(shí)時(shí)同步,從而確保圖書館OPAC系統(tǒng)通過(guò)CADAL元數(shù)據(jù)開放接口系統(tǒng)獲得的元數(shù)據(jù)信息準(zhǔn)確無(wú)誤,同時(shí)生成CADAL數(shù)字資源平臺(tái)全文訪問(wèn)鏈接。截至2017年5月31日,CADAL元數(shù)據(jù)開放接口系統(tǒng)中元數(shù)據(jù)條目為2 433 880條,主要為古籍、民國(guó)書刊、現(xiàn)代圖書、學(xué)位論文、英文圖書等。

2.2.1 簡(jiǎn)單檢索接口

CADAL元數(shù)據(jù)開放數(shù)據(jù)接口平臺(tái)提供規(guī)范的調(diào)用接口,可實(shí)現(xiàn)CADAL資源元數(shù)據(jù)檢索功能。以CADAL資源檢索接口為例,采用發(fā)送HTTP請(qǐng)求的方式實(shí)現(xiàn)接口調(diào)用,基本形式為“http://IP或者域名/cadal/cbook/?q=檢索字符串”。其中,“檢索字符串=檢索項(xiàng):檢索詞”。檢索項(xiàng)包括16個(gè)字段:BookNo(CADAL資源標(biāo)識(shí)ID)、BookType(資源類型)、CreateDate(創(chuàng)建日期)、Creator(作者)、Publisher(出版機(jī)構(gòu))、Subject(關(guān)鍵詞)、Coverage(覆蓋范圍)、Contributor(其他責(zé)任者)、ContentLanguage(內(nèi)容語(yǔ)種)、Relation(關(guān)聯(lián))、Rights(版權(quán))、Source(來(lái)源)、Title(題名)、Description(描述)、ISBN(國(guó)際標(biāo)準(zhǔn)書號(hào))、Format(格式)。如“http://IP或者域名/cadal/cbook/? q=BookNo:xxxx”用于定位唯一CADAL資源記錄,“http://IP或者域名/cadal/cbook/?q=BookType:xxxx”用于檢索不同類型的CADAL資源,“http://IP或者域名/cadal/cbook/?q=CreateDate:xxxx”用于檢索創(chuàng)建日期包含檢索詞的CADAL資源等。

2.2.2 組合檢索接口及參數(shù)

在簡(jiǎn)單檢索接口基礎(chǔ)上利用組合檢索參數(shù),滿足對(duì)不同檢索子串的CADAL資源記錄,可實(shí)現(xiàn)針對(duì)CADAL資源元數(shù)據(jù)組合檢索調(diào)用請(qǐng)求。組合檢索接口基本形式為“http://IP或者域名/cadal/cbook/?q=檢索子串1 組合檢索參數(shù) 檢索子串2(組合檢索參數(shù) 檢索子串N)”。其中,“檢索子串=檢索項(xiàng):檢索詞”??捎玫慕M合檢索參數(shù)有AND、OR、 fl、score、start、rows、sort、wt,其中score表示返回檢索結(jié)果的相關(guān)度得分,分值沒(méi)有范圍,僅針對(duì)不同的檢索條件,具有相對(duì)值意義;rows表示定義1次返回多少條記錄,默認(rèn)為10,出于數(shù)據(jù)安全考慮,每次請(qǐng)求最多返回10條記錄;sort表示CADAL接口服務(wù)默認(rèn)按照相關(guān)度(score)降序排列檢索返回結(jié)果,根據(jù)需要,可以在調(diào)用API的請(qǐng)求中增加參數(shù)sort,定義返回結(jié)果的顯示順序[5]。如“http://IP或者域名/cadal/cbook/?q=Publisher:人民出版社 AND BookType:minguo”。

2.2.3 接口返回結(jié)果

以簡(jiǎn)單檢索為例,使用題名為檢索條件,調(diào)用接口“http://IP或者域名/cadal/cbook/?q=Title:永嘉縣志”,系統(tǒng)默認(rèn)返回XML格式的檢索結(jié)果。如返回結(jié)果中,numFound=“718”表示查詢到的相關(guān)結(jié)果條目數(shù)量為718條,start=“0”表示按照相關(guān)度得分排序后,返回結(jié)果從第1條開始(系統(tǒng)計(jì)數(shù)從0開始);標(biāo)簽間的部分為每條資源的具體元數(shù)據(jù)信息,包括BookNo、BookType等信息。調(diào)用程序按需要對(duì)接口返回結(jié)果進(jìn)行元數(shù)據(jù)字段提取、處理并組合出有效命中記錄的全文訪問(wèn)鏈接,最后將相關(guān)元數(shù)據(jù)信息整合到OPAC頁(yè)面,呈現(xiàn)給讀者參考和使用。

2.3 整合檢索流程設(shè)計(jì)

清華大學(xué)圖書館OPAC系統(tǒng)與CADAL數(shù)字資源平臺(tái)是兩個(gè)異構(gòu)的資源管理系統(tǒng),借助CADAL元數(shù)據(jù)開放接口可實(shí)現(xiàn)OPAC系統(tǒng)與CADAL數(shù)字資源平臺(tái)元數(shù)據(jù)交互。其利用開放接口為讀者查詢所需CADAL數(shù)字資源,將檢索結(jié)果整合到OPAC頁(yè)面,為讀者呈現(xiàn)CADAL數(shù)字資源全文訪問(wèn)鏈接。

讀者通過(guò)OPAC系統(tǒng)檢索資源并獲取CADAL相關(guān)數(shù)字資源包括五個(gè)步驟,整合檢索處理流程見(jiàn)圖1。

(1)讀者在清華大學(xué)圖書館OPAC系統(tǒng)執(zhí)行查詢操作;(2)通過(guò)嵌入OPAC系統(tǒng)的接口調(diào)用處理程序,提取讀者輸入的“題名”“作者”“ISBN”或“關(guān)鍵詞”等檢索字段和檢索值;(3)嵌入OPAC系統(tǒng)中的接口調(diào)用處理程序觸發(fā)接口調(diào)用,生成對(duì)CADAL元數(shù)據(jù)的HTTP請(qǐng)求并發(fā)送到CADAL開放接口系統(tǒng);(4)CADAL開放接口系統(tǒng)對(duì)請(qǐng)求進(jìn)行權(quán)限、語(yǔ)法等方面的合規(guī)性檢測(cè)后,將檢索結(jié)果提供給OPAC系統(tǒng)進(jìn)行后續(xù)處理與呈現(xiàn);(5)OPAC系統(tǒng)接到接口系統(tǒng)的返回結(jié)果,對(duì)返回?cái)?shù)據(jù)進(jìn)行甄別并將有效結(jié)果與OPAC系統(tǒng)館藏檢索結(jié)果進(jìn)行資源整合,供讀者參考和使用。

按照功能劃分,整合檢索處理流程涉及整合檢索邏輯與應(yīng)用場(chǎng)景部分、接口調(diào)用處理程序部分、OPAC頁(yè)面整合呈現(xiàn)部分;按照處理步驟可細(xì)化為四步,即讀者檢索信息提取與甄別、按照接口規(guī)范生成CADAL元數(shù)據(jù)接口調(diào)用請(qǐng)求并發(fā)送給接口系統(tǒng)、接收接口返回?cái)?shù)據(jù)并處理、生成CADAL全文對(duì)象訪問(wèn)鏈接整合到OPAC頁(yè)面呈現(xiàn)給讀者。

圖1 整合檢索處理流程

3 OPAC系統(tǒng)整合檢索CADAL數(shù)字資源功能實(shí)現(xiàn)

OPAC系統(tǒng)整合檢索CADAL數(shù)字資源功能實(shí)現(xiàn)中的關(guān)鍵細(xì)節(jié)問(wèn)題(包括讀者在OPAC系統(tǒng)提交檢索選項(xiàng)和檢索詞處理、整合檢索邏輯與應(yīng)用場(chǎng)景設(shè)計(jì)、接口返回?cái)?shù)據(jù)處理與分析、CADAL資源全文鏈接定位、接口調(diào)用程序編寫中需注意的問(wèn)題等),以供圖書館同行參考。

3.1 OPAC檢索信息處理

根據(jù)讀者在OPAC系統(tǒng)的檢索選項(xiàng)和檢索詞,可設(shè)計(jì)不同的整合檢索邏輯及應(yīng)用場(chǎng)景。讀者可選擇的檢索選項(xiàng)包括題名、作者和ISBN等。檢索選項(xiàng)為ISBN,則對(duì)應(yīng)的檢索邏輯為精確匹配,應(yīng)用場(chǎng)景為查找CADAL數(shù)字圖書館中是否存在ISBN相同的數(shù)字資源;檢索選項(xiàng)為題名或關(guān)鍵詞,對(duì)應(yīng)的檢索邏輯為模糊匹配,應(yīng)用場(chǎng)景為查找CADAL數(shù)字圖書館是否存在與檢索詞相關(guān)的數(shù)字資源;整合呈現(xiàn)頁(yè)面可在OPAC搜索結(jié)果頁(yè)面或資源詳情頁(yè)面實(shí)現(xiàn),兩種情況對(duì)應(yīng)的接口調(diào)用參數(shù)有所差異。搜索結(jié)果頁(yè)面呈現(xiàn)與讀者檢索詞相關(guān)的CADAL數(shù)字資源,資源詳情頁(yè)面呈現(xiàn)與具體資源相關(guān)的CADAL數(shù)字資源。整合檢索的主要目的是方便讀者獲取所需資源,盡可能將讀者檢索的相關(guān)資源精確定位并呈現(xiàn)。若讀者精確查詢,可利用ISBN在CADAL元數(shù)據(jù)中進(jìn)行精確定位;若讀者通過(guò)題名或關(guān)鍵詞等字段進(jìn)行資源查詢,只能利用檢索詞模糊檢索CADAL元數(shù)據(jù),獲得與其查詢目標(biāo)相關(guān)的數(shù)字資源。在整合檢索設(shè)計(jì)與應(yīng)用中,可考慮將兩種情況綜合應(yīng)用;在OPAC檢索結(jié)果頁(yè)面整合呈現(xiàn)時(shí),完全按照讀者輸入的檢索選項(xiàng)和檢索值進(jìn)行接口調(diào)用和元數(shù)據(jù)匹配;在OPAC資源詳情頁(yè)面整合呈現(xiàn)時(shí),考慮CADAL數(shù)字資源并非都包含ISBN值,在接口調(diào)用時(shí)可通過(guò)題名字段模糊匹配相關(guān)CADAL資源。各圖書館在實(shí)際應(yīng)用中需酌情考慮。

3.2 接口返回?cái)?shù)據(jù)量

CADAL接口系統(tǒng)基于元數(shù)據(jù)安全考慮,每次接口調(diào)用請(qǐng)求最多返回10條記錄。CADAL元數(shù)據(jù)檢索結(jié)果按照相關(guān)度分值進(jìn)行排序,檢索命中結(jié)果記錄數(shù)大于或等于10條時(shí),默認(rèn)返回前10條記錄;如需獲取前10條記錄以外的元數(shù)據(jù),可通過(guò)組合檢索參數(shù)start和rows指定返回結(jié)果,基本格式為“http://IP或域名/cadal/cbook/?q=檢索項(xiàng):檢索詞&start=*&rows=*”。如調(diào)用接口“http://IP或域名/cadal/cbook/?q=BookType:minguo&start=100&rows=5”,則返回檢索結(jié)果對(duì)101—105條元數(shù)據(jù)排序。具體應(yīng)用中,受限于OPAC系統(tǒng)頁(yè)面內(nèi)容數(shù)量、布局和美觀考慮以及模糊檢索匹配精確度等,通常在目標(biāo)頁(yè)面整合記錄條目最多為10條。

3.3 接口返回?cái)?shù)據(jù)選取

CADAL元數(shù)據(jù)檢索結(jié)果相關(guān)度主要受CADAL元數(shù)據(jù)質(zhì)量、接口服務(wù)系統(tǒng)分詞庫(kù)以及算法等多重因素共同影響,為保證讀者有良好的檢索體驗(yàn),避免出現(xiàn)接口系統(tǒng)對(duì)于個(gè)別檢索詞返回相關(guān)度低的結(jié)果,考慮對(duì)接口返回?cái)?shù)據(jù)增加過(guò)濾選取工作。按照精確匹配和模糊匹配要求,將過(guò)濾選取工作分為兩種情況進(jìn)行處理:(1)若接口調(diào)用時(shí)按照ISBN對(duì)元數(shù)據(jù)精確匹配,可直接呈現(xiàn)命中結(jié)果,無(wú)需過(guò)濾操作;(2)若接口調(diào)用時(shí)無(wú)法按照ISBN對(duì)元數(shù)據(jù)精確匹配,需通過(guò)讀者輸入檢索詞進(jìn)行模糊匹配,可按照返回結(jié)果中相關(guān)度分值對(duì)命中元數(shù)據(jù)條目進(jìn)行過(guò)濾操作,選取規(guī)則為檢索命中記錄的相關(guān)度分值大于1且高于最大相關(guān)度分值的1/2,將滿足該條件的結(jié)果記錄按照相關(guān)度得分排序呈現(xiàn)。接口返回?cái)?shù)據(jù)選取流程見(jiàn)圖2,其檢索結(jié)果整合遵循的是混搭理念?;齑钭鳛閃eb 2.0的典型應(yīng)用,指將不同來(lái)源的數(shù)據(jù)和功能無(wú)縫組合,形成全新、集成式的服務(wù)。清華大學(xué)圖書館于2008年開始嘗試將混搭理念引入OPAC系統(tǒng),先后實(shí)現(xiàn)在OPAC頁(yè)面上匯集書封、短信、館藏地圖和多媒體資源等服務(wù),目的是給讀者提供多樣化信息資源和獨(dú)特的應(yīng)用體驗(yàn)。本應(yīng)用中整合CADAL資源采用的是同樣的思路,實(shí)現(xiàn)方式是在頁(yè)面不同分區(qū)中呈現(xiàn)不同來(lái)源的資源。OPAC資源與CADAL相關(guān)資源未合并在頁(yè)面同一個(gè)分區(qū)中,在頁(yè)面底部單獨(dú)呈現(xiàn)檢索命中的CADAL相關(guān)資源[6-8]。

圖2 接口返回?cái)?shù)據(jù)選取流程

3.4 全文對(duì)象鏈接定位

接口系統(tǒng)返回?cái)?shù)據(jù)格式默認(rèn)為XML,也可通過(guò)組合檢索參數(shù)指定其他常用返回格式,如json、python、ruby、php、phps或custom等格式。整合CADAL資源到OPAC頁(yè)面需提供全文訪問(wèn)鏈接,以方便讀者使用。對(duì)于命中記錄,提取元數(shù)據(jù)中的BookNo字段值,以定位CADAL資源的全文對(duì)象。所有CADAL資源都具有資源唯一標(biāo)識(shí)BookNo,CADAL數(shù)字資源平臺(tái)中全文對(duì)象的URL由URL前綴加上BookNo字段組成,通過(guò)解析CADAL元數(shù)據(jù),找到CADAL資源的BookNo字段,可組合出相應(yīng)資源的全文訪問(wèn)鏈接地址,具體格式為“http://www.cadal.zju.edu.cn/book/”+BookNo。

3.5 接口調(diào)用量分析

截至2016年年底,在CADAL管理中心登記試用開放接口系統(tǒng)的成員館已有30家。開放接口系統(tǒng)采用雙服務(wù)器負(fù)載均衡,當(dāng)訪問(wèn)量過(guò)多時(shí),兩臺(tái)服務(wù)器共同分擔(dān)訪問(wèn)流量,CADAL開放接口服務(wù)系統(tǒng)并發(fā)量大于500個(gè)用戶。在高并發(fā)用戶測(cè)試時(shí),事務(wù)響應(yīng)時(shí)間最小值為0.343秒,最大值為16.349秒,中間值為2.608秒。實(shí)際應(yīng)用環(huán)境中,并發(fā)用戶量不高,檢索結(jié)果響應(yīng)時(shí)間均在1秒內(nèi),目前接口系統(tǒng)性能和吞吐量可以滿足已登記試用成員館的接口調(diào)用需求。2016年,清華大學(xué)圖書館OPAC系統(tǒng)共發(fā)出264 841次關(guān)于民國(guó)圖書資源的CADAL元數(shù)據(jù)接口調(diào)用請(qǐng)求,日均調(diào)用量約725次,平均調(diào)用量約為30次/小時(shí)。

3.6 接口調(diào)用程序開發(fā)注意事項(xiàng)

在接口調(diào)用程序開發(fā)過(guò)程的注意事項(xiàng)包括接口調(diào)用身份認(rèn)證、特殊字符處理、URL編碼等。

(1)認(rèn)證。使用CADAL開放接口系統(tǒng)需經(jīng)過(guò)IP和用戶白名單雙重認(rèn)證。使用接口系統(tǒng)前須注冊(cè)接口調(diào)用機(jī)器的IP地址,當(dāng)CADAL接口服務(wù)器收到HTTP請(qǐng)求時(shí),要先判斷該請(qǐng)求是否來(lái)自授權(quán)IP地址,若IP地址未經(jīng)授權(quán),則接口調(diào)用請(qǐng)求不會(huì)被系統(tǒng)處理。另外,基于服務(wù)器端編程語(yǔ)言調(diào)用接口時(shí),除提供服務(wù)器IP地址外,還要向CADAL管理中心申請(qǐng)用戶賬號(hào);基于客戶端開發(fā)語(yǔ)言調(diào)用接口時(shí),考慮到JavaScript等客戶端腳本語(yǔ)言的源代碼可見(jiàn),用戶名和密碼信息不安全,使用一組僅需IP認(rèn)證的接口。由于清華大學(xué)圖書館OPAC系統(tǒng)存在封閉性,在應(yīng)用中使用客戶端開發(fā)語(yǔ)言JavaScript進(jìn)行接口調(diào)用。

(2)特殊字符。調(diào)用CADAL提供的開放接口,需遵循相應(yīng)規(guī)則生成合規(guī)的HTTP請(qǐng)求。在生成HTTP請(qǐng)求前,需對(duì)檢索詞中的特殊字符進(jìn)行處理,再提交檢索請(qǐng)求。如檢索詞為“釹玻璃中Na~(3+)離子光吸收溫度依從性及釹玻璃光纖溫度”,經(jīng)處理得到“釹玻璃中Na~(3+)離子光吸收溫度依從性及釹玻璃光纖溫度”。英文文獻(xiàn)的題名、作者等字段經(jīng)常出現(xiàn)空格,若不預(yù)先處理就直接提交檢索,CADAL接口系統(tǒng)會(huì)誤認(rèn)為是組合檢索請(qǐng)求,因此提交檢索請(qǐng)求前,需將檢索詞中空格替換成“AND 檢索項(xiàng):”。

(3)URL編碼。URL編碼格式采用ASCII碼,不能在URL中包含任何非ASCII字符(如中文)。因此,須對(duì)調(diào)用接口的URL進(jìn)行轉(zhuǎn)換,生成有效的ASCII字符格式。如“大學(xué)”轉(zhuǎn)換后為“%E5%A4%A7%E5%AD%A6”。各種編程語(yǔ)言都有相應(yīng)的類和方法實(shí)現(xiàn)編碼功能。不同的瀏覽器對(duì)包含中文的URL處理具有不同的表現(xiàn),有的瀏覽器地址欄在顯示URL時(shí)會(huì)自動(dòng)進(jìn)行解碼(使用UTF-8字符集)。如在Chrome瀏覽器地址欄中輸入“http://IP或者域名/cadal/cbook/?q=Title:大學(xué)”,其中的中文可直接顯示,但實(shí)際發(fā)送給服務(wù)端的原始URL是經(jīng)過(guò)編碼的。

(4)繁簡(jiǎn)體漢字。CADAL元數(shù)據(jù)接口系統(tǒng)會(huì)對(duì)繁簡(jiǎn)體漢字進(jìn)行轉(zhuǎn)換處理,在OPAC系統(tǒng)中調(diào)用接口部分程序不必考慮繁簡(jiǎn)體漢字轉(zhuǎn)換工作。

3.7 OPAC系統(tǒng)整合檢索CADAL數(shù)字資源建設(shè)成效

在清華大學(xué)圖書館OPAC系統(tǒng)整合檢索CADAL數(shù)字資源實(shí)際應(yīng)用中,使用JavaScript客戶端語(yǔ)言調(diào)用CADAL元數(shù)據(jù)開放接口。程序分析讀者檢索OPAC的命中記錄,“出版發(fā)行”字段有“民國(guó)”“民國(guó)”字樣,或者出版時(shí)間在1911—1949年的圖書會(huì)觸發(fā)調(diào)用CADAL元數(shù)據(jù)開放接口腳本程序,接口調(diào)用處理程序?qū)?duì)檢索命中返回結(jié)果進(jìn)行處理并整合呈現(xiàn)相關(guān)CADAL數(shù)字資源。如在清華大學(xué)圖書館OPAC系統(tǒng)中基于關(guān)鍵詞字段搜索“古文觀止”,在結(jié)果列表點(diǎn)擊“考正古文觀止”打開該資源詳情頁(yè)面,獲取該資源在清華大學(xué)圖書館的館藏位置信息與數(shù)字資源全文鏈接,讀者點(diǎn)擊題名后可在瀏覽器直接打開全文對(duì)象,閱讀該資源電子版全文。

清華大學(xué)圖書館OPAC系統(tǒng)整合檢索CADAL數(shù)字資源應(yīng)用得到廣大讀者好評(píng),擴(kuò)充了讀者獲取資源的渠道,部分民國(guó)圖書由于館藏副本較少,給讀者借閱造成不便。借助整合檢索功能的應(yīng)用,使讀者在館藏詳情頁(yè)面獲取整合呈現(xiàn)的CADAL全文資源,方便讀者獲取CADAL數(shù)字資源平臺(tái)中民國(guó)圖書全文電子版,一定程度上緩解了讀者借閱問(wèn)題。

4 結(jié)語(yǔ)

設(shè)計(jì)與開發(fā)清華大學(xué)圖書館OPAC系統(tǒng)整合檢索CADAL數(shù)字資源功能,將清華大學(xué)圖書館館藏資源與CADAL豐富的數(shù)字資源有效、無(wú)縫地關(guān)聯(lián)和整合,為讀者提供包含異構(gòu)資源的檢索結(jié)果,建立跨資源、跨系統(tǒng)的資源共享環(huán)境,更好地為讀者服務(wù)。該功能不僅提高了CADAL數(shù)字資源在清華大學(xué)圖書館OPAC系統(tǒng)的利用率,還擴(kuò)充了讀者獲取CADAL數(shù)字資源的渠道和方式。

各高校圖書館OPAC系統(tǒng)的運(yùn)行環(huán)境、程序開發(fā)語(yǔ)言及頁(yè)面結(jié)構(gòu)等情況各有不同,但CADAL元數(shù)據(jù)開放接口系統(tǒng)提供了獨(dú)立、通用、標(biāo)準(zhǔn)化的應(yīng)用程序接口。其他高校圖書館可通過(guò)標(biāo)準(zhǔn)化接口調(diào)用與程序處理,將CADAL相關(guān)數(shù)字資源元數(shù)據(jù)信息整合到自身OPAC系統(tǒng)。針對(duì)現(xiàn)有OPAC系統(tǒng)整合檢索CADAL數(shù)字資源的讀者使用體驗(yàn)來(lái)看,仍存在不足,需后續(xù)改進(jìn)。CADAL數(shù)字資源平臺(tái)全文訪問(wèn)需要用戶登陸認(rèn)證,圖書館讀者發(fā)現(xiàn)感興趣的資源后,需輸入CADAL數(shù)字資源平臺(tái)的用戶名和密碼,在認(rèn)證成功后才可查看全文。日后應(yīng)避免讀者在不同系統(tǒng)間多次登陸的問(wèn)題,優(yōu)化讀者使用體驗(yàn),后續(xù)可考慮通過(guò)CADAL成員圖書館IP地址免認(rèn)證或?qū)崿F(xiàn)OPAC系統(tǒng)與CADAL數(shù)字資源平臺(tái)統(tǒng)一認(rèn)證功能來(lái)解決上述問(wèn)題。

[1]周虹,張蓓,竇天芳,等.清華大學(xué)圖書館OPAC書封服務(wù)的設(shè)計(jì)與實(shí)現(xiàn)[J].現(xiàn)代圖書情報(bào)技術(shù),2008(8):84-87.

[2]CADAL.資源服務(wù)動(dòng)態(tài)[EB/OL].[2017-05-24].http://www.CADAL.cn/.

[3]CADAL.CADAL數(shù)字資源入庫(kù)量、在線量分類統(tǒng)計(jì)[EB/OL].[2017-05-24].http://www.CADAL.cn/zydt/index1512.htm.

[4]李書寧,王瓊.圖書館資源發(fā)現(xiàn)應(yīng)用OpenAPI標(biāo)準(zhǔn)化研究[J].圖書情報(bào)工作,2012,56(7):16-20.

[5]SMILEY D,PUGH E.Apache Solr 3 enterprise searchserver[M].Birmingham:Packt Publishing Ltd,2011.

[6]竇天芳,姜愛(ài)蓉,陳武.以Exlibris &Metalib為例談?wù)蠙z索的幾個(gè)關(guān)鍵技術(shù)及應(yīng)用[J].情報(bào)科學(xué),2007,25(8):1235-1239.

[7]翟曉娟,聶娜.滿足用戶個(gè)體需求的圖書館開放平臺(tái)設(shè)計(jì)——基于OpenAPI、App、Mashup、SOA的集成實(shí)踐應(yīng)用[J].大學(xué)圖書館學(xué)報(bào),2011(6):26-32.

[8]周朝陽(yáng),王時(shí)繪.面向服務(wù)的資源整合檢索系統(tǒng)研究與實(shí)現(xiàn)[J].現(xiàn)代情報(bào),2009,29(9):175-178.

Abstract:Through calling CADAL metadata open interfaces system,Tsinghua University Library OPAC system can search and integrate metadata of CADAL digital resources,and publish record full text access links in the result page,which could enhance readers experiences and improve CADAL digital resources rendering and utilization,and readers could retrieve and utilize related CADAL digital resources conveniently when they are using OPAC system.This paper focuses on design and implementation of CADAC metadata search and integration in OPAC system,which could be a good reference for the same type of library or system designers.

Keywords:OPAC;CADAL;Metadata;OpenAPI

Research on CADAL Digital Resource Integration Retrieval:Take Tsinghua University Library OPAC System for Example

YUAN HongLiang,ZHANG Bei,ZHANG ChengYu,ZHOU Hong
(Tsinghua University Library,Beijing 100084,China)

G250.7

10.3772/j.issn.1673-2286.2017.08.005

* 本研究得到CADAL應(yīng)用系統(tǒng)建設(shè)子項(xiàng)目“基于OpenAPI的信息檢索系統(tǒng)”資助。

遠(yuǎn)紅亮,男,1982年生,碩士,館員,研究方向:數(shù)字圖書館、圖書館IT及信息化建設(shè),E-mail:yuanhl@lib.tsinghua.edu.cn。

張蓓,女,1979年生,碩士,副研究館員,研究方向:數(shù)字圖書館、圖書館IT及信息化建設(shè)。

張成昱,男,1966年生,博士,副研究館員,研究方向:數(shù)字圖書館、圖書館IT及信息化建設(shè)。

周虹,女,1976年生,碩士,副研究館員,研究方向:數(shù)字圖書館、圖書館IT及信息化建設(shè)。

2017-06-26)

猜你喜歡
調(diào)用清華大學(xué)頁(yè)面
刷新生活的頁(yè)面
清華大學(xué):“如鹽在水”開展課程思政
核電項(xiàng)目物項(xiàng)調(diào)用管理的應(yīng)用研究
我的清華大學(xué)自主招生經(jīng)歷
LabWindows/CVI下基于ActiveX技術(shù)的Excel調(diào)用
基于系統(tǒng)調(diào)用的惡意軟件檢測(cè)技術(shù)研究
他永遠(yuǎn)是我們的老學(xué)長(zhǎng)——清華大學(xué)受助研究生來(lái)信摘編
一道2009年清華大學(xué)自主招生數(shù)學(xué)試題的思考
利用RFC技術(shù)實(shí)現(xiàn)SAP系統(tǒng)接口通信
同一Word文檔 縱橫頁(yè)面并存
涞水县| 道真| 建平县| 伊吾县| 丰宁| 五寨县| 巴楚县| 钟山县| 柯坪县| 来宾市| 开封市| 屏边| 温州市| 保定市| 沾化县| 德令哈市| 武宁县| 连平县| 东安县| 会昌县| 淅川县| 闽清县| 横峰县| 新建县| 孟津县| 榆树市| 青海省| 喜德县| 西青区| 定边县| 恩施市| 玛纳斯县| 河南省| 北海市| 赤峰市| 拉萨市| 依安县| 双流县| 贵定县| 河西区| 和平区|