萬巧燕
(湖南圖書館,湖南 長沙 410011)
隨著大數(shù)據(jù)時代的到來,訪問更便捷、檢索更高效的數(shù)字資源越來越受大眾喜愛,也成為公共圖書館館藏建設(shè)不可或缺的一部分,商用數(shù)據(jù)庫的采購預(yù)算逐年增加。驗收作為數(shù)字資源質(zhì)量控制的重要一環(huán),已然走入研究者的視野。當(dāng)前,公共圖書館數(shù)字資源驗收正處于指標(biāo)界定不明確、統(tǒng)計維度不統(tǒng)一、人工驗收工作量繁重等困境當(dāng)中,必須制定可行、規(guī)范的策略加以應(yīng)對。
國內(nèi)最早對數(shù)字資源驗收進行研究的是王欣、葉祥滿[1]等人,他們從驗收計量、內(nèi)容驗收、更新頻率驗收、檢索功能驗收等方面提出驗收的幾個維度,并從數(shù)字資源合同條款的擬定來探討數(shù)字資源的質(zhì)量控制。劉雪飛[2]采用《高校圖書館數(shù)字資源計量指南》中的計量指標(biāo)作為驗收參考,強調(diào)要在合同定制時明確雙方權(quán)利、義務(wù)的特殊條款。晁行國[3]從高校圖書館數(shù)字資源的驗收出發(fā),在上述基礎(chǔ)上提出驗收要以采購內(nèi)容、使用時間、適用空間為方向。萬萬[4]在《高校圖書館數(shù)字資源采購問題淺談》中提到要組織驗收專家組,從采購人員、技術(shù)人員、讀者、財政人員多個方面組織驗收。整體而言,數(shù)字資源驗收在過去的十多年里取得了長足進展,基本上確定了驗收的內(nèi)容、維度,即便研究對象多為高校圖書館,對公共圖書館的數(shù)字資源驗收也有借鑒意義。相比于高校,公共圖書館受眾面更廣,需求及訪問形式更多樣,驗收工作面臨更為嚴(yán)峻的挑戰(zhàn)。
商用數(shù)據(jù)庫是圖書館通過購買獲得一定期限使用權(quán)或保存權(quán)的數(shù)據(jù)庫。在合同有效期間,為最大限度保障館方權(quán)益,以合同中驗收、質(zhì)保金等明文條款約束供應(yīng)商,進一步控制數(shù)字資源質(zhì)量。把握好數(shù)據(jù)庫驗收,不僅是保障館方獲得與合同相對應(yīng)權(quán)利的應(yīng)有之義,也是控制商用數(shù)據(jù)庫質(zhì)量不可或缺的重要環(huán)節(jié)。同時,在驗收過程中收集整理的數(shù)據(jù)庫建設(shè)數(shù)據(jù)、使用情況等,還可為來年數(shù)據(jù)庫采購提供依據(jù)。
需要說明的是,數(shù)字資源范疇較大,數(shù)據(jù)庫僅為其中一個類別。按《圖書館數(shù)字資源統(tǒng)計標(biāo)準(zhǔn)和應(yīng)用指南》所述,數(shù)據(jù)庫以供應(yīng)商分割的最小銷售單元在檢索平臺中以“庫”的形式而非“專題”形式單獨存在[5]。以皮書數(shù)據(jù)庫為例,其設(shè)有“中國社會發(fā)展數(shù)據(jù)庫”“中國經(jīng)濟發(fā)展數(shù)據(jù)庫”“中國行業(yè)發(fā)展數(shù)據(jù)庫”等專欄,但以皮書數(shù)據(jù)庫為最小銷售單元,統(tǒng)計時則計皮書為一個數(shù)據(jù)庫。讀者在圖書館能使用的數(shù)字資源,除了商用數(shù)據(jù)庫之外,還包括自建資源、地方特色資源等。為嚴(yán)謹(jǐn)計,文中的數(shù)字資源僅指商用數(shù)據(jù)庫。
王欣[1]等在2012年提出數(shù)據(jù)庫質(zhì)量控制的7個步驟:(1)確定需進行質(zhì)量控制的數(shù)據(jù)庫;(2)確定數(shù)據(jù)庫質(zhì)量的特性值,即數(shù)量、內(nèi)容、更新頻率、可獲得性和檢索功能等;(3)確定數(shù)字資源的計量規(guī)格;(4)確定能準(zhǔn)確檢驗特性值的驗收手段;(5)進行實際檢驗并做好數(shù)據(jù)記錄;(6)分析實際與質(zhì)量要求特性值之間存在的差異;(7)反饋給供應(yīng)商,進行糾正。后續(xù)的數(shù)據(jù)庫驗收研究基本上延續(xù)了該思路。在公共圖書館驗收實踐中,怎樣界定不同類型數(shù)據(jù)庫的計量規(guī)格、如何衡量特性值等問題需要進一步思考。
與數(shù)據(jù)庫方簽署的合同是開展數(shù)據(jù)庫驗收的主要依據(jù)。在驗收實踐中,因合同措辭表述不清帶來的問題最直觀,如資源量統(tǒng)計難,更新量、版權(quán)等的描述無法落實到具體驗收環(huán)節(jié)等。
2.1.1 統(tǒng)計難——平臺端口資源量表述不明
合同中約定的資源量,不同數(shù)據(jù)庫商衡量的角度不一。館方所購的是數(shù)據(jù)庫在一段時間內(nèi)的使用權(quán),微信端、電腦端、App端等只是接入的方式不同,各平臺讀者能使用的資源量應(yīng)當(dāng)相等。舉例說,合同上的條款描述為:“乙方為甲方提供微信公眾號訪問和數(shù)據(jù)接口等形式訪問電子書1萬本?!蔽⑿殴娞柨梢詥为殥戽溄樱部梢蚤_通微信小程序,而數(shù)據(jù)接口是一個更為寬泛的概念,是作為計算機軟件開發(fā)商提供給用戶或者第三方軟件開發(fā)商的一系列標(biāo)準(zhǔn)規(guī)范,用于特定數(shù)據(jù)的交流[6]。約定好的1萬本電子書,有部分?jǐn)?shù)據(jù)庫商設(shè)置電腦端、微信端各5000本,有部分?jǐn)?shù)據(jù)庫商會設(shè)置電腦端、微信端各1萬本,有的數(shù)據(jù)庫商設(shè)置電腦端1萬本,出于版權(quán)考慮微信端提供2000本……種種問題,不一而足。如果合同中未詳細(xì)描述資源量分布,每個平臺資源足量自然符合驗收要求,多個平臺數(shù)量合計看似也達標(biāo),但在數(shù)據(jù)庫實際使用時會造成許多麻煩。
多端口多平臺也給數(shù)據(jù)庫評價工作帶來困難。訪問量、下載量等是評價數(shù)據(jù)庫使用情況的主要依據(jù)。部分?jǐn)?shù)據(jù)庫只能統(tǒng)計總體使用情況,少部分可精確到平臺,但無法細(xì)化到不同端的不同入口,無法判斷數(shù)據(jù)庫在哪個平臺哪個端口更受歡迎、更符合讀者的使用習(xí)慣。對數(shù)據(jù)庫的評價失衡,會錯誤引導(dǎo)不同平臺端口的設(shè)置,甚至使采購需求的擬定產(chǎn)生偏差。
2.1.2 統(tǒng)計難——數(shù)字不準(zhǔn)確,單位指代不明
“提供30多萬種出版暢銷圖書”“合計兩萬小時、10萬余集”“提供使用有聲書籍與節(jié)目資源總量達到6000多本”。多種、余集、多本,本意表明資源豐富,卻易引起疑問,“30萬種”并不等同于“30多萬種”。再如單位指代不明,“期刊6000種,2200萬條以上”,電子期刊多以“種”“冊”計,而“條”所指不明。
信息不對稱充斥在公共圖書館采購、驗收、日常維護數(shù)據(jù)庫的各個流程,館方一直處于被動地位。館方?jīng)]有技術(shù)路徑核查數(shù)據(jù)庫的資源上架、更新等情況,所有數(shù)據(jù)來源于數(shù)據(jù)庫方,不僅基數(shù)大,真實性也難以自證。
2.2.1 數(shù)量驗證難
館方有權(quán)對合同中約定的資源量要求數(shù)據(jù)庫方提供證明。其中資源清單是主要依據(jù)。在驗收實踐中,資源清單也出現(xiàn)各種問題。一方面,數(shù)據(jù)庫資源量巨大,動輒百萬千萬,不能一一核實,只能人工手動進行樣本查重、抽查,費時費力,準(zhǔn)確性也有待提高。另一方面,部分?jǐn)?shù)據(jù)庫出于商業(yè)機密考量,并不能完全提供資源清單,資源總量驗證難。
2.2.2 更新量驗證難
資源量的表述必然涉及更新量。有諸多因素導(dǎo)致更新量無法在驗收中落實。數(shù)據(jù)庫一年一采,驗收工作集中在付款前,需投入較長時間,很難作為日常工作進行,更遑論定期關(guān)注資源更新情況。若沒有技術(shù)平臺定期核查資源量與內(nèi)容,合同中的更新量僅作為一項數(shù)據(jù)體現(xiàn),卻得不到驗證。此外,合同中更新量表述不詳盡也易導(dǎo)致理解歧義,產(chǎn)生不必要的糾紛。如“月度更新、年更新量不少于1000小時”“平臺更新20%的資源”“圖書每月更新100本以上”“更新數(shù)據(jù)150多萬條”。提及更新量而不說明更新頻率,未闡述“更新”概念(是指在原有資源量的基礎(chǔ)上“增加”新資源,或替換過期下架的資源而實際總量保持不變)。
近幾年,圖書館數(shù)字資源侵權(quán)事件頻發(fā),作為采購方的圖書館并不能全身而退,甚至因提供展示平臺被認(rèn)定為共同侵權(quán)[7]?!缎畔⒕W(wǎng)絡(luò)傳播權(quán)保護條例》雖然有規(guī)定,圖書館、檔案館等可以不經(jīng)著作權(quán)人許可,通過信息網(wǎng)絡(luò)向本館館舍內(nèi)服務(wù)對象提供本館收藏的合法出版的數(shù)字作品和依法為陳列或者保存版本的需要以數(shù)字化形式復(fù)制的作品,不向其支付報酬,但不得直接或者間接獲得經(jīng)濟利益[8]。條例限定必須在館舍內(nèi)使用,但數(shù)字資源的訪問不受時空的限制才能更便于讀者使用,也是其區(qū)別于本地數(shù)字資源的特色之一,因此部分圖書館采用VPN等技術(shù)手段實現(xiàn)數(shù)據(jù)庫的遠(yuǎn)程訪問,這一點難以避免。
在合同中,數(shù)據(jù)庫商聲明其提供的資源都已取得完整版權(quán),可隨時抽查,并承諾處理、承擔(dān)因版權(quán)問題引起的一切損失。一方面,數(shù)據(jù)庫方從出版社、代理商處采購的資源大都以批為單位,核查每一種資源的授權(quán)需要經(jīng)歷館方抽查、數(shù)據(jù)庫方提出申請、驗收人員核對的流程,必然耗費大量時間與人力,目前階段不可行;另一方面,數(shù)據(jù)庫與搭建的平臺在更新上存在頻率差,導(dǎo)致很多資源下架有延誤、不及時,這為之后的侵權(quán)事件埋下隱患。數(shù)字資源侵權(quán)不僅會給公共圖書館帶來錢財損失,名譽上還有負(fù)面影響。
當(dāng)前圖書館的數(shù)字資源一般以單一來源或公開招標(biāo)形式進行采購,在前期標(biāo)書或合同制訂上明確驗收標(biāo)準(zhǔn),避免引起歧義的表述是優(yōu)化驗收工作、減少后期不必要溝通的重要環(huán)節(jié),也能讓驗收工作有據(jù)可依。如上所述,草擬標(biāo)書中的需求、合同資源數(shù)量時應(yīng)注意精簡行文。
3.1.1 資源量表達精確
數(shù)據(jù)庫資源要數(shù)字準(zhǔn)確,減少類似“10萬余集”字樣的表述,不同單位之間的包含必須表達清楚。如某聽書類數(shù)據(jù)庫所列資源量:“不少于1000本精品電子書,不少于30萬集的專輯數(shù)量,共計20萬小時”,電子書、集數(shù)、時間包含關(guān)系指代不明,應(yīng)盡量避免。
3.1.2 更新量表述準(zhǔn)確
前期與數(shù)據(jù)庫商溝通后確定更新概念、更新頻率,從而約定更新量核查時間。
3.1.3 明確不同端口資源量的分布
在列舉資源數(shù)量時,明確微信公眾號、小程序、電腦端等各端口可供讀者使用的數(shù)量,以此作為驗收的詳細(xì)依據(jù)。有些資源只授權(quán)給數(shù)據(jù)庫,不能放置在第三方平臺。在標(biāo)書或合同中有針對性地對各端口資源量做出規(guī)定,可以有效避免驗收中的無效溝通,減輕驗收人員工作量。
3.1.4 加強對數(shù)字資源商業(yè)資質(zhì)的審查
在標(biāo)書中強調(diào)數(shù)據(jù)庫資源必須是正規(guī)出版物,版權(quán)完整。盡量選擇規(guī)模較大、建設(shè)正規(guī)、行業(yè)口碑較好的數(shù)據(jù)庫商作為合作對象,對國內(nèi)幾個大型正規(guī)出版社的授權(quán)書做數(shù)量上的硬性要求。在驗收過程中除核查標(biāo)書中規(guī)定的出版社版權(quán)之外,還可以抽查一小部分資源的版權(quán)協(xié)議是否從作者—出版社、代理公司—數(shù)據(jù)庫形成完整清晰的版權(quán)協(xié)議鏈條,聽書類資源還需要制作公司的授權(quán)。此外,在雙方的權(quán)利和義務(wù)條款上,應(yīng)當(dāng)讓數(shù)據(jù)庫商做出承諾:必須合法解決版權(quán),保證所供產(chǎn)品信息內(nèi)容符合中華人民共和國相關(guān)法律,并保證所供信息不會引起知識產(chǎn)權(quán)糾紛等法律責(zé)任。因其提供的產(chǎn)品所產(chǎn)生的版權(quán)及相關(guān)知識產(chǎn)權(quán)而導(dǎo)致的糾紛和賠償責(zé)任均由數(shù)據(jù)庫商負(fù)責(zé)處理和承擔(dān)。如若合約到期,數(shù)據(jù)庫方應(yīng)自覺下架資源,由此產(chǎn)生的糾紛和賠償均由數(shù)據(jù)庫商負(fù)責(zé)處理和承擔(dān)。
基于研究者已經(jīng)對統(tǒng)計計量、內(nèi)容驗收、更新頻率驗收、檢索功能驗收等方面做了相關(guān)論述,提出了比較詳盡的驗收流程[1-2],筆者將從公共圖書館商用數(shù)據(jù)庫驗收實踐入手,針對數(shù)據(jù)庫數(shù)量統(tǒng)計驗收展開詳細(xì)論述。
數(shù)字資源驗收是一個長期過程,為條理清晰、梳理有序,應(yīng)當(dāng)有時間、驗收情況的數(shù)據(jù)記錄,也能讓后續(xù)的驗收人員有章可循。數(shù)據(jù)記錄應(yīng)當(dāng)包括如下內(nèi)容:(1)合同編號。(2)公司名稱。(3)數(shù)據(jù)庫名稱。(4)使用終端:一般為館方微信公眾號、館方微信小程序、PC端、App端或其他展示平臺等。(5)合同約定的資源內(nèi)容及總量:在數(shù)據(jù)庫商關(guān)于數(shù)據(jù)的描述較多的情況下,甄選核心關(guān)鍵詞,如“本聽書庫含兒童、人文、有聲小說、財經(jīng)、曲藝戲曲、文學(xué)、相聲評書、外語、健康等類別,提供使用有聲書籍與節(jié)目資源總量達到6000多本”可轉(zhuǎn)化為“含聽書資源6000本”;“本期刊庫涵蓋時事政治、財經(jīng)、管理、時尚等1500多種主流暢銷期刊,館方可選取其中1200種自由使用”可記錄為“1200種電子期刊”。(6)合同約定的更新量:該項應(yīng)當(dāng)指明更新頻率與更新量。以上6項可與合同對應(yīng)填寫。(7)驗收申請函中的資源內(nèi)容及總量:在根據(jù)合同要求布置好資源后,數(shù)據(jù)庫方會向館方發(fā)送驗收申請函。(8)第一次驗收:數(shù)據(jù)庫的日常掛靠、使用數(shù)據(jù)的收集、管理一般由技術(shù)部門、采訪部門、使用部門等多方合作,可分作幾項由以上部門分開填寫。收到資源清單后,與合同約定量、申請驗收量互相比對,如有整合的平臺,還可加上平臺導(dǎo)出量互相印證。(9)最終驗收:在驗收實踐中,可從以下4個維度綜合得出驗收結(jié)論。一是合同驗收率(申請驗收量/合同約定量)。數(shù)據(jù)庫商自查后發(fā)出驗收申請,此項體現(xiàn)合同響應(yīng)程度。兩者一致,合同驗收率100%是驗收工作順利開展的前提。二是資源平臺接入率(后臺導(dǎo)出資源詳單量/合同約定量)。部分圖書館做出了平臺整合資源的嘗試,將各類數(shù)據(jù)庫整合到一個平臺上,實現(xiàn)便捷搜索后臺統(tǒng)一管理,此項體現(xiàn)數(shù)據(jù)庫提供的資源在平臺供讀者使用的情況。三是抽檢缺失率(抽檢缺失量/抽檢總量)。就目前的技術(shù)手段而言,抽檢是數(shù)字資源驗收必不可少的一步。在核驗數(shù)據(jù)庫商提供的清單是否有效的同時,還能以讀者的視角,在檢索使用過程中留意該數(shù)據(jù)庫首頁設(shè)計是否科學(xué)、檢索是否高效便捷、跳轉(zhuǎn)切換是否流暢、閱讀或聽書界面是否功能齊全等。合同驗收率和資源平臺接入率達100%、抽檢缺失率0%代表數(shù)據(jù)庫商在合同中承諾的資源至少在數(shù)量上已達標(biāo)。在此基礎(chǔ)上,抽檢中發(fā)現(xiàn)的問題也應(yīng)當(dāng)妥善處理,如此,方可得出合格的驗收結(jié)論。建議在驗收完成后形成驗收報告,就驗收過程中發(fā)現(xiàn)的各類問題或歸納分類或?qū)こ鲈蚧蛱岢龈倪M方向,以為后續(xù)的驗收工作提供借鑒。
數(shù)字資源種類繁多、體量龐大,現(xiàn)今還沒有規(guī)范、成體系的驗收標(biāo)準(zhǔn),人工驗收費時費力。業(yè)內(nèi)近幾年一直提出要加快技術(shù)研究步伐,減輕驗收人員的負(fù)擔(dān),開發(fā)出能批量核查資源數(shù)量、更新量、版權(quán)的平臺或系統(tǒng)。如今或可從以下兩個方面為改進數(shù)字資源驗收工作提供技術(shù)支持。
3.3.1 將數(shù)據(jù)庫接入平臺統(tǒng)一管理
部分圖書館將休閑娛樂類數(shù)據(jù)庫資源接入了微信小程序。該平臺方便讀者檢索,免去機械打開數(shù)據(jù)庫的繁瑣程序,也讓讀者針對同一種資源在同類型數(shù)據(jù)庫中橫向比較。且官方直接管理平臺,能直觀掌握各數(shù)據(jù)庫瀏覽量等統(tǒng)計數(shù)據(jù),保障數(shù)據(jù)真實性。對于讀者和館方都有極大的益處,但其中的隱患也不能忽視。一是多數(shù)圖書館技術(shù)部門不能獨立完成平臺的搭建與日常維護,平臺與其他數(shù)據(jù)庫的對接、更新、統(tǒng)計等都有賴于第三方公司的技術(shù)支持,削弱了館方的主動性。二是一旦不再與第三方合作或合作形式變動,平臺所有權(quán)的歸屬易引起糾紛。三是版權(quán)問題需要解決,一部分資源在簽署版權(quán)協(xié)議時要求代理方不能放置在第三方平臺。如不能完全接入平臺,數(shù)量有損,驗收不能通過;若針對這一部分資源再設(shè)置遠(yuǎn)程訪問鏈接,則與平臺設(shè)置的初衷背道而馳。
3.3.2 提供館方查詢管理的后臺
資源瀏覽量、下載量等是評價一個數(shù)據(jù)庫使用效果、性價比的重要指標(biāo),在同類型數(shù)據(jù)庫的選擇比較中更為突出。長期以來,館方只能被動地接收數(shù)據(jù)庫商發(fā)過來的使用數(shù)據(jù),搭建統(tǒng)一平臺能有效解決該問題,數(shù)據(jù)庫方如能提供后臺也能取得同樣效果。有些后臺甚至還能管理數(shù)據(jù)庫資源,在提供查詢以日、月、年為單位的使用數(shù)據(jù)的同時,還能明確統(tǒng)計出資源存儲量、更新量等。
以上僅為技術(shù)展望,各數(shù)據(jù)庫方的技術(shù)手段能不能夠支持、愿不愿意開放后臺,都需要雙方協(xié)商與規(guī)劃。
數(shù)字資源驗收正處于各項維度落實難、數(shù)據(jù)統(tǒng)計難、版權(quán)有風(fēng)險的困境中。筆者基于此提出明確驗收標(biāo)準(zhǔn)表述、細(xì)化統(tǒng)計計量指標(biāo)、統(tǒng)一平臺與后臺的技術(shù)展望。商用數(shù)據(jù)庫驗收問題的解決有賴于館方與數(shù)據(jù)庫方的長期磋商、通力協(xié)作。除此之外,也應(yīng)當(dāng)吸收、聽取讀者對數(shù)字資源的評價反饋。來自讀者的意見,更能體現(xiàn)公共圖書館采購商用數(shù)據(jù)庫的初衷。