□黎邦群
書目數(shù)據(jù)是圖書館自動化建設的核心。其質(zhì)量的優(yōu)劣直接影響著信息資源的交流與共享,影響圖書館業(yè)務工作的開展,以及讀者對具體文獻的識別與利用[1]。因此,隨著圖書館書目數(shù)據(jù)庫信息容量的日益龐大,書目數(shù)據(jù)的質(zhì)量問題凸顯出來,相關領域不斷涌現(xiàn)出大量針對書目數(shù)據(jù)質(zhì)量的研究和實踐,主要包括冗余數(shù)據(jù)的影響及解決方案[2]、清理與合并[3]、管理與后續(xù)維護等[4]。它們或分析了某一領域或類型如聯(lián)合編目、期刊或某一館的書目數(shù)據(jù)質(zhì)量現(xiàn)狀,或研究了書目質(zhì)量問題出現(xiàn)的歷史和現(xiàn)實原因,并從制度管理、提高編目人員素質(zhì)等方面提出了相應的改進策略。另有研究者采用Visual Fox-Pro6.0設計書目數(shù)據(jù)自動檢錯糾錯系統(tǒng)[5]。這些研究與實踐,有利于書目數(shù)據(jù)的維護工作,對本文的寫作具有一定的參考價值,但均沒有提出利用OPAC與用戶的互動來進行書目糾錯這一觀點。
有關文獻于2010年針對我國重點大學排名前30強圖書館OPAC系統(tǒng)功能進行的調(diào)查中,并沒有設置“書目糾錯”這個重要的互動功能作為調(diào)查選項[6]。為了認清OPAC書目糾錯功能的應用現(xiàn)狀,筆者于2011年7月18日逐一打開這30所高校圖書館的OPAC,也沒有發(fā)現(xiàn)任何一家OPAC設置這個功能。調(diào)查結果表明,OPAC書目糾錯功能至今尚未引起部分高校圖書館的足夠重視,相關觀念亟需改進。筆者又以“OPAC書目糾錯”、“OPAC書目挑錯”或“OPAC書目檢錯”等關鍵詞,對中國知網(wǎng)、萬方數(shù)據(jù)、維普期刊等網(wǎng)絡數(shù)據(jù)庫1979年到2011年間的文獻進行模糊檢索,查詢結果為“0”,很難找到深入研究該功能的相關文獻資料。
書目數(shù)據(jù)的管理是圖書館數(shù)據(jù)庫管理中最重要的一個方面,也是圖書館提高管理水平與服務質(zhì)量的重要保障[2]。書目數(shù)據(jù)是構建圖書館資源體系的基礎。書目數(shù)據(jù)質(zhì)量的提高,是開展各項業(yè)務工作的基礎,是實現(xiàn)快速檢索,提高檢全、檢準率的需要,是實現(xiàn)文獻資源共享的有力支撐[7]。由于各種歷史和現(xiàn)實原因,如突擊回溯建庫、外部數(shù)據(jù)源的質(zhì)量問題、圖書出版、高校圖書館合并、突擊采購編目、計算機設備落后、軟件系統(tǒng)有待更新等,書目數(shù)據(jù)存在著著錄簡單化、著錄方式不一致、著錄不規(guī)范、重復著錄等質(zhì)量問題[1],這些書目的質(zhì)量問題,并不能完全依賴計算機自動化軟件批處理完成。伴隨著書目數(shù)據(jù)庫的日益龐大,其數(shù)據(jù)維護與日常管理的任務亦越來越繁重,僅憑編目部門的有限力量進行逐一人工校對已很難完成。OPAC系統(tǒng)是圖書館自動化建設中最先引進的自動化系統(tǒng),通過多年的使用、宣傳,已成為讀者最熟悉、最常用的圖書館館藏資源檢索工具[8]。書目數(shù)據(jù)的質(zhì)量問題無疑會引起OPAC用戶的困惑,并由此產(chǎn)生各種書目信息查詢和檢索的質(zhì)量問題。與用戶互動,讓用戶參與書目數(shù)據(jù)的糾錯工作,充分發(fā)揮用戶的積極性與主動性,將有利于提高書目數(shù)據(jù)的質(zhì)量。增強交互性,提升使用體驗,也是未來OPAC升級改造的方向之一。
書目糾錯有2種設計方案。方案1:設計獨立的網(wǎng)頁,內(nèi)含疑問書目數(shù)據(jù)、所在網(wǎng)頁標題及網(wǎng)址、修改意見等多個文本輸入框。用戶逐一輸入各項內(nèi)容,填寫相應信息并提交。方案2:在現(xiàn)有的OPAC頁面設計“劃詞糾錯”功能:即用戶在瀏覽OPAC頁面時,鼠標拖選疑問書目信息區(qū)域,觸發(fā)相關事件跳出糾錯彈窗,填寫修改意見并提交。兩者比較,前者設計簡單,但用戶體驗差,且易出錯。后者實現(xiàn)復雜,但所見所得的互動方式,更易于為用戶所接受。筆者決定采用方案2,利用差錯控制的反饋糾錯方式進行設計。
方案2的設計技術思路如下:已登錄用戶瀏覽OPAC網(wǎng)頁,發(fā)現(xiàn)并鼠標拖選疑問書目文字段落,觸發(fā)提示“我來挑錯”的圖片鏈接和取消操作按鈕,單擊鏈接,則跳出使用CSS(Cascading Style Sheet,層疊樣式表)設計的糾錯彈窗,并利用JavaScript腳本獲取疑問書目文字、所在網(wǎng)頁標題及網(wǎng)址等參數(shù),提交后通過ASP(Active Server Pages,動態(tài)服務器頁面)技術與SQL(Structured Query Language,結構化查詢語言)語句將這些參數(shù)和在彈窗文本輸入框填寫的修改意見存儲到服務器,編目人員在審核后將處理意見反饋給用戶,最終實現(xiàn)書目糾錯功能。整個流程大致分為5部分,如圖1所示:
圖1 OPAC書目糾錯技術思路圖
技術難點在于疑問書目數(shù)據(jù)的獲取,即客戶端的Javascript程序。該程序可對觸發(fā)用戶的鼠標拖選事件,打開糾錯鏈接與糾錯提示框,并將相關參數(shù)傳遞給服務器端的ASP程序。
(1)設計書目糾錯數(shù)據(jù)的存儲表
為了存儲書目糾錯數(shù)據(jù),需要在服務器端Sybase數(shù)據(jù)庫中設計表z_jiucuo。該表可創(chuàng)建在圖書館業(yè)務系統(tǒng)底層數(shù)據(jù)庫中,避免二次連接,提高數(shù)據(jù)庫的連接效率。其結構見表1:
表1 書目糾錯數(shù)據(jù)庫表z_jiucuo結構
此表相關字段僅存儲“1≤字符長度≤255”的糾錯信息,字段id存儲OPAC讀者服務帳戶信息,便于用戶跟蹤處理進度及查看處理結果。字段errorurl可依實際來確定其最小的數(shù)據(jù)長度??茖W的數(shù)據(jù)結構設計可以顯著提升程序執(zhí)行的性能。
(2)獲取客戶端傳遞的書目糾錯數(shù)據(jù)
JavaScript是一種基于對象和事件驅(qū)動并具有相對安全性的客戶端腳本語言,同時也是一種廣泛用于客戶端Web開發(fā)的腳本語言,常用來給Html網(wǎng)頁添加動態(tài)功能,比如響應用戶的各種操作。CSS是一組格式設置規(guī)則,用于控制Web頁面的外觀,通過使用CSS樣式設置頁面的格式,可以將頁面的內(nèi)容與表現(xiàn)形式相分離。JavaScript技術和CSS的結合使用,可給網(wǎng)站的各種功能設計與開發(fā)帶來活力和發(fā)展,該方法設計與實現(xiàn)的網(wǎng)頁具有規(guī)范、簡潔、易于維護等特點,被廣泛應用于 Web2.0網(wǎng)頁設計與開發(fā)中[9]。可利用JavaScript腳本相關的方法、事件,對象及其屬性等,獲取網(wǎng)頁客戶端用戶鼠標拖選的疑問書目數(shù)據(jù)段落文字信息、所在網(wǎng)頁的標題、網(wǎng)址等參數(shù)。如使用document.selection.createRange、document.get Element ById等對象及方法可獲取拖選的段落文字,關鍵代碼如下:
腳本不僅可以減小網(wǎng)頁的規(guī)模和提高網(wǎng)頁瀏覽速度,而且憑其在客戶端運行的特性可以降低糾錯功能對服務器的依賴、減輕整個系統(tǒng)的負擔。但利用JavaScript語言進行網(wǎng)頁設計必須充分考慮用戶瀏覽器的兼容性,如判別用戶使用的瀏覽器為IE、FireFox或其他。在獲取相關參數(shù)后,在糾錯彈窗設計系列Html變量,設置其Input屬性為“type=hidden”,并將這些參數(shù)賦值給對應變量。服務器端通過ASP技術的Request()等函數(shù)接受疑問書目、修改意見等網(wǎng)頁客戶端采用Post方式傳遞的這些參數(shù)。除了服務器端的動態(tài)語言程序,網(wǎng)頁客戶端的JavaScript、CSS及Html等代碼是開源的。有興趣可 通 過 訪 問 http://seek.hzu.edu.cn 下 載 獲?。?0],限于篇幅,不再詳敘。
(3)存儲數(shù)據(jù)
程序采用SybaseOLEDBObjects來連接服務器端數(shù)據(jù)庫Sybase12.5。使用該方法連接數(shù)據(jù)庫,需要在服務器端預裝Sybase驅(qū)動程序,并通過Configuration Manager等工具來完成Data Sources連接設置,再使用連接字符串連接數(shù)據(jù)庫,利用ASP技術創(chuàng)建Recordset對象,并經(jīng)查重后再使用“Insert Into”等SQL語句將相關的糾錯數(shù)據(jù)插入表z_jiucuo。
書目數(shù)據(jù)一旦生產(chǎn)出來,便會隨著整個數(shù)據(jù)庫的運行而被長期使用,其使用年限是無法預計的,因此書目數(shù)據(jù)庫的維護工作必定會伴隨其整個使用過程[11]。書目數(shù)據(jù)的完善程度及其質(zhì)量都直接影響著圖書館信息資源的交流與共享。書目糾錯功能的具體實現(xiàn),可依次分為以下6個步驟:
(1)用戶登錄
即權限驗證。利用OPAC讀者服務系統(tǒng)驗證用戶登錄狀態(tài),以此判斷用戶是否擁有糾錯權限。即通過Session定義一個全局變量,實現(xiàn)用戶在整個OPAC系統(tǒng)中的會話。用戶登錄OPAC讀者服務,即可進行書目糾錯相關操作,否則將進行登錄提示,提醒用戶先登錄再操作,登錄后用戶訪問頁面將被重定向到之前的糾錯操作窗口。
(2)開始糾錯
即數(shù)據(jù)選擇。當且僅當用戶在OPAC網(wǎng)頁中用鼠標高亮拖選疑問書目信息時,松開鼠標,選中區(qū)域旁即出現(xiàn)“我來挑錯”及“X”按鈕,如圖2所示:
圖2 OPAC書目糾錯提示圖
圖3 OPAC書目糾錯操作提示圖
單擊“我來挑錯”,即開始糾錯操作,并跳出糾錯彈窗,如圖4所示。單擊“X”,將取消本次操作,并在cookie生存周期內(nèi)不再執(zhí)行該功能。這樣可給用戶一個選擇的權利,避免對部分不希望使用該功能的用戶造成干擾。
(3)填寫意見
即數(shù)據(jù)編輯。這是用戶操作最關鍵的步驟。糾錯窗口包括了窗口標題、取消操作及提交按鈕、用戶帳戶鏈接及疑問書目數(shù)據(jù)等信息。用戶對照糾錯窗口上部的疑問書目信息,即可在下部的文本輸入框填寫對應的修改意見,如圖4所示:
圖4 OPAC書目糾錯填寫意見圖
假如疑問書目數(shù)據(jù)缺少某部分信息,如摘要、主題詞或標準書號等,可直接拖選題名等區(qū)域,再在修改意見里進行說明,并補充完整的信息即可。常見的疑問書目數(shù)據(jù)一般包括數(shù)據(jù)描述及格式錯誤等方面,具體見表2:
表2 常見疑問書目數(shù)據(jù)類別及處理策略
另有大量其他未知的疑問書目數(shù)據(jù)類別,如200字段(附注)、330字段(摘要)、600字段(個人名稱主題)等。這些問題僅靠計算機自動化軟件無法批量處理,單憑編目部門進行人工的全庫掃描逐條審核修改也是費時耗力,工作量巨大。利用書目糾錯功能,用戶申請,編目人員審核修改,兩者協(xié)同,可有效降低編目人員工作強度,提高書目質(zhì)量控制的效率。
(4)確認保存
即數(shù)據(jù)存儲。填寫修改意見后,單擊“提交”按鈕,可將客戶端保存的相關參數(shù)上傳到服務器,以便編目人員審核修改,以及用戶查看處理進度。提交后,服務器端的ASP程序?qū)⑹褂谩癝elect”等SQL語句查詢表z_jiucuo。如存在重復記錄,則將字段fre值累加1后使用“Update”等SQL語句更新,查重的目的是為了避免用戶刷新或重復提交相同記錄。否則使用“Insert into”等SQL語句進行表記錄的新增。服務器端完成相關計算后,返回“操作成功”的窗口及相關提示信息。點擊“關閉”按鈕,可返回OPAC網(wǎng)頁。同時還給出了查看處理情況和其他人報告的錯誤等鏈接,如圖3所示。
(5)人工審核
即數(shù)據(jù)審核。圖書館應配備專門人員對這些問題和意見進行處理和答復,使之成為一個良性循環(huán)體系。其重要功能之一就是對收集到的讀者意見進行篩選和分析,發(fā)現(xiàn)有問題的書目數(shù)據(jù),進行修改或處理[12]。具體工作包括對疑問書目數(shù)據(jù)進行修改、替換、更新、合并、刪除整理等,使其不斷擴充和完善,保證數(shù)據(jù)的完整性和準確性。如已在編目系統(tǒng)中更新該書目的數(shù)據(jù)庫記錄,OPAC相關頁面將同步顯示其更改效果。用戶的修改意見無論被采納與否,工作人員均應認真填寫反饋意見并進行答復。書目糾錯功能的后臺管理系統(tǒng)依據(jù)字段fre值的大小等參數(shù),對未處理的結果集排序。這將有利于優(yōu)先處理被用戶質(zhì)疑次數(shù)最多的書目數(shù)據(jù)。相關統(tǒng)計表明,書目庫中存在部分借閱率為0的圖書[11],OPAC中也存在不少從未被訪問過的書目數(shù)據(jù)。因此優(yōu)先處理關注度高的書目數(shù)據(jù),比較科學合理。
(6)完成糾錯
即功能實現(xiàn)。如編目人員作出最終的審核與處理結果,書目糾錯功能將主動發(fā)送處理結果通知到用戶登記的信箱中。用戶也可訪問OPAC讀者服務個人帳戶頁面,查看自己的每條疑問書目修改意見、對應的處理結果及反饋意見,實時跟蹤處理過程,并可瀏覽對應的書目信息頁面以核實其處理效果,如圖5所示:
圖5 OPAC書目糾錯效處理情況圖
另可根據(jù)實際需求設計尚未處理記錄的估計完成時間等信息,進一步提高處理過程的公開性與透明度。至此最終完成所有書目數(shù)據(jù)糾錯步驟,實現(xiàn)了OPAC書目糾錯功能。
新一代OPAC的出發(fā)點與目標都是一切以用戶為中心的互動模式,為用戶提供更方便快捷和全面的服務[13]。OPAC書目糾錯功能的實現(xiàn),將進一步增強其互動性。經(jīng)過一段時間的宣傳和實踐積累,其功能及操作方法逐漸為用戶所熟悉,隨著書目質(zhì)量的提高,用戶參與的興趣愈大。從筆者設計的惠州學院圖書館OPAC書目糾錯功能試用情況來看,運行良好,反映不錯。在試用的單位時間內(nèi)取得了較好的實現(xiàn)效果,見表3:
表3 2011年6月OPAC書目糾錯功能效果統(tǒng)計
分析表3得知,OPAC用戶存在互動的需求,且擁有較高的素質(zhì),具有提高書目質(zhì)量的興趣。用戶參與意愿的進一步提升,有賴于廣泛宣傳和核心用戶群的培養(yǎng)。結合采用其他的書目質(zhì)量控制策略,如設立嚴格的審查小組、制定統(tǒng)一的書目著錄細則及提高編目人員的素質(zhì)和工作質(zhì)量等,可有效地提高書目數(shù)據(jù)的質(zhì)量。
筆者設計的OPAC書目糾錯功能,與已有的其他書目數(shù)據(jù)批處理自動糾錯系統(tǒng)比較,兩者均對疑問書目數(shù)據(jù)進行了處理,均可提高書目數(shù)據(jù)的質(zhì)量。其差異主要體現(xiàn)在前者無論是檢錯還是修改,均使用人工干預,且充分利用了OPAC平臺;而后者依據(jù)設定的規(guī)則自動判別檢錯,并批處理疑問書目數(shù)據(jù),如能判別出重復記錄并對重復記錄進行合并[5],能處理有一定規(guī)律的字符及代碼錯誤。兩者的實現(xiàn)效果比較,無疑前者具有高質(zhì)量;后者具有高效率,但存在僅能處理部分問題數(shù)據(jù)的局限性,最終還是避免不了人工干預。較好的方案是同時采用這2種方法,盡量既好又快地提高書目數(shù)據(jù)的質(zhì)量。
本文就OPAC書目糾錯功能的相關研究、需求、原理、設計思路及其實現(xiàn)方法進行了詳盡的研究。作為OPAC的一項附加功能,它可以方便用戶對疑問書目數(shù)據(jù)提出自己的修改意見,從而達到維護書目數(shù)據(jù)庫,提高書目數(shù)據(jù)質(zhì)量的目的。用戶參與增強了OPAC的交互性,提升了其使用體驗。用戶的書目糾錯行為提高了書目數(shù)據(jù)的質(zhì)量,同時也將在一定程度上影響OPAC的檢索結果。其實現(xiàn)無需破壞原有OPAC的設計,可以作為一個附加的獨立模塊進行添加。但顯然目前它并不能完全替代書目數(shù)據(jù)維護工作,還需要圖書館相關部門的密切配合,并輔之以其他科學的管理策略與方案,才能更好地完成書目數(shù)據(jù)的維護工作。OPAC書目糾錯功能的設計與實現(xiàn),只是筆者在以用戶為中心服務思想指導下,改進OPAC、增強其功能和提升用戶體驗、提高書目數(shù)據(jù)質(zhì)量的一次嘗試,需要不斷完善和豐富。
參考資料
1 萬麗蓉.論書目數(shù)據(jù)的質(zhì)量控制.圖書館工作與研究,2007(05):34-35
2 謝東.書目數(shù)據(jù)庫中冗余數(shù)據(jù)的影響及解決方案.情報資料工作,2004(3):45-47
3 周明華.書目數(shù)據(jù)清理與合并.大學圖書館學報,2005(6):51-55
4 甄偉.書目數(shù)據(jù)質(zhì)量管理與后續(xù)維護.圖書情報工作,2004(8):65-67
5 胡谷雨.通用型書目數(shù)據(jù)檢錯糾錯系統(tǒng)的研制.上海大學學報,2001(3):213-217
6 錢文麗.“211工程”高校圖書館OPAC系統(tǒng)比較評價研究.圖書館論壇,2010(2):75-77
7 嚴紅.關于書目數(shù)據(jù)質(zhì)量控制問題的探討.情報雜志,2004(1):120-121
8 金巖,于靜.基于OPAC的資源整合研究.圖書館雜志,2009(2):27-30
9 李沖.基于CSS與JavaScript技術的Tab面板的設計與實現(xiàn).計算機技術與發(fā)展,2011(3):28-30.
10 惠州學院圖書館 OPAC.[2007-04-20].http://seek.hzu.edu.cn
11 鐘文娟.紙本圖書資源建設與利用的優(yōu)化研究——以首都師范大學為例.情報探索,2010(7):65-67
12 張云軍.高校圖書館書目數(shù)據(jù)庫計算機管理方法及效益研究——談運行中的書目數(shù)據(jù)庫維護.河北科技圖苑,2004(6):9-11
13 李榮艷.圖書館2.0時代的OPAC發(fā)展.圖書館論壇,2011(1):85-87