陳 越,都平平,江艷霞
COUNTER(Counting Online Usage of NeTworked Electronic Resources)意為聯(lián)網(wǎng)電子資源在線使用情況統(tǒng)計。COUNTER Online Metrics是由圖書館、出版商和數(shù)據(jù)庫商組成的非盈利標準化組織,負責通過成員間協(xié)作制定并維護COUNTER 實施規(guī)范[1]。這一規(guī)范可幫助出版商和數(shù)據(jù)庫商向圖書館提供一致、可靠和可比較的使用數(shù)據(jù)[2]。2012 年4 月發(fā)布的COUNTER 實施規(guī)范第 4 版(以下簡稱“R4 版規(guī)范”)是目前廣泛使用的版本。近年來隨著線電子資源類型的擴展及資源發(fā)現(xiàn)與訪問技術的變化,R4版規(guī)范在實踐中逐漸凸顯出一些問題,主要包括:
(1)使用報告數(shù)量持續(xù)增長加重了報告提供方和圖書館的統(tǒng)計負擔。為盡可能覆蓋各類資源使用統(tǒng)計,報告數(shù)量從規(guī)范制定之初的7個增加至R4版的27個[3]。一些過于關注特定需求的單一用途報告如移動版報告很少被使用,在增加統(tǒng)計工作量的同時并未發(fā)揮相應的作用[4]。
(2)因數(shù)據(jù)存在差異,部分以不同格式提供的報告無法直接比較[4]。比如R4版規(guī)范期刊報告1,表格報告中將PDF 和HTML 每月訪問量合并計數(shù)[5],而XML報告則按月對兩者分別統(tǒng)計[6]。
(3)部分定義模糊,理解和遵守容易產(chǎn)生分歧。比如對電子書“節(jié)段”的定義,不同資源提供商的解釋和應用存在差別,對比他們提供的電子書借閱報告BR1(整本)、BR2(節(jié)段)數(shù)據(jù)可能引發(fā)困惑[7]。此外,答疑材料、幫助手冊和實施文檔的分散編寫過程以及對規(guī)范及支持材料的不同理解,也導致不同報告提供者的具體實踐存在一定差異[4]。由COUNTER Online Metrics 發(fā)起的調查顯示,在下一代規(guī)范中澄清現(xiàn)有規(guī)范中的歧義是用戶最關心的問題之一[8]。
基于廣泛調研與多方協(xié)作,2017 年7 月COUNTER Online Metrics發(fā)布了下一代COUNTER 實施規(guī)范(即R5 版規(guī)范,以下簡稱“新規(guī)范”)。本文解讀新規(guī)范的主要變化,并結合新規(guī)范的特性,討論其創(chuàng)新應用場景,以期為電子資源管理及相關研究開發(fā)提供參考。
面對復雜多變的信息資源環(huán)境與用戶需求,新規(guī)范不是對R4版規(guī)范的簡單修改或擴充,而是在規(guī)范體系結構、用戶使用報告、數(shù)據(jù)供給與操作模式、實施與維護等方面進行徹底重構。這些改變使新規(guī)范簡單、靈活、一致、可持續(xù),從而具備更廣闊的應用空間。
新規(guī)范通過增加關鍵章節(jié)、取消重復或無意義的內(nèi)容、重組相關主題等修訂措施,優(yōu)化規(guī)范結構,提高規(guī)范的可讀性,更便于各方理解實施,詳見表1至表3。
表1 新規(guī)范增加章節(jié)
表2 新規(guī)范取消章節(jié)
表3 新規(guī)范重組章節(jié)
為解決R4版規(guī)范使用報告過多、部分報告利用率低下的問題,新規(guī)范重新設計了使用報告模型,擴充了使用報告要素,包括:(1)引入主報告(Master Report)及視圖(View)概念,重新劃分報告體系;(2)新增報告屬性,用于統(tǒng)計更詳細的用戶行為信息。
1.2.1 主報告及視圖
主報告是內(nèi)容提供商在電子資源主機上采集使用數(shù)據(jù)后形成的基礎數(shù)據(jù)表。新規(guī)范將電子資源主機分為電子期刊、電子書、全文集成數(shù)據(jù)庫等11種主機類型(Host Type),不同類型主機采集的資源使用行為數(shù)據(jù)有所差異,據(jù)此生成對應的主報告。根據(jù)提供主報告的主機類型,可將主報告分為平臺(Platform)、數(shù)據(jù)庫(Database)、題名(Title)、條目(Item)等四種。主機類型與所提供的主報告之間的關系如圖1所示。
圖1 主報告與主機類型
平臺主報告匯總特定內(nèi)容提供商的資源訪問數(shù)據(jù),所有電子資源主機均應設法收集相關數(shù)據(jù)并生成平臺主報告。題名、數(shù)據(jù)庫及條目主報告則由不同類型的主機生成。題名主報告統(tǒng)計用戶訪問電子書、電子期刊等資源主機的行為信息。數(shù)據(jù)庫主報告統(tǒng)計用戶訪問摘要索引、文獻集成等數(shù)據(jù)庫主機的細節(jié)信息。條目在新規(guī)范中被定義為與資源內(nèi)容有關的數(shù)據(jù)收集術語,可以是全文、全文摘要、HTML頁面、補充數(shù)據(jù)集或非文本資源(圖片、視頻、音頻等)[11]。機構知識庫、多媒體資源主機收集并統(tǒng)計用戶針對上述資源的訪問信息,形成條目主報告。不同主報告面向的主機范圍亦有交叉,某些類型的主機(如文獻全文集成主機)需要同時提供平臺主報告、題名主報告和數(shù)據(jù)庫主報告。
新規(guī)范引入了關系數(shù)據(jù)庫領域的視圖概念,根據(jù)數(shù)據(jù)類型(Data Type)、獲取類型(Access Type)等條件對主報告數(shù)據(jù)表進行過濾,生成視圖并作為使用報告提供給圖書館。新規(guī)范預置了12 個標準視圖,其與主報告的關系如圖2所示。
新規(guī)范在引入主數(shù)據(jù)/視圖模型的同時,同步建立了新規(guī)范視圖與R4 版規(guī)范使用報告之間的映射機制,從而保持了統(tǒng)計工作的延續(xù)性,詳見圖3。
圖2 從主報告生成預置標準視圖
圖3 新舊規(guī)范中報告的轉換與取舍
R4 版規(guī)范中符合通用需求的報告在新規(guī)范中以標準視圖形式提供,如平臺使用量報告PR1、期刊使用量報告JR1,在新規(guī)范中轉換為標準視圖PR_P1、TR_J1。R4 版規(guī)范中為滿足特定需求而定義的各類報告在新規(guī)范中采用自定義視圖形式提供,包括:(1)在不同層次對同一行為進行的統(tǒng)計,如按平臺歸類的R4版被拒電子書訪問量報告BR4;(2)對不同類型資源同一操作行為的統(tǒng)計,如R4版期刊/電子書章節(jié)全文借閱量報告TR1;(3)針對特定資源屬性的統(tǒng)計,如R4版金色開放獲取期刊全文使用量報告JR1 GOA。
新規(guī)范取消了因不符合技術發(fā)展或實踐需要而較少使用的報告。例如,按月份和書名匯總顯示用戶常規(guī)/聯(lián)邦/自動檢索次數(shù)的報告BR5,初衷是比較用戶在出版商平臺訪問電子書時所采用的各種檢索方式[7],但由于大多數(shù)平臺上的書名往往被包含在各類檢索中,不同檢索形式的區(qū)分度并不明顯[12]。此外,即使平臺在標題級別記錄搜索和會話,由于用戶通常很少執(zhí)行此類搜索,導致這些報告中經(jīng)常有零條目出現(xiàn)[13],因此新規(guī)范取消該報告。
1.2.2 新增報告屬性
配合“主報告-視圖”結構,新規(guī)范在使用報告中增加屬性(Attributes)要素,對數(shù)據(jù)格式、訪問行為等進行分類定義。屬性可分為普通屬性和特殊屬性(即指標類型)。普通屬性作為過濾條件,供用戶從主報告中自行提取所需數(shù)據(jù)創(chuàng)建自定義視圖;指標類型(Metric Type)則與統(tǒng)計值對應,用以標明統(tǒng)計量的含義。
(1)普通屬性。普通屬性定義了不同數(shù)據(jù)、不同格式、不同獲取方式等資源獨有特性的取值空間。圖書館可以據(jù)此對主報告數(shù)據(jù)進行過濾,以形成標準或自定義視圖,新規(guī)范中普通屬性見表4。
表4 新規(guī)范普通屬性及取值空間
(2)指標類型。在R4版規(guī)范中,沒有“指標類型”概念,只能通過不同報告展現(xiàn)不同資源的使用行為數(shù)據(jù)[7]。新規(guī)范引入指標類型這一特殊屬性,以區(qū)分用戶在線資源利用活動的總體性質,并將規(guī)范涉及的指標納入不同指標類型,在一份報告中提供不同活動行為的統(tǒng)計數(shù)據(jù)。指標類型分為檢索(Searches)、查看與借閱(Investigations and Requests)及被拒絕訪問(Access Denied)等三組[15],見表5。
表5 新規(guī)范指標分類及說明
檢索類指標和被拒絕訪問類指標繼承了R4版規(guī)范使用報告中的定義,其作用基本沒發(fā)生變化。查看與借閱類指標則為規(guī)范新增指標,用于計量用戶對單個題名和條目的訪問活動,包含查看與借閱兩種行為類型。用戶圍繞條目內(nèi)容的所有活動(包括閱讀和獲取全文)都被當作查看,但借閱僅包括閱讀或獲取全文。圖4解釋了兩種行為的聯(lián)系與差異。
圖4 查看和借閱的關系[15]
在區(qū)分查看與借閱兩種用戶活動的基礎上,新規(guī)范進一步細化活動度量的統(tǒng)計粒度,將計量方式(單一/合計)、訪問對象(題名/條目)與訪問行為(查看/借閱)加以組合,形成了具體的查看與借閱活動度量指標,見圖5。
圖5 查看與借閱活動指標組合方式
單一題名前綴條件可以用于期刊和電子書。通過使用單一題名進行用量統(tǒng)計,在一個會話中,同一期刊/電子書無論是整體下載還是分節(jié)段下載,都只記為1次借閱,以此解決不同平臺的用量比較問題。
單一條目前綴條件解決了用戶接口效應帶來的統(tǒng)計誤差[16]。對同一篇文獻,在同一個會話中,無論以HTML 方式查看全文還是通過下載PDF查看全文,只記為1次借閱。
合計前綴條件提供過濾重復點擊后的累計查看統(tǒng)計。對同一用戶會話,計量每一次對條目的查看與借閱,最后提供累計值。這里的條目包括文章、電子書節(jié)段、多媒體文件等。
新規(guī)范在數(shù)據(jù)與操作兩個方面強化了一致性。在數(shù)據(jù)方面,引入輕量級SUSHI協(xié)議作為傳輸模式,以SUSHI-Lite 中的JSON(JavaScript Object Notation)格式取代XML作為收割數(shù)據(jù)結構。同時提供RESTful風格的API接口[17],允許客戶端在調用接口時附加過濾器與屬性參數(shù),獲得與表格形式報告相同的數(shù)據(jù),保證不同格式報告的數(shù)據(jù)一致性。在操作方面,新規(guī)范完整實現(xiàn)了R4版規(guī)范的關鍵功能,同時簡化了圖書館員的日常操作。有研究者對比了典型用戶使用場景及在兩種規(guī)范下的不同操作(見表6),發(fā)現(xiàn)相對于舊版規(guī)范,新規(guī)范在不同場景下提供了基本一致的操作模式,更便于圖書館理解與實施。
表6 新舊規(guī)范下典型用戶使用場景的操作對比[16]
新規(guī)范在擴展與維護機制方面進行了創(chuàng)新。通過建立類似數(shù)字對象標識符(DOI)的命名空間機制,利用命名空間標識與報告名稱、元素名稱、度量類型名稱以及枚舉值的組合,支持參與各方對使用報告進行擴展,見表7。借鑒并導入SUSHI 標準中的持續(xù)維護過程(Continuous Maintenance Procedures)概念[18],明確關鍵環(huán)節(jié)的處理時限以及批準修訂所需的程序要求,解決了規(guī)范修訂間隔過長難以跟隨用戶需求變化[4]。改進后的規(guī)范修訂流程見圖6。
表7 報告擴展方式及示例
圖6 規(guī)范修訂流程時序圖
圖書館對電子資源利用評估的要求日趨多樣,一些研究者不滿足于現(xiàn)有報告提供的固定指標,自行設計并研發(fā)出相關指標框架體系[19-20]。由于這些體系的研究性質,難以要求資源提供商將其納入統(tǒng)計報告,從而限制了指標體系的落地與推廣應用。新規(guī)范通過提供視圖、元素、屬性等自定義機制,可支撐研究者利用資源提供商平臺開展研究性數(shù)據(jù)采集,以驗證和完善個性化指標體系,也可加強圖書館與資源提供商在資源利用評估領域的互動,推動指標體系研究成果向實際應用轉化。
為加強資源管理、優(yōu)化用戶體驗,需要對用戶資源訪問行為的特征、動機及模式進行考察與分析[21-23],嘗試挖掘用戶行為與資源易用性、服務可達性的關系。新規(guī)范將用戶資源訪問行為界定為“查看”與“借閱”,并結合資源對象類型、計量方式給出清晰的數(shù)字化指標體系,使資源提供商據(jù)此提供一致且詳盡的用戶訪問行為數(shù)據(jù)。對細粒度行為數(shù)據(jù)的觀察,可為圖書館提供問卷調查以外的研究途徑;不同資源平臺提供的標準一致數(shù)據(jù),能夠幫助研究者進行資源平臺之間的比較分析。未來可結合用戶資源訪問的情境數(shù)據(jù)(如學科背景、學術身份、研究方向等)加以深入發(fā)掘,進一步多角度深化用戶行為研究,推動圖書館持續(xù)優(yōu)化和提升電子資源服務體驗。
研究數(shù)據(jù)已逐漸被認定為學術活動的重要產(chǎn)出。在基于出版物引用的評估機制之外,數(shù)據(jù)的使用(查看、下載等)計量也逐漸成為僅次于引用計量的數(shù)據(jù)影響力衡量方法[24-25],以推動研究數(shù)據(jù)的開放與重用。COUNTER 5已經(jīng)提供了針對補充數(shù)據(jù)集、非文本資源的使用計量方法,并允許機構知識庫主機、多媒體主機收集并提供對應數(shù)據(jù)。以此為基礎,COUNTER Online Metrics 與由 NSF 資助的 Make Data Count 項目[26]團隊合作,起草并發(fā)布了COUNTER Code of Practice for Research Data 規(guī)范第 1 版(以下簡稱COUNTER RD1)[27],為研究數(shù)據(jù)使用計量提供了可操作的標準。COUNTER RD1在使用報告、指標體系及操作方面與COUNTER 5保持一致,僅在必要之處根據(jù)研究數(shù)據(jù)的特性給出單獨規(guī)定,如根據(jù)數(shù)據(jù)集版本對研究數(shù)據(jù)利用量進行聚合用量統(tǒng)計。COUNTER RD1的發(fā)布,意味著COUNTER框架有較好的包容能力,能夠平衡通用功能與專有需求,具備推動其他領域資源利用統(tǒng)計標準化的潛力。
在電子資源使用計量領域,我國也制定了相關標準,包括2007年教育部高等學校圖書情報工作指導委員會修訂的《高等學校圖書館數(shù)字資源計量指南》和2012年文化部發(fā)布的《圖書館數(shù)字資源統(tǒng)計規(guī)范》。在實踐中,上述標準不同程度地顯現(xiàn)了一些問題,主要有:(1)起草成員單位主要為行業(yè)主管機構及部分圖書館,缺少出版商、數(shù)據(jù)庫商、一線圖書館員參與,由于資源類型繁雜,各方需求存在差異,解讀與執(zhí)行存在一定困難[28]。(2)“指南”及“規(guī)范”面向的對象僅為圖書館,并未明確約束數(shù)據(jù)庫商執(zhí)行,遵循我國標準的數(shù)據(jù)庫商較少[29]。(3)沒有明確規(guī)定修訂過程,在實踐中出現(xiàn)的新統(tǒng)計需求無法通過修訂納入標準。
COUNTER 5的發(fā)展與維護機制為我國電子資源利用統(tǒng)計標準的制定與維護提供了參照。一方面,標準的起草組織應包括產(chǎn)業(yè)鏈各方,除主管部門與行業(yè)協(xié)會外,還應充分涵蓋公共、專業(yè)、高校等各類圖書館,以及主要出版商、資源提供商等利益相關機構,使標準的發(fā)展充分響應各方訴求,統(tǒng)籌參與各方權益。另一方面,應建立明確、公開、可持續(xù)的標準維護路徑,給出參與各方乃至普通館員提交標準修訂建議的具體措施,如建立在線社群討論落地與修訂問題,及時公開修訂建議的處理過程等。通過定期修訂和更新標準,不斷提高在實踐應用中的影響力。
COUNTER 5在報告模型、指標體系等方面的變革,體現(xiàn)出數(shù)據(jù)時代對圖書館資源提供與信息服務的全新要求。對資源與讀者互動關系的觀察與重估,將引導圖書館以更科學、有效的方法向讀者提供預測、咨詢、資源推薦等個性化服務。更重要的是,新規(guī)范所體現(xiàn)出的包容性及自我迭代更新能力,也為圖書館應對數(shù)據(jù)時代的挑戰(zhàn)提供了啟示和借鑒。