COUNTER 5：關鍵變化及應用展望*

2020-01-09 05:46:48都平平江艷霞

圖書館論壇 2020年1期

陳越，都平平，江艷霞

0 引言

COUNTER(Counting Online Usage of NeTworked Electronic Resources)意為聯(lián)網(wǎng)電子資源在線使用情況統(tǒng)計。COUNTER Online Metrics是由圖書館、出版商和數(shù)據(jù)庫商組成的非盈利標準化組織，負責通過成員間協(xié)作制定并維護COUNTER 實施規(guī)范[1]。這一規(guī)范可幫助出版商和數(shù)據(jù)庫商向圖書館提供一致、可靠和可比較的使用數(shù)據(jù)[2]。2012 年4 月發(fā)布的COUNTER 實施規(guī)范第 4 版(以下簡稱“R4 版規(guī)范”)是目前廣泛使用的版本。近年來隨著線電子資源類型的擴展及資源發(fā)現(xiàn)與訪問技術的變化，R4版規(guī)范在實踐中逐漸凸顯出一些問題，主要包括：

(1)使用報告數(shù)量持續(xù)增長加重了報告提供方和圖書館的統(tǒng)計負擔。為盡可能覆蓋各類資源使用統(tǒng)計，報告數(shù)量從規(guī)范制定之初的7個增加至R4版的27個[3]。一些過于關注特定需求的單一用途報告如移動版報告很少被使用，在增加統(tǒng)計工作量的同時并未發(fā)揮相應的作用[4]。

(2)因數(shù)據(jù)存在差異，部分以不同格式提供的報告無法直接比較[4]。比如R4版規(guī)范期刊報告1，表格報告中將PDF 和HTML 每月訪問量合并計數(shù)[5]，而XML報告則按月對兩者分別統(tǒng)計[6]。

(3)部分定義模糊，理解和遵守容易產(chǎn)生分歧。比如對電子書“節(jié)段”的定義，不同資源提供商的解釋和應用存在差別，對比他們提供的電子書借閱報告BR1(整本)、BR2(節(jié)段)數(shù)據(jù)可能引發(fā)困惑[7]。此外，答疑材料、幫助手冊和實施文檔的分散編寫過程以及對規(guī)范及支持材料的不同理解，也導致不同報告提供者的具體實踐存在一定差異[4]。由COUNTER Online Metrics 發(fā)起的調查顯示，在下一代規(guī)范中澄清現(xiàn)有規(guī)范中的歧義是用戶最關心的問題之一[8]。

基于廣泛調研與多方協(xié)作，2017 年7 月COUNTER Online Metrics發(fā)布了下一代COUNTER 實施規(guī)范(即R5 版規(guī)范，以下簡稱“新規(guī)范”)。本文解讀新規(guī)范的主要變化，并結合新規(guī)范的特性，討論其創(chuàng)新應用場景，以期為電子資源管理及相關研究開發(fā)提供參考。

1 COUNTER 5的關鍵變化

面對復雜多變的信息資源環(huán)境與用戶需求，新規(guī)范不是對R4版規(guī)范的簡單修改或擴充，而是在規(guī)范體系結構、用戶使用報告、數(shù)據(jù)供給與操作模式、實施與維護等方面進行徹底重構。這些改變使新規(guī)范簡單、靈活、一致、可持續(xù)，從而具備更廣闊的應用空間。

1.1 清晰的體系結構

新規(guī)范通過增加關鍵章節(jié)、取消重復或無意義的內(nèi)容、重組相關主題等修訂措施，優(yōu)化規(guī)范結構，提高規(guī)范的可讀性，更便于各方理解實施，詳見表1至表3。

表1 新規(guī)范增加章節(jié)

表2 新規(guī)范取消章節(jié)

表3 新規(guī)范重組章節(jié)

1.2 靈活的使用報告模型

為解決R4版規(guī)范使用報告過多、部分報告利用率低下的問題，新規(guī)范重新設計了使用報告模型，擴充了使用報告要素，包括：(1)引入主報告(Master Report)及視圖(View)概念，重新劃分報告體系；(2)新增報告屬性，用于統(tǒng)計更詳細的用戶行為信息。

1.2.1 主報告及視圖

主報告是內(nèi)容提供商在電子資源主機上采集使用數(shù)據(jù)后形成的基礎數(shù)據(jù)表。新規(guī)范將電子資源主機分為電子期刊、電子書、全文集成數(shù)據(jù)庫等11種主機類型(Host Type)，不同類型主機采集的資源使用行為數(shù)據(jù)有所差異，據(jù)此生成對應的主報告。根據(jù)提供主報告的主機類型，可將主報告分為平臺(Platform)、數(shù)據(jù)庫(Database)、題名(Title)、條目(Item)等四種。主機類型與所提供的主報告之間的關系如圖1所示。

圖1 主報告與主機類型

平臺主報告匯總特定內(nèi)容提供商的資源訪問數(shù)據(jù)，所有電子資源主機均應設法收集相關數(shù)據(jù)并生成平臺主報告。題名、數(shù)據(jù)庫及條目主報告則由不同類型的主機生成。題名主報告統(tǒng)計用戶訪問電子書、電子期刊等資源主機的行為信息。數(shù)據(jù)庫主報告統(tǒng)計用戶訪問摘要索引、文獻集成等數(shù)據(jù)庫主機的細節(jié)信息。條目在新規(guī)范中被定義為與資源內(nèi)容有關的數(shù)據(jù)收集術語，可以是全文、全文摘要、HTML頁面、補充數(shù)據(jù)集或非文本資源(圖片、視頻、音頻等)[11]。機構知識庫、多媒體資源主機收集并統(tǒng)計用戶針對上述資源的訪問信息，形成條目主報告。不同主報告面向的主機范圍亦有交叉，某些類型的主機(如文獻全文集成主機)需要同時提供平臺主報告、題名主報告和數(shù)據(jù)庫主報告。

新規(guī)范引入了關系數(shù)據(jù)庫領域的視圖概念，根據(jù)數(shù)據(jù)類型(Data Type)、獲取類型(Access Type)等條件對主報告數(shù)據(jù)表進行過濾，生成視圖并作為使用報告提供給圖書館。新規(guī)范預置了12 個標準視圖，其與主報告的關系如圖2所示。

新規(guī)范在引入主數(shù)據(jù)/視圖模型的同時，同步建立了新規(guī)范視圖與R4 版規(guī)范使用報告之間的映射機制，從而保持了統(tǒng)計工作的延續(xù)性，詳見圖3。

圖2 從主報告生成預置標準視圖

圖3 新舊規(guī)范中報告的轉換與取舍

R4 版規(guī)范中符合通用需求的報告在新規(guī)范中以標準視圖形式提供，如平臺使用量報告PR1、期刊使用量報告JR1，在新規(guī)范中轉換為標準視圖PR_P1、TR_J1。R4 版規(guī)范中為滿足特定需求而定義的各類報告在新規(guī)范中采用自定義視圖形式提供，包括：(1)在不同層次對同一行為進行的統(tǒng)計，如按平臺歸類的R4版被拒電子書訪問量報告BR4；(2)對不同類型資源同一操作行為的統(tǒng)計，如R4版期刊/電子書章節(jié)全文借閱量報告TR1；(3)針對特定資源屬性的統(tǒng)計，如R4版金色開放獲取期刊全文使用量報告JR1 GOA。

新規(guī)范取消了因不符合技術發(fā)展或實踐需要而較少使用的報告。例如，按月份和書名匯總顯示用戶常規(guī)/聯(lián)邦/自動檢索次數(shù)的報告BR5，初衷是比較用戶在出版商平臺訪問電子書時所采用的各種檢索方式[7]，但由于大多數(shù)平臺上的書名往往被包含在各類檢索中，不同檢索形式的區(qū)分度并不明顯[12]。此外，即使平臺在標題級別記錄搜索和會話，由于用戶通常很少執(zhí)行此類搜索，導致這些報告中經(jīng)常有零條目出現(xiàn)[13]，因此新規(guī)范取消該報告。

1.2.2 新增報告屬性

配合“主報告-視圖”結構，新規(guī)范在使用報告中增加屬性(Attributes)要素，對數(shù)據(jù)格式、訪問行為等進行分類定義。屬性可分為普通屬性和特殊屬性(即指標類型)。普通屬性作為過濾條件，供用戶從主報告中自行提取所需數(shù)據(jù)創(chuàng)建自定義視圖；指標類型(Metric Type)則與統(tǒng)計值對應，用以標明統(tǒng)計量的含義。

(1)普通屬性。普通屬性定義了不同數(shù)據(jù)、不同格式、不同獲取方式等資源獨有特性的取值空間。圖書館可以據(jù)此對主報告數(shù)據(jù)進行過濾，以形成標準或自定義視圖，新規(guī)范中普通屬性見表4。

表4 新規(guī)范普通屬性及取值空間

(2)指標類型。在R4版規(guī)范中，沒有“指標類型”概念，只能通過不同報告展現(xiàn)不同資源的使用行為數(shù)據(jù)[7]。新規(guī)范引入指標類型這一特殊屬性，以區(qū)分用戶在線資源利用活動的總體性質，并將規(guī)范涉及的指標納入不同指標類型，在一份報告中提供不同活動行為的統(tǒng)計數(shù)據(jù)。指標類型分為檢索(Searches)、查看與借閱(Investigations and Requests)及被拒絕訪問(Access Denied)等三組[15]，見表5。

表5 新規(guī)范指標分類及說明

檢索類指標和被拒絕訪問類指標繼承了R4版規(guī)范使用報告中的定義，其作用基本沒發(fā)生變化。查看與借閱類指標則為規(guī)范新增指標，用于計量用戶對單個題名和條目的訪問活動，包含查看與借閱兩種行為類型。用戶圍繞條目內(nèi)容的所有活動(包括閱讀和獲取全文)都被當作查看，但借閱僅包括閱讀或獲取全文。圖4解釋了兩種行為的聯(lián)系與差異。

圖4 查看和借閱的關系[15]

在區(qū)分查看與借閱兩種用戶活動的基礎上，新規(guī)范進一步細化活動度量的統(tǒng)計粒度，將計量方式(單一/合計)、訪問對象(題名/條目)與訪問行為(查看/借閱)加以組合，形成了具體的查看與借閱活動度量指標，見圖5。

圖5 查看與借閱活動指標組合方式

單一題名前綴條件可以用于期刊和電子書。通過使用單一題名進行用量統(tǒng)計，在一個會話中，同一期刊/電子書無論是整體下載還是分節(jié)段下載，都只記為1次借閱，以此解決不同平臺的用量比較問題。

單一條目前綴條件解決了用戶接口效應帶來的統(tǒng)計誤差[16]。對同一篇文獻，在同一個會話中，無論以HTML 方式查看全文還是通過下載PDF查看全文，只記為1次借閱。

合計前綴條件提供過濾重復點擊后的累計查看統(tǒng)計。對同一用戶會話，計量每一次對條目的查看與借閱，最后提供累計值。這里的條目包括文章、電子書節(jié)段、多媒體文件等。

1.3 一致的數(shù)據(jù)供給與操作模式

新規(guī)范在數(shù)據(jù)與操作兩個方面強化了一致性。在數(shù)據(jù)方面，引入輕量級SUSHI協(xié)議作為傳輸模式，以SUSHI-Lite 中的JSON(JavaScript Object Notation)格式取代XML作為收割數(shù)據(jù)結構。同時提供RESTful風格的API接口[17]，允許客戶端在調用接口時附加過濾器與屬性參數(shù)，獲得與表格形式報告相同的數(shù)據(jù)，保證不同格式報告的數(shù)據(jù)一致性。在操作方面，新規(guī)范完整實現(xiàn)了R4版規(guī)范的關鍵功能，同時簡化了圖書館員的日常操作。有研究者對比了典型用戶使用場景及在兩種規(guī)范下的不同操作(見表6)，發(fā)現(xiàn)相對于舊版規(guī)范，新規(guī)范在不同場景下提供了基本一致的操作模式，更便于圖書館理解與實施。

表6 新舊規(guī)范下典型用戶使用場景的操作對比[16]

1.4 可持續(xù)的規(guī)范發(fā)展與維護機制

新規(guī)范在擴展與維護機制方面進行了創(chuàng)新。通過建立類似數(shù)字對象標識符(DOI)的命名空間機制，利用命名空間標識與報告名稱、元素名稱、度量類型名稱以及枚舉值的組合，支持參與各方對使用報告進行擴展，見表7。借鑒并導入SUSHI 標準中的持續(xù)維護過程(Continuous Maintenance Procedures)概念[18]，明確關鍵環(huán)節(jié)的處理時限以及批準修訂所需的程序要求，解決了規(guī)范修訂間隔過長難以跟隨用戶需求變化[4]。改進后的規(guī)范修訂流程見圖6。

表7 報告擴展方式及示例

圖6 規(guī)范修訂流程時序圖

2 COUNTER 5應用展望

2.1 支撐圖書館開展資源評估指標體系驗證

圖書館對電子資源利用評估的要求日趨多樣，一些研究者不滿足于現(xiàn)有報告提供的固定指標，自行設計并研發(fā)出相關指標框架體系[19-20]。由于這些體系的研究性質，難以要求資源提供商將其納入統(tǒng)計報告，從而限制了指標體系的落地與推廣應用。新規(guī)范通過提供視圖、元素、屬性等自定義機制，可支撐研究者利用資源提供商平臺開展研究性數(shù)據(jù)采集，以驗證和完善個性化指標體系，也可加強圖書館與資源提供商在資源利用評估領域的互動，推動指標體系研究成果向實際應用轉化。

2.2 深化用戶電子資源利用行為分析

為加強資源管理、優(yōu)化用戶體驗，需要對用戶資源訪問行為的特征、動機及模式進行考察與分析[21-23]，嘗試挖掘用戶行為與資源易用性、服務可達性的關系。新規(guī)范將用戶資源訪問行為界定為“查看”與“借閱”，并結合資源對象類型、計量方式給出清晰的數(shù)字化指標體系，使資源提供商據(jù)此提供一致且詳盡的用戶訪問行為數(shù)據(jù)。對細粒度行為數(shù)據(jù)的觀察，可為圖書館提供問卷調查以外的研究途徑；不同資源平臺提供的標準一致數(shù)據(jù)，能夠幫助研究者進行資源平臺之間的比較分析。未來可結合用戶資源訪問的情境數(shù)據(jù)(如學科背景、學術身份、研究方向等)加以深入發(fā)掘，進一步多角度深化用戶行為研究，推動圖書館持續(xù)優(yōu)化和提升電子資源服務體驗。

2.3 推動研究數(shù)據(jù)集等資源利用統(tǒng)計的標準化

研究數(shù)據(jù)已逐漸被認定為學術活動的重要產(chǎn)出。在基于出版物引用的評估機制之外，數(shù)據(jù)的使用(查看、下載等)計量也逐漸成為僅次于引用計量的數(shù)據(jù)影響力衡量方法[24-25]，以推動研究數(shù)據(jù)的開放與重用。COUNTER 5已經(jīng)提供了針對補充數(shù)據(jù)集、非文本資源的使用計量方法，并允許機構知識庫主機、多媒體主機收集并提供對應數(shù)據(jù)。以此為基礎，COUNTER Online Metrics 與由 NSF 資助的 Make Data Count 項目[26]團隊合作，起草并發(fā)布了COUNTER Code of Practice for Research Data 規(guī)范第 1 版(以下簡稱COUNTER RD1)[27]，為研究數(shù)據(jù)使用計量提供了可操作的標準。COUNTER RD1在使用報告、指標體系及操作方面與COUNTER 5保持一致，僅在必要之處根據(jù)研究數(shù)據(jù)的特性給出單獨規(guī)定，如根據(jù)數(shù)據(jù)集版本對研究數(shù)據(jù)利用量進行聚合用量統(tǒng)計。COUNTER RD1的發(fā)布，意味著COUNTER框架有較好的包容能力，能夠平衡通用功能與專有需求，具備推動其他領域資源利用統(tǒng)計標準化的潛力。

2.4 為本地化標準的制定與維護提供參照

在電子資源使用計量領域，我國也制定了相關標準，包括2007年教育部高等學校圖書情報工作指導委員會修訂的《高等學校圖書館數(shù)字資源計量指南》和2012年文化部發(fā)布的《圖書館數(shù)字資源統(tǒng)計規(guī)范》。在實踐中，上述標準不同程度地顯現(xiàn)了一些問題，主要有：(1)起草成員單位主要為行業(yè)主管機構及部分圖書館，缺少出版商、數(shù)據(jù)庫商、一線圖書館員參與，由于資源類型繁雜，各方需求存在差異，解讀與執(zhí)行存在一定困難[28]。(2)“指南”及“規(guī)范”面向的對象僅為圖書館，并未明確約束數(shù)據(jù)庫商執(zhí)行，遵循我國標準的數(shù)據(jù)庫商較少[29]。(3)沒有明確規(guī)定修訂過程，在實踐中出現(xiàn)的新統(tǒng)計需求無法通過修訂納入標準。

COUNTER 5的發(fā)展與維護機制為我國電子資源利用統(tǒng)計標準的制定與維護提供了參照。一方面，標準的起草組織應包括產(chǎn)業(yè)鏈各方，除主管部門與行業(yè)協(xié)會外，還應充分涵蓋公共、專業(yè)、高校等各類圖書館，以及主要出版商、資源提供商等利益相關機構，使標準的發(fā)展充分響應各方訴求，統(tǒng)籌參與各方權益。另一方面，應建立明確、公開、可持續(xù)的標準維護路徑，給出參與各方乃至普通館員提交標準修訂建議的具體措施，如建立在線社群討論落地與修訂問題，及時公開修訂建議的處理過程等。通過定期修訂和更新標準，不斷提高在實踐應用中的影響力。

3 結語

COUNTER 5在報告模型、指標體系等方面的變革，體現(xiàn)出數(shù)據(jù)時代對圖書館資源提供與信息服務的全新要求。對資源與讀者互動關系的觀察與重估，將引導圖書館以更科學、有效的方法向讀者提供預測、咨詢、資源推薦等個性化服務。更重要的是，新規(guī)范所體現(xiàn)出的包容性及自我迭代更新能力，也為圖書館應對數(shù)據(jù)時代的挑戰(zhàn)提供了啟示和借鑒。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡