国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

中文Altmetrics數(shù)據(jù)整合分析平臺的建立研究*

2022-08-04 02:44:36陳銘葉繼元
大學圖書館學報 2022年4期
關鍵詞:網(wǎng)絡平臺社交圖書館

陳銘 葉繼元

1 Altmetrics的發(fā)展背景及社交網(wǎng)絡平臺數(shù)據(jù)整合的必要性

1.1 Altmetrics的發(fā)展背景

隨著網(wǎng)絡技術的快速發(fā)展和普及,人類社會的交流方式發(fā)生了巨大變化。特別是大量社交媒體平臺出現(xiàn)后,由于其使用便捷且成本低廉,成為數(shù)以萬計的普通公眾進行信息、思想和知識等交流的主要方式,這其中也包括了科研工作者們對于學術知識和思想的傳播交流。這不但促進了學術信息更廣泛的交流,也實現(xiàn)了學術研究成果的多元化評價。Altmetrics正是在這樣的背景下悄然誕生,促成了計量學學科結合社交媒體在線交流特點進行了Web2.0的創(chuàng)新和革命,也成為圖書情報領域的研究熱點,產(chǎn)生了巨大的影響??蒲袡C構、科研人員以及出版商都紛紛通過社交網(wǎng)絡如推特(Twitter)、小木蟲、臉書(Facebook)等分享交流科研成果,Altmetrics已普遍被研究機構和研究人員看作是一種基于社交網(wǎng)絡數(shù)據(jù)進行科研交流、傳播和評價的新型計量學,旨在通過其建立的快速、全面和新型的科研評價體系補充僅僅依靠傳統(tǒng)引文指標或同行評議的科研評價體系。

1.2 社交網(wǎng)絡平臺及其數(shù)據(jù)呈現(xiàn)的問題

源于科學在線交流環(huán)境中誕生的Altmetrics新型計量學的運行基礎是各類型學術成果(如論文、圖書、數(shù)據(jù)集、程序、視頻等)在各種社交網(wǎng)絡平臺中發(fā)生交互而不斷產(chǎn)生并逐步積累的網(wǎng)絡數(shù)據(jù),即學術成果的Altmetrics指標測量的是其在主流新聞媒體、社交媒體或在線社區(qū)被下載、提及、分享、點贊和評論次數(shù)等的關注度和影響力。所以通過Altmetrics 獲得可以進行指標分析的數(shù)據(jù)受到以下兩方面的影響: 一是研究成果所出現(xiàn)的各種社交網(wǎng)絡平臺,這是Altmetrics原始數(shù)據(jù)源的產(chǎn)生地,具體來說可細分為以下六類:①社交媒體網(wǎng)站,國外有谷歌加(Google+)、Facebook、Twitter等,國內(nèi)有微信、微博、知乎等;②在線學術網(wǎng)站,國外有Scopus、Web of Science、EBSCO ,國內(nèi)有中國知網(wǎng)、萬方數(shù)據(jù)庫等期刊綜合網(wǎng)站等;③新聞媒體網(wǎng)站,國外有科學新聞(Science News)、時代新聞(Time News),國內(nèi)有科學網(wǎng)等;④文獻管理平臺,國外有CiteULike、Mendeley等,國內(nèi)有道客巴巴、百度文庫、豆丁網(wǎng)等;⑤學術社區(qū)網(wǎng)站,國外有F1000等,國內(nèi)有丁香園、小木蟲等;⑥百科平臺,國外有維基百科(Wikipedia)等,國內(nèi)有MBA 智庫百科等。二是統(tǒng)計各種社交網(wǎng)絡平臺上的研究成果及其“活躍”情況,如在小木蟲上對某一研究成果的評論數(shù)或在Mendeley上對某一出版物的保存量[1]。

目前對于Altmetrics的一種主要研究方法是通過收集社交網(wǎng)絡平臺上的數(shù)據(jù)進行實證評價分析得出相應結論。因此,實時快速收集數(shù)據(jù)并保證這些數(shù)據(jù)的準確性、一致性、全面性和有效性就顯得非常重要。但是由于不同的社交網(wǎng)絡平臺數(shù)量眾多,各平臺的使用率和普及率差別很大,在這些社交網(wǎng)絡平臺上進行交流傳播產(chǎn)生的大量網(wǎng)絡數(shù)據(jù)呈現(xiàn)出龐大、多態(tài)、異構、不穩(wěn)定和繁雜的特征,且各平臺的數(shù)據(jù)和指標都存在一定的差異,導致數(shù)據(jù)去重和整合的難度很大。

1.3 整合Altmetrics數(shù)據(jù)的必要性

鑒于以上情況,很多科研人員雖然已廣泛使用各社交網(wǎng)絡上的數(shù)據(jù)來進行基于Altmetrics的評價研究,但是在做研究時只能選取不同的有代表性的社交網(wǎng)絡平臺來采集、處理和匯總平臺數(shù)據(jù),難以形成統(tǒng)一的標準,這必將嚴重影響評價結果的準確性和全面性,也會限制Altmetrics的長期可持續(xù)發(fā)展。因此為了在Web2.0 環(huán)境下,保證科學評價和計量研究的準確性和影響力,最理想化的方式是構建有一致性和通用意義的Altmetrics社交網(wǎng)絡標準化數(shù)據(jù)框架和評價體系,并按照一致性的標準建設能融合各社交網(wǎng)絡平臺上的Altmetrics數(shù)據(jù)的整合分析平臺。目前尚未有一個能把各種零散的社交網(wǎng)絡數(shù)據(jù)整合起來的中文平臺出現(xiàn),這在一定程度上會影響這種創(chuàng)新評價方式的發(fā)展和開放數(shù)據(jù)的有效使用。因此建立中文Altmetrics數(shù)據(jù)整合分析平臺是必須且緊迫的。

2 國外Altmetrics數(shù)據(jù)整合分析平臺的經(jīng)驗與問題

2.1 國外Altmetrics數(shù)據(jù)整合分析平臺的經(jīng)驗

目前國外已有針對Altmetrics數(shù)據(jù)的整合分析平臺,其本身不產(chǎn)生互動數(shù)據(jù),而是匯聚并整合了多個不同社交網(wǎng)絡平臺的原始數(shù)據(jù)源。國外Altmetrics數(shù)據(jù)整合分析平臺主要包括Altmetric.com、PLoS ALM、PlumX、Kudos、ImpactStory 和Webometrics Analyst等,是由不同的出版商或服務商在不同時間開發(fā)的。通過對上述平臺網(wǎng)站的調(diào)研,總結了一些可以借鑒的經(jīng)驗。

(1)數(shù)據(jù)來源和成果類型較豐富。國外Altmetrics整合分析平臺的數(shù)據(jù)來源廣泛,大部分來自于社交媒體網(wǎng)站、在線學術網(wǎng)站、文獻管理平臺、學術社區(qū)網(wǎng)站、新聞媒體網(wǎng)站和百科平臺等,Altmetric.com 和PLoS ALM 覆蓋的數(shù)據(jù)源最為全面,囊括了上述六種社交網(wǎng)絡平臺二十種左右的原始數(shù)據(jù)源。數(shù)據(jù)來源越廣泛多樣,評價數(shù)據(jù)就越能準確科學地反映被評價對象的影響力。評價的成果類型也是多種多樣的,從學術論文到博客、數(shù)據(jù)集、軟件、程序代碼以及圖片等都囊括其中,其中PlumX評價的成果類型最多,高達27 種。

(2)通過DOI等標識符來識別學術成果。數(shù)字對象唯一標識符(Digital Object Identifier,DOI)是國外最常用的一種標識符技術,Altmetrics 數(shù)據(jù)的準確性主要取決于文獻的DOI,DOI 是否可用在很大程度上決定了Altmetrics數(shù)據(jù)的質(zhì)量表現(xiàn)[2]。學術文獻還有一些其他的標識符,如PMID,ArXiv ID和SlideShare的統(tǒng)一資源定位符(Uniform Resource Locator,URL)等[3]。國外Altmetrics數(shù)據(jù)整合分析平臺通過學術成果的DOI等統(tǒng)一標識符來實時追蹤各社交網(wǎng)絡平臺上的Altmetrics數(shù)據(jù),保證了在網(wǎng)絡環(huán)境下對學術文獻對象的準確識別,有效地避免了重復。

(3)建立了系統(tǒng)的指標體系。國外Altmetrics數(shù)據(jù)整合分析平臺都建立了系統(tǒng)的指標體系和一致的評分系統(tǒng),然后以報告或者評分的形式對某一項科研成果的社會影響力進行評價。因此可以提供相對系統(tǒng)和標準化的可用數(shù)據(jù),為科研人員的研究和科研機構的評價提供數(shù)據(jù)維度的方便和實時的支持,科研人員可以在其平臺工具上一站式查詢Altmetrics數(shù)據(jù),省去了在多個社交平臺尋找數(shù)據(jù)的麻煩。

由于易用性和開放性的特征,國外Altmetrics數(shù)據(jù)整合分析平臺受到了學界的歡迎,為精準的科學評價和合理的科技政策的制定提供了全面參考,對Altmetrics 的發(fā)展也起到了重要作用。

2.2 國外Altmetrics數(shù)據(jù)整合分析平臺存在的問題

從理論上來說,不同Altmetrics數(shù)據(jù)整合分析平臺應該提供一致的Altmetrics數(shù)據(jù),但是由于Altmetrics數(shù)據(jù)本身的多源性和復雜性,現(xiàn)在國外也還沒有一家Altmetrics數(shù)據(jù)整合分析平臺能夠涵蓋所有社交網(wǎng)絡平臺的數(shù)據(jù),并且各數(shù)據(jù)整合分析平臺的數(shù)據(jù)源存在著以下不一致的問題。

(1)數(shù)據(jù)來源不一致。目前各個國外Altmetrics整合分析平臺的數(shù)據(jù)來源不一樣,所收集數(shù)據(jù)的策略不一樣,其在發(fā)展過程中根據(jù)自身目標和愿景形成了獨具特色的數(shù)據(jù)源[4],比如Altmetric.com對博客文章的收集最多,而PlumX更多采集來自新聞媒體的數(shù)據(jù)[5]。這些平臺還制定了各不相同的數(shù)據(jù)提取清洗政策,這對數(shù)據(jù)的使用產(chǎn)生了很大影響。

(2)指標聚合方式不一致。各數(shù)據(jù)整合分析平臺所提供的Altmetrics指標有些直接來自某個社交網(wǎng)絡平臺應用程序編程接口(Application Programming Interface,API)提供的一個字段,有些是多個字段的組合形成的一個新的指標[6],以滿足評價的需求。這些指標只有名稱,并沒有說明是如何構建的。所以到目前為止這些數(shù)據(jù)整合分析平臺都還不能夠提供準確、全面和一致的Altmetrics 指標。這些都會影響評價的準確性。

(3)數(shù)據(jù)更新速度不一致。不同的數(shù)據(jù)整合分析平臺對不同來源數(shù)據(jù)的更新頻率不一致。比如Altmetric.com平臺中聲明對Twitter、Scopus、Wikipedia的數(shù)據(jù)是實時更新的,而Facebook、YouTube、Mendeley等是每天更新。實時更新的具體含義以及如何實現(xiàn)、每日更新的方式和具體時間等都是不透明的,這也是導致Altmetrics數(shù)據(jù)整合分析平臺數(shù)據(jù)質(zhì)量的問題之一。

2.3 對國外Altmetrics數(shù)據(jù)整合分析平臺的借鑒

國外常用的Altmetrics數(shù)據(jù)整合分析平臺都以尋找更多樣和全面的社交網(wǎng)絡數(shù)據(jù)源為主要目標,比如Altmetric.com整合分析平臺還收錄了新浪微博數(shù)據(jù),未來各平臺將會收集到更全面的社交網(wǎng)絡平臺數(shù)據(jù)。而且不同的數(shù)據(jù)整合分析平臺之間是具有互補關系的,不同平臺之間的數(shù)據(jù)如果可以相互融合,那么所能提供的數(shù)據(jù)就會更加準確和全面,可以認為這是Altmetrics數(shù)據(jù)整合分析平臺的發(fā)展趨勢,也是建立中文Altmetrics數(shù)據(jù)整合分析平臺的目標。

在中文環(huán)境下,首先要考察學術成果受到哪些中文社交網(wǎng)絡平臺的關注;其次要盡可能尋找多樣化和全面性的學術成果網(wǎng)絡社交數(shù)據(jù)源,借鑒國外Altmetrics數(shù)據(jù)整合分析平臺的經(jīng)驗;再次能提供的Altmetrics指標需要有詳細統(tǒng)一的標準,要能避免如上所述國外各Altmetrics數(shù)據(jù)整合分析平臺現(xiàn)存的問題。最后這個平臺的數(shù)據(jù)不能單靠高成本和低效率的人工方式收集,需要設計專業(yè)和智能的數(shù)據(jù)收集工具,快速準確地通過API接口從相關平臺獲取網(wǎng)絡數(shù)據(jù),并對其進行清洗、格式轉換和特征提取等工作。而這些工作如果由圖書館這樣的社會公共服務機構進行領導和組織,將能取得比較好的效果。筆者深入訪談了10位圖書館學界和業(yè)界的專家,對圖書館界是否適合承擔建立中文Altmetrics數(shù)據(jù)整合分析平臺領導組織的角色、圖書館界應在數(shù)據(jù)整合分析平臺中提供什么樣的服務向專家進行了詳細的咨詢訪談(訪談提綱見附錄)。根據(jù)對專家意見的整理和綜合,筆者認為在建立中文Altmetrics數(shù)據(jù)整合分析平臺時,由圖書館界來組織實施是非常必要且可行的。

3 圖書館界整合中文Altmetrics數(shù)據(jù)的必要性和可行性

3.1 圖書館界整合中文Altmetrics數(shù)據(jù)的必要性

3.1.1 圖書館作為社會公共服務機構的必然使命

數(shù)據(jù)作為獲取知識和開展知識服務的重要性和價值已經(jīng)引起全球的重視,它被認為是世界上最有價值的資源并且改變了競爭的本質(zhì)[7]?!伴_放數(shù)據(jù)”在維基百科中的定義是:“不受任何知識產(chǎn)權和管理機制的限制,是經(jīng)過挑選與許可的數(shù)據(jù),可以免費開放給公眾,任何人都可以自由使用[8]?!遍_放數(shù)據(jù)包括開放的館藏數(shù)據(jù)、科研數(shù)據(jù)、政府數(shù)據(jù)、商業(yè)數(shù)據(jù)和一些用戶產(chǎn)生的數(shù)據(jù)等。公眾對開放數(shù)據(jù)需求的不斷增加促進了開放數(shù)據(jù)運動的長足發(fā)展,隨著越來越多數(shù)據(jù)的開放,開放數(shù)據(jù)的種類不斷增長,開放數(shù)據(jù)的良好環(huán)境逐步形成。

Altmetrics社交網(wǎng)絡數(shù)據(jù)屬于用戶產(chǎn)生的數(shù)據(jù),但由于均被托管給了第三方,所以在授權的情況下也可以認為轉變?yōu)橐环N商業(yè)數(shù)據(jù),因此它也屬于開放數(shù)據(jù)。根據(jù)開放的理念和思維以及開放數(shù)據(jù)的內(nèi)涵,Altmetrics社交網(wǎng)絡數(shù)據(jù)應該免費開放給公眾讓其自由使用。但是大部分社交網(wǎng)絡平臺是營利性質(zhì)的,數(shù)據(jù)還未能無條件地提供給大眾使用。把受限制的數(shù)據(jù)無條件地向任何人開放,也是用戶擁有“數(shù)據(jù)開放權”的最高目標。雖然在開放數(shù)據(jù)環(huán)境下如何對開放數(shù)據(jù)進行知識產(chǎn)權保護尚沒有明確的法律條文,但在對Altmetrics數(shù)據(jù)進行整合管理的過程中,圖書館界也可以借鑒國外如德國國家圖書館、英國大英圖書館、學術出版與學術資源聯(lián)盟等制定的對于開放數(shù)據(jù)在館內(nèi)應用及許可協(xié)議,明確使用者與數(shù)據(jù)提供體系之間的關系,促成用戶與原始數(shù)據(jù)之間的對接與再利用[9]。

國外Altmetrics的數(shù)據(jù)整合分析平臺開發(fā)商大多是出版商或服務商,比如Altmetric.com、PlumX、Kudos、ImpactStory 和Webometrics Analyst都是由服務商提供的, PLoS ALM是由出版商提供的[10]。由于具有商業(yè)性質(zhì),所以其提供的數(shù)據(jù)服務大多不是免費的,比如PlumX和ImpactStory都是收費的,Altmetric.com也是部分收費的,這將極大制約Altmetrics的推廣和應用。因此國內(nèi)整合中文Altmetrics數(shù)據(jù)來開發(fā)建立整合分析平臺不適合由商業(yè)盈利機構來主導。并且圖書館作為社會公共服務機構有義務有責任承擔開放數(shù)據(jù)管理和領導組織的角色,負責對社交網(wǎng)絡開放數(shù)據(jù)進行遴選、采集、描述、組織、分析與評價,提高數(shù)據(jù)資源的可用性和價值性,給用戶免費提供社交網(wǎng)絡數(shù)據(jù)的保存、檢索、分析挖掘等服務,并根據(jù)數(shù)據(jù)連續(xù)使用的視角提供數(shù)據(jù)關聯(lián)、標識和發(fā)布等服務[11]。此外,圖書館相比于商業(yè)機構也更有利于對這些開放數(shù)據(jù)進行長期保存。

3.1.2 開放數(shù)據(jù)環(huán)境下的責任推動

數(shù)據(jù)已成為體現(xiàn)圖書館服務水平和核心競爭力的重要因素,是涉及圖書館服務模式創(chuàng)新、提高個性化服務能力和增強服務透明度的戰(zhàn)略資源。數(shù)據(jù)也是圖書館發(fā)現(xiàn)用戶需求、進行服務決策和評估服務有效性的直接依據(jù),是圖書館用戶服務“數(shù)據(jù)權”和“知情權”的有效載體[12]。圖書館很早就開始進行科學數(shù)據(jù)的管理和政府開放數(shù)據(jù)的整合管理,如美國卡內(nèi)基圖書館整合了農(nóng)業(yè)、教育、建筑、衛(wèi)生等多類別的政府開放數(shù)據(jù)于平臺上供人們隨時下載分享[13]。國外的知名高校如哈佛大學、斯坦福大學、劍橋大學等都有針對本??蒲袛?shù)據(jù)整合管理的平臺[14]。我國雖然起步較晚,但近幾年也越來越重視對開放數(shù)據(jù)的整合管理,國內(nèi)的“雙一流”大學如北京大學、武漢大學、復旦大學等也都建立了科學數(shù)據(jù)的共享平臺[15]。2014年國內(nèi)9家高校圖書館還在復旦大學的牽頭下共同發(fā)起成立了“中國高校圖書館研究數(shù)據(jù)管理推進工作組”,并建立了能夠實現(xiàn)科研數(shù)據(jù)存儲、發(fā)布、交換、共享與在線分析等功能的復旦社會科學數(shù)據(jù)平臺[16]。Altmetrics數(shù)據(jù)屬于開放數(shù)據(jù),是一種公共資源,這種類型數(shù)據(jù)的開放和加工整合能為圖書館服務質(zhì)量的提高提供強有力的數(shù)據(jù)資源支持。因此,圖書館的Altmetrics社交網(wǎng)絡數(shù)據(jù)的整合開放是否可用、安全和具有公信力,將會對圖書館服務模式的有效性以及用戶權益的保障產(chǎn)生很大影響。圖書館界在這樣的新契機下要充分發(fā)揮自身價值和功能,以用戶為中心,以開放的姿態(tài)利用復雜多樣的社交網(wǎng)絡數(shù)據(jù)滿足用戶多元化的需求,跟上時代發(fā)展的潮流,使圖書館與社會的關系更加緊密,從而提高圖書館的地位,實現(xiàn)圖書館的積極轉型,推動圖書館事業(yè)的跨越式發(fā)展。

3.1.3 圖書館實現(xiàn)創(chuàng)新信息資源建設的途徑

Altmetrics的發(fā)展為圖書館實現(xiàn)創(chuàng)新的信息資源建設、開展數(shù)據(jù)相關的服務提供了新的機遇。圖書館的信息資源建設對象除了有紙質(zhì)資源和數(shù)據(jù)庫資源外,數(shù)據(jù)也已成為圖書館信息資源建設中的重要組成部分。社交網(wǎng)絡數(shù)據(jù)是重要的數(shù)據(jù)資源,對于科研人員開展評價活動具有重要作用。國家圖書館已收藏了新浪微博上的2000億條博文,美國國會圖書館也已收錄了千億條Twitter上的推文[17]。圖書館必須把社交網(wǎng)絡數(shù)據(jù)納入到資源建設的范疇,圖書館要改變傳統(tǒng)的資源建設思想和建設模式,整合各社交平臺上大量的Altmetrics數(shù)據(jù),提高社交數(shù)據(jù)資源的利用率,進而提高圖書館的服務水平和服務效率。這有利于推動整個社會開放共享的形成,也讓公民更了解圖書館的價值所在。

3.2 圖書館界整合中文Altmetrics數(shù)據(jù)的可行性

3.2.1 圖書館具有豐富的信息和數(shù)據(jù)服務經(jīng)驗

隨著社會的快速發(fā)展,數(shù)據(jù)時代的到來帶給圖書館巨大的變革,圖書館不再只是存儲紙質(zhì)文獻的場所,圖書館本身的紙質(zhì)館藏資源就很豐富,并在經(jīng)過多年的數(shù)字圖書館建設后,已擁有大量各種類型的數(shù)字化資源,是最適合承擔大數(shù)據(jù)時代數(shù)據(jù)開放與整合的實踐者。而且圖書館作為信息和知識的保存和傳播機構,具有面向公眾開展信息資源服務的豐富經(jīng)驗。這些經(jīng)驗完全可以移植到數(shù)據(jù)服務方面。這也是圖書館界相比于商業(yè)機構更適合整合中文Altmetrics數(shù)據(jù)的優(yōu)勢之一。圖書館界組織協(xié)調(diào)開發(fā)的、可以供用戶免費使用的項目將會有更多的利用率。各圖書館也不需要額外斥巨資向商業(yè)機構購買這樣的整合平臺。國外圖書館在數(shù)據(jù)服務方面已開展了較多實踐[18],其以開放數(shù)據(jù)為原則推動圖書館把現(xiàn)有的數(shù)字資源轉變?yōu)殚_放數(shù)據(jù)資源,并將社會各方豐富的公開數(shù)據(jù)資源納入館藏資源體系,如政府數(shù)據(jù)、氣象數(shù)據(jù)、人文數(shù)據(jù)、科學數(shù)據(jù)和商業(yè)數(shù)據(jù)等,加強開放數(shù)據(jù)資源之間的融合與關聯(lián),打破時空對于公眾獲取數(shù)字資源和服務的限制,為用戶提供特色數(shù)據(jù)服務,滿足公眾對于數(shù)據(jù)資源的個性化需求。

3.2.2 科技發(fā)展使圖書館具有數(shù)據(jù)加工分析的能力

圖書館從發(fā)展初期開始就持續(xù)追蹤讀者使用館藏資源的情況,從基礎簡單的讀者調(diào)查到書籍期刊資源的使用追蹤,再到用計算機來進行圖書館借閱統(tǒng)計分析,直至到出現(xiàn)電子資源后進行電子資源使用情況的復雜分析,因此圖書館具有分析整合用戶數(shù)據(jù)的經(jīng)驗和能力。隨著科技的發(fā)展進步,圖書館的信息化設備已經(jīng)十分完備,具有先進的計算機設備和高速的網(wǎng)絡設施,以及成熟的數(shù)據(jù)采集加工能力,與圖書館相關的用戶使用資源的數(shù)據(jù)分析模型也越來越多樣化,并且圖書館采集、存儲和整合數(shù)據(jù)的成本也逐漸降低。因此由圖書館來進行整合各中文社交網(wǎng)絡平臺上的Altmetrics數(shù)據(jù)具有充分的可行性。

3.3 COUNTER和DRAA的啟示及圖書館界的角色和定位

3.3.1 COUNTER和DRAA成功運作的啟示

網(wǎng)絡電子資源在線利用統(tǒng)計(Counting Online Usage of Net-worked Electronic Resources,COUNTER)是規(guī)范電子資源使用統(tǒng)計報告數(shù)據(jù)處理、審核和提交的國際化標準,其目的是為在線信息服務商和用戶提供可靠的、一致的、兼容的使用統(tǒng)計標準和方案。2019年,COUNTER發(fā)布了第五版《COUNTER電子資源使用統(tǒng)計實施規(guī)范》(以下簡稱COUNTER R5)。COUNTER R5采用了新的報告體系,新的元素和屬性,以及新的報告格式和獲取方式[19]。

高校圖書館數(shù)字資源采購聯(lián)盟(Digital Resource Acquisition Alliance of Chinese Academic Libraries,DRAA)是由中國部分高等學校圖書館共同發(fā)起成立的,目的是合作開展引進數(shù)字資源的采購工作,規(guī)范集團采購行為,通過聯(lián)盟的努力為成員館引進數(shù)字學術資源謀求最優(yōu)價格和最佳服務。DRAA于2013年初開始支持通過標準化的電子資源使用統(tǒng)計獲取協(xié)議(The Standardized Usage Statistics Harvesting Initiative,SUSHI)自動獲取COUNTER格式報告。2015年9月正式成立DRAA使用統(tǒng)計工作組,目的一是促進數(shù)據(jù)庫商配合收集數(shù)據(jù)庫的使用數(shù)據(jù);二是建立收集使用數(shù)據(jù)的長效機制,并對數(shù)據(jù)質(zhì)量進行檢查;三是深入研究COUNTER規(guī)范,實現(xiàn)對使用數(shù)據(jù)統(tǒng)計的進一步應用。DRAA使用統(tǒng)計模塊分為數(shù)據(jù)獲取、數(shù)據(jù)處理和報告展示三個層次來進行使用數(shù)據(jù)統(tǒng)計的管理[20]。

COUNTER項目對于圖書館開展整合Altmetrics數(shù)據(jù)具有很大的啟發(fā)。COUNTER最重要的組成部分是圖書館聯(lián)盟,它還整合了電子資源從生產(chǎn)到利用環(huán)節(jié)的出版商、資源提供商和行業(yè)組織等。新的COUNTER R5報告體系除了依舊保持了詳細的統(tǒng)計術語和嚴格的報告撰寫標準外,還拓展了數(shù)據(jù)類型,比如數(shù)據(jù)集、音頻、視頻和圖片等,并更精準和更新定義了計量類型、訪問類型和訪問方式等。DRAA通過引入了全新的SUSHI協(xié)議,直接自動收割COUNTER的電子資源使用統(tǒng)計報告,可以使圖書館高效地獲取更準確的電子資源使用數(shù)據(jù),而不需要登錄多個數(shù)據(jù)庫商的網(wǎng)站下載COUNTER使用數(shù)據(jù),加強了圖書館和數(shù)據(jù)庫商對于資源使用評估的互動,為各圖書館制定科學有效的采購策略提供了方便[21]。因此由圖書館聯(lián)盟來進行多方參與和協(xié)調(diào)發(fā)展電子資源使用數(shù)據(jù)的統(tǒng)計,制定統(tǒng)計的格式、內(nèi)容和術語,并控制數(shù)據(jù)質(zhì)量方面是有成功典范的,而且自動化收割和整合管理使用數(shù)據(jù)還極大地方便了圖書館自身使用這些數(shù)據(jù)來更好地開展服務。這也更證明了數(shù)據(jù)時代由圖書館界整合中文Altmetrics數(shù)據(jù)的可行性。

3.3.2 圖書館界在中文Altmetrics數(shù)據(jù)整合中的角色及可提供的服務

圖書館界在中文Altmetrics數(shù)據(jù)整合中應借鑒國際上COUNTER項目和我國DRAA統(tǒng)計工作組項目的成功實施經(jīng)驗,充分發(fā)揮其在數(shù)據(jù)整合過程中協(xié)調(diào)組織的作用,確立其協(xié)調(diào)者、組織者、建設者和服務提供者的角色。Altmetrics數(shù)據(jù)整合項目可以由中國圖書館學會(以下簡稱中圖學會)或教育部高等學校圖書情報工作指導委員會(以下簡稱高校圖工委)來牽頭組織,聯(lián)合主要的省級公共圖書館、高校圖書館或圖書館聯(lián)盟,以及部分社交網(wǎng)絡平臺的企業(yè)代表等共同開展此項工作。經(jīng)費可以由各參與的圖書館繳納的會費并結合中圖學會或高校圖工委下?lián)艿牟糠盅芯拷?jīng)費組成,并爭取以項目方式獲得一些基金的資助。對于每一家參加數(shù)據(jù)整合項目的圖書館要明確分工職責,分別負責統(tǒng)計標準的制定、Altmetrics數(shù)據(jù)的采集、Altmetrics數(shù)據(jù)的加工處理、Altmetrics數(shù)據(jù)的保存和發(fā)布、與社交網(wǎng)絡企業(yè)溝通等。

最終應能建立起Altmetrics數(shù)據(jù)整合分析平臺,平臺需要讓用戶自由查詢所需要文獻的Altmetrics全面數(shù)據(jù),還要能定期提供多樣化的統(tǒng)計報告,包括按時間、內(nèi)容、類型劃分等。對于參與Altmetrics數(shù)據(jù)整合項目的圖書館,可以優(yōu)先使用Altmetrics數(shù)據(jù),該圖書館可以在第一時間把Altmetrics數(shù)據(jù)整合分析平臺推送到該館的主頁,讓用戶根據(jù)需要進行瀏覽和獲取。對于未參與的圖書館,由該館與項目負責人進行聯(lián)系,取得Altmetrics數(shù)據(jù)整合分析平臺的使用授權后,為該館用戶提供服務。Altmetrics數(shù)據(jù)整合分析平臺工作流程和服務要點的架構見圖1。

圖1 Altmetrics數(shù)據(jù)整合分析平臺工作流程和服務要點

4 圖書館界構建Altmetrics數(shù)據(jù)整合分析平臺的要點

4.1 拓展原始數(shù)據(jù)源

Altmetrics強調(diào)對多類型學術成果的認可和評價,不僅需要格式多樣,還需要內(nèi)容多樣。所以在格式上學術成果不僅是傳統(tǒng)論文的文本格式,還可以是圖片、視頻等。內(nèi)容上除了學術論文外,程序片段、數(shù)據(jù)算法和科學數(shù)據(jù)集等新型的學術成果也是重要的需要被關注的類型[3]。比如關于科學數(shù)據(jù)集,可以利用數(shù)據(jù)引證的方式來評估科學數(shù)據(jù)集的價值,但由于過于局限于規(guī)范的學術論文,無法捕捉所有科學數(shù)據(jù)集被廣泛應用的情況和多元化的價值[22]。因此用Altmetrics的指標來測量科學數(shù)據(jù)集在社交網(wǎng)絡平臺的提及、下載等情況,可反映其被分享和應用的情況[23]。但由于不同學科的科研人員對于社交網(wǎng)絡平臺的使用偏好具有較大差別,當前Altmetrics的指標涉及的研究成果以適用于科學、技術、工程與數(shù)學(Science,Technology,Engineering,Mathematics,STEM)領域的學術論文偏多,而人文藝術社會科學領域的很多研究成果(如唱曲、畫作、雕刻)很難在社交網(wǎng)絡平臺上通過定量數(shù)據(jù)來衡量其影響力[24]。

研究者往往希望Altmetrics數(shù)據(jù)整合分析平臺能夠全面評價成果的多種影響力,這就需要通過不同類型的多樣化的數(shù)據(jù)源來支撐,才能實現(xiàn)精準和全面的統(tǒng)計和評價。因此圖書館界在進行中文Altmetrics數(shù)據(jù)整合時要盡量拓展原始數(shù)據(jù)源,尋找和收集格式多樣化(文本、圖片及視頻等)和內(nèi)容多樣化(學術論文、程序片段、數(shù)據(jù)算法、科學數(shù)據(jù)集等)的學術成果。

4.2 使用并大力普及DOI

國外的Altmetrics 數(shù)據(jù)整合分析平臺在統(tǒng)計學術成果的Altmetrics數(shù)據(jù)時,一般是基于學術成果的唯一標識符來獲取論及這篇學術成果的數(shù)據(jù)。發(fā)達國家數(shù)字對象唯一標識符(Digital Object Unique Identifier,DOI)的普及率非常高,而大多數(shù)發(fā)展中國家還沒有普及DOI。DOI系統(tǒng)是由國際DOI基金會(International DOI Foundation,IDF)進行全球分布式管理,2007年3月,IDF正式授權中國科技信息研究所和萬方數(shù)據(jù)成立中文DOI注冊機構[25]。我國中文社交網(wǎng)絡平臺的中文學術成果很少有標注來源出處的唯一標識,甚至有一些連URL都沒有,所以無法通過DOI來追蹤中文學術成果的社交網(wǎng)絡痕跡。因此圖書館界在整合Altmetrics數(shù)據(jù)時需要將不同標識符的相同目標文獻采用一致的方法進行聚合,從而確定指標的一致性,保證數(shù)據(jù)的質(zhì)量。圖書館界可以呼吁和敦促相關出版機構和期刊編輯機構盡快加入DOI系統(tǒng),并提供相關技術支持和服務,促進DOI的普及使用。

4.3 制定統(tǒng)一的數(shù)據(jù)標準和科學設計指標

Altmetrics的評價和研究離不開高質(zhì)量的Altmetrics數(shù)據(jù)。Altmetrics數(shù)據(jù)質(zhì)量問題主要發(fā)生在社交網(wǎng)絡平臺、數(shù)據(jù)整合分析平臺和用戶三個層面,如前所述,社交網(wǎng)絡平臺數(shù)據(jù)的差異、數(shù)據(jù)的不穩(wěn)定性、數(shù)據(jù)的不一致性和數(shù)據(jù)的覆蓋率不同會影響Altmetrics數(shù)據(jù)的質(zhì)量,數(shù)據(jù)整合分析平臺中數(shù)據(jù)的來源不一致、聚合方式不一致以及數(shù)據(jù)更新速度不一致也會影響Altmetrics數(shù)據(jù)的質(zhì)量。所以Altmetrics數(shù)據(jù)的準確性、一致性、動態(tài)性和持續(xù)性成為圖書館界在進行數(shù)據(jù)整合分析時最需要關注的問題。

圖書館界作為Altmetrics數(shù)據(jù)整合分析的主導者,應當重視數(shù)據(jù)質(zhì)量的問題。首先通過與整合分析平臺的開發(fā)者進行深入溝通和協(xié)調(diào),制定統(tǒng)一的Altmetrics的數(shù)據(jù)標準,合理遴選各社交網(wǎng)絡平臺的Altmetrics數(shù)據(jù),保證整合分析平臺采集并記錄到的數(shù)據(jù)與來源社交網(wǎng)絡平臺真實的原始數(shù)據(jù)相一致,保證各來源社交網(wǎng)絡平臺的數(shù)據(jù)相統(tǒng)一,保證各數(shù)據(jù)更新的頻率相一致。其次科學地設計整合分析平臺中的數(shù)據(jù)指標。由于各網(wǎng)絡社交平臺功能相近,許多Altmetrics指標界線模糊,在評價時會存在含義重合或者相似的情況,因此有必要區(qū)分不同類型的指標,把同類型的指標進行整合。比如出版商PLoS以及服務商ImpactStory將Altmetrics指標分為訪問、引用、討論、推薦和保存五類,PlumX將指標分為使用、獲取、提及、社交媒體以及引用五類。國內(nèi)有學者將Altmetrics計量指標分為傳播、獲取、利用三個層次[26]。因此在聚合過程中圖書館界需要選取更具代表性、覆蓋范圍更大以及使用頻率較高的指標作為評價指標。最后還需要注意一些保證Altmetrics數(shù)據(jù)質(zhì)量的關鍵問題,比如數(shù)據(jù)整合分析平臺的性能問題,這樣才能更好地促進Altmetrics 平臺的開發(fā)與應用,提升圖書館界對于Altmetrics數(shù)據(jù)管理的有效性。

4.4 構建Altmetrics數(shù)據(jù)采集加工的整體方案

圖書館界對于Altmetrics數(shù)據(jù)的使用需要重視數(shù)據(jù)從采集、處理到轉換等各個階段的數(shù)據(jù)質(zhì)量,并且在每個階段能夠采取合適的方法和策略避免容易產(chǎn)生問題的因素。

在數(shù)據(jù)收集階段,圖書館界要根據(jù)數(shù)據(jù)規(guī)劃要求,多渠道籌措資金提供數(shù)據(jù)整合分析平臺的建設資金,設計開放數(shù)據(jù)服務機制,完成數(shù)據(jù)收集前的準備工作。然后可以通過元數(shù)據(jù)收割協(xié)議,對各社交網(wǎng)絡平臺進行元數(shù)據(jù)收割。在對Altmetrics數(shù)據(jù)進行收集時要注意實現(xiàn)登錄接口、入口的設置。

在數(shù)據(jù)處理階段,首先要進行數(shù)據(jù)清洗。在此過程中圖書館員將社交網(wǎng)絡平臺上的初始數(shù)據(jù)通過API進行提取,然后根據(jù)規(guī)劃的需求,利用合適的數(shù)據(jù)清洗工具以可靠性、真實性和唯一性為原則核實數(shù)據(jù)的來源,剔除不一致、重復、不準確的數(shù)據(jù),修正不精準的數(shù)據(jù),保證Altmetrics數(shù)據(jù)質(zhì)量。其次進行數(shù)據(jù)加工。圖書館界在數(shù)據(jù)加工前要創(chuàng)建元數(shù)據(jù)框架,基于已有元數(shù)據(jù),確定字段結構,統(tǒng)一標準,制定元數(shù)據(jù)規(guī)范和關聯(lián)數(shù)據(jù)應用;實現(xiàn)元數(shù)據(jù)的錄入、排序、補充和存儲,便于數(shù)據(jù)資源的關聯(lián)、分析和應用等。圖書館界應創(chuàng)新開放數(shù)據(jù)格式,使其朝著資源描述框架(Resource Description Framework,RDF) 格式轉變,重視API 標準化;還應實現(xiàn)開放數(shù)據(jù)管理的通用設計,方便各專業(yè)背景的用戶使用,讓開放數(shù)據(jù)轉變?yōu)楦奖闶褂玫暮唵螖?shù)據(jù)。

在數(shù)據(jù)轉換階段,Altmetrics數(shù)據(jù)通過清洗、加工之后成為結構化的干凈數(shù)據(jù),但是還要通過數(shù)據(jù)轉換才能利用API 接口對外開放。圖書館員可以和技術人員協(xié)作,利用RDF 格式轉變工具把數(shù)據(jù)轉換存儲到RDF存儲庫中。然后再利用統(tǒng)一或者分類的開放方式對外開放[27]。

在實現(xiàn)數(shù)據(jù)從采集、處理到轉換等階段后,圖書館界應基于在文獻資源管理方面的經(jīng)驗,進行數(shù)據(jù)平臺的數(shù)據(jù)存儲、分類、組織、檢索、管理等,使用戶可利用圖書館的“一站式”檢索平臺一鍵快速搜索到自己所需的數(shù)據(jù)資源,并完成基于數(shù)據(jù)共享框架下的智能判斷和決策。圖書館界應對開放全程實時監(jiān)管,當發(fā)現(xiàn)錯誤或不精確的數(shù)據(jù)時,應及時對其進行修改。

4.5 廣泛開展合作

圖書館界對于Altmetrics數(shù)據(jù)的開放、整合、管理應廣泛聽取用戶和社會的意見,了解其需求,堅持公開、透明、可擴展和合作的原則,合理選擇數(shù)據(jù)開放的對象、內(nèi)容和方式,不斷增強Altmetrics數(shù)據(jù)整合分析平臺的可用性和價值密度,最終實現(xiàn)數(shù)據(jù)的開放性增值。各圖書館之間應加強合作,對Altmetrics數(shù)據(jù)進行采集整合不是某一家圖書館的事,而是整個圖書館界的責任,需要各圖書館之間協(xié)作來完成。圖書館界需協(xié)調(diào)各方開展對數(shù)據(jù)標準、采集整合方法工具和策略的研究。

圖書館界還需加強與社交網(wǎng)絡平臺企業(yè)的聯(lián)系和合作,作為Altmetrics數(shù)據(jù)的來源,要想獲得準確可靠的數(shù)據(jù)不能僅靠API自動收集,特別是一些企業(yè)沒有開放給大眾的數(shù)據(jù),可以由圖書館界與這些企業(yè)進行溝通協(xié)商,從利益相關者的角度出發(fā),提出解決方案以便獲得這些數(shù)據(jù)??傊訌妶D書館界與社會各部門的聯(lián)系,促使圖書館作為公共文化服務機構能更好地完成Altmetrics數(shù)據(jù)整合分析的工作,開展創(chuàng)新性的由數(shù)據(jù)驅動的公共服務,從而也可以擴大圖書館的社會影響力。

4.6 保護用戶的隱私數(shù)據(jù)

Altmetrics數(shù)據(jù)中包含著社交網(wǎng)絡平臺用戶大量的閱讀內(nèi)容、參與內(nèi)容、社會關系和地理位置等個體特征和行為數(shù)據(jù)。雖然社交網(wǎng)絡數(shù)據(jù)權屬于數(shù)據(jù)收集的企業(yè)一方,但是這些包含大量個人數(shù)據(jù)的隱私也是需要被保護的。在采集利用Altmetrics數(shù)據(jù)過程中如果圖書館界對用戶Altmetrics數(shù)據(jù)資源進行無限制地完全開放,一些用戶不想公開的隱私和個人信息就會被泄露[28]。圖書館界應加強Altmetrics數(shù)據(jù)開放過程中用戶的隱私保護,確保數(shù)據(jù)提供服務具有較高的安全性并能保障用戶的名譽權。首先,圖書館界應保證用戶擁有對自身社交行為數(shù)據(jù)采集、使用和共享的知情權與決定權,讓用戶依據(jù)保護的需求決定開放的內(nèi)容、程度和方式。其次,圖書館界在Altmetrics數(shù)據(jù)開放過程中,應采用對用戶隱私信息匿名,或轉為采集用戶群體特征的數(shù)據(jù),力爭在能保持數(shù)據(jù)價值、可用性和開放性的前提下保護用戶的隱私安全。最后,圖書館界還應根據(jù)發(fā)展變化中的用戶隱私保護需求,不斷更新完善相關的行業(yè)規(guī)范和政策法規(guī),確保用戶隱私保護可及時被評估和界定[29]。因為圖書館界對于用戶隱私數(shù)據(jù)的判定標準也是關乎用戶隱私保護有效性和可控性的重要因素。

5 結語

Altmetrics的長期可持續(xù)發(fā)展能夠保證科學評價和計量研究的準確性和影響力,能夠給科研人員和公眾提供更好的開放數(shù)據(jù)服務,因此建立中文Altmetrics數(shù)據(jù)整合分析平臺勢在必行。作為社會公共服務機構的圖書館界最適合承擔牽頭組織的角色,前有COUNTER項目和DRAA成功運用的經(jīng)驗借鑒,后有圖書館界豐富的信息和數(shù)據(jù)服務的經(jīng)驗,圖書館界可以充分發(fā)揮組織協(xié)調(diào)作用,把握整合分析的要點,避免國外Altmetrics數(shù)據(jù)整合分析平臺存在的問題,協(xié)調(diào)各方力量做好Altmetrics數(shù)據(jù)整合分析平臺。

猜你喜歡
網(wǎng)絡平臺社交圖書館
社交之城
英語世界(2023年6期)2023-06-30 06:28:28
社交牛人癥該怎么治
意林彩版(2022年2期)2022-05-03 10:25:08
一種基于5G網(wǎng)絡平臺下的車險理賠
社交距離
網(wǎng)絡平臺補短板 辦學質(zhì)量穩(wěn)提升
你回避社交,真不是因為內(nèi)向
文苑(2018年17期)2018-11-09 01:29:28
圖書館
小太陽畫報(2018年1期)2018-05-14 17:19:25
網(wǎng)絡平臺打開代表履職新視窗
人大建設(2017年11期)2017-04-20 08:22:46
飛躍圖書館
依托網(wǎng)絡平臺,構建學習評價新模式
福鼎市| 潜江市| 信宜市| 客服| 开封市| 肥乡县| 泗水县| 巴林左旗| 汉源县| 公主岭市| 中西区| 荥阳市| 镇原县| 娱乐| 兴和县| 宁波市| 宿迁市| 罗江县| 阳山县| 冷水江市| 西平县| 沂水县| 祁门县| 金华市| 铜山县| 五峰| 天水市| 安塞县| 红安县| 读书| 东至县| 彝良县| 仙桃市| 宣威市| 中超| 土默特右旗| 卢龙县| 济南市| 柘城县| 陆河县| 驻马店市|