楊寧 張志強(qiáng)
摘 要:“第十六屆數(shù)字圖書館前沿問(wèn)題高級(jí)研討班”于2019年10月在成都召開,研討班的主題是“數(shù)據(jù)科學(xué)、數(shù)據(jù)管理與數(shù)據(jù)應(yīng)用”,來(lái)自國(guó)內(nèi)外80余家高校和科研機(jī)構(gòu)的260余名圖書館員、科研人員及師生等,圍繞國(guó)內(nèi)外數(shù)字圖書館在科學(xué)數(shù)據(jù)管理與服務(wù)領(lǐng)域研究與服務(wù)實(shí)踐的最新進(jìn)展和前沿動(dòng)態(tài)等展開了深入交流和討論,展示了數(shù)字圖書館在開放科學(xué)和科學(xué)大數(shù)據(jù)時(shí)代的新定位、新使命和新發(fā)展。文章從開放科學(xué)背景下科學(xué)大數(shù)據(jù)領(lǐng)域的發(fā)展態(tài)勢(shì)、數(shù)字圖書館在科學(xué)大數(shù)據(jù)領(lǐng)域的定位與挑戰(zhàn)、新技術(shù)對(duì)圖書館業(yè)務(wù)體系的深刻變革和影響等三個(gè)方面,討論和分析了數(shù)字圖書館的發(fā)展現(xiàn)狀以及未來(lái)的發(fā)展情景,特別是指出了未來(lái)圖書館(文獻(xiàn)情報(bào)機(jī)構(gòu))將成為以數(shù)據(jù)知識(shí)生態(tài)系統(tǒng)的管理和服務(wù)為核心的“集成化跨界知識(shí)管理與服務(wù)咨詢機(jī)構(gòu)”的大方向。
關(guān)鍵詞:數(shù)字圖書館;開放科學(xué);科學(xué)大數(shù)據(jù);數(shù)字圖書館前沿問(wèn)題高級(jí)研討班
Abstract The 16th Advanced Digital Library Seminar was held in Chengdu in October 2019. The subject of the seminar is "Data science, data management and data application". More than 260 librarians, researchers, teachers and students from more than 80 universities and scientific research institutions had attended this seminar. The experts exchanged and discussed the international latest progress and frontier trends of digital library research and service practice in the field of scientific data management and service, and showed the new positioning, mission and development of digital library in the era of open science and scientific big data. This paper discusses and analyzes the current situation and future development prospect of digital library from three aspects: the development trend of scientific big data field under the background of open science, the positioning and challenges of digital library in the field of scientific big data, and the profound change and influence of new technology on library business system. In particular, this paper points out that in the future, library (documentation and information institution) will become a "Integrated cross-border knowledge management and service consulting institution" with the management and service of data knowledge ecosystem as the core.
Key words digital library; open science; scientific big data; Advanced Digital Library Seminar
2019年10月25-26日,由中國(guó)圖書館學(xué)會(huì)專業(yè)圖書館分會(huì)、高等學(xué)校圖書館分會(huì)、數(shù)字圖書館研究與建設(shè)專業(yè)委員會(huì)和四川省高校圖工委主辦,中國(guó)科學(xué)院成都文獻(xiàn)情報(bào)中心承辦的“第十六屆數(shù)字圖書館前沿問(wèn)題高級(jí)研討班”(以下簡(jiǎn)稱“研討班”)在成都成功召開,本屆研討班的主題是“數(shù)據(jù)科學(xué)、數(shù)據(jù)管理與數(shù)據(jù)應(yīng)用”。研討班設(shè)置了5場(chǎng)國(guó)內(nèi)外數(shù)字圖書館領(lǐng)域著名專家特邀大會(huì)報(bào)告、15場(chǎng)國(guó)內(nèi)專家主題大會(huì)報(bào)告、4場(chǎng)數(shù)據(jù)技術(shù)專題培訓(xùn)會(huì)、10場(chǎng)優(yōu)秀投稿海報(bào)報(bào)告以及1場(chǎng)圖書館館長(zhǎng)論壇。來(lái)自國(guó)內(nèi)外80余家高校和科研機(jī)構(gòu)的圖書館員、科研人員及師生,圍繞開放科學(xué)和科學(xué)大數(shù)據(jù)時(shí)代國(guó)內(nèi)外數(shù)字圖書館在科學(xué)大數(shù)據(jù)管理與服務(wù)領(lǐng)域研究與服務(wù)實(shí)踐的最新進(jìn)展和前沿動(dòng)態(tài)展開了深入交流和討論,聚焦開放科學(xué)和科學(xué)大數(shù)據(jù)信息環(huán)境下,作為科技知識(shí)管理主力軍的科技圖書館(文獻(xiàn)情報(bào)機(jī)構(gòu)),如何在過(guò)去二十年數(shù)字圖書館發(fā)展的堅(jiān)實(shí)基礎(chǔ)上,以科學(xué)大數(shù)據(jù)知識(shí)管理與知識(shí)服務(wù)為新任務(wù),把握新定位、承擔(dān)新使命和取得新發(fā)展。
在特邀報(bào)告環(huán)節(jié),中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心張曉林研究員、香港中文大學(xué)(深圳)圖書館館長(zhǎng)張甲教授、美國(guó)肯特州立大學(xué)圖書情報(bào)學(xué)院曾蕾教授、美國(guó)雪城大學(xué)信息研究學(xué)院秦健教授、原美國(guó)密歇根大學(xué)中國(guó)信息中心主任鮑曙明教授分別圍繞“建設(shè)研究型大學(xué)的開放智能知識(shí)基礎(chǔ)設(shè)施”“從數(shù)據(jù)到知識(shí)發(fā)現(xiàn)服務(wù)”“開放數(shù)據(jù)的信息服務(wù)”“生物樣本庫(kù)的元數(shù)據(jù)關(guān)聯(lián)與規(guī)范機(jī)制”“面向研究與教學(xué)的未來(lái)數(shù)據(jù)實(shí)驗(yàn)室”等主題作了高水平的學(xué)術(shù)報(bào)告。在專家大會(huì)報(bào)告環(huán)節(jié),來(lái)自中國(guó)科學(xué)院有關(guān)單位、上海圖書館、美國(guó)加州大學(xué)、湘潭大學(xué)、中國(guó)農(nóng)業(yè)科學(xué)院、四川大學(xué)、美國(guó)化學(xué)文摘社等國(guó)內(nèi)外多家高校和機(jī)構(gòu)的15位專家介紹了各自在科學(xué)大數(shù)據(jù)領(lǐng)域的最新研究進(jìn)展與服務(wù)實(shí)踐,主題涵蓋5G與未來(lái)智慧圖書館、科學(xué)數(shù)據(jù)管理與開放共享、多源異構(gòu)數(shù)據(jù)融合、數(shù)字人文、科學(xué)數(shù)據(jù)應(yīng)用、科學(xué)數(shù)據(jù)管理政策等多個(gè)方面。報(bào)告直面科學(xué)大數(shù)據(jù)管理與服務(wù)問(wèn)題,分析應(yīng)對(duì)對(duì)策,介紹發(fā)展前沿,揭示啟示方向,多方位多層次論述了數(shù)字圖書館在科學(xué)大數(shù)據(jù)領(lǐng)域的最新工作進(jìn)展和服務(wù)實(shí)踐。
研討班注重理論與實(shí)踐相結(jié)合,設(shè)置了“科學(xué)數(shù)據(jù)基礎(chǔ)設(shè)施、數(shù)據(jù)策管與數(shù)據(jù)服務(wù)”“基于GIS的歷史地圖的處理”“國(guó)際圖像互操作框架IIIF”“關(guān)聯(lián)數(shù)據(jù)與SPARQL語(yǔ)言”等4場(chǎng)科學(xué)數(shù)據(jù)方面的專業(yè)培訓(xùn)。此外,還設(shè)置了圖書館館長(zhǎng)論壇和海報(bào)討論環(huán)節(jié)。來(lái)自中科院成都文獻(xiàn)情報(bào)中心、復(fù)旦大學(xué)圖書館、四川大學(xué)圖書館、香港中文大學(xué)(深圳)圖書館等單位的圖書館館長(zhǎng)聚焦大數(shù)據(jù)與5G對(duì)圖書館發(fā)展的影響、數(shù)字化時(shí)代圖書館的數(shù)字化發(fā)展戰(zhàn)略與行動(dòng)計(jì)劃、數(shù)字化時(shí)代圖書館員的能力與素質(zhì)等問(wèn)題,從不同的角度展望了圖書館應(yīng)對(duì)大數(shù)據(jù)和5G時(shí)代沖擊的對(duì)策選擇,介紹和討論了圖書館的數(shù)字化長(zhǎng)期發(fā)展規(guī)劃、以及圖書館員在智慧圖書館發(fā)展過(guò)程中的能力素質(zhì)要求及責(zé)任擔(dān)當(dāng)。海報(bào)討論則充分展示了各類型圖書館的最新服務(wù)發(fā)展態(tài)勢(shì)和圖書館數(shù)字知識(shí)產(chǎn)品研發(fā)案例。
縱觀本次研討班,與會(huì)的專家和學(xué)者圍繞著開放數(shù)據(jù)、數(shù)據(jù)管理、數(shù)據(jù)分析、知識(shí)圖譜、數(shù)據(jù)服務(wù)、5G技術(shù)與未來(lái)智慧圖書館等主題的理論方法與實(shí)踐展開了深入學(xué)術(shù)討論,展示了開放科學(xué)與科學(xué)大數(shù)據(jù)時(shí)代數(shù)字圖書館所面臨的新定位與新挑戰(zhàn),呈現(xiàn)出未來(lái)數(shù)字圖書館在知識(shí)服務(wù)需求和信息數(shù)據(jù)技術(shù)雙重驅(qū)動(dòng)下較為清晰的發(fā)展圖景。
1? ?開放科學(xué)背景下科學(xué)數(shù)據(jù)領(lǐng)域的發(fā)展態(tài)勢(shì)
1.1? ? 科學(xué)數(shù)據(jù)納入國(guó)家科技發(fā)展戰(zhàn)略
為占據(jù)科學(xué)數(shù)據(jù)研究制高點(diǎn),加強(qiáng)國(guó)家科技創(chuàng)新能力,各國(guó)相繼將科學(xué)數(shù)據(jù)的發(fā)展納入國(guó)家科技發(fā)展戰(zhàn)略,從政策法規(guī)、機(jī)構(gòu)建設(shè)和人才隊(duì)伍等多個(gè)維度,全方位地部署實(shí)施科學(xué)數(shù)據(jù)相關(guān)計(jì)劃與行動(dòng)以促進(jìn)本國(guó)科學(xué)數(shù)據(jù)領(lǐng)域的發(fā)展。美國(guó)在2012年和2015年兩次出臺(tái)了國(guó)家大數(shù)據(jù)計(jì)劃,用于促進(jìn)美國(guó)在海量數(shù)據(jù)中進(jìn)行科學(xué)發(fā)現(xiàn)與科技創(chuàng)新的能力。其后,美國(guó)國(guó)家科學(xué)基金會(huì)(NSF)、科學(xué)與技術(shù)政策辦公室(OSTP)、國(guó)防部(DOD)、國(guó)家航空航天局(NASA)等機(jī)構(gòu)都發(fā)布了各自的科學(xué)數(shù)據(jù)管理政策。為貫徹科學(xué)數(shù)據(jù)的管理政策,各機(jī)構(gòu)還紛紛成立專門的部門來(lái)管理科學(xué)數(shù)據(jù)的共享與安全,如美國(guó)國(guó)立衛(wèi)生研究院(NIH)就成立了科技政策辦公室,專門負(fù)責(zé)具體制定科學(xué)數(shù)據(jù)管理相關(guān)的科技政策。2013年,英國(guó)政府發(fā)布《英國(guó)數(shù)據(jù)能力發(fā)展戰(zhàn)略規(guī)劃》,并成立了信息經(jīng)濟(jì)委員會(huì)(EIC)來(lái)制定相應(yīng)的戰(zhàn)略方針并保障規(guī)劃的有效實(shí)施。英國(guó)開放數(shù)據(jù)研究所(ODI)和英國(guó)圖書館與情報(bào)專家學(xué)會(huì)(CILIP)等機(jī)構(gòu)還開展了數(shù)據(jù)人才培養(yǎng)計(jì)劃,協(xié)助科研機(jī)構(gòu)和圖書館建立多層次的科學(xué)數(shù)據(jù)人才培養(yǎng)體系,保障密集型科研的數(shù)據(jù)需求[1]。此外,加拿大、日本、澳大利亞、法國(guó)等國(guó)家也紛紛發(fā)布科學(xué)數(shù)據(jù)管理的政策法規(guī),并成立相關(guān)機(jī)構(gòu)來(lái)保障政策的落地實(shí)施。
我國(guó)近年出臺(tái)的國(guó)家級(jí)戰(zhàn)略規(guī)劃中多次提出要將數(shù)據(jù)資源作為社會(huì)經(jīng)濟(jì)發(fā)展的核心推動(dòng)力,通過(guò)國(guó)家層面建設(shè)科學(xué)數(shù)據(jù)重大基礎(chǔ)設(shè)施,出臺(tái)相關(guān)政策保證科學(xué)數(shù)據(jù)的共建共享,利用科學(xué)數(shù)據(jù)推動(dòng)解決科研進(jìn)步和社會(huì)發(fā)展等重大問(wèn)題。
1.2? ? 多方推動(dòng)科學(xué)數(shù)據(jù)開放與共享
2000年,國(guó)際科學(xué)數(shù)據(jù)委員會(huì)(CODATA)制定了《網(wǎng)絡(luò)時(shí)代的科學(xué)原則》,首次提出科學(xué)進(jìn)步與開放數(shù)據(jù)息息相關(guān),各方要在綜合權(quán)衡利弊的基礎(chǔ)上進(jìn)行法律的制定和數(shù)據(jù)的共享。2006年,經(jīng)濟(jì)合作與發(fā)展組織(OECD)制定了《公共資金資助的研究數(shù)據(jù)獲取原則與指南》,提出13條原則用于指導(dǎo)各成員國(guó)制定并完善各自的科學(xué)數(shù)據(jù)共享政策[2]。美國(guó)肯特州立大學(xué)曾蕾教授認(rèn)為開放科學(xué)、開放數(shù)據(jù)、開放存取等信息服務(wù)和獲取方式對(duì)科學(xué)研究的意義十分重大,科學(xué)數(shù)據(jù)管理要遵循FAIR原則(“四可原則”)[3],即可發(fā)現(xiàn)(Findable)、可訪問(wèn)(Accessible)、可交互(Interoperable)和可重用(Reusable)。FAIR原則進(jìn)一步詮釋了現(xiàn)代科學(xué)數(shù)據(jù)共享的基本理念,優(yōu)化和推動(dòng)科學(xué)數(shù)據(jù)的再利用,該原則已在美國(guó)、歐盟、澳大利亞等地得到推廣和普及。
除國(guó)際組織以外,全球各國(guó)政府和科學(xué)數(shù)據(jù)管理機(jī)構(gòu)也出臺(tái)了一系列法律和政策以推動(dòng)科學(xué)數(shù)據(jù)的開放和共享。1985年,美國(guó)行政管理與預(yù)算局發(fā)布A-130號(hào)通告《聯(lián)邦政府信息資源的管理通告》,確立了美國(guó)信息資源管理的總體框架。在此框架基礎(chǔ)上,美國(guó)各大科研資助機(jī)構(gòu)都分別制定了資助項(xiàng)目在開放科學(xué)數(shù)據(jù)方面的具體要求和政策。英國(guó)研究理事會(huì)(RCUK)于2011年發(fā)布了數(shù)據(jù)管理與共享政策,要求資助的學(xué)術(shù)研究和人才培養(yǎng)計(jì)劃都必須遵循這些原則。英國(guó)商業(yè)、創(chuàng)新與技能部(BIS)還發(fā)布了《促進(jìn)增長(zhǎng)的創(chuàng)新和研究戰(zhàn)略》,戰(zhàn)略報(bào)告中進(jìn)一步強(qiáng)調(diào)了開放數(shù)據(jù)對(duì)科技創(chuàng)新的重要性以及促進(jìn)數(shù)據(jù)開放的辦法[4]。日本于2013年開始構(gòu)建政府開放數(shù)據(jù)推動(dòng)藍(lán)圖,并成立開放政府?dāng)?shù)據(jù)委員會(huì)、公共數(shù)據(jù)工作組等專門的部門來(lái)負(fù)責(zé)協(xié)調(diào)和制定開放數(shù)據(jù)的政策和措施。日本政府頒布的《開放政府?dāng)?shù)據(jù)戰(zhàn)略》提出創(chuàng)建開放數(shù)據(jù)案例并制定開放數(shù)據(jù)利用環(huán)境的實(shí)施策略,以開放和共享政府?dāng)?shù)據(jù)[5]??梢?,科技發(fā)達(dá)國(guó)家在科學(xué)數(shù)據(jù)的管理和開放共享的制度建設(shè)和實(shí)踐上,遠(yuǎn)遠(yuǎn)走在國(guó)際前列。
2018年,我國(guó)國(guó)務(wù)院辦公廳印發(fā)了《科學(xué)數(shù)據(jù)管理辦法》(以下簡(jiǎn)稱“《辦法》”),《辦法》強(qiáng)調(diào)了科學(xué)數(shù)據(jù)管理和共享對(duì)我國(guó)科研和經(jīng)濟(jì)社會(huì)發(fā)展的巨大推動(dòng)作用。湘潭大學(xué)邢文明副教授在此次研討班的報(bào)告中從科學(xué)數(shù)據(jù)的管理體制、共享機(jī)制和安全措施三個(gè)方面對(duì)《辦法》進(jìn)行了全面解讀,認(rèn)為《辦法》意義重大,不但理順了我國(guó)科學(xué)數(shù)據(jù)管理體制,并且完善了數(shù)據(jù)共享機(jī)制和安全措施,具備很好的參考和現(xiàn)實(shí)價(jià)值,可以有效地推動(dòng)我國(guó)科學(xué)數(shù)據(jù)工作的可持續(xù)發(fā)展。
1.3? ? 加快科學(xué)數(shù)據(jù)基礎(chǔ)設(shè)施和平臺(tái)建設(shè)
基礎(chǔ)設(shè)施和平臺(tái)建設(shè)是科學(xué)數(shù)據(jù)建設(shè)的重要任務(wù),也是科學(xué)數(shù)據(jù)開放和共享的前提。2011年,歐盟第七框架計(jì)劃資助的GRDI2020(全球研究數(shù)據(jù)基礎(chǔ)設(shè)施10年愿景)項(xiàng)目發(fā)布了《全球科學(xué)數(shù)據(jù)基礎(chǔ)設(shè)施:重大數(shù)據(jù)挑戰(zhàn)》報(bào)告,其中提出了構(gòu)建全球科學(xué)數(shù)據(jù)基礎(chǔ)設(shè)施所面臨的主要挑戰(zhàn),并提出了10項(xiàng)建議以推進(jìn)科學(xué)數(shù)據(jù)基礎(chǔ)設(shè)施的建設(shè)。
目前,基礎(chǔ)設(shè)施和平臺(tái)按照層次和規(guī)??梢源蟾欧譃槿悾海?)國(guó)際學(xué)科組織或國(guó)家建設(shè)的綜合性科學(xué)數(shù)據(jù)管理平臺(tái)。這類平臺(tái)的目標(biāo)是管理和共享各個(gè)學(xué)科來(lái)自全球或本國(guó)的科學(xué)數(shù)據(jù),如美國(guó)國(guó)家生物技術(shù)信息中心(NCBI)、英國(guó)數(shù)據(jù)存檔庫(kù)(UKDA)、我國(guó)國(guó)家科技資源共享服務(wù)平臺(tái)等;(2)服務(wù)于專業(yè)科技領(lǐng)域的學(xué)科數(shù)據(jù)管理平臺(tái)。主要用于管理和服務(wù)某區(qū)域或?qū)I(yè)學(xué)科領(lǐng)域的科學(xué)數(shù)據(jù),如青藏高原科學(xué)數(shù)據(jù)中心等;(3)服務(wù)于本機(jī)構(gòu)的機(jī)構(gòu)知識(shí)庫(kù),多由高校和研究機(jī)構(gòu)建立。如美國(guó)麻省理工學(xué)院機(jī)構(gòu)知識(shí)庫(kù)、英國(guó)南安普頓大學(xué)開放機(jī)構(gòu)知識(shí)庫(kù)、中國(guó)科學(xué)院機(jī)構(gòu)知識(shí)庫(kù)等。在平臺(tái)軟件方面,目前科學(xué)數(shù)據(jù)管理平臺(tái)的構(gòu)建方式主要分為兩種類型:開源軟件和商業(yè)軟件。常用的開源軟件包括Dataverse、DKAN、DSpace等。其中,由哈佛大學(xué)開發(fā)的Dataverse平臺(tái)集成了數(shù)據(jù)管理、權(quán)限管理、檢索和分析等功能,目前在全球已經(jīng)有超過(guò)5600個(gè)用戶,北京大學(xué)和復(fù)旦大學(xué)等國(guó)內(nèi)高校都基于該系統(tǒng)建設(shè)了自己的開放研究數(shù)據(jù)平臺(tái)。常用的商業(yè)軟件包括Teradata、Nesstar等。其中,由挪威研究數(shù)據(jù)中心(NSD)開發(fā)的Nesstar支持用戶在線發(fā)布數(shù)據(jù)和元數(shù)據(jù),并提供搜索、瀏覽和可視化分析等功能。目前,全球有100多家機(jī)構(gòu)用戶在使用該系統(tǒng)[6]。
我國(guó)從2003年開始建設(shè)國(guó)家科技基礎(chǔ)條件平臺(tái),其中科學(xué)數(shù)據(jù)平臺(tái)是重要的組成部分,目前已經(jīng)建成包括國(guó)家人口與健康科學(xué)數(shù)據(jù)共享平臺(tái)、國(guó)家農(nóng)業(yè)科學(xué)數(shù)據(jù)共享中心等8個(gè)科學(xué)數(shù)據(jù)共享平臺(tái)。2019年,國(guó)家基因組科學(xué)數(shù)據(jù)中心(NGDC)成立,目前已建成包括組學(xué)原始數(shù)據(jù)歸檔庫(kù)、基因組、基因表達(dá)等一系列數(shù)據(jù)庫(kù),用戶來(lái)自全球70多個(gè)國(guó)家和地區(qū)。中科院計(jì)算機(jī)網(wǎng)絡(luò)信息中心正高級(jí)工程師胡良霖在此次研討班上以中國(guó)科學(xué)院40年科學(xué)數(shù)據(jù)管理與開放共享的經(jīng)驗(yàn)為出發(fā)點(diǎn),梳理了我國(guó)科學(xué)大數(shù)據(jù)的發(fā)展歷程,介紹了中國(guó)科學(xué)院科學(xué)數(shù)據(jù)資源管理、技術(shù)和服務(wù)體系,以及在科學(xué)數(shù)據(jù)出版、科學(xué)數(shù)據(jù)存儲(chǔ)庫(kù)和唯一標(biāo)識(shí)服務(wù)平臺(tái)方面所做的新嘗試。
1.4? ? 科學(xué)數(shù)據(jù)出版成為科學(xué)界的共識(shí)和趨勢(shì)
科學(xué)數(shù)據(jù)出版是開放出版領(lǐng)域一個(gè)相對(duì)新興的議題,數(shù)據(jù)出版一方面可以保障科學(xué)數(shù)據(jù)共享者(提供者)的信譽(yù)和權(quán)益,解決數(shù)據(jù)知識(shí)產(chǎn)權(quán)問(wèn)題,提高研究人員共享科學(xué)數(shù)據(jù)的積極性;另一方面也便于科學(xué)數(shù)據(jù)使用者查找和利用數(shù)據(jù),提高數(shù)據(jù)的可用性和復(fù)用性。此外,隨著科學(xué)數(shù)據(jù)引用的發(fā)展和規(guī)范,利用論文和科學(xué)數(shù)據(jù)之間建立起來(lái)的引用關(guān)聯(lián)關(guān)系,可以幫助學(xué)科領(lǐng)域進(jìn)行知識(shí)發(fā)現(xiàn),提高科學(xué)數(shù)據(jù)的使用價(jià)值。目前,《Nature》和PLoS等期刊或出版機(jī)構(gòu)都要求其作者在提交論文的同時(shí),還必須提交研究成果相關(guān)的科學(xué)數(shù)據(jù)或數(shù)據(jù)可用性聲明,以方便讀者和科研人員獲取和重用論文的科學(xué)數(shù)據(jù),加快科學(xué)研究進(jìn)程。數(shù)據(jù)出版的探索和成功實(shí)踐,充分說(shuō)明了科學(xué)界對(duì)科學(xué)數(shù)據(jù)出版的高度認(rèn)可,科學(xué)數(shù)據(jù)出版成為科學(xué)大數(shù)據(jù)發(fā)展趨勢(shì)之一。
從數(shù)據(jù)出版的生命周期來(lái)看,數(shù)據(jù)出版的關(guān)鍵問(wèn)題在于數(shù)據(jù)標(biāo)識(shí)和數(shù)據(jù)引用。目前,數(shù)據(jù)出版中應(yīng)用較多的數(shù)據(jù)標(biāo)識(shí)包括數(shù)字對(duì)象標(biāo)識(shí)符(DOI)、開放鏈接(OpenURL)、統(tǒng)一資源名稱(URN)等,其中以DOI的研究和應(yīng)用較為廣泛。科學(xué)數(shù)據(jù)出版所需的DOI通常由注冊(cè)代理機(jī)構(gòu)及其成員單位負(fù)責(zé)分配,目前共有歐盟出版辦公室(OPOCE)、中國(guó)知網(wǎng)(CNKI)、DataCite等10個(gè)代理機(jī)構(gòu)負(fù)責(zé)DOI注冊(cè)和分配。數(shù)據(jù)引用也是科學(xué)數(shù)據(jù)出版的關(guān)鍵環(huán)節(jié),當(dāng)前關(guān)注的焦點(diǎn)主要集中于引用標(biāo)準(zhǔn)、引用技術(shù)和引用行為等問(wèn)題,但科學(xué)數(shù)據(jù)引用尚無(wú)一致的標(biāo)準(zhǔn),不同數(shù)據(jù)庫(kù)、不同學(xué)科領(lǐng)域的差異較大。其中,以哈佛大學(xué)提出的“定量數(shù)據(jù)學(xué)術(shù)引用的建議標(biāo)準(zhǔn)”、FORCE11等團(tuán)體聯(lián)合發(fā)布的“數(shù)據(jù)引用原則聯(lián)合聲明”、DataCite發(fā)布的“研究數(shù)據(jù)出版與引用元數(shù)據(jù)方案”為主要標(biāo)準(zhǔn)和原則[7]。
面向多學(xué)科領(lǐng)域科學(xué)數(shù)據(jù)出版的期刊——《中國(guó)科學(xué)數(shù)據(jù)》,是我國(guó)在科學(xué)數(shù)據(jù)出版方面的具體實(shí)踐。期刊要求作者在投稿時(shí)提交論文相關(guān)的數(shù)據(jù)集,并將論文和數(shù)據(jù)集通過(guò)DOI實(shí)現(xiàn)關(guān)聯(lián),同時(shí)通過(guò)同行評(píng)議來(lái)保證數(shù)據(jù)質(zhì)量。在加強(qiáng)我國(guó)科學(xué)數(shù)據(jù)出版方面,當(dāng)前要結(jié)合我國(guó)科學(xué)數(shù)據(jù)開放共享的進(jìn)程,建立和推廣標(biāo)準(zhǔn)的科學(xué)數(shù)據(jù)出版流程體系,開發(fā)期刊出版和科學(xué)數(shù)據(jù)存儲(chǔ)關(guān)聯(lián)融合平臺(tái),推動(dòng)我國(guó)科學(xué)數(shù)據(jù)出版的健康發(fā)展。
2? ?數(shù)字圖書館在科學(xué)數(shù)據(jù)領(lǐng)域的定位與挑戰(zhàn)
由科學(xué)數(shù)據(jù)領(lǐng)域的快速發(fā)展態(tài)勢(shì)和趨勢(shì)可以看出,數(shù)據(jù)已經(jīng)不折不扣地成為科技創(chuàng)新、商業(yè)發(fā)展、社會(huì)管理、政府治理、社交網(wǎng)絡(luò)的戰(zhàn)略性資源,而科學(xué)大數(shù)據(jù)日益成為科技領(lǐng)域創(chuàng)新競(jìng)爭(zhēng)的關(guān)鍵戰(zhàn)略科技資源??梢院敛恢M言地說(shuō),科技強(qiáng),則國(guó)家強(qiáng);而數(shù)據(jù)強(qiáng),則科技強(qiáng)。未來(lái),真正是“得數(shù)據(jù)者得天下”。但隨著科技創(chuàng)新跨越發(fā)展,科技數(shù)據(jù)大量產(chǎn)生,致使科技大數(shù)據(jù)體系的有效管理、高效服務(wù)、深度應(yīng)用等成為國(guó)家和科技界面臨的重大挑戰(zhàn)。圖書館作為專業(yè)知識(shí)管理與服務(wù)機(jī)構(gòu),管理和服務(wù)科學(xué)大數(shù)據(jù)這類新型知識(shí)體系,也應(yīng)當(dāng)成為其戰(zhàn)略新使命。但圖書館囿于其傳統(tǒng)理念、定位和社會(huì)角色,目前對(duì)數(shù)據(jù)的管理與服務(wù),涉及層次是比較淺顯和局限的。圖書館在未來(lái)能不能抓住“科學(xué)數(shù)據(jù)管理、分析與服務(wù)”這樣一個(gè)全新的、更為廣闊的知識(shí)管理發(fā)展方向,直接決定圖書館這一類知識(shí)管理與服務(wù)機(jī)構(gòu)的興旺發(fā)達(dá)、生死存亡。
圖書館如果要實(shí)現(xiàn)集成管理和組織這些紛繁復(fù)雜的開放科學(xué)數(shù)據(jù)并提供數(shù)據(jù)分析服務(wù),就必須科學(xué)地遵循科學(xué)數(shù)據(jù)的生命周期規(guī)律,提供“用戶需求導(dǎo)向”的數(shù)據(jù)內(nèi)容管理、“科學(xué)問(wèn)題導(dǎo)向”的科學(xué)數(shù)據(jù)分析、“決策目標(biāo)導(dǎo)向”的科學(xué)數(shù)據(jù)服務(wù)和“技術(shù)為王導(dǎo)向”的優(yōu)質(zhì)高效服務(wù)。
2.1? ? 科學(xué)數(shù)據(jù)生命周期模型
科學(xué)數(shù)據(jù)貫穿于科研活動(dòng)的全過(guò)程,圖書館的科學(xué)數(shù)據(jù)服務(wù)只有融入到用戶的科研全過(guò)程中才能體現(xiàn)圖書館的價(jià)值,重塑圖書館的新型服務(wù)能力。伴隨著科研全過(guò)程,科學(xué)數(shù)據(jù)的生命周期通常是指從數(shù)據(jù)產(chǎn)生、處理加工、出版發(fā)布到再利用的往復(fù)循環(huán)流程。據(jù)統(tǒng)計(jì),目前科學(xué)數(shù)據(jù)生命周期模型已超過(guò)40種[8],包括英國(guó)數(shù)字監(jiān)管中心(DCC)提出的監(jiān)管生命周期模型、美國(guó)密歇根大學(xué)ICPSR數(shù)據(jù)中心提出的科學(xué)數(shù)據(jù)生命周期模型、英國(guó)數(shù)據(jù)歸檔中心(UKDA)提出的數(shù)據(jù)生命周期模型等。
盡管各個(gè)模型將科學(xué)數(shù)據(jù)生命周期劃分成不同的階段,但是經(jīng)過(guò)歸納總結(jié)共性階段,并結(jié)合圖書館數(shù)據(jù)服務(wù)的經(jīng)驗(yàn)和特點(diǎn),科學(xué)數(shù)據(jù)生命周期可以分為數(shù)據(jù)產(chǎn)生、數(shù)據(jù)收集、數(shù)據(jù)處理和分析、數(shù)據(jù)共享和出版、數(shù)據(jù)利用等5個(gè)階段,而數(shù)據(jù)存儲(chǔ)則貫穿于整個(gè)科學(xué)數(shù)據(jù)生命周期。圍繞科學(xué)數(shù)據(jù)生命周期,并結(jié)合圖書館自身的特點(diǎn)和經(jīng)驗(yàn),圖書館要開展科學(xué)數(shù)據(jù)服務(wù)可以圍繞數(shù)據(jù)內(nèi)容管理、科學(xué)數(shù)據(jù)分析、科學(xué)數(shù)據(jù)服務(wù)等展開,并堅(jiān)持以數(shù)字信息技術(shù)為優(yōu)質(zhì)高效服務(wù)的核心保障。
數(shù)據(jù)內(nèi)容管理服務(wù)主要在科學(xué)數(shù)據(jù)產(chǎn)生和收集階段開展,圖書館可提供的服務(wù)包括數(shù)據(jù)規(guī)劃和數(shù)據(jù)咨詢等??茖W(xué)數(shù)據(jù)分析服務(wù)主要在數(shù)據(jù)處理和分析階段開展,圖書館可提供的服務(wù)包括數(shù)據(jù)組織和加工、數(shù)據(jù)分析和知識(shí)發(fā)現(xiàn)等。科學(xué)數(shù)據(jù)服務(wù)主要在數(shù)據(jù)共享和出版、數(shù)據(jù)利用階段開展,圖書館可提供的服務(wù)包括數(shù)據(jù)共享服務(wù)、數(shù)據(jù)利用和培訓(xùn)服務(wù)等。而這一切服務(wù)全部建立在數(shù)據(jù)存儲(chǔ)服務(wù)和信息技術(shù)保障的基礎(chǔ)之上。
2.2? ? “用戶需求導(dǎo)向”的數(shù)據(jù)內(nèi)容管理
數(shù)據(jù)規(guī)劃是一切科學(xué)數(shù)據(jù)服務(wù)的基礎(chǔ),科學(xué)數(shù)據(jù)規(guī)劃不但使得科研人員在生產(chǎn)、保存和利用科學(xué)數(shù)據(jù)時(shí)有章可循,也能保證數(shù)據(jù)的一致、準(zhǔn)確和可追溯性。如美國(guó)麻省理工學(xué)院圖書館在科學(xué)數(shù)據(jù)項(xiàng)目開始階段提供數(shù)據(jù)規(guī)劃服務(wù),參與并建議科研人員使用數(shù)據(jù)管理計(jì)劃工具DMPTool來(lái)制定數(shù)據(jù)管理計(jì)劃[9],解決用戶在政策要求和資源查找方面的問(wèn)題。主要的服務(wù)包括:提供資助機(jī)構(gòu)數(shù)據(jù)管理政策和數(shù)據(jù)收集分析方面的指南、數(shù)據(jù)訪問(wèn)和安全政策的選取指導(dǎo)、數(shù)據(jù)管理評(píng)估計(jì)劃等。
數(shù)據(jù)咨詢建立在圖書館參考咨詢服務(wù)體系之上,目前主要通過(guò)專業(yè)學(xué)科館員團(tuán)隊(duì)嵌入科學(xué)數(shù)據(jù)全生命周期的相關(guān)活動(dòng)中,為科學(xué)數(shù)據(jù)發(fā)布者和使用者提供各種問(wèn)題咨詢,咨詢方式主要通過(guò)傳統(tǒng)參考咨詢所采用的面談、郵件或社交軟件等方式進(jìn)行。然而相比于傳統(tǒng)參考咨詢,科學(xué)數(shù)據(jù)的咨詢服務(wù)要求學(xué)科館員擁有較深的學(xué)科背景知識(shí),用戶往往容易對(duì)咨詢的精準(zhǔn)性和權(quán)威性產(chǎn)生疑問(wèn)。為解決這個(gè)問(wèn)題,很多圖書館開始構(gòu)建更加開放的科學(xué)社區(qū),邀請(qǐng)學(xué)科領(lǐng)域?qū)<夜餐瑓⑴c解答用戶問(wèn)題。如美國(guó)弗吉尼亞大學(xué)圖書館成立了專門的科學(xué)數(shù)據(jù)咨詢組(SciDaC Group),咨詢組通過(guò)Lib Guides系統(tǒng)從科研項(xiàng)目的數(shù)據(jù)生命周期考慮來(lái)幫助用戶做出決策,目的是使得用戶數(shù)據(jù)管理變得更為容易,以便提高用戶分享和使用數(shù)據(jù)的積極性。
科學(xué)數(shù)據(jù)的價(jià)值不是與生俱來(lái)的,而是在其生命周期過(guò)程中逐步體現(xiàn)出來(lái)的,其自身價(jià)值在于對(duì)其利用的水平以及利用過(guò)程中創(chuàng)造出來(lái)的價(jià)值,沒有被開發(fā)和利用的數(shù)據(jù)是毫無(wú)價(jià)值的。因此,科學(xué)數(shù)據(jù)資源的建設(shè)不能再簡(jiǎn)單地按照?qǐng)D書館的主觀意愿,而應(yīng)該以用戶需求作為導(dǎo)向,針對(duì)當(dāng)前國(guó)家經(jīng)濟(jì)社會(huì)發(fā)展和科研機(jī)構(gòu)發(fā)展的需要,有針對(duì)性地收集、組織和加工科學(xué)數(shù)據(jù)資源。圖書館可以依靠數(shù)據(jù)規(guī)劃和數(shù)據(jù)咨詢作為主要手段,在科學(xué)數(shù)據(jù)資源建設(shè)初期嵌入到相應(yīng)科技領(lǐng)域的科研活動(dòng)中,基于用戶的數(shù)據(jù)管理需求開展數(shù)據(jù)內(nèi)容管理,用戶需求導(dǎo)向應(yīng)成為數(shù)據(jù)內(nèi)容管理的根本原則。
2.3? ? “科學(xué)問(wèn)題導(dǎo)向”的科學(xué)數(shù)據(jù)分析
數(shù)據(jù)組織和加工包括對(duì)數(shù)據(jù)的組織、加工和關(guān)聯(lián)等,傳統(tǒng)圖書館資源組織加工主要是將文獻(xiàn)資源這類“粗顆?!钡闹R(shí)單元進(jìn)行數(shù)字化、網(wǎng)絡(luò)化、體系化和語(yǔ)義化的處理。傳統(tǒng)文獻(xiàn)資源往往來(lái)自于科研成果的最終產(chǎn)出,具有較為規(guī)范和結(jié)構(gòu)化的格式和標(biāo)準(zhǔn)。而科學(xué)數(shù)據(jù)可能來(lái)自于科研過(guò)程的各個(gè)階段,具有類型眾多、形式各異、學(xué)科差異明顯等特點(diǎn),特別是科學(xué)數(shù)據(jù)是“細(xì)顆?!钡闹R(shí)單元,給數(shù)據(jù)組織和加工工作提出了更高更細(xì)致的要求。如斯坦福大學(xué)圖書館就利用元數(shù)據(jù)、RDF和OWL等技術(shù),幫助用戶進(jìn)行科學(xué)數(shù)據(jù)組織和加工工作。
數(shù)據(jù)分析和知識(shí)發(fā)現(xiàn)是指通過(guò)各種技術(shù)手段從海量數(shù)據(jù)中提煉出潛在的、有價(jià)值的信息和知識(shí),重點(diǎn)是基于大數(shù)據(jù)分析各種關(guān)聯(lián)關(guān)系和演化規(guī)律,所謂知識(shí)發(fā)現(xiàn)即找出隱含在大數(shù)據(jù)中的知識(shí)關(guān)系,是目前解決海量數(shù)據(jù)陷阱的有效手段??茖W(xué)數(shù)據(jù)通過(guò)數(shù)據(jù)分析和知識(shí)發(fā)現(xiàn),可以達(dá)到科學(xué)數(shù)據(jù)深度揭示和數(shù)據(jù)增值的目的。如普林斯頓大學(xué)圖書館推出的數(shù)據(jù)與統(tǒng)計(jì)服務(wù)(DSS)[10],一方面可以為研究人員提供案例分析、實(shí)驗(yàn)數(shù)據(jù)等科學(xué)數(shù)據(jù),另一方面還可以幫助研究人員利用Stata、SPSS等統(tǒng)計(jì)軟件進(jìn)行數(shù)據(jù)統(tǒng)計(jì)分析,為全校師生在科學(xué)數(shù)據(jù)的定量分析方面提供數(shù)據(jù)和軟件支持。
科學(xué)數(shù)據(jù)分析是科學(xué)數(shù)據(jù)生命周期中的重要一環(huán),是展現(xiàn)和提高科學(xué)數(shù)據(jù)價(jià)值的關(guān)鍵手段,也是圖書館參與科研項(xiàng)目層次深淺的直接體現(xiàn)。由于當(dāng)前科學(xué)數(shù)據(jù)的類型復(fù)雜、分析手段千變?nèi)f化、技術(shù)方法日新月異,不可能利用單一手段方法來(lái)完成不同領(lǐng)域的科學(xué)數(shù)據(jù)分析。因此,科學(xué)數(shù)據(jù)的分析工作,要堅(jiān)持以科學(xué)問(wèn)題為導(dǎo)向,從專業(yè)學(xué)科領(lǐng)域背景出發(fā),科學(xué)地選擇數(shù)據(jù)分析手段和軟件工具,才能針對(duì)性地解決不同領(lǐng)域特定問(wèn)題的科學(xué)數(shù)據(jù)分析問(wèn)題的需求。因此,科學(xué)問(wèn)題導(dǎo)向是科學(xué)數(shù)據(jù)分析的根本原則。
2.4? ? “決策目標(biāo)導(dǎo)向”的科學(xué)數(shù)據(jù)服務(wù)
科學(xué)數(shù)據(jù)是服務(wù)于科學(xué)研究、科技發(fā)展等不同層次的決策目標(biāo),科學(xué)數(shù)據(jù)的生命在于共享和重用。數(shù)據(jù)共享和出版是增強(qiáng)科研成果復(fù)用、提升科研數(shù)據(jù)價(jià)值的有效手段,而共享政策和標(biāo)準(zhǔn)規(guī)范對(duì)科學(xué)數(shù)據(jù)共享和出版起著決定性的作用,是影響數(shù)據(jù)共享和出版效果的關(guān)鍵性因素。美國(guó)埃默里大學(xué)圖書館為用戶提供了全面的科學(xué)數(shù)據(jù)共享與出版服務(wù),其中就包括科學(xué)數(shù)據(jù)資助政策咨詢、科學(xué)數(shù)據(jù)引用規(guī)范檢索和科學(xué)數(shù)據(jù)出版相關(guān)服務(wù),可以幫助用戶了解相關(guān)政策法規(guī)和標(biāo)準(zhǔn)規(guī)范,最終完成科學(xué)數(shù)據(jù)共享和出版。
數(shù)據(jù)利用和培訓(xùn)是加強(qiáng)科研人員數(shù)據(jù)管理技能、提高數(shù)據(jù)素養(yǎng)的重要途徑。培訓(xùn)包括主題研討班、培訓(xùn)課以及在線教育等多種形式,內(nèi)容涵蓋科學(xué)數(shù)據(jù)管理的基本知識(shí)、科學(xué)數(shù)據(jù)共享和使用方法、科學(xué)數(shù)據(jù)分析工具軟件使用等。如美國(guó)伊利諾伊大學(xué)香檳分校圖書館就定期舉辦科學(xué)數(shù)據(jù)培訓(xùn),除此之外,學(xué)校還進(jìn)行數(shù)據(jù)管理碩士培養(yǎng),通過(guò)系統(tǒng)的課程學(xué)習(xí)和大量的實(shí)習(xí)機(jī)會(huì),培養(yǎng)科學(xué)數(shù)據(jù)管理的專業(yè)型人才。
科學(xué)數(shù)據(jù)服務(wù)是科學(xué)數(shù)據(jù)生命周期的最終環(huán)節(jié),圖書館由于其知識(shí)服務(wù)和知識(shí)擴(kuò)散傳播的傳統(tǒng)優(yōu)勢(shì)能力,在科學(xué)數(shù)據(jù)服務(wù)上無(wú)疑具有巨大優(yōu)勢(shì)。圖書館要充分借鑒和吸納過(guò)往數(shù)據(jù)服務(wù)的成功經(jīng)驗(yàn),充分把握和發(fā)揮自身在數(shù)據(jù)服務(wù)方面的優(yōu)勢(shì),以科學(xué)研究、科技發(fā)展等各類決策目標(biāo)為導(dǎo)向,解決科學(xué)家和科學(xué)研究的“數(shù)據(jù)痛點(diǎn)”。尋求與其他機(jī)構(gòu)、部門的合作機(jī)會(huì)并建立專業(yè)型科學(xué)數(shù)據(jù)服務(wù)與培訓(xùn)團(tuán)隊(duì),促進(jìn)科學(xué)數(shù)據(jù)的全面開放共享,更好地服務(wù)于科研人員和科研活動(dòng)。
2.5? ? “技術(shù)為王導(dǎo)向”的優(yōu)質(zhì)高效服務(wù)
大數(shù)據(jù)服務(wù)要求高效率。數(shù)字信息技術(shù)的發(fā)展為科學(xué)數(shù)據(jù)的管理和共享服務(wù)提供了強(qiáng)大的支撐和手段,充分利用云計(jì)算、大數(shù)據(jù)等技術(shù),通過(guò)整合數(shù)據(jù)資源、設(shè)施與服務(wù),不斷推動(dòng)服務(wù)創(chuàng)新,是提供優(yōu)質(zhì)高效科學(xué)數(shù)據(jù)服務(wù)的關(guān)鍵。另外,很多新興技術(shù)也對(duì)加強(qiáng)科學(xué)數(shù)據(jù)開放共享、提高科學(xué)數(shù)據(jù)服務(wù)效率起到了助推作用。
在科學(xué)數(shù)據(jù)管理層面,區(qū)塊鏈技術(shù)的誕生,為科學(xué)數(shù)據(jù)傳輸和共享安全提供了新的強(qiáng)大的解決方案。通過(guò)加密算法、共識(shí)機(jī)制和溯源等技術(shù),可以保障數(shù)據(jù)的質(zhì)量和安全性。去中心化存儲(chǔ)和通信方式,可以大幅提升科學(xué)數(shù)據(jù)的共享效率??尚糯鎯?chǔ)的發(fā)展為科學(xué)數(shù)據(jù)安全保護(hù)和高效管理提供了另一條發(fā)展路徑,徹底杜絕了數(shù)據(jù)私自篡改和刪除的可能性,并且在分布式部署和存儲(chǔ)性能方面更為優(yōu)秀。
在科學(xué)數(shù)據(jù)分析層面,實(shí)時(shí)分析技術(shù)的發(fā)展,為海量科學(xué)數(shù)據(jù)及時(shí)高效地處理提供了可能。以天文領(lǐng)域地面廣角相機(jī)陣(GWAC)全天短時(shí)標(biāo)觀測(cè)系統(tǒng)為例,15s的采樣和處理周期對(duì)數(shù)據(jù)管理系統(tǒng)提出了諸多要求,包括多鏡頭數(shù)據(jù)交叉認(rèn)證、數(shù)據(jù)持久化、實(shí)時(shí)瞬變?cè)窗l(fā)現(xiàn)以及數(shù)據(jù)實(shí)時(shí)查詢等。最終,通過(guò)大規(guī)模并行處理技術(shù)(MPP)和基于流式內(nèi)存數(shù)據(jù)的數(shù)據(jù)流查詢處理技術(shù),實(shí)現(xiàn)了科學(xué)大數(shù)據(jù)實(shí)時(shí)存儲(chǔ)、分析和秒級(jí)查詢響應(yīng)[11]。
在過(guò)去的20年發(fā)展中,圖書館已經(jīng)建立數(shù)字圖書館知識(shí)服務(wù)體系,未來(lái)要提供優(yōu)質(zhì)高效的科學(xué)數(shù)據(jù)服務(wù),必須樹立“技術(shù)為王”導(dǎo)向和強(qiáng)烈意識(shí),用新技術(shù)應(yīng)對(duì)大數(shù)據(jù),充分利用機(jī)器智能、語(yǔ)義分析、計(jì)算平臺(tái)等的前沿技術(shù)。不但要建設(shè)自身的信息技術(shù)團(tuán)隊(duì),還要挖掘和依靠外部的技術(shù)力量,多方參與共同推進(jìn)圖書館科學(xué)數(shù)據(jù)服務(wù)的技術(shù)升級(jí)和效率提升。
3? ?新技術(shù)對(duì)圖書館核心業(yè)務(wù)體系的影響
3.1? ? 5G技術(shù)與智慧圖書館
2019年被視為5G技術(shù)元年,一個(gè)萬(wàn)物互聯(lián)的時(shí)代即將到來(lái)。面對(duì)這場(chǎng)深刻影響未來(lái)5-10年的技術(shù)變革,各行各業(yè)早已蓄勢(shì)待發(fā),而圖書館行業(yè)能否抓住這樣一個(gè)新的機(jī)遇,推進(jìn)智慧圖書館的建設(shè),將成為圖書館(文獻(xiàn)情報(bào)機(jī)構(gòu))未來(lái)發(fā)展成敗的分水嶺。
上海圖書館劉煒研究員在此次研討班上從5G技術(shù)和智慧圖書館的概念出發(fā),指出5G技術(shù)將成為智慧圖書館建設(shè)最重要的基礎(chǔ)性技術(shù),將為智慧圖書館提供超高速多媒體應(yīng)用、智能樓宇空間服務(wù)和低延時(shí)高可靠應(yīng)用。結(jié)合圖書館業(yè)務(wù)的未來(lái)發(fā)展需求,梳理細(xì)化出了十個(gè)應(yīng)用場(chǎng)景,包括:無(wú)感借閱、導(dǎo)覽導(dǎo)航、超清全景互動(dòng)直播、智慧書房、智慧場(chǎng)館、云課堂、精準(zhǔn)推送、機(jī)器人服務(wù)、智能安防監(jiān)控和區(qū)域聯(lián)盟服務(wù)協(xié)同等。劉煒還介紹了支持5G技術(shù)的智慧圖書館服務(wù)平臺(tái)FOLIO,認(rèn)為5G技術(shù)的綜合能力將有效地保障該平臺(tái)具有的開放性和幾乎無(wú)限的擴(kuò)展性,也支持了FOLIO的商務(wù)模式和創(chuàng)新潛能。認(rèn)為應(yīng)該加速中文版FOLIO的研發(fā)和應(yīng)用,充分利用5G技術(shù),盡早實(shí)現(xiàn)智慧圖書館的建設(shè),向讀者提供全方位的智慧知識(shí)服務(wù)。
未來(lái)是一個(gè)數(shù)據(jù)與計(jì)算的時(shí)代,5G技術(shù)將給圖書館等各類知識(shí)服務(wù)機(jī)構(gòu)帶來(lái)翻天覆地的變化。5G時(shí)代,各機(jī)構(gòu)、業(yè)務(wù)、方法、理念之間的邊界將會(huì)模糊化,跨界和融合將無(wú)處不在,甚至行業(yè)、機(jī)構(gòu)間的相互替代也都成為可能。圖書館要想生存和發(fā)展,首先要實(shí)現(xiàn)自我革命,不受傳統(tǒng)“圖書館”理念、物理空間和傳統(tǒng)業(yè)務(wù)體系的束縛,不忘“知識(shí)管理”初心,牢記“知識(shí)服務(wù)”使命,創(chuàng)造新類型的、更加高層次的、知識(shí)密集型的新型知識(shí)服務(wù)。
3.2? ? 數(shù)字人文研究與圖書館數(shù)字人文服務(wù)
將數(shù)字技術(shù)與人文學(xué)科研究相結(jié)合的“數(shù)字人文”研究與服務(wù)也是數(shù)字圖書館近年來(lái)的熱點(diǎn)話題。目前,全球很多高校和圖書館都建立了數(shù)字人文研究中心,包括我國(guó)的上海圖書館、北京大學(xué)、武漢大學(xué)等。
上海圖書館夏翠娟研究員在此次研討班上介紹了數(shù)字人文開放數(shù)據(jù)平臺(tái)的發(fā)展概況,并對(duì)上海圖書館家譜數(shù)字人文平臺(tái)進(jìn)行了深入介紹,從需求分析、本體設(shè)計(jì)、數(shù)據(jù)清洗、RDF數(shù)據(jù)轉(zhuǎn)換一直到數(shù)據(jù)發(fā)布的平臺(tái)完整構(gòu)建過(guò)程,并審視了平臺(tái)的技術(shù)方法、領(lǐng)域應(yīng)用以及場(chǎng)景導(dǎo)向。最后以“湖廣填四川,麻城占一半”移民記憶的數(shù)據(jù)化為例,介紹了如何利用家譜平臺(tái)的數(shù)據(jù)來(lái)實(shí)現(xiàn)人文場(chǎng)景到數(shù)據(jù)可視化的全過(guò)程。
上海圖書館陳濤博士在此次研討班上介紹了國(guó)際圖像互操作框架(IIIF),IIIF是一組針對(duì)數(shù)字圖像資源互操作功能而制定的共享API規(guī)范。利用IIIF技術(shù),可以突破圖書館自身資源限制,實(shí)現(xiàn)和其他館藏機(jī)構(gòu)之間圖像資源的互操作。陳濤還介紹了圍繞IIIF建設(shè)特藏資源語(yǔ)義化空間的構(gòu)想,包括對(duì)圖像資源的數(shù)字化重組、數(shù)據(jù)化識(shí)別、語(yǔ)義化標(biāo)注和智慧化關(guān)聯(lián),他認(rèn)為關(guān)聯(lián)數(shù)據(jù)、IIIF和人工智能技術(shù)的結(jié)合將開啟數(shù)字人文研究的新時(shí)代。目前,除上海圖書館家譜、古籍和印章知識(shí)庫(kù)使用IIIF以外,華東師范大學(xué)書畫印本數(shù)據(jù)庫(kù)、復(fù)旦大學(xué)印譜數(shù)據(jù)庫(kù)都基于IIIF在開展研究和平臺(tái)建設(shè)。
美國(guó)加州大學(xué)伯克利分校東亞圖書館林海青在此次研討班上以梵高自畫像分析為案例,談到數(shù)字化與數(shù)字人文的關(guān)系。他認(rèn)為,資源的數(shù)字化本身不足以支撐數(shù)字人文研究,只有將數(shù)字資源對(duì)象化成為數(shù)字對(duì)象,數(shù)字資源才能成為數(shù)字人文的研究對(duì)象。
數(shù)字人文研究與服務(wù)是新時(shí)期數(shù)字圖書館建設(shè)發(fā)展的重要趨勢(shì)之一,在開放數(shù)據(jù)時(shí)代,有著規(guī)范化、標(biāo)準(zhǔn)化結(jié)構(gòu)和語(yǔ)義的數(shù)據(jù)將是圖書館為研究人員提供數(shù)字人文服務(wù)的基礎(chǔ),數(shù)字人文研究與服務(wù)豐富了圖書館知識(shí)服務(wù)的內(nèi)涵,也推動(dòng)了人文學(xué)科的發(fā)展和傳播。
3.3? ? 關(guān)聯(lián)數(shù)據(jù)與圖書館數(shù)據(jù)開放
關(guān)聯(lián)數(shù)據(jù)是一種輕量級(jí)的用于資源整合的語(yǔ)義網(wǎng)技術(shù),它通過(guò)統(tǒng)一的標(biāo)準(zhǔn)將非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù),并通過(guò)RDF實(shí)現(xiàn)這些異構(gòu)分散資源的語(yǔ)義化描述。關(guān)聯(lián)數(shù)據(jù)可以很好地解決圖書館部分資源數(shù)據(jù)孤島的問(wèn)題,提高資源利用率和服務(wù)效果。
中國(guó)農(nóng)業(yè)科學(xué)院國(guó)家農(nóng)業(yè)圖書館李嬌在此次研討班上認(rèn)為統(tǒng)一標(biāo)準(zhǔn)的關(guān)聯(lián)數(shù)據(jù)是語(yǔ)義化和知識(shí)發(fā)現(xiàn)的重要基礎(chǔ),并分享了國(guó)家農(nóng)業(yè)圖書館在關(guān)聯(lián)數(shù)據(jù)和知識(shí)發(fā)現(xiàn)服務(wù)方面所做的相關(guān)工作。為適應(yīng)大數(shù)據(jù)環(huán)境下個(gè)性化知識(shí)服務(wù)的用戶需求,國(guó)家農(nóng)業(yè)圖書館通過(guò)綜合應(yīng)用元數(shù)據(jù)、本體和關(guān)聯(lián)數(shù)據(jù)等技術(shù),對(duì)國(guó)家農(nóng)業(yè)圖書館各類科技文獻(xiàn)、科學(xué)數(shù)據(jù)、規(guī)范庫(kù)、情報(bào)資源等多源異構(gòu)資源開展關(guān)聯(lián)融匯和知識(shí)組織。通過(guò)建立統(tǒng)一的元數(shù)據(jù)描述標(biāo)準(zhǔn)規(guī)范,并綜合應(yīng)用主題詞表和本體模型,對(duì)各類數(shù)字資源進(jìn)行規(guī)范描述、分類標(biāo)引,實(shí)體抽取、歧義消除和多維度語(yǔ)義關(guān)聯(lián),最終將各類資源發(fā)布為包含語(yǔ)義關(guān)聯(lián)關(guān)系的數(shù)據(jù)和知識(shí)網(wǎng)絡(luò),實(shí)現(xiàn)了農(nóng)業(yè)領(lǐng)域綜合數(shù)字資源的知識(shí)發(fā)現(xiàn)和知識(shí)服務(wù)[12]。
在數(shù)據(jù)數(shù)量和類型紛繁復(fù)雜的大數(shù)據(jù)環(huán)境下,圖書館的信息資源愈發(fā)難以被用戶發(fā)現(xiàn)和使用。關(guān)聯(lián)數(shù)據(jù)為圖書館打開了一扇數(shù)據(jù)開放的大門,利用關(guān)聯(lián)數(shù)據(jù)建立良好的數(shù)據(jù)共享和保障機(jī)制,可以擴(kuò)大圖書館資源利用范圍和使用群體,大大提升圖書館在未來(lái)科學(xué)數(shù)據(jù)環(huán)境中的作用與地位。
3.4? ? 人工智能與圖書館知識(shí)服務(wù)
大數(shù)據(jù)、云計(jì)算、人工智能等技術(shù)的發(fā)展給科研工作提供了新的機(jī)遇和無(wú)限可能,也對(duì)圖書館知識(shí)服務(wù)模式產(chǎn)生了巨大沖擊。目前,圖書館在知識(shí)組織與管理、智能搜索、智能問(wèn)答、智能決策方面已開展了大量研究。
中科院文獻(xiàn)情報(bào)中心錢力研究員在此次研討班上認(rèn)為機(jī)器智能正在改變我們理解知識(shí)的模式,需要加速智慧情報(bào)服務(wù)的形成。中科院文獻(xiàn)情報(bào)中心在圖書館與人工智能結(jié)合服務(wù)創(chuàng)新方面做了大量嘗試和具體應(yīng)用,包括面向科技論文的科研指紋智能識(shí)別、機(jī)構(gòu)與學(xué)者名稱智能規(guī)范、學(xué)術(shù)論文內(nèi)容與格式智能核查等。面向科技論文的科研指紋智能識(shí)別主要基于“預(yù)訓(xùn)練+微調(diào)”模式的自然語(yǔ)言處理(NLP)預(yù)訓(xùn)練模型對(duì)科技論文中的九種指紋特征進(jìn)行智能識(shí)別和提取,包括研究背景、目的、方法、工具、結(jié)論等,在海量論文數(shù)據(jù)中進(jìn)行知識(shí)發(fā)現(xiàn)。機(jī)構(gòu)與學(xué)者名稱智能規(guī)范首先基于融合深度學(xué)習(xí)和字符編輯距離解決機(jī)構(gòu)名稱匹配問(wèn)題,再通過(guò)多角度作者實(shí)體屬性相似度匹配解決學(xué)者名稱匹配問(wèn)題,用于解決機(jī)構(gòu)和學(xué)者名稱消歧問(wèn)題。
人工智能帶來(lái)的不僅僅是技術(shù)上的革新,更是思維和服務(wù)上的革新。人工智能將推動(dòng)未來(lái)圖書館服務(wù)的升級(jí)發(fā)展,更加趨向于個(gè)性化、智能化、高效化。其次,人工智能技術(shù)將徹底解放人力,圖書館(文獻(xiàn)情報(bào)機(jī)構(gòu))傳統(tǒng)業(yè)務(wù)將由智能機(jī)器所代替。未來(lái)的所謂圖書館員,將升級(jí)成為新型知識(shí)管理服務(wù)人員,主要包括三個(gè)序列:數(shù)據(jù)管理序列(數(shù)據(jù)館員、數(shù)據(jù)科學(xué)家等);技術(shù)應(yīng)用序列(數(shù)據(jù)管理技術(shù)開發(fā)與應(yīng)用專家);數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)序列(數(shù)據(jù)分析師、知識(shí)分析師、戰(zhàn)略研究專家等)。
4? ?總結(jié)與展望
第16屆“數(shù)字圖書館前沿問(wèn)題高級(jí)研討班”主題重大、內(nèi)涵宏闊,聚焦當(dāng)今時(shí)代的熱點(diǎn)問(wèn)題“數(shù)據(jù)”。內(nèi)容涉及開放科學(xué)、開放數(shù)據(jù)、FAIR原則、數(shù)據(jù)管理與分析、數(shù)據(jù)關(guān)聯(lián)、知識(shí)圖譜、5G技術(shù)、AI(人工智能)、生物識(shí)別、深度學(xué)習(xí)、智能知識(shí)基礎(chǔ)設(shè)施建設(shè)等。從研討主題可以看出,社會(huì)在進(jìn)行數(shù)字化大轉(zhuǎn)型,各行各業(yè)都必然受到數(shù)字化大轉(zhuǎn)型的沖擊,圖書館和文獻(xiàn)情報(bào)機(jī)構(gòu)也不例外。圖書館、文獻(xiàn)情報(bào)機(jī)構(gòu)作為專業(yè)知識(shí)服務(wù)機(jī)構(gòu),要在未來(lái)的知識(shí)服務(wù)中繼續(xù)發(fā)揮主導(dǎo)作用,要以問(wèn)題和目標(biāo)導(dǎo)向?yàn)樵瓌t,在“需求”和“技術(shù)”兩大動(dòng)力驅(qū)動(dòng)下,深度轉(zhuǎn)型發(fā)展新型核心業(yè)務(wù)體系,重新定義和重塑自我。
大數(shù)據(jù)環(huán)境下數(shù)據(jù)知識(shí)管理與服務(wù)的新需求和新任務(wù),將推動(dòng)未來(lái)圖書館和文獻(xiàn)情報(bào)機(jī)構(gòu)突破一系列的傳統(tǒng)邊界:圖書館物理邊界;內(nèi)容邊界(圖書、文獻(xiàn)、信息、數(shù)據(jù)、智慧等);理論方法與技術(shù)邊界(圖書館學(xué)、情報(bào)學(xué)、信息科學(xué)、數(shù)據(jù)科學(xué)、統(tǒng)計(jì)學(xué)等)。未來(lái)圖書館將發(fā)展成為以智慧知識(shí)服務(wù)為中心、以先進(jìn)信息技術(shù)為支撐、跨多類型傳統(tǒng)機(jī)構(gòu)邊界的、完全新類型的“集成化跨界知識(shí)管理與服務(wù)咨詢機(jī)構(gòu)”,是一種從傳統(tǒng)的、以文獻(xiàn)為中心的管理與服務(wù)機(jī)構(gòu),到全面以數(shù)據(jù)為中心的新型知識(shí)生態(tài)系統(tǒng)的知識(shí)管理與咨詢服務(wù)機(jī)構(gòu)。
這種集成跨界知識(shí)管理與服務(wù)咨詢機(jī)構(gòu)的發(fā)展情景將是“N×Commons/Centers”模式,包括Information Commons/Centers(信息中心)、Data Commons/Centers(數(shù)據(jù)中心)、Learning Commons/Centers(學(xué)習(xí)中心,閱覽室)、Research Commons/Centers(研究中心)、Innovation Commons/Centers(創(chuàng)新中心、創(chuàng)新樞紐)、Incubation Commons/Centers(孵化中心)、Education Commons/Centers(MOOC中心,開放教育中心)、Communication Commons/Centers(科學(xué)交流和傳播中心)、Knowledge-discovery Commons/Centers(知識(shí)發(fā)現(xiàn)中心)、Consultative Commons /Centers(Think Tank,專業(yè)型智庫(kù))、Cinema Commons /Centers(視聽娛樂中心)等。N所代表的具體內(nèi)容,哪個(gè)多一些,哪個(gè)少一些,完全取決于各類型圖書館(文獻(xiàn)情報(bào)機(jī)構(gòu))的個(gè)性化、特色化的新角色、新定位、新功能的拓展。
在“N×Commons/Centers”的跨界知識(shí)管理、知識(shí)服務(wù)、知識(shí)咨詢機(jī)構(gòu)的可能發(fā)展情景下,不要糾結(jié)于為什么圖書館(文獻(xiàn)情報(bào)機(jī)構(gòu))不再像那個(gè)所熟悉的圖書館(文獻(xiàn)情報(bào)機(jī)構(gòu))。而要主動(dòng)考慮、主動(dòng)設(shè)計(jì)、主動(dòng)作為,在“以數(shù)字化知識(shí)為核心”的知識(shí)管理、知識(shí)服務(wù)、知識(shí)咨詢中,我們能做什么知識(shí)管理與服務(wù)工作,就做什么知識(shí)管理與服務(wù)工作;我們需要跨界什么知識(shí)管理與服務(wù)領(lǐng)域,就跨界什么知識(shí)管理與服務(wù)領(lǐng)域;我們需要跨界什么技術(shù)和方法,就跨界什么技術(shù)和方法。只要能做的工作,就抓住機(jī)遇去做。如果目前還不能做的工作,就努力創(chuàng)造條件去做。發(fā)展是永恒的,變化是永恒的,圖書館、文獻(xiàn)情報(bào)機(jī)構(gòu)的知識(shí)服務(wù)必須不斷自我超越。
致謝:本文中某些論述和觀點(diǎn)引自“第十六屆數(shù)字圖書館前沿問(wèn)題高級(jí)研討班”各專家報(bào)告或發(fā)言,由于篇幅有限未能對(duì)專家發(fā)言內(nèi)容一一列出并追溯引用,特此致謝并特別說(shuō)明。報(bào)告專家包括(按報(bào)告先后順序):張曉林、張甲、曾蕾、秦健、鮑曙明、朱強(qiáng)、黨躍武、劉煒、張計(jì)龍、林海青、夏翠娟、陳濤、朱江、邢文明、何佳、余敏、劉敏娟、李嬌、胡良霖、錢力、文奕、吳振新、蔡佳展、范煒等。