馬 昀
(山西師范大學(xué) 圖書館,山西 臨汾 041000)
當(dāng)前,信息化、網(wǎng)絡(luò)化、高科技化的設(shè)施設(shè)備日益增多,源源不斷地生成海量數(shù)據(jù)。圖書館必須采取大數(shù)據(jù)、云計算等先進技術(shù)手段,對大數(shù)據(jù)、圖書信息和文獻資源進行處理、挖掘、分析,以更好地滿足讀者的知識信息需求,助力其學(xué)習(xí)、科研、運用等數(shù)據(jù)生命周期。數(shù)據(jù)共享空間(Data Commons,DC)以快捷簡便、成本更低、效益良好的手段為用戶提供知識服務(wù)。為促進圖書館數(shù)據(jù)管理的效果提升和改善,圖書館DC服務(wù)平臺持續(xù)完善和優(yōu)化數(shù)據(jù)管理、分析、應(yīng)用、共享的機制體制,不斷滿足讀者日益增長的數(shù)據(jù)、知識、信息需求。
Robert L. Grossman等[1]認為,DC是協(xié)助用戶使用和供應(yīng)開放性數(shù)據(jù)的法律性載體,它可定位、存儲數(shù)據(jù),利用各種通用工具進行相關(guān)計算活動。為研究機構(gòu)分析、挖掘、分享數(shù)據(jù)而建成相應(yīng)的網(wǎng)絡(luò)平臺,可互操作能力比較突出。Metro Boston[2]指出,作為一個開放型存儲庫,DC在社交、教育、圖書館、藝術(shù)、醫(yī)療等領(lǐng)域中,提供所轄客戶的豐富數(shù)據(jù)(質(zhì)量控制以及元數(shù)據(jù)),包容用作研究的各種原始數(shù)據(jù)和新數(shù)據(jù),消除非結(jié)構(gòu)化數(shù)據(jù)以及結(jié)構(gòu)化數(shù)據(jù)的不平等,促進數(shù)據(jù)、知識、信息的發(fā)現(xiàn)以及傳播。作為開放式平臺的DC,它為各個方面共享有效數(shù)據(jù)集、信息和知識提供有力載體。它支持元數(shù)據(jù)的開發(fā)、存儲、共享、訪問、搜索、檢索等,協(xié)助創(chuàng)建數(shù)字對象的相關(guān)標(biāo)識符,實現(xiàn)數(shù)據(jù)可視化,引用數(shù)據(jù)鏈接到可用的各種出版物或數(shù)據(jù)存儲庫,有效協(xié)調(diào)各種數(shù)據(jù)集,建設(shè)具備多向增值功能的數(shù)據(jù)共享空間。
國外DC建成的數(shù)據(jù)共享平臺非常強大,可開展數(shù)據(jù)精確分析活動,是具備工具、數(shù)據(jù)庫與可擴展功能的大型先進知識網(wǎng)絡(luò),它集數(shù)據(jù)監(jiān)控、數(shù)據(jù)集成、數(shù)據(jù)共享、計量評價、數(shù)據(jù)分析等功能于一體。在當(dāng)前國外圖書館、醫(yī)療衛(wèi)生、科學(xué)研究等領(lǐng)域中,DC服務(wù)平臺是具有扎實基礎(chǔ)的數(shù)據(jù)管理設(shè)施。DC數(shù)據(jù)共享平臺可以完善和發(fā)展圖書館的信息、知識、數(shù)據(jù)服務(wù)機制體制和模式方式,為用戶帶來個性化、多元化、精準(zhǔn)化的功能以及服務(wù)。綜合來講,DC建設(shè)具有下列特征:(1)管理、策劃與收集質(zhì)量較高、價值較大的數(shù)據(jù);(2)增強數(shù)據(jù)信息的可訪問性,特別是更易于做出預(yù)測、解答難題的各種可增值數(shù)據(jù);(3)用作科研與開發(fā)分析更多的算法、方法與軟件,使它們用在數(shù)據(jù)分析中[3];(4)獨立建設(shè)各方共建共用共享生態(tài)型、可循環(huán)數(shù)據(jù)平臺;(5)具有功能強大的存儲庫,通過自定義方式對抽象化對象進行映射,支持長時間跨存儲;(6)通過相關(guān)查詢方法以及名稱實現(xiàn)動態(tài)化查詢,DC數(shù)據(jù)、信息資源的更改、創(chuàng)建和審核等日益透明化[1];(7)打破版權(quán)所有者壟斷版權(quán)產(chǎn)品的現(xiàn)象,使用者獲取數(shù)據(jù)的成本減少;(8)促進與鼓勵用戶間、學(xué)者專家之間、機構(gòu)間的溝通、學(xué)習(xí)和交流。
圖書館DC服務(wù)指的是圖書館與DC有機結(jié)合,以優(yōu)化和改進圖書館現(xiàn)有結(jié)構(gòu)與數(shù)據(jù)服務(wù)為主旨,優(yōu)化改善圖書館用戶利用、學(xué)習(xí)、研究、分享知識、信息和數(shù)據(jù)的服務(wù)模式。圖書館利用DC技術(shù)緩解和解決自身數(shù)據(jù)控制與開放、自身與系列化規(guī)則、集中化存儲與碎片化供給之間的矛盾,改善館內(nèi)館外的數(shù)據(jù)管理、分析、分享、分配與應(yīng)用狀況,將更多資金、精力投向提供具有深度價值的知識、數(shù)據(jù)、信息分享、開發(fā)、運用、分析、管理活動中。
圖書館 DC服務(wù)平臺為了讓用戶享受更優(yōu)質(zhì)的知識服務(wù),讓數(shù)據(jù)集與用戶間無縫隙對接,知識訪問與知識發(fā)現(xiàn)要從以下方面著手。第一,DC平臺有效存儲、聚合各類數(shù)據(jù),對其實施分類化、標(biāo)準(zhǔn)化處理。第二,DC平臺要制定圖書館數(shù)據(jù)共享的技術(shù)標(biāo)準(zhǔn)與合規(guī)文件,明確它的元數(shù)據(jù)、內(nèi)容訪問策略以及文件格式等,以讓圖書館、用戶及時更新和修正現(xiàn)有知識和數(shù)據(jù),實現(xiàn)從數(shù)據(jù)到信息再到知識的順利轉(zhuǎn)換[4]。第三,基于用戶的知識需求,借助可視化、數(shù)據(jù)分析等可互操作科技手段來管理DC數(shù)據(jù)。第四,結(jié)合技術(shù)進步、用戶意見與建議,持續(xù)改進和完善數(shù)據(jù)共享、分析、管理、集成、獲取、運用等生態(tài)周期。
圖書館DC知識服務(wù)平臺的組成部分由下到上依次是數(shù)據(jù)資源層、DC子平臺、用戶信息庫、用戶需求感知、DC知識服務(wù)和知識服務(wù)結(jié)果的輸出。基于DC的圖書館知識服務(wù)平臺由以下4個子平臺組成[1]。首先是數(shù)據(jù)管理平臺。它具有同步監(jiān)控、云計算、轉(zhuǎn)換、協(xié)作、數(shù)據(jù)標(biāo)準(zhǔn)化等多種功能。其次是數(shù)據(jù)分析平臺。它配備了Mahout、Rapid Miner、R語言等工具,進行高效率的數(shù)據(jù)分析,便于數(shù)據(jù)復(fù)用等。再次是數(shù)據(jù)應(yīng)用平臺。它包括數(shù)據(jù)產(chǎn)品的發(fā)布、數(shù)據(jù)可視化,培訓(xùn)和指導(dǎo)讀者科學(xué)地處置DC數(shù)據(jù)。最后是數(shù)據(jù)共享平臺。它具有數(shù)據(jù)資源的集成、低成本共享,數(shù)據(jù)可復(fù)用性與可互操作性。
圖書館為有效發(fā)揮DC知識服務(wù)平臺的功能,要求用戶提供自己的性別、年齡、教育經(jīng)歷、文化程度、職業(yè)工作、專業(yè)課程、科研狀況、信息偏好、信息獲取渠道、信息關(guān)聯(lián)等,希望能夠借此深度挖掘和分析用戶的知識技能需求和需要的系統(tǒng)圖書館資源。
DC服務(wù)平臺要準(zhǔn)確把握讀者的信息需求,為讀者提供信息的搜索、比對、獲取、咨詢、交流、分享、應(yīng)用、傳遞、增刪等服務(wù)。在感知用戶信息需求的過程中,圖書館DC知識服務(wù)平臺要結(jié)合用戶的信息庫和信息需求資料,分析用戶信息行為,以特定目的為出發(fā)點搜索、分析、比對、交流、運用、咨詢、獲取、分享生活、學(xué)習(xí)、工作等多種數(shù)據(jù)資源的“痕跡”,查看和分析用戶瀏覽、甄別、檢索數(shù)據(jù)的手段、方法等。從用戶的這些信息行為中把握用戶需要哪些數(shù)據(jù)、青睞何種服務(wù),這些都需要通過圖書館DC服務(wù)平臺的四大子平臺精準(zhǔn)呈現(xiàn)出來,完整而系統(tǒng)地分析和判斷用戶的信息、數(shù)據(jù)、知識需求后,準(zhǔn)確把握、抓取、匹配館內(nèi)外資源中客戶信息需求的關(guān)鍵詞、主題、所處范圍等,形成科學(xué)化、條理化、規(guī)范化的數(shù)據(jù)信息輸出。
圖書館DC知識服務(wù)和用戶需求感知有效連接起從用戶形成信息需求到信息需求滿足的全過程。平臺綜合信息庫、信息運用目的、數(shù)據(jù)交流記錄、數(shù)據(jù)足跡、相關(guān)模型等,深入分析和實時反饋、深度挖掘解讀用戶的信息行為、信息數(shù)據(jù)以及知識需求,加工、挖掘、調(diào)用相關(guān)的信息數(shù)據(jù)、信息以及數(shù)據(jù)集等。利用語義挖掘技術(shù)合理描述讀者的信息痕跡路線,積極校對前面的使用記錄,為用戶后續(xù)分享、應(yīng)用、獲取所需要的數(shù)據(jù)、知識和信息提供便捷的渠道和路徑。
采用多源數(shù)據(jù)融合的相關(guān)算法工具,全面搜集、調(diào)查、研判相關(guān)信息,對多種信息數(shù)據(jù)進行科學(xué)分析、有效評價和分類聚合,從豐富的信息資源中汲取更高價值。其核心目標(biāo)是綜合處置來源、類型、結(jié)構(gòu)各不相同的數(shù)據(jù)信息,吸收它們各自的優(yōu)勢。與單一數(shù)據(jù)相比,DC服務(wù)平臺可從海量圖書館數(shù)據(jù)中汲取價值更大、針對性更強、科學(xué)性更突出的知識、數(shù)據(jù)和信息,進而滿足讀者對數(shù)據(jù)、知識、信息的旺盛需求。多源數(shù)據(jù)通過DC數(shù)據(jù)服務(wù)平臺,增強圖書館融合、分析、清洗、搜集數(shù)據(jù)的能力,增強知識服務(wù)的實際效能,使讀者更便捷地獲取、使用、分享知識數(shù)據(jù)。
DC數(shù)據(jù)服務(wù)平臺融合圖書館的專家系統(tǒng)。根據(jù)智庫理論的最優(yōu)化理論庫或最佳思想,先由DC數(shù)據(jù)服務(wù)平臺向?qū)<蚁到y(tǒng)提供合乎用戶信息需求的資源,再由專家系統(tǒng)選擇和判定最優(yōu)質(zhì)的知識服務(wù)內(nèi)容,想方設(shè)法滿足客戶的信息需求,幫助他們處理經(jīng)濟、社會、政治、軍事、科技等領(lǐng)域的問題[5]。該平臺需要各個領(lǐng)域的學(xué)者、專家和專業(yè)化人才參與研發(fā)和完善專家系統(tǒng),以更豐富的知識、更高的信息數(shù)據(jù)質(zhì)量、更突出的解決問題能力,滿足讀者迫切需要獲取、分享、應(yīng)用圖書館信息、數(shù)據(jù)、知識的需要。該平臺有利于促進人工智能、大數(shù)據(jù)、云計算、各種算法和DC數(shù)據(jù)共享技術(shù)的科學(xué)運用與深度融合。
這種服務(wù)模式有利于滿足圖書館用戶對專題定題等特定的數(shù)據(jù)、信息、知識的需求,具有顯而易見的針對性、個性化、主動性和創(chuàng)造性特征。圖書館的不少用戶尤其需要某學(xué)科或某領(lǐng)域的專業(yè)知識,其信息需求整體上體現(xiàn)出國內(nèi)外實務(wù)研究、學(xué)術(shù)課題前沿的歷史發(fā)展?fàn)顩r、后續(xù)發(fā)展趨勢與當(dāng)前發(fā)展水平。為此,館員要深入了解和把握這些學(xué)科的知識和內(nèi)容,開展全過程、嵌入式、跟蹤式的知識服務(wù),配合科研工作者從課題立項、課題申報,到最后的成果鑒定、課題結(jié)項,盡可能為這些用戶提供相關(guān)領(lǐng)域與學(xué)科的最新研究動態(tài),對其發(fā)展方向做出預(yù)測,為科研工作者提供相關(guān)學(xué)科和專業(yè)的大量核心信息等,真正實現(xiàn)其“為科研教學(xué)服務(wù)”的目標(biāo)。如今,知識服務(wù)越來越注重“再生知識”“新生知識”領(lǐng)域的服務(wù),館員要不斷篩選、提煉分散在相關(guān)學(xué)科、某領(lǐng)域的專業(yè)知識,不斷跟蹤、搜集、整理這方面的內(nèi)容,融入用戶的知識需求服務(wù),為用戶提供從知識的重組、獲取、新生、再生、科研到運用和反饋的一站式知識服務(wù)。
虛擬化的創(chuàng)客空間融合加工、設(shè)計功能于一體,也是信息化背景下圖書館數(shù)據(jù)共享趨勢的全新發(fā)展模式,它讓“具有同樣愛好興趣的師生聚集起來分享觀點、交流經(jīng)驗與協(xié)同創(chuàng)造”[6]。不少高校圖書館配備了訓(xùn)練有素的專業(yè)館員、高水平的電腦專家與咨詢館員,讓讀者可以享用創(chuàng)客空間的一站式知識服務(wù)。高校圖書館和有關(guān)院系強化合作,師生集體開發(fā)動手實踐類培訓(xùn)課程和內(nèi)容,一條龍式地輔助實踐、教學(xué)、科研等活動的完成。在此過程中要聚焦用戶的知識需求,促進學(xué)科發(fā)展、強化知識服務(wù)能力,使創(chuàng)客空間增強服務(wù)效能。創(chuàng)客空間服務(wù)要結(jié)合師生們的制作設(shè)想、精彩創(chuàng)意等,提供針對性的知識服務(wù),讓靜態(tài)的知識、數(shù)據(jù)、信息動起來,不斷提升知識科研成果和項目的轉(zhuǎn)化率。
如今科研用戶紛紛聚焦于知識發(fā)現(xiàn),圖書館DC數(shù)據(jù)服務(wù)平臺應(yīng)該密切關(guān)注和充分優(yōu)化自身的知識挖掘、分析、互動、關(guān)聯(lián)、組織、生成、匹配等知識服務(wù)。深化對數(shù)據(jù)、信息、文獻的加工挖掘、關(guān)聯(lián)匹配、組織生成,盡可能挖掘與展現(xiàn)知識內(nèi)容間的關(guān)系,將DC知識平臺建設(shè)成效率高、能力強的知識發(fā)現(xiàn)工具。注重資源聚合,進行以單元知識為核心的數(shù)據(jù)、知識、信息整合,設(shè)計開發(fā)的DC知識服務(wù)平臺實現(xiàn)動態(tài)操作、交互處理、實時參與等,做好支持跨數(shù)據(jù)庫、跨文獻的知識挖掘、關(guān)聯(lián)與發(fā)現(xiàn)。
DC技術(shù)的顯著優(yōu)勢和明顯特征使它和圖書館日益密切地結(jié)合起來。圖書館DC知識服務(wù)平臺應(yīng)該持續(xù)改進和完善,綜合運用云計算、大數(shù)據(jù)、計算機、信息化等科技,立足用戶的信息行為、痕跡和基本信息,深度把握和預(yù)測感知用戶的信息知識需求,開展針對性的DC知識服務(wù)。在此基礎(chǔ)上,高校圖書館要不斷優(yōu)化基于DC融合的知識服務(wù)模式,強化它們的知識服務(wù)能力,穩(wěn)步滿足讀者精神文化生活的迫切需要。