周 宇 魏太亮 廖思琴
(1.南京大學(xué)信息管理學(xué)院,江蘇 南京 210023;2.西南科技大學(xué)圖書館,四川 綿陽 621010;
3.中共四川省委黨校圖書館,四川 成都 610071)
?
·應(yīng)用研究·
基于Drupal的圖書館知識交流共享平臺構(gòu)建
周 宇1,2魏太亮3廖思琴2
(1.南京大學(xué)信息管理學(xué)院,江蘇 南京 210023;2.西南科技大學(xué)圖書館,四川 綿陽 621010;
3.中共四川省委黨校圖書館,四川 成都 610071)
當(dāng)前國內(nèi)圖書館知識交流共享平臺少有針對讀者提交資源(如科研數(shù)據(jù)、讀者使用和生成內(nèi)容)的存儲、監(jiān)管和服務(wù),也沒有將上述數(shù)據(jù)與開放數(shù)據(jù)云進(jìn)行整合。研究利用社會開源內(nèi)容管理系統(tǒng)Drupal構(gòu)建圖書館知識交流共享平臺的方法,用以提供讀者學(xué)術(shù)信息交流、科研數(shù)據(jù)監(jiān)管、讀者生成和使用內(nèi)容管理和服務(wù)。研究過程包括:(1)分析圖書館和讀者對平臺的需求;(2)平臺功能和體系結(jié)構(gòu)設(shè)計;(3)介紹用Drupal來構(gòu)建平臺的方法;(4)探討利用平臺進(jìn)行科研數(shù)據(jù)監(jiān)管和數(shù)據(jù)語義描述和關(guān)聯(lián)的方法。針對圖書館知識交流平臺在大數(shù)據(jù)和開放數(shù)據(jù)云環(huán)境下的未來發(fā)展提出一系列對策和建議。
Drupal;知識共享;知識服務(wù);信息系統(tǒng)開發(fā)
Web2.0環(huán)境下,圖書館不僅要提供各種海量的經(jīng)過有效集成的數(shù)字化信息資源,還要積極考慮針對科研數(shù)據(jù)、讀者生成內(nèi)容、讀者使用內(nèi)容等讀者提交內(nèi)容的管理和服務(wù),同時讓讀者基于上述數(shù)據(jù)進(jìn)行有效的讀者與館員、讀者與專家、讀者與讀者之間的信息和知識交流??蒲袛?shù)據(jù)指科學(xué)研究中通過測算、計量、觀察、訪談、調(diào)查、設(shè)計、建模等方法獲得的,并能以現(xiàn)代信息技術(shù)保存和獲取的記錄[1],譬如在線問卷調(diào)查的原始記錄、新型材料性能測試的中間記錄等。 英國聯(lián)合信息系統(tǒng)委員會JISC列舉了對科研數(shù)據(jù)進(jìn)行管理的7個原因,包括(1)為新研究重用數(shù)據(jù);(2)從大量數(shù)據(jù)集中發(fā)現(xiàn)新的科學(xué)知識;(3)保護獨一無二的不可重現(xiàn)的觀察數(shù)據(jù);(4)保留通過昂貴手段獲取的數(shù)據(jù);(5)加強當(dāng)前數(shù)據(jù)對科研項目的可用性;(6)保管法律要求保護的重要數(shù)據(jù);(7)驗證公開發(fā)布的研究結(jié)論[2]。讀者生成內(nèi)容指以任何形式在網(wǎng)絡(luò)上發(fā)表的由讀者創(chuàng)作的文字、圖片、音頻、視頻等內(nèi)容[3]。讀者使用內(nèi)容指讀者在學(xué)習(xí)和科研活動中利用的各種圖書館尚未保存的參考資料和軟件。根據(jù)長尾理論,當(dāng)讀者具有獨特信息資源需求并且可以創(chuàng)建和交流這些信息資源的時候,雖然單個讀者所創(chuàng)建和交流的信息資源量并不多,但所有讀者所創(chuàng)建和使用的信息資源總量所占據(jù)的份額,可以和主流信息資源市場份額相當(dāng),甚至更大[4]。這些信息資源,再加上讀者的解讀、描述、評價和建議,變成了可資利用的知識。因此,如何管理和傳播讀者創(chuàng)建和使用的信息或知識是圖書館的一項重要工作。隨著網(wǎng)絡(luò)傳播技術(shù)的發(fā)展,讀者對知識共享的要求日益提升,讀者只有通過知識的交流才能實現(xiàn)知識創(chuàng)新,知識也只有通過共享才能實現(xiàn)其價值。美國科學(xué)社會學(xué)家羅伯特·默頓(Robert K.Merton) 指出,任何科研成果都是社會協(xié)作的產(chǎn)物,并且應(yīng)該分配給全體社會成員,發(fā)現(xiàn)者和發(fā)明者不應(yīng)據(jù)為私有[5]。圖書館是國家和政府為滿足人們知識共享的需要而提供的一種制度性公共產(chǎn)品[6],為了營造一種高效率的知識共享空間,知識交流共享平臺的建設(shè)就被提上了議程。知識交流共享平臺是指圖書館提供的以現(xiàn)代信息技術(shù)為基礎(chǔ),集合信息資源的加載、審核、發(fā)布、查閱、檢索、管理、交流等功能為一體的信息資源共享系統(tǒng),是用戶存儲和交流知識的重要工具[7]。知識交流共享平臺也可以理解為知識共享空間,是基于知識整合,以知識為共享對象,以人為中心,以泛在知識服務(wù)為特征,以知識管理為目的交互式網(wǎng)絡(luò)虛擬空間[8]。廣大的圖書館,尤其是中小型圖書館,面臨著經(jīng)費、設(shè)備和技術(shù)方面的壓力,在構(gòu)建知識交流共享平臺的時候,各種開源內(nèi)容管理系統(tǒng)是一種重要的備選技術(shù)方案,而Drupal是其中比較優(yōu)秀的一種。Drupal允許用戶在后臺主界面發(fā)布、編輯、修改內(nèi)容,支持協(xié)作環(huán)境中工作流的創(chuàng)建,對內(nèi)容結(jié)構(gòu)的定義有著完善的支持。Drupal經(jīng)初始安裝后,僅提供基本的功能框架,需要進(jìn)行個性化定制,萬維網(wǎng)上有大量的模塊應(yīng)用于網(wǎng)站的個性化定制,截至2015年4月,全球有3萬多名Web專家在更新Drupal并貢獻(xiàn)超過31 000個模塊,大量知名機構(gòu)采用Drupal構(gòu)建網(wǎng)站,支持RSS、BLOG、Wiki、語義網(wǎng)等Web2.0關(guān)鍵技術(shù)[9]。
本研究的目的:(1)從圖書館員和讀者兩個維度對知識交流共享平臺進(jìn)行需求分析;(2)對圖書館知識交流共享平臺進(jìn)行功能設(shè)計和結(jié)構(gòu)設(shè)計;(3)制定一套科研數(shù)據(jù)監(jiān)管元數(shù)據(jù)描述建議,探討利用Drupal語義支持模塊,把科研數(shù)據(jù)發(fā)布為關(guān)聯(lián)數(shù)據(jù)的方法;(4)針對大數(shù)據(jù)和關(guān)聯(lián)數(shù)據(jù)云環(huán)境下的知識交流共享平臺建設(shè),提出對策和建議。
在知識交流共享平臺設(shè)計理念方面,曾群提出了泛在網(wǎng)絡(luò)環(huán)境下高校知識共享平臺資源建設(shè)系統(tǒng)架構(gòu)和遵循整體化、系統(tǒng)化、特色化、實用化的信息資源建設(shè)思想[7]。熊回香提出一個基于Web3.0的虛擬團隊知識共享平臺架構(gòu)模型,包括多平臺跨語言知識交互、個性化知識服務(wù)、知識存儲3個模塊。并認(rèn)為Web3.0的特征(如跨平臺多終端信息交互、個性化信息聚合、跨語言服務(wù)等)可以為知識共享平臺建設(shè)提供技術(shù)支撐[10]。張曾昱和于秀芬構(gòu)建了高校教師隱性知識交流的掌上虛擬社區(qū),核心是針對專業(yè)前沿、交叉學(xué)科和教育技能,按照隱性知識交流主題確立、建立交流關(guān)系、隱形知識存儲流程來構(gòu)建平臺[11]。
在知識交流共享平臺設(shè)計實踐方面,劉會婷等人基于Drupal構(gòu)建了護理學(xué)學(xué)科信息服務(wù)平臺,整合醫(yī)院圖書館館藏資源,為護理人員提供文獻(xiàn)資源推送、標(biāo)簽云揭示、個性化定制等Web2.0信息服務(wù)[12]。趙乃瑄和王海燕運用Drupal和第三方模塊構(gòu)建了圖書館“學(xué)海拾貝”專欄,實現(xiàn)了新聞、娛樂和信息素質(zhì)教育視聽資源的內(nèi)容管理[13]。李丹等人利用Drupal及其擴展模塊,實現(xiàn)了一個混搭(Mashup)平臺,及時發(fā)布來自異構(gòu)數(shù)據(jù)源(如OPAC、RSS新聞、Google圖書)的數(shù)據(jù)[14]。當(dāng)前少有知識交流共享平臺用于語義擴展研究實踐,夏翠娟等人利用Drupal和3組關(guān)聯(lián)數(shù)據(jù)支持模塊,將“中國歷史紀(jì)年和公元紀(jì)年對照表”發(fā)布成關(guān)聯(lián)數(shù)據(jù)[15]。任瑞娟等人使用Drupal7工具,利用各種語義網(wǎng)模塊,實現(xiàn)了學(xué)位論文、書目信息等多類型學(xué)術(shù)資源的語義層面的集成[16]。
從國內(nèi)的研究進(jìn)展可以看出,當(dāng)前圖書館重視知識交流共享系統(tǒng)的構(gòu)建,有意識地建立讀者和各領(lǐng)域?qū)<抑g的交流,建立讀者和圖書館信息資源之間的連接,但國內(nèi)圖書館知識交流共享平臺少有針對科研數(shù)據(jù)、讀者使用和生成內(nèi)容的存儲、監(jiān)管和服務(wù),也沒有將上述數(shù)據(jù)進(jìn)行語義化擴展并與開放數(shù)據(jù)云進(jìn)行整合。Drupal內(nèi)容管理系統(tǒng)在圖書館中的應(yīng)用是當(dāng)前研究熱點,遵循著從各種模塊安裝到通過混搭(Mashup)平臺集成異構(gòu)數(shù)據(jù)源,再到利用語義網(wǎng)模塊實現(xiàn)多類型學(xué)術(shù)資源的語義關(guān)聯(lián)的發(fā)展路徑,從封閉發(fā)展到開放,從數(shù)據(jù)集成發(fā)展到語義集成。本文研究利用Drupal開源內(nèi)容管理系統(tǒng)來構(gòu)建一個主要針對科研數(shù)據(jù)、讀者使用和生成內(nèi)容的存儲、監(jiān)管和服務(wù)的圖書館知識交流共享平臺。
2.1 讀者的需求
知識交流共享平臺對讀者的價值主要體現(xiàn)在:(1)隨著萬維網(wǎng)上的免費信息資源越來越少,大量參考資料、工具性軟件、在線交流記錄和科研活動過程中產(chǎn)生的數(shù)據(jù)需要存儲并重復(fù)使用;(2)不少科研項目資助機構(gòu)要求所有實驗數(shù)據(jù)和研究成果必須呈繳到圖書館并被他人共享;(3)為讀者提供一個知識交流和協(xié)作創(chuàng)新的環(huán)境。
讀者對知識交流平臺的需求包括:(1)能夠存取日常學(xué)習(xí)中用到的學(xué)習(xí)資料(如課件、視頻、音頻、圖形圖像、軟件);(2)能夠存取科研過程中產(chǎn)生的研究數(shù)據(jù)和實驗數(shù)據(jù);(3)能夠上傳自己的創(chuàng)意(如論文、算法、模型、模擬等)并能和有相同興趣愛好的同學(xué)分享,通過協(xié)作開發(fā),集合多人智力進(jìn)行完善;(4)能在線交流,交流內(nèi)容可以保存。
2.2 圖書館的需求
作為數(shù)字圖書館資源檢索平臺的輔助系統(tǒng),圖書館在構(gòu)建知識交流共享平臺時考慮的因素有:(1)操作維護簡便、可擴展性強、節(jié)約經(jīng)費和人力、面向Web2.0技術(shù)、存儲安全和長期保存;(2)能夠?qū)ψx者上傳的數(shù)據(jù)進(jìn)行審核、編輯和發(fā)布;(3)能夠以此為契機,進(jìn)一步對讀者創(chuàng)建內(nèi)容中最具價值的部分—科研過程中產(chǎn)生的研究數(shù)據(jù)和實驗數(shù)據(jù)進(jìn)行數(shù)據(jù)管理;(4)能夠提供對系統(tǒng)和數(shù)據(jù)的安全保障;(5)隨著資源數(shù)量的激增,引入分布式云存儲以及能夠提供對大數(shù)據(jù)的分析;(6)能夠?qū)⒖蒲袛?shù)據(jù)以關(guān)聯(lián)數(shù)據(jù)的形式發(fā)布。另外,圖書館有意愿保存和監(jiān)管的數(shù)據(jù)包括讀者生成內(nèi)容中的學(xué)術(shù)興趣型數(shù)據(jù)(不包括娛樂型、社交型、商業(yè)型和輿論型數(shù)據(jù))、準(zhǔn)確、完整、非拷貝的科研數(shù)據(jù)、無知識產(chǎn)權(quán)糾紛的參考資料和軟件。
3.1 平臺目標(biāo)
本文設(shè)計的圖書館知識交流共享平臺的目標(biāo)是提供讀者在學(xué)習(xí)和科研活動中產(chǎn)生和使用數(shù)據(jù)的存儲、審核、發(fā)布、檢索、下載,提供支持讀者知識交流的環(huán)境以及多人協(xié)作創(chuàng)新環(huán)境,支持知識的有效集成以及在此基礎(chǔ)上的知識創(chuàng)新,此外,還包括對讀者創(chuàng)建內(nèi)容生命周期的數(shù)據(jù)監(jiān)管。平臺的使用者和資源建設(shè)者是讀者,平臺的管理者和數(shù)據(jù)的集成者是圖書館員。
3.2 功能和結(jié)構(gòu)設(shè)計
根據(jù)圖書館和讀者的需求,交流共享平臺根據(jù)功能被劃分為服務(wù)層、數(shù)據(jù)管理層和數(shù)據(jù)存儲層,見圖1。在服務(wù)層,軟件管理模塊提供讀者上傳和下載各種軟件或者自己開發(fā)的信息系統(tǒng),“系統(tǒng)仿真”是一個衍生功能,用于在服務(wù)器上真實安裝讀者開發(fā)的信息系統(tǒng),可在線進(jìn)行運行和演示;經(jīng)典文獻(xiàn)模塊提供讀者上傳和下載各種參考文獻(xiàn),這些文獻(xiàn)可能與圖書館文獻(xiàn)資源重復(fù);科研數(shù)據(jù)模塊提供讀者上傳和下載科研數(shù)據(jù),由數(shù)據(jù)提供者通過接口進(jìn)行語義描述,確保科研數(shù)據(jù)可被其他讀者進(jìn)行運行、驗證和使用;檢索模塊提供讀者一站式檢索平臺中的所有內(nèi)容;論壇模塊發(fā)布重點熱點問題提供讀者討論;博客/文章模塊提供讀者創(chuàng)建自己的博客或者發(fā)布一些自創(chuàng)的文章;在線交流模塊提供讀者利用PC端或者移動終端進(jìn)行在線交流,所有交流記錄被保存在知識庫中。在數(shù)據(jù)管理層,平臺提供一系列功能用于讀者創(chuàng)建內(nèi)容、科研數(shù)據(jù)、讀者使用內(nèi)容的管理,包括審核、創(chuàng)建索引、數(shù)據(jù)集成、數(shù)據(jù)監(jiān)管等。在數(shù)據(jù)存儲層,系統(tǒng)針對潛在有價值的記錄進(jìn)行保存,除了讀者上傳的數(shù)據(jù),還包括讀者交流記錄和論壇留言,這些數(shù)據(jù)經(jīng)過整合并鏈接至關(guān)聯(lián)數(shù)據(jù)云。
圖1 平臺功能設(shè)計圖
在平臺的系統(tǒng)架構(gòu)方面,如果基于傳統(tǒng)的集中式訪問模式,所有的讀者都集中訪問一個站點,勢必造成主站點不堪重負(fù),而且各學(xué)科知識交叉混合,不方便管理。圖2為本文設(shè)計的主分式圖書館知識交流共享平臺體系結(jié)構(gòu),該結(jié)構(gòu)的特點是建立多個子站點,每個子站點只針對某個讀者群進(jìn)行服務(wù),使用單獨的存儲空間,每個子站點安裝在單獨的子站點或虛擬機上。最后,所有子站點的訪問接口都集中在一臺服務(wù)器,即知識交流共享門戶,統(tǒng)一對外提供服務(wù)。知識交流共享門戶會定期從各子站點采集元數(shù)據(jù)和建立索引,提供針對各子站點的統(tǒng)一檢索界面。
每個子站點面對單獨的讀者群提供服務(wù),對子站點的劃分也就是對讀者群進(jìn)行劃分,有多種劃分方法,如高校圖書館的讀者群可按照學(xué)院和專業(yè)劃分,公共圖書館的讀者群可按照學(xué)科領(lǐng)域進(jìn)行劃分,劃分的時候應(yīng)大致保持子站點的負(fù)載均衡。
圖2 體系結(jié)構(gòu)設(shè)計圖
4.1 初始系統(tǒng)安裝
(1)配置服務(wù)器環(huán)境。下載和安裝Apache+PHP+MySQL服務(wù)器環(huán)境,啟動Apache和MySQL服務(wù)。
(2)安裝Drupal。到官網(wǎng)下載最新版Drupal,將其解壓縮到Apache的dtdocs文件夾中;進(jìn)入MySQL管理端,新建一個數(shù)據(jù)庫;打開瀏覽器,輸入“http:∥服務(wù)器IP/drupal7/”進(jìn)入drupal的安裝界面進(jìn)行安裝。
4.2 模塊選擇
剛安裝好的Drupal系統(tǒng)功能簡單,需要進(jìn)行個性化定制。功能模塊有兩個來源:一是Drupal系統(tǒng)內(nèi)置的模塊;二是互聯(lián)網(wǎng)上WEB開發(fā)專家編寫的第三方模塊。第三方模塊是為了彌補Drupal內(nèi)置的模塊功能欠缺,由Web專家開發(fā)的具有特定功能的模塊。KCSP平臺需要用到的模塊及功能說明見表1。
表1 知識交流共享平臺所需模塊及對應(yīng)功能(部分)
4.3 模塊配置
4.3.1 自帶核心模塊的配置
以管理員身份登錄后,選擇“Modules”,在核心模塊的列表中選擇需要的模塊并保存,回到管理控制臺,選擇“內(nèi)容”,再選擇“添加內(nèi)容”的時候,就能夠選擇和使用新添加的模塊了,模塊創(chuàng)建好之后,可以將其訪問入口放置在首頁的導(dǎo)航條或任意級別的目錄中。
4.3.2 第三方模塊的配置
在安裝模塊的界面,選擇“下載其他用戶貢獻(xiàn)的模塊”,輸入模塊的名稱進(jìn)行檢索,檢索到模塊后有兩條路徑進(jìn)行安裝:①直接下載模塊,將文件解壓后拷貝到站點的“sitesallmodules”路徑中,然后在后臺“模塊”界面,啟用新安裝的模塊;②將模塊下載地址復(fù)制到“安裝新模塊”界面,點擊“安裝”即可,見圖3。
4.3.3 個性化配置
在一些特殊情況下,對于安裝好的模塊需要一些個性化配置。比如對于讀者撰寫的文章以及上傳的經(jīng)典文獻(xiàn),數(shù)量太多,需要進(jìn)行分類目錄管理。以“文章”目錄管理為例,需要按照如下4個步驟進(jìn)行配置:
①到“結(jié)構(gòu)”——“分類”里創(chuàng)建需要的文章分類列表;
②到“結(jié)構(gòu)”——“內(nèi)容類型”——“字段管理”里為所需要的內(nèi)容類型(Article)添加字段,字段包括想要設(shè)立的
圖3 第三方模塊下載界面
分類,字段類型選“術(shù)語來源”;
③建立多個視圖(views),每個視圖包含一個術(shù)語類目下的所有文章,每個視圖對應(yīng)一個網(wǎng)頁,有單獨的訪問地址;
④建立一個page,里面建立各類目鏈接,鏈接到各個視圖。
圖4展示了文章分類列表界面,用于發(fā)表讀者的原創(chuàng)性文章,作者可以為文章添加標(biāo)簽,上傳附件和指定類別,標(biāo)簽以標(biāo)簽云的形式可視化,點擊標(biāo)簽打開包含該標(biāo)簽的文章列表。按照同樣的操作,結(jié)合圖1的功能設(shè)計和表1中對應(yīng)的第三方程序模塊,可以很容易開發(fā)出論壇、經(jīng)典文獻(xiàn)、軟件管理、在線交流等核心功能模塊。
圖4 利用視圖構(gòu)建的文章分類列表
科研數(shù)據(jù)圖書館知識交流共享平臺中最有價值的知識資產(chǎn),針對科研數(shù)據(jù)的管理又叫數(shù)據(jù)監(jiān)管、數(shù)據(jù)策管、數(shù)據(jù)監(jiān)護或者Data Curation。VanHorik認(rèn)為應(yīng)認(rèn)真對待具有長期利用價值的科研數(shù)據(jù):(1)科研數(shù)據(jù)必須可以分類查找,體現(xiàn)關(guān)聯(lián)性;(2)必須是可獲取的;(3)必須以可使用的數(shù)據(jù)格式存在,讓常用軟件可以處理;(4)數(shù)據(jù)必須是權(quán)威可靠的,未經(jīng)過變動的;(5)數(shù)據(jù)必須可持久地信賴,數(shù)據(jù)要有一個唯一標(biāo)識符,并且保存在可信任數(shù)據(jù)倉儲中[17],即要考慮科研數(shù)據(jù)的可用性、準(zhǔn)確性、完整性、可追溯性和關(guān)聯(lián)性。要達(dá)到以上目標(biāo),首先需要對科研數(shù)據(jù)進(jìn)行完善地描述,表2是本文設(shè)計的科研數(shù)據(jù)監(jiān)管元數(shù)據(jù)描述建議,重點揭示科研數(shù)據(jù)的起源、數(shù)據(jù)關(guān)聯(lián)、利用方式、修訂細(xì)節(jié)、資源字符集、存儲位置、適用軟硬件等。
表2 科研數(shù)據(jù)監(jiān)管元數(shù)據(jù)描述建議
表2(續(xù))
注:@prefix dc=http:∥purl.org/dc/elements/1.1 @prefix dcterms=http:∥purl.org/dc/terms/ @prefix rdc=http:∥rdc.example.org/
其次,需要對讀者提供提交元數(shù)據(jù)的接口界面,元數(shù)據(jù)以RDF格式描述,方便后續(xù)語義檢索并發(fā)布為關(guān)聯(lián)數(shù)據(jù)。從表2可以看出,對科研數(shù)據(jù)的語義描述是比較復(fù)雜的,讀者沒有動力來完成所有的描述,描述工作主要由圖書館員承擔(dān)。而對科研人員提供的是相對簡單的接口(如圖7所示),屏蔽語義標(biāo)注的細(xì)節(jié)[18]。在語義標(biāo)注時,針對表2中對象屬性(譬如BaseSet、RelSet、RelSet等),需要列舉其他數(shù)據(jù)集的URI,從而關(guān)聯(lián)到外部數(shù)據(jù)集??蒲袛?shù)據(jù)可以以文本、電子表格、圖形圖像、動畫、音頻視頻的格式上傳。
對科研數(shù)據(jù)進(jìn)行語義化描述并支持語義檢索和語義關(guān)聯(lián),需要用到一些語義支持模塊(見表1)。安裝好這些模塊之后,需要做的工作還包括構(gòu)建科研數(shù)據(jù)監(jiān)管本體、利用evoc導(dǎo)入本體、定義科研數(shù)據(jù)描述字段與本體屬性的對應(yīng)關(guān)系(見圖5)、對科研數(shù)據(jù)進(jìn)行語義標(biāo)注(見圖6)。
當(dāng)讀者利用知識交流平臺獲得一份科研數(shù)據(jù)的時候,可以通過資源屬性列表跳轉(zhuǎn)到外部數(shù)據(jù)集,也可以獲取一份RDF文檔,讀者可以利用該文檔的詳細(xì)描述短時間內(nèi)就能夠應(yīng)用于科研實驗,進(jìn)行驗證、測試和模擬。RDF文檔如果被計算機通過網(wǎng)絡(luò)獲取,那么文檔信息可以被自動化處理。平臺同時提供對外的SPARQL查詢終端,為本地站點的RDF數(shù)據(jù)向互聯(lián)網(wǎng)開放提供支持。
圖5 定義科研數(shù)據(jù)描述字段與本體屬性的對應(yīng)關(guān)系
6.1 加強數(shù)據(jù)的搜集和整理工作,提高數(shù)據(jù)質(zhì)量監(jiān)管水平
圖書館需要設(shè)計一套激勵機制鼓勵讀者上傳資源。在讀者上傳的資源當(dāng)中,有一部份是不成熟、不完整甚至錯
圖6 科研數(shù)據(jù)語義標(biāo)注界面
誤的實驗方法和數(shù)據(jù),有一部份是受版權(quán)保護的文獻(xiàn)和軟件,那么需要經(jīng)過專業(yè)人員鑒別,當(dāng)有新的研究成果時需要對老舊數(shù)據(jù)進(jìn)行更新、防止錯誤數(shù)據(jù)隨著大范圍使用和數(shù)據(jù)關(guān)聯(lián)蔓延開來[19],最終目標(biāo)是實現(xiàn)數(shù)據(jù)必須持久地可信賴[20]。重復(fù)提交數(shù)據(jù)的現(xiàn)象時有發(fā)生,如何發(fā)現(xiàn)重復(fù)性資料,是直接刪除還是維持一定的冗余,這也是值得考慮的問題。在所有讀者上傳的資料中,有一部份資料是常規(guī)資料,如網(wǎng)上下載的軟件或引用別人的資料,而另外一部份是獨有的原始資料,對于后者,要進(jìn)行深入的揭示和長時間的積累,如針對讀者上傳的研究數(shù)據(jù),系統(tǒng)要求讀者進(jìn)行詳細(xì)的描述,以確保這些科學(xué)研究數(shù)據(jù)能被他人有效利用,另外,獨有的原始資料需要經(jīng)過長時間的積累才能產(chǎn)生一定的效用和價值。
6.2 加強與開放數(shù)據(jù)云的關(guān)聯(lián)和集成
2007年W3C發(fā)起的Linking Open Data(關(guān)聯(lián)開放數(shù)據(jù)運動)項目已經(jīng)實現(xiàn)了將各種開放數(shù)據(jù)源(如DBpedia、GeoNames、MusicBrainz、WordNet、DBLP等)在Web上發(fā)布并進(jìn)行語義關(guān)聯(lián),用戶可以無縫跳轉(zhuǎn)到關(guān)聯(lián)開放數(shù)據(jù)云(LOD Cloud)中的任意數(shù)據(jù),而不用關(guān)心這些數(shù)據(jù)來自于哪個數(shù)據(jù)集。截止2014年8月,互聯(lián)網(wǎng)上已經(jīng)有1 000余個開放數(shù)據(jù)集合[21]。讀者生成內(nèi)容和科研數(shù)據(jù)集中的知識單元如果能和開放數(shù)據(jù)云中相關(guān)的知識單元進(jìn)行關(guān)聯(lián),讓知識交流共享平臺成為開放數(shù)據(jù)云中的一部分,那么將極大地增強平臺的知識價值和吸引力。Drupal的關(guān)聯(lián)數(shù)據(jù)發(fā)布模塊已經(jīng)比較成熟,難點是如何將實例對象屬性自動化連接到外部相關(guān)知識單元,此外,語義互操作中的本體融合和配準(zhǔn)也是需要解決的問題。
6.3 開發(fā)具有大數(shù)據(jù)分析和處理功能的模塊
隨著時間的積累,讀者生成內(nèi)容、科研數(shù)據(jù)、讀者使用內(nèi)容的數(shù)據(jù)量將變得非常龐大,達(dá)到PB級,此時需要成熟的大數(shù)據(jù)分析和處理框架來處理這些數(shù)據(jù),從而提供數(shù)據(jù)推薦、海量數(shù)據(jù)挖掘(含分類和聚類)、協(xié)作網(wǎng)絡(luò)識別、影響力評估等個性化信息服務(wù)。但目前Drupal還沒有相關(guān)的模塊發(fā)布,可以考慮用第三方工具如Solr、ZooKeeper、Hadoop框架等來開發(fā)。Solr是開放源碼的企業(yè)搜索服務(wù)器軟件,在全文檢索、分布式搜索和緩存方面表現(xiàn)良好;Apache ZooKeeper為大型分布式計算提供開源的分布式配置服務(wù)、同步服務(wù)和命名注冊;Hadoop是一個由Apache基金會所開發(fā)的分布式系統(tǒng)基礎(chǔ)架構(gòu),包含一個開源的MapReduce框架,可以將PB級數(shù)據(jù)劃分到由多臺計算機構(gòu)成的集群上并行處理,提高處理速度。
隨著互聯(lián)網(wǎng)上讀者交流意愿的提升,各種網(wǎng)絡(luò)社區(qū)的活躍和進(jìn)一步發(fā)展,圖書館讀者迫切需要一個平臺提供對科研數(shù)據(jù)、讀者生成內(nèi)容、讀者使用內(nèi)容的管理和服務(wù),同時讀者需要利用這個平臺,以平臺中的讀者提供資源為基礎(chǔ)進(jìn)行知識交流和共享活動。
本文從圖書館員和讀者兩個角度對知識交流共享平臺進(jìn)行需求分析,并以此為基礎(chǔ)設(shè)計了系統(tǒng)的功能結(jié)構(gòu)和體系結(jié)構(gòu)。以圖書館知識交流共享平臺的構(gòu)建為例,介紹了使用Drupal來開發(fā)知識交流共享平臺的方法,重點介紹了各種功能模塊的特點及其配置和使用方法??蒲袛?shù)據(jù)是知識交流共享平臺中最重要的知識資產(chǎn),為了保證科研數(shù)據(jù)的完整性、可用性和準(zhǔn)確性,圖書館需要提供針對科研數(shù)據(jù)的監(jiān)管服務(wù),包括制定元數(shù)據(jù)描述標(biāo)準(zhǔn),提供數(shù)據(jù)描述接口,將科研數(shù)據(jù)集成到開放數(shù)據(jù)云。為了保證科研數(shù)據(jù)的可靠性和完整性,本文設(shè)計了一套推薦性科研數(shù)據(jù)監(jiān)管元數(shù)據(jù)描述規(guī)范,包括針對學(xué)科數(shù)據(jù)內(nèi)容的描述性元數(shù)據(jù)和針對數(shù)據(jù)監(jiān)管的管理性元數(shù)據(jù)兩個部分,介紹了該描述規(guī)范在科研數(shù)據(jù)監(jiān)管、語義描述、科研數(shù)據(jù)語義關(guān)聯(lián)中的具體應(yīng)用。最后,本文針對知識交流共享平臺的未來發(fā)展提供一系列的對策和建議,包括加強數(shù)據(jù)的搜集和整理工作,提高數(shù)據(jù)質(zhì)量監(jiān)管水平、加強和開放數(shù)據(jù)云的關(guān)聯(lián)和集成、開發(fā)具有大數(shù)據(jù)分析和處理功能的模塊。
[1]楊鶴林.數(shù)據(jù)監(jiān)護:美國高校圖書館的新探索[J].中國圖書館學(xué)報,2011(2):18-21,41.
[2]Radovan Vrana.Supporting e-Science:Scientific Research Data Curation[J].Future of Information Sciences Infuture,2011:407-416.
[3]趙宇翔,范哲,朱慶華.用戶生成內(nèi)容(UGC)概念解析及研究進(jìn)展[J].中國圖書館學(xué)報,2012,(5):68-81.
[4]Chris Anderson.長尾巴理論[M].北京:中信出版社,2006,12.
[5]王大珩,于光遠(yuǎn).論科學(xué)精神[M].北京:中央編譯出版社,2001:31-37.
[6]沈小玲.論圖書館的經(jīng)濟學(xué)屬性——公共物品[J].中國圖書館學(xué)報,2001,(1):80-82.
[7]曾群.泛在網(wǎng)絡(luò)環(huán)境下高校知識共享平臺資源建設(shè)研究[J].情報理論與實踐,2013,(9):83-87,77.
[8]吳云珊.泛在圖書館知識共享空間(KC)研究[J].圖書情報知識,2013,(1):114-121.
[9]Drupal[EB/OL].https:∥en.wikipedia.org/wiki/Drupal,2015-11-09.
[10]熊回香,王學(xué)東,許穎穎.基于Web3.0的虛擬團隊知識共享平臺建設(shè)研究[J].情報科學(xué),2009,(12):1770-1775.
[11]張曾昱,于秀芬.基于掌上虛擬社區(qū)的高校教師隱性知識交流平臺實踐研究[J].圖書館學(xué)研究,2015,(9):19-25.
[12]劉會婷,魏青山,李丹.泛在圖書館知識共享空間(KC)研究[J].圖書情報知識,2013,(1):114-121.
[14]李丹,閆曉第,魏青山.Drupal的混搭技術(shù)在圖書館的應(yīng)用[J].現(xiàn)代圖書情報技術(shù),2013,(10):79-84.
[15]夏翠娟,劉煒,趙亮,等.關(guān)聯(lián)數(shù)據(jù)發(fā)布技術(shù)及其實現(xiàn)——以Drupal為例[J].中國圖書館學(xué)報,2012,(1):49-57.
[16]任瑞娟,濮德敏,王劍宏,等.基于Drupal實現(xiàn)多類型學(xué)術(shù)資源的語義化組織與關(guān)聯(lián)化聚合[J].情報科學(xué),2015,(5):63-67.
[17]Van Horik,Rene.Data curation.A Driver’s Guide to European Repositories.Amsterdam:Amsterdam University press,2008:131-152.
[18]Huda Khan,Brian Caruso,Jon Corson-Rikert etc.DataStaR:Using the Semantic Web approach for Data Curation[A].6th International Digital Curation Conference[C].Cornell University,December,2010:1-12.
[19]Antony J.Williams,Sean Ekins.A quality alert and call for improved curation of public chemistry databases[J].Drug Discovery Today,2011,16(17-18):747-750.
[20]Van Horik,Rene.Data curation,A Driver’s Guide to European Repositories.Amsterdam:Amsterdam University press,2008:131-152.
[21]State of the LOD Cloud 2014[EB/OL].http:∥linkeddatacatalog.dws.informatik.uni-mannheim.de/state/,2015-09-10.
(本文責(zé)任編輯:郭沫含)
The Construction of Drupal Based Library Knowledge Exchange and Sharing Platform
Zhou Yu1,2Wei Tailiang3Liao Siqin2
(1.School of Information Management,Nanjing University,Nanjing 210023,China;2.Library,Southwest University of Science and Technology,Mianyang 621010,China;3.Library,Sichuan Party School,Chengdu 610071,China)
Domestic Library Knowledge Exchange and Sharing Platform rarely providing services of storage and curation for readers’ uploaded data such as research data,used data and created data,which is not integrated with open data cloud too.In order to providing services of academic information communication and reader uploaded data management,this paper mainly studied the method of building the Library knowledge exchange and sharing platform by using Drupal,which is an open source content management system.The research process included:(1)Analyzing the requirements of the library and readers for the platform;(2)Designing the function and architecture of the platform;(3)Introducing the method of building the platform with Drupal.(4)Discussing the method of research data curation,semantic prescription and its semantic linking to other dataset.Finally,this paper put forward a series of suggestions on future development of Library knowledge exchange and sharing platform in large data and open data cloud environment.
Drupal;knowledge sharing;knowledge service;information system development
2015-12-20
本文的研究受西南科技大學(xué)圖書館基金項目“科大機構(gòu)知識庫構(gòu)建研究”資助。
周 宇(1982-),男,博士研究生,助理研究員,研究方向:語義網(wǎng)與數(shù)字圖書館。
10.3969/j.issn.1008-0821.2016.03.009
G250.73
A
1008-0821(2016)03-0053-08