李志 姜小函
[摘 要] 本文從關(guān)聯(lián)數(shù)據(jù)的角度,研究科研關(guān)系揭示問題。本文從關(guān)聯(lián)數(shù)據(jù)的研究現(xiàn)狀出發(fā),認(rèn)為基于關(guān)聯(lián)數(shù)據(jù)的科研關(guān)系揭示未來研究重點(diǎn)應(yīng)從科研實(shí)體的識(shí)別與抽取、語義描述框架構(gòu)建、科研實(shí)體及關(guān)系的本體構(gòu)建、科研關(guān)系揭示服務(wù)這四個(gè)方面來開展??蒲嘘P(guān)系揭示實(shí)現(xiàn)了海量數(shù)字資源中分散的、異構(gòu)的科研實(shí)體轉(zhuǎn)化成遵循統(tǒng)一標(biāo)準(zhǔn)的結(jié)構(gòu)化數(shù)據(jù),從而構(gòu)建一個(gè)內(nèi)容相互關(guān)聯(lián)、多維度的資源體系,將不同學(xué)科主題、不同內(nèi)涵外延、不同屬性關(guān)系的實(shí)體進(jìn)行識(shí)別、標(biāo)識(shí)和鏈接,從而形成一個(gè)龐大的關(guān)聯(lián)數(shù)據(jù)網(wǎng)絡(luò),以便快速、高效、全面地揭示科研關(guān)系。
[關(guān)鍵詞] 關(guān)聯(lián)數(shù)據(jù);科研關(guān)系揭示;科研關(guān)系網(wǎng)絡(luò)
[中圖分類號(hào)] G205 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1671-0037(2017)5-28-4
Abstract: From the angle of linked date, this paper studied the scholarly relationship to revel problems.It starts from the present situation of linked date, and believes that the future research about revelation of scholarly relationship based on linked data should mainly follow four aspects: identification and extraction of research entity, construction of semantic description framework, ontology construction of scientific research entities and relationships, and revelation service of scholarly relationship. The scholarly relationship revelation has transformed disperse and heterogeneous scientific research entities in the massive digital resource into structured data following a unified standard,built a content-correlation and multi-dimension resource system, and achieved recognition, identification and association of entities with different subject themes,connotation extensions and attributes relationships, so as to form a huge network of linked data, for revealing scholarly relationship rapidly and efficiently.
Key words: linked data; scholarly relationship revelation; scholarly relationship network
1 引言
當(dāng)前,學(xué)術(shù)數(shù)字資源已成為信息資源的主流,包含各類期刊、學(xué)位論文、會(huì)議錄、科技報(bào)告、圖書專著、專利、標(biāo)準(zhǔn)等。在這些數(shù)字資源中蘊(yùn)含著豐富的科研實(shí)體,如科研主體(科研人員、科研機(jī)構(gòu)、國家地區(qū)等)、科研活動(dòng)(科學(xué)會(huì)議、科學(xué)實(shí)驗(yàn)、科研項(xiàng)目等)、科研條件(科研方法、科學(xué)儀器、科研經(jīng)費(fèi)、科學(xué)期刊等)、科研產(chǎn)出(科研成果、專利、標(biāo)準(zhǔn)等)以及科學(xué)文獻(xiàn)、科學(xué)主題等[1],這些科研實(shí)體之間存在著相互交錯(cuò)的多維聯(lián)系,稱為科研關(guān)系。科研關(guān)系揭示研究有利于增加信息檢索的準(zhǔn)確性,提高檢索效率;有助于構(gòu)建大型的科研關(guān)系網(wǎng)絡(luò),展現(xiàn)知識(shí)與知識(shí)之間的潛在聯(lián)系,進(jìn)而更加有效地實(shí)現(xiàn)知識(shí)導(dǎo)航、智能檢索、科學(xué)評(píng)價(jià)、專家識(shí)別等深層次的知識(shí)服務(wù)。如何實(shí)現(xiàn)相關(guān)實(shí)體的有效聚合,深入挖掘和有效地揭示科研關(guān)系是科研關(guān)系網(wǎng)絡(luò)構(gòu)建的基礎(chǔ)。
2 關(guān)聯(lián)數(shù)據(jù)研究現(xiàn)狀
2006年,萬維網(wǎng)之父伯納斯-李(Tim Berners-Lee)首次提出關(guān)聯(lián)數(shù)據(jù)(Link Date)的概念,他認(rèn)為“關(guān)聯(lián)數(shù)據(jù)”是一組用于發(fā)布、共享和鏈接網(wǎng)絡(luò)上的結(jié)構(gòu)化數(shù)據(jù)的最佳方法。關(guān)聯(lián)數(shù)據(jù)以RDF(資源描述框架,Resource Description Framework)作為基礎(chǔ),將Internet上分布的異構(gòu)的、不同形式的非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為具有統(tǒng)一標(biāo)準(zhǔn)的結(jié)構(gòu)化數(shù)據(jù),方便用戶和機(jī)器的閱讀與理解,并且利用URI(統(tǒng)一資源標(biāo)識(shí)符,Uniform Resource Identifier)來命名和發(fā)布數(shù)據(jù)實(shí)體,然后通過http協(xié)議獲取這些數(shù)據(jù)[2]。關(guān)聯(lián)數(shù)據(jù)是在現(xiàn)有萬維網(wǎng)基礎(chǔ)上,構(gòu)建一個(gè)能夠與世間萬物一一映射的數(shù)據(jù)網(wǎng)絡(luò),可以對(duì)世界上的任何實(shí)體以及它們之間存在的關(guān)聯(lián)關(guān)系進(jìn)行理解和描述,進(jìn)而形成一個(gè)結(jié)構(gòu)化、具有豐富語義且互通互連的知識(shí)網(wǎng)絡(luò),使用戶可以通過計(jì)算機(jī)網(wǎng)絡(luò)工具準(zhǔn)確、快速、高效地在網(wǎng)絡(luò)中找到互相關(guān)聯(lián)的知識(shí)。因此,關(guān)聯(lián)數(shù)據(jù)是語義網(wǎng)的一種輕量級(jí)的實(shí)現(xiàn)技術(shù),它有堅(jiān)實(shí)的技術(shù)基礎(chǔ),完整的系統(tǒng)結(jié)構(gòu),簡單高效的發(fā)布方式,并且能夠?yàn)椴煌愋汀⒉煌Z言、不同粒度的數(shù)字資源動(dòng)態(tài)聚合提供新的研究視角。
2.1 理論研究方面
自關(guān)聯(lián)數(shù)據(jù)提出之后,國內(nèi)外相關(guān)領(lǐng)域的學(xué)者就關(guān)聯(lián)數(shù)據(jù)本身開展了大量的理論研究。2007 年 Richard Cyganiak人在“Linking open data”項(xiàng)目申請(qǐng)中再次強(qiáng)化關(guān)聯(lián)數(shù)據(jù)的概念[3],此后關(guān)聯(lián)數(shù)據(jù)的研究受到了各界的重視。自此,全球互聯(lián)網(wǎng)大會(huì)、AAAI年會(huì)和語義萬維網(wǎng)等國際會(huì)議均有關(guān)聯(lián)數(shù)據(jù)的主題會(huì)議。2011年圖書館信息資源委員會(huì)(Council on Library and Information Resources)、斯坦福大學(xué)圖書館與學(xué)術(shù)信息資源中心(Stanford University Libraries and Academic Information Resources)召集技術(shù)專家和圖書館相關(guān)人員對(duì)關(guān)聯(lián)數(shù)據(jù)在圖書館中的應(yīng)用所遇到的問題和挑戰(zhàn)進(jìn)行了討論[4]。國內(nèi)關(guān)聯(lián)數(shù)據(jù)的研究始于2008年,上海圖書館的劉煒等人對(duì)國外關(guān)聯(lián)數(shù)據(jù)的文獻(xiàn)和著作進(jìn)行了翻譯,并介紹了相關(guān)應(yīng)用。2010年中國科學(xué)院的沈志宏和張曉琳梳理和分析了大量文獻(xiàn),介紹了關(guān)聯(lián)數(shù)據(jù)的原則和技術(shù)體系,研究了關(guān)聯(lián)數(shù)據(jù)的核心技術(shù)[5]。2012年中國科學(xué)院國家科學(xué)圖書館的陶俊對(duì)德國柏林自由大學(xué)提出的關(guān)聯(lián)數(shù)據(jù)映射語言R2R進(jìn)行了深入分析,并與SPAR-QL語言比較,發(fā)現(xiàn)推廣R2R有助于提升RDF鏈接創(chuàng)建能力,從而更好地為創(chuàng)建關(guān)聯(lián)數(shù)據(jù)提供支持[6]。2014年學(xué)者游毅按照關(guān)聯(lián)數(shù)據(jù)的基本原則與聚合機(jī)制,通過圖書館MARC書目數(shù)據(jù)的RDF格式轉(zhuǎn)換、URI資源命名與指向外部數(shù)據(jù)源的RDF鏈接實(shí)現(xiàn)館藏元數(shù)據(jù)的關(guān)聯(lián)數(shù)據(jù)化與網(wǎng)絡(luò)關(guān)聯(lián),提供了一個(gè)實(shí)現(xiàn)館藏資源關(guān)聯(lián)揭示的全新模式[7]。同年樊秋妮和張麗萍利用西安航空學(xué)院圖書館有效的MARC數(shù)據(jù),從網(wǎng)站上收集相關(guān)信息并參照FRBR模型進(jìn)行書目數(shù)據(jù)分解,利用關(guān)聯(lián)數(shù)據(jù)來實(shí)現(xiàn)書目數(shù)據(jù)語義化[8]。
2.2 應(yīng)用研究方面
2.2.1 國外關(guān)聯(lián)數(shù)據(jù)應(yīng)用現(xiàn)狀。在關(guān)聯(lián)數(shù)據(jù)的實(shí)踐推進(jìn)中,2008年瑞典國家圖書館(National Library of Sweden)最先將本國的國家聯(lián)合目錄發(fā)布為關(guān)聯(lián)數(shù)據(jù)。緊接著,美國國會(huì)圖書館(Library of Congress)英國國家廣播公司(British Broadcasting Corporation)、法國國家圖書館(La biliothèque nationale de France)和德國國家圖書館(Die Deutsche Nationalbibliothek)等的書目數(shù)據(jù)也紛紛開放了關(guān)聯(lián)數(shù)據(jù)服務(wù)。2009年作為國際領(lǐng)先的搜索引擎公司Google利用關(guān)聯(lián)數(shù)據(jù)對(duì)視頻內(nèi)容進(jìn)行標(biāo)識(shí),對(duì)搜索結(jié)果摘要中的人物和評(píng)論進(jìn)行RDFa標(biāo)識(shí),提高了Google的搜索質(zhì)量,更好地滿足了用戶的檢索需求。2010年萬維網(wǎng)協(xié)會(huì)W3C還專門成立圖書館關(guān)聯(lián)數(shù)據(jù)孵化小組,鼓勵(lì)圖書館界將各類文檔和數(shù)據(jù)以關(guān)聯(lián)數(shù)據(jù)的形式發(fā)布到網(wǎng)上,使圖書館的資源能夠在和互聯(lián)網(wǎng)上實(shí)現(xiàn)共享[9]。美國國立衛(wèi)生研究院資助康奈爾大學(xué)等機(jī)構(gòu)研發(fā)了VIVO平臺(tái),利用RDF、OWL、Jena和SPARQL等技術(shù),構(gòu)建一個(gè)廣泛適用的科研本體,對(duì)科研人員、科研項(xiàng)目、科學(xué)數(shù)據(jù)、科研成果以及文獻(xiàn)資源等進(jìn)行語義化的知識(shí)揭示,為科研人員提供關(guān)聯(lián)知識(shí)發(fā)現(xiàn)服務(wù)[10]。英國廣播公司BBC(British Broadcasting Corporation)使用關(guān)聯(lián)數(shù)據(jù)技術(shù)進(jìn)行數(shù)據(jù)集成,如將音樂網(wǎng)站與維基百科鏈接,獲取音樂人的信息,通過關(guān)聯(lián)數(shù)據(jù)技術(shù)為每個(gè)節(jié)目建立自己專屬的網(wǎng)頁和靜態(tài)地址,使用戶體驗(yàn)得到大幅度的提升。此外,還有紐約時(shí)報(bào)、百思買等紛紛使用關(guān)聯(lián)數(shù)據(jù)技術(shù)發(fā)布多媒體、新聞等數(shù)據(jù)。
2.2.2 國內(nèi)關(guān)聯(lián)數(shù)據(jù)應(yīng)用現(xiàn)狀。與國外相比,國內(nèi)針對(duì)關(guān)聯(lián)數(shù)據(jù)的應(yīng)用相對(duì)較晚。中國科技信息研究所較早關(guān)注關(guān)聯(lián)數(shù)據(jù),并針對(duì)關(guān)聯(lián)數(shù)據(jù)技術(shù)應(yīng)用開展實(shí)踐。2008年國家科技圖書情報(bào)文獻(xiàn)中心最早成立了關(guān)聯(lián)數(shù)據(jù)項(xiàng)目。2010年中國科學(xué)技術(shù)信息研究白海燕等初步實(shí)現(xiàn)了關(guān)聯(lián)數(shù)據(jù)在書目信息組織中的應(yīng)用。2011年武漢大學(xué)信息資源研究中心馬費(fèi)成等提出一個(gè)基于關(guān)聯(lián)數(shù)據(jù)的網(wǎng)絡(luò)資源集成框架,設(shè)計(jì)并實(shí)現(xiàn)了以“武漢大學(xué)”為基本單位的免費(fèi)網(wǎng)絡(luò)學(xué)術(shù)資源集成實(shí)驗(yàn)系統(tǒng)[11]。2012年中國人民大學(xué)和清華大學(xué)信息研究院的朝樂門和邢春曉等人研究關(guān)聯(lián)數(shù)據(jù)的跨域共享以及關(guān)聯(lián)數(shù)據(jù)知識(shí)地圖的原則、體系、技術(shù)等,并在此基礎(chǔ)上采用語義Web編程技術(shù)實(shí)現(xiàn)面向DBpedia、Yago、FOAF、Freebase等不同關(guān)聯(lián)數(shù)據(jù)集的知識(shí)地圖系統(tǒng)[12]。2013年中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所的鮮國建設(shè)計(jì)自動(dòng)批量轉(zhuǎn)化工具,將農(nóng)業(yè)科學(xué)敘詞表(Chinese Agricultural Thesaurus,簡稱 CAT)轉(zhuǎn)換為CAT/SKOS關(guān)聯(lián)數(shù)據(jù),實(shí)現(xiàn)面向農(nóng)業(yè)科研的新型服務(wù)[13]。2014年吉林大學(xué)崔春等人采用挖掘?qū)嶓w關(guān)系為目標(biāo)的研究路線與方法、發(fā)布中文名稱規(guī)范關(guān)聯(lián)數(shù)據(jù)、對(duì)現(xiàn)有本體進(jìn)行選擇和映射、利用眾包方式開展文本分析工作探索了關(guān)聯(lián)數(shù)據(jù)在提升文化遺產(chǎn)文獻(xiàn)的可視性方面的應(yīng)用[14]。2015年浙江大學(xué)丁楠等人研究了關(guān)聯(lián)數(shù)據(jù)在加強(qiáng)政府信息集成方面的應(yīng)用,構(gòu)建了基于關(guān)聯(lián)數(shù)據(jù)技術(shù)的政府信息聚合模型,并通過實(shí)例驗(yàn)證了其可行性[15]。2016年上海圖書館的夏翠娟等人以家譜開始,利用關(guān)聯(lián)基于語義萬維網(wǎng)的規(guī)范控制方法和基于知識(shí)本體的知識(shí)組織方法以及關(guān)聯(lián)數(shù)據(jù)技術(shù)等實(shí)現(xiàn)了面向知識(shí)發(fā)現(xiàn)的數(shù)字人文服務(wù)[16]。
2.3 其他方面
同時(shí),還對(duì)CNKI優(yōu)秀博碩士學(xué)位數(shù)據(jù)庫中有關(guān)關(guān)聯(lián)數(shù)據(jù)的文獻(xiàn)進(jìn)行了檢索,得到博碩士學(xué)位論文49篇(檢索式為題名=“關(guān)聯(lián)數(shù)據(jù)”),其中博士論文6篇,碩士論文43篇。這6篇博士論文分別屬于計(jì)算機(jī)系統(tǒng)結(jié)構(gòu)、農(nóng)業(yè)信息管理與情報(bào)學(xué)專業(yè),研究主要集中在關(guān)聯(lián)數(shù)據(jù)實(shí)現(xiàn)技術(shù)、關(guān)聯(lián)數(shù)據(jù)在知識(shí)服務(wù)和圖書館建設(shè)方面的應(yīng)用,如表1所示。碩士論文的研究主要集中在關(guān)聯(lián)數(shù)據(jù)的技術(shù)體系和基本原則,以及關(guān)聯(lián)數(shù)據(jù)在知識(shí)服務(wù)、圖書館與檔案建設(shè)、企業(yè)、農(nóng)業(yè)與醫(yī)學(xué)等方面的信息服務(wù)。
此外,又對(duì)全國社會(huì)科學(xué)規(guī)劃辦公室(簡稱“社科”)和國家自然科學(xué)基金委員會(huì)(簡稱“自科”)的網(wǎng)站進(jìn)行了檢索,得到我國關(guān)聯(lián)數(shù)據(jù)項(xiàng)目的立項(xiàng)情況,如表2所示,其研究主要集中在關(guān)聯(lián)數(shù)據(jù)自身的理論研究以及關(guān)聯(lián)數(shù)據(jù)在圖書館建設(shè)、知識(shí)服務(wù)和政府?dāng)?shù)據(jù)開放方面的應(yīng)用。自2011年以來,我國一直都有關(guān)聯(lián)數(shù)據(jù)的專門項(xiàng)目支持,這些項(xiàng)目不僅僅停留在關(guān)聯(lián)數(shù)據(jù)的理論研究,更多涉及到關(guān)聯(lián)數(shù)據(jù)的應(yīng)用,使研究成果更好地為社會(huì)提供服務(wù),發(fā)揮關(guān)聯(lián)數(shù)據(jù)的價(jià)值與優(yōu)勢。
3 基于關(guān)聯(lián)數(shù)據(jù)的科研關(guān)系揭示未來研究建議
綜上所述,關(guān)聯(lián)數(shù)據(jù)的相關(guān)理論研究已經(jīng)比較成熟,其應(yīng)用范圍正在逐漸擴(kuò)大。如何利用關(guān)聯(lián)數(shù)據(jù)已有的理論、方法、工具、規(guī)則去識(shí)別、揭示和挖掘出隱含的、復(fù)雜的、多維的科研關(guān)系是關(guān)聯(lián)數(shù)據(jù)在科研關(guān)系揭示方面的又一新的嘗試和應(yīng)用。本文認(rèn)為,基于關(guān)聯(lián)數(shù)據(jù)的科研關(guān)系揭示是在探討科研關(guān)系揭示概念與內(nèi)涵,分析科研實(shí)體屬性與特征,以及科研關(guān)系類型、結(jié)構(gòu)與表現(xiàn)形式的基礎(chǔ)上重點(diǎn)研究科研實(shí)體的識(shí)別和抽取、科研關(guān)系的語義化描述、科研實(shí)體和關(guān)系的本體構(gòu)建,以及科研關(guān)系的應(yīng)用這四個(gè)方面的內(nèi)容,研究框架如圖1所示。
3.1 科研實(shí)體的識(shí)別與抽取
一方面,需要進(jìn)行科研實(shí)體的識(shí)別與標(biāo)注。分析不同科研實(shí)體的屬性特征,利用基于海量文本統(tǒng)計(jì)和自然語言理解來界定科研實(shí)體的語義特征,以便識(shí)別更細(xì)粒度的科研實(shí)體。采用命名實(shí)體識(shí)別研究方面相對(duì)成熟的技術(shù)和方法,如基于規(guī)則的方法、基于統(tǒng)計(jì)的方法、基于規(guī)則和統(tǒng)計(jì)相結(jié)合的方法、機(jī)器學(xué)習(xí)與人工知識(shí)相結(jié)合的方法等,結(jié)合海量信息資源所提供的信息,對(duì)主要科研實(shí)體,如人名、機(jī)構(gòu)、地名進(jìn)行識(shí)別。重點(diǎn)研究基于海量信息資源的篇章結(jié)構(gòu)、科研實(shí)體的語義特征以及科研實(shí)體之間的鄰近度來識(shí)別和標(biāo)注科研實(shí)體。另一方面,對(duì)科研實(shí)體進(jìn)行歸一與規(guī)范。對(duì)于主要科研實(shí)體的規(guī)范文檔中存在的對(duì)同一科研實(shí)體的多個(gè)名稱或不同實(shí)體的重名等現(xiàn)象進(jìn)行消歧和命名規(guī)范化處理,采用基于上下文的文本向量聚類方法,并充分考慮文本中詞與詞之間的關(guān)聯(lián)度及相互的語義關(guān)系,通過相似度算法,使其在大規(guī)模文獻(xiàn)資源中能夠自動(dòng)選擇或生成一個(gè)最優(yōu)的命名,實(shí)現(xiàn)科研實(shí)體命名規(guī)則的規(guī)范化。在科研實(shí)體的識(shí)別、標(biāo)注、描述和命名規(guī)則研究基礎(chǔ)上,抽取科研實(shí)體,形成科研實(shí)體的知識(shí)庫,為基于關(guān)聯(lián)數(shù)據(jù)的科研實(shí)體語義描述奠定基礎(chǔ)。
3.2 基于關(guān)聯(lián)數(shù)據(jù)的科研關(guān)系語義描述框架研究
在現(xiàn)有的RDF、SKOS、OWL基礎(chǔ)上,針對(duì)科研實(shí)體及其關(guān)系的特殊性和復(fù)雜性,構(gòu)建適用于科研關(guān)系的語義描述框架。在對(duì)科研實(shí)體及其關(guān)系特征分析的基礎(chǔ)上,利用RDA提供的數(shù)據(jù)元素定義、屬性關(guān)系描述、注冊(cè)取值詞表的控制等多種描述手段,定制并設(shè)計(jì)出不同科研情景下的RDA綱要,構(gòu)造科研實(shí)體及其關(guān)系之間的邏輯關(guān)系。針對(duì)科研實(shí)體及其關(guān)系的多維性和復(fù)雜性,構(gòu)建多維實(shí)體組配知識(shí)體系模型,實(shí)現(xiàn)與科研實(shí)體的關(guān)聯(lián),實(shí)體概念與概念之間、概念與實(shí)例之間、實(shí)例與實(shí)例之間、引證關(guān)系、關(guān)聯(lián)關(guān)系、共現(xiàn)關(guān)系等多方面集成并能將其表征為可擴(kuò)展的RDF有向網(wǎng)絡(luò)圖,使其具備關(guān)聯(lián)數(shù)據(jù)集基礎(chǔ)。
3.3 基于關(guān)聯(lián)數(shù)據(jù)的科研實(shí)體及其關(guān)系本體構(gòu)建研究
選取骨架法、企業(yè)建模法、Methontology和Berneras et a.l等方法中的一種,利用Ontosaurus、Ontolingua、OILEd、Protege、OntoEdit等本體構(gòu)建工具來對(duì)領(lǐng)域知識(shí)進(jìn)行建模,然后從海量數(shù)字資源中抽取出科研實(shí)體,通過語義表征技術(shù)SKOS與OWL的語義遞進(jìn)轉(zhuǎn)換,鏈接和集成規(guī)范數(shù)據(jù)與主題概念體系的表征,實(shí)現(xiàn)科研實(shí)體及其關(guān)系的語義化描述,從而構(gòu)建科研本體。在本體構(gòu)建過程中,要產(chǎn)生一份本體需求及規(guī)格說明的文檔,這份文檔在本體構(gòu)建完成后有助于實(shí)現(xiàn)知識(shí)共享。
3.4 基于關(guān)聯(lián)數(shù)據(jù)的科研關(guān)系揭示服務(wù)研究
科研關(guān)系揭示不僅是理論問題,更是現(xiàn)實(shí)問題,其理論研究需要在實(shí)踐中進(jìn)行驗(yàn)證。在不同來源、不同結(jié)構(gòu)和不同類型的海量數(shù)字資源中,進(jìn)行科研實(shí)體的識(shí)別與抽取、語義框架描述、本體構(gòu)建,配置發(fā)布服務(wù)器,解析每個(gè)實(shí)體的URI,根據(jù)內(nèi)容協(xié)商原則返回正確的網(wǎng)頁描述和RDF描述,使其與外部資源形成關(guān)聯(lián),在此基礎(chǔ)上開展基于面向用戶的深層次的知識(shí)檢索、基于關(guān)聯(lián)數(shù)據(jù)的智能導(dǎo)航服務(wù)和相關(guān)知識(shí)聚合推送服務(wù)等。
4 結(jié)語
海量數(shù)字資源中存在著大量分散的、異構(gòu)的科研實(shí)體,對(duì)用戶快速、準(zhǔn)確的檢索科研信息帶來不便。運(yùn)用關(guān)聯(lián)數(shù)據(jù)技術(shù)進(jìn)行科研關(guān)系揭示將有助于將分散的、異構(gòu)的科研實(shí)體轉(zhuǎn)化成統(tǒng)一的結(jié)構(gòu)化數(shù)據(jù)并對(duì)其進(jìn)行標(biāo)識(shí)和鏈接,從而構(gòu)建一個(gè)大型的共享的科研關(guān)系網(wǎng)絡(luò),最終為用戶提供更好的知識(shí)服務(wù)。
參考文獻(xiàn):
[1] 曾建勛.知識(shí)鏈接及其服務(wù)研究[M].北京:科學(xué)技術(shù)文獻(xiàn)出版社,2012.
[2] Linked data FAQ[EB/OL].http://structureddynamics.com/linked_data.html.2015-03-05.
[3] W3C. Linking Open Data[EB/OL].http://www.w3.org/wiki/SweoIG/TaskForces/CommunityProjects/LinkingOpenDate.2015-04-05.
[4] 歐亮.斯坦福大學(xué)關(guān)聯(lián)數(shù)據(jù)報(bào)告概述[J].重慶第二師范學(xué)院學(xué)報(bào),2013(3):164-168.
[5] 沈志宏,張曉林.關(guān)聯(lián)數(shù)據(jù)及其應(yīng)用現(xiàn)狀綜述[J].現(xiàn)代圖書情報(bào)技術(shù),2010(11):1-9.
[6] 陶俊,孫坦,劉崢.關(guān)聯(lián)數(shù)據(jù)映射語言R2R[J].中國圖書館學(xué)報(bào),2012(3):100-109.
[7] 游毅.面向館藏聚合的書目關(guān)聯(lián)數(shù)據(jù)實(shí)現(xiàn)[J].情報(bào)理論與實(shí)踐,2014(8):105-110.
[8] 司莉,李鑫.基于關(guān)聯(lián)數(shù)據(jù)的科學(xué)數(shù)據(jù)集成與共享研究——以Bio2RDF項(xiàng)目為例[J].圖書館學(xué)研究,2014(21):51-55.
[9] W3C Library Linked Data Incubator Group[EB/OL].http://www.w3.org/2005/Incubator/lld/2015-03-05.
[10] 趙雪芹.知識(shí)聚合與服務(wù)研究現(xiàn)狀及未來研究建議[J].情報(bào)理論與實(shí)踐,2015(2):132-135.
[11] 馬費(fèi)成,趙紅斌,萬燕玲,楊東晨,賴潔.基于關(guān)聯(lián)數(shù)據(jù)的網(wǎng)絡(luò)信息資源集成[J].情報(bào)雜志,2011(2):167-170,175.
[12] 朝樂門,張勇,邢春曉,張健.數(shù)據(jù)驅(qū)動(dòng)型知識(shí)地圖及其關(guān)鍵技術(shù)[J].圖書情報(bào)工作,2012(10):25-29,40.
[13] 鮮國建,趙瑞雪,朱亮,寇遠(yuǎn)濤.農(nóng)業(yè)科學(xué)敘詞表的SKOS轉(zhuǎn)化及其應(yīng)用研究[J].現(xiàn)代圖書情報(bào)技術(shù),2012(10):16-20.
[14] 崔春,畢強(qiáng).關(guān)聯(lián)數(shù)據(jù)在數(shù)字人文領(lǐng)域中的應(yīng)用剖析——以關(guān)聯(lián)爵士項(xiàng)目為例[J].圖書情報(bào)工作,2014(24):99-105.
[15] 丁楠,王鈺,潘有能.基于關(guān)聯(lián)數(shù)據(jù)的政府信息聚合研究[J].情報(bào)理論與實(shí)踐,2015(7):76-79,85.
[16] 夏翠娟,張磊.關(guān)聯(lián)數(shù)據(jù)在家譜數(shù)字人文服務(wù)中的應(yīng)用[J].圖書館雜志,2016(10):26-34.