国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大數(shù)據(jù)環(huán)境下的農(nóng)業(yè)知識發(fā)現(xiàn)服務(wù)探索*

2016-10-19 06:51:25趙瑞雪鮮國建寇遠(yuǎn)濤顧亮亮朱亮
數(shù)字圖書館論壇 2016年9期
關(guān)鍵詞:農(nóng)業(yè)知識關(guān)聯(lián)語義

趙瑞雪,鮮國建,寇遠(yuǎn)濤,顧亮亮,朱亮

(中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所,北京 100081)

大數(shù)據(jù)環(huán)境下的農(nóng)業(yè)知識發(fā)現(xiàn)服務(wù)探索*

趙瑞雪,鮮國建,寇遠(yuǎn)濤,顧亮亮,朱亮

(中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所,北京 100081)

適應(yīng)大數(shù)據(jù)環(huán)境下用戶新需求,探索新型知識發(fā)現(xiàn)服務(wù)形態(tài),是圖書館等信息機構(gòu)提升知識服務(wù)能力面臨的挑戰(zhàn)與機遇。本文在簡要分析國內(nèi)外資源發(fā)現(xiàn)與知識發(fā)現(xiàn)系統(tǒng)等研究進展基礎(chǔ)上,設(shè)計大數(shù)據(jù)環(huán)境下農(nóng)業(yè)知識發(fā)現(xiàn)服務(wù)體系架構(gòu),并從農(nóng)業(yè)綜合科技數(shù)字知識倉儲構(gòu)建、基于元數(shù)據(jù)搜索的統(tǒng)一發(fā)現(xiàn)、基于語義多維知識關(guān)聯(lián)發(fā)現(xiàn)、基于深度融合知識挖掘分析和面向特定需求的專題知識發(fā)現(xiàn)等方面闡述農(nóng)業(yè)知識發(fā)現(xiàn)服務(wù)的研究探索。

大數(shù)據(jù);資源發(fā)現(xiàn);知識發(fā)現(xiàn);資源匯聚;知識服務(wù)

1 引言

大數(shù)據(jù)時代,各領(lǐng)域?qū)?shù)據(jù)的挖掘與分析日益深入,海量數(shù)字信息資源已成為科研用戶依賴與使用的主流資源,以數(shù)據(jù)密集型計算為特征的科學(xué)研究“第四范式”方興未艾[1]。面對日益復(fù)雜的科技創(chuàng)新問題,科研用戶的信息需求也從單一文獻信息向多元綜合信息、從簡單文獻資源發(fā)現(xiàn)向細(xì)粒度知識單元及知識發(fā)現(xiàn)演變。大數(shù)據(jù)環(huán)境下,如何適應(yīng)和滿足用戶新需求,以科技文獻資源為主體,更加合理、高效地匯聚融合多源異構(gòu)科技信息大數(shù)據(jù)資源,并與多類型、多層次知識發(fā)現(xiàn)技術(shù)相結(jié)合,研究構(gòu)建大數(shù)據(jù)驅(qū)動的新一代知識發(fā)現(xiàn)服務(wù)系統(tǒng),是圖書館等專業(yè)信息機構(gòu)面臨的挑戰(zhàn),也是優(yōu)化知識服務(wù)體系、提升服務(wù)質(zhì)量的重大機遇[2]。

本文在簡要分析國內(nèi)外資源發(fā)現(xiàn)與知識發(fā)現(xiàn)系統(tǒng)等方面研究進展基礎(chǔ)上,設(shè)計大數(shù)據(jù)環(huán)境下農(nóng)業(yè)專業(yè)領(lǐng)域知識發(fā)現(xiàn)服務(wù)的體系架構(gòu),并從農(nóng)業(yè)綜合科技數(shù)字知識倉儲構(gòu)建、基于元數(shù)據(jù)搜索的統(tǒng)一發(fā)現(xiàn)、基于語義多維知識關(guān)聯(lián)發(fā)現(xiàn)、基于深度融合知識挖掘分析和面向特定需求的專題知識發(fā)現(xiàn)等方面闡述農(nóng)業(yè)領(lǐng)域知識發(fā)現(xiàn)系統(tǒng)的研究實踐進展。

2 國內(nèi)外現(xiàn)狀

為深入整合圖書館資源及其服務(wù)體系,向用戶提供從資源發(fā)現(xiàn)到資源獲取“一站式”服務(wù),Serials Solutions公司于2009年發(fā)布全球第一個網(wǎng)絡(luò)級資源發(fā)現(xiàn)系統(tǒng)Summon[3]。隨后OCLC、EBSCOhost等數(shù)據(jù)庫生產(chǎn)商分別推出WorldCat Local[4]和EDS[5],而圖書館集成系統(tǒng)開發(fā)商ExLibris公司也發(fā)布Primo Central[6]。與提供新型信息資源整合服務(wù)的資源發(fā)現(xiàn)系統(tǒng)相比,學(xué)術(shù)搜索引擎則以學(xué)術(shù)資源為索引對象,涵蓋商業(yè)元數(shù)據(jù)、互聯(lián)網(wǎng)免費學(xué)術(shù)資源和深層網(wǎng)頁學(xué)術(shù)資源,并將這類資源抓取、索引以統(tǒng)一的界面向用戶提供搜索服務(wù)[7],如Google Scholar、微軟學(xué)術(shù)搜索、百度學(xué)術(shù)搜索等[8]。

一般而言,資源發(fā)現(xiàn)系統(tǒng)擅長資源結(jié)果的準(zhǔn)確定位及綜合服務(wù),而學(xué)術(shù)搜索引擎?zhèn)戎刭Y源線索的揭示。大數(shù)據(jù)時代,用戶不再滿足于簡單信息檢索和資源發(fā)現(xiàn),而迫切需要從海量信息中發(fā)掘更具價值的規(guī)律和知識。知識發(fā)現(xiàn)是從大量數(shù)據(jù)集合中抽取或提煉潛在、有用知識的過程。近年來,國內(nèi)外關(guān)于知識發(fā)現(xiàn)系統(tǒng)的研究不斷升溫,2015年,歐洲圖書館協(xié)會發(fā)布的《數(shù)字時代知識發(fā)現(xiàn)海牙宣言》指出,內(nèi)容挖掘、數(shù)據(jù)抽取工具不僅可以處理大數(shù)據(jù),也是數(shù)字時代知識發(fā)現(xiàn)的關(guān)鍵[9]。生物醫(yī)學(xué)領(lǐng)域已基于GO本體和MeSH主題詞表開發(fā)了語義知識發(fā)現(xiàn)工具GoPubMed[10];百度學(xué)術(shù)在2015年中國高校圖書館發(fā)展論壇上發(fā)布“高校圖書館計劃”,致力于提供知識發(fā)現(xiàn)、連接用戶與圖書館的信息服務(wù)[11];基于文獻資源的知識發(fā)現(xiàn)系統(tǒng)有“中國學(xué)術(shù)搜索”“超星發(fā)現(xiàn)系統(tǒng)”“智立方發(fā)現(xiàn)系統(tǒng)”“學(xué)知搜索”等[12]。

上述資源發(fā)現(xiàn)系統(tǒng)和學(xué)術(shù)搜索引擎作為全新的學(xué)術(shù)信息發(fā)現(xiàn)工具,正在以“簡單、快速、易用、有效”的創(chuàng)新資源組織方式、全新商業(yè)模式顛覆傳統(tǒng)圖書館服務(wù)理念,帶給用戶全新的體驗[13]。知識發(fā)現(xiàn)系統(tǒng)基于快速增長的海量數(shù)字資源,通過現(xiàn)代技術(shù)手段將資源整合、知識發(fā)現(xiàn)、信息推送等服務(wù)融為一體,打破以往書刊目錄、文獻索引和全文獲取的局限,為用戶提供具有知識挖掘與數(shù)據(jù)分析功能的知識發(fā)現(xiàn)系統(tǒng),從而實現(xiàn)從資源發(fā)現(xiàn)到知識發(fā)現(xiàn)的轉(zhuǎn)變[14],顯著提高數(shù)字資源利用率和知識服務(wù)能力[2]。

3 農(nóng)業(yè)知識發(fā)現(xiàn)服務(wù)體系架構(gòu)

通過國內(nèi)外現(xiàn)狀分析不難發(fā)現(xiàn),盡管上述資源或知識發(fā)現(xiàn)服務(wù)系統(tǒng)已取得重要進展,但面向?qū)I(yè)領(lǐng)域服務(wù)時,在科技信息資源覆蓋類型、資源深度組織與關(guān)聯(lián)、個性化專業(yè)化服務(wù),以及線上、線下協(xié)同服務(wù)等方面還存在不足。近年來,在推進“三農(nóng)”和現(xiàn)代農(nóng)業(yè)發(fā)展過程中,農(nóng)業(yè)科技創(chuàng)新支撐作用日趨明顯。大數(shù)據(jù)環(huán)境下的農(nóng)業(yè)科技創(chuàng)新工作,對農(nóng)業(yè)科技信息資源保障與知識服務(wù)提出新期望和新要求。如何主動適應(yīng)大數(shù)據(jù)環(huán)境下農(nóng)業(yè)科研創(chuàng)新和管理決策的用戶需求,系統(tǒng)匯聚、有效整合與挖掘利用多源異構(gòu)科技信息大數(shù)據(jù)資源,構(gòu)建大數(shù)據(jù)驅(qū)動的農(nóng)業(yè)專業(yè)知識發(fā)現(xiàn)服務(wù)系統(tǒng),已成為農(nóng)業(yè)信息機構(gòu)服務(wù)于農(nóng)業(yè)科技創(chuàng)新的當(dāng)務(wù)之急。

本文探討的農(nóng)業(yè)知識發(fā)現(xiàn)服務(wù),是依托并整合國家農(nóng)業(yè)圖書館海量文獻資源、各類服務(wù)系統(tǒng)和專業(yè)人才隊伍,在借鑒和集成第三方資源/知識發(fā)現(xiàn)系統(tǒng)基礎(chǔ)上,研究構(gòu)建的服務(wù)于農(nóng)業(yè)科研創(chuàng)新的新一代農(nóng)業(yè)知識發(fā)現(xiàn)系統(tǒng)。該系統(tǒng)旨在全面匯聚與知識化組織融合的多源異構(gòu)農(nóng)業(yè)領(lǐng)域海量數(shù)據(jù)資源,實現(xiàn)資源統(tǒng)一搜索與關(guān)聯(lián)發(fā)現(xiàn),加強基于大數(shù)據(jù)的挖掘分析和知識計算,使得在面向不同用戶群體時,能提供專業(yè)化、個性化、動態(tài)化和集成化的知識發(fā)現(xiàn)增值服務(wù)。該系統(tǒng)體系架構(gòu)分為四個層次:多源異構(gòu)資源層、資源匯聚組織層、知識挖掘分析層、知識發(fā)現(xiàn)服務(wù)層(見圖1)。

圖1 農(nóng)業(yè)知識發(fā)現(xiàn)服務(wù)系統(tǒng)體系架構(gòu)

其中,多源異構(gòu)資源層是構(gòu)成整個系統(tǒng)的數(shù)據(jù)基礎(chǔ),其可整合利用的資源種類及規(guī)模都在不斷擴大,農(nóng)業(yè)科技信息大數(shù)據(jù)格局正在快速形成;資源匯聚組織層遵循統(tǒng)一元數(shù)據(jù)標(biāo)準(zhǔn)實現(xiàn)元數(shù)據(jù)匯聚,并基于分類主題詞表和本體關(guān)聯(lián)模型實現(xiàn)知識組織與多維語義關(guān)聯(lián),形成農(nóng)業(yè)綜合科技數(shù)字知識倉儲;知識挖掘分析層是系統(tǒng)的核心部分,通過集成應(yīng)用智能搜索、關(guān)聯(lián)發(fā)現(xiàn)、知識計算和可視分析等關(guān)鍵技術(shù),整合Primo等其他第三方資源/知識發(fā)現(xiàn)系統(tǒng),以最大程度實現(xiàn)倉儲中各類資源的可見性和可獲得性,并從中挖掘有價值的知識;知識發(fā)現(xiàn)服務(wù)層面向農(nóng)業(yè)科研創(chuàng)新和管理決策的用戶需求,提供人機友好交互的統(tǒng)一搜索發(fā)現(xiàn)、資源關(guān)聯(lián)導(dǎo)航、知識挖掘分析和專題服務(wù)等知識發(fā)現(xiàn)服務(wù)。

4 農(nóng)業(yè)知識發(fā)現(xiàn)服務(wù)探索重點

農(nóng)業(yè)知識發(fā)現(xiàn)服務(wù)旨在集資源、技術(shù)、知識和服務(wù)于一體,實現(xiàn)農(nóng)業(yè)信息資源整合并為用戶提供優(yōu)質(zhì)高效的知識服務(wù)。本文重點從以下方面論述研究實踐。

4.1農(nóng)業(yè)綜合科技數(shù)字知識倉儲構(gòu)建

4.1.1綜合科技數(shù)字資源體系建設(shè)

近年來,國家農(nóng)業(yè)圖書館資源建設(shè)在加快轉(zhuǎn)型。除做好學(xué)術(shù)期刊、圖書、會議錄、學(xué)位論文等傳統(tǒng)館藏文獻資源建設(shè)外,還引進標(biāo)準(zhǔn)、專利等特種文獻,開展國家農(nóng)業(yè)科學(xué)數(shù)據(jù)共享中心作物科學(xué)、農(nóng)業(yè)區(qū)劃、動物科學(xué)等專業(yè)領(lǐng)域科學(xué)數(shù)據(jù)資源的整合,加強政策綱要、科技報告和宏觀統(tǒng)計數(shù)據(jù)(人口、耕地、生產(chǎn)、貿(mào)易)等情報資源的收集整理,擴大農(nóng)業(yè)領(lǐng)域?qū)<覍W(xué)者、科技機構(gòu)、基金項目和學(xué)術(shù)期刊等規(guī)范庫建設(shè)規(guī)模,啟動開放獲取期刊論文、學(xué)位論文、圖書、會議錄、機構(gòu)倉儲和開放關(guān)聯(lián)數(shù)據(jù)集等開放資源的采集,實施農(nóng)業(yè)知識百科、專業(yè)術(shù)語、敘詞表和學(xué)科分類體系等知識組織體系的修訂完善等工作。至此,集商業(yè)購買、自主構(gòu)建和開放獲取于一體的多源、異構(gòu)農(nóng)業(yè)綜合科技數(shù)字資源體系正在形成。

4.1.2多源異構(gòu)資源匯聚與關(guān)聯(lián)融合

為適應(yīng)大數(shù)據(jù)環(huán)境下用戶多樣化、個性化、知識化服務(wù),以及內(nèi)容計算和深度分析的需求,本文綜合應(yīng)用元數(shù)據(jù)、詞表、本體和關(guān)聯(lián)數(shù)據(jù)等技術(shù)方法,對上述多源異構(gòu)資源開展集成匯聚、知識組織與語義關(guān)聯(lián)。首先,基于統(tǒng)一的元數(shù)據(jù)描述標(biāo)準(zhǔn)規(guī)范,通過元數(shù)據(jù)獲取、轉(zhuǎn)換、裝載以及數(shù)據(jù)互操作訪問接口等方式,實現(xiàn)對農(nóng)業(yè)領(lǐng)域科技文獻、科學(xué)數(shù)據(jù)、事實型數(shù)據(jù)、規(guī)范庫、宏觀情報資源等多源異構(gòu)資源的統(tǒng)一元數(shù)據(jù)存儲,完成資源初級匯聚整合;其次,綜合應(yīng)用分類主題詞表和本體關(guān)聯(lián)模型,進行各類資源的規(guī)范描述、主題概念與學(xué)科分類的標(biāo)引,以及對科研機構(gòu)、專家學(xué)者等實體對象的抽取和歸一[15],并顯性建立資源間多維度語義關(guān)聯(lián),在此基礎(chǔ)上構(gòu)建農(nóng)業(yè)綜合科技數(shù)字知識倉儲;最后,將各類資源發(fā)布為富含語義關(guān)聯(lián)關(guān)系的數(shù)據(jù)和知識網(wǎng)絡(luò),并與SFX等資源動態(tài)鏈接技術(shù)進行集成,從而將資源整合提升到知識組織與深度關(guān)聯(lián)融合的層次,最終為農(nóng)業(yè)領(lǐng)域知識發(fā)現(xiàn)與知識服務(wù),提供一個內(nèi)容密切關(guān)聯(lián)、多維立體、多層次、網(wǎng)絡(luò)化的綜合科技數(shù)字資源保障體系。

4.2多層次知識發(fā)現(xiàn)服務(wù)

4.2.1基于元數(shù)據(jù)搜索的統(tǒng)一發(fā)現(xiàn)

提供基于元數(shù)據(jù)搜索的統(tǒng)一發(fā)現(xiàn)是知識發(fā)現(xiàn)服務(wù)系統(tǒng)的“標(biāo)配”功能,也是各類資源深度聚合的進一步體現(xiàn),可提高資源統(tǒng)一發(fā)現(xiàn)的水平和能力。為解決異構(gòu)資源的組織、標(biāo)引和檢索問題,人們開始將搜索引擎和專業(yè)知識庫相結(jié)合。本文基于開源的企業(yè)級全文搜索引擎Solr和改進后的中、英文分詞器插件IKAnalyzer,建立各類資源元數(shù)據(jù)的多核索引(Multi-Core)體系[16-17]。其中,在建立索引過程中,綜合應(yīng)用農(nóng)業(yè)科學(xué)敘詞表、農(nóng)業(yè)百科、聯(lián)合國糧農(nóng)組織的多語種詞表AGROVOC,以及從文獻抽取的高頻關(guān)鍵詞(中、英文)等語料,提高資源切詞、分詞的準(zhǔn)確性和專業(yè)性[18]。

目前提供的統(tǒng)一搜索發(fā)現(xiàn)服務(wù),初步實現(xiàn)跨庫、跨資源、跨語言的一站式檢索、多維分面、學(xué)科導(dǎo)航、語義擴展等功能。基于詞表及詞間語義關(guān)系,從概念匹配的角度建立語義交互,初步實現(xiàn)對自然語言檢索式進行語義淺層理解、分析、匹配,提供相近檢索詞提示和中、英文智能檢索等功能,提供按資源類型、學(xué)科分類和TopN等多種分類和排序方式對檢索結(jié)果進行過濾、聚合與導(dǎo)引,方便用戶快速過濾定位所需資源;系統(tǒng)還集成了ExLibris公司動態(tài)鏈接產(chǎn)品SFX,為文獻資源建立情景敏感的多種全文獲取路徑;此外,系統(tǒng)也提供實體命中功能,可根據(jù)不同輸入主動輸出用戶關(guān)注的核心內(nèi)容,如對命中的科研人員、科研機構(gòu)、基金項目等實體對象優(yōu)先展示,也提供類似百度“框計算”的嵌入式APP深度分析服務(wù)結(jié)果,如搜索“水稻”,將直接命中產(chǎn)量分析APP,在地圖上展示水稻產(chǎn)量統(tǒng)計、預(yù)測和對比分析結(jié)果。

4.2.2基于語義的多維知識關(guān)聯(lián)發(fā)現(xiàn)

在第二屆世界互聯(lián)網(wǎng)大會開幕式上,習(xí)近平指出:“網(wǎng)絡(luò)的本質(zhì)在于互聯(lián),信息的價值在于互通”[19]。大數(shù)據(jù)的巨大價值在于依據(jù)數(shù)據(jù)間關(guān)聯(lián)性而建立的復(fù)雜關(guān)系網(wǎng)絡(luò)中蘊含的知識[20]?;诳蒲斜倔w語義關(guān)聯(lián)模型驅(qū)動(見圖2a),農(nóng)業(yè)知識發(fā)現(xiàn)系統(tǒng)實現(xiàn)了“知識立方”和“專家學(xué)術(shù)圈”等功能,以直觀、可視化、多維度立體展示系統(tǒng)中人與人、人與知識、知識與知識、知識與機構(gòu)、機構(gòu)與人、機構(gòu)與機構(gòu)等資源間的關(guān)聯(lián)關(guān)系[21]。例如,檢索“大豆”時,“知識立方”模塊以檢索詞“大豆”為中心,檢索并可視展示相關(guān)概念、專家、機構(gòu)、科學(xué)數(shù)據(jù)等資源及其相互間關(guān)聯(lián)關(guān)系(見圖2b)?!皩<覍W(xué)術(shù)圈”以專家為中心展示Profile、學(xué)術(shù)論文、基金項目、科技成果等信息,以及合著關(guān)系等的可視化關(guān)聯(lián)展示,系統(tǒng)還提供共詞作者、共詞機構(gòu)、相似文獻等自動推薦功能。

圖2 基于語義的多維知識關(guān)聯(lián)發(fā)現(xiàn)

農(nóng)業(yè)知識發(fā)現(xiàn)服務(wù)系統(tǒng)通過引入本體模型和簡單推理規(guī)則,以科技文獻為基礎(chǔ),與其他科技資源進行碎片化深度聚合,組合成一個高度集成的信息資源體系,初步實現(xiàn)內(nèi)容的整合和語義上的無縫鏈接。通過計算分析處理,可根據(jù)知識與檢索主題間的語義相關(guān)程度為用戶呈現(xiàn)結(jié)構(gòu)清晰的知識體系,幫助用戶快速形成對相關(guān)知識和信息的結(jié)構(gòu)性認(rèn)識。系統(tǒng)通過將各類資源不同粒度知識單元基于內(nèi)容和外部特征進行多重關(guān)聯(lián)與揭示,自動擴展相關(guān)資源發(fā)現(xiàn)的范圍,提高資源發(fā)現(xiàn)的動態(tài)性與完整性,從而為用戶提供更加精準(zhǔn)和智能的知識發(fā)現(xiàn)服務(wù)。

4.2.3基于深度融合的知識挖掘分析

大數(shù)據(jù)環(huán)境下,知識發(fā)現(xiàn)服務(wù)系統(tǒng)除應(yīng)具備強大的統(tǒng)一檢索和關(guān)聯(lián)導(dǎo)航功能外,還需以結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化大數(shù)據(jù)的知識組織及關(guān)聯(lián)融合為基礎(chǔ),綜合應(yīng)用數(shù)據(jù)挖掘、機器學(xué)習(xí)和推理技術(shù),通過可視化技術(shù),動態(tài)、直觀地展現(xiàn)海量信息資源中潛在的規(guī)律和發(fā)展趨勢[22]。

目前,在農(nóng)業(yè)知識發(fā)現(xiàn)服務(wù)探索中,基于知識計算、文獻計量分析、知識脈絡(luò)分析等方法,初步實現(xiàn)基于學(xué)術(shù)論文、專利和科技成果等資源的科研產(chǎn)出分析,包括年度產(chǎn)出趨勢、研究主題分布、核心機構(gòu)、核心作者、基金項目等學(xué)術(shù)成果統(tǒng)計分析,以及科研人員、機構(gòu)科研能力變化趨勢等挖掘分析,初步建立基于數(shù)據(jù)和圖表的動態(tài)分析機制和初級技術(shù)產(chǎn)品。這些功能有助于用戶最直觀、快速地了解某一領(lǐng)域的領(lǐng)軍專家和核心機構(gòu),也有助于同一領(lǐng)域相關(guān)學(xué)者追蹤領(lǐng)域最新研究進展。更具有實踐價值和探索意義的挖掘分析,還包括正在嘗試的跨領(lǐng)域數(shù)據(jù)關(guān)聯(lián)打通和深度融合,與相關(guān)領(lǐng)域?qū)<疑疃群献?,綜合應(yīng)用農(nóng)業(yè)資源遙感、監(jiān)測數(shù)據(jù)、氣象數(shù)據(jù)、宏觀經(jīng)濟統(tǒng)計等多領(lǐng)域數(shù)據(jù),開展農(nóng)業(yè)區(qū)劃、作物空間布局、貿(mào)易網(wǎng)絡(luò)、糧食進出口匯率因素等深度挖掘分析(見圖3)。

圖3 基于深度融合的知識挖掘分析

4.2.4面向特定需求的專題知識發(fā)現(xiàn)

在數(shù)據(jù)種類及規(guī)模龐大、信息價值密度低的大數(shù)據(jù)環(huán)境下,完全基于系統(tǒng)提供資源和知識發(fā)現(xiàn)服務(wù),無法滿足不同類型、不同層次用戶的個性化需求。因此,圖書館等信息服務(wù)機構(gòu),須借助于館場物理空間,基于技術(shù)驅(qū)動,發(fā)揮人類的智慧,三位一體面向特定需求,積極探索提升大數(shù)據(jù)驅(qū)動的知識發(fā)現(xiàn)服務(wù)在時效性、精確性、全面性和針對性等個性化專題服務(wù)方面的能力,這將是信息服務(wù)機構(gòu)應(yīng)對其他資源發(fā)現(xiàn)系統(tǒng)、學(xué)術(shù)搜索引擎的激烈競爭,體現(xiàn)自身存在價值的有效舉措[23]。

在農(nóng)業(yè)知識發(fā)現(xiàn)系統(tǒng)研究實踐過程中,本文也在積極探索構(gòu)建個性化、深層次的知識服務(wù)體系,包括面向研究所、課題組和個人的數(shù)字化科研信息環(huán)境,以及面向?qū)W科領(lǐng)域的個性化專題知識服務(wù)系統(tǒng)。隨著匯聚和挖掘利用多源異構(gòu)農(nóng)業(yè)大數(shù)據(jù)資源技術(shù)方法的逐步完善,本文開始嘗試結(jié)合國家重大戰(zhàn)略需求和重點領(lǐng)域開展面向特定用戶群體的個性化服務(wù)。例如,通過選取糧食安全領(lǐng)域,基于大數(shù)據(jù)資源和農(nóng)業(yè)知識發(fā)現(xiàn)系統(tǒng),經(jīng)過領(lǐng)域資源動態(tài)抽取和技術(shù)平臺開發(fā),初步構(gòu)建糧食與食物安全專題服務(wù)平臺?;谠撈脚_的學(xué)科館員等服務(wù)人員可為糧食安全領(lǐng)域的用戶提供一站式資源檢索與獲取、情報分析等深層次知識服務(wù),初步建立“線上+線下”的綜合服務(wù)模式,并獲得用戶的充分肯定與好評。

5 結(jié)束語

大數(shù)據(jù)環(huán)境下,科研信息環(huán)境和科研方式正發(fā)生巨大變革,信息過載和選擇困惑越來越困擾科技人員,人與大規(guī)模數(shù)據(jù)間的交互已成為重要議題。受限于對各類資源獲取的全面性、時效性,以及知識組織和語義關(guān)聯(lián)等基礎(chǔ)性、工程化工作的熟練化程度,本文研究構(gòu)建的農(nóng)業(yè)知識發(fā)現(xiàn)系統(tǒng)還有更多工作需要深入推進,包括從語義層面推進農(nóng)業(yè)科技大數(shù)據(jù)資源的匯聚融合、語義搜索和語義知識發(fā)現(xiàn)等技術(shù)的應(yīng)用,實現(xiàn)多源異構(gòu)農(nóng)業(yè)綜合科技資源的全面匯聚、知識組織與關(guān)聯(lián)融合,并緊密結(jié)合國家重大戰(zhàn)略、農(nóng)業(yè)科技創(chuàng)新和管理決策需求,提供農(nóng)業(yè)綜合科技大數(shù)據(jù)資源保障,以及個性化、深層次、智能化的語義知識發(fā)現(xiàn)服務(wù)。

[1] HEY T,TANSLER S,TOLLE K.The fourth paradigm:Data-intensive scientific discovery [M]. [S.1.]:Microsoft Research, 2009.

[2] 王寧.淺析大數(shù)據(jù)背景下的數(shù)字圖書館知識發(fā)現(xiàn)系統(tǒng)[J].圖書館工作與研究,2016(4):58-61.

[3] CICCONE K,VICKERY J.Summon,EBSCO discovery service, and Google Scholar:a comparison of search performance using user queries[J].Evidence Based Library & Information Practice,2015,10(1):34-49.

[4] GEWIRTZ S R, NOVAK M, PARSONS J. Evaluating the intersection between WorldCat Local and student research[J].Journal of Web Librarianship, 2014, 8(2):113-124.

[5] EBSCOhost Research Databases.Free databases from EBSCO[EB/ OL].[2016-08-02].https://www.ebscohost.com/.

[6] Empowering libraries to shape the discovery experience[EB/OL].[2016-08-02].http://www.exlibrisgroup.com/files/ Primo_Brochure-2016.pdf.

[7] 蘇建華.圖書館選擇資源發(fā)現(xiàn)系統(tǒng)的策略分析——以資源發(fā)現(xiàn)系統(tǒng)與學(xué)術(shù)搜索引擎的比較為視角[J].情報科學(xué),2015(6):91-94,105.

[8] 謝奇,李立立,畢玉俠.五大學(xué)術(shù)搜索引擎比較[J].情報探索,2015(11):42-46.

[9] The Hague DECLARATION.The Hague declaration on knowledge discovery in the digital age[EB/OL].[2015-06-07].http://thehaguedeclaration.com/thehague-declaration-on-knowledge-discovery-in-the-digitalage/.

[10] 盛東方,孫建軍.基于語義搜索引擎的學(xué)科知識服務(wù)研究——以GoPubMed為例[J].圖書情報知識,2015(4):113-120.

[11] 覃燕梅.百度學(xué)術(shù)搜索與超星發(fā)現(xiàn)系統(tǒng)比較分析及評價[J].現(xiàn)代情報,2016(3):48-52,60.

[12] 王悅辰.國內(nèi)四大中文知識發(fā)現(xiàn)系統(tǒng)比較分析[J].圖書館工作與研究,2015(9):42-45.

[13] 曾建勛.資源發(fā)現(xiàn)系統(tǒng)的顛覆性[J].數(shù)字圖書館論壇,2016(2):1.

[14] 劉江玲.面向大數(shù)據(jù)的知識發(fā)現(xiàn)系統(tǒng)研究[J].情報科學(xué),2014(3):90-92,101.

[15] 夏立新,陳晨,王忠義.基于多維度聚合的網(wǎng)絡(luò)資源知識發(fā)現(xiàn)框架研究[J].情報科學(xué),2016(5): 3-8.

[16] VOHRA D. Pro Docker[M].Berkeley:Berkeley CA Apress,2015:195-218.

[17] 朱明瀚. 基于數(shù)據(jù)倉庫的數(shù)據(jù)搜索引擎設(shè)計與實現(xiàn)[D].上海:華東理工大學(xué),2015.

[18] CARACCIOLO C,STELLATO A,MORSHED A,et al.The AGROVOC linked dataset[EB/OL].[2016-08-02].http://eprints.rclis.org/17010/1/AGR OVOC%20Dataset_vFinal_Preprint.pdf.

[19] 習(xí)近平.在第二屆世界互聯(lián)網(wǎng)大會開幕式上的講話[J].中國信息安全,2016(1):24-27.

[20] 劉文遠(yuǎn),李少雄,王曉敏,等.大數(shù)據(jù)知識發(fā)現(xiàn)[J].燕山大學(xué)學(xué)報, 2014(5): 377-380.

[21] 張艷新,楊瑜.中文檢索平臺知識發(fā)現(xiàn)功能比較研究[J].情報探索,2016(1):80-84,89.

[22] 王峰,劉燕,王學(xué)光.論知識服務(wù)中海量數(shù)據(jù)的知識挖掘與發(fā)現(xiàn)[J].情報探索,2013 (8):43-45,49.

[23] 楊亮,雷智雁.大數(shù)據(jù)環(huán)境下圖書館個性化服務(wù)研究[J].現(xiàn)代情報,2014,34(4):74-77.

Study on Agricultural Knowledge Discovery Service in Big Data Environment

ZHAO RuiXue, XIAN GuoJian, KOU YuanTao, GU LiangLiang, ZHU Liang
(Agricultural Information Institute of CAAS, Beijing 100081, China)

In big data environment, research and build a new generation of knowledge discovery system to meet the new needs of users, that is the challenges and also opportunities faced by professional information institutions such as libraries. This paper firstly analyzed the latest progress of several well-known resource and knowledge discovery systems, and designed the architecture of agriculture domain-specified knowledge discovery systems, and then detailed the progress, including the integration and fusion of the multi-source heterogeneous information resources, unified search based on metadata warehouse, multi-dimensional knowledge discovery based on semantic association, data mining based on knowledge fusion and specific requirement oriented personalized service.

Big Data; Resource Discovery; Knowledge Discovery; Resource Aggregation; Knowledge Service

G254

10.3772/j.issn.1673-2286.2016.9.005

趙瑞雪,女,1968年生,研究員,博士生導(dǎo)師,研究方向:信息管理與信息系統(tǒng)、信息資源管理、知識組織及數(shù)字圖書館,E-mail:zhaoruixue@caas.cn。

鮮國建,男,1982年生,博士,副研究館員,研究方向:知識組織、關(guān)聯(lián)數(shù)據(jù),通訊作者,E-mail:xianguojian@caas.cn。

2016-08-29)

* 本研究得到“中國農(nóng)業(yè)科學(xué)院科技創(chuàng)新工程”項目(編號: CAAS-ASTIP-2016-AII)資助。

猜你喜歡
農(nóng)業(yè)知識關(guān)聯(lián)語義
語言與語義
“一帶一路”遞進,關(guān)聯(lián)民生更緊
新媒體在農(nóng)業(yè)知識科普宣傳中的應(yīng)用探究
新媒體研究(2019年2期)2019-03-29 12:05:58
奇趣搭配
論廣播記者如何做好“三農(nóng)”新聞報道
采寫編(2017年3期)2017-07-21 11:15:24
智趣
讀者(2017年5期)2017-02-15 18:04:18
苗木繁育技能訓(xùn)練通識教育課程探索與實踐
“上”與“下”語義的不對稱性及其認(rèn)知闡釋
認(rèn)知范疇模糊與語義模糊
農(nóng)業(yè)知識云服務(wù)設(shè)計與實現(xiàn)
武陟县| 庆安县| 秦安县| 牡丹江市| 尤溪县| 木兰县| 陈巴尔虎旗| 阿巴嘎旗| 股票| 隆回县| 朔州市| 安溪县| 安顺市| 顺昌县| 务川| 拜泉县| 双桥区| 东乡| 马边| 华亭县| 剑河县| 揭西县| 商水县| 林甸县| 紫阳县| 阳朔县| 当涂县| 杭锦后旗| 秦皇岛市| 陇西县| 修武县| 齐齐哈尔市| 马公市| 平果县| 上杭县| 会东县| 孟村| 元氏县| 建始县| 定南县| 衢州市|