国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

信息服務中的知識組織系統(tǒng)及應用研究

2018-01-02 17:33曾文劉敏
圖書與情報 2017年3期
關鍵詞:信息服務

曾文+劉敏

摘 要:隨著信息技術的發(fā)展,我國信息服務業(yè)正由知識生產(chǎn)型向知識服務型轉(zhuǎn)變。知識組織系統(tǒng)是實現(xiàn)數(shù)據(jù)信息化增效和知識服務增值,以及大數(shù)據(jù)知識資源和知識服務能力的共享基礎。因此,如何建設知識組織系統(tǒng),以提供有效的信息服務是目前知識組織系統(tǒng)應用的關鍵問題之一。文章介紹了國內(nèi)外信息服務中的知識組織系統(tǒng)及應用情況,分析了國內(nèi)知識組織系統(tǒng)應用中存在的問題和原因,并闡述知識組織系統(tǒng)的構(gòu)建需要重點解決的問題,提出知識組織系統(tǒng)的基本框架和構(gòu)建方法。

關鍵詞:信息服務;知識組織系統(tǒng);知識資源;知識服務能力

中圖分類號:G254.29 文獻標識碼:A DOI:10.11968/tsyqb.1003-6938.2017050

Abstract With the development of information technology, the information service in our country is changing from knowledge production to knowledge service. Knowledge organization system is to realize data information efficiency and knowledge value-added services, and knowledge resources and knowledge service of big data sharing. Therefore, how to construct the knowledge organization system to provide effective information services is one of the key problems in the application of knowledge organization system at present. This paper describes the knowledge organization system and its application conditions, analyzes the problems and reasons of domestic application of knowledge organization system, and expounds the framework and key solutions of constructing knowledge organization system.

Key words information service; knowledge organization system; knowledge resources; knowledge service ability

1 引言

隨著大數(shù)據(jù)時代的到來,不同類型和來源的信息數(shù)據(jù)資源規(guī)模與日俱增,如何從這些龐大復雜的數(shù)據(jù)信息中獲取知識,實現(xiàn)有效的知識組織和知識揭示是我國知識組織系統(tǒng)建設和應用的重要方向之一。知識組織系統(tǒng)是定義、描述客觀物質(zhì)世界信息及其相互關系的術語和符號系統(tǒng),其對各種信息資源按照知識的內(nèi)容和結(jié)構(gòu)進行合理的描述和組織,實現(xiàn)知識的導航、檢索以及關聯(lián)。本文通過調(diào)研國內(nèi)外知識組織系統(tǒng)的信息服務應用實例,探討國內(nèi)知識組織系統(tǒng)應用存在的問題和原因以及知識組織系統(tǒng)的框架和構(gòu)建方法,從而為實現(xiàn)更有效的信息服務奠定基礎。

2 知識組織系統(tǒng)研究現(xiàn)狀述評

知識組織系統(tǒng)主要用于闡述某種概念、概念屬性以及概念之間的關系,是聯(lián)系用戶的信息需求和信息資源之間的橋梁,是信息資源建設的核心問題。知識組織系統(tǒng)的應用[1-2]涉及:(1)通過概念、概念屬性及概念之間關系的表達,控制同義詞和近義詞,將信息按照一定的結(jié)構(gòu)構(gòu)建知識庫,通過對信息數(shù)據(jù)的描述、組織和已有的概念知識之間的關系,支持對信息資源檢索的語義理解、規(guī)范和導航;(2)通過建立的概念或知識,概念地圖、主題圖和本體,提高檢索和服務效率,促進領域?qū)<抑R的共享和交流;(3)依據(jù)知識組織系統(tǒng)的概念及關系,可對信息進行概念分析、分類、標引等處理,實現(xiàn)基于語義的檢索,便于全面深入揭示信息、信息之間的關系及其在整個知識組織系統(tǒng)中的位置[3-4]。知識組織系統(tǒng)的目的是在現(xiàn)有資源和用戶需求分析的基礎上,實現(xiàn)對數(shù)據(jù)資源和內(nèi)容的最大化描述,以提供符合用戶需求的數(shù)據(jù)資源。為此,本文調(diào)研和分析了國內(nèi)外知識組織系統(tǒng)及其應用情況(見表1)。

通過研究發(fā)現(xiàn),國內(nèi)現(xiàn)有的以文獻為基礎的知識組織系統(tǒng),除中國知網(wǎng)(CNKI)和百度百科外,多數(shù)是將已有的詞表或詞匯集進行改造而得到領域單一、傳統(tǒng)意義上的知識組織系統(tǒng),這種模式下的知識組織系統(tǒng)在應用中是存在局限性的。相比國外,國內(nèi)的知識組織系統(tǒng)成功應用案例較少,即使較為成功的中國知網(wǎng)(CNKI)和百度百科的知識組織系統(tǒng),也均未達到國外的知識組織系統(tǒng)應用水平。其它如國家科技圖書文獻中心(NSTL)對信息數(shù)據(jù)資源提供的檢索服務和知識導航服務極為有限,部分文獻僅能以卡片方式檢索;提供聯(lián)機檢索部分的資源,只限于字符串簡單匹配;沒有提供對資源的導航瀏覽;更沒有從多個角度去展示信息資源;沒有對眾多的電子信息資源提供集成的統(tǒng)一檢索,導致不同的數(shù)據(jù)庫需要到各自的數(shù)據(jù)庫網(wǎng)站進行檢索。此外,在信息資源獲取方式上基本是以下訂單、Email獲取方式為主,這與當前的主流技術,直接實時下載資源等方式相比,既存在人力消耗問題,也增加了用戶的等待時間。如何從多個角度來深度揭示信息資源的知識、提供多種信息資源導航與集成檢索服務,并盡量讓用戶能實時獲取知識?造成這種現(xiàn)狀的主要原因有以下三點:

(1)信息資源狀況是影響知識組織系統(tǒng)設計和應用的一個重要因索。信息資源數(shù)量越多、類型越多對于知識組織系統(tǒng)的要求也越高。對于不同的信息資源情況和不同的應用需求,應根據(jù)實際情況來設計和實現(xiàn)知識組織系統(tǒng)。綜合性信息資源的組織要求綜合性的知識組織系統(tǒng),專業(yè)性信息資源的組織,最好設計具有針對某個具體的領域或?qū)W科的專業(yè)知識組織系統(tǒng)。普通綜合性信息資源的知識組織系統(tǒng)以全、泛為主,而專業(yè)性知識組織系統(tǒng)的設計則以精細為目的,并能針對學科的特色來構(gòu)建。對于資源數(shù)量巨大、載體類型豐富、學科專業(yè)豐富的知識組織系統(tǒng)的設計,必然要求精細化和多樣化,從而實現(xiàn)從多緯度揭示、有效的集成組織和檢索信息資源的目的。endprint

(2)知識組織的專業(yè)性與信息質(zhì)量的不對稱性。作為知識組織系統(tǒng)的重要組成部分詞表(敘詞表、主題詞表等),是信息組織和服務的重要工具,其與文獻的結(jié)合實際上是一種“高端”產(chǎn)業(yè),詞表作為圖書情報領域的專業(yè)性工具,其權(quán)威性和專業(yè)性是不容置疑的,是支持信息組織和服務的主要工具之一,國外著名的檢索機構(gòu)同樣需要詞表來做知識服務的支撐,但信息服務效果的另一個重要因素是信息資源數(shù)據(jù)的基礎標引工作,以科技文獻為例,國外的科技文獻基本是按敘詞表受控詞的規(guī)范經(jīng)過嚴格標引的,因此信息檢索和知識服務的精確性較好,而國內(nèi)尚無機構(gòu)和人員做類似的基礎工作。因此,國內(nèi)不同領域和規(guī)模的詞表盡管數(shù)目很多,但是利用詞表實現(xiàn)文獻檢索和多領域知識導航服務的功能并未有很好的實現(xiàn)。目前國內(nèi)的知識組織系統(tǒng)應用的現(xiàn)實情況基本是:檢全率有余,但準確率差,且運行代價相對大且慢。

(3)缺乏可用的知識組織語義互操作實施標準和規(guī)范。語義互操作是網(wǎng)絡環(huán)境下信息服務面臨的主要問題之一,是指系統(tǒng)間共享的數(shù)據(jù)能夠在充分定義的領域概念水平上得到理解的能力。語義上的互操作需要統(tǒng)一的規(guī)范,如概念的表示模式、同義概念歸并與語義規(guī)范化、歧義概念的處理等需要依據(jù)一定的規(guī)范和標準來處理。由于國內(nèi)互操作相關標準的制定和發(fā)展很不成熟,導致國內(nèi)詞表集成、詞表與分類表的集成等基本處于“各自為政”的狀態(tài),共享性較差。只有在統(tǒng)一的規(guī)范和標準下,通過機器輔助的人工干預方式進行同義概念歸并,歧義概念處理,生成規(guī)范化概念名稱和概念、唯一標識符,繼承與規(guī)范化來源表重要編碼,構(gòu)建多層次的術語類型和結(jié)構(gòu)化語義網(wǎng),才能較好地支持具有不同詞表的計算機系統(tǒng)之間進行高效和無歧義的數(shù)據(jù)交互。并通過概念組織數(shù)據(jù),界定各來源表的同義概念,為其提供語義規(guī)范化形式的名稱和概念唯一標識符,使得一定抽象水平上的同義概念都能連接到同一個標準化名稱和代碼,這是實現(xiàn)信息系統(tǒng)語義互操作的基本機制。

3 知識組織系統(tǒng)構(gòu)建需解決的關鍵問題

3.1 知識組織的統(tǒng)一表示

知識組織系統(tǒng)需要統(tǒng)一的表示形式、規(guī)范和技術接口,從而集成其它行業(yè)性分類法、主題詞表、兼容現(xiàn)有多種格式的主題詞表。傳統(tǒng)主題詞表是信息資源管理中重要的知識組織工具。隨著基于內(nèi)容的信息處理需求增長,主題詞表作為一個知識體系已經(jīng)成為概念之間可視化分析和演變分析的重要支撐工具。主題詞表的專業(yè)化發(fā)展為領域信息資源的管理帶來了方便,同時也帶來了一些問題。如交叉學科通常是研究活躍的領域,在一篇前沿論文的關鍵詞中,常常會涉及到跨多個領域的術語。一部單個領域的詞表往往很難全面覆蓋這些詞匯。另外,各個行業(yè)所編制的主題詞表的存儲方式也并不統(tǒng)一,這為構(gòu)建知識組織系統(tǒng)帶來諸多不便。主題詞表編制者(領域?qū)<遥母髯缘念I域出發(fā)編制主題詞表,而主題詞表用戶(信息技術專家)則希望能夠通過統(tǒng)一的軟件接口訪問不同領域的各種主題詞表。因此,跨領域、多來源的兼容化、集成化是以主題詞表為代表的知識組織系統(tǒng)需要解決的重要問題之一,必須建立知識組織系統(tǒng)統(tǒng)一的詞表表示形式、規(guī)范和技術接口,從而集成其它行業(yè)性分類法、主題詞表、兼容現(xiàn)有多種格式的主題詞表。

3.2 知識組織的語義集成

知識組織系統(tǒng)集成不僅是簡單詞表之間的合并,更是實現(xiàn)對不同知識組織系統(tǒng)中的詞、概念和關系的集成。消除詞表之間的語義沖突,形成一致的集成詞表。在語義集成的過程中,除了需要實現(xiàn)結(jié)構(gòu)層和詞語概念層的一致性處理,還需要通過對信息資源的挖掘技術發(fā)現(xiàn)詞語之間深層次的語義關聯(lián)[5],包括:(1)同義詞和多義詞集成。在跨領域和多來源詞表中,不可避免會遇到同義詞和多義詞問題,這兩類問題可以通過字形層面的融合實現(xiàn)集成;(2)概念映射。兩個主題詞表的概念之間,可能存在多種關系,如完全相等 、不完全相等(大部分相等、小部分相等),可通過概念映射建立映射文件來解決;(3)概念集成。由于屬分關系在不同的主題詞表中,有各種不同的含義,所以概念集成的重點是概念間屬分關系的發(fā)現(xiàn)問題;(4)關系集成。詞表的集成,不僅是同型概念的映射集成,還需通過對數(shù)據(jù)的挖掘,發(fā)現(xiàn)跨領域的詞表術語之間的新的關聯(lián)關系。

3.3 用戶的行為數(shù)據(jù)分析

分析和利用用戶行為信息的目的是支持知識組織系統(tǒng)的服務,用戶行為信息產(chǎn)生于用戶與知識組織系統(tǒng)交互的過程中,對其進行分析發(fā)現(xiàn)用戶行為規(guī)則和模式,達到快速反饋知識服務的目的。目前已有的用戶行為分析研究主要集中在知識組織系統(tǒng)構(gòu)建已完成后的方法研究,而且研究范圍局限于對用戶行為影響因素分析,對知識服務的主動性欠缺。本文認為:用戶的行為數(shù)據(jù)分析一方面是一個對積累的用戶行為數(shù)據(jù)進行分析的過程,另一方面是如何相對實時跟蹤和獲取用戶行為數(shù)據(jù)參與知識挖掘的過程。所以,構(gòu)建包含用戶行為的知識組織系統(tǒng)框架,借助數(shù)據(jù)分析技術和方法,將用戶行為分析作為“知識”,實現(xiàn)知識組織系統(tǒng)針對性的知識組織,才能更好地為用戶提供有效的主動式信息服務。

4 信息服務中的知識組織系統(tǒng)框架與構(gòu)建方法

4.1 知識組織系統(tǒng)的基本框架

國外知識組織系統(tǒng)的研究和應用日趨多元化[6-7],應用實例不再局限于傳統(tǒng)知識組織系統(tǒng)提供的方法和技術,結(jié)合計算機存儲技術、檢索技術、大數(shù)據(jù)技術等支持更豐富和完善的知識服務[8]。如利用知識組織系統(tǒng)之間的互操作方法和技術,支持不同知識組織系統(tǒng)的數(shù)據(jù)資源進行有效整合和檢索;基于Web構(gòu)建和整合數(shù)字環(huán)境,通過檢索技術和基于內(nèi)容的鏈接能力,將高質(zhì)量的信息資源、信息分析工具和信息管理軟件無縫整合;通過語義匹配和推理,查找具有相關語義內(nèi)容的文檔,將滿足不同需求的相關信息進行組織,建立基于語義技術的文獻和知識的瀏覽及導航;不以傳統(tǒng)的分類表和詞表作為知識組織系統(tǒng)的分類和組織工具,而是基于數(shù)據(jù)資源內(nèi)容特點,構(gòu)建新的數(shù)據(jù)分類和組織體系。此外,根據(jù)用戶需求和信息資源特點,靈活構(gòu)建適用的知識組織系統(tǒng)則更具實用性[9]。因此,本文提出知識組織系統(tǒng)構(gòu)建框架??蚣苤饕ㄋ牟糠郑夯A平臺層、數(shù)據(jù)資源層、業(yè)務層和服務層。其中基礎平臺層是知識組織系統(tǒng)的平臺系統(tǒng),即操作系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng);數(shù)據(jù)資源層指知識的數(shù)據(jù)源,是知識準備的基礎,重點涉及用于知識抽取的各種類型語料庫,已有的知識組織系統(tǒng)資源數(shù)據(jù)及用戶行為資源數(shù)據(jù);業(yè)務層是知識組織系統(tǒng)的功能層,其主要實現(xiàn)知識的加工,傳統(tǒng)知識組織系統(tǒng)的集成、更新和擴展,以及用戶行為知識的分析;服務層主要實現(xiàn)面向用戶的服務,主要涉及信息檢索服務,信息知識的組織和導航、知識組織系統(tǒng)的可視化以及接口服務等(見圖1)。其與傳統(tǒng)知識組織系統(tǒng)構(gòu)建框架的主要不同之處是在數(shù)據(jù)、功能和服務上耦合度和集成度更大,具備集成傳統(tǒng)知識組織系統(tǒng)和知識重新構(gòu)建的雙重功能,且數(shù)據(jù)資源層增加了用戶行為資源數(shù)據(jù),業(yè)務層增加用戶行為知識分析功能,從而使知識組織系統(tǒng)的信息服務更符合用戶的實際需求。endprint

4.2 知識組織系統(tǒng)構(gòu)建的基本方法

(1)知識準備。主要包括兩個方面:一是基于領域的知識準備,這類知識指詞條基本信息、詞條定義及注釋知識、詞條之間的關系知識、詞條的屬性知識及分類知識。這些信息可通過領域數(shù)據(jù)或已有領域詞表信息中獲?。欢腔谟脩舻闹R組織準備。用戶的知識準備是伴隨知識組織系統(tǒng)的使用過程中,通過組織用戶行為中而發(fā)現(xiàn)的知識,如用戶與知識的“會話”信息(如瀏覽的檢索詞),用戶的目標知識信息(如某個文獻)、知識的排序信息等。用戶的行為知識可以通過分析和挖掘這些信息及信息之間的關聯(lián)關系而得到。

(2)知識獲取、組織與集成。數(shù)據(jù)的知識發(fā)現(xiàn)、組織和集成技術的目的之一是實現(xiàn)知識的跟蹤和推理。結(jié)合用戶行為數(shù)據(jù)的分析結(jié)果,從數(shù)據(jù)中挖掘出知識特點,通過建立科學的推理模型,并通過模型帶入新的數(shù)據(jù),從而推理未來的數(shù)據(jù)知識。對于結(jié)構(gòu)化數(shù)據(jù)中知識的獲取,已有很多研究,在目前大數(shù)據(jù)環(huán)境下,非結(jié)構(gòu)化數(shù)據(jù)的多元化給知識識別、組織和集成等技術的實現(xiàn)帶來相比結(jié)構(gòu)化數(shù)據(jù)更大的分析難度,因此需要重點解決如何從非結(jié)構(gòu)化數(shù)據(jù)中獲取知識。研究方法上應更關注非結(jié)構(gòu)化數(shù)據(jù)的知識特點,從而得到知識識別的技術要素,設計有效的知識識別技術,并在此基礎上,對行業(yè)數(shù)據(jù)進行知識的分類和組織,以及一定程度的知識集成。

(3)知識的語義分析。語義分析的核心意義之一是建立數(shù)據(jù)的語義關聯(lián),從而層次化和有序化的揭示數(shù)據(jù)中的核心內(nèi)容,提取有效的數(shù)據(jù)信息。在知識組織系統(tǒng)的生產(chǎn)和服務中,語義分析技術可以輔助用戶生產(chǎn)和加工有效數(shù)據(jù),建立歷史與現(xiàn)實數(shù)據(jù)知識的智能化關聯(lián)。知識的語義分析應建立在符合行業(yè)數(shù)據(jù)特點的知識語義表示,描述標準和規(guī)范基礎上,能夠解決符合數(shù)據(jù)特點的細粒度知識加工和符合數(shù)據(jù)特點的知識獲取和關聯(lián)技術。

(4)符合用戶行為的知識組織和服務。知識組織系統(tǒng)的目的是服務用戶,其不僅僅是通過文獻或其它類型的數(shù)據(jù)資源庫來提供信息和知識服務,更需要結(jié)合用戶行為實現(xiàn)有效的知識組織,再利用可視化方法和技術為用戶提供顯性知識和隱性知識的可視化展示。顯性知識組織的可視化可支持用戶的查詢和知識導航,通過知識的組織和分類快速定位用戶需要的信息。隱性知識組織的可視化則針對用戶行為和知識需求,進行用戶所需知識的分析和組織,提供知識檢索優(yōu)化、推薦等深層次的知識服務。

5 結(jié)語

無論是傳統(tǒng)的文獻資源,還是現(xiàn)代的網(wǎng)絡信息資源,知識組織系統(tǒng)仍是信息組織和服務的基礎,知識組織系統(tǒng)通過在用戶需求和信息資源之間以及多類型信息資源之間建立關聯(lián),達到對信息資源的集成管理、深度挖掘和高效利用,對于更好的建立信息資源索引、瀏覽和展示信息資源等方面將具有巨大的作用[10]。本文通過對國內(nèi)外知識組織系統(tǒng)及應用的分析,提出新的知識組織系統(tǒng)框架和構(gòu)建方法,下一步將對知識組織框架的實現(xiàn)和應用做深入研究。

參考文獻:

[1] 趙蔚,劉秀琴,邱百爽.語義網(wǎng)自適應學習系統(tǒng)中領域本體的構(gòu)建[J].吉林大學學報(信息科學版),2008(5):514-518.

[2] 王蘭成,敖毅,曾瓊.國外知識組織技術研究的現(xiàn)狀、實踐與熱點[J].中國圖書館學報,2008,34(2):93-97.

[3] 曲建峰,李芳,張軼華,等.知識組織系統(tǒng)自動映射規(guī)則研究與實現(xiàn)——以《杜威十進分類法》和《中國圖書館分類法》為例[J].現(xiàn)代圖書情報技術,2012(10):83-88.

[4] 王景俠.知識組織的工具及其語義互操作方法體系[J].數(shù)字圖書館論壇,2013,(5):41-46.

[5] 董慧,徐雷,王菲,等.語義分析系統(tǒng)研究(I)——史籍語義分析流程[J].情報學報,2014,33(2):183-194.

[6] 王昊,谷俊,蘇新寧,等.本體驅(qū)動的知識管理系統(tǒng)模型及其應用研究[J].中國圖書館學報,2013,39(2):98-110.

[7] 蘇新寧,等.面向知識服務的知識組織理論與方法[M].北京:科學出版社,2014:18-19.

[8] 張文秀,陳偉,朱慶華,等.基于本體的語義分析過程與方法的研究應用[J].計算機應用研究,2011,28(3):961-964.

[9] 肖會敏,侯宇.互聯(lián)網(wǎng)+環(huán)境下科技信息資源共享面臨的問題及其對策.[J].情報工程,2015,1(6):39-42.

[10] 孫曉平.大數(shù)據(jù)知識計算的挑戰(zhàn)[J].情報工程,2015,1(6):43-50.

作者簡介:曾文(1973-),女,中國科學技術信息研究所副研究員,博士,碩士生導師,研究方向:知識組織和知識工程、情報分析技術研究;劉敏(1980-),女,中國科學技術信息研究所助理研究員,研究方向:情報分析研究。endprint

猜你喜歡
信息服務
微信環(huán)境下高校移動圖書館信息服務的創(chuàng)新
基于Multi—Agent的智能演藝呈現(xiàn)系統(tǒng)
高校圖書館智庫能力建設探究
旅游網(wǎng)絡信息生態(tài)系統(tǒng)中的協(xié)同信息服務
大數(shù)據(jù)時代圖書館信息服務模式探討
微信平臺在公共圖書館信息服務中的應用
智慧社區(qū)信息服務績效評價研究
公共圖書館科技創(chuàng)新服務探析
農(nóng)業(yè)高校圖書館專利信息服務研究
基于價值共創(chuàng)共享的信息服務生態(tài)系統(tǒng)協(xié)同機制研究
商城县| 广汉市| 扶风县| 太白县| 偏关县| 定边县| 普陀区| 汉川市| 兴业县| 延安市| 察隅县| 福海县| 原平市| 南涧| 南皮县| 长子县| 清涧县| 德保县| 永新县| 廊坊市| 西安市| 利津县| 永顺县| 丰县| 岗巴县| 云梦县| 洛扎县| 太谷县| 衡阳市| 白银市| 鄂州市| 札达县| 榆社县| 莲花县| 耒阳市| 平顶山市| 石棉县| 德格县| 汝城县| 太仓市| 乌恰县|