李 鵬
關于信息組織與知識組織的比較研究
李 鵬
在信息組織與知識組織的含義、特點、技術方法歸納的基礎上,引入相關技術研究的現狀分析,認為信息技術的不斷升級是推動信息組織向知識組織過渡的關鍵因素。
信息組織;知識組織;信息技術
[作 者]李鵬,山西工程職業(yè)技術學院。
各種先進的信息技術及Internet的發(fā)展和運用,切實改變了信息資源的組織方式。第一,數字化數據在網絡環(huán)境中是處于核心位置,沒有單一的信息對象,同時文獻特征的描述局限也被超越了,知識和信息單元也得到了深化。當前傳統(tǒng)的靜態(tài)和規(guī)范以及集中化變成了動態(tài)、復雜以及存取分散化,同時信息組織內容也發(fā)生了本質的變化;第二,信息資源共享的實現在當前的網絡環(huán)境中要怎樣才能做到,同時這個問題也對信息組織的結構與方式提出新的要求。知識經濟的興起使得知識成為社會經濟發(fā)展中最重要的資源和內在變量,信息資源的組織方式也由信息組織發(fā)展到了知識組織。信息組織向知識組織飛躍的過程中起關鍵作用的是信息技術的飛速發(fā)展。
(一)信息組織的含義及特點
信息組織是把某一方面信息進行了整理并且有效的排序,而這些信息往往是量大而且又分散無秩序的,整理的過程也是對這些信息進行重新地排序和利用的過程,即信息序化或信息整序。數據庫或索引只存儲數據信息,減少了信息冗余,增加了信息容量。但實踐證明,信息系統(tǒng)并沒有像人們想象的那么簡單,這是一個靜態(tài)、列舉式的結構構建過程,而這個過程中所服務的對象就是信息,而且這個過程也不能完全體現知識的創(chuàng)造性的動態(tài)邏輯過程。
(二)信息組織的方法
當前,使用比較多關于信息組織的方法,筆者總結如下:
第一,文件的方式,保留計算機處理結果的基本單元。文件方式具有這些優(yōu)勢:在實現上較為簡單,同時也能夠對每一種不是結構化的信息進行有效的存儲。其不足主要有:其一,文件的大小會和數量起沖突,同時也加重了網絡的負載量;其二,當前文件系統(tǒng)還只是比較簡單的信息邏輯結構,而在組織和管理結構化信息中就顯得比較軟弱,對信息組織效率是一種降低的作用。
第二,數據庫的方式,是以固定的記錄格式存儲所有已獲得的網絡信息資源,用戶查找到其所需要的信息線索需要采用一定的方式,相應的網絡信息資源也必須連接相應的線索。其主要具備這些特征:對結構化和非結構化的數據進行大量高速的處理;與此同時作為數據最小的存取單位,信息項對網絡負載起到了降低的作用。但是,當前處理非結構化信息如果采用數據庫處理方式,仍然會面臨著很大的困難,其不能對關聯(lián)的知識進行有效提供,同時仍然缺少對逐漸復雜的信息單元的方法,直觀性和人際交互性也較為不足。
第三,主題樹的方式,用戶進行交流是以當前所提供的界面和網絡信息資源的主題目錄為主,鏈接主題目錄和多個實際有效的數據資源進行連接。優(yōu)點在于:當前檢索網絡信息和對界面的利用都相對比較簡單;而且范疇分類體系也必須遵守,這是信息檢索中的必然要求;有較強的目的性和較高的查準率;能夠對嚴密的系統(tǒng)性以及良好的可擴充性進行掌握。其存在的不足有:沒有復雜的體系結構,不能有太多的信息索引條目,這也對所能容納的網絡信息資源數量起到了很大的制約作用。
第四,超媒體的方式,這是一種超文本組織文本、聲音以及圖像等多媒體的信息的過程,找到任意一種媒介所載的內容。其對人們跳躍性思維的習慣和非線性方式組織信息是相符的,同時其的包容性和擴充性都較好,滿足了鏈接瀏覽的搜索方式。缺點在于是進行信息搜尋時采用的是瀏覽的方式,遇到過于龐大的超媒體網絡的時候,定位的準確性和迅速性很難得到保證,其也很難對瀏覽過程中的歷史記錄予以保存,這就導致了“迷航”現象的出現。
(三)信息組織技術的研究
信息組織的最終實現必須依賴信息技術的運用。信息技術主要以下幾種:
1.元數據技術。元數據(Metadata)能夠幫助識別、發(fā)現描述和選擇信息,電子目錄所具備的功能其都擁有,同時每種電子文獻的內容和特點也都可以予以揭示,對網絡信息資源的分類、組織和索引的實現起到了積極的促進作用。
2.搜索引擎技術。這里指的就是對超文本方式、檢索情報和數據庫系統(tǒng)進行建立,標引和檢索WWW站點資源和其他網絡資源這一類的一類檢索系統(tǒng)機制。
3.數據庫技術。數據庫的內部結構體系可概括為:基于三級模式(概念模式、外模式、內模式)的兩種映射。該技術作為數據管理的最新技術,已先后經歷了第一代數據庫(層次式數據庫與網狀數據庫)應用的成功和第二代數據庫(關系數據庫)的輝煌。
4.推送技術。是信息公司以一定的技術標準或者協(xié)議通過海量的網絡信息經過特定的頻道向用戶發(fā)送信息的傳播系統(tǒng)。信息推送技術不僅能利用其強大的功能,對有用的信息進行分類和管理,還能按照用戶的要求以固定的信息頻道進行播發(fā)。
(一)知識組織的含義及特點
整理、加工、引導、提示、控制知識客體過程和方法,就是知識組織。相對于信息組織來說,知識組織是要實現知識挖掘的知識表示過程。它有自動、集成、智能等特點。
(二)知識組織的途徑
就像之前論述的一樣,對大量數據的合理利用的問題進行解決不能沿用已經存在的信息組織方法。知識組織具體歸納起來主要有以下五種:
1.知識表示。表達和揭示知識因子和知識關聯(lián)這些存在于知識客體中的因素,就稱之為知識表示。具體有主觀知識表示和客觀知識表示。
2.知識重組。是在結構上重新融合相關知識客體中的知識因子和知識關聯(lián),從而形成另一種形式的知識產品的過程。主要有知識因子重組和知識關聯(lián)重組。
3.知識聚類。是按一定的聚類標準分別對知識進行類聚和整序。主要有以學科、以主題、以人、以用、以時空聚類5大種類。
4.知識存檢?!按鎯Α焙汀皺z索”二者構成知識存檢的系統(tǒng),分為知識的腦內存檢和知識的腦外存檢。前者實際就是主觀知識的形成過程,后者屬于客觀知識的存檢范疇。
5.知識編輯。是搜集、整理、加工知識客體的編輯活動。其篩選功能有利于實現知識產品的“優(yōu)生”,分為輯錄性、撰寫性、匯集性、審讀性、譯介性、評價性、專輯性等編輯類型。
(三)知識組織的技術研究
計算機技術以及人工智能技術或者其他與之相關的技術的發(fā)展過程決定著知識組織智能化水平,所以在現有技術內擴張和保持知識組織智能化是必需的。目前使用范圍最廣、影響最大的幾種知識組織智能化技術分別為:
1.超文本技術。這是對計算機技術和人工智能的知識表示技術的利用的一種技術,其對多接電子信息的軟件技術進行非線性地組織和管理。語義網絡式方法的采用體現著超文本和知識的關系,節(jié)點表示其工作原理,知識關聯(lián)用網絡來表示。人們思維的瞬時聯(lián)系它也十分的重視,同時思維聯(lián)系信息的提供,從瀏覽和查詢信息可以從任何一個節(jié)點開始,對用戶而言十分的便利。
2.專家系統(tǒng)。這是當前一個最新的研究領域,代表著人工智能走向實際運用,其存貯某一特定領域內人類專家的知識,其基礎是知識,這也是一款智能化計算機軟件系統(tǒng)。專家系統(tǒng)分別由知識、數據庫,以及推力機制和智能人機接口、獲取知識五個內容組成的。
3.數據倉庫技術。這是以管理和利用數據管理為基礎,也是一種綜合性技術以及解決方案。集合結成主題和數據,可用于支持制定決策的過程。數據倉庫中的數據必須良好定義,具有一致性與不變性。
4.知識挖掘技術??刂骑@性知識的同時也重視挖掘和利用隱性的知識,這是知識組織所發(fā)揮的重要作用。當前主要有以下這些知識挖掘技術:聯(lián)機分析處理,其特征有快速、分析性強和多維以及信息性特征。同時處理方式也多樣化,有關系書籍庫以及多維服務引擎等,對內容的研究是指能自動處理數據庫中大量的原始數據,挖掘、搜索出擁有必然性、富有意義的模式,主要對象仍是關系數據庫;數據挖掘(DM),是從大量的、不完整的原始數據中,提取出隱含在其中的與先前未知的信息和知識的過程。
以計算機技術、網絡技術為代表的現代信息技術的導入,把信息資源組織方式從信息組織引入一個新的境界——知識組織。知識組織實現了整序知識、科學分流、促進選擇、保證利用的組織職能,更好地反映了社會發(fā)展的需要。知識經濟時代,知識組織必將日益凸現、放大其作用。而人工智能技術的發(fā)展,必將把知識組織推進到一個全新的高度,從而開啟信息資源組織方式的新篇章。
[1]蔣永福.圖書館與知識組織[J].中國圖書館學報,l999(5):19-23.
[2]施向春.信息技術與圖書館新概念[J].圖書情報工作,2000(2):29-31.
[3]盛小平.數字圖書館的知識組織[J].圖書情報工作,2001(3):24-27.
[4]張彩虹,田建良.圖書館知識組織問題[J].圖書館雜志,200l(5):6-8.
[5]曾媚.文獻組織、信息組織與知識組織的比較研究[J].圖書館論叢,2003(2):6-10.
[6]李印結.信息組織與知識組織比較研究[J].圖書情報工作,2012(增1):278-281.