葉繼元(中國索引學(xué)會副理事長,南京大學(xué)信息管理系教授)
索引又稱引得、索隱等,是將文獻中的語詞、篇目等有關(guān)項目標引出來,按一定次序排列,并注明出處的檢索工具。索引與目錄、目次既有聯(lián)系又有區(qū)別。
索引的特征,首先要進行標引,或描述,按一定的規(guī)則,諸如各種著錄規(guī)則、條例等;其次要有序化,或字順,或分類;同時,必須指出“索引標目所指事物的地址(出處)”。
索引的編制一般遵循下列步驟:根據(jù)編制目的選擇信息源——分析信息——標引有關(guān)項目與出處——排序——信息存儲。索引是倒排文檔,或稱倒排索引文檔,是以標引詞為單元,在其后列舉一系列相關(guān)文獻號碼的文檔。索引詞是可作為檢索詞或索引標目使用的詞或符號的總稱,包括主題詞、分類號等。索引款目是對某一文獻或文獻集合的主題內(nèi)容、涉及事項加以描述的記錄,是索引的基本單元,由標目、注釋、副標目及出處組成。
信息組織是信息的重構(gòu)和增值過程。在這個過程中,雜亂無章的原始信息變成有序的、優(yōu)質(zhì)的信息集成系統(tǒng),一個相對“粗放”型的信息貧集將轉(zhuǎn)化為一個“集約”型的信息富集,并為信息的進一步增值奠定基礎(chǔ)。
信息組織是以用戶需求為導(dǎo)向,依據(jù)信息體自身的屬性特征,按照一定的原則、方法和技術(shù),將分散的信息整理成為有序的信息集合的活動和過程。其結(jié)果是形成各種方便用戶利用的有序化的信息檢索系統(tǒng),從而達到信息增值的目的。
DIKW概念鏈(金字塔)揭示了信息組織各相關(guān)概念間的關(guān)系,是數(shù)據(jù)(Data)、信息(Information)、知識(Knowledge)、智慧(Wisdom)四個英文單詞的首字母縮寫,將數(shù)據(jù)、信息、知識、智慧分成四級,形成一個金字塔形狀。第一層是數(shù)據(jù),為基礎(chǔ)層,第二層是信息,第三層為知識,第四層是智慧,為頂層。每一層都加了不同的內(nèi)涵,內(nèi)涵越大,其外延越小。信息組織對象并不涵蓋所有的信息,而是指可以組織的記錄形式的信息、數(shù)據(jù)和知識,即信息體。在大數(shù)據(jù)時代,信息體包括的不僅僅是文本的數(shù)據(jù)、信息和知識,也包括非文本的數(shù)據(jù)、信息和知識。概念金字塔中的信息實際上是狹義之信息,廣義的信息是指本體論信息和認識論信息,數(shù)據(jù)屬于認識論信息。
信息組織由信息著錄標引和信息序化兩個工作環(huán)節(jié)組成。信息著錄實際上是對原始信息的外部屬性特征和內(nèi)部屬性特征進行描述的過程;信息標引是給出信息內(nèi)容標識的揭示過程。著錄標引的結(jié)果是將原始信息制成它的替代記錄——二次信息(元數(shù)據(jù))。信息序化則是將所有替代信息按照其某種外部特征和內(nèi)容標識進行有規(guī)律的組織排列,從而構(gòu)成某種序列。各種序列制作完成并存儲以后,就形成了比較完整的檢索系統(tǒng)。
20世紀中期以來,隨著科學(xué)技術(shù)的飛速發(fā)展,人類生產(chǎn)信息、積累和利用信息的活動形成了空前的規(guī)模,以電子計算機、網(wǎng)絡(luò)技術(shù)和多媒體技術(shù)為主的現(xiàn)代信息技術(shù)的發(fā)展不僅把信息組織推上了一個新的發(fā)展水平,也將信息組織的技術(shù)手段帶入到一個新境界。
(1)信息組織的特點
以20世紀90年代初期互聯(lián)網(wǎng)的商業(yè)化為分界線,可以把現(xiàn)代信息組織分為基于計算機應(yīng)用的信息組織和基于網(wǎng)絡(luò)的數(shù)字信息組織兩個階段?;谟嬎銠C應(yīng)用的信息組織的發(fā)展特點從宏觀和微觀兩方面得以體現(xiàn):宏觀上的主要特點是信息組織的技術(shù)化、社會化、產(chǎn)業(yè)化和標準化,而微觀上的主要特點是對分類法的改造、主題法的發(fā)展、分類主題一體化、自然語言檢索系統(tǒng)的興起及對自動標引和分類的探討。網(wǎng)絡(luò)環(huán)境下傳統(tǒng)信息組織方法得以延伸和發(fā)展,主要表現(xiàn)在:利用元數(shù)據(jù)對數(shù)字信息體進行描述,虛擬圖書館的出現(xiàn)、分類法和主題法分別在數(shù)字信息組織中得以應(yīng)用、主題圖的應(yīng)用以及本體的應(yīng)用。
(2)信息組織前沿研究
在信息知識組織領(lǐng)域和文獻信息編目領(lǐng)域兩方面存在多個研究方向,前者主要有分類法研究、虛詞表研究、概念地圖研究、簡單知識組織系統(tǒng)研究、知識組織的互操作研究、數(shù)字圖書館的知識組織研究、學(xué)科信息門戶的知識組織體系研究、TAG與Folksonomy的研究以及Web2.0用于知識(信息)組織的研究。文獻信息編目研究前沿主要體現(xiàn)在編目基本概念與基礎(chǔ)理論、編目思想史、國外編目研究以及編目組織的研究活動等方面。
(1)以需求為導(dǎo)向的信息組織方法和技術(shù)不斷加強
首先,隨著信息技術(shù)的發(fā)展和用戶需求的變化,個性化信息服務(wù)的趨勢愈來愈強勁,這是目前網(wǎng)絡(luò)信息組織努力發(fā)展的重點之一。其次,信息檢索工具的易用化和信息內(nèi)容揭示的深入化,都對信息組織提出了更深入的要求。
(2)信息組織工作的標準化與合作化
在信息組織數(shù)字化和網(wǎng)絡(luò)化過程中,必然會有數(shù)據(jù)庫、聯(lián)機系統(tǒng)、檢索系統(tǒng)和檢索語言的兼容化和標準化的問題,解決這一問題成為信息組織發(fā)展的主要趨勢。同時,互聯(lián)網(wǎng)是一個無主管的分散型互連結(jié)構(gòu),網(wǎng)絡(luò)信息的通暢流動與有效利用要求各方面的整體配合。
(3)信息系統(tǒng)的互操作和信息組織大眾化
網(wǎng)絡(luò)環(huán)境下,如何將廣泛分布的、自治的、異構(gòu)的信息資源和信息檢索系統(tǒng)聯(lián)合起來,向用戶提供統(tǒng)一、透明的服務(wù)并實現(xiàn)信息系統(tǒng)的互操作,成為當前和未來信息組織研究實踐的熱點。同時,Web2.0及相關(guān)概念的引入改變了現(xiàn)有萬維網(wǎng)信息提供的模式,使信息組織不再局限于專業(yè)人員的范疇,而是走向大眾化。
(4)信息組織的智能化和語義網(wǎng)格化
先進的信息技術(shù)將部分地代替人腦進行信息組織中的信息識別、信息分析綜合和信息重組,進而實現(xiàn)智能程度更高的“知識組織”。同時,語義網(wǎng)格技術(shù)的發(fā)展,呈現(xiàn)出與語義網(wǎng)技術(shù)相結(jié)合的趨勢,為網(wǎng)絡(luò)資源的自動計算及其組織體系提供了一個值得關(guān)注的方向。
總之,未來信息組織發(fā)展的趨勢將會呈現(xiàn)跨學(xué)科、跨國界、跨地域和不同文明之間高度融合,技術(shù)應(yīng)用高度智能化,在不同文化背景中深度兼容化與標準化,理論研究高度深入化,信息服務(wù)個性化和泛客戶化,信息資源和背景高度復(fù)雜化,所涉及內(nèi)容向縱深化方向發(fā)展。
在信息社會,信息、知識比資本還重要,是生產(chǎn)的第一要素。信息組織將起到越來越大的作用。萬事萬物皆可組織,皆可索引,以提高利用信息、知識的效益。索引及信息組織工作者將大有用武之地!