摘要:隨著1nternet的迅速發(fā)展,網(wǎng)絡(luò)信息以驚人的速度增長,但這些信息大多分散無序,缺乏有效組織。人們很難從海量信息中獲取自己所需信息,造成信息使用率的不斷下降。針對這種狀況本文提出相應(yīng)的解決思路,以求更好的對網(wǎng)絡(luò)信息資源進(jìn)行組織管理和利用。
關(guān)鍵詞:網(wǎng)路信息資源;組織技術(shù);網(wǎng)絡(luò)導(dǎo)航
作為近幾年才頻繁出現(xiàn)的新術(shù)語“網(wǎng)絡(luò)信息資源(Network information resource)”,到目前為止還沒有被公認(rèn)為是一個專業(yè)術(shù)語。一般把網(wǎng)路資源理解為“通過計(jì)算機(jī)網(wǎng)絡(luò)可以利用的各種信息資源的總和”。具體來說網(wǎng)絡(luò)信息資源有廣義和狹義之分。廣義上是指網(wǎng)絡(luò)的一切信息資源,包括有用的和無用的網(wǎng)上各類信息資源的總和。而狹義上是指借助于各種信息技術(shù)而存儲在各種網(wǎng)絡(luò)上的信息資源,并能夠被存取和利用而且能夠滿足廣大信息用戶的各種需求的各類信息資源的總和。
一 、網(wǎng)絡(luò)信息資源的組織管理
1.網(wǎng)絡(luò)信息資源組織管理的內(nèi)涵與特點(diǎn)
網(wǎng)絡(luò)信息資源組織實(shí)質(zhì)上是一個序化的過程,這個過程通??煞譃閮蓚€階段,即序化階段和優(yōu)化階段。網(wǎng)絡(luò)信息資源的序化是按照一定的方法將無序的信息組織成為有序信息的過程,它又包含了兩層意義:一是把沒有必然內(nèi)在聯(lián)系的信息,為了利用和管理上的方便而加以組織;二是把本質(zhì)上具有必然內(nèi)在聯(lián)系的信息,按照其自身的客觀邏輯結(jié)構(gòu)加以組織;前者主要是主觀因素,后者主要是客觀因素。而網(wǎng)絡(luò)信息的優(yōu)化是在序化的基礎(chǔ)上進(jìn)行的,針對某種目的,依照結(jié)構(gòu)功能優(yōu)化原理對信息進(jìn)行再序化的過程,它是信息序化的繼續(xù)和升華。
網(wǎng)絡(luò)信息資源組織有如下特點(diǎn):(l)過程的整合性。網(wǎng)絡(luò)信息資源組織是對各類網(wǎng)上有用資源進(jìn)行重新整理、加工、再利用的過程,并根據(jù)組織者按不同的標(biāo)準(zhǔn)把相關(guān)信息資源組織在一起,形成一個新的信息集合體,這些信息集合體按信息組織的語法、語義和語用三個層面將各種不同來源,不同類型的網(wǎng)絡(luò)信息資源組織在一起。因此,網(wǎng)絡(luò)信息資源組織具有明顯的整合性。(2)技術(shù)的綜合性。網(wǎng)絡(luò)信息資源組織的理論是通過不同學(xué)科的概念、原理、方法和技術(shù)手段相互融合、相互借助而形成的,但這些概念、原理、方法和技術(shù)手段并不是簡單地堆砌在一起,而是要經(jīng)過某種移植和創(chuàng)新、改造和加工,通過理論的借鑒、方法的移植、技術(shù)的應(yīng)用使得彼此之間能夠有機(jī)地融合在一起形成新的應(yīng)用技術(shù)。 (3)理論的綜合應(yīng)用。網(wǎng)絡(luò)信息資源組織的理論吸收了邏輯學(xué)、認(rèn)知心理學(xué)、管理學(xué)、系統(tǒng)科學(xué)、信息傳播理論、信息檢索理論等不同學(xué)科的理論和方法。從微觀上看,網(wǎng)絡(luò)信息資源組織的研究中采用了科學(xué)抽象、分析與綜合、歸納與演繹等多種具體方法即有定性的,也有定量的。
2.網(wǎng)絡(luò)信息資源的組織管理
(1)通過自由文本方式組織管理網(wǎng)絡(luò)信息資源。這種方式主要用于全文數(shù)據(jù)庫建造,是對非結(jié)構(gòu)化的文本信息進(jìn)行組織與處理的一種方式,如傳統(tǒng)文獻(xiàn)的數(shù)字化,就是建立全文數(shù)據(jù)庫。使之成為計(jì)算機(jī)可以閱讀和處理的文本。自由文本方式是用自然語言揭示文獻(xiàn)中的知識單元,并以此為依據(jù),按文獻(xiàn)全文的自然狀況直接設(shè)置檢索點(diǎn)。它所組織的是人們所創(chuàng)或采集的網(wǎng)外全文信息,是輸入網(wǎng)絡(luò)的新資源。以自由文本方式組織網(wǎng)絡(luò)信息資源具有以下優(yōu)勢:第一、以文本共享與傳輸信息,這種組織方式簡單方便,計(jì)算機(jī)有一整套文件處理的理論與技術(shù)。在組織網(wǎng)絡(luò)信息資源時可以容易地利用這些現(xiàn)成的技術(shù)與方法。第二、這種組織方式是存貯非結(jié)構(gòu)化信息的天然單位,對于圖形、圖像、圖表、音頻、視頻等非結(jié)構(gòu)化信息,可以方便地利用本系統(tǒng)來管理。
(2)建立網(wǎng)絡(luò)資源數(shù)據(jù)庫:數(shù)據(jù)庫是將所獲得的信息資源按照固定的記錄格式存儲組織,它最小存貯單位是字段,數(shù)據(jù)庫方式是對大量規(guī)范化數(shù)據(jù)進(jìn)行組織管理的技術(shù),它具有以下優(yōu)點(diǎn):第一、對大量的結(jié)構(gòu)化數(shù)據(jù)處理效率很高。大大提高了信息的管理效率。第二、可根據(jù)用戶需求靈活地改變查詢結(jié)果集的大小,從而大大降低了網(wǎng)絡(luò)數(shù)據(jù)傳輸?shù)呢?fù)載。
?。?)超媒體組織的方式。這種信息組織方式是將超文本與多媒體技術(shù)結(jié)合起來組織網(wǎng)絡(luò)信息資源的一種主要方式。超文本方式打破了順序線性存取的限制,將文本信息組織成立體網(wǎng)狀結(jié)構(gòu),使用戶可以從任一節(jié)點(diǎn)開始,根據(jù)網(wǎng)頁中信息之間的聯(lián)系,從不同角度瀏覽與查詢信息。超媒體方式是將文本、表格、聲音、圖像等多媒體信息以超文本格式組織起來,通過節(jié)點(diǎn)與鏈接結(jié)構(gòu)在數(shù)據(jù)庫中尋找所需的媒體信息。采用超媒體方式組織信息資源的優(yōu)勢主要有: 第一,以非線性的方式組織信息,符合人們思維聯(lián)想與跳躍習(xí)慣。 第二、節(jié)點(diǎn)中的內(nèi)容可多可少,結(jié)構(gòu)可以任意伸縮,具有良好的包容性和可擴(kuò)充性。 第三。方便描述和建立各種媒體之間的語義聯(lián)系,完全超越媒體類型對信息組織與檢索的限制。
二、網(wǎng)絡(luò)信息資源的組織技術(shù)
?。?)WEB數(shù)據(jù)庫的基礎(chǔ)技術(shù)。所謂WEB數(shù)據(jù)庫,其實(shí)質(zhì)是在傳統(tǒng)的關(guān)系數(shù)據(jù)庫技術(shù)之上,融最新的網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)庫技術(shù)、存儲技術(shù)和檢索技術(shù)為一體,完全基于Internet應(yīng)用的數(shù)據(jù)庫結(jié)構(gòu)和數(shù)據(jù)庫模型的新型數(shù)據(jù)庫。典型的WEB數(shù)據(jù)庫系統(tǒng)有一個WEB游覽器作為用戶界面,一個數(shù)據(jù)庫服務(wù)用作信息存儲和一個連接兩者的WBB服務(wù)器。用戶使用WEB瀏覽器訪問WEB頁,通過WEB頁上顯示的表格與數(shù)據(jù)庫進(jìn)行交互操作。
?。?)數(shù)據(jù)倉庫技術(shù)。數(shù)據(jù)倉庫(Date Warehouse)數(shù)據(jù)倉庫是支持管理決策過程的,面向主題的、集成的、隨時間而變的、持久的數(shù)據(jù)集合;而斯坦福大學(xué)數(shù)據(jù)倉庫研究小組則認(rèn)為"數(shù)據(jù)倉庫是集成信息的存儲中心,這些信息可用于查詢或分析"。目前己成為企業(yè)決策者進(jìn)行管理分析和決策的一種有利工具。而Internet也使得任意時間任意地點(diǎn)對信息的訪問變得更容易,代價更低。這兩項(xiàng)技術(shù)結(jié)合起來可以使得重要信息的處理和傳輸更有效、更經(jīng)濟(jì),因此它導(dǎo)致了基于網(wǎng)絡(luò)的數(shù)據(jù)倉庫技術(shù)的產(chǎn)生。
?。?)基于WEB數(shù)據(jù)挖掘技術(shù)。Web挖掘是利用數(shù)據(jù)挖掘技術(shù)從Web文檔及Web服務(wù)中自動發(fā)現(xiàn)并提取人們感興趣的信息。它是一項(xiàng)綜合技術(shù),涉及到Internet技術(shù)、人工智能、計(jì)算機(jī)語言學(xué)、信息學(xué)、統(tǒng)計(jì)學(xué)等多個領(lǐng)域。通常Web挖掘過程可以分為以下幾個處理階段:資源發(fā)現(xiàn)、數(shù)據(jù)抽取及數(shù)據(jù)預(yù)處理階段、數(shù)據(jù)匯總及模式識別階段、分析驗(yàn)證階段。Web挖掘可分為三類:內(nèi)容挖掘、結(jié)構(gòu)挖掘、用戶訪問模式挖掘,而Web內(nèi)容挖掘和用戶訪問模式挖掘是Web挖掘的兩個主要方面。
?。?)搜索引擎技術(shù)。搜索引擎,,一般是指通過超文本(超媒體)技術(shù)和在Internet網(wǎng)上建立的一種向網(wǎng)絡(luò)用戶提供網(wǎng)上信息資源檢索和導(dǎo)航服務(wù)的專門站點(diǎn)或服務(wù)器。它通過搜集網(wǎng)上的信息,如網(wǎng)站、網(wǎng)頁、URL、以及非WWW形態(tài)的BBS、Telnet、FTP、Newsgroup等,進(jìn)行整理、組織、加工、處理,建立管理和存儲這些信息的索引數(shù)據(jù)庫,并提供基于該索引數(shù)據(jù)庫的檢索。搜索引擎的最終目的是能夠根據(jù)用戶需求查找到相關(guān)信息。
?。?)指引庫技術(shù)。所謂指引庫是指所建立的數(shù)據(jù)庫中,從物理上講并不存儲實(shí)際的信息資源,但對其進(jìn)行訪問卻可以檢索到有關(guān)數(shù)據(jù)庫的實(shí)際資源,即指引用戶到特定的地址獲取所需信息,這樣就可以把因特網(wǎng)上與某一或某些主題相關(guān)的節(jié)點(diǎn)進(jìn)行集中,按照方便用戶檢索的原則,用熟悉的語言組織起來,向用戶提供這些資源的分布情況,指引用戶查找。信息資源指引庫包括三部分:一批反映該專業(yè)國外信息源的URL;一批原始信息,包括訪問頻度高的原始信息資源的鏡像,自建的信息資源等;一套方便信息組織與用戶查詢的支持技術(shù)。
三、基于網(wǎng)絡(luò)導(dǎo)航對網(wǎng)絡(luò)信息資源的利用
針對用戶的需求有效地利用和組織Internet上浩瀚的信息資源,建立一個網(wǎng)絡(luò)信息資源導(dǎo)航庫,使無序的資源變得有序、分散的變得集中,提供導(dǎo)航,指引用戶利用網(wǎng)絡(luò)資源,就能使用戶在浩瀚無邊的信息海洋里不至于迷失方向和耗費(fèi)太多的時間。網(wǎng)絡(luò)導(dǎo)航是指有關(guān)因特網(wǎng)網(wǎng)站、網(wǎng)頁甚至私人信息的檢索及目錄等服務(wù)。隨著網(wǎng)絡(luò)信息資源的不斷變化發(fā)展,網(wǎng)絡(luò)導(dǎo)航的內(nèi)容也是在日益增長,但就目前能夠被人們認(rèn)識和利用的主要有以下幾個方面的內(nèi)容: ①教學(xué)科研機(jī)構(gòu)。主要提供高校資源、學(xué)術(shù)動態(tài)和科技成果等等與教學(xué)、科研有關(guān)的網(wǎng)絡(luò)信息。②文獻(xiàn)信息機(jī)構(gòu)。主要提供各種文獻(xiàn)信息的網(wǎng)絡(luò)服務(wù)。這類機(jī)構(gòu)網(wǎng)站包括圖書館、中科院文獻(xiàn)情報(bào)中心、情報(bào)所等相關(guān)網(wǎng)站。③出版發(fā)行機(jī)構(gòu)。主要提供圖書資料的出版發(fā)行信息,同時也提供圖書的訂購業(yè)務(wù)。這類機(jī)構(gòu)網(wǎng)站包括各種出版社網(wǎng)站和網(wǎng)上書店。④搜索引擎。主要提供用戶自由檢索的強(qiáng)大搜索工具,包括了Google、新浪、網(wǎng)易、搜狐等等。⑤可直接利用的各種免費(fèi)資源。如各種免費(fèi)的或試用的數(shù)據(jù)庫、報(bào)紙資源、期刊資源、其它圖書館的數(shù)字化資源。⑥重點(diǎn)學(xué)科資源導(dǎo)航。主要是為用戶提供以學(xué)科為單元的Internet上的相關(guān)學(xué)術(shù)資源的導(dǎo)引和檢索線索的導(dǎo)航,它將某一學(xué)科的網(wǎng)絡(luò)學(xué)術(shù)資源集中、有序化,讓用戶了解本學(xué)科的最新研究動態(tài)及各種學(xué)術(shù)資源。它是圖書館現(xiàn)代信息服務(wù)和學(xué)科咨詢服務(wù)的一部分。
作者單位:衡水學(xué)院圖書館
參考文獻(xiàn):
[1]安新穎. 網(wǎng)絡(luò)信息資源組織研究[J].現(xiàn)