張 麗
[摘要]本文從Internet上信息資源的重要作用出發(fā),對其開發(fā)利用的必要性、技術(shù)、方法進(jìn)行較為深入的論述,并提出相應(yīng)對策。
[關(guān)鍵詞]Internet 信息資源 開發(fā)利用
一、網(wǎng)上信息資源開發(fā)利用的必要性
網(wǎng)上信息資源又名網(wǎng)絡(luò)信息資源,內(nèi)容和信息都十分豐富,是集文字、圖像、聲音、視頻為一體的多媒體信息。其包括超文本信息和超媒體信息。它們按非線性文本組織模式,將信息單元儲(chǔ)存于節(jié)點(diǎn),通過含URLdizhi地址的鏈接體現(xiàn)各節(jié)點(diǎn)之間的概念邏輯關(guān)系,從而形成網(wǎng)狀結(jié)構(gòu)。既可按線性順序查閱,又可跳躍式瀏覽,與實(shí)體文獻(xiàn)資源相比,具有如下的特點(diǎn)。
1.多樣性
網(wǎng)上信息資源包括館藏目錄、電子書刊、各種類型的數(shù)據(jù)庫、資源導(dǎo)航及搜索引擎、電子公告等。并以超級(jí)鏈接的方式將文字、圖像、語音和視頻信息鏈接起來,形成一個(gè)豐富多彩的網(wǎng)絡(luò)資源。
2.無序性
網(wǎng)上信息以超文本方式而構(gòu)成立體網(wǎng)狀的形式,缺乏統(tǒng)一的控制,呈分散無序狀態(tài),可以根據(jù)節(jié)點(diǎn)任意跳動(dòng),而實(shí)體文獻(xiàn)信息資源則自成體系,呈線性方式。
3.開放性
網(wǎng)上信息是開放、相關(guān)聯(lián)的,可以通過鏈接任意檢索信息。我們知道,通過internet,任意信息都可以傳播到世界各個(gè)地方,只要將計(jì)算機(jī)連接在網(wǎng)絡(luò)上,用戶就可以快速得到這些信息。
4.動(dòng)態(tài)性
網(wǎng)上信息資源跨地區(qū)分布,高速度傳輸,更新淘汰周期短,變化快、不穩(wěn)定,呈高度動(dòng)態(tài)性。由于網(wǎng)上信息資源從本質(zhì)上改變了信息的創(chuàng)造交流和獲取的方式,完全拋棄了傳統(tǒng)的出版概念,實(shí)現(xiàn)了無紙化的出版,信息呈現(xiàn)很強(qiáng)的時(shí)效性。
5.互動(dòng)性
網(wǎng)上信息資源具有很強(qiáng)的互動(dòng)功能,可以形成廣泛的論壇氛圍,有關(guān)專家可以就某一專題開設(shè)電子論壇,網(wǎng)上直接反饋用戶信息,參與交流討論。
6.增值性
網(wǎng)上信息資源開發(fā)與建設(shè)的最終目的是服務(wù)。用戶在網(wǎng)上利用各種手段查找所需的信息內(nèi)容,在這一過程中信息被反復(fù)利用,不但不會(huì)導(dǎo)致網(wǎng)上信息資源損耗,反而可使信息增值。
由此可見,網(wǎng)絡(luò)信息資源使實(shí)體文獻(xiàn)信息資源在內(nèi)容上和形式上有了很大的變化,這個(gè)巨大的信息資源庫涵蓋了不同學(xué)科、不同領(lǐng)域、不同地域、不同語言的信息資源,具有較大的靈活性。圖書館作為科研服務(wù)機(jī)構(gòu)之一,不懂得如何有效地開發(fā)利用網(wǎng)絡(luò)信息資源,就會(huì)失去對網(wǎng)絡(luò)信息的“擁有”與“服務(wù)”。因此,網(wǎng)上信息資源的開發(fā)利用是實(shí)現(xiàn)信息價(jià)值轉(zhuǎn)換一種典型的社會(huì)化智能活動(dòng)。
二、網(wǎng)上信息資源的開發(fā)技術(shù)
1. push技術(shù)
傳統(tǒng)的信息獲取方式是基于Client/server模式,主要采用拉取(pull)的技術(shù)挖掘采集信息。但隨著網(wǎng)上信息資源的豐富和多元化,這種方式已不能滿足用戶快速準(zhǔn)確地獲取信息的要求,引入了push技術(shù),作為internet的一種新技術(shù),提出了新的服務(wù)模式,即核心點(diǎn)放在服務(wù)方,不需要用戶的請求,主動(dòng)將信息送到用戶方,在信息發(fā)布獲取應(yīng)用中它表現(xiàn)為push服務(wù)器自動(dòng)搜集用戶感興趣的信息,并將其定期地傳送給用戶。其表現(xiàn)形式為:web服務(wù)器擴(kuò)展;客戶代理方式;Push服務(wù)器方式。
2.WWW信息挖掘技術(shù)
WWW的數(shù)據(jù)信息挖掘,指從大型數(shù)據(jù)庫的數(shù)據(jù)中提取出用戶感興趣的文本型知識(shí),這些知識(shí)是隱含的、事先未知的、潛在的有用的信息。而網(wǎng)上文本信息挖掘是在已知的數(shù)據(jù)樣本基礎(chǔ)上,得到數(shù)據(jù)對象詞的內(nèi)在特性.并以此為依據(jù)在網(wǎng)絡(luò)上進(jìn)行有目的的信息提取。這種信息挖掘能自動(dòng)地提取相關(guān)文獻(xiàn)之間的有價(jià)值的關(guān)系知識(shí),并將這些知識(shí)以可視的、動(dòng)態(tài)改變的方式反饋給用戶。可視方式為用戶提供了以直觀的易于快速理解的知識(shí)掌握途徑,而動(dòng)態(tài)改變的方式則滿足了用戶的及時(shí)性要求。它由特征提取、源信息采集、特征匹配三部分組成。特征提取負(fù)責(zé)根據(jù)一定的算法和策略,從現(xiàn)有的樣本文檔中提取出其內(nèi)在的特征,即進(jìn)行挖掘目標(biāo)的特征提取;源信息采集負(fù)責(zé)從WWW上選擇下載原始文檔,這部分工作一般由多個(gè)具有一定啟發(fā)策略的Robot (Robot是一個(gè)能沿著Web頁面中的超鏈接進(jìn)行自動(dòng)漫游,并通過HTTP等標(biāo)準(zhǔn)協(xié)議讀取漫游到頁面的程序)完成;特征匹配是利用挖掘目標(biāo)特征判斷源信息的相似度,即進(jìn)行相關(guān)信息的提取。
3.聯(lián)機(jī)分析處理技術(shù)
首先,聯(lián)機(jī)分析處理 (OLAP)與數(shù)據(jù)挖掘 (DM)是基于數(shù)據(jù)倉庫 (數(shù)據(jù)庫)技術(shù)而發(fā)展起來的信息分析與挖掘工具,在實(shí)際應(yīng)用中各有側(cè)重。前者是驗(yàn)證型的,后者是挖掘型的。OLAP建立在多維視圖的基礎(chǔ)上,重在根據(jù)已有的模式將直接源自數(shù)據(jù)倉庫中的不同信息源的大量相關(guān)信息聯(lián)系起來,以給分析人員一個(gè)清晰、一致的視圖。DM建立在各種信息源的基礎(chǔ)上,重在發(fā)現(xiàn)隱藏在大量原始數(shù)據(jù)深層中的對用戶有用的模式。被抽取的即知識(shí),具備可靠、新穎、有效、易于理解的特點(diǎn)。其次,OLAP與DM相結(jié)合,即OLAM,兼有OLAP多維分析的在線性、靈活性和DM對數(shù)據(jù)處理的深入性,因而可在更高層次上滿足網(wǎng)上信息分析與挖掘需求。目前OLAM正處于研究中,其核心點(diǎn)是:①OLAM建立在多維數(shù)據(jù)庫和OLAP的基礎(chǔ)上,能對任何它想要的數(shù)據(jù)進(jìn)行挖掘;②用戶對挖掘算法具有動(dòng)態(tài)選擇的權(quán)利;③具有超強(qiáng)的挖掘算法;④能夠協(xié)調(diào)執(zhí)行效率與挖掘的準(zhǔn)確性之間的關(guān)系;⑤具有靈活的可視化工具和良好的擴(kuò)展性。
三、網(wǎng)上信息資源的開發(fā)方法
1.常規(guī)性開發(fā)
由于網(wǎng)上信息不斷更新,同時(shí)一些站點(diǎn)的URL也在變化,在開發(fā)網(wǎng)絡(luò)信息時(shí),應(yīng)不斷增加日常檢索頻率,把搜索網(wǎng)絡(luò)信息納入日常工作計(jì)劃中,做到分學(xué)科、按課題和科研需求進(jìn)行開發(fā)。此外,為了保證查全率,不要只使用某一種引擎對某一專題的信息檢索,而要使用多種不同查詢工具,對一種主題反復(fù)查詢。
2.專題性開發(fā)
針對學(xué)科和學(xué)科建設(shè),結(jié)合科研課題和研究領(lǐng)域等進(jìn)行專題網(wǎng)絡(luò)資源開發(fā)。在專用的網(wǎng)絡(luò)服務(wù)器上把收集到的各種專業(yè)信息制作成網(wǎng)頁放在網(wǎng)上,同時(shí)把相關(guān)專業(yè)的網(wǎng)絡(luò)資源(如數(shù)據(jù)庫、電子報(bào)刊、BBS、專題討論等)以“友情鏈接”形式到網(wǎng)頁上,以拓寬檢索范圍,使用戶能方便快捷地從專門的網(wǎng)頁上得到所需的信息,并結(jié)合信息咨詢服務(wù)中的定題檢索(SDI)、回溯檢索(RS)、原文提供服務(wù)和進(jìn)行科研項(xiàng)目查詢(on.going re—search)服務(wù)開展工作,指導(dǎo)用戶獲取所需的二次及一次信息源。
四、網(wǎng)上信息資源開發(fā)的利用途徑
1.熟悉網(wǎng)絡(luò)信息資源特點(diǎn)及分布狀況
了解常用信息資源的特點(diǎn)和分布方式,如國內(nèi)外著名的科研機(jī)構(gòu)、信息發(fā)布機(jī)構(gòu)的特點(diǎn)和網(wǎng)址,及時(shí)而準(zhǔn)確獲得這些權(quán)威機(jī)構(gòu)發(fā)布的信息。如世界衛(wèi)生組織及一些重要的學(xué)會(huì)協(xié)會(huì)等,通過其主頁經(jīng)常發(fā)布一些重要的科研信息,對這些機(jī)構(gòu)、學(xué)會(huì)的了解,可以幫助用戶及時(shí)掌握最新科研動(dòng)態(tài)。
2.合理配置網(wǎng)上信息資源
由于我國對信息資源在時(shí)間、空間、數(shù)量三方面的配置存在不同程度的問題,即在空間的分配不均勻,時(shí)間的分配不合理,數(shù)量的分配不均衡,所以優(yōu)化配置網(wǎng)絡(luò)資源尤為重要。在空間上注重網(wǎng)絡(luò)資源在不同地區(qū)、不同行業(yè)部門的分布,在數(shù)量上對各種各樣網(wǎng)絡(luò)信息資源采取合理比例配置,在時(shí)間上調(diào)整好網(wǎng)絡(luò)資源在過去、現(xiàn)在、將來三種時(shí)態(tài)上的配置。
3.建立學(xué)科信息導(dǎo)航庫
為了提高用戶檢索的檢準(zhǔn)率和檢全率,為了使網(wǎng)絡(luò)信息有序化,建立學(xué)科信息導(dǎo)航系統(tǒng),利用各種搜索引擎對某一主題信息上網(wǎng)查詢、瀏覽并參考有關(guān)文獻(xiàn),選擇參考價(jià)值較高的信息資源,由專業(yè)人員經(jīng)過加工、組織、歸類、設(shè)置類目,形成新的知識(shí)關(guān)聯(lián),產(chǎn)生出更高層次上的綜合信息產(chǎn)品,方便用戶查詢。
4.利用國際聯(lián)機(jī)檢索系統(tǒng)
為了擴(kuò)大獲取信息的范圍,一定要利用國際聯(lián)機(jī)檢索系統(tǒng)。其中最著名的是DIALOG系統(tǒng)。它是世界上最大的聯(lián)機(jī)檢索服務(wù)機(jī)構(gòu),有600多個(gè)數(shù)據(jù)庫,涉及到全文型、數(shù)據(jù)型、事實(shí)型、指導(dǎo)型的數(shù)據(jù)庫,有近3億條的記錄。涉及的學(xué)科專業(yè)范圍廣,檢索功能強(qiáng),數(shù)據(jù)更新及時(shí),文獻(xiàn)數(shù)據(jù)時(shí)間跨度大。是項(xiàng)目查新、文獻(xiàn)調(diào)研、課題立項(xiàng)、論文撰寫、專利申請等重要依據(jù)。它的聯(lián)入方式可通過Telnet方式聯(lián)入,也可通過www方式聯(lián)機(jī)的超文本界面。
5.開展個(gè)性化服務(wù)
隨著Internet信息技術(shù)和智能化技術(shù)的發(fā)展,借鑒人工智能技術(shù)將用戶信息需求組成過濾條件對信息資源進(jìn)行過濾,來實(shí)現(xiàn)把資源中符合需求的內(nèi)容提取出為用戶服務(wù),從而形成一種因人而異的信息服務(wù)形態(tài)——個(gè)性化主動(dòng)服務(wù)形態(tài),即“信息找人”,更好地為用戶提供信息挖掘服務(wù)。
6.加強(qiáng)網(wǎng)上搜集,增強(qiáng)針對性
對重點(diǎn)學(xué)科和課題除進(jìn)行定期服務(wù)、跟蹤服務(wù)、信息的調(diào)研等服務(wù)外,還要有針對性地廣泛搜集實(shí)用網(wǎng)址。如農(nóng)業(yè)學(xué)科可搜集作物學(xué)、園藝學(xué)、林學(xué)、植保、畜牧獸醫(yī)、食品、水產(chǎn)養(yǎng)殖、生物學(xué)等方面的URL,還可收集一些農(nóng)業(yè)研究機(jī)構(gòu)、農(nóng)業(yè)高等院校、農(nóng)業(yè)國際會(huì)議等得URL。這樣做,不僅使用戶從虛擬館藏中得到現(xiàn)實(shí)的信息資源,而且深化了網(wǎng)絡(luò)信息資源服務(wù)層次。
7.成立網(wǎng)上信息資源開發(fā)部
在一定區(qū)域內(nèi)建立網(wǎng)上信息資源新產(chǎn)品連鎖服務(wù)站,并通過與企業(yè)、商業(yè)、旅游服務(wù)業(yè)、科研、教學(xué)等單位掛鉤,向社會(huì)傳播有關(guān)信息產(chǎn)品,同時(shí)編制各種網(wǎng)上“指南”、“索引”或“聯(lián)機(jī)幫助”,指導(dǎo)用戶有效的利用網(wǎng)上信息資源。
8.建立用戶反饋意見欄目出版社
用戶對網(wǎng)絡(luò)信息資源的利用價(jià)值最有發(fā)言權(quán),經(jīng)常征求、收集用戶對專業(yè)站點(diǎn)及其信息資源評價(jià)信息,可以把務(wù)握網(wǎng)絡(luò)資源的內(nèi)容質(zhì)量、學(xué)術(shù)水平、編輯質(zhì)量等,對篩選和評價(jià)專業(yè)網(wǎng)絡(luò)資源具有幫助,只有了解用戶需求,才能情報(bào)工作提高知識(shí)服務(wù)的水平,滿足用戶的信息需求。
9.舉辦多種形式的專題講座和信息發(fā)布活動(dòng)
參考文獻(xiàn):
[1]畢強(qiáng).網(wǎng)絡(luò)信息資源管理[M].長春:吉林科學(xué)技術(shù).
[2]王淑群.網(wǎng)絡(luò)環(huán)境下高校圖書館的用戶需求與信息服[J].圖書館論壇,2007,(4):32-34.
[3]王建侖.網(wǎng)絡(luò)科研信息資源的開發(fā)與利用[J].圖書情報(bào)工作,2008,(2):37-39.
[4]王詠.基于Push技術(shù)的信息獲取方式及其應(yīng)用[J].情報(bào)學(xué)報(bào),2008.
[5]楊燕.我國網(wǎng)絡(luò)信息資源管理與開發(fā)[J].圖書館建設(shè),2006,(6):124-126.