王曉波
(黑龍江科技學院圖書館,黑龍江 哈爾濱 150027)
從眾多的信息中查找出符合特定需要的文獻,或某一問題的答案(數(shù)據(jù)、事實經(jīng)過或結論等),這樣一個查找過程,通常被稱為信息檢索。雖然這種查找行為很早就萌芽于圖書館的參考工作之中,但信息檢索的概念直到本世紀五十年代以后才產(chǎn)生。它是現(xiàn)代記錄下來的知識急劇增長而需要給以合理的存儲,人們查尋的著眼點更多地指向包含在文獻中的信息而不是文獻本身,以及電子計算機應用到信息工作領域使人們擁有強有力的信息處理手段而導致出現(xiàn)的名詞。
完整的信息檢索概念包括兩項工作:(1)信息存儲過程,即搜集、篩選、整理、積累現(xiàn)有信息及檢索工具,建立信息檢索系統(tǒng)。(2)信息檢索工程,即利用信息檢索工具查找所需要的信息。廣義的信息檢索過程包括信息的存儲與檢索兩個過程。狹義的信息檢索僅指檢索過程。
2.1 按照信息存儲的載體和實現(xiàn)查找的技術手段劃分,信息檢索可以分為以下幾種:手工檢索。即檢索者翻閱、查找印刷型檢索工具,這種檢索靈活方便,但是檢索效率低。機械檢索。即利用探針或檢索器件,對代表檢索標識的穿孔卡片進行選取,可大大提高檢索效率。光電檢索。即把檢索標識變成黑白點矩陣或條形碼,存儲在縮微介質上,利用光電效應,通過檢索機進行查找。計算機檢索。即把檢索標識轉換成二進制編碼,存儲在磁性載體上,由計算機根據(jù)程序進行查找和輸出。2.2 根據(jù)存儲與檢索對象來劃分,信息檢索可以分為:文獻檢索。即以特定的文獻為檢索對象,包括全文、文摘等。事實檢索。即以特定的事項為檢索對象,凡是查找有關人物、地名、術語、時間等,都屬于事實檢索的范疇。數(shù)據(jù)檢索。即以特定的數(shù)據(jù)為檢索對象,如篇數(shù)、人數(shù)等。
由于以不同形式存在的信息經(jīng)過積累和傳遞,作用于物質活動過程時,能更好地利用和開發(fā)物質資源;與資本和勞動結合時,則可以為人類創(chuàng)造新的物質財富,因而信息資源與能量資源、物質資源并稱為當代社會的三大資源。信息資源管理與開發(fā)水平已成為衡量一個國家信息文明程度的重要標志。信息檢索是信息存儲和信息傳遞的重要環(huán)節(jié),是信息產(chǎn)業(yè)的重要基礎之一;信息檢索技能的提高和手段的日益現(xiàn)代化,將大大加快社會信息資源的開發(fā)速度和程度。
人類積累起來的大量文獻信息資源是一個巨大的知識寶庫,是人們從事科學研究、技術開發(fā)、文學與藝術創(chuàng)作所不可缺少的信息資源;重視信息資源的開發(fā),重視信息檢索和傳遞工作,可以確保學術研究和文藝創(chuàng)作、避免盲目性和重復勞動,可以幫助我們充分利用他人研究成果,在他人研究的基礎上有所改進和創(chuàng)新,從而創(chuàng)造出更多質量更高的信息資源。
信息檢索是研究工作的基礎和必要環(huán)節(jié),成功的信息檢索可以起到事半功倍的效果;尤其是隨著信息技術的更新發(fā)展,研究者可以在很少時間里完成信息調研,從而節(jié)省勞動時間,提高工作效率。
管理決策必須依賴信息咨詢才能保證其科學性、公正性,信息咨詢成功的基礎則是通過科學合理的信息檢索獲取大量有用的信息資源。
有人曾用信息爆炸一詞來描述當今社會中信息生產(chǎn)與信息載體數(shù)量的迅猛增長,在浩如煙海的信息資料之中盲目地找尋自己所需要的信息資源,自然是一種非常困難的事情。信息檢索則為人們提供了一套較完整的開發(fā)、利用信息資料的方法,包括信息檢索工具的選擇、信息檢索策略的制定、信息檢索手段的選擇等等。
直接檢索就是從瀏覽、閱讀文獻信息資源中獲取所需要的情報信息過程,它是研究者習慣使用的方法,具有以下幾個優(yōu)點:(1)易于把握文獻信息實質內(nèi)容。(2)可直接對信息內(nèi)容判斷取舍。(3)簡便易行。(4)信息獲取速度快,時效高。
間接檢索就是以檢索工具為導向,進而查找原始文獻信息資源以獲得所需信息的過程,其優(yōu)越性在于:(1)使盲目的分散檢索成為有目的的集中檢索,因為檢索工具將分散在不同學科、不同類型、不同語種中但主題內(nèi)容相同的文獻信息集中在一起,這樣就可避免直接檢索的分散性、盲目性,大幅度提高檢索效率。(2)檢索工具中的信息源不限于某一個或幾個信息機構,這樣就可以為用戶提供廣泛的信息來源。(3)提供有規(guī)律的檢索途徑,因而檢索者只要掌握檢索工具所提供檢索途徑的規(guī)律性,就可以實現(xiàn)有效的信息檢索。(4)消除語言障礙,因為檢索工具通常只用一種文字寫成,檢索者只需掌握常用文種,即可實現(xiàn)多語種信息檢索。(5)檢索工具通常提供相關主題的題錄或文摘而不是全文,因而可加快檢索速度。
信息存儲工作包括文獻收集、信息加工整理,最后形成有序的、具有存儲標志的文獻信息數(shù)據(jù)庫;信息檢索工作則包括用戶提出課題檢索要求、通過分析形成檢索標志,然后到文獻信息數(shù)據(jù)庫中進行檢索標志與存儲標志的匹配,凡是匹配成功的,相應信息款目即為只能改選檢索結果。
因而,所謂信息檢索原理,簡單地講,就是檢索提問標志與存儲在檢索工具中的文獻特征標志進行比較或稱匹配,然后提取相符合的文獻信息的檢索方法。在機檢中所采用的檢索原理通常是依靠邏輯運算的布爾檢索方式,這種方法是運用以“與”(and)、“或”(or)以及“非”(not)為主的邏輯運算來檢索所需信息的。
網(wǎng)絡信息檢索的可視化是指將數(shù)據(jù)庫中的不可見的語義關系用圖像形式可視化顯示并表達用戶檢索過程??梢暬木W(wǎng)絡信息檢索可以使文獻或檢索式內(nèi)部的語義關系簡化,用戶能夠很容易的判斷一個檢索中的相關的文獻,可視化的網(wǎng)絡信息檢索是一個透明的檢索過程,不僅使檢索更容易、有效,還為用戶展示了更豐富、更直觀的信息。可視化網(wǎng)絡信息檢索使用戶進行交互式輸入,允許在信息空間進行動態(tài)移動,允許用戶修改數(shù)據(jù)的顯示方式,使他們理解數(shù)據(jù)的個人偏好可視化。如今,可視化技術在地理信息系統(tǒng)(Geographic Information System)、產(chǎn)品設計(Product Design)、城鎮(zhèn)建設與規(guī)劃 (Urban Construction and Plan)等領域得到了應用。所以可視化的網(wǎng)絡信息檢索將會更加明顯。
網(wǎng)絡信息檢索的個性化是指各個網(wǎng)站針對不同的用戶需求提供給用戶有特色的服務內(nèi)容。網(wǎng)站提供個性化服務的實質是提供適應用戶需要的產(chǎn)品。事實上,網(wǎng)上已經(jīng)開始出現(xiàn)專門收錄某一領域信息的網(wǎng)站,尤其是在一些熱門領域。一些大型的搜索引擎已經(jīng)注意到個性化信息服務的提供。目前支持個性化信息服務所需的支撐技術已經(jīng)基本成熟,如數(shù)據(jù)推送技術、網(wǎng)頁動態(tài)生成技術和智能代理技術??梢灶A見,將來網(wǎng)絡的“個性化”功能將得到進一步加強。用戶可以根據(jù)個人喜愛的方式來檢索信息,并且可以在一定程度上改變檢索顯示的結果格式,用戶還可以對命中的檢索結果進行限制,要求僅提供權威的結果,從而提高檢索質量。
未來科技的發(fā)展都要以人為本,網(wǎng)絡信息檢索也不例外。用戶友好化的目的就是讓用戶更方便地訪問信息資源。它主要包括兩個方面的內(nèi)容:一是用戶界面友好化,例如利用窗口、圖標瀏覽器和超文本等用戶友好界面技術,使用戶不必知道所要查找的信息在網(wǎng)絡存放的位置,也不必掌握許多操作命令,同樣能得到滿意的檢索結果。另一方面是更好的為檢索結果提供方式,使用戶方便地進行瀏覽、選擇和利用。
全文檢索是指以各類數(shù)據(jù)諸如文字、聲音、圖像等為主要處理對象,根據(jù)數(shù)據(jù)資料的內(nèi)容,而不是外在特征來實現(xiàn)的信息檢索手段。它是信息檢索發(fā)展的最前沿和目前的最高階段。與其他檢索技術相比,全文檢索技術的新穎之處在于,它可以使用原文中任何一個有實際意義的詞作為檢索入口,而且得到的檢索結果是原文文獻而不是文獻線索,從而使人們能快速方便地查到他們想要的文獻原文。
網(wǎng)絡環(huán)境使世界范圍內(nèi)的信息傳播成為現(xiàn)實,網(wǎng)絡環(huán)境中的電子圖書、網(wǎng)絡期刊等出版物,可以自動形成人名、地名、年代等關鍵詞,具有自動編制書本式索引的功能,提供豐富的檢索點,具有較強的檢索功能和靈活多樣的檢索結果輸出形式,并可以通過網(wǎng)絡主動分發(fā)給信息用戶。
網(wǎng)上信息的多樣性、復雜性以及分散和無序,嚴重地影響了網(wǎng)絡信息檢索,因此,必須規(guī)范網(wǎng)絡信息的計量標準,結束當前這種無序的狀態(tài),建立一整套網(wǎng)絡信息錄入、數(shù)據(jù)組織、信息檢索以及檢索結果規(guī)范化的標準。標準化是網(wǎng)絡信息檢索的當務之急,也是網(wǎng)絡環(huán)境中信息檢索的發(fā)展趨勢。
隨著綜合科技的高速發(fā)展,在不遠的將來,語音識別系統(tǒng)就會像文字輸入法一樣普及,它的普及,可以減輕用戶的手、眼、腰的疲勞,而且盲人也能方便的進行網(wǎng)上檢索,系統(tǒng)通過語音合成技術,把所檢索的信息轉化成聲音,以供盲人使用。語音化檢索是網(wǎng)絡信息檢索的一個重要的發(fā)展趨勢。
綜上所述,隨著網(wǎng)絡技術的新興和發(fā)展,信息檢索技術也必將隨之發(fā)展,技術發(fā)展是無限的,而技術的發(fā)展也都是為了用戶信息檢索的方便和實用而服務的,這是一種趨勢。
[1] 沈固朝.網(wǎng)絡信息檢索工具、方法、實踐[M].北京:高等教育出版社,2004.
[2] 馬文峰.人文社會科學信息檢索[M].北京:北京圖書館出版社,2004.
[3] 許家良.信息檢索[M].北京:國防工業(yè)出版社,2004.
[4] 陳軍蓮.網(wǎng)絡信息檢索中存在的問題及對策[J].圖書館,2007(5).
[5] 賀曉利.信息資源網(wǎng)絡檢索的特點、問題及對策[J].現(xiàn)代情報,2007(5).
[6] 孔為民.信息檢索技術的新趨勢[J].農(nóng)業(yè)圖書情報學刊,2009(3).