杜喜
摘 要 浩瀚的互聯(lián)網(wǎng)信息為各種各樣的需求提供了難以窮盡的源泉,因而信息的檢索也就成為了重要的環(huán)節(jié)。隨著信息技術(shù)的進(jìn)一步發(fā)展,信息檢索手段也在不斷完善,它為計(jì)算機(jī)用戶與海洋般的信息之間建起一條更加快捷更加方便的橋梁。本文就互聯(lián)網(wǎng)信息檢索作了簡要論述。
關(guān)鍵詞 互聯(lián)網(wǎng) 信息檢索 技術(shù)
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A
計(jì)算機(jī)技術(shù)的發(fā)展與完善,信息檢索便成為了重要的橋梁。早在上世紀(jì)六十年代,美國海軍機(jī)械試驗(yàn)中心使用IBM701型機(jī),初步建成了計(jì)算機(jī)情報(bào)檢索系統(tǒng),這也預(yù)示著以計(jì)算機(jī)檢索系統(tǒng)為代表的信息檢索自動(dòng)化時(shí)代的到來。單純的手工檢索和機(jī)械檢索都或多或少顯露出各自的缺點(diǎn),因此,新型的信息檢索方式應(yīng)運(yùn)而生。1965年,美國系統(tǒng)發(fā)展公司研制成功ORBIT聯(lián)機(jī)情報(bào)檢索軟件,開啟了聯(lián)機(jī)情報(bào)檢索系統(tǒng)階段。與此同時(shí),美國洛克公司研制成功了著名的Dialog檢索系統(tǒng)。且隨著20世紀(jì)70年代衛(wèi)星通信技術(shù)、微型計(jì)算機(jī)以及數(shù)據(jù)庫產(chǎn)生的同步發(fā)展,用戶得以沖破時(shí)間和空間的障礙,實(shí)現(xiàn)了國際聯(lián)機(jī)檢索。聯(lián)機(jī)檢索是計(jì)算機(jī)、信息處理技術(shù)和現(xiàn)代通信技術(shù)三者的有機(jī)結(jié)合。隨著互聯(lián)網(wǎng)的迅速發(fā)展及超文本技術(shù)的出現(xiàn),基于客戶/服務(wù)器的檢索軟件的開發(fā),實(shí)現(xiàn)了將原來的主機(jī)系統(tǒng)轉(zhuǎn)移到服務(wù)器上,使客戶/服務(wù)器聯(lián)機(jī)檢索模式開始取代以往的終端/主機(jī)結(jié)構(gòu),聯(lián)機(jī)檢索進(jìn)入了一個(gè)嶄新的時(shí)期。信息檢索系統(tǒng)類型包括:參考數(shù)據(jù)庫檢索系統(tǒng),它以二次文獻(xiàn)數(shù)據(jù)庫為主,提供文獻(xiàn)的題錄、文摘數(shù)據(jù)或事實(shí)數(shù)據(jù)。全文數(shù)據(jù)庫檢索系統(tǒng)是近年來隨著數(shù)字化技術(shù)不斷成熟而發(fā)展起來的,系統(tǒng)能提供文獻(xiàn)的全文數(shù)據(jù),包括圖表、圖像等多種形式的媒體。Internet搜索引擎主要提供網(wǎng)上資源的鏈接,某些搜索引擎也提供簡單的網(wǎng)頁介紹或檢索詞的上下文。
從信息檢索方式來說,命令檢索方式,指的是檢索過程中,每一項(xiàng)檢索提問,必須通過具體的命令來完成,這些檢索命令通常需要用戶熟記。這種方式雖然對(duì)于初級(jí)用戶來說比較麻煩,需要記很多的命令,但是對(duì)熟悉系統(tǒng)的用戶來說,命令方式有其步驟簡單的優(yōu)點(diǎn),尤其是完成一些復(fù)雜的檢索算法時(shí),操作步驟簡單。單檢索方式實(shí)際上是將各種檢索指令轉(zhuǎn)化成菜單選項(xiàng),系統(tǒng)的功能和檢索指令通過菜單和子菜單的選項(xiàng)來實(shí)現(xiàn),用戶通過菜單一目了然,只需根據(jù)需要在菜單上選擇某一項(xiàng),或進(jìn)行檢索,或顯示命令中的紀(jì)錄等。菜單驅(qū)動(dòng)的檢索方式對(duì)初級(jí)用戶是比較友好的,用戶不需要培訓(xùn)就可以自行檢索,很容易入門,但對(duì)于較復(fù)雜的檢索算法,常常需要進(jìn)入層層菜單才能完成。其次,命令與菜單相結(jié)合的方式既保留了指令檢索的方式,又提供了菜單的某些直觀的功能。而主題法和分類法在信息檢索中的原理基本相同。信息儲(chǔ)存是對(duì)文獻(xiàn)進(jìn)行收集、標(biāo)引及著錄,并加以有序化編排。
信息檢索是從大量的信息中查找出用戶所需的特定信息的過程,而實(shí)施檢索的主要方法就是利用各種檢索工具。在主題概念表達(dá)上分類語言的一個(gè)顯著特點(diǎn)是用碼號(hào)(如字母或數(shù)字)作為文獻(xiàn)的標(biāo)識(shí),標(biāo)引或檢索時(shí)都必須使用分類號(hào)。主題語言則是直接以自然語言中的話詞作為標(biāo)引和檢索的標(biāo)識(shí)。在主題概念的組織上主題法與分類法都要將主題概念組織成可迅速查找的檢索工具或檢索系統(tǒng)。分類語言主要是按學(xué)科體系或邏輯體系組織的,由于分類體系不是顯而易見、易于掌握的,因此用戶在使用分類檢索工具或檢索系統(tǒng)時(shí),往往難以確定新主題、細(xì)小主題以及復(fù)雜主題在體系中的準(zhǔn)確位置。主題語言按照語調(diào)的字順來組織主題概念,因而可以直接依名檢索。在主題內(nèi)在關(guān)系的顯示上分類語言中主題內(nèi)在關(guān)系主要通過上下位類、同位類以及交替類目、參見類目和類目注釋來顯示。尤其在體系分類表中,類目之間的等級(jí)關(guān)系可以通過類目排列的位置、乃至字體的不同而直接明顯地展示由來。因而分類法系統(tǒng)的系統(tǒng)性、等級(jí)性強(qiáng),便于進(jìn)行瀏覽性檢索,并可以根據(jù)檢索的需要進(jìn)行擴(kuò)檢和縮檢。主題語言中,主題內(nèi)在關(guān)系主要通過建立詞間參照系統(tǒng)的方式來顯示。此外也通過輔助索引進(jìn)行分類顯示。所以,在主題詞表中,相關(guān)主題之間的關(guān)系難以直接地、一目了然地展示出來,因而在族性檢索、尤其是較大范圍課題的檢索中,不如分類語言。在標(biāo)引方法上使用分類語言標(biāo)引時(shí),主題分析的重點(diǎn)是辨別確定文獻(xiàn)主題的學(xué)科性質(zhì),以便進(jìn)一步確定所屬類目。
此外,從信息檢索技術(shù)角度來說,布爾邏輯檢索技術(shù)就是指利用布爾邏輯運(yùn)算符進(jìn)行檢索詞語和代碼之間的邏輯組配運(yùn)算,從而獲得檢索結(jié)果的一種檢索方法。這是計(jì)算機(jī)信息檢索中最基本的也是最常用的技術(shù)。對(duì)于一般用而言,截詞檢索(Truncation)是一種常用的檢索技術(shù),特別是在西文檢索中,更是廣泛使用。截詞檢索就是對(duì)詞的片斷進(jìn)行比較,檢索者將檢索詞在合適的地方截?cái)?,然后以截出的詞語片斷進(jìn)行檢索。在檢索系統(tǒng)中,為了提高檢索的準(zhǔn)確率,縮小檢索的范圍,通常用一些限制的手段和方法。使用這些方法進(jìn)行檢索通常稱為限制檢索(Limit Search)。常用的限制方法就是字段限定。此外,全文本檢索技術(shù)(Full text Searching)是對(duì)數(shù)據(jù)庫紀(jì)錄的全文文本檢索,即紀(jì)錄中的每個(gè)詞都可以作為檢索入口,且可以限定詞與詞之間的語義關(guān)系。全文本檢索也有人把它稱為自由文本檢索。隨著信息技術(shù)的進(jìn)一步發(fā)展,尤其是功能更加強(qiáng)大的搜索軟件的普及,已經(jīng)為廣大用戶帶來了極大的便捷。