摘 要:高等學(xué)校的“文獻(xiàn)檢索課”是一種快速變化的課程,從印刷型檢索到利用計(jì)算機(jī)聯(lián)機(jī)以及對(duì)互聯(lián)網(wǎng)資源的檢索,應(yīng)該與其檢索對(duì)象的大環(huán)境亦步亦趨,網(wǎng)絡(luò)信息資源日臻豐富,給高校的“文獻(xiàn)檢索課”帶來(lái)了新的內(nèi)涵,掌握一種新的實(shí)用高效的搜索引擎應(yīng)該是大學(xué)生“個(gè)人信息基礎(chǔ)架構(gòu)”的重要的部分。
關(guān)鍵詞:檢索;信息資源;信息素質(zhì)
1 引言
“信息素質(zhì)”(Information Literacy),國(guó)內(nèi)一般譯為信息認(rèn)識(shí),信息素質(zhì),信息素養(yǎng),信息能力等。信息素質(zhì)具有廣泛滲透性,涉及國(guó)家經(jīng)濟(jì)及社會(huì)發(fā)展各領(lǐng)域、各層次,是事關(guān)國(guó)家在信息社會(huì)的持續(xù)發(fā)展能力和綜合競(jìng)爭(zhēng)力的一個(gè)重要概念。在信息化熱潮席卷全球,信息素質(zhì)在發(fā)達(dá)國(guó)家已被看作是有關(guān)國(guó)家興衰存亡的一個(gè)重要方面,并在許多發(fā)達(dá)國(guó)家的各教育階段全面開(kāi)發(fā),有較為權(quán)威的教育政策文件、標(biāo)準(zhǔn)和面向各學(xué)科專(zhuān)業(yè)的信息素質(zhì)教育項(xiàng)目、計(jì)劃、課件等。
信息檢索一直是信息素質(zhì)相關(guān)教育中最受重視的部分,是構(gòu)成學(xué)習(xí)者信息能力的重要方面,我國(guó)目前實(shí)施信息素質(zhì)相關(guān)教育采用的最普遍、最主要的教學(xué)形式――高?!拔墨I(xiàn)檢索課”,其主要內(nèi)容包括:文獻(xiàn)信息的組織方法、檢索語(yǔ)言,各類(lèi)檢索工具、檢索系統(tǒng)的檢索利用方法,各類(lèi)文獻(xiàn)的檢索途徑等。隨著網(wǎng)絡(luò)的日益普及和Internet信息資源的深入人心,起來(lái)越多的人們把網(wǎng)絡(luò)作為日常獲得信息的重要手段,有關(guān)的調(diào)查和分析表明,對(duì)于教育和科技界用戶來(lái)說(shuō),通過(guò)網(wǎng)絡(luò)查詢、獲取信息的比例已超過(guò)利用圖書(shū)館的比例。高校圖書(shū)館的“文獻(xiàn)檢索課”在外延和內(nèi)涵上正經(jīng)歷著新的重大轉(zhuǎn)變。
1984年教育部作出了具有戰(zhàn)略意義的決策,在全國(guó)高校普遍開(kāi)設(shè)“文獻(xiàn)檢索與利用”課程,文獻(xiàn)檢索課也從最初完全傳統(tǒng)的印刷型檢索工具開(kāi)始,20世紀(jì)80年代后期逐步結(jié)合計(jì)算機(jī)聯(lián)機(jī)的知識(shí),90年代中后期逐步結(jié)合計(jì)算機(jī)聯(lián)機(jī)檢索的內(nèi)容及其到如今網(wǎng)絡(luò)信息資源的檢索,在短短的十多年中發(fā)生了巨大的變化,這也是國(guó)內(nèi)教學(xué)內(nèi)容變化最快的課程,即便如此,然而,當(dāng)我們果真面臨洶涌澎湃的網(wǎng)絡(luò)信息大潮時(shí),卻發(fā)現(xiàn)原有的教材已跟不上網(wǎng)絡(luò)發(fā)展的步伐,所以我們亟待補(bǔ)上這一門(mén)被“文獻(xiàn)檢索課”疏忽的實(shí)則不可或缺的一個(gè)章節(jié),掌握一種界面簡(jiǎn)潔、友好,搜索功能強(qiáng)大的搜索引擎――Google。
互聯(lián)網(wǎng)是21世紀(jì)最重要的信息媒體,也是世界上最大的信息資源寶庫(kù),掌握在網(wǎng)絡(luò)環(huán)境下的信息檢索方法是大學(xué)生讀者的需求,然而,網(wǎng)絡(luò)環(huán)境下的信息檢索與傳統(tǒng)信息環(huán)境下的檢索有很大不同,網(wǎng)絡(luò)信息資源范圍大、數(shù)量多,網(wǎng)絡(luò)檢索工具及檢索方法也是紛繁眾多,要迅速準(zhǔn)確并相對(duì)全面完整地找到所需信息并不是很容易,往往會(huì)感到與自己的檢索目標(biāo)不符合或差距太遠(yuǎn)而放棄檢索。網(wǎng)絡(luò)信息檢索所具有的多樣性、靈活性遠(yuǎn)遠(yuǎn)超出了傳統(tǒng)的信息檢索,許多在過(guò)去的檢索過(guò)程中業(yè)已形成習(xí)慣的某些檢索思維,以及一些已成定勢(shì)的檢索方法,在網(wǎng)絡(luò)信息檢索空間往往行不通,或不能使檢索結(jié)果達(dá)到最優(yōu),所以,對(duì)一種實(shí)用的網(wǎng)絡(luò)搜索引擎獲取更深廣的認(rèn)知很有必要。
2 我們?yōu)槭裁葱枰畔⑺阉饕?/p>
世界上的某些圖書(shū)館,特別是某些大學(xué)的圖書(shū)館,凡是正式出版的書(shū),它們都網(wǎng)羅無(wú)遺,不過(guò),這樣子的做法已不能維持多久。到2040年,世界上會(huì)有2億種不同的書(shū),要存放這些書(shū),就得要有5000英里長(zhǎng)的書(shū)架,存放與編目工作的代價(jià)將是驚人的。顯然,我們時(shí)代的泛濫的信息需要通過(guò)電子方法來(lái)管理,各種論文、期刊、報(bào)道與其他信息的數(shù)量遠(yuǎn)遠(yuǎn)超過(guò)書(shū)的數(shù)量,這就給信息的整理工作帶來(lái)了更大的困難。
人們創(chuàng)造并保留下來(lái)的信息的數(shù)量是在印刷機(jī)發(fā)明以后開(kāi)始增加起來(lái)的。開(kāi)始時(shí),增加的速度很慢,谷登堡印刷機(jī)的初始階段并沒(méi)有新書(shū)的創(chuàng)作,那時(shí)科學(xué)和學(xué)習(xí)只是對(duì)古老的書(shū)本內(nèi)容的研究和再研究,但是,文藝復(fù)興開(kāi)辟了認(rèn)識(shí)世界的新途徑,人們慢慢地開(kāi)始掌握新的知識(shí),第一本科學(xué)期刊是在十七世紀(jì)六十年代出版的,它比谷登堡發(fā)明印刷機(jī)要晚兩個(gè)世紀(jì)。到了1750年,世紀(jì)上已有10種科學(xué)期刊了,并且從那時(shí)起,每過(guò)五十年科學(xué)期刊的數(shù)量就增加到10倍。大約數(shù)字如下:
1750年科學(xué)期刊數(shù)量 10種
1800年科學(xué)期刊數(shù)量 100種
1850年科學(xué)期刊數(shù)量 1000種
1900年科學(xué)期刊數(shù)量 10,000種
1950年科學(xué)期刊數(shù)量 100,000種
到了二十世紀(jì)五十年代,有記錄的信息增長(zhǎng)之快,被稱為信息爆炸,這種說(shuō)法似乎并不確切,因?yàn)楸ㄊ呛芸炀蜁?huì)結(jié)束的,而在二十世紀(jì)六十年代和以后的歲月中,電子技術(shù)以前人所不能想象的方式迅速提高了記錄信息的速度。
科學(xué)論文數(shù)目的增長(zhǎng)速度大大地超過(guò)了期刊數(shù)目的增長(zhǎng),人類(lèi)知識(shí)的總和在1950年是每十年就翻一番,在計(jì)算機(jī)無(wú)線電通信等領(lǐng)域尤甚。
正當(dāng)科學(xué)進(jìn)展需要的時(shí)候,處理和傳遞信息的新技術(shù)及時(shí)出現(xiàn)了?;仡櫦夹g(shù)發(fā)展的歷史,人們發(fā)現(xiàn),某個(gè)研究領(lǐng)域里的一些重要發(fā)明往往正好是在其他領(lǐng)域的發(fā)展需要它們的時(shí)候出現(xiàn)的。例如,電子管出現(xiàn)在電信發(fā)展極其需要它們的時(shí)候,我們現(xiàn)在已經(jīng)進(jìn)入人類(lèi)知識(shí)的這樣一個(gè)階段:不借助計(jì)算機(jī),所有工業(yè)部門(mén)管理和科學(xué)研究部門(mén)所創(chuàng)造的信息就根本無(wú)法處理。這種信息不會(huì)終止,只會(huì)更加加劇。
隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)上信息資源日臻豐富,在浩如煙海的信息中尋找有用信息更成了一個(gè)非常棘手的問(wèn)題,于是,搜尋信息方便性變得與提供信息本身同樣重要,互聯(lián)網(wǎng)除了提供信息,還提供方便的信息檢索服務(wù),實(shí)現(xiàn)后一種功能的主要手段就是利用搜索引擎。Google于是應(yīng)運(yùn)而生。如果以毫不偏頗、毫不排外的眼光與情懷來(lái)看待這種風(fēng)靡全球的Google,它的確是最好的搜索引擎。
Gogle是由Larry Page與Sergey Brin于1998年9月在美國(guó)硅谷設(shè)計(jì)的搜索引擎。目前,已有Yahoo、AQL、網(wǎng)景和中國(guó)的網(wǎng)易等知名網(wǎng)站在內(nèi)的全球150多家公司采用了Google的搜索引擎技術(shù)。Google中文搜索引擎在某種程度上可以說(shuō)是目前收錄范圍最廣、功能最強(qiáng)、準(zhǔn)確度最高的搜索引擎。
3 Google的功能與特點(diǎn)
Google搜索引擎是是一個(gè)利用蜘蛛程序(Spider)以某種方法自動(dòng)在互聯(lián)網(wǎng)中搜集和發(fā)現(xiàn)信息,并由索引器為搜集到的信息建立索引,從而提供面向網(wǎng)頁(yè)的全文檢索服務(wù)的互聯(lián)網(wǎng)查詢系統(tǒng),它主要有以下特點(diǎn)和功能:
1.采用了先進(jìn)的網(wǎng)頁(yè)級(jí)別(Page Rank)技術(shù)。這種技術(shù)是指依據(jù)網(wǎng)絡(luò)自身結(jié)構(gòu),根據(jù)互聯(lián)網(wǎng)本身的鏈接結(jié)構(gòu)對(duì)相關(guān)網(wǎng)站用自動(dòng)方法進(jìn)行分類(lèi),整理混沌信息,整合組織資源,使網(wǎng)絡(luò)井然有序。這種技術(shù)打破了傳統(tǒng)網(wǎng)絡(luò)分類(lèi)概念,它是基于網(wǎng)頁(yè)的自然結(jié)構(gòu),即任何網(wǎng)頁(yè)均可直接鏈接到另一網(wǎng)頁(yè),無(wú)須任何媒介。從某種意義上說(shuō),該鏈接結(jié)構(gòu)自動(dòng)地推動(dòng)了互聯(lián)網(wǎng)的民主化,消除了等級(jí),從而使信息與觀念在站點(diǎn)與站點(diǎn)之間暢通無(wú)阻。
2.在同一個(gè)界面下,可以定制語(yǔ)言和到何種網(wǎng)站中進(jìn)行搜索。因?yàn)镚oogle將多國(guó)語(yǔ)言的搜索引擎整合到同一個(gè)界面,選擇非常方便。它不像其他搜索引擎(如Yahoo)那樣,要搜索不同語(yǔ)言版本的網(wǎng)站,必須先進(jìn)入相應(yīng)語(yǔ)言的網(wǎng)站。目前,Google已可以對(duì)包括中文在內(nèi)的26種語(yǔ)言進(jìn)行搜索。
3.搜索結(jié)果通常會(huì)比其他搜索引擎來(lái)得更準(zhǔn)確。對(duì)于現(xiàn)實(shí)中許多不諳搜索引擎復(fù)雜系統(tǒng)的使用方式和規(guī)則的檢索者,例如,不知道搜索引擎與分類(lèi)目錄的差別,不懂使用邏輯運(yùn)算符,只會(huì)用單一關(guān)鍵詞查詢等這些情況,Google都替他們考慮過(guò)。當(dāng)輸入關(guān)鍵字搜索時(shí),它不僅會(huì)去搜索包含關(guān)鍵字的網(wǎng)頁(yè),同時(shí)還會(huì)搜索和這些網(wǎng)頁(yè)高相關(guān)性的網(wǎng)頁(yè)。因?yàn)镚oogle具有鏈接分析的功能,即根據(jù)網(wǎng)頁(yè)間彼此的連接關(guān)系,把一篇網(wǎng)頁(yè)被連接數(shù)目的多寡視為相關(guān)性的一項(xiàng)指標(biāo),并根據(jù)相關(guān)性的排列出次序,以確定謬論網(wǎng)頁(yè)的質(zhì)量或重要度。;
4.在查詢時(shí),Google能夠通過(guò)提供多個(gè)關(guān)鍵字,將只提供包含所有關(guān)鍵字的網(wǎng)頁(yè),其正文或指向它的鏈接包含所輸入的所有關(guān)鍵字。而且,Google還能遵從關(guān)鍵字的相對(duì)位置,對(duì)網(wǎng)頁(yè)關(guān)鍵詞接近度度進(jìn)行分析,按照關(guān)鍵字的接近度區(qū)分搜索結(jié)果的優(yōu)先秩序。在顯示的結(jié)果中,只摘錄包含查詢字串的內(nèi)容作為網(wǎng)頁(yè)簡(jiǎn)介,查詢字串高亮顯示。
5.Google是目前收集亞洲網(wǎng)站最多的搜索引擎之一,對(duì)中文的支持性強(qiáng),相對(duì)于許多國(guó)內(nèi)研發(fā)的中文搜索引擎,Google不但大大提升了中文搜索引擎的相關(guān)性,還更好地 檢索字串與網(wǎng)頁(yè)中文字的語(yǔ)義上的匹配,從而提高了檢索效率。例如,它支持中英文混合檢索詞查詢,比如“甲A”,“F1一級(jí)方程式”等;它支持多種編碼,比如“朱镕基”的“镕”不在GB2312字符集中,但存在于GBK編碼中,許多傳統(tǒng)搜索引擎由于不支持GBK,便無(wú)法查到有關(guān)“朱镕基”的網(wǎng)頁(yè),而Google則可以直接找到;此外,對(duì)于所輸入的中文關(guān)鍵字,Google不僅會(huì)去搜索中文簡(jiǎn)體網(wǎng)站,還會(huì)找出相應(yīng)的中文繁體網(wǎng)站,甚至是日文網(wǎng)站。
6.Google的“手氣不錯(cuò)”、“網(wǎng)頁(yè)快照”和“類(lèi)似網(wǎng)頁(yè)”等功能。Google和一家名為Realnames(簡(jiǎn)稱RN)的網(wǎng)絡(luò)關(guān)鍵字管理公司有合作關(guān)系,其網(wǎng)絡(luò)新名詞是指可以鏈接到網(wǎng)站的商標(biāo)、產(chǎn)品、服務(wù)或者公司名稱,在網(wǎng)絡(luò)中起注冊(cè)商標(biāo)的作用。當(dāng)關(guān)鍵詞與Google推薦的網(wǎng)站匹配時(shí),在搜索結(jié)果中就會(huì)顯示“RN”標(biāo)記。例如,查詢的目地是想進(jìn)入一個(gè)特定的網(wǎng)站(如公司網(wǎng)站),只知道名稱和該網(wǎng)站的有關(guān)的一些局部信息(如該公司的產(chǎn)品等),這時(shí),可通過(guò)的關(guān)鍵字來(lái)試試“手氣不錯(cuò)”。
“網(wǎng)頁(yè)快照”是指Google保存應(yīng)急網(wǎng)頁(yè)內(nèi)容。它的作用是:當(dāng)所要檢索的網(wǎng)頁(yè)在實(shí)際上可能已經(jīng)過(guò)時(shí)或者已經(jīng)不存在了,而由于搜索引擎的更新需要一定的時(shí)間,無(wú)法跟得上那些更新快的網(wǎng)站,或是有時(shí)碰到網(wǎng)頁(yè)服務(wù)器的暫時(shí)中斷而找不到服務(wù)器,這時(shí)快照內(nèi)容便可暫解燃眉之急。此外,其速度也比常規(guī)鏈接快,但信息可能不是最新的。
到目前為止,Google依然存在以下一些令人遺憾的地方。其數(shù)據(jù)的更新速度無(wú)法進(jìn)一步提高,由于數(shù)據(jù)量的龐大,使Google搜索引擎的數(shù)據(jù)庫(kù)更新無(wú)法早于30天,在一定程度上影響對(duì)信息的時(shí)效需求,目前這一瓶頸還無(wú)法突破。無(wú)法搜索動(dòng)態(tài)生成的網(wǎng)頁(yè),因?yàn)榇蠖鄶?shù)負(fù)責(zé)搜索網(wǎng)頁(yè)的蜘蛛軟件都不敢去碰動(dòng)態(tài)網(wǎng)頁(yè),怕被變化無(wú)窮的動(dòng)態(tài)系統(tǒng)黑洞吸進(jìn)去出不來(lái)。Google這方面的研究雖然取得一些,但離真正的實(shí)用還有一段路要走。
4 結(jié)束語(yǔ)
源于信息教育的研究在我國(guó)才剛起步,對(duì)信息素質(zhì)教育的整體認(rèn)識(shí)和理論上的準(zhǔn)備還有待深化。由于對(duì)信息素質(zhì)概念缺乏全面認(rèn)識(shí),導(dǎo)致相關(guān)實(shí)踐中的偏頗,如引言中所述,高校中的“文獻(xiàn)檢索與利用”一課是我國(guó)信息教育的主要形式,盡管近年來(lái)已有研究人員對(duì)大學(xué)新形勢(shì)下“文獻(xiàn)檢索課”的名稱和內(nèi)容提出了質(zhì)疑和改革建議,但只是在原有教育內(nèi)容上增加機(jī)檢和網(wǎng)絡(luò)信息檢索極少部分的內(nèi)容,甚至一些信息檢索課還保存已在高校圖書(shū)館中淘汰的手工檢索式陳舊方法的教學(xué)內(nèi)容,整體上仍局限于在對(duì)圖書(shū)館信息資源利用的角度,所以,相關(guān)的教育實(shí)踐也停留在培養(yǎng)“圖書(shū)館素質(zhì)”(Library Literacy)和書(shū)目指導(dǎo)(Bibliographic Instruction)等階段,尚未進(jìn)入到真正意義的信息素質(zhì)教育活動(dòng),希望被廣泛應(yīng)用的搜索能力極強(qiáng)的Google,有利于大學(xué)生讀者建立“個(gè)人信息基礎(chǔ)架構(gòu)(Personal Intormation Infaastructure)。
參考文獻(xiàn)
[1]賀志則 李修波,現(xiàn)代化檢索信息檢索[M].山東科學(xué)技術(shù)出版社 2003年: 183-185
[2]符紹宏等,信息檢索[M]北京:高等教育出版社,2004年:405-407
[3]范并思,二十世紀(jì)西方與中國(guó)的圖書(shū)館學(xué)[M]北京:北京圖書(shū)館出版社,2004年:5-7
[4]馬丁,信息化社會(huì)漫話[M]上海:科學(xué)技術(shù)出版社,1985年:73-75
作者簡(jiǎn)介
鄭祖芬(1975-),女,廣西桂林人,研究生畢業(yè),桂林電子科技大學(xué)圖書(shū)館工作,主要從事圖書(shū)館學(xué)研究。