孫輝中
摘 要:在現(xiàn)代信息技術快速發(fā)展的背景下,計算機互聯(lián)網技術逐漸成為國民生產生活的重要組成部分,能夠深刻地改變國民的思維方式與行為規(guī)范。而計算機檢索主要指應用各類數據庫獲取檢索資源的過程,影響到用戶課題完成的質量與效率。通過制定并調整計算機檢索策略方式,能夠為我國計算機檢索工作的健康發(fā)展與梳理提供抓手。對此,文章結合用戶交談、數據庫選取、概念選取及檢索策略的調整與制定,優(yōu)化并改進我國的計算機檢索策略。
關鍵詞:計算機;檢索策略;調整
0 ? 引言
在通信技術、網絡技術及計算機技術快速發(fā)展的過程中,計算機檢索的功能日漸強大,能夠以突破時空限制、檢索范圍廣、信息更新快、效率高及檢索快等優(yōu)勢逐漸成為用戶獲取文獻數據的重要手段。然而相較于手工檢索,計算機檢索能夠把用戶的思維取向反饋到計算機檢索策略的調整與定制中,提升檢索結果的精準性。因此檢索策略的質量高低,直接影響到檢索結果的呈現(xiàn)效果。譬如檢索策略的調整和定制不夠合理,將導致計算機檢索的結果出現(xiàn)誤檢、漏檢等現(xiàn)象。但在檢索策略編制的過程中,用戶交談、數據庫選取、概念選取及檢索策略的調整和定制是重點,需要我們提高相應的重視程度。
1 用戶交談
用戶交談是計算機檢索的根基與焦點,檢索人員必須提高對用戶體驗、需求及要求的重視程度,傾聽用戶的感受,從而明確檢索策略調整和制定的基本方向。在這個過程中,檢索策略制定者需要傾聽用戶有關課題的講解,探究相應的專業(yè)背景,譬如發(fā)展方向、研究進展、常用方法等。此外還需要通過交談的方式,確定用戶具體掌握的文獻資源,讓用戶積極提供關于主題、概念及行業(yè)術語等信息,以此確定計算機檢索的維度,如文獻類型、時間范圍、文獻類型等。
2 概念選取
概念選取在計算機選取中擁有較為突出的地位和作用,直接影響到檢索式的制定質量,切實反映用戶的課題要求。因此我們需要從核心概念、隱含概念、同義詞、規(guī)范用語及不必要概念等角度出發(fā),探究概念選取的手段及方向。首先是選取核心概念。在計算機檢索的過程中,我們需要充分分析課題背景、課題內容及課題要素,選取能夠全面而充分反映課題訴求的核心概念。而對概念較為明確的課題,譬如“故障限流器及高溫超導”,我們能夠提取出故障限流器與高溫超導兩個概念。而針對概念不夠明確的課題,則需要從隱含概念的角度對其進行分析和梳理。其次是隱含概念的挖掘。隱含概念主要指用戶課題中并沒有明確給出的,但卻與用戶課題緊密相關的概念,具體包括上下位概念與相關概念等。譬如“并購”的隱含概念包括拍賣、剝離等。而針對處于非專業(yè)和專業(yè)間的課題題目,則需要深入挖掘課題的隱含概念,探究出較為科學的檢索式。譬如“保護石質文物”,在該題目下,我們需要將保護、石質及文物作為特定的檢索式。再次是同義詞,在計算機檢索的過程中,固定的漢語詞匯所對應的英文通常有多個。如“保護”的英文詞匯有“protection”“preservation”“conservation”等,所以需要檢索者對其進行充分的考慮和明確。最后是規(guī)范用語,在檢索的過程中,需要采用較為通用的概念、行業(yè)術語作為檢索詞,不能將俗語、俚語、方言等不規(guī)范詞匯作為檢索詞。
3 數據庫選取
在計算機信息技術快速發(fā)展的過程中,數據庫的規(guī)模與數量較為豐富,能夠為用戶提供更廣闊、更多元的選擇。因此在計算機檢索的過程中,我們根據數據庫的實際情況與課題的基本內容進行選擇。即從主題范疇、年度范圍、數據庫類型等角度選擇文獻數據庫。首先是主題范疇。選擇科學合理的主題范疇是計算機檢索策略制定的基本原則,能夠幫助用戶更快、更好地獲取理想的檢索結果。通常來講,檢索者需要從數據庫的名稱上對其專業(yè)覆蓋面進行判斷與分析。其次是數據庫的年度范圍與類型。通常文獻的類型多樣,不同的信息數據庫所包括的資源類型、文獻類型也存在明顯的差異。譬如要檢索專利,則需要選取“專利數據庫”,而要檢索報告,則應以“報告庫”為主。因此在數據庫選取與選擇的過程中,我們可以通過查看數據庫簡介或介紹實現(xiàn)這一點。而在年度范疇的層面上,不同數據庫的檢索年度及時間范疇也存在明顯的差異。譬如Dialog數據庫在時間范疇上主要有“399”“314”“313”“312”“311”“310”“309”“308”等8個文檔,每個文檔所覆蓋的時間范疇有所不同,并呈遞增態(tài)勢。譬如“311”的時間范疇為“1982—1987”,而“314”的時間范疇為(1997—present)。在計算機檢索的過程中,我們需要根據相應的檢索要求,確定相應的文檔類型。
4 計算機檢索策略的調整與制定
4.1 明確計算機檢索的基本構成
計算機檢索的邏輯主線包括接受課題、數據庫選擇、組檔方式、檢索字段、基本索引、位置算符、邏輯算符、截詞算符、匹配、數據庫、整體檢索結果、評價用戶滿意度。與此同時,檢索人員還需要在數據庫選擇的層面上,開展概念分析、檢索詞抽取、檢索策略確定及編制檢索式等工作。并將檢索式與匹配環(huán)節(jié)相聯(lián)系,匯集到整理結果中,幫助用戶更好地選擇和應用檢索結果,提高檢索效率。因此計算機檢索擁有兩條并列的發(fā)展路線,其中編制檢索式與位置算符、邏輯算符、截詞算符共同匯集到匹配環(huán)節(jié)中,并對檢索結果進行影響。而匹配過程是將核心概念與隱含概念用位置算符與邏輯算符鏈接或組配起來,并與檢索式相互匹配、相互作用的過程,可以更好地提高計算機的檢索質量和效率。然而在用戶滿意度評價的過程中,我們還需要根據用戶的滿意度對檢索策略進行調整,即如果用戶對檢索結果不夠滿意,則需要補充或制定全新的檢索策略,優(yōu)化檢索式,并將其“作用”在概念分析與檢索式定制的過程中,使其在重新匹配時,獲得用戶理想的檢索結果。
4.2 檢索結果少的成因及調整
檢索結果過少將導致用戶難以獲取較為滿意的“文獻資源”,嚴重影響到課題開展的質量和效率。而在具體的調整與優(yōu)化的過程中,檢索人員需要從問題的成因出發(fā),確定相應的調整方法或策略。首先是檢索詞不恰當,將導致檢索結果出現(xiàn)過少、不夠全面的現(xiàn)象。針對該問題,檢索人員應對檢索詞進行仔細調整與核對,并明確檢索詞的核心概念、隱含概念是否規(guī)范合理。譬如“部分概念”在某個國家的叫法比較科學合理,然而并非國際通用,對此檢索者需要對其進行調整或修改。如衛(wèi)星云圖在國際上的寫法為“WEfax”。但在日本,衛(wèi)星運通的通用寫法卻是“LR fax”。因此在文獻檢索的過程中,會導致檢索者所檢索出的文獻資源相對有限。其次,不能充分地挖掘隱含概念。譬如在檢索“多媒體現(xiàn)場背景下電話線總線技術的研究”中,檢索者通常以“多媒體”“現(xiàn)場總線”及“電話線”等檢索詞來檢索,其檢索的資源及文獻也相對有限,與用戶所了解的具體情況存在明顯的出入,因此需要通過深入挖掘隱含概念的方式,來獲取更多的檢索結果,譬如將信號采集、遠程監(jiān)控看作現(xiàn)場總線的隱含概念,可以提高檢索效度。最后是詞匯關系的限制較為嚴格,譬如應用基于“算符”的檢索詞,將導致計算機檢索的結果較為有限,因此,檢索人員可以放寬對位置算符的限制,或者采用邏輯算符的方式,提高計算機檢索質量。此外是概念的數量較多,對此,減少相應的概念數量,可以拓寬檢索維度。
4.3 檢索結果多的成因及調整
檢索者也可以結合用戶的實際需求、課題背景增加關聯(lián)度較高的概念。譬如在檢索“特定物質”時,可以利用“物質的用途、性能、材質”對其進行界定。首先是限制或者通過邏輯算符的方式,排除關聯(lián)度較低的概念,提高計算機檢索的針對性與有效性。其次是限制較松。針對該類問題,檢索人員需要將邏輯算符轉變?yōu)槲恢盟惴?,通過提高限制的方式,增強檢索結果的準確度與精準性,當然也可利用數據庫的年度范疇對其進行限制,使檢索結果更新、更全、更具時代特性。最后是截詞在應用過程中,存在不準確、不恰當的問題。譬如在檢索“螞蟻”的過程中,截詞的基本形式選擇了“anti”,將導致大量毫不相關的概念或詞匯被包含進去,進而影響到檢索結果的精準性與準確性。所以在截詞選擇的過程中,必須充分考慮截詞的科學性與合理性。此外,在檢索結果過多的情況下,檢索人還需要根據用戶的實際情況及課題需求,對所增加的“新概念”“新限制”進行斟酌與考慮,確定新檢索式與用戶需求的切合度,如果所增加的“限制”或“概念”與用戶需求相沖突,應對其進行及時的調整和改進。
5 結語
在現(xiàn)代科技快速發(fā)展的背景下,文獻數據庫的規(guī)模增長與數量提升,使數據庫的檢索方法更加完善、更加豐富,并成為文獻數據庫發(fā)展的有機組成部分。然而在檢索策略制定與調節(jié)的過程中,我們需要明確“用戶交流”“概念提取”“數據庫選擇”在檢索策略調節(jié)與制定中的價值和地位,通過了解用戶需求的方式,提高檢索策略的精準性與針對性,切實滿足用戶的基本訴求,推動計算機檢索事業(yè)的健康發(fā)展。
[參考文獻]
[1]燕慧泉.手工檢索與計算機信息檢索在檢索策略之擬定和優(yōu)化方面的分析比較[J].現(xiàn)代情報,2003(12):74-76.
[2]叢立.計算機檢索策略設計及技巧運用[J].圖書館學研究,2001(3):52-55.
[3]劉靜.計算機檢索策略與技巧芻議[J].四川圖書館學報,2001(3):72-75.
[4]紀清照.淺談電力科技查新中計算機檢索的質量控制[J].江西電力職業(yè)技術學院學報,2004(2):59-60.
(編輯 王雪芬)