国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

文獻信息檢索中關(guān)鍵詞的選擇和使用

2016-06-11 13:45徐春燕
經(jīng)營管理者·中旬刊 2016年5期
關(guān)鍵詞:信息檢索下位上位

徐春燕

摘 要:文章主要介紹了關(guān)鍵詞的概念和作用,以及從五個方面闡述了在文獻信息檢索中如何選取關(guān)鍵詞。

關(guān)鍵詞:信息檢索 文獻檢索 關(guān)鍵詞

在對文獻信息檢索的過程中,不少的信息用戶在面對大量的信息資源時,仍不能找到滿足自身需求的信息。出現(xiàn)這種現(xiàn)象,主要是因為信息用戶對信息檢索技巧與方法掌握的不足。關(guān)鍵詞的選取就是信息檢索環(huán)節(jié)中非常重要的一個環(huán)節(jié),其中涉及了不少檢索技巧,下面給大家介紹一下選取關(guān)鍵詞的相關(guān)概念和選取技巧。

一、關(guān)鍵詞的概念

關(guān)鍵詞是直接從原文的題目、摘要或者全文中抽取出來的,具有實質(zhì)意義的、未經(jīng)規(guī)范化處理的自然語言詞匯,對揭示文獻內(nèi)容有重要意義。被抽選出來的關(guān)鍵詞可以作為標(biāo)引詞在索引中輪排,作為檢索詞進行檢索。由于關(guān)鍵詞表達實物和概念比較直接,不受詞表控制,能及時反映新事物、新概念,目前被廣泛地應(yīng)用于手工檢索和計算機檢索系統(tǒng)中。關(guān)鍵詞是未經(jīng)規(guī)范化處理的自由詞,除了禁用詞,如冠詞、介詞、副詞等,幾乎所有具有檢索意義的詞都可用作關(guān)鍵詞。

二、關(guān)鍵詞的作用

關(guān)鍵詞檢索屬于主題檢索范疇,它的特點是:具有檢索的直接性,能夠反映主題的靈活性以及便于特性檢索,查準(zhǔn)率較高。利用關(guān)鍵詞檢索已成為計算機檢索系統(tǒng)下檢索者查找文獻的主要檢索途徑之一。主題檢索語言包括標(biāo)題詞、元詞、敘詞、關(guān)鍵詞。其中,標(biāo)題詞、元詞、敘詞是經(jīng)規(guī)范化的語言,也稱為規(guī)范詞或受控詞。雖然規(guī)范詞具有種種優(yōu)點,但這種受控的語言具有標(biāo)引難度大,標(biāo)引一致性和專指性差等缺點。一般的信息用戶并不熟悉受控詞的相關(guān)規(guī)則及技術(shù),使用起來比較困難。而關(guān)鍵詞檢索不受受控詞表的控制,任何能揭示文獻主題內(nèi)容,具有檢索意義的詞語都可以用作關(guān)鍵詞進行檢索。檢索者不需要去查相關(guān)詞表及其使用規(guī)則,能很快理解和掌握這種方法。但是由于關(guān)鍵詞語言存在大量的同義詞、近義詞、多義詞和同形異義詞,因此在信息檢索中,關(guān)鍵詞的選擇恰當(dāng)與否對查全率和查準(zhǔn)率具有很大的影響。

三、關(guān)鍵詞的選取

1.選擇具有檢索意義的詞。在信息檢索中,關(guān)鍵詞的選擇對與檢索的效率起著有很大的影響。檢索中的無關(guān)詞過多,就會降低檢索效率,返回的相關(guān)文獻較少或者為零;檢索詞越少,返回的冗余信息越多,增加我們篩選相關(guān)信息的工作量。因此在選取關(guān)鍵詞時,我們應(yīng)選擇對待檢課題具有檢索意義的重要詞作為檢索詞。比如“對于信息素質(zhì)的培養(yǎng)問題”,在這一課題中,真正具有檢索意義的重要詞為“信息素質(zhì)”、“培養(yǎng)”,而“對于”和“的”以及“問題”這幾個非重要詞對于這一個課題沒有實質(zhì)的檢索意義,因此本課題關(guān)鍵詞為“信息素質(zhì)”和“培養(yǎng)”。

2.盡量選全同義詞。在《現(xiàn)代漢語同典》中對同義同的定義是:意義相同或相近的詞。如“尊重”和“敬仰”,“計算機”和“電腦”。信息檢索領(lǐng)域中的同義詞比語法學(xué)上的同義詞要更寬泛。包括學(xué)名和俗名,全稱和簡稱,新稱與舊稱,外文形式及其簡稱。

3.優(yōu)先使用代碼?,F(xiàn)在不少的信息都有自己的代碼。例如,圖書的國際標(biāo)準(zhǔn)書號ISBN、期刊的國際標(biāo)準(zhǔn)刊號ISSN、專利號、報告號、合同號、索書號以及元素符號、分子式、結(jié)構(gòu)式、ISO標(biāo)準(zhǔn)號等。在檢索的時候優(yōu)先使用這些代碼作為關(guān)鍵詞能快速地檢索到一批滿足信息用戶需求的信息,這將提高檢索的查準(zhǔn)率。例如想了解手機型號為NIKIA 5530XM的手機的相關(guān)信息,在百度搜索引擎的關(guān)鍵詞輸入框里輸入手機型號代碼“NIKIA 5530XM”就能檢索到關(guān)于這部手機的圖片、性能、報價等相關(guān)信息。

4.注意上位類詞和下位類詞的選取。上位詞:指概念上外延更廣的主題詞。 例如:”花”是”玫瑰”的上位詞,”植物”是”花”的上位詞,上位詞是相對某主題詞的,有它自己的等同詞、上位詞、下位詞、同類詞。

下位詞:指概念上內(nèi)涵更窄的主題詞。 例如:“大學(xué)圖書館”的下位詞包括”重慶大學(xué)圖書館” 、”西南大學(xué)圖書館”,”蘋果”是”水果”的下位詞,下位詞是相對某主題詞的,也有它自己的等同詞、上位詞、下位詞、同類詞。

上位詞、下位詞的檢索方法有兩種,一種是直接采用“擴展檢索”,這種力法是考慮主題概念的上位概念詞。課題“玫瑰的種植”與“牡丹的種植”,將“玫瑰”與“牡丹”組配,結(jié)果等于向上位“花”的概念擴人,再與“種植”組配,完成了課題的要求。另一種方法是將其上位詞、下位詞并用。如檢索“森林鐵路”的有關(guān)文獻,森林鐵路是干線、岔線的上位詞,反過來干線、岔線是森林干線的下位詞。檢索森林鐵路時應(yīng)用“森林鐵路”的上下位詞并用,即把“森林鐵路”“森林干線”“森林岔線”幾個關(guān)鍵詞并用,擴展檢索篇數(shù)明顯大于用“森林鐵路 ”檢索的篇數(shù)。

5.英語關(guān)鍵詞的選取技巧。在信息檢索過程中,對于同一個概念的表達,往往可以使用不同的詞匯。在英文檢索的時候,情況也如此。例如:在檢索關(guān)于“環(huán)境”主題的信息時,若只選取environment作為英文檢索關(guān)鍵詞,則會漏檢。在英文中,“環(huán)境”這一概念還可以用surroudings,setting等詞匯來表達,少選了其中的一個詞,則含有該詞的文獻就不能命中,產(chǎn)生漏檢。因此我們要掌握同一概念詞的不同詞匯,以提高查全率。另外,對于詞根相同的單復(fù)數(shù)形式,時態(tài)不同的詞匯等,我們可以通過截詞檢索技術(shù)對其進行檢索。

四、結(jié)語

關(guān)鍵詞是表達用戶信息需求和檢索課題內(nèi)容的基本構(gòu)成要素,關(guān)鍵詞選取恰當(dāng)與否將直接影響檢索的最終效果,即檢索的查全率和查準(zhǔn)率。因此在檢索課題時,應(yīng)充分分析課題內(nèi)容,對其主題概念和屬性進行分析,選取恰當(dāng)?shù)年P(guān)鍵詞,進行相應(yīng)的邏輯組配,再靈活選用各種檢索方法和檢索技巧,優(yōu)化檢索策略,才能提高檢索效果,檢索出用戶滿意的信息。

參考文獻:

[1]馬景娣.實用信息檢索教程[M].杭州:浙江出版社,2004年:27.

[2] 沈艷紅.信息檢索中檢索詞的選擇對查全率的影響[J].情報探索.2006.11

猜你喜歡
信息檢索下位上位
發(fā)射機房監(jiān)控系統(tǒng)之下位機
特斯拉 風(fēng)云之老阿姨上位
“三扶”齊上位 決戰(zhàn)必打贏
基于ZigBee和VC上位機的教室智能監(jiān)測管理系統(tǒng)
醫(yī)學(xué)期刊編輯中文獻信息檢索的應(yīng)用
景洪電廠監(jiān)控系統(tǒng)下位機數(shù)據(jù)傳輸網(wǎng)絡(luò)改造
圍觀黨“下位”,吐槽帝“登基”
基于神經(jīng)網(wǎng)絡(luò)的個性化信息檢索模型研究
以新思路促推現(xiàn)代農(nóng)業(yè)上位
CAN總線并發(fā)通信時下位機應(yīng)用軟件設(shè)計