国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

網(wǎng)絡(luò)環(huán)境下《漢語主題詞表》(工程技術(shù)版)詞間等同、等級關(guān)系的處理

2014-12-31 09:42:54王冠華
圖書館論壇 2014年8期
關(guān)鍵詞:詞族詞頻廢液

王冠華,危 紅

2010年中國科學技術(shù)信息研究所啟動《漢語主題詞表》 (工程技術(shù)版)(以下簡稱“《漢表》”)的修訂,2013年基本完成。新《漢表》是建立在網(wǎng)絡(luò)環(huán)境下的在線《漢表》,是由基礎(chǔ)詞庫、核心詞庫、敘詞詞庫等構(gòu)成的知識組織系統(tǒng),采用在線平臺進行編制,提供基于知識組織的術(shù)語服務(wù),加強與用戶的交互,并建立動態(tài)變化的專業(yè)知識體系更新與維護機制,其智能化和可視化技術(shù)提供了更多人性化的應用方式[1]。

新《漢表》 的基礎(chǔ)詞庫來源包括80余種的中文敘詞表,截止2010年6月的全國科學技術(shù)名詞審定委員會公布的科技術(shù)語,1600余種的術(shù)語標準,約200種的理工類詞典(含百科),約300萬條萬方中文期刊、學位論文關(guān)鍵詞、維普中文期刊關(guān)鍵詞以及約100萬條的網(wǎng)絡(luò)百科詞匯。按詞形查重后總計360萬條。其中,約30萬條無法歸類,主要為網(wǎng)絡(luò)詞匯,330萬條詞匯有分類;161萬條詞匯有英文譯稱,27萬條詞匯有注釋,21萬條詞匯有用/代關(guān)系,32萬條詞匯有屬/分關(guān)系,10萬條詞匯有相關(guān)關(guān)系[2]。不同來源的數(shù)據(jù)、概念的合并和關(guān)聯(lián)都會加大概念體系的復雜度。如何合并相同概念,構(gòu)建同義詞群;如何區(qū)分敘詞的等級關(guān)系;如何注意到等同關(guān)系、等級關(guān)系、相關(guān)關(guān)系之間既有語詞客觀的聯(lián)系,又有很大的人為性,且相互間不是絕對的,是可以相互轉(zhuǎn)換的;如何在多人協(xié)同工作模式下,使敘詞的詞間關(guān)系得以控制,是詞表修訂工作中詞間關(guān)系建設(shè)質(zhì)量的體現(xiàn)。

1 等同關(guān)系的建立及同義詞群的構(gòu)建

等同關(guān)系用于同義詞或近義詞之間,即一般的異形同義詞、同一概念的不同譯名之間、舊稱與新稱之間、俗稱與學名之間、中文全譯名與外文縮寫詞之間、別名與產(chǎn)品型號名之間;還用于準同義詞之間,即一般準同義詞之間、部分反義詞之間,用于泛指敘詞與專指敘詞之間,須將使用頻率低的專指詞歸納到所從屬的泛指敘詞。準同義詞的詞義不同,但從文獻處理與情報檢索方面考慮,需要將它們作為同義詞來處理,以免分散文獻[3]。

雖然新《漢表》在線平臺對庫中詞匯有同義詞推薦功能,方便了同義詞的詞群建立,但新《漢表》的海量詞匯,致使推薦的同義詞建群的準確率不太高,真正等同關(guān)系的建立,還是依賴于編表人員的判斷。一般來說,同義詞群是一個概念的多個表達詞匯的匯集。這個詞群中所包括的詞匯不全是同義詞,它可以有準同義詞、部分反義詞,以及0詞頻的下位敘詞。

圖1 以廢棄物為敘詞的詞群

如圖1所示,這是具有大量入口詞(即非優(yōu)選詞)的詞群,詞頻的高低是敘詞(即優(yōu)選詞)選取的依據(jù)之一,廢棄物作為這個詞群中詞頻最高的詞,可選做優(yōu)選詞;廢物作為同義詞、三廢作為準同義詞、零廢品作為反義詞,因其詞頻低于廢棄物,可作為入口詞;中級廢物、二次廢物、次生廢物等在詞義上具有上下位關(guān)系,但因其0詞頻,則采用用代關(guān)系,而不是屬分關(guān)系。廢棄物作為敘詞具有唯一性,其它詞均作為非敘詞(即入口詞、非優(yōu)選詞)。

如圖2所示,按詞群的詞頻看,SBR法的詞頻最高,但敘詞是序批式活性污泥法。序批式活性污泥法是環(huán)境工程專業(yè)名詞,按中華人民共和國環(huán)境保護標準《環(huán)境工程 名詞術(shù)語》(HJ 2016-2012)的定義:英文定義為sequencing batch reactor activated sludge process(縮寫SBR);中文定義為在同一反應池(器)中,按時間順序由進水、曝氣、沉淀、排水和待機5個基本工序組成的活性污泥污水處理方法,簡稱SBR法。SBR法是序批式活性污泥法的簡稱,是一種按間歇曝氣方式來運行的活性污泥污水處理技術(shù)。項目組規(guī)定,對于以英文縮略語、中英文組合、中英文縮略語組合的敘詞,應列出相對應的全中文敘詞,與原有敘詞之間可建立用代關(guān)系。而序批式活性污泥法為國家標準的名稱術(shù)語,是在文獻標引與檢索中用于表達文獻的主題而規(guī)范化的詞,可作為敘詞,其外文縮寫詞或相同概念的不同表達方法的詞匯做非敘詞,以用代關(guān)系來表達。

圖2 以序批式活性污泥法為敘詞的詞群

構(gòu)建同義詞群還需注意多個合成詞組成的復雜概念敘詞,由于合成詞位置不同而出現(xiàn)的不同詞形敘詞,需要認真甄別是否是同一概念。比如,安全生活與生活安全;安全系統(tǒng)與系統(tǒng)安全,按詞義看,前者可作為同義詞來建群,后者則分別為兩個詞族的下位詞。

2 等級關(guān)系的建立及概念指引聚集語義大小的辨析

嚴格意義上的概念等級關(guān)系中,表達涵義較為寬泛的上位概念的外延包含屬于上位詞的較小的、更為專指的下位概念的全部外延,即屬種關(guān)系。從傳統(tǒng)紙質(zhì)檢索系統(tǒng)發(fā)展到現(xiàn)在的網(wǎng)絡(luò)和電子信息檢索系統(tǒng),檢索主體和客體都發(fā)生了轉(zhuǎn)變,知識組織工具為適應這種轉(zhuǎn)變,在對概念語義關(guān)系的揭示上也在不斷拓展和演化。美國標準ANSI/NISOZ39.19在2005年的第4版中等級關(guān)系拓展到3種不同的邏輯關(guān)系,即屬種關(guān)系、實例關(guān)系、整部關(guān)系,該標準沿用至今。

中國標準中對敘詞間等級關(guān)系只規(guī)定了2種類型,即通用屬分關(guān)系與整體部分屬分關(guān)系。通用屬分關(guān)系是以概念之間是否具有包含關(guān)系為基礎(chǔ);事物的整體與部分之間一般不構(gòu)成屬分關(guān)系,只有特定的整體部分關(guān)系可作為屬分關(guān)系處理,即表示行政區(qū)劃、地理區(qū)域的詞,表示人體、生物體的系統(tǒng)與器官的詞,表示某些行政與社群結(jié)構(gòu)的詞。

新《漢表》詞間等級關(guān)系的建立,實際上就是構(gòu)建一系列詞族,即以詞族形式顯示等級關(guān)系。其等級關(guān)系包括屬種關(guān)系、整體與部分關(guān)系、實例關(guān)系(通常用專有名詞表示)。需要注意的是,切勿把分類法中所列的某些類目名稱,移植到族首詞的等級關(guān)系中,因為在分類檢索語言體系中,用來揭示文獻主題內(nèi)容的標識符是分類號,而不是類目名稱,其所顯示的每一級分類號都是受學科體系分類等級控制的。多數(shù)情況下,孤立的類名是看不出這些層次關(guān)系的。在敘詞檢索語言體系中,標識符就是敘詞。每個敘詞概念的等級,都定位在該敘詞所在詞族的屬分關(guān)系鏈中,通過敘詞屬分關(guān)系鏈就可確定其級別。所以,嚴格按敘詞概念的本質(zhì)屬性,建立屬分等級關(guān)系就顯得特別重要。

2.1 典型的等級關(guān)系

典型的屬種關(guān)系包括相同屬性的事物(實體)、相同屬性的活動(過程)、相同屬性的狀態(tài)(形態(tài))、相同屬性的形狀(尺度)、相同屬性的特征(特性)、相同屬性的學科(理論)、相同屬性的結(jié)構(gòu)(系統(tǒng))、相同屬性的組織(社會機構(gòu))[4],如圖3、圖4、圖5所示。

圖3 相同屬性的事物

圖4 相同屬性的活動

圖5 相同屬性的結(jié)構(gòu)

2.2 不典型的等級關(guān)系

在詞族加工過程中,很多詞匯的等級關(guān)系并不明顯,有些介于等級關(guān)系和相關(guān)關(guān)系之間,有些類似分類法“類”的關(guān)系。如果按嚴格的等級關(guān)系,一些詞語具有某種等級關(guān)系,卻又游離在“分類”和“詞族”兩種等級之外,進不了詞族[4]。因此在建立等級關(guān)系時,需要編表人員仔細分析、判斷、歸納,可考慮進行必要的變通,比如涉及一些與機理(原理、機制、理論)、工藝(技術(shù)、加工、生產(chǎn)、制造)、方法、性質(zhì)等相關(guān)的語詞,可根據(jù)詞量的大小來設(shè)定建等級關(guān)系還是等同關(guān)系或相關(guān)關(guān)系。比如,廢水處理、廢水處理工藝、廢水處理方法、廢水處理技術(shù)就建為同義詞群。有些獨詞,不適合建立參照關(guān)系,則可以考慮作為最相關(guān)詞的下位詞,這種變通對查詞、自動標引有利,也不會引起歧義。

圖6 不典型的等級關(guān)系

2.3 多等級族關(guān)系

當一個概念在邏輯上可以隸屬于多個不同的族類,這種關(guān)系稱為多等級族關(guān)系,此類關(guān)系的存在是基于對概念詞匯的不同角度建立屬分關(guān)系而形成的。即在不同詞族中,會同時出現(xiàn)一個概念的敘詞,或在同一詞族中也會出現(xiàn)敘詞多屬的情況。比如廢液分工業(yè)廢液、黑液、酒精廢液等等,工業(yè)廢液又分輕工業(yè)廢液、化工廢液、皮革廢液等等,輕工業(yè)廢液又分制漿廢液、食品工業(yè)廢液、染色廢液等等,制漿廢液又分制漿黑液;而黑液又分制漿黑液,其中制漿黑液,既屬于制漿廢液,又屬于黑液,它同時分屬于兩個不同的上位概念,且還是同一詞族廢液下分的敘詞多屬。

2.4 概念指引聚集語義大小的辨析

新《漢表》的編制過程中,建立敘詞的屬分關(guān)系必須要明確相關(guān)敘詞的概念大小與等級關(guān)系,否則,將造成屬分關(guān)系的混亂。比如某某設(shè)施、設(shè)備、裝置等敘詞,如何區(qū)分這些敘詞的概念大小,項目組給出的參考是:裝備>設(shè)備>機械>機器>裝置>機構(gòu);組件>器件(零件)>部件>元件;系統(tǒng)≈設(shè)備(采油系統(tǒng)、采油設(shè)備);系統(tǒng)≈裝置(檢測系統(tǒng)、檢測裝置);系統(tǒng)≈機構(gòu)(啟動系統(tǒng)、啟動機構(gòu));系統(tǒng)≠機械、裝置、機構(gòu)(管理系統(tǒng)、管理裝置、管理機構(gòu))。但在實際編制過程中,并不能完全按上述給出的參考來完成敘詞的等級關(guān)系,如果一個概念的前方匹配一致,只是設(shè)備或裝置的詞不同,且詞頻低,詞族聚詞又太少,這時的等級關(guān)系可轉(zhuǎn)化為等同關(guān)系,某某設(shè)備或某某裝置可按同義詞來構(gòu)建詞群。

圖7 安全設(shè)備、安全設(shè)施

圖8 防雷裝置

如圖7所示,安全設(shè)施和安全設(shè)備的詞頻都不低,且詞族聚詞也不少,各自均有下位詞,因而可分為兩個詞族。圖8所示,防雷設(shè)施和防雷設(shè)備并沒有分為兩個詞族,雖然它們的詞頻也不算太低。因為防雷系統(tǒng)、防雷設(shè)施、防雷設(shè)備幾乎沒有不同下位詞的詞族聚詞,所以可與防雷裝置構(gòu)成同義詞群,根據(jù)詞頻及下位類詞,選擇防雷裝置為敘詞。

3 結(jié)語

正確理解等同、等級關(guān)系的構(gòu)建原則是建立等同、等級關(guān)系的前提條件。尤其需要注意那些容易出錯的典型的字面成族、分類法的從屬派生關(guān)系與敘詞法的屬分關(guān)系混淆不清,如事物與方面、整體與部分關(guān)系等,泛指概念屬專業(yè)概念,即小帽子大身體。對于復合概念,保留詞頻較高的詞匯,并注意其多屬特征,刪除詞頻較低的詞匯。在同一詞族,要注意敘詞中的部分詞匯的詞形相同。在構(gòu)建詞間關(guān)系的過程中,大多數(shù)的前方一致檢索是構(gòu)建等同關(guān)系的重要手段,大多數(shù)的后方一致檢索則是構(gòu)建等級關(guān)系的重要手段,以相同詞尾結(jié)束的詞語,有相當一部分具有成族性。網(wǎng)絡(luò)環(huán)境下的新《漢表》,不只是單純的詞表,它具備了紙質(zhì)文獻環(huán)境下所不具有的動態(tài)、開發(fā)、便于更改增刪和維護等功能。它的詞間關(guān)系揭示更為深刻,對于用戶檢索用詞和文獻主題的準確表達考慮更為充分,實現(xiàn)了敘詞表詞庫與用戶檢索用詞最大限度的一致,從而能為更大范圍的人群使用。

[1] 曾建勛,常春,吳雯娜,等.網(wǎng)絡(luò)環(huán)境下新型《漢語主題詞表》 的構(gòu)建[J]. 中國圖書館學報,2011(4):43.

[2] 中國科學技術(shù)信息研究所.《漢語主題詞表》(工程技術(shù)版) 編制方法培訓[Z].2011.

[3] G B 13190-1991,漢語敘詞表編制規(guī)則[S].

[4] 陳樹年.詞間關(guān)系及其處理[Z].2012.

猜你喜歡
詞族詞頻廢液
基于詞頻分析法的社區(qū)公園歸屬感營建要素研究
園林科技(2021年3期)2022-01-19 03:17:48
分析化學實驗中常見廢液的處理與回收
云南化工(2021年11期)2022-01-12 06:06:44
結(jié)晶法脫硫廢液提鹽技術(shù)的應用與實踐
山東冶金(2019年6期)2020-01-06 07:46:12
“鋌”有“直”義的詞源學解釋——兼說/直/義的同源詞族
常爸:學好“詞族”,英語詞匯量能猛增
幸福(2019年12期)2019-05-16 02:27:34
“X系”詞族初探
人間(2015年19期)2016-01-04 12:46:52
MVR技術(shù)在化機漿廢液處理中的應用
中國造紙(2015年7期)2015-12-16 12:40:48
詞頻,一部隱秘的歷史
自制金寶血濾機廢液傾倒架的應用效果
云存儲中支持詞頻和用戶喜好的密文模糊檢索
枣庄市| 交城县| 图片| 远安县| 兰溪市| 广东省| 嵊州市| 天祝| 田东县| 永顺县| 闻喜县| 遂平县| 信阳市| 子洲县| 陕西省| 新安县| 卢氏县| 湘潭市| 建阳市| 八宿县| 库车县| 阿图什市| 吉木乃县| 保康县| 寻乌县| 柏乡县| 江口县| 柘荣县| 安康市| 伊川县| 屯门区| 衡东县| 图片| 公主岭市| 陈巴尔虎旗| 沈阳市| 罗平县| 北宁市| 庆元县| 台州市| 齐河县|