国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

術(shù)語辭書編纂中的元數(shù)據(jù)設(shè)計

2015-06-30 09:33全如瑊李蕓
中國科技術(shù)語 2015年3期
關(guān)鍵詞:知識框架質(zhì)量保證

全如瑊 李蕓

摘要:首先強調(diào)了工具書作為用戶尋求科技數(shù)據(jù)的重要來源。接著指出,要保障工具書的質(zhì)量,就要求對工具書詞條的知識內(nèi)容進(jìn)行控制。多數(shù)詞典以形或音作為排序依據(jù),但評價一部工具書的好壞以及是否滿足了讀者查詢知識的需求,概念是其關(guān)鍵因素,因為概念是知識的基本單元。為此,文章最后提出了一套面向知識的元數(shù)據(jù)(knowledgeoriented metadata,KOM)集合。總而言之,對于條目內(nèi)容的內(nèi)在管理遠(yuǎn)比表面或形式上對文件和工作流的這些外部管理更重要。

關(guān)鍵詞:質(zhì)量保證,面向知識的元數(shù)據(jù),對內(nèi)容的內(nèi)在管理,知識框架

中圖分類號:H083;N04;H164文章類型:A文獻(xiàn)標(biāo)識碼:1673-8578(2015)03-0005-09

Abstract: Dictionary and encyclopedia are important sources for scientific and technical data. In order to assure the quality, we need to control the contents of dictionary entry and encyclopedia article. In this article, we proposed a set of knowledgeoriented metadata (KOM) for dictionary and encyclopedia making. We also think that more emphasis should be paid on internal control over knowledge contents than those paid on external management of file and work flow.

Keywords: quality assurance, knowledgeoriented metadata, internal control over content, knowledge framework

一辭書編纂需要現(xiàn)代化的管理方式和手段

辭書可說是歷史最悠久的數(shù)據(jù)匯編了,古往今來在知識傳播上起的作用也是其他書籍無法比擬的。前人從當(dāng)時的浩瀚文獻(xiàn)中提煉出精華,以條目的形式為后人打開知識的大門。它首先是提供語言學(xué)的資料,如漢字的形、音、義,為讀者進(jìn)一步閱讀其他書籍提供便利,一般語文詞典(dictionary of common words)都屬此類。再后便是直接提供知識,從普通常識直到專業(yè)知識,這主要體現(xiàn)在后來出現(xiàn)的百科全書上。

自然詞典和百科全書的分別遠(yuǎn)不止此。例如前者的字頭(head character)和詞目(headword)可有各種詞類,包括各種語法功能詞甚至擬聲詞;字詞條(character or vocabulary entry)要給出字詞的定義和慣用法甚至例句。但百科全書的條頭(heading of article)大多是名詞或名詞組,而這個條頭只是個標(biāo)引詞,只是利用它們引出一段知識來,同一個百科條目(encyclopedia article)未嘗不可選用其他相關(guān)的標(biāo)引詞。百科條目的內(nèi)容要廣得多,例如術(shù)語條目也可能包括概念演變和百家爭鳴的材料。條頭標(biāo)引詞還可能是專名(人名、地名、作品名等),借此引出歷史、地理、人文的內(nèi)容。英語國家多年來強調(diào)二者之分,但法語國家一向融合二者。不過英語辭書近年也有融合二者的趨勢,例如英國朗文出版集團(tuán)于20世紀(jì)60年代派專人去法國拉魯斯出版社學(xué)習(xí),然后出版了第二版《當(dāng)代英語詞典》(Longman Modern English Dictionary),書中就包括了1/6的百科條目,內(nèi)容涉及地理、歷史、生物學(xué)等,專名很多。中國歷來受英語辭書影響較大,不過這種“混合型”的辭書也深受歡迎,如《辭海》[1]和《中國百科大詞典》[2]都屬此類。其實,《現(xiàn)代漢語詞典》[3]中也有不少所謂的百科式的知識性條目,只是沒有專名詞條,它也可稱為綜合性詞典(generalpurpose dictionary)。本文探討的對象包括普通詞典、百科全書和這些“混合型”的辭書。

讀者可能對辭書有許多期望,但有3個方面最為人們所關(guān)心,即完備性、便檢性、易讀性。

完備性,或稱綜合性(comprehensiveness),涉及辭書是否能滿足廣大讀者的尋檢需求。當(dāng)然,任何辭書也滿足不了興趣各異、水平不一的廣大讀者的過細(xì)需求,所以這里只談粗線條的需求。重要條目是否完備,這稱“宏觀完備性”,設(shè)計時一方面要考慮讀者對象和出書宗旨,另一方面要參考詞頻表和下面將要談到的知識框架。義項是否完備,這稱“微觀完備性”,反映了條目的綜合性,設(shè)計時也要考慮以上兩個方面。辭書編纂者要考慮到的還有“封閉性”問題,即在一個詞條中用來解釋條頭的話語本身,如有費解處是否另有專條加以解釋。如否,則讀者在相關(guān)條目間循條查詢時,仍然會遇到重大漏解的地方。另一種封閉性,是指相互參見是否做到雙向。前者可稱為解釋系統(tǒng)的封閉性,后者則為參見系統(tǒng)的封閉性。

再一個與完備性有關(guān)的問題涉及詞源學(xué)。一個詞的諸般義項間存在引申、派生等關(guān)系,一般辭書多按歷史順序加以排列。不過科技工作者更關(guān)心的不是字詞的古代淵源,而是概念的現(xiàn)代演變。特別是在中國,大量科技用詞源自西方,翻譯時選用的漢字詞確切與否?譯文是否丟失什么重要信息?所用漢字詞本身帶來的聯(lián)想是否又增添了什么額外的信息?在一本完備的辭書中,這些問題都應(yīng)得到妥善的交代。

便檢性(accessibility),指是否便于檢索。由漢字的形、音、義三個方面來看,字形檢索可提供唯一的(unique)檢索途徑,在中國出現(xiàn)最早也最發(fā)達(dá),已有的檢索系統(tǒng)很多,不過做起來都比較費力費時。借助輔助的音符系統(tǒng),如注音字母和漢語拼音,很容易利用字音檢索,操作較便利。不過對于古澀的生僻字,讀者根本不知讀音,仍要依賴字形檢索。辭書界近年更重視的是字義檢索。詞條中的種種設(shè)置如“近義詞”、“近義詞辨異”、“反義詞”、定義中的“上下位概念”和“分類特征”、語詞的“分類歸屬”、術(shù)語的“學(xué)科歸屬”,以及百科全書中的“分類目錄”,都是字義檢索手段。多層次的“分析索引”(包括相關(guān)索引)使我們能更有效地直接檢索條目內(nèi)容,“相互參見”則造就了條目之間的直接聯(lián)系。而到了現(xiàn)代的電子詞典,超級鏈接(hyperlinking)和全文檢索(full text searching)技術(shù),使我們完全擺脫了過去只能線性地檢索詞頭的單一途徑。endprint

易讀性(readability)的要求異常重要,因為大部分讀者都是外行(包括相對外行,如同屬同一大專業(yè)但小專業(yè)不同的科技工作者,他們對于所檢字詞正因有不解之處才要進(jìn)行查詢,只是起步點和一般讀者不同而已)。已有的增進(jìn)易讀性的措施包括:用俗名代替術(shù)語作標(biāo)引詞;條目中定義和解釋要先行,但行文要由淺入深;釋文中使用舉例法,由簡單、具體且熟知的事例入手,再進(jìn)入總結(jié)性的抽象論斷;添加有助說明的背景材料;避免過多引用其他術(shù)語,減少參見其他條目的需要;不回避形式定義和公式、符號的使用,但放在條目后面并充分解釋;使用表格、圖解和圖片說明等。

詞典編纂是個永續(xù)的工作,隨著科技的不斷進(jìn)步,更新是永遠(yuǎn)不會終止的,包括個別條目的增補及改寫,甚至框架的更動。現(xiàn)在有了電子版之后,可以做到及時更新。但要滿足上述三項要求,卻有大量工作要做,這才使我們轉(zhuǎn)而求助于現(xiàn)代化的手段。

二元數(shù)據(jù)設(shè)計提供協(xié)助術(shù)語辭書編纂的工具

大部分出版單位都購置了計算機和一些常用軟件如數(shù)據(jù)庫、排版系統(tǒng)等。這些工具的使用減少了手工和紙張工作,確實提高了效率,特別是在許多編輯和出版的操作上。但存儲、檢索、排印,以及對工作流的控制,都只是對數(shù)據(jù)的外部管理,并無助于保證數(shù)據(jù)本身的質(zhì)量,無助于提高詞典和條目的完備性、檢索性和易讀性。我們最關(guān)心的還是深入條目內(nèi)部直接對知識進(jìn)行管理。

元數(shù)據(jù)(metadata)是界定和描述數(shù)據(jù)(data)的數(shù)據(jù),目前常作為管理工具,例如用于統(tǒng)一數(shù)據(jù)格式以利數(shù)據(jù)交換和共享,用于控制數(shù)據(jù)工作的工作流以提高效率和消弭疏漏和錯誤等。但我們考慮元數(shù)據(jù)未嘗不可深入內(nèi)部作為知識的管理工具。

近幾年,元數(shù)據(jù)這個題目在國內(nèi)期刊上出現(xiàn)頻繁,其實這個概念已存在較長時間了。例如世界標(biāo)準(zhǔn)化組織(ISO)第37技術(shù)委員會(TC37Terminology)在20世紀(jì)90年代(1996年)就已就此撰寫出一個國際標(biāo)準(zhǔn)《ISO 12620:1999 Computer applications in terminology—Data categories, NEQ》[4](中國在1997年也等效采用了這個國際標(biāo)準(zhǔn),據(jù)此發(fā)布了國家標(biāo)準(zhǔn)《GB/T 16786 術(shù)語工作 計算機應(yīng)用 數(shù)據(jù)類目》,此后陸續(xù)隨ISO版本修訂,最近的版本是2007年發(fā)布的《術(shù)語工作 計算機應(yīng)用 數(shù)據(jù)類目(GB/T 16786—2007)》[5]),其中的數(shù)據(jù)類目(data category)就是一種元數(shù)據(jù),該標(biāo)準(zhǔn)中,數(shù)據(jù)類目分為三個類型:術(shù)語和與術(shù)語相關(guān)的數(shù)據(jù)類目(term and termrelated data categories),這主要涉及語言層面,包括術(shù)語的各種表示法,語法、慣用法、語源、術(shù)語授權(quán)狀態(tài)和術(shù)語概念關(guān)系,等義關(guān)系等;描述性數(shù)據(jù)類目(descriptive data categories),這主要涉及知識層面,包括專業(yè)領(lǐng)域和分類體系,定義、說明和語境,概念關(guān)系,概念結(jié)構(gòu),敘詞、關(guān)鍵詞和索引詞等;管理性數(shù)據(jù)類目(administrative data categories),這主要涉及管理層面,包括日期、責(zé)任者、語種、排序序列、參見和源文獻(xiàn)等。

結(jié)合辭書編纂工作,我們考慮到上述類目中的第二類即描述性數(shù)據(jù)類目對于辭書編纂更為重要。因為每一特定的知識領(lǐng)域都有其獨特的概念系,也就應(yīng)有其獨特的元數(shù)據(jù)集。例如根據(jù)經(jīng)驗,對于介紹“生物(organism)”的條目來講,“結(jié)構(gòu)(structure),功能(function),發(fā)育(development),生態(tài)和進(jìn)化(ecology and evolution)”等幾方面的知識應(yīng)是必須介紹的內(nèi)容,這幾個類目也就是管理此類條目的元數(shù)據(jù)。在百科全書界,針對某個領(lǐng)域的一套類目常被稱為該領(lǐng)域的“知識框架”。

這種知識框架對于百科式條目最為重要,不過設(shè)計起來常常需要相關(guān)學(xué)科的專家和術(shù)語學(xué)專家的共同努力。因為許多術(shù)語可能在多門學(xué)科里使用,其基本含義相通,但因各科的理解和側(cè)重不同或借用和引申的程度不等,以致在定義上有所不同。嚴(yán)格說來,它們構(gòu)成了一套同源術(shù)語(cognate terms),只不過因為共性突出所以仍然沿用同一指稱(designation)。對于這些術(shù)語,一方面既要指出其共性,另一方面還必須點出其個性(差異)。這時如由單科專家處理,可能考慮不全面,也不易給出概念演變的來龍去脈。

對于社會科學(xué)(social sciences)和人文學(xué)科(humanities)以及新興領(lǐng)域中的術(shù)語,因一時難以或無法取得共識,通常不對其進(jìn)行標(biāo)準(zhǔn)化。一般說,它們不作為規(guī)范性術(shù)語學(xué)(prescriptive terminology)的研究對象,而要由描述性術(shù)語學(xué)(descriptive terminology)來處理。在辭書中,一般是采取客觀綜述的方式,將各家見解歸類簡介。其實,即或是已規(guī)范的科技術(shù)語,也不是僅介紹優(yōu)先術(shù)語(preferred term)和許用術(shù)語(admitted term),還要介紹拒用術(shù)語(deprecated term)和被取代術(shù)語(superseded term)。不過要注明其目前的術(shù)語授權(quán)狀態(tài)(normative authorization status)。這是因為,一方面標(biāo)準(zhǔn)化并非一成不變,一般若發(fā)現(xiàn)原定名有不當(dāng)之處可在定期(一般是5年)復(fù)查時加以更改。另一方面,讀者正是因為遇到拒用術(shù)語或被取代術(shù)語才查閱詞典,如不列出,則等于失去詞典釋疑解惑的功能。因此一般說,詞典都應(yīng)是描述性的(descriptive),這樣才能滿足讀者的廣泛需求,但詞典卻可通過加注術(shù)語授權(quán)狀態(tài)的方法起到規(guī)范(normative)作用。

三面向知識的術(shù)語辭書編纂元數(shù)據(jù)

下面列出部分重要的、有助于深入條目管理知識的元數(shù)據(jù)名稱。本文主要是說明這些元數(shù)據(jù)的意義(也即設(shè)立它們的理由),并未一一給出元素屬性和元素構(gòu)成的XML定義(這些機械式的簡單操作留待下一步來做)。同時要聲明,因為不限于詞匯層面,所以這里的“辭書編纂”一詞要超出lexicography(詞典編纂學(xué))的含義。endprint

(一)條目分類

以下分類只是為了分項敘述的方便。因為事實上大量術(shù)語先是普通詞語,然后在某個學(xué)科中被賦予嚴(yán)格定義而成為專科術(shù)語。在一段語境中它究竟是作為普通詞語還是作為術(shù)語來使用,常要根據(jù)使用場合和語境來判斷。而在普通詞典中這兩者可能在詞條中只是作為兩個并列的義項出現(xiàn),因此同一個詞條可以兼具下面兩種屬性。

普通詞語條目

普通詞語條目主要用于介紹漢字的形、音、義和詞及詞組的釋義,常附慣用法和例句。字頭或詞目可為任意詞類。對釋文的邏輯性要求不如對術(shù)語的要求高,常可采用近義詞或例解和比擬等方法解釋,但要求近義詞、用例和比擬對象的熟知度比字頭或詞目為高。一詞多義(一個指稱對應(yīng)多個概念)時,按一個條含多個義項來處理。

百科條目

一般詞典的百科式詞條同百科全書的條目還有所不同:前者仍遵循詞典傳統(tǒng),釋文內(nèi)容緊扣詞目,且同屬一個指稱的不同概念(一詞多義),只作為不同義項處理;后者條頭則僅僅是個標(biāo)引詞,有更換余地,而在一般百科全書中,一個概念一個條目,對于多義字可以是幾個條目都冠以同一個條頭(有時同一指稱在不同領(lǐng)域代表不同概念,此時可在條頭后加括號,注明所屬領(lǐng)域以示區(qū)分)。

術(shù)語條目

術(shù)語是定義明確的學(xué)術(shù)用語,只存在于特定的范圍(一定的專業(yè)領(lǐng)域)內(nèi),因此領(lǐng)域定義是必要成分。百科知識(自然科學(xué)、社會科學(xué)、人文學(xué)科、工程技術(shù)等)主要是通過這些條目來介紹的。

專名條目

人名、地名、作品名、歷史事件名等,主要是用來引出地理、歷史、人文等資料。定義主要是描述式的,但特別要指出該名之所以聞名之處。以歷史事件為例,首先要明確時空位置,說明性質(zhì),然后交代時空背景、事件經(jīng)過、事件影響、因果分析和歷史意義(包括不同看法)等。

(二)釋義部分

一般詞條的釋文主要就是釋義和慣用法的介紹,在較長的百科條目中,前面總有一段引言,交代釋義、背景、意義,甚至對全文梗概做一勾畫。條目的質(zhì)量在很大程度上取決于這一部分撰寫的優(yōu)劣。

1.解釋(explanation)

在初級詞典中對普通詞語,常采用對釋法或描述說明法來釋義,前者用熟知的同義詞來解釋,后者則直接描述說明,包括用熟知的事物來比擬或舉出熟知的個例幫助讀者類推。對于一些描述主觀感覺的詞語,我們常使用一種發(fā)生式的解釋,即告訴讀者在什么客觀條件下可以獲得這種感覺,真正的感覺還要讀者本身去體驗。

2.定義(definition)

對于術(shù)語,我們要求嚴(yán)格的定義。一般定義多采用內(nèi)涵定義(intensional definition)中的屬種式定義(generic definition),即指出其上位概念(superordinate concept)以及它與并列概念間的區(qū)別特征(delimiting characteristic)。不過要注意,同一事物也可能同時要求多個定義。例如阿司匹林(aspirin)是個有機化合物,因此可根據(jù)其化學(xué)結(jié)構(gòu)給出化學(xué)定義;在藥理上,它是個非甾體抗炎藥(NSAID),據(jù)此可以給出藥理學(xué)定義;在臨床上,它可用于退熱、鎮(zhèn)痛、抗炎和抗血栓,因此它又分屬于這幾類藥物而得出不同的臨床醫(yī)學(xué)定義。這些不同的定義正說明它的多維屬性要同時采用不同的概念系來定義。這些定義對應(yīng)同一客體,可互補共存。事實上,很多高檔詞典和綜合百科全書正是這樣地對客觀事物給出綜合的多維定義。

在概念間,除了屬種這種邏輯關(guān)系(logical relation)外,還存在通過客體本身的直接關(guān)聯(lián)而發(fā)生的本體關(guān)系(ontological relation),例如生物體和其器官之間、機器和其部件之間的整體-部分關(guān)系(partitive relation)。再有就是表示時空相接的序列關(guān)系(sequential relation)。不少術(shù)語是根據(jù)這兩類關(guān)系下的定義。

每個條頭都要做概念分析,分解出上位概念和區(qū)別特征。這是檢查全詞典封閉性的一個必要步驟。然后再看兩者是否都另有專條交代。此外,為了方便讀者的理解,建議定義中一定要例舉一兩個熟知的下位概念。

3.上位概念(superordinate concept)

在一般詞典中使用的上位概念不見得就是專業(yè)分類體系中最鄰近的上位概念。例如在生物分類階梯(門、綱、目、科、屬、種)中為種下定義時,不一定要用屬名作上位概念,一般可選用上面任意一個比較熟知的名稱。例如現(xiàn)代人類的種名是智人,定義時上位概念可選用目名(靈長目)、綱名(哺乳動物綱),甚至亞門名(脊椎動物亞門),但門名(脊索動物門)卻用得很少,因為此名不為人所熟知。但此時需要區(qū)別的就不限于同一層次的并列概念,而且上位概念所加的限定詞也要求具有更高的特異性,要足以區(qū)分開該上位概念層次以下的一切其他概念。

4.區(qū)別特征(delimiting characteristic)

有時定義只包括一個加有限定詞的上位概念但沒有并列概念需要區(qū)別,即這個上位概念只有一個下位概念,這時不存在區(qū)別特征。

5.下位概念(subordinate concept)

當(dāng)一個概念的下位概念為數(shù)不多,且大多熟知,也可使用外延定義(extensional definition),即列出其全部下位概念。但一般仍推薦內(nèi)涵定義。

6.操作式定義(operational definition)

對于某些物理量、化學(xué)量常采用物理和化學(xué)實驗操作來定義,這樣可得出客觀而精確的定量定義,結(jié)果有高度可重復(fù)性(reproducibility)。其實這種定義并不限于理化范圍,例如用智力量表(intelligence scale)來定出人的智力,也是一種操作式定義。此類定義在實驗科學(xué)中使用得很廣泛。不過,使用這種定義時不能僅僅描述操作,例如定義智力測驗時還要說明它的效度(validity),即要說明所得結(jié)果為什么能代表智力。endprint

7.單位和量綱(unit and dimension)

對于定量定義來講,一定要給出單位。采用標(biāo)準(zhǔn)單位制推衍出的單位,要附量綱式。

8.語境(context)

這個成分多見于面向詞語的詞典而少見于面向概念的百科全書。一個詞的語境是出現(xiàn)本詞的文本,長度為一個分句至幾句話。在一般辭書中表現(xiàn)為例句,例句也常稱為語境參考(context reference)。語境建立起由語詞到概念再到生活環(huán)境或?qū)I(yè)領(lǐng)域之間的聯(lián)系,但首先它還是聯(lián)系了語詞和概念,因此我們有所謂的定義性語境(definitional context)和說明性語境(explicative context)。它們分別包含了全部或部分的概念信息。不過,定義性語境和定義是不同的,后者用的是正式語言,措辭嚴(yán)謹(jǐn),而前者卻是在一個活生生的話語環(huán)境中不僅給出概念信息,還提供了有關(guān)慣用法和固定搭配的信息。

9.慣用法(usage)

這個成分也是多見于面向詞語的詞典而少見于面向概念的百科全書。慣用法是指一個詞在特定的時間、地理和使用場合(又稱“語域”register)中的用法和頻度。實際上,慣用法不僅教給我們?nèi)绾稳ビ?,而且只有在真正的使用中我們才能對這個詞有更深入的理解。時間上有“古語”“過時”“廢棄”之分;地理上有不同國家(如英美)和不同地區(qū)(如中國大陸和臺灣)的分別;使用場合上有技術(shù)語域和作坊語域(benchlevel register)等差異。

10.熟知度級別(degree of wellknownness)

人們通常用簡單的熟知事物去解釋復(fù)雜的生僻事物。在前面“解釋”和“定義”中都強調(diào)要用熟知的事物去比擬,用熟知的個例或下位概念去說明。因此我們只能用熟知度級別較高的字詞來解釋級別較低的字詞,而熟知度最高的字詞必須另用其他方法來釋義。熟知度可用三分法,不求精確。

11.常見誤解(common misconceptions)

辭書釋文的一個重要內(nèi)容就是澄清常見誤解。因此平時要將各方發(fā)現(xiàn)的誤解一一記錄在案,歸類分析其原因,擇其常見典型寫在釋文中。一類最常見的誤解是由下面的多義詞、異義詞和同義詞造成的。

(三)形-音-義關(guān)系

在國際標(biāo)準(zhǔn)化組織的協(xié)調(diào)下,現(xiàn)在各國都在發(fā)展術(shù)語標(biāo)準(zhǔn)化工作,其目的就是:至少在一個學(xué)科之內(nèi),力求每個術(shù)語都做到單名(mononymic)和單義(monosemic),以利信息的正確交流。但由于歷史的原因,每種語言中都充滿各式各樣的多義詞、異義詞和同義詞,影響著信息的有效交流。從另一方面來講,介紹這些詞有助進(jìn)一步界定本詞的確切含義。

1.多義詞(polyseme)

同一語種中具有兩個或兩個以上詞義的語詞。例如:

日(太陽)→日(白晝)→日(時間)

多義詞通常是一個詞隨著時間的推移和在人群間的傳播而逐漸獲得了不同的含義,而由非同源并對應(yīng)不同概念的詞轉(zhuǎn)而取得相同的形和音的現(xiàn)象則罕見。嚴(yán)格由術(shù)語學(xué)的觀點來看,一個多義詞實際上代表了幾個不同的術(shù)語(概念)。目前標(biāo)準(zhǔn)化的做法是在一個專業(yè)領(lǐng)域內(nèi)消除多義詞,要求在每個學(xué)科中僅具單義,但在不同的專業(yè)領(lǐng)域間允許存在。但一些多義詞是科技界的常用詞,在討論一些普遍的科技問題時保持多義,這就可能導(dǎo)致歧解。參見下面“(四)詞源”部分。

2.同(近)義詞(synonym)

同一語種中表述同一概念的語詞。嚴(yán)格講來,完全的同義詞罕見,絕大多數(shù)只是概念相近,稱近義詞(near synonym);它們只是在某些語境下可以互換,在其他情況下則不能互換。

3.近義詞辨異(differences between near synonyms)

在近義詞之間存在或多或少的差異,包括概念和慣用法的差異。一般詞條和百科條目的釋義部分常設(shè)置這個內(nèi)容,幫助明確詞義和概念。

4.同形\[和/或\]同音異義詞(homonym)

具有相同字形和/或發(fā)音但對應(yīng)不同概念的語詞。包括下面三種情況:

(1)同形\[異音\]異義詞(homograph) ,如“公差(gōngch?。焙汀肮睿╣ōngchāi)”。

(2)同音\[異形\]異義詞(homophone) ,如“樹木”和“數(shù)目”。

(3)同形同音異義詞(full homonym) ,如“杜鵑(花名)”和“杜鵑(鳥名)”。

這些異義詞,特別是第3型,極易混淆。第1型和第2型則要看受方是閱讀文字材料還是傾聽語音材料而有所不同。

5.等義程度(degree of equivalence)

兩個語詞間內(nèi)涵重疊的程度,即外延覆蓋的程度。另有同義程度(degree of synonymy)一詞,但那僅指同一語種內(nèi),而此處則包括不同語種間語詞的比較。

6.假等義(false friend)

又稱不等義(nonequivalence)。這又包括兩大類:

(1)假同源詞(false cognates),這只見于同源語種之間,如日語中的“手紙(指信)”不等于漢語中的“手紙”。

(2)假仿造詞(false calques),這見于對譯的兩個語種之間,又稱假外來語翻譯(false loan translation)。在中國現(xiàn)存術(shù)語中,這是最應(yīng)關(guān)注的問題。詳見下面“(四)詞源”部分的“2跨語言借用”。

7.反義詞(antonym)

所謂反義包括兩種情況:互補(complement)和對比(contrast)。例如結(jié)構(gòu)主義(structuralism)和功能主義(functionalism)雖為反義,卻因側(cè)重不同而可互補而并存。但原子主義(atomism)則否定結(jié)構(gòu)主義,兩者是真正的、互不相容的對比關(guān)系。endprint

反義詞常常有助于說明詞義。例如,當(dāng)我們孤立地見到physical一詞時,還說不上來它指的是什么,只有在上下文中查知同它并列或?qū)Ρ鹊脑捳Z時,才能有個初步的理解。

physical factor & chemical factor——物理因素和化學(xué)因素;

physical environment & human environment——自然環(huán)境和人類環(huán)境;

physical environment & biotic environment——非生物環(huán)境和生物環(huán)境;

physical network & logical network——物理(實指“實體的”)網(wǎng)絡(luò)和邏輯(“形式的”)網(wǎng)絡(luò);

physical diseases & mental disorders——軀體疾病和精神障礙;

physical anthropology & cultural anthropology——體質(zhì)人類學(xué)和文化人類學(xué)。

(四)詞源

詞源學(xué)不僅追溯、針對既有概念如何聚字成詞來表述此概念(造新詞),還要探討概念的演變。例如中國人遇到不解的詞語時總是根據(jù)構(gòu)詞的字義來推測整詞的含義,這時個人對字義的認(rèn)識、個人的知識背景等等都會影響對整詞的理解。于是詞語在流傳中就會發(fā)生畸變。以上還只是個人因素,如果是把術(shù)語由一個學(xué)科移植到另一學(xué)科,那只能是在概念特征中選取適合目的學(xué)科的部分而同時舍棄了不適合的部分。另一方面為了解釋目的學(xué)科的現(xiàn)象或為了同目的學(xué)科的既有理論相融合,還可能賦予這個術(shù)語若干新的特征。這樣就派生出一個同母詞詞義有相當(dāng)差距的新術(shù)語。

除了下述幾種常見的詞源外,還有其他演變途徑,例如通過漢字簡化活動把下面兩個詞合并成了一個多義詞:

幹細(xì)胞(stem cell)和乾細(xì)胞(dry cell)都被簡化為干細(xì)胞。

1.跨學(xué)科借用(transdisciplinary borrowing)

大量同源多義術(shù)語是由此產(chǎn)生的。例如“運動”一詞先后衍生出下述含義:

(物理學(xué))物體的位置變化;

(體育)出于鍛煉或競賽目的的身體活動;

(一般)政治、文化、生產(chǎn)等方面的群眾性的、大張旗鼓的活動。

2.跨語言借用(translingual borrowing)

在中國,大多數(shù)術(shù)語是通過翻譯途徑從西方引進(jìn)的。其中相當(dāng)一部分采取的是字面翻譯,從而帶來程度不等的不等義現(xiàn)象(nonequivalence)。就以一個常用詞“文化”為例,在現(xiàn)在的學(xué)術(shù)文章中常被視為英語“culture”一詞的等義詞?!癱ulture”本義為“培養(yǎng)”后引申出“教化”等含義。“culture”一詞現(xiàn)主要指人類個體生后所學(xué)到的為群體所共有的、穩(wěn)定的精神遺產(chǎn)及其物質(zhì)表現(xiàn),一般包括:語言、宗教、社會體制、法規(guī)、禮儀、風(fēng)俗、知識、信念、價值觀、工具、技術(shù)、文藝創(chuàng)作,等等。而漢語中“文化”兩字則取自古文獻(xiàn)的“文治教化”。這表面看來似乎很恰當(dāng),但翻譯過來和使用后我們?nèi)匀话l(fā)現(xiàn)了不等義的地方。例如《文選》中有言:“文化內(nèi)輯,武功外悠”,這里“文”是作為“武”字的對義語,有“非暴力”的含義。這個含義是英語原文中沒有的。另外,“文”字給中國人的第一個聯(lián)想就是“文字”,于是教識字的教員成了“文化教員”,組織群眾掃盲、識字的場所成了“文化館”。這些含義也是原文沒有強調(diào)過的。再一方面,同“文化”一詞相聯(lián)系的還有“文明(civilization)”一詞,兩者?;焱褂谩5灿腥藢烧邔α⑵饋?,例如視前者專指精神方面的成就,而后者專指物質(zhì)方面的成就。而且還應(yīng)指出,“文明”一詞可作形容詞,我們可以談到“不文明”和“比較文明”,而“文化”則不成。文明與野蠻(或原始)為對義詞,隱含著單線進(jìn)化論的意味。

有鑒于此,術(shù)語學(xué)反對字面翻譯,而強調(diào)引進(jìn)概念,再根據(jù)概念的精確描述(即定義)重新定名(造新詞)。事實上,一些較好的引進(jìn)術(shù)語其實并不是翻譯,而是新詞,因為它們是根據(jù)定義創(chuàng)造出來的。它們大多是偏正詞組,核心詞對應(yīng)定義中的上位概念,前置定語對應(yīng)區(qū)別特征。

3.母語詞源(etymology of source word)

對于引進(jìn)的詞語必須追溯母語的詞源,例如一個詞可能是源于拉丁語→法語→英語,那么就應(yīng)逆序逐級往上追溯。

4.(譯文)方向性(directionality)

指能保證等義性的翻譯方向,當(dāng)然最好是雙向等義,這出現(xiàn)在兩種語言中術(shù)語是一對一對應(yīng)時。規(guī)范性術(shù)語學(xué)要求,當(dāng)兩種語言中存在一對多對應(yīng)時,要保證第一種語言中的唯一術(shù)語與第二種語言中的優(yōu)先術(shù)語是雙向等義,而當(dāng)兩者間存在多對多對應(yīng)時,要保證兩種語言中的優(yōu)先術(shù)語是雙向等義。因此注明方向性可以幫助我們決定翻譯時是否應(yīng)該選擇優(yōu)先術(shù)語。

5.新詞(neologism)

在印歐語系國家,早年間的新詞大多是由現(xiàn)代學(xué)者采用希臘或拉丁詞根創(chuàng)造的仿古術(shù)語。直到近20世紀(jì)中葉才出現(xiàn)來自車間或?qū)嶒炇夜ぷ髡Z言的術(shù)語,且主要在工程技術(shù)方面。現(xiàn)在由俗語轉(zhuǎn)化而來的術(shù)語已越來越多。

在中國,早年間音譯詞不少,后來大多被意譯詞取代。上面介紹過的根據(jù)定義利用偏正詞組制造新詞的方式,就是我們推薦的創(chuàng)造新詞的一個很好途徑。

(五)主題詞控制和檢索途徑

在辭書編纂過程中,最重要的就是控制全局。一方面要對全書(特別是條目間的關(guān)系)進(jìn)行宏觀管理,另一方面還要對條目內(nèi)部進(jìn)行微觀管理。我們主要是使用主題詞作為主線來管理和控制。不過這里使用的“主題詞”一詞,不要同情報學(xué)(information & documentation, I&D)中的“主題詞(subject heading)”混為一談。endprint

再一方面,辭書要保證便檢性,就要為讀者提供足夠的檢索途徑。除了按音序或形序翻閱條頭以外,還包括相互參見和索引(主要見于百科全書)。而索引也不限于按音序或形序來檢索,還可按分類排序,從而為索引帶來一定的系統(tǒng)性。索引還可以分層次,兩個層次之間可以是基于各種概念關(guān)系(例如上下級概念的關(guān)系)。此外還有所謂關(guān)聯(lián)索引(related reference),把同某個條目有各種關(guān)聯(lián)的條目名稱匯總在一起,這種索引異常有用,只是要求制作者必須對全書布局有充分的理解。辭書一般不設(shè)為檢索內(nèi)容使用的目錄,但不排除大條目為便利翻閱而設(shè)置的條目內(nèi)目錄。

1.主題詞表(lists of subject words)

主題詞泛指辭書中一切要求釋義的詞語或術(shù)語。

一級主題詞:條目標(biāo)題;

二級主題詞:大條目內(nèi)的段落標(biāo)題;

三級主題詞:段落內(nèi)主題。

一般詞典中可能只有一級主題詞,二三級主題詞主要見于百科全書。在百科全書中,全部主題詞都是索引詞①。

主題詞表應(yīng)有多種排序,以反映不同的體系,例如按:音序;形序;分類(見下面“2分類體系”);專名原文等。

2.分類體系(classification system)

傳統(tǒng)的學(xué)科分類,體系眾多而且不時在變動,但內(nèi)容交叉重疊的弊端一直沒有得到徹底的解決。因此我們推薦使用主題標(biāo)引的分類體系。一個籌劃編纂辭書的學(xué)術(shù)單位,應(yīng)及早著手組織術(shù)語學(xué)專家和多科學(xué)者編制分類體系。自上而下和自下而上地反復(fù)推敲,同時也可將相對獨立的部分分隔開,一個模塊(module)一個模塊地編制。最后的產(chǎn)品就是上面的按分類組織的三層主題詞表。

3.知識框架(knowledge framework)。

按分類體系組織的、用以安排條目和指導(dǎo)條目撰寫的主題詞表。其中一級主題詞用以安排條目,二三級主題詞用以指導(dǎo)條目撰寫。

4.讀者對象(readership)

出書宗旨的主要內(nèi)容,是決定全書覆蓋范圍(coverage)和起點高低的重要因素。根據(jù)讀者對象,才能確定調(diào)查用戶需求的具體范圍。

5.需求分析(needs analysis)

要了解讀者是檢字還是求知;是求學(xué),是工作,還是科研;專業(yè)范圍是什么;要單語還是雙語,如為雙語,是單向還是雙向等。

6.專業(yè)領(lǐng)域(subject field)

一般詞語有其使用場合,而術(shù)語更是只適用于它被定義的領(lǐng)域中,這要一一注明。但另一方面,通過借用和引申,術(shù)語總有擴大適用范圍的趨勢。傳統(tǒng)學(xué)科間的分界現(xiàn)在越來越模糊,已難據(jù)此對術(shù)語做出唯一的歸屬。因此我們才推薦情報界使用的主題標(biāo)引法(見“2分類體系”)。術(shù)語界更有人主張:在標(biāo)注術(shù)語條目的專業(yè)領(lǐng)域時,盡可能選擇較高級別的、范圍更廣的領(lǐng)域??傊?,詞典和百科全書工作者,必須對知識分類有成熟的考慮,能在術(shù)語歸類上做到不重疊、不遺漏,使讀者能方便地檢索到所求。

7.條目提綱(article outline)

選擇典型條目,設(shè)計有待介紹的二三級主題詞表,用以指導(dǎo)撰寫。

8.相互參見(cross reference)

相關(guān)條目間要設(shè)條目級的相互參見。在不同條目中的上下位概念間、并列概念間、同義詞間、反義詞間、同源多義詞間,都應(yīng)設(shè)立詞一級的相互參見。這些參見都是雙向的。相互參見提供了條目間的檢索途徑,體現(xiàn)了概念間的網(wǎng)絡(luò)結(jié)構(gòu)。保證參見系統(tǒng)的雙向性也就是保證了參見系統(tǒng)的封閉性。

9.索引(index)

在百科全書中,一般都設(shè)置索引,索引到三級主題詞。還可設(shè)置圖片索引、表格索引、部分外文索引(如果某特類條目都附有外文的話)等。

10.目錄(table of content)

一般辭書不設(shè)目錄。但小本、條目為數(shù)不多的百科全書,也有使用書前目錄的。而百科全書的大條目中,也可設(shè)置段落目錄。

(六)質(zhì)量評價

質(zhì)量評價是必要的元數(shù)據(jù),它幫助我們決定材料的取舍和是否需要進(jìn)一步的補充和修正工作。而且質(zhì)量評價工作應(yīng)是隨時隨地進(jìn)行的,不能等待臨出書前再進(jìn)行。全面質(zhì)量管理(TQC)是關(guān)鍵。評價內(nèi)容主要包括:

1.完備性

內(nèi)容包括兩個層次:一個是復(fù)審原定的分類體系和知識框架是否完備,近期學(xué)術(shù)是否有新進(jìn)展,是否有重大歷史事件出現(xiàn)等,這主要是靠專家評審和補充;一個是核對成書是否符合知識框架,這后一工作可以靠計算機來完成。

2.封閉性

解釋系統(tǒng)封閉性——檢查條目定義中的上位概念和區(qū)別特征中的詞語或術(shù)語是否見于主題詞表;

參見系統(tǒng)封閉性——檢查相互參見是否雙向;檢查索引詞是否覆蓋了全部主題詞。這個封閉性同時也代表了便檢性。

3.可靠性(reliability)

包括檢查材料是否屬實,推理是否合乎邏輯等科學(xué)性的問題。這要由專家來審查和糾正。

4.易讀性

最好的測試就是找典型讀者試讀。

5.條目評注(comments)

各方對逐個條目的總體評價。

6.讀者反饋(readers feedback)

搜集讀者反饋是項極其重要的、永續(xù)性的工作,因為用戶中藏龍臥虎,根據(jù)軟件開發(fā)的經(jīng)驗,用戶提供的幫助常常大于專家。新版雖說還需時日,但新版的預(yù)備工作是無時無刻不在進(jìn)行中的。對讀者反饋的應(yīng)答可能馬上就可實施。

四結(jié)語

在術(shù)語辭書編纂過程中,元數(shù)據(jù)的設(shè)計是最基礎(chǔ)的準(zhǔn)備工作,是協(xié)助辭書編纂的有力工具,對元數(shù)據(jù)的各項內(nèi)容進(jìn)行填充和更新是貫穿始終的,也將是影響辭書質(zhì)量的關(guān)鍵。然而,以往的文獻(xiàn),包括筆者以前的相關(guān)文章[6]多從技術(shù)層面對已有的詞典數(shù)據(jù)進(jìn)行元數(shù)據(jù)的設(shè)計,使用某種標(biāo)記語言加以命名、說明和標(biāo)注,討論其各種細(xì)節(jié)和工程實現(xiàn)等,屬于數(shù)據(jù)處理的層次,以外部管理為主要目的。本文則是從內(nèi)在的知識層面論述了詞典和百科全書在內(nèi)的工具書所需的元數(shù)據(jù)應(yīng)如何設(shè)計,提出了一套面向知識的辭書編纂元數(shù)據(jù)集合,屬于知識管理的層次,從而在更高、更宏觀的層次上全面描述了辭書的元數(shù)據(jù)集合。

注釋

① 在《不列顛百科全書》詳編的大條目中,由編輯發(fā)掘出隱式主題并將其顯式化寫為旁注,印在頁旁空白上,稱為書簽(bookmark)。不過,對于一般辭書,不推薦這種做法。

參考文獻(xiàn)

[1] 上海辭書出版社編委會.辭海[M].上海:上海辭書出版社,1999年.

[2] 中國大百科全書出版社編委會. 中國百科大辭典[M].北京:中國大百科全書出版社,2005.

[3] 中國社會科學(xué)院語言所詞典編輯室. 現(xiàn)代漢語詞典[M].5版.北京:商務(wù)印書館,2005.

[4] 國際標(biāo)準(zhǔn)化組織. ISO 12620:1996 Computer applications in terminology — Data categories[S]. 1996.

[5] 中華人民共和國國家質(zhì)量監(jiān)督檢驗檢疫總局,中國國家標(biāo)準(zhǔn)化管理委員會. (GBT 16786—2007)術(shù)語工作 計算機應(yīng)用 數(shù)據(jù)類目[S],北京:中國標(biāo)準(zhǔn)出版社,2008.

[6] Li Y, Fu A P. Designing Metadata for Chinese Dictionary Entries[J]. Data Science Journal, 2007(6): 853-856.endprint

猜你喜歡
知識框架質(zhì)量保證
田灣核電站運行階段質(zhì)量保證分級管理
田灣核電站運行階段質(zhì)量保證分級管理
焊接技能評定過程中的質(zhì)量保證要求
關(guān)于如何做好水質(zhì)環(huán)境監(jiān)測的質(zhì)量保證研究
小虛詞大學(xué)問重夯實促品味
論多媒體在初中歷史教學(xué)中的應(yīng)用
化學(xué)反應(yīng)工程教學(xué)的一點思考
高考化學(xué)復(fù)習(xí)備考策略研究
質(zhì)量保證監(jiān)查在AP1000依托項目中的應(yīng)用
試析如何做好水質(zhì)環(huán)境監(jiān)測的質(zhì)量保證