包冬梅
?
用于信息檢索的敘詞表編制標準
包冬梅
敘詞表的主題規(guī)范控制在網(wǎng)絡(luò)環(huán)境下依然不可或缺,編制標準對于促進敘詞表編制的規(guī)范化和詞表之間的數(shù)據(jù)交換與共享具有重要作用。我國敘詞表編制最新標準GB/T 13190.1-2015《信息與文獻 敘詞表及與其他詞表的互操作 第1部分:用于信息檢索的敘詞表》使用重新起草法,修改采用ISO 25964-1:2011編制。新標準的實施將為我國傳統(tǒng)敘詞表的網(wǎng)絡(luò)知識組織適應(yīng)性改造和新敘詞表的編制提供指南和方向,本文對該標準的修訂背景、基本思路、編制風(fēng)格和內(nèi)容特點等進行梳理與分析。表1。參考文獻16。
GB/T 13190.1-2015敘詞表編制標準修訂
敘詞表是我國信息組織和檢索領(lǐng)域較為成熟的知識組織工具之一。自上世紀七十年代以來,我國編制了眾多綜合性敘詞表和專業(yè)敘詞表,在文獻信息組織和檢索中得到廣泛應(yīng)用。敘詞表發(fā)揮作用的內(nèi)核機制是規(guī)范控制,網(wǎng)絡(luò)信息環(huán)境下其主題規(guī)范控制的重要價值在某些領(lǐng)域(如科研、教育、生產(chǎn)等)日益凸顯,使其成為信息序化及開發(fā)利用過程中必不可少的重要工具。敘詞表編制國家標準,是對敘詞表的編制予以規(guī)定,并由國家標準機構(gòu)批準的規(guī)范性文件。它對于促進敘詞表編制的規(guī)范化和詞表之間的數(shù)據(jù)交換與共享,起著重要作用[1]。
在新標準GB/T 13190.1-2015[2]實施之前,我國敘詞表編制的國家標準包括:GB/T 13190-1991《漢語敘詞表編制規(guī)則》[3](基于ISO 2788:1986《文獻工作——單語種敘詞表編輯和修訂準則》[4]編制)和GB/T 15417-1994《文獻多語種敘詞表編制規(guī)則》[5](基于ISO 5964:1985《文獻工作——多語種敘詞表編輯和修訂準則》[6]編制)。這兩部制定和頒布于上個世紀80年代末到90年代初的標準,雖然多少考慮到計算機檢索系統(tǒng)的需求,但基本內(nèi)容還是立足于滿足手工編制和管理印刷型詞表、人工主題標引的應(yīng)用需求。
網(wǎng)絡(luò)信息環(huán)境下,計算機技術(shù)、數(shù)字化技術(shù)、網(wǎng)絡(luò)技術(shù)已經(jīng)普遍應(yīng)用于信息組織和信息檢索各個領(lǐng)域。敘詞表的應(yīng)用環(huán)境、用戶群體以及整個信息環(huán)境和檢索機制方面的變化,引發(fā)了敘詞表編制、維護、管理、應(yīng)用等方面的變革需求。舊的標準亟待修訂,以滿足新信息環(huán)境下信息組織和檢索的新需求。我國敘詞表編制的最新指導(dǎo)、規(guī)范性文件——《信息與文獻 敘詞表及與其他詞表的互操作》正是應(yīng)對這一變革的產(chǎn)物。
該標準由兩部分組成。第一部分用于信息檢索的敘詞表(GB/T 13190.1-2015),已于2015年5月15日正式發(fā)布,2015年12月1日起正式實施;第二部分內(nèi)容是關(guān)于與其他詞表的互操作(修訂中)。本文僅就第1部分GB/T 13190.1-2015展開闡述,以下簡稱《新標準》。
2.1《新標準》修訂依據(jù)
我國標準制定一貫堅持國際化視野,積極借鑒國際標準的先進經(jīng)驗?!缎聵藴省沸抻喗M持續(xù)跟蹤研究了同階段發(fā)布的多個國外敘詞表編制標準,包括美國的ANSI/NISO Z39.19-2005《單語種受控詞表的結(jié)構(gòu)、形式和管理指導(dǎo)方針》[7]、英國國家標準BS 8723-5-2008《信息檢索的結(jié)構(gòu)化詞匯指南》[8]、《IFLA多語種敘詞表編制指南》[9]和ISO 25964-1:2011《信息與文獻 敘詞表及與其他詞表的互操作》[10]等?!缎聵藴省沸抻喗M一致認為ISO 25964-1:2011與ISO 25964-2(當時尚未出臺)構(gòu)成了關(guān)于敘詞表修訂編制、維護、管理、應(yīng)用的完整體系,其基本內(nèi)容仍然以BS 8723為主,可以視為是對ISO 2788:1986和ISO 5964:1985的直接繼承,它將成為世界范圍內(nèi)敘詞表編制標準的主導(dǎo),對我國敘詞表編制標準的修訂具有重要的參考意義。因此,《新標準》修訂組最終確定使用重新起草法,在ISO 25964-1:2011的基礎(chǔ)上進行修訂,并確定了修訂指導(dǎo)原則,即原則上遵循并采用ISO 25964-1:2011(包括結(jié)構(gòu)、章節(jié)、行文、語句等),在此基礎(chǔ)上增加滿足漢語敘詞表編制的特定內(nèi)容,包括:增加漢語語詞的舉例或注釋說明;增加對應(yīng)的常用漢語標記符;當涉及多語言的語詞、符號時,英語與漢語分別集中編列規(guī)則;增加漢語敘詞表的例圖等,以適應(yīng)漢語敘詞表的編制和應(yīng)用需要。
2.2以概念為核心的基本原則
情報檢索理論中有一個基本假設(shè),即任何語詞都是概念的表征。概念是抽象、唯一的基本知識單元。一個概念可以有一種或多種語詞表達形式,一種表達形式即一個術(shù)語表示,一個術(shù)語也可能代表多個概念。表達概念的語詞可以是單元詞、復(fù)合詞。在敘詞表中,某一概念的既定語義范圍通常由其上位概念和下位概念構(gòu)成的等級關(guān)系所提供的上下文來限定,但當上述方式仍不足以充分明確表達預(yù)期范圍時,可以采用附加的措施(如限定詞、范圍注釋)來明確概念的邊界。敘詞表的主要應(yīng)用是支持以概念搜索為目的的信息檢索,因此,概念邏輯是敘詞語言的基礎(chǔ),概念和概念間關(guān)系的表示是檢索語言要解決的關(guān)鍵問題?!缎聵藴省窂男g(shù)語入手,以概念化為導(dǎo)向,以自然語言詞匯為基本單元,以概念為核心,通過優(yōu)選控制(詞量、詞類、先組度)、規(guī)范化控制(詞形、詞義)、結(jié)構(gòu)化控制(詞間關(guān)系)等規(guī)范控制手段實現(xiàn)詞匯術(shù)語的整合,從而實現(xiàn)以概念為核心的語義網(wǎng)絡(luò)的構(gòu)建。
2.3回歸敘詞表后控制信息檢索的主要應(yīng)用
敘詞表的主要功能是支持信息檢索。在印刷型詞表和手工標引環(huán)境下,常出現(xiàn)敘詞表的編制與應(yīng)用相互脫節(jié)的現(xiàn)象,編表歸編表、標引歸標引、檢索歸檢索。實際上,編表——標引——檢索這三個環(huán)節(jié)息息相關(guān)。在信息檢索過程中,敘詞表主要應(yīng)用于兩個階段:標引和檢索。作為檢索系統(tǒng)的核心模塊,標引和檢索均會涉及詞匯的選擇與控制問題。
敘詞表主要應(yīng)用于后控檢索系統(tǒng)。從目前的檢索機制和信息環(huán)境來看,敘詞表作為檢索中介與語義控制詞典的作用越加明顯[11]。因此,應(yīng)用于后控檢索系統(tǒng)的敘詞表的編制開發(fā),是《新標準》編制規(guī)則規(guī)定的核心。同時,《新標準》也可以應(yīng)用于網(wǎng)絡(luò)導(dǎo)航系統(tǒng)、瀏覽主題目錄以及分類法等先組(先控)檢索系統(tǒng)。
以往的敘詞表主要面向信息專業(yè)人員用于標引和檢索,而網(wǎng)絡(luò)環(huán)境下的敘詞表則要適應(yīng)普通用戶更直觀的信息檢索需求,甚至機器用戶的自動標引和檢索。因此,網(wǎng)絡(luò)環(huán)境下敘詞表設(shè)計的基本原則應(yīng)從適應(yīng)普通用戶和機器用戶的應(yīng)用環(huán)境和需求出發(fā),敘詞表的編制應(yīng)更加關(guān)注詞匯控制模式上的變革,包括敘詞表的自然語言化、控制機制的智能化(“無形化”),以及與互操作的結(jié)合,與其他應(yīng)用(標引、檢索等)系統(tǒng)數(shù)據(jù)的無縫交換和集成。
2.4兼顧融合單語種與多語種
近年來,為了更好地適應(yīng)網(wǎng)絡(luò)多語言環(huán)境、開發(fā)利用外文信息資源,多數(shù)敘詞表根據(jù)用戶的使用特點、檢索文獻的語言種類,呈現(xiàn)出雙語種或多語種的特點。另外,跨語種敘詞表間的映射、翻譯已經(jīng)成為非常重要的多語種敘詞表編制方式。為網(wǎng)絡(luò)環(huán)境下多語種敘詞表的編制、維護、管理和跨語言互操作映射提供的規(guī)則和指南,是敘詞表編制標準中不可或缺的組成部分。《新標準》實施之前的兩部敘詞表編制標準(GB/T 13190-1991和GB/T 15417-1994)是單語種和多語種相互獨立,自成體系。事實上,作為GB/T 13190-1991和GB/T 15417-1994修訂基礎(chǔ)的ISO 5964:1985和ISO 2788:1986遵循同樣的規(guī)則,只是將這些規(guī)則應(yīng)用到多語言環(huán)境中。ISO以英國國家標準BS 8723為基礎(chǔ),將ISO 2788:1985和ISO 5964:1986更新、擴展為ISO 25964,涵蓋了單語種和多語種敘詞表編制規(guī)則?!缎聵藴省芬膊杉{這一做法,將GB/T 13190-1991與GB/T 15417-1994融為一體,兼顧了單語種和多語種的處理,以避免大量交叉、重疊的闡釋和規(guī)定。
2.5充分運用計算機技術(shù)編制和管理敘詞表
敘詞表的編制與管理是一件耗時耗力、智力依賴型工作,人工編制難度大,更新滯后緩慢,無法滿足信息時代的需求。目前,網(wǎng)絡(luò)環(huán)境是敘詞表構(gòu)建、展示和應(yīng)用的主要環(huán)境,敘詞表的編制和管理更多地借助于信息技術(shù)和網(wǎng)絡(luò)技術(shù),但領(lǐng)域?qū)<业闹橇σ廊徊豢苫蛉薄?/p>
在敘詞表構(gòu)建和管理過程中,一方面,應(yīng)充分利用各種自然語言處理技術(shù),從海量語料庫中收集、提取概念術(shù)語和詞匯,并利用計算機的計算速度和智能程度獲取概念間關(guān)系,加快知識的智能處理進程;另一方面,應(yīng)當基于網(wǎng)絡(luò)平臺,開發(fā)或選擇敘詞表編制管理軟件,應(yīng)用于敘詞表構(gòu)建、管理、存儲、維護中的各種事務(wù)性工作,以節(jié)省人力和時間成本,實現(xiàn)從“人編機助”向“機編人助”[11]的方向發(fā)展。
相對于GB/T 13190-1991、GB/T 15417-1994而言,《新標準》GB/T 13190.1-2015在標準的編制風(fēng)格和內(nèi)容方面呈現(xiàn)出許多適應(yīng)數(shù)字網(wǎng)絡(luò)技術(shù)環(huán)境、應(yīng)用環(huán)境、漢語的新特點。
3.1標準編制風(fēng)格
3.1.1內(nèi)容全面、詳盡,涉及詞表編制與應(yīng)用的各個方面
《新標準》內(nèi)容詳盡的特點主要表現(xiàn)在,除了對敘詞表傳統(tǒng)的核心機制——詞匯、詞間關(guān)系控制之外,在敘詞表概述和目標、分面分析、顯示與布局、敘詞表的構(gòu)建與維護管理等方面也都做了詳細的規(guī)定,同時對敘詞表編制管理軟件和詞表的互操作(包括數(shù)據(jù)模型、與應(yīng)用系統(tǒng)的集成、交換格式和協(xié)議)做出了指南性建議和規(guī)定。
3.1.2實用性強,充分考慮各個環(huán)節(jié)、各種細節(jié)
《新標準》一改以往詞表編制標準只做出原則性規(guī)定的不足,新版在做出原則性規(guī)定的同時,還做出了進一步的說明或規(guī)定,大大提高了詞表編制的可操作性。例如:
12.1.2顯示樣式綜述
當以屏幕形式或印刷版形式提供給用戶使用時,敘詞表可以通過如下方式顯示:
a)單條記錄是最基本的顯示形式,它顯示優(yōu)選詞或非優(yōu)選詞本身以及(可以選擇)附加于它的任意一種或全部關(guān)系、編碼和注釋;
b)按字順排列顯示,可以從用戶最初表達的語詞指引到概念。在印刷版敘詞表中它可起索引功能,而計算機顯示中它能夠補充直接查找功能;
c)以BT/NT關(guān)系為基礎(chǔ)的等級序列顯示:能夠幫助擴展或限制被標引或檢索的概念;
d)分類序列顯示,可以實現(xiàn)在一個學(xué)科或主題領(lǐng)域中的瀏覽,引起對相關(guān)概念的關(guān)注;
e)圖形顯示,可以用圖形化的形式展示語詞和它們的關(guān)系;
f)輪排顯示,可以幫助找到那些嵌入在復(fù)合語詞中的單詞、詞素。
這些不同的顯示彼此互相補充。按字母順序獲取是最基本的,應(yīng)該提供直接查找或提供b)中描述的按字母順序排列的序列。c)和d)中至少應(yīng)該提供一種來給出體系序列的一個總覽。有關(guān)每個概念的附加信息,如范圍注釋、和其他概念的關(guān)系,可以……。在看待不同序列的相對重要性和功能方面,還有……,敘詞表可以有很大的差異?!?/p>
3.1.3“剛性”弱,“彈性”強
“剛性”是指硬性規(guī)定,“彈性”是指可以根據(jù)不同的情況進行變通。可以說,“剛性”弱,“彈性”強是本次修訂的顯著特點。
由于敘詞表是一種典型的人工語言,帶有強烈的“人為性”,針對不同的檢索系統(tǒng)、不同的用戶群,很難說哪種“人為性”最佳。因此,在具體規(guī)定上,《新標準》通常根據(jù)具體的應(yīng)用情況,彈性地給出不同的推薦選項,而這正是敘詞表編制中的靈魂和精髓。也正是由于這個特點,《新標準》看起來并不像傳統(tǒng)意義上剛性規(guī)定的“標準”,而更像是參考性、可操作性強的“教科書”。下面是《新標準》中的一些彈性表述(劃線部分)。
形容詞作為名詞詞組的成分或許是有用的,但是如果單獨使用,就會導(dǎo)致檢索中出現(xiàn)問題。
但如果理由很充分時也可以有例外,例如……。
不過,如果完全不可避免要使用,也應(yīng)該保留它們,否則……。
一般來說,……,很難保持絕對的一致性,……,存在一些不一致也是不可避免的。……,因此可以被忽略。
3.2標準內(nèi)容的新特點
3.2.1提供了更為清晰的分面分析應(yīng)用指南
分面分析具有多維視角組織揭示和呈現(xiàn)檢索結(jié)果的優(yōu)異性能,是Web信息架構(gòu)的重要組織模式和檢索方式,在網(wǎng)絡(luò)環(huán)境中廣泛使用。分面分析法使敘詞表從樹型結(jié)構(gòu)向網(wǎng)絡(luò)結(jié)構(gòu)發(fā)展,使敘詞表在導(dǎo)航組織、檢索、呈現(xiàn)等方面具有非常好的應(yīng)用前景。該方法的重要性在《新標準》中也得到了體現(xiàn)?!缎聵藴省穼⒎置娣治鰡为毩袨橐徽拢⑻峁┝饲逦膽?yīng)用指南?!缎聵藴省分赋觯悍置娴倪x擇可根據(jù)敘詞表主題領(lǐng)域的不同而有所變化,但在更高層級上,不同領(lǐng)域的敘詞表可使用一些基本的類,如對象、材料、機構(gòu)、行為、地點、時間等來進行分面[1]。
3.2.2規(guī)定了靈活多樣的敘詞表組織和顯示方式
《新標準》兼顧了屏幕形式和印刷版形式的敘詞表,規(guī)定和展示了靈活多樣的敘詞表組織和顯示方式來適應(yīng)當前的現(xiàn)實和未來的發(fā)展。
在屏幕版本和在線網(wǎng)絡(luò)環(huán)境下,分面分析法充分展示了其在敘詞表微觀結(jié)構(gòu)組織和呈現(xiàn)中靈活、動態(tài)、多維、全面地顯示詞間關(guān)系的優(yōu)勢性能。除了字順顯示、等級顯示等傳統(tǒng)敘詞表組織方式外,《新標準》還著重給出了分面組織的等級顯示、按學(xué)科主題的分類組織顯示、學(xué)科主題加分面的組織顯示,以及多語種敘詞表的顯示與布局等示例和具體指南,并以資料性附錄的方式補充了國外和國內(nèi)一部分已經(jīng)以印刷或在線方式出版的敘詞表顯示樣式,并說明每一種顯示樣式的特點?!缎聵藴省窞閿⒃~表編制中微觀結(jié)構(gòu)的組織和顯示方式的選擇,以及在特定環(huán)境中可選擇采用哪些(或哪種)類型提供了直觀的參照依據(jù)和指南。
3.2.3規(guī)定了敘詞表管理軟件的一般特征和功能要求
敘詞表管理軟件主要用于敘詞表的編制和管理。在實際應(yīng)用中,敘詞表管理軟件的功能設(shè)計應(yīng)以待編制的敘詞表項目的要求為依據(jù)?!缎聵藴省方o出了敘詞表管理軟件開發(fā)的指導(dǎo)原則,包括一般的特征和功能(見表1)。
表1敘詞表管理軟件的一般特征和功能
規(guī)模和字符限制不限制敘詞、節(jié)點標簽和注釋等的數(shù)量不限制敘詞、標簽、注釋的長度不限制等級層次的深度能處理標準字符集中的所有字符不限制語種數(shù)量敘詞間和概念間的關(guān)系不允許同種語言中存在重復(fù)語詞,重復(fù)輸入時應(yīng)有提示支持Y,D,S,F,C,BT/NT,RT/RT,USE/UF等詞間關(guān)系支持互見關(guān)系的自動生成不限制詞間關(guān)系的數(shù)量允許用戶自定義詞間關(guān)系,如細分不同類型的BT/NT,RT關(guān)系支持詞間關(guān)系閉合檢查敘詞和概念的注釋支持注釋中關(guān)聯(lián)敘詞或概念的鏈接指向和跳轉(zhuǎn)支持用戶自定義的注釋代碼和符號盡可能與其他類型的系統(tǒng)符號和詞表中的敘詞或概念、主題范疇建立關(guān)聯(lián)盡可能為每一個敘詞或概念分配唯一標識符盡可能根據(jù)所應(yīng)用的每種系統(tǒng)符號、代碼標識的序列輸出詞表數(shù)據(jù)節(jié)點標簽節(jié)點標簽不作為敘詞表的敘詞或概念來對待軟件應(yīng)具備定位顯示節(jié)點標簽的功能數(shù)據(jù)導(dǎo)入與導(dǎo)出支持批量導(dǎo)入數(shù)據(jù)集支持生成報表或?qū)С鲈~表支持批量編輯/刪除支持導(dǎo)出既定日期修正后的所有數(shù)據(jù)信息支持印刷形式或屏幕形式的輸出顯示樣式編輯性導(dǎo)航與支持支持直接輸入敘詞(或敘詞的一部分)定位敘詞款目支持瀏覽敘詞或概念關(guān)系定位敘詞款目支持編輯界面修訂敘詞時敘詞所有關(guān)系的動態(tài)顯示支持敘詞及其全部關(guān)系改變層級位置時的拖放操作和失效關(guān)系的提示支持標準的字處理和拼寫檢查支持刪除某一敘詞或概念時先提示確認支持多語言敘詞表間的轉(zhuǎn)換對應(yīng)顯示其他功能確保每種語言地位平等、提供編輯性保護措施、充當事務(wù)性內(nèi)部管理工具等
表1中對指導(dǎo)原則的描述滿足了敘詞表管理軟件應(yīng)該具備的導(dǎo)入、導(dǎo)出、編輯、校驗、輸出、顯示、統(tǒng)計等主要功能,保證了敘詞表管理軟件的三項特征:邏輯完整性、操作方便性、數(shù)據(jù)安全性。當選擇敘詞表管理軟件時,只要循著表1所列特征和功能及其他需求,就可以對市場上的現(xiàn)有軟件產(chǎn)品進行評估,或者為定制或開發(fā)新的軟件提供原則性指南[12]。
3.2.4增加了敘詞表編制中互操作的相關(guān)技術(shù)內(nèi)容
敘詞表往往需要整合到一定的信息系統(tǒng)或軟件環(huán)境中才能得到應(yīng)用,因此,需要解決敘詞表與軟件之間的互操作,或數(shù)據(jù)交換問題。對此,GB/T 13190.1-2015給出了相對全面的解決方案。一方面,敘詞表數(shù)據(jù)交換格式和數(shù)據(jù)模型的標準化是為了解決知識組織體系編制軟件與其他應(yīng)用軟件或應(yīng)用環(huán)境之間的數(shù)據(jù)交換問題;另一方面,對敘詞表之間和敘詞表與其他知識組織體系之間的映射類型以及結(jié)構(gòu)模型進行規(guī)范,則是為了解決不同語種、不同類型知識組織體系在語義層面的互操作問題。敘詞表互操作方面的規(guī)定,體現(xiàn)了將敘詞表的應(yīng)用從以人為主向“人”“機器”都能識別的方向轉(zhuǎn)化,適應(yīng)了網(wǎng)絡(luò)環(huán)境下知識組織領(lǐng)域的發(fā)展。
3.2.5新增了大量與基于知識組織的術(shù)語服務(wù)密切相關(guān)的內(nèi)容
術(shù)語學(xué)是情報檢索語言的三大基礎(chǔ)之一[13]。網(wǎng)絡(luò)環(huán)境下,敘詞表的功能與用途被冠以“術(shù)語服務(wù)”(Terminology Service)這個具體稱謂[14]。作為內(nèi)容準確、描述規(guī)范的術(shù)語集,敘詞表已經(jīng)成為當前基于知識組織的術(shù)語服務(wù)的主要數(shù)據(jù)源[15]。面向知識發(fā)現(xiàn)與利用的知識組織服務(wù)系統(tǒng)是敘詞表當前和未來的發(fā)展趨勢。《新標準》除了保留敘詞表編制方面的條款以外,還新增了大量與術(shù)語服務(wù)密切相關(guān)的內(nèi)容。
《新標準》首次明確指出術(shù)語集對敘詞表的構(gòu)建與維護非常有用,它們不僅可以作為概念和語詞的來源,還有助于提供范圍注釋,指導(dǎo)優(yōu)選詞的選擇,提供款目詞的定義。該標準同時指出在應(yīng)用術(shù)語集時應(yīng)注意的問題。
術(shù)語服務(wù)的基本要素之一就是術(shù)語集合的形式化表征,因此,敘詞表的形式化表征已經(jīng)成為其網(wǎng)絡(luò)應(yīng)用服務(wù)的基本技術(shù)要件?!缎聵藴省诽岢龅年P(guān)于互操作中的數(shù)據(jù)交換格式、網(wǎng)絡(luò)環(huán)境下的應(yīng)用協(xié)議等方面的建議,實際上也涉及到了敘詞表形式化表征和網(wǎng)絡(luò)化應(yīng)用的內(nèi)容。
4.1《新標準》的不足
任何標準的產(chǎn)生都是由需求推動的,任何標準一經(jīng)誕生,在應(yīng)用實踐中又會產(chǎn)生新的完善、修訂需求。標準經(jīng)常是平衡和妥協(xié)的結(jié)果。十全十美、一成不變的標準是沒有的。
《新標準》只對敘詞表的編制給予規(guī)定,對于敘詞表以外的其它詞表僅描述一般性特征,并側(cè)重于解決它們與敘詞表之間的互操作問題。
《新標準》是在ISO 25964-1:2011的基礎(chǔ)上修訂完成的,有關(guān)與其他敘詞表互操作的“15 數(shù)據(jù)模型”“16敘詞表及其應(yīng)用程序的集成”“17交換格式”“18協(xié)議”等部分僅做了原則性內(nèi)容闡述及規(guī)定,可操作性不足。這些內(nèi)容有待于在下一階段對《新標準》“第2部分:與其他詞表的互操作”(基于ISO 25964-2:2014)[16]的修訂工作中做進一步的闡釋和規(guī)定,從而與第1部分構(gòu)成一個整體配合使用。
《新標準》還存在其他一些不足之處和需要不斷完善的地方。例如,在詞族的設(shè)計和編制等方面,指導(dǎo)性的規(guī)定較薄弱;常用漢語標記符號仍然承襲原來的“YDSFCZ”,更為細分的關(guān)系符號需要借用“英語標記符”,這對于漢語敘詞表編制的本體化發(fā)展無疑將是一個制約。另外,由于遵循ISO 25964-1:2011的闡釋、行文風(fēng)格,該標準的語句部分存在“歐化”的瑕疵。
但作為計算機化、數(shù)字化、網(wǎng)絡(luò)化條件下的詞表編制標準,《新標準》與GB/T 13190-1991和GB/T 15417-1994相比,有了質(zhì)的飛躍,它的發(fā)布和施行,必將極大地推動我國檢索語言的發(fā)展和應(yīng)用。
4.2《新標準》展望
在《新標準》修訂的這個周期,國內(nèi)外知識組織領(lǐng)域的發(fā)展異常迅猛,除了敘詞表適應(yīng)網(wǎng)絡(luò)應(yīng)用的改造外,關(guān)系模式層次的知識組織系統(tǒng)還發(fā)展出了概念圖、主題圖、語義網(wǎng)絡(luò)、本體等新型語義組織模式;知識組織系統(tǒng)的形式化語義描述(XML/RDF/SKOS/OWL),關(guān)聯(lián)數(shù)據(jù)的形式化發(fā)布成為必須;語義詞表的應(yīng)用樣式不斷豐富和拓展,術(shù)語服務(wù)成為必然。
近年來,圖書館界在未來書目控制方面的努力,包括書目功能需求FRBR模型(及其對規(guī)范記錄與主題的擴展FRAD和FRSAD)、基于FRBR模型的實踐——新的編目內(nèi)容標準RDA,以及直指革命MARC的基于關(guān)聯(lián)數(shù)據(jù)的新書目數(shù)據(jù)格式模型BIBFRAME等,與互聯(lián)網(wǎng)領(lǐng)域的語義化WikiData、知識圖譜(Knowledge Graph)的發(fā)展,無不彰顯著網(wǎng)絡(luò)規(guī)范控制的重要價值。規(guī)范控制、取值詞匯集成為RDA、BIBFRAME功能目標實現(xiàn)和網(wǎng)絡(luò)環(huán)境下信息開發(fā)利用必不可少的重要基礎(chǔ)和工具。名稱規(guī)范數(shù)據(jù)集、主題規(guī)范數(shù)據(jù)集的網(wǎng)絡(luò)編制和應(yīng)用,已然成為知識組織界的熱點和焦點。
一度被唱衰和質(zhì)疑的傳統(tǒng)受控詞表,正經(jīng)歷著網(wǎng)絡(luò)適應(yīng)性改造和變革的過程,并迎來新一輪的發(fā)展契機和研究熱潮?!缎聵藴省返闹贫槲覈鴤鹘y(tǒng)敘詞表的網(wǎng)絡(luò)知識組織適應(yīng)性改造和新敘詞表的編制,及其在機器世界中的應(yīng)用提供了指南和方向。
(致謝:感謝華東理工大學(xué)陳樹年老師的支持與幫助。)
1 劉華,等.網(wǎng)絡(luò)環(huán)境下敘詞表編制標準的國際發(fā)展趨勢[J].情報雜志,2009(11).
2 全國文獻工作標準化委員會.GB/T 13910.1-2015 信息與文獻 敘詞表及與其他詞表的互操作第1部分:用于信息檢索的敘詞表[S].北京:中國標準出版社,2015.
3 全國文獻工作標準化委員會.GB 13190-1991漢語敘詞表編制規(guī)則[S].北京:中國標準出版社,1992.
4 Technical Committee ISO/TC46. ISO 2788: 1986 guidelines for the establishment and development of monolingual thesauri[S]. Switzerland: International Organization for Standardization, 1986.
5 全國文獻工作標準化委員會.GB/T 15417-1994文獻多語種敘詞表編制規(guī)則[S].北京:中國標準出版社,1995.
6 Technical Committee ISO/TC46.ISO 5964:1985 Guidelines for the establishment and development of multilingual thesauri[S]. Switzerland: International Organization for Standardization, 1985.
7 National Information Standards Organization. ANSI/NISO Z39.19-2005 Guidelines for the Construction, Format and Management of Monolingual Controlled Vocabularies[S].Bethesda:NISOPress,2005.
8 British Standards Institution.BS 8723-5-2008 Structured vocabularies for information retrieval-Guide-Part5:Exchange formats and protocols for interoperability[EB/OL].[2015-12-10]http://www.docin.com/p-89764032.html.
9 Classification and Indexing Section, International Federation of Library Associations. IFLA Guidelines for Multilingual Thesauri[EB/OL].[2015-12-10].http://www.ifla.org/VII/s29/index.htm.
10 Technical Committee ISO/TC46. ISO 25964-1:2011 Information and Documentation-Thesauri and Interoperability With other Vocabularies-Part1: Thesauri for information retrieval[S]. Geneva: International Organization for Standards, 2011.
11 薛春香,侯漢清.敘詞表詞匯控制機制變革的探討[J]. 圖書館雜志,2013(11).
12 劉春燕,等. ISO 25964的技術(shù)內(nèi)容分析及對我國敘詞表編制標準的修訂啟示[J]. 圖書情報工作,2009(4).
13 張琪玉.情報語言學(xué)基礎(chǔ)[M].武漢:武漢大學(xué)出版社,1997:15.
14 范煒.詞表資源關(guān)聯(lián)化[J].情報理論與實踐,2010(5).
15 劉華.敘詞表國際標準的修訂及其對基于知識組織的術(shù)語服務(wù)的影響[J].圖書情報工作,2011(11).
16 Technical Committee ISO/TC46. ISO 25964-1:2013 Information and Documentation-Thesauri and Interoperability With otherVocabularies—Part2:Interoperability with other Vocabularies[S]. Geneva: International Organization for Standards, 2013.
(包冬梅講師南京政治學(xué)院上海校區(qū)軍事信息管理系)
Guidelines for the Construction and Management of Thesauri for Information Retrieval
Bao Dongmei
Under the network environment, the important value of thesaurus in subject authority control is still indispensable, and the compilation standard is critical to promoting the standardization of compiling thesaurus and exchanging and sharing data among thesauri. GB/T 13190.1-2015, the latest national standard for thesaurus compilation, is the modified result on the basis of ISO 25964-1:2011. The new standard will provide guidance and direction for the transformation of traditional thesauri and the new thesaurus compilation in China. The article introduces and analyzes the revision background, basic thought, the characteristics both in writing style and content of GB/T 13190.1-2015. 1 tab. 16 refs.
GB/T 13190.1-2015; Compilation of Thesaurus; Standards; Revision
2016-01-15