鄭儉華
(國家圖書館,北京 100081)
文獻標引既是一種技術,也是一種藝術,既帶有很強的規(guī)范性,又有很大的靈活性。[1]保證主題標引的準確性、一致性和有效性,取決于檢索系統(tǒng)的特點和需要,以及檢索語言的規(guī)范化控制。《中國分類主題詞表》第二版(以下簡稱《中分表2版》),正是以《中國分類主題詞表》第一版編制規(guī)則和“主題詞機讀規(guī)范數據庫”、“《中圖法》第四版機讀數據庫”為基礎,以滿足電子版功能為主,兼顧手工印刷版需求的分類與主題、標引與檢索一體化的實用工具。[2]同時《中分表2版》的電子版為實現機助標引和自動標引提供了知識庫和應用接口,為計算機和網絡環(huán)境下的文獻標引工作提供了極其便利的檢索方法,極大地提高了工作中的標準化和規(guī)范化,使我國的文獻標引工作向更高水平發(fā)展。
《中分表2版》的出版與使用,降低了標引難度,提高了標引質量,為標引人員提供了更多學習、研究、探討的機會。
文獻標引的質量,取決于主題標引的“客觀性、專指性、網羅性、一致性和針對性”。[3]其中“專指性”,是衡量文獻標引質量的一把主要標尺。它既是文獻標引“一致性”的基礎,也是有針對性地查找文獻的前提。一個理想的標引結果應該是所標出的主題檢索標識與文獻的主題內容在意義上完全相符,其目的在于保證主題檢索的查準率。這里所指的主題詞是某一特定專業(yè)檢索和標引用的規(guī)范詞。[4]《中分表2版》的啟用,正是將原先要使用的兩個甚至三個主題詞才能表達的內容合二為一,使之更能準確表達文獻主題的性質,應用的主題詞與文獻的內容在意義上完全一致。其主要表現在:
文獻的內容分析是標引工作的前提,為了實現從文獻論述的內容中分析出所需要的知識,則必須弄清文獻論述的主體事物、主要概念和相互關系。
例1:《欠發(fā)達地區(qū)實踐科學發(fā)展觀研究》一書,僅從題目不易理解其中內容,但通過閱讀得知,該書介紹了烏蘭察布市地區(qū)的經濟發(fā)展情況。原書目數據標引為@a區(qū)域經濟@x經濟發(fā)展@x研究@y烏蘭察布市。內容分析準確,主題標引過度、不精練?!吨蟹直?版》已經新增詞匯“區(qū)域經濟發(fā)展”。因此,檢索后準確標引應為@a區(qū)域經濟發(fā)展@x研究@y烏蘭察布市。
例2:《現代人力資源管理實務》一書,原書目數據標引為@a勞動力資源@x資源管理@x高等職業(yè)教育@j教材。書名已經明確顯示了人力資源管理的內容主題,《中分表2版》也已新增詞匯“人力資源管理”。檢索后準確標引應為@a人力資源管理@x高等職業(yè)教育@j教材。
由此可見,詞表新增詞匯使主題詞的專指度達到了文獻內容與檢索標識的統(tǒng)一。
文獻標引的選詞規(guī)則要求,必須首先選擇與原文獻主題概念相對應的單個和最專指的主題詞標引。主題標引是自然語言表達的主題轉換成詞表中人工語言表達的主題?!吨蟹直怼繁旧淼膶V赋潭戎萍s著標引的專指性。因此,標引的專指性直接受到詞表中主題詞專指性的制約。當標引人員在詞表中查不到這些專指詞時,才選用上位標引或靠詞標引。
例1:《C++程序設計案例匯編》一書,因原《中分表》把有關反映C語言編程的文獻內容,均用“C語言”同一主題詞,即標引為@aC語言@x程序設計@x高等教育@j教材。而C++進一步擴充和完善了C語言,成為一種面向對象的程序設計語言?!吨蟹直?版》則新增詞匯“C++語言”,比“C語言”更加專指。所以,檢索后準確標引應為@aC++語言@x程序設計@x高等教育@j教材。
例2:《中文版AutoCAD輔助設計經典實錄228例》一書,原書目數據標引為@a繪圖軟件@x基本知識。而繪圖軟件包括 Photoshop、3Dmax、CAXA等,本書題名明確指出所應用的是AutoCAD軟件進行繪圖設計,而《中分表2版》也已對此增詞,檢索后準確標引應為@aAutoCAD軟件@x基本知識。
由此反映出新詞表的增詞對于新學科、新事物的補充,更體現了主題標引的專指性。
所謂組配,指的是概念組配,而不應該是字面組配。概念組配標引是加強被標引文獻專指性的重要手段。對于組配標引的準確性,直接關系到文獻內容的專指性。
例:《現代工筆人物畫法》一書,原書目數據的標引為@a工筆畫@x人物畫@x繪畫技法。雖然“繪畫技法”屬于新增詞匯,但是工筆畫屬于國畫范疇,因此在詞表中可以檢索到“國畫技法”新增主題詞,它更能準確達到本書內容的概念轉換。準確標引應為@a工筆畫@x人物畫@x國畫技法。增詞還包括“素描技法”、“速寫技法”、“油畫技法”等,均可根據文獻內容組配標引。
《中分表2版》中增加的詞匯,使得文獻標引中能夠選用專指性最高的主題詞進行組配,表達了標引文獻的單一概念,并做到精準、確切。
基于以上論述不難看出,如何利用《中分表2版》提高主題標引的專指性,對于標引人員來說,有著更高的要求。既要認真分析文獻的主題內容(包括隱含主題和顯現主題),又要認真提煉文獻中的主題概念,從而選擇具有專指性的正式主題詞,并進行正確的概念組配,才能最終體現文獻檢索的查準率。
關鍵詞原則上是指文獻題目里出現的詞,可以延續(xù)到文獻摘要,在正文中對揭示和描述文獻主題內容來說,具有實質意義的帶關鍵性的語詞。同時,也是用戶在檢索時常常喜歡使用的語詞,即選擇能準確反映自己意圖的關鍵詞作為檢索標識用于檢索文獻?!吨蟹直?版》對初版中的分類號、類名、注釋、對應的主題詞及其參照關系進行了全面系統(tǒng)地修訂,增補了新學科、新事物的主題概念以及自然語言形式的入口詞。新增主題詞21607條,刪除舊的或將其修改為入口詞的有12115條,自然語言的入口詞新增了21000條。[5]因此,編目員在利用《中分表2版》檢索時,要注意入口詞的對比和變化,以標示文獻主題內容的關鍵詞來檢索經過規(guī)范處理的主題詞。
例:《花生高產優(yōu)質種植技術》一書,原數據標引為@a花生@x栽培技術。但是,通過檢索關鍵詞“高產”,就能夠準確檢索到“高產栽培”這一新增詞匯。所以,正確的標引應該是@a花生@x高產栽培。
盡可能多地提供自然語言的入口詞進行檢索,是《中分表2版》使用的一大特色。
分類主題詞表按其實質是體系分類表的分類號與主題詞表的主題詞兩種檢索標識的轉換系統(tǒng),其原理就是檢索標識間的概念對應,使表達同一個主題概念的兩種檢索標識相互聯(lián)系起來,達到可互相轉換,從而在文獻標引時可一次標引獲得兩種檢索標識?!吨蟹直?版》是以《中國圖書分類法(第4版)》(以下簡稱《中圖法(4版)》)的體系結構為主體,將其原有主題詞及新增和修訂的主題詞全部納入到《中圖法(4版)》的分類體系中,并且依據類目概念對應規(guī)則,把《中圖法(4版)》所有類目(主題)都用主題詞或主題詞串對應標引出來。因此,主題詞范疇號,就是其概念的分類號,可直接從分類角度標引選詞和檢索。
例:《中國現代小說雅俗新論》一書,原書目數據標引為@a小說@x文學評論@y中國@z現代。編目員憑經驗已深知文學作品的研究、評論等分類號范圍應在I106,在電子版中用小說文學研究的分類號I106.4檢索,可以看到新增詞匯“小說評論”。因此正確的標引應為@a小說評論@y中國@z現代。同樣,用主題詞“文學評論”在電子版中可以檢索到分類號 I106、I106.2、I106.5、I106.7 等,即可看到對應的新增詞匯“著作評論”、“詩歌評論”、“報告文學評論”、“民間文學評論”等。
不難看出《中分表2版》的應用,對自然語言中影響檢索效率的不利因素進行有效的控制,降低了標引工作的難度,并提高標引工作的速度。同時,可以直接使用文獻用語和作者用語,改善標引的專指性和一致性,實現了分類主題一體化。
《中分表2版》電子版的使用,實現了多窗口多維檢索。[6]它是通過軟件開發(fā)把分類法和主題詞,以多文檔、多窗體的形式變?yōu)闄C讀數據,從而實現分類主題一體化機助標引和基于內容的信息檢索等功能,并提供了多種途徑和多種檢索方式來查找類目和主題概念,為文獻選擇分類和主題標引方式提供了必要條件。檢索方式為:任意一致、一體化擴檢、完全一致、前方一致和后方一致。
例:《新時期中國社會福利制度轉型理論探索獲獎論文集》一書,原書目數據為@a社會福利@x福利制度@y中國@j文集。而通過電子版中“任意一致”的檢索途徑,輸入“會?!倍郑蜁吹健吧鐣@贫取边@一新增詞匯。因此,準確的標引應為:@a社會福利制度@y中國@j文集。
很明顯,電子版實現了檢索途徑和匹配方式的互相搭配和制約。檢索的內容既存在于類目字面中,又將所檢索的主題詞有關聯(lián)的詞都檢索出來,使分類主題標引更加準確、快捷。
在文獻標引中,用給定的主題詞作為文獻的檢索標識,并通過這些詞之間的形式邏輯關系,表達一個專指概念或一篇文獻完整的主題,從而采取組配的標引格式。即:@a主題因素@x通用因素@y位置因素@z時間因素@j文獻類型因素。
例1:《中國旅游文化》一書,原書目數據標引為@a旅游@x文化@y中國@x高等學校@j教材。在編目員的分析和判斷下,考慮到是否新增“旅游文化”這一詞匯,經過用“旅游”“文化”檢索確實已經增詞。因此,正確的標引應為@a旅游文化@y中國@x高等學校@j教材。
例2:《廣西中小企業(yè)發(fā)展戰(zhàn)略研究》一書,原書目數據標引為@a中小企業(yè)@x經濟發(fā)展戰(zhàn)略@x研究@y廣西。同樣進行“企業(yè)”“發(fā)展戰(zhàn)略”進行檢索,可看到新增了“企業(yè)發(fā)展戰(zhàn)略”主題詞。因此,正確的標引應為:@a中小企業(yè)@x企業(yè)發(fā)展戰(zhàn)略@x研究@y廣西。
分析中得出,參與組配的詞與詞之間不是簡單的字面組合,而是概念的組配。因此,《中分表2版》正是合理而正確地反映了概念之間的邏輯關系。
《中分表2版》對計算機類、軟件類、菜譜類和經濟類等進行大量增詞,增補了許多新學科、新事物的主題詞。以菜譜圖書為例,新增了“家常菜肴”、“葷菜”、“火鍋菜”、“中式菜肴”、“涼菜”等。
例1:《家庭養(yǎng)生菜譜1388例》一書,原書目數據標引為@a保健@x菜譜@y中國。通過增詞檢索,準確的標引應為@a中式菜肴@x保健@x菜譜。
例2:《電子銀行與金融渠道創(chuàng)新》一書,原書目數據標引為@a計算機應用@x銀行業(yè)務@j文集。通過增詞檢索,準確的標引應為@a電子銀行@x銀行業(yè)務@j文集。
顯而易見,《中分表2版》的新增主題詞,更加增強了時代感,適應了當今圖書編目的使用趨勢。在大量讀者群常用的圖書類目中,把使用頻率高的自由詞轉為主題詞,使編目員在標引中選詞更加簡練、精確。
編目員在文獻標引工作中,常用替代詞替代名詞詞組或其中心詞進行檢索。如何了解《中分表2版》的增詞情況,使得對文獻內容的標引更加的準確和貼切,使用相對應的替代詞檢索是個關鍵。
例1:《番木瓜大棚栽培技術》一書,原書目數據標引為@a番木瓜@x塑料溫室@x溫室栽培。雖然能夠表達本書的意思,但受詞意限制,只反映了“塑料”和“溫室”。通過用“大棚栽培”檢索,可以看到已經新增這一詞匯。它包括了“竹木大棚”、“裝配式鍍鋅鋼管大棚”、“鋼竹混合大棚”等,既有“冷棚”,也有保暖加溫棚。因此,準確標引應為:@a番木瓜@x大棚栽培。
例2:《華北平原秋播優(yōu)質小麥節(jié)水栽培》一書。原書目數據標引為@a小麥@x栽培@y華北地區(qū)。小麥的栽培技術包括各種種植技術,如小麥套種技術、小麥地膜覆蓋栽培技術等等。而本書所講述的是小麥節(jié)水栽培技術。因此,用“節(jié)水栽培”檢索,可以看到已經新增這一詞匯。準確標引應為:@a小麥@x節(jié)水栽培@y華北地區(qū)。
分析表明,在《中分表2版》的應用中,增強了圖書標引工作的規(guī)范性和靈活性,大大地提高和完善了文獻標引的質量。
綜上所述,《中分表2版》作為我國規(guī)模最大的分類-主題一體化的標引工具,在原有基礎上進行了類目擴充,拓寬了文獻編目和標引工作在知識提高、知識導航、知識學習和智能檢索等方面的應用,把分類檢索、主題檢索等結合起來,很大地提高了檢索效率。隨著我國圖書館事業(yè)的發(fā)展,文獻資源的共知、共建和共享已經成為人們的共識。中文圖書編目的標準著錄以便信息的交換及傳播,已經成為圖書館工作必不可少的基礎建設。因此,要做到中文圖書書目數據的標準化、規(guī)范化,書目數據質量的提高是必要的前提,這就對從事標引工作的編目員來說,有了更高的要求。
筆者認為,一個合格的編目員,對于標引工作來說是一種專業(yè)性和技術性較強的智力勞動。首先要有較高的素質修養(yǎng)和職業(yè)道德,以及認真、嚴謹的工作態(tài)度,始終保持較強的責任心和使命感,在業(yè)務上勇于開拓和創(chuàng)新。其二,熟練掌握專業(yè)知識和技能,特別是精通《中分表2版》的使用方法和技巧,以及電子版檢索系統(tǒng)的性質、功能、需求等特點。既要有較強的邏輯分析、判斷、推理、歸納、綜合的能力,又要對檢索語言的原理、結構、使用等深入了解,并嚴格遵守標引規(guī)范要求,明確標引細則,客觀而準確地反映出文獻中所論述的事物或研究的對象。其三,要有廣博的學識和計算機應用知識。能夠駕馭多學科、多領域的文獻內容,并時刻關注新思想、新理念、新科學的發(fā)展趨勢,以及它們之間的相互滲透和相互交叉。充分運用計算機自動標引的原理和網絡分類標引的原理。同時,編目員之間要相互溝通、學習和探討,實現統(tǒng)一思想、強化措施,便能促進文獻標引工作提高效率和質量。只要編目員在實踐中去深刻體會、靈活運用,并能夠發(fā)揮和創(chuàng)新,達到主題標引的深度、正確、專指、適度和一致,就能使我國的圖書館有更高質量的書目數據,更準確規(guī)范的主題標引和更廣泛的共享文獻資源。另外,建議《中分表2版》及電子版做好升級和維護工作,盡可能地縮短增詞周期;提高類目對應標引的深度,從而滿足自動分類的需要。完善檢索標識功能和檢索途徑,考慮在軟件允許的條件下與書目數據掛接,并開發(fā)出更多的檢索功能,讓《中分表2版》及電子版在網絡信息資源組織中發(fā)揮不可替代的作用。
[1]陳樹年.中國分類主題詞表標引手冊[Z].北京圖書館出版社,1998.
[2]中國圖書分類法編委會.《中國分類主題詞表》概況[EB/OL].http://clc.nlc.gov.cn/ztfzfbgk.jsp.2008
[3]李 楠.控制主題標引質量提高文獻檢索效率[J].河南圖書館學刊.2010,6:122 -123.
[4][5]毛 慧.《中國分類主題詞表》(第二版)的變化及使用[J].圖書館工作與研究.2008,(10):56-58.
[6]劉英杰.《中國分類主題詞表》(第二版)電子版在文獻標引中的使用價值及修改意見[J].農業(yè)圖書情報學刊,2008,(5):52 -53.