童劉奕 張鵬翼
(北京大學(xué)信息管理系,北京 100871)
知識(shí)組織系統(tǒng)是對(duì)知識(shí)結(jié)構(gòu)進(jìn)行表達(dá)和有組織闡述的語(yǔ)義工具統(tǒng)稱[1],包括術(shù)語(yǔ)表、敘詞表、字詞典、地名辭典、本體等[2]。不同知識(shí)組織系統(tǒng)由于其組織方式不同且用戶難以在一個(gè)系統(tǒng)獲取所有信息,而面臨在多個(gè)系統(tǒng)進(jìn)行多次檢索的困擾,因此,如何在各知識(shí)組織系統(tǒng)間實(shí)現(xiàn)互操作,成為提高用戶檢索效率的重要內(nèi)容。Zeng等[3]指出,知識(shí)組織系統(tǒng)互操作的實(shí)現(xiàn)是當(dāng)前網(wǎng)絡(luò)環(huán)境下不可避免的問(wèn)題。實(shí)現(xiàn)不同知識(shí)組織系統(tǒng)的互操作有多種辦法,其中映射是將兩個(gè)或多個(gè)現(xiàn)有知識(shí)組織體系中的概念通過(guò)映射建立連接,從而實(shí)現(xiàn)知識(shí)組織體系的互操作[4],也是最直接的方法之一。
《中國(guó)圖書(shū)館分類法》是1949年后編制出版的按照一定思想觀點(diǎn),以科學(xué)分類為基礎(chǔ),結(jié)合圖書(shū)資料的內(nèi)容和特點(diǎn),且分門(mén)別類的分類表[5]?!睹绹?guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》是美國(guó)國(guó)會(huì)圖書(shū)館在19世紀(jì)末到20世紀(jì)初編制的大型綜合性分類法,該分類法將知識(shí)分為21個(gè)基本大類,每個(gè)大類以單個(gè)字母作為標(biāo)識(shí)[6]。這兩種分類法是世界范圍內(nèi)使用廣泛的圖書(shū)分類方法。要同時(shí)滿足國(guó)內(nèi)外學(xué)者的信息資源需求,就要實(shí)現(xiàn)對(duì)《中國(guó)圖書(shū)館分類法》和《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》兩個(gè)知識(shí)組織系統(tǒng)間的互操作。
本研究以《中國(guó)圖書(shū)館分類法》的3個(gè)二級(jí)類目(學(xué)科領(lǐng)域)B84心理學(xué)、G4教育、O1數(shù)學(xué)為例,對(duì)這兩種分類法的相關(guān)類目進(jìn)行映射,研究?jī)刹糠诸惙ú糠诸惸恐g的映射關(guān)系,分析映射過(guò)程中體現(xiàn)的兩部分類法差異性與映射的難點(diǎn),并探討相應(yīng)的解決辦法。目前,僅有對(duì)《中國(guó)圖書(shū)館分類法》和《杜威十進(jìn)分類法》(Dewey Decimal Classification,DDC)、《中國(guó)圖書(shū)館分類法》和《國(guó)際專利分類法》的映射研究,尚未有研究者對(duì)《中國(guó)圖書(shū)館分類法》和《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》進(jìn)行映射研究,映射過(guò)程中將會(huì)遇到何種問(wèn)題和困難同樣值得探索。
本研究在實(shí)踐方面,能實(shí)現(xiàn)《中國(guó)圖書(shū)館分類法》與《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》在心理學(xué)、教育、數(shù)學(xué)領(lǐng)域類目的人工映射,且映射準(zhǔn)確率較高,從而為進(jìn)一步實(shí)現(xiàn)兩部分類法的互操作提供數(shù)據(jù)基礎(chǔ);在理論方面,探討《中國(guó)圖書(shū)館分類法》與《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》在類目映射上可能遇到的部分問(wèn)題及其解決方法,為更多研究者在研究分類法映射時(shí)提供理論參考與依據(jù)。
關(guān)于知識(shí)組織互操作,司莉[7]總結(jié)了實(shí)現(xiàn)知識(shí)組織系統(tǒng)互操作的9種方法,即派生法、翻譯法、系列化分類表或詞表、衛(wèi)星詞表法、直接映射、共現(xiàn)映射、中介詞典、通過(guò)連接數(shù)據(jù)庫(kù)實(shí)現(xiàn)和宏詞匯。如OCLC在《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》和DDC之間使用直接映射法進(jìn)行一對(duì)一的相互映射[8],目前除D、J、K類尚未完成外,其他部分都已經(jīng)完成映射,并以表格形式呈現(xiàn);直接映射法在國(guó)內(nèi)已經(jīng)使用,黃筱玲[9]對(duì)《中國(guó)圖書(shū)館分類法》與《中國(guó)科學(xué)院圖書(shū)館圖書(shū)分類法》的全部類目進(jìn)行對(duì)比和研究,發(fā)現(xiàn)兩者間有約2/3的類目可形成一一對(duì)應(yīng)的關(guān)系。
從建立映射的方法看,映射可分為直接映射和共現(xiàn)映射;根據(jù)知識(shí)組織系統(tǒng)映射關(guān)系建立過(guò)程中人力的參與程度,可分為人工映射和自動(dòng)映射[10]。直接映射指不同的詞匯與分類號(hào)建立對(duì)等的關(guān)系,目前已實(shí)現(xiàn)的不少分類法映射項(xiàng)目都采用直接映射法。如《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》與DDC的相互映射,OCLC在兩部分類法的各類目間都直接建立一一對(duì)應(yīng)的關(guān)系[10]。共現(xiàn)映射指在同一元數(shù)據(jù)方案或書(shū)目記錄中同時(shí)出現(xiàn)的不同知識(shí)組織系統(tǒng)術(shù)語(yǔ)間建立映射關(guān)系[11]。1994年,由OCLC發(fā)起的從LCSH到DDC的映射[11]使用DDC電子版進(jìn)行了約9萬(wàn)次共現(xiàn)映射。
人工映射和自動(dòng)映射是從映射的主體角度進(jìn)行劃分。人工映射的主體是人,需要投入大量人力和時(shí)間對(duì)分類法的每個(gè)類目進(jìn)行比對(duì)和映射。Zins等[12]以“10-pillar of knowledge”模型為基準(zhǔn),將《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》、DDC、《通用十進(jìn)制分類法》三部分類法的一級(jí)大類、二級(jí)大類映射到該知識(shí)分類法,以論證當(dāng)前使用的三部分類法是否有足夠的系統(tǒng)性,能否覆蓋人類的所有知識(shí)。自動(dòng)映射以計(jì)算機(jī)為映射主體,基于語(yǔ)義相似度、交叉瀏覽等方法設(shè)計(jì)映射算法,對(duì)類目進(jìn)行自動(dòng)映射。如Vizine-Goetz等[11]將主題詞表以MARC21格式進(jìn)行編碼后,使用自動(dòng)映射法以ERIC和LCSH相互映射為例,論證該算法的可行性。
首先,在進(jìn)行類目映射前要了解映射的影響因素。1990年,崔明愛(ài)[13]從分類標(biāo)準(zhǔn)及其引用次序、分類法類型、列類方法、語(yǔ)言標(biāo)記,分類法的傾向性、動(dòng)態(tài)性、標(biāo)引規(guī)則和復(fù)合主題等多個(gè)方面總結(jié)分類法兼容過(guò)程中可能遇到的問(wèn)題。李珂等[14]將影響因素分為宏觀因素和微觀因素,宏觀因素包括編制原則、體系結(jié)構(gòu)、語(yǔ)言文化等,微觀因素包括先組程度、類目專指度和表述差異。
其次,要對(duì)映射的關(guān)系類型進(jìn)行一定了解。分類法類目之間表達(dá)概念的不完全一致性,決定類目之間的映射存在多種語(yǔ)義對(duì)應(yīng)關(guān)系[15]。如Renardus項(xiàng)目在進(jìn)行DDC與本地網(wǎng)關(guān)分類法映射過(guò)程中,規(guī)定完全等同、包含、包含于、大部分重疊和小部分重疊5種對(duì)應(yīng)關(guān)系[16];戴劍波等[15]在進(jìn)行《中國(guó)圖書(shū)館分類法》和DDC映射實(shí)踐時(shí),規(guī)定等價(jià)、包含、包含于和相關(guān)4種語(yǔ)義映射關(guān)系;此外,也有研究在進(jìn)行映射的過(guò)程中不對(duì)關(guān)系類型進(jìn)行定義,通過(guò)定義相似度的計(jì)算方法,找到兩部分類法之間相似度最高的類目直接進(jìn)行一一對(duì)應(yīng)[16-17]。
最后,對(duì)類目之間進(jìn)行映射的判斷依據(jù)也需要參考。賈君枝等[18]提出要依據(jù)類名、注釋、主題詞、類目間關(guān)系等因素確定映射關(guān)系類型,而不能僅憑借上述某一項(xiàng)就直接確定類目的映射關(guān)系類型,并對(duì)具體情況進(jìn)行詳細(xì)分析。對(duì)于組合類目(如《中國(guó)圖書(shū)館分類法》中O15代數(shù)、數(shù)論、組合理論類目),賈君枝等[19]也針對(duì)類目完全等同、類目交叉、類目包含3種情況進(jìn)行具體討論,并對(duì)每種情況給出相應(yīng)處理辦法。
根據(jù)美國(guó)國(guó)會(huì)圖書(shū)館官方網(wǎng)站提供的《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》全文[20]和國(guó)家圖書(shū)館網(wǎng)站提供的《中國(guó)圖書(shū)館分類法》[21],本文對(duì)數(shù)學(xué)、心理學(xué)、教育學(xué)3個(gè)學(xué)科共計(jì)799條《中國(guó)圖書(shū)館分類法》類目進(jìn)行人工映射。
O1數(shù)學(xué)為二級(jí)類,該二級(jí)類的下位類(不含O1)共237條,其中三級(jí)類目17條(約占比7.2%)、四級(jí)類目(約占比26.2%)62條、五級(jí)類目158條(約占比66.7%)。
數(shù)學(xué)領(lǐng)域大部分三級(jí)類目及其下位類的數(shù)量分布呈金字塔形結(jié)構(gòu),部分類目下位類較多,專指性較強(qiáng),在映射過(guò)程中找到等同關(guān)系的映射概率較大。此外,還存在類目設(shè)置不均衡的情況。如O10數(shù)學(xué)理論等三級(jí)類目沒(méi)有設(shè)置下位類,導(dǎo)致語(yǔ)義不明確,確定涵蓋范圍較難。另外,趙冬梅[22]指出,為體現(xiàn)國(guó)內(nèi)學(xué)者對(duì)數(shù)學(xué)學(xué)科體系構(gòu)建的認(rèn)識(shí),《中國(guó)圖書(shū)館分類法》設(shè)計(jì)了體現(xiàn)中國(guó)特色的特殊性類目(如古典數(shù)學(xué)、初等數(shù)學(xué)、高等數(shù)學(xué)等),這些類目在結(jié)構(gòu)上與《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》的類目設(shè)置差異較大,在映射過(guò)程中需要特殊考慮。
B84心理學(xué)為二級(jí)類,該二級(jí)類的下位類(不含B84)共71條,其中三級(jí)類目9條(約占比12.7%)、四級(jí)類目45條(約占比63.4%)、五級(jí)類目17條(約占比23.9%)。
心理學(xué)領(lǐng)域和數(shù)學(xué)領(lǐng)域有較大區(qū)別,9條三級(jí)類目中只有3條細(xì)分到五級(jí)類目。類目設(shè)置不均衡與學(xué)科歷史發(fā)展有關(guān),19世紀(jì)末,心理學(xué)才成為一門(mén)獨(dú)立的學(xué)科,因此,該學(xué)科領(lǐng)域的進(jìn)一步劃分不如數(shù)學(xué)領(lǐng)域細(xì)致。此外,心理學(xué)的五級(jí)類目較少,專指性較低,難以揭示細(xì)小專深的主題。
G4教育為二級(jí)類,該二級(jí)類的下位類(不含G4)共488條,其中三級(jí)類目30條(約占比6.2%)、四級(jí)類目232條(約占比47.5%)、五級(jí)類目226條(約占比46.3%)。
教育領(lǐng)域是本次映射研究中類目最多、類目設(shè)置最復(fù)雜的二級(jí)類目。三級(jí)類目中,G5按照世界各國(guó)教育事業(yè)進(jìn)行劃分,G6按照各級(jí)教育進(jìn)行劃分,G7按照各類教育進(jìn)行劃分。劃分原則不同,導(dǎo)致各類目之間有大量重疊部分。如四級(jí)類目中的“教育政策”“教學(xué)理論”“教學(xué)管理”等概念多次重復(fù)出現(xiàn)在三級(jí)類目的下位類中,使這部分類目復(fù)雜冗長(zhǎng),尋找映射關(guān)系較難。
本文采用直接映射和人工映射的方法對(duì)兩部分類法的相關(guān)類目進(jìn)行映射。本研究的映射為單向映射,即將《中國(guó)圖書(shū)館分類法》單向映射到《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》上。
本研究將映射關(guān)系類型定義為等同、包含于、包含、相關(guān)4種。采取的映射關(guān)系判斷依據(jù)是以概念涵蓋范圍為主,以類名語(yǔ)義關(guān)系為輔,結(jié)合相應(yīng)注釋進(jìn)行判斷。在判斷過(guò)程中,優(yōu)先尋找與《中國(guó)圖書(shū)館分類法》類目在映射上存在等同關(guān)系的《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》類目,“就近不就遠(yuǎn),就上不就下”(即如果有含義更加接近的上位類,則優(yōu)先選取上位類),允許一對(duì)多的關(guān)系(即在找不到一對(duì)一映射的情況下,如果《中國(guó)圖書(shū)館分類法》中某一類包含《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》的多個(gè)類目,則取多個(gè)類目,屬于包含關(guān)系),但將一對(duì)多關(guān)系限定在3個(gè)以內(nèi),等同關(guān)系的判定只需語(yǔ)義和涵蓋范圍基本相當(dāng)即可。此外,若復(fù)分類目所指不明確,找不到對(duì)應(yīng)類,則直接歸入相關(guān)的上位類。
《中國(guó)圖書(shū)館分類法》數(shù)學(xué)領(lǐng)域的238條(含O1數(shù)學(xué))類目中有108條(占比45.4%)類目的映射關(guān)系為等同,86條(占比36.1%)類目的映射關(guān)系類型為包含于,21條(占比8.8%)類目的映射關(guān)系為包含,23條(占比9.7%)類目的映射關(guān)系為相關(guān)。
許多專有數(shù)學(xué)名詞與概念,在《中國(guó)圖書(shū)館分類法》和《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》中的語(yǔ)義和概念范圍一致,能快速建立等同映射關(guān)系。
根據(jù)“就上不就下”的原則,包含于關(guān)系類型遠(yuǎn)多于包含。映射關(guān)系類型為包含于的類目都是五級(jí)類目,因?yàn)椤吨袊?guó)圖書(shū)館分類法》數(shù)學(xué)領(lǐng)域的類目一般僅細(xì)分到五級(jí)。此外,由于《中國(guó)圖書(shū)館分類法》所表達(dá)的部分概念在《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》中不再進(jìn)行細(xì)分,其下位類只能選擇包含于的映射關(guān)系類型與《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》中的上位類概念建立映射。如《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》中的QA248-248.7類,包括集合論和算術(shù)基礎(chǔ)等概念,但該類不存在下位類,因此,《中國(guó)圖書(shū)館分類法》中的O144集合論的下位類O144.1基本概念、O144.3公理集合論等類目,均只能以包含于的關(guān)系與其建立映射。
建立包含關(guān)系的類目,大部分是組合類目。如《中國(guó)圖書(shū)館分類法》的三級(jí)類目O1-6數(shù)學(xué)參考工具書(shū)擁有兩個(gè)四級(jí)下位類O1-64數(shù)學(xué)表和O1-8計(jì)算工具,分別與《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》的QA47-59 Tables和QA47-59 Tables建立等同映射關(guān)系;結(jié)合“就近不就遠(yuǎn)”原則,該三級(jí)類目與《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》的QA47-59 Tables和QA47-59 Tables建立包含的映射關(guān)系。除組合類目外,還有概念本身的包含關(guān)系,但無(wú)合適的上位類情況。如CLCO159模糊數(shù)學(xué)就與《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》中最接近的下位類QA248.5 Fuzzy sets建立包含的映射關(guān)系。
建立相關(guān)關(guān)系的類目大部分是表達(dá)概念范圍有交錯(cuò),且無(wú)法在《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》相應(yīng)類的上下位類中找到能建立包含或包含于映射關(guān)系的類目。這種情況大部分是由于《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》的相關(guān)類目是組合類目,且不再進(jìn)行細(xì)分。如《中國(guó)圖書(shū)館分類法》的O123.5軌跡與幾何作圖和《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》的QA464 Practical geometry.Geometrical drawing,兩者的幾何作圖部分是等同映射關(guān)系,但在《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》中該類目不再有下位類,因此只能建立相關(guān)映射關(guān)系。
在進(jìn)行映射的《中國(guó)圖書(shū)館分類法》心理學(xué)領(lǐng)域的72條(含B84心理學(xué))類目中有22條(占比30.6%)類目的映射關(guān)系為等同,39條(占比54.2%)類目的映射關(guān)系為包含于,5條(占比6.9%)類目的映射關(guān)系為包含,6條(占比8.3%)類目的映射關(guān)系為相關(guān)。
等同映射關(guān)系的建立大多集中在三級(jí)類目、四級(jí)類目。心理學(xué)領(lǐng)域包含于映射關(guān)系比例多于數(shù)學(xué)領(lǐng)域,建立包含關(guān)系的類目大部分是組合類目,原因與數(shù)學(xué)領(lǐng)域類似。
建立相關(guān)關(guān)系的類目除組合類目外,還存在其他情況。如《中國(guó)圖書(shū)館分類法》中的三級(jí)類目B84-0心理學(xué)理論與《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》的BF38-64 Theory. Scope. Relations,從語(yǔ)義看,兩者應(yīng)建立包含于關(guān)系,但觀察兩個(gè)類目的下位類會(huì)發(fā)現(xiàn),其概念范圍存在部分交叉,不屬于包含于的關(guān)系,因此,兩個(gè)類目間僅能建立相關(guān)的映射關(guān)系。
在進(jìn)行映射的《中國(guó)圖書(shū)館分類法》教育領(lǐng)域的489條(含G4教育)類目中有66條(約占比13.5%)類目的映射關(guān)系為等同,298條(約占比60.9%)類目的映射關(guān)系為包含于,24條(約占比4.9%)類目的映射關(guān)系為包含,101條(約占比20.7%)類目的映射關(guān)系為相關(guān)。
《中國(guó)圖書(shū)館分類法》教育領(lǐng)域的等同關(guān)系類型比例在三個(gè)領(lǐng)域中最低,說(shuō)明在教育領(lǐng)域能建立等同映射關(guān)系的類目很少。因?yàn)榻逃I(lǐng)域的四級(jí)類目相似度過(guò)高,使每個(gè)三級(jí)類目的下位類結(jié)構(gòu)和概念都有很多重疊部分,這種重疊導(dǎo)致能建立等同映射的四級(jí)類目極少。但在四級(jí)類目概念未重疊的部分,其專指性較高,如《中國(guó)圖書(shū)館分類法》的G432廣播、電視教學(xué)能與《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》中LC6571-6581 Radio and television extension courses. Instruction by radio and television建立等同關(guān)系的映射。
教育領(lǐng)域建立的包含于映射關(guān)系類型比例高于其他兩個(gè)領(lǐng)域(60.9%),這與教育領(lǐng)域復(fù)雜冗余的四級(jí)類目有關(guān)。在多個(gè)三級(jí)類目下出現(xiàn)“思想品德教育”“教學(xué)理論、教學(xué)法”“教學(xué)研究與改革”的四級(jí)下位類。當(dāng)出現(xiàn)類似的概念,均采用“就上不就下”的原則,統(tǒng)一歸入《中國(guó)圖書(shū)館分類法》中上位類所對(duì)應(yīng)的《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》類目中。如果該四級(jí)類目上位類與《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》相應(yīng)類目建立的是等同關(guān)系,則該四級(jí)類與《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》相應(yīng)類目建立包含于關(guān)系;如果該四級(jí)類目的上位類與《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》相應(yīng)類目建立的是相關(guān)關(guān)系,則該四級(jí)類與《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》相應(yīng)類目也建立相關(guān)關(guān)系。建立包含關(guān)系的類目大部分為組合類目,建立相關(guān)關(guān)系的類目主要是《中國(guó)圖書(shū)館分類法》中上位類已經(jīng)與《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》相應(yīng)類目建立相關(guān)關(guān)系。
在教育領(lǐng)域中,值得注意的還有復(fù)分類目的映射?!吨袊?guó)圖書(shū)館分類法》中G51-57各地區(qū)教育事業(yè)依據(jù)地區(qū)復(fù)分表復(fù)分,相對(duì)應(yīng)的,《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》中同樣存在地區(qū)復(fù)分表,只是復(fù)分的具體細(xì)節(jié)和《中國(guó)圖書(shū)館分類法》不一樣。《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》相應(yīng)類目若詳細(xì)列出各地區(qū),則將地區(qū)進(jìn)行對(duì)應(yīng);如果沒(méi)有列出各個(gè)地區(qū),則直接與《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》中的上位類進(jìn)行映射,大多數(shù)建立包含于關(guān)系的映射。
在數(shù)學(xué)、心理學(xué)、教育領(lǐng)域,《中國(guó)圖書(shū)館分類法》與《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》類目映射關(guān)系的建立與分析研究可以提高外文資源批量編目的工作效率,有利于實(shí)現(xiàn)對(duì)全球資源的揭示、組織和共享,為圖書(shū)情報(bào)機(jī)構(gòu)的工作人員、相應(yīng)學(xué)科領(lǐng)域的信息組織者和科研人員提供參考。同時(shí),也可為《中國(guó)圖書(shū)館分類法》的修訂完善提供參考。
本文對(duì)《中國(guó)圖書(shū)館分類法》中數(shù)學(xué)、心理學(xué)、教育3個(gè)領(lǐng)域共799個(gè)類目建立與《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》相應(yīng)類目的映射關(guān)系,其中196條(占比24.5%)類目建立等同映射關(guān)系,423條(占比52.9%)類目建立包含于映射關(guān)系,50條(占比6.3%)類目建立包含關(guān)系,130條(占比16.3%)類目建立相關(guān)映射關(guān)系。
分析類目映射的結(jié)果發(fā)現(xiàn),《中國(guó)圖書(shū)館分類法》與《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》的各級(jí)類目在大部分情況下無(wú)法建立等同關(guān)系映射,只能建立包含或包含于的映射,在某些學(xué)科領(lǐng)域,只能建立起相關(guān)映射。出現(xiàn)這種現(xiàn)象的原因很復(fù)雜,總結(jié)起來(lái)有以下4點(diǎn)。
(1)語(yǔ)言文化背景不同。Lee[23]在研究中表示分類法能有效地展示提出該分類法的主流文化,因而文化背景不同導(dǎo)致分類法差異較大。同時(shí),文化背景不同,導(dǎo)致社會(huì)學(xué)科、人文學(xué)科有大量概念難以對(duì)應(yīng)。
(2)社會(huì)背景差異較大。中國(guó)和美國(guó)在社會(huì)背景、人口構(gòu)成、經(jīng)濟(jì)發(fā)展等方面差異較大,從教育領(lǐng)域看,兩部分類法體現(xiàn)出極大的社會(huì)背景差異性。如《中國(guó)圖書(shū)館分類法》中G473.3學(xué)籍,在《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》沒(méi)有任何相關(guān)概念。
(3)編制原則不同。《中國(guó)圖書(shū)館分類法》在編制過(guò)程中符合科學(xué)性原則,以科學(xué)分類為基礎(chǔ),采取從總到分,從一般到具體的邏輯系統(tǒng),同時(shí)要考慮圖書(shū)資料分類的特點(diǎn);而《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》是根據(jù)美國(guó)國(guó)會(huì)圖書(shū)館藏書(shū)的分類需要進(jìn)行編制,造成兩部分類法在結(jié)構(gòu)和細(xì)分程度上的差異性,從而使映射建立困難。
(4)國(guó)內(nèi)外學(xué)科發(fā)展水平不同。國(guó)內(nèi)外的學(xué)者對(duì)該學(xué)科某些概念的涵蓋范圍認(rèn)知不同,導(dǎo)致編制過(guò)程中類目設(shè)置的差異。如《中國(guó)圖書(shū)館分類法》數(shù)學(xué)領(lǐng)域的三級(jí)類目O22運(yùn)籌學(xué),在《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》中無(wú)法找到相對(duì)應(yīng)的類目。《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》的運(yùn)籌學(xué)類目被歸入T科技總論中,因?yàn)橹忻缹W(xué)者對(duì)運(yùn)籌學(xué)的學(xué)科歸屬理解不同,中國(guó)學(xué)者更傾向于將運(yùn)籌學(xué)歸入數(shù)學(xué)領(lǐng)域,而美國(guó)學(xué)者傾向于將其歸入工程、管理領(lǐng)域。
本文的局限在于進(jìn)行映射的類目有限。在《中國(guó)圖書(shū)館分類法》5大基本部類、22個(gè)一級(jí)大類中,僅各在3個(gè)一級(jí)大類中選取了1個(gè)二級(jí)類目及其下位類進(jìn)行映射,采樣數(shù)量過(guò)少。無(wú)法映射指《中國(guó)圖書(shū)館分類法》中存在,但在《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》中無(wú)法找到等同、包含于、包含或相關(guān)的類目。對(duì)于無(wú)法映射概念,本文采取“就上不就下”的原則,直接與其上位類所對(duì)應(yīng)的《美國(guó)國(guó)會(huì)圖書(shū)館圖書(shū)分類法》類目建立相應(yīng)的映射關(guān)系。這種簡(jiǎn)單的處理方法會(huì)使這種情況與普通的包含于映射關(guān)系混淆,影響對(duì)結(jié)果的解讀。
另外,本研究在方法上仍存在一定不足。雖然人工映射建立在詳細(xì)分析類目語(yǔ)義和概念范圍的基礎(chǔ)上,但一方面由于學(xué)科知識(shí)的專業(yè)性和主觀理解的局限性,有可能使參與映射的人員對(duì)某些類目理解不當(dāng),導(dǎo)致建立錯(cuò)誤的映射關(guān)系;另一方面由于人工映射的工作量較大,而映射關(guān)系的建立是一項(xiàng)綜合性的智力勞動(dòng),在映射過(guò)程中難免出現(xiàn)疏漏。研究的下一步是進(jìn)行實(shí)證檢驗(yàn),即引入自動(dòng)映射作為參考,通過(guò)比對(duì)自動(dòng)映射與人工映射的結(jié)果,以檢驗(yàn)研究成果的準(zhǔn)確性。
[1]HILL L L,BUCHEL O A,JANEE G,et al. Integration of knowledge organization systems into digital library architectures[J].2002,43(7):331-335.
[2]Systems of knowledge organization for digital libraries:beyond traditional authority files[EB/OL].[2017-05-12]. https://www.clir.org/pubs/reports/pub91/#1.
[3]ZENG M L,CHAN L M. Trends and issues in establishing interoperability among knowledge organization systems[J]. Journal of the Association for Information Science and Technology,2004,55(5):377-395.
[4]宋文. 知識(shí)組織體系語(yǔ)義互操作研究[J]. 圖書(shū)館論壇,2012,32(6):117-121.
[5]馬張華. 信息組織:第3版[M]. 北京:清華大學(xué)出版社,2008:137-139.
[6]Library of Congress Classification[EB/OL].[2017-05-12]. http://www.loc.gov/catdir/cpso/lcc.html.
[7]司莉. 知識(shí)組織系統(tǒng)的互操作及其實(shí)現(xiàn)[J]. 現(xiàn)代圖書(shū)情報(bào)技術(shù),2007,2(3):29-34.
[8]Map LC(LCC)to Dewey(DDC)Classification[EB/OL].[2017-05-12]. http://www.questionpoint.org/crs/html/help/zs/ask/ask_map_lcctoddc.html.
[9]黃筱玲. 高校圖書(shū)館文獻(xiàn)分類工作改革的思考——兼談《中圖法》和《科圖法》的兼容[J]. 圖書(shū)館學(xué)研究,2001(4):29-31.
[10]劉曉鵬,真溱,于洋. 基于統(tǒng)計(jì)的知識(shí)組織系統(tǒng)自動(dòng)映射方法研究[J]數(shù)字圖書(shū)館論壇,2009(12):75-78.
[11]VIZINE-GOETZ D,HICKEY C,HOUGHTON A,et al.Vocabulary mapping for terminology services[J/OL]. https://journals.tdl.org/jodi/index.php/jodi/article/view/114/113.
[12]ZINS C,SANTOS P L,CIDA L V A C. Mapping the knowledge covered by library classification systems[J]. Journal of the Association for Information Science and Technology,2011,62(5):877-901.
[13]崔明愛(ài). 圖書(shū)分類法兼容理論問(wèn)題探討[J]. 圖書(shū)館建設(shè),1990(1):32-35.
[14]李珂,宋文. 分類法映射研究[J]. 圖書(shū)館雜志,2014,33(12):49-56.
[15]戴劍波,侯漢清. 圖書(shū)分類法映射系統(tǒng)設(shè)計(jì)原理——以《中國(guó)圖書(shū)館分類法》和《杜威十進(jìn)分類法》為例[J]. 情報(bào)學(xué)報(bào),2005,24(3):299-303.
[16]HEERY R,CARPENTER L,DAY M. Renardus project developments and the wider digital library context[J]. D-Lib Magazine,2001,7(4):1082-9873.
[17]VIZINE-GOETZ D. Popular LCSH with Dewey numbers:subject headings for everyone[J]. Journal of Library Administration,2001,34(3/4):293-300.
[18]賈君枝,郝倩倩. DDC到《中圖法》類目映射方法研究[J]. 中國(guó)圖書(shū)館學(xué)報(bào),2013,39(1):43-50.
[19]賈君枝,郝倩倩. DDC與《中圖法》組合類目映射探討[J]. 中國(guó)圖書(shū)館學(xué)報(bào),2012,38(4):63-70.
[20]Library of Congress Classification PDF Files[EB/OL].[2017-05-12]. http://www.loc.gov/aba/publications/FreeLCC/freelcc.html.
[21]《中國(guó)圖書(shū)館分類法》編委會(huì). 中國(guó)圖書(shū)館分類法(第五版)Web版[EB/OL]. [2017-05-12]. http://clc5.nlc.cn/login.aspx.
[22]趙冬梅. 基于數(shù)學(xué)類目的DDC22與CLC5 映射分析[J]. 圖書(shū)館論壇,2013,33(3):126-130.
[23]LEE W C. Culture and classification:an introduction to thinking about ethical issues of adopting global classification standards to local environments[J]. Knowledge Organization,2015,42(5):302-307.