樊虹燕 應飛
摘 要:古籍是歷史文化的載體,從某種意義上說,其屬于文物,需要對其進行相關的保護。文章以古籍書目數(shù)據(jù)庫為主要調(diào)查對象,對數(shù)據(jù)庫建設中存在的目錄格式、分類法選擇等問題進行探究,并提出相應的建議以供大家參考。
關鍵詞:估計數(shù)目;數(shù)據(jù)庫;問題
華夏歷史傳承數(shù)千年,在歲月長河中流傳下數(shù)不勝數(shù)的古籍,這些古籍是我國的文化遺產(chǎn),是珍貴的、有代表性的歷史文物,更是當今各大圖書館珍藏體系中必不可少的重要部分。當今社會科技發(fā)達,如何利用科技對文化遺產(chǎn)進行深入的剖析與利用,實現(xiàn)資源共享,是古籍界關心的頭等大事。我國多個圖書館已開展了古籍數(shù)據(jù)庫的建立,但相關經(jīng)驗不充足,有諸多問題需要得到改進完善。
1 古籍書目數(shù)據(jù)庫的意義
以機讀目錄格式的相關特點為參考建立了統(tǒng)一的古籍書目數(shù)據(jù)庫,這個數(shù)據(jù)庫依賴于網(wǎng)絡,并以網(wǎng)絡系統(tǒng)的形式為用戶提供古籍數(shù)據(jù)資源的相關搜索,成為人們檢索書籍的大型目錄數(shù)據(jù)庫。古籍具有豐富的歷史、文學和學術價值,其重要性是不言而喻的。對于古籍數(shù)據(jù)庫的保護,我國還沒有完善的保護措施,而是和眾多國家一樣以《著作權法》來進行保護。從《著作權法》里的相關內(nèi)容可知,匯編若干作品,不構(gòu)成作品的數(shù)據(jù)庫或者其他材料,保持內(nèi)容的獨有特色,成為人們所熟知的匯編作品,其作品的專屬權也歸匯編者所有,但不能侵犯原作品的著作權。
圖書館特色古籍數(shù)據(jù)庫的建設主要涉及古籍書目數(shù)據(jù)庫、古籍文摘數(shù)據(jù)庫、古籍全文數(shù)據(jù)庫。古籍書目數(shù)據(jù)庫是結(jié)合作品外部信息,方便讀者對其檢索與利用,對內(nèi)容進行選擇編排都是參考MARC統(tǒng)一標準進行的,保持與其他古籍數(shù)據(jù)庫形式的相似性。從數(shù)據(jù)制作格式來看,書目數(shù)據(jù)庫可以分為兩部分:一種是圖像格式,根據(jù)內(nèi)容掃描PDF圖像文本;另一種是元數(shù)據(jù)格式,就是將文獻文本輸入并導入數(shù)據(jù)庫中,形成能供閱讀與檢索的數(shù)據(jù)庫機讀格式。這兩種格式的數(shù)據(jù)庫容量都十分充足,提供了較為原始的檢索方式。但這兩種數(shù)據(jù)庫的運用無法真正展現(xiàn)出數(shù)據(jù)庫該有的優(yōu)勢特征,基本不受《著作權法》的保護。
2 古籍書目數(shù)據(jù)庫存在的問題
2.1 機讀目錄格式不統(tǒng)一
隨著時代的發(fā)展,運用先進的科技對古籍進行編目整理,由于相關技術的淺薄,我國這方面技術仍處于起步階段。20世紀90年代初,南京圖書館最先建立書目數(shù)據(jù)庫,對讀者檢索書目起到重大幫助,隨后書目數(shù)據(jù)庫被廣泛傳播,很快就遍及全國。但時至今日,機讀目錄格式還是沒有完全統(tǒng)一,而是在CNMARC的基礎上進行優(yōu)化,并沒有實質(zhì)性的解決方式。CNMARC研發(fā)之初是以現(xiàn)代文獻為主要實踐對象,古籍文字的特點、形態(tài)、編排、裝幀等都與現(xiàn)代文獻截然不同,字段與子字段尚不能完全加以揭示。再加上各大圖書館的古籍管理制度、書籍不盡相同,所以古籍機讀目錄格式無法實現(xiàn)真正統(tǒng)一,書目數(shù)據(jù)不能識別古籍文獻或者錯誤識別,這些都造成了資源不能共享。
2.2 分類法的多樣化
由于古籍自身的特點,我國對古籍的分類沒有真正可行的管理措施,導致古籍分類方法一直無法得到真正的統(tǒng)一。相關人士對圖書館進行調(diào)查后發(fā)現(xiàn),各圖書館對古籍的分類各不相同,各自都有其自己的方法。因為至今沒有統(tǒng)一的古籍分類管理法,所以我國圖書館的古籍分類五花八門,呈現(xiàn)多樣化,對開展古籍相關工作十分不利。但調(diào)查又發(fā)現(xiàn),多數(shù)圖書館參考傳統(tǒng)的古籍分類法,名氣越高、規(guī)模越大的圖書館對古籍分類就越講究,會根據(jù)古籍的特性與時代,采用多種分類歸納法。多種分類法在圖書館的應用十分普遍,但因為管理的多樣化,以及日常的分類中會為工作人員帶來不便,古籍書目數(shù)據(jù)庫的建設受到影響,得不到顯著發(fā)展。
2.3 著錄用字問題
根據(jù)古籍的專屬特征和國家對古籍的相關規(guī)定,在建立古籍機讀目錄時必須使用原著的字體,只有這樣才能反映原書的真正內(nèi)容。古代文獻的特點就是有不同時期的文字,大量的生僻字至今都無法理解其含義,沒有相關的文字解說,所以至今都沒有超大字庫能完全識別古書中的文字,計算機也無法將古文字進行信息識別。時代的久遠與多樣性造就了古籍中的繁體字、簡體字、新型字,十分復雜多變,現(xiàn)如今也無法真正解決這樣的問題。很多圖書館在處理這樣的問題時采取的方法是替代,一些難以分析的字符只能推測其意,用其他字符來替代,這樣的方式無疑會違反我國對古籍的相關規(guī)定,破壞了原書的原則。如今運用最廣的大字庫編輯軟件Word也不能滿足古籍書目數(shù)據(jù)庫的需求。還是因為古籍的特殊性,它們的字庫過小,沒有兼容性,更不能互補。繁簡字的轉(zhuǎn)換實際是一對一的,無法解決繁簡字的多樣轉(zhuǎn)換方式,如果將繁體字簡化了,在編錄數(shù)據(jù)時就會出現(xiàn)輸入差誤。
3 古籍書目數(shù)據(jù)庫應對措施
3.1 建立統(tǒng)一的機讀目錄格式
從我國圖書館管理的發(fā)展趨勢來看,統(tǒng)一的機讀目錄格式能讓古籍書目數(shù)據(jù)庫得到規(guī)范,不再是種類繁多的分類管理方式。沒有相對目錄的規(guī)范性,古籍書目數(shù)據(jù)庫的內(nèi)容就無法進行交換與共享。國際圖聯(lián)開發(fā)的UNIMARC是世界各國圖書館通用的機讀目錄格式,各國在借鑒UNIMARC的基礎上進行本國相關管理的修訂。我國研發(fā)的CNMAARC是我國專屬的、唯一的機讀目錄標準格式,它適用于我國與其他國家的信息交換,為書目數(shù)據(jù)庫的建立提供參照與依據(jù)。但我國唯一機讀目錄標準格式CNMAARC并不適用于古籍圖書,因為它是以現(xiàn)代文獻為主要實踐對象研發(fā)的。為了讓古籍機讀目錄數(shù)據(jù)更為方便地錄入,我國撰寫了《漢語文古籍機讀目錄格式使用手冊》。但是,我國沒有真正統(tǒng)一古籍機讀目錄格式,所以其方式還是存在問題。
經(jīng)過相關組織的探討,以CNMAARC的特點為基本,結(jié)合《古籍著錄規(guī)則》,為實現(xiàn)古籍機讀目錄格式統(tǒng)一進行了不斷的研究,為了實現(xiàn)它應有的資源共享的效果,統(tǒng)一古籍計算機編目的相關標準,讓計算機與古籍的信息共享,推出了“古籍機讀目錄格式”。
3.2 著錄規(guī)則
古籍的特點是多樣化的,文字形態(tài)的多樣、意義的多樣,華夏五千年的歷史賦予了其豐富的內(nèi)涵。書目數(shù)據(jù)信息員要以數(shù)據(jù)庫的規(guī)范性為基準,針對古籍的特點,保留其固有的特點,進行嚴格且詳細的編目工作,編目中必須保持規(guī)范性,按照國家古籍法規(guī)《古籍著錄規(guī)則》的標準進行著錄。著錄是為了更好地適應計算機相關工作,要嚴格按照《中國文獻編目規(guī)則》的標準進行著錄?!吨袊墨I編目規(guī)則》是以ISBD和中國文獻著錄標準為標準,是為了更好與國際文獻工作相統(tǒng)一,中國文獻語言就是以此為中心進行編錄的,其意義就是符合操作的實際需求,對內(nèi)容增加新的元素。
3.3 分類法
古籍書目數(shù)據(jù)庫的合理分類一直是古籍界不斷研究的核心問題,國內(nèi)尚未實現(xiàn)古籍分類的統(tǒng)一。各圖書館的分類方式五花八門,甚至很多館采用多樣分類法,如“四庫法”“人大法”“中圖法”“東北法”等。其中“四庫法”使用最多,而且很多博物館在原有的基礎上進行了改進。在全封閉的管理下,多樣的方法也不會存在太大問題,但在真正實行時,會因為沒有統(tǒng)一的方法而無法進行正常的交流與檢索。人們爭論的無非是采用哪種分類法,用“四庫法”的很多,用“人大法”的也有,各有各的好處,要合理地采用不同的分類法。在古籍分類時可以提前在計算機編目中運用兩種分類法進行,這樣能測試出哪種方式更適合這種數(shù)據(jù),避免了手工編目改變分類號將導致目錄和排架全局變動的狀況。
分類法對圖書館工作人員的意義重大,便于對數(shù)據(jù)的管理及排架。其中,“四庫法”能最大化發(fā)揮古籍的應有特點,可以從古籍固有的特征中演化出符合計算機存儲管理的特性。因為古籍隱晦難懂,所以對其分類的檢索手段十分匱乏。要想迅速找到、搜索到相似的書籍,就需要把待搜索書籍的相關內(nèi)容進行統(tǒng)計,對書籍進行更規(guī)范的分類管理,進而推進古籍的分類統(tǒng)一。
4 結(jié)語
隨著社會的不斷發(fā)展,古籍數(shù)據(jù)庫的管理措施也逐漸完善,古籍界的專家學者應積極探索中國古籍數(shù)據(jù)庫應用的理論與實踐,盡可能統(tǒng)一圖書數(shù)據(jù)庫,可以借鑒他國的豐富經(jīng)驗,建好古籍書目數(shù)據(jù)庫,為國家的發(fā)展、為歷史的探討做出貢獻。
參考文獻
[1]白林林.中文古籍書目數(shù)據(jù)的關聯(lián)數(shù)據(jù)化研究[D].太原:山西大學,2016.
[2]漆勝蘭.中醫(yī)養(yǎng)生古籍書目數(shù)據(jù)庫的建設與研究[D].合肥:安徽中醫(yī)藥大學,2015.
[3]顏運梅.眾包在國內(nèi)古籍數(shù)據(jù)庫建設中的應用研究[J].圖書館研究,2016(5):30-34.
[4]趙江龍,趙江燕.圖書館特色古籍數(shù)據(jù)庫建設的著作權研究[J].內(nèi)蒙古科技與經(jīng)濟,2015(13):143-144.