劉莉 王姝
摘 要 論文介紹了民國圖書文獻的開發(fā)整理現(xiàn)狀,進一步分析了當前民國文獻整理研究中存在的問題,并提出了通過制定著錄標準、收藏單位聯(lián)合系統(tǒng)整理民國文獻、編制專題索引、搭建智能檢索平臺等進行深度開發(fā)研究的方法。
關(guān)鍵詞 民國文獻 文獻整理 文獻開發(fā)
分類號G257
A Systematic Organization and In-depth Development Research on Literatures of the Republic of China
Liu Li, Wang Shu
Abstract This paper introduces the current status of the development and organization of literatures of the Republic of China. It further analyzes the problems in the current organization and researches of literatures of the Republic of China and presents methods of to enacting record standards, systematically organizing literatures of the Republic of China with the collection entities, enacting subject indexes and building intelligent retrieval platforms.
Keywords Literatures of the Republic of China. Literature arrangement. Literature development.
引言
近年來,民國文獻的開發(fā)和整理越來越受到重視,民國文獻收藏單位開始民國文獻整理出版,編制聯(lián)合目錄,開發(fā)數(shù)字化全文,各種關(guān)于民國文獻的數(shù)據(jù)庫也應(yīng)運而生,為民國史各學科的研究提供了豐富的數(shù)據(jù)支持。但是由于整理工作各自為政,整理的標準不統(tǒng)一,深度不夠,看似繁榮的整理工作經(jīng)費投入不少,實際效果卻不理想。很多研究者仍然無法簡單高效地找到全面、正確的民國文獻相關(guān)資料。因此如何整合各方力量,有效地開展整理工作,為研究者提供更好的資源服務(wù),值得思考和研究。
1 民國文獻整理現(xiàn)狀分析
民國文獻包括圖書、期刊、報紙、檔案、圖片、政府出版物等類型,本文將著重討論圖書的整理情況。
1.1民國文獻聯(lián)合目錄
1949年以來,全國文獻存藏機構(gòu)編制的民國文獻聯(lián)合目錄共計16種,圖書書目僅為3種,其中《民國時期總書目》由北京圖書館編輯,由書目文獻出版社于1986年-1997年陸續(xù)出版。它主要以國家圖書館、上海圖書館、重慶圖書館的館藏為基礎(chǔ)編撰,主要收錄了民國時期(1911年至1949年9月間)中國出版的中文圖書124000余種,基本反映了民國時期出版的圖書全貌,是收入圖書書目數(shù)量最多,也是最具權(quán)威的民國圖書聯(lián)合書目。另外兩種圖書書目《解放區(qū)根據(jù)地圖書書目》以及《抗日戰(zhàn)爭時期出版圖書聯(lián)合目錄》為專題聯(lián)合圖書書目[1]。
1.2 民國文獻數(shù)據(jù)庫
民國文獻由于分布廣、紙張酸化嚴重等問題,導致用戶在查閱時諸多不便,因此民國文獻數(shù)據(jù)庫是現(xiàn)代民國文獻保護的重要手段。一些數(shù)據(jù)出版公司也重點開發(fā)了民國文獻數(shù)據(jù)庫,如尚品大成的“大成故紙堆”,收錄民國圖書4萬多種;《民國文獻大全數(shù)據(jù)庫》由北京時代瀚堂科技有限公司整合提供民國圖書逾13萬冊;《維庫民國電子資源數(shù)據(jù)庫》目前推出131229種全文影像資源,其中圖書文獻近8萬種;《典海民國圖書資源平臺》收錄民國年間出版的各類圖書10萬余種。這些數(shù)據(jù)庫重視用戶體驗,在功能檢索方面能提供較好的體驗[2],但只對付費用戶開放。
與此同時,各大公共圖書館紛紛將本館的民國文獻進行數(shù)字化,建立本館的民國文獻數(shù)據(jù)庫。國家圖書館策劃了“民國時期文獻保護計劃”項目,聯(lián)合國內(nèi)文獻收藏單位制作了《民國圖書數(shù)據(jù)庫》,其中國家圖書館所藏占到全國民國文獻的大部分,以官方文件、內(nèi)部資料等珍稀文獻為特色,分為三期建設(shè),每期收錄民國圖書5萬種。截止到目前為止,民國時期文獻聯(lián)合目錄已匯聚書目數(shù)據(jù)30余萬條,超過《民國時期總書目》著錄的12萬種[3]。重慶圖書館于2013年建成“重慶中國抗戰(zhàn)大后方歷史文獻中心”,全面收集抗戰(zhàn)文獻,目前已形成紙質(zhì)文獻、縮微文獻、圖書期刊數(shù)據(jù)庫、3D數(shù)字圖書館等為一體的全方位抗戰(zhàn)文獻中心[4]。上海圖書館建有《民國圖書數(shù)據(jù)庫》,收錄1911年-1949年間出版的各類中文圖書,收錄內(nèi)容為圖書全文影像,種類齊全,數(shù)據(jù)庫以《民國總書目》為依據(jù),收錄圖書15萬種[5]。
這些整理工作的完成為開展民國相關(guān)學科和專業(yè)研究工作打下了很好的基礎(chǔ),但在實際使用這些資源時也發(fā)現(xiàn)一些問題:由于加工深度不夠以及技術(shù)上的限制,研究資料的查全率不高,還有部分館藏書目不對外開放,導致無法查詢等。
2 民國圖書整理工作存在的問題
2.1 《民國時期總書目》
《民國時期總書目》是回溯性國家書目,全書按《中文普通圖書統(tǒng)一著錄條例》著錄,按《中國圖書館圖書分類法》分類編排,共計17卷21冊約12萬種,基本反映了民國時期出版的圖書全貌[6],其收錄的書目多數(shù)都有內(nèi)容提要。盡管如此,《民國時期總書目》由于其所在年代的歷史原因,也存在一些遺憾。
2.1.1書目整理不全面
《民國時期總書目》根據(jù)國家圖書館、上海圖書館、重慶圖書館的藏書收錄,少量補充其他圖書館的館藏目錄,對于有目無書者未能收錄,線裝書、國內(nèi)出版的外文書、少數(shù)民族文字圖書也未收錄。由于當時人力物力的限制,難免有所遺漏,并不能全面的反應(yīng)全國民國圖書的收錄情況,例如南京圖書館的前身是國民黨的中央圖書館和江蘇省國學圖書館。解放后,這兩個館的藏書除少部分運往臺灣外,大部分保留了下來,同時許多政府機關(guān)、團體及中央政治學校所存文獻也存放在南京圖書館[7]。此外,總書目主要以公共圖書館的館藏目錄為主,而民國圖書在各地的檔案館、博物館、研究機構(gòu)、外事機構(gòu)以及收藏者中也有一定數(shù)量和規(guī)模的藏書并未收錄與此。
2.1.2書目信息不完整
由于民國時期處于中國歷史的變革期,不僅與現(xiàn)代圖書在出版、印刷、裝幀等方面有著巨大的差異,即便是民國初期圖書與民國后期圖書相比,不同時間、不同區(qū)域的書籍也存在著巨大的差異,再加上當時沒有統(tǒng)一的出版格式和出版標準,作為總書目的數(shù)據(jù)制作人員只能如實記錄,從而導致書目信息不完整。此外,由于處在戰(zhàn)亂時期,信息交流的不通暢也可能導致同一種書的作者、出版年代、發(fā)行者、印刷者等項目出現(xiàn)誤差。再加上當時的印刷、儲存條件有限,很多書籍會出現(xiàn)缺頁、損毀現(xiàn)象,也導致著錄的書目信息不完整。
2.1.3索引編制單一
《民國時期總書目》按《中文普通圖書統(tǒng)一著錄條例》著錄,按《中國圖書館圖書分類法》分類編排,各分冊附書名音序索引和筆劃檢索表。整個書目共計12萬條,在進行書目檢索時,只能通過書名對書目進行檢索,要求檢索者了解書籍的詳細題名,按題目拼音或者筆畫進行檢索。如果通過分類進行查找,則需要在所選分類中進行逐條查找,這樣也大大降低了使用效率。在編制時,如能加入要目索引、作者索引,相信能節(jié)省檢索時間,方便讀者。
《民國時期總書目》自出版之日起至今也有三十余年,歲月變遷,隨著民國圖書收藏館的搬遷、合并、整理,現(xiàn)有的民國圖書收藏館和館藏地也發(fā)生了巨大的變化。筆者在使用過程中發(fā)現(xiàn),大量的書目信息在對應(yīng)館藏地的網(wǎng)上數(shù)字檢索系統(tǒng)中并未檢索到,通過電話調(diào)查,有些圖書在搬遷過程中或已遺失,有些圖書或因存放不當已經(jīng)損毀?!睹駠鴷r期總書目》亟需重新進行編纂。
2.2 民國時期文獻聯(lián)合目錄
民國時期文獻聯(lián)合目錄現(xiàn)有數(shù)據(jù)30多萬條,由14個成員館的近50萬條館藏數(shù)據(jù)進行查重后匯集到該平臺發(fā)布,為相關(guān)研究人員提供了很大的便利,但是在使用時也存在一些問題。
2.2.1系統(tǒng)檢索效率低
民國時期文獻聯(lián)合目錄提供簡單檢索和高級檢索。簡單檢索可以通過題名、責任者、出版年代等選項進行檢索。當通過明確的圖書信息進行檢索時,平臺能夠以較快的速度響應(yīng),并給出檢索結(jié)果,但是擴大檢索范圍時,搜索結(jié)果反而減少。以檢索詞“?!焙汀氨<住蓖ㄟ^題名進行檢索為例,搜索結(jié)果同樣都為237條。這種情況的出現(xiàn)說明該平臺在檢索功能的開發(fā)和設(shè)計上并沒有能夠讓平臺內(nèi)部的數(shù)據(jù)信息得到充分的挖掘,檢索數(shù)據(jù)的使用效率也受到了影響,降低了系統(tǒng)的魯棒性。
2.2.2文獻著錄項目標準不一
在具體使用民國時期文獻聯(lián)合目錄的過程中,由于聯(lián)合目錄的數(shù)據(jù)是由不同成員館進行加工提交的,往往會存在各館之間信息交流不夠通暢,導致各成員館對同一本書的著錄標準不一。例如,張恨水在1943年出版的《丹鳳街》,有的記錄是在題名項中注明“原名:負販列傳”,有的則是在一般性附注項中注明“原名:負販列傳”。不同于其他時代的古籍圖書,民國圖書數(shù)據(jù)信息比較復雜,再者如出版地項,就會出現(xiàn)印刷地、發(fā)行地等特殊信息,這些都需要各成員館之間有一個統(tǒng)一的著錄標準,如果著錄標準不統(tǒng)一,就會導致系統(tǒng)數(shù)據(jù)重復,影響使用效果。
2.2.3缺乏必要信息
現(xiàn)有的聯(lián)合目錄中能查詢到的數(shù)據(jù)都是由各個成員館提交并匯總的,館藏地一項代表此條數(shù)據(jù)在對應(yīng)的成員館有紙本書目,便于研究人員進行查找,但是筆者發(fā)現(xiàn)有一些記錄沒有館藏地項,也就意味此條書目的館藏或已不存在,不存在的原因不得而知,如果能在詳細信息中注明此條記錄的信息來源,相信會更加有利于讀者進行查詢。
3 民國文獻目錄整理思路
3.1編制一部完整的民國文獻聯(lián)合目錄
由國家圖書館牽頭,聯(lián)合各級各類收藏單位乃至個人收藏家,系統(tǒng)收集整理,厘清家底,編制一個能反映民國時期珍稀文獻的精品目錄為社會公眾和學術(shù)研究服務(wù),意義非常重大。
目前已面世的民國時期總書目和當前由國家圖書館主持的民國時期文獻目錄系統(tǒng)已投入使用,有著很好的應(yīng)用前景,但也存在不少問題,我們希望在此基礎(chǔ)上有進一步的提高,為此提出如下設(shè)想:
3.1.1擴大聯(lián)合目錄的收藏館范圍
目前國圖主持的聯(lián)合目錄僅限國家文化系統(tǒng)的公共圖書館,建議加入全國教育系統(tǒng)的高校圖書館。國內(nèi)北京大學等多所高校圖書館均有民國文獻收藏,臺灣地區(qū)和國外大學圖書館也有較多的收藏,如哈佛大學燕京圖書館、哥倫比亞大學東亞圖書館等,還有全國檔案館系統(tǒng)、研究院所的資料室等。在當前國家重視民國文獻整理開發(fā)的形勢下,建議由國家圖書館館牽頭,從縣、市、省、國家分四級,從縣級開始逐層開展文獻調(diào)查和整理工作,統(tǒng)一標準開展人員培訓。此項工作同時也在高校系統(tǒng)和檔案館系統(tǒng)開展,并鼓勵個人收藏者參與。他們多年來在舊書市場以及個人手中收購交換的民國文獻很有特色,個別文獻的專題性、系統(tǒng)性、獨特性甚至超越了圖書館、檔案館。
3.1.2加大聯(lián)合目錄的開發(fā)深度
現(xiàn)有標準下的民國文獻目錄比較簡單,在查找民國文獻時造成很高的漏檢率,因此建議圖書目錄應(yīng)詳細著錄文獻篇章節(jié)各級目次和內(nèi)容摘要、 關(guān)鍵詞等。同時應(yīng)增加特征項目的描述,對每種民國文獻的收藏機構(gòu)、文獻品相都應(yīng)有明確的著錄。有一些特征細節(jié)在沒有主要著錄字段的情況下有辨別圖書、區(qū)別版本的作用,這些特征往往存在于文獻的內(nèi)容之中,需在著錄時加以注意,使民國文獻目錄不僅擁有揭示館藏,保存文化的功能,更兼有實用性,在提高檢索效率,開展學術(shù)研究方面發(fā)揮更大的作用。
3.1.3制定統(tǒng)一和兼容的民國書目著錄標準
現(xiàn)有的印刷本民國書目和收藏館的在線目錄均存在著錄項目不全的問題,造成不全的原因既可能是文獻本身不完整,也可能是民國時期圖書出版的標準與現(xiàn)在的不一致,導致很難分辨不同收藏館的藏書是否是同一種書,還是不同版本。如果一味強調(diào)按照現(xiàn)行的國家標準著錄,民國圖書將進一步面臨著著錄不全問題和使用方面的困難。所以必須制定一個統(tǒng)一的著錄標準,便于不同收藏館目錄的整合和對接。
例如,民國《出版法》規(guī)定的發(fā)行人即主辦出版品之人,是發(fā)行所的代表人和直接責任人,發(fā)行所即相當于現(xiàn)在的“出版者”,承擔著出版兼發(fā)行兩種職能,發(fā)行人即相當于現(xiàn)在的“出版者”的代表人[8]。民國時期的圖書,個人出版發(fā)行的情況很多,這類民國書的版權(quán)頁一般只列有發(fā)行者個人,且發(fā)行者與該書的編著者多為同一人[8]。民國文獻封面、題名頁、版權(quán)頁缺損較多,在著錄標準規(guī)定的頁上無法找到著錄信息的,可在序、前言、后記中找出作者、出版地、出版時間等。此外,還應(yīng)留意封底的出版標記,在民國時期,上海知名出版機構(gòu)所出版的書籍的封底大多印有自己的出版標記,不要僅以不詳簡單著錄。
在民國文獻中還有一類較為常見的是單位的工作報告,沒有記載出版者、發(fā)行者、發(fā)行所任何一項。這類工作報告盡管沒有明確記載出版發(fā)行者的信息,但因其通常由本單位編寫,介紹本單位的工作概況、且一般作為內(nèi)部刊物不對外發(fā)行,將編輯單位作為出版者著錄比著錄為出版者不詳對讀者來說更有檢索意義[8]。
目前國家館的民國時期文獻保護辦公室制定了《民國圖書聯(lián)合目錄數(shù)據(jù)暫行標準》,這個標準可進一步完善,加強推廣力度,使民國文獻的整理在一個統(tǒng)一的標準下開展,便于今后的合作交流,更方便用戶的使用。
3.3 以服務(wù)學科研究為目標編制專題書目和索引
目前的民國文獻數(shù)據(jù)庫由于標引深度不夠加上全文是圖像版,存在某一主題資料查找不全的情況。其次,歷史文獻 (包括史料文獻和研究文獻)是多種類型并存和交織的。例如史料文獻,有普通印刷本、影印本、記錄影像和縮微膠片等文獻類型;研究文獻,除普通印刷本外,還有專題片、訪談 (包括電視訪談和網(wǎng)站訪談)、博客、電子文檔等多種媒體形式。這些豐富的記錄和表現(xiàn)形式有利于人們從多角度認識歷史,但目前尚未有一個民國文獻數(shù)據(jù)庫能夠多文獻類型揭示某一主題文獻[9]。對于民國史相關(guān)領(lǐng)域的研究人員來說,專題目錄的編制非常必要。專題目錄可充分利用現(xiàn)有的民國文獻聯(lián)合書目和民國文獻數(shù)據(jù)庫,在此基礎(chǔ)上進行拓展深入,在選題方面要體現(xiàn)館藏特色和學科需求,并圍繞這一特色收集相對完整的文獻資源。
3.4 以民國文獻智能檢索平臺的開發(fā)和建設(shè)為未來發(fā)展目標
民國文獻整理的趨勢是數(shù)字化,在新技術(shù)背景下,民國文獻目錄已經(jīng)從簡單的匯集過渡到對文獻的深度挖掘,目錄數(shù)據(jù)庫和擁有電子全文的民國文獻數(shù)據(jù)庫建設(shè)成為文獻整理的主要方式。
在數(shù)據(jù)庫的建設(shè)過程中,應(yīng)注意提高收藏館在線目錄的質(zhì)量以及開放共享的程度,改變目前部分館和收藏單位書目不共享的現(xiàn)狀,方便用戶就近使用和免費獲取。
其次,應(yīng)加強指導,減少無序開發(fā)和低層次開發(fā)。隨著民國文獻重視程度的加強,當前民國文獻數(shù)據(jù)庫也層出不窮,同質(zhì)化現(xiàn)象比較嚴重,相互交叉重復單又不完整,這樣既造成浪費,又沒有實現(xiàn)完整揭示的目標,并且數(shù)據(jù)庫價格較高,對于個人用戶和小單位來說無法支付。建議加強民國文獻開發(fā)的控制和合作,降低開發(fā)成本,提供更大范圍的使用。
此外,建設(shè)具有以下功能的智能化檢索平臺,提高用戶體驗質(zhì)量水平。
(1)全文檢索功能。目前許多民國文獻數(shù)據(jù)庫處于文本僅有圖像格式文件,只能瀏覽而無法實現(xiàn)全文檢索的狀態(tài),加上標引深度不夠,數(shù)據(jù)漏檢現(xiàn)象比較嚴重。新的智能平臺不再是簡單的書目或文本的數(shù)字化,而是保存文獻信息源的影像資料,同時轉(zhuǎn)化成能夠被計算機網(wǎng)絡(luò)所處理數(shù)字化的符號,對所有的文獻實現(xiàn)全文檢索。數(shù)據(jù)庫能夠提供原版圖片格式和文字識別后的對照版本,供用戶查考。
(2)自動斷句和自動標引。海量數(shù)據(jù)單靠人工整理耗時耗力,系統(tǒng)在實現(xiàn)全文數(shù)字化的基礎(chǔ)上,對于民國早期文獻自動斷句添加標點,方便用戶閱讀,同時實現(xiàn)自動提取和編制刊名、篇名、主題詞、摘要、學科分類、出版時間、出版單位、作者等較為全面的檢索點,使史料實現(xiàn)數(shù)據(jù)化管理。
(3)自動編撰功能。對于收集整理的海量數(shù)據(jù),單靠人力無法按需進行專題整理,讓計算機模擬人腦從大量史料文本中判斷、選擇出與編纂主題相關(guān)的資料,實現(xiàn)專題資料的自動編纂工作。
(4)建成開放式公共交流平臺。該平臺不僅能夠?qū)崿F(xiàn)文獻的數(shù)字化智能整理,還為專家學者提供查詢檢索、校核比勘以及數(shù)據(jù)統(tǒng)計分析等信息處理功能服務(wù),同時開展學術(shù)交流互動,成為兼有文獻查詢、學術(shù)研究、普及教育、讀者互動功能的知識服務(wù)平臺。
民國文獻的應(yīng)用需求越來越多,文獻整理工作需要加快步伐,科學有序地開發(fā)整理,為研究工作創(chuàng)造更好的條件。
參考文獻
[1]蔡迎春, 段曉林. 民國文獻目錄編制沿革及其趨勢[J]. 圖書館論壇, 2017(8): 119-124.
[2]段曉林. 民國文獻數(shù)據(jù)庫開發(fā)現(xiàn)狀研究[J]. 圖書館學研究, 2016(20): 42-45.
[3]民國圖書數(shù)據(jù)庫[EB/OL].[2018-03-23].http://www.lib.sjtu.edu.cn/index.php?m=content&c;=index&a;=show&catid;=223&id;=1475.
[4]重慶圖書館.民國文獻[EB/OL].[2018-03-23].http://www.cqlib.cn/?q=-literature.
[5]上海圖書館資源導航庫[EB/OL].[2018-04-06].http://db.idoc.sh.cn/.
[6]民國時期總書目[EB/OL].[2018-04-13].https://baike.baidu.com/item/%E6%B0%91%E5%9B%BD%E6%97%B6%E6%9C%9F%E6%80%BB%E4%B9%A6%E7%9B%AE/9109114?fr=aladdin.
[7]南京圖書館[EB/OL].[2018-04-13].http://www.jslib.org.cn/.
[8]李麗芳, 宋晶晶. 民國圖書出版發(fā)行信息的CNMARC格式著錄[J]. 國家圖書館學刊, 2013(5): 74-77.
[9]楊樹. 網(wǎng)絡(luò)環(huán)境下編制專題史目的意義和方法:編纂《近十年辛亥革命史料和研究文獻書目索引》的探索[J]. 圖書情報論壇, 2012(3): 38-40.
劉莉 江蘇警官學院圖書館館長、民國警察史料研究中心副主任、研究館員。江蘇南京,210031。
王姝 江蘇警官學院圖書館讀者服務(wù)部副主任、館員。江蘇南京,210031。
(收稿日期:2018-06-25 編校:陳安琪)