龍向洋(復(fù)旦大學(xué)圖書(shū)館研究館員)
報(bào)告中涉及到的數(shù)據(jù)采集依據(jù)主要是芝加哥大學(xué)東亞圖書(shū)館周元館長(zhǎng)2005年發(fā)表在《大學(xué)圖書(shū)館學(xué)報(bào)》的《美國(guó)大學(xué)中的東亞圖書(shū)館》一文中提到的11家圖書(shū)館,圍繞這11家圖書(shū)館進(jìn)行了數(shù)據(jù)調(diào)查。
民國(guó)文獻(xiàn)資料主要有紙質(zhì)的文獻(xiàn)、縮微資料以及近年來(lái)的電子圖書(shū)等類(lèi)型,數(shù)量基數(shù)很大。2008年,我到哈佛大學(xué)燕京圖書(shū)館進(jìn)行為期一年的訪學(xué)。此前,對(duì)國(guó)內(nèi)主要大學(xué)的民國(guó)文獻(xiàn)、民國(guó)時(shí)期總書(shū)目12萬(wàn)條數(shù)據(jù)和香港地區(qū)的3萬(wàn)條數(shù)據(jù)進(jìn)行了收集,共積累三十四五萬(wàn)條數(shù)據(jù)。我的工作就是從這三十幾萬(wàn)數(shù)據(jù)與在美國(guó)采集到的數(shù)據(jù)進(jìn)行對(duì)比整理開(kāi)始。
2009年我先后到芝加哥大學(xué)、加州大學(xué)洛杉磯分校、加州大學(xué)伯克利分校和斯坦福大學(xué)的幾家圖書(shū)館,對(duì)這些館的民國(guó)文獻(xiàn)進(jìn)行了考察和收集。2013年,受哥倫比亞大學(xué)東亞圖書(shū)館館長(zhǎng)之邀到哥大訪學(xué)期間,把普林斯頓和耶魯大學(xué)的民國(guó)文獻(xiàn)也做了采集。通過(guò)對(duì)這八家大學(xué)圖書(shū)館民國(guó)文獻(xiàn)數(shù)據(jù)的收集,大致知道主要的東亞館有哪些資料。遺憾的是,密歇根大學(xué),康奈爾大學(xué)和華盛頓大學(xué)的民國(guó)文獻(xiàn)一直沒(méi)有機(jī)會(huì)去采集。
基于這樣一個(gè)數(shù)據(jù)采集的基礎(chǔ),進(jìn)行了書(shū)目數(shù)據(jù)整理:1)在整理范圍上,僅對(duì)紙本圖書(shū)進(jìn)行統(tǒng)計(jì),不包括1949年以后影印本、微縮資料、電子圖書(shū)和報(bào)刊資料;2)在整理方式上主要以數(shù)據(jù)庫(kù)的方式來(lái)做。保留原始數(shù)據(jù)的路徑、原始數(shù)據(jù)采集的形態(tài),并保持所有過(guò)程的完整性和連貫性,這樣便于發(fā)現(xiàn)在整理過(guò)程中發(fā)生的一些誤差;3)在文字上做了規(guī)范,采用字頻統(tǒng)計(jì)的方式,對(duì)所有14萬(wàn)條數(shù)據(jù)進(jìn)行文字規(guī)范的整理,仍然采用繁體字;4)在分類(lèi)上做了兼容,東亞圖書(shū)館主要采用哈佛燕京圖書(shū)館分類(lèi)法,但其實(shí)哈佛燕京圖書(shū)館民國(guó)文獻(xiàn)也只有三分之二的圖書(shū)采用哈佛燕京圖書(shū)館分類(lèi)法。因此對(duì)所采集的八家館的民國(guó)文獻(xiàn)進(jìn)行了統(tǒng)一的分類(lèi)處理,同時(shí)將中圖分類(lèi)法和哈佛燕京分類(lèi)法映射,使同一本書(shū)既有哈佛燕京的分類(lèi),也有中圖分類(lèi)法的分類(lèi);5)在做關(guān)聯(lián)映射的過(guò)程中涉及到數(shù)據(jù)比較;6)基于這些基礎(chǔ)性整理進(jìn)行目錄編纂。
從學(xué)科分類(lèi)來(lái)看(以哈佛燕京圖書(shū)館的分類(lèi)法來(lái)進(jìn)行統(tǒng)計(jì)),總錄書(shū)志類(lèi)、語(yǔ)言文學(xué)類(lèi)、社會(huì)科學(xué)類(lèi)中的歷史學(xué)科這三大類(lèi)別在東亞館的收藏非常多。這些類(lèi)目的二級(jí)類(lèi)目中,中國(guó)文學(xué)、史地、政法、經(jīng)濟(jì)、社會(huì)這些門(mén)類(lèi)有相當(dāng)豐富的收藏。其中我特別注意到民國(guó)方面軍事類(lèi)著作有很多,而在國(guó)內(nèi)很少見(jiàn)到。另外書(shū)目資料收集的特別多,也就是說(shuō)北美東亞館在收集中國(guó)文獻(xiàn),尤其是在工具書(shū)的目錄資料方面是特別注重的。
八家館的民國(guó)圖書(shū)按照年代來(lái)進(jìn)行統(tǒng)計(jì),有幾個(gè)地方值得注意:抗戰(zhàn)時(shí)期的文獻(xiàn)資料非常多也很有特色。這些資料當(dāng)時(shí)從延安到美國(guó)再到斯坦福大學(xué)東亞圖書(shū)館,有詳細(xì)書(shū)目來(lái)源記載,這部分資料值得我們關(guān)注。
從出版地看,上海是民國(guó)時(shí)期重要的出版地。民國(guó)總書(shū)目中有60~70%的書(shū)在上海出版。東亞館的收藏也不例外,大部分是出版于上海的。除上海外,重慶、南京、北京、香港也是主要的出版地,此外,廣州出版的資料在東亞館的收藏中是比較特有的,如南亞的資料收藏比較突出。通過(guò)東亞館民國(guó)文獻(xiàn)資料與香港地區(qū)、北大圖書(shū)館的收藏進(jìn)行對(duì)比,這個(gè)特征非常明顯。從出版機(jī)構(gòu)來(lái)看,商務(wù)印書(shū)館、中華書(shū)局和正中書(shū)局這幾家大的機(jī)構(gòu)的出版物是東亞館收藏的主要部分。值得注意的是,一些團(tuán)體、組織的史料甚至稿本和一些小冊(cè)子類(lèi)的資料也非常多。
在做民國(guó)文獻(xiàn)的搶救保護(hù)的時(shí)候,作為大學(xué)圖書(shū)館,從藏書(shū)發(fā)展的角度,首先關(guān)注的是民國(guó)時(shí)期重要的學(xué)者和人物以及他們著作的情況。所以我們做了一個(gè)比較有規(guī)模的民國(guó)時(shí)期人物資料數(shù)據(jù)庫(kù),2006年時(shí)該數(shù)據(jù)庫(kù)條目已達(dá)10萬(wàn)條。我們將這個(gè)數(shù)據(jù)庫(kù)跟民國(guó)時(shí)期的書(shū)目資料進(jìn)行關(guān)聯(lián),其中袁同禮編的《中國(guó)留美同學(xué)博士論文目錄》是一個(gè)非常重要的資料。
通過(guò)關(guān)聯(lián)統(tǒng)計(jì),可以從目錄學(xué)的角度來(lái)討論近代獲得歐美國(guó)家博士學(xué)位的人物所發(fā)表的中文著作及其后來(lái)的勘驗(yàn)情況,以及對(duì)中國(guó)學(xué)術(shù)產(chǎn)生的影響。因此,我們將《中國(guó)留美同學(xué)博士論文目錄》《中國(guó)留英同學(xué)博士論文目錄》和《中國(guó)留歐大陸各國(guó)博士論文目錄》共計(jì)4000多個(gè)人物的資料,跟美國(guó)東亞館的14萬(wàn)條民國(guó)文獻(xiàn)進(jìn)行關(guān)聯(lián)統(tǒng)計(jì),發(fā)現(xiàn)胡適在1917年獲得哥倫比亞大學(xué)博士。東亞館里關(guān)于胡適的資料最多,還有馬寅初、馮友蘭、趙元任等人的資料。
另外一個(gè)關(guān)聯(lián)統(tǒng)計(jì)是胡建國(guó)先生的《近代華人生卒簡(jiǎn)歷表》,這是研究民國(guó)文獻(xiàn)的一個(gè)很重要的一個(gè)工具數(shù)據(jù)。該書(shū)收集了1.5萬(wàn)個(gè)近代人物的詳細(xì)生卒年表。將這份年表與東亞館的14萬(wàn)條數(shù)據(jù)進(jìn)行關(guān)聯(lián)統(tǒng)計(jì),其中關(guān)于蔣介石和毛澤東這兩位民國(guó)時(shí)期最重要的政治人物的著作情況很有特點(diǎn),斯坦福大學(xué)收藏的蔣介石的圖書(shū)資料在東亞館中最多。
一方面,將東亞館的14萬(wàn)數(shù)據(jù)跟《民國(guó)時(shí)期總書(shū)目》收藏的12萬(wàn)條數(shù)據(jù)進(jìn)行比較,發(fā)現(xiàn)沒(méi)有被收錄的非常多。由此引出的問(wèn)題是,當(dāng)時(shí)遺漏的,現(xiàn)在重編總目時(shí)是否放進(jìn)去?哪些應(yīng)該放進(jìn)去?線裝書(shū)籍、手稿等文獻(xiàn)是否要放進(jìn)去?這個(gè)是值得思考的問(wèn)題。同時(shí),把當(dāng)時(shí) CADAL(大學(xué)數(shù)字圖書(shū)館國(guó)際合作計(jì)劃)40萬(wàn)冊(cè)民國(guó)文獻(xiàn)(其中圖書(shū)近十萬(wàn)冊(cè))與北美東亞館藏進(jìn)行了比較。對(duì)于我們沒(méi)有的這一部分我們?nèi)绾翁幚??哪些東西可以去數(shù)字化?是不是稀見(jiàn)的就去數(shù)字化?也是值得思考的問(wèn)題。在民國(guó)文獻(xiàn)的數(shù)字化建設(shè)方面,如何推動(dòng)國(guó)際合作,也值得我們深思。
最后是希望通過(guò)這樣的整理編一個(gè)聯(lián)合目錄。我們采用先做聯(lián)合整理,把所有的目錄放在一個(gè)數(shù)據(jù)庫(kù)中,對(duì)所有的文字進(jìn)行規(guī)范化處理,找到之間的差異,再一家一家來(lái)做的方式。最終在編纂的目錄中可以看到,書(shū)目標(biāo)注了八家東亞館的館藏地、在民國(guó)總書(shū)目中的位置、在CADAL中是否已經(jīng)被數(shù)字化。同時(shí)也標(biāo)注了該書(shū)目國(guó)內(nèi)圖書(shū)館的收藏情況。