毛建軍
(河南新鄉(xiāng)學(xué)院,河南新鄉(xiāng)453003)
在中國(guó)古典文獻(xiàn)學(xué)史上,“金石”常常并稱,成為一個(gè)名詞。金指青銅器,石指石刻,因此,以金、石為載體的文獻(xiàn)便統(tǒng)稱為金石文獻(xiàn)。金石文獻(xiàn)包括金文文獻(xiàn)和石刻文獻(xiàn)兩大部分。[1]金石兼具文獻(xiàn)性、文物性、收藏性于一身,是研究中國(guó)古代歷史文化不可多得的珍貴史料。對(duì)金石文獻(xiàn)數(shù)據(jù)庫(kù)資源做調(diào)查分析,既有利于促進(jìn)金石文獻(xiàn)數(shù)字資源的整合,又有利于社會(huì)各界充分利用和挖掘金石文獻(xiàn)信息。
日本收藏有大量的中文古籍。隨著古籍?dāng)?shù)字化進(jìn)程的開展,日本各大圖書館和科研機(jī)構(gòu)也開始將金石文獻(xiàn)數(shù)字化,其中在金石文獻(xiàn)數(shù)據(jù)庫(kù)的開發(fā)與建設(shè)方面,日本京都大學(xué)人文科學(xué)研究所和京都大學(xué)人文科學(xué)研究所最具成就。
京都大學(xué)人文科學(xué)研究所所藏石刻拓本資料[2]由京都大學(xué)人文科學(xué)研究所研制并管理。日本京都大學(xué)人文科學(xué)研究所藏有珍貴中國(guó)典籍,其中尤以甲骨文、金石、漢籍拓本的典藏最為突出。自2001年,京都大學(xué)人文科學(xué)研究所開始“日本所藏中文古籍?dāng)?shù)據(jù)庫(kù)”(包含石刻拓本資料)建設(shè),計(jì)劃分兩個(gè)五年階段實(shí)施。目前數(shù)據(jù)庫(kù)已基本建成,數(shù)據(jù)庫(kù)可提供35個(gè)典藏機(jī)構(gòu)約62萬條記錄的網(wǎng)絡(luò)檢索和閱讀。[3]其中金石文獻(xiàn)數(shù)據(jù)庫(kù)收錄中國(guó)石刻拓片1萬余條,涵蓋時(shí)間為西漢到隋朝。數(shù)據(jù)皆提供選單點(diǎn)選,每筆數(shù)據(jù)呈現(xiàn)黑白影像并附基本說明。京都大學(xué)人文科學(xué)研究所另建有“畫像石與石刻拓本”網(wǎng)站,畫像石資源涵蓋中國(guó)山東、河南、山西、陜西、四川、江蘇等地,石刻拓本檢索范圍為西漢至隋朝??商峁g覽檢索、文字檢索和全文影像閱讀。
明治大學(xué)“唐·五代十國(guó)時(shí)期墓志、墓碑檢索”[4]也很有價(jià)值?!疤啤の宕畤?guó)時(shí)期墓志、墓碑檢索”由明治大學(xué)中國(guó)石刻文物研究會(huì)建置,系統(tǒng)包括《唐代墓志所在總合目錄》、《中國(guó)五代十國(guó)時(shí)期墓志、墓碑綜合目錄稿》以及《西安碑林全集》所載唐代墓志目錄。目前,雖不能閱讀影像,但中國(guó)石刻文物研究會(huì)已經(jīng)計(jì)劃將不斷擴(kuò)充全文數(shù)據(jù)庫(kù)。
目前,港臺(tái)地區(qū)金石文獻(xiàn)全文數(shù)據(jù)庫(kù)已開發(fā)出許多資源,其開發(fā)建設(shè)單位主要為港臺(tái)地區(qū)的研究機(jī)構(gòu)和部分?jǐn)?shù)字公司。其中以香港中文大學(xué)中國(guó)文化研究所古文獻(xiàn)數(shù)據(jù)庫(kù)中心開發(fā)制作的漢達(dá)古籍?dāng)?shù)據(jù)庫(kù)檢索系統(tǒng)——金文數(shù)據(jù)庫(kù)和臺(tái)灣中研院歷史語(yǔ)言研究所開發(fā)制作的殷周金文暨青銅器數(shù)據(jù)庫(kù)最具特色。
漢達(dá)古籍?dāng)?shù)據(jù)庫(kù)檢索系統(tǒng)——金文數(shù)據(jù)庫(kù)[5]由香港中文大學(xué)中國(guó)文化研究所古文獻(xiàn)數(shù)據(jù)庫(kù)中心開發(fā)制作。系統(tǒng)包括甲骨文數(shù)據(jù)庫(kù)、竹簡(jiǎn)帛書數(shù)據(jù)庫(kù)、金文數(shù)據(jù)庫(kù)、先秦兩漢文獻(xiàn)數(shù)據(jù)庫(kù)、魏晉南北朝文獻(xiàn)數(shù)據(jù)庫(kù)以及類書數(shù)據(jù)庫(kù)等。漢達(dá)金文數(shù)據(jù)庫(kù)數(shù)據(jù)主要來源于中國(guó)社會(huì)科學(xué)院考古所編《殷周金文集成釋文》,總計(jì)收錄12,021件銅器,約1萬8千張拓本(包括摹本),約近100萬字器物數(shù)據(jù)說明,另有14萬字隸定釋文。數(shù)據(jù)庫(kù)具有金文銘文和釋文對(duì)照檢索,以及詞串統(tǒng)計(jì)等功能。該數(shù)據(jù)庫(kù)界面清晰,操作簡(jiǎn)單,很受學(xué)界歡迎。不過,由于數(shù)據(jù)庫(kù)不斷擴(kuò)充和升級(jí),該網(wǎng)站時(shí)常不能登陸,甚為遺憾。
殷周金文暨青銅器數(shù)據(jù)庫(kù)[6]由臺(tái)灣“中央研究院”歷史語(yǔ)言研究所開發(fā)制作。數(shù)據(jù)庫(kù)為“中央研究院”史語(yǔ)所金文工作室建置,并與該院地理信息科學(xué)研究專題中心、計(jì)算中心共同合作完成,是目前大型金石文獻(xiàn)數(shù)據(jù)庫(kù)之一。2009年5月數(shù)據(jù)庫(kù)已免費(fèi)開放學(xué)界,使用者只需注冊(cè),便可申請(qǐng)使用。該數(shù)據(jù)庫(kù)可以通過器號(hào)、器名、銅器時(shí)代等多重字段進(jìn)行復(fù)合檢索,查詢結(jié)果包含銅器數(shù)據(jù)與銘文數(shù)據(jù),并有數(shù)字影像可供瀏覽。殷周金文暨青銅器數(shù)據(jù)庫(kù)界面以歷史地貌圖為背景,直觀地展示出青銅器出土的具體地點(diǎn)及其地貌情況,為學(xué)者進(jìn)行金石文獻(xiàn)研究提供了極大便利。
金石拓片數(shù)據(jù)庫(kù)[7]由臺(tái)灣“國(guó)家圖書館”建置。金石拓片數(shù)據(jù)庫(kù)為臺(tái)灣“國(guó)家圖書館”館藏金石拓片數(shù)字化成果網(wǎng)站。臺(tái)灣“國(guó)家圖書館”現(xiàn)藏金石拓片6,462件,12,462幅。金文部分,以鐘鼎彝器為大宗,旁及度量衡器、兵器、鏡鑒等,時(shí)代起自殷商以迄漢世。石刻部分以碑志為多,兩漢刻石文字,有篆有隸,碑碣、摩崖、題記、殘石。另有唐人碑志超過千種。數(shù)據(jù)庫(kù)可選擇題名、類型、版本、序跋等多項(xiàng)字段查詢,每筆詳目結(jié)果有書號(hào)、主要題名、版本等近20項(xiàng)。[8]不過,由于該館限制局域網(wǎng)使用瀏覽數(shù)字化影像功能,給讀者造成很大不便。
其它港臺(tái)地區(qū)金石文獻(xiàn)全文數(shù)據(jù)庫(kù)見下表:
名稱 建設(shè)單位 簡(jiǎn)要說明簡(jiǎn)帛金石數(shù)據(jù)庫(kù) 臺(tái)灣“中央研究院”歷史語(yǔ)言研究所收錄簡(jiǎn)帛金石研究資料共3,401,684字。系統(tǒng)支持布爾運(yùn)算、多項(xiàng)目查詢、詞組查詢、排除字符及自然語(yǔ)言查詢。先秦金文簡(jiǎn)牘詞匯數(shù)據(jù)庫(kù)臺(tái)灣中央研究院歷史語(yǔ)言研究所分為金文和簡(jiǎn)牘兩個(gè)子數(shù)據(jù)庫(kù)。金文詞匯數(shù)據(jù)庫(kù)包括:詞匯庫(kù)查詢、詞匯庫(kù)索引以及詞匯庫(kù)管理。詞匯庫(kù)查詢可以自行輸入關(guān)鍵詞或以《殷周金文集成》青銅器器號(hào)進(jìn)行檢索。青銅器拓片數(shù)據(jù)庫(kù)臺(tái)灣中央研究院歷史語(yǔ)言研究所傅斯年圖書館收錄傅圖館藏共計(jì)1萬余件青銅器拓片圖像及資料。關(guān)鍵詞查詢。查詢結(jié)果依序呈現(xiàn)縮圖、登錄號(hào)、器號(hào)、器名、原器時(shí)代、原拓書名、銘文釋文等信息資料。漢代石刻畫像數(shù)據(jù)庫(kù)臺(tái)灣中央研究院歷史語(yǔ)言研究所傅斯年圖書館收錄傅圖館藏漢代石刻畫象拓本圖像約1,500余件。提供功能、地名及主題簡(jiǎn)易查詢。提供影像比對(duì)查詢功能,并可作放大、縮小、平移、旋轉(zhuǎn)等操作。遼金元拓片數(shù)據(jù)庫(kù)臺(tái)灣中央研究院歷史語(yǔ)言研究所傅斯年圖書館收錄傅圖館藏遼金元拓片約2000幅圖像資料。提供登錄號(hào)、品名、作者、語(yǔ)種、年代、主題、釋文、題跋、印記、著錄、刻立地點(diǎn)檢索途徑。故宮所藏西周金文 臺(tái)灣故宮博物院 普及型展覽類數(shù)據(jù)庫(kù),欄目包括文字的故事、存續(xù)與應(yīng)用、銘文話西周、金文逍遙游。關(guān)鍵詞檢索。
中國(guó)大陸地區(qū)參與金石文獻(xiàn)數(shù)據(jù)庫(kù)開發(fā)建設(shè)的單位主要為公共圖書館、科研機(jī)構(gòu)以及數(shù)字化出版企業(yè)。公共圖書館金石文獻(xiàn)數(shù)據(jù)庫(kù)的建設(shè)以中國(guó)國(guó)家圖書館開發(fā)制作的“碑帖菁華”石刻拓片資源庫(kù)為代表??蒲袡C(jī)構(gòu)金石文獻(xiàn)數(shù)據(jù)庫(kù)的建設(shè)以華東師范大學(xué)中國(guó)文字研究與應(yīng)用中心開發(fā)研制的“商周金文檢索系統(tǒng)”最有特色。企業(yè)研制的以《中國(guó)歷代石刻史料匯編》全文檢索數(shù)據(jù)庫(kù)影響力最大。
“碑帖菁華”石刻拓片資源庫(kù)[9]由中國(guó)國(guó)家圖書館開發(fā)制作,為該館所藏石刻拓片數(shù)字化后建成的公益型數(shù)據(jù)庫(kù)。中國(guó)國(guó)家圖書館收藏的石刻拓片計(jì)30,000多種、23萬余件?!氨既A”石刻拓片資源庫(kù)即掃描拓片原件而制成,目前已完成29,000余幅拓片,影像30,000余幅。資源庫(kù)的著錄包括拓片題名、其他題名、責(zé)任者、年代、地點(diǎn)、拓片原物狀況、附刻、拓片版本、拓片特征、數(shù)目與尺寸、題跋印記、文種、拓片內(nèi)含書目索引、關(guān)聯(lián)關(guān)系、館藏信息、圖片信息等項(xiàng)。資源庫(kù)內(nèi)容以刻立石年月排序,可以提供單一字段的簡(jiǎn)單檢索、多條件限定組合的高級(jí)檢索和元數(shù)據(jù)內(nèi)容關(guān)聯(lián)檢索等查詢方式?!氨既A”收錄的中國(guó)古代石刻拓片雖然占到了總品種的三分之二,其它石刻拓片則分藏在全國(guó)各地圖書館,而且很多圖書館所藏的石刻拓片都沒有整理編目。中文拓片項(xiàng)目設(shè)立之初就因?yàn)椤熬幠空砘A(chǔ)較差,合作建庫(kù)難度很大”。[10]因此,雖然基礎(chǔ)較好的國(guó)家圖書館與北京大學(xué)圖書館密切配合,雙方自建的資源庫(kù)在客觀上形成了互補(bǔ),但能夠檢索全國(guó)各主要圖書館石刻拓片的“中文石刻拓片資源庫(kù)”還只是處在理想階段。
華東師范大學(xué)中國(guó)文字研究與應(yīng)用中心研制的“商周金文檢索系統(tǒng)”[11]最具學(xué)術(shù)價(jià)值和探索意義。為順應(yīng)中國(guó)文字?jǐn)?shù)字化發(fā)展趨勢(shì),華東師范大學(xué)中國(guó)文字研究與應(yīng)用中心構(gòu)筑了規(guī)模龐大的中國(guó)古文字?jǐn)?shù)字資源,主要包括商周金文檢索、戰(zhàn)國(guó)楚文字檢索、花園莊東地甲骨檢索、《金文文獻(xiàn)集成》電子檢索等數(shù)據(jù)庫(kù)系統(tǒng)?!吧讨芙鹞臋z索系統(tǒng)”包含金文字庫(kù)和金文數(shù)據(jù)庫(kù)兩部分。金文字庫(kù)收字完整,對(duì)應(yīng)迄今已發(fā)表的青銅器銘文,包括楷體字6,194個(gè)、金文原形字14,249個(gè)和金文偏旁539個(gè)?!敖鹞臄?shù)據(jù)庫(kù)”收錄了迄今已發(fā)表的青銅器銘文13,320篇,總字?jǐn)?shù)124,800字,可以按器名、時(shí)代、國(guó)別、字?jǐn)?shù)、出土,流傳、現(xiàn)藏等多種路徑進(jìn)行檢索,也可以實(shí)現(xiàn)銘文字、詞、語(yǔ)段的全文檢索。需要指出的是,使用該系統(tǒng)時(shí),需安裝該中心研發(fā)的金文字庫(kù)軟件,用戶頗覺繁瑣。另外,此字庫(kù)搜索類別按“字頭”,較為單一,若可以按詞搜索似乎更好。
《中國(guó)歷代石刻史料匯編》全文檢索數(shù)據(jù)庫(kù)是目前使用面最寬,影響力最大的金石數(shù)據(jù)庫(kù)。數(shù)據(jù)庫(kù)由北京書同文數(shù)字化技術(shù)有限公司開發(fā)研制,分單機(jī)版和網(wǎng)絡(luò)版兩種。數(shù)據(jù)庫(kù)可進(jìn)行全文和分類檢索,并提供有字典、年代換算工具軟件?!吨袊?guó)歷代石刻史料匯編》全文檢索版雖然給研究者提供了極大的學(xué)術(shù)研究?jī)r(jià)值和檢索便利,但仍然存在很多可以改善的空間,如數(shù)據(jù)庫(kù)不能直接提供朝代、書名及著者檢索,給初學(xué)者帶來很大不便;書目秩序無標(biāo)準(zhǔn)規(guī)律,刊刻于不同時(shí)代的石刻零散放在不同位置,夾雜相間、紊亂不整;系統(tǒng)檢索結(jié)果的碑文名后有年代顯示,但是如讀者按年代檢索,系統(tǒng)得出的結(jié)果并不準(zhǔn)確,而且命中不高;系統(tǒng)無法全屏顯示及放大,給視力不是很好的讀者帶來阻礙。
陜西省考古研究所和西安大東國(guó)際數(shù)據(jù)有限公司共同合作開發(fā)的《金文字庫(kù)及金文資料全文檢索系統(tǒng)》也很有特色?!督鹞淖謳?kù)及金文資料全文檢索系統(tǒng)》是全國(guó)文物、博物館、系統(tǒng)人文社會(huì)科學(xué)重點(diǎn)研究課題。該系統(tǒng)金文資料收錄自宋代以來傳世和出土的高周時(shí)期青銅器上的金文資料約12,000件,包括:青銅器影像11,000幅,相關(guān)的簡(jiǎn)介文字約120萬字;銘文拓文12000幅,釋文180萬字。令人遺憾的是,《金文字庫(kù)及金文資料全文檢索系統(tǒng)》軟件迄今未見正式出版或網(wǎng)絡(luò)授權(quán)使用。
北京愛如生數(shù)字化技術(shù)研究中心研發(fā)的《中國(guó)金石庫(kù)》收錄上古至民國(guó)初年歷代金石文獻(xiàn),其中金石拓片10萬件,金石志書1千種。每種(件)各據(jù)善本(原件)詳加訂釋,制成數(shù)字全文,附以高度清晰的原版影像和可以360度旋轉(zhuǎn)觀察的原件影像。總計(jì)全文超過3億字,影像超過100萬頁(yè),數(shù)據(jù)總量約100G,同時(shí)配備強(qiáng)大的檢索系統(tǒng)和完備的功能平臺(tái)。可從分類檢索、條目檢索、全文檢索、高級(jí)檢索4條路徑進(jìn)行檢索,可運(yùn)用圖文對(duì)照、標(biāo)點(diǎn)批注、分類收集、下載保存、原文打印等10個(gè)輔助功能。
其它大陸地區(qū)金石文獻(xiàn)全文數(shù)據(jù)庫(kù)見下表:
名稱 建設(shè)單位 簡(jiǎn)要說明金石拓片特藏 北京大學(xué)圖書館該館藏有中國(guó)歷代金石拓片計(jì)2萬余種,目前已精選出其中100件,年代從商代到民國(guó),掃描制成影像文件。使用者可檢索拓片的題名、年代、出土地點(diǎn)以及全文內(nèi)容,也可以直接點(diǎn)選各項(xiàng)拓本,觀賞拓片之影像。北京記憶——《燕都金石》 首都圖書館“北京記憶”是以近百年館藏為依托的北京歷史文化資源性網(wǎng)站。欄目包括《北京文匯》、《舊京圖典》、《燕都金石》、《京城輿圖》等。以金石拓片為主的《燕都金石》收錄大量北京地區(qū)摩崖題字和刻石圖像數(shù)據(jù)。中國(guó)漢代畫像石磚數(shù)據(jù)庫(kù)徐州師范大學(xué)圖書館中國(guó)漢代畫像石磚數(shù)據(jù)庫(kù)分別建立了圖像資料數(shù)據(jù)庫(kù)、期刊論文資料庫(kù)、圖書著作數(shù)據(jù)庫(kù)、漢文化資料索引庫(kù)等子庫(kù)。圖像資料數(shù)據(jù)庫(kù)收錄中國(guó)漢代畫像石磚的圖像資料,并附簡(jiǎn)要說明。國(guó)學(xué)精品圖庫(kù)書法篇北京國(guó)學(xué)時(shí)代文化傳播有限公司收錄青銅器銘文174幅、碑刻石雕43幅及壁畫、書影等18種藝術(shù)代表作品千余幅,圖片清晰??扇臋z索,復(fù)制、打印,并附有聯(lián)機(jī)字典、歷代帝王紀(jì)年表等多種工具。出土文獻(xiàn)庫(kù) 北京時(shí)代瀚堂科技公司數(shù)據(jù)庫(kù)含甲骨文、金文、簡(jiǎn)帛、印章、錢幣和石刻等分庫(kù)。金文分庫(kù)以《殷周金文集成引得釋文》為基礎(chǔ)建置,涵蓋所有青銅器銘文數(shù)據(jù),圖文對(duì)照。
金石文獻(xiàn)數(shù)字化是對(duì)已存文獻(xiàn)的再現(xiàn)和加工,是21世紀(jì)金石文獻(xiàn)整理和研究的發(fā)展方向。盡管金石文獻(xiàn)全文數(shù)據(jù)庫(kù)的建設(shè)已經(jīng)取得了相當(dāng)大的成績(jī),但還存在一些值得思考的問題。一是資源重復(fù)建設(shè)問題。由于目前還沒有一個(gè)統(tǒng)一的組織和機(jī)構(gòu)去管理和協(xié)調(diào)金石文獻(xiàn)數(shù)據(jù)庫(kù)的建設(shè),國(guó)內(nèi)外重復(fù)開發(fā)和建設(shè)了大量金石文獻(xiàn)數(shù)字化資源。這種重復(fù)開發(fā)不僅造成資金的浪費(fèi),而且也增加了讀者利用上的困難。二是數(shù)據(jù)庫(kù)兼容問題。金石文獻(xiàn)全文數(shù)據(jù)庫(kù)的建設(shè)至今還沒有一個(gè)統(tǒng)一的數(shù)據(jù)庫(kù)著錄和運(yùn)行系統(tǒng)標(biāo)準(zhǔn)。三是資源共享問題。金石文獻(xiàn)全文數(shù)據(jù)庫(kù)的利用在資源共享上還存在資源封閉和利益保護(hù)的弊端,給讀者帶來了諸多不便。需要指出的是,目前金石文獻(xiàn)全文數(shù)據(jù)庫(kù)的建設(shè)最迫切的任務(wù)是做好資源整合工作。
〔1〕 趙子夫,高月起.金石文獻(xiàn)小考[J].河南圖書館學(xué)刊,2007(2):129-131
〔2〕 京都大學(xué)人文科學(xué)研究所所藏石刻拓本資料.[EB/OL].http://kanji.zinbun.kyoto-u.ac.jp/db-machine/imgsrv/takuhon/.[2013-01-29]
〔3〕 毛建軍.日本中文古籍?dāng)?shù)字資源的建設(shè)[J].圖書館建設(shè),2009(3):33-35
〔4〕 明治大學(xué)“唐·五代十國(guó)時(shí)期墓志、墓碑檢索”.[EB/OL].http://www.meiji.ac.jp/sha_ken/.[2013-01-29]
〔5〕 漢達(dá)古籍?dāng)?shù)據(jù)庫(kù)檢索系統(tǒng)—金文數(shù)據(jù)庫(kù).[EB/OL].http://www.chant.org/info/default_jinwen.asp.[2013-01-29]
〔6〕 歷史語(yǔ)言研究所殷周金文暨青銅器數(shù)據(jù)庫(kù).[EB/OL].http://db1.sinica.edu.tw/~ textdb/rubbing/query.php4.[2013-01-29]
〔7〕 臺(tái)灣“國(guó)家圖書館”金石拓片數(shù)據(jù)庫(kù).[EB/OL].http://rarebook.ncl.edu.tw/gold/.[2013-01-29]
〔8〕 漢學(xué)研究中心編.國(guó)際漢學(xué)研究數(shù)字資源選介[M].臺(tái)北:漢學(xué)研究中心出版社,2010:87
〔9〕 中國(guó)國(guó)家圖書館“碑帖菁華”.[EB/OL].http://mylib.nlc.gov.cn/web/guest/beitiejinghua.[2013-01-29]
〔10〕 張志清,冀亞平.中文石刻拓片資源庫(kù)建設(shè)[J].新世紀(jì)圖書館,2005(1):14-17
〔11〕 華東師范大學(xué)中國(guó)文字研究與應(yīng)用中心“商周金文檢索系統(tǒng)”.[EB/OL].http://www.wenzi.cn/pages/jwyd.asp.[2013-01-29]