喬紅霞 李晉元
摘 要:古籍?dāng)?shù)字化是當(dāng)代保護(hù)和傳承古籍的時(shí)代特征。進(jìn)行古籍?dāng)?shù)字圖書館建設(shè),使古籍在紙質(zhì)載體得到保護(hù)的同時(shí),通過(guò)數(shù)字加工成為數(shù)字古籍,得以數(shù)字古籍的形式網(wǎng)絡(luò)再生。文章構(gòu)思了省域各古籍收藏單位共建古籍?dāng)?shù)字圖書館的工作模式,以海南省古籍資源為例,分析了古籍?dāng)?shù)字化工作流程中古籍元數(shù)據(jù)描述、對(duì)象數(shù)據(jù)采集、管理數(shù)據(jù)的命名等標(biāo)準(zhǔn)運(yùn)用問(wèn)題,以期為聯(lián)合共建古籍?dāng)?shù)字圖書館提供參考。
關(guān)鍵詞:古籍?dāng)?shù)字化;數(shù)字圖書館;標(biāo)準(zhǔn)化;海南省
中圖分類號(hào):G250.7? ?文獻(xiàn)標(biāo)識(shí)碼:A? ?文章編號(hào):1003-1588(2023)04-0128-07
古籍?dāng)?shù)字化是運(yùn)用信息處理技術(shù)將古籍原本文獻(xiàn)轉(zhuǎn)化為計(jì)算機(jī)可識(shí)別和處理的數(shù)字信息的過(guò)程,即從利用和保護(hù)古籍的目的出發(fā),采用計(jì)算機(jī)技術(shù),將古籍和其承載的知識(shí)信息轉(zhuǎn)化為能被計(jì)算機(jī)識(shí)別的數(shù)字符號(hào),從而制成古籍電子索引、古籍書目數(shù)據(jù)庫(kù)和古籍全文數(shù)據(jù)庫(kù),用以呈現(xiàn)古籍文獻(xiàn)信息資源的一項(xiàng)系統(tǒng)工作[1]。它是當(dāng)代在計(jì)算機(jī)技術(shù)、信息處理技術(shù)、網(wǎng)絡(luò)傳輸技術(shù)廣泛應(yīng)用的形勢(shì)下,保護(hù)古籍的重要方法,也是當(dāng)代區(qū)別于我國(guó)歷史上任何一次保護(hù)古籍行動(dòng)的時(shí)代特征。歷史上,我國(guó)古代文獻(xiàn)保護(hù)和傳承經(jīng)歷過(guò)甲骨、金石、簡(jiǎn)冊(cè)、寫本、刻本、抄本、石印、鉛印等載體形式的變化,隨著每次文字載體的變更,作為中華文明載體的古籍,其保護(hù)和傳承形式也隨之變更,如:春秋時(shí)孔子保護(hù)古籍是簡(jiǎn)冊(cè)、東漢保護(hù)古籍是刻石、宋代用的是雕版印刷、明代《永樂(lè)大典》和清代《四庫(kù)全書》用的是抄寫、近現(xiàn)代用的石印和鉛印等,在一次次傳承形式更替的過(guò)程中,中華文明得以綿延賡續(xù)。
我國(guó)自1984年臺(tái)灣地區(qū)“中央研究院”歷史語(yǔ)言研究所首先運(yùn)用計(jì)算機(jī)技術(shù)實(shí)施“史籍自動(dòng)化系統(tǒng)”以來(lái),中文古籍和計(jì)算機(jī)逐漸融合,出現(xiàn)過(guò)單機(jī)版、網(wǎng)絡(luò)版古籍?dāng)?shù)據(jù)庫(kù),古籍?dāng)?shù)據(jù)庫(kù)類型有書目數(shù)據(jù)庫(kù)、圖片數(shù)據(jù)庫(kù)、全文數(shù)據(jù)庫(kù)等形式。2007年“中華古籍保護(hù)計(jì)劃”實(shí)施后,古籍?dāng)?shù)字化建設(shè)與開(kāi)放共享走上了快車道,全國(guó)累計(jì)發(fā)布古籍及特藏文獻(xiàn)影像資源達(dá)13萬(wàn)部,國(guó)家圖書館建設(shè)的“中華古籍資源庫(kù)”通過(guò)全彩影像數(shù)字化和縮微膠卷轉(zhuǎn)化影像方式,目前已在線發(fā)布古籍?dāng)?shù)字資源約10.2萬(wàn)部(件),先后7次聯(lián)合39家單位發(fā)布數(shù)字古籍2.8萬(wàn)部,其中有明清版刻、稿抄本古籍、碑帖拓本等,實(shí)現(xiàn)了古籍資源統(tǒng)一入口檢索、讀者免登錄訪問(wèn),平臺(tái)智能推薦、多種瀏覽器兼容,為廣大讀者和學(xué)者利用古籍提供了極大便利。古籍?dāng)?shù)字化平衡了古籍的文物屬性與文獻(xiàn)屬性,實(shí)現(xiàn)了古籍保護(hù)與利用的和諧統(tǒng)一[2]。
2022年4月,中共中央辦公廳、國(guó)務(wù)院辦公廳印發(fā)了《關(guān)于推進(jìn)新時(shí)代古籍工作的意見(jiàn)》(以下簡(jiǎn)稱《意見(jiàn)》),再次強(qiáng)調(diào)推進(jìn)古籍?dāng)?shù)字化,加強(qiáng)古籍?dāng)?shù)字化資源管理和開(kāi)放共享。我國(guó)古籍現(xiàn)存數(shù)量約20萬(wàn)種[3],截至2021年年底,全國(guó)古籍保護(hù)工作座談會(huì)發(fā)布全國(guó)漢文古籍普查完成270余萬(wàn)部[4]??梢?jiàn)古籍?dāng)?shù)字化工作任重而道遠(yuǎn)。
1 海南省古籍?dāng)?shù)字化的資源現(xiàn)狀和建設(shè)內(nèi)容
海南省歷史上曾經(jīng)出現(xiàn)過(guò)豐富的古籍收藏,因天氣溽熱、臺(tái)風(fēng)頻繁、蚊蟲叢聚、瓊北地震等自然因素,以及孤懸海外、社會(huì)動(dòng)蕩等歷史原因,曾經(jīng)見(jiàn)于記載的古籍收藏,省內(nèi)十不存一,僅存的古籍屬吉光片羽,十分珍貴。目前,海南省參加普查的14家古籍收藏單位和個(gè)人普查登記古籍約2,240部、23,931冊(cè)。全省古籍普查中發(fā)現(xiàn)了瓊臺(tái)書院藏書、蘇泉書院藏書(即海南第一樓藏書)、王國(guó)憲藏書、樂(lè)嗣炳專藏等大宗文獻(xiàn)遺存,內(nèi)容覆蓋經(jīng)、史、子、集、叢(含新學(xué))五大部類,版本以漢文刻本為主,有刻本、稿本、抄本、活字本、套印本、石印本、鉛印本等類型。海南省有三部古籍入選《國(guó)家珍貴古籍名錄》:海南師范大學(xué)圖書館藏明徐氏東雅堂刻本《昌黎先生集》入選《第二批國(guó)家珍貴古籍名錄》、海南省民族博物館藏明黃氏集義書堂刻本《大廣益會(huì)玉篇》、明復(fù)古齋刻本《詩(shī)法》(樂(lè)嗣炳跋)入選《第六批國(guó)家珍貴古籍名錄》。海南省圖書館、??趫D書館、文昌市圖書館、海南師范大學(xué)圖書館、海南大學(xué)圖書館收藏的54部古籍入選《第一批海南省珍貴古籍名錄》[5]。海南古籍語(yǔ)言文字專題特色突出,善本古籍品位可觀,普通古籍亦可見(jiàn)證海南歷史發(fā)展,有重要的文獻(xiàn)價(jià)值和文物價(jià)值,因此基于保護(hù)和傳承的理念,建設(shè)全省古籍?dāng)?shù)字圖書館建設(shè)十分必要且迫在眉睫,主要有三項(xiàng)內(nèi)容:一是應(yīng)用古籍普查登記目錄成果,編寫古籍編目元數(shù)據(jù),建成古籍書目數(shù)據(jù)庫(kù)。二是保護(hù)現(xiàn)存海南古籍,進(jìn)行古籍圖像數(shù)字化加工,實(shí)現(xiàn)省內(nèi)古籍?dāng)?shù)字化母本收藏地存儲(chǔ),全省統(tǒng)一備份,并將發(fā)布版上傳至省古籍?dāng)?shù)字圖書館平臺(tái)網(wǎng)絡(luò)發(fā)布。三是采集現(xiàn)存古籍資源(包括影印古籍)[6],進(jìn)行線下古籍采訪,線上數(shù)字專題古籍收集,尤其是海南地方古籍,經(jīng)省古籍?dāng)?shù)字圖書館平臺(tái)整合,實(shí)現(xiàn)地方古籍和特色專題古籍的數(shù)字版網(wǎng)絡(luò)回歸。
2 古籍?dāng)?shù)字圖書館是智慧圖書館建設(shè)的基礎(chǔ)
古籍?dāng)?shù)字圖書館多數(shù)是以古籍書目數(shù)據(jù)庫(kù)+數(shù)字古籍圖像庫(kù)為資源、以檢索瀏覽為主要服務(wù)形式的模式。近年來(lái),我國(guó)開(kāi)始了古籍智慧化的探索,應(yīng)用OCR掃描、AI識(shí)別、自動(dòng)標(biāo)點(diǎn)等技術(shù)建設(shè)古籍全文數(shù)據(jù)庫(kù),進(jìn)行信息整合挖掘,建設(shè)知識(shí)圖譜,實(shí)現(xiàn)古籍智能化整理。影響較大的是由字節(jié)跳動(dòng)與北京大學(xué)數(shù)字人文實(shí)驗(yàn)室、國(guó)家圖書館聯(lián)合推出的古籍?dāng)?shù)字化閱讀平臺(tái)“識(shí)典古籍”[7],由四川大學(xué)、阿里巴巴集團(tuán)公益基金會(huì)、美國(guó)加州大學(xué)伯克利分校聯(lián)合發(fā)起的“漢典重光”海外古籍?dāng)?shù)字化回歸與研究整理平臺(tái)[8]。對(duì)于圖書館等古籍收藏單位來(lái)說(shuō),進(jìn)行古籍?dāng)?shù)字化的初衷是基于古籍本體的保護(hù)和傳承,重點(diǎn)是要保存古籍的真實(shí)面貌,不同版本原樣復(fù)制,即通過(guò)掃描、拍照,把古籍圖像文字保存下來(lái),用數(shù)字圖像形式實(shí)現(xiàn)古籍的文物屬性。
海南省現(xiàn)存古籍藏量不多、收藏分散,省古籍保護(hù)中心可采用“明確責(zé)權(quán),分別加工,集中建庫(kù),統(tǒng)一檢索”的協(xié)作方式,聯(lián)合各古籍收藏單位建設(shè)全省古籍?dāng)?shù)字圖書館。明確責(zé)權(quán)是指明確各古籍收藏單位對(duì)古籍和古籍?dāng)?shù)據(jù)的所有權(quán),明確聯(lián)合共建過(guò)程中的各協(xié)作單位對(duì)古籍?dāng)?shù)據(jù)的加工、轉(zhuǎn)讓、使用、共享、保護(hù)等工作規(guī)則,完善古籍?dāng)?shù)字產(chǎn)品的分級(jí)分類管理,通過(guò)數(shù)據(jù)開(kāi)放、特許開(kāi)發(fā)、授權(quán)應(yīng)用的方式,實(shí)現(xiàn)省內(nèi)古籍?dāng)?shù)字產(chǎn)品的依法、有序、規(guī)范保護(hù)和利用。集中建庫(kù)是指全省古籍?dāng)?shù)字資源集中在一個(gè)數(shù)據(jù)平臺(tái)發(fā)布,分三個(gè)步驟:各單位首先利用前期《海南省古籍普查登記目錄》書目數(shù)據(jù),轉(zhuǎn)換為館藏古籍元數(shù)據(jù);其次對(duì)收藏的古籍有序進(jìn)行圖像掃描,按照技術(shù)要求保存古籍?dāng)?shù)字母本;再次將古籍元數(shù)據(jù)和古籍圖像命名封裝,TIFF格式圖像除本地存儲(chǔ),另備份一份保存版和發(fā)布版,和元數(shù)據(jù)一并提交省古籍保護(hù)中心,統(tǒng)一在全省古籍?dāng)?shù)字圖書館平臺(tái)網(wǎng)絡(luò)發(fā)布。統(tǒng)一檢索是指讀者可以由一個(gè)頁(yè)面登錄省域古籍?dāng)?shù)字圖書館網(wǎng)站進(jìn)行模糊檢索,也可以根據(jù)題名、著者、主題詞、出版地、出版發(fā)行、索書號(hào)等進(jìn)行檢索、瀏覽,根據(jù)古籍的“經(jīng)、史、子、集、叢”分類法進(jìn)行瀏覽。智慧古籍圖書館建設(shè)將在建設(shè)省域古籍?dāng)?shù)字圖書館基礎(chǔ)上,對(duì)特色古籍、專題古籍再進(jìn)行AI識(shí)別、知識(shí)挖掘,循序漸進(jìn)實(shí)現(xiàn)古籍?dāng)?shù)字圖書館的智慧化升級(jí)。
3 保護(hù)傳承理念與古籍?dāng)?shù)字圖書館建設(shè)的關(guān)系
3.1 保護(hù)傳承理念是以保護(hù)為核心,保護(hù)和利用相結(jié)合
進(jìn)行古籍?dāng)?shù)字化是以保護(hù)為核心,紙質(zhì)古籍得到保護(hù),數(shù)字古籍母本也以數(shù)字的形式長(zhǎng)期典藏,即用古籍原本通過(guò)掃描拍照,獲取長(zhǎng)期保存級(jí)數(shù)字古籍母本,實(shí)現(xiàn)紙質(zhì)古籍保護(hù)和數(shù)字古籍母本的雙重版本保護(hù);再通過(guò)復(fù)制、衍生出數(shù)字古籍,通過(guò)數(shù)字圖書館發(fā)布,使紙質(zhì)古籍避免了過(guò)多直接翻閱而受損,文物屬性得以保護(hù);加工后的數(shù)字古籍母本,TIFF格式、不壓縮、長(zhǎng)期保存級(jí),作為數(shù)字古籍的典藏本;由母本衍生出版印刷本、網(wǎng)絡(luò)發(fā)布本,可用于古籍研究、影印復(fù)制、網(wǎng)絡(luò)發(fā)布,實(shí)現(xiàn)了開(kāi)放和共享,數(shù)字古籍可通過(guò)網(wǎng)絡(luò)“化身千百”,實(shí)現(xiàn)古籍的文獻(xiàn)屬性。數(shù)字化后,古籍的文物價(jià)值和文獻(xiàn)價(jià)值可以用不同的形式體現(xiàn)。作為文物價(jià)值的古籍原本,得以在收藏單位恒溫恒濕庫(kù)保存;作為學(xué)術(shù)資料價(jià)值的古籍,以數(shù)字載體形式在數(shù)字圖書館存儲(chǔ)、網(wǎng)絡(luò)發(fā)布,讓科研人員和普通讀者可隨時(shí)通過(guò)電腦、手機(jī)等終端,遠(yuǎn)程訪問(wèn)古籍?dāng)?shù)字圖書館,瀏覽、下載。
用保護(hù)傳承理念指導(dǎo)古籍?dāng)?shù)字圖書館建設(shè),保護(hù)是前提,傳承是目的,因此要正確處理保護(hù)古籍和數(shù)字化開(kāi)放的關(guān)系。對(duì)古籍原本、數(shù)字古籍母本加強(qiáng)保護(hù),數(shù)字古籍的發(fā)布版本應(yīng)最大限度地方便讀者使用,從登錄方式、響應(yīng)速度、閱讀方式、文字識(shí)別、下載打印、多媒體分享等方面,為利用數(shù)字古籍的讀者提供更多的便捷方式,讓讀者共享中華古代文明智慧。
3.2 保護(hù)傳承理念倡導(dǎo)對(duì)現(xiàn)存古籍全面數(shù)字化
基于保護(hù)傳承理念進(jìn)行古籍?dāng)?shù)字化,是基于地域或機(jī)構(gòu)收藏古籍為主的數(shù)字化工作,倡導(dǎo)館藏古籍全面數(shù)字化,即凡是1912年以前的我國(guó)典籍,只要在本地或本機(jī)構(gòu)收藏,均具有數(shù)字化價(jià)值。在開(kāi)展數(shù)字化前,收藏機(jī)構(gòu)可以對(duì)古籍進(jìn)行文獻(xiàn)評(píng)估,善本、孤本、稀見(jiàn)本、專題古籍可以優(yōu)先,品相不完整可以待修復(fù)后數(shù)字化,普通古籍也應(yīng)數(shù)字化。全國(guó)現(xiàn)存20萬(wàn)種古籍全部數(shù)字化可能需要幾十億元,在國(guó)家財(cái)力允許的條件下應(yīng)盡快集中力量實(shí)現(xiàn)全部重要古籍的數(shù)字化[9]。
3.3 保護(hù)傳承理念統(tǒng)籌古籍?dāng)?shù)字圖書館建設(shè)全過(guò)程
基于保護(hù)傳承理念進(jìn)行古籍?dāng)?shù)字化,應(yīng)是圍繞“保護(hù)古籍、傳承文明、開(kāi)發(fā)資源、服務(wù)讀者”方針,統(tǒng)籌古籍保護(hù)工作全過(guò)程的數(shù)字化。將古籍?dāng)?shù)字化并用軟件系統(tǒng)平臺(tái)呈現(xiàn),形成古籍收藏、管理、采訪、編目、修復(fù)、數(shù)據(jù)加工、數(shù)據(jù)傳遞等工作模塊,檢索、瀏覽、下載、打印、圖像索取、讀者交流等讀者服務(wù)模塊,具備古籍收集、典藏、開(kāi)發(fā)、利用等功能,以獨(dú)立的網(wǎng)絡(luò)IP呈現(xiàn)在互聯(lián)網(wǎng)上,就形成了古籍?dāng)?shù)字圖書館。古籍?dāng)?shù)字化作為數(shù)字圖書館建設(shè)的一個(gè)重要部分,大致有古籍?dāng)?shù)字化加工準(zhǔn)備、古籍元數(shù)據(jù)著錄、古籍圖像數(shù)字化、數(shù)據(jù)命名、數(shù)據(jù)檢驗(yàn)、數(shù)據(jù)保存與提交、發(fā)布利用等環(huán)節(jié)。見(jiàn)圖1。
3.3.1 提取古籍前的書況檢查。書況檢查是古籍安全的重要保證,檢查古籍原本情況并進(jìn)行登記,是古籍藏品出庫(kù)前古籍庫(kù)管人員必須做好的基礎(chǔ)工作,也是數(shù)字化加工、交接、質(zhì)檢、標(biāo)引等后續(xù)工作的依據(jù)。根據(jù)國(guó)家古籍保護(hù)中心編寫的《古籍?dāng)?shù)字化工作手冊(cè)》(V.1)要求,主要是對(duì)古籍原本逐葉翻檢,清點(diǎn)古籍冊(cè)數(shù)和葉數(shù),填寫古籍《文獻(xiàn)整理登記表》(全書)和《文獻(xiàn)整理登記表》(各卷)。《文獻(xiàn)整理登記表》(全書)有六個(gè)字段,分別是ID、加工記錄標(biāo)識(shí)號(hào)、名錄號(hào)、題名卷數(shù)、相關(guān)說(shuō)明、冊(cè)數(shù)。《文獻(xiàn)整理登記表》(各卷)有二十一個(gè)字段,分別是ID、內(nèi)部序號(hào)、加工記錄標(biāo)識(shí)號(hào)、冊(cè)次、卷次、葉數(shù)、封面、前護(hù)、后護(hù)、封底、開(kāi)本、板框、透字、夾框、夾字、皺折、缺葉、殘葉、簽條、夾紙、備注。檢查書況過(guò)程中按書葉原貌統(tǒng)計(jì)總?cè)~數(shù),記錄古籍的缺葉、漏葉、錯(cuò)葉、重葉、空白葉等情況,注明是否需要補(bǔ)配、去重、變更葉碼順序等,登記掃描或拍攝的葉數(shù),形成較為完整的書況檢查記錄。
3.3.2 古籍元數(shù)據(jù)制作。古籍元數(shù)據(jù)制作除了前面需要制作《文獻(xiàn)整理登記表》(全書)和《文獻(xiàn)整理登記表》(各卷)外,還需要制作《書目數(shù)據(jù)表》《卷目數(shù)據(jù)表》《外字表》《管理信息表》。《書目數(shù)據(jù)表》有23個(gè)字段,分別是ID、加工記錄標(biāo)識(shí)號(hào)、名錄號(hào)、普查編號(hào)、書目記錄標(biāo)識(shí)號(hào)、索書號(hào)、分類、題名卷數(shù)、其他題名、主要責(zé)任者、其他責(zé)任者、存(缺)卷、版本(含補(bǔ)配)、冊(cè)數(shù)、板框、版式、合訂狀態(tài)、裝幀形式、叢編、附注、批跋、館藏單位、制作單位?!毒砟繑?shù)據(jù)表》有10個(gè)字段,分別是ID、內(nèi)部序號(hào)、加工記錄標(biāo)識(shí)號(hào)、叢書標(biāo)識(shí)號(hào)、子目題名、層級(jí)號(hào)、冊(cè)號(hào)、卷名、葉碼、屬性?!锻庾直怼返怯浀氖枪偶?dāng)?shù)字化使用的Unicode 5.0 UTF-8字符集里不包括的文字,即集外字,本表格有6個(gè)字段,分別是ID、內(nèi)部序號(hào)、加工記錄標(biāo)識(shí)號(hào)、外字、描述、位置,依據(jù)《漢語(yǔ)文古籍機(jī)讀目錄格式使用手冊(cè)》393字段系統(tǒng)外字附注的外字描述方法,即左右結(jié)構(gòu)不用標(biāo)出偏旁位置,其他結(jié)構(gòu)都要標(biāo)出字的結(jié)構(gòu)位置。例如:
左右結(jié)構(gòu)“儋”:##@a=#[亻詹]#(dan)
其他結(jié)構(gòu)“惖”:##@a=#[易(上)、心(下)]#(ti)
《管理信息表》是古籍在數(shù)字化加工過(guò)程中的數(shù)字化參數(shù)等管理信息。每部古籍12個(gè)字段,分別是ID、加工記錄標(biāo)識(shí)號(hào)、技術(shù)信息、格式、分辨率、色彩、色彩位深、壓縮、加工方式、事件類型、操作、操作日期等。另外,《古籍?dāng)?shù)字化工作手冊(cè)》(V.1)還規(guī)定:使用Microsoft Office Access 2003進(jìn)行數(shù)據(jù)制作,使用Unicode 5.0 UTF-8字符集,用通行繁體字、字體字號(hào)為宋體11號(hào);著錄文字處理錯(cuò)誤率不超過(guò)0.3‰,著錄信息描述與古籍實(shí)際內(nèi)容完全一致,標(biāo)引詞與標(biāo)引對(duì)象文件正確鏈接等。
3.3.3 古籍圖像數(shù)字化。根據(jù)古籍的裝幀形式,在不拆分古籍的前提下進(jìn)行古籍?dāng)?shù)字化,掃描的頁(yè)面是半葉和雙半葉,封面、封底、空白頁(yè)、附件、書口、天頭、地腳,都在掃描(拍攝)范圍。掃描的半葉和全葉位置見(jiàn)表1。古籍?dāng)?shù)字化環(huán)境應(yīng)注意防護(hù)光源,避免透光或反射光的影響。如果是彩色掃描(拍照),首先進(jìn)行數(shù)字化設(shè)備的基本色彩校正,測(cè)量數(shù)字輸入設(shè)備和數(shù)字輸出設(shè)備的色彩屬性,將色標(biāo)與古籍放在一起進(jìn)行比對(duì)。古籍原件掃描(拍照)時(shí)頁(yè)面向上,用零邊距掃描儀(數(shù)碼相機(jī)),將古籍放在翻拍臺(tái)上,冷光源照明,按1:1比例掃描,葉面外圍要求留白,寬度不超過(guò)1厘米;書葉間距不超過(guò)0.1厘米。掃描后圖像清晰、端正,圖像傾斜角度不大于0.2度。掃描后的數(shù)據(jù)文件葉碼連續(xù),沒(méi)有重葉、缺葉、錯(cuò)葉、折葉等情況(原書缺葉、錯(cuò)葉除外)。補(bǔ)掃缺葉圖像要與同冊(cè)圖像文件的大小一致,顏色接近。見(jiàn)下頁(yè)表2。
3.3.4 加工記錄標(biāo)識(shí)命名?!豆偶?dāng)?shù)字化工作手冊(cè)》(V.1)規(guī)定,一部古籍的加工記錄標(biāo)識(shí)號(hào)為8位阿拉伯?dāng)?shù)字,由單位代碼(4位,由國(guó)家古籍保護(hù)中心統(tǒng)一分配)+單位內(nèi)部古籍?dāng)?shù)字化流水號(hào)(4位)組成(從1開(kāi)始,不足4位以0補(bǔ)齊)。古籍保存文件命名由三級(jí)結(jié)構(gòu)組成:第一級(jí)目錄名稱為加工記錄標(biāo)識(shí)號(hào)。第二級(jí)目錄名稱為古籍冊(cè)號(hào)。每部古籍有多冊(cè)實(shí)體,每一冊(cè)命名為4位數(shù)字,從0001開(kāi)始,依次按流水號(hào)命名。第三級(jí)保存圖像數(shù)據(jù)文件,按照掃描頁(yè)碼,命名從0001開(kāi)始,加“.tif”。以海南省圖書館藏明刻本《宋大家蘇文忠公文抄》二十八卷為例:加工記錄標(biāo)識(shí)號(hào)為XXXX0001,該書第一冊(cè)號(hào)為0001,第一葉的葉號(hào)為0001,文件保存目錄為XXXX0001/0001,圖像文件名為0001.tif。
4 古籍?dāng)?shù)字圖書館建設(shè)的基本要素
4.1 古籍?dāng)?shù)字圖書館建設(shè)平臺(tái)
古籍?dāng)?shù)字化是傳統(tǒng)古籍整理與現(xiàn)代計(jì)算機(jī)技術(shù)相結(jié)合的產(chǎn)物,是運(yùn)用信息處理技術(shù)將文獻(xiàn)轉(zhuǎn)化為計(jì)算機(jī)可識(shí)別和處理的數(shù)字信息的過(guò)程。古籍?dāng)?shù)字化平臺(tái)軟件是古籍?dāng)?shù)字圖書館建設(shè)的基礎(chǔ)設(shè)施,應(yīng)具有安全性、易用性、開(kāi)放性、可持續(xù)發(fā)展等特征,一般應(yīng)具備以下功能:①古籍?dāng)?shù)據(jù)庫(kù)制作管理與發(fā)布。②數(shù)字資源制作加工。③統(tǒng)一檢索平臺(tái)。④數(shù)字參考咨詢。⑤互聯(lián)網(wǎng)信息資源整合。⑥讀者登錄及個(gè)性化信息服務(wù)。⑦古籍閱覽和整理輔助工具[11]。
古籍?dāng)?shù)字圖書館軟件平臺(tái)應(yīng)具備資源、服務(wù)和管理三大職能,古籍平臺(tái)通過(guò)模塊組織實(shí)現(xiàn)這些功能,主要模塊有資源加工、資源發(fā)布、資源檢索、資源訪問(wèn)權(quán)限、下載和安全控制、用戶服務(wù)、用戶登錄、交互數(shù)據(jù)管理、統(tǒng)計(jì)分析、日志管理等。
我國(guó)現(xiàn)有應(yīng)用較廣泛的古籍?dāng)?shù)字化平臺(tái)有書同文公司的“數(shù)碼翰林”等,“數(shù)碼翰林”是北京書同文公司在推出文淵閣《四庫(kù)全書》電子版、《四部叢刊》的基礎(chǔ)上,繼續(xù)研發(fā)的大型數(shù)字化軟件工具。該軟件是一個(gè)對(duì)實(shí)體資源信息和元數(shù)據(jù)實(shí)施數(shù)字化加工、結(jié)構(gòu)化置標(biāo)、提交發(fā)布,并在網(wǎng)絡(luò)環(huán)境下向公眾提供信息服務(wù)的集成性軟件,包括數(shù)碼大師、電子編目員、發(fā)布系統(tǒng)三個(gè)部分,用于《中國(guó)歷代石刻史料匯編》全文檢索數(shù)據(jù)庫(kù),兩岸五地(大陸、港、澳、臺(tái)、日)13個(gè)成員館聯(lián)合共建的“孫中山數(shù)字圖書館”等[12],中易公司開(kāi)發(fā)的《中易漢神e》、北大方正集團(tuán)公司開(kāi)發(fā)的“DABSI—方正德賽古籍?dāng)?shù)字化系統(tǒng)”[13],臺(tái)灣“中央研究院”歷史語(yǔ)言研究所“漢籍電子文獻(xiàn)資料庫(kù)”、日本“日本國(guó)立公文館內(nèi)閣文庫(kù)漢書庫(kù)”所用古籍?dāng)?shù)字化平臺(tái),值得借鑒。
海南省古籍?dāng)?shù)字圖書館服務(wù)平臺(tái)是基于對(duì)本省古籍進(jìn)行保護(hù)理念基礎(chǔ)上的共建共享一體化、分布式的古籍?dāng)?shù)字化服務(wù)體系,是全省古籍資源收集、加工、保存和發(fā)布、讀者服務(wù)的網(wǎng)絡(luò)窗口。該平臺(tái)在總體技術(shù)上應(yīng)選擇基于國(guó)際標(biāo)準(zhǔn)編碼字符集ISO/IEC 10646/Unicode(CJK+)的漢字平臺(tái),支持漢字繁體和簡(jiǎn)體,有中文、英文、日文等版本,具備統(tǒng)一性、開(kāi)放性、安全性、互操作性、兼容整合性、成熟性、組件化、標(biāo)準(zhǔn)化等多重特征,以便于各個(gè)應(yīng)用系統(tǒng)和各類資源系統(tǒng)的互操作、鏈接、交換數(shù)據(jù)和數(shù)據(jù)集成。
4.2 古籍?dāng)?shù)字化加工工具
4.2.1 掃描設(shè)備。館藏古籍是珍貴而脆弱的文獻(xiàn)資源,數(shù)字圖像采集需要精度高、速度快,對(duì)書籍無(wú)損壞的非接觸式、保護(hù)性的數(shù)字化大型掃描設(shè)備,主要參數(shù)要求是零邊距或非接觸,冷光掃描,設(shè)備A3幅面的光學(xué)分辨率600dpi以上,CCD感光元件不低于5,000像素點(diǎn),色彩位數(shù)24bit,目前市場(chǎng)上有賽數(shù)OS12002V、Book2net、Bookeye5等,賽數(shù)OS12002V是一款高精度專業(yè)古籍掃描儀,頂置式掃描頭,臺(tái)式非接觸掃描,V型書稿臺(tái),打開(kāi)角度90~180度,可快速掃描成標(biāo)準(zhǔn)圖像,解決了掃描古籍時(shí)不能接觸、不能分拆的難題。
4.2.2 數(shù)碼拍照設(shè)備。單反數(shù)碼相機(jī)的有效像素不低于2,100萬(wàn)像素,最好選擇有效像素達(dá)3,300萬(wàn)像素以上的數(shù)碼設(shè)備。
4.2.3 其他工具。包括古籍翻拍架、大容量移動(dòng)硬盤、DVD光盤、用作背景的中灰色紙板或黑色紙板、IT8標(biāo)準(zhǔn)色彩導(dǎo)表(色卡)、衡量古籍開(kāi)本和板框的標(biāo)尺、玻璃壓板、玻璃清潔劑、襯紙等。見(jiàn)圖2。
5 專業(yè)人才是建設(shè)古籍?dāng)?shù)字圖書館的必要因素
古籍?dāng)?shù)字化應(yīng)是古籍收藏、保護(hù)、整理、閱讀、研究、利用等各階段、多層次的數(shù)字化。古籍?dāng)?shù)字圖書館建設(shè)是古籍整理工作的系統(tǒng)化體現(xiàn),集古籍?dāng)?shù)字化加工、讀者服務(wù)、數(shù)據(jù)檢索、古籍全文數(shù)據(jù)庫(kù)、古籍業(yè)務(wù)管理于一體,因此必須堅(jiān)持古籍保護(hù)專業(yè)引領(lǐng)的原則,遵守古籍整理的思路,在古籍?dāng)?shù)字化規(guī)劃中要貫穿保護(hù)和傳承理念:一是數(shù)字化之后盡量達(dá)到無(wú)須再看印本古籍的目的。二是印本古籍因保管不善損毀后,能夠盡可能原色再造古籍原本[14]。進(jìn)行專業(yè)管理,首先要用專業(yè)思維制訂保護(hù)古籍且行之有效的建設(shè)方案,做好規(guī)劃,保證古籍?dāng)?shù)字圖書館建設(shè)扎實(shí)有序開(kāi)展。專業(yè)管理還要把古籍保護(hù)和利用的專業(yè)思維運(yùn)用到古籍?dāng)?shù)字化過(guò)程中的項(xiàng)目管理、項(xiàng)目評(píng)價(jià)、古籍藏品管理與保存、應(yīng)急預(yù)案、數(shù)據(jù)安全、質(zhì)量監(jiān)督、管理制度實(shí)施等方面。
每一部古籍的數(shù)字化都涉及繁體字的辨認(rèn)、古籍元數(shù)據(jù)著錄、古籍圖像掃描(或拍照)、管理數(shù)據(jù)著錄,需要一大批熱愛(ài)古籍、耐心細(xì)致、有古文獻(xiàn)基礎(chǔ)的專業(yè)工作者。古籍?dāng)?shù)字圖書館建設(shè)是計(jì)算機(jī)和古籍的結(jié)合,古籍專業(yè)人員要與計(jì)算機(jī)網(wǎng)絡(luò)專業(yè)人員密切協(xié)作,用計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)演繹古籍?dāng)?shù)字化的專業(yè)流程,以開(kāi)放共享的傳承理念,激活古籍里的文字,讓數(shù)字化后的古籍走出文物庫(kù)房,供用戶在網(wǎng)絡(luò)上閱讀研究,通過(guò)手機(jī)微信、微博、QQ、抖音等轉(zhuǎn)發(fā)分享,真正實(shí)現(xiàn)古籍資源的公益性、基本性、均等性和便利性[15],讓數(shù)字古籍更便捷地惠及學(xué)者和普通讀者。
參考文獻(xiàn):
[1][13] 毛建軍.古籍?dāng)?shù)字化理論與實(shí)踐[M].北京:航空? 工業(yè)出版社,2009:5-6.
[2] 免費(fèi)閱覽全文影像!國(guó)家圖書館聯(lián)合39家單位累計(jì)在線發(fā)布古籍?dāng)?shù)字資源13萬(wàn)部(件)[EB/OL].[2023-01-04].http://www.nlc.cn/pcab/zx/xw/202301/t20230105_214422.htm.
[3] 中國(guó)古籍總目編纂委員會(huì).中國(guó)古籍總目前言//中國(guó)古籍總目[M].北京:中華書局,2009:3.
[4] 全國(guó)漢文古籍總量達(dá)270余萬(wàn)部 資源分布和保存狀況基本摸清[EB/OL].[2023-01-04].https://www.163.com/dy/article/GR8IR85K0514R9KU.html.
[5] 喬紅霞.海南古籍何處尋[N].海南日?qǐng)?bào),2022-04-25(A15).
[6] 姚伯岳.“北京大學(xué)數(shù)字圖書館古文獻(xiàn)資源庫(kù)”的建設(shè)[J].數(shù)字圖書館論壇,2006(12):12-17.
[7] “識(shí)典古籍”測(cè)試版上線,3000萬(wàn)字符在這里跳動(dòng)[EB/OL].[2023-01-04].https://www.sohu.com/a/592831356_121124334.
[8] 樂(lè)艷娜.數(shù)字化助力古籍回歸與再造[J].環(huán)球,2021(19):54-56.
[9] 古籍為何要數(shù)字化 該如何加速[EB/OL].[2023-01-04].https://www.sohu.com/a/117949838_48677.
[10] 朱強(qiáng),張春紅,龍偉.國(guó)家圖書館圖像數(shù)據(jù)加工標(biāo)準(zhǔn)和操作指南[M].北京:國(guó)家圖書館出版社,2011:9,45.
[11] 劉曉清.怎樣建設(shè)數(shù)字圖書館[M].北京:海洋出版社,2010:215-260.
[12] 王立清.中文古籍?dāng)?shù)字化研究[M].北京:國(guó)家圖書館出版社,2011:90.
[14] 朱本軍.海外漢籍?dāng)?shù)字化加工現(xiàn)狀與實(shí)踐研究[J].古籍保護(hù)研究,2020(1):113-129.
[15] 趙文友.基于開(kāi)放共享理念的古籍?dāng)?shù)字資源服務(wù):以“中華古籍保護(hù)計(jì)劃”為中心[J].古籍保護(hù)研究,2020(2):21-28.
(編校:周雪芹)