涂家興
(肇慶市圖書(shū)館,廣東肇慶 526060)
肇慶是國(guó)家歷史文化名城,粵港澳大灣區(qū)城市群之一,嶺南歷史文化氛圍濃郁,蘊(yùn)含了豐富的歷史文化資源,是嶺南文化、廣府文化的發(fā)祥地之一,也是中國(guó)優(yōu)秀旅游城市,國(guó)家園林城市,國(guó)家環(huán)境保護(hù)模范城市。肇慶地區(qū)各級(jí)公共圖書(shū)館作為古籍文獻(xiàn)主要收藏機(jī)構(gòu),擁有在冊(cè)登記的珍貴的古籍文獻(xiàn)36 295 冊(cè),其中不乏如《萬(wàn)歷肇慶府志》《宣統(tǒng)高要縣志》《光緒德慶州志》《清康熙德慶州志》《鼎湖山志》《鼎湖外集》 等本地史志類古籍,如果只是一味束之高閣,對(duì)于名城肇慶深厚的歷史文化的挖掘與傳承,無(wú)疑是一大損失。如何更好地實(shí)現(xiàn)古籍文獻(xiàn)的保存和利用,滿足讀者日益增長(zhǎng)的文化需求,加強(qiáng)古籍?dāng)?shù)字化是肇慶地區(qū)圖書(shū)館建設(shè)的一項(xiàng)重要內(nèi)容。
古籍的數(shù)字化建設(shè),是從保護(hù)和利用古籍的目的出發(fā),采用計(jì)算機(jī)技術(shù)和古籍知識(shí),將古籍里蘊(yùn)含的內(nèi)容通過(guò)圖像加工、數(shù)據(jù)標(biāo)引、校對(duì)等計(jì)算機(jī)技術(shù),進(jìn)行數(shù)據(jù)合并、入庫(kù),從而制成古籍電子文獻(xiàn)數(shù)據(jù)庫(kù),并發(fā)布出來(lái)供廣大讀者及研究人員使用[1]。
肇慶市圖書(shū)館成立于2005年,在古籍文獻(xiàn)建設(shè)與收藏方面存在空白。加強(qiáng)地方古籍文獻(xiàn)的建設(shè)、保存、開(kāi)發(fā)與傳播,肇慶市圖書(shū)館的義務(wù)與責(zé)任。
高要區(qū)圖書(shū)館現(xiàn)保有古籍8594 冊(cè),古籍藏量位居肇慶地區(qū)的首位,是肇慶市唯一一個(gè)全省重點(diǎn)古籍保護(hù)單位。這批古籍中珍本較多,其中珍貴“善本”書(shū)有清乾隆三年(1738)武英殿刻朱墨套印本《朱批諭旨》(此書(shū)入選廣東省第一批省級(jí)珍貴古籍名錄),譚君宰撰清道光六年(1826)刻本《高要縣志》等。高要區(qū)古籍室設(shè)有古籍專用掃描照片平臺(tái)、低溫冷凍殺蟲(chóng)冰柜、專用恒溫空調(diào)等保護(hù)設(shè)備,安裝有閉路電視監(jiān)控錄像系統(tǒng)并與110 聯(lián)網(wǎng),進(jìn)行24h 安全監(jiān)控。然而高要區(qū)圖書(shū)館缺乏一定的資金及專業(yè)的計(jì)算機(jī)技術(shù)人才。而這些古籍是肇慶地區(qū)非常珍貴的文獻(xiàn)資料和歷史文化遺產(chǎn),具有重要的科研價(jià)值。
因此,充分發(fā)揮肇慶市圖書(shū)館人才技術(shù)優(yōu)勢(shì),由肇慶市圖書(shū)館實(shí)行項(xiàng)目規(guī)劃和資金投放,聯(lián)合高要區(qū)圖書(shū)館古籍文獻(xiàn)藏量的優(yōu)勢(shì),并引入第三方合作公司提供計(jì)算機(jī)技術(shù)支持,包括系統(tǒng)平臺(tái)搭建、數(shù)字化加工、古籍掃描后期處理、資源管理、發(fā)布及展示等標(biāo)準(zhǔn)化服務(wù),逐步開(kāi)展“肇慶·高要古籍文獻(xiàn)數(shù)字化建設(shè)項(xiàng)目”。項(xiàng)目的成果兩館各留一份完整的數(shù)字化圖像文檔,用于發(fā)布和其他學(xué)術(shù)研究保存及應(yīng)用。
采用計(jì)算機(jī)技術(shù),對(duì)高要區(qū)圖書(shū)館館藏的古籍文獻(xiàn)進(jìn)行圖像處理、OCR 文字識(shí)別、二次文獻(xiàn)標(biāo)引、建立數(shù)據(jù)庫(kù)索引等數(shù)字化加工,生成數(shù)據(jù)庫(kù)文件,通過(guò)導(dǎo)入電子文獻(xiàn)管理系統(tǒng),建設(shè)地方特色數(shù)據(jù)庫(kù),并發(fā)布出來(lái)供廣大讀者及研究人員使用。
古籍文獻(xiàn)數(shù)據(jù)加工要求見(jiàn)表1。
古籍文獻(xiàn)數(shù)字化處理系統(tǒng)是肇慶市圖書(shū)館古籍文獻(xiàn)數(shù)據(jù)庫(kù)建設(shè)、管理與發(fā)布的技術(shù)平臺(tái),是基于非結(jié)構(gòu)化文件、文檔管理而開(kāi)發(fā)的智能內(nèi)容管理系統(tǒng)。系統(tǒng)主要以全文索引數(shù)據(jù)庫(kù)為核心,采用B/S 瀏覽器方式以及先進(jìn)的三層C/S 架構(gòu),能夠同時(shí)管理文字、圖片、文檔、多媒體等信息,并提供方便的檢索服務(wù),支持網(wǎng)頁(yè)發(fā)布,是一個(gè)面向內(nèi)容管理的應(yīng)用和信息發(fā)布的平臺(tái)。古籍文獻(xiàn)數(shù)字文獻(xiàn)處理系統(tǒng)特點(diǎn)包括,支持多種國(guó)際標(biāo)準(zhǔn):Dublin Core、MARC、RDF、Z39.50 等;是CALIS 中心的認(rèn)證軟件;符合《中國(guó)數(shù)字圖書(shū)館標(biāo)準(zhǔn)規(guī)范建設(shè)》的資源建設(shè)標(biāo)準(zhǔn)和數(shù)據(jù)交換標(biāo)準(zhǔn); 具備優(yōu)秀的檢索功能,基于字索引+分詞策略建立索引,提供簡(jiǎn)繁體互檢、漸進(jìn)式檢索;可以實(shí)現(xiàn)對(duì)掃描圖像的內(nèi)容進(jìn)行檢索,并對(duì)檢索結(jié)果準(zhǔn)確定位;并提供靈活的內(nèi)容發(fā)布平臺(tái),用戶可根據(jù)自己的需要把數(shù)據(jù)以各種形式發(fā)布到Internet 上。
古籍文獻(xiàn)數(shù)字化建設(shè)需要大量的資金和人才的支持。肇慶地區(qū)圖書(shū)館普遍存在資金匱乏、人才儲(chǔ)備不足的情況,古籍文獻(xiàn)建設(shè)工作相對(duì)落后,有部分區(qū)縣圖書(shū)館雖然配備整理古籍文獻(xiàn)的工作人員,但不僅數(shù)量少且不懂技術(shù),而有專門的計(jì)算機(jī)技術(shù)人員又缺乏古籍知識(shí)。古籍文獻(xiàn)的數(shù)字化建設(shè)需要大量資金的投入,在有限的資金投放中,應(yīng)當(dāng)有所側(cè)重,爭(zhēng)取政府和財(cái)政的支持是必不可少的條件。在人才培養(yǎng)方面,積極參與省級(jí)圖書(shū)館舉辦的古籍知識(shí)相關(guān)的培訓(xùn),從整體上優(yōu)化人才結(jié)構(gòu),才能為古籍文獻(xiàn)數(shù)字化建設(shè)提供保障[2]。
表1 古籍文獻(xiàn)數(shù)據(jù)加工要求
在古籍?dāng)?shù)字化建設(shè)過(guò)程中,對(duì)古籍的內(nèi)容和記錄的形式有所區(qū)別,或重復(fù)建設(shè),造成了資源浪費(fèi),影響古籍文獻(xiàn)資源數(shù)字化工作的交流和共享。肇慶地區(qū)圖書(shū)館應(yīng)該加強(qiáng)對(duì)古籍?dāng)?shù)字化建設(shè)的統(tǒng)一認(rèn)識(shí)和規(guī)劃,整合肇慶各縣區(qū)圖書(shū)館古籍資源,把資源優(yōu)勢(shì)和數(shù)字化技術(shù)結(jié)合起來(lái),形成互補(bǔ),不在重復(fù)建設(shè)上浪費(fèi)資金和人力,在有效的范圍內(nèi)進(jìn)行整體檢索,使有用的學(xué)術(shù)資源得到充分發(fā)揮,共同打造一套完善的肇慶地區(qū)圖書(shū)館古籍保護(hù)工作體系,實(shí)現(xiàn)古籍文獻(xiàn)數(shù)字資源的共享[3]。
在古籍?dāng)?shù)字化加工成果后,利用網(wǎng)站平臺(tái)、各類圖書(shū)館服務(wù)活動(dòng),推廣古籍電子文獻(xiàn)資源,并舉辦古籍修復(fù)演示體驗(yàn)活動(dòng)。2016—2018年,連續(xù)三屆“肇慶讀書(shū)節(jié)”啟動(dòng)儀式上,肇慶市圖書(shū)館、高要區(qū)圖書(shū)館、四會(huì)市圖書(shū)館聯(lián)合舉辦的古籍實(shí)物展示、古籍知識(shí)普及展覽、現(xiàn)場(chǎng)古籍修復(fù)演示、古籍?dāng)?shù)據(jù)庫(kù)數(shù)字資源演示等各項(xiàng)專題活動(dòng),以向讀者宣傳古籍、讓讀者了解古籍?dāng)?shù)字化重要性,為往后古籍?dāng)?shù)字化加工提供了保障。
由于古籍文獻(xiàn)資源數(shù)據(jù)庫(kù)存取在網(wǎng)絡(luò)上進(jìn)行,在這個(gè)過(guò)程中存在網(wǎng)絡(luò)安全問(wèn)題。在遭受計(jì)算機(jī)病毒、黑客入侵等,甚至人為導(dǎo)致的各種失誤和操作,都會(huì)造成無(wú)法挽回的惡果。因此,搭建健全的網(wǎng)絡(luò)安全體系是必不可少的,在管理、技術(shù)、設(shè)備和免疫等方面重點(diǎn)保護(hù)數(shù)字化古籍文獻(xiàn)資源的安全,健全技術(shù)防范、預(yù)警和保障體系,注重古籍?dāng)?shù)字資源的備份,以更好地應(yīng)對(duì)各類風(fēng)險(xiǎn)[4]。
隨著數(shù)字技術(shù)及存儲(chǔ)技術(shù)的不斷進(jìn)步完善,古籍文獻(xiàn)數(shù)字化是古籍保護(hù)、整理和傳播利用的主要方向,能有效接解決“藏與用”的矛盾。同時(shí),古籍?dāng)?shù)字化是數(shù)字圖書(shū)館建設(shè)的重要組成部分,是大數(shù)據(jù)背景下肇慶區(qū)域圖書(shū)館發(fā)展的時(shí)代要求。