孫會清,李赫,張霞,王琛
(1.華北理工大學(xué) 社會科學(xué)研究院,河北 唐山 063210;2.華北理工大學(xué) 圖書館,河北 唐山 063210;3.華北理工大學(xué)冀唐學(xué)院,河北 唐山 063210)
文化遺產(chǎn)是傳統(tǒng)文化的重要組成部分之一,具有稀缺性、脆弱性和不可再生性等特點。文獻(xiàn)典籍作為文化遺產(chǎn)的重要組成部分,不僅為專家學(xué)者從事文化遺產(chǎn)研究提供第一手珍貴和原始的參考資料,也為文化遺產(chǎn)的建筑物和文物的保護(hù)、復(fù)原和重建研究提供相對可靠的依據(jù)和重要的實踐基礎(chǔ)[1]。因此,文獻(xiàn)典籍的收集和整理是對文化遺產(chǎn)進(jìn)行保護(hù)、開發(fā)和利用研究的基礎(chǔ)和起點。文獻(xiàn)典籍與其他文物類型一樣,其數(shù)字化建設(shè)能夠有效解決保護(hù)與利用之間的矛盾。在廣義上和本質(zhì)上文獻(xiàn)典籍?dāng)?shù)字化也屬于文獻(xiàn)整理的一種方式,并且是未來文獻(xiàn)整理的發(fā)展方向。
清東陵于2000年被列入世界文化遺產(chǎn)名錄,是我國現(xiàn)存規(guī)模最宏大、體系最完整的封建帝王陵寢建筑群,蘊(yùn)含了極高的歷史價值、藝術(shù)價值和科學(xué)價值。深入挖掘世界文化遺產(chǎn)清東陵的文化價值,促進(jìn)文化遺產(chǎn)的高質(zhì)量供給,對弘揚和發(fā)展中華優(yōu)秀傳統(tǒng)文化具有重要的意義。清東陵文獻(xiàn)典籍的收集、整理和組織等文獻(xiàn)體系建設(shè)是清東陵文化研究的基礎(chǔ)保障性因素。作為世界級文化遺產(chǎn),與清東陵文化研究有關(guān)的文獻(xiàn)典籍不僅遺存數(shù)量和類型眾多,而且被不同機(jī)構(gòu)收藏,或者以文本片段、圖像等形式散存于諸多類型的文獻(xiàn)典籍當(dāng)中,目前還未形成系統(tǒng)性的專題研究成果和體系,清東陵文獻(xiàn)典籍的數(shù)字化建設(shè)也存在著空白,亟待進(jìn)行專題性研究。針對以上現(xiàn)實問題,依據(jù)保護(hù)和利用并重的原則,按照我國文獻(xiàn)數(shù)字化建設(shè)的相關(guān)國家政策、規(guī)范和標(biāo)準(zhǔn),需要對清東陵文化現(xiàn)存各種類型和形態(tài)的文獻(xiàn)典籍進(jìn)行全面、系統(tǒng)、完整和科學(xué)地收集、整理、分類、標(biāo)引和組織,在此基礎(chǔ)上應(yīng)用現(xiàn)代數(shù)字人文(Digital Humanities)技術(shù)進(jìn)行清東陵文獻(xiàn)典籍的數(shù)字化建設(shè)研究。
如何將分散于各處、數(shù)量龐雜、卷帙浩繁的清東陵文獻(xiàn)典籍收集、整理齊全,形成全面、系統(tǒng)、完整和科學(xué)的文獻(xiàn)典籍體系,前提是需要制定出科學(xué)、系統(tǒng)和有效的清東陵文獻(xiàn)典籍收集方案。首先,需要明確界定清東陵文獻(xiàn)典籍的內(nèi)涵和外延,在此基礎(chǔ)上根據(jù)清東陵文獻(xiàn)典籍的不同類型分別制定和形成具體的、有針對性的、具有可操作性的收集策略。
從廣義上講,凡是用文字、圖形、符號、聲頻、視頻等手段記錄知識的一切載體都統(tǒng)稱為文獻(xiàn)。在古代,圖書被稱作 “典籍” ;反過來說, “典籍” 泛指古代圖書,也稱之為 “古籍” 。因此,一般意義上的古籍是指除了簡帛古籍、敦煌遺書、佛教古籍、碑帖拓本及古地圖等特殊類型藏品以外的,未采用現(xiàn)代印刷技術(shù)印制的、習(xí)見的、普通形制的古代漢文書籍[2]。可見,從概念的內(nèi)涵來看, “文獻(xiàn)” 包含了 “典籍” , “典籍” 是 “文獻(xiàn)” 的一種; “文獻(xiàn)典籍” 則是一個復(fù)合概念,特指以古籍為主體但不限于古籍的多種類型形式的文獻(xiàn)。
在中國歷史上,清朝統(tǒng)治時期是從順治元年清朝入關(guān)到宣統(tǒng)三年清帝遜位(即公元1644年—1911年),橫跨時間268年。清世祖順治皇帝的孝陵是清東陵的第一座陵寢,始建于順治十八年(即1661年)。自1663年葬入第一帝順治至1935年葬入同治皇帝的最后一位皇貴妃,歷時272年。清王朝覆滅之后,清東陵仍歷經(jīng)軍閥混戰(zhàn)、日軍侵略、抗日戰(zhàn)爭等戰(zhàn)爭洗禮和磨難,期間還遭受多次盜劫和搶掠,直至新中國成立后清東陵文物保管所成立,清東陵才得到我國政府的專項管理和保護(hù)[3]。因此,為了對清東陵文化研究提供全面、完整、系統(tǒng)的文獻(xiàn)保障,將清東陵文獻(xiàn)典籍的收集時間范圍界定為從順治皇帝即位(1644年)開始至新中國成立(1949年)為止。新中國成立以后至今,現(xiàn)代、當(dāng)代清東陵文化歷史學(xué)家和研究學(xué)者創(chuàng)作出版的圖書和撰寫發(fā)表的報刊論文,是基于清東陵歷史文化研究產(chǎn)生的創(chuàng)作作品、取得的研究成果,不納入清東陵文獻(xiàn)典籍的收集范圍。
綜上,基于 “文獻(xiàn)” 和 “典籍” 的一般性定義,結(jié)合清東陵文化研究的實際需求,將清東陵文獻(xiàn)典籍的內(nèi)涵界定為:在歷史上形成的與清東陵的陵寢規(guī)制、皇家葬俗、工程建設(shè)等有關(guān)的并且具有重要歷史、思想和文化價值的文獻(xiàn)資料。將清東陵文獻(xiàn)典籍的外延界定為:自清朝入關(guān)到新中國成立(即1644 年-1949年)期間留存的,一切記錄清東陵的陵寢規(guī)制、皇家葬俗以及與清東陵陵寢選址、規(guī)劃設(shè)計、施工驗收、維護(hù)修整等清東陵工程建設(shè)過程的各個階段相關(guān)的事件和人物的古籍以及書冊、諭旨、檔案、圖紙、碑刻銘文和照片等形式的文獻(xiàn)[4]。
1.清東陵古籍文獻(xiàn)的收集
首先,通過《中國古籍總目》、《中華古籍書目數(shù)據(jù)庫》以及《鼎秀古籍全文檢索平臺》等公開發(fā)布的權(quán)威性古籍書目類工具書、古籍文獻(xiàn)專題數(shù)據(jù)庫,檢索和查找清東陵古籍文獻(xiàn)的存藏情況。其次,各級各類圖書館和檔案館歷來是各種文獻(xiàn)重要的和主要的收藏來源,也是全國開展古籍普查登記的重要組成單位,成為清東陵古籍文獻(xiàn)收藏的重點調(diào)研對象。通過這些古籍收藏單位網(wǎng)站設(shè)置的 “珍貴古籍名錄” 專欄,可以瀏覽和了解其收藏清東陵古籍文獻(xiàn)的情況。在故宮博物院收藏清代宮中的古籍文獻(xiàn)中也包括大量清東陵陵寢的工程做法、圖紙、賬本等文獻(xiàn)典籍[5],可從中篩選出一批清東陵古籍文獻(xiàn)。再次,通過咨詢清東陵文史研究專家,或者查閱現(xiàn)代及當(dāng)代的清東陵文化研究專著和論文等研究成果,以及調(diào)研和走訪相關(guān)古籍收藏單位和個人,可以有效查找、鑒別和確定部分清東陵古籍文獻(xiàn)的存藏線索。還可以采用購買、捐贈和復(fù)制等多種方式進(jìn)行長期性的清東陵古籍文獻(xiàn)的征集,從而不斷完善清東陵古籍文獻(xiàn)體系。
2.清東陵檔案文獻(xiàn)的收集
檔案是 “過去和現(xiàn)在的國家機(jī)構(gòu)、社會組織以及個人從事政治、軍事、經(jīng)濟(jì)、科學(xué)、技術(shù)、文化、宗教等活動直接形成的對國家和社會有保存價值的各種文字、圖表、聲像等不同形式的歷史記錄”[6]。檔案文獻(xiàn)具有原始第一手資料、更加貼近真實史實等特點,而且內(nèi)容記載豐富、能夠提供細(xì)節(jié)性的資料。在國家、省、市、縣各級各類檔案館中收藏有大量清代宮廷檔案資料,其中有大量未被刊布的檔案內(nèi)容還未被挖掘、整理和公開出版,可填補(bǔ)某些研究領(lǐng)域的文獻(xiàn)空白,或者成為一些史實的新的憑證?;跈n案文獻(xiàn)具有的重要研究價值,應(yīng)將清東陵檔案作為清東陵文化研究文獻(xiàn)典籍的重點收集對象。
中國第一歷史檔案館作為國家級檔案館,目前保存清代檔案數(shù)量約一千余萬件,包括清入關(guān)前天命九年(1607年)至宣統(tǒng)三年(1911年)300多年時間里形成的文書檔案,以及溥儀退位后于1921-1931年間形成的檔案[7],不僅是研究和纂修清代歷史的第一手寶貴資料,也是收集清東陵文獻(xiàn)典籍檔案類資料的最重要的來源和渠道。其中,在《清實錄》《內(nèi)務(wù)府來文·陵寢事務(wù)》《內(nèi)務(wù)府來文·禮儀》《內(nèi)務(wù)府來文·修建工程》《內(nèi)務(wù)府奏銷檔》《內(nèi)務(wù)府奏案》《內(nèi)務(wù)府輿圖》《上諭檔》《軍機(jī)處議覆檔》《朱批奏折》《溥儀檔》《新整溥儀檔》《宮中雜件》《欽定工部則例》《工部案卷》《錄副奏折》《諸陵規(guī)制尺寸略節(jié)》等檔案中都記載了大量與清東陵有關(guān)的人物和事件,尤其是大量內(nèi)務(wù)府檔案,對清東陵文化研究具有極高的、可供挖掘的文獻(xiàn)價值。《定陵工程黃冊》《定陵工料奏銷黃冊》《順?biāo)赍鷪@寢銷算黃冊》《菩陀峪金井安放帳》《菩陀峪萬年吉地銷算黃冊》《普祥峪萬年吉地銷算黃冊》是部分陵寢工程完成后核銷所有耗費工料、錢糧明細(xì)的決算冊;《工程備要》等定東陵工程籍本詳細(xì)輯錄了上諭、奏疏、施工監(jiān)理、施工預(yù)算、施工決算以及工程作法等與陵寢工程各個環(huán)節(jié)相關(guān)的內(nèi)容,能夠翔實反映普祥峪定東陵、菩陀峪定東陵的具體建設(shè)過程和細(xì)節(jié)[8],這些檔案文獻(xiàn)對清代陵寢建筑研究具有非常重要的參考價值。
另外,中國第二歷史檔案館的北洋內(nèi)務(wù)部檔案中收錄了與清東陵被盜案相關(guān)的部分史料,可作為清東陵檔案類文獻(xiàn)資料的重要補(bǔ)充來源[9]。
3.清東陵樣式雷圖檔的收集
自乾隆朝雷家璽規(guī)劃設(shè)計陵寢開始,清朝各陵寢的設(shè)計、修葺或重建,均由樣式雷世家承擔(dān)。由清代雷氏家族設(shè)計、繪制和寫作的建筑圖樣與文字檔冊,統(tǒng)稱樣式雷圖檔[10]。樣式雷圖檔不僅包括畫樣和燙樣,還包括記錄皇帝皇后的旨意、管理機(jī)構(gòu)堂官的堂諭從而形成的《旨意檔》、《堂諭檔》,以及在施工過程中形成的預(yù)算資料、工程日記、工程做法等多種資料,蘊(yùn)涵了關(guān)于清東陵陵寢建筑選址勘測、規(guī)劃設(shè)計以及施工的理念、過程、方法、人物、事件等詳情細(xì)節(jié)資料,具有獨特的建筑、藝術(shù)、美學(xué)研究價值和珍貴的文獻(xiàn)價值,2007 年被入選《世界文化遺產(chǎn)名錄》。當(dāng)前主要保存清代樣式雷圖檔的收藏單位有中國國家圖書館、北京故宮博物院、中國第一歷史檔案館、清華大學(xué)建筑學(xué)院和臺北故宮博物院,還有其他零散保存樣式雷圖檔的機(jī)構(gòu)包括中國國家博物館、日本東京大學(xué)、法國巴黎吉美博物館等[11]。樣式雷圖檔除了收集其紙質(zhì)原件之外,還可以對其拍照或者經(jīng)過3D 處理采集信息后轉(zhuǎn)換成數(shù)字化信息進(jìn)行收集。
4.其它類型清東陵文獻(xiàn)的收集
清東陵文獻(xiàn)典籍除了清東陵古籍文獻(xiàn)、檔案文獻(xiàn)和樣式雷圖檔等常見的主體文獻(xiàn)類型之外,還包括一些具有重要研究價值的其他特殊類型的文獻(xiàn),同樣需要重點進(jìn)行收集、整理和利用。例如,耗時達(dá)3年多完成、居清陵之冠、甚至 “為目前所知歷代帝王陵寢最華美者” 著稱的裕陵地宮,在地宮內(nèi)部的明堂券、穿堂券、金券以及各個洞券內(nèi)刻有大量佛教題材的石雕圖像和佛教經(jīng)文。據(jù)檔案記載,平水墻下的圍墻上均勻地雕刻著數(shù)以萬計的佛經(jīng)咒語中有藏文29464個字、梵文647個字。這些經(jīng)文和圖像雕刻,圖案復(fù)雜,內(nèi)容繁多,工藝絕倫,體現(xiàn)了中國古代傳統(tǒng)墓葬文化與祈福文化的思想內(nèi)涵,反映了在清代滿漢民族融合背景下經(jīng)濟(jì)、政治、宗教、藝術(shù)和哲學(xué)發(fā)展現(xiàn)狀,具有獨特的歷史、文化、藝術(shù)、美學(xué)等學(xué)術(shù)研究價值與商業(yè)應(yīng)用開發(fā)價值[12]。
另外,據(jù)不完全統(tǒng)計,清東陵當(dāng)中有順治帝的孝陵神功圣德碑碑文(1千余字漢文)、康熙帝的景陵圣德神功碑碑文(4千余字漢文)、乾隆帝的裕陵圣德神功碑碑文(2千余字漢文)及其他碑文共計近2萬字漢文[13]。其中,自雍正皇帝胤禛以弘揚康熙 “在位六十余年,功德隆盛,文章字?jǐn)?shù)甚多,一碑不能盡載” 為由將鐫刻康熙大帝一生文治武功的圣德神功碑亭詔建兩碑,一刻清文,一刻漢字,每個碑文長達(dá)4300多字,并自此成為定制[14]。由此可見,清東陵碑文也是不容忽視的重要文獻(xiàn)收集和整理對象。
除了清東陵陵寢建筑中雕刻形成的經(jīng)文、佛像和碑文之外,還有與清東陵有關(guān)的輿圖(如《清東陵風(fēng)水形勢全圖》)、照片(包括清東陵實景和清東陵文物)等,具有很大的歷史和文化研究價值,也應(yīng)作為特殊文獻(xiàn)、采用相應(yīng)的特殊手段進(jìn)行收集、整理和利用。此外,還應(yīng)深入民間進(jìn)行清東陵口述史資料的搶救、挖掘、收集與整理研究。
數(shù)字人文是進(jìn)一步提升文化遺產(chǎn)數(shù)字化建設(shè)和利用水平的重要途徑。數(shù)字人文通過將現(xiàn)代信息技術(shù)應(yīng)用于人文研究領(lǐng)域,為人文研究學(xué)者提供基于數(shù)據(jù)的、面向內(nèi)容的、智能化的和精準(zhǔn)的知識服務(wù),幫助人文研究學(xué)者從數(shù)據(jù)中發(fā)現(xiàn)現(xiàn)象或事物的本質(zhì)和彼此間的邏輯關(guān)聯(lián), “為人文社科研究插上了數(shù)字羽翼”[15]。
從清東陵文化研究的具體需求出發(fā),按照數(shù)字化、結(jié)構(gòu)化、知識化和平臺化四個依次遞進(jìn)的環(huán)節(jié)和流程,提出對清東陵文獻(xiàn)典籍進(jìn)行內(nèi)容描述、組織和揭示,并且應(yīng)用嵌入個人知識環(huán)境的各類分析和處理工具以及提供平臺化服務(wù)的清東陵文獻(xiàn)典籍?dāng)?shù)字化建設(shè)策略。具體環(huán)節(jié)和流程如圖1所示。
圖1 清東陵文獻(xiàn)典籍?dāng)?shù)字化建設(shè)環(huán)節(jié)和流程
根據(jù)清東陵文獻(xiàn)典籍實際存藏現(xiàn)狀,對清東陵文獻(xiàn)典籍進(jìn)行整理和組織,形成基本數(shù)字化素材庫,是清東陵數(shù)字化建設(shè)的第一個基礎(chǔ)性環(huán)節(jié)。
首先,根據(jù)清東陵文獻(xiàn)典籍的不同類型和特點,分類施策進(jìn)行整理和組織。其中,對于那些專門記載清東陵相關(guān)情況并且尚未被全文數(shù)字化的清東陵文獻(xiàn)典籍,根據(jù)文獻(xiàn)研究價值的大小和版本存世稀缺程度的高低,分步驟對其進(jìn)行全文數(shù)字化加工和整理;對于零散記載清東陵相關(guān)情況或零散存在于已建成的古籍全文數(shù)據(jù)庫中的清東陵文獻(xiàn)典籍,通過匯集散佚在文獻(xiàn)典籍中的相關(guān)內(nèi)容和知識點,形成文獻(xiàn)匯編專題數(shù)據(jù)庫;對于那些已經(jīng)被收錄進(jìn)入權(quán)威性的古籍全文數(shù)據(jù)庫的數(shù)字化清東陵文獻(xiàn)典籍,收集數(shù)字地址鏈接并形成導(dǎo)航。對以上各種類型的清東陵文獻(xiàn)典籍?dāng)?shù)字資源進(jìn)行有效整合,編制形成清東陵文獻(xiàn)典籍?dāng)?shù)字化書目目錄和各類型數(shù)字化清東陵文獻(xiàn)典籍索引,成為清東陵文獻(xiàn)典籍基本數(shù)字化素材庫的原始素材。選取人工錄入和機(jī)器掃描相結(jié)合進(jìn)行編碼設(shè)計的策略作為加工形成清東陵文獻(xiàn)典籍基本數(shù)字化素材庫的數(shù)字化方法。
在以上過程中,分別采用數(shù)據(jù)對象和元數(shù)據(jù)對應(yīng)的存儲方式進(jìn)行資源整合。其中,對于古籍、書冊、諭旨、檔案等形式的文獻(xiàn)資料進(jìn)行著錄標(biāo)引形成元數(shù)據(jù),建立索引實現(xiàn)主題檢索功能;對于圖紙、碑刻銘文和照片等形式的文獻(xiàn)資料,通過光學(xué)掃描技術(shù)(OCR)形成高質(zhì)量的圖像信息文件。同時,針對清東陵文獻(xiàn)典籍的文獻(xiàn)資源內(nèi)、外部特征設(shè)計描述元數(shù)據(jù),從而通過題名、責(zé)任者、主題詞、學(xué)科、中圖法分類號、所屬地域、版本信息、成書時代、文字說明等分別建立索引,支持用戶的高級檢索、族性檢索和個性化檢索。在這一環(huán)節(jié)中,還應(yīng)遵循我國古籍文獻(xiàn)數(shù)據(jù)加工流程、古籍版本選擇、古籍文獻(xiàn)文字處理等方面已有的數(shù)字化建設(shè)標(biāo)準(zhǔn),如《古籍著錄規(guī)則》(2008年)、《學(xué)術(shù)出版規(guī)范 古籍整理》(2015 年)、《古籍元數(shù)據(jù)規(guī)范》(2014年)、《古籍?dāng)?shù)字化工作手冊》((試用本),2015年)[16]等,加強(qiáng)對清東陵文獻(xiàn)典籍標(biāo)引和分類工作的標(biāo)準(zhǔn)化和規(guī)范化,從而具備標(biāo)準(zhǔn)性、兼容性和可擴(kuò)展性。
使清東陵文獻(xiàn)典籍實現(xiàn)從數(shù)字化文本到結(jié)構(gòu)化語料庫的轉(zhuǎn)換,是構(gòu)建有序化的清東陵文獻(xiàn)典籍知識庫的重要基礎(chǔ)。首先,由領(lǐng)域?qū)<覍η鍠|陵文獻(xiàn)典籍?dāng)?shù)字化素材進(jìn)行主題分析,研究并歸納不同文獻(xiàn)典籍多特征詞匯底表。然后,構(gòu)建基于清東陵文獻(xiàn)典籍的自動分詞、自動詞性標(biāo)注、自動命名實體識別和自動斷句模型,完成數(shù)字化文本的分詞、詞性、命名實體和斷句的自動標(biāo)注。其中,以古漢語自動分析技術(shù)為基礎(chǔ)進(jìn)行詞語切分,結(jié)合人工標(biāo)注和校對,以實體標(biāo)注方法,對清東陵文獻(xiàn)典籍中所記載的詞語、時間、地點、人物、事件等要素的命名實體以及詞性、地點GIS等信息進(jìn)行標(biāo)注。最后,創(chuàng)建實體同現(xiàn)表、人名表、人物表、時間人物表、地名表等數(shù)據(jù)表[17],最終得到一個多層級標(biāo)注的、結(jié)構(gòu)化的清東陵文獻(xiàn)典籍語料庫,成為后續(xù)構(gòu)建有序化的清東陵文獻(xiàn)典籍知識庫的基礎(chǔ)。在對元數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、對語料進(jìn)行整理、入庫與標(biāo)注的過程中應(yīng)注意保持語料的統(tǒng)一性和規(guī)范性,如,參照《我國數(shù)字圖書館標(biāo)準(zhǔn)與規(guī)范建設(shè)》標(biāo)準(zhǔn)中有關(guān)元數(shù)據(jù)與知識組織標(biāo)準(zhǔn),并遵循《GB/T 20530-2006文獻(xiàn)檔案資料數(shù)字化工作導(dǎo)則》、《GB/T 26816-2011信息資源核心元數(shù)據(jù)》[18][19]等相關(guān)文獻(xiàn)數(shù)字化建設(shè)標(biāo)準(zhǔn),對清東陵文獻(xiàn)典籍?dāng)?shù)字化建設(shè)流程進(jìn)行標(biāo)準(zhǔn)化和規(guī)范化管理,使其具備開放、合作、共享和可持續(xù)發(fā)展等功能特性。
知識庫是一種通過對知識客體分類、整理、加工、揭示、控制等知識組織方法進(jìn)行存儲和管理形成的數(shù)據(jù)集合體,是事實、規(guī)則和概念的集合[20]。利用計算機(jī)與網(wǎng)絡(luò)技術(shù)將清東陵文獻(xiàn)典籍變?yōu)榭蔀g覽、可檢索、語義關(guān)聯(lián)與知識重組的知識化的數(shù)字信息集合,形成有序化的清東陵文獻(xiàn)典籍知識庫,是這一環(huán)節(jié)需要實現(xiàn)的目標(biāo)。
首先,由清東陵文史研究專家指導(dǎo)專業(yè)人員利用語義標(biāo)注工具對清東陵文獻(xiàn)典籍進(jìn)行知識抽取與語義化處理,考慮同義詞、概念的歧義、概念的上下位關(guān)系,借助人工參與及現(xiàn)有的分詞工具,設(shè)計清東陵文獻(xiàn)典籍研究文檔分析器嵌入知識庫系統(tǒng)當(dāng)中,進(jìn)行語義提取、組織和處理,構(gòu)建形成結(jié)構(gòu)化的數(shù)據(jù)集合。然后,通過構(gòu)建領(lǐng)域本體的知識庫組織方式實現(xiàn)語義檢索,利用本體對相關(guān)資源進(jìn)行語義標(biāo)注,建立詞匯間的語義關(guān)系,并存儲對象類、屬性以及對象之間的語義關(guān)系,提供深度的語義層面知識,展開語義知識組織,滿足書目控制和規(guī)范控制等需求[21]。最后,在對清東陵文獻(xiàn)典籍的內(nèi)容進(jìn)行描述、組織和揭示的基礎(chǔ)上建立更多的語義關(guān)聯(lián),采用知識本體、關(guān)聯(lián)數(shù)據(jù)等方式組織、開放資源并提供平臺化服務(wù),提供能夠嵌入個人知識環(huán)境的各類分析處理和可視化工具[22]。最終使清東陵文獻(xiàn)典籍知識庫具備基于知識的語義檢索功能以及文本挖掘、語義分析和知識發(fā)現(xiàn)等數(shù)字人文功能。
構(gòu)建數(shù)字人文知識服務(wù)平臺是實現(xiàn)為人文研究學(xué)者提供人文研究支持和知識服務(wù)的核心目標(biāo)。該平臺將基于清東陵文獻(xiàn)典籍知識庫為領(lǐng)域?qū)W者與公眾用戶提供面向數(shù)字學(xué)術(shù)的各項知識服務(wù)的軟件應(yīng)用模塊,實現(xiàn)各項數(shù)字人文技術(shù)功能[23]。除了具有全文檢索功能外,具有研究支持功能、具有知識共享和人—機(jī)交互功能、具有基于超鏈接的瀏覽閱讀環(huán)境,以滿足不斷發(fā)展的學(xué)術(shù)研究和大眾閱讀的要求,并通過提供API接口,使得網(wǎng)絡(luò)上的資料、工具與平臺相互連接,促進(jìn)資源的整合和互聯(lián)[24]。
由于清東陵文獻(xiàn)典籍包括清東陵古籍文獻(xiàn)、清東陵檔案文獻(xiàn)、清東陵樣式雷圖檔以及陵寢中的經(jīng)文、佛像、碑文、輿圖、照片、口述史資料等多種類型的文獻(xiàn),需要在分類的基礎(chǔ)上對以上各種類型的文獻(xiàn)典籍進(jìn)行整合,以庫、類、目的樹形結(jié)構(gòu)進(jìn)行存儲和展示。經(jīng)數(shù)字化整理之后形成的知識庫數(shù)據(jù)集合,應(yīng)具備基于分類導(dǎo)航和分類檢索的數(shù)據(jù)統(tǒng)一檢索與獲取功能,為用戶提供科學(xué)、高效和便捷的知識服務(wù)。參照和結(jié)合傳統(tǒng)的文獻(xiàn)典籍分類方法和現(xiàn)代國際通行的圖書資料分類法,構(gòu)建符合現(xiàn)代用戶檢索思維和習(xí)慣的知識體系和文獻(xiàn)檢索系統(tǒng),從而便于用戶快速全面地了解清東陵文獻(xiàn)典籍收錄情況,充分挖掘和利用清東陵文獻(xiàn)中的知識信息。
文化遺產(chǎn)數(shù)字化是利用現(xiàn)代信息技術(shù)對文化遺產(chǎn)進(jìn)行深度保護(hù)、傳承、開發(fā)、利用與傳播的重要手段。將數(shù)字技術(shù)與人文學(xué)術(shù)研究深度融合,使文化遺產(chǎn)數(shù)字化平臺具有內(nèi)容分析、社會網(wǎng)絡(luò)分析、計量分析等功能,實現(xiàn)文化遺產(chǎn)資源提供、文化遺產(chǎn)知識關(guān)聯(lián)和文化遺產(chǎn)知識服務(wù)三方面功能的互鑒和可持續(xù)擴(kuò)展,是進(jìn)一步提升文化遺產(chǎn)數(shù)字化建設(shè)和利用水平的重要途徑[25]。通過借鑒數(shù)字人文學(xué)術(shù)的研究范式、研究方法和研究成果,提出建設(shè)清東陵文獻(xiàn)典籍?dāng)?shù)字化建設(shè)的策略,使清東陵數(shù)字人文知識服務(wù)平臺為清東陵文化研究提供新的研究視角、研究方法和研究工具,以增加清東陵文化研究的內(nèi)涵、潛力、廣度和深度,以期為后續(xù)進(jìn)一步開展清東陵數(shù)字人文知識服務(wù)平臺的具體技術(shù)實施方案進(jìn)行探索、打下基礎(chǔ)。
華北理工大學(xué)學(xué)報(社會科學(xué)版)2023年1期