国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

古籍?dāng)?shù)字人文平臺(tái)對(duì)民國(guó)檔案開(kāi)放利用的借鑒意義

2021-06-16 14:25陳宇
檔案管理 2021年3期
關(guān)鍵詞:上海圖書館

摘? 要:本文以上海圖書館為代表的古籍?dāng)?shù)字人文平臺(tái)建設(shè)是館藏資源開(kāi)放利用的新型探索,通過(guò)總結(jié)當(dāng)前中文古籍聯(lián)合目錄及循證平臺(tái)、家譜知識(shí)服務(wù)平臺(tái)的基本特點(diǎn),分析了對(duì)民國(guó)檔案開(kāi)放利用的幾點(diǎn)啟示,提出了民國(guó)檔案知識(shí)服務(wù)平臺(tái)建設(shè)的必要性和建設(shè)路徑。

關(guān)鍵詞:民國(guó)檔案;數(shù)字人文平臺(tái);開(kāi)放利用;上海圖書館;檔案整理

Abstract: The construction of digital humanistic platform for ancient books represented by Shanghai Library is a new exploration for the open utilization of library resources. By summarizing the basic characteristics of current Chinese ancient books joint catalog, evidence-based platform and genealogy knowledge service platform, this paper analyzes some enlightenment for the open utilization of Archives in the Republic of China, and puts forward the necessity and preliminary ideas for the construction of Archives knowledge service platform in the Republic of China.

Keywords: Archives of the republic of china; Digital human platform; Open use; Shanghai library; Archive organization

中國(guó)第二歷史檔案館是中華民國(guó)時(shí)期(1912-1949)檔案典藏的重鎮(zhèn),近年來(lái),二史館通過(guò)縮微復(fù)制、數(shù)字化掃描、編研出版等方式開(kāi)放利用了大批檔案史料。筆者借二史館全面開(kāi)展全館以及全國(guó)民國(guó)檔案文件級(jí)目錄著錄工作之機(jī),以上海圖書館為代表的古籍?dāng)?shù)字人文平臺(tái)建設(shè)為例,希冀有裨于后期民國(guó)檔案知識(shí)服務(wù)平臺(tái)的建設(shè)。

1 古籍?dāng)?shù)字人文平臺(tái)建設(shè)特點(diǎn)

上海圖書館充分利用自身古籍、家譜資源收藏優(yōu)勢(shì),搭建了中文古籍聯(lián)合目錄及循證平臺(tái)、家譜知識(shí)服務(wù)平臺(tái)這兩個(gè)數(shù)字人文平臺(tái)試驗(yàn)型項(xiàng)目。主要實(shí)現(xiàn)了幾點(diǎn)功能:

1.1 循證研究。兩個(gè)平臺(tái)查詢到的數(shù)據(jù),包含聯(lián)合目錄、古籍目錄或家譜目錄中的所有數(shù)據(jù)。在古籍循證平臺(tái),讀者可以查看檢索的作品在歷史上不同目錄書里提到的次數(shù),從側(cè)面反引出了該時(shí)期此本古籍受到的重視程度。檢索結(jié)果可以按照以下分面進(jìn)一步篩選:館藏機(jī)構(gòu)、版本類型、版本時(shí)間、責(zé)任者、批校序跋者,可查看作者的詳細(xì)信息,以及作者批校題跋過(guò)的書籍,可以通過(guò)點(diǎn)擊直接跳轉(zhuǎn)到上海圖書館的人名規(guī)范庫(kù)中。

在家譜知識(shí)平臺(tái),讀者可以篩選譜名、姓氏、堂號(hào)、家譜責(zé)任者、先祖、名人等任一字段,詳情頁(yè)為讀者提供家譜的版本收藏地和姓氏溯源等信息。

1.2 知識(shí)節(jié)點(diǎn)。古籍循證平臺(tái)的古籍目錄收有歷史上有名的官修、私家、史志、藏書樓、版本目錄書,輔之以人名、地名、印章、刻工、避諱字等額外規(guī)范數(shù)據(jù),有助于學(xué)者循證版本、考鏡流藏。家譜知識(shí)服務(wù)平臺(tái)以《中國(guó)家譜總目》所收錄,以及來(lái)自全球多地收藏機(jī)構(gòu)所藏的5萬(wàn)4千余種家譜目錄為基礎(chǔ),析出姓氏608個(gè),先祖名人7萬(wàn)余個(gè),堂號(hào)3萬(wàn)余個(gè),譜籍地名1600余個(gè),[1]以知識(shí)組織的方法和關(guān)聯(lián)數(shù)據(jù)技術(shù),重構(gòu)了上海圖書館的家譜服務(wù)。

1.3 聯(lián)合檢索。古籍循證平臺(tái)目前收錄有1400余家機(jī)構(gòu)的古籍館藏目錄,其中上海圖書館的古籍館藏、哈佛燕京圖書館的中文善本館藏、加州柏克萊大學(xué)東亞圖書館的中文善本館藏、澳門大學(xué)圖書館的中文古籍館藏可在線訪問(wèn)部分掃描影像全文。

1.4 地圖瀏覽。數(shù)字人文平臺(tái)的地圖瀏覽功能,運(yùn)用語(yǔ)義可視化技術(shù)、GIS技術(shù),實(shí)現(xiàn)了在地圖上顯示古籍或家譜的館藏地。即在地圖上畫圈,則可以顯示所畫圈內(nèi)的古籍、家譜收藏機(jī)構(gòu)。點(diǎn)擊機(jī)構(gòu),檢索出該機(jī)構(gòu)的所有館藏古籍、家譜,為研究者提供內(nèi)容分析統(tǒng)計(jì)、時(shí)空及可視化工具和社會(huì)關(guān)系分析。

2 對(duì)民國(guó)檔案開(kāi)放利用的幾點(diǎn)啟示

2.1 挖掘既有成果,建立民國(guó)檔案文獻(xiàn)語(yǔ)料庫(kù)。家譜知識(shí)服務(wù)平臺(tái)的搭建基礎(chǔ)已有的館藏資源和研究成果,包括了上世紀(jì)出版的《上海圖書館館藏家譜提要》《中國(guó)家譜總目》《中國(guó)家譜通論》《中國(guó)家譜資料選編》等工具書。

二史館編輯出版了包括中華民國(guó)史檔案資料匯編、叢刊、叢書在內(nèi)共200余種10億字的檔案史料,并已完成以民國(guó)工具書為主的5740萬(wàn)頁(yè)資料的全文識(shí)別。

下一步,可以利用新的技術(shù)手段來(lái)重新組織研究成果,抽取民國(guó)公文、職官、機(jī)構(gòu)、軍事、人名、區(qū)劃等,與異名別稱規(guī)則、分類規(guī)則、斷句標(biāo)點(diǎn)規(guī)則、書法字體、圖片唱片等形成豐富的語(yǔ)料庫(kù),為實(shí)現(xiàn)規(guī)范數(shù)據(jù)的重用和共享構(gòu)建基礎(chǔ)。

2.2 充分利用語(yǔ)料庫(kù)實(shí)現(xiàn)民國(guó)檔案整理與開(kāi)發(fā)自動(dòng)化。當(dāng)下數(shù)字化的古籍資源除了實(shí)現(xiàn)文本字符的數(shù)字化,還需具有“研究支持”功能,即能夠提供內(nèi)容本身的統(tǒng)計(jì)和計(jì)量信息。[2]

通過(guò)基數(shù)龐大的語(yǔ)料庫(kù),組織編纂期刊論文索引、職官機(jī)構(gòu)索引、卷宗主題索引等各類索引,構(gòu)建起語(yǔ)料庫(kù)之間的元數(shù)據(jù)交叉聯(lián)系,并結(jié)合語(yǔ)言學(xué)方法,實(shí)現(xiàn)計(jì)算機(jī)的輔助識(shí)別、自動(dòng)???、自動(dòng)斷句,從而實(shí)現(xiàn)成果挖掘和知識(shí)增值功能。此外,還可以衍生出多種子目級(jí)檢索系統(tǒng),極大豐富民國(guó)檔案利用的視角和方式。

2.3 基于UGC(用戶貢獻(xiàn)內(nèi)容)實(shí)現(xiàn)公眾互動(dòng)與檢錯(cuò)。上海圖書館另建設(shè)有歷史文獻(xiàn)眾包中心,通過(guò)公布部分掃描圖片,允許研究專家、學(xué)生、民間團(tuán)體依據(jù)識(shí)別難度,自主協(xié)同錄入,并且可以通過(guò)撰寫反饋與不同人士交流互動(dòng)。經(jīng)過(guò)認(rèn)證的專家登錄系統(tǒng)后,可直接修改數(shù)據(jù),經(jīng)審核通過(guò)后發(fā)布。

這種基于UGC的知識(shí)平臺(tái),將會(huì)大大降低民國(guó)檔案目錄著錄過(guò)程中由于少部分抽檢帶來(lái)的錯(cuò)誤率。系統(tǒng)會(huì)像“百度百科”一樣記錄每一次修改。隨著民國(guó)檔案文獻(xiàn)語(yǔ)料庫(kù)的定期更新,讀者與編者也將更容易發(fā)現(xiàn)數(shù)據(jù)沖突和錯(cuò)漏,實(shí)時(shí)修改,保證民國(guó)檔案著錄編目的可持續(xù)性發(fā)展。

所以未來(lái)的民國(guó)檔案開(kāi)放利用平臺(tái)不能僅是一個(gè)展示系統(tǒng),還需要是一個(gè)可寫的、支持眾包的平臺(tái)。

2.4 運(yùn)用語(yǔ)義可視化技術(shù)、GIS技術(shù)滿足多層次需求?;跁r(shí)空的瀏覽、地圖畫圈瀏覽等功能,都在功能設(shè)計(jì)和內(nèi)容組織上增加了用戶使用的趣味性,既滿足普通大眾了解民國(guó)檔案、認(rèn)識(shí)民國(guó)歷史的需求,也能支持學(xué)者基于概念及概念間關(guān)系匹配的高級(jí)檢索。

3 民國(guó)檔案知識(shí)服務(wù)平臺(tái)的建設(shè)路徑

上海圖書館數(shù)字人文平臺(tái)的知識(shí)網(wǎng)絡(luò)基于索引式的研究成果,這種模式的不足便是分類提供的信息固然有價(jià)值,但信息量仍然有限。通過(guò)進(jìn)一步對(duì)中文電子圖書全文數(shù)據(jù)庫(kù)如超星、方正電子圖書等,古籍?dāng)?shù)據(jù)庫(kù)如愛(ài)如生、翰堂典藏、雕龍等了解使用,可以發(fā)現(xiàn)借助云存儲(chǔ)技術(shù),建設(shè)基于多種數(shù)據(jù)庫(kù)的知識(shí)服務(wù)平臺(tái)將能夠更大程度上滿足用戶需求。

比較成功的案例就是中華書局基于14個(gè)數(shù)據(jù)庫(kù)建設(shè)的籍合網(wǎng)以及商務(wù)印書館聚合《新華字典》《現(xiàn)代漢語(yǔ)詞典》《古代漢語(yǔ)詞典》等權(quán)威實(shí)用的字、詞典上線的語(yǔ)言資源知識(shí)服務(wù)平臺(tái)(涵芬APP)。筆者在此對(duì)民國(guó)檔案知識(shí)服務(wù)平臺(tái)提出幾點(diǎn)功能模塊上的建設(shè)思路。

3.1 學(xué)術(shù)功能。首先,要建立民國(guó)檔案文獻(xiàn)語(yǔ)料庫(kù),抽取民國(guó)公文、職官、機(jī)構(gòu)、軍事、人名、區(qū)劃等,與異名別稱規(guī)則、分類規(guī)則、斷句標(biāo)點(diǎn)規(guī)則、書法字體、圖片唱片等形成豐富的語(yǔ)料庫(kù),為實(shí)現(xiàn)規(guī)范數(shù)據(jù)的重用和共享構(gòu)建基礎(chǔ)。

其次,通過(guò)基數(shù)龐大的語(yǔ)料庫(kù),組織編纂期刊論文索引、職官機(jī)構(gòu)索引、卷宗主題索引等各類索引,構(gòu)建起語(yǔ)料庫(kù)之間的元數(shù)據(jù)交叉聯(lián)系,實(shí)現(xiàn)從一鍵檢索、全文查找、章節(jié)閱讀、原圖查看到條目引用的全流程服務(wù)。

最后,開(kāi)發(fā)民國(guó)檔案循證服務(wù),通過(guò)對(duì)同一主題聚類分析,展現(xiàn)近現(xiàn)代人、時(shí)、地、事的多維情況;通過(guò)指定書籍、指定字詞分類查找字頻、詞頻統(tǒng)計(jì),允許導(dǎo)出數(shù)據(jù)表格,滿足計(jì)量分析需求。

3.2 共建功能。首先,要提升知識(shí)服務(wù)模式的共建化水平,平臺(tái)可以打通館藏資源和社會(huì)資源、工作人員與檔案館、讀者與工作人員之間的聯(lián)系,而且挖掘出廣大社會(huì)讀者的知識(shí)資源。

其次,轉(zhuǎn)變?nèi)藛T服務(wù)角色,構(gòu)建多主體協(xié)同供給機(jī)制。借助平臺(tái)可以實(shí)現(xiàn)知識(shí)資源的交換,實(shí)現(xiàn)用戶參與與知識(shí)貢獻(xiàn)的互動(dòng)關(guān)系,逐步形成檔案館主導(dǎo),多主體協(xié)同共建的知識(shí)聚合格局。

最后,要注重知識(shí)挖掘、激勵(lì)策略等機(jī)制的實(shí)現(xiàn),將其轉(zhuǎn)化為用戶持續(xù)行為的動(dòng)力。借助于民國(guó)檔案文件級(jí)目錄著錄工作,實(shí)現(xiàn)全體用戶參與的民國(guó)知識(shí)網(wǎng)絡(luò)節(jié)點(diǎn)更新,以及基于GIS的民國(guó)區(qū)劃、大事記、戰(zhàn)役系統(tǒng)的搭建。

3.3 書城功能。首先,開(kāi)放部分館藏民國(guó)期刊書籍、已出版大型叢書細(xì)目。融合既有民國(guó)史料題材,征集學(xué)術(shù)及文學(xué)創(chuàng)作、創(chuàng)意,開(kāi)發(fā)繪本、有聲書等特色文創(chuàng),加強(qiáng)民國(guó)檔案的歷史文化教育功能。

其次,要統(tǒng)一網(wǎng)絡(luò)文獻(xiàn)資源采集的標(biāo)準(zhǔn)規(guī)范。針對(duì)目前網(wǎng)絡(luò)文獻(xiàn)資源標(biāo)引不規(guī)范導(dǎo)致難以二次開(kāi)發(fā)利用的問(wèn)題,探索建立“垂直典藏、專題建設(shè)、深層檢索”的元數(shù)據(jù)加工制度,實(shí)施分類管理。[3]

最后,構(gòu)建網(wǎng)絡(luò)文獻(xiàn)資源的信息組織機(jī)制。檔案館作為知識(shí)的存儲(chǔ)機(jī)構(gòu),可以承擔(dān)對(duì)網(wǎng)絡(luò)文獻(xiàn)資源的采集與信息組織與分析機(jī)制的探索,制定網(wǎng)絡(luò)文獻(xiàn)資源采集、編目、管理工作規(guī)范。引導(dǎo)社會(huì)公眾參與對(duì)網(wǎng)絡(luò)文獻(xiàn)資源的信息抽取、知識(shí)組織等環(huán)節(jié),引入網(wǎng)絡(luò)文獻(xiàn)資源觀察評(píng)估制度,編制網(wǎng)絡(luò)文獻(xiàn)資源的年度報(bào)告書,逐步建立起一個(gè)嵌入數(shù)字人文服務(wù)平臺(tái),與既有檔案資源數(shù)據(jù)相互補(bǔ)充的互聯(lián)網(wǎng)資源服務(wù)體系。

4 建立民國(guó)檔案知識(shí)服務(wù)平臺(tái)的意義

4.1 知識(shí)服務(wù)模式的完善。長(zhǎng)期以來(lái),民國(guó)檔案由于涉密等客觀因素,開(kāi)放利用程度遠(yuǎn)小于古籍文獻(xiàn)資源,目前仍局限于到館查檔,這實(shí)際并不利于服務(wù)模式的升級(jí)、服務(wù)內(nèi)容的豐富。

以“知識(shí)地圖”的建立為例,布魯克斯提出的“知識(shí)地圖”是“以知識(shí)網(wǎng)絡(luò)的形式來(lái)說(shuō)明知識(shí)單元的發(fā)展變化,從而明確學(xué)科知識(shí)的發(fā)展變化”,[4]基于這個(gè)理念建設(shè)的民國(guó)檔案知識(shí)地圖可以有效組織檔案館知識(shí)資源的總目錄并揭示各知識(shí)資源目錄間關(guān)系。民國(guó)檔案開(kāi)放利用平臺(tái)可以打通館藏資源和外部資源、傳統(tǒng)載體與現(xiàn)代載體、館員與檔案館間、讀者與館員間的聯(lián)系,而且挖掘出廣大社會(huì)讀者的知識(shí)資源。[5]

4.2 人員服務(wù)角色的轉(zhuǎn)變。社會(huì)讀者知識(shí)資源的介入并不會(huì)替代檔案館工作人員應(yīng)有的作用。因?yàn)檫@個(gè)平臺(tái)提供檢索服務(wù)的這背后是線性化文獻(xiàn)檢索向非線性化檢索方式的轉(zhuǎn)變,具有支持知識(shí)發(fā)現(xiàn)、獲取、增值和管理的強(qiáng)大功能。[6]檔案館工作人員需要利用自身的知識(shí)資源將不同介質(zhì)、不同地點(diǎn)的各類知識(shí)資源整合、聯(lián)結(jié)、排序,在浩如煙海的平臺(tái)數(shù)據(jù)資源中尋找到“知識(shí)節(jié)”,從而使不同層次、不同專業(yè)背景的讀者在知識(shí)網(wǎng)絡(luò)中完成資源的利用需求。

4.3 “群體智慧”模式的實(shí)現(xiàn)。非遺檔案資源建設(shè)中提出一種“群體智慧”模式,即“構(gòu)建一個(gè)公眾可以隨時(shí)上傳、共享自己發(fā)現(xiàn)和獲取的非遺資源,并對(duì)現(xiàn)有資源進(jìn)行鑒

定、評(píng)價(jià)和分級(jí),檔案部門只需對(duì)資源進(jìn)行篩選和匯總”。[7]

這種集體協(xié)作的創(chuàng)作方式拓展了UGC(用戶貢獻(xiàn)內(nèi)容)的外延,使用戶由貢獻(xiàn)者轉(zhuǎn)化為主導(dǎo)者。民國(guó)檔案可以通過(guò)開(kāi)放利用平臺(tái)群體決策模塊的設(shè)置,由用戶上傳民國(guó)檔案史料信息,經(jīng)審核后建設(shè)用戶數(shù)據(jù)集,進(jìn)而建立起與館藏?cái)?shù)據(jù)間的聯(lián)系,以雙向融合后的形式向用戶呈現(xiàn)。

4.4 民國(guó)檔案著錄評(píng)估體系的建立。“十三五”期間啟動(dòng)的民國(guó)檔案文件級(jí)目錄著錄與采集工作,全方面覆蓋各省、自治區(qū)、直轄市檔案館館藏的民國(guó)時(shí)期經(jīng)濟(jì)、文化、民俗、商業(yè)等民國(guó)檔案基礎(chǔ)信息,將豐富民國(guó)檔案資源的內(nèi)涵和外延,有助于促進(jìn)各學(xué)科在各階段發(fā)展歷史的有效銜接,充分發(fā)揮民國(guó)檔案在服務(wù)社會(huì)中的價(jià)值。[8]通過(guò)對(duì)民國(guó)檔案開(kāi)放利用平臺(tái)使用前、中、后反饋報(bào)錯(cuò)意見(jiàn)的跟蹤研究,可以補(bǔ)足按比例抽檢帶來(lái)的疏漏,了解外包數(shù)據(jù)資源的實(shí)際產(chǎn)出效益,利用檔案著錄評(píng)估體系對(duì)平臺(tái)進(jìn)行分析研究,在兩相對(duì)照之中,把控民國(guó)檔案著錄的發(fā)展方向,從而進(jìn)一步優(yōu)化檔案卷宗文件的編目著錄工作。[9]

參考文獻(xiàn):

[1]劉小琴,吳建中主編.數(shù)字圖書館發(fā)展趨勢(shì)研究報(bào)告[M].上海:上??茖W(xué)技術(shù)文獻(xiàn)出版社,2016:163.

[2]王雅戈著.古籍計(jì)算機(jī)自動(dòng)索引研究 以民國(guó)農(nóng)業(yè)文獻(xiàn)自動(dòng)索引為例[M].蕪湖:安徽師范大學(xué)出版社,2013:2.

[3]李曉明,馬寧寧.國(guó)家圖書館網(wǎng)絡(luò)信息采集的實(shí)踐與發(fā)展[J].網(wǎng)絡(luò)資源采集與數(shù)字資源長(zhǎng)期保存學(xué)術(shù)研討會(huì)論文集,2013:15-17.

[4]尉遲文珠.試論我國(guó)高校圖書館知識(shí)服務(wù)模式構(gòu)建[D].天津師范大學(xué),2007:27.

[5]陳宇.應(yīng)急保障視角下對(duì)網(wǎng)絡(luò)資源“集聚效應(yīng)”的重新審視[J].高校圖書館工作,2020(05): 50.

[6]陳丹.數(shù)字出版產(chǎn)業(yè)創(chuàng)新模式研究[M].北京:科學(xué)技術(shù)文獻(xiàn)出版社,2012:99.

[7]周耀林等.基于群體智慧的非物質(zhì)文化遺產(chǎn)檔案資源建設(shè)探析[J].中國(guó)檔案研究:第1輯,2015:112.

[8]許茵.國(guó)家重點(diǎn)檔案文件級(jí)目錄題名著錄問(wèn)題探析——以全國(guó)民國(guó)檔案文件級(jí)目錄著錄為例[J].檔案學(xué)通訊,2018(06): 59-61.

[9]姜?dú)J芳.機(jī)關(guān)數(shù)字檔案室建設(shè)淺議[J].檔案管理,2020(04):78+80.

(作者單位:中國(guó)第二歷史檔案館 來(lái)稿日期:2021-01-26)

猜你喜歡
上海圖書館
上海圖書館俄羅斯文學(xué)閱讀情況研究
基于用戶需求和用戶體驗(yàn)的圖書館空間建設(shè)分析
圖書館中文圖書借閱排行榜(2019年12月)
基于微博互動(dòng)的圖書館用戶信息需求研究
汲古慧今 傳習(xí)經(jīng)典
基于OCLC平臺(tái)的上海圖書館外文文獻(xiàn)編目實(shí)踐
上海圖書館百科全書收藏與服務(wù)
數(shù)字閱讀推廣新形式研究
中美公共圖書館社交媒體營(yíng)銷比較研究
創(chuàng)新創(chuàng)業(yè)環(huán)境下公共圖書館企業(yè)信息服務(wù)的轉(zhuǎn)型