国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)字人文視域下特藏建設(shè)與服務(wù)
——以當(dāng)代詩歌簽名本圖像庫為例

2022-10-21 05:15林忠娜
蘭臺內(nèi)外 2022年9期
關(guān)鍵詞:館藏關(guān)聯(lián)人文

文/林忠娜

1 數(shù)字人文研究與實(shí)踐

數(shù)字人文旨在數(shù)字化重構(gòu)人文資源,以提升其開放性、共享性、共建性和可訪問性,在海內(nèi)外學(xué)界引起了廣泛關(guān)注。國外數(shù)字人文實(shí)踐有70余年歷史,2002年國際數(shù)字人文組織聯(lián)盟成立,2005年國際數(shù)字人文中心網(wǎng)絡(luò)成立。對于數(shù)字人文的理論探討、應(yīng)用研究,數(shù)據(jù)開發(fā)層面已經(jīng)積累了一定的研究經(jīng)驗(yàn),其實(shí)踐也頗具規(guī)模。近十年國內(nèi)數(shù)字人文研究日益受到重視,2011年武漢大學(xué)成立第一個(gè)數(shù)字人文研究中心。數(shù)字人文的主要作用是為人文學(xué)科領(lǐng)域中長期存在的問題提供新的研究方法。數(shù)字人文領(lǐng)域仍存在需要人文學(xué)者和技術(shù)人員共同攻克的新課題。

在新型數(shù)字化技術(shù)、語義網(wǎng)以及人工智能等現(xiàn)代信息技術(shù)的推動下,內(nèi)容上融合學(xué)科主題詞表進(jìn)行語義描述,技術(shù)上結(jié)合數(shù)據(jù)科學(xué)、數(shù)字人文與知識圖譜,誕生了一系列圖書檔案博物機(jī)構(gòu)主導(dǎo)的高質(zhì)量數(shù)據(jù)庫。致力于資源保存、文化傳承與知識整序的圖書館將會成為主要責(zé)任主體?!胺e淀與超越:數(shù)字人文與中華文化”為主題的2020數(shù)字人文年會,一方面展現(xiàn)了數(shù)字人文對于實(shí)施積極的文獻(xiàn)搶救性保護(hù)、提供公共文化服務(wù)和專業(yè)學(xué)術(shù)研究等方面的現(xiàn)實(shí)意義;另一方面也加速推動圖書館界數(shù)字人文研究。

2 數(shù)字人文視域下特藏資源建設(shè)與服務(wù)

在數(shù)字、網(wǎng)絡(luò)信息隨手可得的新時(shí)代,圖書館的核心價(jià)值依存于其長期保存并不斷綿延發(fā)展的文明記憶資源。目前,圖書館的館藏尤其是數(shù)字館藏趨于同質(zhì)化,但特藏資源是圖書館在發(fā)展歷程中產(chǎn)生的兼具學(xué)科特色、文化內(nèi)涵和地域特征的館藏,是難以被模仿和復(fù)制的獨(dú)一無二的資源,是圖書館最有標(biāo)志性的資源,是圖書館的獨(dú)特標(biāo)簽。特藏文獻(xiàn)主要分為“特殊館藏”和“特色館藏”,優(yōu)先尋找本館具有先天優(yōu)勢的專題和目前業(yè)界亟待建設(shè)的專題,因其特色性和差異性服務(wù)會使圖書館館藏資源建設(shè)邁上新的臺階。

受人工智能、可視化、VR等技術(shù)的沖擊以及關(guān)聯(lián)數(shù)據(jù)、知識圖譜等知識探勘及呈現(xiàn)工具的影響,文獻(xiàn)收藏單位對重要性、唯一性、實(shí)時(shí)性、脆弱性的珍品進(jìn)行數(shù)字典藏,建置數(shù)據(jù)庫,既滿足用戶的搜尋檢索習(xí)慣,又提供數(shù)據(jù)彼此間的可能脈絡(luò)。國內(nèi)出現(xiàn)古籍、民國文獻(xiàn)、徽州文書等特藏資源整理與分析的探索與研究。

數(shù)字人文有三個(gè)維度:學(xué)科性、專業(yè)性、技術(shù)性。數(shù)字人文是多維度、立體化的網(wǎng)狀結(jié)構(gòu),推動形成各學(xué)科領(lǐng)域的數(shù)字人文學(xué)術(shù)共同體。挖掘傳統(tǒng)紙質(zhì)文獻(xiàn)在數(shù)字人文背景下的全新變化與潛力,深度融合索引與標(biāo)注等圖書館學(xué)科的專業(yè)方法,為數(shù)字人文的創(chuàng)新提供新資源。數(shù)字人文專題強(qiáng)調(diào)的是數(shù)字資源利用過程中的稀缺性、獨(dú)特性和關(guān)聯(lián)性,解決的是“如何用”和“用得好”的問題,二者達(dá)到理念上的契合。

3 當(dāng)代詩歌簽名本特藏專題文獻(xiàn)創(chuàng)建

3.1 創(chuàng)建意義

目前數(shù)據(jù)和結(jié)構(gòu)化知識已成為必不可少且無處不在的學(xué)術(shù)輸入和一級輸出,實(shí)現(xiàn)可查找、可訪問、可互操作和可重復(fù)使用的數(shù)據(jù)環(huán)境目標(biāo),促進(jìn)開放學(xué)術(shù)。

一是文獻(xiàn)資源的優(yōu)勢——研究對象的獨(dú)特性?!凹o(jì)鵬文庫”系當(dāng)代著名詩人紀(jì)鵬捐贈,其中中外詩集、散文集以及關(guān)于詩歌、散文創(chuàng)作理論、創(chuàng)作技法等內(nèi)容具有較強(qiáng)的系統(tǒng)性和相對的完整性,涵蓋了從新中國建立初期到21世紀(jì)初的一些重要國內(nèi)外詩歌作品,從中可以看出這一時(shí)期我國詩詞作品演進(jìn)和發(fā)展軌跡。

還有冰心、艾青、臧克家、賀敬之等著名作家、詩人親筆簽名的書籍。書中有人的加入,就有了靈魂與溫度。中國現(xiàn)當(dāng)代文學(xué)研究比較注重初版本,簽名本有可能是初版本。即使不是初版本,其價(jià)值和意義仍十分重大。簽名本不僅具有歷史價(jià)值、學(xué)術(shù)價(jià)值,而且還具有很高的文化價(jià)值,是研究文學(xué)檔案的一個(gè)新視角。目前,相當(dāng)比例的簽名本都為私人藏品,亦或散落于圖書市場,而公共藏品只占很小比例。藏書界重視有創(chuàng)意和價(jià)值的早期簽名書。一本兼具上下款和作者題詞的簽名書通常是拍賣會上的熱門商品。收藏家通常把重要作家代表作品的簽名本作為文物收藏。使簽名本圖書惠及更多的人,保護(hù)傳承這種文化現(xiàn)象,能將個(gè)人記憶整理為社會記憶,體現(xiàn)數(shù)字的人文關(guān)懷。

二是數(shù)字人文視域下——研究對象的關(guān)聯(lián)性。簽名本,包括收藏者本人的簽名,是研究文學(xué)史的一個(gè)新切入口:可以考察作者的文壇交往,了解作者的著書緣起等。程千帆、徐有富先生在《校讎廣義·典藏篇》 中指出:“藏書除有益于讀書、治學(xué)、創(chuàng)作外,也豐富了藏書家的生活內(nèi)容,使他們獲得高層次的精神享受?!边@些簽名本,曾被著名詩人紀(jì)鵬所有、使用并留有印跡。有“一經(jīng)品題身價(jià)十倍”之說。既有紀(jì)鵬先生的藏書章、長春市圖書館的館藏章、還有部分簽名人的鈐印,有上款、下款和作者題詞,是最完善最齊備的簽名本。利用關(guān)聯(lián)數(shù)據(jù)技術(shù)建立詩人譜系,立體呈現(xiàn)事件之間的關(guān)聯(lián)性,意味著資源開拓的更多可能。

3.2 創(chuàng)建思路

數(shù)字人文背景下,借鑒鄭巧英等編著的《國家圖書館圖像資源元數(shù)據(jù)規(guī)范和著錄規(guī)則》、曾子明等提出的一種面向數(shù)字人文的圖像語義描述模式等,先將簽名本詩歌特藏資源盡可能地?cái)?shù)字化,包含圖像數(shù)字化、文本化、結(jié)構(gòu)化和語義化。對詩詞簽名本信息進(jìn)行提取、描述、分類、多層次標(biāo)引,借助于字符識別技術(shù)、關(guān)聯(lián)數(shù)據(jù)技術(shù)和檢索技術(shù),可以從數(shù)字化轉(zhuǎn)向文本化,最終直達(dá)本體。深入揭示資源內(nèi)部知識單元,將數(shù)字文獻(xiàn)作為“數(shù)據(jù)”進(jìn)行處理和加工,進(jìn)行知識挖掘與探索。構(gòu)建起典藏體系并配套數(shù)據(jù)挖掘、數(shù)據(jù)分析、海量數(shù)據(jù)存儲技術(shù),有效促進(jìn)人文學(xué)者對當(dāng)代詩歌文獻(xiàn)的分析和研究。

研究以收藏、整理當(dāng)代詩歌簽名本和數(shù)字化為起點(diǎn),揭示文獻(xiàn)之間、文本之間的關(guān)系和語義。館藏中的資源并不是彼此孤立存在的,資源彼此間有關(guān)聯(lián)。以構(gòu)建關(guān)聯(lián)數(shù)據(jù)為目標(biāo),數(shù)字人文視域下特藏的持續(xù)拓展、科學(xué)整理和深度研究有待聘請相關(guān)領(lǐng)域的專家協(xié)助,同多學(xué)科背景的研究人員積極展開合作,使之成為精準(zhǔn)化學(xué)科服務(wù)的重要資源,利用關(guān)聯(lián)數(shù)據(jù)技術(shù)建立詩人譜系,輔助和促進(jìn)收藏,以立體的方式呈現(xiàn)出各事件之間的關(guān)聯(lián)性。

通過數(shù)字人文相關(guān)技術(shù)的應(yīng)用,揭示某一詩人、某一事件或某一流派研究進(jìn)展之間的關(guān)聯(lián),并以可視化的方式呈現(xiàn),為廣大研究人員提供更行之有效的數(shù)據(jù)檢索手段,幫助樹立人際網(wǎng)絡(luò)、學(xué)科發(fā)展歷程以及事件關(guān)聯(lián)圖譜。數(shù)字人文技術(shù)的介入,旨在解決三個(gè)主要問題:存儲、檢索與關(guān)聯(lián)。在此基礎(chǔ)上,提供信息檢索與文本標(biāo)注的功能;構(gòu)建內(nèi)容數(shù)據(jù)的關(guān)聯(lián)屬性,賦能文本的量化分析能力;多維展現(xiàn)數(shù)字內(nèi)容,創(chuàng)新文本研究范式。依托圖書館對信息的處理和服務(wù)能力,以及對信息來源、信息終端用戶的把握能力,以重要簽名本、歷史人物等為線索,采集保存?zhèn)€人記憶,創(chuàng)立集書籍、印刷品、展覽、講座、數(shù)據(jù)庫、專藏書架“五位一體”的全新服務(wù)模式,為讀者提供一種全方位、立體式的閱讀體驗(yàn)。

3.3 創(chuàng)建流程

構(gòu)建開放、集成、共享的多元信息整合服務(wù)平臺,有序化整理、深入挖掘并實(shí)現(xiàn)數(shù)據(jù)化,明確創(chuàng)建流程。一是對簽名本進(jìn)行深度、精確的元數(shù)據(jù)標(biāo)引;二是簽名信息數(shù)字化,通過富集數(shù)據(jù)和數(shù)據(jù)關(guān)聯(lián),幫助用戶發(fā)現(xiàn)新知識、提出新問題;三是以簽名本收錄為開端,通過運(yùn)維宣傳、查詢使用、評論交流,豐富簽名本資源信息網(wǎng)絡(luò);四是簽名信息挖掘,通過對文獻(xiàn)類別、讀者群體、閱讀時(shí)間、內(nèi)容喜好等數(shù)據(jù)的甄別分析,從以館員為主到探索與多方合作;五是發(fā)掘、搜集、輯錄、整理“簽名本詩論集”“簽名本詩歌作品集”“簽名本詩歌文獻(xiàn)圖像數(shù)據(jù)庫”及網(wǎng)站運(yùn)行。

3.4 開發(fā)館藏挖掘與應(yīng)用管理系統(tǒng)

按照課題的研究思路、研究方法及規(guī)劃設(shè)計(jì),設(shè)計(jì)“數(shù)字人文視域下館藏深度挖掘”系統(tǒng)。平臺通過對圖書書目信息、簽名信息及書名頁、版權(quán)頁、簽名頁圖像信息上傳,實(shí)現(xiàn)信息發(fā)布,由讀者在網(wǎng)頁端自由查看或發(fā)表閱讀感想書評等,通過讀者的行為操作實(shí)現(xiàn)“圖書-讀者-信息”之間關(guān)系的深度挖掘。系統(tǒng)的主要特點(diǎn)有:圖書信息展示,平臺權(quán)威發(fā)布的專家解讀,讀者評論發(fā)表,讀者行為統(tǒng)計(jì)等。

4 存在問題及解決策略

4.1 運(yùn)維及時(shí)性與眾包

對數(shù)據(jù)進(jìn)行標(biāo)記、評論,創(chuàng)建并上傳用戶原創(chuàng)內(nèi)容。一是充分利用網(wǎng)站后臺進(jìn)行管理,建立針對用戶反饋的及時(shí)響應(yīng)機(jī)制;二是設(shè)置專題的創(chuàng)作、審稿和維護(hù)的流程,讀者和館員共同維護(hù);三是挖掘具有審稿能力的讀者,通過管理員獲取相應(yīng)權(quán)限,參與到專題的勘誤工作,在線修訂專題內(nèi)容;四是定期擴(kuò)充與更新資源;五是及時(shí)優(yōu)化網(wǎng)站;六是補(bǔ)充網(wǎng)站功能。

初衷是保護(hù)、完善、研究和傳播,形成簽名本詩詞專題庫,面向?qū)I(yè)用戶提供開放共享服務(wù)。在圖書館網(wǎng)站發(fā)布、在線論壇、學(xué)術(shù)會議上等進(jìn)行推廣,然后發(fā)掘潛在受眾,并邀請志愿者參與。提升讀者的參與度和積極性,擴(kuò)展資源收集渠道,由讀者進(jìn)行數(shù)字館藏征集與整理的補(bǔ)充,征集更多的影像圖片及文本,貢獻(xiàn)新資源,或豐富、整合及重新配置現(xiàn)有資源,保障專題的多樣性。館員作為數(shù)字化資源OCR、數(shù)字資源組織描述及發(fā)布主體,完成元數(shù)據(jù)著錄。專題數(shù)據(jù)經(jīng)作者創(chuàng)作后,提交審稿人審核并反饋。審核通過后,平臺發(fā)布與公眾共享,開展平臺維護(hù)和管理工作,保障專題的專業(yè)性。

從數(shù)據(jù)資源、數(shù)字技術(shù)進(jìn)而到平臺系統(tǒng)都可以是眾包之源,眾包的志愿群體是實(shí)名的,對詩詞感興趣、通曉現(xiàn)代詩詞或具備一定信息技術(shù)技能的,且對參與價(jià)值認(rèn)可的成員進(jìn)行篩選并進(jìn)行操作培訓(xùn)。由我們發(fā)起,眾包志愿者參與配合,經(jīng)過相互協(xié)作共同保護(hù)、傳承和創(chuàng)建開放、互聯(lián)和智能的資源。志愿者實(shí)現(xiàn)信息技術(shù)水平、詩詞素養(yǎng)提升,學(xué)到新知識,獲得滿足感。項(xiàng)目以貢獻(xiàn)者排行榜進(jìn)行激勵(lì),對持續(xù)參與者進(jìn)行鼓勵(lì)。

4.2 數(shù)據(jù)結(jié)構(gòu)化與關(guān)聯(lián)

對圖像數(shù)據(jù)庫轉(zhuǎn)錄、修訂、標(biāo)記與分類,進(jìn)行標(biāo)準(zhǔn)化加工、組織和管理,轉(zhuǎn)化成結(jié)構(gòu)化數(shù)據(jù)。匯集詩歌文獻(xiàn)的封面、版權(quán)頁、目錄等出版發(fā)行信息,簽名信息,作者簡介、書摘、詩人紀(jì)鵬的標(biāo)注及藏書章、印章、款識、書中閱讀痕跡及館藏信息等。

關(guān)聯(lián)數(shù)據(jù)是一種語義知識圖譜,注重知識發(fā)布與關(guān)聯(lián)?;趫D數(shù)據(jù)庫實(shí)現(xiàn)的知識圖譜是廣義上的知識圖譜,注重知識挖掘與計(jì)算。嘗試基于圖數(shù)據(jù)庫實(shí)現(xiàn)知識圖譜和關(guān)聯(lián)數(shù)據(jù)的結(jié)合,對詩詞背景、典故、情感及地域特征,展開詩、人、地、掌故關(guān)聯(lián)性推理和交互式查詢。最終在圖書館特藏資源建設(shè)的基礎(chǔ)上,結(jié)合數(shù)字技術(shù)、公眾力量和社會資源共同完成簽名本詩詞專題數(shù)據(jù)庫建設(shè)。

4.3 研究維度薄弱與拓展

專題庫建設(shè)是從數(shù)據(jù)采集、加工、組織、存儲,到評估、開放、共享、利用的全流程。目前我們對詩詞簽名本特藏資源進(jìn)行了比較充分的分析與梳理,推動搭建面向?qū)W科的特藏資源研究與開發(fā)平臺,突出館藏特色,努力發(fā)揮館藏的數(shù)字人文研究價(jià)值,但評估、開放、共享、利用及優(yōu)化思考相對薄弱。

一是數(shù)據(jù)評估。對項(xiàng)目的平臺建設(shè)、宣傳,任務(wù)分發(fā)、部署,質(zhì)量控制及風(fēng)險(xiǎn)管理、經(jīng)費(fèi)支持等都要進(jìn)行評估,需要多部門、多學(xué)科、多元服務(wù)與多元支持,邀請數(shù)字人文學(xué)者、計(jì)算機(jī)專業(yè)人才、優(yōu)秀項(xiàng)目管理者及有關(guān)領(lǐng)域的法律顧問等,商議具有指導(dǎo)意義的方案。在評估基礎(chǔ)上進(jìn)一步細(xì)化拓展,完成對現(xiàn)代詩詞簽名本的知識組織和開發(fā)利用,注意館藏中高質(zhì)量圖像的保護(hù),后續(xù)研究需建立現(xiàn)代詩文文本標(biāo)注的語料庫。一邊建設(shè),一邊拓寬交流渠道,了解用戶需求與反饋,并及時(shí)改進(jìn)。

二是開源共享。使數(shù)據(jù)朝著RDF格式轉(zhuǎn)變,重視API標(biāo)準(zhǔn)化或者為不同類型用戶設(shè)置針對性訪問方法。開放的在線專題庫和開放數(shù)據(jù)平臺無疑會為研究人員提供隨時(shí)隨地訪問的便利,考證文獻(xiàn)的真實(shí)性、原本性,考證圖書版本演變源流等。但是基于版權(quán)的開放程度需應(yīng)對挑戰(zhàn),如提供鏈接服務(wù)過程中產(chǎn)生的侵權(quán)風(fēng)險(xiǎn),在開發(fā)圖片數(shù)據(jù)庫的過程中的著作權(quán)侵權(quán)風(fēng)險(xiǎn),如特定情況下,合理使用及著作權(quán)例外并不被法院所認(rèn)可等。協(xié)作和交互技術(shù)有待升級,數(shù)據(jù)安全和數(shù)據(jù)隱私安全有待保障,數(shù)據(jù)加密和脫敏技術(shù)有待升級。

三是增進(jìn)流通。簽名本專題庫承載文化信息的流通功能,實(shí)現(xiàn)簽名本價(jià)值最大程度的體現(xiàn),達(dá)到詩歌文獻(xiàn)信息資源共享。共享和反饋環(huán)境以及深度交互的渠道有待進(jìn)一步探索,數(shù)字化技術(shù)及數(shù)據(jù)管理技術(shù)要不斷升級。依照一套完整的技術(shù)規(guī)范,發(fā)揮關(guān)聯(lián)數(shù)據(jù)的價(jià)值,采用url作為唯一能定位的資源標(biāo)識符,可以實(shí)現(xiàn)簽名本資源多平臺共建共享,提升數(shù)字人文資源流動屬性。為提升簽名本圖像內(nèi)容的實(shí)用價(jià)值,應(yīng)利用知識圖譜、本體方法論、語義網(wǎng)等技術(shù)手段提升文字資源等呈現(xiàn)范式與知識體系構(gòu)建。

四是提升實(shí)用價(jià)值??梢暬治?、統(tǒng)計(jì)分析、關(guān)聯(lián)分析等會為研究帶來新的發(fā)現(xiàn),帶著情懷的簽名本,有人的故事、也有書的故事,是精神思想交流和私人友誼交往的見證。每本藏書都有溫度,有態(tài)度,有故事。講好這些故事,數(shù)據(jù)分析技術(shù)及可視化技術(shù)要不斷升級。利用平臺的可視化分析軟件功能使眾包數(shù)據(jù)、統(tǒng)一檢索與分析數(shù)據(jù)等功能發(fā)現(xiàn)知識發(fā)現(xiàn),實(shí)現(xiàn)數(shù)據(jù)的智慧化使用。

五是資源優(yōu)化。數(shù)字人文研究,圖像是重要的研究資料,包括原照和數(shù)字化后的圖像文獻(xiàn),標(biāo)準(zhǔn)規(guī)范地展現(xiàn)詩歌簽名本領(lǐng)域圖像的特性,有待深入研究。項(xiàng)目選擇自建平臺,由項(xiàng)目組成員,按照課題思路,創(chuàng)建獨(dú)立的項(xiàng)目網(wǎng)站。版本略低,結(jié)構(gòu)、流程、功能及測試等有待優(yōu)化。加強(qiáng)機(jī)構(gòu)之間、作者之間的交流,加強(qiáng)與高校、科研機(jī)構(gòu)、圖書館的交流合作,從實(shí)體到數(shù)字圖像相關(guān)技術(shù)、圖像數(shù)字資源的描述、圖像語義層次的描述、分類及元數(shù)據(jù)屬性特征、關(guān)聯(lián)關(guān)系予以揭示并進(jìn)行優(yōu)化。

猜你喜歡
館藏關(guān)聯(lián)人文
樹德娃的太空之旅 學(xué)習(xí)設(shè)計(jì)
美在山水,魂在人文
最樸素的人文
名家書畫:浙江省文史研究館館藏書畫作品選刊
奇趣搭配
拼一拼
智趣
人文社科
2004年~2012年檔案館與圖書館館藏量發(fā)展比較
介紹兩件館藏青銅器