吳艷飛 張強(qiáng) 周樹斌 汪睿思 周洪
摘要:[目的/意義]革命文物承載著深厚的歷史文化價(jià)值,對(duì)其進(jìn)行知識(shí)組織研究有助于推動(dòng)革命文物資源在數(shù)智時(shí)代的開發(fā)利用,為實(shí)現(xiàn)革命文物資源的知識(shí)關(guān)聯(lián)與發(fā)現(xiàn)研究提供新路徑。[方法/過程] 以大別山革命文物為研究對(duì)象,首先,通過構(gòu)建本體模型實(shí)現(xiàn)對(duì)革命文物資源領(lǐng)域內(nèi)概念的規(guī)范化描述;其次,在分析革命文物資源結(jié)構(gòu)特征的基礎(chǔ)上,對(duì)不同來源與結(jié)構(gòu)的數(shù)據(jù)進(jìn)行實(shí)體、屬性和關(guān)系抽取,并利用知識(shí)融合技術(shù)解決歧義問題;最后,將數(shù)據(jù)存儲(chǔ)到Neo4j圖數(shù)據(jù)庫中完成革命文物知識(shí)圖譜的構(gòu)建,以實(shí)現(xiàn)對(duì)革命文物資源的多維知識(shí)發(fā)現(xiàn)研究。[結(jié)果/結(jié)論]通過構(gòu)建革命文物知識(shí)圖譜,可以對(duì)革命文物資源進(jìn)行深層次知識(shí)挖掘,實(shí)現(xiàn)對(duì)其知識(shí)單元的細(xì)粒度分析與知識(shí)關(guān)聯(lián),為革命文物資源的智能化應(yīng)用奠定基礎(chǔ)。
關(guān)鍵詞:革命文物;知識(shí)圖譜;數(shù)字人文;知識(shí)發(fā)現(xiàn)
分類號(hào):G251.2
引用格式:吳艷飛, 張強(qiáng), 周樹斌, 等. 數(shù)字人文視角下的大別山革命文物知識(shí)圖譜構(gòu)建[J/OL]. 知識(shí)管理論壇, 2024, 9(2): 148-160 [引用日期]. http://www.kmf.ac.cn/p/384/. (Citation: Wu Yanfei, Zhang Qiang, Zhou Shubin, et al. Construction of Knowledge Graph of Dabie Mountain Revolutionary Cultural Relics from the Perspective of Digital Humanities [J/OL]. Knowledge Management Forum, 2024, 9(2): 148-160 [cite date]. http://www.kmf.ac.cn/p/384/.)
革命文物是中國共產(chǎn)黨領(lǐng)導(dǎo)人民群眾在追求民族復(fù)興的實(shí)踐與奮斗過程中所保留下來的歷史遺存物,承載中國革命的偉大歷程與光榮歷史,蘊(yùn)涵豐富的革命文化與紅色精神。當(dāng)前黨和政府從政策方面對(duì)革命文物資源的保護(hù)利用給予高度重視。2018年,中共中央辦公廳、國務(wù)院辦公廳頒布了《關(guān)于實(shí)施革命文物保護(hù)利用工程(2018—2022年)的意見》,對(duì)開展革命文物保護(hù)利用工程提出具體要求[1]。習(xí)近平總書記在2021年召開的全國革命文物工作會(huì)議中,明確了加強(qiáng)革命文物保護(hù)工作對(duì)紅色文化的弘揚(yáng)與傳承具有重要作用[2]。革命文物是偉大革命斗爭中歷史事件的縮影,承擔(dān)著賡續(xù)紅色基因的責(zé)任[3]。實(shí)施革命文物資源的深度開發(fā)利用,不僅可以直觀全面地挖掘文物中蘊(yùn)含的歷史知識(shí),還可以集中彰顯中國偉大革命歷程的獨(dú)特魅力,發(fā)揮革命文物以史鑒今、資政育人的重要作用。
現(xiàn)代信息技術(shù)發(fā)展的浪潮為人文學(xué)科研究提供了新思路與方法,拓寬了人文研究范疇,為文化遺產(chǎn)領(lǐng)域資源的傳承與保護(hù)提供技術(shù)支撐?,F(xiàn)階段,我國的文化遺產(chǎn)領(lǐng)域資源建設(shè)側(cè)重于應(yīng)用現(xiàn)代技術(shù)進(jìn)行數(shù)字化加工與存儲(chǔ),忽視了對(duì)資源的深度挖掘與規(guī)范化表示。為解決這一問題,需要利用語義網(wǎng)技術(shù)對(duì)資源進(jìn)行細(xì)粒度分析及關(guān)聯(lián)聚合,從而實(shí)現(xiàn)將研究重點(diǎn)從“藏”向“用”的轉(zhuǎn)變。革命文物作為重要的文化遺產(chǎn),數(shù)量多、種類豐富,隱含豐富的文化價(jià)值,但目前尚未實(shí)現(xiàn)資源的語義描述,也無法滿足用戶的可視化展示、語義檢索的需求。因此,可以借助知識(shí)圖譜所具有的強(qiáng)大數(shù)據(jù)表示與描述特性,打破革命文物資源的固化藩籬,以可視化的方式將資源及資源間的關(guān)系呈現(xiàn)出來,完成知識(shí)重組,再現(xiàn)革命歷史場景。構(gòu)建革命文物知識(shí)圖譜是對(duì)革命文物資源的內(nèi)涵進(jìn)行深層挖掘的過程,不僅能夠提升資源的利用廣度與深度,也可以為用戶開發(fā)利用資源提供切實(shí)的解決途徑。
筆者立足數(shù)字人文視角,以大別山革命文物為研究對(duì)象,在分析資源結(jié)構(gòu)特征的基礎(chǔ)上,明確革命文物所涉及的相關(guān)概念與屬性,進(jìn)而構(gòu)建革命文物本體模型。然后,以此為模式層構(gòu)建革命文物知識(shí)圖譜實(shí)現(xiàn)資源之間的知識(shí)關(guān)聯(lián),深層次挖掘資源背后隱含的語義知識(shí),為探究革命文物資源的知識(shí)組織與知識(shí)發(fā)現(xiàn)提供了新的研究路徑,改變革命文物資源的服務(wù)模式,實(shí)現(xiàn)從單一的信息瀏覽到語義化的智能服務(wù)的轉(zhuǎn)變,有助于革命文化的傳播與共享。
1? 研究現(xiàn)狀/Research status
1.1? 革命文物資源研究
革命文物見證了中國革命艱辛歷程,是中國共產(chǎn)黨領(lǐng)導(dǎo)人民在革命、建設(shè)和改革的奮斗過程中遺留下的歷史遺物與遺跡。其具體形態(tài)表現(xiàn)為革命遺址遺跡、名人故居、英烈紀(jì)念館等不可移動(dòng)文物,以及相關(guān)的檔案、文獻(xiàn)、史料、實(shí)物等可移動(dòng)文物。革命文物作為紅色文化的載體,相關(guān)研究主要集中于國內(nèi)。革命文物的保護(hù)與利用研究隨著數(shù)字技術(shù)的變革而發(fā)展,其發(fā)展歷程可以分為3個(gè)方面:①革命文物資源的數(shù)字化研究,主要是通過OCR、數(shù)字影像等方式來實(shí)現(xiàn)對(duì)革命文物資源的數(shù)字化保存與整理。如彭慶紅等[4]提出根據(jù)資源類型的不同設(shè)計(jì)相適應(yīng)的開發(fā)利用路徑,來推動(dòng)紅色檔案資源的數(shù)字化建設(shè)。②革命文物資源的數(shù)據(jù)化利用,數(shù)據(jù)化的關(guān)鍵在于重構(gòu)革命文物資源的數(shù)據(jù)顆粒形態(tài),使用元數(shù)據(jù)、領(lǐng)域本體構(gòu)建等方法實(shí)現(xiàn)革命文物資源標(biāo)準(zhǔn)化和有序化。如羅素潔等[5]以“余杭紅色記憶”專題資源庫為例,探索在基層公共圖書館建設(shè)紅色文獻(xiàn)數(shù)據(jù)庫的實(shí)踐路徑。③革命文物資源的關(guān)聯(lián)聚合研究,主要是對(duì)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行開發(fā)利用,實(shí)現(xiàn)資源間的相互關(guān)聯(lián)。如付靖宜等[6]分析紅色文獻(xiàn)資源特征,構(gòu)建基于語義關(guān)聯(lián)的紅色文獻(xiàn)資源知識(shí)聚合模型。關(guān)于革命文物資源的研究已不局限于數(shù)字化與信息化處理,目前的研究正在將視角集中在如何將革命文物資源進(jìn)行語義描述,然而針對(duì)革命文物資源的語義組織研究相對(duì)比較匱乏,需要利用語義網(wǎng)來實(shí)現(xiàn)對(duì)革命文物資源的深度開發(fā)利用。
1.2? 基于知識(shí)圖譜的紅色文化資源研究
現(xiàn)階段,紅色文化資源的定義尚未有統(tǒng)一的結(jié)論,可被表示為:中國共產(chǎn)黨在領(lǐng)導(dǎo)人民實(shí)現(xiàn)中華民族偉大復(fù)興道路上所形成的各種物質(zhì)及精神載體的總和,如革命精神、紅色遺跡等。目前,關(guān)于紅色文化資源的研究主要是從數(shù)字化保護(hù)與利用、建設(shè)與服務(wù)等方面出發(fā),立足數(shù)字人文視角深入研究紅色文化資源的研究較少。數(shù)字人文為從大量的紅色文化資源中挖掘隱含知識(shí)提供了可能性,為歷史的演化發(fā)展研究提供了新路徑。知識(shí)圖譜技術(shù)是人文學(xué)者進(jìn)行數(shù)字人文研究的關(guān)鍵技術(shù),并憑借強(qiáng)大的語義組織與描述能力,成為對(duì)紅色文化資源進(jìn)行知識(shí)組織與可視化呈現(xiàn)的重要工具。通過梳理紅色文化資源知識(shí)圖譜構(gòu)建研究,發(fā)現(xiàn)當(dāng)前學(xué)者在研究內(nèi)容上有所側(cè)重,其研究主要有:劉竟等[7]以黨史主題美術(shù)作品為著力點(diǎn),構(gòu)建相適用的元數(shù)據(jù)框架與本體模型,探究知識(shí)圖譜在黨史主題美術(shù)作品研究的可行性;徐曉娟等[8]以皖西紅色文獻(xiàn)為研究實(shí)例,構(gòu)建皖西紅色文獻(xiàn)數(shù)據(jù)庫,并利用知識(shí)圖譜實(shí)現(xiàn)文獻(xiàn)檢索與知識(shí)發(fā)現(xiàn)服務(wù);郭嘉欣[9]通過構(gòu)建“紅色記憶”知識(shí)圖譜,對(duì)多源異構(gòu)的紅色文化資源進(jìn)行深層次的關(guān)系挖掘;張?jiān)浦械萚10]以紅色歷史人物為對(duì)象,搭建基于知識(shí)圖譜的知識(shí)問答服務(wù)架構(gòu),為用戶提供知識(shí)交互服務(wù)。不難發(fā)現(xiàn),有關(guān)紅色文化資源知識(shí)圖譜構(gòu)建的相關(guān)研究已有了一定的成果,但其研究重點(diǎn)聚焦于宏觀視角,極少有以紅色文化資源的物質(zhì)載體即革命文物資源為主體進(jìn)行深入的研究,不過已有的研究方法與思路對(duì)筆者構(gòu)建革命文物知識(shí)圖譜提供了指導(dǎo)作用與借鑒經(jīng)驗(yàn)。
縱觀上述研究可以發(fā)現(xiàn),針對(duì)革命文物資源的數(shù)字化保護(hù)的標(biāo)準(zhǔn)規(guī)范不夠清晰,資源分散在各機(jī)構(gòu)和地區(qū),難以實(shí)現(xiàn)革命文物資源的共享,有礙于革命文化的傳播與傳承。雖然已有學(xué)者構(gòu)建“紅色記憶”知識(shí)圖譜、紅色歷史人物知識(shí)圖譜,但其關(guān)注點(diǎn)集中于非物質(zhì)性的紅色文化資源,在革命文物資源領(lǐng)域深入研究,對(duì)其知識(shí)結(jié)構(gòu)進(jìn)行知識(shí)關(guān)聯(lián)與深層次的知識(shí)發(fā)現(xiàn)研究仍有待進(jìn)一步展開。因此,筆者以大別山革命文物為研究對(duì)象,借助本體理論與方法從多源異構(gòu)的數(shù)據(jù)中提取核心概念與屬性,以此構(gòu)建革命文物知識(shí)圖譜,將分散的知識(shí)單元進(jìn)行有序化組織與可視化展示,實(shí)現(xiàn)對(duì)革命文物知識(shí)內(nèi)涵進(jìn)行深度分析與挖掘,為紅色文物資源的深度開發(fā)與利用提供可行的研究思路。
2? 框架構(gòu)建/ Building framework
革命文物資源數(shù)量大、形態(tài)多樣、蘊(yùn)含豐富的歷史內(nèi)涵,但現(xiàn)有革命文物資源建設(shè)還停留在粗粒度階段,缺乏對(duì)其知識(shí)單元進(jìn)行深度挖掘與知識(shí)關(guān)聯(lián)。針對(duì)這些問題,急需利用知識(shí)圖譜技術(shù)揭示革命文物資源中的知識(shí)元素與關(guān)系,實(shí)現(xiàn)對(duì)知識(shí)深層次的語義描述與組織?;诖耍P者提出構(gòu)建革命文物知識(shí)圖譜框架(見圖1),該框架包括數(shù)據(jù)來源層、知識(shí)組織層、圖譜構(gòu)建層和知識(shí)應(yīng)用層4個(gè)層次。
數(shù)據(jù)來源層是革命文物知識(shí)圖譜框架的基礎(chǔ),主要是將大量離散的多源異構(gòu)數(shù)據(jù)采集并整合起來。革命文物資源的存在形態(tài)多樣,且在空間分布分散,大多屬于非結(jié)構(gòu)化數(shù)據(jù)與半結(jié)構(gòu)化數(shù)據(jù),需要采用網(wǎng)絡(luò)爬蟲與人工采集相結(jié)合的方式獲取相關(guān)數(shù)據(jù),同時(shí)利用領(lǐng)域內(nèi)的相關(guān)數(shù)據(jù)資源對(duì)其進(jìn)行完善與補(bǔ)充。在此基礎(chǔ)上將經(jīng)過整合處理后的數(shù)據(jù)存儲(chǔ)到數(shù)據(jù)庫中,為后續(xù)的研究提供數(shù)據(jù)支撐。
知識(shí)組織層是圖譜構(gòu)建的關(guān)鍵任務(wù),是對(duì)領(lǐng)域內(nèi)的知識(shí)進(jìn)行邏輯化和體系化的過程,即構(gòu)建革命文物本體。通過構(gòu)建本體模型可以對(duì)革命文物資源進(jìn)行知識(shí)建模,規(guī)范化描述資源中所涉及的概念及概念間的關(guān)系。分析革命文物資源的結(jié)構(gòu)特征,界定革命文物本體的相關(guān)概念與屬性,同時(shí)在考慮復(fù)用現(xiàn)有本體的基礎(chǔ)上,結(jié)合自建本體實(shí)現(xiàn)革命文物本體模型的構(gòu)建,以此完成知識(shí)圖譜模式層的搭建。
圖譜構(gòu)建層是對(duì)獲取到的原始數(shù)據(jù)集進(jìn)行知識(shí)抽取、知識(shí)融合和知識(shí)存儲(chǔ)。知識(shí)抽取是基于設(shè)計(jì)的本體模型,根據(jù)數(shù)據(jù)形式的差異采用不同的方法進(jìn)行實(shí)體、屬性與關(guān)系的抽取,并以“實(shí)體—關(guān)系—實(shí)體”及“實(shí)體—屬性—屬性值”兩種模式表示數(shù)據(jù)。經(jīng)過知識(shí)抽取環(huán)節(jié)獲取到的新知識(shí)存在共指與冗余等問題,需要采用相應(yīng)的知識(shí)融合方法對(duì)其進(jìn)行整合處理。最后,將處理完成的結(jié)構(gòu)化數(shù)據(jù)以RDF三元組形式存儲(chǔ)到Neo4j圖數(shù)據(jù)庫中,完成革命文物知識(shí)圖譜的構(gòu)建。
知識(shí)應(yīng)用層是指基于已構(gòu)建的革命文物知識(shí)圖譜,為用戶提供便捷獲取知識(shí)的服務(wù),滿足用戶深層次開發(fā)利用革命文物資源的需求。革命文物知識(shí)圖譜以圖的方式將知識(shí)與知識(shí)間的關(guān)系呈現(xiàn)出來,實(shí)現(xiàn)知識(shí)間的語義關(guān)聯(lián)。用戶可以通過構(gòu)建查詢語句來檢索所需的節(jié)點(diǎn)與關(guān)系,為用戶從不同角度進(jìn)行革命文物知識(shí)內(nèi)容的深度挖掘與知識(shí)發(fā)現(xiàn)研究提供便利。
3? 實(shí)證研究/Empirical research
3.1? 數(shù)據(jù)來源
大別山革命老區(qū)是中國革命的重要策源地,其包含的革命文物資源具有規(guī)模大、分布廣泛、類型多樣、時(shí)間跨度大等突出特征。大別山革命文物資源作為支撐大別山精神的重要載體,承載寶貴的紅色基因,以其作為實(shí)證對(duì)象進(jìn)行研究對(duì)識(shí)別紅色文化資源基因特質(zhì)、發(fā)揚(yáng)紅色精神具有重要的現(xiàn)實(shí)價(jià)值。大別山革命根據(jù)地位于鄂豫皖三省交界處,其革命文物資源分布在該地區(qū)的博物館、紀(jì)念館與紅色旅游景點(diǎn)等。根據(jù)實(shí)例分析,發(fā)現(xiàn)大別山革命文物資源的數(shù)據(jù)來源多樣,筆者以鄂豫皖地區(qū)紅色文化網(wǎng)頁、黨史建設(shè)平臺(tái)、紅色旅游網(wǎng)頁及百度百科—數(shù)字博物館為主要數(shù)據(jù)源,同時(shí)利用中國共產(chǎn)黨創(chuàng)建史詞典和百度百科資源進(jìn)行補(bǔ)充,通過網(wǎng)頁爬取與手工采集相結(jié)合的方式來獲取所需的數(shù)據(jù)。
3.2? 本體構(gòu)建
本體作為一種抽象化的知識(shí)描述模型,可以清晰地定義和表示特定領(lǐng)域內(nèi)的概念及概念間的關(guān)系,是共享概念模型的形式化規(guī)范說明[11]。本體源于哲學(xué)領(lǐng)域,具有約束和規(guī)范概念屬性的作用,應(yīng)用領(lǐng)域非常廣泛。構(gòu)建本體的過程較為復(fù)雜,其模型設(shè)計(jì)過程為了保證規(guī)范性,必須遵循明確性、客觀性、可擴(kuò)展性等原則。當(dāng)前,關(guān)于本體構(gòu)建方法已經(jīng)較為成熟,如TOVE 法、METHONTOLOGY 法、骨架法和七步法等,筆者選擇通用性較強(qiáng)的七步法來構(gòu)建本體[12],并綜合考慮革命文物資源自身的結(jié)構(gòu)特點(diǎn),參考借鑒社會(huì)網(wǎng)絡(luò)人物本FOAF(Friend of a Friend)[13]、國際博物館理事會(huì)開發(fā)的概念參考模型CIDOC CRM(CIDOC Conceptual Reference Model)[14]、DC(Dublin Core)[15]、Time、GeoNames以及上海圖書館本體SHL[16]等國內(nèi)外通用本體模型,對(duì)本體模型中人物、時(shí)間、事件、地點(diǎn)等相關(guān)概念與屬性進(jìn)行復(fù)用,此外,由于當(dāng)前可復(fù)用的本體詞表無法充分滿足對(duì)革命文物資源知識(shí)單元細(xì)粒度描述的需求。因此,筆者在調(diào)研已有本體詞表的基礎(chǔ)上,構(gòu)建自定義詞表革命文物資源RCRR(revolutionary cultural relics resources),對(duì)革命文物知識(shí)的概念與屬性進(jìn)行描述,進(jìn)而完成革命文物資源本體模型構(gòu)建。
3.2.1? 定義核心類與層級(jí)
革命文物資源本體模型構(gòu)建的關(guān)鍵在于明確定義領(lǐng)域內(nèi)知識(shí)的核心概念。核心概念也稱類,是本體建模的基礎(chǔ),是某領(lǐng)域相關(guān)對(duì)象實(shí)例的集合[17]。在充分剖析革命文物資源知識(shí)內(nèi)涵的基礎(chǔ)上,確定該領(lǐng)域內(nèi)的核心元素,可以深層次地揭示革命文物資源間的相互關(guān)系。筆者結(jié)合革命文物資源特征,從中梳理提取出重要概念與術(shù)語,將革命文物資源頂層概念劃分為革命文物、人物、機(jī)構(gòu)、時(shí)間、地點(diǎn)、事件和資源7個(gè)核心類。此外,還需要關(guān)注核心概念之間的層級(jí)關(guān)系,對(duì)其進(jìn)行細(xì)分,確定其所包含的類及子類的關(guān)系,實(shí)現(xiàn)對(duì)革命文物知識(shí)語義要素體系的完善。革命文物資源類及層次關(guān)系如表1所示:
革命文物類是本體構(gòu)建的核心概念,與其余6大類即人物類、時(shí)間類、機(jī)構(gòu)類、地點(diǎn)類、事件類、資源類相互關(guān)聯(lián),共同構(gòu)成革命文物領(lǐng)域內(nèi)語義層面的知識(shí)網(wǎng)絡(luò)。為了確保對(duì)革命文物資源進(jìn)行細(xì)粒度的描述,在分析已有文物分類標(biāo)準(zhǔn)的基礎(chǔ)上,根據(jù)自身屬性將革命文物資源劃分成實(shí)物(rcrr:practicality)和建筑(rcrr:Architecture)兩個(gè)子類,實(shí)物類包括戰(zhàn)史材料、書籍、日記等各種文獻(xiàn)資料,以及紀(jì)念品、旗幟等代表性實(shí)物,建筑類是指名人故居、革命舊址及紀(jì)念設(shè)施。
人物類是指與革命文物資源相關(guān)的個(gè)人與團(tuán)體等實(shí)體,主要包含個(gè)人(foaf:Person)和團(tuán)體(foaf:Group)兩個(gè)子類。個(gè)人是指與革命文物資源密切相關(guān)的人物,如報(bào)紙、圖書資料的撰寫者、生活用品或武器裝備的使用者。團(tuán)體即與革命文物緊密關(guān)聯(lián)的團(tuán)體組織,如政府組織、運(yùn)動(dòng)工會(huì)組織、文學(xué)社團(tuán)等,這些組織在革命事件中常作為關(guān)鍵出現(xiàn),其數(shù)據(jù)屬性包括團(tuán)體類型和組織宗旨。
機(jī)構(gòu)類是指革命文物資源的收藏機(jī)構(gòu),其與革命文物類、時(shí)間類與地點(diǎn)類相互聯(lián)系,將館藏機(jī)構(gòu)作為革命文物資源的核心類目,從館藏機(jī)構(gòu)的角度實(shí)現(xiàn)資源組織。其數(shù)據(jù)屬性主要有機(jī)構(gòu)名和機(jī)構(gòu)類型。
時(shí)間類是用來描述革命文物資源的時(shí)間特征,包括革命文物資源的創(chuàng)造時(shí)間、個(gè)人的出生時(shí)間與死亡時(shí)間及事件的發(fā)生時(shí)間等。革命文物產(chǎn)生的時(shí)間往往不是某一時(shí)間點(diǎn),而是某一時(shí)間段,因此,需要根據(jù)時(shí)間的跨度將時(shí)間類劃分成時(shí)間點(diǎn)和時(shí)間段兩個(gè)子類。時(shí)間點(diǎn)可以通過年月日來表示精確的時(shí)間,時(shí)間段以2021年中共中央發(fā)布的《中共中央關(guān)于黨的百年奮斗重大成就和歷史經(jīng)驗(yàn)的決議》中關(guān)于中國共產(chǎn)黨百年奮斗歷史的4個(gè)階段為依據(jù),分為新民主主義革命時(shí)期、社會(huì)主義革命時(shí)期、改革開放和社會(huì)主義現(xiàn)代化建設(shè)時(shí)期、中國特色社會(huì)主義新時(shí)代[18]。
地點(diǎn)類是涵蓋了革命文物、人物、事件所涉及的空間信息,對(duì)于革命文物而言,尤其是建筑類,主要是指建筑當(dāng)前的所在地;對(duì)于人物而言,是指個(gè)人的出生地與死亡地以及團(tuán)體的創(chuàng)建地點(diǎn);對(duì)于事件而言,主要涉及事件的發(fā)生地。地點(diǎn)類的數(shù)據(jù)屬性包括地名、舊稱、經(jīng)度和緯度等信息。
事件類主要是指革命文物資源中所涉及的相關(guān)歷史事件的集合,革命文物中蘊(yùn)含豐富的革命事件,記載了艱苦奮斗的革命歷程。事件類與革命文物類、人物類、時(shí)間類、地點(diǎn)類均存在對(duì)象屬性關(guān)系,其具體數(shù)據(jù)屬性有事件名、事件主題和描述等。
資源類是指與革命文物資源相關(guān)的資源類型,如文本、圖譜、視頻等。革命文物的數(shù)據(jù)來源多樣決定知識(shí)呈現(xiàn)方式的多樣性,由此可以從多維視角來表示革命文物資源。資源類的數(shù)據(jù)屬性包括文本資源、圖片資源和視頻資源。
3.2.2? 定義屬性及關(guān)系
在完成革命文物資源本體模型的核心類的定義后,還需要進(jìn)一步定義類的屬性來詳細(xì)描述資源結(jié)構(gòu)特征。在本體構(gòu)建中,屬性可分為對(duì)象屬性與數(shù)據(jù)屬性,通過定義類的屬性可以豐富革命文物資源關(guān)系和特征的語義描述。對(duì)象屬性即關(guān)系屬性,主要用于描述不同實(shí)體之間的關(guān)系,其定義域和值域均為類。對(duì)象屬性在本研究中的作用是為了表述革命文物資源概念間的關(guān)聯(lián)關(guān)系,以此實(shí)現(xiàn)革命文物資源的知識(shí)關(guān)聯(lián),幫助用戶對(duì)革命文物知識(shí)圖譜進(jìn)行知識(shí)檢索服務(wù),具體對(duì)象屬性設(shè)置見表2。數(shù)據(jù)屬性是用于描述類的內(nèi)在和外在屬性,是對(duì)類自身信息的補(bǔ)充說明,其定義域?yàn)轭?,值域是某特定的?shù)據(jù)類型,通過數(shù)據(jù)屬性的設(shè)計(jì)可以幫助用戶了解革命文物資源實(shí)例數(shù)據(jù)的詳細(xì)特征,擴(kuò)充實(shí)例的內(nèi)涵,具體數(shù)據(jù)屬性設(shè)置見表3。
基于上述所定義的類與屬性,最終確定的革命文物資源本體模型(見圖2)。革命文物資源本體模型揭示了類與類之間錯(cuò)綜復(fù)雜的關(guān)系,為革命文物資源所蘊(yùn)含的知識(shí)提供規(guī)范化描述,為后續(xù)的知識(shí)圖譜構(gòu)建與應(yīng)用研究提供有效的頂層邏輯基礎(chǔ)。
3.3? 革命文物知識(shí)圖譜構(gòu)建
3.3.1? 知識(shí)抽取
知識(shí)抽取是革命文物知識(shí)圖譜構(gòu)建的基礎(chǔ),其決定了后續(xù)進(jìn)行知識(shí)融合與知識(shí)存儲(chǔ)的質(zhì)量。知識(shí)抽取的具體步驟是根據(jù)已構(gòu)建的本體模型,從數(shù)據(jù)來源層形成的數(shù)據(jù)集中將所需的實(shí)體、關(guān)系及屬性抽取出來,并轉(zhuǎn)換成實(shí)體關(guān)系三元組。革命文物知識(shí)圖譜以RDF(資源描述框架)數(shù)據(jù)模型對(duì)抽取出的知識(shí)進(jìn)行表示,常表示為<實(shí)體,屬性,屬性值>或<實(shí)體,關(guān)系,實(shí)體>,使知識(shí)得到規(guī)范描述。通過分析革命文物資源的數(shù)據(jù)來源,需采用不同的知識(shí)抽取方法來抽取革命文物資源中的實(shí)體、對(duì)象屬性和數(shù)據(jù)屬性。筆者采用深度學(xué)習(xí)與人工相結(jié)合的方法來實(shí)現(xiàn)知識(shí)抽取,針對(duì)非結(jié)構(gòu)化數(shù)據(jù)(如鄂豫皖蘇區(qū)革命博物館的資源),通過調(diào)用LTP(哈工大語言技術(shù)平臺(tái))[19],對(duì)采集到的語料進(jìn)行分析、標(biāo)注等處理,進(jìn)而從文本中抽取所需的三元組關(guān)系。此外,為了完善領(lǐng)域內(nèi)的相關(guān)數(shù)據(jù),還需要利用Jiagu自然語言處理工具對(duì)百度百科資源中的半結(jié)構(gòu)化數(shù)據(jù)進(jìn)行實(shí)體關(guān)系抽取。例如,以“黃麻起義開始于1927年11月13日,地點(diǎn)位于紅安、麻城”為示例,LTP知識(shí)抽取結(jié)果見圖3。以“劉伯承,1892年12月4日出生于四川省開縣”為示例,Jiagu抽取的結(jié)果見圖4。
3.3.2? 知識(shí)融合
知識(shí)融合是指在相同框架規(guī)范的基礎(chǔ)上,對(duì)不同來源的知識(shí)進(jìn)行異構(gòu)數(shù)據(jù)整合。多源異構(gòu)的革命文物資源的融合需要對(duì)概念的關(guān)系進(jìn)行判斷并整合,其知識(shí)融合包括概念層的本體融合以及數(shù)據(jù)層的實(shí)例、屬性的融合,前者擴(kuò)展了本體的通用性和共享性,后者消除了實(shí)體的歧義性和多樣性[20]。在完成知識(shí)抽取任務(wù)后,得到由實(shí)體和關(guān)系組成的三元組數(shù)據(jù)集,但這些數(shù)據(jù)中仍存在一些冗余與歧義的問題,比如某些實(shí)體可能存在共指問題,即同一個(gè)實(shí)體有多個(gè)指稱項(xiàng),同一概念的實(shí)體指向交叉,需要對(duì)其進(jìn)行整合處理以便消除歧義,進(jìn)而為知識(shí)圖譜的推理提供底層支撐。針對(duì)實(shí)體存在歧義問題,因其問題復(fù)雜且領(lǐng)域性較強(qiáng),常規(guī)的算法無法對(duì)其融合,需要利用人工構(gòu)建自定義詞典的方式來完成實(shí)體融合。此外,針對(duì)關(guān)系存在的歧義問題,則采用哈工大同義詞詞林(擴(kuò)展版)[21]與余弦相似度相結(jié)合的方式來消歧關(guān)系名的多樣性。
3.3.3? 知識(shí)存儲(chǔ)
在完成知識(shí)融合任務(wù)后,需要選擇合適的數(shù)據(jù)庫來有效地表達(dá)和存儲(chǔ)數(shù)據(jù),當(dāng)前知識(shí)圖譜的存儲(chǔ)方式主要有3種,分別是傳統(tǒng)的關(guān)系型數(shù)據(jù)庫、RDF數(shù)據(jù)庫和圖數(shù)據(jù)庫。Neo4j圖數(shù)據(jù)庫與傳統(tǒng)的關(guān)系型數(shù)據(jù)庫相比,具有獨(dú)特的優(yōu)勢,能夠以圖的方式可視化展示數(shù)據(jù)。因此,筆者選擇Neo4j圖數(shù)據(jù)庫作為革命文物資源的存儲(chǔ)工具,以實(shí)現(xiàn)革命文物知識(shí)圖譜的構(gòu)建。Neo4j圖數(shù)據(jù)庫主要有標(biāo)簽、節(jié)點(diǎn)、關(guān)系、屬性4種組成元素,由于本體模型與圖數(shù)據(jù)庫的知識(shí)表現(xiàn)形式存在差異,需要通過RDF三元組這一數(shù)據(jù)形式實(shí)現(xiàn)本體模型到圖數(shù)據(jù)庫結(jié)構(gòu)的互相映射,其映射規(guī)則是將本體中的類與實(shí)例映射為節(jié)點(diǎn),對(duì)象屬性映射為節(jié)點(diǎn)間的關(guān)系,數(shù)據(jù)屬性映射為節(jié)點(diǎn)的屬性。最終,形成包含357個(gè)實(shí)體節(jié)點(diǎn)和523個(gè)三元組關(guān)系的革命文物知識(shí)圖譜,詳細(xì)描述了革命文物資源中蘊(yùn)含的豐富的歷史內(nèi)涵,為實(shí)現(xiàn)革命文物資源知識(shí)檢索、知識(shí)發(fā)現(xiàn)等智能化服務(wù)提供支撐。
3.4? 知識(shí)應(yīng)用
3.4.1? 知識(shí)關(guān)聯(lián)
知識(shí)圖譜具有強(qiáng)大的可視化功能,可以通過有向圖的方式清晰地展示革命文物資源的整體知識(shí)特征,詳細(xì)地描述節(jié)點(diǎn)與節(jié)點(diǎn)間關(guān)系的知識(shí)表示結(jié)構(gòu)。知識(shí)圖譜由節(jié)點(diǎn)和邊構(gòu)成,通過節(jié)點(diǎn)和關(guān)系將革命文物資源中蘊(yùn)含的革命文物、人物、時(shí)間、地點(diǎn)、事件等知識(shí)單元關(guān)聯(lián)起來,進(jìn)而將平面、靜態(tài)的零散知識(shí)單元轉(zhuǎn)換成立體、動(dòng)態(tài)的知識(shí)網(wǎng)絡(luò),為挖掘隱含的知識(shí)提供便利。筆者利用知識(shí)圖譜實(shí)現(xiàn)革命文物資源的實(shí)例化展示,其整體的展示效果見圖5,用戶可以通過單擊節(jié)點(diǎn)對(duì)節(jié)點(diǎn)的大小與顏色進(jìn)行調(diào)節(jié),同時(shí)也可以查看節(jié)點(diǎn)的屬性信息,以便用戶快速了解革命文物資源的知識(shí)關(guān)聯(lián),進(jìn)而對(duì)資源有更加深入的認(rèn)識(shí),賦能知識(shí)發(fā)現(xiàn)研究。
3.4.2? 知識(shí)檢索
革命文物知識(shí)圖譜提供知識(shí)檢索服務(wù),其存儲(chǔ)方式的不同使得檢索方式也存在差異。Neo4j圖數(shù)據(jù)庫運(yùn)用Cypher查詢語言進(jìn)行知識(shí)檢索,與傳統(tǒng)關(guān)系型數(shù)據(jù)庫使用結(jié)構(gòu)化查詢語言而言,具有簡便快捷的優(yōu)勢。革命文物知識(shí)圖譜的檢索功能可以讓用戶根據(jù)自身需要構(gòu)建合適的檢索語言準(zhǔn)確、快捷地獲取所需的節(jié)點(diǎn)和關(guān)系,如以“黃麻起義”為例進(jìn)行檢索,構(gòu)建Cypher查詢語句:MATCH(n)-[r:相關(guān)事件]-(m:Event{eventName:黃麻起義}) RETURN n,m,將與之相關(guān)的節(jié)點(diǎn)與關(guān)系直接呈現(xiàn)出來,查詢結(jié)果見圖6。從圖6中可以看出,與黃麻起義相關(guān)聯(lián)的革命文物資源有5項(xiàng),分別是黃麻起義和鄂豫皖蘇區(qū)革命烈士陵園、黃麻起義使用的銅鑼、麻城烈士陵園、1928年黃麻起義領(lǐng)導(dǎo)人吳煥先用過的羅盤和1927年11月程儒鈿烈士參加黃麻起義時(shí)使用過的軍號(hào)(殘)。通過知識(shí)檢索可以發(fā)現(xiàn)革命文物背后蘊(yùn)含的革命歷史事件,以便用戶全面了解革命文物資源,此外,知識(shí)圖譜還為用戶的知識(shí)檢索提供多維度的切入點(diǎn),實(shí)現(xiàn)全方位、多視角地獲取革命文物資源的相關(guān)信息,有助于紅色文化的傳播與發(fā)展。
3.4.3? 知識(shí)發(fā)現(xiàn)
知識(shí)圖譜最重要的價(jià)值是為用戶提供知識(shí)發(fā)現(xiàn)服務(wù),利用上述的知識(shí)關(guān)聯(lián)與檢索功能,可以快速檢索革命文物的相關(guān)節(jié)點(diǎn)與關(guān)系,還可以從不同維度出發(fā)挖掘知識(shí)關(guān)聯(lián)下的隱含知識(shí),實(shí)現(xiàn)對(duì)革命文物資源的知識(shí)智慧發(fā)現(xiàn),助力人文領(lǐng)域研究從數(shù)據(jù)、學(xué)術(shù)到創(chuàng)造整合方向發(fā)展[22]。革命文物資源承載了諸多英雄事跡和重要的歷史事件,以革命文物為核心進(jìn)行知識(shí)發(fā)現(xiàn)可以探尋文物背后所蘊(yùn)含的歷史事件,通過“文物—事件—時(shí)空”知識(shí)脈絡(luò)實(shí)現(xiàn)對(duì)革命歷史場景再現(xiàn)。如以“王大灣會(huì)議會(huì)址紀(jì)念館”為核心,在圖數(shù)據(jù)庫進(jìn)行多層路徑查詢,由于路徑深度對(duì)檢索結(jié)構(gòu)與中心節(jié)點(diǎn)的關(guān)聯(lián)效果具有較大的影響,因此,將路徑深度設(shè)置為2—5的范圍依次檢索,發(fā)現(xiàn)路徑深度為2—3的時(shí)候,關(guān)聯(lián)效果最好,其結(jié)果見圖7。
從圖7中可以發(fā)現(xiàn),劉鄧大軍在大別山地區(qū)的作戰(zhàn)經(jīng)歷:1947年8月27日,以劉伯承、鄧小平領(lǐng)導(dǎo)的晉冀魯豫野戰(zhàn)軍到達(dá)大別山地區(qū)。抵達(dá)大別山地區(qū)后,為了增強(qiáng)部隊(duì)斗志,克服,克服可能產(chǎn)生的右傾情緒,1947年9月27日至29日,劉伯承、鄧小平同志組織召開了一次旅以上高級(jí)干部會(huì)議,會(huì)議分析了部隊(duì)進(jìn)入大別山后的艱巨任務(wù),對(duì)后期的作戰(zhàn)方向部署任務(wù)。在這次會(huì)議之后,同年10月份,劉鄧大軍先后取得了張家店戰(zhàn)斗與高山鋪大捷重大勝利。綜上,以革命文物資源為線索進(jìn)行知識(shí)發(fā)現(xiàn),可以為相關(guān)學(xué)者進(jìn)行革命事件歷史溯源研究與紅色記憶重構(gòu)提供支撐與保證。
通過知識(shí)圖譜可以將分散的數(shù)據(jù)進(jìn)行有序化組織與關(guān)聯(lián),并以可視化的呈現(xiàn)方式清晰地呈現(xiàn)革命文物資源的知識(shí)結(jié)構(gòu)特征,拓展了用戶的知識(shí)檢索范圍,便于用戶對(duì)革命文物資源進(jìn)行深層次的多維知識(shí)發(fā)現(xiàn)研究。知識(shí)圖譜具有知識(shí)查詢和推理的特性,以節(jié)點(diǎn)與邊相連接的方式展示資源間的關(guān)系,為知識(shí)重組和深入挖掘革命文物資源的潛在知識(shí)提供重要的研究思路。
4? 結(jié)語/Conclusion
知識(shí)圖譜以其所具有的語義理解與組織能力,可以深度揭示革命文物資源的實(shí)體信息及知識(shí)關(guān)聯(lián),正成為各領(lǐng)域進(jìn)行大規(guī)模語義信息集成和提供智慧化服務(wù)的關(guān)鍵所在。因此,將知識(shí)圖譜技術(shù)應(yīng)用于革命文物資源的開發(fā)與利用研究,是推動(dòng)革命文物資源建設(shè)向知識(shí)化乃至智能化發(fā)展的必然抉擇。筆者以大別山革命文物為實(shí)例對(duì)象,在明確革命文物資源所包含的相關(guān)概念與關(guān)系后,完成知識(shí)建模,并以此為基礎(chǔ)構(gòu)建革命文物知識(shí)圖譜,實(shí)現(xiàn)碎片化資源的知識(shí)重組,對(duì)革命文物資源的語義化組織進(jìn)行了探索性研究,為革命文物資源的數(shù)字化傳播與紅色文化基因的傳承提供了新的研究路徑。通過構(gòu)建革命文物知識(shí)圖譜將多類型、多層次的革命文物資源中包含的知識(shí)與知識(shí)間的關(guān)系聯(lián)系起來,且能夠?qū)⒎植荚诓煌瑓^(qū)域的零散碎片化的實(shí)物資源進(jìn)行知識(shí)重組與集成,進(jìn)而以更加直觀、更加動(dòng)態(tài)、更加關(guān)聯(lián)的方式呈現(xiàn)給用戶,為用戶了解及學(xué)習(xí)革命文化提供智能化的信息服務(wù)。
本研究為革命文物資源提供了語義化組織方案,充分描述了資源中所蘊(yùn)含的歷史價(jià)值。但本研究仍存在一些不足:受到案例數(shù)據(jù)的限制,僅以大別山革命文物作為數(shù)據(jù)源進(jìn)行研究,其數(shù)據(jù)量相對(duì)有限,未來會(huì)考慮添加更多的革命文物數(shù)據(jù)進(jìn)行研究,擴(kuò)大數(shù)據(jù)規(guī)模。此外,雖然本研究實(shí)現(xiàn)了對(duì)革命文物資源的知識(shí)檢索與發(fā)現(xiàn)服務(wù),但為了提升研究深度和廣度,滿足用戶對(duì)革命文物資源的智慧化服務(wù)需求,需要進(jìn)一步探討智能問答、知識(shí)推薦等系統(tǒng)的實(shí)現(xiàn)。
參考文獻(xiàn)/References:
[1] 中國政府網(wǎng).中共中央辦公廳 國務(wù)院辦公廳印發(fā)《關(guān)于實(shí)施革命文物保護(hù)利用工程(2018-2022年)的意見》[EB/OL]. [2024-03-10]. http://www.gov.cn/zhengce/2018-07/29/content_5310268.htm.(Chinese Government Website. General Office of the Central Committee of the Communist Party of China and General Office of the State Council issued “Opinions on the implementation of the project for the protection and utilization of revolutionary cultural relics (2018-2022)”[EB/OL]. [2024-03-10]. http://www.gov.cn/zhengce/2018-07/29/content_5310268.htm.)
[2] 中國政府網(wǎng).習(xí)近平對(duì)革命文物工作作出重要指示[EB/OL]. [2024-03-10]. http://www.gov.cn/xinwen/2021-03/30/content_5596770.htm. (Chinese Government Website. Xi Jinping gave important instructions on the work of revolutionary cultural relics[EB/OL]. [2024-03-10]. http://www.gov.cn/xinwen/2021-03/30/content_5596770.htm.)
[3] 田艷, 李帥. 革命文物保護(hù)與中華民族共有精神家園建設(shè)研究[J]. 中央民族大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版), 2023, 50(2): 13-23. (TIAN Y, LI S. Research on the protection of revolutionary cultural relics and the construction of the common spiritual home of the Chinese nation[J]. Journal of Minzu University of China (philosophy and social sciences edition), 2023, 50(2): 13-23.)
[4] 彭慶紅, 孫曉丹. 紅色檔案資源數(shù)字化開發(fā)利用的路徑與梯度[J]. 檔案學(xué)通訊, 2022(4): 10-16. (PENG Q H, SUN X D. Paths and gradients of digital development and utilization of the red archives resources[J]. Archives science bulletin, 2022(4): 10-16.)
[5] 羅素潔. 基層公共圖書館紅色文獻(xiàn)數(shù)據(jù)庫建設(shè)研究——以“余杭紅色記憶”專題資源庫為例[J]. 圖書館雜志, 2021, 40(7): 151-156. (LUO S J. Research on red literature database construction of grassroots public library: take Yuhang red memory thematic resource database as an example[J]. Library journal, 2021, 40(7): 151-156.)
[6] 付靖宜, 李?yuàn)檴櫍?項(xiàng)欣溢, 等. 新四軍蘇浙軍區(qū)多模態(tài)紅色文獻(xiàn)資源知識(shí)聚合模式研究[J]. 檔案學(xué)研究, 2022(4): 24-31. (FU J Y, LI S S, XIANG X Y, et al. Research on knowledge aggregation model of multimodal red literature resources of New Fourth Army in Jiangsu and Zhejiang military region[J]. Archives science study, 2022(4): 24-31.)
[7] 劉竟, 王萌, 劉桂鋒, 等. 數(shù)字人文視角下紅色文化資源知識(shí)圖譜構(gòu)建研究[J]. 圖書館雜志,2023, 42(7): 102-109, 125. (LIU J, WANG M, LIU G F, et al. Research on the construction of knowledge graph of red cultural resources from the perspective of digital humanities[J]. Library journal, 2023, 42(7): 102-109, 125.)
[8] 徐孝娟, 孫愛華, 史如菊, 等. 數(shù)字人文視角下皖西紅色文獻(xiàn)知識(shí)本體及其應(yīng)用[J]. 圖書館論壇,2023, 43(10): 139-151. (XU X J, SUN A H, SHI R J, et al. Research on knowledge ontology and application of red documents in western Anhui from the perspective of digital humanities[J]. Library tribune, 2023, 43(10): 139-151.)
[9] 郭嘉欣.基于多源異構(gòu)數(shù)據(jù)挖掘的“紅色記憶”知識(shí)圖譜構(gòu)建[J]. 知識(shí)管理論壇, 2020, 5(1): 59-68. (GUO J X. Construction of “red memory” knowledge graph based on multi-source heterogeneous data mining[J]. Knowledge management forum, 2020, 5(1): 59-68.)
[10] 張?jiān)浦校?郭冬, 王亞鴿, 等. 基于知識(shí)圖譜的紅色歷史人物知識(shí)問答服務(wù)框架研究[J]. 圖書情報(bào)工作, 2021, 65(16): 108-117. (ZHANG Y Z, GUO D, WANG Y G, et al. Framework of knowledge Q&A service for red historical figures based on knowledge graph[J]. Library and information service, 2021, 65(16): 108-117.)
[11] STUDER R, BENJAMINS V R, FENSEL D. Knowledge engineering: principles and methods[J]. Data & knowledge engineering, 1998, 25(1/2): 161-197.
[12] 岳麗欣, 劉文云. 國內(nèi)外領(lǐng)域本體構(gòu)建方法的比較研究[J]. 情報(bào)理論與實(shí)踐, 2016, 39(8): 119-125. (YUE L X, LIU W Y. A comparative study of the construction method of domain ontology at home and abroad[J]. Information studies: theory & application, 2016, 39(8): 119-125.)
[13] FOAF[EB/OL]. [2024-03-10]. http://xmlns.com/foaf/.
[14] CIDOC CRM[EB/OL]. [2024-03-10]. https://cidoc-crm.org/.
[15] DCMI Schemas[EB/OL]. [2024-03-10]. https://www.dublincore.org/schemas/.
[16] 上海圖書館名人手稿[EB/OL]. [2024-03-10]. http://sg.library.sh.cn/mrsg/ipwarning/nopage. (Manuscripts of celebrities in the Shanghai Library [EB/OL]. [2024-03-10]. http://sg.library.sh.cn/mrsg/ipwarning/nopage.)
[17] 鄧君, 王阮. 口述歷史檔案資源知識(shí)組織與關(guān)聯(lián)分析[J]. 情報(bào)資料工作, 2021, 42(5): 58-67. (DENG J, WANG R. Analysis on the knowledge organization and relevance of oral history archives resources[J]. Information and documentation services, 2021, 42(5): 58-67.)
[18] 中國政府網(wǎng). 中共中央關(guān)于黨的百年奮斗重大成就和歷史經(jīng)驗(yàn)的決議[EB/OL]. [2024-03-10]. http://www.gov.cn/zhengce/2021-11/16/content_5651269.htm.(Chinese Government Website. Resolution of the Central Committee of the Communist Party of China on the major achievements and historical experience of the party in the past century[EB/OL]. [2024-03-10]. http://www.gov.cn/zhengce/2021-11/16/content_5651269.htm.)
[19] HanLP[EB/OL]. [2024-03-10]. https://www.hanlp.com/.
[20] 宋雪雁, 張偉民, 張祥青.基于檔案文獻(xiàn)的清代祭祀禮器知識(shí)圖譜構(gòu)建研究[J]. 圖書情報(bào)工作, 2022, 66(3): 140-151. (SONG X Y, ZHANG W M, ZHANG X Q. Research on the construction of knowledge graph of sacrificial vessels in Qing Dynasty based on archival documents[J]. Library and information service, 2022, 66(3): 140-151.)
[21] LTP[EB/OL]. [2024-03-10]. http://ltp.ai/.
[22] 趙星, 喬利利, 葉鷹. 面向數(shù)據(jù)智能和知識(shí)發(fā)現(xiàn)的圖書情報(bào)學(xué)跨界拓展——數(shù)據(jù)—學(xué)術(shù)—?jiǎng)?chuàng)造整合論[J]. 中國圖書館學(xué)報(bào), 2020, 46(6): 16-25. (ZHAO X, QIAO L L, YE Y. An interdisciplinary extension of library and information science facing data intelligence and knowledge discovery: integration of data-academy-creativity[J]. Journal of library science in China, 2020, 46(6): 16-25.)
作者貢獻(xiàn)說明/Author contributions:
吳艷飛:設(shè)計(jì)研究方案,撰寫論文初稿;
張? 強(qiáng):提出研究思路,論文定稿;
周樹斌:修改論文;
汪睿思:進(jìn)行數(shù)據(jù)采集;
周? 洪:修改論文。
Construction of Knowledge Graph of Dabie Mountain Revolutionary Cultural Relics from the Perspective of Digital Humanities
Wu Yanfei1? Zhang Qiang1? Zhou Shubin1? Wang Sirui2? Zhou Hong3
1School of Information Management, Central China Normal University, Wuhan 430079
2School of Art, Chengdu Jincheng College, Chengdu 610097
3School of Economics and Management, University of Chinese Academy of Sciences, Beijing 100190
Abstract: [Purpose/Significance] Revolutionary cultural relics carry profound historical and cultural value, and the study of their knowledge organization will help promote the development and utilization of revolutionary cultural relics resources in the digital and intelligent era, and provide a new path for the knowledge association and discovery research of revolutionary cultural relics resources. [Method/Process] This study takes the revolutionary cultural relics of Dabie Mountain as the study object. Firstly, the concept of revolutionary cultural relics resources was standardized by constructing an ontology model. Secondly, based on analyzing the structural characteristics of revolutionary cultural relics resources, the entities, attributes, and relationships of data from different sources and structures were extracted, and the knowledge fusion technology was used to solve the existing ambiguity problem. Finally, the data was stored in the Neo4j graph database to complete the construction of the knowledge map of revolutionary cultural relics, and to realize the multi-dimensional knowledge discovery and research of revolutionary cultural relics resources. [Result/Conclusion] By constructing the knowledge map of revolutionary cultural relics, in-depth knowledge mining of revolutionary cultural relics resources can be carried out, fine-grained analysis and knowledge correlation of their knowledge units can be realized, and the foundation can be laid for the intelligent application of revolutionary cultural relics resources.
Keywords: revolutionary cultural relics? ? knowledge graph? ? digital humanities? ? knowledge discovery
Fund project(s): This work is supported by the Key Project of Philosophy and Social Science Research in Colleges and Universities in Anhui Province: “‘Positive up: Research on the Inheritance of Red Gene in Colleges and Universities from the Perspective of Digital Humanities” (Grant No. 2023AH050893)
Author(s): Wu Yanfei, master candidate; Zhang Qiang, doctoral candidate, corresponding author, E-mail: zhangqiang_dh@163.com; Zhou Shubin, master candidate; Wang Sirui, undergraduate; Zhou Hong, doctoral candidate.
Received: 2023-11-20? ? Published: 2024-04-08