丁利民
(東莞市石龍鎮(zhèn)文化服務中心,廣東 東莞 523326)
2017年底,綜藝節(jié)目《國家寶藏》的播出迅速將博物館和文物的相關(guān)話題帶入人們的視野,曾經(jīng)不被人們重視的文物故事一躍成為茶余飯后的重點談資。這檔節(jié)目通過知名影視明星對文物故事的演繹,向觀眾展示了我們國家一代代的文化傳承和文化底蘊,讓文物潮一度達到頂峰。近年來,我國政府也一直高度重視提升人民的文化自信,更是將文化遺產(chǎn)保護提升到了國家戰(zhàn)略高度。而科技的高速發(fā)展讓文化傳播與文物保護具備了符合時代特征和個性化精神需求的發(fā)展空間,正因為如此,越來越多的文物單位(如博物館)和學者將知識圖譜引入到文物資料的存儲、展覽、傳播、傳承等過程中,試圖通過信息技術(shù)手段構(gòu)建各類文物主題數(shù)據(jù)庫,以簡化縮短人工處理文物資料的煩瑣程序,解決耗時等問題。
知識圖譜最早于2012年由美國谷歌公司提出并成功應用于搜索引擎,迅速被信息產(chǎn)業(yè)行業(yè)接受和發(fā)展,現(xiàn)已成為大數(shù)據(jù)收集與分析、語義檢索及智能推薦等強有力的技術(shù)支撐,在諸多領(lǐng)域和行業(yè)得到了廣泛運用。知識圖譜是顯示科學知識的發(fā)展進程與結(jié)構(gòu)關(guān)系的一種圖形,系統(tǒng)化、可視化地描述人類隨時間擁有的知識資源及其載體,整理、繪制、挖掘、分析和顯示科學技術(shù)知識以及它們之間的相互聯(lián)系,在組織內(nèi)創(chuàng)造知識共享的環(huán)境以促進科學技術(shù)研究的合作和深入。①隨著數(shù)字博物館的廣泛建立,文物虛擬化、數(shù)字化的趨勢愈發(fā)明顯,隨之而來的是文物數(shù)據(jù)規(guī)模不斷增加,但目前文物數(shù)據(jù)的收集與維護仍然主要依賴于博物館工作人員,巨大的工作量導致人力、物力和財力的消耗難以估量。因此,文物知識圖譜應運而生。
文物知識圖譜,顧名思義,是指運用知識圖譜的技術(shù)手段將文物資料與數(shù)據(jù)進行整合、收集,形成不同的文物專題數(shù)據(jù)庫,包括文物背景、出土事件、歷史事件、完缺程度、科學研究、展覽陳列等諸多要素,從而便于進行文物檢索、宣傳和利用等。
學術(shù)界關(guān)于博物館文物知識的現(xiàn)有研究文獻多圍繞文物知識的展示與可視化介紹,而未能在實際應用、科學研究方面取得可行性發(fā)展,不能從根本上滿足博物館工作者和文物愛好者的實際應用需求。
而引入知識圖譜后,通過相關(guān)技術(shù)支撐逐漸逐級建立本館—區(qū)域—國家的典型或珍貴文物的知識圖譜并對外公布和展示,并在博物館網(wǎng)站、公眾號、視頻號上的首頁、藏品頁等欄目提供數(shù)字文物的展示及資料檢索等服務。同時,吸收信息技術(shù)、媒體傳播技術(shù)的成果及國內(nèi)外文博行業(yè)網(wǎng)站及其他網(wǎng)站的成功經(jīng)驗,在文物展示的形式、內(nèi)容及功能上不斷推陳出新,打破時間、空間的局限,更大程度上滿足不同研究者和文物愛好者的個性化需求,打造具有特色化、層次化、精準化的智慧博物館,保證文物信息的更新質(zhì)量和更新效率,對于文物知識、博物館文化的傳播、傳承和利用具有重大的推動作用??梢姡瑯?gòu)建博物館文物知識圖譜是文博行業(yè)發(fā)展的必經(jīng)之路。
在經(jīng)濟高質(zhì)量發(fā)展的新時代背景下,人民的生活質(zhì)量更多地取決于精神文明和先進文化的發(fā)展。在文物保護和文化傳承的社會關(guān)注度持續(xù)走高的態(tài)勢下,博物館文物不能再單純地刻畫一段歷史文化,冷冰冰地擺放在庫房或展示柜內(nèi),而更多的是滿足人民的精神文化需求,激發(fā)人民愛國、愛美、愛鄉(xiāng),為人民群眾和各行各業(yè)提供優(yōu)秀文化和美的知識供給。博物館通過構(gòu)建文物知識圖譜,利用虛擬現(xiàn)實、數(shù)字化展示、體感互動等方式為文物展覽提供全時空、全方位、沉浸式的高質(zhì)量體驗,打造可參與、可互動、可分享的博物館,使文物真正“活”起來。不僅如此,除了在展廳提供服務外,還可以通過“云展覽”等形式為非現(xiàn)場群眾、老年人、殘障人士、研究者等提供全新的體驗,既能打破博物館服務時間和空間的限制,又能服務于不同群體的文化需求。
文物保護需要成熟的數(shù)字化技術(shù)體系作為支撐,而文物知識圖譜是對文物知識及相關(guān)資料進行系統(tǒng)的融合匯總,以知識圖譜的形式將文物背景、出土事件、歷史信息、完缺程度、圖案裝飾、科學研究等關(guān)聯(lián)要素進行有機統(tǒng)一,把文物實體搭載的諸多歷史信息進行精準復制,使其能保留信息和價值的完整性并傳承下去,這一過程尤其需要成熟的、安全系數(shù)高的數(shù)字化技術(shù)手段支撐。知識圖譜在應用過程中還需與其他技術(shù)應用系統(tǒng)集成,實現(xiàn)文物主題數(shù)據(jù)庫與不同數(shù)字平臺、館際平臺間的互聯(lián)互通,這一過程也間接地提高了文物知識圖譜的安全系數(shù)和應用廣度。隨著信息技術(shù)的持續(xù)發(fā)展,這些技術(shù)過程也將被持續(xù)完善、拓展和豐富。因此,信息化技術(shù)的發(fā)展應用必然會帶來文博行業(yè)的智慧化發(fā)展,其中博物館文物知識圖譜的構(gòu)建就是必然趨勢之一。
一般而言,知識圖譜的構(gòu)建主要包含知識抽取、知識融合和知識加工三大模塊,但由于博物館文物本身所具有的知識屬性和傳播方式,其知識圖譜的構(gòu)建不僅需要包含這三方面,還需要考慮圖譜的存儲和可視化等問題。此外,由于不同文物間的歷史差異性和復雜程度不同及館方要求、標準不同,不同博物館的數(shù)據(jù)庫對文物的描述、年代和歷史背景等統(tǒng)計資料的規(guī)范度、標準度、統(tǒng)一度不高,導致在實際進行知識圖譜構(gòu)建程序前,還需對數(shù)據(jù)庫的資料進行預處理,以最大限度地統(tǒng)一標準,方便文物知識的抽取和加工,保證知識圖譜的準確性和官方性。
3.1.1 知識抽取
目前,構(gòu)建知識圖譜的數(shù)據(jù)常由博物館文物專家進行人工整理,工作量大,相對而言,人工干預較多,自動化、數(shù)字化程度不高,難以形成規(guī)?;?、系統(tǒng)化、標準化的數(shù)據(jù)體系,因此,如何自動便捷地抽取文物信息并加工是形成知識圖譜的關(guān)鍵。
在文物知識抽取過程中,各類文物數(shù)據(jù)主要來源于現(xiàn)有的博物館館藏數(shù)據(jù)庫或其他公開數(shù)據(jù)庫,這些數(shù)據(jù)庫中的數(shù)據(jù)多為半結(jié)構(gòu)化的網(wǎng)頁信息或是非結(jié)構(gòu)化的文本信息,包括文物圖片、歷史文獻、考古資料、網(wǎng)絡數(shù)據(jù)等,僅靠人工抽取難以實現(xiàn)知識的快速積累,需要借助數(shù)字化的機器技術(shù)和深度學習技術(shù)來幫助完成。
知識抽取主要包括文物性質(zhì)抽取、實體提取、關(guān)系抽取、屬性抽取和事件抽取等多方面要素,在此基礎(chǔ)上進行知識的加工和融合,然后考慮實體對齊、指代消解、知識更新、質(zhì)量評估等方面,最終構(gòu)造完整的文物知識圖譜。②
3.1.2 知識融合
在對文物數(shù)據(jù)進行知識和信息抽取后,如何有效整合這些異構(gòu)多元化的信息實現(xiàn)知識融合是最關(guān)鍵的、必不可少的一環(huán)。知識融合是指將多個數(shù)據(jù)庫來源的文物知識進行對齊和合并工作,形成統(tǒng)一標準的文物知識和數(shù)據(jù)標識,實現(xiàn)文物數(shù)據(jù)與知識間的互聯(lián)互通。就目前的研究進展來看,異構(gòu)多源的文物數(shù)據(jù)和知識由于知識公開和融合度有限,導致在構(gòu)建知識圖譜時大量的信息流未被納入體系中,這一工作仍處在初步發(fā)展階段。多源異構(gòu)數(shù)據(jù)的融合方法如圖1所示??梢?,構(gòu)建文物知識圖譜的工作還有很大的研究和提升空間。
圖1 多源異構(gòu)數(shù)據(jù)的知識融合
3.1.3 知識加工
利用數(shù)字化技術(shù)自動對文物知識和數(shù)據(jù)進行抽取與融合處理后,還需對文物知識進行加工,主要包括知識推理、知識更新、質(zhì)量評估等內(nèi)容。這些文物數(shù)據(jù)和文物知識在被收藏時由于統(tǒng)計標準、記錄形式不一等原因,導致按照統(tǒng)一標準進行標識后還可能存在重復或遺漏統(tǒng)計等問題,因此,有必要對抽取的文物知識和數(shù)據(jù)進行再確認、再整理、再加工。比如,對于重復統(tǒng)計的知識和數(shù)據(jù)需要進行刪除,保留下最完整規(guī)范的信息流;對于遺漏統(tǒng)計的地方,需要綜合判斷數(shù)據(jù)的真實性、有效性和可融合性,利用現(xiàn)成的數(shù)據(jù)進行補充、完善、更新。
3.1.4 生成圖譜
上述準備工作完成之后,可以利用數(shù)字技術(shù)將這些文物數(shù)據(jù)和知識進行大數(shù)據(jù)分析、自然語言處理等,完成博物館文物知識圖譜的構(gòu)建,并對后續(xù)文物知識的表達和呈現(xiàn)提供應用空間。此外,這一知識管理體系也可以與其他應用系統(tǒng)集成或連接,實現(xiàn)文物主題數(shù)據(jù)庫與不同數(shù)據(jù)庫、不同平臺間的互聯(lián)互通。博物館文物知識圖譜的基本構(gòu)建流程如圖2所示。
圖2 文物知識圖譜的基本構(gòu)建流程
3.2.1 文物陳列展覽的業(yè)務支撐
通常而言,博物館展覽是通過文物陳列、文物說明、音視頻介紹、講解員講解等多種形式進行的,但這些形式仍然不能完全滿足部分觀眾或文物愛好者的獨特需求。如果將文物知識講解與知識圖譜結(jié)合起來,能夠?qū)崿F(xiàn)博物館靜態(tài)展覽與數(shù)字化技術(shù)的有效融合,強化文物展覽的科學性、藝術(shù)性和趣味性,解決展覽重點不突出以及文物內(nèi)涵和資料講解不全面、不清晰的問題。
此外,在參觀展覽過程中,觀眾或文物愛好者可能會有對某些文物進行深入了解的欲望,這就需要檢索文物和文物知識。將知識圖譜引入博物館展覽中,可以有效解決這一問題。文物知識圖譜具有信息鉆取功能,可以支撐用戶對文物的深入研究需求,實現(xiàn)博物館展覽文物和觀眾的直接、深入交流。不僅如此,文物知識圖譜還能提供文物檢索功能,用戶的檢索請求可以被機器識別處理,并直接與文物資源庫中的對象標識相匹配,或間接通過關(guān)鍵詞搜索進行邏輯銜接后與文物資源庫中的對象標識相匹配,進而準確檢索出所需查詢的文物知識?;谥R圖譜的文物數(shù)據(jù)交換也可以檢索出相似文物和文物相關(guān)的信息,盡可能高效地擴大檢索范圍,盡可能地提高檢索精準度和匹配度,增強用戶體驗感。③
3.2.2 文物知識問答及普及
文物知識問答即是通過知識圖譜技術(shù),在一定程度上利用文物主題數(shù)據(jù)庫中和觀眾或文物愛好者進行人機互動交流。這一過程目前還存在一定的局限性,即機器技術(shù)對稍復雜的問題無法給出精準回答,但已經(jīng)能夠完成簡單問題或識別到關(guān)鍵詞的問題的精準回答。從技術(shù)層面來看,文物知識圖譜的知識問答應用需要軟件系統(tǒng)支撐,包括前端和后端系統(tǒng)。前者主要輸出知識與數(shù)據(jù),后者主要進行智能問答的處理,通過對用戶的問題進行初步處理,識別關(guān)鍵詞并與主題數(shù)據(jù)庫進行匹配,并將處理結(jié)果反饋給前端基于知識圖譜的問答平臺,從而完成文物知識問答的過程。
隨著國家對博物館工作的高度重視,文物知識傳播更多地通過音視頻、博客、微博等新媒體形式或線上平臺進行,將虛擬與現(xiàn)實、線上與線下有機結(jié)合,從而滿足用戶的視覺體驗和感官需求。將知識圖譜運用到博物館文物知識傳播中是一種新興的數(shù)字化傳播形式,隨著科技發(fā)展應用滲透到生活的方方面面,這種形式的文物傳播反而更能引起人們的好奇和新鮮感,從而達到文物知識傳播的目的。
3.2.3 文物研究的技術(shù)支撐
在文物相關(guān)研究中,學者們一般通過網(wǎng)絡檢索、史料記載、實地考察等形式收集可用資料,然后通過相關(guān)資料的規(guī)整梳理,剔除關(guān)聯(lián)性不大的資料,找出、保留和研究主題、研究文物相聯(lián)系的資料。這一過程通常耗費大量的時間和精力,效率也不高。而相較于人工搜集資料而言,博物館文物知識圖譜會在很大程度上提高文物研究的效率和準確度。因為文物知識圖譜不僅對文物本身的資料數(shù)據(jù)進行了加工融合,也對文物相關(guān)及周邊的文獻進行了知識聚合,其數(shù)據(jù)來源包括了大量的、不同保存格式的參考文獻,這能為學者研究文物提供快速、便捷、精準的查詢服務,提高文獻的利用效率。④
此外,博物館文物知識圖譜對文獻研究也具有相當?shù)默F(xiàn)實意義,知識圖譜通常以可視化視圖的形式表現(xiàn)文獻資料間的關(guān)系和背景信息,并在性質(zhì)、屬性、關(guān)系方面與相關(guān)文物建立實體聯(lián)系,這一過程往往涉及應用統(tǒng)計學、計量學、數(shù)學和信息技術(shù)等多學科的交叉,能反映文獻本身的性質(zhì)和研究側(cè)重點,能幫助學者建立綜合性的研究體系。
文物是具有獨特歷史、人文、藝術(shù)、科學價值的珍貴資源,其數(shù)量大、種類豐富,傳統(tǒng)的文物處理方法難以有效地對博物館文物進行管理、儲存、展示和利用。為了滿足文物保護、管理和利用的更高要求及人們對文物知識的有效需求,在新的技術(shù)環(huán)境下引入新技術(shù)手段勢在必行。博物館文物知識圖譜就是為了應用新的網(wǎng)絡技術(shù)而產(chǎn)生的一種博物館公教傳播的服務方法,通過文物數(shù)據(jù)庫間的互聯(lián)互通將文物知識和數(shù)據(jù)進行加工整合,再通過計算機語言智能地反饋出關(guān)于文物的基本信息和擴展信息,有效解決文物資料收藏、存儲及展示等過程中的一系列局限性或問題。
目前來看,博物館文物知識圖譜的構(gòu)建已初具規(guī)模,但還有很大的提升空間。如何完善博物館文物知識圖譜并利用知識圖譜,助力文博行業(yè)的數(shù)字化、智能化、智慧化發(fā)展,都是未來值得學者們關(guān)注的。
注釋
①劉則淵.科學知識圖譜:方法與應用[C]//遼寧省哲學社會科學成果獎評審委員會辦公室.遼寧省哲學社會科學獲獎成果匯編(2007—2008年度).沈陽:遼寧大學出版社,2010:493-496.
②戴畋.博物館智慧化背景下文物知識圖譜構(gòu)建的實踐探索[J].科學教育與博物館,2022,8(1):41-49.
③劉紹南,楊鴻波,侯霞.文物知識圖譜的構(gòu)建與應用探討[J].中國博物館,2019(4):118-125.
④楊偉強.文物知識圖譜的構(gòu)建與應用[D].天津:天津大學,2018.