国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

文物知識(shí)聚合與傳播的初步研究
——以上海博物館“宋徽宗與他的時(shí)代數(shù)字人文專題”為例

2022-07-06 01:38
東南文化 2022年3期
關(guān)鍵詞:本體圖譜語義

李 峰

(上海博物館 上海 200003)

內(nèi)容提要:博物館作為一個(gè)知識(shí)生產(chǎn)和傳播的機(jī)構(gòu),面對新的時(shí)代環(huán)境,需要?jiǎng)?chuàng)新的知識(shí)化范式。因此,博物館要利用數(shù)字化的知識(shí)組織方法,實(shí)現(xiàn)基于本體模型和知識(shí)圖譜的知識(shí)建模和知識(shí)表達(dá),構(gòu)建博物館數(shù)字化新型的文物詮釋和傳播模式,可以提高公眾對文物知識(shí)生產(chǎn)與獲取的體驗(yàn)感,全面提升博物館文化創(chuàng)新傳播能力。除了理論研究外,上海博物館還不斷進(jìn)行創(chuàng)新性探索,為我國博物館利用新的數(shù)字化知識(shí)生產(chǎn)、組織工具,探索出一條具有特色的知識(shí)聚合、傳播之路。

一、引言

現(xiàn)代博物館從誕生伊始就具有知識(shí)生產(chǎn)和知識(shí)傳播的功能,三百多年來,這已經(jīng)成為博物館的一個(gè)核心價(jià)值。在博物館知識(shí)信息聚合、生產(chǎn)和傳播的過程中,博物館既是舊知識(shí)的匯集之地,也是新知識(shí)誕生的沃土。信息時(shí)代以來,隨著博物館數(shù)字化建設(shè)的逐漸深入,“智慧博物館”概念被提出,博物館界也對知識(shí)屬性予以充分的關(guān)注,提出“在教育與研究方面,通過系統(tǒng)挖掘和整理博物館藏品的歷史、藝術(shù)、科學(xué)和相關(guān)社會(huì)等方面的信息,建立新型的知識(shí)組織方式,推動(dòng)研究與教育的互動(dòng),把博物館及相關(guān)虛擬平臺(tái)打造成為學(xué)生的第二課堂和公眾終身教育的場所”[1]。因此,從智慧博物館建設(shè)的角度來說,知識(shí)的管理、生產(chǎn)和傳播是博物館智慧業(yè)務(wù)的核心要素,也是智慧管理、智慧保護(hù)、智慧服務(wù)的立基之所。我們?nèi)绻梦奈镔Y源講好中國故事、讓文物真正“活起來”,亟需文物知識(shí)生產(chǎn)模式的改革和組織服務(wù)模式的創(chuàng)新,這里的關(guān)鍵就是文物知識(shí)的聚合與傳播,而知識(shí)聚合與傳播的基礎(chǔ)是知識(shí)的組織。

當(dāng)博物館置身于新的時(shí)代語境,面對需要?jiǎng)?chuàng)新的知識(shí)化范式,就有必要引入新的手段和方法進(jìn)行探索。如果說,從知識(shí)聚合(knowledge aggre?gation)到知識(shí)組織(knowledge organization)乃至知識(shí)傳播(knowledge transmission),這一過程形成了一個(gè)博物館知識(shí)創(chuàng)新的關(guān)聯(lián)形態(tài),那么在方法論層面,有必要借助于已構(gòu)成知識(shí)生產(chǎn)重要方式之一的數(shù)字人文,以研究展示為導(dǎo)向,以數(shù)字思維及跨學(xué)科的知識(shí)整合方法介入博物館傳統(tǒng)的專業(yè)研究活動(dòng),形成基于數(shù)字內(nèi)容的知識(shí)生產(chǎn)與傳播鏈。在技術(shù)層面上,利用知識(shí)圖譜(knowledge graph)與本體(ontology)等方法進(jìn)行多元分層且系統(tǒng)化的知識(shí)體系構(gòu)建;利用深度學(xué)習(xí)等智能技術(shù)進(jìn)行博物館文物數(shù)據(jù)的挖掘、分析和揭示;利用數(shù)據(jù)驅(qū)動(dòng)的可視化技術(shù)進(jìn)行展示,讓數(shù)據(jù)以美觀的圖形方式而非數(shù)字方式呈現(xiàn),清晰有效地傳達(dá)與溝通信息?;诖?,博物館經(jīng)過為時(shí)不短的數(shù)字化建設(shè),長期采集加工所形成的大量包括圖像、文本、視頻和三維在內(nèi)的數(shù)據(jù)資源才會(huì)有真正的用武之地。在數(shù)字時(shí)代,博物館的核心業(yè)務(wù)終將與數(shù)字技術(shù)結(jié)合,創(chuàng)新出融合多學(xué)科、以技術(shù)協(xié)力人文而產(chǎn)生的全新業(yè)務(wù)形態(tài),讓傳統(tǒng)的知識(shí)體系和數(shù)字化的知識(shí)系統(tǒng)在博物館中形成競爭性的多層次知識(shí)結(jié)構(gòu),由此給社會(huì)提供一種新的選擇,進(jìn)一步滿足人們對知識(shí)探索、學(xué)習(xí)和創(chuàng)新的需求。

本文將以上海博物館(以下簡稱“上博”)“宋徽宗與他的時(shí)代數(shù)字人文專題”(以下簡稱“宋徽宗數(shù)字人文專題”)為例,探討如何利用數(shù)字化的知識(shí)組織方法,實(shí)現(xiàn)基于本體模型和知識(shí)圖譜的知識(shí)建模和知識(shí)表達(dá),以全面完備的知識(shí)支撐文物敘事,構(gòu)建博物館數(shù)字化新型的文物詮釋和傳播模式,提高公眾對文物知識(shí)生產(chǎn)與獲取的體驗(yàn)感,全面提升博物館文化創(chuàng)新傳播能力。

二、博物館文物知識(shí)聚合與傳播的現(xiàn)狀與問題

1.國內(nèi)博物館數(shù)字化建設(shè)的現(xiàn)狀和瓶頸

國內(nèi)博物館的數(shù)字化建設(shè),如果從1984年上博成立電腦組算起,逾時(shí)近四十年。經(jīng)過以基礎(chǔ)建設(shè)為主的信息化時(shí)期和以分類業(yè)務(wù)系統(tǒng)建設(shè)為主的數(shù)字化建設(shè)時(shí)代后,2015年開始進(jìn)入了“一種以物、人、數(shù)據(jù)動(dòng)態(tài)雙向多元信息傳遞模式為核心”[2]的智慧博物館建設(shè)高潮。雖然多年的數(shù)字化建設(shè)取得了非常大的成就,但也存在著明顯的缺陷,觀察各地全面鋪開的智慧博物館建設(shè),我們不難發(fā)現(xiàn)一個(gè)明顯的特征,就是各館的建設(shè)內(nèi)容同質(zhì)性相當(dāng)高:不外乎是通過二維或三維的文物數(shù)字化采集,建設(shè)以藏品為主的業(yè)務(wù)行政管理系統(tǒng)、以傳播為主的網(wǎng)站、觀眾導(dǎo)覽及預(yù)約等服務(wù)系統(tǒng),間或有一些數(shù)字展示的軟硬件。但缺乏真正能對博物館轉(zhuǎn)型或核心業(yè)務(wù)發(fā)展具有推動(dòng)作用的產(chǎn)品,尤其是能對博物館的文物研究發(fā)揮關(guān)鍵作用的平臺(tái),比如協(xié)作性文物研究平臺(tái);同時(shí)也很少產(chǎn)生博物館知識(shí)傳播的精品類產(chǎn)品,比較有影響力的反而是那種“網(wǎng)紅”產(chǎn)品。出現(xiàn)這種狀況的原因當(dāng)然有很多,其中最主要的是:從主觀上講,我們?nèi)鄙購闹R(shí)生產(chǎn)、知識(shí)傳播角度進(jìn)行智慧化建設(shè)的思考、實(shí)踐;從客觀上說,雖然文物類型眾多、文物數(shù)據(jù)的數(shù)量每年都在大幅增長,但文物數(shù)據(jù)多為多源異構(gòu),標(biāo)準(zhǔn)化程度差,因此給文物數(shù)據(jù)的組織和關(guān)聯(lián)帶來相當(dāng)大的阻礙。很多博物館在手握大量二維、三維數(shù)據(jù)的情況下,卻茫然不知所措,不知下一步該怎么走,而且這一問題普遍存在,可以說形成了博物館智慧化建設(shè)的一個(gè)巨大瓶頸。

2.國外博物館知識(shí)數(shù)據(jù)組織的啟示

如果我們能體認(rèn)到在博物館的數(shù)字化傳播方面,絕不能僅僅走流行路線、靠賣萌搞怪賺取流量這一招鮮,那么,博物館智慧化建設(shè)就應(yīng)該進(jìn)行某種深層次的改變,真正以內(nèi)容為中心展開知識(shí)性傳播,體現(xiàn)博物館的自身價(jià)值和初衷。當(dāng)然,要實(shí)現(xiàn)這一點(diǎn),需要博物館在現(xiàn)有傳播基礎(chǔ)上進(jìn)行一次實(shí)質(zhì)性的“融合創(chuàng)新”。所謂“讓文物活起來”,并不簡單地等同于讓文物動(dòng)起來。以數(shù)字化的一個(gè)最基本的應(yīng)用——展品闡釋來說,不是幾張圖片、一段文字就能完成,也不是簡單地讓一張畫從平面變立體并有動(dòng)態(tài)展示即可,其背后應(yīng)該有一個(gè)知識(shí)體系的支撐。而在這方面,國外博物館似乎比國內(nèi)博物館先行一步。2004年,芬蘭各博物館與公司聯(lián)合推出了基于Sampo語義模型的Museum Finland門戶網(wǎng)站。2006年,國際文獻(xiàn)工作委員會(huì)(International Committee for Documentation,CIDOC)開發(fā)的基于本體的數(shù)據(jù)模型——CIDOC概念參考模型(CIDOC Conceptual Reference Model,CIDOC CRM)成為國際標(biāo)準(zhǔn)化組織(ISO)的推薦標(biāo)準(zhǔn)[3]。CIDOC CRM提供了一個(gè)通用并且可擴(kuò)展的語義框架,使任何文化遺產(chǎn)信息都能用該框架描述,并且定義了文化遺產(chǎn)領(lǐng)域的各類實(shí)體(概念)、屬性(關(guān)系),形成通用的術(shù)語詞表,從而推動(dòng)實(shí)現(xiàn)了不同文化遺產(chǎn)信息源之間的信息交換、集成和互操作,現(xiàn)該模型已逐漸成為文化遺產(chǎn)領(lǐng)域的一個(gè)通用的主流模型[4]。近年來,文化遺產(chǎn)機(jī)構(gòu)之間的協(xié)同合作被視為一種趨勢,比如信息資源管理領(lǐng)域的GLAM(即美術(shù)館/Gal?lery、圖書館/Library、檔案館/Archives以及博物館/Museum)的館際協(xié)作及資源整合方式已經(jīng)逐漸成熟,GLAM也因此成為這一領(lǐng)域的指稱。在這一合作的過程中,圖情界的一些成熟的知識(shí)組織方法,如元數(shù)據(jù)、主題分類、本體等也逐漸為博物館界所應(yīng)用。例如在數(shù)字化建設(shè)方面堪稱楷模的美國克利夫蘭博物館(Cleveland Museum of Art)在2013年開放的Gallery One項(xiàng)目[5],一般人可能會(huì)更關(guān)注其由12米寬超大顯示屏所組成的“藏品墻”(Collection Wall)以及被稱為“鏡頭”(Lens)的互動(dòng)屏,被它的豐富內(nèi)容和充分的個(gè)性化體驗(yàn)所吸引,但很少有人知道在這些屏幕背后的定制型數(shù)據(jù)融合管理系統(tǒng)(Piction CMS)的強(qiáng)大支撐作用,以及通過元數(shù)據(jù)進(jìn)行的數(shù)據(jù)控制和組織。正是這些數(shù)據(jù)庫和內(nèi)容管理系統(tǒng),才使得這一著眼于激發(fā)觀眾的創(chuàng)造力及其對館藏作品全面理解的項(xiàng)目目標(biāo)能夠全面實(shí)現(xiàn)。而運(yùn)用主題分類最為引人注目的是英國維多利亞和阿爾伯特博物館(Victoria&Albert Museum)所做的“中國圖像志索引典”(Chinese Iconography Thesaurus,CIT)[6]。圖像志原是一種研究歐洲藝術(shù)史的方法,被用來紀(jì)錄和檢索藝術(shù)史中的圖像。由于沒有針對中國藝術(shù)進(jìn)行圖像志主題分類的方案,過去歐洲及北美博物館的中國文物通常只能按照西方的分類體系進(jìn)行編目著錄。CIT首次改變了這一狀況,設(shè)計(jì)出了符合中國文物藝術(shù)品概念的詞匯方案。這一系統(tǒng)“期望為博物館、圖書館與文獻(xiàn)庫的專業(yè)人士創(chuàng)建一套標(biāo)注準(zhǔn)則,提供標(biāo)準(zhǔn)詞匯(受控詞表),從而提升館藏文物編目的質(zhì)量和準(zhǔn)確性,促進(jìn)數(shù)字圖像跨收藏的信息獲取及相互操作”[7]。CIT系統(tǒng)以自然界、人類、社會(huì)與文化、宗教、神話與傳說、歷史與地理及文學(xué)作品為基本分類,每一類以樹形圖模式呈現(xiàn)多種層次及其語義聯(lián)系。借助索引典,研究人員可以選擇適當(dāng)詞匯闡明中國文物藝術(shù)圖像的概念與內(nèi)容,也能在很大程度上提升館藏文物編目的質(zhì)量和準(zhǔn)確性,并促進(jìn)數(shù)字圖像信息的交換及獲取。

3.國內(nèi)博物館知識(shí)組織的初步實(shí)踐

相較于歐美,國內(nèi)博物館在這方面還處于剛剛起步階段。2014年,我國科學(xué)技術(shù)部批復(fù)設(shè)立“文物數(shù)字化保護(hù)標(biāo)準(zhǔn)體系及關(guān)鍵標(biāo)準(zhǔn)研究與示范”項(xiàng)目,文博單位借助圖情界的力量開始了文物元數(shù)據(jù)的研究。2017年5月,文物數(shù)字化保護(hù)元數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范各項(xiàng)征求意見稿陸續(xù)發(fā)布,邁出了文物數(shù)字資源標(biāo)準(zhǔn)化的重要一步。2017年以來,山西博物院聯(lián)合天津大學(xué)在國內(nèi)文博領(lǐng)域開展文物知識(shí)圖譜構(gòu)建的探索性應(yīng)用研究,首次提出了建立館藏文物知識(shí)圖譜知識(shí)表達(dá)的數(shù)據(jù)模型,初步開發(fā)了文物知識(shí)圖譜的存儲(chǔ)、檢索功能,并結(jié)合智能問答、計(jì)算機(jī)語音等技術(shù)實(shí)現(xiàn)了語義搜索、文物知識(shí)問答機(jī)器人等知識(shí)圖譜應(yīng)用[8]。2018年底,上博配合“丹青寶筏——董其昌書畫藝術(shù)大展”推出了“董其昌數(shù)字人文綜合展示系統(tǒng)”(以下簡稱“董其昌展示系統(tǒng)”),在文博界產(chǎn)生了較大的影響力。董其昌展示系統(tǒng)依托上博豐富的藏品資源和雄厚的研究基礎(chǔ),參照CIDOC CRM等國際標(biāo)準(zhǔn)、基于關(guān)聯(lián)數(shù)據(jù)(linked data)設(shè)計(jì)了董其昌的數(shù)據(jù)體系,并基本形成半結(jié)構(gòu)化的明清文人書畫本體[9]。除了展示數(shù)據(jù)的組織之外,董其昌展示系統(tǒng)的開發(fā)以董其昌為基點(diǎn)、以古代文人活動(dòng)為核心、以社會(huì)網(wǎng)絡(luò)關(guān)系和歷史地理信息技術(shù)為兩個(gè)主要應(yīng)用點(diǎn),輔以人工智能技術(shù),通過數(shù)據(jù)關(guān)聯(lián)和量化分析,以可視化的形式呈現(xiàn)與董其昌相關(guān)的時(shí)、地、人、事。此次展示在業(yè)內(nèi)引發(fā)的轟動(dòng)效應(yīng),在一定程度上激發(fā)了國內(nèi)文博界進(jìn)行知識(shí)聚合與傳播的熱情。例如敦煌研究院與武漢大學(xué)聯(lián)手,共同對敦煌壁畫圖像所蘊(yùn)含的信息進(jìn)行語義描述、揭示與標(biāo)注,并提出層次性的圖像語義描述框架(SDFDI)[10],在此基礎(chǔ)上,還進(jìn)行了敦煌壁畫敘詞表的構(gòu)建和關(guān)聯(lián)數(shù)據(jù)發(fā)布[11],以及利用元數(shù)據(jù)、語義標(biāo)注、國際圖像互操作框架(IIIF)等技術(shù)與標(biāo)準(zhǔn),構(gòu)建文化遺產(chǎn)圖像交互式數(shù)字?jǐn)⑹孪到y(tǒng)的開發(fā)[12];秦始皇帝陵博物院則搭建了“四海一”虛擬展覽平臺(tái)[13],這是一個(gè)利用數(shù)字網(wǎng)絡(luò)技術(shù)和信息技術(shù)構(gòu)建的大型秦文化虛擬展示,通過文物知識(shí)圖譜等技術(shù)的運(yùn)用,以文物知識(shí)服務(wù)系統(tǒng)的表達(dá),揭示秦代的物質(zhì)文明和精神文明;最近,江西省博物館建成了“江西古代名人數(shù)字人文研究與服務(wù)平臺(tái)”[14],這是依托江西古代歷史文化遺產(chǎn)和名人文化資源,以館藏文物和其他相關(guān)研究資料等數(shù)據(jù)為基礎(chǔ),以江西古代名人知識(shí)為主體,利用知識(shí)圖譜技術(shù)建設(shè)的專題文化知識(shí)服務(wù)平臺(tái)。

綜上,雖然國內(nèi)博物館在知識(shí)組織和傳播上已經(jīng)有了一些成果,但都是個(gè)別的、零星的、自覺的行為,在文博界還沒有形成較大規(guī)模的共識(shí)和共同的行動(dòng)。在這方面,國內(nèi)博物館不用說與國外博物館相比,就是與國內(nèi)圖情界相比也存在較大差距。比如國內(nèi)圖情界很多已采用聯(lián)合目錄等方法進(jìn)行更關(guān)鍵的數(shù)據(jù)互通和共享,而博物館界較多采用各自為戰(zhàn)的方式進(jìn)行數(shù)字化建設(shè),很少有行業(yè)內(nèi)各類型或區(qū)域內(nèi)博物館的聯(lián)動(dòng)和數(shù)據(jù)交換、共享機(jī)制以及建設(shè)實(shí)踐;圖情界對知識(shí)組織從上到下已形成共識(shí)并付之于行動(dòng),博物館界缺乏運(yùn)用數(shù)字化方法進(jìn)行知識(shí)生產(chǎn)的意識(shí),導(dǎo)致出現(xiàn)知識(shí)生產(chǎn)效率低、知識(shí)表達(dá)缺少系統(tǒng)性、自建知識(shí)較為孤立等基礎(chǔ)問題,以及知識(shí)交換機(jī)制不完善、公眾參與度低等技術(shù)面和需求面的問題;在理論研究、數(shù)據(jù)標(biāo)準(zhǔn)、技術(shù)規(guī)范等方面,博物館與圖情界相比也差距很大。所以,在知識(shí)圖譜與本體方法已經(jīng)日益成為知識(shí)數(shù)據(jù)組織和表達(dá)的主要手段時(shí),有志于文物數(shù)字化知識(shí)生產(chǎn)的博物館界同仁,應(yīng)該更多采用多維度、多層次、細(xì)顆粒度的領(lǐng)域數(shù)據(jù)的組織,來進(jìn)行文物知識(shí)圖譜及本體的構(gòu)建,以實(shí)現(xiàn)本領(lǐng)域甚至是跨領(lǐng)域的知識(shí)融通,進(jìn)而達(dá)成基于數(shù)字技術(shù)的、多學(xué)科知識(shí)整合的、創(chuàng)新型的知識(shí)生產(chǎn)模式,提高公眾對文物知識(shí)生產(chǎn)與獲取的體驗(yàn)感,全面提升博物館文化創(chuàng)新傳播能力。

三、知識(shí)圖譜、本體與文物知識(shí)聚合與傳播

在數(shù)字化領(lǐng)域,不論是開展文物知識(shí)聚合還是傳播工作,都需要有相應(yīng)的方法與技術(shù)的支撐。如果說,元數(shù)據(jù)的運(yùn)用為我們提供了結(jié)構(gòu)化數(shù)據(jù)基礎(chǔ),那么,隨著語義網(wǎng)、深度學(xué)習(xí)等技術(shù)和方法的快速發(fā)展,可通過知識(shí)圖譜和本體來達(dá)到建立數(shù)據(jù)或知識(shí)間的廣泛聯(lián)系,形成重要知識(shí)組織和利用的表達(dá)方式,并以此來支持新的研究范式、知識(shí)生產(chǎn)方法和知識(shí)傳播模式。

1.信息領(lǐng)域知識(shí)組織的發(fā)展路徑

知識(shí)圖譜、本體主要用于知識(shí)組織。所謂“知識(shí)組織”,一般泛指對知識(shí)數(shù)據(jù)進(jìn)行描述、標(biāo)引、分類和整序。但在大數(shù)據(jù)環(huán)境下,知識(shí)組織面臨著新挑戰(zhàn)與變革,需要結(jié)合海量的、多樣性的、動(dòng)態(tài)性的數(shù)據(jù)特征進(jìn)行多維度、多層次的組織,同時(shí)知識(shí)組織也逐漸向開放化、語義化的方向發(fā)展[15]。從在這方面發(fā)展得更為成熟的圖情領(lǐng)域來看,引入語義網(wǎng)技術(shù)和本體方法后,由于語義網(wǎng)提供了一套比較完整的知識(shí)建模和知識(shí)表示規(guī)范,超越了元數(shù)據(jù)以資源對象為中心的知識(shí)組織方式,因此圖書館知識(shí)組織方法的適用范圍得以進(jìn)一步擴(kuò)大。作為后來者的文博機(jī)構(gòu),圖情界的做法值得借鑒。實(shí)際上,關(guān)聯(lián)數(shù)據(jù)、知識(shí)圖譜、本體等都是在語義網(wǎng)發(fā)展過程中產(chǎn)生的,是用于構(gòu)建知識(shí)間語義關(guān)聯(lián)的方法。1998年12月,蒂姆·伯納斯-李(Tim Berners-Lee)正式提出了“語義網(wǎng)”(Semantic Web)的概念。語義網(wǎng)的目標(biāo)是想用更豐富的方式表達(dá)數(shù)據(jù)背后的含義,讓計(jì)算機(jī)能夠理解數(shù)據(jù)。2006年,蒂姆·伯納斯-李進(jìn)一步提出了“關(guān)聯(lián)數(shù)據(jù)”,這是一種用來定義在語義網(wǎng)上如何發(fā)布結(jié)構(gòu)化數(shù)據(jù)的方法,以使得數(shù)據(jù)能夠相互連接起來,便于得到更好的使用。2011年,英國大英博物館(The British Museum)基于館藏目錄創(chuàng)建關(guān)聯(lián)數(shù)據(jù),建立了關(guān)聯(lián)開放數(shù)據(jù)項(xiàng)目[16]。大英博物館為該項(xiàng)目提供了2500條關(guān)聯(lián)開放數(shù)據(jù),并利用這些開放數(shù)據(jù)陸續(xù)推出了多項(xiàng)語義檢索、語義數(shù)據(jù)注釋、語義圖像注釋等開放研究課題[17]。2012年,美國谷歌公司(Google Inc.)提出“知識(shí)圖譜”概念,初衷是讓用戶能夠更快更精準(zhǔn)地發(fā)現(xiàn)新的信息和知識(shí)[18]。在它被成功應(yīng)用于谷歌搜索引擎之后,知識(shí)圖譜技術(shù)才真正得到了廣泛的關(guān)注。在文博領(lǐng)域,最有代表性的應(yīng)用應(yīng)該是2012年開始的“歐洲數(shù)字圖書館項(xiàng)目”(Europeana),資源包括了來自15個(gè)歐洲國家的二百多家文化遺產(chǎn)機(jī)構(gòu)的文物、書籍、圖片等。開發(fā)者采用自主建立的本體歐洲數(shù)據(jù)模型(Europeana Data Model,EDM),在不同的知識(shí)實(shí)體之間構(gòu)建語義鏈接,以實(shí)現(xiàn)歐洲博物館、畫廊、圖書館和檔案館資源的整合,成為一個(gè)歐洲數(shù)字文化資源聚合門戶,同時(shí)也是一個(gè)知識(shí)聚合的交流平臺(tái)[19]。其中,作為數(shù)據(jù)組織核心的歐洲數(shù)據(jù)模型就是一個(gè)基于本體的跨領(lǐng)域、跨機(jī)構(gòu)的復(fù)雜關(guān)聯(lián)數(shù)據(jù)模型。本體以其跨領(lǐng)域融合的特性日益引起人們的重視,并開始不斷地被各領(lǐng)域的研究者應(yīng)用,成為知識(shí)組織方法的“新貴”。

2.信息技術(shù)領(lǐng)域的本體及其應(yīng)用

信息技術(shù)領(lǐng)域的本體是一種知識(shí)表示方法,它用計(jì)算機(jī)可處理的一種形式化表達(dá)方法,對特定領(lǐng)域的概念進(jìn)行描述。文物數(shù)據(jù)信息處理的難點(diǎn)就是它有大量的非結(jié)構(gòu)化數(shù)據(jù)及其多樣性來源。因此要做知識(shí)組織,就必須首先對多源、不規(guī)范的信息進(jìn)行綜合處理,通過信息的相互補(bǔ)充、重組和優(yōu)化,從而達(dá)到數(shù)據(jù)的規(guī)范化和語義化,這就是進(jìn)行所謂的語義轉(zhuǎn)化,而語義轉(zhuǎn)化的基礎(chǔ)就是需要有本體數(shù)據(jù)模型。建立本體是以知識(shí)共享為目的的,從大數(shù)據(jù)時(shí)代知識(shí)領(lǐng)域的角度來看,“機(jī)器世界中的‘知識(shí)融通’要求統(tǒng)一的知識(shí)建模和一致的知識(shí)表示,前者作為高層、抽象的知識(shí)共享模型,超越學(xué)科話語體系,在不同領(lǐng)域的術(shù)語間建立映射和關(guān)聯(lián);后者提供一致的知識(shí)編碼規(guī)范,以支持與原生數(shù)據(jù)格式無關(guān)的數(shù)據(jù)傳輸、交換和融合”[20]。在文博界,美國蓋蒂基金會(huì)(Getty Trust)藝術(shù)信息工作組(Art Information TaskForce)制定的用于描述藝術(shù)作品或作品集合的元數(shù)據(jù)標(biāo)準(zhǔn)——藝術(shù)作品描述類目(CDWA),在相當(dāng)長的時(shí)間受到推崇[21]。但它多是對某個(gè)藏品的個(gè)別描述,對數(shù)據(jù)間的關(guān)系定義較少,還構(gòu)不成一個(gè)本體。而前述的CIDOC CRM則在《引言》中清楚地表示它就是要提供一個(gè)基于本體的元數(shù)據(jù)集成概念模型,形成促進(jìn)多樣化的文化遺產(chǎn)信息源的集成、轉(zhuǎn)接和相互交換的形式本體設(shè)計(jì)[22]。所以,從建立開始,CIDOC CRM就是一個(gè)遵循了知識(shí)本體原則的模型:它明確地定義了文化遺產(chǎn)領(lǐng)域的各種實(shí)體(類別)、屬性(關(guān)系)。在CIDOC CRM模型中,“實(shí)體是通過屬性連接的,屬性兩端的實(shí)體分別是屬性的定義域和值域”[23]。CIDOC CRM所制定的語義框架達(dá)成了文化遺產(chǎn)領(lǐng)域異構(gòu)信息的共同理解,從而實(shí)現(xiàn)了異構(gòu)文化遺產(chǎn)信息的整合和共享[24]。也正是因?yàn)镃IDOC CRM所具有的知識(shí)本體的特征,其在文化遺產(chǎn)及文博領(lǐng)域得到了廣泛的運(yùn)用。近年來,上博開始了將基于CIDOC CRM本體模型和詞表的知識(shí)組織方法應(yīng)用于數(shù)字人文實(shí)踐中的初步嘗試,即2018年的“董其昌展示系統(tǒng)”;在此基礎(chǔ)上,2021年上博在此方面進(jìn)行了更大規(guī)模的探索,即“宋徽宗數(shù)字人文專題”的開發(fā)制作,并以此作為上博在文物知識(shí)聚合與傳播方面的一次新努力。

四、上博文物知識(shí)聚合與傳播的再嘗試

1.項(xiàng)目的背景

在后疫情時(shí)代,博物館的數(shù)字化傳播和展示在線上線下都成為熱點(diǎn)。但目前國內(nèi)博物館的數(shù)字展示都在往所謂的“沉浸式”方向傾斜,以視覺沖擊、感官體驗(yàn)為特色,以贏得流量、吸引打卡為追求,而博物館作為一個(gè)知識(shí)生產(chǎn)和傳播的機(jī)構(gòu),其初衷有可能在無形中被消解了。因此,在沉浸式數(shù)字展示泛濫之余,我們應(yīng)該也必須為博物館的數(shù)字展示找到另外一條出路,那就是數(shù)字化的知識(shí)闡釋。博物館數(shù)字化的文化魅力在很大程度上也體現(xiàn)在通過闡釋使知識(shí)得到傳播,體現(xiàn)在觀眾對知識(shí)的發(fā)現(xiàn)和解讀,體現(xiàn)在觀眾對知識(shí)的認(rèn)識(shí)與體驗(yàn)的歡樂中。在這方面,數(shù)字人文給我們提供了一種很好的思路和方法。2018年,上博的“董其昌展示系統(tǒng)”率先作了一些嘗試,2021年的“宋徽宗數(shù)字人文專題”是在這方面繼續(xù)開拓的標(biāo)志(圖一)。從“董其昌展示系統(tǒng)”到“宋徽宗數(shù)字人文專題”,不單單是一個(gè)內(nèi)容由點(diǎn)到面的擴(kuò)展,更是力圖在博物館數(shù)字闡釋上進(jìn)行一些新的嘗試,即在傳統(tǒng)史學(xué)和器物學(xué)的基礎(chǔ)上,融入政治史、社會(huì)學(xué)、經(jīng)濟(jì)史、文獻(xiàn)學(xué)等多學(xué)科視角及語境,幫助觀眾對人、文化乃至背后的社會(huì)進(jìn)行多元化解讀,引起觀眾的發(fā)散性思考。通過數(shù)據(jù)的標(biāo)引聚類、信息的整合呈現(xiàn),對時(shí)、地、人、事、物全面關(guān)聯(lián):遠(yuǎn)觀精讀書畫精品,多維度剖析趙佶的人生百態(tài),可視化梳理人物關(guān)系,力求實(shí)現(xiàn)博物館數(shù)字化展示見物見人、更要見社會(huì)的理想目標(biāo),成為知識(shí)聚類與傳播的一個(gè)良好案例。

圖一//“宋徽宗數(shù)字人文專題”系統(tǒng)架構(gòu)(圖片來源:作者提供)

2.項(xiàng)目的主要內(nèi)容

“宋徽宗數(shù)字人文專題”項(xiàng)目由“綜合主頁”及“大事”“人物”“作品”等多個(gè)版塊組成,從“人”“事”“物”三個(gè)維度實(shí)現(xiàn)數(shù)據(jù)的知識(shí)化、結(jié)構(gòu)化和可視化呈現(xiàn)。

首先是“綜合主頁”。作為系統(tǒng)的總?cè)肟冢捎脛?dòng)態(tài)時(shí)空地圖的形式,將由數(shù)萬條宋代文獻(xiàn)、實(shí)物及相關(guān)學(xué)術(shù)研究成果資源轉(zhuǎn)化而成的可讀數(shù)據(jù),根據(jù)數(shù)字化的原則結(jié)構(gòu)整合,形成以時(shí)間為經(jīng)、空間為緯,人物、事件、實(shí)物為坐標(biāo)的整體知識(shí)呈現(xiàn)系統(tǒng),意在整體呈現(xiàn)在宋徽宗54年人生中北宋末年歷史文化的發(fā)展趨勢、重大節(jié)點(diǎn)和實(shí)物例證,體現(xiàn)各孤立知識(shí)點(diǎn)之間顯性與隱性的關(guān)系及彼此的層級(jí),幫助研究與學(xué)習(xí)者透過真實(shí)的數(shù)據(jù)遠(yuǎn)(distant reading)主題,形成對北宋末期代表人物和典型文化面貌的認(rèn)知(彩插五∶1)。

其次是“大事”版塊。以事件為中心,采用“圖譜化總覽頁面”“時(shí)空地圖頁面”兩種形式,從綜合、分類兩個(gè)維度,通過和戰(zhàn)、災(zāi)異、文藝三個(gè)角度,多樣化聚類并深度分析北宋末年史事的政治、經(jīng)濟(jì)、文化內(nèi)涵(彩插五∶2)。“圖譜化總覽頁面”將徽宗時(shí)期大事以散點(diǎn)形式組織于整體的可視化頁面之中,以視覺邏輯呈現(xiàn)各事件看似散漫實(shí)則互具因果的關(guān)系,并提供時(shí)間、人物、地點(diǎn)元數(shù)據(jù)的圖譜檢閱功能,反映不同數(shù)據(jù)點(diǎn)在數(shù)據(jù)流中的位置與語義。“時(shí)空地圖頁面”以時(shí)間軸和地圖相結(jié)合,并列對照北宋末年中國與歐洲的歷史、文藝發(fā)展進(jìn)程,展現(xiàn)中華文明在世界范圍內(nèi)的獨(dú)特成就、位置以及前大航海時(shí)代文明交流的區(qū)域性特點(diǎn)。和戰(zhàn)、災(zāi)異、文藝三個(gè)大事頁面則從不同的橫切面深入展現(xiàn)和探討了北宋末年安全環(huán)境、自然環(huán)境、文化環(huán)境對歷史進(jìn)程的影響。

再次是“人物”版塊。以人物為中心,展示宋徽宗本人、家庭、政治人物關(guān)系及其對北宋末期歷史及文化走向的影響。由于宋徽宗在政治及文化上獨(dú)特的中心地位,將其本人、家族及作品數(shù)據(jù)集以獨(dú)立單元予以展示,并與“作品”等版塊互相鏈接,形成既獨(dú)立又整體的展現(xiàn)效果?!叭宋铩卑鎵K以“變法人物”“文藝地圖”“行跡圖”為主要形式,分別展現(xiàn)徽宗時(shí)期政治人物、文藝人物及具有代表性政治文藝人物的結(jié)構(gòu)化數(shù)據(jù),從不同側(cè)面和層次揭示其基本歷史形態(tài)及產(chǎn)生的影響。“變法人物”以北宋著名的“元祐黨爭”為切入口,引用中國歷代人物傳記資料庫(CBDB)的數(shù)據(jù),對徽宗時(shí)期政治人物錯(cuò)綜復(fù)雜的政治關(guān)系進(jìn)行梳理并分層級(jí)、分類型展示,形成一對多、多對多的可視化關(guān)系描述,反映內(nèi)在的關(guān)聯(lián)規(guī)律,構(gòu)成動(dòng)態(tài)的關(guān)系圖譜(彩插六∶1)?!拔乃嚨貓D”依托年代、地點(diǎn)、人物基礎(chǔ)數(shù)據(jù)庫,結(jié)合歷史地圖、“搜韻”和CBDB等平臺(tái)的數(shù)據(jù),力圖全面呈現(xiàn)北宋文學(xué)、書法、繪畫等著名藝術(shù)家的時(shí)空分布規(guī)律、創(chuàng)作流行趨勢及具體作品實(shí)例。“行跡圖”分別挑選徽宗時(shí)期最具代表性的文藝人物——蘇軾和李清照進(jìn)行個(gè)案呈現(xiàn)。前者是宋代最為著名的政治家、文學(xué)家、藝術(shù)家,活躍于宋徽宗父兄在位期間及徽宗的青少年時(shí)期;后者的生卒年代貫穿反映徽宗人生的整個(gè)時(shí)期,是當(dāng)時(shí)最具代表性的文藝人物,父族和夫族又深度參與當(dāng)時(shí)政事。系統(tǒng)通過對二者生平經(jīng)歷的編年化梳理和空間定位,以及時(shí)空坐標(biāo)與他們創(chuàng)作實(shí)例的精確關(guān)聯(lián),從側(cè)面樣本化地呈現(xiàn)了徽宗青少年時(shí)代北宋政治、文藝的特征及其對徽宗思想、藝術(shù)的影響,以及徽宗時(shí)期思想、藝術(shù)的發(fā)展流變和對南宋時(shí)期文藝發(fā)展的深遠(yuǎn)影響。

最后是“作品”版塊。通過對徽宗時(shí)期書畫藝術(shù)品進(jìn)行分類標(biāo)注和聚類分析,以實(shí)例形式呈現(xiàn)北宋末年藝術(shù)發(fā)展的大致面貌(彩插六∶2)?!白髌贰卑鎵K分別構(gòu)建了針對書畫類文物的本體,形成了書畫文物的概念模型和知識(shí)圖譜,并引入深度學(xué)習(xí)技術(shù),對書畫實(shí)物的視覺主題元素以及印章、題跋元素進(jìn)行語義化聚類,最終形成智能化關(guān)聯(lián)和呈現(xiàn)。

3.項(xiàng)目的知識(shí)組織和表達(dá)

“宋徽宗數(shù)字人文專題”項(xiàng)目的一個(gè)關(guān)鍵難點(diǎn)就在于對來自不同渠道的、內(nèi)容龐雜的資源數(shù)據(jù)進(jìn)行聚合、梳理、組織和有序的可視化表達(dá)。比如以書畫為主體的文物展示的組織,上博針對不同來源、不同層次、不同結(jié)構(gòu)、不同內(nèi)容的文物知識(shí)進(jìn)行綜合和集成,實(shí)施結(jié)構(gòu)再建,使單一知識(shí)、零散知識(shí)、新舊知識(shí)、顯性知識(shí)和隱性知識(shí)經(jīng)過整合提升形成新的知識(shí)體系,同時(shí)不斷迭代這一過程,實(shí)現(xiàn)文物知識(shí)的持續(xù)集成演化。圖二為文物知識(shí)集成的模型,主要的處理流程包括采集入庫、數(shù)據(jù)預(yù)處理、知識(shí)提取、知識(shí)檢索、關(guān)聯(lián)度計(jì)算、知識(shí)關(guān)聯(lián)、專家篩選、知識(shí)評價(jià);文物知識(shí)集成過程還需要有對應(yīng)的管理策略,主要包括版本管理、權(quán)限管理和操作記錄。文物知識(shí)演化過程可分為知識(shí)協(xié)同、知識(shí)集成、知識(shí)評估、知識(shí)更新和知識(shí)應(yīng)用五個(gè)過程。

圖二// 文物知識(shí)集成模型(圖片來源:作者提供)

上博還對其現(xiàn)有書畫文物數(shù)據(jù)結(jié)構(gòu)和術(shù)語標(biāo)準(zhǔn)化情況進(jìn)行梳理,以上博藏品管理系統(tǒng)中書畫類文物采用的本地標(biāo)準(zhǔn)化術(shù)語,映射國際文物領(lǐng)域元數(shù)據(jù)標(biāo)準(zhǔn)《藝術(shù)品描述類目》(CDWA)(表一),確認(rèn)書畫類文物元數(shù)據(jù)方案(表二)。同時(shí),進(jìn)一步定義核心元素作為發(fā)展書畫本體之基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)和內(nèi)容,根據(jù)元數(shù)據(jù)元素和其他相關(guān)重點(diǎn)知識(shí)信息(如文物背景脈絡(luò)、相關(guān)事件)與知識(shí)本體標(biāo)準(zhǔn)CIDOC CRM進(jìn)行映射,研究確立映射路徑,提出書畫知識(shí)本體之實(shí)體與屬性。再根據(jù)分析結(jié)果擴(kuò)展書畫類文物知識(shí)本體模型之實(shí)體,如畫面元素、地點(diǎn)、主題類型、人物交往關(guān)系、相關(guān)事件等(圖三)。此外,由于書畫文物的創(chuàng)作者、創(chuàng)作時(shí)間、書派/畫派、展覽/借出史等亦需要進(jìn)一步的實(shí)體和屬性關(guān)系表述,故分別建立了相應(yīng)模型。同時(shí)開展基于上博繪畫藏品數(shù)據(jù)的主題詞分析,研發(fā)書畫類文物專題知識(shí)圖譜,為知識(shí)聚合敘事傳播提供支撐。書畫文物知識(shí)圖譜采用網(wǎng)絡(luò)本體語言(ontology web language,OWL)作為本體的形式化表達(dá)方法,主要包含書畫文物本體、人物本體、年代本體、地點(diǎn)本體及事件本體。使用本體作為框架,利用語義網(wǎng)技術(shù),通過知識(shí)抽取、融合及關(guān)聯(lián),對以書畫為主體的文物數(shù)據(jù)、文獻(xiàn)及數(shù)字資源進(jìn)行組織和聚合,形成覆蓋人、事、時(shí)、地、物的龐大信息網(wǎng)絡(luò),解決博物館信息資源的多源異構(gòu)、難以整合、知識(shí)服務(wù)水平較低的問題(彩插七∶1)。

表一// 上博本地?cái)?shù)據(jù)結(jié)構(gòu)和CDWA元素初步映射情況(部分)

表二// 上博書畫文物元數(shù)據(jù)方案(部分)

圖三// 書畫文物知識(shí)本體基本數(shù)據(jù)模型截圖

在構(gòu)建書畫文物專題知識(shí)圖譜過程中,需要整理書畫中的花鳥、人物等元素,同時(shí)需要提取印章、題跋等信息,從而豐富書畫文物知識(shí)。由于一件書畫文物往往有著大量主題、印章、題跋等信息,依靠傳統(tǒng)人工提取雖然精度較高,但是需要花費(fèi)大量時(shí)間,無法滿足知識(shí)圖譜應(yīng)用需要。因此,需要研究特色文物的識(shí)別技術(shù),針對人物、動(dòng)物、山頭、樹木、橋梁、房屋等繪畫元素以及印章、題跋等信息,利用人工智能技術(shù)(artificial in?telligence,AI),讓計(jì)算機(jī)輔助專家進(jìn)行信息提?。ú什迤摺?)。上博采用深度學(xué)習(xí)的方法,以卷積神經(jīng)網(wǎng)絡(luò)提取圖像特征為基礎(chǔ),應(yīng)用監(jiān)督/無監(jiān)督方法學(xué)習(xí)特征分布到類別的映射,實(shí)現(xiàn)對繪畫元素的自動(dòng)識(shí)別、標(biāo)注,并構(gòu)建基于構(gòu)圖元素的繪畫內(nèi)容的索引,查詢比對與分析系統(tǒng),通過k均值聚類算法(k-means clustering algorithm)實(shí)現(xiàn)圖像的聚類,以此輔助繪畫的研究和鑒賞工作。目前,從實(shí)現(xiàn)的效果看,在繪畫元素的提取方面取得了令人滿意的效果;在印章和題跋信息的提取上,由于古文字本身的識(shí)別難度大和易受干擾,效果還不是十分理想,將來隨著書法文字識(shí)別技術(shù)(OCR)的提高,相信還會(huì)有很大的提升空間。

五、結(jié)語

無論是博物館數(shù)字化還是智慧化建設(shè),本質(zhì)上是大同小異的,最終目的都是推進(jìn)、革新博物館的業(yè)務(wù)模式,更好地履行博物館作為知識(shí)生產(chǎn)、傳播機(jī)構(gòu)的職能。因此,利用新的數(shù)字化知識(shí)生產(chǎn)、組織工具,探索一條屬于博物館自己的知識(shí)聚合、傳播之路,應(yīng)該是未來博物館改革發(fā)展的題中應(yīng)有之意。當(dāng)博物館數(shù)字化基本實(shí)現(xiàn)了傳統(tǒng)資源向數(shù)字資源的轉(zhuǎn)化,以及能夠被計(jì)算機(jī)存儲(chǔ)、處理和展示,并有了一定的“數(shù)據(jù)化”基礎(chǔ)時(shí),基于數(shù)據(jù)的知識(shí)組織和傳播就是對博物館數(shù)字化的一種拓展與推進(jìn)。從上博的實(shí)踐來看,如果說數(shù)字化改變了資源儲(chǔ)存和展示的形態(tài),那么數(shù)據(jù)的知識(shí)組織就是建立了數(shù)字資源之間的聯(lián)系,形成了一個(gè)供博物館開展各種知識(shí)傳播應(yīng)用的知識(shí)環(huán)境。

猜你喜歡
本體圖譜語義
真實(shí)場景水下語義分割方法及數(shù)據(jù)集
基于圖對比注意力網(wǎng)絡(luò)的知識(shí)圖譜補(bǔ)全
“植物界大熊貓”完整基因組圖譜首次發(fā)布
繼齊韻往昔,以今聲開來——思考自五音戲主奏樂器的演變、本體及延伸
眼睛是“本體”
圖表
漢語依憑介詞的語義范疇
專題
Care about the virtue moral education
中國知名官方智庫圖譜