朱佳慧 常娥,2
(1.東南大學(xué)經(jīng)濟管理學(xué)院,南京 211189;2.東南大學(xué)圖書館,南京 210096)
非物質(zhì)文化遺產(chǎn)(以下簡稱“非遺”)是指各群體、團體,甚至是個人世代相傳并視其為傳統(tǒng)文化的各種表現(xiàn)形式及文化空間,與群眾生活密切相關(guān)[1]。21世紀以來,非遺保護成為學(xué)界和業(yè)界關(guān)注的重要議題,伴隨著聯(lián)合國教科文組織《保護非物質(zhì)文化遺產(chǎn)公約》(以下簡稱《公約》)的出臺,人們對于非遺的關(guān)注度持續(xù)飆升。我國于2004年正式加入《公約》,此后在全國各地開展了非遺立法、申報、普查等一系列保護工作,取得顯著成效。截至2020年12月,國務(wù)院發(fā)布了四批國家級項目名錄,國家級非遺代表性項目共計1 557項[2]。其中,列入聯(lián)合國教科文組織非遺名錄的項目共42項,總數(shù)位居世界第一[3]。2021年8月,中共中央辦公廳、國務(wù)院辦公廳印發(fā)《關(guān)于進一步加強非物質(zhì)文化遺產(chǎn)保護工作的意見》[4],明確指出將非遺融入國民教育體系,支持有條件的高校開展非遺相關(guān)專業(yè)和課程建設(shè),這將進一步推動非遺領(lǐng)域的相關(guān)研究工作。
作為一門“活著”的藝術(shù),非遺與人類生活密切相關(guān),需要融入現(xiàn)代生活中,才能煥發(fā)出無窮的生命活力,不斷對其進行宣傳和報道是非遺保護和傳承的重要方式。目前各類新聞媒體平臺經(jīng)過多年的宣傳與報道,已經(jīng)積累了海量非遺數(shù)字媒體資源。對于專家學(xué)者而言,非遺數(shù)字媒體資源反映的是純粹的、時事型的非遺信息,是學(xué)術(shù)研究重要的基礎(chǔ)性資源;對于普通用戶而言,非遺數(shù)字媒體資源內(nèi)容豐富、簡單易懂,是了解和學(xué)習(xí)非遺知識的重要來源。有鑒于此,本文以非遺數(shù)字媒體資源為研究對象,嘗試構(gòu)建非遺數(shù)字媒體資源本體模型,以期用一種細粒度、結(jié)構(gòu)化的方式將數(shù)字媒體、非遺活動、非遺人物與新聞資源進行關(guān)聯(lián)化組織,具有一定的學(xué)術(shù)價值和應(yīng)用價值。
目前學(xué)術(shù)界還沒有關(guān)于非遺數(shù)字媒體資源概念的明確定義。本研究認為,非遺數(shù)字媒體資源是指以網(wǎng)絡(luò)為傳播載體,經(jīng)職業(yè)新聞人或普通用戶報告與評述,綜合運用多種大眾傳播媒體對以非遺知識為主導(dǎo)的新聞信息進行傳遞和呈現(xiàn)。簡言之,非遺數(shù)字媒體資源是基于新聞媒體平臺發(fā)布的非遺數(shù)字資源總稱,明顯帶有新聞性這一功能定位。
由于大眾傳媒環(huán)境的發(fā)展變化,傳統(tǒng)新聞媒體的概念已然發(fā)生了很大變化,以微博、微信、抖音、快手等為代表的新媒體平臺逐漸興起。在非遺知識的傳播與報道過程中,除報紙、廣播和電視等傳統(tǒng)傳播媒介外,各種非遺社團、學(xué)會、協(xié)會與學(xué)校等機構(gòu)/組織,抑或非遺傳承人、非遺愛好者等借助微信、微博、抖音、視頻號等新媒體平臺生成了大量的非遺數(shù)字媒體資源,內(nèi)容涵蓋非遺的教學(xué)、培訓(xùn)、展覽、講座、社會實踐以及學(xué)術(shù)交流等各個方面。
已生成的非遺數(shù)字媒體資源總量十分豐富,不僅是普通大眾接觸、了解與獲取非遺相關(guān)知識的重要來源渠道,同時也是學(xué)術(shù)研究的重要基礎(chǔ)性資源。然而,由于各類新媒體平臺數(shù)字網(wǎng)絡(luò)化特征顯著,因此非遺數(shù)字媒體資源明顯具有分布廣泛、動態(tài)性強、非結(jié)構(gòu)化、零散無序、內(nèi)容重復(fù)等特點,迫切需要對非遺數(shù)字媒體資源進行科學(xué)的組織研究,以實現(xiàn)對非遺數(shù)字媒體資源的深度開發(fā)與利用。
在漫長的歷史旅途中,非遺能夠歷經(jīng)諸多劫難而不衰、不斷吐故納新,新聞媒體在其中的作用不可忽視[5]。自2003年以來,聯(lián)合國教科文組織一直致力于挖掘促進非遺得以傳承和保護的創(chuàng)新舉措,他們發(fā)現(xiàn)并采用了一種全新方式,在YouTube上保存非遺的視頻并將其制作成數(shù)字檔案[6]。而Zhao等[7]在調(diào)研北京相聲成功要素的實踐中發(fā)現(xiàn)與微信、微博等媒體的合作關(guān)系是北京相聲作為非遺得以傳承和發(fā)展的關(guān)鍵因素之一。目前,有關(guān)非遺與媒體的探討,尤其是非遺媒體資源的開發(fā)與利用已經(jīng)成為學(xué)界研究熱點。學(xué)者主要傾向于以媒體上與非遺相關(guān)的內(nèi)容及其衍生的數(shù)據(jù)為支撐,探究媒體對于非遺保護的影響。Khalid等[8]通過對孟加拉國非遺的Facebook頁面內(nèi)容進行分析揭露了社交媒體在創(chuàng)建和傳播非遺知識過程中所具有的空間作用;韓國學(xué)者以珍島阿里郎民歌在大眾傳媒上的發(fā)展歷程為側(cè)重點,探討了珍島阿里郎普及的社會文化背景[9];吳祐昕等[5]借助媒體活躍度分析,揭示了媒體宣傳強化和非遺項目關(guān)注度提升之間的緊密關(guān)系;趙路平等[10]則以關(guān)于37個世界級非遺項目的各種新聞報道為研究樣本,利用傳播“5W模式”闡述我國非遺傳播存在的問題及可行的改進策略。
在知識組織領(lǐng)域,目前尚未見直接研究非遺數(shù)字媒體資源組織的文獻,但對于普遍意義上的非遺信息資源的組織研究,包括對某一特定民族或地域的非遺信息資源的組織研究,為本文研究奠定了基礎(chǔ)。滕春娥[11]、夏建軍[12]等分別以赫哲族非遺資源和土家織錦非遺資源為研究對象,建立了相應(yīng)的領(lǐng)域本體組織模型。Isa等[13]則以丁加奴銅器工藝(Terengganu brassware craftsmanship)為實例,模擬了傳統(tǒng)工藝的領(lǐng)域知識。另外有一部分學(xué)者關(guān)注非遺信息資源的知識元素,計劃揭示這些組成要素間的語義關(guān)系。首先對于核心要素而言,學(xué)者通過描述非遺信息資源的核心概念及概念之間的關(guān)系,得到一個通用的非遺本體庫[14-15]。而考慮與非遺相關(guān)的社會文化元素,則需要創(chuàng)建一個可擴展的本體庫。Kalita等[16]在對用戶和特定領(lǐng)域需求調(diào)查的基礎(chǔ)上,構(gòu)建了一個保存印度傳統(tǒng)舞蹈的知識庫,能夠滿足不同使用意圖的信息搜索需要。除此之外,學(xué)者也熱衷于對多媒體類型(圖片、視頻、音頻和3D動畫)的非遺信息資源進行語義化組織嘗試[17-18],如侯西龍等實現(xiàn)了非遺視頻資源從片段到關(guān)鍵幀的細顆粒度本體模型構(gòu)建。
綜上所述,隨著非遺保護和傳播活動的進一步開展,產(chǎn)生數(shù)量巨大、形式多樣且內(nèi)容豐富的非遺數(shù)字媒體資源,但鮮有學(xué)者涉及非遺數(shù)字媒體資源組織研究。如何從非遺數(shù)字媒體資源本身特點出發(fā),構(gòu)建語義化組織模型,以深入挖掘其中蘊含的非遺知識,發(fā)現(xiàn)非遺信息傳播與演化的規(guī)律,是值得探索的研究課題。
書目描述框架(the Bibliographic Frame Work Initiative,BIBFRAME)作為一種新型書目數(shù)據(jù)格式標準,具有較好的開放性和包容性,對于資源類型的描述沒有限制,在科研數(shù)據(jù)、電子資源、連續(xù)性資源以及文學(xué)作品上都顯示了良好的語義映射效果[19-21]。2016年6月,BIBFRAME 2.0正式確立。相較于BIBFRAME 1.0,BIBFRAME 2.0的核心類更為精簡,主要包括三大類:作品、實例和單件[22-23]。考慮到BIBFRAME 2.0模型的廣泛適應(yīng)性,本文擬在借鑒和發(fā)展BIBFRAME 2.0模型基礎(chǔ)上,圍繞非遺數(shù)字媒體資源的自身特點,構(gòu)建非遺數(shù)字媒體資源本體模型。
結(jié)合BIBFRAME 2.0模型,對非遺數(shù)字媒體資源從內(nèi)容特征、載體形式和獲取方式三個層面進行分析,各層面具有以下特點。①內(nèi)容層面,非遺數(shù)字媒體資源特征主要表現(xiàn)在兩個方面:其一圍繞非遺知識內(nèi)容本身;其二具有新聞性,帶有事件主導(dǎo)性。因此該層面需要深入揭示非遺傳承人、非遺活動、發(fā)生地點與時間、非遺物品、非遺組織等相關(guān)信息,從而構(gòu)建非遺數(shù)字媒體資源“作品”層面知識概念及其關(guān)系。②載體層面,非遺數(shù)字媒體資源不再依賴以文本、圖片、視頻等傳統(tǒng)資源格式進行描述,可以考慮從微博、微信、抖音等數(shù)字媒體平臺角度進行表達,以便于對非遺數(shù)字媒體傳播方式與路徑進行組織與挖掘,從而構(gòu)建非遺數(shù)字媒體資源“實例”層面知識概念及其關(guān)系。③獲取方式層面,非遺數(shù)字媒體資源不同于紙本資源,它以數(shù)字化形式存在于網(wǎng)絡(luò)之中,因此需要清晰設(shè)計包括URI地址、媒體頻道名稱等在內(nèi)的資源獲取方式,以代替紙本資源的館藏地和條形碼等信息,從而構(gòu)建非遺數(shù)字媒體資源“單件”層面知識概念及其關(guān)系。
基于上述考慮,本文以BIBFRAME 2.0模型的“作品-實例-單件”為主軸,重點在“數(shù)字媒體-非遺活動-非遺人物-新聞資源”之間架起橋梁,構(gòu)建非遺數(shù)字媒體資源本體模型,具體如圖1所示。本文用矩形代表非遺數(shù)字媒體資源本體模型中的概念類,有向箭頭代表屬性,箭頭的起止位置分別對應(yīng)定義域和值域,橢圓形代表字符串。另外,將帶有bf前綴、dc前綴的詞分別標記為復(fù)用BIBFRAME 2.0詞表和DC詞表,帶有dmr前綴的詞表示為自定義詞匯,本模型各層級詳細核心概念類與屬性關(guān)系設(shè)計如下文所述。
圖1 非遺數(shù)字媒體資源本體模型中相關(guān)類、屬性及其關(guān)系展示
3.2.1 對于“作品”層概念類的擴展與延伸
非遺數(shù)字媒體資源帶有明顯的新聞性,為反映這一特性,本文設(shè)計了新聞體裁概念類,原因在于新聞體裁是具有新聞特性的形象思維或邏輯思維的物化反映[24],是傳播非遺信息與知識的直觀表現(xiàn)形式。根據(jù)內(nèi)容記述目的的不同,非遺新聞體裁概念類下又設(shè)計了新聞、言論、科普、廣告這4個概念類。其中,新聞以報道非遺信息事實為主;言論主要闡述對于非遺事物的看法和見解;科普重在傳授非遺知識、講解非遺概念;廣告在陳述非遺事實信息的同時,會為達到特定目的而帶有一些推銷性話語,涵蓋與非遺相關(guān)的社會公益廣告、社會服務(wù)公告等。
為幫助用戶快速找到自己感興趣的非遺新聞和確定非遺項目類別,本文設(shè)計了非遺新聞主題、非遺項目這兩個概念類,以有效揭示非遺數(shù)字媒體資源的主題思想。其中非遺新聞主題對應(yīng)的概念實例有非遺文化傳承、非遺教育、非遺旅游、非遺產(chǎn)業(yè)建設(shè)、非遺鑒賞等;非遺項目對應(yīng)的概念實例借鑒中國非物質(zhì)文化遺產(chǎn)網(wǎng)給出的10大非遺類別,包括民間文學(xué)、傳統(tǒng)音樂、傳統(tǒng)舞蹈、傳統(tǒng)戲劇、曲藝、傳統(tǒng)體育、游藝與雜技等。
為進一步揭示非遺數(shù)字媒體資源的內(nèi)容,本文特別設(shè)計了非遺活動、非遺人物、非遺組織和非遺產(chǎn)物這4個概念類。其中,非遺活動指在一定時間和地點發(fā)生的事件(如展覽、課程、實踐等),利用活動類型對象屬性及活動開始日期、活動結(jié)束日期、活動地點、主辦方/承辦方等數(shù)據(jù)屬性進行補充描述;非遺人物是與非遺相關(guān)的一切人物的抽象,包括非遺傳承人、非遺學(xué)術(shù)專家、非遺學(xué)徒和非遺推廣人這4種概念類,采用姓名、性別、出生年月、技能等數(shù)據(jù)屬性進行描述;非遺組織指與非遺相關(guān)的團體或集體;非遺產(chǎn)物指與非遺相關(guān)的有形或無形的文創(chuàng)產(chǎn)品,包括窗花、云錦、空竹、陶藝作品、昆曲、民族歌謠等。
基于上述分析,本文對非遺數(shù)字媒體資源本體模型“作品”層概念類進行擴展和延伸,其中包含的相關(guān)概念、屬性及其關(guān)系描述具體如圖1(a)所示。
3.2.2 對于“實例”層概念類的擴展與延伸
媒體平臺作為非遺數(shù)字媒體資源的物質(zhì)載體,不僅承擔(dān)著記錄和出版非遺數(shù)字媒體資源的重要功能,而且能夠深刻反映非遺數(shù)字媒體資源豐富多樣的載體表現(xiàn),本文設(shè)計了報紙、廣播電視、微信公眾號等9個概念類表達不同的媒體平臺。
其中,報紙和廣播電視是傳統(tǒng)官方媒體平臺的代表,主要指在新媒體環(huán)境下發(fā)展起來的相關(guān)新聞網(wǎng)站和新聞客戶端;博客、微博、論壇等概念類主要是自媒體平臺的代表,但也不乏官方媒體所設(shè)立的微信、微博等宣傳客戶端;短視頻是近幾年流行起來的自媒體平臺,特別適合宣傳報道貼近民眾生活的非遺知識和技能,視頻時長一般控制在5分鐘以內(nèi),根據(jù)用戶觀看工具的不同,又可細分為快手、抖音、視頻號等不同媒體平臺。值得注意的是,門戶網(wǎng)站指的是除官方媒體網(wǎng)站外通向某類綜合性互聯(lián)網(wǎng)信息資源的媒體平臺,包括新浪、搜狐等網(wǎng)站平臺;而資訊閱讀App有別于微信公眾號,主要指致力于滿足用戶資訊類信息個性化閱讀的媒體平臺。此外,除設(shè)計上述相關(guān)媒體平臺概念類外,本文還設(shè)計了創(chuàng)建者、發(fā)布時間、語種、來源、貢獻者等數(shù)據(jù)屬性進行補充描述,特別設(shè)計了版本數(shù)據(jù)屬性,描述相同非遺數(shù)字媒體資源出版在不同數(shù)字媒體平臺上而構(gòu)成的實例。
基于上述分析,本文對非遺數(shù)字媒體資源本體模型“實例”層概念類進行擴展與延伸,其中包含的相關(guān)概念、屬性及其關(guān)系描述具體如圖1(b)所示。
3.2.3 對于“單件”層概念類的擴展與延伸
非遺數(shù)字媒體資源借助網(wǎng)絡(luò)以多樣化的數(shù)字形式呈現(xiàn),為準確描述非遺數(shù)字媒體資源的獲取方式,本文設(shè)計了獲取訪問來源、官方網(wǎng)址、所在媒體欄目、所屬公司名稱、聯(lián)系方式等一系列數(shù)據(jù)屬性。其中,獲取訪問來源指可直接定位獲取數(shù)字媒體資源的URI網(wǎng)址,標識了其在“單件”層上的唯一性;官方網(wǎng)址指獲取訪問來源的上層URI地址?;诖?,本文對非遺數(shù)字媒體資源本體模型“單件”層概念類進行擴展與延伸,其中包含的相關(guān)概念、屬性及其關(guān)系描述具體如圖1(c)所示。
剪紙又稱刻紙,是一種用刀具在紙上剪刻出花紋,以裝飾和配合民俗活動的民間藝術(shù)。2009年中國剪紙被列入聯(lián)合國教科文組織《人類非物質(zhì)文化遺產(chǎn)代表作名錄》,剪紙藝術(shù)成為我國極具世界影響力的傳統(tǒng)文化之一,具有傳承和保護的重要價值。其中,南京剪紙于2008年6月被列入第一批國家級非物質(zhì)文化遺產(chǎn)擴展項目名錄,因此本文選擇南京剪紙作為實證研究對象。以慧科新聞搜索研究數(shù)據(jù)庫為數(shù)據(jù)來源,以“南京剪紙”為檢索詞,篩選得到與南京剪紙相關(guān)的數(shù)字媒體資源共計1 461篇。
本文應(yīng)用Protégé軟件工具將南京剪紙數(shù)字媒體數(shù)據(jù)轉(zhuǎn)換為計算機可識別語言。首先自定義IRI為http://www.ICH_Digital_Media_Resource_Ontology.com,根據(jù)非遺數(shù)字媒體資源本體模型添加相關(guān)類和屬性。其中,構(gòu)建了Work、ICHProject、ICHProduct、ICHOrganization等8個一級類,并且在Work_types、Role、Instance大類下分設(shè)了不同數(shù)量的子類;在Object property選項卡中添加了如hasPerson、hasInstance、relatedTo等在內(nèi)的37個關(guān)系屬性;在Data proterty選項卡添加了birthday、gender、skill、language等在內(nèi)的31個數(shù)據(jù)屬性。
本文將采集到的1 461篇資源數(shù)據(jù)按照非遺數(shù)字媒體資源本體模型進行語義化表達,以CSV格式文件方式進行存儲,并批量導(dǎo)入Protégé生成相應(yīng)的OWL文件,形成南京剪紙數(shù)字媒體資源知識圖譜,充實非遺領(lǐng)域的知識組織架構(gòu)體系。在本文所構(gòu)建的知識圖譜中,包含南京剪紙相關(guān)作品345種、實例1 461篇、非遺活動103場、非遺組織29個、非遺人物43位、非遺產(chǎn)物139件、數(shù)字媒體平臺216個。
Neo4j圖數(shù)據(jù)庫相比傳統(tǒng)的關(guān)系型數(shù)據(jù)庫具有更佳的數(shù)據(jù)分析處理能力,并且該數(shù)據(jù)庫的查詢語言Cypher提供了更加簡便有效的查詢表達方式,能夠輕松獲取概念間的語義路徑,更好地處理數(shù)據(jù)中復(fù)雜的知識。因此,本文將南京剪紙數(shù)字媒體資源知識圖譜OWL文件與Neo4j圖數(shù)據(jù)庫結(jié)構(gòu)進行映射分析[25],通過neosemantics插件導(dǎo)入Neo4j圖數(shù)據(jù)庫進行存儲,實現(xiàn)本研究知識圖譜的C-path(x,y)路徑檢索、適用范圍檢索以及知識傳播與演化推理等功能。
(1)C-path(x,y)路徑檢索。C-path(x,y)路徑檢索通過推導(dǎo)實體間的路徑關(guān)系,探析實體間的聯(lián)系。本文以查詢“張方林”與“陳耀”之間的關(guān)聯(lián)路徑為例,通過構(gòu)建查詢語言“match p=(a:ICHPerson{name:'張方林'})-[*..2]-(b:ICHPerson{name:'陳耀'}) return p”得到查詢結(jié)果。在本次查詢中,發(fā)現(xiàn)張方林和陳耀之間沒有直接聯(lián)系,往往通過作品、非遺活動和非遺組織等建立關(guān)聯(lián)。圖2顯示了他們之間的所有關(guān)聯(lián)路徑。
圖2 “張方林”與“陳耀”路徑圖
(2)適用范圍檢索。借助適用范圍檢索方式探究符合某些條件的實體,能夠?qū)崿F(xiàn)基于個性化需求的檢索。例如,查詢與“張方林”擁有社會關(guān)系和所屬關(guān)系的全部個人和組織的情況,具體見圖3。可以發(fā)現(xiàn),張方林師承其舅舅馬連喜,與父親張吉根、兒子張鈞、妹妹張林娣、侄女張瀅同屬于有著“金陵神剪張”之稱的張氏剪紙流派家族,并且同其家族成員參與到了中國民間文學(xué)藝術(shù)家協(xié)會、金陵神剪張剪紙傳習(xí)所等多個組織中,積極傳播和教授南京剪紙技藝。
圖3 適用范圍檢索圖
(3)知識傳播與演化推理。利用Cypher語句,查詢2021年4月15日開展的相關(guān)活動,得到startDate屬性值為“2021/4/15”的3個非遺活動實例,分別為“中國館‘非遺江蘇’輪展區(qū)南京專場”“世園會南京城市主題周”“2021揚州世園會‘非遺江蘇’輪展區(qū)-南京專場”,見圖4。通過分析與之關(guān)聯(lián)的新聞報道名稱、非遺活動的類型、地點、開始日期與結(jié)束日期等信息,可以推理得到這3個非遺活動是某一非遺活動通過不同新聞報道而形成的3種不同說法而已,它們具有等同關(guān)系,實際上是同一種非遺活動?;顒忧捌?,相關(guān)新聞報道以廣告體裁為主,多帶有呼吁人們參與其中的性質(zhì);活動后期,則更多進行活動總結(jié)和回顧報道。這一變化揭示了非遺媒體信息隨著時間的推移而轉(zhuǎn)變其傳播重點的特征。
圖4 知識傳播與演化推理圖
本文以非遺數(shù)字媒體資源作為研究對象,構(gòu)建了非遺數(shù)字媒體資源本體模型,并以南京剪紙作為實證對象,利用Protégé本體軟件和Neo4j圖數(shù)據(jù)庫進行了非遺數(shù)字媒體資源語義化組織實驗研究,最終實現(xiàn)非遺數(shù)字媒體資源的知識發(fā)現(xiàn)。囿于研究時間與精力,本文所采集的實驗數(shù)據(jù)量有限,但本文提出的非遺數(shù)字媒體資源本體模型可為后續(xù)研究提供借鑒,不足之處在于,非遺數(shù)字媒體資源知識圖譜構(gòu)建過程中人工參與較多。今后,本文將進一步系統(tǒng)采集非遺數(shù)字媒體資源,豐富非遺數(shù)字媒體資源知識圖譜,并積極探索自動化知識圖譜構(gòu)建方法,搭建面向非遺數(shù)字媒體資源領(lǐng)域的智能服務(wù)平臺,更好地支持該領(lǐng)域的語義查詢、知識推理與傳播軌跡研究等智能知識服務(wù)。