一、引言
中共中央辦公廳、國(guó)務(wù)院辦公廳印發(fā)的《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》中指出:“從國(guó)家、地區(qū)多層面一體推進(jìn)檔案信息共享利用工作,建設(shè)以全國(guó)檔案查詢利用服務(wù)平臺(tái)為支撐、檔案查詢‘一網(wǎng)通辦的全國(guó)檔案信息共享利用體系。[1]”非遺檔案雖因非遺項(xiàng)目的特殊性,多數(shù)保存在非遺管理機(jī)構(gòu),但應(yīng)隸屬于檔案大類,為了有利于非物質(zhì)文化遺產(chǎn)傳承,非遺數(shù)字檔案建設(shè)和數(shù)字平臺(tái)建設(shè)應(yīng)以信息共享、廣泛傳播和充分利用為目的。
目前,各地非遺檔案的數(shù)字化工作呈不均衡狀態(tài),有些地區(qū)的非遺檔案未建成數(shù)字平臺(tái),長(zhǎng)期蒙塵,無(wú)從面世;已建成的數(shù)字平臺(tái)質(zhì)量良莠不齊,有些平臺(tái)維護(hù)不及時(shí),數(shù)據(jù)更新滯后,大多數(shù)平臺(tái)的非遺檔案資料呈“粗線條”展示狀態(tài),無(wú)法滿足現(xiàn)代非遺愛好者的知識(shí)服務(wù)需求。
二、非遺檔案數(shù)字平臺(tái)建設(shè)現(xiàn)狀及存在問(wèn)題
根據(jù)筆者所在的課題組對(duì)國(guó)內(nèi)非遺網(wǎng)站的調(diào)研,發(fā)現(xiàn)目前非遺數(shù)字化平臺(tái)存在的現(xiàn)狀和共性問(wèn)題如下:
(一)發(fā)展不均衡,非遺檔案信息量不足
由于地方政府的重視程度不同以及對(duì)不同級(jí)別非遺項(xiàng)目重視程度的不同,各地各級(jí)的非遺數(shù)字化工作發(fā)展不均衡,非遺數(shù)字檔案的內(nèi)容豐富程度、更新頻率等不均衡,很多非遺網(wǎng)站尤其是市級(jí)網(wǎng)站內(nèi)容單一、更新不及時(shí),所承載的非遺檔案信息量低,造成非遺檔案處于相對(duì)封閉狀態(tài),社會(huì)融合度低。
(二)非遺數(shù)字平臺(tái)組織架構(gòu)單一,無(wú)法揭示非遺項(xiàng)目的歷史文化內(nèi)涵
非遺的數(shù)字檔案和數(shù)字平臺(tái)一般以非遺傳統(tǒng)分類的十類法為基礎(chǔ)組織形式,按照民間文學(xué)、傳統(tǒng)音樂、傳統(tǒng)舞蹈、傳統(tǒng)戲劇、曲藝、傳統(tǒng)體育、游藝與雜技、傳統(tǒng)美術(shù)、傳統(tǒng)技藝、傳統(tǒng)醫(yī)藥及民俗等十個(gè)類目進(jìn)行分類組織和展示。十類法類目符合非遺項(xiàng)目的組織特性,參考了檔案資料的分類方法,設(shè)置科學(xué)、規(guī)范。但是十類法目前還沒有統(tǒng)一、標(biāo)準(zhǔn)的二級(jí)類目,分類粒度過(guò)粗,在組織種類繁雜、規(guī)模龐大的非遺資源前顯得捉襟見肘。另外,十類法分類維度有限,比如對(duì)非遺項(xiàng)目而言,其存在的文化空間非常重要,是非遺生存的土壤,非遺文化表現(xiàn)形式與之息息相關(guān),但由于文化空間表達(dá)晦澀、模糊,無(wú)法與十類法的其他類目成為并列類目,所以現(xiàn)有的非遺數(shù)字平臺(tái)對(duì)非遺的文化空間存在描述缺失[2]。
(三)缺乏主題標(biāo)引手段,無(wú)法揭示非遺項(xiàng)目之間的關(guān)聯(lián)信息
依據(jù)國(guó)家標(biāo)準(zhǔn)《文獻(xiàn)主題標(biāo)引規(guī)則》,我國(guó)檔案資源通常按“主體因素”“通用因素”“位置因素”“時(shí)間因素”和“文件類型因素”五要素來(lái)標(biāo)引和體現(xiàn)主題內(nèi)容[3],而由于非遺檔案資源的特殊性,以這些因素對(duì)非遺數(shù)字檔案進(jìn)行主題標(biāo)引并不適合非遺項(xiàng)目的特征,技術(shù)上難以實(shí)現(xiàn),而且這五要素不能有效揭示各類非遺之間的關(guān)聯(lián)信息。非遺數(shù)字化的目的之一是為便利相關(guān)人員以歷史背景為依托,研究、挖掘各民族、各地區(qū)的歷史文化。非遺項(xiàng)目由于其文化背景、地域背景等方面的異同,存在著大量的關(guān)聯(lián)關(guān)系,這對(duì)研究非遺文化非常有價(jià)值[2]。中國(guó)非物質(zhì)文化遺產(chǎn)網(wǎng)經(jīng)過(guò)改版后對(duì)非遺項(xiàng)目的關(guān)聯(lián)信息做了部分揭示,在每一個(gè)非遺項(xiàng)目下列出了相關(guān)傳承人、相關(guān)項(xiàng)目、相關(guān)資訊、相關(guān)學(xué)術(shù)的鏈接地址,但是受版面限制,揭示的關(guān)聯(lián)信息有限。
筆者所在的課題組通過(guò)對(duì)非遺數(shù)字平臺(tái)的調(diào)研和對(duì)承德非遺項(xiàng)目的田野調(diào)研,掌握了第一手非遺資料,針對(duì)目前非遺數(shù)字平臺(tái)存在的問(wèn)題,建設(shè)了承德地區(qū)非遺檔案數(shù)字平臺(tái),打破了傳統(tǒng)非遺平臺(tái)的信息組織方式,引入社會(huì)化標(biāo)簽,并進(jìn)行改良,拓展了非遺檔案的內(nèi)涵和外延。
三、基于社會(huì)化標(biāo)簽的非遺數(shù)字平臺(tái)的建設(shè)思路
(一)社會(huì)化標(biāo)簽用于非遺數(shù)字平臺(tái)的可行性分析
社會(huì)化標(biāo)簽是一種靈活、開放并體現(xiàn)用戶興趣的信息組織方式,它興起于Web2.0時(shí)代,多用于一些用戶貢獻(xiàn)內(nèi)容的開放性網(wǎng)站,如del .icio.us,flickr,CiteUlike,目前Librarything、豆瓣等網(wǎng)站還在使用這種信息組織方式,知網(wǎng)研學(xué)平臺(tái)、印象筆記等知識(shí)工具軟件也在大量使用。使用標(biāo)簽的信息組織模式曾被圖書館界稱為Folksonomy(分眾分類法),是對(duì)網(wǎng)絡(luò)信息資源組織與管理一種代價(jià)較小且有效的自由主題標(biāo)引方法,體現(xiàn)用戶對(duì)其興趣資源的主題和內(nèi)容的解讀。
將社會(huì)化標(biāo)簽應(yīng)用于非遺數(shù)字平臺(tái),作為非遺檔案的一種主題標(biāo)引形式,一是有利于將興趣用戶同非遺檔案資源有機(jī)地結(jié)合起來(lái),可以從用戶理解和需要的角度來(lái)揭示和組織非遺檔案資源,打破非遺檔案資源信息量低、相對(duì)封閉的困境;二是解決十類法列類單一、分類維度少、分類粒度粗的問(wèn)題,有效揭示非遺項(xiàng)目的文化內(nèi)涵,還可以通過(guò)標(biāo)簽的主題標(biāo)引作用,揭示十類法中無(wú)法列類的文化空間;三是對(duì)標(biāo)簽進(jìn)行技術(shù)處理后,通過(guò)標(biāo)簽的聚類分析有利于將隸屬不同類目的非遺項(xiàng)目關(guān)聯(lián)起來(lái),挖掘不同類目非遺項(xiàng)目歷史和文化內(nèi)涵的關(guān)聯(lián)性。
(二)社會(huì)化標(biāo)簽用于文化遺產(chǎn)類數(shù)字平臺(tái)的案例
文化遺產(chǎn)數(shù)字化保護(hù)工作由于數(shù)據(jù)資源龐大,標(biāo)引工作量巨大,亟需志愿者的參與和協(xié)作,國(guó)外的文化遺產(chǎn)數(shù)字化保護(hù)工作都曾經(jīng)通過(guò)引入眾包模式,借助群體力量和智慧來(lái)解決數(shù)字文化遺產(chǎn)的主題標(biāo)引工作。如史蒂夫博物館項(xiàng)目(Steve.museum)通過(guò)開發(fā)一個(gè)在線平臺(tái),鼓勵(lì)興趣用戶為數(shù)字藏品加注標(biāo)簽,來(lái)探索社會(huì)標(biāo)簽服務(wù)于藝術(shù)博物館的可行性,提高公眾對(duì)數(shù)字博物館館藏的訪問(wèn)量和參與度[4];美國(guó)的“公民檔案工作者”(Citizen Archivist)項(xiàng)目[5]和英國(guó)“檔案志愿者”(Archive Volunteer)項(xiàng)目[6]都支持興趣用戶為館藏目錄加標(biāo)簽,同時(shí)支持用戶將檔案資料圖像上傳至Flickr,并加標(biāo)簽、注釋,一方面增加公眾對(duì)館藏檔案的訪問(wèn)率,另一方面通過(guò)相對(duì)大眾化的標(biāo)簽標(biāo)引資源,增加館藏的易獲取性[7]。
(三)社會(huì)化標(biāo)簽用于非遺數(shù)字平臺(tái)的建設(shè)思路
社會(huì)化標(biāo)簽雖然具有諸多優(yōu)點(diǎn),但是由于自由度高,不規(guī)范、歧義詞匯(長(zhǎng)尾標(biāo)簽)過(guò)多,同義詞難以處理,容易產(chǎn)生檢索噪音,所以Web2.0時(shí)代多用于開放的網(wǎng)絡(luò)社交平臺(tái)。現(xiàn)在開放使用社會(huì)化標(biāo)簽的網(wǎng)絡(luò)系統(tǒng)如LibraryThing、豆瓣大多已進(jìn)行了改進(jìn),多采用自由標(biāo)簽與受控語(yǔ)言相結(jié)合的混合信息組織模式,對(duì)同義詞進(jìn)行分組、定期清除長(zhǎng)尾標(biāo)簽等,逐步克服最初不受控的自由標(biāo)簽產(chǎn)生的一系列問(wèn)題[8]。
非遺檔案資源不同于開放的網(wǎng)絡(luò)信息資源,是經(jīng)過(guò)加工整理而形成的資源,是有控制規(guī)范和標(biāo)準(zhǔn)的產(chǎn)物,在使用社會(huì)化標(biāo)簽標(biāo)引資源進(jìn)行內(nèi)容揭示和主題標(biāo)引時(shí),可以借鑒社會(huì)化標(biāo)簽的標(biāo)引理念,但需對(duì)標(biāo)簽進(jìn)行規(guī)范與控制,并及時(shí)進(jìn)行標(biāo)簽清洗,去除無(wú)效標(biāo)簽、合并同義標(biāo)簽,將社會(huì)化標(biāo)簽轉(zhuǎn)換為限制性標(biāo)簽即受控標(biāo)簽,達(dá)到通過(guò)標(biāo)簽的聚類分析來(lái)揭示非遺資源之間關(guān)聯(lián)性的目的。
課題組在建設(shè)承德非遺數(shù)字平臺(tái)時(shí),充分考慮了非遺檔案資源的規(guī)范性及非遺項(xiàng)目的特殊屬性,以一種混合式信息組織框架對(duì)非遺檔案資源進(jìn)行分類組織,并在試運(yùn)行過(guò)程中根據(jù)出現(xiàn)的問(wèn)題不斷修整,在實(shí)踐層面驗(yàn)證了社會(huì)化標(biāo)簽應(yīng)用于非遺數(shù)字平臺(tái)的可行性。
四、基于社會(huì)化標(biāo)簽的非遺檔案數(shù)字平臺(tái)的建設(shè)驗(yàn)證
(一)基于十類法和社會(huì)化標(biāo)簽的平臺(tái)建設(shè)框架
承德非遺平臺(tái)的建設(shè)框架采用十類法和受控標(biāo)簽混合的分類框架,如圖1所示。平臺(tái)主體組織框架按照十類法將非遺項(xiàng)目分為民間文學(xué)、傳統(tǒng)音樂、傳統(tǒng)舞蹈、傳統(tǒng)戲劇等十個(gè)類目,即按照非遺檔案的內(nèi)容屬性進(jìn)行劃分,屬于縱向框架;輔助分類框架屬于橫向框架,一是按照非遺項(xiàng)目的外部特征如地區(qū)、傳承人、獲批批次、級(jí)別、獲批時(shí)間等進(jìn)行劃分,二是按照非遺項(xiàng)目的內(nèi)容特征分析形成的受控標(biāo)簽聚類。這樣混合架構(gòu)的組織模式有利于對(duì)非遺檔案資料進(jìn)行深入揭示,用戶不僅可以按照非遺類目,還能夠按照每種非遺項(xiàng)目所蘊(yùn)含的文化、歷史背景檢索到感興趣的項(xiàng)目。
(二)對(duì)社會(huì)化標(biāo)簽的改進(jìn)措施
承德非遺數(shù)字平臺(tái)在使用社會(huì)化標(biāo)簽標(biāo)引資源時(shí),為了規(guī)避其自由度過(guò)高帶來(lái)的檢索噪音和網(wǎng)絡(luò)安全風(fēng)險(xiǎn),借鑒文獻(xiàn)主題標(biāo)引的理念,采用經(jīng)過(guò)規(guī)范處理的受控標(biāo)簽標(biāo)引非遺資源,這種受控標(biāo)簽亦可稱之為限制性標(biāo)簽。同時(shí),為了獲取足夠的標(biāo)簽,設(shè)置用戶分組,然后通過(guò)清洗標(biāo)簽、合并同義標(biāo)簽獲取有標(biāo)引價(jià)值的受控標(biāo)簽,如圖2所示。
1.規(guī)范標(biāo)簽數(shù)據(jù),構(gòu)建基于5W+1H分析法的主題標(biāo)引框架
根據(jù)“5W+1H”分析法[9],在對(duì)非遺檔案資源進(jìn)行標(biāo)注時(shí),通過(guò)分析非遺項(xiàng)目所承載的歷史活動(dòng)內(nèi)容,使用“何人(who)”“何故(why)”“何時(shí)(when)”“何地(where)”“何事(what)”“何方式(how)”6個(gè)維度對(duì)其主題內(nèi)容(對(duì)象)進(jìn)行標(biāo)注,從而充分體現(xiàn)非遺的文化空間和歷史背景。例如,國(guó)家級(jí)非遺“豐寧滿族吵子會(huì)”隸屬于“傳統(tǒng)音樂”大類,設(shè)置標(biāo)簽如下:who—陳安良(傳承人),滿族(所屬民族)why,how—民間花會(huì)(其主要表演背景),when—乾隆年間,簡(jiǎn)化為乾?。òl(fā)源時(shí)間),where—豐寧,八間房村(發(fā)源地),what,how—嗩吶藝術(shù),吹打樂(表演形式)。省級(jí)非遺“蝴蝶舞”隸屬于“傳統(tǒng)舞蹈”大類,設(shè)置標(biāo)簽如下:who—滿族,why,how—民間花會(huì),吵子會(huì)(因其以吵子會(huì)為伴奏樂),when—康熙年間,簡(jiǎn)化為康熙,where—豐寧,八間房村,what,how—背歌(背桿);省級(jí)非遺“十番樂”,why,how—民間花會(huì),廟會(huì),where—灤平,張百灣,what,how—杠房音樂,吹打樂,等等,以上標(biāo)簽全部是在“5W+1H”框架下,經(jīng)過(guò)規(guī)范處理的受控標(biāo)簽(如表1)。這些標(biāo)簽認(rèn)知度高,成為網(wǎng)站平臺(tái)的基礎(chǔ)標(biāo)簽和用戶加注標(biāo)簽時(shí)的推薦標(biāo)簽,可以引導(dǎo)用戶使用和創(chuàng)建標(biāo)簽,隨著平臺(tái)的運(yùn)行、用戶的使用,逐漸成為網(wǎng)站的高頻標(biāo)簽。
2.用戶群體分組,獲取標(biāo)簽數(shù)據(jù)
為了建設(shè)標(biāo)簽群,平臺(tái)將用戶進(jìn)行分組,按照用戶在設(shè)置標(biāo)簽時(shí)的作用權(quán)重分作 5 類用戶,第一類用戶是非遺傳承人及非遺申報(bào)者,他們?cè)谏陥?bào)非遺項(xiàng)目時(shí),即可根據(jù)每種非遺資源的特征預(yù)設(shè)部分標(biāo)簽; 第二類用戶是非遺項(xiàng)目相關(guān)領(lǐng)域的專家、數(shù)據(jù)庫(kù)建庫(kù)專家; 第三類用戶是政府相關(guān)職能部門及從事非遺保護(hù)工作的專業(yè)人員; 第四類用戶是非遺文化愛好者。
第一、二、三類用戶屬于高級(jí)用戶,項(xiàng)目組邀請(qǐng)這三類用戶根據(jù)5W+1H框架預(yù)設(shè)基礎(chǔ)標(biāo)簽,他們所標(biāo)注的標(biāo)簽相對(duì)規(guī)范性高,可以精準(zhǔn)地反映非遺項(xiàng)目的文化特征, 第四類用戶是普通用戶,他們是網(wǎng)站的活躍用戶,也能貢獻(xiàn)部分有價(jià)值的標(biāo)簽,但是其貢獻(xiàn)的標(biāo)簽規(guī)范性、準(zhǔn)確性降低。
3.標(biāo)簽數(shù)據(jù)清洗
高級(jí)用戶加注的標(biāo)簽相對(duì)專業(yè)和規(guī)范,能深刻揭示非遺項(xiàng)目的內(nèi)容特征,但是由于不同用戶對(duì)非遺項(xiàng)目的認(rèn)知不同,同時(shí)這些用戶對(duì)標(biāo)簽的組織原理理解不透徹,他們所加注的標(biāo)簽會(huì)產(chǎn)生大量不同表達(dá)方式的同義詞,這也會(huì)產(chǎn)生檢索噪音,普通用戶的標(biāo)簽更甚之。所以要對(duì)標(biāo)簽進(jìn)行清洗、合并、遴選(如圖2),一是將普通用戶加注的使用頻率低、與資源相關(guān)度低、過(guò)于個(gè)性化的標(biāo)簽清洗掉。二是將高級(jí)用戶加注的同義詞標(biāo)簽合并、規(guī)范處理,形成基礎(chǔ)標(biāo)簽庫(kù),基礎(chǔ)標(biāo)簽將成為第四類用戶加注標(biāo)簽時(shí)的推薦標(biāo)簽,隨著標(biāo)簽的大量使用,逐漸成為高頻標(biāo)簽。
清洗標(biāo)簽時(shí),一是要考慮用戶的使用習(xí)慣,盡量簡(jiǎn)明。二是標(biāo)簽要具有代表性和關(guān)聯(lián)性。三是重點(diǎn)清洗同質(zhì)標(biāo)簽,如將“民間花會(huì)”和“花會(huì)”合并為“民間花會(huì)”,將“豐寧縣”和“豐寧”合并為“豐寧”,將“乾隆年間”和“乾隆”合并簡(jiǎn)化為“乾隆”等等。這些標(biāo)簽在承德非遺項(xiàng)目中廣泛使用,被用來(lái)標(biāo)注多個(gè)非遺項(xiàng)目,可以放入基礎(chǔ)標(biāo)簽庫(kù),作為用戶推薦標(biāo)簽備用,并逐漸成為高頻標(biāo)簽。
(三)形成標(biāo)簽云圖,標(biāo)簽聚合同質(zhì)資源、同質(zhì)用戶
經(jīng)過(guò)處理的規(guī)范標(biāo)簽積累到一定數(shù)量,平臺(tái)將自動(dòng)生成標(biāo)簽云、標(biāo)簽列表,高頻標(biāo)簽在標(biāo)簽云中字體變大,在標(biāo)簽列表中依據(jù)標(biāo)簽點(diǎn)擊數(shù)排序靠前(如圖3)。標(biāo)簽的聚類作用開始逐步體現(xiàn)。
首先,標(biāo)簽揭示了十類法所不能表達(dá)的非遺項(xiàng)目的歷史文化內(nèi)涵,如發(fā)源地、發(fā)源時(shí)間、活動(dòng)場(chǎng)所、活動(dòng)時(shí)間、表現(xiàn)形式,即非遺項(xiàng)目的文化空間,文化空間在十類法中是無(wú)法列類的,而同樣文化空間的非遺項(xiàng)目往往由于隸屬不同類目而被人為割裂,標(biāo)簽則實(shí)現(xiàn)揭示了這種關(guān)聯(lián)關(guān)系。
其次,同類標(biāo)簽聚合了具有相同主題特征的非遺項(xiàng)目,有利于用戶發(fā)現(xiàn)非遺項(xiàng)目的關(guān)聯(lián)性。如“民間花會(huì)”這個(gè)民俗表現(xiàn)場(chǎng)所標(biāo)簽聚合了“隆化滿族二貴摔跤”“寬城背桿”“豐寧滿族吵子會(huì)”“蹦跶會(huì)”“八大怪”“蝴蝶舞”“棉花鬼”等19個(gè)非遺項(xiàng)目,“豐寧”這個(gè)地域標(biāo)簽聚合了12個(gè)非遺項(xiàng)目,“滿族”這個(gè)民族標(biāo)簽聚合了18個(gè)非遺項(xiàng)目等等,這些非遺項(xiàng)目分別隸屬于十個(gè)非遺類目之下,這些標(biāo)簽將相同歷史背景、地域背景、文化背景的非遺項(xiàng)目關(guān)聯(lián)起來(lái)。又如,豐寧滿族吵子會(huì)隸屬于傳統(tǒng)音樂,蝴蝶舞隸屬于傳統(tǒng)舞蹈,二者都是滿族騎射文化的產(chǎn)物,文化空間類似,發(fā)源地同為豐寧八間房村,都是民間花會(huì)的表演項(xiàng)目,蝴蝶舞的伴奏音樂即是吵子會(huì),二者看似不相關(guān),但通過(guò)“豐寧”“滿族”“八間房村”“民間花會(huì)”等多個(gè)標(biāo)簽被用戶同時(shí)檢索到,即可發(fā)現(xiàn)二者的高度關(guān)聯(lián)性;豐寧滿族吵子會(huì)與十番樂都隸屬于傳統(tǒng)音樂,用戶通過(guò)“吹打樂”這個(gè)表演形式標(biāo)簽可以同時(shí)檢索到兩個(gè)非遺項(xiàng)目,揭示出二者表演形式的關(guān)聯(lián)性。
第三,高頻標(biāo)簽聚合同質(zhì)用戶。在標(biāo)簽云圖中,被點(diǎn)擊數(shù)量越高的標(biāo)簽字體越突出,而標(biāo)簽指向的非遺資源被點(diǎn)擊率也較高,表明用戶對(duì)該標(biāo)簽和標(biāo)簽聚合的資源關(guān)注度高,這類用戶具有同質(zhì)性。
五、結(jié)論和建議
以往的非遺檔案展示平臺(tái),存在組織架構(gòu)單一、主題標(biāo)引手段單一、無(wú)法揭示非遺項(xiàng)目的歷史文化內(nèi)涵及其關(guān)聯(lián)關(guān)系等問(wèn)題,承德非遺數(shù)字平臺(tái)進(jìn)行了信息組織模式的變革,首次引入社會(huì)化標(biāo)簽,通過(guò)分析非遺項(xiàng)目的歷史背景、文化空間、內(nèi)容特征,參照5W1H框架,提煉出標(biāo)簽數(shù)據(jù),然后進(jìn)行標(biāo)簽清洗、合并,將其改進(jìn)為受控標(biāo)簽,實(shí)現(xiàn)了對(duì)非遺項(xiàng)目的主題標(biāo)引,同時(shí)基于標(biāo)簽聚合了不同類目的非遺項(xiàng)目和同質(zhì)用戶。試運(yùn)行過(guò)程中,標(biāo)簽及其標(biāo)注資源的訪問(wèn)量較大,標(biāo)簽云一直在動(dòng)態(tài)變化中,從實(shí)踐角度驗(yàn)證了社會(huì)化標(biāo)簽經(jīng)改良后作為非遺數(shù)字平臺(tái)主題標(biāo)引手段的可行性。
平臺(tái)建設(shè)過(guò)程中也出現(xiàn)了一些問(wèn)題,首先,作為受控標(biāo)簽主要貢獻(xiàn)者的高級(jí)用戶,由于對(duì)非遺項(xiàng)目和5W1H框架理解程度的偏頗和對(duì)標(biāo)簽這種標(biāo)引方式的不了解,加注了大量無(wú)效標(biāo)簽和同義不同形的同義標(biāo)簽,在對(duì)這些標(biāo)簽進(jìn)行清洗、合并和遴選時(shí),花費(fèi)了較大的人力成本和時(shí)間成本;其次,出于網(wǎng)絡(luò)安全和技術(shù)開發(fā)能力考慮,未能放開普通用戶加注標(biāo)簽的入口,從一定程度上限制了普通用戶的參與度,所以網(wǎng)站的受控標(biāo)簽有余,而自由標(biāo)簽不足,網(wǎng)站技術(shù)開發(fā)未考慮大量自由標(biāo)簽清洗的技術(shù)難度。
針對(duì)以上問(wèn)題,平臺(tái)還在持續(xù)完善,用戶層面,要加強(qiáng)高級(jí)用戶和志愿者用戶加注標(biāo)簽的規(guī)范化培訓(xùn);技術(shù)層面,通過(guò)機(jī)器學(xué)習(xí)和半監(jiān)督學(xué)習(xí),提高關(guān)鍵詞向量特征提取,實(shí)現(xiàn)標(biāo)簽的有效清洗和同義詞合并;安全層面,增加用戶標(biāo)簽數(shù)據(jù)審核環(huán)節(jié),保障開放標(biāo)簽數(shù)據(jù)后的信息內(nèi)容安全。
參考文獻(xiàn):
[1]中辦國(guó)辦印發(fā)《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》 - 中華人民共和國(guó)國(guó)家檔案局[EB/OL] [2023-2-2]. https://www.saac.gov.cn/daj/yaow/202106/899650c1b1ec4c0e9ad3c2ca7310eca4.shtml.
[2]劉向紅. 基于用戶協(xié)作的非物質(zhì)文化遺產(chǎn)數(shù)字資源分類模式研究[J]. 現(xiàn)代情報(bào), 2017, (3): 21-25, 31.
[3]呂元智. 基于限制性標(biāo)簽的檔案資源主題標(biāo)引方法探索[J]. 檔案學(xué)研究, 2020, (1): 59-66.
[4]Steve.Museum[EB/OL] [2023-2-2]. https://www.steve.museum/.
[5]Citizen Archivist | National Archives[EB/OL] [2023-2-2]. https://www.archives.gov/citizen-archivist.
[6]The National Archives[EB/OL] [2023-2-2]. https://www.nationalarchives.gov.uk/.
[7]閆靜. 檔案事業(yè)公眾參與特點(diǎn)及新趨勢(shì)探析——基于英國(guó)“檔案志愿者”和美國(guó)“公民檔案工作者”的思考[J]. 檔案學(xué)研究, 2014, (3): 81-84.
[8]Bolanos-mejias Carmen. Folksonomy Indexing From the Assignment of Free Tags to Setup Subject: A Search Analysis into the Domain of Legal History[J]. Knowledge Organization: KO, 2018, (7): 574-585.
[9]5W1H分析法_百度百科[EB/OL] [2023-2-2]. https://baike.baidu.com/item/5W1H分析法/10091536?fromtitle=5W1H&fromid=6062002&fr=aladdin.
基金項(xiàng)目:本文是2022年度國(guó)家檔案局科技項(xiàng)目計(jì)劃《基于社會(huì)化標(biāo)簽的非遺數(shù)字檔案主題標(biāo)引方法研究——以承德地區(qū)非遺數(shù)據(jù)平臺(tái)為例》(課題編號(hào):2022-R-017)階段性研究成果之一
作者單位:河北石油職業(yè)技術(shù)大學(xué)