中國的歷史與文化遺產(chǎn)宛如璀璨星河,其中,非物質(zhì)文化遺產(chǎn)便是其中不可或缺的一顆明星。黔東南苗族侗族自治州位于貴州省東南部,苗、侗、布依、水、瑤、壯、土家等少數(shù)民族占據(jù)了這里81.1%的人口,他們的身影構(gòu)成了黔東南多彩的民俗畫卷。黔東南苗族侗族自治州作為全國12個(gè)國家級文化生態(tài)保護(hù)區(qū)之一,孕育了聯(lián)合國人類非物質(zhì)文化遺產(chǎn)代表作名錄項(xiàng)目1項(xiàng)(侗族大歌),國家級非遺56項(xiàng)78處,省級非遺218項(xiàng)307處。然而,現(xiàn)代化浪潮中,一些文化遺產(chǎn)正面臨著消失的危險(xiǎn)。凱里學(xué)院圖書館致力于探討非物質(zhì)文化遺產(chǎn)剪報(bào)數(shù)據(jù)庫的建設(shè),力求為這些珍貴文化遺產(chǎn)的保護(hù)與傳承提供借鑒,讓非遺煥發(fā)新生機(jī),助力鄉(xiāng)村振興。
一、非遺剪報(bào)數(shù)據(jù)庫建設(shè)基本情況
(一)建設(shè)意義
剪報(bào)數(shù)據(jù)庫作為一種重要的信息積累與知識(shí)整合平臺(tái),不僅有效地促進(jìn)了信息的高效利用,更極大地減少了重復(fù)勞動(dòng)的發(fā)生。通過系統(tǒng)化的剪報(bào)收集、整理與歸類,剪報(bào)數(shù)據(jù)庫將海量的報(bào)紙資源轉(zhuǎn)化為可隨時(shí)查閱、反復(fù)利用的數(shù)字化信息,使信息的使用價(jià)值得到了最大程度的釋放和提升。非遺剪報(bào)更是這一領(lǐng)域中的瑰寶,它們猶如一幅幅生動(dòng)的歷史畫卷,真實(shí)而細(xì)膩地反映了不同時(shí)代的社會(huì)風(fēng)貌、民眾生活以及社會(huì)變遷的脈絡(luò),對傳承和弘揚(yáng)優(yōu)秀文化具有不可估量的價(jià)值。通過精心篩選和編纂非遺剪報(bào),我們可以讓后人尤其是年輕一代更加直觀、深入地了解歷史與文化,增強(qiáng)民族自豪感和文化認(rèn)同感。
本數(shù)據(jù)庫的核心目標(biāo)在于全面數(shù)字化黔東南地區(qū)的非遺報(bào)紙資料,旨在構(gòu)建一個(gè)既全面又系統(tǒng)的剪報(bào)數(shù)據(jù)庫。這一數(shù)據(jù)庫將通過在線平臺(tái)進(jìn)行展示,不僅便于存儲(chǔ)和檢索,還能實(shí)現(xiàn)資源的實(shí)時(shí)更新與共享,有力地提升黔東南非遺的知名度和影響力。借助現(xiàn)代信息技術(shù)手段,我們可以對非遺資源進(jìn)行深度挖掘和精細(xì)化處理,進(jìn)一步揭示其內(nèi)在的經(jīng)濟(jì)文化價(jià)值。這不僅有助于推動(dòng)非遺與現(xiàn)代社會(huì)的緊密融合,也能讓更多人接觸并愛上非遺文化,從而在新的時(shí)代背景下煥發(fā)非遺的生命力,促進(jìn)非物質(zhì)文化遺產(chǎn)的保護(hù)與傳承。
(二)建設(shè)基礎(chǔ)
自2016年起,凱里學(xué)院圖書館收集與整理黔東南非遺報(bào)紙資源,制作剪報(bào)。八載春秋,已累計(jì)完成165期剪報(bào),匯集約1800篇文章,但囿于人力,現(xiàn)仍有4000余份資料未轉(zhuǎn)化,且剪報(bào)收集量持續(xù)增長中。
早期剪報(bào)制作需要掃描、裁剪、拼接紙質(zhì)報(bào)紙,非常煩瑣??萍歼M(jìn)步后,我們能直接從網(wǎng)絡(luò)尋找資源,用軟件處理排版,制作更便捷、高效。每期至少八版,以PDF形式上傳供瀏覽。但此類剪報(bào)不支持檢索、下載、文獻(xiàn)分析及在線打印等功能,難以滿足需求。因此,剪報(bào)數(shù)據(jù)庫的建設(shè)被推上日程,期待能為讀者帶來更加豐富的閱讀體驗(yàn)與更高科研價(jià)值。
二、非遺剪報(bào)數(shù)據(jù)庫建設(shè)實(shí)踐
本剪報(bào)數(shù)據(jù)庫的建立包括報(bào)紙信息加工、構(gòu)建數(shù)據(jù)庫框架、確定導(dǎo)航體系、設(shè)置分類、數(shù)據(jù)著錄和審核發(fā)布等幾個(gè)步驟。
(一)剪報(bào)信息的收集
數(shù)據(jù)采集我們嚴(yán)謹(jǐn)細(xì)致,制訂實(shí)施標(biāo)準(zhǔn)規(guī)范,統(tǒng)一剪報(bào)格式,細(xì)化信息分類,精準(zhǔn)表述,為后續(xù)處理和檢索奠定基礎(chǔ)。報(bào)紙資料來源廣泛,包括黔東南地方、民族類報(bào)紙,用網(wǎng)絡(luò)搜索引擎查找非遺報(bào)紙信息作為補(bǔ)充。收集非遺領(lǐng)域各方面內(nèi)容,確保全面準(zhǔn)確,記錄詳細(xì)信息,尊重版權(quán)。最大限度地保證為一個(gè)全面、準(zhǔn)確、易讀的黔東南非物質(zhì)文化遺產(chǎn)資料庫。
(二)剪報(bào)信息的處理與轉(zhuǎn)換
剪報(bào)數(shù)據(jù)主要存在三種形式。一是紙質(zhì)報(bào)紙掃描得的圖像數(shù)據(jù),須確保高分辨率,用OCR技術(shù)轉(zhuǎn)文本,存儲(chǔ)于WORD文檔。二是從報(bào)紙數(shù)字版下載的PDF文件,每篇單獨(dú)保存。三是從網(wǎng)頁復(fù)制的新聞報(bào)道,經(jīng)排版后存儲(chǔ)于WORD文檔。初步處理的數(shù)據(jù)將批量轉(zhuǎn)化為雙層PDF文件,結(jié)合了文本層和圖像層,使得內(nèi)容既可編輯和搜索,又能保持原始文檔的版面效果。處理和轉(zhuǎn)換工作完成后,將展開數(shù)據(jù)清洗,識(shí)別并糾正錯(cuò)誤、重復(fù)、不準(zhǔn)確或不完整的信息,確保數(shù)據(jù)準(zhǔn)確完整。
(三)數(shù)據(jù)庫分類導(dǎo)航的建立
非遺作為中華文明的瑰寶,分類方法多樣,本數(shù)據(jù)庫建立三種導(dǎo)航方式構(gòu)建其分類體系,分別是地域?qū)Ш?、級別導(dǎo)航和批次導(dǎo)航。其中地域?qū)Ш接址譃槿墸患墝?dǎo)航匯聚了黔東南十八個(gè)申報(bào)單位;二級導(dǎo)航按項(xiàng)目類別分類;三級導(dǎo)航列出具體項(xiàng)目名稱,后續(xù)新增項(xiàng)目將根據(jù)公告更新。三級導(dǎo)航體系建立好后,數(shù)據(jù)庫著錄人員只需選擇項(xiàng)目名稱字段,即可將剪報(bào)歸入地域?qū)Ш较到y(tǒng)。建立導(dǎo)航體系后,在數(shù)據(jù)庫中可以根據(jù)分類建立字段對非遺項(xiàng)目進(jìn)行標(biāo)注和索引,方便用戶快速檢索相關(guān)內(nèi)容(如表1)。
(四)數(shù)據(jù)庫字段設(shè)置
數(shù)字化加工前,需要明確數(shù)字化標(biāo)準(zhǔn),主要遵循都柏林核心元數(shù)據(jù)標(biāo)準(zhǔn)和著錄規(guī)范,并在這些標(biāo)準(zhǔn)基礎(chǔ)上進(jìn)行細(xì)化和優(yōu)化設(shè)置標(biāo)引字段?!岸及亓趾诵脑獢?shù)據(jù)”又稱DC(Dublin Core)元數(shù)據(jù),是當(dāng)前圖書館界應(yīng)用最廣、影響最大的標(biāo)準(zhǔn)化元數(shù)據(jù)(如表2)。
參考DC元數(shù)據(jù)標(biāo)準(zhǔn)后,本數(shù)據(jù)庫中復(fù)用了其中6個(gè)元素(題名、創(chuàng)建者、主題、描述、日期、來源), 關(guān)于已定義的其余剪報(bào)知識(shí)元要素,目前尚未找到近似的元數(shù)據(jù)標(biāo)準(zhǔn),因此,本文自行定義一個(gè)元數(shù)據(jù)標(biāo)準(zhǔn)(FYJB,簡寫為fy)說明,元數(shù)據(jù)元素共計(jì)13個(gè)(如表3) 。
這些字段涵蓋了剪報(bào)數(shù)據(jù)庫的基本需求,但具體的設(shè)計(jì)還要根據(jù)實(shí)際業(yè)務(wù)需求進(jìn)行調(diào)整和擴(kuò)展。此外,還要設(shè)置字段的數(shù)據(jù)類型、長度、約束條件等,以確保數(shù)據(jù)的準(zhǔn)確性和完整性。同時(shí),為了提高查詢效率,可以建立合適的索引。此外,數(shù)據(jù)庫設(shè)計(jì)是一個(gè)迭代的過程,隨著業(yè)務(wù)的發(fā)展和變化,要對數(shù)據(jù)庫結(jié)構(gòu)進(jìn)行調(diào)整和優(yōu)化。因此,在設(shè)計(jì)過程中應(yīng)保持靈活性和可擴(kuò)展性。
(五)數(shù)據(jù)著錄
完成PDF格式剪報(bào)數(shù)據(jù)的批量上傳后,我們進(jìn)入數(shù)據(jù)著錄階段。這一環(huán)節(jié)對數(shù)據(jù)庫質(zhì)量控制至關(guān)重要,須持續(xù)投入精力。著錄前,制定嚴(yán)謹(jǐn)規(guī)范并嚴(yán)格執(zhí)行,確保數(shù)據(jù)質(zhì)量。規(guī)范應(yīng)詳細(xì)規(guī)定日期格式、數(shù)字精度、文本長度及特殊符號使用等,確保數(shù)據(jù)真實(shí)準(zhǔn)確。
著錄過程中,注意細(xì)節(jié)把控,如字符統(tǒng)一為英文半角,作者名單用半角逗號分隔前三位,關(guān)鍵詞選取三至五個(gè)用半角分號分隔,項(xiàng)目名稱依據(jù)導(dǎo)航體系選擇。秉持“應(yīng)錄盡錄”原則,確保信息完整,可跳過無相關(guān)內(nèi)容字段。借助自動(dòng)化工具校驗(yàn)數(shù)據(jù)一致性、準(zhǔn)確性。數(shù)據(jù)著錄是數(shù)據(jù)庫建設(shè)的基石,關(guān)乎系統(tǒng)穩(wěn)定性。審核后發(fā)布數(shù)據(jù)供讀者使用。
三、非遺剪報(bào)數(shù)據(jù)庫建設(shè)中存在的問題
非遺剪報(bào)數(shù)據(jù)庫作為保護(hù)和傳承非物質(zhì)文化遺產(chǎn)的重要工具,近年來得到了廣泛的關(guān)注和發(fā)展。然而,在非遺剪報(bào)數(shù)據(jù)庫的建設(shè)過程中,仍存在諸多問題。
一是由于非遺剪報(bào)來源廣泛,可能涉及各種報(bào)紙、雜志、網(wǎng)站等,因此在收集數(shù)據(jù)時(shí)可能會(huì)存在遺漏,導(dǎo)致數(shù)據(jù)庫內(nèi)容不完整。二是非遺剪報(bào)的內(nèi)容可能涉及不同的主題、地域、時(shí)間等,如果整理不規(guī)范,會(huì)導(dǎo)致數(shù)據(jù)混亂,難以查找和利用。三是非遺剪報(bào)是動(dòng)態(tài)發(fā)展的,新的報(bào)道和資料會(huì)不斷涌現(xiàn),如果數(shù)據(jù)庫更新不及時(shí),就無法反映非遺的最新動(dòng)態(tài)。四是非遺剪報(bào)數(shù)據(jù)庫的建設(shè)需要相應(yīng)的技術(shù)支持,包括數(shù)據(jù)采集、存儲(chǔ)、處理、查詢等方面的技術(shù),如果技術(shù)支持不足,會(huì)影響數(shù)據(jù)庫的建設(shè)質(zhì)量和使用效果。
四、非遺剪報(bào)數(shù)據(jù)庫建設(shè)的應(yīng)對措施
首先,為了確保非遺剪報(bào)數(shù)據(jù)的全面性和完整性,我們將通過多種渠道進(jìn)行收集。例如,通過圖書館、檔案館、文化館等實(shí)體機(jī)構(gòu)獲取非遺剪報(bào)資料;與各大報(bào)紙、雜志等媒體建立穩(wěn)定的合作關(guān)系,確保能夠及時(shí)獲取到第一手的非遺剪報(bào)資料;利用互聯(lián)網(wǎng)平臺(tái),進(jìn)行網(wǎng)絡(luò)收集。通過這些渠道的共同努力,我們能夠更好地保留和傳承黔東南非遺文化。
其次,制定統(tǒng)一的數(shù)據(jù)整理規(guī)范非常重要,它涉及對非遺剪報(bào)進(jìn)行分類、標(biāo)注、整理等工作。我們將根據(jù)非遺剪報(bào)的內(nèi)容、來源、時(shí)間等關(guān)鍵信息進(jìn)行分類和標(biāo)注,以便于后續(xù)的查找和使用。同時(shí),建立數(shù)據(jù)質(zhì)量檢查機(jī)制也是必不可少的,它能夠?qū)φ砗蟮臄?shù)據(jù)進(jìn)行質(zhì)量檢查,確保數(shù)據(jù)的準(zhǔn)確性。通過規(guī)范數(shù)據(jù)整理和建立數(shù)據(jù)質(zhì)量檢查機(jī)制,我們能夠提高非遺剪報(bào)數(shù)據(jù)庫的質(zhì)量和可靠性,為非遺文化的傳承和發(fā)展提供有力支持。
此外,為了確保非遺剪報(bào)數(shù)據(jù)庫內(nèi)容的時(shí)效性和新鮮感,我們建立了定期更新機(jī)制。這意味著我們會(huì)按照一定的時(shí)間周期,如每月、每季度或每年,對數(shù)據(jù)庫進(jìn)行全面更新。這樣的更新頻率能夠確保數(shù)據(jù)庫中的內(nèi)容始終緊跟非遺領(lǐng)域的最新動(dòng)態(tài)和發(fā)展趨勢。除了定期更新外,我們還會(huì)密切關(guān)注非遺領(lǐng)域的熱點(diǎn)事件和話題,一旦發(fā)現(xiàn)具有重要性和時(shí)效性的剪報(bào)資料,我們會(huì)立即將其納入數(shù)據(jù)庫中,確保數(shù)據(jù)的時(shí)效性和完整性。
最后,為了進(jìn)一步提高非遺剪報(bào)數(shù)據(jù)庫的建設(shè)質(zhì)量和使用效果,我們將積極引進(jìn)先進(jìn)的數(shù)據(jù)采集技術(shù),確保數(shù)據(jù)的全面性和完整性;采用高效的數(shù)據(jù)存儲(chǔ)技術(shù),保障數(shù)據(jù)庫的高可用性和高可靠性;運(yùn)用智能化的數(shù)據(jù)處理技術(shù),提升數(shù)據(jù)的分析和挖掘能力;搭建靈活的數(shù)據(jù)查詢平臺(tái),使用戶能夠便捷地獲取所需信息。同時(shí),我們會(huì)加強(qiáng)技術(shù)培訓(xùn)和人才引進(jìn),提高技術(shù)人員的專業(yè)水平,為數(shù)據(jù)庫的建設(shè)和維護(hù)提供有力保障。
五、結(jié)語
黔東南非遺剪報(bào)數(shù)據(jù)庫建設(shè)意義重大,前景廣闊。展望未來,該數(shù)據(jù)庫有望在多個(gè)領(lǐng)域取得顯著進(jìn)展和突破。伴隨著AI和自然語言處理技術(shù)的發(fā)展,非遺剪報(bào)數(shù)據(jù)庫將迎來重大革新,AI和機(jī)器學(xué)習(xí)技術(shù)將實(shí)現(xiàn)剪報(bào)信息的自動(dòng)化處理與分類,提高工作效率,減少錯(cuò)誤。數(shù)據(jù)可視化技術(shù)將復(fù)雜數(shù)據(jù)處理結(jié)果以直觀圖表和圖像形式展現(xiàn),有助于用戶理解和利用數(shù)據(jù)。非遺剪報(bào)數(shù)據(jù)庫將與各領(lǐng)域研究機(jī)構(gòu)、企業(yè)、非政府組織合作,推動(dòng)數(shù)據(jù)開放共享,為非遺研究、傳承、產(chǎn)業(yè)發(fā)展提供數(shù)據(jù)支持,并保護(hù)、傳承、推廣黔東南非遺。總之,黔東南非遺剪報(bào)數(shù)據(jù)庫的建設(shè)將為保護(hù)和傳承這一獨(dú)特的文化遺產(chǎn)做出重要貢獻(xiàn),并成為學(xué)術(shù)研究、文化傳承與社會(huì)應(yīng)用的重要資源,推動(dòng)黔東南地區(qū)文化的繁榮與可持續(xù)發(fā)展。
參考文獻(xiàn):
[1]高夢秦.高校圖書館報(bào)紙資源的利用與TPI技術(shù)的應(yīng)用[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2007(33):11-12.
[2]唐月娥,李敏.紅色報(bào)紙文獻(xiàn)數(shù)字化探索與實(shí)踐——以《晉綏日報(bào)》為例[J].圖書館雜志,2021,40(11):4-8.
[3]陳帥印,劉桂鋒,劉瓊.基于元數(shù)據(jù)的數(shù)據(jù)論文與期刊論文的關(guān)聯(lián)研究——以全球變化科學(xué)研究數(shù)據(jù)出版系統(tǒng)為例[J].數(shù)字圖書館論壇,2022(08):11-18.
(作者簡介:趙冬香,女,碩士研究生,凱里學(xué)院圖書館,副研究館員,研究方向:數(shù)字圖書館、數(shù)據(jù)庫建設(shè);龍志鳴,男,本科,凱里學(xué)院圖書館,館員,研究方向:圖書管理、古籍整理與保護(hù))
(責(zé)任編輯 王玲)