[摘 要]數(shù)字時(shí)代,網(wǎng)絡(luò)可引用資源呈現(xiàn)多元化、無序化、數(shù)量龐大等特點(diǎn),引用網(wǎng)絡(luò)資源成為社會(huì)普遍現(xiàn)象。通過文獻(xiàn)分析法明確原生數(shù)字網(wǎng)絡(luò)資源引用現(xiàn)狀,基于各大網(wǎng)站調(diào)研分析的相關(guān)數(shù)據(jù),歸納總結(jié)引用失效的特點(diǎn)、類型,剖析引用失效原因,提出國家、平臺(tái)、人員三方參與,構(gòu)建相關(guān)政策及體系,提高技術(shù)手段,注重?cái)?shù)字資源生產(chǎn)者、發(fā)布者、使用者的需求等應(yīng)對(duì)策略。
[關(guān)鍵詞]原生數(shù)字網(wǎng)絡(luò)資源 引用失效 資源保存
[分類號(hào)]G250.73
近年來,國家日益重視數(shù)字資源的開發(fā)和保護(hù),但對(duì)數(shù)字資源引用失效問題卻鮮有關(guān)注。筆者以Web of Science為檢索庫,數(shù)據(jù)庫選擇WOS核心集,使用“Link rot”或“Reference rot”為主題詞[1],選擇文獻(xiàn)發(fā)表時(shí)間為2013年3月至2023年3月。通過檢索相關(guān)文獻(xiàn)發(fā)現(xiàn),國外將原生數(shù)字資源引用失效原因歸結(jié)為兩點(diǎn),一是鏈接失效,二是內(nèi)容漂移。早在2000年,美國國會(huì)圖書館就發(fā)起了國家數(shù)字信息基礎(chǔ)設(shè)施和保存計(jì)劃(NDIIPP)[2],2021年7月美國國會(huì)圖書館對(duì)“數(shù)字格式研究的可持續(xù)性”進(jìn)行了探討。美國國會(huì)圖書館網(wǎng)站提供超過 500 種數(shù)字文件格式的信息,并就圖書館數(shù)字內(nèi)容的長期保存問題進(jìn)行指導(dǎo)。用“引文”并“可獲得性”或“可追溯性”在CNKI中進(jìn)行主題詞檢索,由相關(guān)文獻(xiàn)可知,近年來我國學(xué)者對(duì)于引用失效相關(guān)研究主要集中在對(duì)無法訪問的網(wǎng)絡(luò)資源進(jìn)行探究及改進(jìn)方面。
1 原生數(shù)字網(wǎng)絡(luò)資源引用的特點(diǎn)
1.1 引用網(wǎng)絡(luò)信息資源的復(fù)雜性
網(wǎng)絡(luò)世界日新月異,原生數(shù)字網(wǎng)絡(luò)資源呈現(xiàn)諸多復(fù)雜性。(1)類型復(fù)雜多樣。原生數(shù)字網(wǎng)絡(luò)資源有網(wǎng)頁、期刊、博客、音視頻文件等多種資源類型;呈現(xiàn)方式多樣,如網(wǎng)頁域名被分為con、com、net、info等多種。(2)資源來源復(fù)雜多樣。任何個(gè)人或團(tuán)體均可以創(chuàng)造生產(chǎn)原生數(shù)字網(wǎng)絡(luò)資源。如,溫州市公共圖書館數(shù)字資源專欄共收錄資源97項(xiàng);濟(jì)寧市圖書館數(shù)字資源中,特色數(shù)字專欄收錄資源21項(xiàng)。(3)資源內(nèi)容復(fù)雜多樣。原生數(shù)字網(wǎng)絡(luò)資源內(nèi)容包括學(xué)術(shù)、娛樂、生活、文化等社會(huì)各個(gè)方面,受創(chuàng)作主體內(nèi)在素質(zhì)的制約,質(zhì)量也參差不齊。以上因素造成原生數(shù)字網(wǎng)絡(luò)資源的復(fù)雜性,也導(dǎo)致引用網(wǎng)絡(luò)信息資源的復(fù)雜性,必然會(huì)影響網(wǎng)絡(luò)信息資源的引用。
1.2 網(wǎng)絡(luò)引文鏈接的可達(dá)性不可靠
網(wǎng)站的可達(dá)性是指網(wǎng)站的各類型用戶是否能夠通過主要的信息揭示途徑到達(dá)網(wǎng)站[3]。網(wǎng)絡(luò)引文鏈接可達(dá)性不可靠會(huì)導(dǎo)致用戶無法正常訪問網(wǎng)站,主要原因有3種。(1)突發(fā)情況的發(fā)生。平臺(tái)可能會(huì)發(fā)生突發(fā)情況,導(dǎo)致單入口鏈接直接癱瘓。應(yīng)建立多鏈接入口,如高校圖書館除通過官網(wǎng)直接訪問網(wǎng)絡(luò)資源,也可利用虛擬專用網(wǎng)絡(luò)(VPN)遠(yuǎn)程訪問方便用戶引用。(2)服務(wù)對(duì)象范圍的界定不清晰。服務(wù)對(duì)象范圍擴(kuò)大,針對(duì)不同的服務(wù)對(duì)象,仍有一部分群體無法訪問,圖書館應(yīng)保障所有服務(wù)對(duì)象,如殘疾人等群體能正常訪問網(wǎng)站[4]。(3)網(wǎng)站建設(shè)的不完善。網(wǎng)站沒有及時(shí)建設(shè)維護(hù)或更新升級(jí),導(dǎo)致一部分網(wǎng)站不可達(dá)。為推進(jìn)平臺(tái)鏈接的可訪問性,網(wǎng)絡(luò)升級(jí)改版應(yīng)該對(duì)死鏈接及時(shí)進(jìn)行清除,改善鏈接響應(yīng)速度,不斷優(yōu)化網(wǎng)站。
1.3 信息的新穎性、真實(shí)性、準(zhǔn)確性不易把握
隨著網(wǎng)絡(luò)技術(shù)的快速發(fā)展,互聯(lián)網(wǎng)資源良莠混雜,信息的時(shí)效性、準(zhǔn)確性等不易把握。(1)網(wǎng)絡(luò)資源的時(shí)效性。原生數(shù)字網(wǎng)絡(luò)資源由于自身具備的獨(dú)特載體,導(dǎo)致信息傳播持久,引用廣泛。多數(shù)網(wǎng)絡(luò)資源流傳及被引用的時(shí)間久遠(yuǎn),無法充分發(fā)揮其引用價(jià)值。(2)網(wǎng)絡(luò)資源的虛假性。網(wǎng)絡(luò)環(huán)境中,非正向輿論導(dǎo)向壓制正確信息的流動(dòng),網(wǎng)絡(luò)資源經(jīng)過多次的重復(fù)傳遞,無法保證資源的真實(shí)可靠。(3)審核流程的不規(guī)范性。如,正規(guī)機(jī)構(gòu)收錄期刊的流程為投稿—審核—出刊—網(wǎng)絡(luò)檢索;而抖音平臺(tái)資源發(fā)放分為雙重審核、流量池推薦、疊加推薦。為確保內(nèi)容準(zhǔn)確性,雙重審核是人工與機(jī)器共同審核。但仍存在審核部門未篩選出違規(guī)資源,導(dǎo)致被引用時(shí)無法判斷信息是否準(zhǔn)確的問題。
1.4 資源創(chuàng)建與發(fā)布的隨意性
當(dāng)用戶成為內(nèi)容的生產(chǎn)者,資源創(chuàng)建變得便捷、隨意,必須加大風(fēng)險(xiǎn)感知敏銳性,更加注重對(duì)內(nèi)容質(zhì)量的把控。(1)用戶生產(chǎn)(UGC)信息生產(chǎn)方式廣泛應(yīng)用。近四十年來,數(shù)字資源的生產(chǎn)從PGC、UGC再到如今盛行的AIGC。UGC這種生產(chǎn)信息內(nèi)容的方式被廣泛應(yīng)用,其內(nèi)容還是目前互聯(lián)網(wǎng)的主基調(diào),如微博、知乎、搜狐號(hào)等均使用的是UGC模式。主體自發(fā)性在資源創(chuàng)建與發(fā)布中體現(xiàn)明顯,隨意發(fā)布造成了網(wǎng)絡(luò)資源魚龍混雜。(2)網(wǎng)絡(luò)引文鏈接可追溯性低。服務(wù)器的失效會(huì)直接導(dǎo)致鏈接的失效,發(fā)布者抱有利用服務(wù)器漏洞,追溯不到自身信息的僥幸心理,隨意發(fā)布信息。(3)監(jiān)管機(jī)制缺失。中國互聯(lián)網(wǎng)絡(luò)信息中心 (CNNIC) 發(fā)布的報(bào)告顯示,截至2020年6月,38.4%的網(wǎng)民表示過去半年在上網(wǎng)過程中遭遇過網(wǎng)絡(luò)安全問題。平臺(tái)關(guān)注自身利益,為吸引流量而降低審核標(biāo)準(zhǔn),以及網(wǎng)關(guān)的失職均易造成“資源污染”,網(wǎng)絡(luò)資源的規(guī)范性無法保證。
2 原生數(shù)字網(wǎng)絡(luò)資源引用失效類型
2.1 引用文本失效
文本類的原生數(shù)字網(wǎng)絡(luò)信息資源以文字為主,如,網(wǎng)頁文獻(xiàn)、小說等主要由機(jī)構(gòu)統(tǒng)一回收歸納發(fā)布,博文則主要以個(gè)人直接編寫發(fā)布為主。大量引用網(wǎng)絡(luò)文本資源的同時(shí),舊文本也在慢慢失效。如,Martin Klein等人發(fā)現(xiàn),五分之一的STM文章都有參考,在發(fā)表后的一段時(shí)間不能重新訪問引用網(wǎng)站。以博客文本為例,十年前發(fā)布的文章大批量失效,其主要的失效原因顯示為“博客平臺(tái)維護(hù)中”。時(shí)代的發(fā)展推動(dòng)了文本管理措施的更新,短視頻時(shí)代的崛起也促進(jìn)了主營文本機(jī)構(gòu)的更新?lián)Q代,大量文本的不合規(guī)、平臺(tái)運(yùn)營維護(hù)導(dǎo)致舊文本的失效現(xiàn)象頻頻發(fā)生。
2.2 引用非文本失效
引用非文本失效是指圖片、圖形、動(dòng)畫、音頻、視頻等應(yīng)用引用時(shí)出現(xiàn)失效現(xiàn)象。多媒體的動(dòng)態(tài)信息易涉及侵權(quán)問題,且在非文本資源存檔系統(tǒng)和互動(dòng)式檢索系統(tǒng)建設(shè)方面我國的技術(shù)欠缺完備性。
數(shù)字經(jīng)濟(jì)背景下,分享、下載、引用音頻是日常生活中的普遍行為。公眾對(duì)音樂的熱愛使各大平臺(tái)發(fā)現(xiàn)了隱蔽在音樂背后的價(jià)值,音樂壟斷現(xiàn)象應(yīng)運(yùn)而生。數(shù)字音樂版權(quán)獨(dú)家交易致使多家平臺(tái)因侵犯版權(quán)下架音頻,造成了音頻的引用失效[5]。同樣,在視頻行業(yè),侵權(quán)問題也是導(dǎo)致視頻失效的主要因素。根據(jù)《2021年中國短視頻版權(quán)保護(hù)白皮書》,2019年1月至2021年5月,12426版權(quán)監(jiān)測中心對(duì)包含影視綜藝短視頻在內(nèi)的1300萬件二度創(chuàng)作作品進(jìn)行監(jiān)測,累計(jì)監(jiān)測到300萬個(gè)侵權(quán)賬號(hào),通知?jiǎng)h除1478.6萬條侵權(quán)短視頻,涉及點(diǎn)擊量5.01萬億次[6]。在CNKI,以“視頻”和“侵權(quán)”作為主題詞檢索,可以檢索到2012年至今相關(guān)文獻(xiàn)共853篇,其中2020年至今共408篇,短視頻侵權(quán)問題越來越受到重視。由此可見,目前非文本資源引用失效除個(gè)人私自刪除、技術(shù)不完善外,侵權(quán)失效也是一大原因。
2.3 引用代碼失效
網(wǎng)頁代碼是目前人們?nèi)粘I钪薪佑|最多的代碼種類,同時(shí)網(wǎng)頁的普及也導(dǎo)致了大量惡意網(wǎng)頁的產(chǎn)生。據(jù)CNCERT監(jiān)測,2019年我國境內(nèi)被篡改的網(wǎng)站約185573個(gè),其中被篡改的政府網(wǎng)站數(shù)量約515個(gè),較2018年增長了138.4%。網(wǎng)頁的大量篡改,極易增加引用時(shí)網(wǎng)頁代碼失效的概率。
針對(duì)數(shù)據(jù)安全問題,2019年國家網(wǎng)信辦發(fā)布了《數(shù)據(jù)安全管理辦法》,但目前還沒有出臺(tái)相關(guān)引用標(biāo)準(zhǔn)。代碼引用的體系化標(biāo)準(zhǔn)尚且模糊,程序員通常會(huì)選擇在原有的代碼基礎(chǔ)上適當(dāng)修改,完善模型解算方法,并未考慮引用規(guī)范問題。代碼作為生產(chǎn)力,可以在允許范圍內(nèi)使用,但是發(fā)表在公共平臺(tái)的作品,若遇到病毒或個(gè)人刪除等現(xiàn)象,會(huì)使引用代碼永久失效,并導(dǎo)致使用者引用失效。針對(duì)代碼引用失效問題,代碼備份是主要應(yīng)對(duì)辦法。
3 原生數(shù)字網(wǎng)絡(luò)資源引用失效原因分析
3.1 不穩(wěn)定性
由于原生數(shù)字網(wǎng)絡(luò)資源具有數(shù)字形式的唯一性,相較于非原生數(shù)字資源穩(wěn)定性較差,其特殊屬性、網(wǎng)頁的廢棄或更改、突發(fā)事件的發(fā)生均易導(dǎo)致資源引用失效[7]。
(1)特殊屬性。Andrea Mannocci等人收集的4種著名學(xué)術(shù)注冊(cè)中心的13000個(gè)獨(dú)特URL的全球?qū)W術(shù)知識(shí)庫中大約25%的存儲(chǔ)庫URL和主頁是有問題的。由于原生數(shù)字網(wǎng)絡(luò)資源是以數(shù)字形式傳播,不以實(shí)體形式存在,信息載體的不同使其信息資源的增添、刪改、移動(dòng)變得十分便捷,容易造成引用失效。
(2)網(wǎng)頁的廢棄或變更。網(wǎng)頁廢棄體現(xiàn)為網(wǎng)頁被從索引中刪除,域不再存在;或網(wǎng)站內(nèi)容存在,但是內(nèi)容將不再與引用者所引的鏈接連接。網(wǎng)頁變更體現(xiàn)為網(wǎng)站地址重新定向,當(dāng)網(wǎng)站的域名變更或刪除后將其轉(zhuǎn)向到新域名下,引用者點(diǎn)擊鏈接將直接跳轉(zhuǎn)到無關(guān)網(wǎng)頁內(nèi)容。運(yùn)用定時(shí)器檢查數(shù)據(jù)更新情況,發(fā)現(xiàn)75%的引用網(wǎng)頁發(fā)生了內(nèi)容的變化。Cho等人也發(fā)現(xiàn),超過40%的網(wǎng)站頁面每天都在變化[8];Adar等人觀察到很大一部分不斷變化的網(wǎng)絡(luò)資源語料庫中,65%的頁面發(fā)生了一定程度的變化[9]。
(3)突發(fā)事件的發(fā)生。由于原生數(shù)字網(wǎng)絡(luò)資源都以數(shù)字形式存放,若其保存設(shè)備遇到巨大災(zāi)難,如火災(zāi)、洪災(zāi)等易導(dǎo)致徹底損毀;互聯(lián)網(wǎng)政策也在面臨著不斷地更新與修改,政策的改變會(huì)導(dǎo)致機(jī)構(gòu)刪除現(xiàn)有資源;網(wǎng)站宕機(jī)也會(huì)導(dǎo)致通過網(wǎng)絡(luò)鏈接抓取頁面時(shí)發(fā)生錯(cuò)誤。
3.2 非權(quán)威性
隨著互聯(lián)網(wǎng)時(shí)代的崛起,網(wǎng)絡(luò)信息“資源污染”嚴(yán)重,原生數(shù)字資源網(wǎng)絡(luò)首發(fā)這一特點(diǎn)對(duì)資源的來源以及保存機(jī)構(gòu)的權(quán)威性要求較高,來源與機(jī)構(gòu)的非權(quán)威性極易導(dǎo)致引用資源因著作權(quán)等法律問題而失效。
(1)網(wǎng)絡(luò)資源來源的非權(quán)威性。一是原生數(shù)字網(wǎng)絡(luò)資源的來源多數(shù)不明確,被引用的部分資源沒有署名和鏈接網(wǎng)址。如,Ott Douglas 對(duì)醫(yī)學(xué)文章發(fā)表后的參考文獻(xiàn)可用性評(píng)估分析發(fā)現(xiàn),9%~25%的文章被錯(cuò)誤地引用和歪曲“事實(shí)”[10]。二是由于網(wǎng)絡(luò)用戶的知識(shí)背景不同,發(fā)布的資源內(nèi)容質(zhì)量也存在一定的差異。三是沒有專門人員審核或者與作者簽訂有效的個(gè)人版權(quán)協(xié)議,無法明確發(fā)布內(nèi)容是否為作者原創(chuàng)。
(2)網(wǎng)絡(luò)資源保存機(jī)構(gòu)的非權(quán)威性。在網(wǎng)絡(luò)信息資源引用的過程中,有些資源來源無法確定是正規(guī)公共機(jī)構(gòu)、商業(yè)機(jī)構(gòu)還是個(gè)人,網(wǎng)絡(luò)管理者也無法向使用者出具官方檢測機(jī)構(gòu)正規(guī)的證明。對(duì)于普通人而言,若不靠第三方檢測機(jī)構(gòu)識(shí)別,無法準(zhǔn)確判斷所引用的網(wǎng)絡(luò)信息資源的權(quán)威性、可靠性與穩(wěn)定性。
3.3 信息過時(shí)
生產(chǎn)者的去舊換新加快了原生數(shù)字資源的新舊更替,使用者的信息需求促進(jìn)了原生數(shù)字資源的反復(fù)引用,資源的現(xiàn)實(shí)價(jià)值是決定其是否被摒棄的關(guān)鍵因素,所以信息的時(shí)效性也影響著資源的被引情況。
(1)從生產(chǎn)者角度看,中國互聯(lián)網(wǎng)絡(luò)信息中心第51次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展統(tǒng)計(jì)報(bào)告》數(shù)據(jù)顯示,截至2022年12月,我國域名總數(shù)達(dá)3440萬個(gè),IPv6地址數(shù)量達(dá)67369塊/32,較2021年12月增長6.8%[11]。由于網(wǎng)站的數(shù)量龐大,每天必定會(huì)有大量首發(fā)資源涌入網(wǎng)絡(luò),網(wǎng)絡(luò)原生數(shù)字資源大量更新生產(chǎn),新舊信息不斷更替,導(dǎo)致信息過時(shí)加快。除網(wǎng)站運(yùn)營需要外,由于網(wǎng)絡(luò)時(shí)代的開放性,人人都具有生產(chǎn)資源的權(quán)利,同樣加速了信息新舊更替。
(2)從使用者角度看,為使引用內(nèi)容更加具有時(shí)效性,使用者往往引用最新的信息資源,以證明自身觀點(diǎn)的新穎程度。Martin Klein等人表示時(shí)效性是網(wǎng)絡(luò)的變革性特征之一,也是基于網(wǎng)絡(luò)的學(xué)術(shù)傳播特征之一,使知識(shí)傳播的速度急劇加快。以CNKI中的文獻(xiàn)為例,發(fā)表時(shí)間較早的文獻(xiàn),若不是核心期刊或理論基礎(chǔ)等相關(guān)的文章,就會(huì)面臨引用較少的局面。這一普遍現(xiàn)象往往會(huì)造成大量信息內(nèi)容過時(shí),無人引用的現(xiàn)象。
3.4 忽視個(gè)人資源保護(hù)
由于重視程度以及宣傳力度的不足,資源因版權(quán)問題導(dǎo)致鏈接失效頻頻發(fā)生,因此提高個(gè)人主創(chuàng)數(shù)字資源的保護(hù)意識(shí),能夠有效規(guī)避因侵權(quán)造成的資源失效。
(1)重視程度低。當(dāng)前各類資源盛行,但引用主體缺乏判斷力,就2021年“劍網(wǎng)行動(dòng)”短視頻整治數(shù)據(jù)顯示,共查處網(wǎng)絡(luò)侵權(quán)案件445件,關(guān)閉侵權(quán)盜版網(wǎng)站(App)245個(gè),處置刪除侵權(quán)盜版鏈接61.83萬條,清理各類侵權(quán)鏈接846.75萬條,可見重視不足并非個(gè)例[12]。當(dāng)前,越來越多的人在各大平臺(tái)上發(fā)布個(gè)人創(chuàng)作作品,每個(gè)人都可以成為原生資源的創(chuàng)作者,但是大多數(shù)人并不注重發(fā)布資源失效的問題,沒有從源頭解決原生數(shù)字資源失效的意識(shí)。如果只是單純論述失效后的補(bǔ)救策略,失效問題也無法從根本上解決。
(2)宣傳力度不足。當(dāng)前我國資源保護(hù)問題呈現(xiàn)出兩極分化現(xiàn)象,一部分人資源保護(hù)意識(shí)薄弱,另一部分人意識(shí)過盛推進(jìn)了版權(quán)壟斷。由于個(gè)人資源保護(hù)意識(shí)水平不一致,面對(duì)引用失效情況的發(fā)生,處理手段也不同。平臺(tái)、政府等多方缺乏宣傳資源保護(hù)的專職人員,政府宣傳力度不足、普及不廣泛,也是當(dāng)前原生數(shù)字資源失效的原因。
4 應(yīng)對(duì)策略
4.1 國家監(jiān)管,頂層設(shè)計(jì),多方參與
4.1.1 相關(guān)法律政策推進(jìn)引用有效
據(jù)《全球視角下的數(shù)據(jù)保存政策》顯示,世界各國數(shù)字資源保存的政策制定存在差距[13]。我國國家統(tǒng)計(jì)局和尼日利亞國家圖書館曾發(fā)布相關(guān)數(shù)字保存政策,但政策仍有不足之處,不足以確保數(shù)字信息長期保存[14]。缺乏統(tǒng)一的政策規(guī)定是各國普遍存在的問題。當(dāng)前我國網(wǎng)址、博文、視頻等數(shù)字資源多經(jīng)多次傳播,無法追溯首發(fā)資源,所以更應(yīng)對(duì)版權(quán)進(jìn)行保護(hù),建立統(tǒng)一的標(biāo)準(zhǔn)和規(guī)范,構(gòu)建版權(quán)保護(hù)制度,建立合理合法的侵權(quán)評(píng)估標(biāo)準(zhǔn),并加強(qiáng)引用者的引用安全意識(shí)。
4.1.2 建立國家數(shù)字資源體系
在原生數(shù)字資源保存過程中,我國雖不斷完善構(gòu)建數(shù)字資源體系,但網(wǎng)絡(luò)資源的飛速增長,空前巨大的訪問量仍使引用鏈接變得脆弱。我國雖然與國外出版商也簽訂了資源長期保存協(xié)議,但是資源使用的價(jià)格越來越高,高校數(shù)字資源長期保存僅占比60%,全國性數(shù)字資源戰(zhàn)略儲(chǔ)備庫尚未建立[15]。我國應(yīng)借鑒國外成功運(yùn)作的數(shù)字資源體系,如Perma,順應(yīng)時(shí)代發(fā)展的需求,保障數(shù)字資源永久保存。
4.1.3 拓寬資源保存機(jī)構(gòu)范圍
如果沒有長期穩(wěn)定的財(cái)力支持,也無法保障原生數(shù)字資源長期有效地保存。國家可建立原生數(shù)字資源共建共享機(jī)制,使得不同機(jī)構(gòu)在原生數(shù)字資源保存的過程中平均、有效地分配需要的資金,減少資金消耗。充分調(diào)動(dòng)各基層機(jī)構(gòu)的積極性,使其也參與到原生數(shù)字資源長期保存的計(jì)劃中,同時(shí)注意潛在利益關(guān)系沖突問題,維持經(jīng)濟(jì)效益有效平衡,保障共建共享聯(lián)盟可持續(xù)發(fā)展。
4.2 平臺(tái)治理
4.2.1 管理體制
在人員管理方面,平臺(tái)應(yīng)上好資源保存的最后一把鎖,明確保存信息的重要性,號(hào)召基層組織加大管理力度。并對(duì)平臺(tái)資源管理人員進(jìn)行統(tǒng)一培訓(xùn),強(qiáng)化人員資源管理、組織、利用的總體意識(shí),灌輸長期有效管理原生數(shù)字資源的相關(guān)知識(shí)。
在制度管理方面,平臺(tái)應(yīng)盡快制定關(guān)于署名權(quán)、復(fù)制權(quán)、修改權(quán)等的相關(guān)管理制度,對(duì)于工作的極大失誤標(biāo)注處罰措施,避免工作人員由于制度約束的不到位,做出不恰當(dāng)?shù)男袨???梢詤⒖紘庀嚓P(guān)圖書館管理制度,制定著作權(quán)管理政策,加強(qiáng)制度建設(shè),規(guī)范工作流程。
4.2.2 技術(shù)手段
針對(duì)數(shù)字視頻資源保存的問題,國外運(yùn)用了很多先進(jìn)的技術(shù)手段,如將區(qū)塊鏈等相關(guān)技術(shù)運(yùn)用到資源保存是當(dāng)前的創(chuàng)新熱點(diǎn)。巴西等國家通過建立具有特定方法的選擇政策以及采用開源技術(shù)的網(wǎng)絡(luò)檔案進(jìn)行數(shù)字資源的管理保存[16];非洲多數(shù)機(jī)構(gòu)庫選擇使用DSpace軟件來管理其數(shù)字內(nèi)容;Ahrefs外鏈查詢工具也能有效幫助網(wǎng)站維護(hù),可立即查看某一網(wǎng)站上每個(gè)損壞的出站鏈接,對(duì)列表進(jìn)行排序和過濾以確定修復(fù)的優(yōu)先級(jí),定期查看發(fā)現(xiàn)新?lián)p壞的鏈接。
國內(nèi)需要加大開發(fā)相關(guān)技術(shù)的力度,創(chuàng)造更加先進(jìn)高效的系統(tǒng),優(yōu)化相關(guān)機(jī)構(gòu)庫,使技術(shù)與時(shí)俱進(jìn)。在高速發(fā)展的網(wǎng)絡(luò)環(huán)境中,計(jì)算機(jī)技術(shù)的發(fā)展需要緊跟時(shí)代步伐,時(shí)刻以使用者需求為中心開展技術(shù)創(chuàng)新,為人類文化傳承做出貢獻(xiàn)。
4.2.3 備份
單純靠管理保存平臺(tái)技術(shù)手段并不能從根本上解決鏈接失效問題,網(wǎng)絡(luò)公司技術(shù)部門致力于研究鏈接重鏈接問題,但是目前的技術(shù)無法直接從源頭根除這一現(xiàn)象,平臺(tái)開發(fā)相關(guān)技術(shù)做好備份無疑是目前應(yīng)對(duì)失效最有效的手段之一。如,Archives of General Psychiatry編輯部要求作者保存網(wǎng)絡(luò)引文資料,并有義務(wù)向需要者提供。加拿大多倫多大學(xué)Gunther Eysenbach主導(dǎo)開發(fā)了旨在為作者、編輯、圖書館等提供網(wǎng)絡(luò)引文數(shù)字化備份的Webcite[17]。平臺(tái)對(duì)發(fā)布的資源進(jìn)行備份是應(yīng)對(duì)引文失效的有效策略,也是提高機(jī)構(gòu)權(quán)威性的手段,能增加使用者對(duì)平臺(tái)的信任度。Wayback機(jī)器專門用于收集、保存和提供網(wǎng)頁,針對(duì)失效的資源,它仍可以通過自身功能獲取網(wǎng)頁。
4.3 數(shù)字資源生產(chǎn)者、發(fā)布者
4.3.1 增強(qiáng)保存意識(shí)
在數(shù)字資源正確引用方面,需提高數(shù)字資源生產(chǎn)者、發(fā)布者的原生數(shù)字資源保存意識(shí),加大保存意識(shí)普及,盡量避免由于生產(chǎn)者自身原因刪除作品。專業(yè)人員需幫助生產(chǎn)者、發(fā)布者更加細(xì)致地了解判斷資源發(fā)布機(jī)構(gòu)的權(quán)威性,使得多數(shù)數(shù)字資源發(fā)布在正規(guī)的平臺(tái)。
4.3.2 加強(qiáng)自身修養(yǎng)
生產(chǎn)者、使用者要嚴(yán)格把控自身創(chuàng)作資源的內(nèi)容準(zhǔn)確性,注重個(gè)人修養(yǎng),把握道德標(biāo)準(zhǔn),嚴(yán)格遵守法律法規(guī),這不僅是對(duì)數(shù)字資源使用的保障,更是對(duì)自身創(chuàng)作的負(fù)責(zé)。
4.4 數(shù)字資源使用者
4.4.1 及時(shí)備份
使用者潛意識(shí)里往往忽略了備份的重要性,更加傾向于“選擇性保存”,更加重視原生數(shù)字資源的現(xiàn)實(shí)價(jià)值性,即當(dāng)下有用保存原則,而忽略未來參考價(jià)值,造成了未來需要引用時(shí)資源失效的現(xiàn)象。Molina等人在 12 個(gè)多學(xué)科數(shù)據(jù)庫中進(jìn)行書目檢索,選擇了 16 篇研究文章,指出最常用的保存策略是遷移、保存元數(shù)據(jù)、備份副本和仿真[18]。未來在技術(shù)方面,可以使用JavaScript改變?cè)氐腃SS屬性來實(shí)現(xiàn)顏色變化,通過顏色改變來提醒用戶數(shù)據(jù)的更新情況,幫助及時(shí)備份。數(shù)字資源的使用者需要及時(shí)保存下載資源,在網(wǎng)盤、硬盤雙重備份,同時(shí)仍需注意著作權(quán)問題,避免侵害作品的復(fù)制權(quán)。
4.4.2 提高引用安全意識(shí)
一方面,需要提高使用者自身識(shí)別能力,引用時(shí)需要明確上傳網(wǎng)絡(luò)資源的平臺(tái)是否可以永久保存數(shù)據(jù),盡量避免使用不安全的原生數(shù)字網(wǎng)絡(luò)資源。另一方面,平臺(tái)應(yīng)對(duì)使用者加以培訓(xùn),通過宣傳教育,加強(qiáng)使用者的引用安全意識(shí),正確辨別引用資源的失效風(fēng)險(xiǎn)性。
4.4.3 訓(xùn)練資源有用性感知能力
使用者在下載資源的時(shí)候,要考慮到未來這一信息內(nèi)容的發(fā)展趨勢。目前,網(wǎng)絡(luò)數(shù)字資源更新迅速,熱點(diǎn)內(nèi)容稍縱即逝,如果盲目大量下載必然會(huì)導(dǎo)致存儲(chǔ)負(fù)擔(dān)過重的問題,所以就需要使用者具備前瞻性意識(shí),用長遠(yuǎn)眼光看待信息資源,及時(shí)下載保存未來有需要的信息內(nèi)容,訓(xùn)練自身感知資源有用性的能力。
5 結(jié)語
數(shù)字經(jīng)濟(jì)的蓬勃發(fā)展離不開數(shù)字網(wǎng)絡(luò)資源,筆者通過關(guān)注原生數(shù)字網(wǎng)絡(luò)資源引用失效問題,深刻地意識(shí)到數(shù)字網(wǎng)絡(luò)資源長期保存的重要性。在國內(nèi)外相關(guān)研究的引導(dǎo)下,探究了失效的多種原因以及具體應(yīng)對(duì)策略。建議國家相關(guān)部門、平臺(tái)、個(gè)人關(guān)注數(shù)字資源引用失效問題,并針對(duì)此類現(xiàn)象深入探究,從而推動(dòng)原生數(shù)字網(wǎng)絡(luò)資源長期發(fā)展。
參考文獻(xiàn):
[1] 黃國彬,黃戀.原生網(wǎng)絡(luò)數(shù)字資源引用失效的概念界定與類型剖析[J].情報(bào)雜志,2022(8):163-170.
[2] 趙丹陽.國外網(wǎng)絡(luò)資源保存政策法規(guī)發(fā)展研究[J].情報(bào)探索,2022(3):104-110.
[3] 朱江,余敏.數(shù)字圖書館網(wǎng)站的可用性框架研究[J].情報(bào)理論與實(shí)踐,2009(6):114-117,121.
[4] 李院.圖書館網(wǎng)站的可訪問性探討[J].情報(bào)雜志,2000(2):37-38.
[5] 張宇.數(shù)字音樂獨(dú)家交易的壟斷規(guī)制研究[J].中國價(jià)格監(jiān)管與反壟斷,2022(8):32-36.
[6] 12426版權(quán)監(jiān)測中心.2021年中國短視頻版權(quán)保護(hù)白皮書[EB/OL].[2023-03-18].https://mp.weixin.qq.com/s/OaQ8E4QkUB9ALa3rrOfvLQ.
[7] 陳紅星,張淑芳.網(wǎng)絡(luò)原生數(shù)字資源:概念、特征與類型[J].圖書館建設(shè),2010(5):1-4.
[8] Cho J, Garcia-Molina H.The Evolution of the Web and Implications for an Incremental Crawler[J].Proceedings of the 20th International Conference on VLDB,2000:200-209.
[9] Adar E,et al.The Web Changes Everything: Understanding the Dynamics of Web Content[J].Proceedings of the 2nd ACM International Conference on WSDM,2009:282-291.
[10] Ott Douglas E.Reference Hygiene and Death on the Internet-Decay, Rot, Half-Life, Deterioration, and Corruption[J].JSLS: Journal of the society of laparoendoscopic surgeons,2022(1).
[11] 中國互聯(lián)網(wǎng)信息中心.第51次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[EB/OL].[2023-03-13].https://www.cnnic.cn/n4/2023/0303/c88-10757.html.
[12] 國家版權(quán)局.“劍網(wǎng)2021”專項(xiàng)行動(dòng)取得階段性成效[EB/OL].[2023-04-09].https://www.ncac.gov.cn/chinacopyright/contents/12227/355096.shtml.
[13] Rockembach,Moises.Policies and technologies to digital preservation in web archiving[J].Revista Ibero-Americana De Ciencia Da Informacao,2018(1).
[14] Gbaje E S,Mohammed Z.Digital preservation policy in National Information Centres in Nigeria[J].The Electronic Library,2013(4):483-492.
[15] 葉繼元,劉鳳儀.全國數(shù)字資源保障體系重構(gòu)的管理體制與運(yùn)行機(jī)制宏觀構(gòu)想[J].數(shù)字圖書館論壇,2021(6):17-22.
[16] Laerte Pda SJ,Maria MB.Digital preservation policies of the institutional repositories at Brazilian Federal Universities[J].The Electronic Library,2017(2):311-321.
[17] 劉春燕.網(wǎng)絡(luò)環(huán)境下信息資源引用的新特點(diǎn)及其應(yīng)對(duì)[J].情報(bào)雜志,2010(2):172-175.
[18] Flores-Fernandez C,et al. Digital preservation strategies of sound archives.Systematized review[J].Revista Espanola De Documentacion Cientifica,2022(2).
欒曉菲 女,2000年生。碩士研究生在讀。研究方向:信息資源管理。
張 劍 女,1981年生。碩士,副教授。研究方向:信息資源管理。
(收稿日期:2023-07-15;責(zé)編:劉曉霞。)