【摘要】Web3.0時代具有更加注重數(shù)據(jù)的智能化、去中心化、隱私保護以及用戶掌握數(shù)據(jù)權(quán)利的特點。出版生態(tài)中,數(shù)據(jù)成為提升出版競爭力的關(guān)鍵生產(chǎn)要素和戰(zhàn)略性資源,改變了傳統(tǒng)知識生產(chǎn)、發(fā)現(xiàn)與傳播的方式,推動出版業(yè)態(tài)向數(shù)據(jù)驅(qū)動的范式轉(zhuǎn)變。基于此,文章通過與數(shù)字出版進行比較,厘清數(shù)據(jù)出版的范疇邊界、屬性特征以及參與主體,采用服務(wù)生態(tài)系統(tǒng)理論,圍繞主體互動關(guān)系、數(shù)據(jù)資源整合、數(shù)據(jù)服務(wù)關(guān)聯(lián)以及技術(shù)應(yīng)用創(chuàng)新等關(guān)鍵要素,構(gòu)建適應(yīng)價值鏈不同環(huán)節(jié)和不同需求場景的數(shù)據(jù)出版服務(wù)生態(tài)系統(tǒng),提出共創(chuàng)與協(xié)作的發(fā)展策略,以期為數(shù)據(jù)出版生態(tài)系統(tǒng)的可持續(xù)發(fā)展提供借鑒。
【關(guān)鍵詞】數(shù)據(jù)出版 數(shù)據(jù)驅(qū)動 智慧驅(qū)動 服務(wù)生態(tài)系統(tǒng) 出版生態(tài)
【中圖分類號】G230 【文獻標識碼】A 【文章編號】1003-6687(2024)7-038-07
【DOI】 10.13786/j.cnki.cn14-1066/g2.2024.7.005
近年來,在AIGC和Web3.0等前沿技術(shù)的推動下,我國的數(shù)據(jù)基礎(chǔ)設(shè)施得到了顯著加強,無論是大數(shù)據(jù)存儲和管理能力,還是數(shù)據(jù)處理和分析效率,都得到了明顯提升。截至2021年,我國數(shù)據(jù)容量已達到18.51ZB,預(yù)計在2026年將飆升至56.16ZB。[1]為應(yīng)對這一數(shù)據(jù)潮流,我國陸續(xù)推出了旨在促進數(shù)據(jù)應(yīng)用和服務(wù)的政策。2022年12月,中共中央、國務(wù)院發(fā)布《關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》。2023年10月,國家數(shù)據(jù)局成立,標志著數(shù)據(jù)治理工作已提升到國家戰(zhàn)略層面。
這些情況催生了作為數(shù)字出版新形態(tài)的數(shù)據(jù)出版,其核心在于通過開放和共享數(shù)據(jù)、知識重組及數(shù)據(jù)可視化等方式,將調(diào)查和研究成果以數(shù)字形式公開發(fā)布。[2]數(shù)據(jù)出版不僅強調(diào)數(shù)據(jù)的原始性、準確性和可重用性,更注重利用數(shù)據(jù)洞察和驅(qū)動用戶需求,實現(xiàn)定制化服務(wù),開發(fā)滿足用戶需求的個性化數(shù)據(jù)產(chǎn)品。隨著互聯(lián)網(wǎng)和數(shù)字技術(shù)的演進,數(shù)據(jù)出版不僅展現(xiàn)了其獨特價值,還形成一個特有的生態(tài)系統(tǒng)。
在Web3.0時代,借助大數(shù)據(jù)、生成式人工智能、虛擬現(xiàn)實和區(qū)塊鏈技術(shù),數(shù)據(jù)出版正經(jīng)歷一場深刻的變革。這一時代的核心特征——智能化、去中心化和信任化——為數(shù)據(jù)出版的價值創(chuàng)造帶來了新的可能性。利益相關(guān)者的有效參與不僅可以提升數(shù)據(jù)質(zhì)量和實用性,還能加強出版生態(tài)系統(tǒng)的創(chuàng)新性和合作潛力。在這一新的生態(tài)環(huán)境下,數(shù)據(jù)出版正展現(xiàn)出與Web3.0應(yīng)用服務(wù)結(jié)合后的新屬性,通過整合資源,形成一個完善的價值共創(chuàng)生態(tài)系統(tǒng),為構(gòu)建可持續(xù)發(fā)展的數(shù)據(jù)出版生態(tài)系統(tǒng)奠定基礎(chǔ),從而推動整個行業(yè)的質(zhì)量提升和商業(yè)模式轉(zhuǎn)型。
一、數(shù)據(jù)出版的參與主體、范疇與特征
構(gòu)建數(shù)據(jù)出版生態(tài)系統(tǒng),首先要明確參與主體、范疇與特征,并在此基礎(chǔ)上建立結(jié)構(gòu)模型。
1. 數(shù)據(jù)出版的參與主體
1985年,邁克爾·波特提出了價值鏈概念,強調(diào)企業(yè)活動可以被視為價值創(chuàng)造的連續(xù)環(huán)節(jié)。[3]將此理念應(yīng)用于數(shù)據(jù)出版領(lǐng)域,可以識別出以下關(guān)鍵活動:數(shù)據(jù)的采集與生成、管理、分析與挖掘,數(shù)據(jù)出版物的研發(fā)、分發(fā)與銷售,以及用戶支持與信息收集反饋。這一系列活動不僅展現(xiàn)了數(shù)據(jù)價值的逐步實現(xiàn)過程,也揭示了不同參與者在其中扮演的角色。
具體到數(shù)據(jù)出版,其價值鏈的實現(xiàn)依賴于多種主體的緊密合作。這些主體超越了簡單的“平臺—用戶”或“生產(chǎn)者—消費者”關(guān)系,形成了一個包括數(shù)據(jù)生產(chǎn)者、保有者、傳遞者、利用者及消費者在內(nèi)的廣泛社會網(wǎng)絡(luò)。[4]這個網(wǎng)絡(luò)不僅涉及直接參與數(shù)據(jù)出版的個體和組織,還包括通過各種方式支持數(shù)據(jù)價值創(chuàng)造和流通的輔助參與者(見表1)。
為確保數(shù)據(jù)的價值在整個鏈條中得到最大化,各參與主體需發(fā)揮其專業(yè)優(yōu)勢,通過提升技能和共享資源,促進數(shù)據(jù)資源的優(yōu)化配置與協(xié)同創(chuàng)新。例如,數(shù)據(jù)生產(chǎn)者負責提供高質(zhì)量的原始數(shù)據(jù),數(shù)據(jù)分析師通過挖掘和分析等工作增加數(shù)據(jù)的附加值,而平臺則負責將這些數(shù)據(jù)有效地分發(fā)給最終用戶。通過這樣的合作模式,數(shù)據(jù)出版不僅能夠?qū)崿F(xiàn)對數(shù)據(jù)的有效利用,還能激發(fā)新的價值創(chuàng)造,從而提升整個社會的信息利用效率和創(chuàng)新能力。
2. 數(shù)據(jù)出版的范疇邊界
(1)數(shù)字出版的獨立新形態(tài)。在政策、技術(shù)和產(chǎn)業(yè)的共同驅(qū)動下,數(shù)據(jù)出版已經(jīng)成為激勵數(shù)據(jù)傳播、促進數(shù)據(jù)共享的重要方式。隨著科技的不斷進步與社會的深層演變,數(shù)據(jù)出版的范疇正不斷拓寬并觸及整個數(shù)據(jù)生命周期中的多個關(guān)鍵方面。
數(shù)據(jù)出版作為數(shù)字出版的一種獨立存在的形態(tài),一方面,呈現(xiàn)了與數(shù)字出版相同的特性,包括對數(shù)字技術(shù)的依賴、內(nèi)容數(shù)字化、用戶互動性以及渠道多樣化等;另一方面,因關(guān)注數(shù)據(jù)集、研究數(shù)據(jù)、統(tǒng)計結(jié)果等,特別重視數(shù)據(jù)的原始性、準確性和可重用性。其中,數(shù)據(jù)的可重用性指數(shù)據(jù)可以被其他研究人員或在其他研究中使用,而不僅僅限于其最初的收集目的。假設(shè)一個研究項目為了研究心血管疾病的風險因素,收集了某地區(qū)居民的體重、身高、血壓等健康狀況數(shù)據(jù),這些數(shù)據(jù)詳細且標準化程度高,它們也可以被其他研究人員用于不同的研究,比如分析體重、身高與糖尿病之間的關(guān)系。數(shù)據(jù)的可重用性有賴于數(shù)據(jù)的質(zhì)量、標準化格式,以及充足的元數(shù)據(jù),以確保其他研究人員可以理解數(shù)據(jù)的上下文。而我們通常所說的數(shù)字出版則包括電子書、在線雜志、數(shù)字新聞、博客等,更側(cè)重于文本、圖像、視頻等內(nèi)容的創(chuàng)作和傳播。
數(shù)據(jù)出版服務(wù)于科學研究、政策制定、教育發(fā)展以及商業(yè)創(chuàng)新等領(lǐng)域,目的在于推動知識的共享和再利用;數(shù)字出版不僅包括上述領(lǐng)域,還涵蓋了娛樂、新聞傳播、廣告服務(wù)、游戲電競等更多更廣的領(lǐng)域。
在發(fā)展過程中,數(shù)據(jù)出版關(guān)注數(shù)據(jù)生產(chǎn)者、數(shù)據(jù)保有者、數(shù)據(jù)利用者、數(shù)據(jù)傳遞者以及數(shù)據(jù)消費者之間的關(guān)系;數(shù)字出版則更加注重內(nèi)容創(chuàng)作者、出版平臺、分銷渠道以及讀者之間的互動。在生產(chǎn)流程上,數(shù)據(jù)出版強調(diào)數(shù)據(jù)的標準化和互操作性,這是實現(xiàn)數(shù)據(jù)共享和重復(fù)利用的關(guān)鍵;數(shù)字出版雖然也有格式標準,但由于內(nèi)容的多樣性,標準化和互操作性的要求相對較低。在市場經(jīng)營上,數(shù)據(jù)出版需要平衡數(shù)據(jù)開放性與數(shù)據(jù)保護之間的關(guān)系,需特別關(guān)注敏感數(shù)據(jù)的版權(quán)和隱私平衡問題;數(shù)字出版則更多強調(diào)內(nèi)容的原創(chuàng)性和版權(quán)保護。
總之,數(shù)據(jù)出版因其核心關(guān)注點、內(nèi)容形態(tài)、目標受眾的不同,已在科學研究、政府治理、教育發(fā)展和商業(yè)創(chuàng)新等領(lǐng)域形成了特有的價值鏈,這是構(gòu)建數(shù)據(jù)出版生態(tài)的起點和基礎(chǔ)。
(2)科學研究前沿的數(shù)據(jù)出版??茖W研究領(lǐng)域的數(shù)據(jù)出版發(fā)展迅速,特別是在數(shù)據(jù)標準化、數(shù)據(jù)倉庫應(yīng)用和開放獲取平臺(Open Access,OA)方面取得了顯著成果。
在科學研究領(lǐng)域,數(shù)據(jù)出版涉及原始數(shù)據(jù)的整理、分析和公開等,以支持學術(shù)成果的驗證和再利用,這就要求科學數(shù)據(jù)具備一定的透明度和可復(fù)現(xiàn)性。其中,元數(shù)據(jù)是關(guān)于數(shù)據(jù)的數(shù)據(jù),它描述了數(shù)據(jù)的來源、內(nèi)容、質(zhì)量、條件等特性,如記錄數(shù)據(jù)集經(jīng)歷的所有更新和修改,用于評估數(shù)據(jù)集的可靠性,確保其來源的完整性。元數(shù)據(jù)標準化服務(wù)不僅可以提高數(shù)據(jù)的可發(fā)現(xiàn)性和可訪問性,還有助于數(shù)據(jù)的管理、共享、保護和長期利用,是數(shù)據(jù)出版和科學研究中不可或缺的一環(huán)。[5]如Data Cite和Dublin Core等為數(shù)據(jù)集的描述提供了一套共通的規(guī)則,其元數(shù)據(jù)標準化服務(wù)使得研究者和機器都能夠理解和處理這些數(shù)據(jù)。
同時,數(shù)據(jù)倉庫通過提供穩(wěn)定的存儲基礎(chǔ)設(shè)施、促進數(shù)據(jù)開放獲取和共享、支持數(shù)據(jù)標準化和元數(shù)據(jù)管理,以及支持科學的可復(fù)現(xiàn)性,極大地促進了數(shù)據(jù)的持久存儲和共享。常見的數(shù)據(jù)倉庫,如Zenodo、Figshare和Dryad等,不僅為數(shù)據(jù)的長期存儲提供了解決方案,還提供了數(shù)據(jù)的組織、檢索和共享機制,允許研究者存儲和分享他們的數(shù)據(jù)集,確保數(shù)據(jù)能夠持久鏈接和引用。這些功能提高了數(shù)據(jù)價值,加速了科學知識的生成和傳播。
此外,開放獲取平臺克服了傳統(tǒng)出版機制中的授權(quán)壁壘與價格阻滯,[6]使得用戶能夠免費在線訪問數(shù)據(jù)集。當前,全球領(lǐng)先的科技出版商均積極推動與第三方數(shù)據(jù)平臺的合作,[7]國際上著名的科學數(shù)據(jù)期刊有Geoscience Data Journal、Scientific Data、CO-DATA's Data Science Journal等,國內(nèi)則包括《中國科學數(shù)據(jù)》《全球變化數(shù)據(jù)學報》等。[8]開放獲取平臺通過確保科學數(shù)據(jù)和研究成果的自由使用,推動科學知識的廣泛傳播、學術(shù)合作的加深以及研究創(chuàng)新的加速,對提升科學研究的質(zhì)量和數(shù)據(jù)出版的影響力產(chǎn)生了積極影響。
盡管如此,科學數(shù)據(jù)出版仍面臨許多挑戰(zhàn)??茖W數(shù)據(jù)的隱私、安全性以及與商業(yè)利益相關(guān)的敏感性等是當前的熱點問題,科學數(shù)據(jù)的標準化和質(zhì)量控制[9]仍需進一步加強。未來的研究可能會集中于開發(fā)更先進的元數(shù)據(jù)標準、提高數(shù)據(jù)倉庫的互操作性,以及探索新型科學數(shù)據(jù)共享模式等方面。
(3)政府治理層面的數(shù)據(jù)出版。政府數(shù)據(jù)的開放性增強了治理的透明度,有助于公民參與基于數(shù)據(jù)的政策制定。政府鼓勵研究人員和機構(gòu)利用開放數(shù)據(jù)進行產(chǎn)品和服務(wù)開發(fā),不僅推動了數(shù)據(jù)市場的發(fā)展,而且促進了數(shù)據(jù)出版領(lǐng)域的進步,如數(shù)據(jù)分析和可視化等方法得到應(yīng)用。[10]
盡管政府數(shù)據(jù)的開放性帶來了諸多好處,但用戶在訪問數(shù)據(jù)時也可能遇到障礙,如煩瑣的申請過程等。政府應(yīng)為開放數(shù)據(jù)平臺設(shè)計較為友好的用戶界面,簡化操作流程,優(yōu)化用戶體驗,促進數(shù)據(jù)流通。[11]為確保數(shù)據(jù)的質(zhì)量和易用性,還應(yīng)制定統(tǒng)一的數(shù)據(jù)開放標準,包括數(shù)據(jù)的可信性、[12]一致存在性和互操作性標準。[13]此外,政府公共數(shù)據(jù)面臨供給不足、安全風險和質(zhì)量不高等挑戰(zhàn),[14]這要求政府采用技術(shù)手段整合數(shù)據(jù),并注重數(shù)據(jù)安全與創(chuàng)新利用,以推動數(shù)據(jù)市場健康發(fā)展。
(4)教育發(fā)展中的數(shù)據(jù)出版。在教育領(lǐng)域,數(shù)據(jù)出版的目的是通過分析大量的教育相關(guān)數(shù)據(jù)評估學生的學習效果,并為教師改進教學方法提供建議。通過整合內(nèi)部資源數(shù)據(jù)與外部用戶數(shù)據(jù)建立大型數(shù)據(jù)庫,教育數(shù)據(jù)出版有助于促進出版業(yè)轉(zhuǎn)型,加快新產(chǎn)業(yè)和服務(wù)模式發(fā)展。依托大數(shù)據(jù)管理平臺,教育數(shù)據(jù)出版涵蓋了從數(shù)據(jù)采集、存儲、計算、分析、挖掘到可視化及應(yīng)用的全流程,[15]確保數(shù)據(jù)在不同平臺間互通共享,有利于資源供給精準化和運營決策智能化。
然而,當前中國教育數(shù)據(jù)領(lǐng)域面臨數(shù)據(jù)標準不一、質(zhì)量參差不齊及訪問權(quán)限模糊等問題,[16]造成了“數(shù)據(jù)孤島”現(xiàn)象。促進教育數(shù)據(jù)的整合和共享,一方面,需要統(tǒng)一數(shù)據(jù)標準,確保數(shù)據(jù)的質(zhì)量和安全;另一方面,需要提升從業(yè)人員的數(shù)據(jù)素養(yǎng),包括數(shù)據(jù)意識、知識、能力等。此外,教育數(shù)據(jù)出版商應(yīng)引入數(shù)據(jù)標簽系統(tǒng),對數(shù)據(jù)創(chuàng)建、使用、存儲、傳輸和銷毀等行為進行規(guī)范,確保教育數(shù)據(jù)發(fā)揮最大價值。通過這些措施,我們可以更好地利用教育數(shù)據(jù),推動教育個性化和智能化發(fā)展。
(5)商業(yè)創(chuàng)新方面的數(shù)據(jù)出版。近年來,企業(yè)通過數(shù)據(jù)出版與利益相關(guān)者進行互動,以促進產(chǎn)品和服務(wù)創(chuàng)新,這一模式越來越受到重視。許多先進企業(yè)已經(jīng)建立了數(shù)據(jù)中臺,[17]即利用大數(shù)據(jù)平臺和數(shù)據(jù)倉庫體系,依托統(tǒng)一的數(shù)據(jù)管理框架(如One Data體系)優(yōu)化數(shù)據(jù)處理流程,包括數(shù)據(jù)管理、分析、共享和服務(wù)。這不僅促進了企業(yè)內(nèi)部數(shù)據(jù)流通和價值實現(xiàn),而且通過數(shù)據(jù)共享和互通,優(yōu)化了政府治理。[18]
隨著整個社會數(shù)字化轉(zhuǎn)型的加速和人工智能技術(shù)的應(yīng)用,人們對數(shù)據(jù)安全性和傳輸效率的要求不斷提高。在這一背景下,區(qū)塊鏈技術(shù)憑借其安全、去中心化等特性,成為支持數(shù)據(jù)存儲、加密和分發(fā)的關(guān)鍵技術(shù),廣泛應(yīng)用于數(shù)字金融、物聯(lián)網(wǎng)和數(shù)字資產(chǎn)交易等領(lǐng)域。這使得相關(guān)企業(yè)認識到自身與數(shù)據(jù)出版進行協(xié)同發(fā)展的重要性,積極探索基于區(qū)塊鏈的新商業(yè)模式和價值共創(chuàng)方式。[19]
通過開放公共數(shù)據(jù),政府可以激勵企業(yè)共享數(shù)據(jù),形成有效的雙向數(shù)據(jù)流通機制,增強數(shù)據(jù)供給。這種模式不僅有助于釋放企業(yè)數(shù)據(jù)的潛力,而且為商業(yè)創(chuàng)新和政府治理能力提升提供了新途徑。因此,構(gòu)建一個基于數(shù)據(jù)共享和協(xié)作的生態(tài)系統(tǒng),對于激發(fā)商業(yè)創(chuàng)新和提高治理效能具有重要意義。
總體來看,盡管數(shù)據(jù)出版在不同領(lǐng)域面臨不同的挑戰(zhàn),但遵循FAIR數(shù)據(jù)原則——即數(shù)據(jù)的可發(fā)現(xiàn)性(Findable)、可訪問性(Accessible)、可互操作性(Interoperable)及可重用性(Reusable)[20]——是各領(lǐng)域的數(shù)據(jù)出版共同的核心。這些原則不僅能促進數(shù)據(jù)的有效管理和利用,也為應(yīng)對Web3.0時代帶來的變革奠定了基礎(chǔ)。
3. Web3.0時代數(shù)據(jù)出版的特征
Web3.0作為新一代互聯(lián)網(wǎng)技術(shù)的代表,預(yù)示著數(shù)據(jù)共享和信息交流方式的根本變革。因此,數(shù)據(jù)出版不再局限于發(fā)布數(shù)據(jù)本身,而是擴展到了數(shù)據(jù)的整個生命周期,包括創(chuàng)造、處理、分析、共享和保護等各個環(huán)節(jié)。這種全方位的管理要求來自不同領(lǐng)域的利益相關(guān)者共同協(xié)作,以形成適應(yīng)新時代新要求的標準、制度和政策。在此基礎(chǔ)上,結(jié)合FAIR數(shù)據(jù)原則,數(shù)據(jù)出版在Web3.0時代呈現(xiàn)出四個核心特征:開放共享(Openness and Sharing)、互操作性(Interoperability)、人機協(xié)同(Human-machine Collaboration)和去中心化(Decentralization),簡稱為OICD核心特征。
一是開放共享。數(shù)據(jù)出版的核心目標在于促進知識傳播和創(chuàng)新。實現(xiàn)這一目標需要多方面保障,包括確保個人和組織的利益得到保護、建立健全的制度框架、提供必要的基礎(chǔ)設(shè)施和資金支持等。[21]例如,科研數(shù)據(jù)的開放共享應(yīng)遵循透明的使用和引用規(guī)則,以促進學術(shù)合作和公眾參與。二是互操作性。為實現(xiàn)數(shù)據(jù)廣泛應(yīng)用,必須確保不同學科和領(lǐng)域之間的數(shù)據(jù)可以相互理解和使用。這需要標準化元數(shù)據(jù)和數(shù)據(jù)格式,以及能夠支持這些標準的工具和技術(shù)。[22]三是人機協(xié)同。隨著人工智能技術(shù)的發(fā)展,數(shù)據(jù)出版正越來越多地涉及人機合作模式,結(jié)合人類的創(chuàng)造力和機器的處理能力,共同推動知識的生成和創(chuàng)新。[23]例如,研究人員通過機器學習算法分析大規(guī)模數(shù)據(jù)集,可以發(fā)現(xiàn)新的模式和關(guān)聯(lián),開拓新的研究方向。四是去中心化。Web3.0的一個顯著特征是去中心化,這對數(shù)據(jù)出版意味著更分散的控制和管理模式。去中心化可以促進更廣泛的數(shù)據(jù)共享,但同時也帶來了數(shù)據(jù)質(zhì)量控制和隱私保護的挑戰(zhàn)。因此,需要新的技術(shù)和策略保障數(shù)據(jù)的安全和質(zhì)量,如采用區(qū)塊鏈技術(shù)確保數(shù)據(jù)的真實性和不可篡改性。
綜上所述,OICD核心特征共同定義了數(shù)據(jù)出版在Web3.0時代的新面貌,數(shù)據(jù)出版工作在保障開放共享的同時,也要關(guān)注數(shù)據(jù)的互操作性、人機合作的新模式,以及去中心化帶來的機遇和挑戰(zhàn)。
二、構(gòu)建數(shù)據(jù)出版生態(tài)系統(tǒng)的結(jié)構(gòu)模型
1. 數(shù)據(jù)出版生態(tài)系統(tǒng)的形成邏輯
在服務(wù)主導(dǎo)邏輯(Service Dominant Logic,SDL)框架下,企業(yè)不再單方面提出價值主張,而是與消費者互動,共同參與產(chǎn)品的創(chuàng)造和生產(chǎn)過程,從而實現(xiàn)價值共創(chuàng)。在這種互動模式中,消費者既是價值的創(chuàng)造者,也是與企業(yè)協(xié)同的生產(chǎn)者。隨著服務(wù)主導(dǎo)理念的進一步普及和發(fā)展,價值創(chuàng)造的過程越來越多地依賴企業(yè)與消費者之間的共同決策,價值共創(chuàng)的范疇也從單個交易擴展到整個服務(wù)系統(tǒng)。
這一服務(wù)系統(tǒng)不僅僅基于單一的買賣雙方交換,而是涵蓋多方參與者在廣泛的網(wǎng)絡(luò)中進行的服務(wù)交換,形成了一個復(fù)雜的服務(wù)生態(tài)系統(tǒng)。結(jié)合數(shù)據(jù)出版價值鏈中的主體關(guān)系,以及資源、服務(wù)和技術(shù)等關(guān)鍵要素,我們提出構(gòu)建數(shù)據(jù)出版生態(tài)系統(tǒng)的三個策略,即數(shù)據(jù)資源整合、數(shù)據(jù)服務(wù)關(guān)聯(lián)和技術(shù)應(yīng)用創(chuàng)新,進而構(gòu)建出數(shù)據(jù)出版生態(tài)系統(tǒng)模型(見圖1)。這一生態(tài)系統(tǒng)涉及八個關(guān)鍵要素:自發(fā)的感知與響應(yīng)能力、時間和空間的組織結(jié)構(gòu)、松散耦合、多元的價值主張主體、共通的語言、適合的制度和技術(shù)應(yīng)用、共同生產(chǎn)的服務(wù)以及互惠的服務(wù)和價值共創(chuàng)。[24]其核心目標是通過資源整合和共享,打破組織邊界,形成一個強大的價值共創(chuàng)網(wǎng)絡(luò),從而提高服務(wù)系統(tǒng)的適應(yīng)性和可持續(xù)性。
由此看來,在數(shù)據(jù)出版領(lǐng)域,建立基于資源整合的平臺成為開展服務(wù)生態(tài)系統(tǒng)共創(chuàng)活動的關(guān)鍵。這些平臺不僅促使不同參與者之間有效互動,而且通過整合資源解決了信息孤島問題,提供更高級別的知識服務(wù)。因此,數(shù)據(jù)出版的服務(wù)生態(tài)系統(tǒng)實質(zhì)上構(gòu)建了一個價值共創(chuàng)的框架,涵蓋了數(shù)據(jù)生產(chǎn)者、保有者、傳遞者、利用者和消費者等多個參與方。通過這些參與方動態(tài)、多層次的服務(wù)交換、數(shù)據(jù)資源整合、關(guān)聯(lián)服務(wù)以及技術(shù)創(chuàng)新互動,進一步優(yōu)化和提升了整個價值共創(chuàng)空間的能力。
2. 數(shù)據(jù)出版生態(tài)系統(tǒng)的關(guān)鍵策略
為適應(yīng)Web3.0時代的需求,數(shù)據(jù)資源整合、數(shù)據(jù)服務(wù)關(guān)聯(lián)和技術(shù)應(yīng)用創(chuàng)新三個策略共同支持一個高度互動、開放和自我維持的生態(tài)系統(tǒng),旨在促進數(shù)據(jù)出版領(lǐng)域服務(wù)創(chuàng)新和價值共創(chuàng)。
(1)數(shù)據(jù)資源整合。在Web3.0背景下,數(shù)據(jù)資源整合可通過去中心化的方法,利用區(qū)塊鏈技術(shù),在建立分布式存儲系統(tǒng),提高數(shù)據(jù)安全性和可靠性的同時,促進跨界合作,從而使數(shù)據(jù)資源的獲取、管理和利用變得更加高效和透明。例如,Mirror平臺利用Arweave網(wǎng)絡(luò)實現(xiàn)了數(shù)據(jù)內(nèi)容的去中心化存儲和驗證,為用戶提供數(shù)據(jù)控制權(quán),確保內(nèi)容的永久性和可訪問性。
(2)數(shù)據(jù)服務(wù)關(guān)聯(lián)。利用跨鏈技術(shù),數(shù)據(jù)服務(wù)關(guān)聯(lián)打破數(shù)據(jù)孤島,建立一個開放透明的數(shù)據(jù)服務(wù)網(wǎng)絡(luò),促進數(shù)據(jù)、價值、服務(wù)和知識自由流動,使不同參與者能夠在同一個平臺上協(xié)作創(chuàng)新。例如,AVAA平臺通過Metax API、IDA存儲和Fairdata Etsin等服務(wù),為用戶提供了一個綜合的數(shù)據(jù)服務(wù)體系,從數(shù)據(jù)傳輸?shù)酱鎯?、訪問和分析,都實現(xiàn)了高效協(xié)作和價值共創(chuàng)。
(3)技術(shù)應(yīng)用創(chuàng)新。去中心化技術(shù)、人工智能、機器學習等領(lǐng)域的創(chuàng)新,不僅提高了數(shù)據(jù)處理的效率,也為數(shù)據(jù)出版提供了新的價值創(chuàng)造機會。例如,Springer Nature的人工智能編輯工具,以及基于區(qū)塊鏈的智能合約技術(shù),都極大地提升了出版流程的自動化和智能化水平,為用戶帶來更加個性化和高質(zhì)量的服務(wù)。
通過實施上述三個策略,有望構(gòu)建一個強大靈活的數(shù)據(jù)出版生態(tài)系統(tǒng),在滿足現(xiàn)有數(shù)據(jù)管理和出版需求的同時,適應(yīng)未來技術(shù)和市場變化,促進整個行業(yè)持續(xù)進化和創(chuàng)新。
三、數(shù)據(jù)出版生態(tài)系統(tǒng)在Web3.0時代的發(fā)展路徑
在Web3.0時代,構(gòu)建一個繁榮的數(shù)據(jù)出版生態(tài)系統(tǒng)需要多方面努力和創(chuàng)新。為此,我們可以在開展跨領(lǐng)域數(shù)據(jù)監(jiān)管、建立多元化數(shù)據(jù)庫和發(fā)揮數(shù)據(jù)要素乘數(shù)效應(yīng)等方面探索發(fā)展路徑。
1. 協(xié)同式的組織實施:開展跨領(lǐng)域數(shù)據(jù)監(jiān)管
數(shù)字技術(shù)改變了行業(yè)邊界、組織協(xié)同方式,產(chǎn)生了新的共生空間、多主體的價值鏈接以及平臺效應(yīng),重構(gòu)了數(shù)字技術(shù)背景下的協(xié)同共生價值。因此,在數(shù)據(jù)出版生態(tài)中,可利用協(xié)同式管理措施提高出版效率。
針對國內(nèi)數(shù)據(jù)共享平臺中的數(shù)據(jù)使用及共享管理僅對本平臺負責,缺乏跨域、跨平臺的安全評估或監(jiān)管介入,存在對數(shù)據(jù)共享的監(jiān)管漏洞等情況,[25]尤其需要開展協(xié)同式的組織實施工作,組建跨領(lǐng)域的數(shù)據(jù)共享監(jiān)管責任團隊。這一團隊需要包括各領(lǐng)域的專家和來自各個相關(guān)平臺的代表,由其共同制定和執(zhí)行跨平臺的數(shù)據(jù)安全和共享規(guī)則,定期進行數(shù)據(jù)安全評估,確保數(shù)據(jù)安全和有效共享。同時,也需要建立一個跨平臺的數(shù)據(jù)共享監(jiān)管機制,實時監(jiān)控和管理數(shù)據(jù)流動,及時發(fā)現(xiàn)并處理可能出現(xiàn)的數(shù)據(jù)安全問題。例如,建立跨界的數(shù)據(jù)共享APIs,推動政策導(dǎo)向下的數(shù)據(jù)共享平臺建設(shè)。
在構(gòu)建Web3.0時代數(shù)據(jù)出版生態(tài)系統(tǒng)的過程中,各參與主體需站在一個新的起點上,面向更加開放、互聯(lián)、智能的未來,重新定義數(shù)據(jù)的價值和流動方式。Web3.0時代的數(shù)據(jù)出版不僅僅是技術(shù)的升級,更是跨領(lǐng)域、跨行業(yè)合作的深化,除技術(shù)領(lǐng)域的人才外,數(shù)據(jù)出版還需培養(yǎng)包括經(jīng)濟、社會、政治、法律等相關(guān)領(lǐng)域在內(nèi)的專業(yè)人才,以及具備團隊合作、溝通協(xié)調(diào)、創(chuàng)新思維和解決問題能力的綜合性人才,以更好適應(yīng)Web3.0時代數(shù)據(jù)出版領(lǐng)域需求。
2. 強有力的數(shù)據(jù)保障:建立多元化數(shù)據(jù)庫
面對數(shù)據(jù)出版的新需求和新模式,相關(guān)機構(gòu)應(yīng)采取相應(yīng)的對策措施,強化對數(shù)據(jù)資源的匯聚能力和保障能力,從提高數(shù)據(jù)供給水平、優(yōu)化數(shù)據(jù)流通環(huán)境和完善數(shù)據(jù)安全保障等方面,推動建立多元數(shù)據(jù)庫,實現(xiàn)數(shù)據(jù)出版物的高質(zhì)量開發(fā)。
(1)完善數(shù)據(jù)資源體系,提升數(shù)據(jù)供給水平。政府和企業(yè)要開放共享數(shù)據(jù),整合來自政府、企業(yè)、非營利組織及公眾等主體的數(shù)據(jù)資源,形成互補的數(shù)據(jù)集,提高社會數(shù)據(jù)資源價值。目前,隨著開放共享的科學數(shù)據(jù)出版逐步推進,國內(nèi)不少期刊出版單位、數(shù)據(jù)中心等機構(gòu)正積極探索新型數(shù)據(jù)出版方式以提升數(shù)據(jù)再利用價值。例如,《地球科學進展》雜志發(fā)出《數(shù)據(jù)論文關(guān)聯(lián)數(shù)據(jù)提交的倡議書》,呼吁所有錄用論文作者將論文支撐數(shù)據(jù)提交到公共數(shù)據(jù)平臺進行公共保存和開放共享,以增加科學數(shù)據(jù)的供給量。
(2)深化多項技術(shù)應(yīng)用,優(yōu)化數(shù)據(jù)流通環(huán)境。數(shù)據(jù)出版需要深化數(shù)據(jù)空間、隱私計算、聯(lián)邦學習、區(qū)塊鏈、數(shù)據(jù)沙箱等技術(shù)的應(yīng)用,打造安全可信的數(shù)據(jù)流通環(huán)境,促進數(shù)據(jù)合規(guī)高效流通和使用。例如,國家海洋科學數(shù)據(jù)開放共享隱私計算平臺利用區(qū)塊鏈和隱私計算技術(shù),搭建了一個海洋科學數(shù)據(jù)隱私計算框架,引入?yún)^(qū)塊鏈協(xié)同多方、可信數(shù)據(jù)流轉(zhuǎn)和存證審計等功能,通過對海洋數(shù)據(jù)、模型算法進行加密,為數(shù)據(jù)供給方、算法模型供給方和資源使用方提供多方協(xié)同的數(shù)據(jù)處理、模型應(yīng)用、產(chǎn)品制作等服務(wù),構(gòu)建安全的計算環(huán)境,做到全程留痕可溯,確保原始數(shù)據(jù)不出域,實現(xiàn)“數(shù)據(jù)可用不可見”。
(3)提供全面數(shù)據(jù)服務(wù),完善數(shù)據(jù)安全保障。為確保數(shù)據(jù)出版正常開展,有必要通過實施數(shù)據(jù)安全法規(guī),完善數(shù)據(jù)分級保護、落實網(wǎng)絡(luò)安全等級保護及強化關(guān)鍵信息基礎(chǔ)設(shè)施的安全管理,加強數(shù)據(jù)安全保障。例如,國家空間科學數(shù)據(jù)中心通過建立空間科學大數(shù)據(jù)基礎(chǔ)設(shè)施,提供數(shù)據(jù)存儲和獲取服務(wù),包括泛在數(shù)據(jù)檢索及應(yīng)用服務(wù),分級數(shù)據(jù)存儲、數(shù)據(jù)限期保護、受眾及流程審核等安全保護服務(wù)。此外,數(shù)據(jù)出版應(yīng)注重提供基于云端的數(shù)據(jù)安全服務(wù),提升數(shù)據(jù)安全水平。例如,科學研究領(lǐng)域的大數(shù)據(jù)云服務(wù)平臺融合了數(shù)據(jù)存儲、超級計算、云計算業(yè)務(wù),實現(xiàn)了跨學科數(shù)據(jù)的統(tǒng)一管理、分析處理和對外發(fā)布。在政府治理領(lǐng)域,政府數(shù)據(jù)開放平臺也完成了從Data.gov到Cloud.gov的基礎(chǔ)結(jié)構(gòu)遷移,全面實現(xiàn)政府開放數(shù)據(jù)云端部署,通過開源設(shè)計強化了安全技術(shù)應(yīng)用、提升了數(shù)據(jù)安全能力。
3. 負責任的科技創(chuàng)新:發(fā)揮數(shù)據(jù)要素乘數(shù)效應(yīng)
負責任的科技創(chuàng)新指與之相關(guān)的各類主體要保障科技倫理的可接受性,充分考慮行業(yè)、社會發(fā)展的可持續(xù)性,讓科學技術(shù)進步以適當?shù)姆绞角度霐?shù)據(jù)出版發(fā)展之中,為數(shù)據(jù)出版乃至整個社會的中長期穩(wěn)健發(fā)展負責。新質(zhì)生產(chǎn)力是科技創(chuàng)新發(fā)揮主導(dǎo)作用的生產(chǎn)力,能夠利用數(shù)據(jù)要素乘數(shù)效應(yīng),以“動力變革、質(zhì)量變革、效率變革”[26]推動數(shù)據(jù)出版高質(zhì)量發(fā)展。
(1)數(shù)據(jù)出版需要進行動力變革。當前,數(shù)據(jù)優(yōu)勢已從資源方面逐漸轉(zhuǎn)移到競爭方面,數(shù)據(jù)出版相關(guān)參與主體需要打造數(shù)據(jù)驅(qū)動型產(chǎn)品研發(fā)新模式,通過輸入多樣化和具有包容性的數(shù)據(jù)集,完善生成式人工智能技術(shù)與相關(guān)平臺,充分釋放數(shù)據(jù)乘數(shù)效應(yīng),體現(xiàn)商業(yè)、社會責任以及數(shù)據(jù)透明度,推動數(shù)據(jù)要素協(xié)同優(yōu)化、復(fù)用增效、融合創(chuàng)新,促進新質(zhì)生產(chǎn)力發(fā)展,為數(shù)據(jù)出版高質(zhì)量發(fā)展注入新動能。
(2)數(shù)據(jù)出版需要進行質(zhì)量變革。數(shù)據(jù)出版商可引入?yún)^(qū)塊鏈技術(shù),保障數(shù)據(jù)信息的準確性、可驗證性、可重復(fù)性,從而提高數(shù)據(jù)出版物的質(zhì)量。雖然區(qū)塊鏈作為基于點對點網(wǎng)絡(luò)運行的交易賬本技術(shù),能夠精簡數(shù)據(jù)出版中數(shù)據(jù)管理的中間環(huán)節(jié),強化數(shù)據(jù)管理主體的信任約束,驅(qū)動數(shù)據(jù)出版物的流通過程可追溯,破解數(shù)據(jù)質(zhì)量的困局。但需要注意的是,區(qū)塊鏈的應(yīng)用落地仍面臨諸多挑戰(zhàn)和未知風險,有待數(shù)據(jù)出版各參與主體深入研究和探索,共同構(gòu)建高質(zhì)量的數(shù)據(jù)出版生態(tài)。
(3)數(shù)據(jù)出版需要進行效率變革。不同主體數(shù)據(jù)、行業(yè)數(shù)據(jù)與其他要素協(xié)同,可以提高數(shù)據(jù)出版物的產(chǎn)出效率。數(shù)據(jù)出版相關(guān)參與主體需要關(guān)注各種科技創(chuàng)新成果的轉(zhuǎn)化和擴散,利用數(shù)字技術(shù)的溢出效應(yīng)和網(wǎng)絡(luò)協(xié)同效應(yīng),打造具有國際競爭力的數(shù)據(jù)出版產(chǎn)業(yè)集群。例如,數(shù)據(jù)出版商可通過搭建智能化平臺,促進各類數(shù)據(jù)要素發(fā)揮作用,實現(xiàn)各類數(shù)據(jù)采集終端的網(wǎng)絡(luò)化、全數(shù)據(jù)要素可視化等,推動數(shù)據(jù)出版智能化、網(wǎng)絡(luò)化、協(xié)同化生產(chǎn)。
此外,依循上述發(fā)展路徑,構(gòu)建一個開放、協(xié)同、高效的數(shù)據(jù)出版生態(tài)系統(tǒng),還需要大力開展跨學科合作,構(gòu)建靈活強大的數(shù)據(jù)治理框架,并確保負責任地使用新技術(shù)。面對Web3.0時代的挑戰(zhàn),這將推動數(shù)據(jù)出版向更開放、可持續(xù)的方向發(fā)展。
參考文獻:
[1] IDC.聚焦快速發(fā)展的數(shù)據(jù)軟件市場:分布式關(guān)系型數(shù)據(jù)庫與商業(yè)智能軟件研究報告啟動[EB/OL].[2023-12-05].https://www.idc.com/getdoc.jsp?containerId=prCHC50718123.
[2] 衣彩天. 數(shù)據(jù)出版的功能、應(yīng)用、流程與未來[J]. 出版發(fā)行研究,2020(9):19-25,89.
[3] 邁克爾·波特. 競爭優(yōu)勢[M]. 陳小悅,譯. 北京:華夏出版社,1997:35-38.
[4] 張新新. 生成式智能出版:知識生成原理、沿革與啟迪——從智慧驅(qū)動到數(shù)據(jù)驅(qū)動[J]. 編輯之友,2023(11):36-44.
[5] 高瑜蔚,朱艷華,孔麗華,等. 數(shù)據(jù)論文及關(guān)聯(lián)科學數(shù)據(jù)集出版元數(shù)據(jù)標準研究[J]. 中國科技期刊研究,2023,34(10):1270-1282.
[6] 彭飛. 試論開放獲取出版背景下的圖書館信息資源建設(shè)[J]. 河南圖書館學刊,2023,43(11):118-120.
[7] 徐麗芳,鄒青,周伊,等. 在博弈中邁向開放科學:2022年海外科技期刊出版與數(shù)據(jù)出版盤點[J]. 科技與出版,2023(3):36-49.
[8] 溫亮明,郭蕾,王曉東,等. 基于關(guān)聯(lián)規(guī)則的國內(nèi)外數(shù)據(jù)期刊載文特征比較分析——以《Scientific Data》和《中國科學數(shù)據(jù)》為例[J]. 情報科學,2019,37(1):112-121.
[9] 涂志芳. 科學數(shù)據(jù)出版生態(tài)系統(tǒng)與質(zhì)量控制體系構(gòu)建[J]. 圖書與情報,2019(1):125-134.
[10] 張會平,馬太平. 城市全面數(shù)字化轉(zhuǎn)型中數(shù)據(jù)要素跨界流動:四種模式、推進邏輯與創(chuàng)新路徑[J]. 電子政務(wù),2022(5):56-68.
[11] 司曉. 數(shù)據(jù)要素市場呼喚數(shù)據(jù)治理新規(guī)則[J]. 圖書與情報,2020(3):7-8.
[12] 歐陽日輝. 數(shù)據(jù)要素流通的制度邏輯[J]. 人民論壇·學術(shù)前沿,2023(6):13-27.
[13] 黃如花. 我國政府數(shù)據(jù)開放共享標準體系構(gòu)建[J]. 圖書與情報,2020(3):17-19.
[14] IDC. 探索數(shù)據(jù)要素市場——IDC發(fā)布數(shù)字政府公共數(shù)據(jù)授權(quán)運營市場分析[EB/OL].[2024-03-22].https://www. idc. com/getdoc. jsp?containerId=prCHC51982524.
[15] 危珊,高俊. 教育大數(shù)據(jù)的平臺構(gòu)建與關(guān)鍵實現(xiàn)技術(shù)研究[J]. 信息與電腦(理論版),2021,33(21):254-256.
[16] 王正青,但金鳳. 大數(shù)據(jù)時代教育大數(shù)據(jù)治理架構(gòu)與關(guān)鍵領(lǐng)域——以美國肯塔基州、華盛頓州與馬里蘭州為例[J]. 現(xiàn)代教育技術(shù),2019,29(2):5-11.
[17] 張弛. 數(shù)據(jù)中臺賦能出版頭部企業(yè)多元業(yè)務(wù)發(fā)展研究[J]. 出版科學,2022,30(6):90-99.
[18] 胡元聰,徐媛. 企業(yè)向政府共享數(shù)據(jù)的法律激勵問題及創(chuàng)新路徑[J]. 陜西師范大學學報(哲學社會科學版),2024,53(1):134-147.
[19] 資武成,方卿. 大數(shù)據(jù)時代數(shù)字出版企業(yè)的價值共創(chuàng)研究[J]. 出版科學,2016,24(4):27-32.
[20] Wilkinson M, Dumontier M, Aalbersberg I, et al. The FAIR Guiding Principles for Scientific Data Management and Stewardship[J]. Scientific Data, 2016(3): 167-172.
[21] 上海市哲學社會科學規(guī)劃辦公室. 開放科學環(huán)境下的科學數(shù)據(jù)開放共享機制與對策研究[EB/OL].[2024-03-15].http://www.sh-popss.gov.cn/newsInfo.asp?idval=7778.
[22] 盧逸航,李國慶,陳祖剛. 科學數(shù)據(jù)中心間互操作模式研究[J]. 數(shù)據(jù)與計算發(fā)展前沿,2022,4(1):69-83.
[23] 侯曉麗,趙需要,周慶山,等. 政府開放數(shù)據(jù)生態(tài)鏈價值共創(chuàng)機理與節(jié)點優(yōu)化策略研究[J]. 情報理論與實踐,2024(5):1-13.
[24] Vargo S L, Lusch R F. From Repeat Patronage to Value Co-creation in Service Ecosystems: A Transcending Conceptualization of Relationship[J]. Journal of Business Market Management, 2010, 4(4): 169-179.
[25] 宋筱璇,王延飛,鐘燦濤. 國內(nèi)外科研數(shù)據(jù)安全管理政策比較研究[J]. 情報理論與實踐,2016,39(11):10-16.
[26] 范軍,鄒開元,田靜瑤. 新質(zhì)生產(chǎn)力推動出版業(yè)高質(zhì)量發(fā)展的理論邏輯、價值意蘊、實踐要求[J]. 科技與出版,2024(3):1-6.
Data Publishing in the Web3.0 Era: A New Ecological Construction of Co-Creation and Collaboration
ZHOU Rong-ting(Provincial Key Laboratory of Science Education and Communication, University of Science and Technology of China, Hefei 230026, China)
Abstract: The Web3.0 era has the characteristics of paying more attention to the intelligence, decentralization, privacy protection and the right of users to master data. In the publishing ecology, data has also become the key production factors and strategic resources to enhance the publishing competitiveness. These have changed the way traditional knowledge is produced, discovered and disseminated, and driven the shift of paradigm to data-driven publishing. Based on this, the scope, boundary, attribute characteristics and participants of data publishing are clarified by making comparison with digital publishing. The service ecosystem theory is adopted to build a data publishing service ecosystem adapted to different links of the value chain and demand scenarios of different value chains including such key elements as interaction of subjects, integration of data resources, correlation of data services and technological application innovation. In order to provide reference for the sustainable development of the data publishing ecosystem, the author puts forward the development strategy of co-creation and cooperation.
Key words: data publishing; data-driven; intelligent-driven; service ecosystem; publishing ecology