国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

出版數(shù)據(jù)產(chǎn)品化:出版數(shù)據(jù)要素價(jià)值釋放的關(guān)鍵*?

2024-11-06 00:00:00辛諫黃馨月孫瑾劉愛民
數(shù)字出版研究 2024年4期

摘 要:在簡要分析數(shù)字出版和數(shù)據(jù)出版、數(shù)字出版產(chǎn)品與數(shù)據(jù)出版產(chǎn)品的區(qū)別與聯(lián)系的基礎(chǔ)上,本文提出“數(shù)據(jù)出版產(chǎn)品,是指出版單位對(duì)作品、版權(quán)素材、排版文件等原始數(shù)據(jù)采用特定算法,經(jīng)過數(shù)據(jù)挖掘而形成的二次數(shù)據(jù)、衍生數(shù)據(jù)、可視化數(shù)據(jù),具備統(tǒng)計(jì)、分析、預(yù)測、預(yù)警等功能”,界定了出版數(shù)據(jù)產(chǎn)品化的基本內(nèi)涵,即“從出版原始數(shù)據(jù)到出版數(shù)據(jù)產(chǎn)品的過程”,明確了出版數(shù)據(jù)產(chǎn)品化是出版數(shù)據(jù)資源到出版數(shù)據(jù)資產(chǎn)的關(guān)鍵步驟,是調(diào)用數(shù)據(jù)資源、發(fā)展數(shù)據(jù)出版業(yè)態(tài)的樞紐環(huán)節(jié)。出版數(shù)據(jù)產(chǎn)品化的基本流程包括出版數(shù)據(jù)采集、存儲(chǔ)、分類、分級(jí)、清洗、標(biāo)引、計(jì)算與建模及新數(shù)據(jù)生成等。對(duì)出版數(shù)據(jù)產(chǎn)品化所面臨的問題及應(yīng)對(duì)路徑進(jìn)行思考和分析,有助于推動(dòng)出版數(shù)據(jù)產(chǎn)品化的健康發(fā)展,為出版業(yè)注入新的活力和動(dòng)力。

關(guān)鍵詞:數(shù)據(jù)出版產(chǎn)品;數(shù)字出版產(chǎn)品;出版數(shù)據(jù)要素;出版數(shù)據(jù)產(chǎn)品化;出版數(shù)據(jù)資產(chǎn);出版數(shù)據(jù)資源

DOI: 10.3969/j.issn.2097-1869.2024.04.004 文獻(xiàn)標(biāo)識(shí)碼:A

著錄格式:辛諫,黃馨月,孫瑾,等.出版數(shù)據(jù)產(chǎn)品化:出版數(shù)據(jù)要素價(jià)值釋放的關(guān)鍵[J].數(shù)字出版研究,2024,3(4):30-37.

數(shù)據(jù)時(shí)代的標(biāo)志是數(shù)據(jù)成為社會(huì)基礎(chǔ)資源和經(jīng)濟(jì)活動(dòng)的要素,成為比土地、資本、勞動(dòng)力等更核心的要素,甚至被比作“石油”“新能源”[1]。隨著數(shù)據(jù)成為關(guān)鍵生產(chǎn)要素和數(shù)字經(jīng)濟(jì)發(fā)展中的基礎(chǔ)資源和戰(zhàn)略性資源,數(shù)據(jù)的重要性與日俱增,數(shù)據(jù)要素在國民經(jīng)濟(jì)各行各業(yè)的應(yīng)用場景不斷涌現(xiàn),出版業(yè)也不例外。

數(shù)字出版的概念界定往往強(qiáng)調(diào)技術(shù)創(chuàng)新、科技創(chuàng)新,無論是“二進(jìn)制說”“數(shù)字技術(shù)說”還是“全媒體說”,三種學(xué)術(shù)流派都在強(qiáng)調(diào)技術(shù)創(chuàng)新對(duì)出版的賦能及催生出版新形態(tài),都在突出出版技術(shù)進(jìn)步催生了數(shù)字出版,數(shù)字技術(shù)賦能是數(shù)字出版的特有屬性。這種思維本身并無大礙,但對(duì)數(shù)字出版的概念界定都缺乏對(duì)“數(shù)據(jù)”“數(shù)據(jù)要素”的考量,涵括力和科學(xué)性有待提升。依據(jù)這種思維,數(shù)字出版屬于出版技術(shù)創(chuàng)新而非產(chǎn)業(yè)創(chuàng)新,而只有變革出版業(yè)底層生產(chǎn)要素,才可能推動(dòng)出版產(chǎn)業(yè)創(chuàng)新,只有“內(nèi)容要素不斷走向數(shù)據(jù)化,推動(dòng)出版內(nèi)容數(shù)據(jù)的產(chǎn)品化與資產(chǎn)化運(yùn)營”[2],才會(huì)逐步形成出vJcJScpJzvvFxnuQT47bflBdL6BDkaq2d9kLGsUPwEc=版數(shù)據(jù)產(chǎn)品的新形態(tài)。鑒于此,可對(duì)數(shù)字出版概念進(jìn)一步修正,即“數(shù)字出版是以數(shù)據(jù)為關(guān)鍵要素,以數(shù)字技術(shù)賦能為特有屬性的新型出版”。

由此繼續(xù)引發(fā)一個(gè)新問題,數(shù)字出版和數(shù)據(jù)出版之間是什么關(guān)系?數(shù)據(jù)在數(shù)字出版發(fā)展歷程中處于基礎(chǔ)但關(guān)鍵的地位,數(shù)字出版以數(shù)據(jù)為加工對(duì)象,并在出版內(nèi)容數(shù)據(jù)、用戶數(shù)據(jù)、交互數(shù)據(jù)、管理和服務(wù)數(shù)據(jù)的基礎(chǔ)上形成;數(shù)字技術(shù)原理的發(fā)揮、數(shù)字技術(shù)在出版業(yè)不同場景的應(yīng)用,都以出版數(shù)據(jù)為基礎(chǔ),同時(shí)數(shù)字技術(shù)的應(yīng)用又進(jìn)一步促進(jìn)了出版數(shù)據(jù)要素的開發(fā)和利用。

1 數(shù)字出版與數(shù)據(jù)出版的關(guān)系

數(shù)字出版與數(shù)據(jù)出版,是既有關(guān)聯(lián)又不同的兩個(gè)概念。首先,數(shù)字出版的外延大于數(shù)據(jù)出版。數(shù)據(jù)出版是數(shù)字出版題中應(yīng)有之義,但并非所有的數(shù)字出版都是數(shù)據(jù)出版,例如,“出版數(shù)字化”所催生出來的數(shù)字出版產(chǎn)品、資源等就不屬于數(shù)據(jù)出版的范疇。其次,數(shù)據(jù)出版是數(shù)字出版發(fā)展的新階段。從數(shù)字技術(shù)發(fā)展水平來看,智能出版是“智能化數(shù)字技術(shù)賦能”[3]的數(shù)字出版發(fā)展的高級(jí)階段;而從生產(chǎn)要素創(chuàng)新的視角來看,數(shù)據(jù)出版則是數(shù)字出版發(fā)展的新定位,因其在出版業(yè)原有的土地、資本、勞動(dòng)力等傳統(tǒng)要素基礎(chǔ)之上,引入了數(shù)據(jù)這一新的生產(chǎn)要素。最后,數(shù)字出版指向出版技術(shù)創(chuàng)新,而數(shù)據(jù)出版則指向出版產(chǎn)業(yè)創(chuàng)新。數(shù)字技術(shù)賦能出版的力度、深度、寬度和厚度有限,換言之,技術(shù)要素對(duì)出版業(yè)的滲透效應(yīng)是“有限滲透”,而數(shù)據(jù)要素對(duì)出版業(yè)的滲透效應(yīng)是“無限滲透”,出版數(shù)據(jù)要素乘數(shù)效應(yīng)、溢出效應(yīng)、反饋效應(yīng)的發(fā)揮,將推動(dòng)出版業(yè)進(jìn)行產(chǎn)業(yè)創(chuàng)新而非止步于技術(shù)創(chuàng)新。數(shù)據(jù)出版與數(shù)字出版的關(guān)系是一個(gè)值得深刻探討的學(xué)術(shù)議題,囿于篇幅所限和主題設(shè)定,本文不再作過多闡述,僅聚焦“數(shù)據(jù)出版產(chǎn)品”這一出版數(shù)據(jù)要素價(jià)值釋放的關(guān)鍵因素,在分析其與“數(shù)字出版產(chǎn)品”區(qū)別與聯(lián)系的基礎(chǔ)上,探討數(shù)據(jù)出版產(chǎn)品、出版數(shù)據(jù)產(chǎn)品化的內(nèi)涵、要素、流程及路徑。

為防止概念混淆,并為不同學(xué)科背景、不同知識(shí)域的讀者提供對(duì)比視角,筆者對(duì)“科學(xué)數(shù)據(jù)出版”這一概念加以簡析。2013年前后,隨著大數(shù)據(jù)對(duì)各學(xué)科、行業(yè)的影響,科學(xué)數(shù)據(jù)出版這一概念被提出,其雛形是“為論文評(píng)審提供依據(jù)、促進(jìn)數(shù)據(jù)再次利用、期刊要求作者于文章正式發(fā)表前公開有關(guān)數(shù)據(jù)”[4]。據(jù)此邏輯,數(shù)字時(shí)代的數(shù)據(jù)出版,是指“在互聯(lián)網(wǎng)上公開數(shù)據(jù),并且支持除數(shù)據(jù)提供者之外的研究人員或者組織機(jī)構(gòu)下載、分析、再利用及引用數(shù)據(jù)”[5],廣義上講,“任何將數(shù)據(jù)上傳到互聯(lián)網(wǎng)或者數(shù)據(jù)庫并支持開放獲取的行為都可以被稱為‘?dāng)?shù)據(jù)出版’”[6]。有學(xué)者從“遵循傳統(tǒng)學(xué)術(shù)出版內(nèi)涵和基于互聯(lián)網(wǎng)開放精神”[7]的視角,歸納了科學(xué)數(shù)據(jù)出版的兩類內(nèi)涵:一是圍繞科研數(shù)據(jù)展開并與出版相關(guān)的活動(dòng);二是運(yùn)用互聯(lián)網(wǎng)進(jìn)行科學(xué)數(shù)據(jù)發(fā)布。就其本質(zhì)而言,科學(xué)數(shù)據(jù)出版是“數(shù)據(jù)化的科學(xué)技術(shù)資源公開或共享,其基本流程是數(shù)據(jù)創(chuàng)作—數(shù)據(jù)投稿—數(shù)據(jù)審核—數(shù)據(jù)傳播”[8]。由此,本文認(rèn)為科學(xué)數(shù)據(jù)出版是數(shù)據(jù)出版的一種形態(tài),是“以數(shù)據(jù)為關(guān)鍵要素的出版”在科學(xué)數(shù)據(jù)領(lǐng)域的應(yīng)用,其對(duì)數(shù)據(jù)出版的概念界定沒有上升到生產(chǎn)要素的高度,而是從數(shù)據(jù)對(duì)出版作用、數(shù)據(jù)在互聯(lián)網(wǎng)發(fā)布、科學(xué)數(shù)據(jù)開放共享的角度進(jìn)行詮釋和概括;其誕生的背景是大數(shù)據(jù)的提出、大數(shù)據(jù)技術(shù)的應(yīng)用和賦能,而本文所述的數(shù)據(jù)出版則立足于數(shù)據(jù)作為新生產(chǎn)要素和關(guān)鍵生產(chǎn)要素這一時(shí)代背景。

2 數(shù)字出版產(chǎn)品與數(shù)據(jù)出版產(chǎn)品的異同分析

在界定數(shù)據(jù)出版產(chǎn)品之前,須先明確數(shù)據(jù)產(chǎn)品的定義。廣義上認(rèn)為,數(shù)據(jù)產(chǎn)品是指原始數(shù)據(jù)、數(shù)據(jù)原材料經(jīng)過“粗加工”之后形成的“數(shù)據(jù)集”[1]和經(jīng)過“精加工”形成的數(shù)據(jù)挖掘服務(wù)、二次數(shù)據(jù)、衍生數(shù)據(jù)、可視化數(shù)據(jù)產(chǎn)品等。數(shù)據(jù)庫、數(shù)據(jù)平臺(tái)、數(shù)據(jù)決策等[9]都屬于數(shù)據(jù)產(chǎn)品的范疇。狹義上認(rèn)為,數(shù)據(jù)產(chǎn)品界定有4個(gè)標(biāo)準(zhǔn)[10]:(1)經(jīng)過算法智力勞動(dòng)投入(可視化的內(nèi)容、性質(zhì)屬于二次數(shù)據(jù)、衍生數(shù)據(jù));(2)經(jīng)過數(shù)據(jù)脫敏化處理,獨(dú)立于用戶對(duì)信息的控制;(3)具有排他性,無法被其他市場主體有限、無償使用;(4)無法被公開獲取。因此,數(shù)據(jù)產(chǎn)品是“網(wǎng)絡(luò)運(yùn)營者通過合法手段獲取到原始數(shù)據(jù),對(duì)原始數(shù)據(jù)采用一定的算法,經(jīng)過深度的分析過濾、提煉整合及脫敏處理后而形成的具有交換價(jià)值和技術(shù)可行性的衍生數(shù)據(jù),數(shù)據(jù)產(chǎn)品具有一定的表達(dá)性,即能夠通過衍生數(shù)據(jù)的內(nèi)容為使用者提供預(yù)測、指數(shù)、統(tǒng)計(jì)等方面的服務(wù)”[10]。換言之,簡單加工的匯集整理、數(shù)據(jù)集、數(shù)據(jù)庫等未經(jīng)“算法”之力而通過勞動(dòng)加工生產(chǎn)的數(shù)字產(chǎn)品并非數(shù)據(jù)產(chǎn)品。

據(jù)此,可以認(rèn)為數(shù)據(jù)出版產(chǎn)品(或曰出版數(shù)據(jù)產(chǎn)品)也可按廣義和狹義來界定。

廣義的數(shù)據(jù)出版產(chǎn)品,指應(yīng)用數(shù)字技術(shù)進(jìn)行內(nèi)容編輯加工并通過網(wǎng)絡(luò)進(jìn)行傳播的出版產(chǎn)品,其主要特征是內(nèi)容生產(chǎn)數(shù)字化、內(nèi)容呈現(xiàn)數(shù)字化、產(chǎn)品形態(tài)數(shù)字化和傳播渠道數(shù)字化。簡言之,凡是數(shù)字技術(shù)賦能出版的產(chǎn)品,或凡是以數(shù)據(jù)為載體和形態(tài)的出版產(chǎn)品,皆為數(shù)據(jù)出版產(chǎn)品。廣義的數(shù)據(jù)出版產(chǎn)品包括電子書、數(shù)字圖書館、專題數(shù)據(jù)庫、可視化數(shù)據(jù)、二次數(shù)據(jù)等,原因是其調(diào)用了出版業(yè)的內(nèi)容數(shù)據(jù)資源,同時(shí)應(yīng)用了數(shù)智化的技術(shù),是內(nèi)容要素和技術(shù)要素的結(jié)合,是文化子系統(tǒng)和技術(shù)子系統(tǒng)的融合,是數(shù)據(jù)要素和技術(shù)要素協(xié)同的結(jié)果。

狹義的數(shù)據(jù)出版產(chǎn)品,指出版單位對(duì)作品、版權(quán)素材、排版文件等原始數(shù)據(jù)采用特定算法,經(jīng)過數(shù)據(jù)挖掘而形成的二次數(shù)據(jù)、衍生數(shù)據(jù)、可視化數(shù)據(jù),具備統(tǒng)計(jì)、分析、預(yù)測、預(yù)警等功能(后文如無特指,本文采取狹義定義)。其僅僅是數(shù)字出版產(chǎn)品的一部分,多以趨勢圖、統(tǒng)計(jì)圖、占比圖、指數(shù)圖等可視化數(shù)據(jù)形式呈現(xiàn),或提供數(shù)據(jù)解決方案、輔助支持決策的數(shù)據(jù)服務(wù)等。狹義上看,出版業(yè)的作品素材、版權(quán)素材、排版文件、非數(shù)字化的數(shù)據(jù)等不能稱為數(shù)據(jù)產(chǎn)品,而僅僅是出版業(yè)的原始數(shù)據(jù)或數(shù)據(jù)原材料;電子書、數(shù)字圖書館、一般意義上的專題數(shù)據(jù)庫、數(shù)據(jù)集也不能稱為數(shù)據(jù)產(chǎn)品,其沒有經(jīng)過算法的投入、數(shù)據(jù)的挖掘和分析,僅僅是出版業(yè)數(shù)據(jù)資源“‘量’的集聚而非‘質(zhì)’的改變”[11]。

作為內(nèi)容產(chǎn)業(yè)、文化產(chǎn)業(yè)及意識(shí)形態(tài)主陣地的數(shù)據(jù)出版產(chǎn)品,與其他行業(yè)的數(shù)據(jù)產(chǎn)品相比還有其特殊性:其一,出版業(yè)數(shù)據(jù)產(chǎn)品的本質(zhì)是知識(shí)或近似知識(shí);其二,大部分?jǐn)?shù)據(jù)產(chǎn)品帶有意識(shí)形態(tài)屬性;其三,出版業(yè)數(shù)據(jù)產(chǎn)品往往承擔(dān)著文化的生產(chǎn)、傳播和傳承功能,具備文化屬性;其四,出版業(yè)數(shù)據(jù)產(chǎn)品的內(nèi)容往往來源于出版物,或者出版物的內(nèi)容占首要地位。

3 出版數(shù)據(jù)產(chǎn)品化的內(nèi)涵與意義

從出版原始數(shù)據(jù)到出版數(shù)據(jù)產(chǎn)品,即數(shù)據(jù)出版產(chǎn)品的形成過程,要經(jīng)過出版數(shù)據(jù)產(chǎn)品化的過程。

3.1 出版數(shù)據(jù)產(chǎn)品化的基本內(nèi)涵

數(shù)據(jù)要素的生成,要經(jīng)過“原始數(shù)據(jù)到數(shù)據(jù)資源、數(shù)據(jù)資源到數(shù)據(jù)產(chǎn)品、數(shù)據(jù)產(chǎn)品到數(shù)據(jù)資產(chǎn)、數(shù)據(jù)資產(chǎn)到數(shù)據(jù)要素”[12]的過程。數(shù)據(jù)產(chǎn)品是承上啟下的關(guān)鍵步驟,解決了原始數(shù)據(jù)、數(shù)據(jù)資源的歸屬問題,同時(shí)也為數(shù)據(jù)資產(chǎn)的認(rèn)定評(píng)估與入表、為數(shù)據(jù)要素的形成奠定了牢固的基礎(chǔ)。

出版原始數(shù)據(jù)到出版數(shù)據(jù)資源的躍升,一是要具備使用價(jià)值,有用性是出版數(shù)據(jù)資源的前提和基礎(chǔ);二是要經(jīng)過數(shù)字化階段,進(jìn)行數(shù)據(jù)收集、清洗、分析和挖掘等處理過程,以數(shù)字化形式進(jìn)行描述、記錄、呈現(xiàn)和表達(dá)。

出版數(shù)據(jù)資源到出版數(shù)據(jù)產(chǎn)品的演化,用戶需求、數(shù)智技術(shù)和應(yīng)用場景是關(guān)鍵要素。出版數(shù)據(jù)產(chǎn)品通常具有明確的目標(biāo)用戶、應(yīng)用場景和使用價(jià)值,如數(shù)據(jù)報(bào)告、數(shù)據(jù)應(yīng)用工具、數(shù)據(jù)接口等。

3.2 出版數(shù)據(jù)產(chǎn)品化的意義

出版數(shù)據(jù)產(chǎn)品化是出版業(yè)數(shù)據(jù)價(jià)值演進(jìn)的基礎(chǔ),是出版業(yè)數(shù)據(jù)要素潛能激發(fā)和價(jià)值釋放的關(guān)鍵。數(shù)據(jù)產(chǎn)品化是出版業(yè)深度數(shù)字化轉(zhuǎn)型升級(jí)的關(guān)鍵一環(huán),它將數(shù)據(jù)要素作為核心資產(chǎn),通過產(chǎn)品化的方式實(shí)現(xiàn)數(shù)據(jù)要素價(jià)值的深度挖掘和全面釋放,將“死數(shù)據(jù)”變?yōu)椤盎顢?shù)據(jù)”。

第一,供給高質(zhì)量的出版數(shù)據(jù)產(chǎn)品,發(fā)展數(shù)據(jù)出版業(yè)新業(yè)務(wù)。出版數(shù)據(jù)產(chǎn)品化的直接目的是研發(fā)出版數(shù)據(jù)產(chǎn)品,與應(yīng)用大數(shù)據(jù)、大語言模型、生成式人工智能等數(shù)智技術(shù)要素相融合,對(duì)出版數(shù)據(jù)進(jìn)行計(jì)算、賦能和應(yīng)用,打造高質(zhì)量出版數(shù)據(jù)產(chǎn)品或提供高品質(zhì)出版數(shù)據(jù)服務(wù)。如江蘇鳳凰出版?zhèn)髅郊瘓F(tuán)通過“上云用數(shù)賦智”,圍繞平臺(tái)、知識(shí)服務(wù)、新媒體、電商數(shù)據(jù)服務(wù)等方向,面向不同用戶開發(fā)高質(zhì)量的個(gè)性化線上服務(wù)產(chǎn)品,2023年數(shù)字經(jīng)濟(jì)收入規(guī)模約31億元,其中包含數(shù)據(jù)服務(wù)2.7億元[13];又如中華醫(yī)學(xué)會(huì)雜志社近年推出的垂直化產(chǎn)品中華醫(yī)學(xué)全文數(shù)據(jù)庫、中華醫(yī)學(xué)知識(shí)庫及智能化的全流程數(shù)字出版平臺(tái)等。

第二,創(chuàng)新數(shù)據(jù)出版業(yè)態(tài),豐富出版深度融合發(fā)展新模式。數(shù)據(jù)賦能模式,是指“基于數(shù)據(jù)型賦能理念的出版深度融合發(fā)展,應(yīng)用和配置數(shù)據(jù)無形生產(chǎn)要素,提高全要素生產(chǎn),以推進(jìn)出版業(yè)效率型增長、質(zhì)變型增長”[14]。出版數(shù)據(jù)產(chǎn)品化是推動(dòng)數(shù)據(jù)出版業(yè)態(tài)發(fā)展,形成出版業(yè)數(shù)據(jù)賦能模式的關(guān)鍵步驟,唯有供給高質(zhì)量、大規(guī)模的出版數(shù)據(jù)產(chǎn)品服務(wù),大力推進(jìn)數(shù)據(jù)出版市場化、產(chǎn)業(yè)化發(fā)展,才可能穩(wěn)定和深化數(shù)據(jù)出版業(yè)態(tài),豐富和驗(yàn)證出版數(shù)據(jù)賦能模式。

第三,促進(jìn)出版數(shù)據(jù)要素潛能釋放,推動(dòng)出版數(shù)據(jù)要素價(jià)值實(shí)現(xiàn)。出版數(shù)據(jù)產(chǎn)品化是數(shù)據(jù)要素價(jià)值釋放的關(guān)鍵路徑,在數(shù)據(jù)產(chǎn)品化的基礎(chǔ)上,推動(dòng)出版數(shù)據(jù)資源流通,通過數(shù)據(jù)交易、共享和開放,將數(shù)據(jù)轉(zhuǎn)化成經(jīng)濟(jì)價(jià)值和社會(huì)效益,可以有效緩解出版業(yè)數(shù)據(jù)流通不暢、質(zhì)量不高和規(guī)模受限等問題。

第四,完善出版要素市場體系,加快出版數(shù)據(jù)要素市場化配置。出版數(shù)據(jù)產(chǎn)品化催生了對(duì)出版數(shù)據(jù)要素的新需求,要求數(shù)據(jù)具備更高的類型多樣性、質(zhì)量標(biāo)準(zhǔn)、數(shù)量和規(guī)模,這有助于推動(dòng)出版業(yè)數(shù)據(jù)要素市場體系的健全與完善。

第五,協(xié)同促進(jìn)數(shù)智技術(shù)賦能,提升全要素生產(chǎn)率。出版業(yè)全要素生產(chǎn)率,是指除出版業(yè)資本、勞動(dòng)力要素以外對(duì)出版經(jīng)濟(jì)增長起作用的新興無形要素,包括數(shù)智技術(shù)、出版數(shù)據(jù)及出版人力資本等[15]。出版數(shù)據(jù)產(chǎn)品化是發(fā)揮出版數(shù)據(jù)要素乘數(shù)效應(yīng)的前提和基礎(chǔ)。出版數(shù)據(jù)要素通過與數(shù)智技術(shù)要素的融合,賦能出版業(yè)生產(chǎn)、制作、分配和消費(fèi)各環(huán)節(jié),數(shù)據(jù)驅(qū)動(dòng)的協(xié)同配套、優(yōu)化組合和精準(zhǔn)匹配,有利于提升出版業(yè)全要素生產(chǎn)率。

因此,出版數(shù)據(jù)產(chǎn)品化不僅是對(duì)數(shù)據(jù)要素價(jià)值的直接利用,更是出版業(yè)創(chuàng)新和轉(zhuǎn)型的基礎(chǔ),它推動(dòng)出版業(yè)從傳統(tǒng)的出版模式向數(shù)字化、智能化、服務(wù)化方向發(fā)展,實(shí)現(xiàn)數(shù)據(jù)要素價(jià)值的全面釋放和出版業(yè)的可持續(xù)發(fā)展。

4 出版數(shù)據(jù)產(chǎn)品化的基本流程

出版數(shù)據(jù)產(chǎn)品化的基本流程由數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分類、數(shù)據(jù)分級(jí)、數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)引、數(shù)據(jù)計(jì)算與建模及新數(shù)據(jù)生成等基本環(huán)節(jié)所組成。

4.1 出版數(shù)據(jù)采集

出版業(yè)數(shù)據(jù)采集是出版數(shù)據(jù)產(chǎn)品化的首要環(huán)節(jié),需要從多個(gè)渠道獲取數(shù)據(jù),并確保數(shù)據(jù)的質(zhì)量、安全和合規(guī)。通過科學(xué)合理的采集方法和工具,可以獲取高質(zhì)量的出版數(shù)據(jù)資源,為后續(xù)的數(shù)據(jù)加工、分析和應(yīng)用奠定基礎(chǔ)。

4.1.1 數(shù)據(jù)來源

出版業(yè)數(shù)據(jù)按照來源可分為存量數(shù)據(jù)、在制數(shù)據(jù)和增量數(shù)據(jù)。存量數(shù)據(jù)是指將現(xiàn)有出版資源進(jìn)行數(shù)字化加工,如將圖書、期刊、報(bào)紙等紙質(zhì)資源進(jìn)行掃描、識(shí)別、轉(zhuǎn)換而形成的數(shù)字化版本,將錄音帶、錄像帶、光盤等音視頻資源進(jìn)行數(shù)字化轉(zhuǎn)換而形成的數(shù)字音視頻文件等。在制數(shù)據(jù)是指生產(chǎn)過程中產(chǎn)生的數(shù)據(jù),包括但不限于編輯稿、校對(duì)稿、設(shè)計(jì)稿、審稿意見等,這些數(shù)據(jù)在出版流程中不斷更新和迭代,是出版物從策劃到成品過程中的關(guān)鍵信息。增量數(shù)據(jù)是指在原有數(shù)據(jù)基礎(chǔ)上新增或更新的數(shù)據(jù),增量數(shù)據(jù)的管理對(duì)于保持?jǐn)?shù)據(jù)的時(shí)效性和準(zhǔn)確性至關(guān)重要。

對(duì)于數(shù)據(jù)出版產(chǎn)品建設(shè)而言,存量數(shù)據(jù)建設(shè)是基礎(chǔ),在制數(shù)據(jù)建設(shè)是關(guān)鍵,增量數(shù)據(jù)建設(shè)是突破口。出版行業(yè)數(shù)字化轉(zhuǎn)型過程中應(yīng)更高效地管理和利用這些數(shù)據(jù),實(shí)現(xiàn)出版數(shù)據(jù)資源的深度開發(fā)和多形態(tài)利用。

4.1.2 數(shù)據(jù)分類

出版業(yè)數(shù)據(jù)分類標(biāo)準(zhǔn)應(yīng)側(cè)重科學(xué)性和實(shí)用性,數(shù)據(jù)分類有利于出版數(shù)據(jù)產(chǎn)品的類型化開發(fā),有利于明確各類數(shù)據(jù)資源的應(yīng)用場景,有利于出版數(shù)據(jù)要素的充分開發(fā)利用,同時(shí)也有利于出版業(yè)數(shù)據(jù)產(chǎn)品的精細(xì)化治理。一直以來,按照出版內(nèi)容數(shù)據(jù)、用戶數(shù)據(jù)、交互數(shù)據(jù)及治理數(shù)據(jù)進(jìn)行分類,是出版數(shù)據(jù)分類建設(shè)中重要性和認(rèn)可度較高的方法。“內(nèi)容數(shù)據(jù)、用戶數(shù)據(jù)、交互數(shù)據(jù)”[16]的分類,來源為原國家新聞出版廣電總局?jǐn)?shù)字出版司為新聞出版業(yè)“十三五”時(shí)期發(fā)展專門組織的大數(shù)據(jù)技術(shù)應(yīng)用預(yù)研究報(bào)告,華東師范大學(xué)出版社、人民法院出版社、知識(shí)產(chǎn)權(quán)出版社、貴州出版集團(tuán)等頭部數(shù)字出版企業(yè)的出版數(shù)據(jù)建設(shè)進(jìn)程,都按照這種基本三分法開展數(shù)據(jù)出版活動(dòng)。

內(nèi)容數(shù)據(jù)是出版行業(yè)的核心數(shù)據(jù)類型,包括圖書、期刊、文章的核心信息,包含內(nèi)容屬性的元數(shù)據(jù)等,其對(duì)內(nèi)容的檢索、分類和推廣至關(guān)重要,是研發(fā)出版數(shù)據(jù)產(chǎn)品的戰(zhàn)略性資源;用戶數(shù)據(jù)包括用戶個(gè)人信息和行為數(shù)據(jù);交互數(shù)據(jù)記錄了用戶在平臺(tái)上的各種行為,對(duì)實(shí)現(xiàn)個(gè)性化推薦、精準(zhǔn)營銷、用戶畫像學(xué)者畫像構(gòu)建、精準(zhǔn)傳播等具有重要意義,是明確用戶需求、支持出版數(shù)據(jù)產(chǎn)品研發(fā)決策、推動(dòng)出版數(shù)據(jù)產(chǎn)品精準(zhǔn)營銷的重要資源;治理數(shù)據(jù)是出版企業(yè)內(nèi)部管理數(shù)據(jù),包括財(cái)務(wù)數(shù)據(jù)、人力資源數(shù)據(jù)、供應(yīng)鏈數(shù)據(jù)等,是提升企業(yè)管理和服務(wù)水平的重要決策依據(jù)和參考。不同類型的數(shù)據(jù)在出版行業(yè)的不同環(huán)節(jié)、階段發(fā)揮不同作用,通過精細(xì)化管理和深度分析,最大程度凸顯出版業(yè)數(shù)據(jù)的價(jià)值,推動(dòng)出版業(yè)的產(chǎn)業(yè)創(chuàng)新。

4.1.3 數(shù)據(jù)分級(jí)

數(shù)據(jù)分級(jí)在出版業(yè)務(wù)中是確保數(shù)據(jù)安全與合規(guī)的重要步驟,它基于數(shù)據(jù)對(duì)業(yè)務(wù)影響的嚴(yán)重程度進(jìn)行分類,包括核心、重要和一般出版數(shù)據(jù)。核心出版數(shù)據(jù)一旦泄露或受損,將對(duì)出版公司的聲譽(yù)、財(cái)務(wù)狀況和法律地位造成嚴(yán)重影響。因此,核心數(shù)據(jù)需要最高級(jí)別的保護(hù),包括加密存儲(chǔ)、嚴(yán)格訪問控制和定期安全審計(jì)。市場分析報(bào)告、銷售數(shù)據(jù)、庫存信息等重要出版數(shù)據(jù)對(duì)出版業(yè)務(wù)也有顯著影響,但程度略低于核心數(shù)據(jù),重要出版數(shù)據(jù)的泄露或損失可能影響49982b07dd7441e8fcba2ee1669dd046決策質(zhì)量、市場響應(yīng)速度和客戶滿意度,因此需要中等級(jí)別的保護(hù),如數(shù)據(jù)備份、合理的訪問權(quán)限設(shè)置和定期的安全檢查。一般出版數(shù)據(jù)對(duì)出版業(yè)務(wù)的影響較小,包括過期的出版物信息、非敏感的員工培訓(xùn)資料等,可以采用較低級(jí)別的安全措施,如基本的防病毒軟件和防火墻保護(hù)。

通過數(shù)據(jù)分級(jí),出版機(jī)構(gòu)可以明確數(shù)據(jù)產(chǎn)品化的禁止范圍和允許范圍,更有效地分配出版數(shù)據(jù)資源,在確保數(shù)據(jù)安全的同時(shí)合理控制成本。

4.2 出版數(shù)據(jù)存儲(chǔ)

出版機(jī)構(gòu)可獨(dú)立存儲(chǔ)出版數(shù)據(jù),確保其處于可控、安全、不受威脅的狀態(tài)。但獨(dú)立存儲(chǔ)的成本相對(duì)較高,較高等級(jí)的安全保護(hù),安全的物理環(huán)境、通信網(wǎng)絡(luò)、制度構(gòu)建、運(yùn)營維護(hù)及人員配置必不可少。出版機(jī)構(gòu)也可將外部數(shù)據(jù)交由第三方機(jī)構(gòu)存儲(chǔ),采用云存儲(chǔ)方式。云存儲(chǔ)成本更低、安全系數(shù)更高,日益成為出版機(jī)構(gòu)存儲(chǔ)數(shù)據(jù)的首選。

4.3 出版數(shù)據(jù)加工

數(shù)據(jù)加工是出版數(shù)據(jù)處理流程中的關(guān)鍵和核心,為數(shù)據(jù)分析和應(yīng)用提供可靠基礎(chǔ)。出版數(shù)據(jù)加工包括數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)引、數(shù)據(jù)計(jì)算與建模、產(chǎn)品封裝、新數(shù)據(jù)生成等步驟。

出版數(shù)據(jù)清洗,要對(duì)所采集的出版數(shù)據(jù)資源進(jìn)行“去粗取精、去偽存真”的審查和校驗(yàn)。確定缺失值范圍、刪除不必要字段、填充缺失內(nèi)容等是出版數(shù)據(jù)清洗的主要內(nèi)容,而主要任務(wù)是提高出版數(shù)據(jù)質(zhì)量,確保數(shù)據(jù)完整、一致、有效。

出版數(shù)據(jù)標(biāo)引是將數(shù)據(jù)與相關(guān)的元數(shù)據(jù)或標(biāo)簽關(guān)聯(lián)起來的過程,這一步驟對(duì)數(shù)據(jù)的組織、檢索和分析非常關(guān)鍵,特別是在人工智能和機(jī)器學(xué)習(xí)領(lǐng)域,通過數(shù)據(jù)標(biāo)引可為訓(xùn)練模型提供更加準(zhǔn)確的結(jié)構(gòu)數(shù)據(jù)。出版業(yè)常用的兩種標(biāo)引方式為知識(shí)標(biāo)引和時(shí)間標(biāo)引。知識(shí)標(biāo)引是將知識(shí)內(nèi)容與元數(shù)據(jù)或標(biāo)簽相關(guān)聯(lián)的過程,在數(shù)字化時(shí)代,知識(shí)標(biāo)引有助于提高知識(shí)資源的可發(fā)現(xiàn)性和可重用性,特別是在構(gòu)建知識(shí)圖譜和智能搜索引擎時(shí),知識(shí)標(biāo)引涉及文獻(xiàn)、數(shù)據(jù)庫記錄、網(wǎng)絡(luò)資源等多種類型的知識(shí)內(nèi)容,通過對(duì)這些內(nèi)容進(jìn)行細(xì)粒度分析和描述,可以進(jìn)一步實(shí)現(xiàn)對(duì)知識(shí)的精細(xì)化管理和利用。時(shí)間標(biāo)引是指對(duì)文檔、檔案或其他信息資源的形成或相關(guān)時(shí)間點(diǎn)進(jìn)行標(biāo)注的過程,在檔案管理和信息檢索系統(tǒng)中,時(shí)間標(biāo)引有助于用戶根據(jù)時(shí)間線索快速定位到相關(guān)信息。例如,江蘇鳳凰科學(xué)技術(shù)出版社以圖書《中國運(yùn)河志》為基礎(chǔ)建設(shè)的運(yùn)河專題數(shù)據(jù)庫“數(shù)字中國·大運(yùn)河知識(shí)服務(wù)平臺(tái)”,就包含時(shí)空年表和專題圖譜的內(nèi)容展示。

出版數(shù)據(jù)計(jì)算與建模是建立在數(shù)據(jù)標(biāo)引的基礎(chǔ)上所進(jìn)行的出版數(shù)據(jù)資源的關(guān)聯(lián)、計(jì)算、挖掘等工作,為形成二次數(shù)據(jù)、衍生數(shù)據(jù),以及出版數(shù)據(jù)可視化做準(zhǔn)備。數(shù)據(jù)計(jì)算包括聚類分析、分類分析、同領(lǐng)域關(guān)聯(lián)和跨領(lǐng)域關(guān)聯(lián)等,數(shù)據(jù)計(jì)算還要對(duì)出版數(shù)據(jù)資源進(jìn)行統(tǒng)計(jì)和推理,包括描述統(tǒng)計(jì)、預(yù)測分析和推斷統(tǒng)計(jì)。例如,重慶出版集團(tuán)基于“安全閱讀云”構(gòu)建的“一站式數(shù)字資產(chǎn)運(yùn)營管理平臺(tái)”,實(shí)現(xiàn)了數(shù)字資源一站使用、數(shù)據(jù)規(guī)范可管可控、數(shù)字資產(chǎn)全盤可見,為出版行業(yè)創(chuàng)新應(yīng)用和知識(shí)體系的構(gòu)建持續(xù)提供有力的技術(shù)支撐,為智慧出版的選題策劃及IP孵化提供科學(xué)而精準(zhǔn)的數(shù)據(jù)支撐。

新數(shù)據(jù)生成是出版數(shù)據(jù)產(chǎn)品化的最后一個(gè)步驟,即發(fā)現(xiàn)數(shù)據(jù)背后的數(shù)據(jù)、知識(shí)背后的知識(shí),最為常見的即數(shù)據(jù)可視化,其應(yīng)用范圍廣泛且具有高度延展性。文生文、文生圖、文生音頻、文生視頻等是基于大模型技術(shù)所實(shí)現(xiàn)的出版二次數(shù)據(jù)生成的最新模式和趨勢。

4.4 出版數(shù)據(jù)治理

出版數(shù)據(jù)治理是指對(duì)數(shù)據(jù)資產(chǎn)管理行使權(quán)力和控制的活動(dòng)集合,包括組織、制度、流程、工具等管理體系。數(shù)據(jù)治理的目標(biāo)是保留安全且易于訪問的高質(zhì)量數(shù)據(jù),以獲得更深入的業(yè)務(wù)洞察,并支持大數(shù)據(jù)和數(shù)字化轉(zhuǎn)型工作。數(shù)據(jù)治理的實(shí)施涉及數(shù)據(jù)質(zhì)量管理、數(shù)據(jù)安全策略、數(shù)據(jù)合規(guī)性、數(shù)據(jù)架構(gòu)優(yōu)化和數(shù)據(jù)文化建設(shè)等多個(gè)方面,主要包括數(shù)據(jù)安全治理、數(shù)據(jù)質(zhì)量治理和數(shù)據(jù)合規(guī)治理。

數(shù)據(jù)安全治理是指確保數(shù)據(jù)處于有效保護(hù)和合法利用的狀態(tài),以及具備保障持續(xù)安全狀態(tài)的能力。數(shù)據(jù)安全的重要性在于保護(hù)個(gè)人隱私、商業(yè)秘密和國家安全,維護(hù)數(shù)據(jù)處理的全過程安全,以及促進(jìn)數(shù)據(jù)的高效流通和合理有效利用。此外,數(shù)據(jù)安全治理的創(chuàng)新治理思路和方法也在不斷發(fā)展,以適應(yīng)數(shù)據(jù)要素市場化配置改革的需求。

數(shù)據(jù)質(zhì)量治理是指確保數(shù)據(jù)滿足特定業(yè)務(wù)需求和標(biāo)準(zhǔn)的程度,涉及數(shù)據(jù)的準(zhǔn)確性、完整性、一致性、及時(shí)性、唯一性、有效性和可追溯性等多個(gè)維度。數(shù)據(jù)質(zhì)量治理包括對(duì)數(shù)據(jù)質(zhì)量的監(jiān)控、評(píng)估、改進(jìn)和保證,旨在通過計(jì)劃實(shí)施和控制質(zhì)量管理技術(shù)提升數(shù)據(jù)的適用性和價(jià)值。

數(shù)據(jù)合規(guī)治理是指企業(yè)或組織在收集、存儲(chǔ)、處理和傳輸數(shù)據(jù)的過程中,須遵守相關(guān)法律、法規(guī)和標(biāo)準(zhǔn)的要求,確保出版數(shù)據(jù)的合法性、安全性和隱私保護(hù)。數(shù)據(jù)合規(guī)治理可以促進(jìn)數(shù)據(jù)的合法利用和發(fā)展,減少或盡量避免因違規(guī)操作而產(chǎn)生的法律風(fēng)險(xiǎn)和經(jīng)濟(jì)損失?!毒W(wǎng)絡(luò)數(shù)據(jù)安全管理?xiàng)l例》的擬制定將進(jìn)一步細(xì)化和補(bǔ)充現(xiàn)有的數(shù)據(jù)合規(guī)治理上位法,增強(qiáng)數(shù)據(jù)安全法律體系的完備性和可操作性。

5 出版數(shù)據(jù)產(chǎn)品化的新挑戰(zhàn)與實(shí)踐路徑

出版數(shù)據(jù)要素市場化程度,滯后于傳統(tǒng)出版要素市場化程度,也滯后于數(shù)字經(jīng)濟(jì)、數(shù)字出版發(fā)展。就出版數(shù)據(jù)產(chǎn)品化而言,數(shù)據(jù)質(zhì)量、數(shù)據(jù)安全、數(shù)據(jù)處理、數(shù)量流通等各環(huán)節(jié),都尚有較大的欠缺。

5.1 出版數(shù)據(jù)質(zhì)量問題與路徑選擇

出版數(shù)據(jù)dUsSRGIw8QQRoO0y/mQqKOIbS6RWvIJuA3IWgnZtrRI=資源大部分屬于知識(shí),這本是出版數(shù)據(jù)質(zhì)量的優(yōu)勢所在,但落后的生產(chǎn)方式、低效的生產(chǎn)及數(shù)據(jù)化進(jìn)程嚴(yán)重影響了出版數(shù)據(jù)質(zhì)量。數(shù)據(jù)質(zhì)量問題會(huì)直接影響出版數(shù)據(jù)產(chǎn)品的準(zhǔn)確性、可靠性和可用性。數(shù)據(jù)質(zhì)量治理面臨數(shù)據(jù)來源多樣、數(shù)據(jù)量龐大、數(shù)據(jù)處理復(fù)雜、數(shù)據(jù)更新頻繁等諸多挑戰(zhàn),對(duì)此,亟待建立一套完整的出版業(yè)數(shù)據(jù)質(zhì)量治理流程,包括數(shù)據(jù)質(zhì)量度量、數(shù)據(jù)質(zhì)量分析、數(shù)據(jù)質(zhì)量問題的識(shí)別、解決,以及持續(xù)監(jiān)控與改進(jìn)。

5.2 出版數(shù)據(jù)安全問題與路徑選擇

隨著數(shù)據(jù)規(guī)模的擴(kuò)大和數(shù)據(jù)流轉(zhuǎn)共享的增加,數(shù)據(jù)安全面臨數(shù)據(jù)承載邊界的開放性、大數(shù)據(jù)中心數(shù)據(jù)關(guān)系的多維交叉,以及數(shù)據(jù)擁有權(quán)、使用權(quán)和管理權(quán)分離等問題。為了應(yīng)對(duì)這些挑戰(zhàn),需要加快對(duì)數(shù)據(jù)資源梳理、數(shù)據(jù)庫加密、數(shù)據(jù)安全運(yùn)維、數(shù)據(jù)脫敏和數(shù)據(jù)庫漏掃等技術(shù)的應(yīng)用,推動(dòng)建立數(shù)據(jù)分類分級(jí)保護(hù)體系,完善數(shù)據(jù)安全監(jiān)測發(fā)現(xiàn)和應(yīng)急處置體系。2024年最新發(fā)布的《數(shù)據(jù)安全治理白皮書6.0》強(qiáng)調(diào)了數(shù)據(jù)安全治理的重要性,并提出數(shù)據(jù)分類分級(jí)、數(shù)據(jù)安全評(píng)估、場景化管控等創(chuàng)新治理思路,在促進(jìn)數(shù)據(jù)價(jià)值釋放的同時(shí)保護(hù)個(gè)人信息安全。

5.3 出版數(shù)據(jù)處理能力問題與路徑選擇

出版數(shù)據(jù)處理能力問題主要指處理大量數(shù)據(jù)時(shí)遇到的技術(shù)挑戰(zhàn),包括數(shù)據(jù)的存儲(chǔ)、計(jì)算、分析和可視化等。為進(jìn)一步強(qiáng)化出版數(shù)據(jù)處理能力,須不斷優(yōu)化數(shù)據(jù)出版編輯崗位設(shè)置、數(shù)據(jù)處理工具軟件購置、出版數(shù)據(jù)應(yīng)用場景創(chuàng)新等方面,為出版數(shù)據(jù)處理營造良好環(huán)境,提供配套措施。

5.4 出版數(shù)據(jù)流通效率問題與路徑選擇

出版數(shù)據(jù)流通效率問題是指在數(shù)據(jù)的傳輸、交換和共享過程中,數(shù)據(jù)流動(dòng)的速度和順暢度不足可能會(huì)導(dǎo)致數(shù)據(jù)價(jià)值無法及時(shí)實(shí)現(xiàn),影響數(shù)據(jù)資源的有效利用。為了提高數(shù)據(jù)流通效率,可以采取以下措施:第一,建立規(guī)范、高效的數(shù)據(jù)交易場所,增進(jìn)買賣雙方的信任,減少爭議,同時(shí)有助于發(fā)現(xiàn)數(shù)據(jù)的公允價(jià)值,使數(shù)據(jù)便于追溯和監(jiān)管。第二,研制合理的出版數(shù)據(jù)交易規(guī)則,包括數(shù)據(jù)交易前的登記標(biāo)準(zhǔn)、合規(guī)性審查和審計(jì)辦法,以及交易中的安全傳輸和交易成本降低措施。第三,引導(dǎo)多樣化交易所共同發(fā)展,形成國家級(jí)、區(qū)域性和行業(yè)性數(shù)據(jù)交易市場層級(jí),促進(jìn)數(shù)據(jù)的自由流動(dòng)。第四,推動(dòng)出版數(shù)據(jù)標(biāo)準(zhǔn)化體系建設(shè),確立數(shù)據(jù)產(chǎn)品的通用技術(shù)標(biāo)準(zhǔn)和安全標(biāo)準(zhǔn)體系,確保數(shù)據(jù)交易安全合規(guī)。第五,優(yōu)化出版數(shù)據(jù)流通政策,確保數(shù)據(jù)流通符合政策要求,探索如“原始數(shù)據(jù)不出域、數(shù)據(jù)可用不可見”的數(shù)據(jù)交易新范式。

6 結(jié)語

出版數(shù)據(jù)產(chǎn)品化是出版業(yè)發(fā)展的必然趨勢。以出版數(shù)據(jù)為關(guān)鍵要素的數(shù)據(jù)出版,是出版業(yè)高質(zhì)量發(fā)展的必然要求,也是推動(dòng)出版深度融合發(fā)展、構(gòu)建全媒體出版?zhèn)鞑ンw系的重要著力點(diǎn)。以出版業(yè)數(shù)據(jù)要素價(jià)值的實(shí)現(xiàn)為出發(fā)點(diǎn),通過出版數(shù)據(jù)產(chǎn)品化,豐富出版業(yè)勞動(dòng)對(duì)象,釋放出版業(yè)數(shù)據(jù)要素價(jià)值。通過加強(qiáng)數(shù)據(jù)質(zhì)量控制、完善數(shù)據(jù)版權(quán)保護(hù)機(jī)制、推進(jìn)數(shù)據(jù)標(biāo)準(zhǔn)化和互操作性及拓展數(shù)據(jù)出版產(chǎn)品形式等策略措施的實(shí)施,可以推動(dòng)出版數(shù)據(jù)產(chǎn)品化的健康發(fā)展,為出版業(yè)注入新的活力和動(dòng)力。典型的出版數(shù)據(jù)產(chǎn)品有哪些?出版數(shù)據(jù)產(chǎn)品如何交易流通?出版數(shù)據(jù)資產(chǎn)如何認(rèn)定評(píng)估與入表?這些問題將接踵而來,尚需業(yè)界和學(xué)界展開探討和研究。

作者簡介

辛諫,男,博士,上海理工大學(xué)出版學(xué)院、數(shù)字文明研究院教授、博士生導(dǎo)師。研究方向:數(shù)字出版、人工智能、文化管理與服務(wù)。

黃馨月,女,上海理工大學(xué)出版學(xué)院、數(shù)字文明研究院碩士研究生。研究方向:數(shù)字出版。

孫瑾,女,新疆人民出版社數(shù)字出版部部長,副編審。研究方向:數(shù)字出版、出版運(yùn)營管理。

劉愛民,男,重慶出版集團(tuán)有限公司辦公室主任。研究方向:數(shù)字出版、數(shù)據(jù)出版、出版大數(shù)據(jù)。

參考文獻(xiàn)

高富平.數(shù)據(jù)生產(chǎn)理論:數(shù)據(jù)資源權(quán)利配置的基礎(chǔ)理論[J].交大法學(xué),2019(4):5-19.

李子星,張新新,李佰玨.數(shù)字出版十大學(xué)術(shù)熱點(diǎn)分析:2023年度數(shù)字出版研究盤點(diǎn)[J].科技與出版,2024(4):99-111.

張新新,齊江蕾.智能出版述評(píng):概念、邏輯與形態(tài)[J].出版廣角,2021(13):21-25.

吳立宗,王亮緒,南卓銅,等.科學(xué)數(shù)據(jù)出版現(xiàn)狀及其體系框架[J].遙感技術(shù)與應(yīng)用,2013,28(3):383-390.

HEY T,TANSLEY S,TOLLE K.The fourth paradigm:Data-intensive scientific discovery[M].Redmond: Microsoft Research,2009:176.

PENEV L, MIETCHEN D, CHAVAN V, et al. Pensoft data publishing policies and guidelines for biodiversity data[EB/OL].(2013-12-10)[2024-09-29].https://pensoft.net/J_FILES/Pensoft_Data_Publishing_Policies_and_Guidelines.pdf.

邱春艷.國內(nèi)外科學(xué)數(shù)據(jù)出版理論研究述評(píng)[J].中國科技期刊研究,2019,30(3):271-279.

馬天一.科學(xué)數(shù)據(jù)出版面臨的風(fēng)險(xiǎn)隱患及其治理對(duì)策[J].情報(bào)雜志,2023,42(12):168-179.

龍衛(wèi)球.數(shù)據(jù)新型財(cái)產(chǎn)權(quán)構(gòu)建及其體系研究[J].政法論壇,2017,35(4):63-77.

李曉珊.數(shù)據(jù)產(chǎn)品的界定和法律保護(hù)[J].法學(xué)論壇,2022(5):122-131.

毛立琦.數(shù)據(jù)產(chǎn)品保護(hù)路徑探究:基于數(shù)據(jù)產(chǎn)品利益格局分析[J].財(cái)經(jīng)法學(xué),2020(2):94-109.

張夏恒,馮曉宇.數(shù)據(jù)要素乘數(shù)效應(yīng)的邏輯解構(gòu)與實(shí)現(xiàn)進(jìn)路[J].長安大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2024,26(3):91-102.

蘇雁.江蘇鳳凰出版?zhèn)髅郊瘓F(tuán):數(shù)字化催生產(chǎn)業(yè)新增長點(diǎn)[N].光明日?qǐng)?bào),2024-05-29(9).

付文綺,張新新.出版深度融合發(fā)展:內(nèi)涵、機(jī)理、模式與路徑分析[J].出版發(fā)行研究,2023(1):7,15-21.

張新新,周穎燕.新質(zhì)生產(chǎn)力提升出版業(yè)全要素生產(chǎn)率的內(nèi)涵意蘊(yùn)、理論機(jī)理與策略構(gòu)建[J].上海理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2024,46(4):339-348.

國家新聞出版廣電總局?jǐn)?shù)字出版司.新聞出版業(yè)科技十三五時(shí)期發(fā)展規(guī)劃預(yù)研究成果匯編[M].北京:中國書籍出版社,2015:103-104.

Publishing Data Productization: Key to Unlocking Value of Publishing Data Elements

XIN Jian1,2, HUANG Xinyue1,2, SUN Jin3, LIU Aimin4

1. College of Publishing, University of Shanghai for Science and Technology, 200093, Shanghai, China; 2. Institute of Digital Civilization, University of Shanghai for Science and Technology, 200093, Shanghai, China; 3. Digital Publishing Department, Xinjiang People’s Publishing House, 830049, Urumqi, China; 4. Chongqing Publishing Group, 400061, Chongqing, China

Abstract: On the basis of briefly analyzing the difference and connection between digital publishing and data publishing, digital publishing products and data publishing products, this study put forward that, data publishing 4ed5adc8c6feddec784e53de8772d7bfc866744517238238ce6a99988580afd1products refered to the secondary data, derivative data and visualization data formed by publishers through data mining by adopting specific algorithms on original data of the works, copyrighted materials, typesetting files, etc. Basic connotation of publishing data productization was defined as “the process from publishing original data to publishing data products”. It was clarified that publishing data productization is the key of transforming publishing data resources to data assets, and is the pivotal link in calling data resources and developing data publishing industry. The basic process of publishing data productization included publishing data collection, storage, categorization, classification, cleaning, citation, calculation, modeling and generation. Thinking and analyzing problems faced by publishing data productization and paths to deal with can help healthily develop publishing data productization and inject new vitality into the publishing industry.

Keywords: Data publishing product; Digital publishing product; Publishing data element; Publishing data productization; Publishing data asset; Publishing data resource

南投县| 天津市| 盖州市| 普陀区| 新和县| 襄汾县| 宁南县| 新巴尔虎左旗| 渑池县| 克拉玛依市| 陆良县| 奇台县| 平山县| 普兰店市| 尼勒克县| 尚志市| 安陆市| 宿州市| 衡阳市| 宜阳县| 克山县| 武定县| 邵武市| 卢湾区| 通州区| 从江县| 晋江市| 敦化市| 隆昌县| 库尔勒市| 北碚区| 布尔津县| 福鼎市| 绵竹市| 博客| 德安县| 田东县| 岳池县| 甘德县| 满城县| 威信县|