楊 丹
云南漫畫派對雜志社有限公司
大數(shù)據(jù)在當(dāng)下出版中的應(yīng)用研究
楊 丹
云南漫畫派對雜志社有限公司
當(dāng)前,隨著科學(xué)技術(shù)的發(fā)展,大數(shù)據(jù)技術(shù)應(yīng)用到了各個(gè)方面。對于出版行業(yè)而言,大數(shù)據(jù)在出版流程中打造了環(huán)形閉合式結(jié)構(gòu),貫穿從選題策劃、內(nèi)容生產(chǎn)、編排制作到營銷推廣的所有環(huán)節(jié)。因此,對于國內(nèi)出版?zhèn)髅狡髽I(yè)要盡快實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型,要結(jié)合自身實(shí)際做好大數(shù)據(jù)應(yīng)用規(guī)劃,借助大數(shù)據(jù)來推動企業(yè)流程的變革和業(yè)務(wù)模式的創(chuàng)新?;诖耍恼戮痛髷?shù)據(jù)在當(dāng)下出版中的應(yīng)用進(jìn)行簡要的分析,希望可以提供一個(gè)借鑒。
大數(shù)據(jù);出版;應(yīng)用
目前對于大數(shù)據(jù)(Bigdata)并無統(tǒng)一的定義,互聯(lián)網(wǎng)上對其普遍定義為:大數(shù)據(jù)或稱巨量數(shù)據(jù)、海量數(shù)據(jù)、大資料,指的是所涉及的數(shù)據(jù)量規(guī)模巨大到無法通過人工,在合理時(shí)間內(nèi)截取、管理、處理,并整理成為人類所能解讀的信息。大數(shù)據(jù)有四大主要特點(diǎn),可以歸納為4個(gè)V,包括Volume(數(shù)據(jù)體量大)、Variety(數(shù)據(jù)類型繁多)、Velocity(處理速度快)、Value(價(jià)值密度低)。
在大數(shù)據(jù)時(shí)代,如何挖掘和深入利用如此多的數(shù)據(jù),這就涉及大數(shù)據(jù)技術(shù)的運(yùn)用。大數(shù)據(jù)的利用過程可以簡單地分為大數(shù)據(jù)采集、大數(shù)據(jù)預(yù)處理、大數(shù)據(jù)存儲及管理、大數(shù)據(jù)分析、大數(shù)據(jù)應(yīng)用、大數(shù)據(jù)安全等幾個(gè)方面,其中最重要的莫過于大數(shù)據(jù)的分析。準(zhǔn)確的數(shù)據(jù)分析是數(shù)據(jù)應(yīng)用前提,也是大數(shù)據(jù)得以實(shí)現(xiàn)其價(jià)值,為使用者帶來利益的保證。從這個(gè)角度說,大數(shù)據(jù)主要涉及的技術(shù)包括云技術(shù)、分布式文件系統(tǒng)和并行計(jì)算框架。
大數(shù)據(jù)和云技術(shù)是相輔相成、息息相關(guān)的。大數(shù)據(jù)為云計(jì)算提供可資分析的信息內(nèi)容,云計(jì)算為大數(shù)據(jù)提供基礎(chǔ)架構(gòu),以實(shí)現(xiàn)數(shù)據(jù)的分析。隨著數(shù)據(jù)量躍升到PB(1024TB=1PB)、EB(1024PB=1EB),甚至ZB(1024EB=1ZB)級別,大量的重復(fù)信息或無效信息也必然產(chǎn)生,需要強(qiáng)大的計(jì)算能力和可擴(kuò)展的存儲空間對此進(jìn)行收集和過濾,云技術(shù)無疑具備這種能力。
分布式文件系統(tǒng)可以將非本地節(jié)點(diǎn)上的物理儲存資源,通過計(jì)算機(jī)網(wǎng)絡(luò)連接起來,使得眾多的節(jié)點(diǎn)組成一個(gè)文件系統(tǒng)網(wǎng)絡(luò)。并行計(jì)算則可以一次性執(zhí)行多個(gè)計(jì)算。分布式文件系統(tǒng)和并行計(jì)算框架都是大數(shù)據(jù)時(shí)代的關(guān)鍵性技術(shù),Hadoop框架是目前較有代表性的實(shí)現(xiàn)模式。
2.1 基于大數(shù)據(jù)的選題策劃
大數(shù)據(jù)首先助力選題策劃。這在當(dāng)下涉足出版的新媒體企業(yè)中,尤其突出。這些企業(yè)大多具有強(qiáng)大的互聯(lián)網(wǎng)基因,其對結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的采集、分析和應(yīng)用,相對傳統(tǒng)出版單位,具有天然的資源優(yōu)勢和技術(shù)優(yōu)勢,尤其是能通過所擁有的社交平臺和電商平臺記錄的用戶行為數(shù)據(jù),快速準(zhǔn)確地捕捉到社會熱點(diǎn)以及某個(gè)領(lǐng)域的流行趨勢等,以此作為選題策劃的重要參考。近年來,很多暢銷書的成功打造,就是基于大數(shù)據(jù)對選題策劃的介入,在國內(nèi)最具代表性的就是2014年自營式電商企業(yè)京東基于1700萬網(wǎng)站用戶數(shù)據(jù)分析而推出的《大衛(wèi)·貝克漢姆》。
2.2 基于大數(shù)據(jù)的內(nèi)容生產(chǎn)
在內(nèi)容生產(chǎn)環(huán)節(jié),不管是選擇作者還是確定作品內(nèi)容的表述方式、故事情節(jié)的發(fā)展走向,大數(shù)據(jù)都是決策時(shí)最好的依據(jù),電子出版公司Coliloquy曾在這方面做過成功的嘗試。Coliloquy借助亞馬遜的Kindle創(chuàng)建互動內(nèi)容,通過“選擇你自己的歷險(xiǎn)經(jīng)歷”的模式,允許讀者進(jìn)行人物角色和情節(jié)線索的設(shè)計(jì),并對讀者選擇后所產(chǎn)生的數(shù)據(jù)進(jìn)行匯總,再把數(shù)據(jù)分析結(jié)果發(fā)給作家,以此來調(diào)整故事線索,《饑餓游戲》(《TheHungerGames》)的暢銷就是基于這樣的理念和實(shí)踐。
2.3 基于大數(shù)據(jù)的編排制作
編排制作主要包括內(nèi)容審核、編輯、校對、排版等環(huán)節(jié),效率和質(zhì)量是重點(diǎn)。近年來,基于XML結(jié)構(gòu)化數(shù)據(jù)標(biāo)準(zhǔn)構(gòu)建的互聯(lián)網(wǎng)環(huán)境下的數(shù)字化生產(chǎn)加工平臺得到應(yīng)用,其中多人異地協(xié)同在線編纂平臺為作者、讀者、編輯、出版方等不同角色的實(shí)時(shí)交流和共同編纂提供可能,不僅能自動記錄所有的過程版本,而且能使成品數(shù)據(jù)和生產(chǎn)過程中的碎片化數(shù)據(jù)同時(shí)入庫,易于內(nèi)容追溯和提取。在編輯過程中,數(shù)字批注工具基于預(yù)先定義好的常用校對符號,能對稿件進(jìn)行電子化審讀和標(biāo)注;大量的數(shù)據(jù)庫能確保內(nèi)容找到與之匹配的排版樣式,自動排版,并和不同的模板結(jié)合,最終生成各種形態(tài)的出版物?;诖髷?shù)據(jù)的編排制作,不僅提高了編輯工作的效率,也保障了成品的質(zhì)量。
2.4 基于大數(shù)據(jù)的精準(zhǔn)營銷
所謂精準(zhǔn)營銷就是將出版產(chǎn)品以“最小化營銷成本、最大化營銷效果”準(zhǔn)確地推送給有確實(shí)需求的用戶。利用大數(shù)據(jù)技術(shù)進(jìn)行營銷時(shí),出版?zhèn)髅狡髽I(yè)既可以深度挖掘客戶信息,實(shí)現(xiàn)精準(zhǔn)投放,也可以利用社交網(wǎng)等各種平臺保持與用戶的個(gè)性化互動式溝通來提高用戶的忠實(shí)度,或通過對社交網(wǎng)絡(luò)中用戶圈子的分析來實(shí)現(xiàn)有針對性的營銷活動。
在大數(shù)據(jù)營銷方面,亞馬遜做得非常出色。亞馬遜利用基于大數(shù)據(jù)的個(gè)性化推薦系統(tǒng)替代先前的專家推薦系統(tǒng),大大提高了銷售量。系統(tǒng)通過分析客戶消費(fèi)信息(如購買什么書、關(guān)注什么書等)來準(zhǔn)確地給讀者推薦圖書。除個(gè)性化推薦系統(tǒng)外,亞馬遜在大數(shù)據(jù)營銷方面又進(jìn)入了一個(gè)更高階段——預(yù)判發(fā)貨。預(yù)判發(fā)貨的核心是利用大數(shù)據(jù)技術(shù)深度分析顧客以前的消費(fèi)記錄、搜索記錄以及心愿單等信息來預(yù)判顧客對新商品的購買意愿,并在未下單前直接將商品郵寄給顧客或離顧客較近的倉庫,這樣顧客一旦下單,收貨時(shí)間就將以“小時(shí)”計(jì),而不是以“天”計(jì)。預(yù)判發(fā)貨模式在某種程度上可提升顧客的忠誠度,提升亞馬遜在高端客戶中的口碑。
總而言之,大數(shù)據(jù)目前在出版中的應(yīng)用仍然處于起步階段,還有很多需要深入研究和探討的問題。對國內(nèi)出版?zhèn)髅狡髽I(yè)來說,當(dāng)前首先要盡快實(shí)現(xiàn)數(shù)字化轉(zhuǎn)型,并結(jié)合自身實(shí)際做好大數(shù)據(jù)應(yīng)用規(guī)劃,借助大數(shù)據(jù)來推動企業(yè)流程的變革和業(yè)務(wù)模式的創(chuàng)新。
[1]劉鯤翔,杜麗娟,丁雪.大數(shù)據(jù)技術(shù)在數(shù)字出版中的應(yīng)用前景展望[J].出版發(fā)行研究,2013,04:9-11.
[2]祝興平.大數(shù)據(jù)分析技術(shù)及其在數(shù)字出版中的應(yīng)用[J].出版發(fā)行研究,2014,04:13-16.
[3]梁瑩.大數(shù)據(jù)分析在出版中的應(yīng)用與展望[J].出版廣角,2015,02:15-17.