■文/ 馬國寶
大數(shù)據(jù)分析技術(shù)及其在數(shù)字出版中的運用探究
■文/ 馬國寶
我國的經(jīng)濟社會不斷發(fā)展,網(wǎng)絡(luò)信息技術(shù)水平不斷提升,其與社會各個行業(yè)的融合日益緊密。大數(shù)據(jù)分析技術(shù)是現(xiàn)代技術(shù)的代表,將其應(yīng)用在出版行業(yè)中,可以收獲良好的效果。為了發(fā)揮大數(shù)據(jù)分析技術(shù)的實用價值,必須推動新媒體出版行業(yè)的發(fā)展。本文將具體探討大數(shù)據(jù)分析技術(shù)及其在數(shù)字出版中的運用,希望能為相關(guān)人士提供一些參考。
大數(shù)據(jù)分析技術(shù);數(shù)字出版;運用
進入21世紀(jì)以來,我國的社會主義市場經(jīng)濟持續(xù)繁榮,現(xiàn)代技術(shù)發(fā)展更加迅速。在信息化時代中,數(shù)據(jù)信息是最具價值的資源。出版行業(yè)記錄著大量的出版信息,為了實現(xiàn)行業(yè)發(fā)展,必須對數(shù)據(jù)信息進行分析,制定科學(xué)的發(fā)展決策。大數(shù)據(jù)分析技術(shù)改變了傳統(tǒng)的新聞出版模式,催生了數(shù)字出版這一新模式。為了擴展數(shù)字出版的范圍,必須探討大數(shù)據(jù)分析技術(shù)的實踐意義。
1.1 內(nèi)涵
所謂的大數(shù)據(jù)分析技術(shù),就是以互聯(lián)網(wǎng)技術(shù)作為依托,對數(shù)據(jù)進行儲存、管理和精準(zhǔn)分析,從中識別有用信息,自動剔除無用信息的現(xiàn)代化技術(shù)[1]。大數(shù)據(jù)分析技術(shù)具有突出的實用功能,得到了各個行業(yè)的普遍重視。
我國的經(jīng)濟社會不斷發(fā)展,網(wǎng)絡(luò)信息技術(shù)滲透了人們?nèi)粘I畹姆椒矫婷?。人們在生產(chǎn)生活中會接觸到大量的數(shù)據(jù)信息,只有對海量數(shù)據(jù)信息進行分析,才能提升數(shù)據(jù)處理能力,實現(xiàn)自身的可持續(xù)發(fā)展。傳統(tǒng)的信息處理手段具有滯后性,存在時間延緩的弊病,信息處理結(jié)果只能反映上一時段的情況。大數(shù)據(jù)技術(shù)彌補了傳統(tǒng)信息處理方式的不足,將各種數(shù)據(jù)信息整合到了一起,可以對實時數(shù)據(jù)進行快速分析。
就內(nèi)容來看,大數(shù)據(jù)技術(shù)包括對數(shù)據(jù)流進行預(yù)測、對數(shù)據(jù)庫進行管理、對數(shù)據(jù)算法進行優(yōu)化等。就方法來看,大數(shù)據(jù)技術(shù)包括數(shù)據(jù)收集方法、數(shù)據(jù)錄入方法、數(shù)據(jù)處理方法等。就操作來看,大數(shù)據(jù)技術(shù)包括數(shù)據(jù)挖掘、數(shù)據(jù)庫建構(gòu)、數(shù)據(jù)統(tǒng)計等。
1.2 數(shù)據(jù)挖掘
數(shù)據(jù)挖掘是大數(shù)據(jù)分析技術(shù)中最重要的操作方法。數(shù)據(jù)挖掘又稱數(shù)據(jù)開發(fā),是對互聯(lián)網(wǎng)中的海量數(shù)據(jù)進行開發(fā),從中甄選出最具價值的實時信息。外部環(huán)境處在不斷發(fā)展變化中,數(shù)據(jù)也具有極強的變化性,數(shù)據(jù)挖掘以數(shù)據(jù)實時特征作為基點,可以對數(shù)據(jù)資源進行類別化分析。具體來說,數(shù)據(jù)挖掘操作包括以下幾個環(huán)節(jié)。
第一是劃分?jǐn)?shù)據(jù)的類型。在互聯(lián)網(wǎng)中有大量的數(shù)據(jù)信息,為了方便管理,需要形成不同的數(shù)據(jù)庫,記錄不同類型的數(shù)據(jù)。就出版行業(yè)來看,數(shù)據(jù)信息包括用戶信息、出版社信息、書籍信息等,數(shù)據(jù)發(fā)掘可以將數(shù)據(jù)分門別類地保存在數(shù)據(jù)庫之中;第二是對數(shù)據(jù)進行細分。每一類數(shù)據(jù)都可以被劃分為不同的層次,以用戶信息為例,包含用戶偏好信息、用戶產(chǎn)品信息、用戶屬性信息等;以出版社信息為例,包含出版社營業(yè)信息、出版社配送信息、出版社銷售信息等;以書籍信息為例,包含書籍作者信息、電子書籍信息、書籍促銷信息等;第三是分析數(shù)據(jù)信息的特征。每類信息都有突出的個性化特征,數(shù)據(jù)挖掘可以將數(shù)據(jù)信息放在一起,從中提取出最具價值的特征信息;第四是對數(shù)據(jù)的回歸分析。數(shù)據(jù)有一定的流動性,數(shù)據(jù)挖掘可以根據(jù)數(shù)據(jù)流方向,對出版行業(yè)的書籍銷售趨勢進行預(yù)測。
2.1 內(nèi)涵
所謂的數(shù)字出版,就是依托網(wǎng)絡(luò)數(shù)據(jù)信息的新型出版模式。數(shù)字出版以網(wǎng)絡(luò)信息技術(shù)作為基礎(chǔ),可以彌補傳統(tǒng)出版模式的不足之處。數(shù)字出版具有極強的系統(tǒng)性特征,不僅包括出版方式的數(shù)字化,還包括出版業(yè)務(wù)、用戶消費的數(shù)字化等[2]。在采用數(shù)字出版的過程中,需要依靠互聯(lián)網(wǎng)技術(shù)構(gòu)建信息平臺,在平臺上為用戶提供電子閱讀書目。用戶在閱讀之前,需要先支付一定的閱讀費用,與商家進行交易。
2.2 優(yōu)勢
首先,數(shù)字出版具有突出的便捷性特征。數(shù)字出版以網(wǎng)絡(luò)信息技術(shù)作為支撐,儲存了大量數(shù)據(jù)信息。在搜索數(shù)據(jù)的過程中,用戶可以根據(jù)數(shù)據(jù)類型尋找到相應(yīng)數(shù)據(jù),節(jié)省大量搜索時間。出版行業(yè)的每個鏈條都有相關(guān)性,數(shù)字出版可以在網(wǎng)絡(luò)平臺上傳遞數(shù)據(jù),實現(xiàn)信息的交互和共享。傳統(tǒng)出版以人的操作為主,誤差較大,耗費成本較高。數(shù)字出版以智能操作為主,誤差較小,耗費成本較低。從這個角度來看,數(shù)字出版已經(jīng)成為出版行業(yè)發(fā)展的必然之勢。
其次,數(shù)字出版具有突出的豐富性特征。就目前來看,我國的數(shù)字出版包括數(shù)字報刊、電子書、電子地圖等多種產(chǎn)品,各種移動終端都可以加載上述產(chǎn)品。隨著網(wǎng)絡(luò)信息技術(shù)水平的不斷提升,線下出版產(chǎn)品已經(jīng)擴展到了線上。與傳統(tǒng)出版相比,數(shù)字出版可以帶給用戶更加直觀的服務(wù)體驗,改變用戶的娛樂方式。
再次,數(shù)字出版具有突出的發(fā)展性特征。數(shù)字出版以互聯(lián)網(wǎng)技術(shù)作為依托,互聯(lián)網(wǎng)技術(shù)不斷發(fā)展,數(shù)字出版的發(fā)展速度也會不斷加快。在信息化時代中,數(shù)字出版已經(jīng)引起了大眾的關(guān)注,成為最具活力的現(xiàn)代技術(shù)產(chǎn)物之一。大數(shù)據(jù)技術(shù)為數(shù)字出版注入了新鮮的血液,勢必會推動當(dāng)代出版行業(yè)的發(fā)展。
3.1 出版流程
大數(shù)據(jù)技術(shù)可以被應(yīng)用在數(shù)字出版的各個環(huán)節(jié)之中,節(jié)省出版時間。具體來說,數(shù)字出版包括以下幾個流程:第一是準(zhǔn)備出版產(chǎn)品,對產(chǎn)品特性進行分析,分門別類進行管理;第二是制定產(chǎn)品營銷策略,對市場情況進行分析,和大眾媒體進行聯(lián)合;第三是優(yōu)化配置人力資源和物力資源,對每個工作環(huán)節(jié)的工作量進行測算,工作量越大,人力資源和物力資源的輸出越多;第四是對用戶進行集中管理,儲存海量用戶信息。比如,在準(zhǔn)備出版產(chǎn)品的過程中,可以應(yīng)用大數(shù)據(jù)技術(shù)中的RDM系統(tǒng)[3]。RDM系統(tǒng)是智能網(wǎng)絡(luò)管理平臺,可以對出版產(chǎn)品進行集中管理,為了輔助RDM系統(tǒng)的工作,也可以構(gòu)建ERP系統(tǒng),并劃分兩個管理系統(tǒng)的工作內(nèi)容。在系統(tǒng)產(chǎn)生數(shù)據(jù)后,要應(yīng)用大數(shù)據(jù)技術(shù),對實時數(shù)據(jù)進行精準(zhǔn)分析。如果產(chǎn)品信息出現(xiàn)訛誤,需要對其進行二度審核,并修正訛誤信息。
數(shù)字出版流程有兩條線索,第一條是業(yè)務(wù)流程線索,第二條是管理流程線索。出版流程不同,大數(shù)據(jù)技術(shù)的應(yīng)用也呈現(xiàn)出差異。以業(yè)務(wù)流程為例,在設(shè)計業(yè)務(wù)流程時,需要利用大數(shù)據(jù)技術(shù),考察市場消費情況和用戶的個人偏好,并將各種信息記錄在數(shù)據(jù)庫中。為了提高業(yè)務(wù)流程的設(shè)計水平,可以形成網(wǎng)絡(luò)信息平臺,吸引更多設(shè)計師的注意。以管理流程為例,在設(shè)計管理流程時,需要形成數(shù)據(jù)分析部門,對商業(yè)數(shù)據(jù)進行搜尋和處理。同時要考察供需關(guān)系,對投入產(chǎn)品比重進行控制。
3.2 出版產(chǎn)品
大數(shù)據(jù)技術(shù)可以被應(yīng)用在數(shù)字出版產(chǎn)品中。在物質(zhì)生活日益豐富的今天,人們的精神需求日益旺盛,對出版產(chǎn)品提出了更高的要求。出版產(chǎn)品只有滿足用戶的多元需求,才能促進出版行業(yè)的可持續(xù)發(fā)展。大數(shù)據(jù)分析技術(shù)可以對用戶需求進行調(diào)查,根據(jù)需求數(shù)據(jù)創(chuàng)新出版產(chǎn)品,為用戶提供多種選擇。在大數(shù)據(jù)技術(shù)的支持下,產(chǎn)品生產(chǎn)速度加快,產(chǎn)品的市場占有率不斷上升,創(chuàng)造了更多的經(jīng)濟價值和社會價值。除了提供產(chǎn)品之外,數(shù)字出版還可以為用戶提供線上服務(wù)。大數(shù)據(jù)技術(shù)重構(gòu)了數(shù)字服務(wù)的內(nèi)容,跨越了時間和空間的界限。用戶只需要登錄網(wǎng)絡(luò)平臺,就能和供應(yīng)商實現(xiàn)交互。
為了實現(xiàn)經(jīng)濟效益的最大化,供應(yīng)商必須采用有效的營銷策略,而營銷策略要以用戶偏好作為基礎(chǔ)。大數(shù)據(jù)技術(shù)可以為營銷策略提供海量數(shù)據(jù),幫助出版行業(yè)構(gòu)建新的營銷方式。一方面,大數(shù)據(jù)技術(shù)可以形成互動平臺,讓供應(yīng)商和用戶相對接;另一方面,大數(shù)據(jù)技術(shù)可以綜合考量用戶需要,為用戶提供定制化的數(shù)字產(chǎn)品。
3.3 出版服務(wù)
大數(shù)據(jù)技術(shù)可以被應(yīng)用在數(shù)字出版服務(wù)中。在大數(shù)據(jù)技術(shù)的支持下,數(shù)字出版更加智能,在很大程度上推動了我國出版行業(yè)和的發(fā)展。根據(jù)用戶的歷史數(shù)據(jù),大數(shù)據(jù)技術(shù)可以為用戶推送相關(guān)內(nèi)容,避免用戶在網(wǎng)絡(luò)上進行重新搜索。用戶的歷史數(shù)據(jù)包括用戶的消費偏向、用戶的內(nèi)容喜好、用戶的個人評價等[4]。大數(shù)據(jù)技術(shù)需要按照主題、人物等,把產(chǎn)品劃分為不同的類型,盡量和消費市場相貼合。
在提供服務(wù)的同時,還應(yīng)該和用戶建立好關(guān)系,讓用戶進行信息反饋。比如,在微信、微博等社交媒體中,應(yīng)該汲取用戶提出的意見和建議。大數(shù)據(jù)技術(shù)可以對數(shù)據(jù)進行智能分析,供應(yīng)商應(yīng)該利用數(shù)據(jù)挖掘功能,對用戶體驗進行評價,以此為依據(jù)調(diào)整自身的服務(wù)方式。
綜上所述,我國的經(jīng)濟社會不斷發(fā)展,出版行業(yè)進入快速發(fā)揮階段。為了擴展數(shù)字出版的范圍,必須探討大數(shù)據(jù)分析技術(shù)的實踐意義。
[1]王鵬,趙麗虹. 大數(shù)據(jù)和新媒體技術(shù)推動城市規(guī)劃轉(zhuǎn)型初探[A]. 中國科學(xué)技術(shù)協(xié)會、廣東省人民政府.第十七屆中國科協(xié)年會——分16大數(shù)據(jù)與城鄉(xiāng)治理研討會論文集[C].中國科學(xué)技術(shù)協(xié)會、廣東省人民政府,2015:7.
[2]劉實然. 面向出版行業(yè)的新媒體精準(zhǔn)營銷系統(tǒng)的設(shè)計與實現(xiàn)[D].中國科學(xué)院大學(xué)(工程管理與信息技術(shù)學(xué)院),2015.
[3]滕躍民,滕莉. 新媒體的發(fā)展及技術(shù)與市場分析——“新媒體出版與傳播高級研修班”綜述[J]. 出版與印刷,2016(04):7-10.
[4]楊淑娟,劉景景,沈陽. 媒體微信公眾平臺服務(wù)發(fā)展現(xiàn)狀及對策——基于“新媒體指數(shù)”大數(shù)據(jù)平臺的分析[J]. 新聞與寫作,2015(02):10-14.
(作者單位:河南科學(xué)技術(shù)出版社有限公司)
G23
A
1671-0134(2017)07-067-02
10.19483/j.cnki.11-4653/n.2017.07.019