【摘 要】:“互聯(lián)網(wǎng)+”時(shí)代的到來讓各行業(yè)發(fā)展變得無所不能,且形成了資源融合并用的發(fā)展態(tài)勢?,F(xiàn)如今,圖書出版市場在用戶需求方面不能及時(shí)有效滿足客戶需求,社會(huì)經(jīng)濟(jì)效益產(chǎn)能下降,正處于求新求變的轉(zhuǎn)折期。本文就基于“互聯(lián)網(wǎng)+”時(shí)代背景下的關(guān)鍵技術(shù)融合,探討基于大數(shù)據(jù)信息采集和數(shù)據(jù)挖掘技術(shù)輔助下的圖書選題策劃新方案,證明了“互聯(lián)網(wǎng)+”思維在當(dāng)代圖書出版市場運(yùn)作中的有效性。
【關(guān) 鍵 詞】:“互聯(lián)網(wǎng)+”思維;圖書選題策劃;數(shù)據(jù)挖掘
【作者簡介】:姜軍,男,中譯出版社社長,副編審,碩士,主要從事編輯學(xué)、出版學(xué)、融合發(fā)展、跨媒體發(fā)展研究。
【責(zé)編介紹】:思涵,女,今傳媒雜志社社長助理,主要從事傳媒理論和實(shí)踐研究。
選題策劃一直以來都被視為是圖書出版工作的重要源泉及核心,這是因?yàn)閮?yōu)秀的選題策劃可以深入讀者的內(nèi)心,探尋他們的精神文化需求,也能發(fā)揮媒介效應(yīng),拓展市場開發(fā)路徑,對圖書知識(shí)領(lǐng)域做出全面性的前瞻預(yù)測和判斷。在“互聯(lián)網(wǎng)+”概念提出以后,基于數(shù)字科學(xué)互聯(lián)網(wǎng)技術(shù)的圖書選題策劃環(huán)境與出版環(huán)境也發(fā)生了巨變。因此,出版社也應(yīng)該積極調(diào)整圖書選題策劃戰(zhàn)略,多多利用“互聯(lián)網(wǎng)+”配合傳統(tǒng)出版技術(shù)與選題策劃技術(shù)來實(shí)現(xiàn)全新的企業(yè)發(fā)展策略,為全媒體時(shí)代下的圖書選題策劃創(chuàng)造新思路、新模式,同時(shí)也極力發(fā)揮選題策劃的立體化、全方位規(guī)模,為市場建立圖書知識(shí)品牌,為選題策劃工作增值增效。
一、“互聯(lián)網(wǎng)+”思維與圖書選題策劃
1.“互聯(lián)網(wǎng)+”思維的具體內(nèi)涵
本文所談到的“互聯(lián)網(wǎng)+”思維是基于圖書選題策劃的互聯(lián)網(wǎng)科學(xué)技術(shù)運(yùn)用,即“互聯(lián)網(wǎng)+圖書選題策劃”。圖書選題策劃是一項(xiàng)貫穿于出版社圖書制作始終的內(nèi)容,隨著當(dāng)代社會(huì)對文化知識(shí)的需求量變大,圖書市場競爭的日趨激烈,出版社也面臨著必須革新,創(chuàng)造新業(yè)態(tài)的局面。因此在圖書從組稿、編輯、設(shè)計(jì)、宣傳到銷售等一系列流程中融入“互聯(lián)網(wǎng)+”思維,不但能夠提升圖書選題策劃的效率與創(chuàng)造性,也能提升出版社自身與市場、與它社的溝通能力,進(jìn)而根據(jù)市場發(fā)展趨勢來第一時(shí)間調(diào)整圖書選題策劃藍(lán)圖,最大限度地規(guī)避市場風(fēng)險(xiǎn)所帶來的不必要損失,這也是“互聯(lián)網(wǎng)+”思維在圖書選題策劃過程中的價(jià)值內(nèi)涵所在。
2.圖書的選題策劃
圖書選題策劃是圖書出版前期的重要工作,它是為了達(dá)到圖書制作的特定目標(biāo)而制定的相關(guān)計(jì)劃方案。出版社將圖書選題策劃視為是一項(xiàng)特殊的系統(tǒng)工程,這就是因?yàn)樗倪x題策劃過程會(huì)貫穿整個(gè)圖書出版的始終,對出版社全員的業(yè)務(wù)能力都是一種深度考量。具體來說,圖書的選題策劃應(yīng)該被歸納為5個(gè)步驟。
步驟1:收集信息。圖書選題策劃是系統(tǒng)工程,更是創(chuàng)意工作,所以大量的創(chuàng)意信息是不可或缺的。收集信息時(shí),應(yīng)主要注意所收集信息的用途以及對有價(jià)值信息的捕捉。前者所考察的是圖書編輯的能力,而后者則強(qiáng)調(diào)對圖書市場的了解程度。
步驟2:立題。立題,即為圖書確立中心思想,并在掌握大量的信息基礎(chǔ)上,建立工作實(shí)際目標(biāo),確立圖書選題。立題需要注意三方面:第一,要以出版社的特色來進(jìn)行定位,爭取打造特色品牌并試圖闖開市場;第二,在策劃大眾讀物時(shí),應(yīng)該開放視野,挖掘大眾閱讀興趣,找準(zhǔn)切入點(diǎn);第三,一定要把握時(shí)代脈搏。
步驟3:市場調(diào)查。圖書市場調(diào)查是選題策劃中的重要一環(huán),因?yàn)樗鼡?dān)負(fù)著選題的確定與出版社的投資問題。當(dāng)選題與投資落實(shí)以后,就要開始進(jìn)入選題工作。選題的根本在于多多調(diào)查圖書市場、社會(huì)各個(gè)層面,了解市場中一切與所策劃選題圖書相關(guān)的知識(shí)業(yè)務(wù)領(lǐng)域。同時(shí)要了解同行的動(dòng)態(tài),確立自身競爭優(yōu)勢,打好圖書未來銷售策略的前期基礎(chǔ)。
步驟4:市場定位及生產(chǎn)。當(dāng)圖書選題確定并做好市場調(diào)查后就要實(shí)施市場定位工作,該工作的重點(diǎn)在于確認(rèn)市場調(diào)查結(jié)果,并確定圖書的開本、用材以及整體設(shè)計(jì)風(fēng)格,然后再根據(jù)市場狀況為圖書設(shè)定頁碼、定價(jià),并根據(jù)不同的目標(biāo)讀者來定位市場前期銷售計(jì)劃。
在生產(chǎn)制作層面,則意味著項(xiàng)目投資的正式開始。在這一環(huán)節(jié)中,出版社要控制的是生產(chǎn)費(fèi)用以及印刷質(zhì)量,希望在印刷前將一切質(zhì)量問題完全解決。
步驟5:營銷策劃。營銷策劃也是選題策劃的最終環(huán)節(jié),它的基本實(shí)施步驟有兩點(diǎn)。其一,在圖書出版前的營銷策劃,這段時(shí)間內(nèi)要為圖書的出版積極造勢,以達(dá)到一定的宣傳效果;其二,在圖書出版后的營銷策劃則主要包含兩個(gè)層面的工作,首先就是要做好線上線下渠道的圖書發(fā)行工作,確保沒有任何侵權(quán)行為發(fā)生,并保證圖書在最快時(shí)間內(nèi)在最廣范圍內(nèi)上架鋪貨銷售;其次就是面向目標(biāo)讀者,引發(fā)他們購買行為的圖書發(fā)行后宣傳活動(dòng)及營銷活動(dòng),確保圖書持續(xù)保持穩(wěn)定的銷量。
二、互聯(lián)網(wǎng)+數(shù)據(jù)挖掘技術(shù)的圖書選題策劃
1.數(shù)據(jù)的提取
以國內(nèi)某圖書購物網(wǎng)站為例,它的每一個(gè)圖書商品頁面都涵蓋了圖書的相關(guān)信息框、圖書文本屬性,可以利用網(wǎng)頁信息抽取技術(shù)來對網(wǎng)頁中的數(shù)據(jù)進(jìn)行數(shù)據(jù)信息挖掘,并最終放入到圖書的原信息資源庫中,它可以作為隨后圖書選題策劃的元數(shù)據(jù)來使用。
基于“互聯(lián)網(wǎng)+”環(huán)境,選擇網(wǎng)頁抓取技術(shù),從圖書中抓取圖書實(shí)體信息與市場需求信息,構(gòu)建相應(yīng)的資源庫。因此,該圖書購物網(wǎng)站的圖書元數(shù)據(jù)提取模擬過程如下:
首先,先提取圖書的ISBN號(hào),并為圖書信息附加如“按銷量排名”“猜你喜歡”等URL標(biāo)識(shí)參數(shù),拼接成為該網(wǎng)站圖書的高級(jí)搜索URL。
第二,模擬HTTP請求,在html中抽取相關(guān)的商品鏈接,并最終獲取該網(wǎng)站圖書商品的真實(shí)html鏈接與商品ID。
第三,根據(jù)上一步驟而得到html地址,并通過http請求來獲得圖書商品的具體頁面信息,此時(shí)利用網(wǎng)頁抓取技術(shù)抓取圖書中的詳細(xì)數(shù)據(jù),可將其作為出版社圖書信息的資源庫資料。
第四,再根據(jù)第二步來獲取圖書商品的ID,并根據(jù)互聯(lián)網(wǎng)中的圖書信息拼接它的圖書評價(jià)頁面URL,抽取用戶的評價(jià)詳情,作為選題策劃的市場動(dòng)態(tài)信息數(shù)據(jù)備用。
2.選題策劃的數(shù)據(jù)挖掘
選題策劃的數(shù)據(jù)挖掘基于兩點(diǎn)完成,淺度挖掘和深度挖掘。以某書《投資是一場旅行》為例,以下為它的選題策劃數(shù)據(jù)淺度挖掘與深度挖掘分析。
首先,淺度挖掘會(huì)根據(jù)所收集的《投資是一場旅行》的元數(shù)據(jù)與市場數(shù)據(jù)來進(jìn)行對比性的市場數(shù)據(jù)統(tǒng)計(jì)分析,并淺度挖掘其內(nèi)在比較有利的選題策劃信息。例如可以在網(wǎng)站直觀看到的讀者評價(jià)、銷量等。根據(jù)這些信息來為圖書選題策劃奠定信息資源基礎(chǔ)。
其次是深度挖掘。深度挖掘相對復(fù)雜,它根據(jù)圖書的選題策劃信息,利用到了貝葉斯算法,并基于大量數(shù)據(jù)來得出分析結(jié)果。貝葉斯算法的整個(gè)流程要?jiǎng)澐譃槿蟛糠?。首先是?zhǔn)備階段,網(wǎng)站系統(tǒng)會(huì)根據(jù)圖書選題策劃基本數(shù)據(jù)來生成相對應(yīng)的訓(xùn)練數(shù)據(jù),也同時(shí)為第二部分分類規(guī)則提供相應(yīng)數(shù)據(jù)參考;第二部分的主要任務(wù)則為建模,系統(tǒng)會(huì)自動(dòng)根據(jù)客戶需求來生成相關(guān)的訓(xùn)練數(shù)據(jù),并計(jì)算其中各個(gè)類別的計(jì)算數(shù)據(jù)。在每個(gè)被計(jì)算的圖書信息屬性中,都要為圖書選題策劃信息劃分屬性類別,并在信息發(fā)生的前提下驗(yàn)證信息出現(xiàn)概率,進(jìn)而建立貝葉斯模型;最后一部分則為分類階段,系統(tǒng)會(huì)自動(dòng)根據(jù)第二部分所建立的貝葉斯模型,對圖書選題策劃中的樣本計(jì)算設(shè)計(jì)概率,進(jìn)而獲得較大的信息分了概率,并推測出圖書選題策劃樣本的屬性歸類,最后獲得選題策劃信息。
3.互聯(lián)網(wǎng)+數(shù)據(jù)挖掘的圖書選題策劃設(shè)計(jì)
(1)需求分析
出版社一定要根據(jù)圖書市場的發(fā)展走勢、消費(fèi)者的現(xiàn)實(shí)需求反饋以及媒體的評價(jià)、圖書應(yīng)力狀況來獲取輿情信息。充分利用“互聯(lián)網(wǎng)+”技術(shù),將各個(gè)環(huán)節(jié)與互聯(lián)網(wǎng)融為一體,提升數(shù)據(jù)量,加快數(shù)據(jù)傳輸速度,并獲取利于選題策劃的相關(guān)信息。另外,為了滿足互聯(lián)網(wǎng)用戶的現(xiàn)實(shí)需求,應(yīng)該在系統(tǒng)設(shè)計(jì)中滿足選題策劃需求,基于數(shù)據(jù)挖掘來將圖書的選題策劃工作劃分為四大模塊:圖書元數(shù)據(jù)與市場信息提取模塊、圖書市場信息管理模塊、圖書市場信息存儲(chǔ)模塊以及數(shù)據(jù)挖掘模塊。采用Jsoup軟件進(jìn)行數(shù)據(jù)提取分析,并利用Hadoop分布式文件系統(tǒng)來存儲(chǔ)和管理大量的圖書信息,為以后的選題策劃奠定資源基礎(chǔ)?;凇盎ヂ?lián)網(wǎng)+”的數(shù)據(jù)挖掘圖書選題策劃圖書設(shè)計(jì)模塊整體操作流程圖如圖1所示。
(2)相關(guān)功能設(shè)計(jì)
這里要利用到Jsoup軟件工具對圖書選題策劃數(shù)據(jù)進(jìn)行有效提取與分析,同時(shí)基于Hadoop生態(tài)系統(tǒng)技術(shù)來為圖書市場挖掘有效信息,以供選題策劃使用。它所涉及的相關(guān)功能主要有以下三點(diǎn)。
第一,圖書的元數(shù)據(jù)與市場信息提取。該功能基于互聯(lián)網(wǎng)HTTP模擬技術(shù)完成,可以直接獲取圖書商品的信息頁面,并通過超文本文件分析與處理來去除無用信息,獲取相應(yīng)圖書中所存在的市場信息、用戶行為信息以及元信息數(shù)據(jù)等等。對它們的提取有利于出版社的信息數(shù)據(jù)庫建立。
第二,數(shù)據(jù)挖掘模塊。如上文提到,它被分為深度與淺度挖掘兩種。對于海量的數(shù)據(jù)選擇而言,它有利于對出版社圖書選題策劃的信息功能分類,并深入選題策劃內(nèi)容。
最后是信息反饋,通過分析選題策劃結(jié)果所涉及的圖書制作交互日志來進(jìn)一步獲取數(shù)據(jù)挖掘方案,幫助出版社明確圖書選題策劃決策。
三、總 結(jié)
在“互聯(lián)網(wǎng)+”時(shí)代,出版社應(yīng)該妥善合理地選擇相關(guān)選題策劃技術(shù),并圍繞“互聯(lián)網(wǎng)+”這一理念來豐富自己的技術(shù)理念與技術(shù)實(shí)操效果,充分發(fā)揮某些技術(shù)交流平臺(tái)的作用來完善圖書選題策劃市場。正如文中所提到的信息采集與數(shù)據(jù)挖掘技術(shù),將圖書選題策劃的運(yùn)用科學(xué)化、人性化、豐富化。
參考文獻(xiàn):
[1] 余人,段雨濛.“互聯(lián)網(wǎng)+”時(shí)代圖書選題創(chuàng)意從哪里來[J].出版廣角,2015(14).
[2] 徐劍.大數(shù)據(jù)時(shí)代圖書選題信息的采集模式研究[D].安徽大學(xué), 2015.
[3] 李汶羲.基于數(shù)據(jù)挖掘的選題策劃的研究與設(shè)計(jì)[D].北方工業(yè)大學(xué),2015.