文/趙宏源
隨著大數(shù)據(jù)的發(fā)展逐步邁入實(shí)質(zhì)應(yīng)用階段,對(duì)社會(huì)各個(gè)層面都產(chǎn)生了重大的影響:行業(yè)層面上,決策依據(jù)更加全面和準(zhǔn)確,有助于形成新的核心競(jìng)爭(zhēng)力,對(duì)企業(yè)的生產(chǎn)模式、商業(yè)模式以及管理模式等都產(chǎn)生了深刻的變革,行業(yè)之間的界限模糊化;思維方式層面上,從滿足于樣本數(shù)據(jù)變?yōu)槭褂萌w數(shù)據(jù),從追求精確性到容忍混雜性,從關(guān)注因果關(guān)系到關(guān)注相關(guān)關(guān)系;智慧和戰(zhàn)略層面上,數(shù)據(jù)的膨脹在“量”上引發(fā)混沌的同時(shí),在“質(zhì)”上可能開(kāi)始顯現(xiàn)出秩序,對(duì)社會(huì)發(fā)展和管理模式提出了新的挑戰(zhàn)。[1]
在這個(gè)時(shí)代背景下,數(shù)字出版的發(fā)展逐步走向多元化:網(wǎng)絡(luò)出版、移動(dòng)出版、數(shù)據(jù)庫(kù)出版、融合出版以及知識(shí)服務(wù)等。數(shù)字出版本身的特征也發(fā)生重大變化,從內(nèi)容生產(chǎn)、管理過(guò)程、產(chǎn)品形態(tài)以及傳播渠道的單純的數(shù)字化1發(fā)展為內(nèi)容生產(chǎn)主體的多元化、交付方式的多樣化、服務(wù)過(guò)程的系統(tǒng)化以及內(nèi)容推薦的智能化。內(nèi)容生產(chǎn)主體的多元化體現(xiàn)為UGC(用戶生產(chǎn)內(nèi)容)、PGC(專(zhuān)業(yè)生產(chǎn)內(nèi)容)、OGC(職業(yè)生產(chǎn)內(nèi)容)以及DGC(設(shè)備驅(qū)動(dòng)內(nèi)容)等多種內(nèi)容生產(chǎn)模式的涌現(xiàn);交付方式的多樣化如紙質(zhì)圖書(shū)、音頻圖書(shū)、VR/AR圖書(shū)、知識(shí)付費(fèi)乃至知識(shí)服務(wù)等;服務(wù)過(guò)程的系統(tǒng)化體現(xiàn)在多層次的關(guān)聯(lián)體系為讀者提供完整的知識(shí)體系;內(nèi)容推薦的智能化體現(xiàn)在用戶畫(huà)像基礎(chǔ)上的精準(zhǔn)推薦。
在數(shù)字出版上述特征的形成與演變過(guò)程中,大數(shù)據(jù)技術(shù)的應(yīng)用是最主要的推動(dòng)因素。隨著數(shù)字出版產(chǎn)業(yè)的發(fā)展,大數(shù)據(jù)的應(yīng)用價(jià)值越來(lái)越大。
用戶畫(huà)像(persona)是美國(guó)交互設(shè)計(jì)師阿蘭·庫(kù)珀在《交互設(shè)計(jì)之路—讓高科技產(chǎn)品回歸人性》一書(shū)中提出的概念,persona本意為面具,引申義為“面具”所表現(xiàn)出來(lái)的“角色”,主要作用在于描述用戶特征。根據(jù)用戶的現(xiàn)實(shí)特征和潛在特征,用戶畫(huà)像可以分為靜態(tài)畫(huà)像和動(dòng)態(tài)畫(huà)像兩種。前者主要針對(duì)用戶的統(tǒng)計(jì)學(xué)特征(如出生日期、性別、學(xué)歷以及職業(yè)等)和行為特征(如衣食住行、娛樂(lè)、社交以及學(xué)習(xí)等消費(fèi)習(xí)慣);后者則針對(duì)用戶的可能性、潛在性和趨勢(shì)性特征。[2]前者以用戶需求為導(dǎo)向,重點(diǎn)在于應(yīng)用場(chǎng)景中的用戶行為模式,后者以生活愿景為導(dǎo)向的用戶生活方式的描述,重點(diǎn)在于數(shù)據(jù)挖掘基礎(chǔ)上的用戶趨勢(shì)預(yù)測(cè)。[3]
大數(shù)據(jù)視角下的用戶概念,外延擴(kuò)展到所有用戶,既包括現(xiàn)實(shí)或者潛在用戶,也包括跨行業(yè)潛在用戶。界定用戶的標(biāo)準(zhǔn)在于其價(jià)值提供和價(jià)值共創(chuàng)的結(jié)果,而非是否購(gòu)買(mǎi)企業(yè)的產(chǎn)品/服務(wù)或者參與過(guò)企業(yè)活動(dòng)。[4]大數(shù)據(jù)基礎(chǔ)上的用戶畫(huà)像通過(guò)用戶標(biāo)簽化,構(gòu)建數(shù)據(jù)模型研究“全樣本”用戶特征,有助于準(zhǔn)確識(shí)別和描繪目標(biāo)用戶,有效聯(lián)接用戶的屬性、行為與期待,極大地避免了主觀因素的干擾;有助于及時(shí)掌握用戶的異動(dòng),促進(jìn)產(chǎn)品/服務(wù)的升級(jí)或者調(diào)整;有助于針對(duì)用戶的個(gè)性化需求實(shí)現(xiàn)精準(zhǔn)推薦。[5]
與其他行業(yè)比較,數(shù)字出版的用戶的特點(diǎn)更加復(fù)雜,首先是用戶角色的多重性。同一個(gè)用戶既可能單一的服務(wù)使用角色,也可能是集內(nèi)容的創(chuàng)作者、使用者、演繹者以及傳播者中某幾個(gè)或者全部于一體的混合角色。其次是用戶之間的關(guān)聯(lián)性?;趯?duì)共同主題內(nèi)容的關(guān)注和用戶自身知識(shí)層次產(chǎn)生用戶之間的碰撞效應(yīng)或者同化效應(yīng),形成用戶之間多種多樣的關(guān)聯(lián)關(guān)系。最后是用戶特征的動(dòng)態(tài)演變。隨著用戶知識(shí)量的增加,對(duì)內(nèi)容的需求、內(nèi)容產(chǎn)業(yè)鏈上扮演的角色以及社交關(guān)系等都處于持續(xù)的動(dòng)態(tài)演變過(guò)程中。數(shù)字出版的目標(biāo)用戶的這些特點(diǎn)不僅要求準(zhǔn)確描述用戶的現(xiàn)實(shí)特征,進(jìn)行靜態(tài)畫(huà)像,以便實(shí)現(xiàn)產(chǎn)品/服務(wù)的精準(zhǔn)推送,更要著眼未來(lái),準(zhǔn)確把握用戶需求的發(fā)展趨勢(shì),進(jìn)行動(dòng)態(tài)畫(huà)像,以便捕捉用戶興趣與需求的變化,實(shí)現(xiàn)用戶畫(huà)像的完整構(gòu)建與不斷迭代。
2004年10 月,《連線》雜志主編克里斯·安德森提出長(zhǎng)尾理論,他認(rèn)為,“只要存儲(chǔ)和流通的渠道足夠大,需求不旺或銷(xiāo)量不佳的產(chǎn)品所共同占據(jù)的市場(chǎng)份額,可以和那些少數(shù)熱銷(xiāo)產(chǎn)品所占據(jù)的市場(chǎng)份額想匹敵甚至更大,即眾多小市場(chǎng)可匯聚成與主流大市場(chǎng)相匹敵的市場(chǎng)能量”。長(zhǎng)尾效應(yīng)的意義在于“將所有非流行的市場(chǎng)累加起來(lái)會(huì)形成一個(gè)比流行市場(chǎng)還大的市場(chǎng)”[6]。
大數(shù)據(jù)時(shí)代的到來(lái),人們獲取的信息量越來(lái)越大,長(zhǎng)期存在的信息不對(duì)稱現(xiàn)象因此得到改善。與此同時(shí),大數(shù)據(jù)也引發(fā)了選擇困境,面對(duì)海量的信息人們無(wú)所適從,尤其對(duì)大量?jī)r(jià)值有限甚或垃圾信息難以甄別,從而形成了大數(shù)據(jù)實(shí)踐應(yīng)用中的悖論。反映在市場(chǎng)經(jīng)濟(jì)中體現(xiàn)為冪律分布[7]與長(zhǎng)尾分布的并存,一方面,由于關(guān)注度的集聚效應(yīng),頭部產(chǎn)品所占比例越來(lái)越小,單品銷(xiāo)量越來(lái)越大;另一方面,長(zhǎng)尾產(chǎn)品越來(lái)越多,質(zhì)量參差不齊,人們的選擇與甄別越發(fā)困難。這一問(wèn)題的解決依然要回到大數(shù)據(jù)本身,通過(guò)完整的用戶畫(huà)像與產(chǎn)品特征的描述實(shí)現(xiàn)產(chǎn)品的精準(zhǔn)推薦。
圖書(shū)出版業(yè)屬于小眾行業(yè),一方面,大多數(shù)圖書(shū)的讀者群有限,不可能有巨大的銷(xiāo)量;另一方面,如此眾多的圖書(shū)充斥市場(chǎng),結(jié)果是大多數(shù)圖書(shū)很難找到目標(biāo)讀者,只有極少數(shù)的圖書(shū)最終成為暢銷(xiāo)書(shū)。[8]進(jìn)入數(shù)字出版階段之后,這一特征體現(xiàn)的更加明顯,存儲(chǔ)和復(fù)制的邊際成本趨近于零,創(chuàng)作門(mén)檻大幅降低,所出版的作品規(guī)模急劇擴(kuò)張。冪律分布與長(zhǎng)尾分布的兩極化現(xiàn)象在數(shù)字出版業(yè)內(nèi)更加劇烈,長(zhǎng)尾產(chǎn)品的挖掘與過(guò)濾更加困難。通過(guò)大數(shù)據(jù)技術(shù),有助于建立完整的用戶畫(huà)像,以識(shí)別用戶需求,建立完整的知識(shí)關(guān)聯(lián)體系,以導(dǎo)航定位發(fā)掘優(yōu)質(zhì)的長(zhǎng)尾產(chǎn)品,通過(guò)用戶評(píng)價(jià)以及作品相關(guān)的各種被引用關(guān)系等實(shí)現(xiàn)劣質(zhì)長(zhǎng)尾產(chǎn)品的過(guò)濾。
所謂協(xié)同,就是指協(xié)調(diào)兩個(gè)或者兩個(gè)以上的不同資源或者個(gè)體,協(xié)同一致地完成某一目標(biāo)的過(guò)程或能力。站在具有獨(dú)立法人地位企業(yè)的角度,協(xié)同包括企業(yè)之間的協(xié)同和企業(yè)內(nèi)部的協(xié)同。企業(yè)之間的協(xié)同包括縱向協(xié)同與橫向協(xié)同,前者最典型的例子就是外包,后者即聯(lián)合開(kāi)發(fā),雙方或者多方組成項(xiàng)目組共同開(kāi)發(fā),獲取的知識(shí)產(chǎn)權(quán)和利潤(rùn)按比例分?jǐn)偂F髽I(yè)間協(xié)同根據(jù)緊密程度分為三個(gè)層次,即低耦合、中耦合和高耦合。企業(yè)內(nèi)部的協(xié)同也分為三個(gè)層次,即產(chǎn)品結(jié)構(gòu)的協(xié)同、專(zhuān)業(yè)技術(shù)的協(xié)同和內(nèi)部各業(yè)務(wù)部門(mén)之間的協(xié)同。[9]
大數(shù)據(jù)背景下的企業(yè)協(xié)同,更注重資源整合意義上的協(xié)同。從內(nèi)部而言,必須打破系統(tǒng)邊界,打破部門(mén)壁壘,整合企業(yè)內(nèi)外多源異構(gòu)的數(shù)據(jù),通過(guò)大數(shù)據(jù)分析,掌握企業(yè)自身優(yōu)勢(shì)與劣勢(shì)、市場(chǎng)環(huán)境、用戶特征與需求,改革并優(yōu)化企業(yè)內(nèi)部的管理與服務(wù)流程,為用戶提供精準(zhǔn)的產(chǎn)品/服務(wù)。從外部而言,企業(yè)不同階段的發(fā)展需求必然不斷產(chǎn)生各種或虛或?qū)嵉膱F(tuán)隊(duì),導(dǎo)致協(xié)同的邊界不斷擴(kuò)大,相應(yīng)的資源需求不斷擴(kuò)大而且多變。通過(guò)大數(shù)據(jù)分析,有效整合包括人力、組織、技術(shù)以及資金等在內(nèi)的各種企業(yè)外部資源,并隨時(shí)根據(jù)實(shí)際狀況動(dòng)態(tài)調(diào)整,實(shí)現(xiàn)企業(yè)內(nèi)部之間以及企業(yè)之間信息的共享和利用,優(yōu)化外部合作流程,從而大幅提升效率。[10]
相比其他行業(yè),數(shù)字出版流程涉及的因素更為復(fù)雜,用戶畫(huà)像描述、選題策劃、表達(dá)方式確定、交付方式選擇、外部審校資源與作者資源整合、關(guān)聯(lián)體系構(gòu)建、交互功能設(shè)計(jì)與內(nèi)容監(jiān)管以及版權(quán)追蹤監(jiān)控等,都必須整合企業(yè)內(nèi)部與外部的各種資源,針對(duì)不同需求進(jìn)行相應(yīng)的甄別與選擇,尤其是面對(duì)快速多變的內(nèi)容創(chuàng)作創(chuàng)新,更加要求協(xié)同的出版流程,實(shí)現(xiàn)產(chǎn)品/服務(wù)市場(chǎng)的高效運(yùn)營(yíng)。大數(shù)據(jù)技術(shù)的運(yùn)用,有助于提升出版流程各個(gè)環(huán)節(jié)的市場(chǎng)化程度,據(jù)此實(shí)現(xiàn)內(nèi)部部門(mén)之間的分工協(xié)調(diào),外部資源的充分利用,進(jìn)而提升數(shù)字出版企業(yè)的協(xié)同管理效率。
供需鏈的研究起源于20世紀(jì)60年代,一般是指由進(jìn)行物料獲取、加工物料成中間件或者成品,再將成品送到用戶手中的一些企業(yè)或者企業(yè)部門(mén)構(gòu)成的網(wǎng)絡(luò)。參與供需鏈的主體包括供應(yīng)商、生產(chǎn)商、配送中心、零售商以及最終用戶。供需鏈涉及的內(nèi)容包括參與供需鏈的有關(guān)實(shí)體之間的物流、信息流與資金流。[11]根據(jù)供需鏈中起核心作用的企業(yè)類(lèi)型,供需鏈模式可以分為以分銷(xiāo)商為核心的供需鏈、以制造商為核心的供需鏈、以拍賣(mài)商為核心的供需鏈三種。[12]有效的供需鏈管理有助于企業(yè)降低成本,提高競(jìng)爭(zhēng)力;加速整個(gè)供需鏈上物流與信息流的流動(dòng),縮短產(chǎn)品流通周期;突出企業(yè)核心能力,加強(qiáng)競(jìng)爭(zhēng)力。[13]
大數(shù)據(jù)技術(shù)的出現(xiàn),通過(guò)對(duì)供需信息的量化與分析,降低供需鏈中的不確定風(fēng)險(xiǎn),改變了傳統(tǒng)的供需鏈模式,體現(xiàn)在兩方面:一是供需從面對(duì)面模式(即傳統(tǒng)的批量模式)到點(diǎn)對(duì)點(diǎn)(即根據(jù)消費(fèi)需求定點(diǎn)生產(chǎn)與銷(xiāo)售)模式的確立;二是供需分析預(yù)測(cè)的廣度、深度和準(zhǔn)確度的提高。第一個(gè)體現(xiàn)對(duì)于生產(chǎn)者而言意味著生產(chǎn)端與消費(fèi)端溝通距離的縮短,上文中的三種供需鏈模式因之分化解體,個(gè)性化需求的滿足逐步成為企業(yè)生產(chǎn)的主流模式;對(duì)于消費(fèi)者而言意味著按需購(gòu)買(mǎi)模式的盛行,用戶根據(jù)商家基于大數(shù)據(jù)分析的推薦和自身實(shí)際需求選擇合適的產(chǎn)品/服務(wù)。第二個(gè)體現(xiàn)傳統(tǒng)的樣本分析、概貌分析演變?yōu)榫珳?zhǔn)分析,并以此為基礎(chǔ)對(duì)未來(lái)趨勢(shì)進(jìn)行預(yù)測(cè),根據(jù)趨勢(shì)預(yù)測(cè)確定企業(yè)的戰(zhàn)略決策。[14]
數(shù)字出版與包括傳統(tǒng)出版在內(nèi)的行業(yè)供需鏈相比,構(gòu)成和運(yùn)作模式都有很大不同。供需鏈的構(gòu)成上有內(nèi)容供需鏈、技術(shù)供需鏈以及載體供需鏈,其中,內(nèi)容供需鏈從作者到出版單位到平臺(tái)商(包括出版單位自建平臺(tái))到用戶端;技術(shù)供需鏈從數(shù)據(jù)加工商(例如內(nèi)容的數(shù)字化加工或者音視頻加工)到出版單位再到技術(shù)開(kāi)發(fā)商(平臺(tái)或者數(shù)據(jù)庫(kù)開(kāi)發(fā));載體供需鏈從作者到出版單位到渠道商再到零售商最后到讀者。無(wú)論每一條供需鏈除了中介性質(zhì)的出版單位之外,都不是一般行業(yè)的一對(duì)一和一對(duì)多,而是多對(duì)多,而且供需鏈上的角色之間還存在重合性或者協(xié)作關(guān)系,前者如作者與讀者角色的重合,后者如數(shù)據(jù)加工商與平臺(tái)開(kāi)發(fā)商之間的協(xié)作。大數(shù)據(jù)的應(yīng)用,使整個(gè)供需鏈的上下游都發(fā)生改變,從相對(duì)單一的線性結(jié)構(gòu)變?yōu)槎嘣Ⅲw的網(wǎng)狀結(jié)構(gòu)[15]。通過(guò)對(duì)最終用戶畫(huà)像的描述,供需鏈上各個(gè)角色的分析,實(shí)現(xiàn)出版不同角色供需的精準(zhǔn)匹配,優(yōu)化供需鏈結(jié)構(gòu)。
知識(shí)服務(wù),指以知識(shí)資源為對(duì)象,以信息知識(shí)的組織、關(guān)聯(lián)、挖掘、重構(gòu)等為手段,為用戶提供個(gè)性化的智能服務(wù)。它是當(dāng)今知識(shí)信息資源共享模式設(shè)計(jì)的核心指導(dǎo)思想,這種共享模式為用戶提供的是針對(duì)特定問(wèn)題的解決方案,即“知識(shí)”。[16]知識(shí)包括顯性知識(shí)和隱性知識(shí)。其中,顯性知識(shí)指容易轉(zhuǎn)化為符號(hào)的知識(shí),可以語(yǔ)言表述從而傳播;隱性知識(shí)隱藏在知識(shí)主體手中和頭腦中,體現(xiàn)為技能、訣竅、洞察力、經(jīng)驗(yàn)等無(wú)法用語(yǔ)言或者特定符號(hào)編碼的知識(shí)。[17]前者最典型的呈現(xiàn)方式就是出版物,尤其是圖書(shū),系統(tǒng)的論證與闡述、便捷的傳播與交付,成為顯性知識(shí)最佳的載體選擇;后者最常見(jiàn)的表現(xiàn)例如師徒傳承、實(shí)踐練習(xí)以及頭腦風(fēng)暴等,“只可意會(huì),不可言傳”是其最主要的特征。兩者同時(shí)又可以相互轉(zhuǎn)化,通過(guò)社會(huì)化實(shí)現(xiàn)隱性知識(shí)之間的轉(zhuǎn)化;通過(guò)外化實(shí)現(xiàn)隱性知識(shí)到顯性知識(shí)的轉(zhuǎn)化;通過(guò)整合實(shí)現(xiàn)顯性知識(shí)之間的轉(zhuǎn)化;通過(guò)內(nèi)化實(shí)現(xiàn)顯性知識(shí)到隱性知識(shí)的轉(zhuǎn)化。[18]通過(guò)顯性知識(shí)與隱性知識(shí)相互之間不斷的轉(zhuǎn)化,實(shí)現(xiàn)知識(shí)本身的創(chuàng)新與傳播。
大數(shù)據(jù)的出現(xiàn)使知識(shí)服務(wù)在知識(shí)生產(chǎn)與更新、典型特征、服務(wù)范圍與模式等方面都產(chǎn)生了迥異于以往的變化。首先,知識(shí)生產(chǎn)主體多元化,既有領(lǐng)域內(nèi)專(zhuān)家,也有普通用戶,既有職業(yè)機(jī)構(gòu),也有個(gè)體生產(chǎn),出現(xiàn)既有系統(tǒng)化的專(zhuān)業(yè)知識(shí),也有碎片化的應(yīng)用/普及知識(shí),從而增強(qiáng)了知識(shí)關(guān)聯(lián)體系構(gòu)建的必要性。其次,在知識(shí)更新的方式上,既有質(zhì)變性的系統(tǒng)化更新,也有知識(shí)交互過(guò)程中產(chǎn)生的量變性質(zhì)的碎片化更新,知識(shí)交互同時(shí)具有了用戶體驗(yàn)與知識(shí)輸出的功能。再次,知識(shí)服務(wù)的典型特征體現(xiàn)在:面向自主需求和智慧服務(wù)、不確定性、強(qiáng)調(diào)用戶參與、按需使用與付費(fèi)以及基于群體創(chuàng)新等。[19]
從社會(huì)功能角度看,個(gè)人認(rèn)為,數(shù)字出版與圖書(shū)出版并無(wú)二致,那就是娛樂(lè)和教化。前者如網(wǎng)絡(luò)文學(xué)、網(wǎng)絡(luò)游戲、數(shù)字音樂(lè)以及網(wǎng)絡(luò)動(dòng)漫等;后者如電子圖書(shū)、數(shù)字報(bào)紙、數(shù)字期刊、網(wǎng)絡(luò)教育出版物、數(shù)據(jù)庫(kù)出版物以及手機(jī)出版物等。從上文對(duì)大數(shù)據(jù)背景下數(shù)字出版和知識(shí)服務(wù)的分析可以看出,知識(shí)服務(wù)更強(qiáng)調(diào)用戶為中心,根據(jù)用戶的信息偏好以及具體需要,采取個(gè)性化的服務(wù)方式,為用戶提供針對(duì)實(shí)際問(wèn)題的解決方案等,因此,可以把知識(shí)服務(wù)視為教化領(lǐng)域數(shù)字出版的深化。[20]依托大數(shù)據(jù)技術(shù),知識(shí)服務(wù)既可以整合已有的存量系統(tǒng)化知識(shí)資源,又可以整合社會(huì)上的相關(guān)碎片化知識(shí)資源,還可以通過(guò)知識(shí)交互產(chǎn)生新的知識(shí)。在此基礎(chǔ)上,構(gòu)建完整的知識(shí)關(guān)聯(lián)體系,實(shí)現(xiàn)系統(tǒng)知識(shí)和碎片知識(shí)的關(guān)聯(lián),自動(dòng)建立新知識(shí)與已有知識(shí)的關(guān)聯(lián),消除“信息超載”“知識(shí)碎片化”和“信息孤島”等問(wèn)題,促進(jìn)知識(shí)服務(wù)的深層次發(fā)展。[21]
所謂用戶體驗(yàn),簡(jiǎn)單講就是用戶的主觀感受,主要指用戶使用產(chǎn)品之前、期間和之后的認(rèn)知印象和回應(yīng)。[22]影響用戶體驗(yàn)的因素主要有四個(gè),即產(chǎn)品策略、用戶界面、技術(shù)以及運(yùn)營(yíng)等。[23]大數(shù)據(jù)通過(guò)量化用戶的愉悅度、參與度、接受度、留存度與任務(wù)完成度等指標(biāo),建立完整的用戶靜態(tài)與動(dòng)態(tài)畫(huà)像,改善影響用戶體驗(yàn)的因素,
實(shí)現(xiàn)用戶體驗(yàn)的優(yōu)化與迭代。
大數(shù)據(jù)在用戶體驗(yàn)上的功能訴求可以分為三個(gè),即基于銷(xiāo)售的智能推薦、基于選題的需求分析和基于創(chuàng)作的能力分析。所以,用戶體驗(yàn)的優(yōu)化與迭代應(yīng)從這三個(gè)方面展開(kāi)。
首先,應(yīng)對(duì)海量的用戶數(shù)據(jù)進(jìn)行最大限度的采集與整理,分析其靜態(tài)特征,包括統(tǒng)計(jì)學(xué)特征和行為特征,從而找到產(chǎn)品的潛在用戶,進(jìn)而提供精準(zhǔn)推薦服務(wù),進(jìn)行場(chǎng)景化的介紹,簡(jiǎn)化用戶選擇過(guò)程,提高用戶購(gòu)買(mǎi)體驗(yàn)。
其次,加強(qiáng)非結(jié)構(gòu)化數(shù)據(jù)的采集整理,尤其是潛在細(xì)分領(lǐng)域中用戶共同關(guān)注的話題、發(fā)表的言論、表達(dá)的思想等等,通過(guò)挖掘與分析,發(fā)現(xiàn)用戶數(shù)據(jù)背后所反映的深層思想和預(yù)見(jiàn)趨勢(shì),進(jìn)而策劃細(xì)分市場(chǎng)選題,并且在選題策劃過(guò)程中持續(xù)追蹤這些變化,不斷迭代,最終形成符合用戶需求的選題與產(chǎn)品。
最后,通過(guò)隱性知識(shí)標(biāo)引與隱性知識(shí)地圖構(gòu)建,尋找符合需求的潛在作者,并對(duì)作者的專(zhuān)業(yè)能力與創(chuàng)作能力進(jìn)行分析。隱性知識(shí)標(biāo)引通過(guò)隱性知識(shí)顯性化的方式進(jìn)行:其一是個(gè)人主動(dòng)提供,包括個(gè)人詳細(xì)信息、經(jīng)歷、創(chuàng)作的作品以及交互過(guò)程中的內(nèi)容輸出等,從中選取標(biāo)識(shí)個(gè)人的標(biāo)簽;其二是他人評(píng)價(jià),主要是在各種交互過(guò)程中周?chē)耸繉?duì)所輸出的內(nèi)容的各種評(píng)論、解讀以及態(tài)度等,從外部視角做出更客觀的評(píng)價(jià)。最后是系統(tǒng)自動(dòng)發(fā)現(xiàn),及時(shí)捕捉個(gè)人的隱性知識(shí),例如人與人的互動(dòng)過(guò)程中不自覺(jué)顯示的某些技能等。[24]隱性知識(shí)地圖的構(gòu)建主要通過(guò)分析與作者相關(guān)的數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系,包括作者與作品關(guān)系、領(lǐng)域內(nèi)作者之間關(guān)系以及領(lǐng)域內(nèi)作品之間關(guān)系等。根據(jù)作者的專(zhuān)業(yè)能力、創(chuàng)作能力與溝通能力確定作品的創(chuàng)作方式、表達(dá)方式以及傳播協(xié)作等。
大數(shù)據(jù)的價(jià)值由大數(shù)據(jù)的關(guān)聯(lián)性即大數(shù)據(jù)結(jié)構(gòu)表達(dá)。[25]大數(shù)據(jù)伴生的信息超載和信息孤島現(xiàn)象與數(shù)字出版的冪律分布和長(zhǎng)尾分布并存現(xiàn)象導(dǎo)致除少數(shù)頭部?jī)?nèi)容外,大多數(shù)內(nèi)容無(wú)法得到足夠的展示機(jī)會(huì)為用戶所知曉,部分劣質(zhì)內(nèi)容也無(wú)法及時(shí)處理,信噪比降低。解決這個(gè)問(wèn)題,就必須回歸大數(shù)據(jù)的價(jià)值根本,那就是通過(guò)關(guān)聯(lián)體系的構(gòu)建,充分運(yùn)用知識(shí)之間存在的多類(lèi)型、多維度、多層次的關(guān)聯(lián)關(guān)系,實(shí)現(xiàn)知識(shí)的挖掘、發(fā)現(xiàn)、驗(yàn)證、甄別以及過(guò)濾等。[26]
運(yùn)用大數(shù)據(jù)技術(shù)構(gòu)建知識(shí)關(guān)聯(lián),實(shí)現(xiàn)優(yōu)質(zhì)內(nèi)容的發(fā)現(xiàn)與劣質(zhì)內(nèi)容的過(guò)濾,可以從幾個(gè)方面展開(kāi):
首先,通過(guò)基于大數(shù)據(jù)的自動(dòng)標(biāo)引、社會(huì)標(biāo)引以及知識(shí)元標(biāo)引等構(gòu)建顯性知識(shí)、知識(shí)內(nèi)容以及學(xué)科知識(shí)等類(lèi)型的已有知識(shí)關(guān)聯(lián),在此基礎(chǔ)上,結(jié)合知識(shí)交互過(guò)程中的輸出,不斷將新產(chǎn)生知識(shí)納入既有知識(shí)體系的同時(shí),完善知識(shí)(包括交互過(guò)程中的輸出知識(shí),下同)的評(píng)價(jià)指標(biāo)體系,進(jìn)而建立隱性知識(shí)關(guān)聯(lián)與個(gè)性化的主題知識(shí)關(guān)聯(lián),通過(guò)知識(shí)之間的相互印證和用戶評(píng)價(jià)兩個(gè)角度達(dá)到知識(shí)發(fā)現(xiàn)與過(guò)濾的目的。
其次,從知識(shí)與知識(shí)之間、知識(shí)與人之間以及人與人之間等三個(gè)維度完善關(guān)聯(lián)關(guān)系,知識(shí)與知識(shí)之間的關(guān)聯(lián)即上文顯性知識(shí)之間的關(guān)聯(lián);知識(shí)與人之間的關(guān)聯(lián)意味著必須對(duì)人即讀者和作者進(jìn)行標(biāo)引,這種標(biāo)引既包括統(tǒng)計(jì)學(xué)意義上的特征標(biāo)引,也包括行為意義上的特征標(biāo)引,在此基礎(chǔ)上,通過(guò)知識(shí)與作者之間的多樣化關(guān)聯(lián),確定知識(shí)內(nèi)容的真?zhèn)?。知識(shí)內(nèi)容真?zhèn)蔚谋孀R(shí)通過(guò)兩個(gè)途徑實(shí)現(xiàn):其一是類(lèi)似文獻(xiàn)分析中的共引和耦合分析,發(fā)現(xiàn)指定知識(shí)內(nèi)容的關(guān)聯(lián)關(guān)系,從而做出正確判斷;其二是用戶評(píng)價(jià),通過(guò)多數(shù)人的看法得出正確結(jié)論。
最后是綜合運(yùn)用簡(jiǎn)單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)和因果關(guān)聯(lián)等規(guī)則,及時(shí)發(fā)現(xiàn)異常數(shù)據(jù),清除垃圾賬號(hào)與垃圾信息,減少噪聲。通過(guò)簡(jiǎn)單關(guān)聯(lián)規(guī)則中兩類(lèi)變量(例如交互過(guò)程中輸出內(nèi)容與原始內(nèi)容)之間相關(guān)程度的測(cè)算,判斷輸出內(nèi)容質(zhì)量的優(yōu)劣與輸出動(dòng)機(jī);通過(guò)行為發(fā)生的時(shí)間對(duì)行為(例如內(nèi)容輸出的行為與時(shí)間)進(jìn)行時(shí)序關(guān)聯(lián)計(jì)算,判斷輸出者的勤勉程度或者輸出內(nèi)容的性質(zhì);通過(guò)關(guān)聯(lián)的時(shí)序、強(qiáng)度、特異性、可重復(fù)性、一致性、合理性以及相似性等標(biāo)準(zhǔn),確定因果關(guān)聯(lián)成立的可能性,從而發(fā)現(xiàn)新知識(shí)、判斷現(xiàn)有知識(shí)的正確與否。[27]
大數(shù)據(jù)對(duì)數(shù)字出版流程優(yōu)化的作用主要通過(guò)數(shù)據(jù)分析與挖掘?qū)崿F(xiàn)決策支持,為產(chǎn)品生命周期不同階段的內(nèi)外資源整合提供識(shí)別與選擇、汲取與配置、激活和有機(jī)融合,構(gòu)建企業(yè)價(jià)值鏈,[28]促進(jìn)開(kāi)發(fā)過(guò)程中各個(gè)環(huán)節(jié)的有效銜接與資源利用率的最大化,及時(shí)發(fā)現(xiàn)并處理運(yùn)營(yíng)過(guò)程中的隱患,加快產(chǎn)品的更新迭代,實(shí)現(xiàn)產(chǎn)品的協(xié)同運(yùn)營(yíng)。
通過(guò)大數(shù)據(jù)技術(shù)整合資源,推動(dòng)產(chǎn)品協(xié)同運(yùn)營(yíng)應(yīng)從以下幾個(gè)方面展開(kāi):
首先,在選題策劃階段應(yīng)從內(nèi)容和主創(chuàng)作者兩個(gè)角度考慮。內(nèi)容方面,通過(guò)大數(shù)據(jù)對(duì)現(xiàn)有海量文獻(xiàn)數(shù)據(jù)分析與挖掘,根據(jù)關(guān)注度、詞頻統(tǒng)計(jì)、共引度以及耦合度等多種指標(biāo),及時(shí)發(fā)現(xiàn)學(xué)科研究熱點(diǎn)方向、學(xué)科細(xì)分市場(chǎng)盲點(diǎn)(例如研究或者科普)、不同層次讀者關(guān)注的重點(diǎn)等確定選題方向(即所謂思想),然后,通過(guò)用戶畫(huà)像分析用戶的應(yīng)用場(chǎng)景,據(jù)此確定不同應(yīng)用場(chǎng)景的表達(dá)方式。主創(chuàng)作者方面,在通過(guò)現(xiàn)有海量文獻(xiàn)數(shù)據(jù)分析與挖掘的同時(shí),建立作者數(shù)據(jù)庫(kù),對(duì)作者的專(zhuān)業(yè)研究方向、學(xué)術(shù)關(guān)注度、媒體關(guān)注度、學(xué)術(shù)傳播度、用戶關(guān)注度、創(chuàng)作風(fēng)格、粉絲群體以及動(dòng)態(tài)行為等跟蹤分析,根據(jù)作品應(yīng)用場(chǎng)景精準(zhǔn)選定作者?;诎鏅?quán)引進(jìn)的選題分析則在此基礎(chǔ)上增加版權(quán)作品輸出區(qū)的市場(chǎng)分析、作者與作品在輸入?yún)^(qū)的影響力與前景分析等。
其次,在內(nèi)容生產(chǎn)階段主要考慮兩個(gè)方面:一是場(chǎng)景化的表達(dá)與迭代;二是內(nèi)容關(guān)聯(lián)的及時(shí)建立與更新。前者根據(jù)用戶的應(yīng)用場(chǎng)景細(xì)分化,并對(duì)不同場(chǎng)景的相關(guān)數(shù)據(jù)資源予以整合,實(shí)現(xiàn)內(nèi)容的一次創(chuàng)作,多次發(fā)布。在此基礎(chǔ)上,確定與應(yīng)用場(chǎng)景相匹配的表達(dá)方式和交付方式,例如沉浸式深度或者淺度閱讀、陪伴式閱讀(親子閱讀可歸入此類(lèi))、伴隨式閱讀(音頻讀物),可分別采用專(zhuān)業(yè)論述或者普及講述,音頻或者文字等。在創(chuàng)作過(guò)程中,不斷根據(jù)用戶反饋協(xié)助作者調(diào)整創(chuàng)作思路,完善交付設(shè)計(jì),實(shí)現(xiàn)產(chǎn)品的更新迭代。后者則在內(nèi)容發(fā)布更新的同時(shí),不斷建立完善內(nèi)容關(guān)聯(lián),實(shí)現(xiàn)交付的增值與迭代,方式如上文所述。
最后,在產(chǎn)品傳播階段,通過(guò)大數(shù)據(jù)技術(shù)著重解決產(chǎn)品與應(yīng)用場(chǎng)景的連接問(wèn)題,提高產(chǎn)品交付效率。這個(gè)連接主要通過(guò)兩條途徑實(shí)現(xiàn):一是通過(guò)大數(shù)據(jù)分析找到目標(biāo)用戶及其使用場(chǎng)景,通過(guò)用戶畫(huà)像實(shí)現(xiàn)產(chǎn)品的智能化精準(zhǔn)推薦;二是通過(guò)針對(duì)性的誘因設(shè)計(jì),刺激用戶的主動(dòng)傳播行為,實(shí)現(xiàn)產(chǎn)品的裂變傳播。其中,智能化推薦通過(guò)兩種方式實(shí)現(xiàn),一種是整合用戶與應(yīng)用場(chǎng)景連接渠道基礎(chǔ)上的主動(dòng)推薦,例如智能音箱最適合伴隨式閱讀場(chǎng)景,因此,通過(guò)智能音箱的實(shí)物分發(fā)渠道向用戶推薦適合伴隨場(chǎng)景的有聲讀物;另一種是基于關(guān)聯(lián)(此處關(guān)聯(lián)指普遍意義上的關(guān)聯(lián),不包括知識(shí)關(guān)聯(lián))規(guī)則挖掘的關(guān)聯(lián)推薦,通過(guò)分析關(guān)聯(lián)的提升度、置信度以及支持度等指標(biāo)找到強(qiáng)關(guān)聯(lián)規(guī)則,為用戶提供擴(kuò)展性推薦。
供需鏈優(yōu)化的主要作用在于及時(shí)識(shí)別經(jīng)營(yíng)風(fēng)險(xiǎn),降低運(yùn)營(yíng)成本。大數(shù)據(jù)對(duì)供需鏈優(yōu)化的兩個(gè)作用主要通過(guò)兩端即上游供應(yīng)端和下游需求端的歷史數(shù)據(jù)分析研究,在發(fā)現(xiàn)與創(chuàng)造用戶需求的前提下判斷供應(yīng)端的各種能力與風(fēng)險(xiǎn),提高經(jīng)營(yíng)水平。
通過(guò)大數(shù)據(jù)技術(shù)優(yōu)化供需鏈,實(shí)現(xiàn)經(jīng)營(yíng)效率的提升應(yīng)從兩方面展開(kāi):
從供應(yīng)端角度重點(diǎn)加強(qiáng)能力分析,包括供應(yīng)端的生產(chǎn)能力、響應(yīng)能力、管理能力與風(fēng)險(xiǎn)防范能力等。數(shù)字出版的供應(yīng)端包括內(nèi)容供應(yīng)者、技術(shù)供應(yīng)者以及載體供應(yīng)者,其中,內(nèi)容供應(yīng)者是重點(diǎn),各種UGC、PGC與OGC都可以歸入此類(lèi)。首先通過(guò)大數(shù)據(jù)采集數(shù)字出版單位自身的業(yè)務(wù)數(shù)據(jù)、用戶體驗(yàn)、交互數(shù)據(jù)等,分析并確定自身的定位、核心功能,進(jìn)行動(dòng)態(tài)修正與調(diào)整。在此基礎(chǔ)上,通過(guò)對(duì)PGC與OGC等內(nèi)容供應(yīng)者的分析考察,建立基于知識(shí)生產(chǎn)的分享與協(xié)作網(wǎng)絡(luò),確定系統(tǒng)化的內(nèi)容來(lái)源與供應(yīng)節(jié)奏;建立UGC內(nèi)容生產(chǎn)者的篩選與審核辦法,并對(duì)內(nèi)容建立嚴(yán)格的審查辦法,確保輸出內(nèi)容的合法性;建立對(duì)UGC內(nèi)容生產(chǎn)者的發(fā)掘與培養(yǎng)辦法,逐步往PGC方向發(fā)展,提升其內(nèi)容生產(chǎn)質(zhì)量;結(jié)合人工審核與用戶反饋,建立優(yōu)質(zhì)內(nèi)容的篩選、評(píng)價(jià)與深加工流程。
從需求端角度重點(diǎn)在于通過(guò)對(duì)各種半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的分析,主要是基于知識(shí)元分析的內(nèi)容、內(nèi)容交互過(guò)程中的輸出內(nèi)容(例如書(shū)評(píng))以及各種自媒體內(nèi)容等,發(fā)現(xiàn)空白或者尚未滿足市場(chǎng)的內(nèi)容需求,通過(guò)與之有關(guān)的相關(guān)關(guān)聯(lián)與因果關(guān)聯(lián)分析,確定所需基本的表達(dá)思想,進(jìn)一步通過(guò)用戶畫(huà)像所呈現(xiàn)的應(yīng)用場(chǎng)景確定內(nèi)容的表達(dá)方式。其次是用戶的基本特征數(shù)據(jù)、消費(fèi)記錄數(shù)據(jù)、地理位置數(shù)據(jù)、線上互動(dòng)數(shù)據(jù)、線下行為數(shù)據(jù)、web公共數(shù)據(jù)以及社交生成數(shù)據(jù)等[29]確定內(nèi)容生產(chǎn)元素與用戶數(shù)據(jù)之間的關(guān)系。最后通過(guò)與供應(yīng)端內(nèi)容生產(chǎn)者的匹配,確定不同內(nèi)容生產(chǎn)者的分工合作,滿足市場(chǎng)需求。
大數(shù)據(jù)對(duì)出版資源的深度開(kāi)發(fā)在自有資源整合的基礎(chǔ)上完成知識(shí)的組織、關(guān)聯(lián)、挖掘與重構(gòu),完成知識(shí)服務(wù)基本架構(gòu)的搭建,進(jìn)一步拓展整合外部資源并及時(shí)更新,形成知識(shí)服務(wù)產(chǎn)品的更新迭代,幫助用戶不斷實(shí)現(xiàn)知識(shí)發(fā)現(xiàn)。
通過(guò)大數(shù)據(jù)整合資源,推動(dòng)知識(shí)服務(wù)不斷升級(jí),主要通過(guò)以下幾個(gè)方面展開(kāi):
首先是在根據(jù)上述目標(biāo)用戶畫(huà)像,確定知識(shí)服務(wù)產(chǎn)品主題的前提下,組織所需的內(nèi)容資源,對(duì)資源進(jìn)行深加工,構(gòu)建包括知識(shí)元標(biāo)引、隱性知識(shí)標(biāo)引、動(dòng)態(tài)標(biāo)引以及社會(huì)標(biāo)引在內(nèi)的知識(shí)標(biāo)引體系,據(jù)此建立完整的知識(shí)關(guān)聯(lián)。
其次是不斷對(duì)知識(shí)服務(wù)產(chǎn)品運(yùn)營(yíng)過(guò)程中通過(guò)知識(shí)交互產(chǎn)生的輸出內(nèi)容進(jìn)行標(biāo)引,與已有知識(shí)內(nèi)容建立關(guān)聯(lián);及時(shí)獲取社會(huì)新產(chǎn)生的知識(shí)內(nèi)容與信息資訊,在知識(shí)標(biāo)引的基礎(chǔ)上將其納入知識(shí)體系。在形成動(dòng)態(tài)知識(shí)關(guān)聯(lián)的同時(shí)不斷擴(kuò)展知識(shí)體系的邊界,實(shí)現(xiàn)知識(shí)服務(wù)的更新迭代。
最后是根據(jù)用戶的行為特征與知識(shí)之間的連接關(guān)系建立個(gè)性化的關(guān)聯(lián)關(guān)系,為用戶提供個(gè)性化的知識(shí)體系,實(shí)現(xiàn)個(gè)人意義上的知識(shí)發(fā)現(xiàn)。例如,用戶學(xué)習(xí)輸入假說(shuō),動(dòng)機(jī)可能是研究第二外語(yǔ)教學(xué)理論,也可能在研究知識(shí)服務(wù)運(yùn)營(yíng),還可能在研究寫(xiě)作理論。因此,必須綜合考察用戶的瀏覽內(nèi)容、創(chuàng)作內(nèi)容(包含引文)、交互內(nèi)容以及其他行為特征,據(jù)此為用戶提供或二語(yǔ)教學(xué),或知識(shí)服務(wù)運(yùn)營(yíng),或?qū)懽骼碚撗芯康年P(guān)聯(lián)內(nèi)容,提供精準(zhǔn)的內(nèi)容推薦,有效促進(jìn)用戶的知識(shí)吸收,推動(dòng)知識(shí)輸出,實(shí)現(xiàn)知識(shí)的分享與協(xié)作。
與傳統(tǒng)出版比較,數(shù)字出版融合圖書(shū)、期刊、報(bào)紙、廣播電視以及互聯(lián)網(wǎng)出版等多種形態(tài),與知識(shí)服務(wù)的界限日趨模糊,不僅強(qiáng)調(diào)內(nèi)容的系統(tǒng)性、關(guān)聯(lián)性、交互性,更強(qiáng)調(diào)表達(dá)的場(chǎng)景化、內(nèi)容的個(gè)性化和推薦的精準(zhǔn)化,提高思想到達(dá)的有效性。這些特征的產(chǎn)生一方面是大數(shù)據(jù)在數(shù)字出版領(lǐng)域發(fā)展的必然結(jié)果;另一方面,通過(guò)大數(shù)據(jù)技術(shù)得到了強(qiáng)化。
大數(shù)據(jù)通過(guò)對(duì)各種信息數(shù)據(jù)資源的整合、分析、關(guān)聯(lián)、挖掘與重構(gòu)對(duì)用戶畫(huà)像、長(zhǎng)尾經(jīng)營(yíng)、流程再造、供需鏈優(yōu)化以及知識(shí)服務(wù)深化等方面產(chǎn)生了深刻影響,形成真正以用戶為中心的內(nèi)容生產(chǎn)、交互與交付格局,從根本上顛覆了傳統(tǒng)出版的運(yùn)營(yíng)模式。在這種背景下,數(shù)字出版企業(yè)必須從用戶體驗(yàn)優(yōu)化、內(nèi)容的發(fā)掘與過(guò)濾、產(chǎn)品的協(xié)同運(yùn)營(yíng)、供需鏈結(jié)構(gòu)的優(yōu)化以及知識(shí)服務(wù)的更新等方面入手,推動(dòng)出版業(yè)的全面轉(zhuǎn)型發(fā)展。