劉銀娣
[摘 要] 探討人工智能應(yīng)用給出版業(yè)帶來的發(fā)展機(jī)遇,包括促進(jìn)出版大數(shù)據(jù)向大機(jī)遇的轉(zhuǎn)化、提高出版生產(chǎn)效率、促進(jìn)圖書發(fā)現(xiàn)。梳理出版業(yè)應(yīng)用人工智能面臨的挑戰(zhàn),包括讀者數(shù)據(jù)的獲取難題、出版規(guī)律性的發(fā)現(xiàn)和分析難題,以及具備出版經(jīng)驗(yàn)的智能科學(xué)家人才缺乏問題。指出要應(yīng)對(duì)這些挑戰(zhàn),出版業(yè)在人工智能應(yīng)用過程中要注意數(shù)據(jù)驅(qū)動(dòng)而非代替人類決策、訓(xùn)練人機(jī)交互,還要提高出版人的專業(yè)素養(yǎng),識(shí)別出版市場規(guī)律。
[關(guān)鍵詞] 出版業(yè) 人工智能 大數(shù)據(jù)
[中圖分類號(hào)] G237 [文獻(xiàn)標(biāo)識(shí)碼] A [文章編號(hào)] 1009-5853 (2018) 04-0089-04
[Abstract] The development opportunities brought by artificial intelligence technology in the publishing industry include promoting the transformation of publishing big data into great opportunities, improving the productivity of publication and enhancing the discovery of books. The challenges the publishing industrys AI applications will face include obtaining readership data, discovering and analyzing best-selling patterns, and the shortage of intelligent scientists with publishing experiences. To meet these challenges, the publishing industry should pay attention to data-driven rather than data-soly decision making, train human-computer interaction in the application of artificial intelligence, improve the publishing professionalism and identify the publishing market rules.
[Key words] Publishing industry Artificial intelligence Big data
隨著人工智能(Artificial Intelligence,AI)程序“阿爾法狗”(AlphaGo)完勝九段棋手李世石,“人工智能”成為2016年最熱門的科技名詞。人工智能先驅(qū)皮埃羅·斯加魯菲(Piero Scaruffi)在《2017未來媒體報(bào)告》中指出:人工智能與機(jī)器人寫作是未來媒體十大發(fā)展趨勢之一[1]。事實(shí)上,機(jī)器人寫作已經(jīng)成為行業(yè)現(xiàn)實(shí),媒體行業(yè)對(duì)于人工智能應(yīng)用的探索也早已開啟,出版業(yè)也不例外。2016 年年初,一篇由人工智能與人類合作完成的短篇小說《當(dāng)有一天電腦寫起了小說》(Konpyuta ga shosetsu wo kaku hi)成功通過了《日本經(jīng)濟(jì)新聞》“星新一文學(xué)獎(jiǎng)”的初審[2]?;仡櫝霭鏄I(yè)的發(fā)展,每一次變革都離不開技術(shù)的推動(dòng)。這些技術(shù)變革既對(duì)現(xiàn)有的出版流程和模式形成挑戰(zhàn),也給出版業(yè)帶來難得的發(fā)展機(jī)遇。人工智能的發(fā)展也不例外。
1 人工智能為出版業(yè)帶來的機(jī)遇
人工智能給出版業(yè)帶來不少發(fā)展機(jī)遇,主要包括如下方面。
1.1 促進(jìn)出版大數(shù)據(jù)向出版大機(jī)遇的轉(zhuǎn)化
正如科學(xué)、專業(yè)和學(xué)術(shù)出版領(lǐng)域的內(nèi)容分銷商英捷特(Ingenta)首席執(zhí)行官大衛(wèi)·蒙哥馬利(David Montgomery)指出的,在云計(jì)算和大數(shù)據(jù)技術(shù)的推動(dòng)下,出版商日益認(rèn)識(shí)到數(shù)據(jù)對(duì)于出版的重要性,紛紛開始投資建立數(shù)據(jù)基礎(chǔ)設(shè)施,以獲取有關(guān)消費(fèi)者和產(chǎn)品的海量信息。這些信息可以幫助出版商更好地了解其讀者,告訴出版商讀者的閱讀動(dòng)機(jī)和閱讀行為。毫無疑問,這類“大數(shù)據(jù)”可以幫助出版商在出版產(chǎn)品策劃、銷售和營銷方式上做出更睿智的決策[3]。然而,數(shù)據(jù)如此龐雜,而且單憑人類自身的力量無法對(duì)如此巨量的信息快速有效地做出處理。因此,出版大數(shù)據(jù)中蘊(yùn)藏的“知識(shí)”并未得到充分挖掘。人工智能技術(shù)則可以幫助出版商解決這個(gè)問題,將出版大數(shù)據(jù)轉(zhuǎn)化為出版大機(jī)遇。
1.2 簡化出版流程,提高出版效率
人工智能還是提高出版運(yùn)營速度和效率的重要手段??萍汲霭嫔淘缇烷_始使用初級(jí)的人工智能技術(shù)來簡化工作流程,自動(dòng)化同行評(píng)審所涉及的工作任務(wù)。例如跨國科技出版商愛思唯爾(Elsevier)新的編輯系統(tǒng)“伊威瑟”(EVISE)就應(yīng)用人工智能技術(shù)檢查論文的重復(fù)率;根據(jù)論文內(nèi)容在海量作者資源庫中發(fā)現(xiàn)和建議同行評(píng)審人;審查同行評(píng)審人員的研究狀況、科學(xué)表現(xiàn)以及和論文作者可能存在的利益沖突;自動(dòng)給作者、同行評(píng)審撰寫和發(fā)送郵件;提醒同行評(píng)審工作進(jìn)度,如果在一定時(shí)間內(nèi)沒有得到回復(fù)則刪除該同行評(píng)審,邀請備用審閱者;自動(dòng)向作者發(fā)送論文錄用、修改或被拒絕的通知;自動(dòng)給審稿人發(fā)送感謝信[4]。除了科技出版領(lǐng)域外,大眾出版領(lǐng)域也開始運(yùn)用人工智能技術(shù)進(jìn)行稿件審查。例如閱文集團(tuán)在編輯環(huán)節(jié)開發(fā)和應(yīng)用人工智能系統(tǒng)進(jìn)行反剽竊以及對(duì)政治、社會(huì)敏感內(nèi)容和涉黃內(nèi)容的挖掘和審查,極大地提高了審稿工作的效率。此外,在創(chuàng)造性要求相對(duì)較低的內(nèi)容產(chǎn)品編創(chuàng)環(huán)節(jié),也開始利用人工智能提高效率。例如龍?jiān)雌诳W(wǎng)旗下的人工智能寫作平臺(tái)“知識(shí)樹”支持個(gè)人或企業(yè)用戶自行按照不同主題和關(guān)鍵詞將知識(shí)聚合,亦即定義圖書一部分內(nèi)容,其后系統(tǒng)會(huì)自動(dòng)完成剩下的內(nèi)容。在“知識(shí)樹”的幫助下,編輯用一個(gè)半小時(shí)就可以完成一本書的編創(chuàng)工作,極大地提高了內(nèi)容生產(chǎn)效率。
1.3 增強(qiáng)圖書發(fā)現(xiàn)
根據(jù)2016年9月貝瑞特-科特(Berrett-Koehler)發(fā)布的報(bào)告,2015年美國出版的書籍?dāng)?shù)量比2006年上升了400%,達(dá)到了約一百萬種。2016年,我國圖書出版的品種數(shù)也達(dá)到了499884萬種,與2007年的248283種相比上升了200%[5]。然而,盡管圖書出版種類上升速度如此之快,讀者卻表示發(fā)現(xiàn)自己需要的圖書變得更加困難;出版社也發(fā)現(xiàn)越來越難為其出版的圖書找到合適的讀者。圖書發(fā)現(xiàn)成為制約出版業(yè)發(fā)展最大的問題之一。作者和出版商賠錢,讀者則浪費(fèi)大量時(shí)間尋找需要的內(nèi)容產(chǎn)品。這個(gè)問題單靠人力資源一直無法解決,而人工智能則可以有效促進(jìn)圖書發(fā)現(xiàn)。人工智能可以提供有意義的分析來為采購決策提供信息,或創(chuàng)建有效的機(jī)制將書籍與最喜歡它們的讀者連接起來。例如,英科特(Inkitt)通過制定算法分析用戶的閱讀模式,基于讀者的閱讀模式為其推薦圖書。美國國家科學(xué)基金會(huì)(National Science Foundation)資助的出版創(chuàng)新項(xiàng)目布克斯比(Booxby)則與英科特不同,它讓計(jì)算機(jī)模擬每本圖書讀者的閱讀行為,然后通過并基于內(nèi)容分析來識(shí)別、量化和預(yù)測讀者經(jīng)驗(yàn)。這兩種方法哪種更有效目前還沒有明確結(jié)論,但是其預(yù)測準(zhǔn)確度遠(yuǎn)超編輯和圖書營銷人員則是通過實(shí)驗(yàn)驗(yàn)證了的[6]。
2 人工智能應(yīng)用于出版業(yè)的挑戰(zhàn)
人工智能在出版業(yè)的應(yīng)用也面臨諸多挑戰(zhàn):一是數(shù)據(jù)獲取仍然面臨困難;二是人工智能的預(yù)測需要對(duì)出版規(guī)律的確認(rèn)和提取,然而目前尚未發(fā)現(xiàn)支持出版規(guī)律性的數(shù)據(jù);三是人才的缺乏。
2.1 讀者數(shù)據(jù)的獲取難題
第三次人工智能浪潮最明顯的特征是:以大數(shù)據(jù)為基石。正是由于大數(shù)據(jù)和深度學(xué)習(xí)技術(shù)的結(jié)合,才促使第三次人工智能熱潮的出現(xiàn)。當(dāng)人工智能成為生產(chǎn)力時(shí),數(shù)據(jù)就成為重要的生產(chǎn)要素。盡管近年來出版商已經(jīng)著力于建立自己的數(shù)據(jù)基礎(chǔ)設(shè)施,也獲得數(shù)倍于以往的數(shù)據(jù),然而因?yàn)槌霭鏄I(yè)過去長期采用B2B(Business to Business)的商業(yè)運(yùn)行模式,出版企業(yè)面對(duì)的是銷售渠道而不是讀者,因此它們并不擁有廣泛的讀者數(shù)據(jù)。讀者數(shù)據(jù)被鎖定在亞馬遜、蘋果、谷歌等內(nèi)容分銷平臺(tái)手中,而這些海量的讀者需求和閱讀行為數(shù)據(jù)才是人工智能進(jìn)行暢銷書機(jī)器預(yù)測、智能化推薦等出版業(yè)應(yīng)用的基礎(chǔ),如何從這些企業(yè)獲取數(shù)據(jù)是出版商面臨的一個(gè)相當(dāng)大的難題。
2.2 出版規(guī)律性的發(fā)現(xiàn)和分析難題
2016年,朱迪·阿切爾(Jodie Archer )和馬修·喬克斯( Matthew L. Jockers )合作出版了《暢銷書代碼:轟動(dòng)小說解析》(The Bestseller Code: Anatomy of the Blockbuster Novel)一書。該書作者從市場上選取5000本暢銷書,抽取圖書文本和亞馬遜、臉書等網(wǎng)上書店和社交網(wǎng)絡(luò)平臺(tái)對(duì)該書主要內(nèi)容的描述和評(píng)論作為元數(shù)據(jù)建立暢銷書預(yù)測算法[7]。出版人當(dāng)然希望這本書破解圖書暢銷的秘訣,然而很遺憾,盡管測試表明其預(yù)測準(zhǔn)確性高于普通人類編輯,然而其準(zhǔn)確性仍然非常低,未能完全發(fā)現(xiàn)暢銷書的真正基因和密碼。英科特宣稱其為“數(shù)據(jù)驅(qū)動(dòng)的出版商”,然而它采用的暢銷書發(fā)現(xiàn)方法是讓作者將其手稿上傳到英科特,供平臺(tái)上的讀者免費(fèi)閱讀部分或完整內(nèi)容,然后根據(jù)讀者閱讀量、評(píng)論和投票等參與行為確定未來的暢銷書。換句話說,他們的模型是以電子方式發(fā)布書稿,看看有沒有人喜歡它。這種方式未免過于簡單,而且因其平臺(tái)讀者有限,數(shù)據(jù)偏差也是一個(gè)問題。亞馬遜的智能化推薦則主要基于讀者的歷史閱讀數(shù)據(jù)。然而,泰勒·畢肖普(Tyler Bishop)組織的一項(xiàng)讀者調(diào)查顯示幾乎沒有人對(duì)亞馬遜的書籍建議感到滿意[8]。如果不理解讀者為什么讀某本書,不能真正發(fā)現(xiàn)出版業(yè)的規(guī)律性,就很難利用人工智能建立一個(gè)有效的系統(tǒng)去發(fā)現(xiàn)下一本暢銷書,或做出個(gè)性化的精準(zhǔn)推薦。
2.3 具備出版經(jīng)驗(yàn)的智能科學(xué)家人才缺乏
《暢銷書代碼:轟動(dòng)小說解析》的兩位作者都是計(jì)算機(jī)專業(yè)出身;英科特的創(chuàng)始人兼首席執(zhí)行官阿里·阿爾巴扎(Ali Albazaz)的專業(yè)是計(jì)算機(jī)科學(xué),另一位聯(lián)合創(chuàng)始人琳達(dá)·加芬(Linda Gavin)的專業(yè)方向是設(shè)計(jì)藝術(shù)。他們不了解出版,不知道一個(gè)編輯的工作是什么,缺乏對(duì)內(nèi)容價(jià)值的把握,甚至不知道如何發(fā)布或出售一本書,又怎么可能開發(fā)出一套適合出版業(yè)的人工智能應(yīng)用呢?目前,專業(yè)出版人不懂人工智能技術(shù),而那些進(jìn)行人工智能出版業(yè)應(yīng)用技術(shù)開發(fā)的人又大多缺乏出版經(jīng)驗(yàn)。缺乏具備出版經(jīng)驗(yàn)和知識(shí)的智能科學(xué)家人才,將會(huì)極大減緩出版業(yè)人工智能合理應(yīng)用的步伐。
3 出版業(yè)應(yīng)用人工智能的建議
人工智能在出版業(yè)的應(yīng)用并非要完全取代人類編輯、營銷和銷售人員的工作;要讓人工智能成為出版業(yè)升級(jí)發(fā)展的有效工具,需要將人類和人工智能的優(yōu)勢結(jié)合起來。
3.1 數(shù)據(jù)驅(qū)動(dòng)而非代替人類決策
對(duì)于出版業(yè)而言,確定讀者的需要是一項(xiàng)艱巨的任務(wù),因?yàn)椴豢赡艽笠?guī)模地追蹤讀者偏好。傳統(tǒng)出版業(yè)的選題、組稿、營銷和銷售決策建立在編輯和出版代理人的學(xué)識(shí)、經(jīng)驗(yàn)、直覺基礎(chǔ)上,并據(jù)此選擇出版可能會(huì)引起讀者共鳴的作品。然而各國出版業(yè)廣泛存在的“滯脹”現(xiàn)象就是這種決策失敗的后果之一。艾瑞克·歐塞(Erik Ose)發(fā)表的一篇文章《制漿是出版業(yè)的骯臟小秘密 》就指出傳統(tǒng)出版商每年由于市場預(yù)測失敗,至少要將其25%的庫存化為紙漿[9]。這是巨大的浪費(fèi)。這也是出版業(yè)人工智能應(yīng)用最大的用武之地。在選題策劃方面,可以根據(jù)社會(huì)和文化熱潮、互聯(lián)網(wǎng)熱點(diǎn)、銷售數(shù)據(jù)等對(duì)選題進(jìn)行智能分析;在營銷決策方面,人工智能可以根據(jù)網(wǎng)絡(luò)書店和閱讀平臺(tái)的銷售數(shù)據(jù)、閱讀數(shù)據(jù)、評(píng)論數(shù)據(jù),幫助出版社制定有效的營銷決策;在銷售決策方面,基于大數(shù)據(jù)的智能分發(fā)和個(gè)性化推薦,可以做到千人千面,將讀者真正需要的內(nèi)容送到讀者面前。然而,數(shù)據(jù)驅(qū)動(dòng)決策并不意味著數(shù)據(jù)代替人類決策,人工智能只是為人類提供更科學(xué)的方法和手段。完全依賴數(shù)據(jù)決策,也許會(huì)使出版業(yè)生產(chǎn)出更多同質(zhì)化產(chǎn)品。因此,最終還需要由人類在數(shù)據(jù)驅(qū)動(dòng)決策和對(duì)市場的直覺判斷間達(dá)到平衡,出版的最終決策權(quán)仍然應(yīng)當(dāng)掌握在人類手中。
3.2 提高出版專業(yè)素養(yǎng),識(shí)別出版市場規(guī)律
目前,人工智能已經(jīng)滲透到出版業(yè)的各個(gè)環(huán)節(jié),從選題策劃環(huán)節(jié)的暢銷書機(jī)器預(yù)測、創(chuàng)作環(huán)節(jié)的自動(dòng)化寫作和編輯環(huán)節(jié)的自動(dòng)化審稿,再到營銷環(huán)節(jié)的智能化推薦。然而,除了一些簡單的重復(fù)性工作在人工智能的幫助下實(shí)現(xiàn)了生產(chǎn)效率的提高以外,其他應(yīng)用大多還處于實(shí)驗(yàn)階段,尚沒有哪個(gè)出版企業(yè)的人工智能應(yīng)用能夠真正有效地預(yù)測或創(chuàng)作出一本暢銷書。技術(shù)在出版業(yè)中的可能性是無止境的,然而這個(gè)可能性還要依賴于人類的知識(shí)才能實(shí)現(xiàn)。如果出版人對(duì)于圖書在市場上獲得成功或失敗的原因一無所知,那又如何指導(dǎo)機(jī)器學(xué)習(xí)的方向呢?人工智能的發(fā)展是一面鏡子,人工智能并非會(huì)創(chuàng)作,也并非會(huì)判斷、會(huì)預(yù)測,它們只會(huì)通過學(xué)習(xí)來無限模擬人類活動(dòng)的某一方面;而我們則需要決定“要讓人工智能像人類的哪一個(gè)方面”。這一決定需要我們對(duì)讀者本身、對(duì)出版和文化本身有更深的理解。因此,要讓人工智能在出版業(yè)的應(yīng)用更加有效,出版商和編輯還需要進(jìn)一步提升專業(yè)素養(yǎng),找出導(dǎo)致人們愛上一本書的所有可能的原因和規(guī)律。人工智能可以將所有的數(shù)據(jù)映射到讀者身上,并通過訓(xùn)練來不斷完善和調(diào)整自己的算法,從而創(chuàng)作出更接近人類創(chuàng)作規(guī)律的作品,提高預(yù)測的準(zhǔn)確性,以及不斷優(yōu)化性能來處理更加復(fù)雜的出版工作。
3.3 訓(xùn)練人機(jī)交互,實(shí)現(xiàn)人機(jī)協(xié)同
由于人工智能的介入,以前以人為主導(dǎo)的出版物創(chuàng)作、選題、組稿、編校、營銷和銷售過程逐步發(fā)展成智能機(jī)器參與度越來越高的人機(jī)協(xié)同的信息生產(chǎn)和傳播過程。在人工智能技術(shù)浪潮下,人類編輯不會(huì)完全被人工智能取代,但是人類也需要重新思考和提升自身獨(dú)有的優(yōu)勢,將文化創(chuàng)作者的情懷與工程師的嚴(yán)謹(jǐn)結(jié)合起來,實(shí)現(xiàn)價(jià)值的“向上升級(jí)”。通過引入機(jī)器承擔(dān)重復(fù)、復(fù)雜和耗時(shí)的工作,讓人類作者和編輯縮短認(rèn)知周期,將精力用來專注于價(jià)值更高的項(xiàng)目。人類將處于出版過程的控制中心,指示機(jī)器遵循編輯和業(yè)務(wù)規(guī)則。機(jī)器將執(zhí)行和分析大量數(shù)據(jù),基于這些數(shù)據(jù)進(jìn)行實(shí)時(shí)預(yù)測和輔助決策。在未來,讓人做人擅長的事,機(jī)器做機(jī)器擅長的事,訓(xùn)練人機(jī)交互,實(shí)現(xiàn)人機(jī)協(xié)同,才能讓出版人的專業(yè)主義優(yōu)勢和人工智能的高效智能生產(chǎn)更為完美地結(jié)合在一起。
正如科技視頻媒體“冷聚變電視臺(tái)”(Cold-FusionTV)在其節(jié)目《我們正在邁向人工意識(shí)時(shí)代嗎》中所說,“人工智能研究的原點(diǎn)是人腦,是人類對(duì)于自己大腦的理解的反應(yīng)”,所有的規(guī)律和奧秘其實(shí)都在我們自身。人工智能可以幫助我們擴(kuò)大出版范圍,增強(qiáng)出版人的能力,但是這僅僅意味著出版工具的變化,而不意味著出版業(yè)的規(guī)則發(fā)生了變化。所以,對(duì)于出版業(yè)及其每一個(gè)從業(yè)者而言,只有更加深入地了解出版業(yè)的本質(zhì)和人類獲得信息和知識(shí)的本質(zhì),才能成為人工智能的主人,把握住人工智能技術(shù)浪潮下出版業(yè)獲得的機(jī)遇,應(yīng)對(duì)出版業(yè)應(yīng)用人工智能的挑戰(zhàn)。
注 釋
[1] 李釗.人工智能先驅(qū)預(yù)測未來媒體十大趨勢[N].科技日報(bào),2016-10-27
[2] 徐麗芳,樂征帆. 機(jī)器學(xué)習(xí):出版業(yè)的下一個(gè)引爆點(diǎn)?[J].出版參考,2017(1):25-27
[3] David Montgomery. AI - how it can work for publishers[EB/OL].[2018-01-05].http://www.bookbrunch.co.uk/page/free-article/ai--how-it-can-work-for-publishers
[4] Enago Academy . Can Artificial Intelligence Fix Peer Review?[EB/OL].[2017-12-25].https://www.enago.com/academy/can-artificial-intelligence-fix-peer-review
[5] 中國新聞出版廣播電視總局.全國新聞出版業(yè)基本情況(2007—2016)[R/OL]. [2018-01-02].http://www.sapprft.gov.cn/sapprft/govpublic/6677.shtml
[6] Holly Lynn Payne. Why Book Publishing Seeks Artificial Intelligence[EB/OL].[2017-12-28]. https://www.huffingtonpost.com/entry/why-book-publishing-seeks-artificial-intelligence_us_59482841e4b0961faacbe5d6
[7] The New Yorker,Jia Tolentino. “The Bestseller Code” Tells Us What We Already Know[EB/OL].[2017-11-13]. https://www.newyorker.com/books/page-turner/the-bestseller-code-tells-us-what-we-already-know
[8] Tyler Bishop.Using Data Science & Artificial Intelligence In Digital Publishing[EB/OL].[2017-12-29].https://blog.ezoic.com/using-data-science-artificial-intelligence-in-digital-publishing
[9] Erik Ose.Pulping is The Publishing Industrys Dirty Little Secret[EB/OL].[2017-12-29].http://thelatestoutrage.blogspot.com/2009/12/pulping-is-publishing-industrys-dirty.html
(收稿日期:2018-01-12)