【摘要】近年來,人們逐漸養(yǎng)成了有聲閱讀習慣,且越來越多的用戶開始愿意為優(yōu)質(zhì)內(nèi)容付費,爆發(fā)式增長的市場需求給有聲書出版帶來了巨大的機遇。然而,在市場紅利的背后,有聲書出版也面臨著諸多困境,如盜版盛行、盈利模式單一、內(nèi)容匱乏、生產(chǎn)效率低、生產(chǎn)成本高等問題,有聲書出版如何破局成為業(yè)內(nèi)人士關(guān)注的焦點。
【關(guān)? 鍵? 詞】有聲書;音頻版權(quán);人工智能;場景化閱讀
【作者單位】馮白,南京大學商學院。
【中圖分類號】G230.7 【文獻標識碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2020.24.010
艾媒網(wǎng)數(shù)據(jù)統(tǒng)計,2016年我國有聲閱讀市場的用戶僅有2.18億人,而截至2019年用戶數(shù)量已高達4.78億人,有專家預測,2020年我國有聲閱讀市場的用戶將超過5.62億人。有聲市場的快速擴張主要源于兩個方面:一是用戶規(guī)模快速增長,二是用戶使用有聲應(yīng)用的頻率和時長有所增加。例如,喜馬拉雅在2013年上線之初,活躍用戶每天的平均使用時長僅30-40分鐘,而截至2020年9月,活躍用戶每天平均使用時間增長至170分鐘。在移動互聯(lián)網(wǎng)高速發(fā)展的今天,各種移動應(yīng)用瓜分著用戶的時間,而在激烈的市場競爭中,有聲讀物獲得了更多的用戶以及更高的使用時長,這意味著有聲市場的需求量和市場規(guī)模正逐步擴大。2019年,我國有聲閱讀市場規(guī)模達到63.6億元,比2018年增加了17.3億元,增幅高達37%。2020年,有聲閱讀市場規(guī)模預計達到82.1億元。
有聲閱讀市場的擴大給有聲書出版帶來了極大的機遇。一方面,出版社開始紛紛入駐有聲書市場。如接力出版社在原有紙質(zhì)圖書的基礎(chǔ)上推出500余種有聲書,用戶覆蓋白領(lǐng)、大學生、少年兒童等群體;中國出版集團整合旗下人民文學出版社的豐富資源,僅在喜馬拉雅推出的有聲書就超過300種。另一方面,有聲書單品也獲得了多數(shù)用戶的喜愛,如《平凡的世界》在喜馬拉雅平臺上的播放量超過1.8億次。
一、有聲書快速發(fā)展下的困境
智能終端的普及、移動互聯(lián)網(wǎng)的高速發(fā)展給有聲書出版提供了廣闊的發(fā)展空間,但用戶需求量的激增與行業(yè)內(nèi)的競爭所帶來的內(nèi)容劣質(zhì)及盜版盛行、生產(chǎn)效率低且生產(chǎn)成本高、聽書場景單一等問題始終困擾著出版機構(gòu)。
1.劣質(zhì)內(nèi)容及盜版問題
有聲閱讀平臺最大的特點是具有開放性,其主要內(nèi)容來源于用戶生產(chǎn),也就是UGC模式。UGC模式下,用戶的水平參差不齊,制作的內(nèi)容也良莠不一。一些用戶為獲取粉絲流量隨意侵權(quán)修改內(nèi)容,甚至制作違規(guī)內(nèi)容。隨著有聲閱讀用戶規(guī)模不斷增大,平臺的UGC內(nèi)容也呈爆發(fā)式增長,平臺工作人員的審核精力不足,加劇了劣質(zhì)內(nèi)容的盛行。在版權(quán)保護上,雖然越來越多的出版機構(gòu)和作者紛紛開始關(guān)注有聲書版權(quán)以及圖書的有聲化授權(quán),但有聲市場仍缺乏系統(tǒng)的法律保障。因此,在版權(quán)保護方面,除了要重視對原作者的版權(quán)保護,也要重視有聲讀物本身的版權(quán)。有聲書在制作過程中融入了大量的創(chuàng)造性思維,是智力勞動的結(jié)果,然而我國對有聲書的二次上傳、盜錄、修改等問題的發(fā)現(xiàn)和處理機制尚未完善,參差不齊的內(nèi)容、猖獗的盜版現(xiàn)象是制約有聲書市場良性發(fā)展的重要因素。
2.生產(chǎn)效率低且生產(chǎn)成本高
近年來,有聲市場的需求量逐年攀升,不僅用戶規(guī)模有了較高的增長,用戶的平均使用時長也有了提升,這意味著市場需要更多的優(yōu)質(zhì)內(nèi)容來滿足用戶需求。尤其在新冠肺炎疫情期間,各有聲閱讀平臺發(fā)起免費閱讀的舉措使用戶量激增,有聲書的制作方要在短時間內(nèi)做出快速響應(yīng)。然而,有聲書在制作工序、人力投入以及開發(fā)周期上比其他音頻內(nèi)容更為復雜,需要耗費的時間及費用成本更高。有聲書在開始錄制前需要獲得授權(quán),而其他有聲內(nèi)容則不一定需要經(jīng)過授權(quán)程序。在制作內(nèi)容的過程中,如果是人工錄播,還需要有聲書的編輯篩選主播,錄播后期還要對作品內(nèi)容進行配樂、剪輯、校對,需要消耗大量的時間、物力和人力。與高額的制作費相比,用戶為有聲書付費的意愿不高,用戶的付費習慣也需要長時間養(yǎng)成。因此,有聲書想要破局,降低制作成本是一項重要舉措。
3.音頻傳播載體的局限
傳統(tǒng)的紙質(zhì)閱讀將讀者限制在特定的場景中,而隨著移動互聯(lián)網(wǎng)的發(fā)展,碎片化的時間與快節(jié)奏的生活使人們閱讀的場景變得更為多樣。有實驗證實,人類在獲取信息時,83%來自視覺,11%來自聽覺,其余則來自嗅覺、味覺和觸覺。因此,當無法通過視覺獲取信息時,聽覺就成了人們的第二選擇,這也是有聲市場能夠生存壯大的原因之一。早在20世紀60年代,人們就開始通過收音機收聽廣播電臺,這是有聲閱讀最初的形式,這一形式受到閱讀場所、閱讀時間的限制。而在移動互聯(lián)網(wǎng)時代,人們可以在更多的場景下進行閱讀,但大部分的閱讀都是以手機終端為主要載體,不能滿足不同群體的需求?,F(xiàn)階段的有聲閱讀載體較為單一,這也導致了有聲書只能在一定的群體和范圍中推廣,而有聲書的陪伴性特點也較難得到深入發(fā)展。
二、有聲書出版的破局之路
隨著5G商用的普及,大數(shù)據(jù)、移動互聯(lián)網(wǎng)、人工智能以及智能終端設(shè)備將迎來高速發(fā)展期。在新一代信息技術(shù)快速發(fā)展的背景下,有聲書行業(yè)只有找到與新興技術(shù)的契合點并充分融合發(fā)展才能走出困局,激發(fā)出更大的市場潛力。
1.技術(shù)革新推動有聲書市場規(guī)范
第一,解決有聲書的版權(quán)保護問題是有聲書市場良性發(fā)展的第一要務(wù)。2020年以來,聲紋識別技術(shù)快速發(fā)展,眾多領(lǐng)域在使用聲紋識別技術(shù),如門禁系統(tǒng)、用戶認證、刑偵工作等。聲紋識別的原理即語音同一認定,主要依據(jù)個人語音特征的穩(wěn)定性、個人語音的總體差異性、語音反應(yīng)性等進行系統(tǒng)運作。不同的人說話發(fā)音的習慣、語音的音調(diào)和音色各不相同,結(jié)合這些特性可以建立有聲書制作者的聲紋數(shù)據(jù)庫?;诼暭y數(shù)據(jù)庫,可嘗試結(jié)合數(shù)字水印技術(shù),將經(jīng)過智能分析提取的制作者的聲音特性作為音頻水印,在制作有聲書的過程中,將音頻水印嵌入作品中,即可為作品錄入隱形的聲音版權(quán)標記。此外,聲紋數(shù)據(jù)庫還能夠用來比對和認證音頻內(nèi)容。早在2018年,科大訊飛的聲紋識別技術(shù)就能夠?qū)崿F(xiàn)將說話者的聲紋信息與聲紋庫中已有的用戶聲紋進行對比驗證。將聲紋技術(shù)深度應(yīng)用到有聲書的版權(quán)保護中,可以有效識別并檢驗二次上傳、音頻盜錄、惡意篡改、惡意剪輯等侵權(quán)行為,幫助有聲書制作者維護自身權(quán)益,從而保證有聲書市場的良性發(fā)展。
第二,劣質(zhì)內(nèi)容泛濫的現(xiàn)象不容忽視,利用語音鑒別技術(shù)提升語音內(nèi)容的篩選是突破有聲書內(nèi)容審核困難的有效途徑。語音內(nèi)容的審核過濾系統(tǒng)主要利用語音轉(zhuǎn)寫技術(shù),即將長段的音頻數(shù)據(jù)轉(zhuǎn)化成文本數(shù)據(jù),再結(jié)合自然語言處理技術(shù)將音頻審核文字化,該系統(tǒng)能夠?qū)徍诵侍嵘?0%以上。當前,音頻審核技術(shù)廣泛應(yīng)用于直播平臺、視頻網(wǎng)站等平臺的音頻審核工作中。如一下科技旗下的秒拍、一直播等APP,通過百度人工智能提供的技術(shù),從文字、畫面以及音頻多個方面對內(nèi)容進行多方面審核,把原本需要120秒才能完成的審核縮短至24秒,且內(nèi)容審核準確率高達96%,人力成本降低了50%以上。有聲閱讀平臺也可以充分利用音頻過濾系統(tǒng)進行高效審核。首先,根據(jù)審核的標準建立違規(guī)詞、敏感詞等內(nèi)容數(shù)據(jù)庫;其次,通過結(jié)合語音轉(zhuǎn)寫技術(shù)把音頻內(nèi)容轉(zhuǎn)化為文本內(nèi)容;最后,通過語義識別、關(guān)鍵詞識別等技術(shù)對文本內(nèi)容進行判斷和分析,并與數(shù)據(jù)庫進行匹配,即可及時發(fā)現(xiàn)含有不合規(guī)內(nèi)容的有聲讀物。相比于人工審核,依托智能語音的審核技術(shù)不僅速度快,還可以不間斷工作,審核效率更高。
2.人工智能技術(shù)提升有聲書制作效率及多樣性
第一,利用聲音復刻技術(shù)可降低有聲書的制作成本,使有聲書產(chǎn)品更加多樣化。為提高用戶的付費意愿,有聲書的制作要以用戶青睞的故事性強、娛樂性強的作品為主。但一味地滿足用戶閱讀需求也會導致有聲書產(chǎn)品的單一性。雖然目前語音合成技術(shù)在情緒表達以及情感認知上還不夠成熟,但是對于專業(yè)圖書、教材教輔等這類對情緒表達要求不高、配音枯燥且多重復性內(nèi)容的圖書,可以利用人工智能技術(shù)進行配音。如微軟旗下的朗文小英就結(jié)合了語音識別與語音合成技術(shù),為用戶提供教材的朗讀和教學服務(wù)。此外,通過擴大語音庫、豐富語音類型,能夠彌補人工智能制作的有聲書的不足。如當前語音合成技術(shù)支持多種外語及地方特色方言,一本有聲書可復制成不同版本,不僅增添了內(nèi)容的趣味性,還可以更好地滿足用戶的個性化需求。
第二,利用人工智能技術(shù)進行內(nèi)容分析,精準匹配音頻,提升有聲書的制作效率。一方面,通過語音識別技術(shù)把有聲書的音頻內(nèi)容轉(zhuǎn)化為文字,形成相應(yīng)的內(nèi)容數(shù)據(jù)庫,并標記關(guān)鍵詞、高頻詞等,每段音頻設(shè)置獨立標簽。在后期對有聲書進行制作和修改時,便可通過檢索標簽、關(guān)鍵詞等快速找到相關(guān)片段,極大地提升了后期制作的效率。另一方面,利用人工智能深度學習技術(shù)訓練機器,輔助有聲書的制作,有效降低有聲書的制作成本,提升有聲書的質(zhì)量。首先,結(jié)合大數(shù)據(jù)對有聲書的用戶流量、反饋評論、銷量等進行分析;其次,將數(shù)據(jù)交給人工智能進行學習理解,建立有聲書的特征、音頻特征、用戶的反饋的聯(lián)系,繼而搭建有聲書模型。新技術(shù)的發(fā)展可以提升有聲書優(yōu)質(zhì)內(nèi)容的生產(chǎn)效率,降低有聲書的制作成本。
3.用戶精準畫像,深挖場景化閱讀需求
隨著5G商業(yè)化的廣泛應(yīng)用、移動互聯(lián)網(wǎng)技術(shù)及智能終端的快速發(fā)展,有聲閱讀的場景開始逐漸跳出單一的APP載體,向多元化的閱讀場景發(fā)展。如以iReader、Kindle為代表的電子閱讀器,以科大訊飛機器人為代表的互動性、陪伴性極強的繪本閱讀器等,滿足了更多閱讀場景的需求。智能硬件設(shè)備及智能終端產(chǎn)品的普及,極大地提升了有聲書給用戶帶來的交互式陪伴體驗,由于智能音箱具有語音入口優(yōu)勢,用戶只需通過語音便能隨時檢索、播放有聲書。此外,在5G技術(shù)賦能下,AR/VR的沉浸式閱讀可以更好地融入人們的日常生活學習中。不同的載體可以滿足用戶對不同場景的需求,這些新的需求也將成為有聲書行業(yè)發(fā)展的新機遇。
不同的用戶屬性要求內(nèi)容的開發(fā)制作要更加精準地滿足用戶的需求。首先,分析不同平臺、不同用戶對不同場景的需求;其次,結(jié)合自身優(yōu)勢進行選品制作;最后,選擇適宜的方式表現(xiàn)內(nèi)容,如主播講解圖書、制作純有聲書、將原有圖書制作成知識付費課程等。只有把握用戶在不同場景下的需求,才能給用戶提供優(yōu)質(zhì)體驗。如湛廬文化打造的湛廬閱讀APP,主要圍繞湛廬系列圖書為用戶提供精讀和通讀服務(wù),并且有針對性地服務(wù)30-45歲的用戶,內(nèi)容強調(diào)實用性而非娛樂性。清晰的用戶畫像明確了湛廬文化有聲書的打造方向,使其牢牢抓住了流量市場。
5G時代,技術(shù)的加持給有聲書行業(yè)帶來了巨大的發(fā)展機遇。通過與新技術(shù)結(jié)合有利于實現(xiàn)有聲書的版權(quán)保護,提升有聲書制作的效率及質(zhì)量,降低有聲書的制作成本,促進有聲書市場的發(fā)展。而依托人工智能技術(shù)、大數(shù)據(jù)技術(shù)挖掘用戶的場景化閱讀也將成為有聲書出版的發(fā)展方向。
|參考文獻|
[1]康寧. 有聲閱讀發(fā)展趨勢與中小型出版社應(yīng)對策略[J]. 傳媒論壇,2019(12):156-157.
[2]陳棟. 數(shù)字有聲出版行業(yè)的發(fā)展瓶頸與破局[J]. 出版廣角,2017(11):23-25.
[3]劉一鳴,高玥. 人工智能語音在有聲讀物中的應(yīng)用研究[J]. 出版發(fā)行研究,2019(11):35-39.
[4]熊宏蕾. 網(wǎng)絡(luò)環(huán)境下有聲讀物版權(quán)利益平衡探討[J]. 出版參考,2019(2):64-66.