【摘要】數字內容動態(tài)重組是滿足當下碎片化閱讀需求的一種重要手段,制作圖書精縮本是一種內容重組方式。本文在分析當前圖書精縮本現狀的基礎上,將用戶思維引入圖書精縮本的制作中,提出了一種基于讀者筆記數據動態(tài)生成圖書精縮本的方法。在散文集《看見》上的應用表明該方法能夠動態(tài)生成圖書摘錄本并能夠提高讀者的閱讀效率。
【關鍵詞】筆記數據;動態(tài)重組;圖書摘錄
【作者單位】嚴志永,北京印刷學院,清華大學新聞與傳播學院博士后流動站。
【基金項目】中國博士后科學基金項目(2015M581006號)。
碎片化閱讀已成為現代社會閱讀的主要方式[1],人們利用大段時間閱讀大部頭圖書的機會逐漸減少。讀者在閱讀一本書時大量的時間其實是花在過濾信息以尋找自己感興趣的內容這一環(huán)節(jié)上。戴盈指出在數字化時代,為了降低閱讀的時間成本,我們需要將選書時間壓縮并且減少誤讀圖書的時間[2]。降低讀者的閱讀時間成本不僅需要讀者提高內容選取技巧,也需要內容提供方運用用戶思維來幫助讀者選取內容。
數字內容動態(tài)重組是滿足碎片化閱讀的一種方法。數字內容動態(tài)重組通過對內容進行最大限度的聚合與重用,生成多元化、個性化產品來充分發(fā)揮內容價值,滿足讀者的需求[3]。數字內容動態(tài)重組系統(tǒng)一般基于領域詞表、領域本體等語義知識建立,工作量很大,在現實中推廣這種方式有一定的難度。
圖書精縮本是內容重組的一種可選產品形式。精縮本圖書在我國有很長的歷史[4],現在圖書市場上仍有大量的精縮本圖書在出售,這其中既有紙質圖書也有專門的電子版精縮本。本文擬在分析現有圖書精縮本的基礎上將用戶思維運用到圖書精縮本的生成中,即根據讀者筆記數據和讀者的閱讀時間自動生成動態(tài)圖書精縮本以幫助讀者進行碎片化數字閱讀。
一、圖書精縮本現狀
現在市場上的圖書精縮本主要有縮寫本和摘錄本兩種形式??s寫本是在把握全書內容的基礎上以更短小的篇幅來重寫全書的內容,摘錄本是對全書內容進行摘錄??s寫本的優(yōu)勢是能使讀者以較小的篇幅和較少的閱讀時間來了解大部頭著作的內容,不足之處是無法保持原著語言的魅力[4]。摘錄本的優(yōu)勢是能夠保存文字的原貌,不減弱內容的原有魅力,不足之處是較難把握原書的全貌。
名著縮寫本在我國很受歡迎,有代表性的作品當屬外語教學與研究出版社出版的“書蟲”系列雙語讀物、各出版社推出的名著縮寫本和“羅輯思維”團隊研發(fā)的“得到APP”。
“書蟲”系列雙語讀物包括7個級別、15個套裝、149冊圖書,適齡讀者涵蓋小學高年級、初中、高中和大學一年級新生,主要用于英語學習。該系列獲得了巨大的成功,自1997年推出至今,銷量超過6000萬冊[5]。根據開卷數據,在2013年前三季度英語讀物類圖書排行榜TOP100中,有68種出自“書蟲”系列[6]。
除了單部文學名著的縮寫本,市場上還有一類文學名著縮寫集,這類圖書通常囊括幾十部甚至上百部文學名著,但每一部名著都被壓縮成幾頁的篇幅。一個典型的例子是四川辭書出版社于2007年出版的鄧雙琴編著的《世界一流文學名著精縮》。該書以378頁的篇幅囊括了《荷馬史詩》《神曲》等90部世界名著。
縮寫本在數字出版領域也有應用,如“羅輯思維”欄目組推出的“得到APP”中的“干貨圖書”功能?!案韶泩D書”主打減少讀者閱讀時間的功能。以《世界為何存在》一書為例,該書原文有28.2萬字,“得到APP”提供的干貨圖書只有0.6萬字,為原書長度的1/47,顯然能為讀者節(jié)省大量的閱讀時間?!暗玫紸PP”中也注明能夠為讀者平均節(jié)省4.6小時的閱讀時間。
圖書摘錄本在圖書市場上也較常見,典型的例子如北京師范大學出版社出版的“當代哲學經典”系列叢書。該叢書包含《邏輯學卷》《中國哲學卷》等八卷。其基本體例是從學術大家的著作中選取具有代表性的文章,加上編者寫的作者簡介和文本簡介。以《邏輯學卷》為例,里面選取的王浩先生的兩篇文章分別選自《邏輯之旅:從哥德爾到哲學》和《數學哲學》二書。為了克服摘錄本的不足,書中提供了作者簡介和文本簡介,以使讀者獲得相關的背景知識。
縮寫本更適合以小說為代表的連續(xù)型作品,能夠幫助讀者了解作品的全貌;摘錄本更適合以散文集和論文集為代表的離散型作品,能夠幫助讀者對單篇文章有更深入的了解。
現有的圖書精縮本有兩點不足。首先,主要靠專家來完成,專家需要在通讀全書的基礎上對圖書進行縮寫或摘錄。這種方法一方面成本非常高,另一方面精縮本質量也在很大程度上取決于專家的水平。事實上,名著縮寫本已經引來學者的批評[7][8]。其次,一旦生成就無法更改,無法為不同的讀者提供不同的精縮本,也無法根據讀者閱讀興趣的變化生成不同的版本。
紙質書一旦出版就基本固定下來,想要出新版,成本非常高,并且較難為不同的讀者生成不同的精縮本版本。數字出版與傳統(tǒng)出版有很大的不同,一方面較容易及時跟進讀者需求對圖書精縮本進行調整,另一方面也較容易為不同的讀者生成不同的圖書精縮本。本文的研究就是為數字閱讀讀者動態(tài)生成圖書精縮本。
二、用戶思維
用戶思維是互聯網思維中非常重要的一種思維,也為出版領域的學者們所重視。方莉指出,數字時代編輯最需要的四種互聯網思維中第一種就是用戶思維,在出版行業(yè),用戶思維就是讀者思維,也就是要努力挖掘讀者的同情感、參與感和體驗感,圖書要滿足讀者的心理和自我實現的需要,要有契合時代的文本和話題[9]。盛瑨和張殷博指出,用戶思維的重點是傳播理念的轉變,要改變過去“傳者中心,以我為準”的心態(tài),貼近受眾,關注受眾的需求[10]。羅小衛(wèi)和程輝指出,出版業(yè)的用戶思維就是讀者思維,與工業(yè)時代的單一化、標準化思維模式有著本質的差異,讀者的話語權應受到重視[11]。
前述圖書精縮本在編輯時實際上并未很好地體現用戶思維。在對圖書進行縮寫或摘錄時,專家所依靠的是自己對圖書內容和讀者需求的理解。由于很難在第一時間接觸到讀者,他們對讀者需求的把握很可能會出現失準。要想使圖書精縮本這種圖書形式在市場上引起更大的反響,需要將用戶思維運用到編輯實踐中。
愛奇藝公司在視頻播放領域對用戶思維進行了大膽的探索。一般來說,導演在編輯視頻時無法知道觀眾的需求,對情節(jié)的取舍也需要依據自己的經驗。針對此情況,愛奇藝推出了“綠鏡”功能[12]。該功能在對視頻觀看數據進行大數據分析的基礎上,將用戶喜歡的精彩內容摘錄出來形成最受觀眾關注的“精華版”視頻。根據報道,該功能可使用戶在30分鐘內看完原長90分鐘的《爸爸去哪兒》等節(jié)目,已至少有20萬人次使用該功能觀看《爸爸去哪兒》[13]。愛奇藝“綠鏡”功能所做的實際上就是視頻摘錄的工作,因此其思想也可以應用到圖書精縮本的制作過程中。
要實現數字內容動態(tài)重組,無疑需要讀者的閱讀行為數據。愛奇藝“綠鏡”利用的是收集到的用戶觀看視頻時快進或快退播放的大數據[14]。不論是電子書閱讀器,還是智能手機上的閱讀APP,數字閱讀產品一般都會提供筆記功能,這些筆記數據可以作為生成圖書精縮本的依據。
三、圖書精縮本的自動生成及在數字閱讀中的應用
圖書內容的自動選取包含如下三個階段:(1)對原書內容進行碎片化;(2)對讀者筆記數據進行單元化;(3)根據碎片化的內容和單元化的筆記數據生成動態(tài)的圖書摘錄本。
在對原書內容進行碎片化時,粒度的選擇非常重要。如果粒度太粗,則較難達到摘錄圖書以減少讀者閱讀時間的目的;如果粒度太細,圖書被分割后內容單元會非常多,則需要更多的讀者筆記數據來進行選擇。筆者建議粒度的選擇可以根據筆記數量的多寡來動態(tài)調整,隨著筆記數據的積累,粒度可以做到越來越細,圖書內容的摘錄相應會越來越準確。
讀者筆記數據的單元化指將筆記映射入碎片化后的內容單元中。在對紙質書做筆記時一般會定位到頁碼,而在數字出版中,很多圖書以流式進行閱讀,并且會根據設備屏幕來調整行數和列數,已經沒有了頁碼的概念。對讀者筆記數據進行單元化就是將紙質書筆記的頁碼和數字閱讀中的精確位置映射到第一階段所生成的碎片化單元中。碎片化后各個單元內的讀者筆記數量往往不同,嚴志永對此進行研究后發(fā)現讀者筆記一般集中在圖書的前20%[15]。
第三階段就是根據各碎片單元的筆記比例來生成圖書的摘錄本。具體方法如下:(1)將碎片單元按照筆記比例排序;(2)根據讀者的閱讀需求選取筆記比例靠前的多個單元;(3)將選取的這些單元按照原書順序排序后發(fā)給讀者。
這種摘錄方法既可以應用于前文提到的離散型圖書,也可以應用于連續(xù)型圖書。當應用于散文集和論文集等離散型圖書時,可直接生成圖書的摘錄本;當應用于小說等連續(xù)型圖書時,當前還需要人工提供全書的脈絡,以將各個碎片單元串聯起來。
數字內容提供方既可以直接將該方法生成的圖書精縮本出售給讀者,就像“得到APP”所做的那樣;也可以在讀者購買電子版全書之后作為附加服務提供給讀者,以此作為特色來增加平臺的用戶黏性。當前數字內容平臺差異化不明顯,提供該功能有助于提高平臺的競爭力。
四、以豆瓣筆記生成圖書摘錄本實證研究
豆瓣網于2011年1月推出了豆瓣筆記功能,并于2012年5月推出了豆瓣筆記APP,目的是方便豆瓣讀者在閱讀紙質書時做筆記。豆瓣筆記中包含頁碼、筆記等信息。得益于豆瓣網的眾多讀者,豆瓣筆記積累了大量的筆記數據。
本文以《看見》為例,研究如何根據讀書筆記生成圖書摘錄本。首先將《看見》按照篇章劃分為若干碎片化單元,其次將豆瓣讀書筆記的相關根據頁碼映射到相應的碎片化單元即圖書內容中,最后在統(tǒng)計比例數量的基礎上動態(tài)生成圖書摘錄本。
柴靜的暢銷書《看見》于2013年1月由廣西師范大學出版社出版,共有424頁,230千字。截至2015年6月17日,該書在豆瓣網上共有讀者22967名,讀書筆記13375條。《看見》是由序言、20篇散文和后記組成的散文集。在這22篇文章中,前言和后記各只有2頁,因此本文僅研究其中的20篇散文。
將這20篇散文按照筆記比例從高到低排序,并取排名前5位的散文(由于篇幅限制),得到表1。
表1 《看見》中筆記條數多的散文
排序 章 標題 頁數 筆記比例
1 第一章 別當了主持人就不是人了 20 13.10%
2 第十章 真相常流失于涕淚交加中 20 10.59%
3 第十七章 無能的力量 36 7.80%
4 第五章 我們終將渾然難分,像水溶于水中 18 7.29%
5 第二章 那個溫熱的跳動就是活著 20 6.84%
從表1可知,豆瓣讀者筆記在《看見》一書各章中的分布并不均衡,實際上有7章的豆瓣筆記比例超過平均值5%。動態(tài)生成的《看見》摘錄本的應用方法如下:
(1)如果讀者只有閱讀一章的時間,則數字內容提供方可僅向讀者提供第一章。該章僅有20頁,占20章總共405頁的4.94%,一般讀者閱讀完該章用時不超過20分鐘,筆記比例卻高達13.10%。
(2)如果讀者有閱讀五章的時間,則數字內容提供方可僅向讀者提供第一章、第二章、第五章、第十章和第十七章。上述五章共114頁,占20章總頁數的28.15%,筆記比例則高達45.62%。
通過上述對《看見》生成摘錄本的分析可知,本文提出的方法能夠顯著提高這類散文集讀者的數字閱讀效率。
五、總結與展望
本文將用戶思維應用到數字內容動態(tài)重組中,提出了一種使用讀者筆記數據自動生成圖書動態(tài)精縮本的方法,該方法能夠生成包括縮寫本和摘錄本兩種形式的圖書精縮本。本文基于豆瓣讀書筆記數據為《看見》自動生成了動態(tài)的圖書摘錄本,結果表明該方法能夠根據讀者的碎片化閱讀時間動態(tài)生成圖書摘錄本,從而大大提高讀者的閱讀效率。
數字內容的動態(tài)重組對數字出版而言是一個非常重要的問題。數字內容提供方可以在掌握讀者閱讀行為數據的基礎上為讀者提供個性化的知識和服務。如果能夠通過讀者的閱讀數據得到讀者閱讀某一類內容的速度,那么讀者只需要提供即將閱讀的圖書和自己擁有的閱讀時間,本文提出的方法就能夠使數字內容提供方提供更精準長度的內容,讀者會得到更好的閱讀體驗。
本文提出的生成圖書精縮本方法既能應用于散文集等離散型圖書生成摘錄本,也可應用于小說等連續(xù)型圖書生成縮寫本。為連續(xù)型圖書生成縮寫本無疑要比為散文集生成摘錄本更難,有待于未來進一步地去解決。
[1]黃張活. 碎片化閱讀趨勢下傳統(tǒng)圖書館面臨的機遇與挑戰(zhàn)[J]. 圖書館學刊,2016(2):33-35.
[2]戴盈. 數字化時代讀者的選書智慧和閱讀興趣圖譜構建[J]. 中國出版,2014(5):40-44.
[3]萬智. 市場驅動下的出版內容動態(tài)重組模式思路[J]. 出版發(fā)行研究,2016(4):40-43.
[4]陸琳. 談文學名著縮寫本[J]. 信息系統(tǒng)工程,2010(10):134.
[5]勃朗特. 書蟲·牛津英漢雙語讀物:6級 [M]. 韋斯特,江紅,譯.北京:外語教學與研究出版社,1997.
[6]楊毅,秦潔. 英語類圖書零售市場分析[J]. 出版人, 2013(12): 50-51.
[7]王濤. 名著縮寫值得商榷[N]. 光明日報,2004-09-01.
[8]司葆華. 風干的名著[J]. 成才之路,2008(34):91.
[9]方莉. 芻議數字時代下編輯的互聯網思維[J]. 出版廣角,2015(6):25-27.
[10]盛瑨,張殷博. 紙媒數字化轉型中的互聯網思維應用[J]. 出版廣角,2015(15):32-33.
[11]羅小衛(wèi),程輝. 互聯網時代圖書選題策劃創(chuàng)新[J]. 出版廣角,2016(12):49-51.
[12]任捐獻. 大數據時代網絡視頻網站的發(fā)展——以“愛奇藝”為例[J]. 新聞世界,2014(5):102-103.
[13]TechWeb. 愛奇藝推“綠鏡”視頻編輯功能 民意決定內容組合[N/OL]. (2013-11-27). [2016-10-20]. http://www.techweb.com.cn/internet/2013-11-27/1363246.shtml.
[14]愛奇藝. 愛奇藝上線“綠鏡” 依靠大數據解構視頻內容[N/OL]. (2013-11-26). [2016-10-20]. http://www.iqiyi.com/common/20131128/13875261ad970a12.html.
[15]嚴志永. 基于豆瓣筆記的紙質書讀者閱讀行為研究[J]. 科技與出版,2016(4):76-79.