摘 要:以ChatGPT為代表的聊天機(jī)器人再次引發(fā)了人們對(duì)AIGC(人工智能生成內(nèi)容)的關(guān)注。“出版再想象:AI與內(nèi)容生產(chǎn)變革”研討會(huì)回應(yīng)熱點(diǎn),邀請(qǐng)來(lái)自學(xué)界業(yè)界的5位專(zhuān)家,從不同角度探討AIGC背景下出版的未來(lái)。厘清ChatGPT的技術(shù)原理及其可供性,辨析AIGC模式中的人機(jī)互動(dòng)關(guān)系,是理解這場(chǎng)內(nèi)容生產(chǎn)范式轉(zhuǎn)換的前提。當(dāng)前,AIGC已經(jīng)有一定程度的實(shí)踐應(yīng)用,在提升內(nèi)容生產(chǎn)力方面表現(xiàn)出優(yōu)勢(shì)。對(duì)出版業(yè)而言,AIGC給產(chǎn)業(yè)發(fā)展帶來(lái)更大的不確定性,既提供了機(jī)遇,也帶來(lái)了挑戰(zhàn),出版人必須做好應(yīng)對(duì)準(zhǔn)備。
關(guān)鍵詞:AIGC;ChatGPT;出版變革;數(shù)字出版;智能出版
DOl: 10.3969/j.issn.2097-1869.2023.02.003
2022年年底,OpenAI公司推出了一款名為ChatGPT的人工智能產(chǎn)品,它基于大規(guī)模語(yǔ)料庫(kù)和生成式模型,具有十分強(qiáng)大的通用性能力和邏輯推理能力。基于自身技術(shù)路線(xiàn),ChatGPT更加適合解決復(fù)雜的AIGC問(wèn)題,這使得AIGC再一次成為學(xué)術(shù)熱點(diǎn),并且還走向了大眾領(lǐng)域,引發(fā)了全民關(guān)注。在幾年前的討論高潮中,人們關(guān)注AIGC的可版權(quán)性和版權(quán)歸屬問(wèn)題,以及它對(duì)內(nèi)容產(chǎn)業(yè)的沖擊和產(chǎn)業(yè)內(nèi)部的自我調(diào)適。今天,在全民狂歡于探索ChatGPT的應(yīng)用邊界時(shí),以此為引子,《數(shù)字出版研究》編輯部的討論進(jìn)一步將ChatGPT應(yīng)用延伸到出版專(zhuān)業(yè)領(lǐng)域,冷靜思考AIGC時(shí)代出版的未來(lái)向何處去。
在此背景下,2023年3月2日,由北京印刷學(xué)院主辦,北京印刷學(xué)院出版學(xué)院、《數(shù)字出版研究》編輯部、“學(xué)術(shù)志”平臺(tái)承辦的“出版再想象:AI與內(nèi)容生產(chǎn)變革”研討會(huì)在云端舉行。本次研討會(huì)由北京印刷學(xué)院出版學(xué)院講師劉廣東主持,邀請(qǐng)到5位相關(guān)領(lǐng)域的專(zhuān)家:
北京斯麥爾數(shù)字出版技術(shù)有限公司董事長(zhǎng)鄭鐵男;北京網(wǎng)梯科技發(fā)展有限公司董事長(zhǎng)張震;北京頡騰文化傳媒有限公司副總經(jīng)理李杰臣;中華醫(yī)學(xué)會(huì)雜志社新媒體部主任沈錫賓;中國(guó)音像與數(shù)字出版協(xié)會(huì)副秘書(shū)長(zhǎng)李弘。
《數(shù)字出版研究》編輯部對(duì)這次研討會(huì)中的一些共性議題做了梳理和整合,希望借此為思考內(nèi)容生產(chǎn)的未來(lái)帶來(lái)啟發(fā)。
1 奇點(diǎn)來(lái)臨?ChatGPT的原理與想象
技術(shù)奇點(diǎn)假說(shuō)認(rèn)為,技術(shù)發(fā)展會(huì)在很短的時(shí)間內(nèi)發(fā)生極大的接近于無(wú)限的進(jìn)步,技術(shù)的增長(zhǎng)將會(huì)變得不可控制和不可逆轉(zhuǎn)。基于大規(guī)模預(yù)訓(xùn)練自然語(yǔ)言處理模型的人工智能,正在不斷沖擊人類(lèi)對(duì)技術(shù)的既有認(rèn)知,近期,人形機(jī)器人Ameca接入ChatGPT后,甚至產(chǎn)生了有“情緒”的對(duì)話(huà),引起科技界甚至社會(huì)大眾的廣泛關(guān)注。以ChatGPT為代表的AIGC會(huì)是奇點(diǎn)到來(lái)的標(biāo)志或者即將到來(lái)的前奏嗎?拆解其技術(shù)原理,有助于我們?cè)诩w技術(shù)焦慮中冷靜審視這場(chǎng)變革。
鄭鐵男:ChatGPT是人工智能技術(shù)驅(qū)動(dòng)的自然語(yǔ)言處理工具,其核心是自然語(yǔ)言處理(Natural Language Processing, NLP)。自然語(yǔ)言處理是計(jì)算機(jī)科學(xué)領(lǐng)域與人工智能領(lǐng)域中的一個(gè)重要方向,主要應(yīng)用于機(jī)器翻譯、輿情監(jiān)測(cè)、自動(dòng)摘要、觀點(diǎn)提取、文本分類(lèi)、問(wèn)題回答、文本語(yǔ)義對(duì)比、語(yǔ)音識(shí)別、中文OCR等方面。國(guó)內(nèi)外都有成形的自然語(yǔ)言處理技術(shù)。ChatGPT并非一個(gè)新技術(shù),它能夠通過(guò)理解和學(xué)習(xí)人類(lèi)的語(yǔ)言進(jìn)行對(duì)話(huà),還能根據(jù)聊天的上下文進(jìn)行互動(dòng),真正像人類(lèi)一樣聊天交流,甚至能完成撰寫(xiě)郵件、編寫(xiě)視頻腳本、編寫(xiě)文案、翻譯、編代碼、寫(xiě)論文等任務(wù)。
張震:在ChatGPT引發(fā)的這輪AIGC浪潮之前,AI在自然理解領(lǐng)域顯著落后于人類(lèi)?,F(xiàn)在,我們看到它超越了大部分普通人,但是依然落后于專(zhuān)業(yè)人士。普通人覺(jué)得它很專(zhuān)業(yè),但有時(shí)候它的答案是“一本正經(jīng)地胡說(shuō)八道”。即便如此,用“涌現(xiàn)”這個(gè)詞來(lái)描繪ChatGPT給人們帶來(lái)的震撼并不為過(guò)。AI也在不斷學(xué)習(xí),其內(nèi)容更新速度很快,人類(lèi)在體力工具、運(yùn)輸工具外,終于在腦力工具上出現(xiàn)了一次質(zhì)的飛躍。
自然語(yǔ)言的理解和生成的突破可能開(kāi)啟人工智能的奇點(diǎn):以前只是模仿普通生物,如模仿基本的兩棲類(lèi)動(dòng)物,進(jìn)行一些視覺(jué)模仿和基本的符號(hào)識(shí)別。但是真正的基于符號(hào)的思考和理解是人類(lèi)突飛猛進(jìn)的一個(gè)關(guān)鍵點(diǎn),這個(gè)點(diǎn)在互聯(lián)網(wǎng)領(lǐng)域就是奇點(diǎn)。
如果從入口把水灌入迷宮,水只要一直不斷,它必然找到出口。水能走通迷宮是不是智能?我以前認(rèn)為水能走通迷宮只是自然界的一種規(guī)律,現(xiàn)在我認(rèn)為這就是智能。很多圖像生成類(lèi)人工智能軟件能夠幫助用戶(hù)消除照片中的背景干擾,效果很好,但如果去原場(chǎng)景就會(huì)發(fā)現(xiàn),AI消除后新建的場(chǎng)景與實(shí)際相去甚遠(yuǎn)。智能也許是自然界的普遍現(xiàn)象,人的大腦也是進(jìn)化的產(chǎn)物,所以AI對(duì)很多問(wèn)題隨機(jī)回答、腦補(bǔ)答案,是十分必要的。
OpenAI的工程師John Carmack堅(jiān)信一個(gè)人能夠?qū)崿F(xiàn)整個(gè)人類(lèi)大腦的核心源代碼,個(gè)人能夠編寫(xiě)實(shí)現(xiàn)AIGC的源代碼。他提出,人類(lèi)DNA信息量不足1 GB,而大腦只有40 MB的信息容量,并且其中存在大量的冗余和無(wú)效代碼;假設(shè)把冗余去掉,其工作量是一個(gè)程序員即可完成的。人類(lèi)大腦這樣的核心代碼可能需要幾萬(wàn)行,關(guān)鍵在于大量的用于學(xué)習(xí)的語(yǔ)料庫(kù)。孕育生命僅需要10個(gè)月,而人類(lèi)大腦發(fā)育成熟則一般要到23歲,養(yǎng)育過(guò)程的成本遠(yuǎn)遠(yuǎn)大于生育過(guò)程的成本。對(duì)于AIGC,算法的代碼其實(shí)很少,但是教會(huì)算法需要付出巨大的代價(jià),甚至有個(gè)說(shuō)法:人工智能,有多少智能就有多少人工。OpenAI把大量的數(shù)據(jù)標(biāo)引工作交給了肯尼亞的外包團(tuán)隊(duì),由該團(tuán)隊(duì)做相關(guān)的數(shù)據(jù)標(biāo)注和訓(xùn)練。AlphaGo初期學(xué)習(xí)了大量的圍棋棋譜,之后就開(kāi)始自己跟自己對(duì)弈了。在知識(shí)和語(yǔ)言領(lǐng)域,在出版領(lǐng)域,未來(lái)也可能出現(xiàn)這種情況,一旦AI學(xué)會(huì)人類(lèi)語(yǔ)言的規(guī)律,就會(huì)進(jìn)入自我進(jìn)化階段,加速發(fā)展。
李弘:技術(shù)有遞歸性,《技術(shù)的本質(zhì)》一書(shū)中講到所有的技術(shù)都是一點(diǎn)一點(diǎn)從最原始的技術(shù)不斷疊加出來(lái)的,理解ChatGPT亦然。ChatGPT并不是技術(shù)革命,其采用的技術(shù)路線(xiàn)并未變化,而是應(yīng)用上的重大突破,其意義在于大大加強(qiáng)了人類(lèi)對(duì)于人工智能可用性的信心。ChatGPT處在展開(kāi)期,任何一項(xiàng)技術(shù)的應(yīng)用都有導(dǎo)入和展開(kāi)的情境。
ChatGPT對(duì)于大規(guī)模文字模態(tài)的AIGC應(yīng)用具有重要意義,在歸納性的文字類(lèi)工作中有著優(yōu)異表現(xiàn)。ChatGPT有理解、學(xué)習(xí)、邏輯推理能力,這些能力對(duì)于研究咨詢(xún)、定題分析十分必要,因此其對(duì)于出版業(yè)有很強(qiáng)的支撐作用。此外,ChatGPT在道德、倫理方面有比較強(qiáng)的判斷,如有主動(dòng)承認(rèn)錯(cuò)誤、敢于質(zhì)疑的“性格”,未來(lái)其在模仿人類(lèi)能力方面可能還會(huì)有很大進(jìn)步。ChatGPT的應(yīng)用會(huì)產(chǎn)生一個(gè)較大的市場(chǎng),隨著越來(lái)越多的企業(yè)和個(gè)人接入ChatGPT的開(kāi)放接口,其應(yīng)用可能會(huì)是下一個(gè)階段創(chuàng)新和創(chuàng)業(yè)的主戰(zhàn)場(chǎng)。
2 技術(shù)賦能:嵌入出版業(yè)的AIGC
無(wú)論是人類(lèi)還是機(jī)器,其生產(chǎn)的內(nèi)容都是供人類(lèi)消費(fèi)的精神產(chǎn)品并可轉(zhuǎn)化為意義,出版的本質(zhì)屬性和價(jià)值追求并不因內(nèi)容生產(chǎn)主體的變化而變化。著眼于當(dāng)下,如果以出版為視角,AIGC無(wú)疑是近年來(lái)十分重要的出版轉(zhuǎn)型升級(jí)的機(jī)遇之一。
鄭鐵男:出版行業(yè)是為知識(shí)服務(wù)的,無(wú)論是紙質(zhì)書(shū)還是在線(xiàn)教育平臺(tái)、知識(shí)數(shù)據(jù)庫(kù)等,其實(shí)都是提供知識(shí)服務(wù)的。出版行業(yè)正向知識(shí)服務(wù)轉(zhuǎn)向,為網(wǎng)民提供知識(shí)搜索、知識(shí)推薦的服務(wù)。出版業(yè)原來(lái)的用戶(hù)主要是消費(fèi)紙質(zhì)書(shū),現(xiàn)在則是知識(shí)圖譜,要通過(guò)自然語(yǔ)言處理的中間插件技術(shù)或ChatGPT的技術(shù)進(jìn)行內(nèi)容的組織和生產(chǎn)。與ChatGPT不同,出版業(yè)大多是做縱深領(lǐng)域,切口小,類(lèi)似于石油領(lǐng)域、化工領(lǐng)域、機(jī)械領(lǐng)域等,我們把行業(yè)的內(nèi)容數(shù)字化,進(jìn)行知識(shí)圖譜的標(biāo)引,這并不需要海量的數(shù)據(jù)去給用戶(hù)提供最后的服務(wù),因?yàn)橛脩?hù)需要得到的都是行業(yè)內(nèi)部的準(zhǔn)確內(nèi)容。我們要使用ChatGPT還有自然語(yǔ)言處理這種中間的搜索引擎的插件技術(shù),由出版社編輯進(jìn)行深度的標(biāo)引,用人工+技術(shù)的方式對(duì)內(nèi)容進(jìn)行分類(lèi)聚類(lèi),組織形成產(chǎn)品,提供給用戶(hù)。
張震:ChatGPT將會(huì)改變傳統(tǒng)知識(shí)的出版和教授方式,讓個(gè)性化學(xué)習(xí)成為可能,人工智能將會(huì)成為抄襲者。ChatGPT的訓(xùn)練過(guò)程和訓(xùn)練成本基本上都是小公司、小團(tuán)隊(duì)無(wú)法承擔(dān)的,所以大部分公司都會(huì)基于人工智能操作系統(tǒng)開(kāi)發(fā)自己的相關(guān)產(chǎn)品和應(yīng)用。對(duì)出版企業(yè)來(lái)說(shuō)也一樣,可能是在別人已經(jīng)訓(xùn)練好的預(yù)訓(xùn)練模型上做一些簡(jiǎn)單的學(xué)習(xí)和加工,打造自己的產(chǎn)品和應(yīng)用。
國(guó)內(nèi)有人將一門(mén)管理學(xué)慕課課程視頻轉(zhuǎn)化成文字后輸入給ChatGPT,再拿考試題目做測(cè)試,結(jié)果ChatGPT成功通過(guò)了考試,拿到了號(hào)稱(chēng)頒發(fā)給ChatGPT的第一張結(jié)業(yè)證書(shū)。未來(lái),有可能每一個(gè)出版機(jī)構(gòu)都會(huì)訓(xùn)練出自己的面向某一個(gè)專(zhuān)業(yè)領(lǐng)域的提供人工智能服務(wù)的具體應(yīng)用。
AIGC對(duì)出版業(yè)的意義是,在生產(chǎn)環(huán)節(jié)會(huì)實(shí)現(xiàn)效率的極大提升,在專(zhuān)業(yè)能力環(huán)節(jié)會(huì)讓專(zhuān)業(yè)能力前置,以前專(zhuān)業(yè)人士才能達(dá)到的水平、掌握的技術(shù),未來(lái)有可能終端用戶(hù)比編輯水平還要高,所以可能會(huì)給出版行業(yè)帶來(lái)顛覆。未來(lái)有可能產(chǎn)生一些人類(lèi)和AI共同打造的新書(shū),生產(chǎn)速度越來(lái)越快、數(shù)量越來(lái)越多。在服務(wù)群眾的精神文化需求上,AIGC還將產(chǎn)生重大的價(jià)值和功能。
沈錫賓:通過(guò)我們的實(shí)際測(cè)試發(fā)現(xiàn),ChatGPT在醫(yī)療健康和科技出版方面的應(yīng)用潛力巨大:它具備基本醫(yī)學(xué)、保險(xiǎn)常識(shí)和多輪對(duì)話(huà)的能力,對(duì)中文的理解能力不弱;具備病例閱讀、理解和糾錯(cuò)的能力;信息抽取和術(shù)語(yǔ)標(biāo)準(zhǔn)化的能力涉及強(qiáng)知識(shí),且隨時(shí)間變化少,這兩個(gè)任務(wù)接近甚至超出基于大量標(biāo)注的有監(jiān)督學(xué)習(xí)的效果,相當(dāng)于自帶通識(shí)知識(shí)庫(kù);具備簡(jiǎn)單推理、肯定否定關(guān)系的識(shí)別能力;具備連續(xù)學(xué)習(xí)的能力,在不斷的訓(xùn)練后,前后一個(gè)月的水平完全不同;具備一定的學(xué)術(shù)評(píng)價(jià)能力,但水平有限,結(jié)果不理想;結(jié)合知識(shí)圖譜和相關(guān)規(guī)則進(jìn)行輸出,可大幅提升現(xiàn)有對(duì)話(huà)、推理能力;醫(yī)學(xué)類(lèi)應(yīng)用的特點(diǎn)是嚴(yán)謹(jǐn),其提供的建議可以給出置信度,幫助使用者判斷答案是否可靠。
對(duì)出版商來(lái)說(shuō),傳統(tǒng)的基于知識(shí)圖譜構(gòu)建進(jìn)行知識(shí)服務(wù)很煩瑣,因?yàn)檫@需要大量的專(zhuān)家介入,而且知識(shí)圖譜在不斷演進(jìn),短時(shí)間內(nèi)難以完成更新。對(duì)此,可以利用出版機(jī)構(gòu)已有的論文文檔、一些比較好的臨床病例和臨床指南去做大規(guī)模的預(yù)訓(xùn)練,形成知識(shí)服務(wù)體系,以此向大眾提供比較通用的醫(yī)學(xué)咨詢(xún)服務(wù)。通過(guò)大量經(jīng)過(guò)同行評(píng)議的數(shù)據(jù)訓(xùn)練AI,可以此面向臨床醫(yī)生提供更好的CDSS(臨床決策支持系統(tǒng))服務(wù)。
人工智能在科技界的應(yīng)用分為五個(gè)方向:第一,在科研設(shè)計(jì)和論文寫(xiě)作方向上,其可以幫助科研人員完成數(shù)據(jù)的組織、統(tǒng)計(jì)和文字修訂,可以協(xié)助作者開(kāi)展科研設(shè)計(jì)、進(jìn)行投稿指導(dǎo);第二,在知識(shí)服務(wù)方向上,它可以為用戶(hù)提供個(gè)性化服務(wù),幫助出版企業(yè)從內(nèi)容提供商向知識(shí)服務(wù)商過(guò)渡,提供解決問(wèn)題的方案而非文檔;第三,在選題策劃方向上,可以協(xié)助編輯、專(zhuān)家開(kāi)展選題策劃,從大量的稿件中遴選出更優(yōu)秀的和更具話(huà)題性的文章,也可以開(kāi)展專(zhuān)家遴選、評(píng)價(jià)等;第四,在學(xué)術(shù)不端檢測(cè)方向上,它利用圖像識(shí)別技術(shù)進(jìn)行圖片對(duì)比,利用自然語(yǔ)言處理技術(shù)實(shí)現(xiàn)文字相似性檢查,能有效避免抄襲情況的發(fā)生;第五,在傳播方向上,它可以提煉主題、擴(kuò)展表現(xiàn)形式、提升網(wǎng)絡(luò)傳播效率,也可以基于自動(dòng)翻譯功能實(shí)現(xiàn)多語(yǔ)種傳播,還可以基于用戶(hù)精準(zhǔn)畫(huà)像實(shí)現(xiàn)內(nèi)容的精準(zhǔn)分發(fā)與推送。
3 未來(lái)已來(lái):AIGC在出版業(yè)的實(shí)踐
出版史已經(jīng)證明,技術(shù)是深刻影響出版發(fā)展的關(guān)鍵因素之一。以ChatGPT為代表的AIGC技術(shù)在出版界快速實(shí)踐,一定程度上證明了其在提升內(nèi)容生產(chǎn)力方面的價(jià)值。隨著技術(shù)的不斷普及,其應(yīng)用空間還將進(jìn)一步得到拓展。
鄭鐵男:近期,Springer Link已經(jīng)有作者和ChatGPT合作出書(shū)。2023年2月14日,每日經(jīng)濟(jì)新聞、澎湃新聞、上游新聞等多家媒體平臺(tái)宣布接入被稱(chēng)為“中國(guó)版ChatGPT”的百度“文心一言”,成為其生態(tài)合作伙伴。這些都彰顯了以ChatGPT為代表的AIGC工具在出版領(lǐng)域的廣闊應(yīng)用前景。
數(shù)字出版正在向數(shù)據(jù)出版階段發(fā)展。出版企業(yè)要構(gòu)建數(shù)智底座、數(shù)據(jù)中臺(tái),做好內(nèi)容數(shù)據(jù)和用戶(hù)數(shù)據(jù)。出版企業(yè)現(xiàn)在只有PDF、方正排版或者InDesign的文件,要把內(nèi)容變成碎片化的XML原數(shù)據(jù),才能被ChatGPT或自然語(yǔ)言處理技術(shù)利用,重新組織形成數(shù)據(jù)庫(kù)或者變成OWL知識(shí)圖譜。為此,要在標(biāo)準(zhǔn)上做好準(zhǔn)備。有關(guān)部門(mén)發(fā)布的《中央文化企業(yè)數(shù)字化轉(zhuǎn)型升級(jí)項(xiàng)目標(biāo)準(zhǔn)化工作方案》《中央文化企業(yè)數(shù)字化轉(zhuǎn)型升級(jí)規(guī)劃與實(shí)施方案》《出版資源內(nèi)容部件數(shù)據(jù)元》等方案、標(biāo)準(zhǔn),對(duì)書(shū)刊加工、數(shù)據(jù)管理、資料管理等都設(shè)置了規(guī)范,出版社要參照國(guó)家標(biāo)準(zhǔn)做好數(shù)據(jù)處理。
提供知識(shí)服務(wù)將會(huì)成為出版業(yè)下一步轉(zhuǎn)型的目標(biāo)。如國(guó)家開(kāi)放大學(xué)出版社的口號(hào)是“為終身學(xué)習(xí)者提供知識(shí)服務(wù)”,該社的愿景就是通過(guò)人工智能等方式,為用戶(hù)提供支持服務(wù),讓學(xué)習(xí)更有效。出版行業(yè)已經(jīng)開(kāi)始利用技術(shù)對(duì)內(nèi)容進(jìn)行碎片化重組,更新產(chǎn)品和服務(wù)。正如黑龍江科學(xué)技術(shù)出版社總編輯張東君所言,基于內(nèi)容的多形態(tài)出版才具有生命力。中國(guó)電力出版社、社科文獻(xiàn)出版社、中國(guó)法制出版社等眾多出版社已經(jīng)改變了生產(chǎn)流程,從排版起就與加工公司合作,僅需4天時(shí)間就可生成XML、PDF和Epub文件,生產(chǎn)周期很短。出版企業(yè)要轉(zhuǎn)換流程,構(gòu)建排版、加工質(zhì)檢、標(biāo)引、成品提交體系,從排版文件到XML、再到知識(shí)圖譜,打造這樣的數(shù)據(jù)庫(kù)生產(chǎn)與發(fā)布模式。要不斷地重組內(nèi)容,利用各種數(shù)字技術(shù)形成新的數(shù)字產(chǎn)品。出版企業(yè)要從文獻(xiàn)服務(wù)向信息服務(wù)轉(zhuǎn)型,最后成為知識(shí)服務(wù)業(yè)。出版企業(yè)要做多種形態(tài)的產(chǎn)品,這樣才有生命力。出版企業(yè)也可以為各類(lèi)客戶(hù)建立數(shù)據(jù)庫(kù),如組織內(nèi)容、搭建平臺(tái)。
李杰臣:《ChatGPT:AI革命》是國(guó)內(nèi)首部利用ChatGPT創(chuàng)作的關(guān)于ChatGPT的圖書(shū),通過(guò)復(fù)盤(pán)該書(shū)的創(chuàng)作和出版流程,能夠直觀感受出版業(yè)如何利用AIGC,以及AIGC對(duì)出版內(nèi)容生產(chǎn)的影響。
這本書(shū)的寫(xiě)作時(shí)間是8天,速度較快:首先,寫(xiě)作過(guò)程中提出的問(wèn)題非常準(zhǔn)確,ChatGPT能夠快速填充細(xì)節(jié)內(nèi)容;其次,這本書(shū)是用ChatGPT講ChatGPT,其回復(fù)相對(duì)準(zhǔn)確。在這本書(shū)的出版過(guò)程中,人工干預(yù)得最多的是寫(xiě)作框架和邏輯關(guān)系,否則輸出內(nèi)容的前后邏輯會(huì)比較混亂。該書(shū)從交稿到出藍(lán)圖的周期大概是7天,一是因?yàn)榭傮w文字量不大,只有11萬(wàn)字;二是根據(jù)一線(xiàn)編輯反饋的意見(jiàn),AIGC的文字質(zhì)量是優(yōu)于絕大多數(shù)人類(lèi)作者的。關(guān)于知識(shí)產(chǎn)權(quán)問(wèn)題,OpenAI公司的官方說(shuō)明中明確提出,通過(guò)個(gè)人提問(wèn)所產(chǎn)生的答案,其知識(shí)產(chǎn)權(quán)歸屬于提問(wèn)者。
沈錫賓:人工智能已經(jīng)給科技期刊界帶來(lái)了正向影響。2019年,中華醫(yī)學(xué)會(huì)與國(guó)際知名期刊服務(wù)商Wiley及其旗下公司Atypon簽約,共同研發(fā)中華醫(yī)學(xué)會(huì)開(kāi)放獲取平臺(tái)。Atypon在特定領(lǐng)域提供知識(shí)服務(wù),目前其主要服務(wù)基于人工智能技術(shù)從原始內(nèi)容中提取知識(shí)而展開(kāi),幫助用戶(hù)在冗長(zhǎng)的文本中快速準(zhǔn)確地找到信息。Atypon的機(jī)器學(xué)習(xí)技術(shù)在內(nèi)容提升、模式識(shí)別、信息檢索以及知識(shí)聚合方面都有很多應(yīng)用和場(chǎng)景。他們認(rèn)為,人工智能在科研設(shè)計(jì)與論文寫(xiě)作、知識(shí)服務(wù)、選題策劃、學(xué)術(shù)不端檢測(cè)、傳播出版等五個(gè)方面有巨大潛力。
Atypon團(tuán)隊(duì)研發(fā)的人工智能技術(shù)應(yīng)用在自動(dòng)摘要、信息提取以及從語(yǔ)音到文本、圖片的轉(zhuǎn)化等領(lǐng)域,團(tuán)隊(duì)還在研發(fā)文章完整性檢測(cè)、高級(jí)篩選論文的功能,可以實(shí)現(xiàn)自動(dòng)翻譯、跨語(yǔ)言檢索;可以基于中文文獻(xiàn)推薦英文文獻(xiàn);可以從一些內(nèi)容中做實(shí)體識(shí)別、構(gòu)建知識(shí)圖譜、尋找疾病與藥物之間的關(guān)系、提取因果關(guān)系,做共病的共同基因的知識(shí)圖譜?;谖恼聝?nèi)容,它可以生成非結(jié)構(gòu)式的小型摘要和一句話(huà)摘要,這個(gè)功能便于論文在Google Scholar這種學(xué)術(shù)引擎中進(jìn)行分發(fā)和傳播;在圖片方面,它可以把模糊的圖片變得高清;可以基于視頻發(fā)現(xiàn)平臺(tái)和AI轉(zhuǎn)換成文本做二次檢索。
4 歧路彷徨:出版業(yè)的“危”與“機(jī)”
AIGC所引發(fā)的是包括本體論、認(rèn)識(shí)論和方法論等在內(nèi)的一場(chǎng)內(nèi)容生產(chǎn)范式轉(zhuǎn)換,這向既有的理論方法、政策工具和實(shí)踐路徑等的有效性提出了挑戰(zhàn),出版業(yè)未來(lái)的不確定性正在增強(qiáng),出版人要做好迎接機(jī)遇與挑戰(zhàn)的兩方面準(zhǔn)備。
張震:大部分人所從事的都是服務(wù)業(yè),包括出版社的編輯。服務(wù)業(yè)的本質(zhì)是表演——有人“表演”,有人“看表演”。出版業(yè)其實(shí)大部分都屬于出版服務(wù)業(yè),如中小學(xué)教輔材料,其中的腦筋急轉(zhuǎn)彎類(lèi)型的內(nèi)容長(zhǎng)期沒(méi)有變化,只是形式更加生動(dòng),更加寓教于樂(lè),更復(fù)雜。ChatGPT能賦能大部分服務(wù)業(yè),服務(wù)行業(yè)不需要太精密,人工智能取代這些行業(yè)是一種必然趨勢(shì)。
清華大學(xué)梁斌教授早在2011年就提出,未來(lái)的網(wǎng)絡(luò)教育領(lǐng)域,教育、培訓(xùn)、出版、咨詢(xún)、投資沒(méi)有邊界。沒(méi)有邊界會(huì)導(dǎo)致工業(yè)時(shí)代的分工、行業(yè)的大規(guī)模融合。出版行業(yè)的未來(lái)會(huì)怎么樣?出版行業(yè)會(huì)做教育、培訓(xùn)、投資以及咨詢(xún)相關(guān)的業(yè)務(wù)。大部分的出版工作和咨詢(xún)工作,本質(zhì)上做的是輔導(dǎo)性的工作,我認(rèn)為會(huì)被AIGC取代;而一些創(chuàng)造性、創(chuàng)新性的行業(yè),是人類(lèi)從來(lái)沒(méi)有去做過(guò)的事情,AIGC可能會(huì)發(fā)揮一些輔助作用。人類(lèi)大腦神經(jīng)元網(wǎng)絡(luò)的參數(shù)、模型和能量消耗,還遠(yuǎn)遠(yuǎn)小于各種人工智能的數(shù)據(jù)模型。ChatGPT會(huì)開(kāi)啟新的人工智能時(shí)代,出版會(huì)成為中國(guó)未來(lái)在線(xiàn)教育的入口。
李杰臣:在人機(jī)協(xié)同過(guò)程中,應(yīng)該注重體現(xiàn)人的主體性。首先,OpenAI公司明確說(shuō)明ChatGPT作為一個(gè)模型是沒(méi)有自主意識(shí)的,其無(wú)法為錯(cuò)誤信息承擔(dān)責(zé)任。出版物應(yīng)該體現(xiàn)人的意志,而AI不是承擔(dān)責(zé)任的主體,這也是很多期刊不接受ChatGPT作為聯(lián)合署名者投稿的原因。其次,在利用ChatGPT進(jìn)行創(chuàng)作的過(guò)程中,很多思想、觀點(diǎn)必須由人提出,否則它會(huì)反復(fù)出現(xiàn)一些口水話(huà)。AI時(shí)代強(qiáng)調(diào)“問(wèn)商”,就是將人的思想和主體性體現(xiàn)成問(wèn)題,去引導(dǎo)機(jī)器回答。做人機(jī)交互,無(wú)論是創(chuàng)作一篇文章還是創(chuàng)作一本書(shū),最終的內(nèi)容還是人引導(dǎo)機(jī)器生產(chǎn)的,而非相反。
對(duì)于編輯個(gè)人來(lái)說(shuō),AIGC高效與否取決于其使用的熟練程度。當(dāng)AIGC引發(fā)一個(gè)產(chǎn)業(yè)的整體生產(chǎn)模式變革后就能體現(xiàn)其優(yōu)勢(shì)。AIGC對(duì)于文字編輯而言是利好,因?yàn)樗梢詭椭薷奈淖直磉_(dá);對(duì)于策劃編輯而言則喜憂(yōu)參半,一方面是中低端作者+AIGC就能很好地實(shí)現(xiàn)選題,另一方面是未來(lái)策劃編輯可能要耗費(fèi)大量精力去甄別AIGC的內(nèi)容。
對(duì)于作者而言,AIGC對(duì)作者的創(chuàng)新思維、邏輯思維和求證辨?zhèn)文芰Φ囊髸?huì)更高。此外,AIGC會(huì)改變作者的一些常規(guī)創(chuàng)作。在提出更好的問(wèn)題的基礎(chǔ)上,讓AIGC去生成約70%的普通內(nèi)容,在此基礎(chǔ)上再增加30%的人類(lèi)見(jiàn)解和創(chuàng)新。另外是去中心化的創(chuàng)作方式,內(nèi)容的生產(chǎn)模式經(jīng)歷了從專(zhuān)家生產(chǎn)到用戶(hù)生產(chǎn)、再到人工智能生產(chǎn)的過(guò)程,領(lǐng)域?qū)<抑恍枰褍?nèi)容的結(jié)構(gòu)體系列出來(lái),再通過(guò)AI填充細(xì)節(jié)。在未來(lái)的創(chuàng)作中,這種去中心化的創(chuàng)作方式或許還會(huì)迎來(lái)新變革。此外,AIGC對(duì)于中低端的作者影響很大,但是對(duì)高端作者影響有限,因?yàn)楦叨俗髡咄袀€(gè)人的獨(dú)特見(jiàn)解。
沈錫賓:AIGC在帶來(lái)一系列利好的同時(shí),也帶來(lái)了一些隱憂(yōu)?!犊茖W(xué)》系列期刊已經(jīng)明確,由ChatGPT(或任何其他人工智能工具)生成的文本不能用于科學(xué)作品中,圖像或圖形也不能是此類(lèi)工具的產(chǎn)品,人工智能的程序不能成為作者;違反這些政策將構(gòu)成學(xué)術(shù)不端行為,與修改圖像或抄襲等不端行為沒(méi)有區(qū)別;當(dāng)然,在研究論文中有許多由AI生成的合法數(shù)據(jù)集(而不是論文的文本)不包括在這次政策的更改中?!都?xì)胞》和《柳葉刀》則表示,不能使用人工智能工具取代作者完成關(guān)鍵性任務(wù),作者還必須在論文中詳細(xì)解釋他們是如何使用人工智能工具的。然而,AIGC與人類(lèi)創(chuàng)作的文本是難以區(qū)分的。AIGC還會(huì)涉及數(shù)據(jù)造假問(wèn)題,計(jì)算機(jī)科學(xué)家已經(jīng)發(fā)現(xiàn),如果軟件沒(méi)有接觸到足夠的訓(xùn)練數(shù)據(jù)來(lái)生成正確的回答,它通常會(huì)編造一個(gè)答案。如果被某些不法機(jī)構(gòu)利用,可能產(chǎn)生大量的混雜了假數(shù)據(jù)的“水文”,會(huì)極大地?cái)_亂科技期刊的同行評(píng)議機(jī)制,造成公共資源的浪費(fèi)。對(duì)此,需要研發(fā)相關(guān)的檢測(cè)工具,例如為DeepFake生成的換臉視頻加上特殊水印,AIGC的文字內(nèi)容也可以參考這種方式,以避免意外風(fēng)險(xiǎn)。
李弘:2022年關(guān)于元宇宙的討論很多,但元宇宙的發(fā)展已經(jīng)開(kāi)始“退燒”。這給我們一個(gè)很強(qiáng)的警醒:這些技術(shù)與出版是何關(guān)系?出版業(yè)如何跟進(jìn)新技術(shù)?出版業(yè)不該盲從技術(shù),尤其是以虛擬技術(shù)為代表的元宇宙技術(shù),因?yàn)閷?duì)于出版業(yè)來(lái)說(shuō),其技術(shù)框架包括相關(guān)應(yīng)用還十分遙遠(yuǎn)。但ChatGPT基于大模型人工智能技術(shù),對(duì)出版業(yè)會(huì)有比較大的影響,它是離出版最近的風(fēng)口,出版融合創(chuàng)新需要解決如何利用ChatGPT技術(shù)的框架及其相關(guān)應(yīng)用的問(wèn)題。如果不利用ChatGPT的相關(guān)技術(shù)來(lái)做好市場(chǎng)的、專(zhuān)業(yè)領(lǐng)域的出版轉(zhuǎn)型,出版發(fā)展就可能面臨越來(lái)越大的壓力。
推動(dòng)出版融合必須厘清技術(shù)和內(nèi)容之間的矛盾關(guān)系,這要求我們?cè)谝粋€(gè)技術(shù)框架里、在一個(gè)更強(qiáng)的法律環(huán)境里重新理解出版。談?wù)摮霭娴谋举|(zhì),必須考慮其技術(shù)本質(zhì),否則在實(shí)踐中就會(huì)遇到困境。例如,關(guān)于專(zhuān)業(yè)出版的困境,實(shí)質(zhì)是投入問(wèn)題?;谡Z(yǔ)音、圖像、文本的人工智能應(yīng)用與出版有很大的重合度。一方面,這對(duì)出版可能會(huì)造成沖擊;另一方面,也給出版帶來(lái)了發(fā)展機(jī)遇,出版業(yè)要加大研發(fā)投入,讓人工智能技術(shù)為我所用,加大技術(shù)對(duì)內(nèi)容的支撐。出版實(shí)踐中對(duì)于數(shù)據(jù)、信息等出版客體的價(jià)值創(chuàng)造關(guān)注不夠。ChatGPT對(duì)于同樣問(wèn)題的回應(yīng)并不相同,其會(huì)根據(jù)問(wèn)題描述情況調(diào)整回答。如果有足夠的語(yǔ)料,它就能在某一個(gè)專(zhuān)業(yè)領(lǐng)域給出更精確的檢索結(jié)果,這對(duì)于改善內(nèi)容質(zhì)量、提高檢索精準(zhǔn)性是十分必要的。但這樣做在某種意義上是不合規(guī)的,雖然能優(yōu)化其模型和輸出結(jié)果,但是存在版權(quán)問(wèn)題和數(shù)據(jù)安全問(wèn)題。對(duì)此,需要盡快建立一個(gè)數(shù)據(jù)安全機(jī)制和內(nèi)容合規(guī)框架,使這類(lèi)技術(shù)為出版所用、為產(chǎn)業(yè)賦能。
AI的突破對(duì)于人類(lèi)的角色和管理效能的提升有很大幫助,對(duì)于ChatGPT的下一步技術(shù)創(chuàng)新,出版主管部門(mén)要做一些課題,重點(diǎn)實(shí)驗(yàn)室要主動(dòng)承擔(dān)責(zé)任,行業(yè)協(xié)會(huì)、高等院校、研究機(jī)構(gòu)都要開(kāi)展研究,共同探討ChatGPT如何與出版結(jié)合。只有在政產(chǎn)學(xué)研各方合力推動(dòng)之下,出版融合發(fā)展的技術(shù)創(chuàng)新和模式創(chuàng)新才有可能成功。
(實(shí)習(xí)生周洋對(duì)此文亦有貢獻(xiàn)。)
作者簡(jiǎn)介
劉廣東,男,北京印刷學(xué)院出版學(xué)院講師。研究方向:出版基礎(chǔ)理論、數(shù)字出版新模式和學(xué)術(shù)出版。
Abstract: Chatbots, represented by ChatGPT, have attracted peoples attention to AIGC once again. The seminar of “Publishing Re-Imagination: AI and Content Production Transformation”, in response to the hot topics, invited five experts either from academia or industry to discuss the future of publishing in the context of AIGC. To understand this paradigm shift in content production transformation, the technical principles and availability of ChatGPT should be investigated and the relationship between man and machine in their interaction in the mode of AIGC must be identified. AIGC has been applied in practice to a certain extent, showing advantages in enhancing content productivity. For the publishing industry, AIGC brings greater uncertainty to industrial development, including both opportunities and challenges, for which publishers should prepare.
Keywords: AIGC; ChatGPT; Publishing transformation; Digital publishing; Intelligent publishing