【摘要】文章基于人工智能生成知識(shí)的視角,分析了智慧驅(qū)動(dòng)型和數(shù)據(jù)驅(qū)動(dòng)型兩種知識(shí)生成的原理,論述了個(gè)體生產(chǎn)知識(shí)、專業(yè)生產(chǎn)知識(shí)、大眾生產(chǎn)知識(shí)以及人工智能生成知識(shí)的沿革歷程,最后提出知識(shí)生成格局的變化對(duì)出版業(yè)、出版本質(zhì)及出版學(xué)研究范圍拓展三個(gè)方面的價(jià)值思考。
【關(guān)鍵詞】AIGC 生成式智能出版 ChatGPT 數(shù)字出版 數(shù)據(jù)科學(xué) 微軟小冰
【中圖分類號(hào)】G230 【文獻(xiàn)標(biāo)識(shí)碼】A 【文章編號(hào)】1003-6687(2023)11-036-09
【DOI】10.13786/j.cnki.cn14-1066/g2.2023.11.005
生成式人工智能技術(shù)的出現(xiàn)引起社會(huì)各行各業(yè)的熱議和思考,在出版業(yè)內(nèi)部,將引發(fā)編校印發(fā)各環(huán)節(jié)革新;[1]在出版業(yè)外部,將促進(jìn)出版大數(shù)據(jù)、智能知識(shí)服務(wù)、出版領(lǐng)域智能決策機(jī)器人、生成式智能出版物以及元宇宙出版等新產(chǎn)品、新業(yè)態(tài)和新模式的涌現(xiàn)。[2]此外,生成式人工智能技術(shù)將推動(dòng)出版業(yè)前端——知識(shí)生成方式發(fā)生革命性變化,把人類生成知識(shí)推至人機(jī)協(xié)同生成知識(shí)的新層面。
一、知識(shí)生成原理闡釋:以智慧為中心與以數(shù)據(jù)為中心
出版是知識(shí)生產(chǎn)和表達(dá)的產(chǎn)業(yè),知識(shí)生產(chǎn)是出版業(yè)的前提和基礎(chǔ)。所謂知識(shí),《現(xiàn)代漢語詞典》有兩種解釋:第一種是指人們?cè)谏鐣?huì)實(shí)踐中所獲得的認(rèn)識(shí)和經(jīng)驗(yàn)的總和;第二種是指學(xué)術(shù)、文化或?qū)W問,如知識(shí)面、知識(shí)分子等。本文以第一種概念為立論之基,探討知識(shí)的生成理路。
人類社會(huì)發(fā)展至今,知識(shí)生成包含智慧驅(qū)動(dòng)型和數(shù)據(jù)驅(qū)動(dòng)型兩種類型。智慧驅(qū)動(dòng)型知識(shí)生成方式,是指知識(shí)生成是在人的智慧主導(dǎo)下所形成的知識(shí)創(chuàng)造。知識(shí)生成最初的原動(dòng)力源于個(gè)體,即“個(gè)體通過直接的‘實(shí)踐經(jīng)驗(yàn)積累隱性知識(shí)”。[3]隱性知識(shí)無法通過文字、語言、圖表或符號(hào)來明確表述,也難以進(jìn)行邏輯說明,往往是人類非語言智力活動(dòng)的成果,如非正式的、難以表達(dá)的經(jīng)驗(yàn)、技巧、技能和訣竅等技能類隱性知識(shí),再如直覺、感悟、洞察力、心智模式、團(tuán)隊(duì)默契、企業(yè)文化等認(rèn)識(shí)類隱性知識(shí)。隱性知識(shí)生成以后,大致形成了社會(huì)化、外顯化、組合化、內(nèi)隱化四種知識(shí)轉(zhuǎn)化模式。[4]社會(huì)化,強(qiáng)調(diào)隱性知識(shí)的傳播過程,即通過傳授、觀察、模仿等社會(huì)化方式實(shí)現(xiàn)個(gè)體與個(gè)體之間的隱性知識(shí)傳播,如出版業(yè)中的“傳幫帶”學(xué)徒機(jī)制,新編輯通過模仿、學(xué)習(xí)和請(qǐng)教等方式學(xué)會(huì)老編輯的技巧和經(jīng)驗(yàn)。外顯化,是隱性知識(shí)轉(zhuǎn)化為顯性知識(shí)的過程。顯性知識(shí)是指可以通過文字、圖表、公式等進(jìn)行完整表述的知識(shí),隱性知識(shí)顯性化的呈現(xiàn)方式包括概念、假設(shè)、模式、類比或比喻等。組合化,是指顯性知識(shí)通過增加、關(guān)聯(lián)、組合、分類和整理等形式向系統(tǒng)知識(shí)轉(zhuǎn)化的過程。內(nèi)隱化,是指顯性知識(shí)的隱性化過程,即顯性知識(shí)體現(xiàn)于隱性知識(shí)之中,生成應(yīng)用性、操作性知識(shí),如“事上練”“干中學(xué)”較好地形容了內(nèi)隱化過程。智慧驅(qū)動(dòng)型的知識(shí)生成是目前占據(jù)主流地位的知識(shí)生成方式,構(gòu)成了目前出版業(yè)所生產(chǎn)和傳播的主流知識(shí)。知識(shí)轉(zhuǎn)化之后,則進(jìn)入知識(shí)論證或驗(yàn)證階段。論證環(huán)節(jié)是指人們通過預(yù)測(cè)或?qū)嶒?yàn),能夠證偽或證明該知識(shí)環(huán)節(jié)決定著知識(shí)的合規(guī)律性和知識(shí)質(zhì)量。在知識(shí)體系構(gòu)建的過程中,論證環(huán)節(jié)主要通過知識(shí)融合方式實(shí)現(xiàn):為解決知識(shí)質(zhì)量參差不齊、基于不同數(shù)據(jù)源的知識(shí)重復(fù)等問題,進(jìn)行知識(shí)融合;對(duì)來自不同數(shù)據(jù)源的知識(shí)基于同一框架規(guī)范進(jìn)行異構(gòu)數(shù)據(jù)整合、消歧,由實(shí)體對(duì)齊和實(shí)體消歧組成。
數(shù)據(jù)驅(qū)動(dòng)型知識(shí)生成方式,是指基于海量數(shù)據(jù)的知識(shí)生產(chǎn)原料,從中挖掘出新規(guī)律、新知識(shí),實(shí)現(xiàn)數(shù)據(jù)、信息走向知識(shí)生成的使命?!耙詳?shù)據(jù)為關(guān)鍵原料的知識(shí)生產(chǎn)范式的出現(xiàn)與知識(shí)形態(tài)的演變,意味著新的認(rèn)識(shí)論或知識(shí)觀正在悄然形成?!盵3]數(shù)據(jù)驅(qū)動(dòng)型知識(shí)生成方式離不開數(shù)據(jù)、算法和算力要素的支持。在數(shù)據(jù)方面,“機(jī)器學(xué)習(xí)的數(shù)據(jù)是影響創(chuàng)作質(zhì)量的重要因素,掌握的數(shù)據(jù)越多,設(shè)定的程序越清晰,他們的知識(shí)創(chuàng)作會(huì)越順利”。[5]相反,數(shù)據(jù)積累偏少、數(shù)據(jù)質(zhì)量不高或需高度創(chuàng)造性寫作的領(lǐng)域,[6]知識(shí)智能生成就無法實(shí)現(xiàn)。就新聞機(jī)器人而言,越是天氣、地震預(yù)報(bào)及金融、體育等數(shù)據(jù)繁多、結(jié)構(gòu)化和標(biāo)準(zhǔn)化水平較高(“干凈”數(shù)據(jù))的領(lǐng)域,[7]就越容易開發(fā)出實(shí)用價(jià)值突出的自然語言自動(dòng)生成系統(tǒng);就生成型預(yù)訓(xùn)練聊天機(jī)器人而言,ChatGPT之所以能夠取得突破性進(jìn)展,極為關(guān)鍵的因素是其從網(wǎng)頁、WebText2、圖書、維基百科等渠道搜集而來的3 000億單詞語料,經(jīng)過數(shù)據(jù)清理后形成超過1 750億的巨量無標(biāo)注文本數(shù)據(jù);[8]就寫作機(jī)器人而言,微軟小冰在出版《陽光失了玻璃窗》詩集之前,就已完成自1920年以來519位詩人的現(xiàn)代詩數(shù)據(jù)訓(xùn)練,并借助深度神經(jīng)網(wǎng)絡(luò)等技術(shù),在訓(xùn)練1萬次之后,具備了創(chuàng)作現(xiàn)代詩歌的能力。
在算法方面,機(jī)器人根據(jù)語法、句法規(guī)則,或者大語言模型,實(shí)現(xiàn)半自動(dòng)或全自動(dòng)的自然語言生成,形成符合人類認(rèn)知、需求和價(jià)值觀的內(nèi)容。不過在具體的算法應(yīng)用方面尚有較大差異,如微軟小冰采用基于規(guī)則的系統(tǒng)和機(jī)器學(xué)習(xí)技術(shù),而ChatGPT則基于海量語料庫以及人類的反饋強(qiáng)化學(xué)習(xí)算法。
在算力方面,算力水平的高低、強(qiáng)弱決定著算法作用的發(fā)揮和數(shù)據(jù)處理能力的大小。通俗理解,算力相當(dāng)于人的大腦在觀察、感知、決策、控制等方面的反應(yīng)速度。ChatGPT能夠成為AI發(fā)展的里程碑式成果,在知識(shí)生成方面實(shí)現(xiàn)巨大跨越,離不開超強(qiáng)算力的支撐和加持。ChatGPT使用的GPT3.5模型在微軟云計(jì)算服務(wù)Azure AI的超算基礎(chǔ)設(shè)施上訓(xùn)練,總算力消耗約為3 640PF-days(按每秒一千萬億次計(jì)算,須運(yùn)行3 640天);[9]而小冰公司與微軟中國聯(lián)手推出的人工智能解決方案,則將微軟智能云Azure作為云計(jì)算運(yùn)營平臺(tái),可以提供大規(guī)模的計(jì)算資源支持。
2021年,Haiko等人從數(shù)據(jù)科學(xué)視角提出了數(shù)據(jù)智能和分析的知識(shí)創(chuàng)造過程模型,將人的智慧和智能化技術(shù)進(jìn)行了有機(jī)融合。[10]該模型分為擴(kuò)大個(gè)體知識(shí)、分享隱性知識(shí)、業(yè)務(wù)概念(個(gè)體通過分享擴(kuò)充知識(shí)以增強(qiáng)業(yè)務(wù)內(nèi)容理解能力)、數(shù)據(jù)理解、數(shù)據(jù)準(zhǔn)備(數(shù)據(jù)加工、清洗、整合等)、數(shù)據(jù)建模、評(píng)估論證、知識(shí)生成(知識(shí)網(wǎng)絡(luò)化)、模型應(yīng)用以及部署(新知識(shí)、新模型的應(yīng)用)階段。也有國內(nèi)學(xué)者進(jìn)一步提煉為“業(yè)務(wù)理解與概念化、數(shù)據(jù)準(zhǔn)備與建模、知識(shí)生成與模型應(yīng)用”[3]三個(gè)階段。由此看來,人類智慧生產(chǎn)知識(shí)和數(shù)據(jù)生成知識(shí)的融合趨勢(shì)日益明顯,融為一體、合而為一的知識(shí)生成新格局正在加速形成。
二、知識(shí)生成進(jìn)階分析:從個(gè)體智慧到人工智能
ChatGPT的火出圈,也推動(dòng)著知識(shí)生成從個(gè)體生產(chǎn)知識(shí)、專業(yè)生產(chǎn)知識(shí)、大眾生產(chǎn)知識(shí)走向人工智能生成知識(shí),進(jìn)而推動(dòng)人機(jī)協(xié)同生成知識(shí)新格局的出現(xiàn),知識(shí)生成進(jìn)階見下頁圖1。
1. 個(gè)體生產(chǎn)知識(shí)
“人類知識(shí)的兩大枝干,它們也許來自某種共同但不為我們所知的根源,這就是感性和理性。”[11]知識(shí)是如何產(chǎn)生的?關(guān)于這個(gè)問題,古今中外先賢們孜孜不倦地追求并試圖給出盡可能合理的答案,由此形成了經(jīng)驗(yàn)論和唯理論兩種認(rèn)知觀。以笛卡爾、斯賓諾莎和萊布尼茨等人為代表的唯理論派認(rèn)為,知識(shí)的源泉是“天賦觀念”,唯有經(jīng)過演繹和推理所獲得的理性知識(shí),方是可靠的知識(shí),因此崇尚演繹法;而貝克萊、休謨和馬赫等則認(rèn)為,知識(shí)的源泉是經(jīng)驗(yàn)感知,知識(shí)是對(duì)客觀世界的反映,人們通過感官對(duì)世界進(jìn)行觀察歸納和總結(jié),從而形成知識(shí),故崇尚歸納法。
此外,力圖綜合唯理論和經(jīng)驗(yàn)論的康德則以感知經(jīng)驗(yàn)為基礎(chǔ),提出先驗(yàn)想象力的概念,以“靈魂不可或缺的功能”[12]試圖找尋二者之間的平衡點(diǎn),即想象力是感情和理性的中介,是先天知識(shí)的奠基力量。“科學(xué)始于問題”是卡爾·波普爾提出的著名觀點(diǎn),[13]強(qiáng)調(diào)的是問題促使人們探索、思考,并通過科學(xué)嚴(yán)謹(jǐn)?shù)那笞C過程獲得答案,最終形成有關(guān)問題的科學(xué)知識(shí)。[14]應(yīng)該說,“科學(xué)始于問題”的知識(shí)生產(chǎn)方式,圍繞著問題的提出、猜想假設(shè)、證偽排除,最終提出新問題,同樣綜合了唯理論和經(jīng)驗(yàn)論,并強(qiáng)調(diào)實(shí)驗(yàn)法對(duì)科學(xué)知識(shí)發(fā)現(xiàn)的重要價(jià)值。
個(gè)體生產(chǎn)知識(shí)本質(zhì)上是觀念生產(chǎn)和創(chuàng)造活動(dòng),是個(gè)體基于語言和心智,對(duì)陌生事物的概念、屬性、特征、程序、結(jié)構(gòu)、邏輯等進(jìn)行探索的過程?;趥€(gè)體生產(chǎn)的知識(shí),推動(dòng)著社會(huì)從蒙昧樸素走向科學(xué)理性,對(duì)科學(xué)和社會(huì)發(fā)展有著不可磨滅的貢獻(xiàn)。[5]個(gè)體生產(chǎn)知識(shí)古已有之,是出版和出版業(yè)發(fā)展的原動(dòng)力。如孔子以“垂世立教”的思想“書其重者”,選擇重要的學(xué)術(shù)著作進(jìn)行整理、刪節(jié)、補(bǔ)充、編次和闡述,編訂“六經(jīng)”,歸納總結(jié)了夏商周三代文化,實(shí)現(xiàn)了中華文化的傳播與傳承,且孔子之于《論語》的原創(chuàng)性知識(shí)生產(chǎn)影響深遠(yuǎn),迄今仍然是出版機(jī)構(gòu)出版和發(fā)行的暢銷品牌。個(gè)體生產(chǎn)知識(shí)對(duì)出版業(yè)的影響還體現(xiàn)在專著出版這一出版業(yè)態(tài)上。在學(xué)術(shù)出版或?qū)I(yè)出版領(lǐng)域,專著是學(xué)術(shù)成果的最主要體現(xiàn),也是個(gè)體生產(chǎn)知識(shí)的智慧結(jié)晶,是作者圍繞特定選題所進(jìn)行的系統(tǒng)、專深的知識(shí)生產(chǎn)。
2. 專業(yè)生產(chǎn)知識(shí)
專業(yè)生產(chǎn)知識(shí)是指由專門的組織或個(gè)人負(fù)責(zé)知識(shí)生產(chǎn),是以知識(shí)生產(chǎn)為職業(yè)活動(dòng)的過程?!皩I(yè)組織所生產(chǎn)的文化形式開始決定著其他個(gè)體文化形式的合法性、合理性與發(fā)展方向,壟斷著對(duì)宇宙、社會(huì)、人生以及神的存在等問題的解釋權(quán),影響著人類的終極關(guān)懷?!盵15]
在我國歷史上,西周時(shí)期就已出現(xiàn)專業(yè)化的知識(shí)生產(chǎn)組織,《禮記·王制》記載:“天子命之教然后為學(xué)。小學(xué)在公宮南之左,大學(xué)在郊。天子曰辟雍,諸侯曰泮宮?!碧熳拥拇髮W(xué)叫辟雍,諸侯的大學(xué)叫泮宮。春秋戰(zhàn)國時(shí)期,諸子百家爭(zhēng)鳴,分別生產(chǎn)、傳播和傳世了各學(xué)派的知識(shí)和理論。諸子書編纂有個(gè)鮮明特點(diǎn),即采用語錄體,[16]由弟子門人根據(jù)老師生前言談內(nèi)容編輯記錄而成。西漢時(shí)期,“興太學(xué)”,“以養(yǎng)天下之士”。作為專門傳授知識(shí)、研究學(xué)問的太學(xué),開創(chuàng)于公元前124年,與西方的雅典大學(xué)、亞歷山大里亞大學(xué)同為世界上最古老的高等學(xué)校。[17]到唐朝初年,太學(xué)規(guī)模完備,盛極一時(shí)。唐朝和宋朝,太學(xué)和國子學(xué)同時(shí)存在,元明清則改設(shè)國子學(xué)或國子監(jiān)。
西方出現(xiàn)的第一個(gè)培育思想的場(chǎng)所是公元前387年柏拉圖創(chuàng)立的阿加德米學(xué)園,被視作“雅典第一個(gè)永久性的高等教育機(jī)構(gòu)”。[18]學(xué)園生產(chǎn)和教授體操、數(shù)學(xué)、音樂、法律等各門知識(shí),以培養(yǎng)自由人格和探索萬物本源的能力。中世紀(jì)時(shí)期,沙龍成為上流社會(huì)和文人雅士生產(chǎn)和交流知識(shí)的重要場(chǎng)所,知識(shí)生產(chǎn)為上流精英和政府權(quán)威所壟斷。及至大學(xué)出現(xiàn),符合要求的大學(xué)從業(yè)者成為職業(yè)化的知識(shí)生產(chǎn)者,與科研團(tuán)隊(duì)在組織制度下從事知識(shí)生產(chǎn),從而實(shí)現(xiàn)了個(gè)人知識(shí)向?qū)I(yè)知識(shí)的跨越。而今,大學(xué)也不再是唯一的知識(shí)生產(chǎn)組織,學(xué)會(huì)、協(xié)會(huì)、實(shí)驗(yàn)室、科技公司、創(chuàng)新智庫等越來越成為科研創(chuàng)新主體,擔(dān)任著生產(chǎn)和傳播知識(shí)的角色。
專業(yè)人士生產(chǎn)知識(shí)或精英群體生產(chǎn)知識(shí),本質(zhì)上還是個(gè)體生產(chǎn)知識(shí),只不過依托專門化的知識(shí)生產(chǎn)組織,在知識(shí)探索、生產(chǎn)和傳播途徑上更加科學(xué)化、合理化和系統(tǒng)化。而專業(yè)組織生產(chǎn)知識(shí)或?qū)I(yè)機(jī)構(gòu)生產(chǎn)知識(shí),一方面,使知識(shí)的生產(chǎn)者、擁有者由權(quán)貴階層、精英階層轉(zhuǎn)變?yōu)槁殬I(yè)性知識(shí)生產(chǎn)者,只要該生產(chǎn)者具有專業(yè)組織標(biāo)準(zhǔn),即可在制度內(nèi)從事知識(shí)的協(xié)同生產(chǎn)和傳播;另一方面,個(gè)體生產(chǎn)知識(shí)模式轉(zhuǎn)變?yōu)閰f(xié)作生產(chǎn)知識(shí)模式,知識(shí)生產(chǎn)向著群體化、社會(huì)化、職業(yè)化、建制化、合理化的方向發(fā)展,在更大范圍內(nèi)、更高水平上、更深程度上推動(dòng)了人類社會(huì)的知識(shí)生產(chǎn)和傳播水平的提升。
以出版視角來審視,專業(yè)生產(chǎn)知識(shí)對(duì)出版業(yè)發(fā)展也產(chǎn)生了深刻而久遠(yuǎn)的影響。首先,學(xué)術(shù)出版本身就是對(duì)學(xué)術(shù)成果進(jìn)行編輯加工,面向?qū)W術(shù)群體進(jìn)行傳播,以推動(dòng)學(xué)術(shù)研究進(jìn)步為宗旨。[19]學(xué)術(shù)出版得以誕生、發(fā)展與壯大,離不開專業(yè)生產(chǎn)內(nèi)容模式的出現(xiàn),得益于大學(xué)等專業(yè)組織生產(chǎn)和傳播知識(shí)的直接推動(dòng)。其次,專業(yè)出版作為面向特定領(lǐng)域的職業(yè)群體所開展的法律、醫(yī)學(xué)、建筑等專業(yè)知識(shí)生產(chǎn)和傳播的業(yè)態(tài),本身也是專業(yè)生產(chǎn)知識(shí)模式在出版業(yè)的體現(xiàn),是專業(yè)生產(chǎn)和傳播知識(shí)的發(fā)展結(jié)果。最后,教育出版是以教材、教輔圖書、數(shù)字教育服務(wù)為主要產(chǎn)品的出版業(yè)態(tài),以社會(huì)教育和知識(shí)傳播為主要目的。
3. 大眾生產(chǎn)知識(shí)
隨著互聯(lián)網(wǎng)時(shí)代的到來,網(wǎng)絡(luò)重構(gòu)了社會(huì)形態(tài),也成為新知識(shí)的提供方和沉淀池。為適應(yīng)互聯(lián)網(wǎng)變革,“知識(shí)的創(chuàng)造者和應(yīng)用者都要具有將知識(shí)轉(zhuǎn)化成電腦語言的工具和技巧”,[20]通過鍵盤、屏幕、網(wǎng)絡(luò)等新介質(zhì),人們?cè)诨ヂ?lián)網(wǎng)上生產(chǎn)、分發(fā)和共享數(shù)據(jù)、信息、知識(shí),形成了新的思維方式、工作方式和生活方式。于是,用戶生產(chǎn)知識(shí)這一新的知識(shí)生產(chǎn)方式應(yīng)運(yùn)而生。
用戶生產(chǎn)知識(shí)在出版業(yè)有幾種典型的業(yè)態(tài),在特定的發(fā)展階段,這些新業(yè)態(tài)的出現(xiàn),進(jìn)一步推動(dòng)了出版業(yè)的可持續(xù)、高質(zhì)量發(fā)展。第一,網(wǎng)絡(luò)出版。網(wǎng)絡(luò)出版相較于傳統(tǒng)的圖書出版,首先,作者身份由專業(yè)群體轉(zhuǎn)變?yōu)榇蟊娋W(wǎng)民,出版作者準(zhǔn)入門檻降低,作者群體規(guī)模擴(kuò)大;其次,出版的門檻實(shí)質(zhì)性降低了,不像圖書出版需要嚴(yán)格的書號(hào)配給,網(wǎng)絡(luò)出版取得經(jīng)營許可證后,具體的編號(hào)編碼由網(wǎng)絡(luò)出版企業(yè)自行開展;再次,網(wǎng)民大眾生產(chǎn)網(wǎng)絡(luò)文學(xué)、小說作品等,通過網(wǎng)絡(luò)出版的傳播,進(jìn)一步發(fā)揮了數(shù)字出版產(chǎn)品的教誨、審美、倫理等價(jià)值,維護(hù)了社會(huì)和諧穩(wěn)定。第二,眾智眾創(chuàng)的民營出版。民營文化公司的知識(shí)生產(chǎn)方式,較國有出版企業(yè)有較大不同:后者主要是借助外部作者的資源,進(jìn)行知識(shí)的二次生產(chǎn);而前者則大多圍繞特定領(lǐng)域、特定主題、特定知識(shí)點(diǎn),組織包括自身隊(duì)伍在內(nèi)的眾人智慧進(jìn)行編創(chuàng),是知識(shí)的一次生產(chǎn),甚至許多出版產(chǎn)品的知識(shí)生產(chǎn)完全來自自身,如考研輔導(dǎo)讀物、中小學(xué)教輔讀物等。第三,基于互聯(lián)網(wǎng)的大眾協(xié)作式知識(shí)生產(chǎn)?;诨ヂ?lián)網(wǎng)的大眾協(xié)作式知識(shí)生產(chǎn),如百度百科、維基百科、豆瓣小組等網(wǎng)絡(luò)平臺(tái)的知識(shí)產(chǎn)品,往往就特定的知識(shí)體系、知識(shí)點(diǎn),面向全網(wǎng)征稿,符合一定標(biāo)準(zhǔn)和具備一定水平的網(wǎng)民,可以就相關(guān)詞條、相關(guān)作品進(jìn)行內(nèi)容編創(chuàng),所完成的知識(shí)產(chǎn)品經(jīng)過審校后可面向整個(gè)互聯(lián)網(wǎng)進(jìn)行知識(shí)傳播。值得注意的是,這種生產(chǎn)方式,一方面,融匯了大眾集體的智慧,是智慧生產(chǎn)知識(shí)的模式;另一方面,也融合了智能化的數(shù)字技術(shù),采取知識(shí)挖掘、數(shù)據(jù)驅(qū)動(dòng)知識(shí)生成技術(shù),因此是既屬于智慧驅(qū)動(dòng)型也屬于數(shù)據(jù)驅(qū)動(dòng)型的知識(shí)生產(chǎn)模式。
隨著5G技術(shù)的普及和推廣,互聯(lián)網(wǎng)門檻進(jìn)一步降低,得益于移動(dòng)互聯(lián)網(wǎng)終端設(shè)備的普及與通信寬帶提速降費(fèi)等,用戶依然是互聯(lián)網(wǎng)內(nèi)容的主要生產(chǎn)者和有力傳播者。[21]基于5G容量增強(qiáng)、海量終端、高速率以及低時(shí)延等技術(shù)優(yōu)勢(shì),大眾進(jìn)行知識(shí)生產(chǎn)、制作、下載的高速度、即時(shí)化效果將進(jìn)一步呈現(xiàn),同時(shí),將進(jìn)一步面臨生產(chǎn)內(nèi)容、生產(chǎn)知識(shí)的審核、把關(guān)等方面的挑戰(zhàn)。
于出版業(yè)發(fā)展而言,大眾生產(chǎn)知識(shí)模式的出現(xiàn),一方面,擴(kuò)大了上游的作者群體,使作者的范疇不再局限于專業(yè)人士和專業(yè)組織,進(jìn)一步擴(kuò)展到數(shù)量更多、范圍更廣、代表性更強(qiáng)的公民大眾;另一方面,大眾生產(chǎn)知識(shí)模式的豐富和發(fā)展,推動(dòng)著大眾出版、民營出版的蓬勃發(fā)展,促進(jìn)了網(wǎng)絡(luò)出版業(yè)態(tài)的繁榮壯大,也進(jìn)一步強(qiáng)化了眾智眾創(chuàng)的群體智能技術(shù)在出版業(yè)的廣泛落地和應(yīng)用。
4. 人工智能生成知識(shí)
前述個(gè)體生產(chǎn)知識(shí)、專業(yè)生產(chǎn)知識(shí)、大眾生產(chǎn)知識(shí)在各自的發(fā)展階段對(duì)知識(shí)生產(chǎn)、傳播和規(guī)律探索都起到了積極的推動(dòng)作用,但是知識(shí)生產(chǎn)的主體始終局限于人的范疇。而人工智能生產(chǎn)知識(shí)則把知識(shí)生產(chǎn)主體由同質(zhì)的個(gè)人、專業(yè)群體或?qū)I(yè)組織擴(kuò)展到異質(zhì)的數(shù)據(jù)、算法、機(jī)器、人工智能。
其實(shí),新型內(nèi)容生產(chǎn)方式(AIGC)并非新事物,早在第二次人工智能浪潮(1976—2006年)時(shí),專家系統(tǒng)就試圖通過“人機(jī)交互界面、知識(shí)庫、推理機(jī)、解釋器、綜合數(shù)據(jù)庫、知識(shí)獲取”[22]等部件,輸入某個(gè)領(lǐng)域的大量專家知識(shí)與經(jīng)驗(yàn),模擬人類專家的推理思維,解決需要人類專家處理的復(fù)雜知識(shí)問題。專家系統(tǒng)依據(jù)知識(shí)庫,使用推理機(jī)所得出的結(jié)論,就具備了AIGC的雛形,具有了人工智能生成知識(shí)的意味。1976年,耶魯大學(xué)開啟了機(jī)器模擬人類寫作的先河,研發(fā)了全球首套故事寫作機(jī)器算法,支持撰寫簡(jiǎn)訊等簡(jiǎn)單文字內(nèi)容。[6]
前些年的微軟小冰、新聞機(jī)器人、維基百科等都具備了人工智能生成內(nèi)容的能力,只是ChatGPT優(yōu)化對(duì)話語言模型出現(xiàn)以后,其超強(qiáng)的內(nèi)容創(chuàng)作、智能回答、代碼編寫、內(nèi)容翻譯、教育輔導(dǎo)等能力,使得AIGC由專業(yè)群體走向公民大眾、由特定行業(yè)走向社會(huì)的方方面面。維基百科、新聞機(jī)器人、微軟小冰、ChatGPT代表著四種不同人工智能生成內(nèi)容、知識(shí)的技術(shù)路線。
(1)基于群體智能的AIGC。群體智能源于20世紀(jì)90年代人們對(duì)蜜蜂、螞蟻、魚、鳥等生物群體的觀察和研究。所謂群體智能,是指數(shù)量眾多的無智能或低智能的簡(jiǎn)單個(gè)體聚集在一起組成群體,利用群體優(yōu)勢(shì)通過相互間的分工合作表現(xiàn)出智能行為特性。[23]
群體智能作為新一代人工智能的重要方向,作為我國人工智能發(fā)展的重點(diǎn)領(lǐng)域,已是不爭(zhēng)的事實(shí)。在理論層面,繼自組織、間接通信以及群體智能系統(tǒng)的底層機(jī)制研究等涌現(xiàn)[24]之后,結(jié)構(gòu)理論與組織方法、激勵(lì)機(jī)制與涌現(xiàn)機(jī)理、學(xué)習(xí)理論與方法、通用計(jì)算范式與模型,成為基于互聯(lián)網(wǎng)的群體智能理論體系重點(diǎn)突破的方向所在。在政策層面,國務(wù)院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》明確規(guī)定了群體智能的基礎(chǔ)理論、關(guān)鍵共性技術(shù)、服務(wù)平臺(tái)以及應(yīng)用場(chǎng)景,指出要開展群體智能的知識(shí)獲取與生成關(guān)鍵技術(shù)研究。在實(shí)踐層面,群體智能的應(yīng)用場(chǎng)景廣泛,幾乎滲透到生活的各個(gè)方面,如基于群體編輯的維基百科、基于眾包眾享的共享經(jīng)濟(jì)、基于眾問眾答的知識(shí)共享等,甚至包括“基于群智理念的出版流程協(xié)同再造”。[25]
維基百科是群體智能生成知識(shí)的典型產(chǎn)品,也是前述數(shù)據(jù)驅(qū)動(dòng)型知識(shí)生產(chǎn)方式的經(jīng)典案例。維基百科“通過大規(guī)模群體協(xié)作、非線性、去中心化、自下而上的群體智慧方法”,[26]實(shí)現(xiàn)了對(duì)結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)源的知識(shí)抽取。一方面,抽取的結(jié)果形成了形式化的知識(shí),如建筑、法律、醫(yī)學(xué)等領(lǐng)域本體;另一方面,生成了基于元數(shù)據(jù)的專題知識(shí)庫。這一過程的微觀層面可描述為,用戶以標(biāo)簽(用戶隱性知識(shí)顯性化的結(jié)果)作為信息載體參與群體的交流和溝通,通過對(duì)信息資源的大量標(biāo)注進(jìn)行協(xié)作,從而形成群體知識(shí);群體知識(shí)在推動(dòng)個(gè)體智能提升的基礎(chǔ)上促進(jìn)群體智能的涌現(xiàn),從而再次鞏固群體知識(shí)形成的基礎(chǔ)。[27]在技術(shù)路線的歸結(jié)上,維基百科奉行的是人機(jī)物結(jié)合的群體智能2.0時(shí)代的眾包技術(shù),[28]任務(wù)提出者運(yùn)用互聯(lián)網(wǎng)聚集群體智慧,將任務(wù)發(fā)布在眾包平臺(tái)上供參加者選擇,任務(wù)提出者和參加者基于眾包平臺(tái)進(jìn)行信息交流。
(2)基于模板的AIGC。就新聞資訊行業(yè)而言,機(jī)器撰稿、新聞推薦已不是新鮮事物。[29]新聞機(jī)器人本身是一種人工智能生成內(nèi)容、生成知識(shí)的技術(shù)。國外有代表性的新聞機(jī)器人有美聯(lián)社的WordSmith、《華盛頓郵報(bào)》的Heliograf以及《紐約時(shí)報(bào)》的Blossom等;國內(nèi)則有新華社的快筆小新、騰訊的Dreamwriter(夢(mèng)幻寫手)、第一財(cái)經(jīng)的DT稿王、《南方都市報(bào)》的小南、今日頭條的張小明、中國地震臺(tái)網(wǎng)的地震信息播報(bào)機(jī)器人等。
機(jī)器人撰稿核心技術(shù)主要是自然語言處理、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、知識(shí)圖譜、語音識(shí)別及計(jì)算機(jī)視覺等。作為自然語言生成系統(tǒng),機(jī)器人撰稿的技術(shù)路線有模板式、抽取式和生成式三種。[30]抽取式撰稿的技術(shù)路線主要應(yīng)用在文本自動(dòng)摘要方面,即機(jī)器人從海量文本素材中篩選重要信息,進(jìn)行二次加工,從原始新聞文本內(nèi)容中快速抽取核心信息,生成文章摘要。生成式撰稿的技術(shù)路線則主要體現(xiàn)在基于大語言模型的AIGC,如ChatGPT?;谀0宓臋C(jī)器人撰稿技術(shù)是迄今最普遍、最成熟的一種技術(shù)。其主要技術(shù)原理包括:首先,清洗和加工數(shù)據(jù),建立海量的語料庫;其次,對(duì)海量語料庫進(jìn)行訓(xùn)練,形成深度學(xué)習(xí)模型,并通過語義分析、命名實(shí)體識(shí)別和情感分析等技術(shù),準(zhǔn)確抓取新聞事件的關(guān)鍵要素,[31]包括測(cè)量新聞性、敘事角度排序、匹配報(bào)道角度與數(shù)據(jù)事實(shí)(選擇故事點(diǎn))等;最后,因事制宜選擇模板,篩選關(guān)鍵數(shù)據(jù)填入語言模板模型,[32]自動(dòng)生成新聞稿件并基于自然語言進(jìn)行潤色。早期的新聞機(jī)器人所生成的稿件,往往因?yàn)槟0鍐我欢勺x性不強(qiáng)、模板痕跡嚴(yán)重而為人詬病,但經(jīng)過數(shù)十年的發(fā)展,各種新聞機(jī)器人的語言模板類型不斷豐富、數(shù)量不斷增加,基于不同模板生成的新聞適人化、可讀性程度不斷提升,已經(jīng)達(dá)到難以區(qū)分是由人類撰寫還是由機(jī)器撰寫的程度。如Wordersmith自身擁有100多種報(bào)道類型、3億種新聞寫作模板,不同模板的語調(diào)、語氣和寫作風(fēng)格都各有特色。新聞機(jī)器人生成的稿件,從枯燥無味、單調(diào)呆板變得更加生動(dòng)、具有人情味,更加符合人類的學(xué)習(xí)、閱讀、思考和表達(dá)習(xí)慣。
此外,AI主播等新聞機(jī)器人在前述技術(shù)基礎(chǔ)之上,還運(yùn)用了計(jì)算機(jī)視覺、語音合成等技術(shù),基于真人表情、語音、唇形等特征進(jìn)行建模,把文字信息轉(zhuǎn)化為音視頻的形式,實(shí)現(xiàn)新聞咨詢的音視頻播報(bào)和實(shí)時(shí)交流互動(dòng)。
(3)基于規(guī)則的AIGC與基于大模型的AIGC。在ChatGPT出現(xiàn)以前,微軟小冰、微軟小娜等聊天機(jī)器人在內(nèi)容、知識(shí)生成方面有著不俗的表現(xiàn),一度是AIGC領(lǐng)域的佼佼者。但前者的到來并成為現(xiàn)象級(jí)事件,使得有必要分析和比較這兩種AIGC的技術(shù)原理和應(yīng)用場(chǎng)景差異,以便對(duì)AIGC有更進(jìn)一步的認(rèn)知和理解。
2014年5月,微軟(亞洲)互聯(lián)網(wǎng)工程院正式宣告微軟小冰的誕生。微軟小冰是建立在情感計(jì)算框架基礎(chǔ)上,綜合運(yùn)用算法、大數(shù)據(jù)和云計(jì)算,逐步進(jìn)行代際升級(jí)并向EQ方向發(fā)展的完整的人工智能體系。[33]2021年9月,第九代微軟小冰發(fā)布,覆蓋中國、日本、印尼等多個(gè)國家的6.6億在線用戶、4.5億臺(tái)智能設(shè)備以及9億內(nèi)容觀眾,涵蓋金融、地產(chǎn)、汽車、零售等多個(gè)垂直領(lǐng)域。
在內(nèi)容生成方面,微軟小冰可以進(jìn)行文本內(nèi)容、語音內(nèi)容以及視覺內(nèi)容生成。在詩歌領(lǐng)域,2017年其與湛廬文化合作出版首部AI詩集《陽光失了玻璃窗》,2019年采取人機(jī)合作的方式出版首部由AI和人類共同創(chuàng)作的詩集《花是綠水的沉默》;在金融領(lǐng)域,建立國內(nèi)規(guī)模第一的金融文本摘要平臺(tái),為國內(nèi)40%以上的個(gè)人投資者和90%以上的金融機(jī)構(gòu)交易員提供金融知識(shí)服務(wù),并構(gòu)建了基于小冰AI生成的金融知識(shí)圖譜;在音樂領(lǐng)域,創(chuàng)作獨(dú)一無二的音樂曲目,并自主完成樂器選擇、編曲和歌詞創(chuàng)作,自主發(fā)布數(shù)十首逼近人類歌手演唱水平的單曲;在有聲讀物領(lǐng)域,構(gòu)建CCP有聲讀物生產(chǎn)平臺(tái)并創(chuàng)造30多個(gè)角色化聲音,支持基于AI技術(shù)自動(dòng)生成定制化的兒童有聲讀物,并擁有2 300多小時(shí)自主版權(quán)的非定制兒童有聲讀物,形成了國內(nèi)規(guī)模較大的有聲讀物知識(shí)庫;在繪畫領(lǐng)域,通過學(xué)習(xí)400多年藝術(shù)史上的236位著名畫家的經(jīng)驗(yàn),可在受到創(chuàng)作激勵(lì)時(shí),獨(dú)立完成100%原創(chuàng)繪畫作品,并于2019年在中央美術(shù)學(xué)院舉辦個(gè)人畫展,于2020年在中信出版社出版繪畫作品集《或然世界:誰是人工智能畫家小冰》。此外,小冰在圖案設(shè)計(jì)、電臺(tái)節(jié)目和電視臺(tái)節(jié)目?jī)?nèi)容生成方面也都有著杰出的表現(xiàn)。
ChatGPT作為一款火爆2023年度的AI產(chǎn)品,其在智能回答、代碼編寫、教育輔導(dǎo)、內(nèi)容翻譯以及內(nèi)容創(chuàng)作方面的應(yīng)用場(chǎng)景和表現(xiàn),以及作用于出版業(yè)所形成的生成式智能出版場(chǎng)景,如出版大數(shù)據(jù)與大語言模型、升維發(fā)展的智能知識(shí)服務(wù)、智能決策的出版領(lǐng)域智能機(jī)器人、生成式智能出版物、元宇宙出版五類新業(yè)態(tài),已有相關(guān)研究[1-2]加以介紹,此不贅言。
同樣是人工智能生成內(nèi)容、生成知識(shí)的微軟小冰和ChatGPT,其相互之間的原理、場(chǎng)景和特征對(duì)比分析主要有以下幾方面。
在AI設(shè)定方面,小冰被設(shè)定為對(duì)話代理,用于社交平臺(tái)為用戶提供情感陪護(hù),其已然成為全球范圍內(nèi)承載交互量最大的人工智能系統(tǒng),占全球交互總量60%以上。ChatGPT則優(yōu)化對(duì)話語言模型,運(yùn)用更為通用的大語言模型,可回答更廣闊范圍內(nèi)的各種知識(shí)問題并執(zhí)行各種自然語言處理任務(wù)。小冰的目標(biāo)設(shè)定和功能設(shè)置上更多屬于情感智能的范疇,而ChatGPT則更多屬于認(rèn)知智能的范疇。前者旨在賦予AI以類似于人的觀察、理解和生成各種情感特征的能力,產(chǎn)生類人情感并進(jìn)行自然、親切、生動(dòng)交互;后者則旨在賦予AI具備類似人的學(xué)習(xí)、理解、語言、推理、決策等高級(jí)智能,進(jìn)行知識(shí)學(xué)習(xí)、邏輯推理、問題求解、形成知識(shí)圖譜或進(jìn)行智能決策等。二者的共同點(diǎn)在于均集多項(xiàng)技能于一身,都具備了通用人工智能的若干屬性。
在算法方面,微軟小冰使用了基于規(guī)則的系統(tǒng)以及深度學(xué)習(xí)技術(shù),即使用了預(yù)先定義的規(guī)則和規(guī)則引擎進(jìn)行響應(yīng)和交互,其主要過程包括:一是語義解析,對(duì)輸入的文本進(jìn)行語義解析以理解關(guān)鍵信息和意圖;二是規(guī)則匹配,基于預(yù)定義規(guī)則和規(guī)則引擎來匹配輸入的語義和模式,如使用固定的模板;三是生成回復(fù),匹配到相應(yīng)的規(guī)則,根據(jù)規(guī)則的定義生成回復(fù),回復(fù)的方式可以是簡(jiǎn)單的文本替換,也可以基于模板填充;四是輸出和交互,把生成的回復(fù)反饋給用戶,作為對(duì)用戶輸入的回應(yīng)。而ChatGPT則使用了基于人類反饋強(qiáng)化學(xué)習(xí)算法的Transformer架構(gòu)以及自注意力機(jī)制(self-attention)。GPT是一種基于互聯(lián)網(wǎng)可用數(shù)據(jù)訓(xùn)練的文本生成深度學(xué)習(xí)模型,采用了利用人類反饋中強(qiáng)化學(xué)習(xí)(Reinforcement Learning with Human Feedback,RLHF)算法,主要包括三個(gè)步驟:一是預(yù)訓(xùn)練語言模型的訓(xùn)練階段,旨在形成自然語言理解與生成上下文學(xué)習(xí)能力、復(fù)雜意圖理解能力以及特定受眾文本摘要能力等;二是打分模型訓(xùn)練階段,旨在通過代碼微調(diào)和指令微調(diào)來評(píng)估模型輸出符合人類表現(xiàn)程度的優(yōu)劣;三是基于強(qiáng)化學(xué)習(xí)的語言模型優(yōu)化階段,旨在優(yōu)化模型,支持生成思維鏈進(jìn)行復(fù)雜推理,以提高ChatGPT的思考能力。自注意力機(jī)制,也是Transformer架構(gòu)的核心技術(shù)之一,通過給予不同位置的元素不同的注意力權(quán)重,使得模型可以根據(jù)序列中元素之間的相關(guān)性加權(quán)組合信息。ChatGPT的Transformer架構(gòu)則使用了多頭注意力機(jī)制,在不同的“頭”中分別計(jì)算注意力權(quán)重,以獲得更多顆細(xì)顆粒度的關(guān)注信息。[34]多注意力機(jī)制的使用,使得ChatGPT具有更卓越的處理長序列和捕捉長距離依賴關(guān)系的能力,更好地實(shí)現(xiàn)自然語言理解,能夠生成連貫的、高質(zhì)量的文本內(nèi)容。
在數(shù)據(jù)語料庫方面,微軟小冰側(cè)重于中文語境,集合了中國近7億用戶的社交數(shù)據(jù)、新聞和百科知識(shí)等,并精練為1 500萬條真實(shí)而有趣的語料庫(之后每天凈增 0.7%)。[34]ChatGPT的訓(xùn)練語料或數(shù)據(jù)來源則主要是英語、法語等其他語境,大致有兩類:一是前文介紹過的超過1 750億的巨量無標(biāo)注文本數(shù)據(jù);[33]二是有標(biāo)注文本數(shù)據(jù),融入了由40名標(biāo)注人員主導(dǎo)的、數(shù)萬高質(zhì)量的、符合人類偏好的人工標(biāo)注數(shù)據(jù),“以獲得聽得懂人類語言、自身擁有判斷標(biāo)準(zhǔn)的LLM”。[8]
正是由于上述三方面的不同,微軟小冰和ChatGPT在知識(shí)生成方面各有特色:在輸出長度方面,微軟小冰輸出內(nèi)容的長度和規(guī)模較ChatGPT顯得力有不逮,后者可以輸出數(shù)萬字的文本內(nèi)容;在輸出模態(tài)方面,微軟小冰可支持輸出文本、圖片、表情符號(hào)、音頻、視頻等多種模態(tài)的知識(shí),而ChatGPT則主要集中在文本模態(tài)領(lǐng)域,所生成的內(nèi)容以文本為主;在輸出語言性質(zhì)方面,微軟小冰主要面向中國客戶輸出中文數(shù)據(jù)、信息和知識(shí),而ChatGPT則更多是基于英語、法語等非中文的語料庫進(jìn)行內(nèi)容生成;在適人化方面,由于微軟小冰的強(qiáng)交互性、情感智能定位以及專門針對(duì)中文用戶所進(jìn)行的訓(xùn)練和優(yōu)化,其個(gè)性化理解和回應(yīng)用戶需求、偏好的能力較強(qiáng),具有較好的適人性,而ChatGPT作為通用的大語言模型,個(gè)性化和適應(yīng)性方面則稍遜色;從知識(shí)生成的特點(diǎn)來看,微軟小冰所生成的知識(shí)在特定領(lǐng)域的內(nèi)容會(huì)更加豐富和準(zhǔn)確,而ChatGPT則能夠涵蓋更廣泛的主題和領(lǐng)域,針對(duì)用戶提問,生成范圍更廣、更為系統(tǒng)、更為專業(yè)的數(shù)據(jù)和知識(shí)。
三、知識(shí)生成價(jià)值芻議:從出版前端到出版本質(zhì)
從知識(shí)生產(chǎn)的主體和時(shí)間節(jié)點(diǎn)來看,前述個(gè)體生產(chǎn)知識(shí)、專業(yè)生產(chǎn)知識(shí)、大眾生產(chǎn)知識(shí)以及人工智能生產(chǎn)知識(shí),皆為知識(shí)的第一次生產(chǎn),即由人類或人工智能所進(jìn)行的知識(shí)的創(chuàng)新和創(chuàng)造;而出版行為、出版活動(dòng)則屬于知識(shí)的第二次生產(chǎn)。那么,從知識(shí)生產(chǎn)方式來看出版學(xué),能夠帶來哪些啟迪和思考?
1. 知識(shí)生成格局的變革,深刻影響出版業(yè)的發(fā)展
知識(shí)生成格局的變革,從智慧驅(qū)動(dòng)到數(shù)據(jù)驅(qū)動(dòng),從人類生產(chǎn)知識(shí)到AI生產(chǎn)知識(shí),將在很長一段時(shí)間內(nèi)呈現(xiàn)出人機(jī)協(xié)作生成知識(shí)的新格局。人機(jī)協(xié)作生成知識(shí)格局涵蓋AI生產(chǎn)新聞、AI創(chuàng)作圖書、AI創(chuàng)作音樂、AI創(chuàng)造繪畫、AI生產(chǎn)有聲讀物等AI生成內(nèi)容的各個(gè)領(lǐng)域,對(duì)出版業(yè)產(chǎn)生全方位的深刻影響。在出版產(chǎn)品方面,一系列的生成式智能出版物將陸續(xù)出現(xiàn),如生成式智能出版物、生成式智能知識(shí)服務(wù)、出版專業(yè)大語言模型等。實(shí)踐中,世界頂級(jí)的法律、稅務(wù)知識(shí)服務(wù)商律商聯(lián)訊(LexisNexis)已于2023年5月推出了面向法律界的生成式智能知識(shí)服務(wù)平臺(tái)——Lexis+AI,具備提供法律內(nèi)容檢索、法律內(nèi)容總結(jié)以及生成合同、簡(jiǎn)報(bào)等功能。在出版技術(shù)方面,大語言模型技術(shù)、基于人類反饋的強(qiáng)化學(xué)習(xí)算法、自注意力機(jī)制等技術(shù)將陸續(xù)影響和作用于出版業(yè),對(duì)出版內(nèi)部流程和外部產(chǎn)品服務(wù)持久賦能。在出版營銷方面,營銷文檔的AI制作、基于AIGC的虛擬客服、出版營銷數(shù)據(jù)建設(shè)等將會(huì)出現(xiàn)或不斷強(qiáng)化,在線下營銷、直播營銷、短視頻營銷等基礎(chǔ)上進(jìn)一步拓展出版營業(yè)的版圖,豐富出版營業(yè)的內(nèi)涵。
2. 知識(shí)生成方式的變化,并沒有改變出版本質(zhì)
出版的本質(zhì)究竟是什么?以實(shí)踐視角視之,出版的本質(zhì)可被解讀為“對(duì)作品經(jīng)過編輯、復(fù)制而后予以公開的活動(dòng)”,筆者認(rèn)為反映出版實(shí)踐的編校印發(fā)說固然是沒錯(cuò)的,但在回答出版的本質(zhì)是什么這一問題上則顯得力有不逮。以理論視角考察,編輯出版是“文化締構(gòu)、文化傳播和文化再生產(chǎn)活動(dòng)”[35]“出版活動(dòng)的本質(zhì)是文化選擇”[36]“商業(yè)形式的文化建構(gòu)”[37]等觀點(diǎn)是從文化角度提出的,“出版專業(yè)主義核心內(nèi)涵是信息選擇把關(guān)、共識(shí)與價(jià)值觀表達(dá)以及知識(shí)和文化的傳播”[38]及“出版本質(zhì)是一種知識(shí)生產(chǎn)”[39]則是從知識(shí)的角度提出的。筆者基本贊同出版的本質(zhì)是知識(shí)生產(chǎn)這種說法,至少知識(shí)生產(chǎn)作為出版的本質(zhì)可以適用于專業(yè)出版、學(xué)術(shù)出版、教育出版等業(yè)態(tài),但是大眾出版的本質(zhì)是否為生產(chǎn)知識(shí)?抑或生產(chǎn)的是技巧、技能、生活經(jīng)驗(yàn)等隱性知識(shí)?這一點(diǎn)尚需嚴(yán)謹(jǐn)論證。實(shí)際上,出版的本質(zhì)是知識(shí)生產(chǎn),更確切地說,是知識(shí)的第二次生產(chǎn),是知識(shí)的建制化生產(chǎn),是一種深層次、有底蘊(yùn)的知識(shí)生產(chǎn),是知識(shí)的社會(huì)化生產(chǎn)與傳播。就此而言,無論是人類還是AI生產(chǎn)的知識(shí),實(shí)質(zhì)上生產(chǎn)的是知識(shí)素材、知識(shí)原型,而非知識(shí)產(chǎn)品、知識(shí)成品,出版業(yè)生產(chǎn)和傳播的則是知識(shí)產(chǎn)品和知識(shí)成品。
3. 知識(shí)生成范式的轉(zhuǎn)換,啟迪出版學(xué)研究范圍拓新
AI生成知識(shí)的出現(xiàn)并不能取代人類生成知識(shí),數(shù)據(jù)驅(qū)動(dòng)生成知識(shí)也不能替代智慧生成知識(shí),恰如機(jī)器人新聞中算法和記者的關(guān)系,不是替代關(guān)系而是耦合關(guān)系,[40]二者同樣在新聞業(yè)中扮演重要角色。但這意味著知識(shí)生成的范式開始由人類智慧生成知識(shí)轉(zhuǎn)變?yōu)槿藱C(jī)協(xié)作生成知識(shí),且這一新的知識(shí)生成范式將在很長的歷史時(shí)期內(nèi)存在并發(fā)展。就出版學(xué)研究而言,知識(shí)生產(chǎn)范式和內(nèi)容供給模式的轉(zhuǎn)換,[41]給我們最大的啟發(fā)在于拓新出版學(xué)的研究邊界,基于時(shí)間維度展開高新技術(shù)對(duì)出版業(yè)應(yīng)用的出版未來學(xué)研究。[42]就此而言,是否可擴(kuò)展至出版前端的作者,在作者學(xué)方面進(jìn)行鉆研和探索?長期以來,出版學(xué)研究的范圍往往在本體維度的出版經(jīng)營管理、時(shí)間維度的出版史、空間維度的國際出版、技術(shù)維度的數(shù)字出版以及作為出版后端的閱讀、讀者等,鮮有學(xué)者將作者、作者學(xué)作為出版學(xué)研究的基本范疇和主要領(lǐng)域。把出版學(xué)研究領(lǐng)域拓展至前端的作者,一方面,有利于擴(kuò)大出版學(xué)研究范圍,深入分析知識(shí)生成的主體、工具、對(duì)象等特點(diǎn),探究知識(shí)生成機(jī)理與規(guī)律;另一方面,在人機(jī)寫作生成知識(shí)的時(shí)代,對(duì)作者的研究進(jìn)一步由研究人類作者延展到研究AI作者,既是提升出版人數(shù)字素養(yǎng)與技能的要求,也與當(dāng)下作為研究熱點(diǎn)的智能出版、智慧出版相吻合。
結(jié)語
生成式人工智能技術(shù)引發(fā)了社會(huì)各行各業(yè)的熱議和思考,也引起了學(xué)術(shù)各界的研究和探索。本文在提出智慧驅(qū)動(dòng)型和數(shù)據(jù)驅(qū)動(dòng)型知識(shí)生成原理的基礎(chǔ)上,從知識(shí)生成這個(gè)維度,對(duì)個(gè)體生產(chǎn)知識(shí)、專業(yè)生產(chǎn)知識(shí)、大眾生產(chǎn)知識(shí)及人工智能生成知識(shí)進(jìn)行了分析和思考,最后提出了人機(jī)協(xié)同生成知識(shí)的新格局對(duì)出版業(yè)和出版學(xué)發(fā)展的意義。其實(shí),關(guān)于生成式人工智能和出版的關(guān)系,還有諸多議題值得深入研究,如生成式人工智能物的可版權(quán)性如何、著作權(quán)歸屬如何、可行性的法律治理方案如何、分析式智能出版和生成式智能出版的區(qū)別與聯(lián)系又在哪里等。
參考文獻(xiàn):
[1] 張新新,丁靖佳.生成式智能出版的技術(shù)原理與流程革新[J/OL].[2023-07-16].圖書情報(bào)知識(shí),https://kns.cnki.net/kcms2/detail/42.1085.g2.20230716.0031.002.html.
[2] 張新新,黃如花. 生成式智能出版的應(yīng)用場(chǎng)景、風(fēng)險(xiǎn)挑戰(zhàn)與調(diào)治路徑[J/OL].[2023-07-17].圖書情報(bào)知識(shí),https://kns.cnki.net/kcms2/detail/42.1085.G2.20230717.1104.003.html.
[3] 郝祥軍,顧小清. AI重塑知識(shí)觀:數(shù)據(jù)科學(xué)影響下的知識(shí)創(chuàng)造與教育發(fā)展[J]. 中國遠(yuǎn)程教育,2023(5):13-23.
[4] 王健. 知識(shí)萃取——將科研項(xiàng)目隱性知識(shí)顯性化[J]. 企業(yè)管理,2022(4):102-105.
[5] 吳飛,段竺辰. 從獨(dú)思到人機(jī)協(xié)作——知識(shí)創(chuàng)新模式進(jìn)階論[J]. 浙江學(xué)刊,2020(5):94-104.
[6] 吳鋒. 發(fā)達(dá)國家“算法新聞”的理論緣起、最新進(jìn)展及行業(yè)影響[J]. 編輯之友,2018(5):48-54.
[7] 熊國榮,李賢秀.“機(jī)器人記者”對(duì)新聞?dòng)浾呔蜆I(yè)的沖擊及應(yīng)對(duì)[J]. 編輯之友,2016(11):73-77.
[8] Brown T, Mann B, Ryder N, et al. Language Models are Few-shot Learners[J]. Advances in Neural Information Processing Systems, 2020(33): 1877-1901.
[9] 朱光輝,王喜文. ChatGPT的運(yùn)行模式、關(guān)鍵技術(shù)及未來圖景[J]. 新疆師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2023(4):113-122.
[10] Haiko V, Cunningham S, Janssen M, et al. Data science as knowledge creation a framework for synergies between data analysts and domain professionals[J]. Technological Forecasting and Social Change, 2011, 173(4): 1-10.
[11] 康德. 純粹理性批判[M]. 鄧曉芒,譯. 北京:人民出版社,2004:21.
[12] 王慶節(jié).“先驗(yàn)想象力”抑或“超越論形象力”——海德格爾對(duì)康德先驗(yàn)想象力概念的解釋與批判[J].現(xiàn)代哲學(xué),2016(4):58-65.
[13] 邱仁宗. 科學(xué)方法與科學(xué)動(dòng)力學(xué)——現(xiàn)代科學(xué)哲學(xué)概述[M]. 北京:高等教育出版社,2006:51.
[14] 袁方,王漢生. 社會(huì)研究方法教程(重排本)[M]. 北京:北京大學(xué)出版社,2013:28.
[15] 劉魁. 真理、文化權(quán)威與知識(shí)生產(chǎn)的時(shí)代性——兼評(píng)??聦?duì)真理話語的微觀權(quán)力分析[J]. 南京政治學(xué)院學(xué)報(bào),2005(3):53-57.
[16] 李明杰. 中國出版史:上冊(cè)·古代卷[M]. 長沙:湖南大學(xué)出版社,2008:50-51.
[17] 張岱年,方克立. 中國文化概論[M]. 北京:北京師范大學(xué)出版社,2004:135.
[18] 賀國慶. 古希臘高等教育探微[J]. 河北大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2003(4):5-8.
[19] 方卿,許潔,等. 出版學(xué)基礎(chǔ)[M].武漢:武漢大學(xué)出版社,2023:356.
[20] 讓-弗朗索瓦·利奧塔. 后現(xiàn)代狀況:關(guān)于知識(shí)的報(bào)告[M]. 島子,譯. 長沙:湖南美術(shù)出版社,1996:35.
[21] 張新新,陳奎蓮. 堅(jiān)持出版導(dǎo)向,引領(lǐng)5G時(shí)代數(shù)字出版新變化[J]. 出版發(fā)行研究,2020(3):38-44.
[22] 張新新. 智能出版:現(xiàn)代出版技術(shù)原理與應(yīng)用[M]. 北京:人民出版社,2021:40-50.
[23] Rocio·M. T, Maria O. Identification of innovation solvers in open innovation communities using swarm intelligence[J]. Technological Forecasting and Social Change, 2016, 109(2): 15-24.
[24] 王玫,朱云龍,何小賢. 群體智能研究綜述[J]. 計(jì)算機(jī)工程,2005(22):194-196.
[25] 劉華東,馬維娜,張新新. “出版+人工智能”:智能出版流程再造[J]. 出版廣角,2018(1):14-16.
[26] 肖奎. 維基百科大數(shù)據(jù)的知識(shí)挖掘與管理方法研究[D]. 武漢大學(xué),2014.
[27] 牛明坤. 基于大眾標(biāo)注的群體知識(shí)組織性質(zhì)與結(jié)構(gòu)研究[D]. 湖南大學(xué),2018.
[28] 趙健,張?chǎng)窝|,李佳明,等. 群體智能2.0研究綜述[J]. 計(jì)算機(jī)工程,2019(12):1-7.
[29] 張新新,劉華東. 出版+人工智能: 未來出版的新模式與新形態(tài)——以《新一代人工智能發(fā)展規(guī)劃》為視角[J]. 科技與出版,2017(12):38-43.
[30] 申屠曉明,甘恬. 機(jī)器人寫稿的技術(shù)原理及實(shí)現(xiàn)方法[J]. 傳媒評(píng)論,2017(9):15-19.
[31] 央視新聞:新聞機(jī)器人的工作原理與技術(shù)解析[EB/OL].[2023-07-14].http://www.uctdm.com/43920.html.
[32] 鄧浩然. 新聞寫作機(jī)器人現(xiàn)狀與發(fā)展研究——以Xiaomingbot為例[D]. 蘭州大學(xué),2019.
[33] 陸偉晶. 人工智能機(jī)器人面臨的倫理困境——以“微軟小冰”為例[J]. 視聽界,2018(4):74-78.
[34] 崔宇紅,白帆,張蕊芯. ChatGPT在高等教育領(lǐng)域的應(yīng)用、風(fēng)險(xiǎn)及應(yīng)對(duì)[J]. 重慶理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)),2023(5):16-25.
[35] 王振鐸. 文化締構(gòu)編輯觀[J]. 河南大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),1988(3):104-114.
[36] 陳少志,張新新. 出版業(yè)文化質(zhì)量的提升向度與路徑探析——基于編輯工作的視角[J]. 中國編輯,2023(7):34-40.
[37] 方卿,丁靖佳. 數(shù)字出版三個(gè)基本理論問題的思考[J]. 中國出版,2023(10):17-22.
[38] 李楊. 數(shù)智時(shí)代出版專業(yè)主義的核心內(nèi)涵建構(gòu)[J]. 編輯之友,2022(7):83-89.
[39] 范軍. 出版本質(zhì)上是一種知識(shí)生產(chǎn)[J]. 出版科學(xué),2022(3):1.
[40] 張超,鐘新. 從比特到人工智能:數(shù)字新聞生產(chǎn)的算法轉(zhuǎn)向[J]. 編輯之友,2017(11):61-66.
[41] 方卿,丁靖佳. 人工智能生成內(nèi)容(AIGC)的三個(gè)出版學(xué)議題[J]. 出版科學(xué),2023(2):5-10.
[42] 張新新. 中國特色數(shù)字出版學(xué)研究對(duì)象:研究?jī)r(jià)值、提煉方法與多維表達(dá)[J]. 編輯之友,2020(11):5-11,30.
作者信息:張新新(1984— ),男,江蘇贛榆人,博士,上海理工大學(xué)出版印刷與藝術(shù)設(shè)計(jì)學(xué)院教授、博士生導(dǎo)師,國家新聞出版署科技與標(biāo)準(zhǔn)重點(diǎn)實(shí)驗(yàn)室學(xué)術(shù)委員會(huì)主任,主要研究方向:數(shù)字出版、人工智能、文化管理與服務(wù)。