生成式智能出版：知識(shí)生成原理、沿革與啟迪

2023-11-19 22:50張新新

編輯之友 2023年11期

【摘要】文章基于人工智能生成知識(shí)的視角，分析了智慧驅(qū)動(dòng)型和數(shù)據(jù)驅(qū)動(dòng)型兩種知識(shí)生成的原理，論述了個(gè)體生產(chǎn)知識(shí)、專業(yè)生產(chǎn)知識(shí)、大眾生產(chǎn)知識(shí)以及人工智能生成知識(shí)的沿革歷程，最后提出知識(shí)生成格局的變化對(duì)出版業(yè)、出版本質(zhì)及出版學(xué)研究范圍拓展三個(gè)方面的價(jià)值思考。

【關(guān)鍵詞】AIGC 生成式智能出版 ChatGPT 數(shù)字出版數(shù)據(jù)科學(xué) 微軟小冰

【中圖分類號(hào)】G230 【文獻(xiàn)標(biāo)識(shí)碼】Ａ【文章編號(hào)】1003-6687（2023）11-036-09

【DOI】10.13786/j.cnki.cn14-1066/g2.2023.11.005

生成式人工智能技術(shù)的出現(xiàn)引起社會(huì)各行各業(yè)的熱議和思考，在出版業(yè)內(nèi)部，將引發(fā)編校印發(fā)各環(huán)節(jié)革新；[1]在出版業(yè)外部，將促進(jìn)出版大數(shù)據(jù)、智能知識(shí)服務(wù)、出版領(lǐng)域智能決策機(jī)器人、生成式智能出版物以及元宇宙出版等新產(chǎn)品、新業(yè)態(tài)和新模式的涌現(xiàn)。[2]此外，生成式人工智能技術(shù)將推動(dòng)出版業(yè)前端——知識(shí)生成方式發(fā)生革命性變化，把人類生成知識(shí)推至人機(jī)協(xié)同生成知識(shí)的新層面。

一、知識(shí)生成原理闡釋：以智慧為中心與以數(shù)據(jù)為中心

出版是知識(shí)生產(chǎn)和表達(dá)的產(chǎn)業(yè)，知識(shí)生產(chǎn)是出版業(yè)的前提和基礎(chǔ)。所謂知識(shí)，《現(xiàn)代漢語詞典》有兩種解釋：第一種是指人們?cè)谏鐣?huì)實(shí)踐中所獲得的認(rèn)識(shí)和經(jīng)驗(yàn)的總和；第二種是指學(xué)術(shù)、文化或?qū)W問，如知識(shí)面、知識(shí)分子等。本文以第一種概念為立論之基，探討知識(shí)的生成理路。

人類社會(huì)發(fā)展至今，知識(shí)生成包含智慧驅(qū)動(dòng)型和數(shù)據(jù)驅(qū)動(dòng)型兩種類型。智慧驅(qū)動(dòng)型知識(shí)生成方式，是指知識(shí)生成是在人的智慧主導(dǎo)下所形成的知識(shí)創(chuàng)造。知識(shí)生成最初的原動(dòng)力源于個(gè)體，即“個(gè)體通過直接的‘實(shí)踐經(jīng)驗(yàn)積累隱性知識(shí)”。[3]隱性知識(shí)無法通過文字、語言、圖表或符號(hào)來明確表述，也難以進(jìn)行邏輯說明，往往是人類非語言智力活動(dòng)的成果，如非正式的、難以表達(dá)的經(jīng)驗(yàn)、技巧、技能和訣竅等技能類隱性知識(shí)，再如直覺、感悟、洞察力、心智模式、團(tuán)隊(duì)默契、企業(yè)文化等認(rèn)識(shí)類隱性知識(shí)。隱性知識(shí)生成以后，大致形成了社會(huì)化、外顯化、組合化、內(nèi)隱化四種知識(shí)轉(zhuǎn)化模式。[4]社會(huì)化，強(qiáng)調(diào)隱性知識(shí)的傳播過程，即通過傳授、觀察、模仿等社會(huì)化方式實(shí)現(xiàn)個(gè)體與個(gè)體之間的隱性知識(shí)傳播，如出版業(yè)中的“傳幫帶”學(xué)徒機(jī)制，新編輯通過模仿、學(xué)習(xí)和請(qǐng)教等方式學(xué)會(huì)老編輯的技巧和經(jīng)驗(yàn)。外顯化，是隱性知識(shí)轉(zhuǎn)化為顯性知識(shí)的過程。顯性知識(shí)是指可以通過文字、圖表、公式等進(jìn)行完整表述的知識(shí)，隱性知識(shí)顯性化的呈現(xiàn)方式包括概念、假設(shè)、模式、類比或比喻等。組合化，是指顯性知識(shí)通過增加、關(guān)聯(lián)、組合、分類和整理等形式向系統(tǒng)知識(shí)轉(zhuǎn)化的過程。內(nèi)隱化，是指顯性知識(shí)的隱性化過程，即顯性知識(shí)體現(xiàn)于隱性知識(shí)之中，生成應(yīng)用性、操作性知識(shí)，如“事上練”“干中學(xué)”較好地形容了內(nèi)隱化過程。智慧驅(qū)動(dòng)型的知識(shí)生成是目前占據(jù)主流地位的知識(shí)生成方式，構(gòu)成了目前出版業(yè)所生產(chǎn)和傳播的主流知識(shí)。知識(shí)轉(zhuǎn)化之后，則進(jìn)入知識(shí)論證或驗(yàn)證階段。論證環(huán)節(jié)是指人們通過預(yù)測(cè)或?qū)嶒?yàn)，能夠證偽或證明該知識(shí)環(huán)節(jié)決定著知識(shí)的合規(guī)律性和知識(shí)質(zhì)量。在知識(shí)體系構(gòu)建的過程中，論證環(huán)節(jié)主要通過知識(shí)融合方式實(shí)現(xiàn)：為解決知識(shí)質(zhì)量參差不齊、基于不同數(shù)據(jù)源的知識(shí)重復(fù)等問題，進(jìn)行知識(shí)融合；對(duì)來自不同數(shù)據(jù)源的知識(shí)基于同一框架規(guī)范進(jìn)行異構(gòu)數(shù)據(jù)整合、消歧，由實(shí)體對(duì)齊和實(shí)體消歧組成。

數(shù)據(jù)驅(qū)動(dòng)型知識(shí)生成方式，是指基于海量數(shù)據(jù)的知識(shí)生產(chǎn)原料，從中挖掘出新規(guī)律、新知識(shí)，實(shí)現(xiàn)數(shù)據(jù)、信息走向知識(shí)生成的使命?！耙詳?shù)據(jù)為關(guān)鍵原料的知識(shí)生產(chǎn)范式的出現(xiàn)與知識(shí)形態(tài)的演變，意味著新的認(rèn)識(shí)論或知識(shí)觀正在悄然形成?！盵3]數(shù)據(jù)驅(qū)動(dòng)型知識(shí)生成方式離不開數(shù)據(jù)、算法和算力要素的支持。在數(shù)據(jù)方面，“機(jī)器學(xué)習(xí)的數(shù)據(jù)是影響創(chuàng)作質(zhì)量的重要因素，掌握的數(shù)據(jù)越多，設(shè)定的程序越清晰，他們的知識(shí)創(chuàng)作會(huì)越順利”。[5]相反，數(shù)據(jù)積累偏少、數(shù)據(jù)質(zhì)量不高或需高度創(chuàng)造性寫作的領(lǐng)域，[6]知識(shí)智能生成就無法實(shí)現(xiàn)。就新聞機(jī)器人而言，越是天氣、地震預(yù)報(bào)及金融、體育等數(shù)據(jù)繁多、結(jié)構(gòu)化和標(biāo)準(zhǔn)化水平較高（“干凈”數(shù)據(jù)）的領(lǐng)域，[7]就越容易開發(fā)出實(shí)用價(jià)值突出的自然語言自動(dòng)生成系統(tǒng)；就生成型預(yù)訓(xùn)練聊天機(jī)器人而言，ChatGPT之所以能夠取得突破性進(jìn)展，極為關(guān)鍵的因素是其從網(wǎng)頁、WebText2、圖書、維基百科等渠道搜集而來的3 000億單詞語料，經(jīng)過數(shù)據(jù)清理后形成超過1 750億的巨量無標(biāo)注文本數(shù)據(jù)；[8]就寫作機(jī)器人而言，微軟小冰在出版《陽光失了玻璃窗》詩集之前，就已完成自1920年以來519位詩人的現(xiàn)代詩數(shù)據(jù)訓(xùn)練，并借助深度神經(jīng)網(wǎng)絡(luò)等技術(shù)，在訓(xùn)練1萬次之后，具備了創(chuàng)作現(xiàn)代詩歌的能力。

在算法方面，機(jī)器人根據(jù)語法、句法規(guī)則，或者大語言模型，實(shí)現(xiàn)半自動(dòng)或全自動(dòng)的自然語言生成，形成符合人類認(rèn)知、需求和價(jià)值觀的內(nèi)容。不過在具體的算法應(yīng)用方面尚有較大差異，如微軟小冰采用基于規(guī)則的系統(tǒng)和機(jī)器學(xué)習(xí)技術(shù)，而ChatGPT則基于海量語料庫以及人類的反饋強(qiáng)化學(xué)習(xí)算法。

在算力方面，算力水平的高低、強(qiáng)弱決定著算法作用的發(fā)揮和數(shù)據(jù)處理能力的大小。通俗理解，算力相當(dāng)于人的大腦在觀察、感知、決策、控制等方面的反應(yīng)速度。ChatGPT能夠成為AI發(fā)展的里程碑式成果，在知識(shí)生成方面實(shí)現(xiàn)巨大跨越，離不開超強(qiáng)算力的支撐和加持。ChatGPT使用的GPT3.5模型在微軟云計(jì)算服務(wù)Azure AI的超算基礎(chǔ)設(shè)施上訓(xùn)練，總算力消耗約為3 640PF-days（按每秒一千萬億次計(jì)算，須運(yùn)行3 640天）；[9]而小冰公司與微軟中國聯(lián)手推出的人工智能解決方案，則將微軟智能云Azure作為云計(jì)算運(yùn)營平臺(tái)，可以提供大規(guī)模的計(jì)算資源支持。

2021年，Haiko等人從數(shù)據(jù)科學(xué)視角提出了數(shù)據(jù)智能和分析的知識(shí)創(chuàng)造過程模型，將人的智慧和智能化技術(shù)進(jìn)行了有機(jī)融合。[10]該模型分為擴(kuò)大個(gè)體知識(shí)、分享隱性知識(shí)、業(yè)務(wù)概念（個(gè)體通過分享擴(kuò)充知識(shí)以增強(qiáng)業(yè)務(wù)內(nèi)容理解能力）、數(shù)據(jù)理解、數(shù)據(jù)準(zhǔn)備（數(shù)據(jù)加工、清洗、整合等）、數(shù)據(jù)建模、評(píng)估論證、知識(shí)生成（知識(shí)網(wǎng)絡(luò)化）、模型應(yīng)用以及部署（新知識(shí)、新模型的應(yīng)用）階段。也有國內(nèi)學(xué)者進(jìn)一步提煉為“業(yè)務(wù)理解與概念化、數(shù)據(jù)準(zhǔn)備與建模、知識(shí)生成與模型應(yīng)用”[3]三個(gè)階段。由此看來，人類智慧生產(chǎn)知識(shí)和數(shù)據(jù)生成知識(shí)的融合趨勢(shì)日益明顯，融為一體、合而為一的知識(shí)生成新格局正在加速形成。

二、知識(shí)生成進(jìn)階分析：從個(gè)體智慧到人工智能

ChatGPT的火出圈，也推動(dòng)著知識(shí)生成從個(gè)體生產(chǎn)知識(shí)、專業(yè)生產(chǎn)知識(shí)、大眾生產(chǎn)知識(shí)走向人工智能生成知識(shí)，進(jìn)而推動(dòng)人機(jī)協(xié)同生成知識(shí)新格局的出現(xiàn)，知識(shí)生成進(jìn)階見下頁圖1。

1. 個(gè)體生產(chǎn)知識(shí)

“人類知識(shí)的兩大枝干，它們也許來自某種共同但不為我們所知的根源，這就是感性和理性。”[11]知識(shí)是如何產(chǎn)生的？關(guān)于這個(gè)問題，古今中外先賢們孜孜不倦地追求并試圖給出盡可能合理的答案，由此形成了經(jīng)驗(yàn)論和唯理論兩種認(rèn)知觀。以笛卡爾、斯賓諾莎和萊布尼茨等人為代表的唯理論派認(rèn)為，知識(shí)的源泉是“天賦觀念”，唯有經(jīng)過演繹和推理所獲得的理性知識(shí)，方是可靠的知識(shí)，因此崇尚演繹法；而貝克萊、休謨和馬赫等則認(rèn)為，知識(shí)的源泉是經(jīng)驗(yàn)感知，知識(shí)是對(duì)客觀世界的反映，人們通過感官對(duì)世界進(jìn)行觀察歸納和總結(jié)，從而形成知識(shí)，故崇尚歸納法。

此外，力圖綜合唯理論和經(jīng)驗(yàn)論的康德則以感知經(jīng)驗(yàn)為基礎(chǔ)，提出先驗(yàn)想象力的概念，以“靈魂不可或缺的功能”[12]試圖找尋二者之間的平衡點(diǎn)，即想象力是感情和理性的中介，是先天知識(shí)的奠基力量。“科學(xué)始于問題”是卡爾·波普爾提出的著名觀點(diǎn)，[13]強(qiáng)調(diào)的是問題促使人們探索、思考，并通過科學(xué)嚴(yán)謹(jǐn)?shù)那笞C過程獲得答案，最終形成有關(guān)問題的科學(xué)知識(shí)。[14]應(yīng)該說，“科學(xué)始于問題”的知識(shí)生產(chǎn)方式，圍繞著問題的提出、猜想假設(shè)、證偽排除，最終提出新問題，同樣綜合了唯理論和經(jīng)驗(yàn)論，并強(qiáng)調(diào)實(shí)驗(yàn)法對(duì)科學(xué)知識(shí)發(fā)現(xiàn)的重要價(jià)值。

個(gè)體生產(chǎn)知識(shí)本質(zhì)上是觀念生產(chǎn)和創(chuàng)造活動(dòng)，是個(gè)體基于語言和心智，對(duì)陌生事物的概念、屬性、特征、程序、結(jié)構(gòu)、邏輯等進(jìn)行探索的過程?；趥€(gè)體生產(chǎn)的知識(shí)，推動(dòng)著社會(huì)從蒙昧樸素走向科學(xué)理性，對(duì)科學(xué)和社會(huì)發(fā)展有著不可磨滅的貢獻(xiàn)。[5]個(gè)體生產(chǎn)知識(shí)古已有之，是出版和出版業(yè)發(fā)展的原動(dòng)力。如孔子以“垂世立教”的思想“書其重者”，選擇重要的學(xué)術(shù)著作進(jìn)行整理、刪節(jié)、補(bǔ)充、編次和闡述，編訂“六經(jīng)”，歸納總結(jié)了夏商周三代文化，實(shí)現(xiàn)了中華文化的傳播與傳承，且孔子之于《論語》的原創(chuàng)性知識(shí)生產(chǎn)影響深遠(yuǎn)，迄今仍然是出版機(jī)構(gòu)出版和發(fā)行的暢銷品牌。個(gè)體生產(chǎn)知識(shí)對(duì)出版業(yè)的影響還體現(xiàn)在專著出版這一出版業(yè)態(tài)上。在學(xué)術(shù)出版或?qū)I(yè)出版領(lǐng)域，專著是學(xué)術(shù)成果的最主要體現(xiàn)，也是個(gè)體生產(chǎn)知識(shí)的智慧結(jié)晶，是作者圍繞特定選題所進(jìn)行的系統(tǒng)、專深的知識(shí)生產(chǎn)。

2. 專業(yè)生產(chǎn)知識(shí)

專業(yè)生產(chǎn)知識(shí)是指由專門的組織或個(gè)人負(fù)責(zé)知識(shí)生產(chǎn)，是以知識(shí)生產(chǎn)為職業(yè)活動(dòng)的過程?！皩I(yè)組織所生產(chǎn)的文化形式開始決定著其他個(gè)體文化形式的合法性、合理性與發(fā)展方向，壟斷著對(duì)宇宙、社會(huì)、人生以及神的存在等問題的解釋權(quán)，影響著人類的終極關(guān)懷?！盵15]

在我國歷史上，西周時(shí)期就已出現(xiàn)專業(yè)化的知識(shí)生產(chǎn)組織，《禮記·王制》記載：“天子命之教然后為學(xué)。小學(xué)在公宮南之左，大學(xué)在郊。天子曰辟雍，諸侯曰泮宮?！碧熳拥拇髮W(xué)叫辟雍，諸侯的大學(xué)叫泮宮。春秋戰(zhàn)國時(shí)期，諸子百家爭(zhēng)鳴，分別生產(chǎn)、傳播和傳世了各學(xué)派的知識(shí)和理論。諸子書編纂有個(gè)鮮明特點(diǎn)，即采用語錄體，[16]由弟子門人根據(jù)老師生前言談內(nèi)容編輯記錄而成。西漢時(shí)期，“興太學(xué)”，“以養(yǎng)天下之士”。作為專門傳授知識(shí)、研究學(xué)問的太學(xué)，開創(chuàng)于公元前124年，與西方的雅典大學(xué)、亞歷山大里亞大學(xué)同為世界上最古老的高等學(xué)校。[17]到唐朝初年，太學(xué)規(guī)模完備，盛極一時(shí)。唐朝和宋朝，太學(xué)和國子學(xué)同時(shí)存在，元明清則改設(shè)國子學(xué)或國子監(jiān)。

西方出現(xiàn)的第一個(gè)培育思想的場(chǎng)所是公元前387年柏拉圖創(chuàng)立的阿加德米學(xué)園，被視作“雅典第一個(gè)永久性的高等教育機(jī)構(gòu)”。[18]學(xué)園生產(chǎn)和教授體操、數(shù)學(xué)、音樂、法律等各門知識(shí)，以培養(yǎng)自由人格和探索萬物本源的能力。中世紀(jì)時(shí)期，沙龍成為上流社會(huì)和文人雅士生產(chǎn)和交流知識(shí)的重要場(chǎng)所，知識(shí)生產(chǎn)為上流精英和政府權(quán)威所壟斷。及至大學(xué)出現(xiàn)，符合要求的大學(xué)從業(yè)者成為職業(yè)化的知識(shí)生產(chǎn)者，與科研團(tuán)隊(duì)在組織制度下從事知識(shí)生產(chǎn)，從而實(shí)現(xiàn)了個(gè)人知識(shí)向?qū)I(yè)知識(shí)的跨越。而今，大學(xué)也不再是唯一的知識(shí)生產(chǎn)組織，學(xué)會(huì)、協(xié)會(huì)、實(shí)驗(yàn)室、科技公司、創(chuàng)新智庫等越來越成為科研創(chuàng)新主體，擔(dān)任著生產(chǎn)和傳播知識(shí)的角色。

專業(yè)人士生產(chǎn)知識(shí)或精英群體生產(chǎn)知識(shí)，本質(zhì)上還是個(gè)體生產(chǎn)知識(shí)，只不過依托專門化的知識(shí)生產(chǎn)組織，在知識(shí)探索、生產(chǎn)和傳播途徑上更加科學(xué)化、合理化和系統(tǒng)化。而專業(yè)組織生產(chǎn)知識(shí)或?qū)I(yè)機(jī)構(gòu)生產(chǎn)知識(shí)，一方面，使知識(shí)的生產(chǎn)者、擁有者由權(quán)貴階層、精英階層轉(zhuǎn)變?yōu)槁殬I(yè)性知識(shí)生產(chǎn)者，只要該生產(chǎn)者具有專業(yè)組織標(biāo)準(zhǔn)，即可在制度內(nèi)從事知識(shí)的協(xié)同生產(chǎn)和傳播；另一方面，個(gè)體生產(chǎn)知識(shí)模式轉(zhuǎn)變?yōu)閰f(xié)作生產(chǎn)知識(shí)模式，知識(shí)生產(chǎn)向著群體化、社會(huì)化、職業(yè)化、建制化、合理化的方向發(fā)展，在更大范圍內(nèi)、更高水平上、更深程度上推動(dòng)了人類社會(huì)的知識(shí)生產(chǎn)和傳播水平的提升。

以出版視角來審視，專業(yè)生產(chǎn)知識(shí)對(duì)出版業(yè)發(fā)展也產(chǎn)生了深刻而久遠(yuǎn)的影響。首先，學(xué)術(shù)出版本身就是對(duì)學(xué)術(shù)成果進(jìn)行編輯加工，面向?qū)W術(shù)群體進(jìn)行傳播，以推動(dòng)學(xué)術(shù)研究進(jìn)步為宗旨。[19]學(xué)術(shù)出版得以誕生、發(fā)展與壯大，離不開專業(yè)生產(chǎn)內(nèi)容模式的出現(xiàn)，得益于大學(xué)等專業(yè)組織生產(chǎn)和傳播知識(shí)的直接推動(dòng)。其次，專業(yè)出版作為面向特定領(lǐng)域的職業(yè)群體所開展的法律、醫(yī)學(xué)、建筑等專業(yè)知識(shí)生產(chǎn)和傳播的業(yè)態(tài)，本身也是專業(yè)生產(chǎn)知識(shí)模式在出版業(yè)的體現(xiàn)，是專業(yè)生產(chǎn)和傳播知識(shí)的發(fā)展結(jié)果。最后，教育出版是以教材、教輔圖書、數(shù)字教育服務(wù)為主要產(chǎn)品的出版業(yè)態(tài)，以社會(huì)教育和知識(shí)傳播為主要目的。

3. 大眾生產(chǎn)知識(shí)

隨著互聯(lián)網(wǎng)時(shí)代的到來，網(wǎng)絡(luò)重構(gòu)了社會(huì)形態(tài)，也成為新知識(shí)的提供方和沉淀池。為適應(yīng)互聯(lián)網(wǎng)變革，“知識(shí)的創(chuàng)造者和應(yīng)用者都要具有將知識(shí)轉(zhuǎn)化成電腦語言的工具和技巧”，[20]通過鍵盤、屏幕、網(wǎng)絡(luò)等新介質(zhì)，人們?cè)诨ヂ?lián)網(wǎng)上生產(chǎn)、分發(fā)和共享數(shù)據(jù)、信息、知識(shí)，形成了新的思維方式、工作方式和生活方式。于是，用戶生產(chǎn)知識(shí)這一新的知識(shí)生產(chǎn)方式應(yīng)運(yùn)而生。

用戶生產(chǎn)知識(shí)在出版業(yè)有幾種典型的業(yè)態(tài)，在特定的發(fā)展階段，這些新業(yè)態(tài)的出現(xiàn)，進(jìn)一步推動(dòng)了出版業(yè)的可持續(xù)、高質(zhì)量發(fā)展。第一，網(wǎng)絡(luò)出版。網(wǎng)絡(luò)出版相較于傳統(tǒng)的圖書出版，首先，作者身份由專業(yè)群體轉(zhuǎn)變?yōu)榇蟊娋W(wǎng)民，出版作者準(zhǔn)入門檻降低，作者群體規(guī)模擴(kuò)大；其次，出版的門檻實(shí)質(zhì)性降低了，不像圖書出版需要嚴(yán)格的書號(hào)配給，網(wǎng)絡(luò)出版取得經(jīng)營許可證后，具體的編號(hào)編碼由網(wǎng)絡(luò)出版企業(yè)自行開展；再次，網(wǎng)民大眾生產(chǎn)網(wǎng)絡(luò)文學(xué)、小說作品等，通過網(wǎng)絡(luò)出版的傳播，進(jìn)一步發(fā)揮了數(shù)字出版產(chǎn)品的教誨、審美、倫理等價(jià)值，維護(hù)了社會(huì)和諧穩(wěn)定。第二，眾智眾創(chuàng)的民營出版。民營文化公司的知識(shí)生產(chǎn)方式，較國有出版企業(yè)有較大不同：后者主要是借助外部作者的資源，進(jìn)行知識(shí)的二次生產(chǎn)；而前者則大多圍繞特定領(lǐng)域、特定主題、特定知識(shí)點(diǎn)，組織包括自身隊(duì)伍在內(nèi)的眾人智慧進(jìn)行編創(chuàng)，是知識(shí)的一次生產(chǎn)，甚至許多出版產(chǎn)品的知識(shí)生產(chǎn)完全來自自身，如考研輔導(dǎo)讀物、中小學(xué)教輔讀物等。第三，基于互聯(lián)網(wǎng)的大眾協(xié)作式知識(shí)生產(chǎn)?；诨ヂ?lián)網(wǎng)的大眾協(xié)作式知識(shí)生產(chǎn)，如百度百科、維基百科、豆瓣小組等網(wǎng)絡(luò)平臺(tái)的知識(shí)產(chǎn)品，往往就特定的知識(shí)體系、知識(shí)點(diǎn)，面向全網(wǎng)征稿，符合一定標(biāo)準(zhǔn)和具備一定水平的網(wǎng)民，可以就相關(guān)詞條、相關(guān)作品進(jìn)行內(nèi)容編創(chuàng)，所完成的知識(shí)產(chǎn)品經(jīng)過審校后可面向整個(gè)互聯(lián)網(wǎng)進(jìn)行知識(shí)傳播。值得注意的是，這種生產(chǎn)方式，一方面，融匯了大眾集體的智慧，是智慧生產(chǎn)知識(shí)的模式；另一方面，也融合了智能化的數(shù)字技術(shù)，采取知識(shí)挖掘、數(shù)據(jù)驅(qū)動(dòng)知識(shí)生成技術(shù)，因此是既屬于智慧驅(qū)動(dòng)型也屬于數(shù)據(jù)驅(qū)動(dòng)型的知識(shí)生產(chǎn)模式。

隨著5G技術(shù)的普及和推廣，互聯(lián)網(wǎng)門檻進(jìn)一步降低，得益于移動(dòng)互聯(lián)網(wǎng)終端設(shè)備的普及與通信寬帶提速降費(fèi)等，用戶依然是互聯(lián)網(wǎng)內(nèi)容的主要生產(chǎn)者和有力傳播者。[21]基于5G容量增強(qiáng)、海量終端、高速率以及低時(shí)延等技術(shù)優(yōu)勢(shì)，大眾進(jìn)行知識(shí)生產(chǎn)、制作、下載的高速度、即時(shí)化效果將進(jìn)一步呈現(xiàn)，同時(shí)，將進(jìn)一步面臨生產(chǎn)內(nèi)容、生產(chǎn)知識(shí)的審核、把關(guān)等方面的挑戰(zhàn)。

于出版業(yè)發(fā)展而言，大眾生產(chǎn)知識(shí)模式的出現(xiàn)，一方面，擴(kuò)大了上游的作者群體，使作者的范疇不再局限于專業(yè)人士和專業(yè)組織，進(jìn)一步擴(kuò)展到數(shù)量更多、范圍更廣、代表性更強(qiáng)的公民大眾；另一方面，大眾生產(chǎn)知識(shí)模式的豐富和發(fā)展，推動(dòng)著大眾出版、民營出版的蓬勃發(fā)展，促進(jìn)了網(wǎng)絡(luò)出版業(yè)態(tài)的繁榮壯大，也進(jìn)一步強(qiáng)化了眾智眾創(chuàng)的群體智能技術(shù)在出版業(yè)的廣泛落地和應(yīng)用。

4. 人工智能生成知識(shí)

前述個(gè)體生產(chǎn)知識(shí)、專業(yè)生產(chǎn)知識(shí)、大眾生產(chǎn)知識(shí)在各自的發(fā)展階段對(duì)知識(shí)生產(chǎn)、傳播和規(guī)律探索都起到了積極的推動(dòng)作用，但是知識(shí)生產(chǎn)的主體始終局限于人的范疇。而人工智能生產(chǎn)知識(shí)則把知識(shí)生產(chǎn)主體由同質(zhì)的個(gè)人、專業(yè)群體或?qū)I(yè)組織擴(kuò)展到異質(zhì)的數(shù)據(jù)、算法、機(jī)器、人工智能。

其實(shí)，新型內(nèi)容生產(chǎn)方式（AIGC）并非新事物，早在第二次人工智能浪潮（1976—2006年）時(shí)，專家系統(tǒng)就試圖通過“人機(jī)交互界面、知識(shí)庫、推理機(jī)、解釋器、綜合數(shù)據(jù)庫、知識(shí)獲取”[22]等部件，輸入某個(gè)領(lǐng)域的大量專家知識(shí)與經(jīng)驗(yàn)，模擬人類專家的推理思維，解決需要人類專家處理的復(fù)雜知識(shí)問題。專家系統(tǒng)依據(jù)知識(shí)庫，使用推理機(jī)所得出的結(jié)論，就具備了AIGC的雛形，具有了人工智能生成知識(shí)的意味。1976年，耶魯大學(xué)開啟了機(jī)器模擬人類寫作的先河，研發(fā)了全球首套故事寫作機(jī)器算法，支持撰寫簡(jiǎn)訊等簡(jiǎn)單文字內(nèi)容。[6]

前些年的微軟小冰、新聞機(jī)器人、維基百科等都具備了人工智能生成內(nèi)容的能力，只是ChatGPT優(yōu)化對(duì)話語言模型出現(xiàn)以后，其超強(qiáng)的內(nèi)容創(chuàng)作、智能回答、代碼編寫、內(nèi)容翻譯、教育輔導(dǎo)等能力，使得AIGC由專業(yè)群體走向公民大眾、由特定行業(yè)走向社會(huì)的方方面面。維基百科、新聞機(jī)器人、微軟小冰、ChatGPT代表著四種不同人工智能生成內(nèi)容、知識(shí)的技術(shù)路線。

（1）基于群體智能的AIGC。群體智能源于20世紀(jì)90年代人們對(duì)蜜蜂、螞蟻、魚、鳥等生物群體的觀察和研究。所謂群體智能，是指數(shù)量眾多的無智能或低智能的簡(jiǎn)單個(gè)體聚集在一起組成群體，利用群體優(yōu)勢(shì)通過相互間的分工合作表現(xiàn)出智能行為特性。[23]

群體智能作為新一代人工智能的重要方向，作為我國人工智能發(fā)展的重點(diǎn)領(lǐng)域，已是不爭(zhēng)的事實(shí)。在理論層面，繼自組織、間接通信以及群體智能系統(tǒng)的底層機(jī)制研究等涌現(xiàn)[24]之后，結(jié)構(gòu)理論與組織方法、激勵(lì)機(jī)制與涌現(xiàn)機(jī)理、學(xué)習(xí)理論與方法、通用計(jì)算范式與模型，成為基于互聯(lián)網(wǎng)的群體智能理論體系重點(diǎn)突破的方向所在。在政策層面，國務(wù)院印發(fā)的《新一代人工智能發(fā)展規(guī)劃》明確規(guī)定了群體智能的基礎(chǔ)理論、關(guān)鍵共性技術(shù)、服務(wù)平臺(tái)以及應(yīng)用場(chǎng)景，指出要開展群體智能的知識(shí)獲取與生成關(guān)鍵技術(shù)研究。在實(shí)踐層面，群體智能的應(yīng)用場(chǎng)景廣泛，幾乎滲透到生活的各個(gè)方面，如基于群體編輯的維基百科、基于眾包眾享的共享經(jīng)濟(jì)、基于眾問眾答的知識(shí)共享等，甚至包括“基于群智理念的出版流程協(xié)同再造”。[25]

維基百科是群體智能生成知識(shí)的典型產(chǎn)品，也是前述數(shù)據(jù)驅(qū)動(dòng)型知識(shí)生產(chǎn)方式的經(jīng)典案例。維基百科“通過大規(guī)模群體協(xié)作、非線性、去中心化、自下而上的群體智慧方法”，[26]實(shí)現(xiàn)了對(duì)結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)源的知識(shí)抽取。一方面，抽取的結(jié)果形成了形式化的知識(shí)，如建筑、法律、醫(yī)學(xué)等領(lǐng)域本體；另一方面，生成了基于元數(shù)據(jù)的專題知識(shí)庫。這一過程的微觀層面可描述為，用戶以標(biāo)簽（用戶隱性知識(shí)顯性化的結(jié)果）作為信息載體參與群體的交流和溝通，通過對(duì)信息資源的大量標(biāo)注進(jìn)行協(xié)作，從而形成群體知識(shí)；群體知識(shí)在推動(dòng)個(gè)體智能提升的基礎(chǔ)上促進(jìn)群體智能的涌現(xiàn)，從而再次鞏固群體知識(shí)形成的基礎(chǔ)。[27]在技術(shù)路線的歸結(jié)上，維基百科奉行的是人機(jī)物結(jié)合的群體智能2.0時(shí)代的眾包技術(shù)，[28]任務(wù)提出者運(yùn)用互聯(lián)網(wǎng)聚集群體智慧，將任務(wù)發(fā)布在眾包平臺(tái)上供參加者選擇，任務(wù)提出者和參加者基于眾包平臺(tái)進(jìn)行信息交流。

（2）基于模板的AIGC。就新聞資訊行業(yè)而言，機(jī)器撰稿、新聞推薦已不是新鮮事物。[29]新聞機(jī)器人本身是一種人工智能生成內(nèi)容、生成知識(shí)的技術(shù)。國外有代表性的新聞機(jī)器人有美聯(lián)社的WordSmith、《華盛頓郵報(bào)》的Heliograf以及《紐約時(shí)報(bào)》的Blossom等；國內(nèi)則有新華社的快筆小新、騰訊的Dreamwriter（夢(mèng)幻寫手）、第一財(cái)經(jīng)的DT稿王、《南方都市報(bào)》的小南、今日頭條的張小明、中國地震臺(tái)網(wǎng)的地震信息播報(bào)機(jī)器人等。

機(jī)器人撰稿核心技術(shù)主要是自然語言處理、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)、知識(shí)圖譜、語音識(shí)別及計(jì)算機(jī)視覺等。作為自然語言生成系統(tǒng)，機(jī)器人撰稿的技術(shù)路線有模板式、抽取式和生成式三種。[30]抽取式撰稿的技術(shù)路線主要應(yīng)用在文本自動(dòng)摘要方面，即機(jī)器人從海量文本素材中篩選重要信息，進(jìn)行二次加工，從原始新聞文本內(nèi)容中快速抽取核心信息，生成文章摘要。生成式撰稿的技術(shù)路線則主要體現(xiàn)在基于大語言模型的AIGC，如ChatGPT?；谀０宓臋C(jī)器人撰稿技術(shù)是迄今最普遍、最成熟的一種技術(shù)。其主要技術(shù)原理包括：首先，清洗和加工數(shù)據(jù)，建立海量的語料庫；其次，對(duì)海量語料庫進(jìn)行訓(xùn)練，形成深度學(xué)習(xí)模型，并通過語義分析、命名實(shí)體識(shí)別和情感分析等技術(shù)，準(zhǔn)確抓取新聞事件的關(guān)鍵要素，[31]包括測(cè)量新聞性、敘事角度排序、匹配報(bào)道角度與數(shù)據(jù)事實(shí)（選擇故事點(diǎn)）等；最后，因事制宜選擇模板，篩選關(guān)鍵數(shù)據(jù)填入語言模板模型，[32]自動(dòng)生成新聞稿件并基于自然語言進(jìn)行潤色。早期的新聞機(jī)器人所生成的稿件，往往因?yàn)槟０鍐我欢勺x性不強(qiáng)、模板痕跡嚴(yán)重而為人詬病，但經(jīng)過數(shù)十年的發(fā)展，各種新聞機(jī)器人的語言模板類型不斷豐富、數(shù)量不斷增加，基于不同模板生成的新聞適人化、可讀性程度不斷提升，已經(jīng)達(dá)到難以區(qū)分是由人類撰寫還是由機(jī)器撰寫的程度。如Wordersmith自身擁有100多種報(bào)道類型、3億種新聞寫作模板，不同模板的語調(diào)、語氣和寫作風(fēng)格都各有特色。新聞機(jī)器人生成的稿件，從枯燥無味、單調(diào)呆板變得更加生動(dòng)、具有人情味，更加符合人類的學(xué)習(xí)、閱讀、思考和表達(dá)習(xí)慣。

此外，AI主播等新聞機(jī)器人在前述技術(shù)基礎(chǔ)之上，還運(yùn)用了計(jì)算機(jī)視覺、語音合成等技術(shù)，基于真人表情、語音、唇形等特征進(jìn)行建模，把文字信息轉(zhuǎn)化為音視頻的形式，實(shí)現(xiàn)新聞咨詢的音視頻播報(bào)和實(shí)時(shí)交流互動(dòng)。

（3）基于規(guī)則的AIGC與基于大模型的AIGC。在ChatGPT出現(xiàn)以前，微軟小冰、微軟小娜等聊天機(jī)器人在內(nèi)容、知識(shí)生成方面有著不俗的表現(xiàn)，一度是AIGC領(lǐng)域的佼佼者。但前者的到來并成為現(xiàn)象級(jí)事件，使得有必要分析和比較這兩種AIGC的技術(shù)原理和應(yīng)用場(chǎng)景差異，以便對(duì)AIGC有更進(jìn)一步的認(rèn)知和理解。

2014年5月，微軟（亞洲）互聯(lián)網(wǎng)工程院正式宣告微軟小冰的誕生。微軟小冰是建立在情感計(jì)算框架基礎(chǔ)上，綜合運(yùn)用算法、大數(shù)據(jù)和云計(jì)算，逐步進(jìn)行代際升級(jí)并向EQ方向發(fā)展的完整的人工智能體系。[33]2021年9月，第九代微軟小冰發(fā)布，覆蓋中國、日本、印尼等多個(gè)國家的6.6億在線用戶、4.5億臺(tái)智能設(shè)備以及9億內(nèi)容觀眾，涵蓋金融、地產(chǎn)、汽車、零售等多個(gè)垂直領(lǐng)域。

在內(nèi)容生成方面，微軟小冰可以進(jìn)行文本內(nèi)容、語音內(nèi)容以及視覺內(nèi)容生成。在詩歌領(lǐng)域，2017年其與湛廬文化合作出版首部AI詩集《陽光失了玻璃窗》，2019年采取人機(jī)合作的方式出版首部由AI和人類共同創(chuàng)作的詩集《花是綠水的沉默》；在金融領(lǐng)域，建立國內(nèi)規(guī)模第一的金融文本摘要平臺(tái)，為國內(nèi)40%以上的個(gè)人投資者和90%以上的金融機(jī)構(gòu)交易員提供金融知識(shí)服務(wù)，并構(gòu)建了基于小冰AI生成的金融知識(shí)圖譜；在音樂領(lǐng)域，創(chuàng)作獨(dú)一無二的音樂曲目，并自主完成樂器選擇、編曲和歌詞創(chuàng)作，自主發(fā)布數(shù)十首逼近人類歌手演唱水平的單曲；在有聲讀物領(lǐng)域，構(gòu)建CCP有聲讀物生產(chǎn)平臺(tái)并創(chuàng)造30多個(gè)角色化聲音，支持基于AI技術(shù)自動(dòng)生成定制化的兒童有聲讀物，并擁有2 300多小時(shí)自主版權(quán)的非定制兒童有聲讀物，形成了國內(nèi)規(guī)模較大的有聲讀物知識(shí)庫；在繪畫領(lǐng)域，通過學(xué)習(xí)400多年藝術(shù)史上的236位著名畫家的經(jīng)驗(yàn)，可在受到創(chuàng)作激勵(lì)時(shí)，獨(dú)立完成100%原創(chuàng)繪畫作品，并于2019年在中央美術(shù)學(xué)院舉辦個(gè)人畫展，于2020年在中信出版社出版繪畫作品集《或然世界：誰是人工智能畫家小冰》。此外，小冰在圖案設(shè)計(jì)、電臺(tái)節(jié)目和電視臺(tái)節(jié)目?jī)?nèi)容生成方面也都有著杰出的表現(xiàn)。

ChatGPT作為一款火爆2023年度的AI產(chǎn)品，其在智能回答、代碼編寫、教育輔導(dǎo)、內(nèi)容翻譯以及內(nèi)容創(chuàng)作方面的應(yīng)用場(chǎng)景和表現(xiàn)，以及作用于出版業(yè)所形成的生成式智能出版場(chǎng)景，如出版大數(shù)據(jù)與大語言模型、升維發(fā)展的智能知識(shí)服務(wù)、智能決策的出版領(lǐng)域智能機(jī)器人、生成式智能出版物、元宇宙出版五類新業(yè)態(tài)，已有相關(guān)研究[1-2]加以介紹，此不贅言。

同樣是人工智能生成內(nèi)容、生成知識(shí)的微軟小冰和ChatGPT，其相互之間的原理、場(chǎng)景和特征對(duì)比分析主要有以下幾方面。

在AI設(shè)定方面，小冰被設(shè)定為對(duì)話代理，用于社交平臺(tái)為用戶提供情感陪護(hù)，其已然成為全球范圍內(nèi)承載交互量最大的人工智能系統(tǒng)，占全球交互總量60%以上。ChatGPT則優(yōu)化對(duì)話語言模型，運(yùn)用更為通用的大語言模型，可回答更廣闊范圍內(nèi)的各種知識(shí)問題并執(zhí)行各種自然語言處理任務(wù)。小冰的目標(biāo)設(shè)定和功能設(shè)置上更多屬于情感智能的范疇，而ChatGPT則更多屬于認(rèn)知智能的范疇。前者旨在賦予AI以類似于人的觀察、理解和生成各種情感特征的能力，產(chǎn)生類人情感并進(jìn)行自然、親切、生動(dòng)交互；后者則旨在賦予AI具備類似人的學(xué)習(xí)、理解、語言、推理、決策等高級(jí)智能，進(jìn)行知識(shí)學(xué)習(xí)、邏輯推理、問題求解、形成知識(shí)圖譜或進(jìn)行智能決策等。二者的共同點(diǎn)在于均集多項(xiàng)技能于一身，都具備了通用人工智能的若干屬性。

在算法方面，微軟小冰使用了基于規(guī)則的系統(tǒng)以及深度學(xué)習(xí)技術(shù)，即使用了預(yù)先定義的規(guī)則和規(guī)則引擎進(jìn)行響應(yīng)和交互，其主要過程包括：一是語義解析，對(duì)輸入的文本進(jìn)行語義解析以理解關(guān)鍵信息和意圖；二是規(guī)則匹配，基于預(yù)定義規(guī)則和規(guī)則引擎來匹配輸入的語義和模式，如使用固定的模板；三是生成回復(fù)，匹配到相應(yīng)的規(guī)則，根據(jù)規(guī)則的定義生成回復(fù)，回復(fù)的方式可以是簡(jiǎn)單的文本替換，也可以基于模板填充；四是輸出和交互，把生成的回復(fù)反饋給用戶，作為對(duì)用戶輸入的回應(yīng)。而ChatGPT則使用了基于人類反饋強(qiáng)化學(xué)習(xí)算法的Transformer架構(gòu)以及自注意力機(jī)制（self-attention）。GPT是一種基于互聯(lián)網(wǎng)可用數(shù)據(jù)訓(xùn)練的文本生成深度學(xué)習(xí)模型，采用了利用人類反饋中強(qiáng)化學(xué)習(xí)（Reinforcement Learning with Human Feedback，RLHF）算法，主要包括三個(gè)步驟：一是預(yù)訓(xùn)練語言模型的訓(xùn)練階段，旨在形成自然語言理解與生成上下文學(xué)習(xí)能力、復(fù)雜意圖理解能力以及特定受眾文本摘要能力等；二是打分模型訓(xùn)練階段，旨在通過代碼微調(diào)和指令微調(diào)來評(píng)估模型輸出符合人類表現(xiàn)程度的優(yōu)劣；三是基于強(qiáng)化學(xué)習(xí)的語言模型優(yōu)化階段，旨在優(yōu)化模型，支持生成思維鏈進(jìn)行復(fù)雜推理，以提高ChatGPT的思考能力。自注意力機(jī)制，也是Transformer架構(gòu)的核心技術(shù)之一，通過給予不同位置的元素不同的注意力權(quán)重，使得模型可以根據(jù)序列中元素之間的相關(guān)性加權(quán)組合信息。ChatGPT的Transformer架構(gòu)則使用了多頭注意力機(jī)制，在不同的“頭”中分別計(jì)算注意力權(quán)重，以獲得更多顆細(xì)顆粒度的關(guān)注信息。[34]多注意力機(jī)制的使用，使得ChatGPT具有更卓越的處理長序列和捕捉長距離依賴關(guān)系的能力，更好地實(shí)現(xiàn)自然語言理解，能夠生成連貫的、高質(zhì)量的文本內(nèi)容。

在數(shù)據(jù)語料庫方面，微軟小冰側(cè)重于中文語境，集合了中國近7億用戶的社交數(shù)據(jù)、新聞和百科知識(shí)等，并精練為1 500萬條真實(shí)而有趣的語料庫（之后每天凈增 0.7%）。[34]ChatGPT的訓(xùn)練語料或數(shù)據(jù)來源則主要是英語、法語等其他語境，大致有兩類：一是前文介紹過的超過1 750億的巨量無標(biāo)注文本數(shù)據(jù)；[33]二是有標(biāo)注文本數(shù)據(jù)，融入了由40名標(biāo)注人員主導(dǎo)的、數(shù)萬高質(zhì)量的、符合人類偏好的人工標(biāo)注數(shù)據(jù)，“以獲得聽得懂人類語言、自身擁有判斷標(biāo)準(zhǔn)的LLM”。[8]

正是由于上述三方面的不同，微軟小冰和ChatGPT在知識(shí)生成方面各有特色：在輸出長度方面，微軟小冰輸出內(nèi)容的長度和規(guī)模較ChatGPT顯得力有不逮，后者可以輸出數(shù)萬字的文本內(nèi)容；在輸出模態(tài)方面，微軟小冰可支持輸出文本、圖片、表情符號(hào)、音頻、視頻等多種模態(tài)的知識(shí)，而ChatGPT則主要集中在文本模態(tài)領(lǐng)域，所生成的內(nèi)容以文本為主；在輸出語言性質(zhì)方面，微軟小冰主要面向中國客戶輸出中文數(shù)據(jù)、信息和知識(shí)，而ChatGPT則更多是基于英語、法語等非中文的語料庫進(jìn)行內(nèi)容生成；在適人化方面，由于微軟小冰的強(qiáng)交互性、情感智能定位以及專門針對(duì)中文用戶所進(jìn)行的訓(xùn)練和優(yōu)化，其個(gè)性化理解和回應(yīng)用戶需求、偏好的能力較強(qiáng)，具有較好的適人性，而ChatGPT作為通用的大語言模型，個(gè)性化和適應(yīng)性方面則稍遜色；從知識(shí)生成的特點(diǎn)來看，微軟小冰所生成的知識(shí)在特定領(lǐng)域的內(nèi)容會(huì)更加豐富和準(zhǔn)確，而ChatGPT則能夠涵蓋更廣泛的主題和領(lǐng)域，針對(duì)用戶提問，生成范圍更廣、更為系統(tǒng)、更為專業(yè)的數(shù)據(jù)和知識(shí)。

三、知識(shí)生成價(jià)值芻議：從出版前端到出版本質(zhì)

從知識(shí)生產(chǎn)的主體和時(shí)間節(jié)點(diǎn)來看，前述個(gè)體生產(chǎn)知識(shí)、專業(yè)生產(chǎn)知識(shí)、大眾生產(chǎn)知識(shí)以及人工智能生產(chǎn)知識(shí)，皆為知識(shí)的第一次生產(chǎn)，即由人類或人工智能所進(jìn)行的知識(shí)的創(chuàng)新和創(chuàng)造；而出版行為、出版活動(dòng)則屬于知識(shí)的第二次生產(chǎn)。那么，從知識(shí)生產(chǎn)方式來看出版學(xué)，能夠帶來哪些啟迪和思考？

1. 知識(shí)生成格局的變革，深刻影響出版業(yè)的發(fā)展

知識(shí)生成格局的變革，從智慧驅(qū)動(dòng)到數(shù)據(jù)驅(qū)動(dòng)，從人類生產(chǎn)知識(shí)到AI生產(chǎn)知識(shí)，將在很長一段時(shí)間內(nèi)呈現(xiàn)出人機(jī)協(xié)作生成知識(shí)的新格局。人機(jī)協(xié)作生成知識(shí)格局涵蓋AI生產(chǎn)新聞、AI創(chuàng)作圖書、AI創(chuàng)作音樂、AI創(chuàng)造繪畫、AI生產(chǎn)有聲讀物等AI生成內(nèi)容的各個(gè)領(lǐng)域，對(duì)出版業(yè)產(chǎn)生全方位的深刻影響。在出版產(chǎn)品方面，一系列的生成式智能出版物將陸續(xù)出現(xiàn)，如生成式智能出版物、生成式智能知識(shí)服務(wù)、出版專業(yè)大語言模型等。實(shí)踐中，世界頂級(jí)的法律、稅務(wù)知識(shí)服務(wù)商律商聯(lián)訊（LexisNexis）已于2023年5月推出了面向法律界的生成式智能知識(shí)服務(wù)平臺(tái)——Lexis+AI，具備提供法律內(nèi)容檢索、法律內(nèi)容總結(jié)以及生成合同、簡(jiǎn)報(bào)等功能。在出版技術(shù)方面，大語言模型技術(shù)、基于人類反饋的強(qiáng)化學(xué)習(xí)算法、自注意力機(jī)制等技術(shù)將陸續(xù)影響和作用于出版業(yè)，對(duì)出版內(nèi)部流程和外部產(chǎn)品服務(wù)持久賦能。在出版營銷方面，營銷文檔的AI制作、基于AIGC的虛擬客服、出版營銷數(shù)據(jù)建設(shè)等將會(huì)出現(xiàn)或不斷強(qiáng)化，在線下營銷、直播營銷、短視頻營銷等基礎(chǔ)上進(jìn)一步拓展出版營業(yè)的版圖，豐富出版營業(yè)的內(nèi)涵。

2. 知識(shí)生成方式的變化，并沒有改變出版本質(zhì)

出版的本質(zhì)究竟是什么？以實(shí)踐視角視之，出版的本質(zhì)可被解讀為“對(duì)作品經(jīng)過編輯、復(fù)制而后予以公開的活動(dòng)”，筆者認(rèn)為反映出版實(shí)踐的編校印發(fā)說固然是沒錯(cuò)的，但在回答出版的本質(zhì)是什么這一問題上則顯得力有不逮。以理論視角考察，編輯出版是“文化締構(gòu)、文化傳播和文化再生產(chǎn)活動(dòng)”[35]“出版活動(dòng)的本質(zhì)是文化選擇”[36]“商業(yè)形式的文化建構(gòu)”[37]等觀點(diǎn)是從文化角度提出的，“出版專業(yè)主義核心內(nèi)涵是信息選擇把關(guān)、共識(shí)與價(jià)值觀表達(dá)以及知識(shí)和文化的傳播”[38]及“出版本質(zhì)是一種知識(shí)生產(chǎn)”[39]則是從知識(shí)的角度提出的。筆者基本贊同出版的本質(zhì)是知識(shí)生產(chǎn)這種說法，至少知識(shí)生產(chǎn)作為出版的本質(zhì)可以適用于專業(yè)出版、學(xué)術(shù)出版、教育出版等業(yè)態(tài)，但是大眾出版的本質(zhì)是否為生產(chǎn)知識(shí)？抑或生產(chǎn)的是技巧、技能、生活經(jīng)驗(yàn)等隱性知識(shí)？這一點(diǎn)尚需嚴(yán)謹(jǐn)論證。實(shí)際上，出版的本質(zhì)是知識(shí)生產(chǎn)，更確切地說，是知識(shí)的第二次生產(chǎn)，是知識(shí)的建制化生產(chǎn)，是一種深層次、有底蘊(yùn)的知識(shí)生產(chǎn)，是知識(shí)的社會(huì)化生產(chǎn)與傳播。就此而言，無論是人類還是AI生產(chǎn)的知識(shí)，實(shí)質(zhì)上生產(chǎn)的是知識(shí)素材、知識(shí)原型，而非知識(shí)產(chǎn)品、知識(shí)成品，出版業(yè)生產(chǎn)和傳播的則是知識(shí)產(chǎn)品和知識(shí)成品。

3. 知識(shí)生成范式的轉(zhuǎn)換，啟迪出版學(xué)研究范圍拓新

AI生成知識(shí)的出現(xiàn)并不能取代人類生成知識(shí)，數(shù)據(jù)驅(qū)動(dòng)生成知識(shí)也不能替代智慧生成知識(shí)，恰如機(jī)器人新聞中算法和記者的關(guān)系，不是替代關(guān)系而是耦合關(guān)系，[40]二者同樣在新聞業(yè)中扮演重要角色。但這意味著知識(shí)生成的范式開始由人類智慧生成知識(shí)轉(zhuǎn)變?yōu)槿藱C(jī)協(xié)作生成知識(shí)，且這一新的知識(shí)生成范式將在很長的歷史時(shí)期內(nèi)存在并發(fā)展。就出版學(xué)研究而言，知識(shí)生產(chǎn)范式和內(nèi)容供給模式的轉(zhuǎn)換，[41]給我們最大的啟發(fā)在于拓新出版學(xué)的研究邊界，基于時(shí)間維度展開高新技術(shù)對(duì)出版業(yè)應(yīng)用的出版未來學(xué)研究。[42]就此而言，是否可擴(kuò)展至出版前端的作者，在作者學(xué)方面進(jìn)行鉆研和探索？長期以來，出版學(xué)研究的范圍往往在本體維度的出版經(jīng)營管理、時(shí)間維度的出版史、空間維度的國際出版、技術(shù)維度的數(shù)字出版以及作為出版后端的閱讀、讀者等，鮮有學(xué)者將作者、作者學(xué)作為出版學(xué)研究的基本范疇和主要領(lǐng)域。把出版學(xué)研究領(lǐng)域拓展至前端的作者，一方面，有利于擴(kuò)大出版學(xué)研究范圍，深入分析知識(shí)生成的主體、工具、對(duì)象等特點(diǎn)，探究知識(shí)生成機(jī)理與規(guī)律；另一方面，在人機(jī)寫作生成知識(shí)的時(shí)代，對(duì)作者的研究進(jìn)一步由研究人類作者延展到研究AI作者，既是提升出版人數(shù)字素養(yǎng)與技能的要求，也與當(dāng)下作為研究熱點(diǎn)的智能出版、智慧出版相吻合。

結(jié)語

生成式人工智能技術(shù)引發(fā)了社會(huì)各行各業(yè)的熱議和思考，也引起了學(xué)術(shù)各界的研究和探索。本文在提出智慧驅(qū)動(dòng)型和數(shù)據(jù)驅(qū)動(dòng)型知識(shí)生成原理的基礎(chǔ)上，從知識(shí)生成這個(gè)維度，對(duì)個(gè)體生產(chǎn)知識(shí)、專業(yè)生產(chǎn)知識(shí)、大眾生產(chǎn)知識(shí)及人工智能生成知識(shí)進(jìn)行了分析和思考，最后提出了人機(jī)協(xié)同生成知識(shí)的新格局對(duì)出版業(yè)和出版學(xué)發(fā)展的意義。其實(shí)，關(guān)于生成式人工智能和出版的關(guān)系，還有諸多議題值得深入研究，如生成式人工智能物的可版權(quán)性如何、著作權(quán)歸屬如何、可行性的法律治理方案如何、分析式智能出版和生成式智能出版的區(qū)別與聯(lián)系又在哪里等。

參考文獻(xiàn)：

[1] 張新新，丁靖佳．生成式智能出版的技術(shù)原理與流程革新[J/OL].[2023-07-16].圖書情報(bào)知識(shí)，https：//kns.cnki.net/kcms2/detail/42.1085.g2.20230716.0031.002.html.

[2] 張新新，黃如花. 生成式智能出版的應(yīng)用場(chǎng)景、風(fēng)險(xiǎn)挑戰(zhàn)與調(diào)治路徑[J/OL].[2023-07-17].圖書情報(bào)知識(shí)，https：//kns.cnki.net/kcms2/detail/42.1085.G2.20230717.1104.003.html.

[3] 郝祥軍，顧小清. AI重塑知識(shí)觀：數(shù)據(jù)科學(xué)影響下的知識(shí)創(chuàng)造與教育發(fā)展[J]. 中國遠(yuǎn)程教育，2023（5）：13-23.

[4] 王健. 知識(shí)萃取——將科研項(xiàng)目隱性知識(shí)顯性化[J]. 企業(yè)管理，2022（4）：102-105.

[5] 吳飛，段竺辰. 從獨(dú)思到人機(jī)協(xié)作——知識(shí)創(chuàng)新模式進(jìn)階論[J]. 浙江學(xué)刊，2020（5）：94-104.

[6] 吳鋒. 發(fā)達(dá)國家“算法新聞”的理論緣起、最新進(jìn)展及行業(yè)影響[J]. 編輯之友，2018（5）：48-54.

[7] 熊國榮，李賢秀.“機(jī)器人記者”對(duì)新聞?dòng)浾呔蜆I(yè)的沖擊及應(yīng)對(duì)[J]. 編輯之友，2016（11）：73-77.

[8] Brown T， Mann B， Ryder N， et al. Language Models are Few-shot Learners[J]. Advances in Neural Information Processing Systems， 2020（33）： 1877-1901.

[9] 朱光輝，王喜文. ChatGPT的運(yùn)行模式、關(guān)鍵技術(shù)及未來圖景[J]. 新疆師范大學(xué)學(xué)報(bào)（哲學(xué)社會(huì)科學(xué)版），2023（4）：113-122.

[10] Haiko V， Cunningham S， Janssen M， et al. Data science as knowledge creation a framework for synergies between data analysts and domain professionals[J]. Technological Forecasting and Social Change， 2011， 173（4）： 1-10.

[11] 康德. 純粹理性批判[M]. 鄧曉芒，譯. 北京：人民出版社，2004：21.

[12] 王慶節(jié).“先驗(yàn)想象力”抑或“超越論形象力”——海德格爾對(duì)康德先驗(yàn)想象力概念的解釋與批判[J].現(xiàn)代哲學(xué)，2016（4）：58-65.

[13] 邱仁宗. 科學(xué)方法與科學(xué)動(dòng)力學(xué)——現(xiàn)代科學(xué)哲學(xué)概述[M]. 北京：高等教育出版社，2006：51.

[14] 袁方，王漢生. 社會(huì)研究方法教程（重排本）[M]. 北京：北京大學(xué)出版社，2013：28.

[15] 劉魁. 真理、文化權(quán)威與知識(shí)生產(chǎn)的時(shí)代性——兼評(píng)?？聦?duì)真理話語的微觀權(quán)力分析[J]. 南京政治學(xué)院學(xué)報(bào)，2005（3）：53-57.

[16] 李明杰. 中國出版史：上冊(cè)·古代卷[M]. 長沙：湖南大學(xué)出版社，2008：50-51.

[17] 張岱年，方克立. 中國文化概論[M]. 北京：北京師范大學(xué)出版社，2004：135.

[18] 賀國慶. 古希臘高等教育探微[J]. 河北大學(xué)學(xué)報(bào)（哲學(xué)社會(huì)科學(xué)版），2003（4）：5-8.

[19] 方卿，許潔，等. 出版學(xué)基礎(chǔ)[M].武漢：武漢大學(xué)出版社，2023：356.

[20] 讓-弗朗索瓦·利奧塔. 后現(xiàn)代狀況：關(guān)于知識(shí)的報(bào)告[M]. 島子，譯. 長沙：湖南美術(shù)出版社，1996：35.

[21] 張新新，陳奎蓮. 堅(jiān)持出版導(dǎo)向，引領(lǐng)5G時(shí)代數(shù)字出版新變化[J]. 出版發(fā)行研究，2020（3）：38-44.

[22] 張新新. 智能出版：現(xiàn)代出版技術(shù)原理與應(yīng)用[M]. 北京：人民出版社，2021：40-50.

[23] Rocio·M. T， Maria O. Identification of innovation solvers in open innovation communities using swarm intelligence[J]. Technological Forecasting and Social Change， 2016， 109（2）： 15-24.

[24] 王玫，朱云龍，何小賢. 群體智能研究綜述[J]. 計(jì)算機(jī)工程，2005（22）：194-196.

[25] 劉華東，馬維娜，張新新. “出版+人工智能”：智能出版流程再造[J]. 出版廣角，2018（1）：14-16.

[26] 肖奎. 維基百科大數(shù)據(jù)的知識(shí)挖掘與管理方法研究[D]. 武漢大學(xué)，2014.

[27] 牛明坤. 基于大眾標(biāo)注的群體知識(shí)組織性質(zhì)與結(jié)構(gòu)研究[D]. 湖南大學(xué)，2018.

[28] 趙健，張?chǎng)窝|，李佳明，等. 群體智能2.0研究綜述[J]. 計(jì)算機(jī)工程，2019（12）：1-7.

[29] 張新新，劉華東. 出版+人工智能：未來出版的新模式與新形態(tài)——以《新一代人工智能發(fā)展規(guī)劃》為視角[J]. 科技與出版，2017（12）：38-43.

[30] 申屠曉明，甘恬. 機(jī)器人寫稿的技術(shù)原理及實(shí)現(xiàn)方法[J]. 傳媒評(píng)論，2017（9）：15-19.

[31] 央視新聞：新聞機(jī)器人的工作原理與技術(shù)解析[EB/OL].[2023-07-14].http：//www.uctdm.com/43920.html.

[32] 鄧浩然. 新聞寫作機(jī)器人現(xiàn)狀與發(fā)展研究——以Xiaomingbot為例[D]. 蘭州大學(xué)，2019.

[33] 陸偉晶. 人工智能機(jī)器人面臨的倫理困境——以“微軟小冰”為例[J]. 視聽界，2018（4）：74-78.

[34] 崔宇紅，白帆，張蕊芯. ChatGPT在高等教育領(lǐng)域的應(yīng)用、風(fēng)險(xiǎn)及應(yīng)對(duì)[J]. 重慶理工大學(xué)學(xué)報(bào)（社會(huì)科學(xué)），2023（5）：16-25.

[35] 王振鐸. 文化締構(gòu)編輯觀[J]. 河南大學(xué)學(xué)報(bào)（哲學(xué)社會(huì)科學(xué)版），1988（3）：104-114.

[36] 陳少志，張新新. 出版業(yè)文化質(zhì)量的提升向度與路徑探析——基于編輯工作的視角[J]. 中國編輯，2023（7）：34-40.

[37] 方卿，丁靖佳. 數(shù)字出版三個(gè)基本理論問題的思考[J]. 中國出版，2023（10）：17-22.

[38] 李楊. 數(shù)智時(shí)代出版專業(yè)主義的核心內(nèi)涵建構(gòu)[J]. 編輯之友，2022（7）：83-89.

[39] 范軍. 出版本質(zhì)上是一種知識(shí)生產(chǎn)[J]. 出版科學(xué)，2022（3）：1.

[40] 張超，鐘新. 從比特到人工智能：數(shù)字新聞生產(chǎn)的算法轉(zhuǎn)向[J]. 編輯之友，2017（11）：61-66.

[41] 方卿，丁靖佳. 人工智能生成內(nèi)容（AIGC）的三個(gè)出版學(xué)議題[J]. 出版科學(xué)，2023（2）：5-10.

[42] 張新新. 中國特色數(shù)字出版學(xué)研究對(duì)象：研究?jī)r(jià)值、提煉方法與多維表達(dá)[J]. 編輯之友，2020（11）：5-11，30.

作者信息：張新新（1984— ），男，江蘇贛榆人，博士，上海理工大學(xué)出版印刷與藝術(shù)設(shè)計(jì)學(xué)院教授、博士生導(dǎo)師，國家新聞出版署科技與標(biāo)準(zhǔn)重點(diǎn)實(shí)驗(yàn)室學(xué)術(shù)委員會(huì)主任，主要研究方向：數(shù)字出版、人工智能、文化管理與服務(wù)。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

生成式智能出版：知識(shí)生成原理、沿革與啟迪