索偉
[摘要]智能出版的本質(zhì)是作者通過自動(dòng)文本分析、AI語義解析、人工智能排版等方式生產(chǎn)以及傳播知識(shí)。在人工智能與出版融合發(fā)展的大趨勢下,生成式智能出版作為一種新型智能出版模式,通過對內(nèi)容資源進(jìn)行數(shù)字化處理和個(gè)性化定制,實(shí)現(xiàn)知識(shí)內(nèi)容的快速生產(chǎn)、精準(zhǔn)分發(fā)與個(gè)性化定制。生成式智能出版具有智能生產(chǎn)、人機(jī)協(xié)同、個(gè)性化定制等特點(diǎn),在優(yōu)化出版物結(jié)構(gòu)、助力內(nèi)容增值、增強(qiáng)用戶體驗(yàn)等方面具有積極作用,但在技術(shù)應(yīng)用過程中也存在版權(quán)保護(hù)不力、生產(chǎn)成本高昂、知識(shí)產(chǎn)權(quán)難以保障等問題。對此,文章針對上述問題從加強(qiáng)版權(quán)保護(hù)與權(quán)益保障、打造自主可控的核心技術(shù)、優(yōu)化生產(chǎn)流程與用戶體驗(yàn)三個(gè)方面提出生成式智能出版的優(yōu)化路徑。
[關(guān)鍵詞]生成式智能出版;技術(shù)原理;應(yīng)用挑戰(zhàn);路徑
智能出版是人工智能與出版融合發(fā)展的產(chǎn)物,指利用人工智能、大數(shù)據(jù)、云計(jì)算等技術(shù)手段,對傳統(tǒng)出版進(jìn)行數(shù)字化處理和智能化再造,為讀者提供個(gè)性化的內(nèi)容和服務(wù)[1]。人工智能技術(shù)在出版業(yè)的落地與應(yīng)用是生成式智能出版的重要組成部分,代表出版業(yè)數(shù)字化轉(zhuǎn)型發(fā)展的新方向。2017年,中國新聞出版研究院印發(fā)的《2016—2017中國數(shù)字出版產(chǎn)業(yè)年度報(bào)告》(以下簡稱《報(bào)告》)指出,從數(shù)字內(nèi)容生產(chǎn)、數(shù)字內(nèi)容消費(fèi)到數(shù)字內(nèi)容服務(wù),我國數(shù)字出版產(chǎn)業(yè)的數(shù)字化轉(zhuǎn)型升級(jí)已成為必然趨勢[2]。
一、生成式智能出版:“智能生產(chǎn)”與“人機(jī)協(xié)同”的新型出版模式
新型出版領(lǐng)域的智能化轉(zhuǎn)型已是大勢所趨,而人工智能作為一種先進(jìn)的生產(chǎn)工具,已經(jīng)滲透至出版生產(chǎn)與傳播的各個(gè)環(huán)節(jié)。近年來,我國對人工智能技術(shù)加大投入力度,從基礎(chǔ)層到應(yīng)用層都實(shí)現(xiàn)了智能化的轉(zhuǎn)型,如當(dāng)下的大型化工廠、酒店等都可實(shí)現(xiàn)智能化,而對出版行業(yè)而言,智能化也是人心所向,新聞出版產(chǎn)業(yè)逐漸從“人找信息”過渡到“信息找人”,從“產(chǎn)品導(dǎo)向”轉(zhuǎn)向“用戶導(dǎo)向”,從“人機(jī)協(xié)同”走向“人機(jī)融合”。
傳統(tǒng)出版企業(yè)為實(shí)現(xiàn)融合發(fā)展,紛紛引入人工智能技術(shù),在智能編輯、智能校對、智能排版、智能審核等方面進(jìn)行探索和嘗試。然而,目前基于人工智能的智能編輯與校對仍主要處于“人機(jī)協(xié)同”階段[3]。在編輯環(huán)節(jié),人工智能主要用于自動(dòng)檢測、糾錯(cuò)與矯錯(cuò)等;在校對環(huán)節(jié),人工智能主要用于語言識(shí)別、語義理解和語法分析;在排版環(huán)節(jié),人工智能主要用于排版工具的開發(fā)。總體而言,這種人機(jī)協(xié)同模式僅將人工智能作為一種工具,尚未實(shí)現(xiàn)真正意義上的“人機(jī)協(xié)同”。而生成式智能出版作為一種新型智能出版模式,以進(jìn)行數(shù)字化處理并加以個(gè)性化定制為核心內(nèi)容,是基于深度學(xué)習(xí)算法模型和自然語言處理技術(shù)進(jìn)行內(nèi)容生成的過程。隨著深度學(xué)習(xí)算法模型的不斷改進(jìn)與優(yōu)化,生成式智能出版逐漸實(shí)現(xiàn)從“人機(jī)協(xié)同”到“人機(jī)融合”的轉(zhuǎn)變。
在出版領(lǐng)域中,“人機(jī)協(xié)同”指機(jī)器在完成任務(wù)的過程中更加注重人與機(jī)器之間的協(xié)作關(guān)系,并使得工作效率得到顯著提升。在內(nèi)容生產(chǎn)階段,人工智能主要通過機(jī)器自動(dòng)或半自動(dòng)地完成編輯工作;在內(nèi)容分發(fā)階段,人工智能主要通過機(jī)器自動(dòng)或半自動(dòng)地完成對內(nèi)容的快速分發(fā);在個(gè)性化定制階段,人工智能則主要通過機(jī)器自主或半自動(dòng)地完成對內(nèi)容的深度加工并最終交付。與傳統(tǒng)出版相比,生成式智能出版具有更高的智能化程度和更強(qiáng)的個(gè)性化定制能力。一方面,生成式智能出版可以根據(jù)用戶的當(dāng)前需求和用戶的喜好習(xí)慣,更新出版內(nèi)容和寫作資源;另一方面,生成式智能化出版可以結(jié)合用戶的喜好,為用戶提供個(gè)性化專屬定制,從而真正實(shí)現(xiàn)內(nèi)容生產(chǎn)和分發(fā)與用戶一體化關(guān)系,優(yōu)化用戶的使用體驗(yàn)[4]。
二、生成式智能出版的技術(shù)原理:內(nèi)容、用戶與場景的匹配
生成式智能出版的第一個(gè)關(guān)鍵技術(shù)是機(jī)器學(xué)習(xí)技術(shù)。機(jī)器學(xué)習(xí)技術(shù)是人工智能發(fā)展中最重要的分支之一,也是生成式智能出版的核心技術(shù)。機(jī)器學(xué)習(xí)算法以統(tǒng)計(jì)學(xué)為基礎(chǔ),利用統(tǒng)計(jì)學(xué)中的一些經(jīng)典思想和算法分析來處理數(shù)據(jù),從而對人類思維過程進(jìn)行模
擬[5]。具體來說,機(jī)器學(xué)習(xí)可分為監(jiān)督學(xué)習(xí)、無監(jiān)督學(xué)習(xí)、強(qiáng)化學(xué)習(xí)三種類型:監(jiān)督學(xué)習(xí)指通過訓(xùn)練一個(gè)模型來預(yù)測另一個(gè)模型的輸出結(jié)果,通過不斷地訓(xùn)練和優(yōu)化,讓模型的預(yù)測效果更好;無監(jiān)督學(xué)習(xí)則指從沒有標(biāo)簽的數(shù)據(jù)中進(jìn)行學(xué)習(xí),如無標(biāo)簽文本分類;強(qiáng)化學(xué)習(xí)則是通過與環(huán)境之間的互動(dòng)來進(jìn)行學(xué)習(xí),如自動(dòng)駕駛汽車。
在生成式智能出版中,機(jī)器學(xué)習(xí)技術(shù)主要分為三種類型:一是基于文本數(shù)據(jù)訓(xùn)練得到的分類模型;二是基于用戶行為數(shù)據(jù)訓(xùn)練得到的推薦模型;三是基于用戶反饋數(shù)據(jù)訓(xùn)練得到的推薦模型。基于文本數(shù)據(jù)訓(xùn)練得到的分類模型主要是在傳統(tǒng)算法上進(jìn)行改進(jìn),其在大規(guī)模數(shù)據(jù)集訓(xùn)練上取得較好的效果;基于用戶行為數(shù)據(jù)訓(xùn)練得到的推薦模型則能夠更加準(zhǔn)確地預(yù)測用戶可能感興趣或者需要關(guān)注的領(lǐng)域。在傳統(tǒng)算法中,文本數(shù)據(jù)集通過分類標(biāo)簽對用戶進(jìn)行分類,并根據(jù)不同標(biāo)簽來判斷用戶偏好,從而向其推薦內(nèi)容。然而,這種模式存在一定的問題:第一,對海量且多樣的文本數(shù)據(jù)集而言,標(biāo)簽本身就會(huì)存在一定程度的局限性;第二,不同標(biāo)簽之間缺乏有效區(qū)分度。在推薦算法中,由于對用戶標(biāo)簽進(jìn)行了系統(tǒng)級(jí)劃分和處理,因此在用戶多標(biāo)簽下的內(nèi)容推薦很難取得好效果?;谟脩舴答仈?shù)據(jù)訓(xùn)練得到的推薦模型雖然能夠較為準(zhǔn)確地預(yù)測用戶可能感興趣或需要關(guān)注的領(lǐng)域,但是其在面對海量且多樣的文本數(shù)據(jù)集時(shí)會(huì)出現(xiàn)泛化能力不足、不穩(wěn)定等問題。
三、生成式智能出版的價(jià)值作用:助力內(nèi)容增值,優(yōu)化出版結(jié)構(gòu)
在人工智能與出版融合發(fā)展的大趨勢下,生成式智能出版以數(shù)據(jù)和算法為核心,在數(shù)字時(shí)代重新定義了出版業(yè)的基本規(guī)律,具有優(yōu)化出版物結(jié)構(gòu)、助力內(nèi)容增值、增強(qiáng)用戶體驗(yàn)等價(jià)值作用[6]。首先,在內(nèi)容增值方面,生成式智能出版通過對海量數(shù)據(jù)的自動(dòng)處理和分析,能夠?qū)σ延袃?nèi)容資源進(jìn)行深加工與再利用,更好地實(shí)現(xiàn)知識(shí)內(nèi)容的個(gè)性化生產(chǎn)與定制化推送,從而為用戶提供更多優(yōu)質(zhì)的內(nèi)容資源。其次,在出版結(jié)構(gòu)優(yōu)化方面,生成式智能出版通過對知識(shí)數(shù)據(jù)的深入挖掘和分析,能夠?qū)鹘y(tǒng)出版物中不方便閱讀或用戶不感興趣的內(nèi)容與用戶不匹配的資源進(jìn)行重新整合與優(yōu)化,確保用戶既能看到自己喜歡的資源,又能屏蔽自己不感興趣的部分。最后,在用戶體驗(yàn)方面,生成式智能出版通過對海量用戶數(shù)據(jù)進(jìn)行自動(dòng)化的深度分析與挖掘,確保在出版結(jié)構(gòu)優(yōu)化時(shí)找到屬于用戶的獨(dú)一無二的內(nèi)容。同時(shí),這樣的查詢方式還能夠提升出版業(yè)的整體效率。
四、生成式智能出版的困境挑戰(zhàn):版權(quán)保護(hù)與權(quán)益保障不足
智能出版以數(shù)據(jù)為核心,通過對內(nèi)容進(jìn)行數(shù)據(jù)化處理,生成具有高度個(gè)性化特征的內(nèi)容產(chǎn)品。在這種新型智能出版模式中,由于機(jī)器自動(dòng)化的屬性,數(shù)據(jù)獲取的成本降低,生產(chǎn)效率提升,從而引發(fā)數(shù)據(jù)產(chǎn)權(quán)、版權(quán)保護(hù)與權(quán)益保障等問題。目前,生成式智能出版主要分為三種形式:一是自動(dòng)生成系統(tǒng)(Automated Generation System,AGS);二是人工智能寫作系統(tǒng)(Artificial Intelligence Writing System,AW);三是自然語言處
理系統(tǒng)(Natural Language Processing System,NLP)。
其中,前兩種生成式智能出版模式的版權(quán)保護(hù)與權(quán)益保障問題最為突出。
(一)自動(dòng)生成系統(tǒng):數(shù)據(jù)產(chǎn)權(quán)界定模糊
在自動(dòng)生成系統(tǒng)中,數(shù)據(jù)主要由編輯通過對作品的加工處理獲得。在生成時(shí),編輯可以通過對數(shù)據(jù)的抓取、整合與加工,形成具有高度個(gè)性化特征的內(nèi)容產(chǎn)品。由于數(shù)據(jù)獲取的便利性和時(shí)效性,在傳統(tǒng)出版中,作品創(chuàng)作完成后由作者享有版權(quán)。而在自動(dòng)生成系統(tǒng)中,編輯并不直接參與內(nèi)容的創(chuàng)作過程,而將作者提供的內(nèi)容作為數(shù)據(jù)來源進(jìn)行抓取和處理,從中獲取大量具有獨(dú)創(chuàng)性、新穎性的內(nèi)容。因此,自動(dòng)生成系統(tǒng)的數(shù)據(jù)產(chǎn)權(quán)界定存在一定的模糊性。在未來技術(shù)不斷發(fā)展、市場競爭加劇的背景下,傳統(tǒng)版權(quán)法很可能面臨“去中心化”的挑戰(zhàn),同時(shí)數(shù)據(jù)產(chǎn)權(quán)問題也可能進(jìn)一步加劇,因此,數(shù)據(jù)產(chǎn)權(quán)界定成為生成式智能出版面臨的首要問題。
(二)人工智能寫作系統(tǒng):著作權(quán)保護(hù)存在漏洞
人工智能寫作系統(tǒng)的核心是智能算法,通過對輸入信息的學(xué)習(xí),根據(jù)不同作者的寫作風(fēng)格和特色,利用機(jī)器自動(dòng)生成文字相關(guān)的內(nèi)容和作品。在生成式智能出版模式下,機(jī)器對用戶輸入的文字內(nèi)容以及作者信息和擅長類別進(jìn)行篩選、過濾與匯總,基于此生成用戶真正想要的內(nèi)容,并通過算法推薦給適合這類內(nèi)容的用戶,這種基于用戶需求的智能化創(chuàng)作模式雖然具有高度的個(gè)性化特征,但是其數(shù)據(jù)是在互聯(lián)網(wǎng)大環(huán)境中所找到的,因此原始數(shù)據(jù)容易受到其他機(jī)構(gòu)或個(gè)人的非法利用。同時(shí),機(jī)器不具有重新創(chuàng)造出全新作品的能力,也無法享受我國的著作權(quán)法保護(hù)。盡管我國相關(guān)法規(guī)對“人工智能生成作品”有明確規(guī)定:“本法所稱人工智能創(chuàng)作的作品……是指計(jì)算機(jī)程序和算法”,但由于細(xì)節(jié)不夠以及缺乏相關(guān)法律規(guī)定,目前司法實(shí)踐仍難以確定人工智能著作是否構(gòu)成著作權(quán)侵權(quán),這對人工智能寫作系統(tǒng)來說是一個(gè)非常大的弊端。
五、生成式智能出版的優(yōu)化路徑
人工智能與出版的深度融合是智能出版發(fā)展的必然趨勢,生成式智能出版的應(yīng)用將會(huì)對傳統(tǒng)出版模式產(chǎn)生巨大的影響。然而,生成式智能出版的流程還不夠完善,同時(shí)其在技術(shù)應(yīng)用上也面臨不少問題,為解決這些問題,筆者認(rèn)為可以從以下三個(gè)方面做出優(yōu)化。
(一)加強(qiáng)版權(quán)保護(hù)與權(quán)益保障
目前,作者和平臺(tái)都面臨侵權(quán)的風(fēng)險(xiǎn)。比如,一些平臺(tái)利用網(wǎng)絡(luò)爬蟲技術(shù)抓取他人作品數(shù)據(jù),或在網(wǎng)頁中插入與他人作品相似度較高的圖片和音頻,從而獲得用戶數(shù)據(jù)。在這種情況下,如果侵權(quán)行為得不到有效制止,將會(huì)嚴(yán)重影響作者和平臺(tái)的利益。因此,相關(guān)主體必須完善相關(guān)法律法規(guī),嚴(yán)厲打擊侵犯著作權(quán)行為,建立完善的版權(quán)交易市場,增加侵權(quán)行為成本,真正加強(qiáng)版權(quán)保護(hù)與權(quán)益保障。
(二)打造自主可控的核心技術(shù)
生成式智能出版涉及數(shù)字內(nèi)容產(chǎn)品生產(chǎn)、加工、包裝、營銷、管理等環(huán)節(jié),每個(gè)環(huán)節(jié)都需要投入大量的人力、物力與財(cái)力。而生成式智能出版中涉及的人工智能算法需要大量算力支撐才能實(shí)現(xiàn)智能生產(chǎn)與智能分發(fā),這無疑加大了內(nèi)容生產(chǎn)成本。因此,出版企業(yè)等相關(guān)主體要及時(shí)引入屬于自己的核心技術(shù)算法[7],深入推進(jìn)生成式智能化出版,有效利用AI技術(shù),并科學(xué)合理地創(chuàng)新技術(shù),引入國外相對發(fā)達(dá)的技術(shù)資源進(jìn)行學(xué)習(xí)和鉆研,從而形成屬于自己的核心資源,降低內(nèi)容生產(chǎn)成本。
(三)優(yōu)化生產(chǎn)流程與用戶體驗(yàn)
在智能出版趨勢下,一些大學(xué)生或是學(xué)術(shù)參與者依賴AI智能寫作,由此衍生出一系列學(xué)術(shù)不端的問題。這在一定程度上對當(dāng)下論文原創(chuàng)度以及實(shí)驗(yàn)真實(shí)程度、學(xué)術(shù)公平性、道德規(guī)范的維持以及用戶體驗(yàn)度都產(chǎn)生不良影響。對此,筆者建議相關(guān)主體加大內(nèi)容生產(chǎn)流程的監(jiān)管力度,對內(nèi)容生產(chǎn)過程給予更好的意見(列大綱、實(shí)驗(yàn)數(shù)據(jù)參考等方面),從而增強(qiáng)用戶體驗(yàn)。
六、結(jié)語
目前,生成式智能出版仍面臨前所未有的挑戰(zhàn),有些學(xué)者認(rèn)為,生成式智能出版內(nèi)容提出過早。對此,相關(guān)主體要積極宣傳生成式智能出版,及時(shí)解決當(dāng)前出版面臨的知識(shí)碎片化、信息過載、質(zhì)量參差不齊等問題,利用人工智能與出版融合賦能,實(shí)現(xiàn)由傳統(tǒng)出版向生成式智能出版的轉(zhuǎn)型,促進(jìn)生成式智能出版在內(nèi)容生產(chǎn)領(lǐng)域發(fā)揮更大的價(jià)值。
[參考文獻(xiàn)]
[1]張新新,黃如花.生成式智能出版的應(yīng)用場景、風(fēng)險(xiǎn)挑戰(zhàn)與調(diào)治路徑[J].圖書情報(bào)知識(shí),2023(05):77-86.
[2]楊雅.生成式人工智能在科技期刊出版中的應(yīng)用場景探討[J].新聞研究導(dǎo)刊,2024(02):242-245.
[3]楊亞紅,孫巖,余黨會(huì).學(xué)術(shù)出版行業(yè)生成式人工智能作品相關(guān)責(zé)任與風(fēng)險(xiǎn)分析研究綜述[J].中國科技期刊研究,2023(12):1601-1607.
[4]劉珍,趙云澤.技術(shù)邏輯、實(shí)現(xiàn)方式與現(xiàn)實(shí)邊界:生成式AI對出版業(yè)的深層影響[J].中國出版,2023(15):11-16.
[5]種曉明.AIGC賦能出版業(yè)背景下版權(quán)監(jiān)管新路徑研究[J].科技與出版,2023(08):96-104.
[6]熊有軍,戴瓊.生成式人工智能發(fā)展路徑賽道及商業(yè)模式分析[J].信息系統(tǒng)工程,2023(12):121-124.
[7]彭道敦,謝琳. 大型生成式人工智能的版權(quán)法分析:禁止盜用救濟(jì)路徑的提出[J].學(xué)術(shù)研究,2023(11):52-54.