[摘要]ChatGPT的火爆問世引起了出版行業(yè)對自然語言處理技術(shù)的熱切關(guān)注。文章在深入分析自然語言處理技術(shù)對學術(shù)期刊出版影響的基礎(chǔ)上,進一步采用SWOT分析法對我國學術(shù)期刊出版的優(yōu)勢與劣勢、面臨的機遇與挑戰(zhàn)進行剖析,提出學術(shù)期刊智能化轉(zhuǎn)型發(fā)展的策略:緊抓機遇,深化體制改革和資源整合;加強技術(shù)合作,建設(shè)智能化綜合出版平臺;加速建立監(jiān)管體系,保障智能出版健康發(fā)展;精準匹配供需,提供本土化服務(wù)模式;加強人才隊伍建設(shè),提高智能化發(fā)展競爭力。
[關(guān)鍵詞]自然語言處理技術(shù);ChatGPT;人工智能;學術(shù)期刊;智能出版
自然語言處理技術(shù)(Natural Language Processing,NLP)是人工智能(Artificial Intelligence,AI)的重
要技術(shù)手段之一,它基于機器學習算法對人類語言進行語言分析、理解、生成等。作為NLP技術(shù)的杰出代表,由美國OpenAI公司開發(fā)的智能聊天機器人ChatGPT(Chat Generative Pre-trained Transformer)
自2022年11月30日正式推出以來,便憑借出色的語言理解和生成能力在全球范圍內(nèi)引起了廣泛關(guān)注和激烈討論。隨著信息時代的到來和人工智能技術(shù)的迅猛發(fā)展,國際出版行業(yè)巨頭正在人工智能的賽道上積極謀篇布局,如何推動國內(nèi)學術(shù)期刊出版的智能化轉(zhuǎn)型并在新的賽道上實現(xiàn)追趕甚至超越,成為近年來出版研究的熱點[1-2]。如今,ChatGPT取得了自然語言處理領(lǐng)域的顛覆性技術(shù)突破,作為與人類語言聯(lián)系最密切的行業(yè)之一,出版業(yè)將面臨怎樣的變革和影響,以及我國學術(shù)期刊的智能化發(fā)展策略,成為業(yè)內(nèi)人士關(guān)注的問題[3]。
文章針對NLP技術(shù)對學術(shù)期刊出版的影響展開分析,并采用SWOT分析法對我國學術(shù)期刊發(fā)展的優(yōu)劣勢以及外部環(huán)境的機會和挑戰(zhàn)進行剖析,探索我國學術(shù)期刊出版的智能化發(fā)展策略,為學術(shù)出版在新技術(shù)背景下實現(xiàn)高質(zhì)量創(chuàng)新發(fā)展提供參考。
一、NLP技術(shù)對學術(shù)期刊出版的影響
(一)優(yōu)化學術(shù)內(nèi)容生產(chǎn)的效率與質(zhì)量
NLP技術(shù)能夠識別詞匯、理解語法、解釋語義、推斷邏輯關(guān)系等,學術(shù)期刊編輯不僅可以使用NLP技術(shù)根據(jù)論文內(nèi)容生成摘要、標題和關(guān)鍵詞,對語法、語義和篇章結(jié)構(gòu)等進行多維度檢查、質(zhì)量評估和潤色加工,為內(nèi)容編校提供參考和建議,減少人工編校的工作量和錯誤,還可以根據(jù)不同的發(fā)行形式進行智能排版并協(xié)助處理各種常見的排版格式問題,大幅度提高學術(shù)內(nèi)容生產(chǎn)的效率與質(zhì)量,從而更多地關(guān)注學術(shù)內(nèi)容價值的評估工作及創(chuàng)新性的出版工作。
(二)增強學術(shù)評價的科學性和有效性
隨著學科分類的細化和專業(yè)領(lǐng)域的延伸,學術(shù)研究的專業(yè)化趨勢日漸顯著,不同研究方向之間壁壘分明。研究方向有偏差的審稿人提出的審稿意見可能會受到嚴謹性和專業(yè)性的質(zhì)疑,審稿人也可能因?qū)I(yè)偏差謝絕評審而耽誤審稿周期。對此,學術(shù)期刊編輯可以采用NLP技術(shù)自動匹配科研方向吻合的審稿人,并為審稿人提供快速、優(yōu)質(zhì)的評審參考意見,從而增強論文評審的科學性和有效性。
(三)提高期刊傳播能力和知識服務(wù)水平
學術(shù)期刊編輯可以利用NLP技術(shù)基于論文生成個性化的推送文本、宣傳海報甚至視頻,輔助新媒體內(nèi)容創(chuàng)作和期刊宣傳。同時,學術(shù)期刊編輯也可以利用NLP技術(shù)對學術(shù)論文進行高質(zhì)量的多語種智能翻譯,使非英語期刊也能達到國際傳播的效果。此外,學術(shù)期刊編輯還可以利用NLP技術(shù),根據(jù)讀者歷史閱讀記錄、閱讀需求等進行個性化分析,有針對性地為讀者提供文獻推薦、學科前沿熱點和問題解決方案等,幫助讀者高效、準確地獲取學術(shù)信息,隨時向讀者提供互動交流服務(wù),提高期刊服務(wù)水平。
二、NLP技術(shù)背景下我國學術(shù)期刊發(fā)展SWOT
分析
NLP技術(shù)深入、廣泛地嵌入學術(shù)期刊出版的各個環(huán)節(jié)已成為未來發(fā)展的重要趨勢。在此背景下,對我國學術(shù)期刊發(fā)展的內(nèi)外部競爭條件和競爭環(huán)境展開深入的態(tài)勢分析并采取前瞻性的應(yīng)對策略,是確保我國學術(shù)期刊在科技變革中實現(xiàn)創(chuàng)新發(fā)展的關(guān)鍵。
(一)優(yōu)勢
1.數(shù)據(jù)資源和基礎(chǔ)設(shè)備
數(shù)據(jù)是人工智能應(yīng)用的基礎(chǔ),學術(shù)期刊掌握數(shù)據(jù)資源才能占據(jù)人工智能技術(shù)的高地。我國具有科研大國的優(yōu)勢,豐富的科技論文資源為開展與人工智能出版相關(guān)的應(yīng)用研究提供了豐富的數(shù)據(jù)和有利條件。同時,面對超大型模型所需要的龐大算力需求,國內(nèi)已建立包括天津中心、廣州中心、長沙中心等在內(nèi)的10個國家超級計算中心以及多個人工智能計算中心,為我國人工智能自主創(chuàng)新發(fā)展提供了充分保障。
2.科研市場
2022年,我國研發(fā)人員總量超過600萬人,連續(xù)多年保持世界第一。豐富的人才資源不僅為學術(shù)期刊智能化發(fā)展提供了可靠的人才基礎(chǔ),而且意味著產(chǎn)生龐大的學術(shù)論文發(fā)表和文獻信息獲取需求,這些都為我國學術(shù)出版智能化轉(zhuǎn)型提供了巨大的市場潛力和廣闊的發(fā)展空間。
(二)劣勢
1.期刊體制問題
國內(nèi)學術(shù)期刊呈現(xiàn)“散、小、弱”以及非市場化的特點。首先,小眾、分散的期刊運營模式不利于AI數(shù)據(jù)的獲取和處理。NLP等人工智能技術(shù)的進一步發(fā)展需要大量數(shù)據(jù)進行訓練和迭代,而國內(nèi)學術(shù)期刊之間的數(shù)據(jù)、規(guī)范等彼此獨立,使人工智能對數(shù)據(jù)的獲取和處理有一定的限制和難度,不利于人工智能技術(shù)在學術(shù)期刊出版中的使用。其次,發(fā)展智能出版對算力的要求很高,而我國學術(shù)期刊出版單位市場化和集約化程度相對較低,計算資源和經(jīng)費支撐有限,進行學術(shù)研究和應(yīng)用開發(fā)的困難較大。最后,國內(nèi)部分學術(shù)期刊在運營體制、服務(wù)模式、人才隊伍建設(shè)等方面的創(chuàng)新不足,缺乏期刊改革發(fā)展的內(nèi)生動力和市場化競爭意識。這些劣勢可能會加大我國學術(shù)期刊與國際一流期刊在智能化發(fā)展中的差距。
2.人才缺失
隨著人工智能技術(shù)在學術(shù)出版領(lǐng)域的不斷深入應(yīng)用,學術(shù)期刊出版單位需要一支有學術(shù)出版經(jīng)驗且具備人工智能信息技術(shù)素養(yǎng)的人才隊伍,要求相關(guān)人員能夠理解并利用人工智能技術(shù)實施與學術(shù)出版相關(guān)的算法應(yīng)用,為學術(shù)出版流程提供技術(shù)支持。然而,國內(nèi)的人工智能技術(shù)起步相對較晚,學術(shù)期刊編輯對AI技術(shù)的了解和應(yīng)用較為缺乏。這可能導致他們無法全面了解AI技術(shù)的應(yīng)用場景和優(yōu)勢,并將其有效應(yīng)用于實際工作。
(三)機會
1.國家政策引導
2017年7月,國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》,確定人工智能發(fā)展分三步走的戰(zhàn)略目標;同年12月,工信部印發(fā)《促進新一代人工智能產(chǎn)業(yè)發(fā)展三年行動計劃(2018—2020年)》,推動人工智能技術(shù)研發(fā)和產(chǎn)業(yè)化發(fā)展;2019年8月,科技部等六部門印發(fā)《關(guān)于促進文化和科技深度融合的指導意見》,為出版行業(yè)與人工智能的高度融合提供了良好的政策保障;同月,中國科協(xié)、中宣部、教育部、科技部聯(lián)合印發(fā)《關(guān)于深化改革 培育世界一流科技期刊的意見》,明確提出我國科技期刊的發(fā)展目標是期刊綜合實力進入世界第一方陣;2022年4月,中共中央宣傳部印發(fā)了《關(guān)于推動出版深度融合發(fā)展的實施意見》,指出要立足擴大優(yōu)質(zhì)內(nèi)容供給、創(chuàng)新內(nèi)容呈現(xiàn)傳播方式、打造重點領(lǐng)域內(nèi)容精品……充分發(fā)揮技術(shù)對出版融合發(fā)展的支撐作用。一系列國家政策的出臺表明,人工智能作為基礎(chǔ)技術(shù)在文化出版等行業(yè)的開發(fā)應(yīng)用備受重視,也從宏觀層面為構(gòu)建適用于中國的智能出版模式提供了良好的政策引導和社會環(huán)境。
2.市場需求驅(qū)動
隨著我國科研人員數(shù)量的增加和研究水平的不斷提高,研究人員需要獲取更多、更全面的科研信息支持研究工作,面對海量的學術(shù)信息內(nèi)容,科研成果的產(chǎn)出也越來越倚重文獻信息資源的高效獲取、傳播與科學分析。NLP技術(shù)改變了文獻信息資源的獲取、傳播與分析方式,科研人員可以從海量的學術(shù)文獻數(shù)據(jù)中挖掘特定研究領(lǐng)域的學術(shù)信息,獲得更加精準、高效和個性化的科研信息內(nèi)容并加以分析整合。我國旺盛的科研市場需求為促進人工智能嵌入學術(shù)期刊發(fā)展提供了重要驅(qū)動。
3.行業(yè)技術(shù)推動
目前,我國互聯(lián)網(wǎng)龍頭企業(yè)已積極投入NLP技術(shù)的開發(fā)和應(yīng)用,并取得一定進展。例如:2021年哈爾濱工業(yè)大學和科大訊飛聯(lián)合研發(fā)的中文預(yù)訓練語言模型BERT-wwm(whole word masking)[4]在多個中文測試集上表現(xiàn)優(yōu)異,部分效果甚至超過了原版BERT模型,彌補了之前該研究模型在中文自然語言處理上的不足;百度公司開發(fā)的NLP項目“文心一言”(ERNIE Bot)于2023年3月面向公眾開放,該模型將大數(shù)據(jù)預(yù)訓練與多源知識相結(jié)合,通過持續(xù)學習不斷提高模型的表現(xiàn)能力;華為、騰訊和阿里公司分別提出的“盤古”“混元”和“通義千問”三大NLP模型的參數(shù)規(guī)模均達到千億甚至萬億級。國內(nèi)企業(yè)在NLP領(lǐng)域的不斷發(fā)展為AI技術(shù)在學術(shù)出版中的創(chuàng)新應(yīng)用和深入發(fā)展提供了技術(shù)基礎(chǔ)和保障。
(四)挑戰(zhàn)
1.制度標準缺失
學術(shù)期刊使用NLP技術(shù)生成的內(nèi)容可能存在不實、抄襲現(xiàn)象,由此產(chǎn)生的知識產(chǎn)權(quán)和責任風險的歸屬問題尚不明確,而在進行信息推送傳播時,可能進一步構(gòu)成對原作品人版權(quán)和傳播權(quán)的侵權(quán)行為[5],因此包括《科學》《自然》等在內(nèi)的部分學術(shù)期刊已明令禁止或限制其作者使用ChatGPT等NLP模型。目前,我國學術(shù)出版界還沒有關(guān)于作者使用NLP等人工智能技術(shù)的明確規(guī)定或標準??梢灶A(yù)見的是,未來采用人工智能進行的研究或以人機結(jié)合的方式撰寫的文本可能越來越常見,學術(shù)出版界應(yīng)積極著手研究和制訂人工智能在應(yīng)用中可能引發(fā)的各種侵權(quán)和責任問題及相應(yīng)的制度標準。此外,NLP模型需要的大量訓練數(shù)據(jù),不僅包括作者、讀者等個人隱私,還可能涉及國家政策及基金專利等敏感信息,若數(shù)據(jù)被竊取或濫用,會對數(shù)據(jù)安全造成重大威脅。
2.科技出版競爭加劇
NLP技術(shù)作為備受關(guān)注的國際前沿技術(shù),各個行業(yè)巨頭對其正在爭先籌措。例如:Springer Nature公司已利用該技術(shù)在SpringerLink平臺上為用戶提供文獻推薦和搜索體驗;Elsevier公司的Scopus數(shù)據(jù)庫使用NPL技術(shù)進行文章的自動標記和分類,幫助用戶更輕松地查找、篩選和評估學術(shù)文章。國外大型學術(shù)出版商在機器學習和自然語言處理技術(shù)方面的持續(xù)投入和開發(fā)應(yīng)用,可能進一步擴大我國在知識傳播和學術(shù)出版方面的現(xiàn)有差距,加劇出版行業(yè)的市場競爭及目前學術(shù)出版的不平等。
三、我國學術(shù)期刊智能化發(fā)展策略
為了貫徹落實建設(shè)世界一流學術(shù)期刊的規(guī)劃要求,順應(yīng)出版行業(yè)與人工智能技術(shù)深度融合的發(fā)展趨勢,根據(jù)以上SWOT分析,我國學術(shù)期刊可從以下方面高效推進智能化發(fā)展。
(一)緊抓機遇,深化體制改革和資源整合
我國現(xiàn)有的學術(shù)期刊體制模式在一定程度上與市場發(fā)展需求不相適應(yīng),且期刊數(shù)量多、資源散、市場化程度低、體制改革難度大[6]。人工智能為我國學術(shù)出版發(fā)展帶來挑戰(zhàn)的同時,也為其進行體制結(jié)構(gòu)調(diào)整、出版資源整合、運營機制創(chuàng)新提供了新的契機。學術(shù)期刊要在挑戰(zhàn)中抓機遇,在變局中開新局,將行業(yè)競爭壓力轉(zhuǎn)化為改革創(chuàng)新動力,牢牢把握好培育世界一流科技期刊、促進人工智能產(chǎn)業(yè)發(fā)展、推動出版深度融合發(fā)展等機會,充分發(fā)揮人工智能技術(shù)優(yōu)勢,創(chuàng)新編輯出版、學術(shù)評價、知識服務(wù)等模式。在人工智能新賽道上,學術(shù)期刊要加快落實轉(zhuǎn)體改制的步伐,組建具有學術(shù)品牌影響力和綜合發(fā)展實力的學術(shù)出版集團公司,依托優(yōu)質(zhì)學術(shù)資源或優(yōu)勢出版平臺,通過合作辦刊、平臺加盟、全流程托管等多種辦刊模式實現(xiàn)期刊集群化發(fā)展[7],改變各學術(shù)出版單位資源割裂和重復建設(shè)的狀態(tài),充分整合資源,實現(xiàn)互促發(fā)展。
(二)加強技術(shù)合作,建設(shè)智能化綜合出版平臺
學術(shù)期刊必須加強與人工智能技術(shù)企業(yè)的技術(shù)合作,通過引入第三方服務(wù)或其他技術(shù)服務(wù)商的服務(wù)產(chǎn)品或技術(shù)優(yōu)勢來解決自身人力和資金不足的問題,打造集組稿約稿、投稿審稿、內(nèi)容加工、編校排版、發(fā)布傳播、信息推送、知識服務(wù)于一體的綜合智能學術(shù)出版平臺,推動學術(shù)期刊智能化發(fā)展。例如:2022年,Springer Nature公司收購了Research Square公司,該公司的子公司AJE (美國期刊專家)可提供一流人工智能驅(qū)動的作者解決方案;2023年,該公司宣布收購創(chuàng)新的數(shù)字化寫作輔助工具TooWrite,為研究人員提供寫作引導和數(shù)字化解決方案。
(三)加速建立監(jiān)管體系,保障智能出版健康發(fā)展
NLP技術(shù)給學術(shù)出版賦能的同時也帶來風險與責任隱患。人工智能領(lǐng)域的標準化、制度化建設(shè)是AI嵌入學術(shù)出版亟待解決的問題。近年來,我國在加速建立AI監(jiān)管法規(guī)方面取得一定進展:2019年5月,國內(nèi)多所研究機構(gòu)和高校聯(lián)合發(fā)布了《人工智能北京共識》,提出人工智能研發(fā)、使用和治理方面的諸項社會意識導向性原則;2021年11月,《中華人民共和國個人信息保護法》正式實施,與《中華人民共和國網(wǎng)絡(luò)安全法》《中華人民共和國數(shù)據(jù)安全法》一同奠定了我國人工智能監(jiān)管法律體系的基礎(chǔ)。此外,我國還要加快出臺人工智能相關(guān)的法律法規(guī),制定人工智能在出版領(lǐng)域的標準體系和制度規(guī)范,如專門的人工智能審核和監(jiān)管機構(gòu)、可區(qū)分原創(chuàng)與人工智能技術(shù)合成品的溯源系統(tǒng),以及人工智能侵權(quán)行為責任認定等,保障我國學術(shù)期刊應(yīng)用人工智能出版的健康有序發(fā)展。
(四)精準匹配供需,提供本土化服務(wù)模式
國際學術(shù)出版集團的人工智能應(yīng)用,在我國科研市場可能存在不適應(yīng)的問題。這是因為國外NLP技術(shù)的開發(fā)主要基于他國的語言數(shù)據(jù)庫,對中文數(shù)據(jù)的訓練和表達效果較弱。我國科研工作者數(shù)量龐大、專業(yè)研究范圍廣、對中文科研服務(wù)和學術(shù)出版的需求大,因此,學術(shù)期刊的智能化發(fā)展要從國內(nèi)科研工作者需求出發(fā),精準匹配供需,構(gòu)建智能化、個性化、本土化的學術(shù)服務(wù)創(chuàng)新模式。學術(shù)期刊也要利用自然語言處理技術(shù)和數(shù)據(jù)挖掘技術(shù),對國內(nèi)學術(shù)資源內(nèi)容進行抓取、分析和重建,并做好與國外重要期刊數(shù)據(jù)庫、學術(shù)社交平臺和學術(shù)搜索引擎的對接工作,竭力滿足國內(nèi)用戶的個性化學術(shù)服務(wù)需求。
(五)加強人才隊伍建設(shè),提高智能化發(fā)展競爭力
雖然現(xiàn)在AI已基本勝任出版過程中校對、排版等創(chuàng)新性較低的工作,甚至可完成部分學術(shù)評估任務(wù),如論文完整性審查、審稿人的選擇等,但是基于已有數(shù)據(jù)的機械邏輯算法,其仍無法實現(xiàn)創(chuàng)新并對學術(shù)創(chuàng)新性進行前瞻性評估。因此,在科研學術(shù)的創(chuàng)造性發(fā)展及其評價活動中,人工智能無法完全替代人類的角色。對此,學術(shù)期刊編輯要做好知識把關(guān)人,在不斷提高專業(yè)學術(shù)素養(yǎng)和出版業(yè)務(wù)能力的同時,也要具備較高的計算機信息素養(yǎng)、全媒體傳播能力等。目前,人才尤其是復合型人才,仍是人工智能技術(shù)背景下學術(shù)期刊的核心競爭力。為此,學術(shù)期刊要重視對復合型編輯人才的引進和培養(yǎng),創(chuàng)建尊重個體價值和貢獻的工作環(huán)境,實行開放、積極的人才引進政策,以吸引高素質(zhì)的復合型編輯人才助力學術(shù)期刊的智能化發(fā)展。同時,學術(shù)期刊也要積極制訂切實可行的人才培養(yǎng)計劃,如激勵政策、暢通轉(zhuǎn)型和晉升通道等,鼓勵現(xiàn)有編輯主動提升智能化技術(shù)能力,幫助其成長為具備人工智能綜合素養(yǎng)的復合型編輯,從而提高我國學術(shù)期刊智能化發(fā)展的競爭力。
四、結(jié)語
NLP技術(shù)為學術(shù)期刊智能化發(fā)展提供了強大的技術(shù)支撐,同時引發(fā)了國際學術(shù)出版界的新一輪激烈競爭。我國學術(shù)期刊應(yīng)采取一系列策略,包括緊抓機遇,深化體制改革和資源整合;加強技術(shù)合作,建設(shè)智能化綜合出版平臺;加速建立監(jiān)管體系,保障智能出版健康發(fā)展;精準匹配供需,提供本土化服務(wù)模式;加強人才隊伍建設(shè),提高智能化發(fā)展競爭力,以推動我國學術(shù)期刊在人工智能技術(shù)變革中實現(xiàn)跨越式的新發(fā)展。
[參考文獻]
[1]向颯.人工智能對學術(shù)期刊智能化轉(zhuǎn)型與融合發(fā)展的賦能[J].出版廣角,2022(18): 81-84.
[2]范軍,陳川.人工智能在歐美學術(shù)出版領(lǐng)域的應(yīng)用及其啟示[J].河南大學學報(社會科學版),2020(01):144-149.
[3]沈錫賓,王立磊,劉紅霞.人工智能生成內(nèi)容時代學術(shù)期刊出版的機遇與挑戰(zhàn)[J].數(shù)字出版研究,2023(02):27-33.
[4]CUI Yiming, CHE Wanxiang, LIU Ting, et al. Pre-Training with Whole Word Masking for Chinese BERT[J]. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2021(29): 3504-3514.
[5]鄧婧,何婧.智能出版視域下學術(shù)期刊技術(shù)倫理風險與責任[J].中國編輯,2022(01):55-60.
[6]秦德繼.建設(shè)世界一流科技期刊的路徑研究[J].科技傳播,2019(11):1-3.
[7]張維,冷懷明,王治,等.國內(nèi)重點科技期刊群集約化管理和運營模式研究[J].出版發(fā)行研究,2022(12):52-57.
[基金項目]2023年度江蘇高校哲學社會科學研究一般項目“學術(shù)期刊智能化轉(zhuǎn)型發(fā)展策略研究” (項目編號:2023SJYB2071);揚州大學人文社會科學基金資助項目“高校綜合性科技期刊與‘雙一流’建設(shè)互促發(fā)展的意義和路徑探討”(項目編號:xjj2021-50);江蘇省期刊協(xié)會立項課題“‘雙一流’建設(shè)背景下高校科技期刊服務(wù)能力提升路徑探析”(項目編號:2022JSQKB57)。
[作者簡介]文采(1986—),女,貴州貴陽人,揚州大學學報編輯部編輯。