王鵬濤 章紫桐
[摘 要] AI技術(shù)的應(yīng)用為學術(shù)出版商在知識生產(chǎn)領(lǐng)域的探索提供了難得機遇,智能出版的核心價值在于從已出版文獻、科研實驗數(shù)據(jù)、引用數(shù)據(jù)等資源中發(fā)現(xiàn)知識間的新關(guān)聯(lián),為科學進步貢獻力量。通過文獻調(diào)查、比較分析和案例探討,指出AI技術(shù)在數(shù)據(jù)的獲取、利用、審核,學術(shù)語言的翻譯,智能化的信息關(guān)聯(lián)與知識推理,推動科學家的合作與知識分享,預測學科領(lǐng)域前沿等方面提供了前所未有的便利,推動了自然科學領(lǐng)域出版事業(yè)的智能化轉(zhuǎn)型。自然科學領(lǐng)域知識生產(chǎn)的內(nèi)在邏輯和AI的獨有特征,共同決定了在以上場景中學術(shù)出版企業(yè)的數(shù)智化轉(zhuǎn)型升級將大有可為。
[關(guān)鍵詞] 人工智能 學術(shù)出版 知識生產(chǎn) 自然科學
[中圖分類號] G230[文獻標識碼] A[文章編號] 1009-5853 (2021) 06-0012-08
[Abstract] The Application of AI provides a rare opportunity for academic publishers to explore in the field of knowledge production. The core value of intelligent publishing lies in discovering new knowledge correlation among published resources such as published literature, scientific research data, and citation data. The inherent logical characteristics of knowledge production in the natural sciences include: quantitative and empirical research methods, value neutrality and logical necessity of knowledge content, specialization and formalization of knowledge expression, collaboration and openness of production process, the progressive and non-historical nature of knowledge development. Based on the above characteristics, the development of academic publishing in this field is more reliable and less difficult.
[Key words] Artificial intelligence Academic publishing Knowledge production Natural science
伴隨著新技術(shù)的發(fā)展和應(yīng)用,知識的生產(chǎn)、存儲與傳播方式發(fā)生了顛覆性改變。傳統(tǒng)出版企業(yè)作為作者與讀者的中間機構(gòu),強調(diào)自身的篩選、過濾、聚合、優(yōu)化和傳播功能,知識生產(chǎn)的核心主體是作者(高校科研人員、職業(yè)科學家、專業(yè)作家等);如今,信息服務(wù)商、科技企業(yè)、出版機構(gòu)也紛紛活躍于知識生產(chǎn)的舞臺,尤其是學術(shù)出版商,掌握著大量的學術(shù)數(shù)據(jù),不再滿足于知識的把關(guān)人和傳播者身份[1],力求在知識生產(chǎn)、優(yōu)化、存儲和傳播等環(huán)節(jié)中發(fā)揮更為重要的參與、服務(wù)作用。
1 智能出版給知識生產(chǎn)帶來的新機遇
AI技術(shù)為學術(shù)出版商在知識生產(chǎn)領(lǐng)域的創(chuàng)新性探索提供了契機,傳統(tǒng)出版時期,書籍制度作為一種固定規(guī)范應(yīng)用到知識生產(chǎn)中,人類的知識以有形的方式被切割成有限的文本,集聚在統(tǒng)一的書本中,被賦予序言、目錄、標題、后記等形式。這種分割體現(xiàn)了人為的創(chuàng)造與建構(gòu),體現(xiàn)了作者的意志和目的,書籍形態(tài)將作為總體的知識分門別類,使知識得以集中表達,但是也有學者認為書籍制度使人類的知識被不合理地斷裂和孤立開來。
信息科學與AI技術(shù)的進步催生了人類科研事業(yè)的革命,知識生產(chǎn)形式發(fā)生了巨大轉(zhuǎn)變。一方面,圖書再次被分離成一句句話或一個個段落,重組成面向用戶需求的新文本,如知網(wǎng)的知識元搜索、亞馬遜的單章圖書售賣等都是典型例證。另一方面,知識本身又重新進入到更大的統(tǒng)一體中,圖書與圖書、期刊與期刊、學科與學科間的界限被打破,知識借力技術(shù)創(chuàng)新經(jīng)過聚合優(yōu)化重歸于完整。在知識生產(chǎn)領(lǐng)域,智能出版的關(guān)鍵作用在于突破學科間的知識界限,從而在更大的關(guān)聯(lián)網(wǎng)絡(luò)中深化已有知識并發(fā)現(xiàn)、培育新知識的“萌芽”。
2 智能出版對知識生產(chǎn)的作用機理
知識載體的沿革打破了知識之間的阻隔,創(chuàng)造了新的知識流動空間,智能出版的核心價值在于發(fā)現(xiàn)新的知識[2]??蒲袑嶒灁?shù)據(jù)、已出版文獻、引用數(shù)據(jù)三者按照時間次序貫穿于知識生產(chǎn)前期、中期和后期,數(shù)字密集型科研范式的興起將鼓勵人工智能技術(shù)全方位地介入知識生產(chǎn)的整個流程。
2.1 在已出版文獻中發(fā)現(xiàn)新知識
新知識發(fā)現(xiàn)的關(guān)鍵在于發(fā)現(xiàn)新關(guān)聯(lián),有學者認為關(guān)聯(lián)本身就是知識,數(shù)據(jù)當中隱藏著大量的知識內(nèi)容和知識關(guān)系[3],人的思維依照相似聯(lián)系律進行活動,認知過程貫穿著相似信息的搜索、匹配和基于相似的推理,知識發(fā)現(xiàn)過程同樣基于相似性原理并采用挖掘算法發(fā)現(xiàn)新關(guān)聯(lián)[4]。近年來,語義技術(shù)與機器學習的進展彌補了傳統(tǒng)知識發(fā)現(xiàn)方法的不足,提升了相似性判斷的準確性,改善了知識發(fā)現(xiàn)的效果,比如愛麗思AI(Iris.AI) [5]的分析技術(shù)將詞語與語境語義結(jié)合,UNSILO的全自動內(nèi)容加強技術(shù)能夠?qū)崿F(xiàn)跨專業(yè)的內(nèi)容推薦[6]。
從科學哲學和科學史的角度來看,科學研究活動遵循一定的程式和規(guī)范,科學家通過數(shù)據(jù)驅(qū)動歸納和理論驅(qū)動歸納兩種方式解決問題獲得知識[7]。前者指科學家先收集大量數(shù)據(jù),然后總結(jié)、發(fā)現(xiàn)規(guī)律,如施普林格·自然通過對大量論文進行跨語料自動摘要,基于相似性聚類自動生成了第一本化學類書籍[8]。后者理論驅(qū)動歸納則要求研究者具有豐富的學術(shù)想象力,預先提出假設(shè)作為研究準備。計算智能擅于多重推理,研究人員正在嘗試如何基于已有研究結(jié)果來驗證現(xiàn)有的科學假設(shè),甚至通過揭示不同文獻的研究發(fā)現(xiàn)彼此之間的聯(lián)系,提出指導實驗的新假設(shè)[9]。這兩種方式在人工智能技術(shù)的推動下都能夠為知識的創(chuàng)造、優(yōu)化提供新的路徑。
2.2 從引用數(shù)據(jù)中發(fā)現(xiàn)新知識
引文數(shù)據(jù)本身蘊含了作者對于文獻的專業(yè)判斷,展現(xiàn)了知識的進化過程,最初借鑒的文章經(jīng)過層層引用,實現(xiàn)了知識的分化、轉(zhuǎn)變和拓展,表面上知識的原型已難以辨認[10],但通過引證信息的梳理,我們能夠追溯知識的基礎(chǔ),發(fā)現(xiàn)學科的歷史和前沿以及不同學科之間成熟度的差異,等等[11]。在傳統(tǒng)科研環(huán)境中,知識間充滿阻礙,知識的發(fā)展過程難以辨認,數(shù)字時代的科研通過聚集大量文獻實現(xiàn)了對知識發(fā)展過程的深度解析。
AI的介入使引用數(shù)據(jù)的分析不再局限于分析知識的統(tǒng)計學特征,而是基于對引用文獻的內(nèi)容理解,縱深挖掘數(shù)據(jù)中含藏的科研價值。舉例來說,引文在文獻中充當?shù)慕巧话阌兴姆N:綜述式、繼承式、啟發(fā)式、批評式[12]。通過分析引文角色,可以發(fā)現(xiàn)更多的隱性知識,如多次被肯定性引用的文章通常蘊含更豐富的價值[13],啟發(fā)式引用表明知識在此實現(xiàn)了深度轉(zhuǎn)化。AI技術(shù)可通過對不同引用方式中引用習慣、引用形式等信息的分析分辨出引用角色,如否定性引用的上下文中可能出現(xiàn)批評性、轉(zhuǎn)折性詞匯,肯定性引用的上下文通常直接跟上作者本人的觀點,啟發(fā)式引用的表達相較于原文通常發(fā)生較大改變。這些分析在傳統(tǒng)出版時代必須由讀者自己根據(jù)專業(yè)知識和閱讀經(jīng)驗來完成,在智能媒體時代引文數(shù)據(jù)中潛藏的知識顯然可以借助技術(shù)的力量來外顯。
2.3 在原始科研實驗數(shù)據(jù)中發(fā)現(xiàn)新知識
知識與知識的碰撞不僅是知識間的重新關(guān)聯(lián),也是兩個知識形成過程的關(guān)聯(lián)。傳統(tǒng)出版業(yè)僅僅關(guān)注科研鏈條中最為精華的部分,科研數(shù)據(jù)作為記錄科研原始過程的非正式信息逐步丟失 [14],這一方面不利于學術(shù)監(jiān)督和知識記錄,另一方面也不利于充分挖掘科研數(shù)據(jù)的價值,造成了社會資源的浪費。
事實上,隨著數(shù)據(jù)密集型科研范式的提出,科研數(shù)據(jù)管理逐步得到各方的重視,1966 年,國際科技數(shù)據(jù)委員會(CODATA)成立,它旨在促進全球科技數(shù)據(jù)的評價、編輯和分發(fā)工作[15]。國內(nèi)外高校和基金機構(gòu)也已經(jīng)不同程度地開展了科研數(shù)據(jù)管理工作[16]。學術(shù)出版領(lǐng)域出現(xiàn)了數(shù)據(jù)期刊和數(shù)據(jù)論文,諸如《地球系統(tǒng)科學數(shù)據(jù)》(Earth System Science Date,ESSD)等國際期刊要求將數(shù)據(jù)作為論文的附錄一同公布,甚至自建了完整的存儲數(shù)據(jù)服務(wù)中心[17]。盡管如此,目前的科研數(shù)據(jù)管理仍存在不少缺憾,比如數(shù)據(jù)標準不一、質(zhì)量粗糙,真正能用于科研的資源較少,智能化的科研數(shù)據(jù)管理將逐步改善數(shù)據(jù)的質(zhì)量,提高數(shù)據(jù)的利用率。我們認為,科研數(shù)據(jù)出版過程包括數(shù)據(jù)收集、數(shù)據(jù)審核、數(shù)據(jù)保存、數(shù)據(jù)共享、數(shù)據(jù)利用五個階段,在上述流程中智能出版可以起到非常關(guān)鍵的作用,從知識服務(wù)的角度看,平臺化、服務(wù)化、社交化和工具化等趨勢是未來科研數(shù)據(jù)出版發(fā)展的重要方向。
3 智能出版在自然科學知識生產(chǎn)領(lǐng)域應(yīng)用的可行性
目前,國內(nèi)學術(shù)出版企業(yè)在智能出版領(lǐng)域已經(jīng)開展了若干探索,如科學技術(shù)文獻出版社與AI影像公司鷹瞳(Airdoc)等機構(gòu)合作探索智能化醫(yī)學知識服務(wù) [18],中國科學院植物研究所開發(fā)了物種的智能識別應(yīng)用,以服務(wù)農(nóng)業(yè)、地質(zhì)等學科發(fā)展[19]。人們已經(jīng)認識到,AI介入知識生產(chǎn)關(guān)乎人的主體地位,涉及價值理性、文化發(fā)展與科技倫理等問題,AI時代如何合理地運用技術(shù)能夠幫助我們?nèi)ニ伎既绾嗡茉煲粋€更加健康的出版業(yè)[20]。以下將立足于自然科學與人文社會科學兩大部類的共識性區(qū)分,探討AI在自然科學知識生產(chǎn)領(lǐng)域的應(yīng)用機制。
3.1 智能化的數(shù)據(jù)獲取、審核和利用
從研究方法的角度看,自然科學探索真理的根本屬性是定量研究,主要解決“是多大”,“有多少”等問題[21],科學文化的發(fā)展是化質(zhì)為量的坎陷過程,從依據(jù)審美精神而向上到落于實然而向下[22]。長期的科學訓練培養(yǎng)了自然科學家處理仔細控制的實驗數(shù)據(jù)的能力[23],定量數(shù)據(jù)的采集則主要通過實驗、觀察、測量等方式來完成 [24]。研究方法的定量化與實證化為智能化的數(shù)據(jù)獲取、審核與利用提供了天然便利,讓AI賦能自然科學知識生產(chǎn)有了廣闊的成長空間。
智能化的數(shù)據(jù)獲取和數(shù)據(jù)利用。智能化的學術(shù)環(huán)境正在重塑科學家進行定量實驗的方式,實證數(shù)據(jù)的獲取不再是一次性的、正式的,各種觀測、實驗設(shè)備都裝備了智能系統(tǒng),實現(xiàn)了數(shù)據(jù)的智能采集和管理[25]。不僅如此,數(shù)據(jù)本身成為了科研活動的研究對象,科研人員通過與數(shù)據(jù)打交道發(fā)掘潛在規(guī)律,AI為文獻中的實驗數(shù)據(jù)賦予了深度關(guān)聯(lián)的可能性,打破了實驗數(shù)據(jù)孤立存在的局面,例如在線工具源數(shù)據(jù)(SourceData),能夠為科研人員提供生物實驗數(shù)據(jù)的搜索,可供查詢實驗中生物對象間的關(guān)系,相關(guān)團隊還將結(jié)合AI與施普林格·自然(Springer Nature)的基因數(shù)據(jù)幫助腫瘤學家制定診療方案[26],幫助上述領(lǐng)域的科技工作者針砭數(shù)據(jù)離散導致的痛點。
智能化的數(shù)據(jù)審核和加工。量化精神與實驗驗證原則塑造了科學研究的典型特征,科學實驗及其產(chǎn)生的數(shù)據(jù)通常構(gòu)成一篇論文的關(guān)鍵部分,各種數(shù)據(jù)、公式、圖表占據(jù)了較大篇幅,純粹的思辨性文本數(shù)量較少。量化數(shù)據(jù)的主觀想象空間小,AI在提取和解讀數(shù)據(jù)的過程中依據(jù)規(guī)范,不易產(chǎn)生錯誤和歧義,因此,AI在科技論文的寫作、編輯、審議過程中大有作為,比如幫助作者和編輯對實驗樣本、實驗環(huán)境、實驗數(shù)據(jù)的統(tǒng)計方法和數(shù)學公式進行核查和檢驗[27];為已知的數(shù)據(jù)自動生成曲線圖,或進行可視化轉(zhuǎn)換;為數(shù)據(jù)生成描述性文本甚至解讀報告,有效減輕科研工作者的寫作壓力,提高科學信息交流的效率。
3.2 智能化的學術(shù)語言翻譯
從表達方式上看,相較于人文社會科學用語的模糊性、多義性和隱喻性等特征,自然科學的語言大多語義明晰、指稱單一,概念、定義、范疇的用語力圖擺脫日常語言和人為因素的干擾,專業(yè)性和區(qū)分度強,利于精準辨認,甚至形成了一套形式化、數(shù)學化、公理化的語言系統(tǒng),奠定了人工智能進行計算知識生產(chǎn)的基礎(chǔ)[28],知識表達的專業(yè)化與規(guī)范化推動了AI在學術(shù)語言翻譯過程中的應(yīng)用。
隨著詞典研編從傳統(tǒng)的“編者主體經(jīng)驗驅(qū)動”轉(zhuǎn)變?yōu)椤罢Z言數(shù)據(jù)驅(qū)動”,語料庫成為語言學家獲取語言學知識的可靠來源,語料詞典學的焦點也逐漸轉(zhuǎn)變?yōu)槿绾螐拇笠?guī)模數(shù)據(jù)中提取有效的語料信息[29]。自然語言理解等AI技術(shù)通過文本挖掘,一方面為語言學研究提供豐富的養(yǎng)料,另一方面在詞典等產(chǎn)品的編纂過程中,調(diào)取合適的語料以匹配詞匯、自動生成條目內(nèi)容、生產(chǎn)專業(yè)出版物。
學術(shù)出版商的語料數(shù)據(jù)資源規(guī)模并非最大,但專業(yè)性與學術(shù)性較強。對專業(yè)語詞的恰當理解離不開特定的學科語境,尤其是一些專業(yè)名詞及其英文字母縮寫,在網(wǎng)絡(luò)論壇、大眾媒體等日常生活領(lǐng)域和在學術(shù)共同體內(nèi)部表征的含義常常大相徑庭,甚至在不同的學科中語義也會相異。學術(shù)文獻的累積資源提供了眾多科學共同體的內(nèi)部語言表達范例,因此,學術(shù)出版商若能充分利用自身的學術(shù)語言資料優(yōu)勢,借助于AI編纂出符合專業(yè)科研人員需求的學術(shù)詞典,那么不僅在知識生產(chǎn)方面,詞典研編效率和專業(yè)度將能獲得極大提升;在科研輔助方面,論文的閱讀、寫作效率也將大大提高,比如中國知網(wǎng)開發(fā)的翻譯助手匯集了從中國知網(wǎng)數(shù)據(jù)庫中挖掘出的800余萬中英文詞條,依托于實時更新的數(shù)據(jù)庫,保障了學術(shù)翻譯的準確性和時效性,為科研工作者提供了學術(shù)語言翻譯方面的有力支持。
此外,專業(yè)化、形式化的語言表達有利于建構(gòu)一套系統(tǒng)的通用學科語言規(guī)范,為智能知識服務(wù)開發(fā)提供便利條件,節(jié)省轉(zhuǎn)換成本,例如人民衛(wèi)生出版社開發(fā)的系列醫(yī)學知識服務(wù)系統(tǒng),就是在醫(yī)學系統(tǒng)命名法—臨床術(shù)語的架構(gòu)以及各個國內(nèi)外術(shù)語表的基礎(chǔ)上建立起來的[30]。 這種共識性的語言規(guī)范在提高學術(shù)交流效率方面顯然更有優(yōu)勢。
3.3 智能化的信息關(guān)聯(lián)與知識推理
從內(nèi)容特征上看,高度發(fā)達的概念框架使科學依據(jù)邏輯必然性向前發(fā)展,新事物在相當大程度上是從科學知識的已有結(jié)構(gòu)中派生出來的[31]。有研究者指出[32],形式邏輯、線性理性恰恰是最容易被計算機化的,而直觀能力、主觀情感卻難以被AI模仿,價值中立性使得自然科學領(lǐng)域的AI應(yīng)用可以揚長避短,發(fā)揮相對理想的作用。
機器自動發(fā)現(xiàn)知識間的新關(guān)聯(lián)。在自然科學領(lǐng)域,知識間的關(guān)聯(lián)避免了主觀情感與倫理道德上的價值判斷,依存于較為簡明的邏輯關(guān)系(如因果關(guān)系、分類關(guān)系等),更有學者提出數(shù)據(jù)密集型科研關(guān)注相關(guān)性而非因果性[33],相關(guān)性關(guān)涉概率與統(tǒng)計,價值上保持客觀中立,比如在生物醫(yī)學領(lǐng)域,可通過相互關(guān)聯(lián)的數(shù)據(jù)系統(tǒng)發(fā)現(xiàn)阿爾茨海默病與某一具體單核苷酸多態(tài)性(Single Nucleotide ?Polymorphism,SNP)的關(guān)系[34]。在醫(yī)學知識庫的構(gòu)建中,董良廣提出[35],如果A表示一種物質(zhì)的攝入可能導致某生理改變B,而B的生理變化又引發(fā)某一器官的疾病C,D藥物是治療疾病C的非針對性藥物,這樣就可快速獲得A作用于C和D并影響B(tài)的有用信息,ABCD間的邏輯關(guān)系便于AI快速抓取關(guān)鍵信息。這種新的關(guān)聯(lián)如果靠傳統(tǒng)的知識生產(chǎn)方式(主要依賴個體經(jīng)驗和思維慣性)來完成,顯然是比較困難的。
增強科研人員的預估能力??茖W預測的正確與否是檢驗科學理論的重要標準,AI的引入解決了人類難以應(yīng)對的復雜推理和計算,從而增強了科研人員的預估能力,使科研工作者能發(fā)現(xiàn)簡單實驗無法呈現(xiàn)的深層規(guī)律和內(nèi)在機制。在化學領(lǐng)域,約翰威立國際出版公司與美國化學文摘社合作,將文摘社的化學信息與威利公司(Wiley)的化學合成軟件(Chem Planner)技術(shù)結(jié)合,加速預測合成反應(yīng)路線的發(fā)展[36]。正是沿著邏輯必然性的規(guī)律,AI技術(shù)根據(jù)已有化學公式與大量化學反應(yīng)數(shù)據(jù),自動地完成推理運算過程,預測出反應(yīng)結(jié)果,提出了具有預判價值的觀點,幫助化學家在目標分子和可獲得的起始原料之間選擇最優(yōu)合成路線,提高了新分子的開發(fā)效率,節(jié)約了實驗成本,推動化學領(lǐng)域的知識發(fā)現(xiàn)。
3.4 推動科學家的合作與知識分享
從知識生產(chǎn)過程來看,科學知識的生產(chǎn)有賴于科學共同體的互動與合作,科學思想的無障礙交流和擴散離不開科學知識的公開 [37]。在智能技術(shù)應(yīng)用普及的時代背景下,科學知識在公開的深度、廣度、即時性上達到前所未有的程度,為科學家間的分享、協(xié)作奠定堅實的基礎(chǔ)。
提升知識公開的速度與深度。有效的科學知識是通過公開的辯論、協(xié)商、審查、批判和重新表達而幸存下來的[38],知識的快速分享與發(fā)布提高了學術(shù)信息交流的活躍度,加快了科技創(chuàng)新的速度,AI技術(shù)在選題策劃、編輯校對、價值評審、精準發(fā)布等方面全方位提升了學術(shù)出版的速度,比如智能化的同行評審篩選工具能夠為待發(fā)表的稿件快速地匹配合適的審稿人[39]。不僅如此,研究要素的出版以及虛擬學術(shù)社區(qū)的建立同樣提高了學術(shù)成果的公開性和知識分享的自由度。愛思唯爾(Elsevier) [40]、施普林格(Springer)等出版商通過數(shù)據(jù)論文、負面研究結(jié)果集、數(shù)據(jù)筆記等文章類型,發(fā)表了研究過程中的數(shù)據(jù)資料、與學界主流相悖的研究成果,保障弱勢學術(shù)意見的發(fā)表權(quán)利,施普林格推出學術(shù)社交工具易分享(Sharelt)[41],幫助作者將科研論文免費版鏈接發(fā)送到社交媒體、作者網(wǎng)站和機構(gòu)倉儲等各個平臺,以最快的速度幫助研究者提升其成果的國際學術(shù)影響力。此外,知識分享行為的分析也日益智能化,例如可以利用AI辨析一篇文獻中被引用的研究要素,如實驗數(shù)據(jù)、實驗方法甚至單個假設(shè)的引用情況等。從這些行為數(shù)據(jù)的分析結(jié)果中,可以看到一些學科演化的軌跡,以及科學家互動的規(guī)律。
改善科研人員交流方式。在傳統(tǒng)的科研環(huán)境中,由于實驗過程中的原始數(shù)據(jù)和細節(jié)信息未能獲得出版機會,研究者無法看到一個結(jié)論背后的細節(jié)和完整的發(fā)展過程??蒲袛?shù)據(jù)的智能化出版使科學研究的實驗環(huán)境更加清晰地重現(xiàn),不同時間、不同地點的科研工作者們可以通過智能化科研網(wǎng)絡(luò)遠程合作,相互啟發(fā)思維、共同利用實驗數(shù)據(jù)、核查科研成果。杰貝·威爾遜(Jebel Wilson)[42]認為,人工智能技術(shù)將不斷地改善科學工作者的交流方式,鼓勵研究人員通過合作網(wǎng)絡(luò)分享觀點,科學家們將更傾向于跨地區(qū)、跨領(lǐng)域合作以實現(xiàn)更有價值的科研創(chuàng)新。
3.5 智能化預測學科領(lǐng)域前沿
從知識發(fā)展過程來看,科學發(fā)展具有毋庸置疑的進步性,科學哲學家托馬斯·庫恩(Thomas Kuhn)認為[43],科學革命本質(zhì)上是一個新范式徹底取代舊范式的過程,成功的科學發(fā)現(xiàn)并不需要熟記學科的發(fā)展歷史,科學家們只需專注于前沿問題的探究??茖W創(chuàng)新加速度前進,科技期刊編輯尤其需要具備追蹤前沿的素養(yǎng),預測學科發(fā)展的趨勢。湯森路透(Thomson Reuters)與全球研究機構(gòu)合作,通過分析核心文獻及其引用行為來捕捉學術(shù)熱點[44],愛思唯爾充分利用用戶的行為數(shù)據(jù),通過分析用戶搜索頻率較高的關(guān)鍵詞來判斷熱點學科[45]。此外,隨著機器學習與信息抽取技術(shù)在知識圖譜領(lǐng)域的應(yīng)用,前沿知識圖譜的構(gòu)建也日益智能化、可視化,參考價值日益提升。
與文獻計量和大數(shù)據(jù)分析不同,AI介入選題分析還可以以信息整理的方式進行,通過對學術(shù)動態(tài)信息的自動獲取,整合生成完整的學術(shù)前沿報告。傳統(tǒng)科技編輯通過追蹤權(quán)威學者的研究動態(tài)、權(quán)威數(shù)據(jù)庫和權(quán)威期刊的文獻出版、國家的科技政策、國家級科研項目立項通知、學術(shù)會議主題設(shè)置等信息,把握學科的前沿動態(tài)[46],但是這些信息內(nèi)容混雜、價值不一、分布離散、更新頻繁,編輯與學者想要全面地把握這些信息須耗費大量的時間精力。學術(shù)出版商可通過自動抓取新的政策、會議、項目信息,追蹤學科內(nèi)核心學者的研究行為,對新發(fā)表的核心論文進行自動摘要處理和關(guān)鍵詞分析,并將這些內(nèi)容進行全方位的整合、分析,生成研究前沿的綜合報告以提供選題參考,以指導研究者的學術(shù)寫作和出版活動。
4 結(jié) 語
遵循社會、文化、市場和技術(shù)環(huán)境的演變邏輯,出版商升級為知識服務(wù)商的趨向愈來愈清,出版業(yè)關(guān)注的幾大主題始終是:“出版能提供什么樣的知識服務(wù)、能通過什么樣的方式提供知識服務(wù)”,AI技術(shù)在科學交流中的融合應(yīng)用,無疑為知識生產(chǎn)類型的豐富和知識傳播方式的創(chuàng)新提供了更多可能[47]。AI技術(shù)在學術(shù)出版領(lǐng)域的核心價值在于協(xié)助科研人員在更短時間內(nèi)發(fā)現(xiàn)新知識。基于知識生產(chǎn)邏輯的差別,在一段時間內(nèi)AI技術(shù)更適用于自然科學領(lǐng)域知識的生產(chǎn),人文社會科學領(lǐng)域由于其倫理價值的原生性特質(zhì),而使AI技術(shù)徘徊于核心圈層之外。盡管如此,探討AI在人文社科領(lǐng)域的應(yīng)用邊界不可回避且有著不容輕忽的意義,受篇幅所限本文未能深入探討。
概而言之,目前智能化的知識發(fā)現(xiàn)成果大多出自科研院所和高校實驗室,學術(shù)出版商在知識生產(chǎn)方面的探索還處于起步階段,并且大多尚處于輔助地位。本研究對出版領(lǐng)域知識生產(chǎn)功能的探索,可以拓寬科學工作者和學術(shù)出版商的創(chuàng)新思路,對學術(shù)出版企業(yè)提高應(yīng)用智能技術(shù)實現(xiàn)創(chuàng)新等問題提供了啟示。展望未來,學術(shù)出版商如何從整體學術(shù)環(huán)境和技術(shù)應(yīng)用趨勢出發(fā),搭建智能化出版平臺幫助科研團隊和機構(gòu)更好地開展學術(shù)創(chuàng)新是后續(xù)研究的核心問題,而不同學科領(lǐng)域、不同類型的科研合作方式對智能學術(shù)出版平臺的功能價值、服務(wù)內(nèi)涵有不同要求,因此,分類探究不同類型智能學術(shù)出版平臺及其服務(wù)創(chuàng)新模式將是下一步研究的重點。
注 釋
[1]賀鈺瀅.知識生產(chǎn)與傳播[D].武漢:武漢大學,2018:1-14
[2]王曉光.人工智能與出版的未來[J].科技與出版,2017(11):4-6
[3]張曉林.重新認識知識過程和知識服務(wù)[J].圖書情報工作,2009,53(1):6-8
[4][7]楊炳儒.基于內(nèi)在機理的知識發(fā)現(xiàn)理論及其應(yīng)用[M].北京:電子工業(yè)出版社,2004:1-2,211-212
[5]互聯(lián)網(wǎng)金融. Iris.AI:讓人工智能成為你的科研助手[EB/OL]. [2020-11-04]. http://www.Shedejie.com/mingmei/98183.html
[6]任翔.學術(shù)傳播的數(shù)據(jù)化與智能化:2017年歐美學術(shù)出版產(chǎn)業(yè)發(fā)展評述[J].科技與出版,2018(2):6-12
[8]王宏澤.施普林格自然第一本由機器生成的書籍問世[EB/OL]. [2020-12-14]. http://news.gmw.cn/2019-04/03/content_32713781.htm
[9][26]Andy E.How AI technology can tame the scientific literature[J]. Nature,2018,561(7722):273-274
[10]梁永霞,劉則淵,楊中楷.引文分析學的知識流動理論探析[J].科學研究,2010,28(5):668-674
[11][12][13]蘇新寧,朱云霞.面向知識服務(wù)的引文索引數(shù)據(jù)組織研究(Ⅰ):引用數(shù)據(jù)特征及其作用分析[J].圖書與情報,2013(05):1-6
[14]鄧仲華,李志芳.基于情報學視角的科學研究第四范式需求分析[J].情報科學,2015,33(7):3-6,20
[15]劉磊.從數(shù)據(jù)科學到第四范式:大數(shù)據(jù)研究的科學淵源[J].廣告大觀(理論版),2016(2):44-52
[16]彭鑫,鄧仲華.數(shù)據(jù)密集型科研環(huán)境下的科研數(shù)據(jù)管理框架研究[J].數(shù)字圖書館論壇,2017(7):61-67
[17]梁子裕.國外科研數(shù)據(jù)出版模式研究[J].出版發(fā)行研究,2017(3):82-85
[18]胡紅亮,郭傳斌.行業(yè)生態(tài)變革中的醫(yī)學知識服務(wù)模式創(chuàng)新:以科學技術(shù)文獻出版社醫(yī)學出版轉(zhuǎn)型為例[J].出版科學,2018,26(4):47-51
[19]李敏.“花伴侶”:人工智能時代知識服務(wù)的新媒介[J].出版參考,2018(8):23-24
[20]王鵬濤.出版業(yè)智能化發(fā)展研究的學術(shù)構(gòu)想:關(guān)鍵維度與可用視角[J].新聞界,2018(11):95-100
[21]梁祝平.自然科學與社會科學方法的異同及其啟示[J].學術(shù)論壇,2000(3):12-15
[22]崔樹芝.牟宗三對西方科學源流的反思[J].孔子研究,2018(6):122-129
[23]孫小禮.自然科學方法與社會科學方法的相互借鑒和結(jié)合[J].清華大學學報(哲學社會科學版),2005(1):76-80
[24]李醒民.論科學經(jīng)驗方法[J].社會科學論壇(學術(shù)評論卷),2009(2):5-25
[25][33]黃欣榮.數(shù)據(jù)密集型科學發(fā)現(xiàn)及其哲學問題[J].自然辯證法研究,2015,31(11):48-54
[27]向颯.人工智能對學術(shù)出版流程的再造及知識服務(wù)提升[J].中國科技期刊研究,2018,29(11):1091-1096
[28][37]李醒民.知識的三大部類:自然科學、社會科學和人文學科[J].學術(shù)界,2012(8):5-33,286
[29]耿云冬,魏向清.科學研究“第四范式”轉(zhuǎn)向與詞典編纂技術(shù)特征創(chuàng)新研究[J].外語電化教學,2017(2):65-70
[30][35]董良廣.出版企業(yè)基于人工智能開展知識服務(wù)的路徑探索:以人民衛(wèi)生出版社為例[J].出版廣角,2017(14):16-19
[31]伯納德·巴伯.科學與社會秩序[M].北京:生活·讀書·新知三聯(lián)書店,1991:21-22
[32]張祥龍.人工智能與廣義心學:深度學習和本心的時間含義芻議[J].哲學動態(tài),2018(4):13-22
[34]洪娜,錢慶,范煒,等.關(guān)聯(lián)數(shù)據(jù)中關(guān)系發(fā)現(xiàn)的可視化實踐[J].現(xiàn)代圖書情報技術(shù),2013(2):11-17
[36]美國化學文摘社.約翰威立國際出版公司與美國化學文摘社宣布合作聯(lián)手為全球科研人員提供先進的預測化學信息工具[J].上海醫(yī)藥,2017,38(11):32
[38]郭榮茂.共建:科學知識生產(chǎn)過程的“社會”品格[J].自然辯證法通訊,2018,40(5):88-94
[39]劉銀娣.學術(shù)出版領(lǐng)域的人工智能應(yīng)用:現(xiàn)狀、挑戰(zhàn)與應(yīng)對[J].科技與出版,2019, 289(1):64-68
[40]方卿,王一鳴,李舒格.技術(shù)的閘門已開啟:2016年海外學術(shù)出版技術(shù)熱點分析[J].科技與出版,2017(2):15-19
[41][47]叢挺.基于知識鏈的全球?qū)W術(shù)出版服務(wù)模式創(chuàng)新研究[J].出版科學,2018,26(1):27-32
[42]杰貝·威爾遜.2018年AI如何在學術(shù)出版中落地[EB/OL].[2021-06-19].http: // www.cp.com.cn//content /2018 /03-21/1433213430.Html
[43]托馬斯·庫恩.科學革命的結(jié)構(gòu)[M].北京:北京大學出版社,2012:85-87
[44]King C,Pendlebury D. 2013研究前沿:自然科學與社會科學的前100個探索領(lǐng)域[J].科學觀察,2013(4):1-21
[45]胡英奎,游濱,王秀玲,等.科技期刊編輯跟蹤學術(shù)前沿的途徑[J].編輯學報,2010,22(4):307-308
[46]方卿,王一鳴. 論出版的知識服務(wù)屬性與出版轉(zhuǎn)型路徑[J].出版科學,2020,28(1):22-29
(收稿日期:2021-07-25)