周小玲
隨著以算法為核心技術(shù)的智能時(shí)代的到來(lái),算法越來(lái)越多地被應(yīng)用到社會(huì)各領(lǐng)域。例如,政府利用算法來(lái)實(shí)現(xiàn)智能化疫情防控;媒體依據(jù)算法對(duì)用戶進(jìn)行個(gè)性化的新聞推送;商家利用算法來(lái)實(shí)現(xiàn)精準(zhǔn)營(yíng)銷;監(jiān)管部門采用算法對(duì)網(wǎng)絡(luò)暴力、色情等違法內(nèi)容進(jìn)行識(shí)別與檢查;等等??梢哉f(shuō),算法的普及全方位地改變了人們的生活。然而,算法是一把雙刃劍,它在給日常生活帶來(lái)巨大便利的同時(shí)也導(dǎo)致了不公平、歧視、隱私泄露等一系列問(wèn)題。例如,算法在增強(qiáng)人們的信息獲取能力,提高人們意見(jiàn)表達(dá)的機(jī)會(huì)的同時(shí),也在無(wú)形中接管了信息分發(fā)的權(quán)力;在實(shí)現(xiàn)高效管理、維護(hù)社會(huì)穩(wěn)定的同時(shí),也在無(wú)意識(shí)中增強(qiáng)了政府的公權(quán)力;在幫助企業(yè)優(yōu)化服務(wù)、精準(zhǔn)營(yíng)銷的同時(shí),也暗中賦予了企業(yè)更多的支配權(quán)與控制權(quán)??梢哉f(shuō),“世界不再以我們能夠理解的方式來(lái)表達(dá),它已經(jīng)被數(shù)據(jù)化了,任由算法闡釋,按照控制論方式重新配置”[1]。
目前學(xué)界對(duì)算法所引發(fā)的經(jīng)濟(jì)、倫理、社會(huì)治理方面的種種問(wèn)題與隱患都給予了極大關(guān)注??梢钥吹?,算法偏見(jiàn)、算法黑箱、算法失靈、算法倫理、算法治理、算法權(quán)力等概念層出不窮。然而,算法對(duì)學(xué)術(shù)期刊的影響卻鮮有研究者關(guān)注,相關(guān)研究大多聚焦于學(xué)術(shù)期刊在算法時(shí)代的傳播,即學(xué)術(shù)期刊如何構(gòu)建有效的傳播平臺(tái)來(lái)適應(yīng)算法時(shí)代的來(lái)臨[2—4],而對(duì)算法可能給學(xué)術(shù)期刊帶來(lái)的潛在問(wèn)題與現(xiàn)實(shí)困境的研究則寥寥無(wú)幾。因此,本文試圖從算法在學(xué)術(shù)期刊中的應(yīng)用出發(fā),結(jié)合學(xué)術(shù)期刊的編輯工作,探討算法作為一種權(quán)力在學(xué)術(shù)期刊中的滲透與擴(kuò)張,揭示算法權(quán)力對(duì)學(xué)術(shù)期刊的無(wú)形控制,并為學(xué)術(shù)期刊的自救提出解決之道。
目前,算法在學(xué)術(shù)期刊中的應(yīng)用主要通過(guò)以下四種方式實(shí)現(xiàn)。
用戶畫(huà)像(user profile)是一種通過(guò)描繪用戶特征來(lái)為用戶提供精準(zhǔn)服務(wù)的技術(shù),該技術(shù)往往需要綜合使用分類、聚類、推薦等各種算法[5],目前被廣泛地應(yīng)用于圖書(shū)館、電子商務(wù)、健康醫(yī)療等領(lǐng)域。近年來(lái),隨著相關(guān)研究的推進(jìn),很多學(xué)者將用戶畫(huà)像技術(shù)引入學(xué)術(shù)期刊研究,試圖通過(guò)構(gòu)建學(xué)術(shù)期刊的用戶畫(huà)像模型來(lái)更好地理解作者與讀者的需求、選擇更加合適的審稿專家、實(shí)現(xiàn)學(xué)術(shù)期刊微信公眾號(hào)的精準(zhǔn)推送等。例如,有學(xué)者通過(guò)挖掘和收集學(xué)術(shù)期刊的網(wǎng)站、投稿平臺(tái)、微信公眾號(hào)上的用戶數(shù)據(jù),并按照一定的算法對(duì)這些原始數(shù)據(jù)進(jìn)行過(guò)濾、整理、分析、計(jì)算,構(gòu)建作者畫(huà)像、讀者畫(huà)像與專家畫(huà)像,從而使學(xué)術(shù)期刊提供更加精準(zhǔn)化、多樣化、社交化和個(gè)性化的服務(wù)[6]。另有學(xué)者針對(duì)學(xué)術(shù)期刊存在的“找不到”或“找不對(duì)”合適的外審專家審稿的問(wèn)題,將用戶畫(huà)像技術(shù)應(yīng)用到審稿人的遴選之中,通過(guò)構(gòu)建審稿人畫(huà)像模型,設(shè)計(jì)出更加有效的外審專家推薦方法,以實(shí)現(xiàn)審稿人研究方向與稿件的精準(zhǔn)匹配[7]。還有學(xué)者試圖通過(guò)用戶畫(huà)像技術(shù)來(lái)提高學(xué)術(shù)期刊微信公眾號(hào)的精準(zhǔn)推送功能,從而提高期刊的傳播力與影響力[8]??傊⒃谒惴ɑA(chǔ)上的用戶畫(huà)像技術(shù)讓學(xué)術(shù)期刊可以精準(zhǔn)細(xì)致地把握作者、讀者、專家的信息,從而提升學(xué)術(shù)期刊的服務(wù)質(zhì)量與水平。
算法在學(xué)術(shù)期刊中最早、最主要的應(yīng)用是期刊評(píng)價(jià)。學(xué)術(shù)期刊的評(píng)價(jià)方式主要有兩種:定量評(píng)價(jià)和定性評(píng)價(jià)。由于定量評(píng)價(jià)有利于保證評(píng)價(jià)結(jié)果的客觀性,避免人的主觀性、認(rèn)知及情感等因素對(duì)評(píng)價(jià)結(jié)果產(chǎn)生過(guò)多影響,所以,長(zhǎng)期以來(lái)都備受推崇。近年來(lái),雖然同行評(píng)議等定性評(píng)價(jià)越來(lái)越受到重視,但以文獻(xiàn)計(jì)量為主的定量評(píng)價(jià)仍是期刊評(píng)價(jià)中不可或缺的方法。文獻(xiàn)計(jì)量主要是對(duì)引文數(shù)據(jù)進(jìn)行整理、排序、分析、統(tǒng)計(jì),這為算法提供了絕佳的用武之地??梢哉f(shuō),無(wú)論是長(zhǎng)期以來(lái)期刊評(píng)價(jià)中最倚重的傳統(tǒng)指標(biāo),如載文量、被引量、期刊影響因子(journal impact factor,英文縮寫(xiě)JIF)、h指數(shù)、g指數(shù)、A指數(shù)、r指數(shù)等[9]88,還是近來(lái)新興的“期刊聲望指標(biāo)(SCImago journal rank,英文縮寫(xiě)SJR)與特征因子(eigen-factor,英文縮寫(xiě)EF)等衍生指標(biāo)”[10],都離不開(kāi)算法的支撐。傳統(tǒng)的期刊評(píng)價(jià)所依據(jù)的算法往往比較簡(jiǎn)單,主要是對(duì)引用進(jìn)行統(tǒng)計(jì),如影響因子就是對(duì)一種期刊前兩年發(fā)表的論文在統(tǒng)計(jì)當(dāng)年被來(lái)源期刊引用的總次數(shù)除以該期刊在這兩年內(nèi)發(fā)表的論文總數(shù)進(jìn)行的計(jì)算。這種簡(jiǎn)單算法使得影響因子只注重引文的絕對(duì)數(shù)量,而忽視引文的實(shí)際質(zhì)量,且無(wú)法排除自引等情況,因而不斷被詬病。面對(duì)指責(zé),期刊評(píng)價(jià)的算法不斷更新?lián)Q代,逐步出現(xiàn)了一些新型期刊評(píng)價(jià)指標(biāo),例如,“作為新型期刊評(píng)價(jià)指標(biāo)的代表SJR和EF,兩者都采用了類PageRank算法模型來(lái)評(píng)價(jià)科技期刊的質(zhì)量與影響力”[9]88。總之,無(wú)論是傳統(tǒng)指標(biāo)還是新型指標(biāo),算法在以定量分析為主的期刊評(píng)價(jià)中始終發(fā)揮著舉足輕重的作用。不過(guò),顯而易見(jiàn)的是,過(guò)于依賴算法的期刊評(píng)價(jià)也帶來(lái)了一些弊端。
及時(shí)了解和掌握學(xué)術(shù)熱點(diǎn)和前沿,并據(jù)此來(lái)進(jìn)行選題策劃,是學(xué)術(shù)期刊編輯需要掌握的基本技能之一。然而,在信息爆炸時(shí)代,不僅信息量呈幾何級(jí)增長(zhǎng),而且信息傳播的速度和廣度也大大增加,這導(dǎo)致學(xué)術(shù)熱點(diǎn)也在加速更迭,那么,身處信息洪流和熱點(diǎn)日新月異中的學(xué)術(shù)期刊編輯如何應(yīng)對(duì)這一挑戰(zhàn)?越來(lái)越多的研究者提倡學(xué)術(shù)期刊編輯利用算法來(lái)挖掘與捕捉學(xué)術(shù)熱點(diǎn)與前沿,從而在組稿、約稿中能主動(dòng)出擊、引領(lǐng)學(xué)科發(fā)展。有學(xué)者探索運(yùn)用SciVal的文獻(xiàn)數(shù)據(jù)挖掘技術(shù)來(lái)提煉學(xué)術(shù)熱點(diǎn),以此輔助學(xué)術(shù)期刊編輯及時(shí)了解和掌握研究熱點(diǎn),從而實(shí)現(xiàn)精準(zhǔn)約稿[11]。有的學(xué)者自行開(kāi)發(fā)算法來(lái)進(jìn)行學(xué)術(shù)熱點(diǎn)發(fā)現(xiàn)與熱度評(píng)價(jià),一方面“通過(guò)詞頻統(tǒng)計(jì)和詞增長(zhǎng)速度算法對(duì)專業(yè)領(lǐng)域內(nèi)的熱點(diǎn)進(jìn)行識(shí)別”;另一方面“從內(nèi)容層面和傳播層面兩個(gè)維度設(shè)計(jì)并計(jì)算一系列指標(biāo),對(duì)識(shí)別到的熱點(diǎn)進(jìn)行熱度評(píng)價(jià)與排序”,最終實(shí)現(xiàn)由數(shù)據(jù)、算法驅(qū)動(dòng)的選題決策。[12]有的學(xué)者建議利用數(shù)據(jù)庫(kù)自帶的算法對(duì)學(xué)術(shù)熱點(diǎn)進(jìn)行預(yù)測(cè),如利用基本科學(xué)指標(biāo)數(shù)據(jù)庫(kù)(Essential Science Indicators,英文縮寫(xiě)ESI)的相關(guān)功能來(lái)統(tǒng)計(jì)分析作者/機(jī)構(gòu)/國(guó)家合作度、基金論文影響力、高被引期刊/機(jī)構(gòu)/熱點(diǎn)主題詞等信息,以獲取研究熱點(diǎn)。[13]有學(xué)者借助Doc2Vec方法,對(duì)期刊論文的相似度進(jìn)行計(jì)算,采取共詞聚類分析、關(guān)鍵詞的詞頻統(tǒng)計(jì)等算法,計(jì)算出一定時(shí)間和范圍內(nèi)的期刊熱點(diǎn)選題。[14]總之,隨著技術(shù)的進(jìn)步,學(xué)術(shù)期刊編輯關(guān)注學(xué)術(shù)熱點(diǎn)、進(jìn)行選題策劃的手段日趨豐富,不過(guò),算法在選題策劃上的應(yīng)用也有局限性與不足之處,如會(huì)導(dǎo)致信息繭房、加劇學(xué)術(shù)期刊選題同質(zhì)化等。
目前,國(guó)內(nèi)雖然有多種學(xué)術(shù)不端檢測(cè)系統(tǒng),但其論文查重的基本原理是一致的,即查重系統(tǒng)將待檢測(cè)的論文與數(shù)據(jù)庫(kù)中的文獻(xiàn)進(jìn)行比對(duì),按照一定的算法進(jìn)行識(shí)別,計(jì)算出重復(fù)率,并生成檢測(cè)報(bào)告單。由此可見(jiàn),算法是學(xué)術(shù)不端檢測(cè)系統(tǒng)的關(guān)鍵。然而,不同檢測(cè)系統(tǒng)的重復(fù)率算法大同小異。例如,中國(guó)知網(wǎng)、萬(wàn)方、大雅的查重系統(tǒng),其重復(fù)率算法是相同的,即都是“重復(fù)字?jǐn)?shù)和總字?jǐn)?shù)的比值”。需要注意的是,中國(guó)知網(wǎng)查重采用的是目前比較先進(jìn)的模糊算法,即以句子為最小單位,如果一句話中有連續(xù)13個(gè)字符重復(fù),并且重復(fù)字?jǐn)?shù)達(dá)到該段落的5%,那么就會(huì)被標(biāo)記出來(lái)[15]。而維普與PaperPass采用的重復(fù)率算法略有不同,維普使用的算法是“總相似比=復(fù)寫(xiě)率+他引率+自引率”;Paper-Pass的重復(fù)率算法是“(句子1相似度+句子2相似度+……+句子n相似度)/n”[16]??陀^來(lái)講,算法的應(yīng)用的確有助于發(fā)現(xiàn)抄襲、剽竊、一稿多投等學(xué)術(shù)不端行為,算法的確是防范學(xué)術(shù)不端、凈化學(xué)術(shù)生態(tài)的有力武器,但需要指出的是,查重系統(tǒng)算法目前仍有不足,這也令學(xué)術(shù)期刊與作者都頗感苦惱。
需要指出的是,算法在為學(xué)術(shù)期刊賦能的同時(shí),也逐步異化成了一種權(quán)力,成為支配與控制學(xué)術(shù)期刊的一種強(qiáng)制性力量。這是因?yàn)椋谝磺卸家詳?shù)據(jù)化的面貌出現(xiàn)的智能時(shí)代,誰(shuí)擁有數(shù)據(jù),誰(shuí)就有權(quán)對(duì)數(shù)據(jù)進(jìn)行分類、搜索、判定、過(guò)濾、推薦等算法的分析與處理[17]。而算法依據(jù)某些相關(guān)性作出的選擇、排序、分類或預(yù)測(cè),會(huì)在有利于某些人或物的同時(shí)不利于其他人或物。如果說(shuō)“權(quán)力是一種社會(huì)關(guān)系”,是某個(gè)主體“運(yùn)用其擁有的資源,對(duì)他人發(fā)生強(qiáng)制性的影響力、控制力,促使或強(qiáng)迫對(duì)方按權(quán)力者的意志和價(jià)值標(biāo)準(zhǔn)作為或不作為” [18]的能力,那么可以被用來(lái)強(qiáng)化自己對(duì)他人的影響力和控制力的算法,儼然已經(jīng)演化為一種算法權(quán)力。正如喻國(guó)明教授所指出的:“算法的社會(huì)本質(zhì)是一種權(quán)力,技術(shù)不僅能夠賦能與賦權(quán),而且它自身就構(gòu)成一種權(quán)力的行使和對(duì)于傳統(tǒng)權(quán)力模式的替代?!?[19]可見(jiàn),算法不僅是一種技術(shù),還是一種操縱政治、社會(huì)和經(jīng)濟(jì)的權(quán)力手段。作為一種權(quán)力的算法,如今已經(jīng)滲透到了社會(huì)的方方面面,學(xué)術(shù)期刊也概莫能外。
算法權(quán)力通常是非常隱蔽的,其在學(xué)術(shù)期刊中的運(yùn)作往往是通過(guò)對(duì)學(xué)術(shù)期刊進(jìn)行分等定級(jí)與排名,滲入選題策劃、學(xué)術(shù)不端檢測(cè)以及學(xué)術(shù)信息傳播等環(huán)節(jié)來(lái)實(shí)現(xiàn)的。
通過(guò)采集各種數(shù)據(jù)對(duì)學(xué)術(shù)期刊進(jìn)行分等定級(jí)與排名是一種重要的期刊評(píng)價(jià)方式,這種評(píng)價(jià)方式可以在學(xué)術(shù)期刊之間形成角逐與競(jìng)爭(zhēng),因而在一定程度上有助于提高學(xué)術(shù)期刊的質(zhì)量。但對(duì)評(píng)價(jià)結(jié)果的濫用與盲目追求,也使得它逐步背離了設(shè)計(jì)的初衷,因此飽受詬病。《清華大學(xué)學(xué)報(bào)》仲偉民教授曾客觀地評(píng)價(jià)了“學(xué)術(shù)評(píng)價(jià)與學(xué)術(shù)期刊的糾葛”,他指出,學(xué)術(shù)界、期刊界以及管理部門“對(duì)學(xué)術(shù)評(píng)價(jià)的批評(píng)多、肯定少,這是可以理解的,因?yàn)樽罱欢陮W(xué)術(shù)評(píng)價(jià)機(jī)構(gòu)對(duì)學(xué)術(shù)研究的負(fù)面影響的確越來(lái)越大,應(yīng)該批評(píng)。但是,另一方面,我們也要充分看到有的學(xué)術(shù)評(píng)價(jià)機(jī)構(gòu)在與學(xué)者及管理部門的交涉及交流中,客觀上對(duì)學(xué)術(shù)研究和學(xué)術(shù)期刊也起到了很重要的正向作用”[20]。目前,國(guó)內(nèi)不同的評(píng)價(jià)機(jī)構(gòu)按照不同的標(biāo)準(zhǔn),對(duì)學(xué)術(shù)期刊進(jìn)行了各種等級(jí)區(qū)分,其中比較重要的等級(jí)劃分有核心期刊與非核心期刊、CSSCI來(lái)源期刊與非CSSCI來(lái)源期刊等;比較重要的排名有影響因子排名、人大復(fù)印資料轉(zhuǎn)載指數(shù)排名、學(xué)術(shù)影響力排名、國(guó)際影響力排名等。此外,隨著微信的盛行,還出現(xiàn)了許多與之相關(guān)的新排名,如學(xué)術(shù)期刊微信公眾號(hào)熱點(diǎn)文章排名、學(xué)術(shù)期刊微信傳播力排名等。這些琳瑯滿目的分級(jí)與排名讓學(xué)術(shù)期刊冰火兩重天,評(píng)級(jí)高的、排名靠前的歡呼雀躍,反之則垂頭喪氣。
等級(jí)劃分與排名的實(shí)質(zhì)是一種算法權(quán)力機(jī)制,這是因?yàn)?,等?jí)與排名都是通過(guò)某種算法被計(jì)算出來(lái)的。雖然近年來(lái)隨著學(xué)界與期刊界中有志人士的不斷推進(jìn),各大期刊評(píng)價(jià)體系都放棄了之前單純依據(jù)量化指標(biāo)的計(jì)算,逐步提高了質(zhì)性內(nèi)容的權(quán)重,但即使如此,定量分析仍是學(xué)術(shù)期刊評(píng)價(jià)體系的主要方法。然而,這種計(jì)算出來(lái)的等級(jí)與排名被盲目認(rèn)同后,不僅某些作者會(huì)以刊物的等級(jí)與名次作為投稿的參照,某些讀者也會(huì)更愿意閱讀等級(jí)高、排名靠前的期刊。久而久之便產(chǎn)生了馬太效應(yīng):等級(jí)越高、排名越前的期刊,其稿源就越好,其訂閱量與影響力就越大。這導(dǎo)致一些期刊開(kāi)始刻意迎合等級(jí)與排名的算法來(lái)調(diào)整自己的辦刊方針。于是我們看到,為了擠進(jìn)核心期刊或提高影響因子,有的期刊會(huì)重金買稿,即給著名學(xué)者的文章提供高稿酬;有的期刊聲明自己傾向于發(fā)表長(zhǎng)文章,因?yàn)闊o(wú)論是轉(zhuǎn)載率還是影響因子的計(jì)算都是以文章被轉(zhuǎn)載或被引用的次數(shù)除以發(fā)表的文章數(shù)量總和[21],而多發(fā)篇幅長(zhǎng)的文章就會(huì)降低文章數(shù)量總和即分母,從而期刊就可以坐享其成,即什么都不用做,只改變文章的篇幅就可以有效提高轉(zhuǎn)載率或影響因子;有的期刊明確表示自己偏愛(ài)發(fā)表基金論文,因?yàn)榛鹫撐谋仁窃u(píng)價(jià)期刊等級(jí)與排名的重要指標(biāo)之一;甚至還有期刊明確要求作者投稿的論文必須引用本刊發(fā)表過(guò)的文章……真可謂八仙過(guò)海,各顯神通。如此種種都是為了提高等級(jí)與排名??梢?jiàn),學(xué)術(shù)期刊對(duì)等級(jí)與排名的認(rèn)同,讓等級(jí)與排名的算法建立了自己的霸權(quán)地位。為了迎合這些等級(jí)與排名算法的偏好,學(xué)術(shù)期刊在選稿、用稿等方面不得不刻意地投其所好,以致丟失了自己作為優(yōu)秀學(xué)術(shù)成果展示平臺(tái)的意義。奧尼爾(Cathy O' Neil)曾把算法稱為“數(shù)學(xué)殺傷性武器”,他指出“許多數(shù)學(xué)殺傷性武器都是依靠自己的內(nèi)置邏輯來(lái)定義其所處理的情況,然后再以其自己的定義證明其輸出結(jié)果的合理性的。這種模型會(huì)不斷地自我鞏固、自我發(fā)展,極具破壞力”[22]。盲目追求算法決策出的等級(jí)與排名對(duì)學(xué)術(shù)期刊造成的傷害,又一次印證了這種“數(shù)學(xué)殺傷性武器”的破壞力。
國(guó)內(nèi)的學(xué)術(shù)期刊尤其是綜合性學(xué)術(shù)期刊存在嚴(yán)重的同質(zhì)化問(wèn)題,它們不僅在形式上如封面、版式上趨同,更是在選題內(nèi)容上重復(fù),在欄目設(shè)置上相似,缺少各自的特色。對(duì)此,學(xué)界做過(guò)多方面的分析。如《天府新論》的謝蓮碧將學(xué)術(shù)期刊同質(zhì)化的原因歸結(jié)為學(xué)術(shù)資源的有限、學(xué)術(shù)熱點(diǎn)的相對(duì)集中,以及期刊之間激烈的競(jìng)爭(zhēng)[23]。《甘肅社會(huì)科學(xué)》的胡政平將學(xué)術(shù)期刊同質(zhì)化的成因總結(jié)得更為全面,不僅追溯了歷史原因如“計(jì)劃經(jīng)濟(jì)時(shí)代形成的行政化的單位制辦刊模式”“長(zhǎng)期形成的傳統(tǒng)化的內(nèi)向式辦刊模式”,還從制度設(shè)計(jì)與執(zhí)行層面作了探討,認(rèn)為失范的制度設(shè)計(jì)和長(zhǎng)期的執(zhí)行不力是同質(zhì)化的重要因素。此外,他還從期刊自身出發(fā)深刻反省,列出了期刊主帥創(chuàng)新能力匱乏、編輯隊(duì)伍素質(zhì)欠佳等弊病[24]。以上分析固然頗有見(jiàn)地,然而在算法時(shí)代,我們不得不考慮一個(gè)新現(xiàn)象,即信息繭房所帶來(lái)的選題同質(zhì)化的加劇。
以往學(xué)術(shù)期刊編輯感知與獲取學(xué)術(shù)信息的方式通常有兩種:一是閱讀同行期刊,通過(guò)閱讀來(lái)尋找高頻出現(xiàn)的學(xué)術(shù)議題;二是參加各種學(xué)術(shù)會(huì)議,通過(guò)會(huì)議來(lái)了解學(xué)界動(dòng)態(tài)與理論前沿。互聯(lián)網(wǎng)的發(fā)展讓編輯更多地依賴網(wǎng)絡(luò)來(lái)獲取信息,于是對(duì)同行期刊的閱讀從傳統(tǒng)的紙質(zhì)閱讀轉(zhuǎn)變成了現(xiàn)代的數(shù)字化閱讀,即通過(guò)中國(guó)知網(wǎng)、萬(wàn)方等電子數(shù)據(jù)庫(kù)來(lái)閱讀。新冠肺炎疫情暴發(fā)后,越來(lái)越多的學(xué)術(shù)會(huì)議也開(kāi)始借助騰訊會(huì)議、ZOOM等軟件實(shí)現(xiàn)了線上與線下的共享。然而,無(wú)論是通過(guò)中國(guó)知網(wǎng)、萬(wàn)方等數(shù)據(jù)庫(kù)檢索信息,還是參加線上線下的各種學(xué)術(shù)會(huì)議,都是編輯主動(dòng)獲取學(xué)術(shù)信息。但算法時(shí)代的降臨,改變了編輯獲取學(xué)術(shù)信息的方式,讓被動(dòng)獲取信息的比重大幅提升,即越來(lái)越多的學(xué)術(shù)信息來(lái)自微信朋友圈的分享、微博熱搜的榜單、今日頭條的推薦等。關(guān)注高校、科研機(jī)構(gòu)、學(xué)術(shù)期刊等公眾號(hào),閱覽微信朋友圈的分享,雖然有助于編輯及時(shí)把握學(xué)界最新動(dòng)態(tài),了解最新研究成果,但需要引起重視的是,過(guò)于依賴學(xué)術(shù)信息的被動(dòng)獲取會(huì)導(dǎo)致信息繭房,從而加劇選題的同質(zhì)化。
下文以微信為例做具體分析。微信極大地提升了學(xué)術(shù)信息的傳播范圍與傳播速度,但它的算法機(jī)制有可能導(dǎo)致信息繭房現(xiàn)象。編輯通過(guò)微信獲取信息的途徑主要有三種:第一種來(lái)源于微信的分享功能,即微信好友基于朋友圈、“看一看”、視頻號(hào)所發(fā)布、分享的內(nèi)容;第二種來(lái)源于微信的關(guān)注功能,是基于用戶關(guān)注的微信公眾號(hào)與視頻號(hào)所發(fā)布的信息;第三種來(lái)源于微信的推薦功能,如“看一看”中的“熱點(diǎn)廣場(chǎng)”、“搜一搜”中的“今日熱點(diǎn)”,視頻號(hào)中的“推薦”都會(huì)向用戶推薦信息。這三種信息來(lái)源都會(huì)在一定程度上造成信息繭房。首先,微信的分享與關(guān)注功能會(huì)導(dǎo)致個(gè)人信息繭房。這是因?yàn)?,添加誰(shuí)為好友與關(guān)注哪些公眾號(hào)都是用戶個(gè)人選擇的結(jié)果,這個(gè)選擇本身就已經(jīng)對(duì)繁雜的信息做了過(guò)濾,使得用戶看到的信息都是自己所偏愛(ài)的。毋庸置疑,編輯的微信好友中肯定包含大量的學(xué)者與同行,編輯所關(guān)注的公眾號(hào)中肯定不會(huì)缺少各種同行期刊等與工作相關(guān)的公眾號(hào),而對(duì)于這些好友與公眾號(hào)的選擇,本身已經(jīng)經(jīng)過(guò)編輯本人偏好的過(guò)濾。所以編輯在微信朋友圈或公眾號(hào)中獲得的學(xué)術(shù)信息,已經(jīng)是經(jīng)個(gè)人偏好篩選后的信息了。其次,微信的推薦功能會(huì)帶來(lái)群體信息繭房。微信“看一看”中的“熱點(diǎn)廣場(chǎng)”、“搜一搜”中的“今日熱點(diǎn)”,視頻號(hào)中的“推薦”的形成是經(jīng)過(guò)群體信息篩選的結(jié)果,算法對(duì)用戶關(guān)注、點(diǎn)贊、轉(zhuǎn)發(fā)、評(píng)論、搜索的數(shù)據(jù)進(jìn)行統(tǒng)計(jì),然后向用戶推送包含出現(xiàn)頻率最高的詞的信息,這就導(dǎo)致同樣的信息會(huì)被反復(fù)傳播,形成信息壁壘,新的信息很難打破重圍并突顯出來(lái)。因此,編輯通過(guò)微信推薦所獲取的學(xué)術(shù)信息并不全面客觀,而是算法過(guò)濾后的“擬態(tài)環(huán)境”[25],很可能是大量重復(fù)且單一的信息。由此可見(jiàn),編輯在微信中只能獲取到自己偏愛(ài)和大眾偏愛(ài)的信息。學(xué)術(shù)期刊編輯如果過(guò)于依賴微信這一信息渠道來(lái)獲取學(xué)術(shù)信息,并據(jù)此提煉選題,就會(huì)受困于信息繭房而加劇選題同質(zhì)化。
目前學(xué)術(shù)期刊基本上都采用了學(xué)術(shù)不端檢測(cè)系統(tǒng)來(lái)防范抄襲、剽竊、一稿多投等違背學(xué)術(shù)誠(chéng)信與學(xué)術(shù)準(zhǔn)則的行為。自2008年3月國(guó)內(nèi)第一個(gè)學(xué)術(shù)不端檢測(cè)系統(tǒng)PaperPass問(wèn)世以來(lái),目前我國(guó)已經(jīng)有十余種學(xué)術(shù)不端檢測(cè)系統(tǒng),主要包括中國(guó)知網(wǎng)的“學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)”、武漢大學(xué)的“ROST論文反剽竊系統(tǒng)”、維普論文檢測(cè)系統(tǒng)、Gocheck論文引用檢測(cè)系統(tǒng)、萬(wàn)方數(shù)據(jù)文獻(xiàn)相似性檢測(cè)服務(wù)、大雅相似度分析系統(tǒng)等。
十多年來(lái)的實(shí)踐經(jīng)驗(yàn)證明,學(xué)術(shù)不端檢測(cè)系統(tǒng)對(duì)于發(fā)現(xiàn)學(xué)術(shù)不端行為是有效的,但不能否認(rèn)的是,目前的學(xué)術(shù)不端檢測(cè)系統(tǒng)雖然經(jīng)過(guò)不斷升級(jí)仍有許多不盡如人意之處。這些不足主要是由其算法上的漏洞導(dǎo)致的。一方面,算法的數(shù)據(jù)來(lái)源存在盲區(qū),使系統(tǒng)無(wú)法甄別抄襲與合理引用,于是許多必要自引、合理他引,如對(duì)權(quán)威著作、歷史資料、法律法規(guī)、專業(yè)名詞、經(jīng)典詩(shī)詞、名言警句等的引用都一概被判定為抄襲,甚至論文的統(tǒng)一格式如前言、資料與方法、結(jié)論等內(nèi)容也被判定為抄襲[26]。另一方面,算法不夠智能,這導(dǎo)致同義詞的替換、表達(dá)方式的變更、字序的調(diào)整等簡(jiǎn)單操作就會(huì)極大地影響檢測(cè)結(jié)果。目前國(guó)內(nèi)的學(xué)術(shù)不端檢測(cè)系統(tǒng)大多采用數(shù)字指紋技術(shù)或詞頻統(tǒng)計(jì)技術(shù),其原理在本質(zhì)上只是對(duì)字符串進(jìn)行統(tǒng)計(jì)與標(biāo)記,而無(wú)法從語(yǔ)義信息和語(yǔ)用信息層面理解論文的含義,因而多數(shù)只能識(shí)別文本復(fù)制類型的簡(jiǎn)單抄襲[27],對(duì)思想觀點(diǎn)、研究方法上的剽竊完全束手無(wú)策。此外,檢測(cè)系統(tǒng)不能識(shí)別圖表與公式,且有些系統(tǒng)只能查中文文獻(xiàn)而對(duì)外文文獻(xiàn)無(wú)能為力[28]。
為了彌補(bǔ)檢測(cè)系統(tǒng)的局限,期刊界提倡系統(tǒng)檢測(cè)與人工審查相結(jié)合來(lái)判斷引用的必要性與合理性,試圖用人工來(lái)矯正算法的失靈。但是,如今很多高校、編輯部、管理機(jī)構(gòu)都把低重復(fù)率作為一個(gè)硬性指標(biāo),例如,有些高校規(guī)定畢業(yè)生論文提交評(píng)審前必須通過(guò)學(xué)術(shù)不端檢測(cè)系統(tǒng)的查重;多數(shù)編輯部把學(xué)術(shù)不端檢測(cè)作為審稿的第一步;某些管理機(jī)構(gòu)也將學(xué)術(shù)不端檢測(cè)作為必備的輔助工具,用于課題審核與職稱評(píng)定等。檢測(cè)系統(tǒng)的算法決定了一篇文章重復(fù)率的高低,這導(dǎo)致同一篇文章在不同的檢測(cè)系統(tǒng)中很可能具有不同的重復(fù)率[29]。這就讓檢測(cè)系統(tǒng)的算法擁有了影響甚至決定學(xué)生畢業(yè)論文是否合格、編輯部審稿是否通過(guò)、課題與職稱評(píng)定是否成功的強(qiáng)制性力量。而如何對(duì)算法的權(quán)力進(jìn)行有效制衡、防止其異化,是一個(gè)亟待解決的問(wèn)題。
算法歧視通常被理解為日常生活中基于數(shù)據(jù)的廣告所含有的種族歧視、性別歧視,以及“大數(shù)據(jù)殺熟”背后的價(jià)格歧視等。不過(guò),僅僅將算法歧視“定義為由于算法程序的片面性呈現(xiàn)在種族、性別、職業(yè)身份等之上的消極態(tài)度,未免稍顯狹隘”[30]48,理應(yīng)將其擴(kuò)展為“算法程序在信息生產(chǎn)和分發(fā)過(guò)程失去客觀中立的立場(chǎng),影響公眾對(duì)信息的客觀全面認(rèn)知” [30]48 。正是在這個(gè)意義上,本文認(rèn)為,如今的學(xué)術(shù)期刊在傳播機(jī)會(huì)上遭遇了嚴(yán)重的算法歧視。這種歧視主要表現(xiàn)為兩大類:一是搜索引擎的競(jìng)價(jià)排名算法所帶來(lái)的經(jīng)濟(jì)歧視,二是搜索引擎內(nèi)置的認(rèn)證歧視。
首先分析競(jìng)價(jià)排名算法的經(jīng)濟(jì)歧視。算法在表面上僅僅是一種技術(shù),但其背后卻往往潛藏著強(qiáng)大的資本力量。競(jìng)價(jià)排名算法就是這樣一種資本與技術(shù)的共謀,使學(xué)術(shù)期刊深受其害。眾所周知,在百度上隨便搜索任一學(xué)術(shù)期刊的刊名,就會(huì)出現(xiàn)一堆虛假期刊網(wǎng)站,而學(xué)術(shù)期刊真正的官方網(wǎng)站則可能淹沒(méi)在茫茫的高仿網(wǎng)站之中。雖然經(jīng)過(guò)2016年的專項(xiàng)治理,搜索引擎取消了對(duì)一些釣魚(yú)網(wǎng)站的推廣,亂象得到了一定程度的遏制,但即使如此,如今在網(wǎng)上搜索期刊刊名,查詢結(jié)果中仍有不少虛假網(wǎng)站位居前列。為學(xué)術(shù)黑市助紂為虐的正是競(jìng)價(jià)排名算法,這一算法使付費(fèi)越多的網(wǎng)站在搜索結(jié)果中排名越靠前,因而假冒網(wǎng)站可以通過(guò)付費(fèi)購(gòu)買競(jìng)價(jià)排名服務(wù)讓自己比真實(shí)網(wǎng)站更容易被搜到。而與虛假期刊網(wǎng)站積極購(gòu)買競(jìng)價(jià)排名服務(wù)不同,絕大多數(shù)學(xué)術(shù)期刊為非營(yíng)利機(jī)構(gòu),以傳播優(yōu)秀學(xué)術(shù)成果為己任,基本不會(huì)主動(dòng)參與競(jìng)價(jià)排名,因此,其真實(shí)網(wǎng)站通常都在搜索頁(yè)面中排位靠后,難以被公眾看到[31]。由此可見(jiàn),競(jìng)價(jià)排名算法在利益的驅(qū)動(dòng)下,已經(jīng)在信息傳播的過(guò)程中失去了客觀中立的立場(chǎng),它們赫然實(shí)行經(jīng)濟(jì)歧視,使得虛假的仿冒期刊網(wǎng)站也能“買”到搜索結(jié)果的前排位置,嚴(yán)重妨礙了公眾對(duì)學(xué)術(shù)信息的客觀全面的認(rèn)知,致使真正的學(xué)術(shù)期刊網(wǎng)站在海量信息里遭到屏蔽,無(wú)法獲得公平的傳播機(jī)會(huì)??梢哉f(shuō),競(jìng)價(jià)排名算法造成了假冒期刊網(wǎng)站與學(xué)術(shù)期刊官網(wǎng)之間的一場(chǎng)不公平競(jìng)爭(zhēng),讓學(xué)術(shù)期刊受到了來(lái)自算法的經(jīng)濟(jì)歧視。
其次分析搜索引擎的認(rèn)證歧視。為了打擊山寨網(wǎng)站,搜索引擎推行認(rèn)證制度,為一些知名期刊網(wǎng)站授予“官網(wǎng)”標(biāo)識(shí)。例如,加入百度認(rèn)證后就會(huì)有藍(lán)色背景的“官網(wǎng)”字樣,加入360認(rèn)證后就會(huì)有綠色的“官網(wǎng)”字樣。事實(shí)證明,認(rèn)證機(jī)制確實(shí)有效。據(jù)統(tǒng)計(jì),實(shí)行官網(wǎng)認(rèn)證后,學(xué)術(shù)期刊網(wǎng)站在國(guó)內(nèi)三大主流搜索引擎(百度、360搜索及搜狗)中的排位情況為:“前3頁(yè)出現(xiàn)正確官網(wǎng)的比例最高為百度搜索,其次為360搜索和搜狗搜索,后二者間差別不大。雖然前3頁(yè)大多有正確官網(wǎng)顯示,但正確官網(wǎng)出現(xiàn)在首頁(yè)首位的比例均偏低,都未超過(guò)50%,360搜索甚至低于10%?!盵32]然而,并非所有的學(xué)術(shù)期刊都進(jìn)行了認(rèn)證,只有繳納一定費(fèi)用才能通過(guò)認(rèn)證。這樣認(rèn)證機(jī)制就帶來(lái)了新歧視,即有認(rèn)證的官網(wǎng)對(duì)沒(méi)有認(rèn)證的官網(wǎng)的歧視。認(rèn)證與否本來(lái)不影響搜索結(jié)果的排名,因?yàn)檎J(rèn)證的主要作用是驗(yàn)證網(wǎng)站的真實(shí)性和有效性,但事實(shí)上,搜索引擎的算法傾向于優(yōu)先展示自己平臺(tái)認(rèn)證的網(wǎng)頁(yè),而那些沒(méi)有進(jìn)行認(rèn)證的學(xué)術(shù)期刊官網(wǎng)即使是真實(shí)的,也會(huì)被算法降序甚至忽略。其實(shí),這種優(yōu)先展示自己平臺(tái)內(nèi)容的算法早已經(jīng)是互聯(lián)網(wǎng)行業(yè)的公開(kāi)秘密。比如Facebook 會(huì)在用戶信息流中優(yōu)先呈現(xiàn)自己平臺(tái)上的視頻而非 YouTube 上的視頻[33];今日頭條會(huì)向用戶優(yōu)先推薦自己平臺(tái)(頭條號(hào))中的資訊[34]。因此搜索引擎優(yōu)先顯示自己認(rèn)證的網(wǎng)站也只不過(guò)是如法炮制而已。
算法既給學(xué)術(shù)期刊帶來(lái)了機(jī)遇,也帶來(lái)了風(fēng)險(xiǎn)。它對(duì)學(xué)術(shù)期刊的未來(lái)發(fā)展的影響是多方面的。本文指出算法權(quán)力對(duì)學(xué)術(shù)期刊的規(guī)訓(xùn),并不意味著要抵制算法在學(xué)術(shù)期刊中的應(yīng)用,只是希望引起學(xué)界的重視,讓算法權(quán)力能得到應(yīng)有的制衡與約束,從而維護(hù)學(xué)術(shù)期刊的正當(dāng)權(quán)益。當(dāng)然,“批判的武器不能代替武器的批判”,要想真正從算法困境中解脫出來(lái),除了技術(shù)開(kāi)發(fā)、法律監(jiān)管等方面的完善之外,學(xué)術(shù)期刊也需要開(kāi)展自救,那么學(xué)術(shù)期刊能為自己做些什么呢?
面對(duì)算法時(shí)代的到來(lái),學(xué)術(shù)期刊應(yīng)端正自己的辦刊理念,不忘自己的初心與使命,即“學(xué)術(shù)期刊只是一個(gè)學(xué)術(shù)研究成果的展示和交流平臺(tái)……展示哲學(xué)社會(huì)科學(xué)研究領(lǐng)域的高水平研究成果,支持哲學(xué)社會(huì)科學(xué)領(lǐng)域優(yōu)秀學(xué)術(shù)人才成長(zhǎng),促進(jìn)中外哲學(xué)社會(huì)科學(xué)研究的學(xué)術(shù)交流”是它“最基本的工作內(nèi)容”[35]。因此,在期刊評(píng)價(jià)上,不應(yīng)過(guò)度追求各種排名與等級(jí)劃分,而應(yīng)倡導(dǎo)多元評(píng)價(jià),從而發(fā)揮期刊對(duì)評(píng)價(jià)體系的引導(dǎo)作用,以利于期刊評(píng)價(jià)體系的優(yōu)化與完善;在選題策劃上,不要盲目追隨熱點(diǎn)問(wèn)題,而應(yīng)根據(jù)期刊特色來(lái)組織選題;在審稿上,不要單純依賴學(xué)術(shù)不端檢測(cè)系統(tǒng)的檢測(cè)報(bào)告,還要對(duì)檢測(cè)報(bào)告的數(shù)據(jù)結(jié)果進(jìn)行具體分析;在期刊傳播上,要重視官網(wǎng)建設(shè)以及搜索引擎的官方認(rèn)證,做好自己力所能及的事情,維護(hù)自己的法定權(quán)利。
算法時(shí)代的快速來(lái)臨,直接將新聞媒體的“把關(guān)人”從編輯轉(zhuǎn)變?yōu)樗惴ǎ霈F(xiàn)了“算法把關(guān)”的新現(xiàn)象,編輯的主體性遭到了消解。盡管與新聞媒體相比,在學(xué)術(shù)期刊界,算法并沒(méi)有完全取代編輯,但它也滲透進(jìn)了學(xué)術(shù)期刊的選題策劃、審稿、傳播等環(huán)節(jié)之中,影響著編輯的選擇與判斷,在一定程度上削弱了學(xué)術(shù)期刊編輯的主體性。要矯正、彌補(bǔ)算法的弊端,就需要在算法時(shí)代重新確認(rèn)與強(qiáng)調(diào)編輯的主體性,用人的主體性來(lái)彌補(bǔ)物的不足,即在編輯工作中不要過(guò)多依賴算法,不要迷信數(shù)據(jù),不要完全將選題與審稿的權(quán)力讓渡給算法,而應(yīng)在充分利用算法于數(shù)據(jù)分析方面的優(yōu)勢(shì)的同時(shí),結(jié)合編輯的經(jīng)驗(yàn)來(lái)選稿、用稿、審稿。2021年6月,中宣部、教育部、科技部等三部委聯(lián)合印發(fā)《關(guān)于推動(dòng)學(xué)術(shù)期刊繁榮發(fā)展的意見(jiàn)》(簡(jiǎn)稱《意見(jiàn)》),為學(xué)術(shù)期刊的繁榮發(fā)展指明了方向。《意見(jiàn)》明確提出,應(yīng)“提升編輯策劃與把關(guān)能力”“切實(shí)把好政治導(dǎo)向關(guān)、學(xué)術(shù)質(zhì)量關(guān)和價(jià)值取向關(guān)”。可見(jiàn),算法時(shí)代下學(xué)術(shù)期刊編輯不僅不應(yīng)該讓算法取代自己進(jìn)行把關(guān),從而弱化自己的把關(guān)人形象,相反,應(yīng)該進(jìn)一步強(qiáng)化自己的主體性,做算法的把關(guān)人。