■徐奇智 范 晴
1)中國科學技術大學科技傳播系,安徽省合肥市金寨路96號 230026 2)科學教育與傳播安徽省哲學與社會科學重點實驗室,安徽省合肥市金寨路96號 230026
近年來,經(jīng)過數(shù)字圖像技術修改的圖像成為學術不端的重災區(qū),并呈逐年上升趨勢。到2021年初,科學圖像學術不端(Academic Misconduct in Scientific Images,AMSI)已經(jīng)高居論文被撤銷原因之首[1-2],并在我國頻頻引發(fā)輿情。科技部對Elizabeth Bik和饒毅舉報多名院士和學者涉嫌AMSI的事件進行調(diào)查,給出的結論為“圖片誤用”,而非“圖片造假”,從而引發(fā)網(wǎng)絡輿情質疑。雖然該調(diào)查報告將“重復使用圖片”認定為“圖片誤用”,但國際期刊對類似行為采取了更嚴厲的處罰。同年10月,《DNA與細胞生物學》期刊將張文宏醫(yī)生為通信作者的一篇論文撤稿,理由為“重復使用圖片”,即使第一作者已經(jīng)增補了最新的實驗圖片。兩相對比,輿情再次質疑我國學術道德標準偏低,嚴重損害了我國學者的學術形象,因此對其現(xiàn)狀與趨勢進行研究已經(jīng)刻不容緩。
AMSI高發(fā)可顯見的原因在于科學圖像在科學論證中的核心地位以及數(shù)字圖像技術的出現(xiàn)。對4個世紀的科學論文的定量研究顯示,科學圖像作為證據(jù)逐漸成為科學論文的核心元素,“語言和視覺的互動……構成了20世紀末科學論證實踐的核心”[3]。隨著數(shù)字圖像技術的出現(xiàn)和廣泛應用,學術行為不端的目標瞄準論證價值巨大的科學圖像。數(shù)字圖像技術能夠提供按照主觀意愿修改的非標準過程,并且處理后的圖像由于數(shù)據(jù)復雜,識別和檢測圖像操作痕跡的難度較大,這為圖像學術不端行為提供了“便利”。更多主觀意愿介入圖像產(chǎn)生過程的可能性,使得發(fā)現(xiàn)和防止圖像學術不端行為充滿挑戰(zhàn)。
為了應對這一挑戰(zhàn),AMSI逐漸成為相關領域的研究熱點,學術界對此進行了大量研究,特別是科技期刊的防范策略[1, 4]、數(shù)字圖像操作識別技術[5-6]、科學圖像倫理準則[7-10]等。Cromey[7]討論并嘗試制定了學術共同體內(nèi)部的科學圖像倫理準則。Nature期刊報道了美國雪城大學研究員Acuna博士帶領的研究小組成功研發(fā)的一款論文圖片查重軟件[11],并將其作為防范AMSI的重要工具。學術界還出現(xiàn)了專業(yè)的“學術偵探”,最著名的學者包括Bik等,他們發(fā)表了相當數(shù)量的AMSI調(diào)查論文[12]。我國相關學者和機構也在此方面進行了研究:孫力煒等[6]主要研究了科技期刊的防范策略;任艷青等[13]從被撤銷論文的責任主體、責任客體及主要原因3個維度進行了討論,他們認為圖像、數(shù)據(jù)、同行評議等方面的學術不端行為呈現(xiàn)出新的特征;葉青[14]收集和梳理了撤稿觀察數(shù)據(jù)庫(Retraction Watch Database,RWD)中與圖片相關的撤稿記錄,并針對圖片的偽造、篡改、剽竊等問題提出了應對策略;段姚堯等[4]針對醫(yī)學論文圖片的真實性進行了討論。很多學術期刊也針對科學圖像提出了專門的學術規(guī)范,并且專文報道與科學圖像學術規(guī)范相關的重要事件。
通過對領域內(nèi)過去的相關研究進行總結,發(fā)現(xiàn)大多研究都對防范AMSI采取了“堵”的態(tài)度。但是,“堵”并非唯一的治理手段,為避免陷入“道高一尺,魔高一丈”的無盡循環(huán),“疏”同樣重要。為尋找“疏”的途徑,需要先定位AMSI行為的最重要源頭及其動機,再采取相應的有效舉措。國外研究者對中國的相關行為缺乏針對性的深入分析,未能找出中國學者圖像學術不端行為的獨特特征,對于中國AMSI行為的疏導并無太多助益。本研究嘗試使用RWD并結合中國科學院文獻情報中心期刊分區(qū)數(shù)據(jù)庫,檢索收集國際期刊因AMSI撤銷我國學者論文的信息,對期刊類型/等級、地域、單位等維度進行分析,找出中國學者在圖像學術不端行為上的特征,探討中國學者圖像造假的源動力。與被動的“堵”不同,本研究的思路是尋找源頭上的疏通路徑,通過減少不端行為的發(fā)生,堅固期刊所建立的防線。
調(diào)查數(shù)據(jù)來自RWD[15]。撤稿觀察(Retraction Watch)是一家關注學術不端并專門報道撤稿情況的博客,由學者Adam Marcus和Ivan Oransky于2010年創(chuàng)建,并于2018年將公開報道的撤稿事件搜集整理形成數(shù)據(jù)庫并在線發(fā)布。RWD每日更新,最早可追溯到1756年發(fā)表的論文(因圖像原因而撤稿的論文最早為1979年發(fā)表的論文),是目前同類數(shù)據(jù)庫中最全面、規(guī)模最大的撤稿數(shù)據(jù)庫,被眾多學術不端行為研究者使用。
本研究在RWD中以image作為撤稿原因[Reason(s) for Retraction]的檢索關鍵字進行搜索,獲得5790條有關AMSI的記錄,占全部43602條記錄的13.28%(截至2023年4月20日0時)。隨后使用爬蟲工具獲取了相關數(shù)據(jù)并存入MySQL數(shù)據(jù)庫,按照如下步驟進行篩選:
(1)剔除非研究性論文。按照分類獲得研究性論文5572篇,其他類型(包括臨床觀察、案例報告、媒體新聞等)218篇。
(2)篩選出撤稿數(shù)據(jù)。對于涉及AMSI的研究性論文共有4類處理結果(撤稿、更正、關切、其他),其中被撤稿論文共4581篇。
(3)確認論文歸屬國。因RWD論文歸屬國存在不準確的數(shù)據(jù),部分第一作者國籍和單位歸屬國均不屬于中國的論文也被歸為中國論文,因此按照第一作者國籍篩選出歸屬國為中國的論文(以下簡稱“中國論文”),共得到2530篇撤稿論文。
在數(shù)據(jù)篩選過程中發(fā)現(xiàn),中外數(shù)據(jù)存在顯著差異(χ2=204.46、P<0.001)。如果存在AMSI,對中國論文的處理結果較少更正和關切,更多的是撤稿。在全部5572篇研究論文中,中國論文的占比為 51.08%,在處理結果為“撤稿”的論文中,中國論文的占比上升至55.23%(表1)。
表1 科學圖像不端行為處理結果
在完成數(shù)據(jù)篩選后,本研究對部分字段進行了人工編碼,編碼規(guī)則詳見表2。采用SPSS 26和Excel等工具對所得編碼數(shù)據(jù)進行描述性統(tǒng)計、卡方檢驗、t檢驗等分析。
表2 人工編碼字段定義及編碼規(guī)則
根據(jù)RWD對AMSI的分類進行分析,發(fā)現(xiàn)中外作者的不端行為類別存在顯著差異(χ2=428.33、P<0.001)。如表3所示:中國作者主要涉及的圖像不端行為是圖片復制和圖片爭議,且此類行為顯著多于國外作者;國外作者在偽造圖片、圖片操縱等有意造假的行為上的比例高于中國作者。
表3 中外學者圖像導致撤稿的學術不端行為分布
對2000—2022年的研究論文撤稿數(shù)據(jù)進行分析,結果如圖1所示。按照撤稿年份計數(shù)后發(fā)現(xiàn),國外研究論文的撤稿數(shù)量從2010年開始迅速增長,而我國研究論文的撤稿數(shù)量在2019年后快速增長,目前仍處于上升趨勢。
圖1 2000—2022年因圖像學術不端行為導致撤稿的論文數(shù)量
撤稿事件有一定的滯后性,應通過論文發(fā)表日期來考察AMSI發(fā)生的趨勢。按照發(fā)表日期對2000—2022年的研究論文撤稿數(shù)據(jù)進行分析,結果如圖2所示??梢钥吹剑簢鈭D像造假行為高發(fā)于2006—2015年,在2013年后逐年降低;中國相關學術不端行為從2012年開始快速上升,2019年到達目前的最高峰;2020年之后數(shù)量下降的原因可能是撤稿周期長,導致圖像學術不端行為目前還未被充分發(fā)現(xiàn)。
圖2 2000—2022年發(fā)表的被撤稿論文數(shù)量
對平均撤稿周期進行分析,發(fā)現(xiàn)中國論文的撤稿周期(Tmean=1249.90,N=2846)顯著低于外國論文的撤稿周期(Tmean=2206.11,N=2726),且t=-26.17、P<0.001。此外,近年來撤稿周期逐漸縮短(圖3),表明學術界對于圖像學術不端行為的警覺性和關注度已經(jīng)顯著提升,采取了更加及時的措施。
圖3 當年發(fā)表的研究性論文的平均撤稿周期變化趨勢
中國作者的研究論文撤稿記錄共涉及82家國際學術出版機構,其中撤稿數(shù)量排名前10的出版機構如表4所示,世界著名的Elsevier、Wiley、Springer Nature、Taylor &Francis等學術出版機構均名列其中。值得注意的是,三大OA出版機構Frontiers、Hindawi和MDPI在最近5年也開始撤銷中國論文,數(shù)量分別為27篇、53篇和17篇。相比于三大OA出版機構的巨大發(fā)文量,這一撤稿論文占比較小,與近年來圍繞三大OA出版商論文質量和學術不端的爭議情況不吻合,需要引起注意。
表4 撤稿數(shù)量排名前10的學術出版機構
中國作者的研究性論文撤稿記錄涉及468種期刊。其中:中國科學院Top期刊113種(24.15%),接近期刊總數(shù)的1/4,Top期刊撤稿442篇(17.47%);SCIE收錄期刊351種(75.00%),撤稿2042篇(80.71%);非SCIE期刊117種(25.00%),撤稿488篇(19.29%)。按照中國科學院文獻情報中心期刊分區(qū)表計算撤稿數(shù)量,如表5所示。雖然各分區(qū)涉及期刊數(shù)量無顯著差異,但撤稿數(shù)量差異較大。其中三區(qū)刊均撤稿8.05篇,四區(qū)(6.24篇)和二區(qū)(5.78篇)緊隨其后,非SCIE期刊的刊均撤稿量(4.17篇)低于二區(qū)期刊。
表5 期刊分區(qū)撤稿情況
對各分區(qū)近年來每年的撤稿數(shù)量進行分析,結果如圖4所示。前期撤稿數(shù)量較少,各分區(qū)差異不明顯;自2020年起,一區(qū)期刊撤稿數(shù)量依舊保持著相對較低的水平,而二、三區(qū)期刊撤稿數(shù)量暴增。
圖4 各分區(qū)近年來每年的撤稿數(shù)量
根據(jù)中國科學院文獻情報中心期刊分區(qū)表升級版(2019—2022年)中的學科大類,撤稿論文主要來自醫(yī)學(1144篇,占56.02%)和生物學(476篇,23.31%)領域(圖5),這兩個領域的撤稿論文占比也遠高于非中國作者在SCIE期刊上的撤稿論文占比。醫(yī)學和生物學是我國圖像學術不端的重災區(qū)。
圖5 SCIE期刊撤稿數(shù)量在中國科學院文獻情報中心期刊分區(qū)表升級版的學科大類中的分布情況
按照省份統(tǒng)計撤稿數(shù)量后發(fā)現(xiàn),排名前10的省(區(qū)、市)為山東省(413篇,16.32%)、吉林省(195篇,7.70%)、江蘇省(185篇,7.31%)、廣東省(177篇,7.00%)、河南省(167篇,6.60%)、上海市(150篇,5.93%)、北京市(117篇,4.62%)、浙江省(108篇,4.27%)、陜西省(103篇,4.07%)、湖北省(101篇,3.99%),見圖6。其中山東省的撤稿數(shù)量最多,是第二名的兩倍有余。
圖6 各省區(qū)市的撤稿數(shù)量分布
對第一作者所屬單位進行編碼,按照單位性質歸為高校、科研院所、醫(yī)院和其他四類,分析發(fā)現(xiàn)接近3/4的撤稿論文來自醫(yī)院,總數(shù)達1883篇,而高校、科研院所和其他機構的被撤稿論文分別為503篇、131篇和13篇,如圖7所示。
各地區(qū)各類機構的撤稿數(shù)量存在顯著差異(χ2=1232.02、P<0.001),在部分區(qū)域中,來自醫(yī)院的論文占比最高。如表6所示,在撤稿數(shù)量最多的10個省(區(qū)、市)中,排名第一的山東省和排名第二的吉林省的撤稿論文絕大多數(shù)來自醫(yī)院,占比分別為89.59%和94.87%。除此之外,醫(yī)院也是河南省撤稿論文的主要來源單位,其撤稿數(shù)量占據(jù)了該省撤稿數(shù)量的89.22%。相比之下,北京市(58.97%)、江蘇省(63.78%)、浙江省(65.74%)的醫(yī)院撤稿比例較低。第一作者位于香港特別行政區(qū)、臺灣省和海外地區(qū)的撤稿數(shù)據(jù)中,醫(yī)院的撤稿數(shù)量僅分別占20.00%、21.05%和5.08%。
表6 撤稿數(shù)量排名前10的省區(qū)市各類型機構撤稿數(shù)量
我國AMSI情況較為嚴重,近年來處于高峰且未見下降跡象。對“撤稿觀察”數(shù)據(jù)庫中AMSI撤稿數(shù)據(jù)進行分析后發(fā)現(xiàn),2020—2022年撤稿數(shù)量占據(jù)了我國圖像不端撤稿總量的76.20%,僅2023年1—4月就撤稿218篇,占全球數(shù)據(jù)的72.42%。從全球AMSI撤稿數(shù)據(jù)來看,中外作者在不端行為發(fā)生時間、不端行為類型和處理結果上存在顯著差異。國際上AMSI始發(fā)于數(shù)字圖像技術出現(xiàn)并逐漸成熟的20世紀90年代,并經(jīng)過十幾年的逐漸發(fā)酵,在2010年前后達到高峰,此后逐年回落;我國研究者在2013年才開始大規(guī)模采用此類手段,并快速在兩三年內(nèi)達到高峰,目前還處于高峰期。從時間上看,撤稿數(shù)據(jù)與論文工廠的大規(guī)模出現(xiàn)時間有密切的關系。在不端行為類型上,我國主要集中表現(xiàn)為圖片復制,偽造圖片和圖片操縱等明確的主觀造假行為相對較少,這似乎是某種成系統(tǒng)的不端行為來源,與近年來我國論文工廠等學術黑色產(chǎn)業(yè)鏈的活躍相呼應。盡管造假行為的嚴重程度不如偽造圖片和圖片操縱,但我國更多被撤稿,一方面可能暗示這些論文中的圖像數(shù)據(jù)難以更正,另一方面也可能因為近年來國際期刊加重了處罰力度。
從出版機構和期刊的角度分析,我國AMSI撤稿呈現(xiàn)出學科集中、分區(qū)集中和出版商分散等特點。在學科上,醫(yī)學和生物學是重災區(qū),占據(jù)SCIE期刊撤稿總數(shù)的79.33%。一是因為在生物和醫(yī)學領域,圖像在研究中起著至關重要的作用,如顯微鏡圖像、X光片、MRI掃描圖像、細胞染色圖像等,這些圖像是研究結果的直接證據(jù)。二是圖像處理技術的復雜性不僅容易導致研究者們在圖像處理過程中出現(xiàn)錯誤,也給審稿人的檢驗和審核帶來了挑戰(zhàn)。三是我國生物和醫(yī)學領域的研究者在面對職業(yè)發(fā)展時,發(fā)表論文的壓力較大,導致其更容易追求圖像數(shù)據(jù)的“理想化”或“可復制性”。在分區(qū)上,我國圖像學術不端的論文重點集中在中國科學院文獻情報中心期刊分區(qū)表的三、四區(qū),一區(qū)或Top期刊數(shù)量反而較少,這一方面說明頂級期刊對于審稿要求更為嚴厲,造假難度較大;另一方面,頂級期刊的圖片檢測技術應用更為深入、投入的人力成本更大,有更大可能在論文出版前發(fā)現(xiàn)圖像學術不端,這也為其他期刊提供了防范策略的參考。值得注意的是,目前國內(nèi)已經(jīng)有高校、科研院所和醫(yī)院將三大OA出版商的所有期刊列入警示清單,其撤稿數(shù)量相對較低,不能說明其圖像學術不端行為較少,反而可能潛藏未發(fā)現(xiàn)的問題,需要進行進一步的研究。
對期刊第一作者歸屬單位和所在省區(qū)市進行分析發(fā)現(xiàn),醫(yī)院成為圖像學術不端行為的集中地,其撤稿論文占比接近3/4,暗示了醫(yī)生具有較強的造假動機,且部分省區(qū)市的情況異常嚴重。撤稿數(shù)量排名第一的山東省,撤稿數(shù)量占16.32%,且接近90%來自醫(yī)院。撤稿數(shù)量排名第二的吉林省,雖然撤稿數(shù)量不到山東省的一半,但醫(yī)院撤稿數(shù)量占比高達近95%。在港澳臺地區(qū)和海外中國學者的撤稿中,來自醫(yī)院的撤稿占比相對較小,暗示大陸(內(nèi)地)地區(qū)的醫(yī)院可能存在制度性問題。
近年來,我國學者在國際期刊中因圖像學術不端遭遇集體撤稿的事件頻繁發(fā)生,已經(jīng)影響我國學術界在國際上的形象,因此亟需采取應對措施。
對于學術出版界,防范AMSI較為困難,尤其在人工智能技術與數(shù)字圖像技術結合后,將面臨更大的挑戰(zhàn),因此需要制定全方位的措施。顯而易見的措施包括:與國際學術出版界接軌,建設嚴格的圖像規(guī)范;引入先進的圖像檢測技術,提高圖像篩查的精確性。這些措施在過去已經(jīng)有多項研究進行了詳細的闡述,是學術出版界對于這類不端行為的“堵”。本研究的數(shù)據(jù)顯示,我國AMSI有獨特的特點,其主要源頭在于特定群體來自政策的“造假動力”。如果這種動力持續(xù)存在,則“堵”不勝“堵”。因此,除升級期刊的防范措施外,還需要疏導這種造假動力,并建設聯(lián)合治理機制。
(1)我國AMSI較為嚴重,且對于單一期刊來說檢測困難,因此建議從國家層面出發(fā)建設統(tǒng)一的學術圖像庫。例如,基于中國知識基礎設施工程(China National Knowledge Infrastructure,CNKI)建設學術圖像庫,并在學術圖像庫的基礎上建設學術圖像檢測平臺。
(2)參考國際出版?zhèn)惱砦瘑T會(Committee on Publication Ethics,COPE)的機制,建設中國學術出版?zhèn)惱砺?lián)盟,在聯(lián)盟的基礎上建設更加廣泛的圖像學術不端防治機制:對于醫(yī)學、生物學等主要依賴圖像進行數(shù)據(jù)闡述的學科,聯(lián)盟內(nèi)建設原始圖像共享數(shù)據(jù)庫;構建聯(lián)盟內(nèi)部共享的高風險作者庫,對投稿中存在的不合理圖像以及投稿者進行標記,以便在此類作者再次投稿時進行干預。
(3)在處理涉嫌圖像學術不端的論文時,期刊應積極向作者反饋并進行核實。對于不能提供充足原始數(shù)據(jù)支持的圖像,應及時與作者進行溝通并采取拒稿(發(fā)表前)或撤稿(發(fā)表后)的措施;對于已經(jīng)發(fā)表的論文且不能得到作者答復的,應當聯(lián)系作者所屬單位;對于單位答復不清的已發(fā)表論文,期刊無法協(xié)調(diào)單位上級主管機構(例如醫(yī)院的上級主管單位、各省區(qū)市衛(wèi)健委)時,聯(lián)盟可以承擔聯(lián)系并協(xié)調(diào)上級機構的職責。
(4)我國對醫(yī)生職稱晉升的評價體系仍存在問題,臨床醫(yī)生被要求按照大學的科研評價標準進行評估,這無疑會導致醫(yī)生人力資源的錯配。各省區(qū)市衛(wèi)健委應遵循國務院改革完善人才評價機制的要求,破除唯論文、唯學歷、唯獎項、唯帽子的職稱評定標準,健全醫(yī)務人員晉升體制,如增加實踐能力、醫(yī)德水平等維度,根據(jù)各省區(qū)市的情況和崗位類型制定靈活的晉升指標和渠道,提升各指標的可行性,避免論文成為醫(yī)務人員的唯一可行性選擇。
(5)在醫(yī)院和醫(yī)科院校針對醫(yī)生和醫(yī)學生集中開展學術道德教育活動,并建立相關懲罰措施,例如撤銷申請材料中包括學術不端論文的職稱評定、榮譽稱號、項目資助等。
盡管防范技術的發(fā)展日新月異,但新的造假技術也會相應出現(xiàn)。因此,需要在源頭對我國科學圖像學術不端的現(xiàn)象進行有效遏制,加強涉及AMSI的學術倫理教育,在晉升上避免“唯論文”的導向,建設學術出版?zhèn)惱砺?lián)盟,共享AMSI數(shù)據(jù),期刊、作者單位、上級主管機構三方聯(lián)動。具體來說,可以通過改革科研評價體系,引入更多元化的評價指標,以鼓勵科研人員進行真實、可靠的科研活動,并注重制度的貫徹與反饋,確保各省區(qū)市嚴格執(zhí)行落實。如此,方有可能有效減少AMSI的發(fā)生。
本研究深入探討了中國學者在圖像處理上的學術不端行為的根源,以期在源頭上實施干預,從而降低此類行為的發(fā)生率。然而,撤稿作為這一問題的終極結果,其真實原因僅能通過現(xiàn)有的線索進行推測,這就增加了研究的復雜性。為了獲取更為準確的原因,需要采用訪談、問卷等定性研究方法進行深入探索。然而,由于學術不端行為的負面性,受訪者可能會對此類研究產(chǎn)生抵觸,從而不愿意接受研究者的調(diào)查,這無疑增加了研究的難度。此外,由于缺乏在投稿環(huán)節(jié)的AMSI數(shù)據(jù),分析問題的維度受到限制,可能會影響研究的深度和廣度。因此,需要尋找更多的數(shù)據(jù)來源和更全面的研究方法,以期更全面、更深入地理解這一問題。
雖然本次調(diào)查數(shù)據(jù)觸目驚心,但仍應當看到正在出現(xiàn)的良好跡象。近日,廣東省人力資源社會保障廳、廣東省衛(wèi)生健康委和廣東省中醫(yī)藥局聯(lián)合印發(fā)的《廣東省衛(wèi)生健康專業(yè)技術人才職稱評價改革實施方案》中已經(jīng)明確要求突出對臨床實踐能力的評價,不再把論文作為職稱申報的必要條件[17]。相關舉措陸續(xù)出臺,相信能夠有效改變圖像學術不端行為高發(fā)的現(xiàn)狀。