郭衛(wèi)兵,葉繼元
近年來學(xué)術(shù)規(guī)范一直受到學(xué)界、教育界和管理界的重視,國家也已出臺了一些治理學(xué)術(shù)失范和不端的相關(guān)文件,但回望現(xiàn)實,學(xué)術(shù)不正之風(fēng)尚未得到根本的扭轉(zhuǎn),有關(guān)我國學(xué)術(shù)不端現(xiàn)象的新聞報道屢見不鮮,學(xué)術(shù)論文抄襲事件更是層出不窮。為此,行政管理機(jī)構(gòu)、高等教育機(jī)構(gòu)及科研機(jī)構(gòu)等部門相繼出臺了各種防治學(xué)術(shù)不端的文件,學(xué)術(shù)界也發(fā)起了抵制學(xué)術(shù)不端的倡議,商業(yè)機(jī)構(gòu)也研發(fā)了遏制學(xué)術(shù)不端行為的軟件。這些防治措施雖在一定程度上扼制了學(xué)術(shù)不端行為的蔓延,但尚未達(dá)到“治本”的目的,且一些學(xué)術(shù)失范、不端檢測軟件(以下簡稱“不端檢測軟件”或“檢測軟件”)本身也存在不少設(shè)計上的問題。為了更好地達(dá)到治理效果,改進(jìn)和完善檢測軟件功能,本文采用文獻(xiàn)調(diào)查法、比較研究法,歸納和分析國內(nèi)主要檢測軟件的功能、算法、使用范圍和存在的問題,從學(xué)術(shù)研究規(guī)范的角度,將學(xué)術(shù)研究規(guī)范,尤其是論文形式規(guī)范貫穿到檢測軟件中,為學(xué)術(shù)不端檢測及防范提供新思路。
20世紀(jì)40年代后期,美國學(xué)術(shù)界開始出現(xiàn)文字抄襲、編造實驗數(shù)據(jù)、篡改實驗結(jié)果等學(xué)術(shù)不端現(xiàn)象,當(dāng)時并未引起足夠重視,直到1987年匹茲堡大學(xué)助理教授布魯寧的學(xué)術(shù)造假事件發(fā)生,學(xué)術(shù)不端行為才逐漸被學(xué)界關(guān)注和研究。1992年,美國公共衛(wèi)生局對學(xué)術(shù)不端行為正式定義為“在進(jìn)行或報告研究時發(fā)生的捏造、篡改、剽竊行為,或嚴(yán)重背離科學(xué)共同體公認(rèn)規(guī)則的其他行為”[1]。我國對學(xué)術(shù)不端行為的關(guān)注也差不多在同一時間,1996年專注于揭發(fā)我國學(xué)術(shù)不端行為的“新語絲”網(wǎng)站創(chuàng)辦,之后我國學(xué)術(shù)界開始出現(xiàn)對學(xué)術(shù)不端現(xiàn)象的相關(guān)解釋性研究[2]。曹樹基認(rèn)為“學(xué)術(shù)不端主要指學(xué)者涉及抄襲、剽竊等不良行為,也指學(xué)者惡意的一稿多投行為”[3],此是“學(xué)術(shù)不端行為”概念初步形成。2016年中華人民共和國教育部發(fā)布《高等學(xué)校預(yù)防與處理學(xué)術(shù)不端行為辦法》,明確了學(xué)術(shù)不端行為的定義、具體行為表現(xiàn)及處理方式,指出學(xué)術(shù)不端行為是高等學(xué)校及其教學(xué)科研人員、管理人員和學(xué)生在科學(xué)研究及相關(guān)活動中發(fā)生的違反公認(rèn)的學(xué)術(shù)準(zhǔn)則、違背學(xué)術(shù)誠信的行為。這是我國第一份針對高校學(xué)術(shù)不端行為的規(guī)章性文件,標(biāo)志著教育部對依法治理學(xué)術(shù)不端行為重視程度的提升,也引發(fā)了公眾和學(xué)界對當(dāng)前我國高校學(xué)術(shù)不端行為的激烈討論。
以信息技術(shù)為支撐的學(xué)術(shù)不端檢測軟件,在一定程度上有助于發(fā)現(xiàn)抄襲、拼湊論文等學(xué)術(shù)不端行為,從而起到威懾作用。國外學(xué)術(shù)不端檢測軟件起步較早,又由于語言文字等方面的差異,其反抄襲技術(shù)較國內(nèi)成熟。成立較早的Turnitin軟件是全球最權(quán)威的英文檢測系統(tǒng)[4],1998年作為同行評議的申請由四位大學(xué)生創(chuàng)立,2000年開始開展防抄襲服務(wù),現(xiàn)支持英文、中文、阿拉伯文等30多種語言的檢測,被90多個國家7000多所高校采用[5]。我國學(xué)術(shù)不端檢測軟件最早于2008年研制成功并投入使用,包括武漢大學(xué)信息管理學(xué)院的“ROST論文反剽竊系統(tǒng)”、同方知網(wǎng)的“學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)”和北京智齒數(shù)匯科技有限公司的PaperPass檢測系統(tǒng),緊接著其他幾大數(shù)據(jù)庫商和信息服務(wù)機(jī)構(gòu)都相繼推出了學(xué)術(shù)不端檢測軟件,國內(nèi)的學(xué)術(shù)不端檢測技術(shù)研究進(jìn)入繁榮時期,詳見表1。
國內(nèi)相關(guān)學(xué)術(shù)不端檢測軟件的研究是從2008年同方知網(wǎng)的“學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)”上線運(yùn)行后開始的。本文以CNKI中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫、中國重要會議論文全文數(shù)據(jù)庫為統(tǒng)計源,以CNKI的高級檢索為檢索途徑,檢索1998-2017年時段內(nèi)主題包含“學(xué)術(shù)不端檢測系統(tǒng)”“相似度檢測軟件”“相似度分析軟件”“論文檢測”等關(guān)鍵詞的文獻(xiàn),去除非學(xué)術(shù)文獻(xiàn)和不相關(guān)文獻(xiàn),最終得到204篇文獻(xiàn)。對204篇文獻(xiàn)的年度分布、來源分布和作者所屬機(jī)構(gòu)進(jìn)行定量統(tǒng)計分析,結(jié)果見圖1、圖2和表2。
圖1 2009-2017年文獻(xiàn)數(shù)量年度分布
圖2 文獻(xiàn)來源分布
表2 文獻(xiàn)作者所屬機(jī)構(gòu)分布
在Turnitin誕生至“CNKI學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)”誕生的10年間,我國并無學(xué)術(shù)不端文獻(xiàn)檢測軟件的相關(guān)研究,自“學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)”誕生起,有關(guān)學(xué)術(shù)不端文獻(xiàn)檢測軟件的研究逐漸興起,總體呈上升趨勢,但文獻(xiàn)數(shù)量不多,2011-2014年是該領(lǐng)域的研究高峰期,2014年之后研究文獻(xiàn)數(shù)量略有下降,但趨于平穩(wěn)。有關(guān)學(xué)術(shù)不端文獻(xiàn)檢測軟件的研究文獻(xiàn)在《編輯學(xué)報》發(fā)表的數(shù)量最多,其次是《中國科技期刊研究》,這兩種期刊均為CSSCI來源期刊;發(fā)表相關(guān)文獻(xiàn)4篇以上的共6種期刊,合計發(fā)表文獻(xiàn)27篇(占13%)。從發(fā)表論文的期刊層次上看,學(xué)術(shù)不端檢測軟件相關(guān)研究文獻(xiàn)具有一定的質(zhì)量。在文獻(xiàn)作者所屬機(jī)構(gòu)方面,共有107篇文獻(xiàn)的作者來自學(xué)術(shù)期刊編輯部,其中發(fā)表文獻(xiàn)數(shù)量最多的為《陰山學(xué)刊》編輯部,可見學(xué)術(shù)期刊編輯對學(xué)術(shù)不端檢測軟件的關(guān)注度比其他任何一個職業(yè)都高。
在研究內(nèi)容方面,較集中在檢測軟件使用評價、檢測平臺比較分析、軟件局限性分析、缺陷防范措施等方面,例如王宇[6]認(rèn)為檢測軟件在數(shù)據(jù)來源方面存在檢測盲區(qū),在檢索結(jié)果方面存在檢測效果不理想、無法甄別合理引用的問題。肖駿等[7]測試了文獻(xiàn)內(nèi)容篡改和字序變更對檢測軟件檢測結(jié)果的影響,發(fā)現(xiàn)字序更改和是否“觸媒”都能極大地影響學(xué)術(shù)不端檢測軟件的檢測結(jié)果。徐仲[8]、王福軍等[9]在對萬方論文相似性檢測系統(tǒng)(PSDS)和知網(wǎng)學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)(AMLC)進(jìn)行比較后,認(rèn)為兩者在檢測范圍、文獻(xiàn)引證檢測和圖表相似性檢測上存在差異,并且這兩種檢測軟件都存在一定的問題。王文福[10]認(rèn)為僅依靠技術(shù)手段來清除學(xué)術(shù)不端行為是行不通的,應(yīng)構(gòu)建以人為主導(dǎo)、網(wǎng)絡(luò)為主體,“人機(jī)合一”的防范體系。這205篇文獻(xiàn)對檢測軟件的討論主要是圍繞道德規(guī)范、法律、制度和技術(shù)扼制等幾個方面展開的,尚未見從學(xué)術(shù)研究規(guī)范的角度來討論檢測軟件局限和對策的文獻(xiàn),道德規(guī)范、法律、制度建設(shè)固然是必不可少,但本文認(rèn)為從檢測軟件的功能出發(fā),從學(xué)術(shù)研究規(guī)范的視角來討論其局限、分析對策并展開實施,是當(dāng)下學(xué)術(shù)不端防治嚴(yán)峻形勢下的一條有效路徑。
目前國內(nèi)提供學(xué)術(shù)不端檢測服務(wù)的機(jī)構(gòu)有10余家,軟件各具所長,如表3所示。
這些學(xué)術(shù)不端檢測軟件的特點主要有如下幾方面:
(1)檢測軟件功能重合率高。大部分軟件僅具備論文檢測一項功能,除了檢測算法細(xì)節(jié)不一致、比對數(shù)據(jù)覆蓋量不同之外,并無其他異處。所有檢測軟件均已實現(xiàn)了在海量數(shù)據(jù)的基礎(chǔ)上的語義級別檢測技術(shù),包括指紋特征檢測技術(shù)、知識挖掘技術(shù)、自然語言處理技術(shù)等,部分軟件已經(jīng)能夠智能識別文字圖片、智能抓取公式內(nèi)容并自動檢測觀點剽竊。比對數(shù)據(jù)庫文獻(xiàn)量均以億計,內(nèi)容覆蓋了期刊論文、會議論文、學(xué)位論文、圖書、網(wǎng)頁、報紙等資源。多數(shù)軟件能夠針對不同的使用對象開發(fā)了相應(yīng)的檢測版本,如博碩文論版、本科論文版、職稱論文版、圖書專著版等。
(2)學(xué)術(shù)研究規(guī)范應(yīng)用簡單。除了學(xué)術(shù)不端檢測之外,部分檢測軟件拓展了軟件功能,嘗試將學(xué)術(shù)研究規(guī)范應(yīng)用到檢測軟件中來。Gocheck論文引用檢測系統(tǒng)3.1版本提供一個“導(dǎo)師指導(dǎo)”功能,該功能使指導(dǎo)老師和學(xué)生能夠在線互動并記錄下互動內(nèi)容,為導(dǎo)師指導(dǎo)貫穿畢業(yè)論文撰寫過程提供途徑。同方知網(wǎng)提供了一款名為Writeaid論文寫作助手的論文輔助寫作軟件,該軟件滲透到論文寫作的過程,即能在論文寫作之前根據(jù)不同高?;蚱诳恼撐膶懽饕笤O(shè)定模板并自動校對文本,使得論文的格式能符合形式規(guī)范。大雅相似度分析系統(tǒng)可將研究思路、成果主要內(nèi)容在中文圖書中作全面的比對,從而協(xié)助找到相同或相似研究方向的課題和相關(guān)團(tuán)隊。這些功能的擴(kuò)展,豐富了檢測軟件的應(yīng)用場景,擴(kuò)大了使用范圍,然而這些應(yīng)用僅利用了學(xué)術(shù)研究規(guī)范的部分條例,還不成體系。
(3)學(xué)術(shù)不端行為更加“隱秘”。學(xué)術(shù)不端檢測軟件引入的初衷是為了防范學(xué)術(shù)不端,然而技術(shù)進(jìn)步并不能阻止學(xué)術(shù)不端行為的發(fā)生,比如檢測算法的升級很快就被發(fā)現(xiàn)有“漏洞”,而被不法分子所利用,如今社會上出現(xiàn)的支持被檢測者實施學(xué)術(shù)不端行為的“幫兇”[6],幫助被檢測者實施“一種升級版的造假[17]”的行為愈來愈猖狂,使得檢測成為了一場所謂“降重技巧”的比拼,失去了學(xué)術(shù)不端檢測應(yīng)有的意義。筆者在百度中輸入“降重”,立即跳出“降重軟件”“論文降重”等關(guān)鍵詞,相關(guān)檢索結(jié)果多達(dá)927萬余條,各種所謂“自動降重軟件”“論文降重助手”比比皆是,在淘寶網(wǎng)中搜索“論文降重”也得到400余條檢索結(jié)果,并顯示有大量成功交易。這種做法助長了學(xué)術(shù)不端風(fēng)氣,嚴(yán)重阻礙了相關(guān)學(xué)術(shù)研究的進(jìn)步。
表3 國內(nèi)主流學(xué)術(shù)不端檢測軟件比較
違反學(xué)術(shù)規(guī)范行為涉及到所有參加學(xué)術(shù)研究行為的主體,其行為紛繁復(fù)雜,在學(xué)術(shù)研究各個環(huán)節(jié)均有所表現(xiàn)。根據(jù)學(xué)術(shù)活動涉及到的人員可分為在校學(xué)生、學(xué)術(shù)期刊編輯、專門科研人員、評審專家、管理單位等,根據(jù)不端行為本身的性質(zhì)可分為偽造類、剽竊類、贊譽(yù)類等[18]。本文根據(jù)已有研究成果,總結(jié)了不同的人員在學(xué)術(shù)研究程序各環(huán)節(jié)內(nèi)可能發(fā)生的違反學(xué)術(shù)規(guī)范行為見表4。
表4 學(xué)術(shù)不端行為分類
由表4可以看出,在學(xué)術(shù)研究的研究選題、數(shù)據(jù)分析、總結(jié)研究成果和研究成果發(fā)表這四個階段最易發(fā)生違反學(xué)術(shù)規(guī)范行為,包括學(xué)術(shù)失范、學(xué)術(shù)不端和學(xué)術(shù)腐敗等。學(xué)術(shù)失范行為在大多數(shù)情況下可能是科學(xué)工作者在不經(jīng)意間的失誤,并不是刻意的行為,是一種輕微的違反學(xué)術(shù)規(guī)則而造成的失誤。學(xué)術(shù)腐敗主要表現(xiàn)為學(xué)術(shù)組織的權(quán)力擁有者利用手中的權(quán)力侵占他人學(xué)術(shù)成果,其危害性更大。學(xué)術(shù)不端行為介于二者之間,界定在包括剽竊、數(shù)據(jù)篡改和捏造等情形中,不僅作者本人會產(chǎn)生學(xué)術(shù)不端行為,期刊編輯的不當(dāng)轉(zhuǎn)載、互惠引用等行為也會使作者產(chǎn)生學(xué)術(shù)不端行為。
從20世紀(jì)80年代學(xué)術(shù)不端初露端倪開始,政府、學(xué)界和社會為規(guī)范學(xué)術(shù)行為開始了漫長的治理之路,其治理途徑主要包括道德規(guī)范建設(shè)、制度建設(shè)、法律建設(shè)和技術(shù)遏制[19]等幾個方面,所付出的努力有目共睹。本文總結(jié)學(xué)術(shù)不端治理路徑依據(jù)其可操作性認(rèn)為學(xué)術(shù)不端防治可分為易操作、一般操作和難操作3個層次,如表5所示。
表5 學(xué)術(shù)不端治理路徑的三個層次
我國學(xué)術(shù)不端行為的治理之所以一直并沒有達(dá)到所期望的效果,是因為在這過程中存在配套機(jī)制缺失和執(zhí)行力度不夠等問題,比如匿名評審制度,由于學(xué)術(shù)研究的專門化,小同行之間相互熟悉,匿名評審專家很容易判斷出作者是誰,專家?guī)斓娜笔?、遴選機(jī)制的不透明等都使得匿名評審制度在學(xué)界存在異議。學(xué)術(shù)單位和管理部門在懲戒違反學(xué)術(shù)規(guī)范、追究相關(guān)責(zé)任人、完善項目申請和評審制度方面有著非常嚴(yán)格的制度[20],但是執(zhí)行的力度往往卻礙于名聲、熟人等原因而有所折扣,且“問題”往往跟著“制度”相繼出現(xiàn),甚至出現(xiàn)來不及堵漏洞的現(xiàn)象。全面、系統(tǒng)的學(xué)術(shù)規(guī)范教育、完善學(xué)術(shù)評價機(jī)制、加強(qiáng)學(xué)術(shù)立法等手段無法立竿見影且不易操作,比如學(xué)術(shù)規(guī)范道德建設(shè)就容易被操作成泛泛意義上的道德說教,學(xué)術(shù)評價容易被操作成重量不重質(zhì)。
學(xué)術(shù)不端檢測是最易操作、也是當(dāng)前最流行的一種基于計算機(jī)技術(shù)的學(xué)術(shù)不端防治手段,學(xué)術(shù)論文要想公開發(fā)表就必須通過檢測審核。經(jīng)過10年的發(fā)展,檢測軟件在實踐中不斷進(jìn)步,算法、操作、服務(wù)等方面均有所改進(jìn),但仍然存在一定的功能局限:第一,存在時間上的檢測盲區(qū)。收集論文存在一定程度的滯后性,無法檢測未及時上傳的、未能公開發(fā)表的或僅在一定范圍內(nèi)公開發(fā)表的抄襲源文獻(xiàn);第二,存在技術(shù)上的檢測盲區(qū)。檢測算法不夠智能,無法檢測翻譯的外文文獻(xiàn),無法檢測表述方式變動、語序調(diào)整、同義詞替換等深層學(xué)術(shù)不端行為,只能避免“文字”抄襲而不能防止“思想”抄襲[21];第三,存在相似度判定盲區(qū)。不能區(qū)分必要自引、合理他引和抄襲,對作者正常、必要的自引一律判定為“重復(fù)”,會將引用權(quán)威著作、歷史材料、法律法規(guī)等情況判定為抄襲,將統(tǒng)一格式的醫(yī)學(xué)論文的前言、資料與方法、結(jié)果、討論等內(nèi)容判定為抄襲[22],如此修改后有損論文整體內(nèi)容結(jié)構(gòu),也浪費(fèi)作者寶貴的時間和精力;第四,檢測軟件功能單一。檢測軟件只具備文本相似度檢測的功能,被檢測者有若干手段可繞過相似度檢測,缺乏論文選題、師生互動、學(xué)術(shù)積累等其他功能對學(xué)術(shù)行為的佐證;第五,檢測軟件只檢測結(jié)果,不檢測過程。對于篡改、偽造、剽竊數(shù)據(jù)、偽造輔證、實驗違規(guī)、提前發(fā)表不成熟的成果、不當(dāng)署名、學(xué)術(shù)泄密這一類學(xué)術(shù)不端行為無能為力。
學(xué)術(shù)不端防治的道德規(guī)范、制度、法律和技術(shù)遏制等四種路徑在措施上存在不妥之處,且未能達(dá)成學(xué)術(shù)治理的良性互動,應(yīng)用較為廣泛的學(xué)術(shù)不端檢測軟件也有著存在檢測盲區(qū)、檢測功能單一等局限,因此,學(xué)術(shù)不端行為得不到有效遏制。2018年5月,中共中央辦公廳、國務(wù)院辦公廳印發(fā)了《關(guān)于進(jìn)一步加強(qiáng)科研誠信建設(shè)的若干意見》(以下簡稱《意見》),對進(jìn)一步推進(jìn)科研誠信制度化建設(shè)等方面做出部署。本文認(rèn)為,升級技術(shù)遏制手段,全面系統(tǒng)地融入學(xué)術(shù)研究規(guī)范條例,延展檢測軟件的功能和使用范圍,在檢測前開展學(xué)術(shù)規(guī)范教育、檢測中增加檢測軟件的實用功能、檢測后建立學(xué)術(shù)信用數(shù)據(jù)庫,同時利用學(xué)術(shù)制度和學(xué)術(shù)立法來約束學(xué)術(shù)研究參與者在學(xué)術(shù)研究過程中的行為,是短期內(nèi)防治學(xué)術(shù)不端行為的一個有效措施。
期刊編輯部應(yīng)將已錄用未發(fā)表論文納入學(xué)術(shù)不端檢測源,甚至可進(jìn)一步將該部分文獻(xiàn)提供給軟件公司或檢測機(jī)構(gòu),同時檢測軟件應(yīng)在法律允許范圍內(nèi)盡可能收集更多的灰色文獻(xiàn)資源作為檢測源,擴(kuò)大比對數(shù)據(jù)量。對于科研院所、期刊編輯部等用戶來說,應(yīng)利用多種檢測軟件分時段多次檢測,以避免單一檢測軟件數(shù)據(jù)收錄不全面的漏洞。此外,檢測軟件記錄了學(xué)者檢測過的學(xué)術(shù)成果以及檢測結(jié)果,學(xué)術(shù)成果可進(jìn)一步擴(kuò)充檢測數(shù)據(jù)源,檢測結(jié)果則可累積進(jìn)而建立學(xué)者學(xué)術(shù)信用數(shù)據(jù)庫。《意見》第七條指出“科技部會同中國社科院建立完善覆蓋全國的自然科學(xué)和哲學(xué)社會科學(xué)科研誠信信息系統(tǒng),對科研人員、相關(guān)機(jī)構(gòu)、組織等的科研誠信狀況進(jìn)行記錄”。我國至今仍未建立學(xué)術(shù)信用信息系統(tǒng),相比歐美等發(fā)達(dá)國家差距較大。盡管建立學(xué)術(shù)信用數(shù)據(jù)庫需要有規(guī)范的學(xué)術(shù)信用評估標(biāo)準(zhǔn)和制度規(guī)范的信息收集及傳播途徑等前提條件保障[23],但就檢測軟件來說,其記錄的檢測結(jié)果數(shù)據(jù)可為一定范圍內(nèi)的學(xué)術(shù)信用監(jiān)管和學(xué)術(shù)評價活動提供依據(jù)。
所謂的“降重技巧”往往隨著檢測軟件的升級而“升級”,它們試圖通過翻譯、替換同義詞、調(diào)整語序等方式來逃避檢測軟件的檢測,嚴(yán)重擾亂了學(xué)術(shù)秩序。檢測軟件的這種“不強(qiáng)大”也成為了一些人抵制學(xué)術(shù)不端軟件的理由。打鐵還需自身硬,檢測軟件應(yīng)積極利用近年來蓬勃發(fā)展的人工智能技術(shù)來壯大自己,其中的跨語言檢測技術(shù)和語義識別技術(shù)等可幫助檢測軟件有效解決“思想抄襲”的問題??缯Z言檢測通過語言規(guī)范化、候選文檔檢索、分類器訓(xùn)練、剽竊行為分析等幾個步驟來進(jìn)行跨語言相似性分析,該技術(shù)剛剛起步不久,國內(nèi)外都正處于研究快速發(fā)展階段[24]。語義識別技術(shù)是通過對文獻(xiàn)的詞語解析、信息抽取、時間因果、情緒判斷等技術(shù)處理實現(xiàn)對文獻(xiàn)的語篇理解,能較好地識別替換同義詞、調(diào)整語序等學(xué)術(shù)不端行為。
學(xué)術(shù)不端檢測軟件的使用范圍越來越廣,涉及到學(xué)生畢業(yè)、學(xué)者論文發(fā)表、職稱評定、評獎評優(yōu)等學(xué)術(shù)活動的方方面面,因誤判而帶來的風(fēng)險越來越大。檢測軟件應(yīng)積極利用大數(shù)據(jù)技術(shù),建立語料庫,充分進(jìn)行數(shù)據(jù)訓(xùn)練,提高相似度判定的準(zhǔn)確率。首先,檢測軟件要能夠智能區(qū)分待檢測論文的學(xué)科并根據(jù)學(xué)科特點來判定待檢測論文的引用情況,疑似抄襲文字是否為權(quán)威著作、歷史材料、法律法規(guī)或名人名言,若有如此情況應(yīng)不可判定為抄襲。其次,檢測軟件還可根據(jù)文獻(xiàn)類型對待檢測論文的文體特征進(jìn)行分析,智能判定學(xué)術(shù)論文中是否提供研究的學(xué)術(shù)背景、前沿動態(tài),真實報道研究方法、研究步驟、研究結(jié)果、研究結(jié)論等內(nèi)容,是否遵守包括題名、署名、摘要等在內(nèi)的內(nèi)容格式規(guī)范,以確保檢測論文符合學(xué)術(shù)形式規(guī)范要求。需要說明的是,人工智能的判定結(jié)果應(yīng)再交予專家進(jìn)一步鑒定,例如在學(xué)位論文檢測時,檢測軟件應(yīng)提供文字復(fù)制比由導(dǎo)師介入判定是否存在學(xué)術(shù)不端行為;期刊編輯部檢測待發(fā)表論文時如發(fā)現(xiàn)論文相似度比例過高,應(yīng)由編輯或?qū)徃鍖<胰斯そ槿肱卸ㄊ欠駷槌u行為。
《意見》第三條指出要“加強(qiáng)科研活動全流程誠信管理”。作為當(dāng)前使用最為廣泛的學(xué)術(shù)治理軟件,如果將學(xué)術(shù)規(guī)范的相關(guān)規(guī)范條例貫穿到學(xué)術(shù)不端檢測軟件中去,學(xué)術(shù)不端檢測軟件深入到學(xué)術(shù)研究的各個環(huán)節(jié),不僅可以檢測學(xué)術(shù)研究結(jié)果,還可以監(jiān)督學(xué)術(shù)研究過程,研究成果和研究過程可以相互印證,相關(guān)學(xué)術(shù)評價活動也能夠依此開展過程評價而不再把預(yù)期目標(biāo)和研究成果作為唯一的評價依據(jù),可在一定程度上防止篡改、偽造、剽竊數(shù)據(jù)、不當(dāng)署名等學(xué)術(shù)不端行為的發(fā)生。
在研究選題階段,可根據(jù)科研人員的公開發(fā)表論文和論文被引情況得到學(xué)術(shù)信息、科研能力和學(xué)術(shù)影響力,開發(fā)學(xué)術(shù)前沿發(fā)現(xiàn)功能,可協(xié)助學(xué)術(shù)新人進(jìn)行研究選題;在文獻(xiàn)調(diào)研階段提供文獻(xiàn)管理功能,科研人員可將其搜集到的與待檢測論文相關(guān)的文獻(xiàn)分類標(biāo)注存儲起來,一方面作為研究筆記;另一方面可為檢測提供參考依據(jù);在研究方法選擇階段提供研究方法記錄功能,記錄下科研人員的研究方法,研究方法不同則研究步驟就不同,如研究方法與研究步驟不相匹配,則該論文必有瑕疵;在資料數(shù)據(jù)分析階段提供數(shù)據(jù)記錄功能,詳細(xì)記錄實驗過程及其數(shù)據(jù),為其他研究人員驗證論文結(jié)果提供依據(jù);在總結(jié)研究成果階段提供自動校對論文格式功能,能夠根據(jù)前期文獻(xiàn)積累和研究記錄、實驗數(shù)據(jù)等情況自動生成并校驗論文相關(guān)內(nèi)容,同時根據(jù)論文參與人員的貢獻(xiàn)程度生成署名;在研究成果發(fā)表階段增加互動功能,記錄每一次的檢測記錄和作者修改記錄;在學(xué)術(shù)評價階段提供形式評價功能,根據(jù)成果的類型和形式制定評價標(biāo)準(zhǔn)并開展初步評價,為專家評審提供初步意見。
加強(qiáng)學(xué)術(shù)規(guī)范教育和學(xué)術(shù)規(guī)范意識養(yǎng)成是防范學(xué)術(shù)不端行為的重要手段?!兑庖姟返谖鍡l提出要“切實加強(qiáng)科研誠信的教育和宣傳”。由于種種原因限制,過往的多數(shù)科研誠信和學(xué)術(shù)規(guī)范教育多為口頭傳達(dá),學(xué)生對于學(xué)術(shù)規(guī)范僅理解為“引文格式”“寫作規(guī)范”“規(guī)范標(biāo)注”等,期刊編輯部大都要求與作者簽署版權(quán)協(xié)議和責(zé)任聲明,其中包含作者杜絕學(xué)術(shù)不端行為的承諾,但實際上大多數(shù)流于形式,沒有真正起到防范作用[25]。學(xué)術(shù)不端檢測軟件是所有學(xué)生和學(xué)者在學(xué)術(shù)成果發(fā)表之前必須使用的軟件,可在檢測軟件的訪問界面上提供學(xué)術(shù)規(guī)范自主學(xué)習(xí)平臺,內(nèi)容包括科研誠信、道德修養(yǎng)、政策法規(guī)、研究規(guī)范、寫作規(guī)范等,提供在線閱讀、視頻觀看、案例分析、在線練習(xí)等功能,作者需完成一定時長的學(xué)術(shù)規(guī)范學(xué)習(xí)或通過學(xué)術(shù)規(guī)范測試后方可使用檢測軟件。
學(xué)術(shù)規(guī)范是每一位科研人員所必須進(jìn)行的“規(guī)定動作”,科研人員遵守學(xué)術(shù)規(guī)范,所進(jìn)行的學(xué)術(shù)研究才有價值,才能與國內(nèi)外同行進(jìn)行有效的交流,才能促進(jìn)學(xué)術(shù)創(chuàng)新和知識增長[26]。盡管目前國內(nèi)相關(guān)學(xué)術(shù)不端檢測軟件存在各種缺點,但作為學(xué)術(shù)不端治理的技術(shù)遏制手段之一,也發(fā)揮了其應(yīng)有的作用。本文分析了學(xué)術(shù)不端檢測軟件的功能和局限以及學(xué)術(shù)研究規(guī)范在學(xué)術(shù)不端防治技術(shù)手段中的有限應(yīng)用,探討如何將學(xué)術(shù)不端檢測軟件深入到學(xué)術(shù)研究過程中去,提出學(xué)術(shù)不端行為防治規(guī)范化和流程化措施建議,為我國學(xué)術(shù)不端行為的防范與治理提供思路借鑒。