關(guān)鍵詞:人工智能生成內(nèi)容;AIGC;AI 文本檢測(cè);知網(wǎng)AIGC 檢測(cè)服務(wù)系統(tǒng);鑒字源AIGC 文本識(shí)別系統(tǒng);技術(shù)缺陷;學(xué)術(shù)期刊;因應(yīng)策略
DOI:10.19619/j.issn.1007-1938.2024.00.027
作者單位:深圳大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版)編輯部
引文格式:周濛. AIGC 論文檢測(cè)系統(tǒng)的技術(shù)缺陷與學(xué)術(shù)期刊因應(yīng)[J]. 出版與印刷,2024(4):20-30.
隨著人工智能生成內(nèi)容(artificial intelligencegenerated content,英文縮寫AIGC)技術(shù)在學(xué)術(shù)出版領(lǐng)域的發(fā)展與滲透,一些作者已經(jīng)開始利用AI 工具,例如ChatGPT,來撰寫學(xué)術(shù)論文,AI 代寫現(xiàn)象頻發(fā)。甚至在國(guó)際知名期刊之中,也能發(fā)現(xiàn)AIGC 的痕跡。例如,2024 年3 月愛思唯爾(Elsevier)出版集團(tuán)旗下期刊《表面與界面》(Surfaces and Interfaces)上的一篇論文出現(xiàn)了ChatGPT 常用生成語(yǔ)——“當(dāng)然,以下是關(guān)于您主題可參考的介紹”;2023 年8 月物理學(xué)一流期刊《物理寫作》(Physica Scripta)發(fā)表的一篇論文中出現(xiàn)了 ChatGPT 的按鈕標(biāo)簽——“生成回答”(regenerate response)。這些AI 生成的毫無(wú)意義的措辭竟然能在作者、編輯、審稿人、校對(duì)的審校后幸存下來,說明學(xué)術(shù)出版主體在應(yīng)對(duì)AIGC 技術(shù)的能力方面存在不足。為了應(yīng)對(duì)這一情況,已有部分科技出版企業(yè)相繼研發(fā)并推出AIGC 論文檢測(cè)系統(tǒng),探索AIGC運(yùn)行規(guī)律,嘗試攻克內(nèi)容識(shí)別、算法效率、可信評(píng)估等技術(shù)難題,以識(shí)別學(xué)術(shù)文本中的AI 生成內(nèi)容。在利用AIGC 論文檢測(cè)系統(tǒng)的實(shí)踐之中,探究學(xué)術(shù)期刊出版單位如何警惕系統(tǒng)的技術(shù)缺陷,應(yīng)對(duì)機(jī)器風(fēng)險(xiǎn)與技術(shù)風(fēng)險(xiǎn),并發(fā)揮獨(dú)立于機(jī)器之上的主觀能動(dòng)性以構(gòu)建有效的AIGC 識(shí)別策略,對(duì)于推動(dòng)學(xué)術(shù)期刊的數(shù)智化發(fā)展具有重要意義。
就AIGC 對(duì)于學(xué)術(shù)期刊的影響這一研究主題,已有較多國(guó)內(nèi)外學(xué)者進(jìn)行了探討。在實(shí)證研究領(lǐng)域,國(guó)外的Catherine A. Gao 等學(xué)者[1] 以及國(guó)內(nèi)的沈錫賓等[2] 通過比較AI 檢測(cè)工具和人工評(píng)審者在AI 寫作判別能力上的差異,指出特定AI 檢測(cè)工具可以較好識(shí)別出ChatGPT 改寫的醫(yī)學(xué)論文摘要,借助這些工具可以幫助學(xué)術(shù)編輯更好地發(fā)現(xiàn)AI 代寫行為。在制度研究領(lǐng)域,張凌寒等[3] 認(rèn)為應(yīng)設(shè)計(jì)AIGC 質(zhì)量光譜標(biāo)識(shí),要求對(duì)生成來源、責(zé)任主體、內(nèi)容質(zhì)量進(jìn)行強(qiáng)制標(biāo)識(shí),以激活標(biāo)識(shí)制度在信息內(nèi)容篩選中的實(shí)質(zhì)作用;蔣雪穎等[4] 則提出要建構(gòu)多元主體協(xié)同監(jiān)管的學(xué)術(shù)出版生態(tài)框架,嘗試為AIGC 技術(shù)下我國(guó)學(xué)術(shù)生態(tài)的良性發(fā)展提供可能的進(jìn)路。在行業(yè)研究領(lǐng)域,王鵬濤等[5] 分析了AIGC 技術(shù)與知識(shí)生產(chǎn)的耦合性,識(shí)別由AIGC 引發(fā)的信任危機(jī),在此基礎(chǔ)上探索學(xué)術(shù)出版行業(yè)的信任機(jī)制理論模型與實(shí)踐路徑;張重毅等[6] 指出學(xué)術(shù)出版行業(yè)存在AI 工具使用程度不易把握、隱性學(xué)術(shù)不端行為更不易識(shí)別、科研倫理問題更加不易發(fā)現(xiàn)、現(xiàn)行同行評(píng)議制度權(quán)威性不易保證、著作權(quán)及研究成果分配不易處理等方面的挑戰(zhàn),提出出版主體要清晰認(rèn)識(shí)自身的核心優(yōu)勢(shì)和定位。在對(duì)策研究領(lǐng)域,趙凱[7]提出了以人機(jī)協(xié)同審核、編輯價(jià)值重塑迎接新挑戰(zhàn)的策略構(gòu)想,使AI 真正成為新的內(nèi)容生產(chǎn)力和審核力引擎;曹聯(lián)養(yǎng)[8] 則提出了前置審查的應(yīng)對(duì)策略,包括更新作者反學(xué)術(shù)不端承諾、在常規(guī)查重外使用自動(dòng)化工具檢查辨識(shí)AIGC、對(duì)成果中重要觀點(diǎn)的來源進(jìn)行核查、對(duì)學(xué)術(shù)成果所依據(jù)的主要事實(shí)和數(shù)據(jù)進(jìn)行核查等解決方案。
已有研究成果雖然多方位、多角度地指出了AIGC 的具體風(fēng)險(xiǎn)與影響,并為學(xué)術(shù)期刊應(yīng)對(duì)AI 代寫現(xiàn)象提供了出版政策、行業(yè)、主體層面的建議,但尚未涉及AIGC 檢測(cè)系統(tǒng)的技術(shù)原理和技術(shù)缺陷,也未能明確說明出版單位如何在實(shí)操層面利用AIGC 檢測(cè)技術(shù)來解決問題。具體而言,該研究領(lǐng)域還有待從以下三個(gè)方面進(jìn)行補(bǔ)充:第一,在實(shí)證檢測(cè)方面,可識(shí)別醫(yī)學(xué)領(lǐng)域AI 改寫摘要的檢測(cè)系統(tǒng)未必能推廣至其他學(xué)科,尤其對(duì)于語(yǔ)言邏輯或詞匯多樣性更為復(fù)雜的人文社科領(lǐng)域,以及經(jīng)過多次語(yǔ)料投喂而能夠模仿用戶寫作風(fēng)格的高級(jí)AI 工具,AIGC 檢測(cè)系統(tǒng)的效果可能不盡如人意;第二,在技術(shù)缺陷層面,目前的研究鮮少提及AIGC 檢測(cè)系統(tǒng)的誤報(bào)、漏報(bào)現(xiàn)象,也忽略了不同學(xué)科、場(chǎng)景、領(lǐng)域、類型的文本檢測(cè)標(biāo)準(zhǔn)缺乏通用性的問題;第三,在實(shí)操因應(yīng)層面,現(xiàn)有研究的對(duì)策與制度構(gòu)想還不能滲透進(jìn)具體的學(xué)術(shù)出版活動(dòng)之中,出版單位如何理解AIGC 檢測(cè)系統(tǒng)的技術(shù)原理與功能,以及如何在審稿校對(duì)過程中將人工審核與機(jī)器檢測(cè)相互結(jié)合,仍舊是難以克服的現(xiàn)實(shí)問題。基于以上不足,本文在已有研究基礎(chǔ)上作進(jìn)一步探索:首先,使用兩個(gè)國(guó)內(nèi)較知名的AIGC 論文檢測(cè)系統(tǒng)對(duì)10 篇由ChatGPT 生成的法學(xué)論文摘要和10 篇由其他AI 改寫的法學(xué)論文摘要分別進(jìn)行檢測(cè),以驗(yàn)證檢測(cè)工具的AI 鑒別能力;其次,通過分析檢測(cè)結(jié)果總結(jié)檢測(cè)工具的技術(shù)缺陷,并基于其技術(shù)原理分析缺陷成因;最后,將缺陷與成因置于學(xué)術(shù)出版單位的出版場(chǎng)景中,總結(jié)出版主體使用AIGC 檢測(cè)系統(tǒng)需要避免的問題,提出實(shí)操層面的技術(shù)應(yīng)對(duì)策略。
一、數(shù)據(jù)來源和研究方法
1. 檢測(cè)樣本說明
由于國(guó)內(nèi)現(xiàn)有研究使用的檢測(cè)樣本僅來源于醫(yī)學(xué)文獻(xiàn),為了進(jìn)一步檢測(cè)AIGC 論文檢測(cè)系統(tǒng)的AI 識(shí)別能力,本文選取了2023年發(fā)表在某中文核心期刊的10篇法學(xué)文獻(xiàn)。法學(xué)論文的語(yǔ)言邏輯層次和詞匯組合難度相對(duì)而言更為豐富和復(fù)雜,AI 工具也更加難以模仿法學(xué)學(xué)者的文風(fēng)和思路,大幅提升了識(shí)別測(cè)試的難度。
樣本分為三組:①對(duì)照組,為入選的10篇文獻(xiàn)摘要原文,均在400 字左右,不對(duì)其作任何文字處理;②AI 生成組,先通過向ChatGPT 投喂原文標(biāo)題、摘要以及關(guān)鍵詞,生成對(duì)原文內(nèi)容的分析與評(píng)價(jià),再基于相應(yīng)回答(response)使用提示詞(prompt)“根據(jù)此題目與對(duì)話內(nèi)容,重新生成500 字左右的學(xué)術(shù)論文摘要”,最終獲得10 篇AI 代寫樣本,不對(duì)其作刪改處理;③AI 改寫組,使用國(guó)內(nèi)一款聲稱能夠降低AIGC 疑似程度的AI改寫軟件,向其輸入10 篇AI 生成組樣本,最終獲得10 篇字?jǐn)?shù)為600 字左右的AI 改寫樣本,改寫軟件默認(rèn)與原AI 生成組的文本相似度控制在65%—80%,不再對(duì)其作刪改處理。
2. 具體檢測(cè)方式
本研究并不試圖尋求嚴(yán)格意義上的統(tǒng)計(jì)學(xué)結(jié)果,僅針對(duì)檢測(cè)系統(tǒng)的直觀輸出結(jié)果進(jìn)行簡(jiǎn)要的數(shù)據(jù)分析,并對(duì)檢測(cè)失敗的樣本進(jìn)行具體的文本分析以尋求技術(shù)缺陷根源。目前國(guó)內(nèi)市面上的AIGC 論文檢測(cè)系統(tǒng)一般兼具文獻(xiàn)相似性檢測(cè)與AIGC 文字占比檢測(cè)雙重功能,由于此前已有學(xué)者實(shí)證分析過AI 代寫文本能否通過文獻(xiàn)相似率檢測(cè),且重復(fù)率結(jié)果與本文研究目的并不相關(guān),因此本研究不再對(duì)樣本進(jìn)行相似性檢測(cè)。
對(duì)于具體的檢測(cè)系統(tǒng),本研究選擇了較多科研與出版機(jī)構(gòu)使用的同方知網(wǎng)(北京)技術(shù)有限公司的“知網(wǎng)AIGC 檢測(cè)服務(wù)系統(tǒng)”(簡(jiǎn)稱“知網(wǎng)檢測(cè)系統(tǒng)”)以及南京智齒數(shù)匯信息科技有限公司的“鑒字源AIGC 文本檢測(cè)系統(tǒng)”(簡(jiǎn)稱“鑒字源檢測(cè)系統(tǒng)”)進(jìn)行判別。
二、技術(shù)缺陷表征:檢測(cè)系統(tǒng)的低準(zhǔn)確度、高差異率與弱敏感性
通過對(duì)AI 生成組、AI 改寫組以及對(duì)照組的共30 篇樣本同時(shí)使用知網(wǎng)檢測(cè)系統(tǒng)和鑒字源檢測(cè)系統(tǒng)進(jìn)行檢測(cè),最終生成60 條檢測(cè)記錄,數(shù)據(jù)結(jié)果如下表1所示。
知網(wǎng)檢測(cè)系統(tǒng)與鑒字源檢測(cè)系統(tǒng)都以疑似AIGC 片段的字?jǐn)?shù)占全文的百分比為檢測(cè)數(shù)據(jù),經(jīng)過不同的賦值方式,標(biāo)記檢測(cè)的片段有多大概率屬于AIGC。知網(wǎng)檢測(cè)系統(tǒng)的結(jié)果是經(jīng)過系統(tǒng)加權(quán)計(jì)算的數(shù)值,系統(tǒng)通過對(duì)不同程度的疑似片段分別進(jìn)行系數(shù)賦值(高度疑似AIGC 值為0.9—1,中度疑似AIGC 值為0.7—0.9,輕度疑似AIGC 值為0.5—0.7,不予標(biāo)識(shí)為0—0.5。左側(cè)臨界值包含在對(duì)應(yīng)范圍內(nèi),如AIGC 值=0.5,即為輕度疑似AI生成,AIGC 值<0.5 則系統(tǒng)不進(jìn)行標(biāo)注,判定不屬于AIGC),最終得到系統(tǒng)評(píng)估的AIGC片段占比而非實(shí)際占比。例如,AI 生成組第6 篇摘要在知網(wǎng)檢測(cè)系統(tǒng)中被標(biāo)記為中度疑似的字?jǐn)?shù)實(shí)際只占全文的46.5%,但系統(tǒng)經(jīng)評(píng)估后為其疑似程度賦值為0.79,最終得到加權(quán)占比36.7%。鑒字源檢測(cè)系統(tǒng)的結(jié)果則是實(shí)際字?jǐn)?shù)占比,被標(biāo)記為高度、中度、輕度的片段,其疑似AIGC 的概率分別為70%—100%、60%—70%、50%—60%,概率小于50% 的片段不予識(shí)別為AIGC;左側(cè)臨界值判定同知網(wǎng)檢測(cè)系統(tǒng)。例如AI 改寫組第3 篇摘要全文都被鑒字源檢測(cè)系統(tǒng)標(biāo)記為AIGC, 其中前41.6% 的片段為高度疑似,后58.4% 的片段則為輕度疑似。通過分析表中數(shù)據(jù),可以初步總結(jié)出目前AIGC 檢測(cè)系統(tǒng)的三點(diǎn)缺陷,即低準(zhǔn)確度、高差異率與弱敏感性。
1. 低準(zhǔn)確度
總體來看,對(duì)照組的檢測(cè)結(jié)果都為0%,說明兩個(gè)系統(tǒng)對(duì)于發(fā)現(xiàn)哪些文本由真人撰寫具有優(yōu)秀的鑒別能力;而從生成組的結(jié)果來看,不管是知網(wǎng)檢測(cè)系統(tǒng)還是鑒字源檢測(cè)系統(tǒng),能夠成功判別存在AIGC 的篇數(shù)都只有4 篇,成功率只有四成,都未能達(dá)到及格線。由此可見,目前流行的檢測(cè)系統(tǒng)雖然能夠大概率確認(rèn)真人不是AI,但并無(wú)能力準(zhǔn)確判別AI 就是AI。知網(wǎng)檢測(cè)系統(tǒng)對(duì)不同疑似程度分別進(jìn)行賦值的做法雖然看起來更加科學(xué),但總體來看其實(shí)際檢測(cè)出的疑似片段并不如鑒字源檢測(cè)系統(tǒng)多,尤其對(duì)于兩者都判別為高度疑似的生成組第2 篇摘要,鑒字源檢測(cè)系統(tǒng)的檢測(cè)結(jié)果要遠(yuǎn)高于知網(wǎng)。由此可知系統(tǒng)的準(zhǔn)確度與生成結(jié)果計(jì)算方法的復(fù)雜程度并無(wú)直接關(guān)聯(lián)。
從改寫組的檢測(cè)結(jié)果來看,AI 改寫軟件降低AIGC 占比與程度的能力明顯不足,有時(shí)還會(huì)適得其反。只有對(duì)生成組第8、9、10篇摘要的改寫成功避開了系統(tǒng)檢測(cè),其他改寫要么降低得不多,要么進(jìn)一步加重AI成分。但從改寫軟件的降A(chǔ)I 原理來說,其本身就是將AIGC 詞句替換為類似真人的表達(dá)方式,如果檢測(cè)系統(tǒng)反而評(píng)估改寫后片段的AI 成分更多,則從側(cè)面表明了檢測(cè)系統(tǒng)在識(shí)別真人語(yǔ)氣方面仍然不夠敏感。
2. 高差異率
生成組中知網(wǎng)檢測(cè)系統(tǒng)和鑒字源檢測(cè)系統(tǒng)檢測(cè)結(jié)果較為一致的只有4 篇,差異率達(dá)到60%(此處的差異率為兩個(gè)系統(tǒng)檢測(cè)結(jié)果不一致的篇數(shù)相對(duì)于總檢測(cè)篇數(shù)的占比,是否一致只針對(duì)系統(tǒng)能否識(shí)別到AIGC 片段,不論占比是否完全一樣)。其中生成組第2 篇都被檢測(cè)出高度疑似,第3、4、7 篇都被檢測(cè)為無(wú)AI 創(chuàng)作成分;其他6 篇文章的檢測(cè)結(jié)果則完全不同,有的知網(wǎng)檢測(cè)系統(tǒng)能夠檢測(cè)出AI 創(chuàng)作成分,有的鑒字源檢測(cè)系統(tǒng)能夠檢測(cè)出AI 創(chuàng)作成分。以上結(jié)果說明不同AIGC 檢測(cè)系統(tǒng)的技術(shù)原理和參考模型存在差異,訓(xùn)練程度與應(yīng)用場(chǎng)景也各有不同,對(duì)于典型AI標(biāo)識(shí)詞的識(shí)別也不一致,差異性特征較為明顯。雖然改寫組中知網(wǎng)檢測(cè)系統(tǒng)和鑒字源檢測(cè)系統(tǒng)檢測(cè)結(jié)果較為一致的有9 篇,差異率僅10%,但這只能側(cè)面說明AI 改寫軟件的降A(chǔ)I 方式非常機(jī)械化,檢測(cè)系統(tǒng)只能對(duì)簡(jiǎn)單易識(shí)別的AI 改寫標(biāo)識(shí)詞具有一致的鑒別能力。
3. 弱敏感性
針對(duì)生成組檢測(cè)結(jié)果為0% 即未被查出具有AI 創(chuàng)作成分的樣本,本研究進(jìn)一步對(duì)其中的文本進(jìn)行了細(xì)致分析,可以發(fā)現(xiàn)一些人工較為容易辨識(shí)的AI 標(biāo)識(shí)詞也通過了檢測(cè),例如“以上內(nèi)容強(qiáng)調(diào)了”“本文得出了”“以下是”等詞句,可見檢測(cè)系統(tǒng)的AI 詞庫(kù)與智能語(yǔ)言模型的發(fā)展訓(xùn)練水平落后于ChatGPT一類的大語(yǔ)言模型,致使系統(tǒng)對(duì)于AI 詞匯、語(yǔ)句、語(yǔ)氣的識(shí)別高度不敏感。而基于AI 改寫組中同時(shí)通過兩個(gè)系統(tǒng)檢測(cè)的4 篇文本,可以發(fā)現(xiàn)一些降A(chǔ)I 方式反而更為夸張與生硬(如刻意加入模板化的關(guān)聯(lián)詞或語(yǔ)氣詞、使用過于主觀化的描述方式等),可見檢測(cè)系統(tǒng)對(duì)部分機(jī)械化的反AI 技巧也不夠敏感。
三、技術(shù)缺陷根源:模型訓(xùn)練不足、算法優(yōu)化不當(dāng)、預(yù)設(shè)詞庫(kù)匱乏
本研究的數(shù)據(jù)結(jié)果反映了AIGC論文檢測(cè)系統(tǒng)的實(shí)際鑒別能力并不理想,在輔助出版主體識(shí)別AI 代寫行為方面還有很大不足。就表層原因而言,一方面可能是由于檢測(cè)難度的提高,檢測(cè)的樣本是由經(jīng)過語(yǔ)料投喂與簡(jiǎn)易訓(xùn)練的AI 工具生成的,且使用了語(yǔ)言邏輯復(fù)雜性較高的法學(xué)文獻(xiàn)素材;另一方面則是由于AI 工具的機(jī)器學(xué)習(xí)速度遠(yuǎn)遠(yuǎn)超過了檢測(cè)系統(tǒng)的更新迭代速度,就同一AI 工具依據(jù)不同版本或不同發(fā)展階段的語(yǔ)言模型生成的類似文本,檢測(cè)系統(tǒng)可能只具有鑒別舊模型的能力,對(duì)新模型則無(wú)能為力。與此同時(shí),通過仔細(xì)分析檢測(cè)系統(tǒng)的技術(shù)原理,還能夠發(fā)現(xiàn)一些技術(shù)領(lǐng)域的深層次原因。
以“AI 文本檢測(cè)”作為關(guān)鍵詞在中國(guó)專利公布公告網(wǎng)( http://epub.cnipa.gov.cn/Index)上進(jìn)行搜索,只得到同方知網(wǎng)的專利公告記錄。該專利名稱為“一種AI 生成文本的檢測(cè)方法、裝置、介質(zhì)及設(shè)備”,專利申請(qǐng)?zhí)枮?023110993486,公布/公告號(hào)為CN17151074A。專利摘要聲稱該發(fā)明可以判定待檢測(cè)文本是否為 AI 生成文本,不僅檢測(cè)效率高,而且不受審核人員的主觀因素影響,使得檢測(cè)結(jié)果更加準(zhǔn)確。從專利摘要附圖(圖1)可以看出,檢測(cè)方法主要由文本分類模型、目標(biāo)損失函數(shù)、預(yù)設(shè)字典及預(yù)測(cè)模型四部分構(gòu)成(S101—106為包含專利權(quán)利要求的具體實(shí)施例)。檢測(cè)步驟如下:①文本分類模型輸出待檢測(cè)文本的第一概率值,以評(píng)估該文本是AI 生成的可能性;②目標(biāo)損失函數(shù)輸出待檢測(cè)文本的偏離度特征,以評(píng)估該文本與真人文本之間的差異程度;③預(yù)測(cè)模型及預(yù)設(shè)字典輸出待檢測(cè)文本的擴(kuò)散度特征值,以表明文本中的詞匯多樣性和使用頻率;④經(jīng)過統(tǒng)計(jì)分析得出待檢測(cè)文本的句子長(zhǎng)度特征及字詞分布特征,結(jié)合第一概率值、偏離度特征、擴(kuò)散度特征值綜合判定待檢測(cè)文本是否為AI 生成文本。此外,知網(wǎng)檢測(cè)系統(tǒng)首頁(yè)的宣傳語(yǔ)表明,它主要以知網(wǎng)結(jié)構(gòu)化、碎片化和知識(shí)元化的高質(zhì)量文獻(xiàn)大數(shù)據(jù)資源為基礎(chǔ),基于預(yù)訓(xùn)練大語(yǔ)言模型算法邏輯,結(jié)合“知識(shí)增強(qiáng)AIGC檢測(cè)技術(shù)”和若干檢測(cè)算法,從語(yǔ)言模式和語(yǔ)義邏輯兩條鏈路,應(yīng)用AI 檢測(cè)AIGC。
1. 語(yǔ)言模型訓(xùn)練水平不足
從以上公開的技術(shù)內(nèi)容可以看出,知網(wǎng)的AIGC 檢測(cè)系統(tǒng)主要由系統(tǒng)自身建立的大語(yǔ)言模型以及配套算法構(gòu)成。通過比較,可以發(fā)現(xiàn)檢測(cè)系統(tǒng)的大語(yǔ)言模型與ChatGPT 等AI 生成工具的大語(yǔ)言模型存在較多不同(詳見表2),其中最重要的差異就是兩者的訓(xùn)練機(jī)制不同。檢測(cè)系統(tǒng)的大語(yǔ)言模型依附于技術(shù)主體提供的海量學(xué)術(shù)文獻(xiàn)數(shù)據(jù)庫(kù),它通過對(duì)海量學(xué)術(shù)文獻(xiàn)進(jìn)行深度學(xué)習(xí),構(gòu)建了一個(gè)龐大的知識(shí)庫(kù)。當(dāng)有新文章提交檢測(cè)時(shí),系統(tǒng)會(huì)將其與知識(shí)庫(kù)中的文獻(xiàn)進(jìn)行比對(duì),從而快速找出相似或重復(fù)的內(nèi)容。因此,其訓(xùn)練語(yǔ)料的來源主要由兩部分構(gòu)成,一是基于現(xiàn)有文獻(xiàn)構(gòu)建的知識(shí)庫(kù),二是機(jī)構(gòu)或個(gè)人用戶提供的海量檢測(cè)樣本,前者構(gòu)成了檢測(cè)的人工對(duì)照組,而后者則構(gòu)成了檢測(cè)的AI對(duì)照組。由于現(xiàn)有文獻(xiàn)豐富,基于人工對(duì)照組的識(shí)別與區(qū)分訓(xùn)練相對(duì)容易,這就可以解釋為何前述檢測(cè)可以大概率識(shí)別真人是真人。相反,不管是知網(wǎng)檢測(cè)系統(tǒng)還是鑒字源檢測(cè)系統(tǒng),目前開放使用的時(shí)間都很短,用戶直接提交AI 代寫論文交由系統(tǒng)檢測(cè)的案例相對(duì)較少,進(jìn)而導(dǎo)致AI 對(duì)照組的語(yǔ)料來源相對(duì)匱乏,其文本識(shí)別與區(qū)分訓(xùn)練成熟度遠(yuǎn)遠(yuǎn)不及人工對(duì)照組,即本研究結(jié)果反饋的檢測(cè)系統(tǒng)較難識(shí)別AI 是AI。
此外,不同檢測(cè)系統(tǒng)大語(yǔ)言模型的結(jié)構(gòu)復(fù)雜性存在差異,再加上訓(xùn)練時(shí)間與語(yǔ)料質(zhì)量的參差,其實(shí)現(xiàn)的迭代次數(shù)不同,進(jìn)而導(dǎo)致模型學(xué)習(xí)成熟度的不同。就知網(wǎng)檢測(cè)系統(tǒng)與鑒字源檢測(cè)系統(tǒng)相比,知網(wǎng)檢測(cè)系統(tǒng)雖然依托著中國(guó)最大的學(xué)術(shù)期刊庫(kù),語(yǔ)言模型建構(gòu)基礎(chǔ)較好,但使用價(jià)格較高,容易導(dǎo)致學(xué)校、科研機(jī)構(gòu)等用戶選擇價(jià)格較為便宜、迭代更為成熟的鑒字源檢測(cè)系統(tǒng),進(jìn)而使其模型訓(xùn)練水平受限。這一點(diǎn)也能在一定程度上印證為何測(cè)試結(jié)果中鑒字源檢測(cè)系統(tǒng)檢測(cè)出的疑似占比更高。
2. 算法中目標(biāo)函數(shù)的優(yōu)化不當(dāng)
不同的模型可能采用不同的算法進(jìn)行訓(xùn)練和優(yōu)化,這些算法的效率和適應(yīng)性也會(huì)影響語(yǔ)言模型的最終表現(xiàn)。以知網(wǎng)檢測(cè)系統(tǒng)為例,算法中的目標(biāo)損失函數(shù)是比較檢測(cè)文本與AI 對(duì)照組差異的重要手段,其運(yùn)行效率和方式的改變將會(huì)直接導(dǎo)致模型在優(yōu)化過程中所關(guān)注的文本特征發(fā)生變化,進(jìn)而影響檢測(cè)性能。隨著語(yǔ)言模型不斷深入地進(jìn)行機(jī)器學(xué)習(xí),當(dāng)初設(shè)計(jì)的目標(biāo)損失函數(shù)可能難以繼續(xù)匹配容量更大的知識(shí)庫(kù)樣本,新增的多樣化文本類型與特征也會(huì)使計(jì)算資源不堪重負(fù),如果不對(duì)函數(shù)功能進(jìn)行優(yōu)化、對(duì)性能進(jìn)行提升,則會(huì)導(dǎo)致模型迭代緩慢、檢測(cè)效率變低,最終影響檢測(cè)結(jié)果的準(zhǔn)確度。
此外,相關(guān)函數(shù)可能還會(huì)設(shè)定識(shí)別、區(qū)分文本特征的評(píng)價(jià)指標(biāo),不同系統(tǒng)設(shè)定的指標(biāo)不同,語(yǔ)言模型在優(yōu)化的方向上也會(huì)存在差異,比如更側(cè)重于提高局部的精細(xì)度還是整體的準(zhǔn)確度。就本研究的數(shù)據(jù)來看,雖然知網(wǎng)檢測(cè)系統(tǒng)輸出結(jié)果的疑似占比并不高,但其對(duì)于片段鑒別的精細(xì)度更高,原因就在于其評(píng)價(jià)指標(biāo)的多樣性,即以句子長(zhǎng)度特征及字詞分布特征、第一概率值、偏離度特征、擴(kuò)散度特征值這四個(gè)指標(biāo)綜合判定待檢測(cè)文本的可疑性。對(duì)于疑似程度賦予更為精細(xì)的權(quán)值而不是以簡(jiǎn)單的范圍作為函數(shù)運(yùn)算的輸入值,將能夠較大程度體現(xiàn)文本的疑似特征。相反,鑒字源檢測(cè)系統(tǒng)雖然標(biāo)識(shí)了較多范圍的疑似片段,但局部精細(xì)度明顯不足,難以突出特定語(yǔ)句的疑似特征。由此可以反向推出,鑒字源檢測(cè)系統(tǒng)評(píng)價(jià)指標(biāo)的多樣性稍顯欠缺。
3. 人工預(yù)設(shè)詞庫(kù)匱乏
知網(wǎng)檢測(cè)系統(tǒng)中的“預(yù)設(shè)字典”指的是一個(gè)事先定義好的詞匯集合或詞匯數(shù)據(jù)庫(kù),它用于輔助檢測(cè)系統(tǒng)在分析和識(shí)別AI 生成文本時(shí),對(duì)特定詞匯或表達(dá)方式的使用進(jìn)行評(píng)估。預(yù)設(shè)字典通常包括AIGC 的高頻詞匯、特殊表達(dá)、語(yǔ)言模式、錯(cuò)誤或異常用法等詞庫(kù)。設(shè)定此類詞庫(kù)的目的在于提供一組標(biāo)準(zhǔn)或參考,以便檢測(cè)系統(tǒng)可以有效地對(duì)文本進(jìn)行分析和判定。通過比較待檢測(cè)文本中的詞匯使用、表達(dá)方式、語(yǔ)言模式等與預(yù)設(shè)字典中的條目,檢測(cè)系統(tǒng)可以更準(zhǔn)確地判斷文本是否為AI 生成。
然而,如果預(yù)設(shè)字典只由檢測(cè)系統(tǒng)通過檢測(cè)樣本進(jìn)行收集與擴(kuò)充,那么在檢測(cè)從未遭遇過的AIGC 片段時(shí),系統(tǒng)很難判別此樣本是否為AI 代寫。知網(wǎng)檢測(cè)系統(tǒng)與鑒字源檢測(cè)系統(tǒng)之所以對(duì)AI 樣本具有弱敏感性,根本原因還在于預(yù)設(shè)字典中缺少人為添加AIGC詞庫(kù)的功能。本研究AI 生成組中一些人工能夠大概率辨識(shí)的模板化AIGC 片段(模板句式雖然也會(huì)由真人使用,但一般不會(huì)在段落中循環(huán)反復(fù)出現(xiàn),這容易被檢測(cè)系統(tǒng)忽略),如ChatGPT 被高頻提示詞引導(dǎo)后經(jīng)常生成的句首“本研究的結(jié)論強(qiáng)調(diào)了”“本文主要探討了”“本文揭示了”等通過了檢測(cè),足以說明目前市面上的研發(fā)企業(yè)對(duì)檢測(cè)系統(tǒng)的設(shè)計(jì)忽略了這一點(diǎn)。相反,本研究使用的AI 改寫軟件卻具有自定義詞庫(kù)的功能,能夠不斷收錄用戶偏好的詞句,通過不斷學(xué)習(xí)和模仿用戶的文風(fēng)和寫作習(xí)慣,以增強(qiáng)其對(duì)AIGC 的反偵測(cè)能力。如此發(fā)展下去,AIGC 檢測(cè)系統(tǒng)將會(huì)在AI 改寫軟件迭代更新中落于下風(fēng),陷入止步不前的困境。
四、學(xué)術(shù)期刊因應(yīng):系統(tǒng)研發(fā)與期刊發(fā)展的良性互動(dòng)
不管是AI生成技術(shù)的濫用,還是更有針對(duì)性的AI 改寫技術(shù)的迭代,學(xué)術(shù)期刊都面臨著識(shí)別和管理AI 生成文本的挑戰(zhàn),與廣泛普及的文獻(xiàn)重復(fù)率檢測(cè)系統(tǒng)一樣,未來期刊主體對(duì)AIGC 檢測(cè)系統(tǒng)的使用也是勢(shì)在必行。但正如前文所述,目前的AIGC 論文檢測(cè)系統(tǒng)還存在較多技術(shù)缺陷,如果期刊主體引入相關(guān)系統(tǒng)卻不善于運(yùn)用和訓(xùn)練系統(tǒng),以輔助審稿,則難以應(yīng)對(duì)飛速發(fā)展的AIGC 技術(shù)并實(shí)現(xiàn)學(xué)術(shù)期刊的數(shù)智化發(fā)展。為此,本研究認(rèn)為應(yīng)當(dāng)將出版科技企業(yè)對(duì)檢測(cè)系統(tǒng)的研發(fā)目標(biāo)滲透到學(xué)術(shù)期刊行業(yè)的整體發(fā)展層面,雙方在這個(gè)過程中需要積極構(gòu)建人機(jī)協(xié)同、良性循環(huán)的溝通與合作。學(xué)術(shù)期刊作為技術(shù)需求主體,則需從研發(fā)配合、行業(yè)發(fā)展、編輯實(shí)踐三個(gè)層面促成這種良性互動(dòng)。
1. 系統(tǒng)研發(fā)配合層面
首先,學(xué)術(shù)期刊出版單位應(yīng)主動(dòng)與技術(shù)提供商進(jìn)行溝通,了解最新的AIGC 檢測(cè)技術(shù),并根據(jù)自身的需求提出建議,以促進(jìn)系統(tǒng)研發(fā)的不斷完善和發(fā)展。在測(cè)試系統(tǒng)的使用過程中,筆者曾與系統(tǒng)推廣人員進(jìn)行溝通,并將部分檢測(cè)結(jié)果以及測(cè)試樣本反饋給相關(guān)后臺(tái)人員。在溝通過程中能夠發(fā)現(xiàn),檢測(cè)系統(tǒng)的銷售推廣人員與技術(shù)服務(wù)人員并非十分清楚系統(tǒng)的功能設(shè)計(jì)不足與技術(shù)機(jī)制缺陷,對(duì)于AI 生成工具與改寫工具的迭代現(xiàn)狀與市場(chǎng)發(fā)展也缺乏細(xì)致了解。這很大程度是由于學(xué)術(shù)科研機(jī)構(gòu)與期刊單位對(duì)于檢測(cè)系統(tǒng)的使用不夠深入,負(fù)面反饋不足。系統(tǒng)研發(fā)人員通常沒有學(xué)術(shù)出版行業(yè)的從業(yè)經(jīng)驗(yàn),因而對(duì)于系統(tǒng)的升級(jí)與完善未充分考慮用戶的實(shí)際使用體驗(yàn)和感受。期刊單位作為檢測(cè)系統(tǒng)的最龐大用戶群體,如若不積極主動(dòng)地提供自身的需求與建議,則難以使研發(fā)人員實(shí)時(shí)推進(jìn)大語(yǔ)言模型的發(fā)展、相關(guān)算法的優(yōu)化以及預(yù)設(shè)字典的擴(kuò)充。
其次,學(xué)術(shù)期刊出版單位應(yīng)積極參與新版本檢測(cè)系統(tǒng)的測(cè)試,根據(jù)論文類型、學(xué)科場(chǎng)景、應(yīng)用領(lǐng)域提供更為豐富的檢測(cè)樣本,幫助技術(shù)提供商優(yōu)化語(yǔ)言模型和配套算法,使其更加精準(zhǔn)和高效。如前文所述,檢測(cè)系統(tǒng)大語(yǔ)言模型的訓(xùn)練需要兼?zhèn)浜A康膶W(xué)術(shù)文獻(xiàn)知識(shí)庫(kù)和AIGC 文本,而目前用戶向系統(tǒng)中輸入的AIGC 文本還遠(yuǎn)不能夠匹配現(xiàn)有知識(shí)庫(kù),導(dǎo)致訓(xùn)練素材與活動(dòng)的匱乏。不同領(lǐng)域、學(xué)科、行業(yè)的期刊具有多樣性的專業(yè)實(shí)踐基礎(chǔ),可以在出版活動(dòng)中基于日常收稿輸出大量經(jīng)過訓(xùn)練的具有高質(zhì)量、高專業(yè)度、高仿真性的AIGC 文本。這些優(yōu)質(zhì)文本可以大幅度縮減語(yǔ)言模型的迭代時(shí)間間隔,不斷提高系統(tǒng)對(duì)不同場(chǎng)景的適應(yīng)性和檢測(cè)不同學(xué)科論文的準(zhǔn)確度。
最后,學(xué)術(shù)期刊出版單位應(yīng)注重日常積累并記錄在出版活動(dòng)中發(fā)現(xiàn)的疑似AI 生成的特殊詞匯或語(yǔ)句,將其分門別類地添加到基于特定學(xué)科或?qū)崉?wù)場(chǎng)景的詞庫(kù)中,以供預(yù)設(shè)字典作為參考。僅依靠研發(fā)企業(yè)自身收集的詞庫(kù)難以滿足語(yǔ)言模型進(jìn)行識(shí)別與比較文本時(shí)所需的語(yǔ)料資源,而期刊審稿、編輯、校對(duì)人員在各個(gè)出版環(huán)節(jié)中積累的高頻詞匯、特殊表達(dá)、語(yǔ)言誤用或異常用法能夠大幅度彌補(bǔ)系統(tǒng)收集能力的不足,進(jìn)一步完善比照標(biāo)準(zhǔn)。預(yù)設(shè)字典的完善本質(zhì)上是一種人機(jī)協(xié)同的發(fā)展過程,系統(tǒng)將單個(gè)期刊人工創(chuàng)建的詞庫(kù)收集起來,發(fā)布到整個(gè)期刊集群之中,詞庫(kù)再被其他期刊利用來檢測(cè)AI 文本,輸出正向反饋,以此可形成期刊與期刊之間、期刊與系統(tǒng)之間的良性互動(dòng)。
2. 期刊行業(yè)發(fā)展層面
AIGC 論文檢測(cè)系統(tǒng)反饋的疑似文字占比實(shí)際上是一種類似于論文重復(fù)率的中性數(shù)值,但與單純的抄襲、不規(guī)范引用不同,AIGC的具體內(nèi)容并不一定對(duì)于學(xué)術(shù)研究與期刊行業(yè)發(fā)展毫無(wú)用處。期刊行業(yè)作為知識(shí)創(chuàng)新的守門人,把握著知識(shí)生產(chǎn)的演進(jìn)方向,[9] 因而更需要客觀評(píng)價(jià)檢測(cè)系統(tǒng)的結(jié)果,以規(guī)避AI 代寫的學(xué)術(shù)不端行為和辯證利用AI 生成的高質(zhì)量與真實(shí)性知識(shí)內(nèi)容作為使用檢測(cè)系統(tǒng)的雙重目標(biāo)。
一方面,學(xué)術(shù)期刊要以篩除低質(zhì)量AI 文本為目標(biāo),嚴(yán)格把關(guān)惡意利用AI 工具的學(xué)術(shù)不端行為。為此,可以基于AIGC 檢測(cè)系統(tǒng)建立學(xué)術(shù)期刊互聯(lián)的內(nèi)部局域網(wǎng)與期刊行業(yè)云,建立更緊密的檢測(cè)系統(tǒng)處理與期刊結(jié)果反饋評(píng)價(jià)之間的互聯(lián)互通,實(shí)現(xiàn)AI 稿件拒稿信息以及AIGC疑似文本的共享。目前知網(wǎng)騰云采編系統(tǒng)在升級(jí)版本(V10.3)中就采用了“刊群”功能用于期刊互聯(lián),不管是因一稿多投還是其他學(xué)術(shù)不端行為被退稿,作者及文章都有可能會(huì)被期刊社群體拉黑、拒稿。同時(shí),該系統(tǒng)還實(shí)現(xiàn)了正常退稿后作者的一鍵轉(zhuǎn)投功能,大大提升了期刊對(duì)同領(lǐng)域論文的資源共享能力。AIGC 檢測(cè)系統(tǒng)的發(fā)展同樣可以利用刊群的共享機(jī)制,通過召集期刊出版單位共同打擊AI 代寫慣犯、共同評(píng)價(jià)AI代寫文本,使期刊行業(yè)能夠齊心協(xié)力應(yīng)對(duì)學(xué)術(shù)科研領(lǐng)域的AI 亂象。
另一方面,學(xué)術(shù)期刊要以合理利用高質(zhì)量AI 文本為目標(biāo),充分發(fā)揮AIGC 技術(shù)的知識(shí)生產(chǎn)能力。在評(píng)估AIGC 檢測(cè)系統(tǒng)提供的疑似文字占比時(shí),期刊單位應(yīng)考慮AI 生成內(nèi)容的質(zhì)量和真實(shí)性。在適當(dāng)引用和標(biāo)注的前提下,高質(zhì)量的AI 生成內(nèi)容也能推動(dòng)學(xué)術(shù)發(fā)展。同時(shí),期刊出版單位要嚴(yán)格把控學(xué)術(shù)原創(chuàng)性的標(biāo)準(zhǔn),善于引導(dǎo)作者有效、規(guī)范地利用AI 工具,展現(xiàn)自身的獨(dú)立思考和學(xué)術(shù)貢獻(xiàn),避免學(xué)術(shù)不端行為出現(xiàn)。
3. 期刊編輯實(shí)踐層面
編輯是在期刊出版活動(dòng)中實(shí)際利用AIGC檢測(cè)系統(tǒng)的主體,檢測(cè)結(jié)果是否準(zhǔn)確最終應(yīng)當(dāng)由編輯決定。對(duì)于一些經(jīng)過深入訓(xùn)練和調(diào)教而生成的高度類人化文本,雖然檢測(cè)系統(tǒng)難以通過語(yǔ)句成分和邏輯表達(dá)識(shí)別其AI 成分,但編輯依然可以憑借對(duì)內(nèi)容真實(shí)性和科學(xué)性的判斷來把握真?zhèn)?。正是由于AIGC 檢測(cè)系統(tǒng)尚未成熟以及具有種種缺陷,編輯更應(yīng)該發(fā)揮人機(jī)關(guān)系協(xié)同者的身份,樹立正確的人機(jī)協(xié)同理念,引導(dǎo)系統(tǒng)的最優(yōu)化發(fā)展。[10]
第一,學(xué)術(shù)期刊編輯要不斷關(guān)注和促進(jìn)AIGC 檢測(cè)系統(tǒng)中大語(yǔ)言模型的迭代,推動(dòng)模型配套算法的性能優(yōu)化,完善個(gè)性化的預(yù)設(shè)詞庫(kù)。雖然大多數(shù)期刊編輯只具有學(xué)科特長(zhǎng)而不具有技術(shù)敏感性,但大模型賴以進(jìn)化的資源根本上還是來源于編輯的日常審稿校對(duì)活動(dòng)。通過對(duì)檢測(cè)結(jié)果進(jìn)行更為準(zhǔn)確的人工標(biāo)注,不斷反饋給系統(tǒng)并修正AI 評(píng)價(jià)指標(biāo),編輯可以正確引導(dǎo)語(yǔ)言模型向有利于學(xué)術(shù)出版實(shí)踐的方向發(fā)展。此外,不同期刊的編輯通過積極參與刊群、共同監(jiān)測(cè)異常等方式建設(shè)模型公共訓(xùn)練平臺(tái),可以有效避免AIGC內(nèi)容擴(kuò)散并污染文獻(xiàn)知識(shí)庫(kù),確保系統(tǒng)基礎(chǔ)文獻(xiàn)資源的可靠性。[11]
第二,學(xué)術(shù)期刊編輯要主動(dòng)培養(yǎng)自身識(shí)別AIGC 的技能,知己知彼才能克服AIGC檢測(cè)的各種缺陷。隨著OpenAI 在2024 年4月1 日宣布ChatGPT 無(wú)須注冊(cè)即可使用,越來越多的期刊編輯將能夠更加容易學(xué)習(xí)并使用最前沿的AI 工具。期刊編輯只有在相關(guān)操作實(shí)踐中才能深入理解AIGC 的工作原理、算法,在期刊出版工作中利用好AIGC 檢測(cè)系統(tǒng)分析結(jié)果,從而發(fā)揮基于系統(tǒng)之上的獨(dú)立思考能力,做到活學(xué)活用,用AI 打敗AI。[12]
第三,學(xué)術(shù)期刊編輯要構(gòu)建自身的AIGC評(píng)判標(biāo)準(zhǔn),基于學(xué)科專業(yè)性、場(chǎng)景適用性、知識(shí)創(chuàng)新性來鑒別檢測(cè)系統(tǒng)的輸出結(jié)果。這樣的標(biāo)準(zhǔn)旨在確保能夠有效識(shí)別和利用AI 生成內(nèi)容,同時(shí)保護(hù)學(xué)術(shù)誠(chéng)信和促進(jìn)原創(chuàng)性研究。學(xué)科專業(yè)性意味著文章是否展現(xiàn)了必要的專業(yè)知識(shí)和理論深度,文中專業(yè)術(shù)語(yǔ)的使用是否準(zhǔn)確,以及是否恰當(dāng)?shù)胤从沉藢W(xué)科的當(dāng)前發(fā)展?fàn)顟B(tài);場(chǎng)景適用性意味著文章內(nèi)容與學(xué)術(shù)期刊的主題和范圍是否高度相關(guān),是否符合目標(biāo)讀者群體的特定需求和學(xué)術(shù)興趣;知識(shí)創(chuàng)新性意味著文章的理論、方法、實(shí)驗(yàn)設(shè)計(jì)或研究結(jié)果是否新穎,引用內(nèi)容是否是對(duì)現(xiàn)有文獻(xiàn)的簡(jiǎn)單復(fù)述。遵循這些符合期刊發(fā)展規(guī)律的實(shí)際評(píng)判標(biāo)準(zhǔn),才能打破AICG檢測(cè)系統(tǒng)的機(jī)械化認(rèn)知,真正讓AI 服務(wù)于編輯工作。
五、結(jié)語(yǔ)
隨著AIGC 技術(shù)的成熟以及使用門檻的降低,作為學(xué)術(shù)不端行為守門人的期刊編輯將承擔(dān)防范AI 代寫行為的重任。筆者測(cè)試比較了兩種AIGC 論文檢測(cè)系統(tǒng)的檢測(cè)能力,從技術(shù)人員視角對(duì)系統(tǒng)的語(yǔ)言模型、算法函數(shù)、評(píng)價(jià)參數(shù)進(jìn)行了較為細(xì)致的梳理,分析得出系統(tǒng)技術(shù)缺陷背后的問題根源;再?gòu)膶W(xué)術(shù)期刊編輯的視角將缺陷的解決引入期刊實(shí)踐工作之中,最終提出學(xué)術(shù)期刊需要與技術(shù)提供方進(jìn)行良性互動(dòng),讓系統(tǒng)的發(fā)展成果能夠真正輔助期刊編輯鑒別AI 代寫行為并合理利用AIGC 的優(yōu)質(zhì)內(nèi)容。由于經(jīng)濟(jì)成本與篇幅原因,本研究未能獲取更多學(xué)科的檢測(cè)樣本,也未能使用更多的檢測(cè)系統(tǒng)獲取更多的檢測(cè)數(shù)據(jù),使得研究在大規(guī)模的統(tǒng)計(jì)學(xué)意義上缺乏更加可信的數(shù)據(jù)結(jié)果。此外,由于難以獲取有關(guān)檢測(cè)系統(tǒng)更為詳細(xì)的公開技術(shù)信息,對(duì)于技術(shù)原理的分析存在一些只基于技術(shù)邏輯但未經(jīng)現(xiàn)實(shí)檢驗(yàn)的推測(cè),有待于系統(tǒng)技術(shù)人員的進(jìn)一步證實(shí)。未來期待在多學(xué)科、多場(chǎng)景、多環(huán)節(jié)的AI 文本檢測(cè)領(lǐng)域繼續(xù)推進(jìn)該主題的研究。
延伸閱讀:在學(xué)術(shù)出版中合理利用AIGC技術(shù)
2024年4月,知名期刊《自然》(Nature)的專欄文章《ChatGPT 通過三種方式幫助我進(jìn)行學(xué)術(shù)寫作》(Three Ways ChatGPT Helps Me in My AcademicWriting)引起學(xué)術(shù)界的廣泛關(guān)注。文章提出AIGC 可以為學(xué)術(shù)出版提供以下三點(diǎn)幫助,但要提供精確的指示。
第一,潤(rùn)色學(xué)術(shù)寫作。作者使用AIGC 來完善論文某個(gè)部分時(shí),可先概述上下文,再使用如下指令:我正在為一份【學(xué)科】學(xué)術(shù)期刊寫一篇關(guān)于【主題】的論文。我在以下部分試圖表達(dá)的是【具體觀點(diǎn)】。請(qǐng)重新措辭,使其更加清晰、連貫和簡(jiǎn)潔,確保每個(gè)段落之間的流暢銜接。使用專業(yè)術(shù)語(yǔ)。
第二,提高同行評(píng)審。專家在閱讀稿件后可以使用AIGC組織評(píng)審報(bào)告。如使用以下指令:根據(jù)我對(duì)【領(lǐng)域】中一篇關(guān)于【主題】的論文的總結(jié),提供一份詳細(xì)的評(píng)審報(bào)告,順序如下:①簡(jiǎn)要論述其核心內(nèi)容;②指出論文的局限性;③給出修改建議。始終保持簡(jiǎn)潔和專業(yè)的語(yǔ)氣。
第三,優(yōu)化編輯反饋。AIGC 可以幫助編輯撰寫精確、可操作的審稿意見。如使用以下指令:根據(jù)我的筆記,起草一篇審稿意見。指出文稿的關(guān)鍵問題,并解釋為什么盡管文稿的選題有一定意義,但由于無(wú)法提供足夠的借鑒參考價(jià)值而難以發(fā)表。請(qǐng)保持專業(yè)和尊重的語(yǔ)氣。
AIGC技術(shù)給學(xué)術(shù)出版帶來了挑戰(zhàn),但也可以提高學(xué)術(shù)出版工作的質(zhì)量。AIGC 技術(shù)可以輔助我們寫作、審閱和編輯文稿,并改善我們交流研究的方式。