余瑞芬?朱丹
【摘要】? 當下,算法在學術評價中具有較大影響,引發(fā)了使用檢測報告時人與技術誰是主宰的爭辯。從應用特征來看,算法具有不透明性、局限性及權力擴張化等特點,誘發(fā)了其與著作權法的深層次不融合。要解決因算法權力擴張而形成的制度適應問題,就要以著作權法為出發(fā)點去考量算法,細分比對庫的文類,拓寬識別對象,從作者自覺遵守學術論文規(guī)范和他人有效監(jiān)督兩方面,讓學術論文評價回歸社群自治。
【關? 鍵? 詞】著作權;學術論文;相似度檢測;算法
【作者單位】余瑞芬,江西科技學院教育學院;朱丹,江科學術研究編輯部。
【中圖分類號】D923.41 【文獻標識碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2021.19.021
隨著互聯(lián)網(wǎng)的興起與發(fā)展,各大知識資源數(shù)據(jù)庫相繼開發(fā)了相似度檢測系統(tǒng),這類系統(tǒng)通過算法計算得出檢測報告。在評價學術論文時,這些報告被視為重要的甚至決定性的標準。算法檢測之所以成為主流,很大程度上是因為數(shù)字便利化產(chǎn)生的積極效應,但也引發(fā)了很多問題。探討算法檢測引發(fā)的問題,對于探索我國學術論文評價路徑優(yōu)化是一項重要課題。
一、著作權法視角下算法檢測的考量
本文定位于算法本身,從相似度檢測、反檢測考量、數(shù)字痕跡處理三個角度去反觀著作權法視角下的算法檢測。
1.相似度檢測與作品獨創(chuàng)性認定有偏差
新出臺的論文行業(yè)標準對相關術語進行了定義,認定標準更加細致實用。但在實際操作中,高校和期刊需要更為便捷高效的評價方法,比如很多高校評價學位論文時習慣使用算法檢測方法,以初步篩查人工答辯的范圍,這極容易造成一些不良后果。首先,為了保證比對庫作品的“質”和“量”,相關機構試圖積累各種“充分數(shù)據(jù)”,擴大超文本和“數(shù)據(jù)湖”容量,這使得各資源庫陷入無序的市場競爭中。其次,以連續(xù)多個字為單位,待檢測論文被分解成無數(shù)小單位,這在一定程度上破壞了作品的思想獨創(chuàng)性。
當下,算法檢測越來越多地被作為學術論文評價的手段,但這與作品獨創(chuàng)性認定原則有偏差?!蹲罡呷嗣穹ㄔ宏P于審理著作權民事糾紛案件適用法律若干問題的解釋》第15條規(guī)定了獨創(chuàng)性需滿足兩個條件:其一,是否由作者獨立完成;其二,是否具備“創(chuàng)作屬性”。就第一個條件來看,數(shù)據(jù)學習和分析使人們的關注點集中在檢測結果本身,作者的創(chuàng)作過程得不到應有的重視,在網(wǎng)絡空間里,“獨立完成作品”這個條件很難論證;就第二個條件來看,檢測機構最終提供一份數(shù)據(jù)報告,以規(guī)定的重復率為標準,這使得作者的創(chuàng)作行為不再具有原本意義上的創(chuàng)作屬性。
2.“反檢測”考量異化了表達規(guī)則
本文所說的“反檢測”考量是指在相似度檢測的前提下,作者對檢測系統(tǒng)和方法的關注,以及在一系列技巧的指引下對論文的修改。我們可以看到,在體現(xiàn)學術自由上,“反檢測”考量與表達規(guī)則是背道而馳的。學術自由是內在思想和外化表達結合的體現(xiàn),作者有權利在公開場合展示知識,并且有權利選擇是否公開表達自己的思想。但學術自由和“表達”在“反檢測”考量中受到了較大影響。其一,“反檢測”考量影響了表達的多樣性。同一思想可以外化成不同的表達方式,過于倚重文字這一表達方式,就容易忽略圖片等方式。其二,“反檢測”考量割裂了思想與表達。思想與表達是作品不可或缺的組成部分,“反檢測”考量使人們無法真正了解作品所要體現(xiàn)的思想,從而割裂了思想和表達。
3.數(shù)字痕跡處理消解了著作權的私權屬性
數(shù)字痕跡處理將數(shù)字曝光在公眾視野里,使得數(shù)字痕跡擁有公私兩種屬性。一方面,數(shù)字痕跡“精準刻畫”個人信息,其對象、主體和媒介都具有私權屬性;另一方面,基于公共基礎設施,數(shù)字通過相互配合與社交泛化,形成全數(shù)據(jù)模式。而作品自創(chuàng)作完成時依法享有著作權,這是一種原始權力保護,帶有“依照受控行為界定專有權利”的特點,本質屬于不是權利人自用而是他人禁止權的私權。在一個封閉計算的流程中,待檢測論文生成的數(shù)字痕跡至少交互了兩次,在格式化檢測中被初次支配,在匹配算法中被深度計算,或許還將在檢測報告中被循環(huán)轉換??梢?,數(shù)字痕跡處理在消解作品本身的同時也在消解著作權的私權屬性。
二、根源——算法的應用特征不融合
1.算法的不透明性
(1)技術因素:算法技術保護模式具有私法屬性。目前,國外對算法的技術保護有商業(yè)秘密模式與專利模式兩種,都屬于私法保護模式。商業(yè)秘密模式重點在于全方位的保護,當算法造成實際損害時,對其追責效率降低。而在專利模式下,常見的“黑箱”算法、“感知”算法和“奇異”算法則超越了人類當前的認知范疇,連發(fā)明人都很難清晰地描述技術方案里的具體操作規(guī)程[1]。
(2)人為因素:對算法技術不了解,但絕對信任。算法常常被視為中立的、權威的、科學的代號,它的出現(xiàn)把人們從具體的可信賬本中解放出來,轉而信任普遍主義的抽象系統(tǒng)。數(shù)字經(jīng)濟依靠平臺擴張,產(chǎn)生信用資產(chǎn)化效應,用戶在信任中創(chuàng)造并獲得價值。陌生人在數(shù)字世界通過一定的合約機制就可以建立信用共識,不需要第三方的調處[2]。在這種絕對信任下,人類想“利用算法、模型等數(shù)學方法重塑一個更加客觀的現(xiàn)實世界”,被學者生動地定義為盲目的“數(shù)學洗腦”。
2.算法的局限性
(1)比對庫資源有限,沒有細分文類。無論是全樣本數(shù)據(jù),還是傳統(tǒng)抽樣小數(shù)據(jù),都可能存在樣本偏差。在樣本識別與設計中,樣本不完整問題越突出,特征數(shù)據(jù)就越容易“以偏概全”,導致檢測結果缺乏完整性與代表性。因此,各大知識資源數(shù)據(jù)庫積極爭搶數(shù)字情報,擴大文獻類型的覆蓋面。但目前國內大多數(shù)比對庫尚未在文類上細分文獻資源,文獻規(guī)模也無法實現(xiàn)“充分數(shù)據(jù)”。
(2)計算序列有限,執(zhí)行過于機械化。算法是將輸入轉化為輸出的計算步驟的序列[4],在算法模式下,對同一類問題的任何初始輸入,機器都能展開計算,在完成有限步驟之后終止計算。如果一個算法有缺陷或不適合某個問題,在經(jīng)過有限步驟的計算后,機器將得不出結果,進入死循環(huán)??梢?,過于機械化的執(zhí)行可能會讓系統(tǒng)陷入困境。
3.算法權力擴張化
算法在為人類數(shù)據(jù)評估和行為分析帶來便利的同時,也因“黑箱”操作而泛化為權力擴張。首先,權力在政府治理中的擴張。如果學術評價比較重視重合率,那么教育等相關機構就會推廣使用相似度檢測的方法,在這樣的背景下,各大高校和期刊也只愿意購買能提供該項服務的知識庫。其次,權力在物理邊界上的擴張。互聯(lián)網(wǎng)的虛擬數(shù)字傳播極快,下載功能極為便捷,推進了自然語言信息化,擴大了知識共享的接觸空間。如今的學術文獻浩如煙海,數(shù)據(jù)庫發(fā)生集聚,數(shù)據(jù)聯(lián)系強化,這讓處于某個細分領域的作品與自然語言之間的關系更加密切。數(shù)據(jù)分析框架對人和世界產(chǎn)生了決定性影響,論文檢測不僅是事后對抄襲行為的監(jiān)測,而且成為框定論文是否符合原創(chuàng)標準的一種調控技術[5]。
三、應對——學術論文評價路徑的優(yōu)化
日前,中央宣傳部、教育部、科學技術部、工業(yè)和信息化部、公安部、文化和旅游部、國家市場監(jiān)督管理總局、國家廣播電視總局等九部委印發(fā)《關于加強互聯(lián)網(wǎng)信息服務算法綜合治理的指導意見》,提出利用三年左右的時間,逐步構建治理機制健全、監(jiān)管體系完善、算法生態(tài)規(guī)范的算法安全綜合治理格局。這顯示我國在法律框架下已開展算法治理。在這樣的背景下,筆者認為,應當推動學術論文評價人類自覺化,規(guī)制算法權力。由于算法檢測在技術層面尚無法完全優(yōu)化,在學術論文評價中只能作為輔助手段,筆者建議,可從相似度檢測規(guī)則的優(yōu)化和對學術論文規(guī)范的遵守與監(jiān)督兩方面展開探索。
1.相似度檢測規(guī)則的優(yōu)化
檢測規(guī)則優(yōu)化包括文類細分與拓寬對象范圍兩方面,要研究這兩方面內容,首先要明確回答兩個問題:文類細分怎么從侵權判定中找到切口?相似度檢測怎么識別非“實質性相似”的作品?
(1)參照侵權判定制度,細分比對庫文類。在司法實踐中,對整體觀感法與抽象分離法的適用范圍和標準沒有進行嚴格區(qū)分,二者因讀者不同而形成了一個相對平衡的彈性空間。不同的讀者又因作品屬性不同,做出不同的處理,從而形成相似判斷的考量因素[6]。但是從屬性細分來看,文哲史類論文對功能和事實的表達勝過對審美或藝術性的表達,其承載了更多的技術特征和功能性元素,包含更多的公共領域素材,因而其獨創(chuàng)性認定有一定特殊性。一般來說,我們把論文上傳數(shù)據(jù)庫時已經(jīng)做了文類細分,但建立比對庫時沒有進行同樣的操作,導致數(shù)據(jù)循環(huán)在起點和終點處形成矛盾,檢測實效不匹配。因此,根據(jù)思想表達原則進行文類細分,是彌補算法評價局限性的關鍵。將作品的功能、思想、事實等元素剔除后,再進行相似度認定,更為科學規(guī)范。
(2)把識別對象拓寬到非“實質性相似”范圍。在司法實踐中,侵權裁判規(guī)則能夠解決一部分學術論文“實質性相似”的糾紛,但只靠作品比對不能實現(xiàn)學術論文的強勢保護,還需要利用學術專業(yè)判斷進行約束。具體來說,應拓寬識別對象,不限于識別“實質性相似”。我們應當尊重任何一種原創(chuàng)行為,加強對高級抄襲、公有領域的合理使用、翻譯、改寫、思想剽竊等行為的識別。為此,有關部門應重視學術專業(yè)判斷,使專業(yè)判斷能夠自主應對學術問題,而不是僅僅依靠公權力規(guī)制算法。
2.對學術論文規(guī)范的遵守與監(jiān)督
目前,對于算法規(guī)制,學者大多轉向法律和社會規(guī)范的互動,嘗試在法社會學理論中找到進路,避免自己陷入“法律更多而秩序更少”的境遇。
(1)作者遵守學術論文規(guī)范的自覺。為了開展自我保護,防止被數(shù)字權力評分與貼標簽,作者更愿意約束自身行為,做到合法合規(guī),將自己納入道德規(guī)范的框架。這說明作者具有良好的“合作者”品質[7],而這種品質促使作者自覺遵守相應規(guī)則,維護學術氛圍。
(2)他人對學術論文規(guī)范的有效監(jiān)督。他人對學術論文規(guī)范的監(jiān)督行為,如成立論文評價小組,實質上是讓論文評價更為民主化??偟膩碚f,要實現(xiàn)他人對學術論文規(guī)范的有效監(jiān)督,應從兩方面著手。其一,須提高論文評價小組成員對算法的警惕性,并以監(jiān)督者身份督促創(chuàng)作者重視學術規(guī)范,從社群層面構建學術論文評價的共建共治共享規(guī)則,而非過于依賴算法檢測結果。這樣,學術論文評價才有可能回歸到人工審核的社群自治[8]。另一方面,構建新型的學術秩序空間,讓作者回歸智力創(chuàng)造主體本身,形成治理機制健全、監(jiān)管體系完善、算法生態(tài)規(guī)范的算法安全綜合治理格局,促使評價機制更加民主化。
在評價學術論文時,算法檢測雖然給人們帶來了便利性,但也限制了人類智力成果獨立自信的表達,造成很多風險隱患。因此,在著作權法框架內,從算法應用特征出發(fā),找到相似度檢測的優(yōu)化規(guī)則,并發(fā)揮學術論文規(guī)范的作用,對于推動大數(shù)據(jù)時代論文行業(yè)的高質量發(fā)展具有現(xiàn)實意義。
|參考文獻|
[1]孫建麗. 論算法的法律保護模式[J]. 西北民族大學學報(哲學社會科學版),2019(5):148-154.
[2]郝國強. 從人格信任到算法信任:區(qū)塊鏈技術與社會信用體系建設研究[J]. 南寧師范大學學報(哲學社會科學版),2020(1):126-136.
[3]TYLERWOODS.“Mathwashing”Facebook and the zeitgeist of data worship[EB/OL]. (2016-06-08)[2021-06-18]. https://technical.ly/brooklyn/2016/06/08/fredbenenson-mathwashing-facebook-data-worship.
[4]算法導論(第3版)[M]. 殷建平,等譯. 北京:機械工業(yè)出版社,2012.
[5]段偉文. 數(shù)據(jù)智能的算法權力及其邊界校勘[J]. 探索與爭鳴,2018(10):92-100+143.
[6]梁志文. 版權法上實質性相似的判斷[J]. 法學家,2015(6):37-50+174.
[7]羅伯特·C.埃里克森. 無需法律的秩序[M]. 蘇力,譯. 北京:中國政法大學出版社,2016.
[8]謝嘉圖. 論規(guī)制網(wǎng)絡洗稿的社會規(guī)范路徑:以反思著作權法的功能為邏輯展開[J]. 電子知識產(chǎn)權,2019(8):14-29.