眭占菱 何亮亮 蔣潔
摘? ?要:數(shù)字經(jīng)濟(jì)新產(chǎn)業(yè)、新業(yè)態(tài)和新模式獲得加速培育的全新場(chǎng)景下,滲透千行百業(yè)的數(shù)據(jù)信息深度合成技術(shù)在提高生產(chǎn)效率、改善生活質(zhì)量、助力經(jīng)濟(jì)社會(huì)發(fā)展的同時(shí),眾多惡意應(yīng)用亦嚴(yán)重威脅個(gè)人權(quán)益、政治安全、社會(huì)穩(wěn)定和國(guó)家安全等等。文章從深度合成數(shù)據(jù)的概念與類(lèi)型入手,結(jié)合待證數(shù)據(jù)的特質(zhì)與現(xiàn)行采信模式,集中探討了深度合成待證數(shù)據(jù)影響鑒真算法實(shí)效、引發(fā)漣漪式信任衰退、威脅安全體系等關(guān)鍵性風(fēng)險(xiǎn),進(jìn)而提出嚴(yán)格遏止源頭違規(guī)、重塑專(zhuān)家鑒定模式、加強(qiáng)環(huán)境經(jīng)驗(yàn)支撐等一系列健全辨識(shí)機(jī)制的方式方法。
關(guān)鍵詞:深度合成;待證數(shù)據(jù);風(fēng)險(xiǎn)剖析;辨識(shí)機(jī)制
Abstract On one hand, the technology of data deep synthesis, which has been used in thousands of industries, improves the production efficiency and the quality of life, and helps the economic and social development. On the other hand, many malicious applications also seriously threaten personal rights, political security, social stability and national security. This paper starts with the concept and classification of data deep synthetic, combined with the characteristics of data to be proved and the current criteria of the accepting, focuses on the key risks in affecting the effectiveness of authentication algorithm, causing trust decline, infringing personal rights and interests, and threatening the security system. Then, it put forward a series of methods, such as strictly curbing source violations, reshaping the expert witness, and strengthening the supporting mechanism of circumstantial experience.
Key words deep synthesis; data to be proved; risk analysis; identification mechanism
隨著第五次科技革命和第三次產(chǎn)業(yè)革命深入推進(jìn),迅速滲透社會(huì)生活方方面面的人工智能技術(shù)應(yīng)用和開(kāi)放的海量數(shù)據(jù)有序流動(dòng)成為新時(shí)期培育新產(chǎn)品、打造新業(yè)態(tài)的關(guān)鍵支撐。2020年3月30日,《中共中央、國(guó)務(wù)院關(guān)于構(gòu)建更加完善的要素市場(chǎng)化配置體制機(jī)制的意見(jiàn)》勾勒了加速培育各領(lǐng)域數(shù)據(jù)高效開(kāi)發(fā)利用和數(shù)據(jù)資源有序流動(dòng)的數(shù)據(jù)要素市場(chǎng)的具體方案,既釋放出巨大的信息紅利、高質(zhì)量助推智能社會(huì)構(gòu)建,亦暴露出迭代更新的先進(jìn)產(chǎn)品持續(xù)引發(fā)諸多新型風(fēng)險(xiǎn)。如短短三年間,深度合成數(shù)據(jù)技術(shù)的主要產(chǎn)出形式已經(jīng)從肉眼可以識(shí)別的粗糙拼接物發(fā)展為“多重軟件檢測(cè)+人工復(fù)檢”仍然難以辨識(shí)的仿真精品①。
隨著《新一代人工智能發(fā)展規(guī)劃》《促進(jìn)新一代人工智能產(chǎn)業(yè)發(fā)展三年行動(dòng)計(jì)劃(2018-2020年)》《關(guān)于促進(jìn)人工智能和實(shí)體經(jīng)濟(jì)深度融合的指導(dǎo)意見(jiàn)》等貫徹落實(shí),深度合成數(shù)據(jù)產(chǎn)品的制作成本大幅降低而仿真水平迅速提升,致使基于人工智能程序和深度學(xué)習(xí)算法的數(shù)據(jù)內(nèi)容合成類(lèi)違規(guī)制品以幾何乘數(shù)泛濫成災(zāi),不僅給社會(huì)監(jiān)管帶來(lái)巨大困難,嚴(yán)重威脅自然人的人身安全和財(cái)產(chǎn)安全[1],一定程度上甚至阻滯了作為人權(quán)保障最后手段的規(guī)則救濟(jì)的有序運(yùn)轉(zhuǎn)[2]。尤其是在將運(yùn)用深度合成技術(shù)偽造的數(shù)據(jù)信息作為待證資料的特殊場(chǎng)景下,“如果證據(jù)規(guī)則跟不上人工智能技術(shù)發(fā)展的腳步,公民的基本權(quán)益和程序正義面臨的風(fēng)險(xiǎn)將大幅增加?!盵3]亟待以《新一代人工智能治理原則》的八項(xiàng)治理原則為軸心,結(jié)合《數(shù)據(jù)安全法(草案)》《人工智能標(biāo)準(zhǔn)化白皮書(shū)》等,搭建具象場(chǎng)景中人工智能應(yīng)用治理的實(shí)踐方案。
1? ?深度合成數(shù)據(jù)的概要分析
雖然美圖秀秀、會(huì)聲會(huì)影、Adobe Photoshop等應(yīng)用程序嵌入了修改數(shù)據(jù)內(nèi)容的功能,但通過(guò)生成對(duì)抗網(wǎng)絡(luò)(GAN)的機(jī)器學(xué)習(xí)周期進(jìn)行的以極端逼真的方式重塑現(xiàn)實(shí)的數(shù)據(jù)深度合成可以學(xué)習(xí)模仿任何數(shù)據(jù)分布,能夠創(chuàng)造出與現(xiàn)實(shí)世界極其相似的虛擬世界①。
自美國(guó)著名科技媒體網(wǎng)站“主板”(Motherboard)首次曝光深度偽造色情視頻的事件以來(lái),社會(huì)各界飽受深度合成技術(shù)暗黑面的困擾[4]。雖然全球主要站點(diǎn)大力封禁深度偽造的色情制品或政治人物音視頻[5],但持續(xù)走低的制作成本和不斷降低的發(fā)布難度以及互聯(lián)網(wǎng)固有的零邊界、匿名化、娛樂(lè)性等特質(zhì)使得惡意行為者不僅能夠在同一站點(diǎn)反復(fù)發(fā)布且可以在互聯(lián)網(wǎng)管制死角不斷創(chuàng)建和傳播各類(lèi)偽造的數(shù)據(jù)制品[6],嚴(yán)重威脅個(gè)人權(quán)益、社會(huì)穩(wěn)定、政治和國(guó)家安全等。
事實(shí)上,信息時(shí)代的數(shù)據(jù)深度合成(Deep Synthesis)本身是一個(gè)中性概念,泛指借助深度學(xué)習(xí)算法模型等智能化方案自動(dòng)生成文本、圖像、語(yǔ)音、視頻等數(shù)據(jù)內(nèi)容的一系列處理技術(shù)。
一方面,數(shù)據(jù)深度合成的正向應(yīng)用將創(chuàng)建的虛擬角色、聲音模擬、視頻渲染等廣泛應(yīng)用到娛樂(lè)文化、社交通訊、醫(yī)療保健等眾多場(chǎng)景之中,提升音視頻制作的效率與質(zhì)量,建立使用者的社交數(shù)字化分身,還原歷史人物或故去親友的肖像,提升醫(yī)學(xué)影像精度,彌補(bǔ)聽(tīng)力缺陷等。如2020年全國(guó)兩會(huì)期間,搜狗公司聯(lián)合新華社發(fā)布了通過(guò)語(yǔ)音、表情、唇動(dòng)、肢體動(dòng)作等數(shù)據(jù)深度合成的算法實(shí)時(shí)驅(qū)動(dòng)的全球首個(gè)動(dòng)態(tài)3D虛擬主播“新小微”,更好地滿(mǎn)足新聞呈現(xiàn)多樣化的需求,推動(dòng)智能化的媒體融合[7]。
另一方面,數(shù)據(jù)深度合成的負(fù)向應(yīng)用,亦稱(chēng)深度偽造(Deepfake),通過(guò)文本數(shù)據(jù)重組、表情數(shù)據(jù)遷移、動(dòng)作數(shù)據(jù)遷移等方式生成表面上高度可信的仿真制品,傳播虛假信息,操控受眾反應(yīng),嚴(yán)重威脅整個(gè)社會(huì)的安全體系與保障機(jī)制[8]。如FakeApp、FaceWap、DeepNude等一鍵合成不雅內(nèi)容的應(yīng)用程序引發(fā)各界爭(zhēng)議②;又如,深度合成馬斯克、奧巴馬、默克爾、佩羅西等歐美名流政客的虛假視頻引發(fā)廣泛的信任危機(jī)和安全憂(yōu)慮。
總體而言,基于深度學(xué)習(xí)的數(shù)據(jù)合成技術(shù)主要應(yīng)用在文本合成、視覺(jué)合成、聽(tīng)覺(jué)合成等三大領(lǐng)域。深度文本合成和視覺(jué)合成因循數(shù)據(jù)收集、模型訓(xùn)練、偽造內(nèi)容等核心步驟創(chuàng)造虛擬數(shù)字人及其所處的生態(tài)環(huán)境。深度聽(tīng)覺(jué)合成則主要采用拼接式語(yǔ)音合成或基于參數(shù)估算的合成方法重塑現(xiàn)實(shí)。相關(guān)戲仿性應(yīng)用產(chǎn)品迅速迭代,難以精準(zhǔn)及時(shí)地予以鑒識(shí)③,亟待構(gòu)建和完善規(guī)?;囊?guī)制體系。
2? ?待證數(shù)據(jù)的采信難題
證據(jù)是認(rèn)定案件事實(shí)的基礎(chǔ)和關(guān)鍵。21世紀(jì)以來(lái),隨著運(yùn)用計(jì)算機(jī)工具的違法犯罪模式日趨多樣化并呈現(xiàn)出高速增長(zhǎng)的態(tài)勢(shì),以二進(jìn)制編碼記載的能夠證明案件事實(shí)的數(shù)據(jù)愈加繁雜,立法部門(mén)開(kāi)始關(guān)注電子證據(jù)的相關(guān)性、真實(shí)性、合法性及其證明值等等?!队?jì)算機(jī)犯罪現(xiàn)場(chǎng)勘驗(yàn)與電子證據(jù)檢查規(guī)則》首次以列舉方式明確指出電子數(shù)據(jù)、存儲(chǔ)媒介和電子設(shè)備皆是電子證據(jù)這一全新證據(jù)形態(tài)的主要分支?!蛾P(guān)于辦理刑事案件收集提取和審查判斷電子數(shù)據(jù)若干問(wèn)題的規(guī)定》隨即明確將電子數(shù)據(jù)界定為“案件發(fā)生過(guò)程中形成的以數(shù)字化形式存儲(chǔ)、處理、傳輸?shù)哪軌蜃C明案件事實(shí)的數(shù)據(jù)”,并將“文檔、圖片、音視頻、數(shù)字證書(shū)、計(jì)算機(jī)程序等電子文件”列為典型的電子數(shù)據(jù)形式①?!豆矙C(jī)關(guān)辦理刑事案件電子數(shù)據(jù)取證規(guī)則(2019)》進(jìn)一步勾勒了電子數(shù)據(jù)證據(jù)收集、提取、檢查、實(shí)驗(yàn)、檢驗(yàn)、鑒定等全生命周期的規(guī)制體系。
2.1? ? 待證數(shù)據(jù)的特征分析
第五輪信息技術(shù)革命場(chǎng)景下進(jìn)入訴訟階段的數(shù)據(jù)囊括了所有以二進(jìn)制代碼形式存在的試圖經(jīng)過(guò)取證、舉證、質(zhì)證和認(rèn)證后能夠作為證據(jù)使用的信息內(nèi)容及其派生物。大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算等技術(shù)應(yīng)用的迅速迭代使得當(dāng)前司法實(shí)踐中充斥著多樣化的新型待證數(shù)據(jù)。相應(yīng)的證明能力(待證數(shù)據(jù)的適格性驗(yàn)證)和證明力(待證數(shù)據(jù)的證明效果驗(yàn)證)的法庭采信與人證、物證、書(shū)證等傳統(tǒng)證據(jù)形態(tài)差異較大。如一般證據(jù)規(guī)則為了更好地審核證據(jù)材料的真實(shí)性和合法性,通常要求扣押物理載體,但云計(jì)算的廣域分布式處理模式和一臺(tái)云服務(wù)器可能同時(shí)承載大量來(lái)源迥異的數(shù)據(jù)庫(kù)的特質(zhì),導(dǎo)致實(shí)踐中難以獲取云端數(shù)據(jù)的物理介質(zhì)。又如,大多數(shù)的傳統(tǒng)證據(jù)形態(tài)是完整的有形物,待證數(shù)據(jù)卻往往是零散的無(wú)形物,不僅難以形成完備合法的證據(jù)鏈,甚至不易證明證據(jù)來(lái)源的合法性。
2.2? ? 待證數(shù)據(jù)的采信模式
信息時(shí)代中飛速增長(zhǎng)的待證數(shù)據(jù)必須經(jīng)過(guò)查證屬實(shí)才能作為認(rèn)定事實(shí)的依據(jù)。我國(guó)立法部門(mén)不僅對(duì)待證數(shù)據(jù)的來(lái)源、取證主體、收集方式、存儲(chǔ)和出示等完整流程的合法性、數(shù)據(jù)內(nèi)容的真實(shí)性及其與案件事實(shí)的關(guān)聯(lián)性等的法庭審查作出原則性規(guī)定,還逐步建立了有關(guān)待證數(shù)據(jù)技術(shù)鑒定的多項(xiàng)國(guó)家標(biāo)準(zhǔn)和行業(yè)標(biāo)準(zhǔn)。尤其是評(píng)估判斷待證數(shù)據(jù)是否可以合理認(rèn)定為證據(jù)真實(shí)和鏈條完整的難題,除了少量可以經(jīng)由原被告或控辯雙方都認(rèn)可或是其他證據(jù)足以充分證明予以解決之外,絕大多數(shù)需要法官依據(jù)經(jīng)驗(yàn)和理性進(jìn)行審查判斷或是行業(yè)專(zhuān)家進(jìn)行高水平技術(shù)鑒定,部分個(gè)案輔以證人證言為證據(jù)基礎(chǔ)。
2.2.1? ?法官審查判斷
雖然我國(guó)沒(méi)有明確認(rèn)可西方國(guó)家普遍采用的自由心證制度,卻積極應(yīng)用在實(shí)踐之中。傳統(tǒng)的錄音錄像證據(jù)曾在很長(zhǎng)時(shí)間內(nèi)被認(rèn)定為可信度較高的證據(jù)形式,法官通常基于專(zhuān)業(yè)知識(shí)和審判經(jīng)驗(yàn),依據(jù)公正且準(zhǔn)確的標(biāo)準(zhǔn),自行判斷其證明力。隨著數(shù)字化音視頻的迅猛發(fā)展,個(gè)人無(wú)法直接讀取、需要借助特殊工具轉(zhuǎn)換輸出的以二進(jìn)制形式存儲(chǔ)的待證數(shù)據(jù)大幅增加。全生命周期涉及物理載體的可信性、收集方法的合法性、輸出內(nèi)容的真實(shí)性、相關(guān)人員的獨(dú)立性以及流程的完整性等一系列技術(shù)性較強(qiáng)的關(guān)鍵因素,即便經(jīng)驗(yàn)豐富的法官也會(huì)產(chǎn)生較大的質(zhì)疑和困惑,難以直接依據(jù)經(jīng)驗(yàn)和理性完成采信審核。然而,隨著千行百業(yè)的數(shù)字化進(jìn)程日益加快,數(shù)據(jù)類(lèi)證據(jù)材料在認(rèn)定案件事實(shí)中的價(jià)值愈加凸顯,眾多場(chǎng)景下不宜僅認(rèn)定為輔助性參考資料。因之,聘請(qǐng)具有學(xué)科權(quán)威身份和相關(guān)認(rèn)證資質(zhì)的專(zhuān)家運(yùn)用科學(xué)原理進(jìn)行真實(shí)性鑒定逐漸成為采信待證數(shù)據(jù)的重要前提。
2.2.2? ?專(zhuān)家技術(shù)鑒定
隨著計(jì)算機(jī)技術(shù)、生物醫(yī)藥技術(shù)及其他各種專(zhuān)精化技術(shù)發(fā)展,復(fù)雜零散的數(shù)據(jù)涉及的專(zhuān)門(mén)性問(wèn)題難以確定和解決。判斷數(shù)據(jù)內(nèi)容是否被篡改或偽造需要采用專(zhuān)業(yè)工具和技術(shù)方法進(jìn)行獲取、識(shí)別、存儲(chǔ)、傳輸和分析??茖W(xué)驗(yàn)證的范圍甚至包括數(shù)據(jù)取證主體、取證程序、取證標(biāo)準(zhǔn)、取證技術(shù)和取證工具等強(qiáng)關(guān)聯(lián)要素。這一任務(wù)惟有通過(guò)具備行業(yè)領(lǐng)先技術(shù)能力的專(zhuān)家群體依據(jù)鑒真規(guī)則開(kāi)展精準(zhǔn)辨識(shí),方可較為圓滿(mǎn)地完成。
3? ?深度合成待證數(shù)據(jù)的風(fēng)險(xiǎn)評(píng)估
數(shù)碼攝影誕生之初的圖像質(zhì)量較差,往往只能作為補(bǔ)充證人證言的說(shuō)明證據(jù)。直至高質(zhì)量的視頻數(shù)據(jù)直接完整地記錄了案件事實(shí),方才充分展現(xiàn)出證據(jù)價(jià)值。然而,數(shù)據(jù)量級(jí)擴(kuò)大且合成技術(shù)日趨復(fù)雜等大幅提升了識(shí)破偽造音視頻的難度。具有專(zhuān)門(mén)知識(shí)的特聘人員依據(jù)科學(xué)原理作出的結(jié)論性鑒定意見(jiàn)能夠準(zhǔn)確辨識(shí)待證數(shù)據(jù)真實(shí)性的假設(shè)處于風(fēng)雨飄搖之中。
3.1? ? 降低說(shuō)明證據(jù)可靠性
長(zhǎng)期以來(lái),證人證言一般不會(huì)被視為個(gè)案場(chǎng)景下獨(dú)立證明案件事實(shí)的實(shí)質(zhì)證據(jù),而是作為幫助找出案件真相的說(shuō)明證據(jù)。原因在于,個(gè)人對(duì)于物體或事件的認(rèn)知一般包括感知、理解、回憶和證明等四大要素。人類(lèi)的記憶并非自體封裝的音視頻重現(xiàn)系統(tǒng)。記憶的提取和表達(dá)是一個(gè)從龐雜的記憶數(shù)據(jù)庫(kù)的各子域拼湊出對(duì)應(yīng)內(nèi)容的過(guò)程。證人不僅應(yīng)當(dāng)知悉需要作證的內(nèi)容,往往還需要通過(guò)傳聞或推測(cè)填補(bǔ)闕值內(nèi)的記憶巢白。因之,記憶內(nèi)容的準(zhǔn)確性很容易受到外部信息與內(nèi)在心理的影響。證人通常也會(huì)主動(dòng)為記憶準(zhǔn)確性附加警示助詞,如“我覺(jué)得”“我認(rèn)為”“我不能肯定”等[9]。如英國(guó)華威大學(xué)(University of Warwick)的研究團(tuán)隊(duì)通過(guò)測(cè)試視頻重現(xiàn)與受試者之間的記憶關(guān)系,證實(shí)偽造視頻數(shù)據(jù)對(duì)于證人記憶的強(qiáng)烈暗示性①。由此,通過(guò)深度合成關(guān)涉案件的主要數(shù)據(jù)重塑現(xiàn)實(shí)體驗(yàn)并向證人展示,比傳統(tǒng)的文本偽造或圖像偽造更具直觀性和沖擊力,容易導(dǎo)致證人因混淆實(shí)際記憶和視覺(jué)效果而在無(wú)意中提供虛假證言[10]。也就是說(shuō),一方在法庭庭審過(guò)程中提交的深度偽造視頻鑲嵌的欺詐性數(shù)據(jù)內(nèi)容有可能影響證人準(zhǔn)確回憶事實(shí)真相,嚴(yán)重妨礙司法公正。
3.2? ? 影響鑒真算法成效
近年來(lái),基于復(fù)雜模型鑒識(shí)待證數(shù)據(jù)與運(yùn)用合并算法提升偽造數(shù)據(jù)可信度之間的“貓鼠游戲”愈演愈烈。持續(xù)迭代的生成對(duì)抗網(wǎng)絡(luò)編程技術(shù)致使深度偽造數(shù)據(jù)方案能夠迅速更新鑒真算法抵御模塊,難以形成能夠長(zhǎng)期有效地應(yīng)用到各行各業(yè)的可靠鑒真方法。目前主流的深度合成數(shù)據(jù)檢測(cè)技術(shù)仍然依賴(lài)基于偽造內(nèi)容數(shù)據(jù)集對(duì)模型檢測(cè)器的差異化訓(xùn)練和基于生物信息不一致性對(duì)偽造內(nèi)容數(shù)據(jù)的辨識(shí),很難妥善應(yīng)對(duì)迅速提升的深度合成技術(shù)。如紐約州立大學(xué)奧爾巴尼分校(University at Albany,State University of New York)的研究團(tuán)隊(duì)發(fā)現(xiàn)早期深度合成視頻技術(shù)的訓(xùn)練數(shù)據(jù)庫(kù)中大多是原始的靜態(tài)圖像數(shù)據(jù),導(dǎo)致算法無(wú)法準(zhǔn)確偽造生理特征,輸出的仿真制品中虛擬數(shù)字人的眨眼頻率遠(yuǎn)遠(yuǎn)低于真實(shí)視頻,進(jìn)而開(kāi)發(fā)出實(shí)驗(yàn)準(zhǔn)確率高達(dá)95%的眨眼檢測(cè)方法②。即通過(guò)第一神經(jīng)網(wǎng)絡(luò)掃描檢測(cè)是否包含人臉并自動(dòng)定位到眼部,進(jìn)而將眼部截圖輸入第二網(wǎng)絡(luò),再由第二網(wǎng)絡(luò)通過(guò)特征提取、序列學(xué)習(xí)和狀態(tài)預(yù)測(cè)等辨識(shí)是否為真人眨眼,進(jìn)而鑒別出偽造視頻。然而,這一全新的深度數(shù)據(jù)合成檢測(cè)模塊僅在短時(shí)間內(nèi)展現(xiàn)出較好的驗(yàn)證效果。事實(shí)上,該項(xiàng)成果公布不久之后,研究團(tuán)隊(duì)就收到了大量能夠通過(guò)“眨眼測(cè)試”的匿名視頻。這些制作者迅速在數(shù)據(jù)訓(xùn)練集中增加了大量閉眼圖像數(shù)據(jù),積極改良識(shí)別器算法,進(jìn)而導(dǎo)致“眨眼測(cè)試”完全失靈。
3.3? ? 引發(fā)漣漪式信任衰退
信息時(shí)代中,難以及時(shí)準(zhǔn)確地完成深度合成待證數(shù)據(jù)的鑒真義務(wù),有可能引發(fā)整個(gè)社會(huì)范圍內(nèi)的漣漪式信任衰退。窄域而言,具有極強(qiáng)技術(shù)性的深度偽造產(chǎn)品往往展現(xiàn)出難以識(shí)別的逼真度,不僅加大司法部門(mén)對(duì)于有關(guān)案件真相的數(shù)據(jù)真實(shí)性的質(zhì)疑,當(dāng)事人還有可能宣稱(chēng)作為證據(jù)的數(shù)據(jù)是經(jīng)過(guò)深度偽造合成的虛擬內(nèi)容,以達(dá)到混淆視聽(tīng)之目的。廣域而言,普遍運(yùn)用深度合成技術(shù)的大環(huán)境下,人們不敢輕易地相信所見(jiàn)所聞,嚴(yán)重威脅社會(huì)信任機(jī)制。
3.4? ? 侵害個(gè)人合法權(quán)益
深度合成待證數(shù)據(jù)的完整流程充斥著侵害個(gè)人隱私、尊嚴(yán)、平等、自由及其他合法的人身權(quán)和財(cái)產(chǎn)權(quán)的風(fēng)險(xiǎn)[11]。如原始數(shù)據(jù)的收集主體、收集方式和收集對(duì)象均有可能侵害個(gè)人隱私。又如,深度合成過(guò)程中對(duì)于訓(xùn)練內(nèi)容的特征提取可以分為自動(dòng)提取和手動(dòng)提取兩大分支。能夠自主學(xué)習(xí)的數(shù)據(jù)自動(dòng)提取模型在設(shè)計(jì)中可能被有意或無(wú)意地嵌入歧視性或侮辱性規(guī)則,手動(dòng)進(jìn)行分類(lèi)器訓(xùn)練的模型則一直受到操作者主觀偏見(jiàn)或認(rèn)知缺陷的影響,嚴(yán)重威脅自然人的尊嚴(yán)權(quán)、平等權(quán)和自由權(quán)。
3.5? ? 威脅國(guó)家安全體系
深度合成技術(shù)負(fù)面應(yīng)用的多個(gè)領(lǐng)域直接關(guān)聯(lián)國(guó)家安全體系。對(duì)于政商名流、新聞事件、軍事領(lǐng)導(dǎo)及社會(huì)事務(wù)相關(guān)人員與場(chǎng)景數(shù)據(jù)的深度偽造,存在著不少待證情境下難以精準(zhǔn)及時(shí)地進(jìn)行辨識(shí)的難題,已經(jīng)成為影響政治安全、社會(huì)安全、國(guó)家安全的不穩(wěn)定因素。
4? ?健全深度合成待證數(shù)據(jù)的辨識(shí)機(jī)制
萬(wàn)物互聯(lián)的背景下,網(wǎng)絡(luò)信息技術(shù)普遍應(yīng)用在生產(chǎn)生活之中,數(shù)據(jù)對(duì)于查明案件事實(shí)具有極其重要的價(jià)值。有效避免錯(cuò)誤肯定深度合成待證數(shù)據(jù)的方法不是棄之不用,而是充分發(fā)揮多方力量、迅速建立健全科學(xué)有效的辨識(shí)機(jī)制。
4.1? ? 嚴(yán)格遏止源頭違規(guī)
從源頭上遏止深度合成待證數(shù)據(jù)是查清案件事實(shí)、營(yíng)建可信社會(huì)的根本措施。既需要加強(qiáng)直接關(guān)聯(lián)的政策法規(guī)建設(shè),亦需要強(qiáng)化對(duì)相關(guān)技術(shù)和數(shù)據(jù)的研究與持有機(jī)構(gòu)、企業(yè)及從業(yè)群體的監(jiān)督管理,減少數(shù)據(jù)深度合成的負(fù)面作用。如國(guó)家網(wǎng)信辦發(fā)布的《網(wǎng)絡(luò)音視頻信息服務(wù)管理規(guī)定》明確指出,2020年1月1日起,發(fā)布深度合成視頻前必須按照有關(guān)規(guī)定開(kāi)展安全評(píng)估并以顯著方式標(biāo)識(shí)“非真實(shí)”字樣,且不得用于發(fā)布虛假新聞等場(chǎng)景,并開(kāi)始部署深度合成音視頻的鑒別技術(shù)體系與健全相應(yīng)的辟謠機(jī)制。
4.2? ? 重塑專(zhuān)家鑒定模式
深度合成待證數(shù)據(jù)不僅無(wú)法憑借肉眼辨別,甚至難以通過(guò)傳統(tǒng)方法加以鑒識(shí)。盡管眾多科研機(jī)構(gòu)、頭部企業(yè)和司法鑒定部門(mén)正在積極開(kāi)發(fā)各種深度合成檢測(cè)工具,但迄今為止整體上落后于數(shù)據(jù)偽造技術(shù)。行業(yè)專(zhuān)家依據(jù)經(jīng)驗(yàn)和知識(shí)辨別重要的微小變化的能力往往不足以識(shí)別高度仿真的深度偽造制品。待證數(shù)據(jù)的真實(shí)性認(rèn)定亟待重塑專(zhuān)家鑒定模式。
目前而言,深度合成圖像數(shù)據(jù)檢測(cè)的關(guān)鍵在于組織能夠及時(shí)有效地挖掘定制化修改點(diǎn)的專(zhuān)家團(tuán)隊(duì)。深度偽造音視頻與真實(shí)視頻的特征差異比對(duì)迫切要求技術(shù)專(zhuān)家構(gòu)建完善的深度神經(jīng)網(wǎng)絡(luò)架構(gòu)以便更好地提取不自然的元素特征,并在具體場(chǎng)景中輔以虹膜驗(yàn)證、指紋驗(yàn)證以及人工鑒偽等。
4.3? ? 加強(qiáng)環(huán)境經(jīng)驗(yàn)支持
早在全球深度偽造危機(jī)爆發(fā)之初,美國(guó)國(guó)防部高級(jí)研究計(jì)劃局(Defense Advanced Research Project Agency)就開(kāi)始探索如何建立一個(gè)能夠辨別圖像或視頻可信度的自動(dòng)評(píng)分系統(tǒng)[12]。通過(guò)集中比對(duì)待檢圖像數(shù)據(jù)或視頻數(shù)據(jù)在內(nèi)容上與各種外部經(jīng)驗(yàn)數(shù)據(jù)的不一致之處(如與太陽(yáng)光照位置不對(duì)應(yīng)的陰影影像數(shù)據(jù)),提升深度合成數(shù)據(jù)的檢驗(yàn)準(zhǔn)確性。同時(shí),有必要授權(quán)一方在一些具體場(chǎng)景中有權(quán)要求舉行聽(tīng)證會(huì),迫使待證數(shù)據(jù)提供方提供能夠間接證明真實(shí)性的重要環(huán)境信息。
5? ?結(jié)語(yǔ)
深度合成待證數(shù)據(jù)是對(duì)社會(huì)正義最后防線(xiàn)、廣大居民人身和財(cái)產(chǎn)安全乃至國(guó)家和社會(huì)有序運(yùn)轉(zhuǎn)的巨大威脅。相關(guān)證偽方案執(zhí)行不暢有可能導(dǎo)致社會(huì)信任體系全面崩盤(pán)。亟待從源頭到末端營(yíng)建精準(zhǔn)高效的風(fēng)險(xiǎn)辨識(shí)與應(yīng)對(duì)框架。如不僅通過(guò)推廣區(qū)塊鏈認(rèn)證簽名工具加強(qiáng)數(shù)據(jù)來(lái)源標(biāo)注,還有必要建立基于區(qū)塊鏈和智能合約的待證數(shù)據(jù)來(lái)源追溯機(jī)制,推動(dòng)智慧司法,助力數(shù)字經(jīng)濟(jì),支撐智能化社會(huì)建設(shè)。
參考文獻(xiàn):
[1]? Elizabeth Caldera.Reject the Evidence of Your Eyes and Ears.Deepfakes and the Law of Virtual Replicants[J].Seton Hall Law Review,2019(50):177.
[2]? Russell Spivak.Deepfakes:The Newest Way to Commit One of the Oldest Crimes[J].Georgetown Law & Technology Review,2019(3):332.
[3]? Jeff Ward.10 Things Judges Should Know About AI[R].Deepfakes Report Act of 2019,116th Congress,H.R.3600,2019.
[4]? Kevin Roose.How Come the Fake Videos,Too[N].New York Times,2018-05-04.
[5]? Janko Rocttgers.Reddit,Twitter Ban Deepfake Celebrity Porn Videos[EB/OL].[2018-02-07].https://www.nasdaq.com/articles/reddit-twitter-ban-deepfake-celebrity-porn-videos-2018-02-07.
[6]? Jessica Ice.Defamatory Political Deepfakes and the First Amendment[J].Case Western Reserve Law Review,2019(70):427.
[7]? “她”來(lái)了!全球首位3D版AI合成主播精彩亮相[EB/OL].[2020-05-20].http://www.xinhuanet.com/2020-05/20/c_1126011533.htm.
[8]? Douglas Harris.Deepfakes:False Pornography Is Here and the Law Cannot Protect You[J].Duke Law & Technology Review,2019(17):99.
[9]? Mark Bennett.Unspringing the Witness Memory and Demeanor Trap:What Every Judge and Juror Needs to Know About Cognitive Psychology and Witness Credibility[J].American University Law Review,2015(64):1331.
[10]? Richard Schmechel,Timothy Toole.Beyond the Ken? Testing Jurors Understanding of Eyewitness Reliability Evidence[J].Jurimetrics,2006(46):178.
[11]? Robert Chesney.Deep Fakes:A Looming Challenge for Privacy,Democracy,and National Security[J].California Law Review,2019(107):1753.
[12]? Matt Turek.Media Forensics[EB/OL].[2020-11-30].https://www.darpa.mil/program/media-forensics.
作者簡(jiǎn)介:眭占菱(1991-),女,南京信息工程大學(xué)中意網(wǎng)絡(luò)侵權(quán)研究所助理研究員,研究方向:信息科技與信息規(guī)制;何亮亮(1980-),男,南京信息工程大學(xué)法政學(xué)院副教授,研究方向:信息科技與信息倫理;蔣潔(1979-),女,南京信息工程大學(xué)中意網(wǎng)絡(luò)侵權(quán)研究所、法政學(xué)院教授,研究方向:信息政策法律與信息倫理。