張 超, 呂 凱
(1.上海交通大學(xué) 馬克思主義學(xué)院,上海 200240;2.天津大學(xué) 法學(xué)院,天津 300072)
物聯(lián)網(wǎng)引發(fā)了新的科技革命,智能時(shí)代即將到來。深化司法體制綜合配套改革,要善于運(yùn)用互聯(lián)網(wǎng)技術(shù)和信息化手段開展工作。大數(shù)據(jù)和人工智能技術(shù)在司法系統(tǒng)的應(yīng)用切合了發(fā)展需要,但新興技術(shù)的應(yīng)用又需要理論的回應(yīng)。大數(shù)據(jù)的相關(guān)探討已經(jīng)開始由“應(yīng)用/技術(shù)導(dǎo)向”朝著“理論導(dǎo)向”轉(zhuǎn)型[]。由于法律領(lǐng)域的特殊性,大數(shù)據(jù)在法律領(lǐng)域內(nèi)不同細(xì)分場景中的應(yīng)用表現(xiàn)出不同形態(tài),其中大數(shù)據(jù)在刑事訴訟司法證明同一認(rèn)定理論中的應(yīng)用就是其中重要的場景。
隨著司法實(shí)踐的發(fā)展,同一認(rèn)定理論從物證鑒定基礎(chǔ)理論到偵查學(xué)基礎(chǔ)理論,發(fā)展到現(xiàn)如今對整個(gè)司法證明活動(dòng)都具有指導(dǎo)意義。智能時(shí)代人身同一認(rèn)定技術(shù)有了質(zhì)的飛越,例如基于“人臉”的人身同一認(rèn)定、基于人體步態(tài)的認(rèn)定、基于網(wǎng)絡(luò)“文本”特征的認(rèn)定、基于網(wǎng)絡(luò)行為規(guī)律的認(rèn)定等。新技術(shù)為人身同一認(rèn)定以及司法證明注入了新的活力。
相比于傳統(tǒng)的人身同一認(rèn)定技術(shù),智能時(shí)代的人身同一認(rèn)定帶有數(shù)據(jù)化、智能化的特征理論研究方面,需對新技術(shù)與人身同一認(rèn)定理論的融合做出理論創(chuàng)新;實(shí)踐發(fā)展中,存在將法律大數(shù)據(jù)視為上述技術(shù)在人身同一認(rèn)定領(lǐng)域的平移應(yīng)用的問題,技術(shù)與法律領(lǐng)域的融合生硬,具體表現(xiàn)為智能時(shí)代人身同一認(rèn)定的模式總結(jié)不足。本文試圖梳理兩種人身同一認(rèn)定的模式,充實(shí)新興技術(shù)應(yīng)用于人身同一認(rèn)定的理論。
同一認(rèn)定是指依據(jù)客體特征判斷兩次或多次出現(xiàn)的客體是否同一客體的認(rèn)識活動(dòng)[2]。而人身同一認(rèn)定,意為依據(jù)某些與人身不可分割的特征來判斷人身是否同一的認(rèn)識活動(dòng)[3]。
人身同一認(rèn)定的判斷基礎(chǔ)是與人身不可分離的特征,包括人的相貌、指紋、腳印、筆跡、DNA遺傳基因等。人身同一認(rèn)定的發(fā)展路徑首先受研究對象即人身特征本身的內(nèi)在制約,主要依據(jù)人身特征是否新產(chǎn)生以及產(chǎn)生的空間來作劃分;其次,外在的技術(shù)邏輯的支配下,智能時(shí)代的人身同一認(rèn)定的發(fā)展路徑應(yīng)依循技術(shù)發(fā)展的軌跡,而智能時(shí)代的生物技術(shù)和網(wǎng)絡(luò)技術(shù)是最為典型的新興技術(shù)。因此智能時(shí)代人身同一認(rèn)定可分為基于人體生物特征識別數(shù)據(jù)的人身同一認(rèn)定和基于網(wǎng)絡(luò)行為數(shù)據(jù)的人身同一認(rèn)定。前者是利用物理空間中人的形象特征的身份識別,后者是利用虛擬空間中人所留痕跡的人身同一認(rèn)定(1)分成這兩類是基于智能時(shí)代新興技術(shù)應(yīng)用于人身同一認(rèn)定最為典型的兩種形態(tài),對此不應(yīng)狹義理解,只要是有助于人身同一認(rèn)定的其他科學(xué)技術(shù),也可以與上述的兩種分類成平行并列的邏輯關(guān)系。。
第一種是對在物理空間中業(yè)已存在的人身特征運(yùn)用新興技術(shù)進(jìn)行身份識別。生物特征識別技術(shù)是其中一個(gè)范例,生物特征識別技術(shù)目的在于獲取“生物特征識別數(shù)據(jù)”。2018年5月25日在歐盟各國生效的《一般數(shù)據(jù)保護(hù)法案》(General Data Protection Regulation, GDPR)第4(14)條明確了“生物特征識別數(shù)據(jù)”的定義,即通過對自然人的物理、生物或行為特征進(jìn)行的特定技術(shù)處理而得到的個(gè)人數(shù)據(jù)。這類數(shù)據(jù)生成了特定自然人的唯一標(biāo)識。人臉識別屬于技術(shù)比較成熟,應(yīng)用廣泛的典型代表;步態(tài)識別屬于技術(shù)尚未成熟,但應(yīng)用前景廣泛的典型代表[4]。二者意為結(jié)合智能視頻監(jiān)控以及人臉和步態(tài)識別系統(tǒng),運(yùn)用人臉識別和步態(tài)識別的軟件算法,實(shí)現(xiàn)自動(dòng)的身份識別。人臉識別屬于依據(jù)人體的形象特征進(jìn)行的同一認(rèn)定,以人體的反映形象特征為依據(jù),是物質(zhì)上的反映形象,而步態(tài)識別屬于依據(jù)人的生理活動(dòng)習(xí)慣特征進(jìn)行的同一認(rèn)定,它是一種行為特征,表現(xiàn)為人行走時(shí)協(xié)調(diào)的、周期的姿態(tài),是人們思想意識等各種內(nèi)部控制,由身體肌肉、骨骼等協(xié)調(diào)配合執(zhí)行的動(dòng)作過程[5]。隨著生物特征識別技術(shù)的應(yīng)用,原來不易識別的特征可轉(zhuǎn)化為可識別的人身特征。例如,2007年英國警方通過對數(shù)百個(gè)嫌疑人的步態(tài)分析,其中一位嫌疑人的步態(tài)和案發(fā)現(xiàn)場的一位胖子的步態(tài)吻合度在96%以上,可以確定二者是同一人,最終案件被破獲[6]。
第二種發(fā)展路徑是基于互聯(lián)網(wǎng)技術(shù)發(fā)展在虛擬空間出現(xiàn)的新人身特征進(jìn)行人身同一認(rèn)定。網(wǎng)絡(luò)信息技術(shù)的應(yīng)用不僅使用戶在使用過程中產(chǎn)生“網(wǎng)絡(luò)行為數(shù)據(jù)”(主要包括用戶個(gè)人在線行為活動(dòng)的數(shù)據(jù),如用戶的瀏覽記錄、交易記錄、檢索記錄等,反映了數(shù)據(jù)文件和系統(tǒng)運(yùn)行的特征),而且可根據(jù)cookie等互聯(lián)網(wǎng)跟蹤記錄程序收集的上述網(wǎng)絡(luò)行為數(shù)據(jù)進(jìn)行身份識別[7]。例如在某刷單騙保案中,嫌疑人通過虛假購物并退貨的方式騙取運(yùn)費(fèi)險(xiǎn)賠付費(fèi),通過對“IP地址”、 “收貨地址”和“小額支付”的交易記錄的分析,最終“挖掘”出騙保金額1150余萬元[8]。
從刑事司法角度看,基于生物特征識別和網(wǎng)絡(luò)行為的數(shù)據(jù)進(jìn)行人身同一認(rèn)定用于打擊犯罪,涉及兩個(gè)方面的功效與價(jià)值:一是促進(jìn)犯罪預(yù)測與預(yù)防;二是對已經(jīng)存在的犯罪,從減少打擊犯罪的盲區(qū)和提升打擊精準(zhǔn)度達(dá)到遏制犯罪的目的。兩個(gè)功效體現(xiàn)的是智能時(shí)代人身同一認(rèn)定有助于司法效率的提升與智能化。
第一,促進(jìn)犯罪預(yù)防。各種全球性風(fēng)險(xiǎn)對人類命運(yùn)共同體的生存發(fā)展提出挑戰(zhàn),有必要擴(kuò)大犯罪預(yù)防的空間范圍和提升預(yù)防的效果。進(jìn)入智能時(shí)代,犯罪預(yù)防已經(jīng)從以往的特殊預(yù)防轉(zhuǎn)向現(xiàn)下的一般性預(yù)防,向前預(yù)測的范圍也大大超前。預(yù)測是大數(shù)據(jù)最核心的價(jià)值之一。大數(shù)據(jù)預(yù)測思維體現(xiàn)為對“案”的預(yù)測和對“人”的預(yù)測。對“案”的預(yù)測是指預(yù)測某地區(qū)在未來一階段內(nèi)發(fā)生某種犯罪的概率。對“人”的預(yù)測是指對高危犯罪分子進(jìn)行的預(yù)測[9]。前者應(yīng)當(dāng)是犯罪的宏觀預(yù)測,后者為犯罪的微觀預(yù)測。高科技手段可能在立案之前就得到應(yīng)用,或者辦案機(jī)關(guān)得到重大犯罪即將發(fā)生的情報(bào)消息,立案之前即采用高科技手段來收集證據(jù)和獲得犯罪以及犯罪人信息[10]。智能時(shí)代的人身同一認(rèn)定是建立在大樣本基礎(chǔ)之上,生物識別信息和網(wǎng)絡(luò)行為數(shù)據(jù)對個(gè)人隱私的干涉也較以往的各類數(shù)據(jù)和信息有更深的影響,原因在于可追溯到特定人,進(jìn)行特殊預(yù)防的效果極佳。同時(shí)算法的靈活性可以進(jìn)行較為精確的一般性預(yù)防。
第二,減少打擊犯罪的盲區(qū)與提升打擊精度。一是公共區(qū)域和網(wǎng)絡(luò)虛擬空間犯罪盲區(qū)的減少。公安部門的“天眼系統(tǒng)”的構(gòu)建使得大街小巷遍布智能攝像頭,使得打擊違法犯罪活動(dòng)能夠延伸至以往的監(jiān)控盲區(qū)。例如 2015 年重慶市渝中區(qū)“民心天網(wǎng)”工程共安裝 10687 個(gè)監(jiān)控?cái)z像頭,實(shí)現(xiàn)轄區(qū)監(jiān)控視頻全覆蓋。入室盜竊或者詐騙等危害公民財(cái)產(chǎn)案件常常發(fā)生在監(jiān)控盲區(qū),造成破案的困難,以往受限于技術(shù)條件的限制,犯罪打擊面常常有所空白之處,但是基于人體的面部、步態(tài)特征的人身同一認(rèn)定使得發(fā)生在監(jiān)控盲區(qū)或者死角的犯罪逃脫打擊的現(xiàn)象正逐漸消失?;ヂ?lián)網(wǎng)每天的信息量呈現(xiàn)爆炸式堆積,基于海量的網(wǎng)絡(luò)行為數(shù)據(jù)的人身同一認(rèn)定是網(wǎng)絡(luò)空間進(jìn)行同一認(rèn)定的關(guān)鍵環(huán)節(jié)?;诤A康木W(wǎng)絡(luò)行為數(shù)據(jù)有助于涉眾型犯罪案件的偵破。在涉眾型案件中往往存在犯罪組織,犯罪組織內(nèi)部存在精細(xì)分工,不同涉案人員扮演著不同角色,需要將不同涉案人員的身份和相應(yīng)的犯罪事實(shí)相對應(yīng),此時(shí)根據(jù)上傳到銀行系統(tǒng)的資金流數(shù)據(jù)或者其他網(wǎng)絡(luò)平臺(tái)的交流信息等可以揭示犯罪人身份。2015 年,公安部會(huì)同國家稅務(wù)總局、人民銀行用 8 個(gè)月時(shí)間查處了一起虛開增值稅專用發(fā)票案件。辦案人員收集到 10 多億資金流水,利用模型分析虛開公司資金流向,清楚地將涉案公司分為開票公司、收票公司、中轉(zhuǎn)公司三層,根據(jù)資金流向區(qū)分出會(huì)員單位、二級單位等,繪制出資金流的閉環(huán)關(guān)系。公司層級和會(huì)員關(guān)系,就揭示出涉案單位和人員的具體角色[11]。二是打擊精準(zhǔn)度提升。伴隨著犯罪打擊面的擴(kuò)大化的是犯罪打擊精準(zhǔn)度的提升。人臉識別技術(shù)和步態(tài)技術(shù)可以幫助警方在海量圖像信息中精確甄別、迅速檢索, 實(shí)現(xiàn)了快速高效鎖定嫌疑人。2016 年 11 月,上海市公安局通過大數(shù)據(jù)對比分析, 通過視頻監(jiān)控進(jìn)行人臉識別,能夠精確鎖定犯罪嫌疑人的住所,上海市當(dāng)月刑事案件同比下降 21.1%(2)新聞晨報(bào).11月以來兩搶盜竊詐騙案同比下降[EB/OL].http://sh.people.com.cn/n2/2016/1225/c134768-29510101.html,2020-05-08.。
第三,提升司法效率與智能化水平。不論是基于生物識別信息還是基于網(wǎng)絡(luò)行為數(shù)據(jù)進(jìn)行人身同一認(rèn)定,都離不開算法。算法意味著用系統(tǒng)的方法解決問題,要求在有限時(shí)間內(nèi)獲得輸出結(jié)果, 這就減少了橫向的每一個(gè)同一認(rèn)定或種類認(rèn)定所需要耗費(fèi)的時(shí)間,使得同一認(rèn)定鏈條上每一個(gè)節(jié)點(diǎn)都能夠經(jīng)得起合理推敲,即每一個(gè)階段都能夠達(dá)到同一認(rèn)定所需要的特征組合的特定性、穩(wěn)定性和反映性,司法效率因此能夠得以提升。比如銀行發(fā)生的案件,往往要從長達(dá)幾十天的監(jiān)控錄像中尋找可疑人員,造成人力的巨大浪費(fèi)。而人臉識別智能監(jiān)控通過存儲(chǔ)檢索以及內(nèi)容匹配等智能化手段, 讓監(jiān)控真正智能化,從而大大提高案件偵破的效率[9]。針對社會(huì)危害性較小的犯罪,能夠及時(shí)運(yùn)用算法分析輸入結(jié)果,在有限個(gè)步驟之后終止運(yùn)算,得出分析結(jié)果,輔助辦案人員得出結(jié)果。讓辦案的精力能夠更多投于重大財(cái)產(chǎn)類和人身類犯罪,有助于合理分配司法資源,使司法辦案智能化。例如 2020年重慶市渝中區(qū)某派出所通過“民心天網(wǎng)”系統(tǒng)調(diào)取視頻錄像僅耗費(fèi)了2個(gè)小時(shí)即破獲了一起連環(huán)扒竊案。
智能時(shí)代人身同一認(rèn)定的模式可分為三步:擴(kuò)大數(shù)據(jù)來源,構(gòu)建身份識別模型,在具體應(yīng)用中進(jìn)行特征匹配。第一步,智能時(shí)代人身同一認(rèn)定擴(kuò)大受審查客體的特征反映體的范圍,即在受審查客體的數(shù)據(jù)來源方面呈現(xiàn)數(shù)據(jù)規(guī)模海量性的特征,受審查客體及其特征反映體可以精確地被分析和使用。具體表現(xiàn)為利用生物特征和網(wǎng)絡(luò)行為數(shù)據(jù)進(jìn)行人身同一認(rèn)定時(shí),需要建立相應(yīng)的數(shù)據(jù)庫,整合歸納所提取到的人臉、步態(tài)數(shù)據(jù)和網(wǎng)絡(luò)行為數(shù)據(jù);第二步,根據(jù)生物特征和網(wǎng)絡(luò)行為數(shù)據(jù)自身的特點(diǎn)進(jìn)行身份識別模型構(gòu)建;第三步,結(jié)合法律專家的經(jīng)驗(yàn)知識進(jìn)行特征匹配。
(1) 人臉和步態(tài)數(shù)據(jù)庫的建立 生物特征識別數(shù)據(jù)所涉范圍極廣,建立指紋、DNA遺傳基因紋數(shù)據(jù)庫,并以此為依據(jù)進(jìn)行人身同一認(rèn)定在十幾年前已經(jīng)在公安系統(tǒng)中廣泛應(yīng)用,并成為偵破案件的利器(3)截至2011年底,全國指紋系統(tǒng)捺印指紋庫容量已超過9000萬份,并以每年20%的速度增長,年偵破案件達(dá)11萬起。同時(shí)全國“打拐”DNA數(shù)據(jù)庫于2009年4月30日建成,至2009年5月底前,全國公安機(jī)關(guān)已有的236個(gè)DNA實(shí)驗(yàn)室將全部聯(lián)網(wǎng)運(yùn)行,實(shí)現(xiàn)技術(shù)資源和數(shù)據(jù)資源共享。要求一線公安機(jī)關(guān)對群眾報(bào)告兒童失蹤、被拐賣的,都必須立即立案,組織查找和偵查調(diào)查工作,同時(shí)做好采血工作。。相比較于傳統(tǒng)生物特征識別數(shù)據(jù)庫的建立,人臉和步態(tài)數(shù)據(jù)庫的建立具有非接觸性和全天候采集兩個(gè)新特點(diǎn)。
第一,人臉和步態(tài)數(shù)據(jù)采集具有非接觸性的特點(diǎn),弱化了人的配合程度。利用遠(yuǎn)程監(jiān)控?cái)z像機(jī)對人臉和步態(tài)數(shù)據(jù)進(jìn)行采集,避免了和人的直接接觸,不需要人的主動(dòng)配合,只要被采集信息的人出現(xiàn)在智能視頻監(jiān)控所及的范圍即可。采集過程自然,促進(jìn)了采集效率的提升。人臉采集只需要監(jiān)控?cái)z像頭抓取到一張符合條件的人臉面相,步態(tài)采集也僅需要人的步態(tài)序列,即步態(tài)識別的輸入是一段行走的連續(xù)視頻圖像序列。美國“9.11”事件以后,國際社會(huì)反恐形勢異常嚴(yán)峻,加強(qiáng)機(jī)場、火車站和汽車站等重點(diǎn)場所的安全監(jiān)測,利用人臉和步態(tài)數(shù)據(jù)的快速采集,能夠提升公共場所的安保能力。
第二,人臉和步態(tài)數(shù)據(jù)采集具有全天候采集的特點(diǎn)。一個(gè)監(jiān)控?cái)z像頭便可以清晰記錄下某個(gè)區(qū)域每天24小時(shí)所經(jīng)過的人群,實(shí)現(xiàn)時(shí)時(shí)采集人臉和步態(tài)等生物特征識別數(shù)據(jù)的目的。
(2) 人臉和步態(tài)特征數(shù)據(jù)的提取與匹配識別 一是人臉圖像和步態(tài)特征提取。首先,先檢驗(yàn)被尋找客體的人臉或步態(tài)特征,后檢驗(yàn)受審查客體的人臉或步態(tài)特征。因?yàn)楸粚ふ铱腕w具有不可選擇性,先了解被尋找客體的人臉或步態(tài)特征能夠使得有目標(biāo)和有選擇地考察受審查客體人臉或步態(tài)特征,避免檢驗(yàn)的盲目性和檢驗(yàn)時(shí)間與人力物力的浪費(fèi)。這實(shí)際上是偵查活動(dòng)由果溯因的回溯性思維的體現(xiàn),即通過已經(jīng)發(fā)生過的事實(shí)存留下的人臉或步態(tài)數(shù)據(jù),尋找符合條件的受審查客體的特征反映體,進(jìn)而還原出事實(shí)真相。其次,受審查客體范圍大。人臉識別和步態(tài)識別中,特征提取涉及到的數(shù)據(jù)往往達(dá)到“TB”甚至是“PB”的海量級別,數(shù)據(jù)海量性導(dǎo)致其無法被適用于傳統(tǒng)的人工分析[12],突破了人工分析所能夠承受的極限。
二是人臉圖像和步態(tài)匹配與識別。將提取的人臉圖像和步態(tài)的特征數(shù)據(jù)與數(shù)據(jù)庫中存儲(chǔ)的特征模板進(jìn)行搜索匹配,按照先一般后細(xì)節(jié)的比較順序。如果在比較一般特征時(shí)發(fā)現(xiàn)了本質(zhì)的差異,即可得出輸出否定的同一認(rèn)定結(jié)果。例如,被尋找客體是圓臉,而受審查客體是方臉,一般情況下即可做出否定的同一認(rèn)定結(jié)果,因?yàn)槟樞陀蓤A變方的變化是極小事件。如果比較某個(gè)一般特征時(shí)未發(fā)現(xiàn)本質(zhì)的差異或者根據(jù)被尋找客體和受審查客體的差異不能夠直接得出否定的同一認(rèn)定結(jié)果時(shí),對每一個(gè)特征符合點(diǎn)進(jìn)行價(jià)值評判,在此基礎(chǔ)上評斷這些符合點(diǎn)的總和是否構(gòu)成特定性。評判該特征復(fù)合點(diǎn)的價(jià)值,以該特征的出現(xiàn)率為特征。一般來說,一個(gè)特征的出現(xiàn)率越高,其價(jià)值越低;而出現(xiàn)率越低,則價(jià)值越高。
通過算法對其事先設(shè)置得分或者得出一個(gè)受審查客體與數(shù)據(jù)中已有的人臉和步態(tài)數(shù)據(jù)相似的概率,并設(shè)定一個(gè)閾值(相似度),如果將閾值設(shè)置為A,人臉圖像和步態(tài)匹配與識別后有存在輸出結(jié)果和不存在符合條件的輸出結(jié)果兩種情況。第一,存在一個(gè)或多個(gè)相似度大于A的輸出結(jié)果;第二,所有受審查客體與被尋找客體的相似度都低于A,沒有輸出結(jié)果。
圖1 人臉圖像與步態(tài)匹配與識別流程
第一種情況,即便以相似概率判斷人身是否同一不能達(dá)到100%的精確度,但是仍然具有較高的相似度(4)全國人臉識別算法測試FRVT2006的最好成績是正確識別率為99%、FRVT2010的最好成績是正確識別率為99.7%。,通過挑選出概率大于某一閾值的所有輸出結(jié)果,縮小犯罪偵查時(shí)的搜尋范圍,再借助專家的經(jīng)驗(yàn)知識,結(jié)合事件同一認(rèn)定中的案件事實(shí)要素進(jìn)行綜合判斷,以具體的事件要素分析具體的人身同一認(rèn)定,使得可以得出確定的人身同一認(rèn)定判斷。
第二種情況,在沒有輸出結(jié)果的情況下需要以降低閾值的方式擴(kuò)大偵查范圍,降低閾值后得到的輸出結(jié)果為人身同一認(rèn)定提供數(shù)據(jù)支持和線索,而后通過專家鑒定進(jìn)行身份確認(rèn),實(shí)現(xiàn)聲像線索到證據(jù)的轉(zhuǎn)換[13]。
(1) 網(wǎng)絡(luò)行為數(shù)據(jù)的共享性 第一,網(wǎng)絡(luò)行為數(shù)據(jù)的共享性體現(xiàn)在數(shù)據(jù)來源渠道廣泛。傳統(tǒng)的指紋、DNA遺傳基因數(shù)據(jù)庫和新興的人臉和步態(tài)數(shù)據(jù)庫的建立往往采取偵查機(jī)關(guān)主導(dǎo),技術(shù)部門參與的形式建成,最終數(shù)據(jù)庫的歸屬于國家,數(shù)據(jù)采集由公安部門進(jìn)行,得到的數(shù)據(jù)也不對外公布,進(jìn)行嚴(yán)格保密。在大數(shù)據(jù)時(shí)代,一些大型網(wǎng)絡(luò)平臺(tái)依托其龐大的網(wǎng)絡(luò)生態(tài)體系和業(yè)務(wù)鏈,掌握著海量公民個(gè)人數(shù)據(jù),可能隱藏著犯罪線索和痕跡[9]。網(wǎng)絡(luò)平臺(tái)不論大小,都存有用戶的網(wǎng)絡(luò)行為數(shù)據(jù),使得這些數(shù)據(jù)具有分散性、權(quán)屬部門多,同時(shí)又依靠網(wǎng)絡(luò)拓?fù)淇臻g緊密聯(lián)系等特點(diǎn)。在偵查活動(dòng)中,這些平臺(tái)的數(shù)據(jù)共同構(gòu)成了網(wǎng)絡(luò)行為的數(shù)據(jù)庫。
第二,網(wǎng)絡(luò)行為數(shù)據(jù)的共享性體現(xiàn)在網(wǎng)絡(luò)服務(wù)商有配合偵查機(jī)關(guān)取證的信息披露義務(wù)。一是對其已經(jīng)控制的靜態(tài)數(shù)據(jù)進(jìn)行披露,二是通過固定或者追蹤動(dòng)態(tài)數(shù)據(jù)進(jìn)行披露[14]。網(wǎng)絡(luò)服務(wù)商基于營業(yè)目的或者提供服務(wù)需要會(huì)留存用戶的網(wǎng)絡(luò)行為數(shù)據(jù)(5)《電子商務(wù)法》第18條規(guī)定電子商務(wù)經(jīng)營者在不提供針對消費(fèi)者個(gè)人特征的選項(xiàng)時(shí)可以根據(jù)消費(fèi)者商品或者服務(wù)的搜索結(jié)果進(jìn)行消費(fèi)者的大數(shù)據(jù)畫像。,挖掘網(wǎng)絡(luò)行為數(shù)據(jù)的商業(yè)價(jià)值,然而這種以商業(yè)利益為導(dǎo)向的數(shù)據(jù)留存具有任意性和短期性等特征,難以達(dá)到偵查案件的要求,所以基于法律規(guī)定或指令的強(qiáng)制留存應(yīng)運(yùn)而生。
(2) 網(wǎng)絡(luò)數(shù)據(jù)的行為建模 行為建模的依據(jù)是個(gè)案中具體違法犯罪行為所遺留的特征信息,基于這種特征信息的大數(shù)據(jù)計(jì)算結(jié)果就能夠從一定程度反映具體行為與相應(yīng)數(shù)據(jù)(行為后果、行為情節(jié))之間的因果性[8]。網(wǎng)絡(luò)行為數(shù)據(jù)是用戶在網(wǎng)絡(luò)虛擬空間活動(dòng)留下的痕跡,在基于網(wǎng)絡(luò)行為數(shù)據(jù)進(jìn)行人身同一認(rèn)定時(shí),圍繞網(wǎng)絡(luò)空間的違法犯罪行為進(jìn)行信息搜集,并能夠還原出特定人在網(wǎng)絡(luò)空間從事了某種違法犯罪活動(dòng)的整個(gè)流程,這就是網(wǎng)絡(luò)行為數(shù)據(jù)的行為建模。
圖2 基于網(wǎng)絡(luò)行為數(shù)據(jù)的橫向同一認(rèn)定
基于行為人在網(wǎng)絡(luò)空間留下的信息進(jìn)行人身同一認(rèn)定必然要對網(wǎng)絡(luò)行為數(shù)據(jù)的種類進(jìn)行分類,以便為信息搜集階段指明方向。網(wǎng)絡(luò)犯罪公約委員會(huì)將網(wǎng)絡(luò)犯罪偵查過程中所需的特征信息概括成三種類型,即注冊人信息(subscriber information)、交互信息(traffic data)以及內(nèi)容信息(content data)(6)注冊人信息是指單位或個(gè)人在獲取網(wǎng)絡(luò)服務(wù)時(shí)向服務(wù)商提交的,或者在使用服務(wù)過程中顯示的與個(gè)人身份信息相關(guān)的信息;交互信息是指基于計(jì)算機(jī)系統(tǒng)進(jìn)行交流產(chǎn)生的,任何用以表明該交流的起始位置、路徑、時(shí)間、日期、體量、時(shí)長或類型的數(shù)據(jù);內(nèi)容信息是指某項(xiàng)溝通交流行為所傳遞的實(shí)質(zhì)內(nèi)容。。通過對這三類信息的質(zhì)量與數(shù)量進(jìn)行分析,注冊人信息表明用戶的個(gè)人信息,交互信息表明用戶設(shè)備的運(yùn)行軌跡,內(nèi)容信息表明一具體事件的內(nèi)容。這三項(xiàng)同一認(rèn)定或銜接或并列,保障在逆向回溯過程中每個(gè)橫向的靜態(tài)階段都能達(dá)到同一認(rèn)定的條件。
以上三類信息綜合起來就是特定用戶在特定設(shè)備上干了特定的事,留下了特定的網(wǎng)絡(luò)行為數(shù)據(jù),環(huán)環(huán)相扣共同構(gòu)成了案件偵破工作中的同一認(rèn)定鏈條,呈縱向遞進(jìn)式動(dòng)態(tài)發(fā)展形態(tài),這一鏈條的終點(diǎn)就是人事同一認(rèn)定[15]。縱向同一認(rèn)定是建立在三類信息橫向的同一認(rèn)定的堅(jiān)實(shí)可靠的基礎(chǔ)上,勾勒出數(shù)據(jù)人模型,進(jìn)行數(shù)據(jù)畫像,犯罪嫌疑人會(huì)成為大數(shù)據(jù)下的“透明人”[16]。
(1)統(tǒng)計(jì)概率的非理性 運(yùn)用生物特征識別技術(shù),以概率來判斷人身是否同一將會(huì)面臨合理性與科學(xué)性的質(zhì)疑。統(tǒng)計(jì)數(shù)據(jù)或數(shù)量上的可能性只是針對某類事物的一般描述,不能成為認(rèn)定個(gè)人的具體事實(shí)。如果審判者僅僅依據(jù)統(tǒng)計(jì)數(shù)據(jù),宣布某人的罪行成立,就違背了罪責(zé)自負(fù)原則。在證明過程中,統(tǒng)計(jì)數(shù)據(jù)不能單獨(dú)成為確定案情真實(shí)的依據(jù),必須與具體的案件證據(jù)相配合[9]。即便將閾值設(shè)置為98%或者99%,仍有2%或者1%的概率出錯(cuò),而司法活動(dòng)關(guān)系公民的人身和財(cái)產(chǎn)權(quán)利,容錯(cuò)率極低,也與讓公民在每一個(gè)司法案件中感受到公平正義的價(jià)值追求背道而馳;同時(shí),閾值低于設(shè)置標(biāo)準(zhǔn)的受審查客體也不能排除它可能就是被尋找客體的情況,人臉特征和步態(tài)特征的提取因?yàn)楣饩€、外形、裝飾等外界因素和人的情緒、整容、刻意訓(xùn)練等自身主動(dòng)改變都會(huì)發(fā)生或大或小的變化,從而導(dǎo)致識別的準(zhǔn)確率降低。出現(xiàn)上述兩種情況的原因在于統(tǒng)計(jì)概率反映的是相關(guān)關(guān)系,即人臉數(shù)據(jù)和步態(tài)數(shù)據(jù)兩類數(shù)據(jù)進(jìn)行人身同一認(rèn)定存在統(tǒng)計(jì)上的可能性,而司法證明強(qiáng)調(diào)的具體的因果關(guān)系。故僅憑借算法得出的統(tǒng)計(jì)概率判斷人身是否同一不符合司法證明的理性標(biāo)準(zhǔn)。
即便是在統(tǒng)計(jì)概率可大顯身手的犯罪預(yù)防階段,識別錯(cuò)誤也難以避免。美國的“可疑活動(dòng)報(bào)告系統(tǒng)”(The Suspicious Activity Reporting, SAR)盡管識別了16萬多名犯罪嫌疑人,但警方最終只對其中的103人展開了刑事調(diào)查,這其中僅有5人被逮捕,而且無人被判處有罪[10]。
(2)特征價(jià)值權(quán)重概念缺失 結(jié)合司法證明領(lǐng)域的特殊性需求,結(jié)合法律專家經(jīng)驗(yàn)知識,使得生物特征識別技術(shù)在人身同一認(rèn)定中能夠從相關(guān)關(guān)系轉(zhuǎn)化為因果關(guān)系。然而,這種轉(zhuǎn)化存在缺失特征價(jià)值權(quán)重概念而相關(guān)關(guān)系較弱,造成轉(zhuǎn)化為因果關(guān)系時(shí)說理性不強(qiáng),進(jìn)而導(dǎo)致運(yùn)用生物特征識別技術(shù)進(jìn)行人身同一認(rèn)定時(shí)準(zhǔn)確度存有缺陷。特征價(jià)值權(quán)重,意為人臉或步態(tài)中的不同特征在進(jìn)行人身同一認(rèn)定時(shí)所發(fā)揮的作用大小,在算法中通過賦分或者計(jì)算相似概率時(shí)進(jìn)行體現(xiàn)。特征價(jià)值權(quán)重概念缺失的表現(xiàn)是各種人臉或步態(tài)識別技術(shù)對于同一性特征所賦權(quán)重不一,導(dǎo)致輸出結(jié)果存在差異,也與司法證明強(qiáng)調(diào)同一性標(biāo)準(zhǔn)相矛盾。同一輸入材料得到不同的輸出結(jié)果,削弱了相關(guān)關(guān)系。問題的癥結(jié)本質(zhì)上在于特征分類、特征價(jià)值的評估原則和評估方法等人身同一認(rèn)定領(lǐng)域的概念、定義、原理、理論與活動(dòng)的知識未在法律大數(shù)據(jù)開發(fā)過程中正確體現(xiàn)。
基于生物特征和網(wǎng)絡(luò)行為數(shù)據(jù)的人身識別,需要通過算法對兩類海量數(shù)據(jù)進(jìn)行建模分析,然而算法的不透明性增加了人們對于機(jī)器算法準(zhǔn)確性的疑慮,不僅如此,算法的固有缺陷、人為歧視以及算法的惡意性導(dǎo)致了人們對其的不信任。
(1)算法的不透明性 算法是一種黑箱運(yùn)作機(jī)制,猶如一個(gè)未知的“黑箱”,用戶并不清楚算法的目標(biāo)和意圖,也無從獲悉算法設(shè)計(jì)者、實(shí)際控制者以及機(jī)器生成內(nèi)容的責(zé)任歸屬等信息,更談不上對其進(jìn)行評判和監(jiān)督。
基于生物特征和網(wǎng)絡(luò)行為數(shù)據(jù)的人身同一認(rèn)定結(jié)論在法庭質(zhì)證階段,質(zhì)證方因?yàn)樯虡I(yè)秘密保護(hù)或者國家安全等原因無法直接接觸到這些數(shù)據(jù)。加之專業(yè)技術(shù)的限制,無法對開示過的算法進(jìn)行質(zhì)證。公民擔(dān)憂用于人身同一認(rèn)定的算法將性別、種族等差異也考慮在內(nèi),不透明性加劇了這種疑慮。在State v. Loomis一案中,一位名叫盧米斯(Eric Loomis)的犯罪嫌疑人被COMPS(Correctional Offender Management Profiling for Alternative Sanctions)算法判定為“累犯風(fēng)險(xiǎn)較高”。而該算法所依據(jù)的是罪犯的各項(xiàng)生理特征和社會(huì)背景,其中便包括了性別[17]。
(2)算法的固有缺陷與人為歧視 算法的固有缺陷是由于機(jī)器深度學(xué)習(xí)時(shí)導(dǎo)致了難以預(yù)測的消極后果。在識別算法訓(xùn)練階段,輸入的人臉和步態(tài)數(shù)據(jù)各類樣本數(shù)量多,算法的匹配識別也就更接近真實(shí)情況;反之,如果某類數(shù)量少,此類誤差也就更大。識別算法的準(zhǔn)確度與輸入算法的人臉和步態(tài)數(shù)量和多元性成正比。MIT對于微軟、Facebook、IBM等公司人臉識別系統(tǒng)的研究表明,系統(tǒng)在檢測膚色較深的女性時(shí),出錯(cuò)率要比檢測膚色較淺的男性高出35%[18]。算法的固有缺陷導(dǎo)致了結(jié)論的偏見。
正因?yàn)樗惴ǖ牟煌该餍詫?dǎo)致的信息不對稱和不公開,使得一些歧視性的算法在應(yīng)用時(shí)讓人無法得知。算法歧視是人工智能自動(dòng)化決策中,由數(shù)據(jù)分析導(dǎo)致的對特定群體的、系統(tǒng)的、可重復(fù)的、不公正對待[19]。當(dāng)設(shè)計(jì)者人為地將對被識別者的性別、種族、職業(yè)、收入等方面的歧視延伸到算法時(shí),這種隱藏于的歧視很難被發(fā)現(xiàn),進(jìn)而導(dǎo)致人身同一認(rèn)定的歧視[20]。
(3)算法的惡意性 在人身同一認(rèn)定領(lǐng)域,既可以產(chǎn)生有助于身份識別的算法,同時(shí)也存在利用技術(shù)缺陷的惡意性算法。對公民的生物特征和網(wǎng)絡(luò)行為數(shù)據(jù)不分場合地加以應(yīng)用,可能造成某種違法犯罪的目的。“深度偽造”(Deepfakes)技術(shù)開源兩年后,黑產(chǎn)鏈已經(jīng)步入成熟期,不僅提供色情片換臉和惡意欺詐視頻制作的教學(xué)與定制服務(wù),還積極“攻堅(jiān)”金融類刷臉程序[21]。2017年,一位名叫“deepfakes”的外國網(wǎng)友就利用AI技術(shù),將DC超級英雄電影《神奇女俠》扮演者蓋爾·加朵、《哈利波特》主演“赫敏”的艾瑪·沃森等明星的臉,“移花接木”到了色情片女主角身上,一度掀起軒然大波(7)周舟,方正.你“ZAO”換臉嗎?新華社https://baijiahao.baidu.com/s?id=1644006114156968372&wfr=spider&for=pc,2019-09-07.。
(1)被采集者的知情同意權(quán)無法確保 人臉識別技術(shù)和人體步態(tài)技術(shù)采集公民的臉部和步態(tài)特征時(shí)具有隔空捕捉信息的非接觸性特點(diǎn);同時(shí),通過網(wǎng)絡(luò)爬蟲技術(shù)和Cookie技術(shù)獲取用戶的網(wǎng)絡(luò)行為數(shù)據(jù),也弱化了用戶的配合程度。正因?yàn)槿绱?,兩類?shù)據(jù)的獲取都可輕易繞開信息被采集者的知情同意權(quán),后續(xù)對于采集得到的數(shù)據(jù)進(jìn)行使用、加工、流轉(zhuǎn)和刪除也脫離了信息被采集者的控制。
(2)信息采集泛化 人臉和步態(tài)數(shù)據(jù)以及網(wǎng)絡(luò)行為數(shù)據(jù)的采集呈現(xiàn)泛化的趨勢。商場、地鐵站、火車站、機(jī)場、小區(qū)門禁等廣泛使用人臉識別技術(shù)和人體步態(tài)技術(shù),甚至為了規(guī)范游客使用廁紙,北京天壇公園使用“人臉識別廁紙機(jī)”,識別人臉后,自動(dòng)出紙[22]??梢?,人臉和步態(tài)數(shù)據(jù)的采集已經(jīng)超過了合理限度。當(dāng)前密布在城市社區(qū)、街道各個(gè)角落的攝像頭形成了一張大網(wǎng),除了記錄各種犯罪行為和犯罪現(xiàn)象,也不可避免將公民在公共場所的行為置于24小時(shí)監(jiān)控之下。為了精準(zhǔn)打擊犯罪,對公共場所進(jìn)行全天候的監(jiān)控在情理之中,并且公民有必要讓渡在公共區(qū)域自己的行為信息供司法證明之用,但是其讓渡或者被干涉的信息邊界非常模糊,造成了個(gè)人信息不必要的泄露。
在網(wǎng)絡(luò)空間網(wǎng)絡(luò)行為數(shù)據(jù)的采集隱藏在技術(shù)的外衣下更具有隱秘性,導(dǎo)致了網(wǎng)絡(luò)行為數(shù)據(jù)采集也呈現(xiàn)了過度的現(xiàn)象。例如可以實(shí)現(xiàn)網(wǎng)站對登錄ID、使用偏好、習(xí)慣收集的Flash Cookie技術(shù)的儲(chǔ)存位置對于普通人而言更難發(fā)現(xiàn)[15]。
(3)信息泄露后果嚴(yán)重 生物識別信息和網(wǎng)絡(luò)行為的數(shù)據(jù)庫中都包含著海量的個(gè)人信息,導(dǎo)致一旦泄露便會(huì)發(fā)生難以預(yù)測的后果。這些數(shù)據(jù)的流轉(zhuǎn)可能被用于監(jiān)視等違法犯罪活動(dòng)。不僅如此,當(dāng)數(shù)據(jù)大到一定程度,部分企業(yè)為了識別通過率而偽造誤讀率,黑客通過篡改數(shù)據(jù)庫中的人臉模板而使得算法在正常運(yùn)作下輸出錯(cuò)誤信息等,進(jìn)而會(huì)危害國家安全、經(jīng)濟(jì)安全、信息安全和人身安全[21]。
在人臉圖像與步態(tài)匹配與識別中,先通過算法運(yùn)算得出輸出結(jié)果,再經(jīng)過專家的經(jīng)驗(yàn)知識即可得出肯定或否定的人身同一認(rèn)定。從上述人身同一認(rèn)定的兩個(gè)步驟出發(fā),可從重視法律專家的經(jīng)驗(yàn)知識、引入特征價(jià)值權(quán)重概念以及融合應(yīng)用多種生物特征識別技術(shù)三方面提升人身同一認(rèn)定的準(zhǔn)確度。
(1)重視法律專家的經(jīng)驗(yàn)知識 智能時(shí)代,過度的迷信大數(shù)據(jù)技術(shù),輕視法律專家的經(jīng)驗(yàn)知識的主導(dǎo)作用,是法律在技術(shù)應(yīng)用的司法特定領(lǐng)域話語權(quán)缺失的結(jié)果,不僅造成了人身同一認(rèn)定結(jié)果的理性缺失和說理性不足的后果,而且也失去了校正和補(bǔ)足技術(shù)輸出結(jié)果的機(jī)會(huì)。人工智能技術(shù)從海量數(shù)據(jù)提煉出的知識并不會(huì)取代人類理性,而是更應(yīng)與事實(shí)認(rèn)定者的主觀理性和經(jīng)驗(yàn)產(chǎn)生互補(bǔ)。計(jì)算智能更多的是與人類理性相互支持,而不是取代與被取代的零和關(guān)系[23]。重視法律專家的經(jīng)驗(yàn)知識,將自動(dòng)識別中人體檢測和特征提取階段引起的信息丟失的缺陷再由法律專家予以校正與補(bǔ)足,不但能最大限度地保存檢材原有特征,還能根據(jù)不同的條件進(jìn)行相應(yīng)調(diào)整[7]。使得技術(shù)由法律專家主導(dǎo),充分發(fā)揮人臉識別技術(shù)和步態(tài)技術(shù)對人身同一認(rèn)定的輔助作用。
(2)引入特征價(jià)值權(quán)重概念 為得到更加精確的人身同一認(rèn)定技術(shù)上的輸出結(jié)果,需將抽象的特征符合點(diǎn)的價(jià)值量化為具體的數(shù)量,可以通過引入特征權(quán)重價(jià)值概念,結(jié)合法律專家和技術(shù)人才的共同努力來實(shí)現(xiàn)這一目的。
特征可以分為稀有形態(tài)特征和常見形態(tài)特征、穩(wěn)定特征與不穩(wěn)定特征、細(xì)節(jié)形態(tài)特征與輪廓形態(tài)特征、整體形態(tài)特征和局部形態(tài)特征、組合形態(tài)特征和個(gè)體形態(tài)特征等幾種類型。一般地,幾種分類前者的特征價(jià)值權(quán)重要高于后者[11]。一方面,在賦權(quán)時(shí)可以給前者設(shè)置一個(gè)基礎(chǔ)值,其大小可根據(jù)這一類特征單獨(dú)或者結(jié)合其它特征進(jìn)行身份識別的作用大小進(jìn)行設(shè)定。實(shí)踐層面應(yīng)當(dāng)以法律專家為主導(dǎo),對不同特征的權(quán)重大小進(jìn)行排序,初步設(shè)定,然后通過算法檢驗(yàn)準(zhǔn)確度。不斷進(jìn)行修正,使得基礎(chǔ)值的設(shè)置具有更高的科學(xué)性。
另一方面,根據(jù)特征的可辨認(rèn)程度設(shè)置百分比形式的可識別度。某一類特征在具體案情中會(huì)因?yàn)闀r(shí)間流逝、受到破壞污染等因素導(dǎo)致可識別性下降,此時(shí)就需要對特征的可辨認(rèn)程度進(jìn)行修正。例如,某一特征的基礎(chǔ)特征價(jià)值權(quán)重為x,但是可識別度只有80%,那么該特征的價(jià)值權(quán)重為x·80%。
(3)融合應(yīng)用多種生物特征識別技術(shù) 人在識別他人時(shí),會(huì)綜合他人的多種生物特征進(jìn)行判斷;同理,在人身同一認(rèn)定時(shí),可綜合人的多種生物特征,融合應(yīng)用多種生物特征識別技術(shù)。不僅應(yīng)用本文已經(jīng)提及過的人臉識別和步態(tài)識別等新興技術(shù),傳統(tǒng)的指紋、虹膜識別技術(shù)也應(yīng)包含在內(nèi)。當(dāng)某一種識別技術(shù)的閾值過低時(shí)可以參照其他識別技術(shù)進(jìn)行補(bǔ)強(qiáng),如此便具有特征變化適應(yīng)性強(qiáng),安全性和可靠性高等優(yōu)點(diǎn)。
(1)增強(qiáng)算法可解釋性 算法的不透明性并不必然導(dǎo)致所得的輸出結(jié)果不準(zhǔn)確,也不必然導(dǎo)致其證明力的降低或喪失。例如,人們不會(huì)因?yàn)椴涣私饧夹g(shù)原理而否認(rèn)各種基于GPS、基站、IP地址的軌跡分析報(bào)告的證據(jù)價(jià)值。即便公開算法的源代碼,冗長的代碼檢測也不現(xiàn)實(shí)[11]。問題的根源并不浮于算法不透明的表面,實(shí)際上算法不透明造成的是算法的可解釋性差。大多為技術(shù)外行的司法人員因?yàn)榧夹g(shù)壁壘無法對專業(yè)技術(shù)作出有力的法律解釋,故需要加強(qiáng)算法可解釋性。大數(shù)據(jù)分析是一種基于全量數(shù)據(jù)的解釋方法[25],然而大數(shù)據(jù)分析在司法特定領(lǐng)域必須轉(zhuǎn)化為法律解釋。可從法庭質(zhì)證階段的算法開示使得算法可解釋性增強(qiáng)。
首先,要向法庭說明在進(jìn)行人身同一認(rèn)定時(shí)所選取對比的初始范圍,在一定范圍內(nèi)進(jìn)行人身同一認(rèn)定,這是運(yùn)用排除法確定犯罪嫌疑人的第一步。其次,要進(jìn)一步通過直接排除法和間接排除法來縮小范圍,在這個(gè)過程中必然要涉及到對橫向小的同一認(rèn)定或者種類認(rèn)定進(jìn)行雙方的質(zhì)證,對于其中涉及到算法的原理部分,控辯雙方可以借助專家輔助人的經(jīng)驗(yàn)知識?!蹲罡呷嗣穹ㄔ宏P(guān)于適用<中華人民共和國刑事訴訟法>的解釋》第一百條第一款規(guī)定:“因無鑒定機(jī)構(gòu),或者根據(jù)法律、司法解釋的規(guī)定,指派、聘請有專門知識的人就案件的專門性問題出具的報(bào)告,可以作為證據(jù)使用?!边@為對于人身同一認(rèn)定時(shí)的算法檢驗(yàn)途徑指明了方向。
(2)綜合應(yīng)用技術(shù)審查和倫理審查 針對算法的固有缺陷和人為歧視無法從法律視角進(jìn)行發(fā)現(xiàn)、分析和解讀的問題,需要在算法設(shè)計(jì)完成的產(chǎn)品檢測階段對算法是否具有固有缺陷進(jìn)行技術(shù)審查,對是否存在人為歧視進(jìn)行倫理審查。技術(shù)審查應(yīng)從算法操作的全過程即數(shù)據(jù)輸入階段、數(shù)據(jù)分析階段和數(shù)據(jù)輸出階段三方面設(shè)置技術(shù)標(biāo)準(zhǔn)。第一,在數(shù)據(jù)輸入階段,不僅應(yīng)當(dāng)保證采集的人臉、步態(tài)數(shù)據(jù)和網(wǎng)絡(luò)行為數(shù)據(jù)質(zhì)量,而且需要注意從各類人群采集得到的人臉和步態(tài)數(shù)據(jù)量上的均衡;同時(shí)采集網(wǎng)絡(luò)行為數(shù)據(jù)時(shí),注冊人信息、交互信息和內(nèi)容信息也要保持量上的均衡。第二,在數(shù)據(jù)分析階段,在特定測試環(huán)境中檢驗(yàn)人身同一認(rèn)定算法的運(yùn)行效果。此項(xiàng)工作可以由具有專門資質(zhì)的第三方機(jī)構(gòu)完成。在當(dāng)前實(shí)踐中的一種技術(shù)方案是,由法庭組織司法鑒定機(jī)構(gòu)或行業(yè)組織的專業(yè)人員進(jìn)行黑箱測試。在測試時(shí),把軟件程序看作一個(gè)不能打開的黑盒子,在完全不考慮其內(nèi)部結(jié)構(gòu)和內(nèi)部特性的情況下,在軟件程序接口進(jìn)行測試[18]31。保證識別算法的中立性與準(zhǔn)確性,避免分類時(shí)遺漏重要的相關(guān)變量。第三數(shù)據(jù)輸出階段,根據(jù)技術(shù)發(fā)展水平,盡可能在輸出結(jié)果的同時(shí),同步輸出各項(xiàng)自變量及其特征價(jià)值權(quán)重,乃至對人身同一認(rèn)定的算法做出解釋,以便算法使用者更好地判斷該算法的風(fēng)險(xiǎn)[24]。
在倫理審查方面,人身同一認(rèn)定的算法的設(shè)計(jì)者和擁有者應(yīng)當(dāng)向有資質(zhì)的法律專家和技術(shù)專家組成的小組解釋說明可能出現(xiàn)的倫理風(fēng)險(xiǎn)及其應(yīng)對策略,并做好相應(yīng)地備案。
(3)規(guī)制惡意算法 惡意算法是人為地利用機(jī)器算法的深度學(xué)習(xí)來對算法的準(zhǔn)確度進(jìn)行強(qiáng)烈干擾,增大了公民對深度學(xué)習(xí)算法的不可預(yù)測性的恐懼與擔(dān)憂,擾亂了現(xiàn)有的技術(shù)秩序。規(guī)制惡意算法首先是如何準(zhǔn)確識別惡意算法。從算法的對象——數(shù)據(jù)來看,數(shù)據(jù)的輸入必然存在源頭,對源頭進(jìn)行準(zhǔn)確識別是探討識別惡意算法的有效路徑。算法針對大量數(shù)據(jù),小量的干擾并不會(huì)對算法準(zhǔn)確度造成很大的偏差,設(shè)置預(yù)警系統(tǒng)可應(yīng)對大量無效數(shù)據(jù)的入侵。例如,針對某一或多個(gè)用戶連續(xù)、多次、重復(fù)地進(jìn)行上傳不良數(shù)據(jù)的行為,可以采取將這些用戶在一定時(shí)間內(nèi)拉入數(shù)據(jù)輸入的“黑名單”的限制措施。在技術(shù)層面,算法設(shè)計(jì)者可以通過不斷地提前演練來提升算法的抗干擾性和準(zhǔn)確度;在法律層面,需要完善現(xiàn)有的法律法規(guī)對惡意算法進(jìn)行規(guī)制?,F(xiàn)階段針對人臉識別、步態(tài)識別和網(wǎng)絡(luò)行為數(shù)據(jù)的應(yīng)用風(fēng)險(xiǎn)的法律規(guī)制體系尚不夠完善。以人臉識別為例,僅僅發(fā)布了圍繞刑事偵查、證件管理和公共安全防護(hù)等公安業(yè)務(wù)展開的《公共安全人臉識別應(yīng)用圖像技術(shù)要求》[18]。
第一,通過現(xiàn)存的有關(guān)公民個(gè)人信息安全和網(wǎng)絡(luò)空間安全的法律進(jìn)行規(guī)制。惡意算法本身屬于技術(shù)問題,在主觀惡性不大的情況下運(yùn)用技術(shù)審查部門責(zé)令限期改正即可達(dá)到預(yù)防和規(guī)制的目的。如果主觀惡性過大和消極后果嚴(yán)重,造成了公民個(gè)人信息的惡意散播和利用,強(qiáng)烈威脅網(wǎng)絡(luò)空間安全,那么可利用刑法的有關(guān)公民個(gè)人信息安全和計(jì)算機(jī)安全犯罪條文加以規(guī)制。
第二,建立相應(yīng)的算法法規(guī),對相關(guān)算法的設(shè)計(jì)者和擁有者進(jìn)行責(zé)任捆綁。同時(shí)應(yīng)考慮到鼓勵(lì)技術(shù)創(chuàng)新,當(dāng)算法出現(xiàn)了惡意性并造成嚴(yán)重后果時(shí),算法的設(shè)計(jì)者和擁有者就要承擔(dān)民事責(zé)任或刑事責(zé)任,但可以通過以下兩種途徑免除:①算法的設(shè)計(jì)者和擁有者舉證已經(jīng)做到相應(yīng)的技術(shù)規(guī)范審查,并采取及時(shí)的措施消除惡意算法帶來的負(fù)面影響;②技術(shù)的發(fā)展產(chǎn)生的不可預(yù)知的風(fēng)險(xiǎn)或不可預(yù)知的標(biāo)準(zhǔn),可以法律、技術(shù)、倫理等領(lǐng)域的專家進(jìn)行風(fēng)險(xiǎn)評估與緊急方案的制定。
(1)保障被采集者的知情權(quán) 采集信息之前,需征得被采集知情同意,可作為人臉、步態(tài)數(shù)據(jù)和網(wǎng)絡(luò)行為數(shù)據(jù)采集的先行原則。要告知被采集者采集信息和數(shù)據(jù)的范圍、使用方式和使用目的。在進(jìn)行數(shù)據(jù)流轉(zhuǎn)時(shí)仍要被采集者的知情同意。
現(xiàn)下在各大網(wǎng)站或手機(jī)的APP在個(gè)人信息采集之前通過隱私條款征得用戶同意,然而人臉和步態(tài)數(shù)據(jù)的采集任意性卻太大。人臉和步態(tài)數(shù)據(jù)的采集具有非接觸性的特點(diǎn),所以征得被采集者的知情同意在操作上存在難題,可采取事后刪除和“隱私政策”的方式來保障被采集者的知情權(quán)。國家機(jī)關(guān)處于安全防控的需要采集人臉和步態(tài)數(shù)據(jù)時(shí),公民有配合國家機(jī)關(guān)進(jìn)行安全防控的義務(wù),故在公共區(qū)域采取明顯通知告示或者語音廣播的形式即可達(dá)到告知的目的。然而,對于企業(yè)、小區(qū)物管搜集人臉和步態(tài)數(shù)據(jù)時(shí)需要通過明示告知的形式,如果被采集者拒絕被采集人臉和步態(tài)數(shù)據(jù),應(yīng)當(dāng)及時(shí)刪除。還有一種可行策略是信息與軟件進(jìn)行分離,即信息的采集與信息的應(yīng)用實(shí)行嚴(yán)格分離,當(dāng)生物特征與網(wǎng)絡(luò)行為數(shù)據(jù)被采集者收集儲(chǔ)存在載體以后,對后續(xù)的應(yīng)用時(shí)間與方式需要經(jīng)得政府專業(yè)管理部門的審查與同意。
除此之外,需要加強(qiáng)對信息采集企業(yè)、機(jī)構(gòu)、組織的資質(zhì)的常態(tài)化審查。一方面,政府部門應(yīng)定期對信息采集的程序是否合規(guī)進(jìn)行審查;另一方面,信息采集的企業(yè)、機(jī)構(gòu)、組織要定期向政府部門進(jìn)行信息采集的備案,從數(shù)據(jù)來源、數(shù)據(jù)量大小、安全性評估、危險(xiǎn)結(jié)果預(yù)測與應(yīng)對方案等方面進(jìn)行備案。
(2)信息采集的比例原則 國家對于公民權(quán)利的任何限制措施都應(yīng)當(dāng)遵循比例原則。針對信息采集泛化的亂象,在信息采集時(shí)同樣適用這一原則。比例原則是指公權(quán)力在依法限制公民基本權(quán)利時(shí),用于衡量合法限制措施的必要性和充分性的一組規(guī)則[25]。這一原則的核心是要以最小程度地侵害公民權(quán)利,采取合理手段達(dá)到正當(dāng)目的。針對人臉、步態(tài)數(shù)據(jù)和網(wǎng)絡(luò)行為數(shù)據(jù)的不同類型,可侵害程度會(huì)有顯著差異。如前所述,網(wǎng)絡(luò)行為數(shù)據(jù)可分為三種類型,但仍有必要進(jìn)一步細(xì)化,賦予每種細(xì)分小類不同的信息價(jià)值權(quán)重,信息價(jià)值權(quán)重越高,那么采集時(shí)的程序也應(yīng)更加嚴(yán)格。
(3)規(guī)范信息的使用流程 針對人體生物特征識別數(shù)據(jù),可以借助歐盟的經(jīng)驗(yàn),嚴(yán)格限定人體生物特征識別數(shù)據(jù)的使用范圍,除法律規(guī)定的例外情況之外禁止出售。從生物特征識別信息的存儲(chǔ)和銷毀等方面進(jìn)行程序規(guī)制,其中應(yīng)該特別規(guī)定生物識別信息的銷毀時(shí)間,不僅是因?yàn)樯镒R別信息更迭較快,更是因?yàn)槿绻斡煽蒲袡C(jī)構(gòu)和政府機(jī)關(guān)長期持有公民的生物識別信息,就像一個(gè)隨時(shí)可能發(fā)生爆炸的“火藥庫”,要及時(shí)清理以達(dá)到消除隱患的目的。例如,美國伊利諾伊州頒布的《生物信息隱私法案》規(guī)定,當(dāng)企業(yè)收集數(shù)據(jù)的目的已達(dá)到或距信息主體與企業(yè)最后一次聯(lián)絡(luò)已滿3年時(shí)(以先發(fā)生者為準(zhǔn)),應(yīng)當(dāng)銷毀生物特征識別數(shù)據(jù)[26]。
當(dāng)前,大數(shù)據(jù)與人工智能技術(shù)的應(yīng)用方興未艾。新興技術(shù)的應(yīng)用是生產(chǎn)力急劇發(fā)展的產(chǎn)物,將新興技術(shù)用于社會(huì)治理終極目的還是為了人類更和諧穩(wěn)定美好的生活。人身同一認(rèn)定的需要新興技術(shù),法律人的作用在于清晰界定新技術(shù)條件下人身同一認(rèn)定的模式,以法律人特有的專業(yè)知識敏銳地挖掘出其中的風(fēng)險(xiǎn),并且直面安全保障和個(gè)人信息保護(hù)法益的沖突,使看似矛盾的法益能夠相互融合。二者并非非此即彼的利益衡量問題,而是如何共生共存的利益協(xié)調(diào)問題[27]。本文基于上述背景,研究了新興技術(shù)應(yīng)用于人身同一認(rèn)定所引發(fā)的法律問題。研究認(rèn)為,新興技術(shù)應(yīng)用于人身同一認(rèn)定可能引發(fā)精準(zhǔn)度的缺陷,算法風(fēng)險(xiǎn)以及個(gè)人信息被侵犯等三類風(fēng)險(xiǎn)。文章提出了相應(yīng)的風(fēng)險(xiǎn)應(yīng)對辦法:一是要重視法律專家的經(jīng)驗(yàn)知識、引入特征價(jià)值權(quán)重概念、融合應(yīng)用多種生物特征識別技術(shù)等方面提升人身同一認(rèn)定的準(zhǔn)確度;二是要增強(qiáng)算法的可解釋性、結(jié)合應(yīng)用技術(shù)審查和倫理審查以及規(guī)制惡意算法;三是要保障被采集者的知情權(quán)、遵循信息采集的比例原則、規(guī)范信息的使用流程等方面加強(qiáng)個(gè)人信息和數(shù)據(jù)安全保護(hù)。
智能技術(shù)應(yīng)用下的人身同一認(rèn)定突出了人的主體地位,人是技術(shù)發(fā)展的邊界。在“人身”“人與技術(shù)”的表述中已隱含了人類中心主義的前提,人與技術(shù)等對象物的互相作用使得“人”的主體性更加突出。而這也是技術(shù)發(fā)展的人文“止”境,即智能技術(shù)的發(fā)展的界限和評估者都是人類。同時(shí),法律與技術(shù)的融合呈現(xiàn)出新的趨勢,如何使得技術(shù)更好融合于法律領(lǐng)域,真正能體現(xiàn)“具體法律問題具體分析”將值得繼續(xù)探索。
合肥工業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2022年2期