[德]米夏埃爾·黑格曼斯
人工智能在刑事訴訟中的運(yùn)用受到討論,這包括特定的調(diào)查事項(xiàng),如為了確保對(duì)核心領(lǐng)域的保護(hù)②Gleizer,in:Beck/Kusche/Valerius(Hrsg.),Digitalisierung,Automatisierung,KI und Recht,2020,S.535.而對(duì)德國(guó)《刑事訴訟法》第100B、100C 條規(guī)定的措施進(jìn)行監(jiān)督,以及幫助法官在量刑③Kohn,Künstliche Intelligenz in der Strafzumessung,2021.上做出決定,還有刑罰執(zhí)行和監(jiān)禁執(zhí)行的問(wèn)題——尤其是為了評(píng)判是否采取必要的執(zhí)行措施和假釋而進(jìn)行犯罪預(yù)測(cè)。由于當(dāng)前高度復(fù)雜的數(shù)字系統(tǒng)在發(fā)展上的迅速進(jìn)步,必要的技術(shù)前提(尤其是計(jì)算機(jī)能力和適當(dāng)?shù)能浖┻t早是可以獲得的,所以這一發(fā)展不會(huì)停留在理論設(shè)想中。因此,在未經(jīng)準(zhǔn)備地遭遇制定司法和刑事政策的誘惑以及觸發(fā)假想的客觀約束(Sachzwang)或自動(dòng)機(jī)制以前,是時(shí)候去思考刑事訴訟中關(guān)于人工智能運(yùn)用的機(jī)遇、風(fēng)險(xiǎn)和必要的規(guī)范性框架條件了。
人工智能的概念很不統(tǒng)一地得到運(yùn)用,在此應(yīng)當(dāng)在一種嚴(yán)格的意義上予以理解。這一般不是指附帶數(shù)據(jù)庫(kù)系統(tǒng)和記錄管理、已進(jìn)入司法①So hat die elektronische Akte in der Ziviljustiz bereits das Versuchsstadium verlassen und ist weitgehend etabliert(§§130a ff.ZPO).中或在可預(yù)見(jiàn)的將來(lái)受到規(guī)劃的數(shù)字化。②Vgl.Mitterer,in:Anders/ Graalmann-Scheerer/Schady(Hrsg.),Innovative Entwicklungen in den deutschen Staatsanwaltschaften,2021,S.353.結(jié)構(gòu)通常相對(duì)簡(jiǎn)單的電子系統(tǒng)對(duì)程序發(fā)展的助益建立在確定的計(jì)算機(jī)程序這一基礎(chǔ)上,并由此基本上始終能得到法官的理解和監(jiān)督。人工智能的特殊性在于機(jī)器通過(guò)算法的運(yùn)用進(jìn)行學(xué)習(xí)這一可能性,該可能性從數(shù)據(jù)中推斷出獨(dú)立的規(guī)律性,持續(xù)調(diào)整和優(yōu)化以經(jīng)驗(yàn)為基礎(chǔ)的系統(tǒng)。人工智能系統(tǒng)在研發(fā)及其后的數(shù)據(jù)處理階段運(yùn)用了數(shù)學(xué)算法而非單純的“如果—那么”規(guī)則,用數(shù)學(xué)算法識(shí)別復(fù)雜的模型,與人類觀察者的眼睛相反,后者注意到的主要是個(gè)別情況。較強(qiáng)的算法是將來(lái)的神經(jīng)網(wǎng)絡(luò),其工作原理類似于學(xué)習(xí)過(guò)程以及對(duì)人類大腦中的反饋進(jìn)行處理。判斷一種預(yù)先的評(píng)估是正確或錯(cuò)誤的,根據(jù)這些信息(如根據(jù)對(duì)外部數(shù)據(jù)庫(kù)的獨(dú)立進(jìn)入),該人工智能系統(tǒng)單獨(dú)或共同地改變了系統(tǒng)(“突觸”或“神經(jīng)”)內(nèi)部無(wú)數(shù)的規(guī)則連接,由此導(dǎo)致對(duì)未來(lái)的問(wèn)題進(jìn)行變動(dòng)的評(píng)估。當(dāng)然,為了識(shí)別復(fù)雜的模型和理想地獲得適當(dāng)?shù)慕Y(jié)果,這種獨(dú)立進(jìn)行學(xué)習(xí)的人工智能系統(tǒng)需要大量的訓(xùn)練數(shù)據(jù)。
基于神經(jīng)網(wǎng)絡(luò)的多層性和復(fù)雜性,人類運(yùn)用者對(duì)被開(kāi)發(fā)的人工智能系統(tǒng)始終理解甚少:某個(gè)參數(shù)在何處被改變,為何經(jīng)過(guò)一段延長(zhǎng)的訓(xùn)練期以后只能產(chǎn)生這樣一種結(jié)果——存在系統(tǒng)還無(wú)法識(shí)別的新數(shù)據(jù)?該決定過(guò)程以此方式似乎迅速成為一個(gè)“黑箱”,在復(fù)雜的人工智能系統(tǒng)中,最初的編程者也不再能完整地解釋它。為了解決人工智能的不透明性問(wèn)題,近年來(lái)對(duì)“可解釋的人工智能”(Explainable AI)所進(jìn)行的研究率先提出了一些大有希望的算法③Vgl.u.a.Goodfellow/Bengio/Courville,Deep Learning,2018.(參見(jiàn)下文),但尚未進(jìn)入在此得到關(guān)注的適用范圍?;谠撎厥庑裕谛淌略V訟中,人工智能的運(yùn)用關(guān)系到一種特殊的挑戰(zhàn)——由人工智能產(chǎn)生的評(píng)估,該評(píng)估以其他的程序?yàn)榛A(chǔ)或者做出決定時(shí)要進(jìn)行該評(píng)估。
由于人工智能系統(tǒng)對(duì)刑事訴訟中的各項(xiàng)事務(wù)存在多種評(píng)估方法,對(duì)此無(wú)法對(duì)合法性和可行性進(jìn)行全面的評(píng)估。因此,在進(jìn)行犯罪預(yù)測(cè)時(shí),可將以下觀點(diǎn)示范性地用于可想到的運(yùn)用方案中:一方面,這涉及一種在結(jié)構(gòu)上還比較簡(jiǎn)單的決定(有無(wú)風(fēng)險(xiǎn))。另一方面,外國(guó)已有實(shí)踐經(jīng)驗(yàn),盡管尚未運(yùn)用上文意義上的人工智能,這是因?yàn)?,雖然這些被運(yùn)用至今的系統(tǒng)還將得到運(yùn)用,但在運(yùn)用過(guò)程中它們的參數(shù)沒(méi)有獨(dú)立、持續(xù)、額外地得到優(yōu)化。④Siehe dazu n?her unter III.這種關(guān)于預(yù)測(cè)的決定屬于以下范圍——法官在審判中做出判處緩刑(德國(guó)《刑法典》第56、67B 條)的決定,或者在刑罰執(zhí)行中做出決定(德國(guó)《刑法典》第67C 條、第67D 條第2、3 款)。但對(duì)執(zhí)行保安處分而言,人工智能的運(yùn)用可能是不太實(shí)際的,這是因?yàn)?,為了適應(yīng)電子決定過(guò)程,精神病學(xué)的評(píng)估通常具有決定性意義,這具備很強(qiáng)的個(gè)案關(guān)聯(lián)性并在經(jīng)驗(yàn)上難以理解。至少在更輕微和中等的犯罪這一領(lǐng)域,關(guān)于緩刑和假釋的預(yù)測(cè)在數(shù)量上明顯更多,但更依賴在統(tǒng)計(jì)上具備可測(cè)量性的電子處理標(biāo)準(zhǔn)(如前科刑、執(zhí)行經(jīng)歷、犯罪種類和年齡)。只要法官在提供建議上并非罕見(jiàn)性地不專業(yè)(德國(guó)《刑事訴訟法》第246a 條第2款、第454 條第2 款),他以自己多少較為充沛的職業(yè)經(jīng)驗(yàn)和對(duì)犯罪原因及過(guò)程的主觀認(rèn)識(shí)為背景,根據(jù)個(gè)案中對(duì)事實(shí)情況的提出和衡量,做出了較為理想但終歸是直覺(jué)性的決定。
這種做出決定的結(jié)構(gòu)(以統(tǒng)計(jì)和數(shù)學(xué)上的關(guān)聯(lián)為基礎(chǔ)提出和評(píng)估數(shù)據(jù),完全通過(guò)數(shù)據(jù)處理被模擬)最終能給出風(fēng)險(xiǎn)評(píng)估——是否會(huì)導(dǎo)致德國(guó)《刑事訴訟法》第56 條第1 款意義上的“期待”存在或是否符合該法第57 條第1 款第2 項(xiàng)的“責(zé)任”,隨后法官在做出決定前的評(píng)判中可能參考該評(píng)估。但根據(jù)當(dāng)前的規(guī)范綱領(lǐng)(Normprogramm),基于做出緩刑決定的必要評(píng)判要素,這種擴(kuò)展性的運(yùn)用亦即適當(dāng)?shù)木徯虥Q定無(wú)法通過(guò)人工智能做出。此外,很明顯,德國(guó)《基本法》第92 條意義上的司法權(quán)被行使,該司法權(quán)被委托給法官而非技術(shù)人員設(shè)計(jì)的一個(gè)計(jì)算機(jī)程序。①Eingehend Nink(Fn.2),S.261 ff.,287 f.對(duì)此,存在以下共識(shí):最終的決定必須始終由法官做出,②Nink(Fn.2),S.354 f.在此要區(qū)分兩種討論面向:一方面涉及以下事實(shí)問(wèn)題:人類對(duì)一種潛在的、永不出錯(cuò)的工作系統(tǒng)進(jìn)行控制的強(qiáng)度和效率。③Eisele/B?hm,in:Beck/Kusche/Valerius(Fn.1),S.519(532).另一方面涉及以下規(guī)范視角:法官保留(Richtervorbehalt)或一般的人類決定者的保留。在一般的數(shù)據(jù)保護(hù)法即歐盟《通用數(shù)據(jù)保護(hù)條例》第22 條第1 款④Art.22 Abs.1 DSGVO lautet:“Die betroffene Person hat das Recht,nicht einer ausschlie?lich auf einer automatisierten Verarbeitung[…]beruhenden Entscheidung unterworfen zu werden,die ihr gegenüber rechtliche Wirkung entfaltet oder sie in ?hnlicher Weise erheblich beeintr?chtigt.”(當(dāng)然也有例外)中,完全自動(dòng)地做出決定在一般法(einfachgesetzlich)的意義上已被禁止。⑤Steinbach(Fn.5),S.120.此外,處于核心地位的危險(xiǎn)防控和刑事追訴部門(mén)與歐洲議會(huì)和理事會(huì)第2016/680 號(hào)指令有關(guān),該指令第11 條第1 款有相應(yīng)規(guī)定,明確要求具備(人類)責(zé)任人介入的可能性。⑥Art.11 Abs.1 RL(EU)2016/80 lautet:“Die Mitgliedstaa-ten sehen vor,dass eine ausschlie?lich auf einer automatischen Verarbeitung beruhende Entscheidung-einschlie?lich Profiling-,die eine nachteilige Rechtsfolge für die betroffene Person hat oder sie erheblich beeintr?chtigt,verboten ist,es sei denn,sie ist nach dem Unionsrecht oder dem Recht der Mitgliedstaaten,dem der Verantwortliche unterliegt und das geeignete Garantien für die Rechte und Freiheiten der betroffenen Person bietet,zumindest aber das Recht auf pers?n-liches Eingreifen seitens des Verantwortlichen,erlaubt.”德國(guó)《聯(lián)邦數(shù)據(jù)保護(hù)法》第54 條第1款的規(guī)定⑦Die Vorschrift lautet:“Eine ausschlie?lich auf einer automatischen Verarbeitung beruhende Entscheidung,die mit einer nachteiligen Rechtsfolge für die betroffene Person verbunden ist oder sie erheblich beeintr?chtigt,ist nur zul?ssig,wenn sie in einer Rechtsvorschrift vorgesehen ist.”修正性地得以實(shí)現(xiàn):通過(guò)法律規(guī)范,禁止完全自動(dòng)地做出決定最終變成附許可保留的禁止,但令人驚訝的是,對(duì)責(zé)任人介入權(quán)的最低保障在此并未復(fù)歸。然而,該條款也通過(guò)進(jìn)行符合該指令的解釋得到解讀。⑧Helfrich,in:Sydow(Hrsg.),Nomos Kommentar,Bundesdatenschutzgesetz,2019,§54 Rn.5.上述介入可能性的最低標(biāo)準(zhǔn)意味著一種(法官)對(duì)決定過(guò)程的監(jiān)督,同時(shí)基于其他必要的、有待評(píng)估的決定性因素,這種監(jiān)督最終僅成為一種將做出決定的人工智能支撐:法官審查人工智能所進(jìn)行的犯罪預(yù)測(cè),目的在于必要時(shí)糾正這些預(yù)測(cè),然后(若有可能的話)將這些預(yù)測(cè)建立在以下基礎(chǔ)上——關(guān)于“可期待性”或“可負(fù)責(zé)性”的決定。
這種所謂的決定模式當(dāng)前是可以建構(gòu)的,不會(huì)從一開(kāi)始就面臨無(wú)法克服的法律障礙。然而,這只是完成了第一步,因?yàn)閮蓚€(gè)相互交織的問(wèn)題完全可能導(dǎo)致:通過(guò)人工智能排除做出這種決定的支撐。第一個(gè)問(wèn)題涉及對(duì)人工智能評(píng)估進(jìn)行法律監(jiān)督的可行性和效率。要克服這些難以修復(fù)的薄弱環(huán)節(jié)將產(chǎn)生以下問(wèn)題:對(duì)于法官所做出決定的質(zhì)量提出規(guī)范性要求。如果基于人工智能的復(fù)雜性,該決定的特定基本前提不可能得到質(zhì)問(wèn),這就涉及該問(wèn)題。此外,工作量、技術(shù)信任或其他原因?qū)е陆z毫不加批判地接受技術(shù)評(píng)估——該疑慮是有價(jià)值的,并且對(duì)于非學(xué)習(xí)性信息系統(tǒng)的運(yùn)用也是適用的。對(duì)此,相似的但同樣遭受疑慮的是反面效果——一種對(duì)人工智能評(píng)估不加區(qū)別的不信任,這導(dǎo)致技術(shù)支持基本上受到忽視并以(可能是比較糟糕的)直覺(jué)替代評(píng)估。這就將人工智能的優(yōu)勢(shì)轉(zhuǎn)化為劣勢(shì),最終導(dǎo)致做出更糟糕的決定。
在此背景下,考察一下國(guó)外迄今為止獲得的、以軟件做支撐的犯罪預(yù)測(cè)工具運(yùn)用的經(jīng)驗(yàn)是值得的。基于算法對(duì)罪犯進(jìn)行風(fēng)險(xiǎn)預(yù)測(cè)可能已被美國(guó)所有的州(不包括聯(lián)邦層面)采用。⑨Steinbach(Fn.5),S.85.這類系統(tǒng)⑩Eine übersicht bietet Electronic Privacy Information Center(epic.org),Liberty at Risk:Pretrial Risk Assessment Tools in the U.S.,2020,S.2 ff.中當(dāng)前最知名的是COMPAS,①COMPAS = Correctional Offender Management Profiling for Alternative Sanctions,entwickelt von Northpointe Inc.und inzwischen als COMPAS-R Core Teil der Northpointe Suite Pretrial.其以137 條信息為根據(jù),其中部分信息是通過(guò)詢問(wèn)獲取的。②Der Fragebogen ist abgedruckt in Electronic Privacy Information Center(Fn.16),S.26 ff.但關(guān)于這些系統(tǒng)的經(jīng)驗(yàn)是矛盾的。一個(gè)重要的批評(píng)點(diǎn)在于對(duì)特定族群可能存在的歧視,因?yàn)槲kU(xiǎn)在于僅以膚色為根據(jù)將他們歸入風(fēng)險(xiǎn)族群。③Nink(Fn.2),S.381 ff.此外,在風(fēng)險(xiǎn)預(yù)測(cè)中,所謂的結(jié)果可能不會(huì)被高估,因?yàn)榈玫竭\(yùn)用的系統(tǒng)在有效性上并無(wú)區(qū)別,運(yùn)行的精確性較低。④James,Risk and Needs Assessment in the Federal Prison System,10.7.2018,S.4.
在瑞士,分類能力明顯較低的FaST 軟件⑤FaST=Fall-Screening-Tool.得到運(yùn)用,其當(dāng)然無(wú)法發(fā)布預(yù)測(cè),而是將受檢者僅歸入3 個(gè)風(fēng)險(xiǎn)族群,并且僅表明可能需要進(jìn)行更詳細(xì)的說(shuō)明。⑥Eisele/B?hm(Fn.9),S.525 f.在犯罪行為和人方面,來(lái)自4 個(gè)領(lǐng)域的17 條標(biāo)準(zhǔn)得到運(yùn)用,使用者也要對(duì)其中的部分標(biāo)準(zhǔn)權(quán)衡一下,但這些標(biāo)準(zhǔn)既未得到深度的采用,也未對(duì)個(gè)案特殊性留有余地。⑦Wegen der Einzelheiten siehe das Manual des Fall-Screening-Tools,Version 6 aus Januar 2018.
基于上述經(jīng)驗(yàn),當(dāng)前可用的程序(用于有效地支持法官做出決定)具備的可運(yùn)用性值得懷疑。但在此背景下,如何判斷人工智能系統(tǒng)潛在的合適性?
此外,如果對(duì)自動(dòng)做出決定所持的期待很高,⑧Dietvorst/Simmons/Massey,Journal of Experimental Psychology:General 2015,Bd.144,Heft 1,114.該決定就像人類的判斷一樣,始終形塑了環(huán)境中的一部分。⑨Steinbach(Fn.5),S.33.這涉及一個(gè)高度復(fù)雜的環(huán)境,因而人們經(jīng)?!昂雎浴毕嚓P(guān)的環(huán)境因素。原因可能首先在于相關(guān)者在動(dòng)力和生活環(huán)境上的多樣性,這就無(wú)法事先識(shí)別對(duì)關(guān)于預(yù)測(cè)的決定有意義的所有因素。但這可能(就像在FaST 的場(chǎng)合)以已知的少數(shù)因素的減少為根據(jù),有人想要充分地認(rèn)識(shí)其效果,嚴(yán)格循證的規(guī)定參數(shù)(Streng Evidenzbasierte Vorgaben)對(duì)此通常是欠缺的。有人可能為了避免歧視而故意刪除了其他因素。⑩Siehe etwa die Bemühungen in Pennsylvania,ethnisch begründete Risikomodifikationen auszublenden,z.B.in den Richtlinien der Pennsylvania Commission on Sentencing.在算法訓(xùn)練中,何種因素占據(jù)重要地位?這在某種程度上也取決于開(kāi)發(fā)者和委托人的世界觀(和犯罪觀)。?Steinbach(Fn.5),S.34.此外,只有在人工智能模型中明確的獲取和供給這一場(chǎng)合,從情境角度誘發(fā)或阻礙犯罪的影響可能才得到考慮,這種獲取和供給只是識(shí)別了一般性的促進(jìn)或阻礙犯罪的情況。基于人類的決定自由,這是否也在個(gè)案中起作用是懸而未決的。
此目的也不一定是最好的,最好的是:進(jìn)步取決于預(yù)測(cè)是否比現(xiàn)狀起到更好的作用。人工智能的運(yùn)用可在多個(gè)方面考慮已有的預(yù)測(cè)方法,對(duì)此要富于幫助性。眾所周知,人類做出決定時(shí)在感知、信息處理、決定的做出方面均遭到某種程度的(未考慮到的)扭曲(“偏差”)。例如,在法學(xué)語(yǔ)境下,以下傾向是較為重要的:對(duì)符合最初推測(cè)的信息進(jìn)行評(píng)估、忽略相互矛盾的信息(“已證實(shí)的偏差”),或做出決定時(shí)完全忽略法官遭遇的困難和不合法的證據(jù)。?Peer/Gamliel,Court Review:The Journal of the American Judges Associaton 49(2013),114.甚至在訴訟期間數(shù)量(有時(shí)這是不重要的)的大小可能決定性地影響最終量刑的高低?Englich/Mussweiler,Journal of Applied Social Psychology 31(2001),1535.(“錨定效應(yīng)”)。這只是一些例子說(shuō)明對(duì)人類做出決定的主觀影響。自主學(xué)習(xí)的人工智能系統(tǒng)沒(méi)有這種阻礙,每次做出決定都以基于數(shù)據(jù)的模型為基礎(chǔ),不被以下因素影響:最初的推測(cè)、不重要的信息、數(shù)據(jù)的順序、時(shí)間、饑餓或其他心理狀態(tài)。對(duì)此,可能實(shí)現(xiàn)一種相當(dāng)程度的公平,始終不變的循證規(guī)則就能由此得到運(yùn)用。
人工智能的另一個(gè)優(yōu)勢(shì)在于最大可能地將數(shù)據(jù)作為決定的基礎(chǔ)而加以利用,?Steinbach(Fn.5),S.30.這種決定的基礎(chǔ)優(yōu)于單純的人類或法官的經(jīng)驗(yàn)基礎(chǔ)。除了更好的預(yù)判能力以外,還利用人工智能系統(tǒng)或(獨(dú)立的)數(shù)據(jù)挖掘(Data Mining),尋找不同因素(犯罪行為的發(fā)生、諸如社會(huì)環(huán)境條件等個(gè)人情況)之間在數(shù)據(jù)上的重要關(guān)聯(lián)。因此,人工智能可從獨(dú)立并同時(shí)起作用的幾種原因之間的關(guān)聯(lián)中識(shí)別出犯罪風(fēng)險(xiǎn),個(gè)案中的人類觀察者不一定知道這些風(fēng)險(xiǎn)。
人工智能有希望得到成功運(yùn)用的基本前提在于足夠大而有效的數(shù)據(jù)庫(kù),但該數(shù)據(jù)庫(kù)主要只對(duì)經(jīng)?;虼罅勘粚?shí)施的犯罪而言具備可展示性。①Eisele/B?hm(Fn.9),S.531.為了能對(duì)犯罪黑數(shù)較高的犯罪進(jìn)行可靠的預(yù)測(cè),同時(shí)為了獲得在生活和性格方面容易導(dǎo)致犯罪的、有意義的參數(shù),還要對(duì)犯罪黑數(shù)進(jìn)行相應(yīng)的研究。但對(duì)犯罪自動(dòng)進(jìn)行預(yù)測(cè)大體上可能還是一種空想。對(duì)于研究現(xiàn)狀較好或可研究性較強(qiáng)的犯罪領(lǐng)域,如商店盜竊、BTM 機(jī)犯罪、暴力犯罪,自動(dòng)預(yù)測(cè)在可預(yù)見(jiàn)的未來(lái)完全可能得到運(yùn)用。
對(duì)此,較為重要的是,人工智能系統(tǒng)僅適用于適合進(jìn)行犯罪側(cè)寫(xiě)(Kriminalit?tsprofil)的情形。否則,人們將相信它是一種精確的方法所導(dǎo)致的結(jié)果,在具體情形中其不應(yīng)得到這種信任,因?yàn)樗惴ㄋ罁?jù)的數(shù)據(jù)過(guò)少。這也同樣適用于決定的客觀性或中立性。②Steinbach(Fn.5),S.31 ff.
要考察一下法官對(duì)人工智能提供支持的、調(diào)查領(lǐng)域的犯罪預(yù)測(cè)所進(jìn)行的必要監(jiān)督,就不得不先在結(jié)構(gòu)上比較一下對(duì)鑒定意見(jiàn)的審查。在這種情形下,法官利用連自己都沒(méi)有的、他人的權(quán)限,以對(duì)自己做出的決定確定根據(jù)。數(shù)據(jù)庫(kù)和算法可能大體上均已家喻戶曉,但可能與計(jì)算機(jī)運(yùn)算一樣,被人們理解甚少,如其自動(dòng)進(jìn)行的DNA 分析或類精神分裂型人格違常(schizoide Pers?nlichkeitsst?rung)的診斷。鑒定意見(jiàn)仍然要求理解數(shù)據(jù)庫(kù)和算法,并且不要盲目相信被告知的結(jié)論。③BGHSt 8,113(118).同樣在結(jié)構(gòu)上可以比較的是經(jīng)常在罰金程序中討論的問(wèn)題——合規(guī)的自動(dòng)化測(cè)量?jī)x。在標(biāo)準(zhǔn)化的測(cè)量程序中,只有被告知的結(jié)論在正確性上存疑時(shí),才存在詳細(xì)的審查義務(wù)。④Dazu statt vieler BGH NJW 1993,3081(3083).當(dāng)然,人們可能暫時(shí)不會(huì)將處于發(fā)展中的人工智能視為標(biāo)準(zhǔn)化的方法。在可比較的情形中,沒(méi)有必要通過(guò)征求鑒定意見(jiàn)去詳細(xì)地理解標(biāo)準(zhǔn)化速度測(cè)量的準(zhǔn)確性和以其為基礎(chǔ)的預(yù)判。⑤OLG Oldenburg,Beschl.v.19.7.2021-2 Ss(OWi)170/21,Rn.19.人們將鑒定意見(jiàn)交給審查人工智能預(yù)測(cè)的法官,對(duì)此可能產(chǎn)生很廣泛的審查需求。但值得懷疑的是,一方面,是否要對(duì)預(yù)測(cè)結(jié)論進(jìn)行完整的理解?另一方面,力求做出無(wú)過(guò)錯(cuò)的決定是否有必要?因?yàn)椴煌阼b定意見(jiàn)和速度測(cè)量,如果法官由于極其懷疑人工智能的正確性而拒絕運(yùn)用人工智能,他并未兩手空空,因?yàn)槠淙员A糁鴤鹘y(tǒng)的預(yù)測(cè)方法,甚至以職業(yè)和生活經(jīng)驗(yàn)為基礎(chǔ)通過(guò)直覺(jué)進(jìn)行風(fēng)險(xiǎn)評(píng)估。將來(lái)一個(gè)有趣的選擇,同時(shí)也是一種可能性——考慮以進(jìn)修或繼續(xù)教育的形式,將基于人工智能的預(yù)測(cè)變成法官培訓(xùn)的部分內(nèi)容。
這涉及對(duì)人工智能所產(chǎn)生結(jié)果的審查,那就主要考察一下軟件。但這種審查會(huì)遭遇極大的困難。用于進(jìn)行犯罪預(yù)測(cè)的人工智能系統(tǒng)的開(kāi)發(fā)主要由私人企業(yè)掌握,這些企業(yè)的運(yùn)作以營(yíng)利為導(dǎo)向。⑥Vgl.für die USA die übersicht von Electronic Privacy Information Center(Fn.16),S.5 ff.雖然美國(guó)有個(gè)別州表現(xiàn)得較為積極,但大多州運(yùn)用較為簡(jiǎn)單的統(tǒng)計(jì)程序,鑒于必要的編程或培訓(xùn)程序費(fèi)用較高,積極的州在數(shù)量上稀少得令人震驚。就德國(guó)而言,由于聯(lián)邦結(jié)構(gòu)使然,同樣不可能期待個(gè)別或幾個(gè)州能以一己之力開(kāi)發(fā)有效的程序用于犯罪預(yù)測(cè)。在國(guó)家司法中運(yùn)用多種數(shù)據(jù)處理程序的經(jīng)驗(yàn)事實(shí)上允許我們期待以下情形:有人在產(chǎn)生疑問(wèn)時(shí)及開(kāi)發(fā)人工智能系統(tǒng)時(shí)將求助于商業(yè)供貨人。但如果以營(yíng)利為導(dǎo)向的軟件企業(yè)必須將其軟件置于法官的監(jiān)督之下,這些企業(yè)就有權(quán)認(rèn)為其市場(chǎng)地位遭遇危險(xiǎn)。這種情形在刑事訴訟中業(yè)已發(fā)生,所以根據(jù)既定的閱卷權(quán),排除以下情形的發(fā)生是站不住腳的:有人索取甚至競(jìng)相索取敏感信息。根據(jù)迄今為止所有的經(jīng)驗(yàn)可知,開(kāi)發(fā)者有良好的理由拒絕公開(kāi)以下數(shù)據(jù):①Electronic Privacy Information Center(epic.org),AI in the Criminal Justice System.該數(shù)據(jù)誘發(fā)了以下要求——只接受開(kāi)源算法運(yùn)行的系統(tǒng)。②Jiang(Fn.37),S.569 f.
但即使運(yùn)用開(kāi)源軟件是現(xiàn)實(shí)的,也存在以下疑問(wèn):這種運(yùn)用是否將導(dǎo)致可理解性得到極大提升?在自主學(xué)習(xí)系統(tǒng)的極深層結(jié)構(gòu)中,系統(tǒng)的初始結(jié)構(gòu)(Ausgangsstruktur)可能對(duì)以后的個(gè)案結(jié)果扮演著一個(gè)較為微弱的角色,該結(jié)果證明是一種持續(xù)優(yōu)化的機(jī)器學(xué)習(xí)過(guò)程。因?yàn)橄噍^于訓(xùn)練數(shù)據(jù)的總量、結(jié)構(gòu)和系統(tǒng)內(nèi)部由其引起的變化,上述初始狀態(tài)對(duì)具體的請(qǐng)求進(jìn)行響應(yīng)時(shí)較少做出決定。是否有人會(huì)以合理的費(fèi)用,通過(guò)軟件、神經(jīng)元及其重要性的公開(kāi),理解這種隨著時(shí)間的推移持續(xù)發(fā)生的變化,③So die Forderung von Jiang(Fn.37),S.585.這至少是有疑問(wèn)的。上述情況的實(shí)現(xiàn)無(wú)論如何都不是常規(guī)的,通常必然同時(shí)發(fā)生的是不再讓法官進(jìn)行審查,但這似乎與法官做出決定的要求不一致。
如果人工智能支撐的個(gè)案預(yù)測(cè)對(duì)系統(tǒng)之最初編程的依賴,低于對(duì)基于數(shù)據(jù)的訓(xùn)練之依賴,這些數(shù)據(jù)的質(zhì)量則成為焦點(diǎn)?!袄M(jìn),垃圾出”這一現(xiàn)象,建議堅(jiān)持運(yùn)用特定的標(biāo)準(zhǔn),從理論上講這具備可控制性。因此,這些訓(xùn)練數(shù)據(jù)必須在數(shù)量上符合被犯罪學(xué)證實(shí)的事實(shí),不可有歧視傾向。但實(shí)際上面臨極大的障礙,因?yàn)楂@取這些數(shù)據(jù)完全不是理所當(dāng)然的。美國(guó)的經(jīng)驗(yàn)包含以下內(nèi)容:基于競(jìng)爭(zhēng)和費(fèi)用原因,合作和透明度是無(wú)法期待的。④Jiang(Fn.37),S.563.但即使在可用的訓(xùn)練數(shù)據(jù)這一場(chǎng)合,識(shí)別潛在的關(guān)鍵性數(shù)據(jù)也并非不重要。例如,有人識(shí)別出此種過(guò)度表征(überrepr?sentation):歧視性的模型(比如,相較于沒(méi)有移民背景的人,該模型更多地表現(xiàn)出逮捕具有移民背景的人),被認(rèn)為以一種較為精確的認(rèn)識(shí)為前提——認(rèn)識(shí)到相關(guān)群體的犯罪傾向?qū)嶋H上是怎樣的情形。這些事實(shí)是否都得到了充分的研究以及完全被認(rèn)識(shí)清楚,對(duì)所有的重要參數(shù)而言似乎無(wú)論如何都無(wú)法得到保證?;诖朔治?,預(yù)先完全隱去這些易受歧視的事實(shí)(比如出身)⑤Sympathien für eine solch radikale L?sung scheinen bei Eisele/B?hm(Fn.9),S.530,durch.這一簡(jiǎn)單的解決方案帶來(lái)以下危險(xiǎn):可能放棄對(duì)預(yù)測(cè)而言重要的提示。特定類型的訓(xùn)練數(shù)據(jù)有必要僅在以下范圍得到運(yùn)用:該數(shù)據(jù)符合已得到充分研究的事實(shí)。如果上述事實(shí)在某個(gè)環(huán)節(jié)未得到充分研究,但人工智能查明了其相關(guān)性,該環(huán)節(jié)就必定具備可察知性,對(duì)此,該環(huán)節(jié)受法官監(jiān)督的預(yù)測(cè)作用是可以獲得的。不要忘記具體案件的數(shù)據(jù)在質(zhì)量上的重要性。只要案件數(shù)據(jù)在錄入上具有目的性而非被自動(dòng)獲取,⑥D(zhuǎn)enkbar w?re natürlich auch ein Scan der Akten bzw.künftig der elektronischen Akten.Allerdings erscheint der dadurch erzielbare Vorteil in Gestalt einer Arbeitserleichterung eher gering,weshalb sich diese zus?tzliche Fehlerquelle ohne gr??eren Aufwand vermeiden lie?e.對(duì)錄入錯(cuò)誤進(jìn)行監(jiān)督的標(biāo)準(zhǔn)和方法就仍不屬于人工智能做出的決定這一范疇,法官通過(guò)上述標(biāo)準(zhǔn)和方法,在這些事實(shí)中選擇他認(rèn)為重要和不重要的部分。其他的錯(cuò)誤根源或監(jiān)督漏洞在此可以很好地得以避免。
基于各種原因考察數(shù)據(jù)庫(kù)和軟件對(duì)法官監(jiān)督而言可能毫無(wú)用處。令人擔(dān)心的是,人工智能越先進(jìn)并且可用的經(jīng)驗(yàn)越多,就越難做出決定。因此,試圖在某種程度上進(jìn)行剖析并讓決定過(guò)程透明可見(jiàn)、易于理解,⑦Auf die damit verbundenen datenschutzrechtlichen Probleme im Lichte der Art.5 Abs.1 lit.a DSGVO(für die betroffene Person nachvollziehbare Verarbeitung)und der dies konkretisierenden Art.13-15 DSGVO soll an dieser Stelle nicht eingegangen werden.應(yīng)該沒(méi)有較可行的方法。要從本質(zhì)上理解人工智能產(chǎn)生的結(jié)果,就需要對(duì)信息與計(jì)算機(jī)科學(xué)進(jìn)行很深入的研究并提出多種解決方案,⑧Einen anschaulichen überblick liefert die Studie von Kraus/Ganschow/Eisentr?ger/Wischmann,Erkl?rbare KI - Anforderungen,Anwendungsf?lle und L?sungen,2021,S.24 ff.但這絕非所有努力的終點(diǎn)。
為了提高人工智能的透明度,可想到的是這樣去編程:向人工智能公開(kāi)將產(chǎn)生特定結(jié)果的、某個(gè)案件的重要參數(shù)。最近開(kāi)發(fā)的一種名為“SHAP”的模型可解釋性算法甚至在當(dāng)前極不透明的神經(jīng)網(wǎng)絡(luò)中都讓我們能進(jìn)行這種觀察。對(duì)此,對(duì)每次做出決定而言,可能要顯示出何種因素是決定性的。一種因素對(duì)結(jié)果而言是積極的還是消極的也要受到評(píng)判,據(jù)此讓人們予以理解。這對(duì)人工智能系統(tǒng)的可理解性而言是巨大的進(jìn)步,并且產(chǎn)生歧視效果的情況由此潛移默化地昭示在外。
為了提升對(duì)人工智能及其可接受性的信任,法官可能“玩弄”案件數(shù)據(jù),亦即,為了研究人工智能評(píng)估在何種程度上發(fā)生改變,修改或忽略某個(gè)或幾個(gè)參數(shù)。例如,以此方式可以厘清:法官根據(jù)直覺(jué)認(rèn)為案件中較為重要的某方面究竟是否在自動(dòng)化的預(yù)測(cè)中扮演著一個(gè)角色。人工智能的這種情況明顯被認(rèn)為是無(wú)關(guān)緊要的,這無(wú)論如何都讓法官發(fā)出質(zhì)問(wèn):他通過(guò)直覺(jué)做出的相反的評(píng)估是否可能是錯(cuò)誤的?或者說(shuō),他本應(yīng)認(rèn)為,人工智能在此明顯已到達(dá)極限并由此不值得贊同。歧視傾向同樣可能通過(guò)替換為一個(gè)聽(tīng)上去較為外國(guó)化的名稱“非犯罪嫌疑人”(Unverd?chtige)而暴露無(wú)遺。①So sollen Algorithmen in der Versicherungsbranche bei einer bestimmten nationalen Herkunft zu Angeboten mit h?heren Versicherungspr?mien neigen,vgl.die Website der Eidgen?ssischen Kommission gegen Rassismus.該可能性至少為初任法官培訓(xùn)提供了充滿趣味的潛力。
一種容許進(jìn)行對(duì)比試驗(yàn)的軟件設(shè)計(jì)無(wú)疑具備可建構(gòu)性,在諸多解決方案中也是存在的。②Zahlreiche Modelle,die eine KI zu erkl?ren suchen,sind allerdings auf KI-Systeme zur Bild-(oder Gesichts-)Erkennung ausgerichtet(wie LRP[Layer-Wise Relevance Propagation])oder für Nutzer nicht anwendungssicher(wie DeepLIFT[Deep Learning Important FeaTures]oder Activation Maximization)und scheiden daher für die hier in Rede stehenden Zwecke aus.該軟件設(shè)計(jì)以SHAP 運(yùn)用的原則為根據(jù),③SHAP=SHapley Additive exPlanations.根據(jù)該原則,被單獨(dú)選擇的因素對(duì)人工智能系統(tǒng)所產(chǎn)生具體結(jié)果的影響得到確定。對(duì)此,人工智能先是在考慮所有因素的情形下做出某種預(yù)測(cè),隨后在隱去個(gè)別因素的情形下完成了其他的預(yù)測(cè)。以此方式,存在于這些結(jié)果之間一種存在疑問(wèn)的區(qū)別可能呈現(xiàn)出來(lái),某種因素的具體影響可能由此被識(shí)別出來(lái),只要不是只有少數(shù)幾個(gè)因素得到審查,缺點(diǎn)就在于費(fèi)用較高。④Kraus/Ganschow/Eisentr?ger/Wischmann(Fn.44),S.27 f.m.w.N.一種其他的解決方案提供了反事實(shí)解釋(counterfactual explanations)。這涉及一個(gè)概念,對(duì)一種具體的分類結(jié)果(比如一個(gè)糟糕的犯罪預(yù)測(cè))而言,此概念試圖在輸入值中識(shí)別出一種盡可能小的變化,該變化將導(dǎo)致不同的分類。該軟件以此方式顯示出了這個(gè)敏感點(diǎn)。⑤Kraus/Ganschow/Eisentr?ger/Wischmann(Fn.44),S.26 f.m.w.N.定義這些有待審查的因素本身可能是有助益的,卻是不被允許的。為了通過(guò)這些變化查明哪些輸入?yún)?shù)對(duì)分類結(jié)果影響最大,靈敏度分析作為第3 種可想到的方法系統(tǒng)性地改變了各個(gè)輸入值。⑥Kraus/Ganschow/Eisentr?ger/Wischmann(Fn.44),S.31 m.w.N.該方法的目的當(dāng)然是識(shí)別重要的因素,而非審查孤立來(lái)看可能顯得不太重要的各個(gè)參數(shù)。
基于既定的解釋模型和人工智能技術(shù)的進(jìn)步,認(rèn)為對(duì)信息與計(jì)算機(jī)科學(xué)領(lǐng)域詳細(xì)知識(shí)欠缺的使用者而言,將來(lái)相對(duì)更容易有機(jī)會(huì)審查各個(gè)案件參數(shù)的影響,不應(yīng)該是一種不切實(shí)際的空想。運(yùn)用人工智能系統(tǒng)完成預(yù)測(cè)以及具有相應(yīng)的監(jiān)督可能性還不夠。在人類法官做出決定以及人工智能對(duì)做出決定提出建議的場(chǎng)合,要思考一下:這兩種做出決定的系統(tǒng)并非彼此獨(dú)立運(yùn)行的。一方面,尤其是當(dāng)出發(fā)點(diǎn)為人工智能預(yù)測(cè),原則上具備有效性和精確性,并且法官認(rèn)識(shí)到這一點(diǎn)時(shí),究竟是否要進(jìn)行一種符合法官角色的、中立的、不偏不倚的監(jiān)督,是不明確的。⑦?hnlich für den Einsatz im Rahmen medizinischer Diagnose und Behandlung Lohmann/Sch?mig,in:Beck/Kusche/Valerius(Fn.1),S.345(355).另一方面,法官是一個(gè)可能不符合信息技術(shù)使用者常規(guī)類型的群體。法官習(xí)慣于獨(dú)立做出決定,基于其職業(yè)上的社會(huì)化,他們可能比其他職業(yè)群體更不信任這種評(píng)估,如何理解法官要做出決定的一個(gè)事實(shí),這具有優(yōu)先性,但沒(méi)有得到詳細(xì)的解釋。這種相反的趨勢(shì)在何種程度上實(shí)際發(fā)揮作用,尚需要解釋。根據(jù)這兩種可想到的態(tài)度中某種態(tài)度的出現(xiàn)或占據(jù)上風(fēng),要么產(chǎn)生一種未加批判的信息技術(shù)依賴性,該依賴性容許通過(guò)技術(shù)根據(jù)實(shí)際情況做出法官保留的決定,要么忽視高價(jià)值的信息而損害所做出決定的質(zhì)量。為了利用人工智能的優(yōu)點(diǎn)而非一開(kāi)始就遭受其影響,二者都需要避免。
通過(guò)許內(nèi)曼(Schünemann)的相關(guān)著作可知,①Schünemann,StV 2000,159=ders.,Strafprozessrecht und Strafprozessreform,2020,S.239.法官做出決定時(shí)并未不偏不倚,而是可能具有閱卷(Aktenkenntnis)、當(dāng)事人陳述和利害關(guān)系等特征。比如,許內(nèi)曼研究法官在審判中依賴于閱卷這一問(wèn)題行為(Frageverhalten)并發(fā)現(xiàn):預(yù)先信息(Vorinformation)已導(dǎo)致回應(yīng)詢問(wèn)的準(zhǔn)備不足。②Schünemann,StV 2000,159(161 f.).因此,可能無(wú)法排除的是,一種形式為人工智能犯罪預(yù)測(cè)的預(yù)先信息也會(huì)導(dǎo)致法官的舉止發(fā)生改變。③Staffler/Jany,ZIS 2020,164(175).只要在適當(dāng)?shù)?、批判性思考的范圍?nèi)考慮人工智能提出的建議,這本身不是有害的。此外,其他欠缺實(shí)證檢驗(yàn)的想法當(dāng)然是純理論性的。
另外,法官作為人工智能使用者一般需要信任人工智能對(duì)做出適當(dāng)決定提出建議的能力。否則,人工智能就無(wú)法有效地得到運(yùn)用。人工智能已被察知的可信任性不僅包含以正確建議為形式的執(zhí)行力方面,這讓使用者能信任該系統(tǒng)(在理性上完全是可理解的)。④Solberg et al.,Group&Organization Management 2022,Bd.47,Heft 2,187.為了評(píng)估系統(tǒng)的有效性,以過(guò)程為導(dǎo)向的方面(如人工智能的可運(yùn)用性和上文已討論的工作過(guò)程的透明性)作為其他要件也扮演著一個(gè)重要的角色。第三個(gè)要件是對(duì)人工智能總體目標(biāo)、基本價(jià)值和編程導(dǎo)向的信任。除了人工智能系統(tǒng)這種受到評(píng)估的可信任性以外,法官的信任也被關(guān)于技術(shù)的信任傾向(Vertrauensneigung)決定,該傾向的程度無(wú)論在一般性(在社會(huì)整體及其法官群組中)還是個(gè)別性上都是可變的,并且通常依賴于人工智能或數(shù)字化的經(jīng)驗(yàn)(技術(shù)信任)。人工智能的運(yùn)用潛力隨著信任的程度得到提升,因?yàn)槭褂谜邩?lè)意運(yùn)用人工智能,其優(yōu)點(diǎn)由此得到利用。⑤Mee?en/Thielsch/Hertel,Zeitschrift für Arbeits-und Organisationspsychologie 2020,Bd.64,Heft 1,6.對(duì)此,信任并不完全是正面的,因?yàn)槊つ康男湃慰赡軐?dǎo)致不適當(dāng)?shù)剡\(yùn)用人工智能,這可能又潛移默化地導(dǎo)致做出不適當(dāng)?shù)臎Q定。這與“算法厭惡”這一想象相反,因?yàn)橄噍^于人類犯錯(cuò),人們很少原諒系統(tǒng)犯錯(cuò)。⑥D(zhuǎn)ietvorst/Simmons/Massey,Journal of Experimental Psychology:General 2015,Bd.144,Heft 1,114.
需要考察的是,對(duì)人工智能所具有能力的信任究竟如何在特定的法官這一目標(biāo)群體中產(chǎn)生?何種其他的因素(其中部分是無(wú)關(guān)因素)影響了法官對(duì)人工智能做出決定的可接受性?可想到的大概是較高的工作量、沒(méi)時(shí)間親自做出合理的決定或個(gè)人在自動(dòng)決定過(guò)程中由于技術(shù)恐懼或擔(dān)心而產(chǎn)生的不信任(這是不必要的)。然后要考察的是,信任與否以及如何在某種程度上受到限制且不遭到破壞,以及如何被降低到一種“健康”的程度?回答上述兩個(gè)問(wèn)題也需要實(shí)證研究的幫助。這取決于法官對(duì)人工智能給予何種信任,亦即,在可變的初始條件下涉及對(duì)具體得到運(yùn)用的人工智能的認(rèn)識(shí)。因?yàn)樵谶@種情況下,要對(duì)所有已知的訓(xùn)練數(shù)據(jù)和經(jīng)驗(yàn)數(shù)據(jù)、可能未知的個(gè)案事實(shí)具有的影響形成完整的認(rèn)識(shí),是無(wú)法達(dá)到理想狀態(tài)的。需要說(shuō)明的是,在運(yùn)用人工智能的場(chǎng)合,信任的最低限度條件是什么?此外,盡管明顯相反的(重要的、不重要的或重要性無(wú)法判斷)個(gè)案事實(shí)引人注目,知道一種既定的信任何時(shí)減弱,或者知道法官還能對(duì)人工智能信任多久是較為重要的。上述問(wèn)題是跨學(xué)科尤其是心理學(xué)的最佳研究對(duì)象。
在運(yùn)用人工智能系統(tǒng)的場(chǎng)合,對(duì)使用者的信任所進(jìn)行的初始研究一般是存在的,⑦H?ddinghaus/Sondern/Hertel,Computers in Human Behavior 116(2021),106635 m.w.N.但并不涉及法官這一特定群體。此外,該初始研究基于其獨(dú)立性而具有一種特殊性:在其他機(jī)構(gòu)(經(jīng)濟(jì)、行政)中沒(méi)有眾多的決定者。另外,法官遵守嚴(yán)格的決定過(guò)程,該過(guò)程預(yù)先規(guī)定了其無(wú)法任意處置的法律規(guī)范。其特殊性并不在于追求更上位的利益(比如經(jīng)濟(jì)成果或政治目的),而僅在于追求以下最終目的:根據(jù)決定過(guò)程這一標(biāo)準(zhǔn)所做出決定的正當(dāng)性。這些特殊性不容許未經(jīng)審查就作為初步證據(jù)(prima facie)在其他職業(yè)群體的場(chǎng)合接受某些調(diào)查結(jié)果。更確切地說(shuō),似乎有必要在法官群體中獲取關(guān)于信任產(chǎn)生和信任限度的實(shí)證數(shù)據(jù)。
人工智能的運(yùn)用在刑事訴訟中可能長(zhǎng)期導(dǎo)致迅捷地做出長(zhǎng)遠(yuǎn)來(lái)看較為經(jīng)濟(jì)的、高質(zhì)量的決定。在此,就像完成犯罪預(yù)測(cè)那樣,個(gè)案中的許多因素以一種在經(jīng)驗(yàn)上可理解的方式?jīng)Q定了結(jié)果。然而,人工智能的可運(yùn)用性暫時(shí)還未充分得到開(kāi)發(fā),以符合在內(nèi)容上待定的規(guī)范性要求。只要法官能理解某個(gè)決定并讓該決定實(shí)質(zhì)上成為自己做出的決定,則法官做出關(guān)于預(yù)測(cè)的決定可能基本上都以人工智能預(yù)測(cè)為支撐。對(duì)此,軟件必須提供機(jī)會(huì)讓法官至少在原則上理解具體的、對(duì)預(yù)測(cè)的決定而言特定案件參數(shù)的重要性。同時(shí),人工智能的運(yùn)用和其他的相關(guān)框架條件是這樣來(lái)設(shè)計(jì)的——法官在(通常能進(jìn)行正確評(píng)估的)人工智能的運(yùn)用中可能產(chǎn)生一種合理的信任度,而不喪失回應(yīng)批評(píng)性詢問(wèn)的能力和準(zhǔn)備。如何塑造這種工作環(huán)境,仍需要深入的跨學(xué)科實(shí)證研究。應(yīng)建議司法行政管理部門(mén)和立法者保持克制,直至這種工作環(huán)境形成。(王德政①王德政,中南財(cái)經(jīng)政法大學(xué)刑事司法學(xué)院博士后研究人員。譯校)