蔡勝賓
(南開大學(xué) 法學(xué)院,天津 300071)
傳統(tǒng)司法統(tǒng)計是由各級法院統(tǒng)計人員手工統(tǒng)計后,從基層法院開始逐級層報匯總,形成全國性的司法數(shù)據(jù)。隨著計算機(jī)網(wǎng)絡(luò)技術(shù)的進(jìn)步,司法統(tǒng)計效率得到了極大的提升,統(tǒng)計數(shù)據(jù)難以檢驗的弊端也得到了一定的紓解。尤其是2002年以后,司法統(tǒng)計的統(tǒng)計口徑、計算方法和指標(biāo)體系都向著大數(shù)據(jù)與智能化的路徑進(jìn)行改進(jìn)和提升,這也為法院司法統(tǒng)計改革引入大數(shù)據(jù)和新技術(shù)奠定了初步基礎(chǔ)[1]。
近年來,最高院為全面落實《國家信息化發(fā)展戰(zhàn)略綱要》和《“十三五”國家信息化規(guī)劃》對智慧法院建設(shè)的總體要求,制定了《最高人民法院關(guān)于加快建設(shè)智慧法院的意見》。其中,“運用大數(shù)據(jù)和人工智能技術(shù),按需提供精準(zhǔn)智能服務(wù)”、“運用大數(shù)據(jù)為司法決策服務(wù),結(jié)合審判動態(tài)分析和司法統(tǒng)計智能分析”更是成為人民法院推進(jìn)新時期司法統(tǒng)計工作的規(guī)范指引和行動指南。
2016年,最高人民法院全面推進(jìn)司法統(tǒng)計系統(tǒng)與大數(shù)據(jù)管理和服務(wù)數(shù)據(jù)平臺并軌,實現(xiàn)司法統(tǒng)計報表全自動生成(1)。至此,全國法院人工司法統(tǒng)計時代已成為歷史。司法統(tǒng)計信息化建設(shè)水平也在不斷提升,然而,就當(dāng)前情況來看,司法統(tǒng)計也有一些不足之處。
其一,統(tǒng)計平臺有待進(jìn)一步公開。司法統(tǒng)計數(shù)據(jù)涵蓋了案件內(nèi)容、程序運行、效果評價、法律適用,以及法院內(nèi)部審判管理等諸多方面,然而從其公開數(shù)據(jù)來看,卻很難達(dá)到理想的標(biāo)準(zhǔn)。
以最高人民法院網(wǎng)站的司法統(tǒng)計數(shù)據(jù)公開專欄“司法數(shù)據(jù)”為例,自2010年至今,最高人民法院會定期和不定期公布全國司法統(tǒng)計數(shù)據(jù)。就公布的內(nèi)容來看,案件數(shù)量,以刑事、民事及行政案件為區(qū)分標(biāo)準(zhǔn),輔之以一審、二審及再審,對各類數(shù)據(jù)進(jìn)行統(tǒng)計、計算比率。2016年3月以后,該網(wǎng)站開始探索以司法大數(shù)據(jù)專題形式對社會熱點進(jìn)行解析??傮w上,公開內(nèi)容仍限于案件總體數(shù)量和比率升降,以總結(jié)業(yè)績?yōu)槟康?,?shù)據(jù)公開只是附帶性的[2]。
目前,數(shù)據(jù)公開渠道有法院工作報告、法院網(wǎng)站和年鑒。以已發(fā)布的2014年、2018年31個省份法院工作報告為例,報告基本上都發(fā)布了、民商、行政和刑事受案數(shù)量和結(jié)案數(shù)量的數(shù)據(jù)。結(jié)果顯示,即便是針對收結(jié)案等基本數(shù)據(jù),統(tǒng)計口徑也不一致。另外,“數(shù)出多門”不僅出現(xiàn)在政府部門,在司法部門上也由來已久[3]。還存在一些非正式的司法統(tǒng)計數(shù)據(jù)公開渠道,如李國光在《行政執(zhí)法與行政審判參考》中公布了行政審判相關(guān)數(shù)據(jù)。以上各種渠道發(fā)布內(nèi)容詳略不一、類型多樣,直接和間接影響了司法數(shù)據(jù)的嚴(yán)肅性、周延性和精準(zhǔn)性。
其二,統(tǒng)計數(shù)據(jù)監(jiān)管薄弱。大法官高憬宏從現(xiàn)有司法統(tǒng)計數(shù)據(jù)監(jiān)督制度上,指出其存在四個方面的問題:相關(guān)規(guī)定不夠明確、監(jiān)督范圍較為狹窄、方法較單一及監(jiān)控措施執(zhí)行不力[4]。而且,現(xiàn)有統(tǒng)計人員,許多屬于“半路出家”,統(tǒng)計專業(yè)知識缺乏,也很難滿足統(tǒng)計數(shù)據(jù)監(jiān)管要求。針對北京石景山區(qū)人民法院調(diào)研報告,也證實了這一點[5]。
我們還應(yīng)看到現(xiàn)有數(shù)據(jù)管理方式同樣是造成統(tǒng)計數(shù)據(jù)監(jiān)管難堪重任的原因之一?,F(xiàn)行法院大多采取的是涉密信息與非涉密信息捆綁管理的模式。而在司法統(tǒng)計對象中,絕大多數(shù)案件(2)并非涉密信息。加之,絕大多數(shù)法院尚未建立涉密系統(tǒng)與非涉密系統(tǒng)等級保護(hù)機(jī)制,考慮司法信息可能涉密等原因,往往對數(shù)據(jù)信息實行封閉管理。這一管理模式同樣不利于保護(hù)公眾的數(shù)據(jù)知情權(quán)。
其三,統(tǒng)計分析難以深入。作為提供信息支持的服務(wù)工作,法院司法統(tǒng)計通過采集、分析和應(yīng)用司法信息,為人民法院決策、管理、預(yù)測和評價等活動[6]。
目前來看,司法數(shù)據(jù)統(tǒng)計分析主要以歷年法院工作報告、調(diào)研報告及最高人民法院網(wǎng)站“司法數(shù)據(jù)”專欄等形式呈現(xiàn)。工作報告主要是事后分析,通過提取數(shù)量、頻率、百分比、相對比進(jìn)行簡單的數(shù)據(jù)比對,以彰顯業(yè)績?yōu)槟康?。另外,公開文獻(xiàn)顯示,調(diào)研報告主要是法院內(nèi)部人員撰寫,內(nèi)容在于對現(xiàn)有司法統(tǒng)計工作做實證分析及提出改進(jìn)建議,而且公開成果不多(3),難以構(gòu)成統(tǒng)計分析的主要途徑。
2017年10月起,最高人民法院網(wǎng)站開始以司法大數(shù)據(jù)專題的形式發(fā)布各類熱點案件的數(shù)據(jù)分析報告。從現(xiàn)已公布的專題內(nèi)容來看,絕大多數(shù)主要是以案件審結(jié)情況、案件地域分布、當(dāng)事人特征、案件特征等全部或其中兩到三個類目作為研究對象,分析內(nèi)容很固定,也是以事后分析為重點,提取數(shù)量變化、比率升降(4),限于已有的信息資源而缺乏對新的信息資源的開發(fā);從成效來看,至今還未有司法統(tǒng)計分析大規(guī)模地影響立法進(jìn)程的事例,亦很少看到?jīng)Q策者依靠司法統(tǒng)計分析數(shù)據(jù)做決策[7]。
實踐中,全國各級法院都在積極探索一條符合本院實際的司法統(tǒng)計“大數(shù)據(jù)”之路,如崇左中院全面推行電子卷宗工作深度運用[8]、浙江高院開發(fā)了“審判執(zhí)行案件信息結(jié)構(gòu)化數(shù)據(jù)分析系統(tǒng)”和建立起各種類型司法統(tǒng)計分析需要的數(shù)學(xué)統(tǒng)計模型[9]??梢哉f,大數(shù)據(jù)及人工智能、云計算等新技術(shù)相繼在司法統(tǒng)計中的應(yīng)用,為推進(jìn)新時代司法統(tǒng)計工作提供了前所未見的效能。
其一,規(guī)范統(tǒng)計平臺數(shù)據(jù)采集,助推司法公開。當(dāng)前,我國法院司法統(tǒng)計口徑不一致,其重要制約因素之一在于各省法院數(shù)據(jù)采集模式存在差別、數(shù)據(jù)采集深度不同。因此限于已獲取數(shù)據(jù)量的差異,后續(xù)公開數(shù)據(jù)的統(tǒng)計口徑已很難達(dá)到一致。大數(shù)據(jù)時代強調(diào)數(shù)據(jù)的量大(5),一改傳統(tǒng)數(shù)據(jù)分析的樣本收集,強調(diào)收集盡可能全的數(shù)據(jù)進(jìn)行分析[10]。一旦全法院系統(tǒng)實現(xiàn)全樣本統(tǒng)計,這意味著數(shù)據(jù)采集模式和體量上的差異得以消弭。后續(xù)司法數(shù)據(jù)公開只要是同等的,統(tǒng)計口徑自然很輕易能做到一致。那么此時關(guān)鍵在于,如何實現(xiàn)全樣本統(tǒng)計?以辦公內(nèi)網(wǎng)、涉密內(nèi)網(wǎng)、法院專網(wǎng)、外部專網(wǎng)和互聯(lián)網(wǎng)等五大網(wǎng)系為紐帶的信息基礎(chǔ)設(shè)施覆蓋全國法院,作為用戶的法官、涉案當(dāng)事人和社會公眾在平臺上從事相關(guān)活動,每時每刻都會產(chǎn)生巨量的數(shù)據(jù)(6)。司法大數(shù)據(jù)真正實現(xiàn)時,應(yīng)當(dāng)是全樣本統(tǒng)計、全景式記錄。除了深挖以上案件和報表的統(tǒng)計數(shù)據(jù)以外,大數(shù)據(jù)及新技術(shù)的引入將為司法統(tǒng)計開辟全新的數(shù)據(jù)源頭,實現(xiàn)數(shù)據(jù)采集的全面化。
其二,推進(jìn)數(shù)據(jù)平臺的社會化,強化數(shù)據(jù)監(jiān)管。當(dāng)數(shù)據(jù)平臺逐步實現(xiàn)社會化時,意味著數(shù)據(jù)源頭不再被法院和法官捏在手中,統(tǒng)計數(shù)據(jù)流動的內(nèi)外互通互聯(lián),自然不再是問題。而且,隨著數(shù)據(jù)平臺的開放性和互動性加強,數(shù)據(jù)監(jiān)管的多主體化成為可能,其中就包括了當(dāng)事人和普通網(wǎng)民。目前來看,大數(shù)據(jù)管理與服務(wù)平臺已經(jīng)匯聚了9000余萬案件信息,顯然在數(shù)據(jù)的量級上已經(jīng)有了相當(dāng)?shù)奶嵘?。基于司法?shù)據(jù)的公共屬性和司法公開的要求,大數(shù)據(jù)技術(shù)將持續(xù)優(yōu)化網(wǎng)系建設(shè)、構(gòu)建法院開放云。
其三,實現(xiàn)統(tǒng)計分析的綜合化,充分釋放司法統(tǒng)計效能。大數(shù)據(jù)和新技術(shù)的引入,使得司法統(tǒng)計實現(xiàn)了分析的綜合化、立體化。通過對數(shù)據(jù)平臺上的初始數(shù)據(jù)、整合數(shù)據(jù)和處理數(shù)據(jù)等進(jìn)行綜合分析和立體解構(gòu),司法數(shù)據(jù)集群得以納入多維時空視角進(jìn)行具體分析。大數(shù)據(jù)的數(shù)據(jù)挖掘和分析,不再受限于傳統(tǒng)統(tǒng)計學(xué)中抽樣樣本,通過一定的運算法則,將事物之間通過相關(guān)關(guān)系搜索列入量化數(shù)據(jù)分析的范疇,發(fā)現(xiàn)事物之間的相關(guān)關(guān)系而非因果關(guān)系。通過從海量數(shù)據(jù)信息中發(fā)現(xiàn)相關(guān)關(guān)系,真正實現(xiàn)讓數(shù)據(jù)自己“發(fā)聲”。再者,通過大數(shù)據(jù)平臺和新技術(shù)的自動識別和智能提取,呈現(xiàn)出綜合評估結(jié)果和單項指標(biāo)數(shù)據(jù)關(guān)系。此外,大數(shù)據(jù)實現(xiàn)統(tǒng)計分析的綜合化,還體現(xiàn)在預(yù)測未來,即通過把特定算法運用到巨量數(shù)據(jù)上,來計算事件發(fā)生的蓋然性。通過比照當(dāng)前數(shù)據(jù)和預(yù)測結(jié)果,審判管理者可以優(yōu)化司法資源配置和輔助辦案法官實時調(diào)整自身的表現(xiàn)。
其一,提高基礎(chǔ)數(shù)據(jù)的量與質(zhì)??梢?,大數(shù)據(jù)采用的是一種全數(shù)據(jù)模式,即“樣本=總體”[11]。事實上,基礎(chǔ)數(shù)據(jù)的量與質(zhì)直接影響著后續(xù)數(shù)據(jù)的開發(fā)利用和統(tǒng)計分析的成效。這就要求,一方面要不斷開辟新的源頭、擴(kuò)展數(shù)據(jù)量;另一方面要對海量數(shù)據(jù)進(jìn)行清洗和預(yù)處理、保障其高精度。
事實上,法院案件信息大多是以半結(jié)構(gòu)化和非結(jié)構(gòu)化文檔的形式保存,司法統(tǒng)計真的統(tǒng)計了全體樣本嗎?顯然,答案是否定的。我國人民法院基于大數(shù)據(jù)管理與服務(wù)平臺面向3500個法院,自動生成47萬張報表,超過1000萬統(tǒng)計數(shù)據(jù)和1億個案件信息項,相較于以往,統(tǒng)計數(shù)據(jù)量確有了極大地躍升。然而,司法統(tǒng)計仍然是圍繞案件信息的一種框架式的統(tǒng)計,其仍然是結(jié)構(gòu)化數(shù)據(jù)為主。
“量化一切,數(shù)據(jù)化的核心”,大數(shù)據(jù)及技術(shù)要求改變以往司法統(tǒng)計只能對結(jié)構(gòu)數(shù)據(jù)進(jìn)行選擇的尷尬局面。在非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)占數(shù)據(jù)體量約85%情況下,要想真正開掘司法統(tǒng)計的“寶藏”、增大數(shù)據(jù)量,必須對非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)進(jìn)行挖掘和采集。
在法院系統(tǒng)內(nèi)部產(chǎn)生非結(jié)構(gòu)化與半結(jié)構(gòu)化數(shù)據(jù)的資料主要有裁判文書文本、庭審視聽資料等。以刑事裁判文書文本為例,按照刑事案件的犯罪構(gòu)成、量刑情節(jié)、法律規(guī)范等抽取特定情節(jié)要素,創(chuàng)建相應(yīng)的文件模板,進(jìn)而通過轉(zhuǎn)換程序來解構(gòu)和重建這些非結(jié)構(gòu)化文件的內(nèi)容,使用類型化轉(zhuǎn)換規(guī)則將其分別轉(zhuǎn)換成為標(biāo)準(zhǔn)的XML文檔(7),再分析XML文檔與關(guān)系數(shù)據(jù)庫的映射關(guān)系,按照某種轉(zhuǎn)換規(guī)則將XML文檔轉(zhuǎn)換成相應(yīng)的關(guān)系數(shù)據(jù)庫表。關(guān)于庭審直播視頻,對視頻內(nèi)容按照語義關(guān)系,利用時空分割、特征提取和對象識別等處理技術(shù),進(jìn)而組成可供計算機(jī)和人理解的文本信息(8)。從數(shù)據(jù)處理的流程看,視頻結(jié)構(gòu)化描述技術(shù)能夠?qū)⒅辈ヒ曨l轉(zhuǎn)化為人和機(jī)器可理解的語義,并進(jìn)一步轉(zhuǎn)換為統(tǒng)計平臺所能抓取的數(shù)據(jù)。
移動端的普及,增加了普通民眾獲取司法產(chǎn)品和服務(wù)的可能性,同時移動端的數(shù)據(jù)采集對拓寬數(shù)據(jù)源也有一定作用??偟膩砜?,大多數(shù)法院在手機(jī)移動端開發(fā)了網(wǎng)上立案、案件查詢、網(wǎng)絡(luò)普法、文書服務(wù)、律師通道等等應(yīng)用,有的甚至內(nèi)嵌入法院官微鏈接??梢韵胂筮@樣的一個場景,因相鄰權(quán)糾紛一方當(dāng)事人在家拿著手機(jī)登錄APP平臺就完成了對鄰居的所有訴訟程序。實際上,該APP不僅完成了對當(dāng)事人訴訟程序的智能引導(dǎo),而也會同步記錄全部用戶行為。未來,隨著5G時代的到來,法院移動端產(chǎn)生的數(shù)據(jù)體量也必然持續(xù)爆炸增長。司法數(shù)據(jù)也會在這個過程中跳出司法的圈子,擴(kuò)大數(shù)據(jù)源,更好地與社會大數(shù)據(jù)交融。
“數(shù)據(jù)量的大幅度增加會造成結(jié)果的不準(zhǔn)確,與此同時,一些錯誤的數(shù)據(jù)也會混進(jìn)數(shù)據(jù)庫?!睂τ谶@個問題,國際著名的大數(shù)據(jù)科學(xué)家維克托認(rèn)為,這是由“小數(shù)據(jù)”向“大數(shù)據(jù)”重要轉(zhuǎn)變之一,我們既要允許少許不精確,也要能夠努力避免這些問題。因此,需要采用有關(guān)技術(shù)如數(shù)理統(tǒng)計、數(shù)據(jù)挖掘或預(yù)定義的清理規(guī)則,包括一致性檢查、無效值和缺失值的處理,再用算法進(jìn)行匹配。
其二,校正指標(biāo)、智能提取指標(biāo)群??梢钥吹剑瑥囊婚_始的指標(biāo)選擇、權(quán)重設(shè)置到最后的統(tǒng)計成果綜合利用,雖然有法官參與,但實質(zhì)性不強[12]。這種參與往往以召開專家座談會輔之以本系統(tǒng)內(nèi)領(lǐng)導(dǎo)們的意見而敲定。但那些來自審判業(yè)務(wù)一線的數(shù)據(jù)生產(chǎn)者——法官們的聲音,卻在共同意見中得不到回應(yīng),甚至他們的意見被前兩者全權(quán)代表。而一旦司法數(shù)據(jù)和統(tǒng)計指標(biāo)在法院管理中不加區(qū)分地使用,勢必導(dǎo)致辦案法官在很大程度上盲目地、甚至不惜一切代價地追求對自己有利的指標(biāo)、避免不利的指標(biāo)。
對于預(yù)先設(shè)置的指標(biāo),一方面或多或少裹挾著審判管理者的好惡,另一方面也勢必會篩選掉一部分重要高度個體化的數(shù)據(jù)。隨著大數(shù)據(jù)和人工智能司法應(yīng)用的深化,這一點或許會得到改善。作為人工智能技術(shù)的核心,機(jī)器學(xué)習(xí)包括算法、模型和評估三個部分,數(shù)據(jù)通過算法構(gòu)建模型并對模型進(jìn)行評估,評估的效能如果符合要求,就拿這個模型來驗證其他的數(shù)據(jù)。如果達(dá)不到要求,就要調(diào)整算法來重新訓(xùn)練模型,進(jìn)而進(jìn)行二次評估,如此反復(fù)評估和驗證,最終獲取滿意的經(jīng)驗來處理其他的數(shù)據(jù)[13]。具體到指標(biāo)體系的建構(gòu),可以有以下兩種模式。其一是自上而下,事先人為地設(shè)定好統(tǒng)計指標(biāo)體系。然后,從海量的案件信息、裁判文書、法律、人事檔案等中提取相應(yīng)的情節(jié)來充實形成完整的圖譜。比如“法官績效”方面,可以區(qū)分為“審判業(yè)績”、“科研成果”、“業(yè)務(wù)培訓(xùn)”、“普法宣傳”等,進(jìn)行具體權(quán)重賦分。其二則是自下而上,事先不設(shè)定指標(biāo),而是通過對海量數(shù)據(jù)進(jìn)行深度學(xué)習(xí),自動地找出全體數(shù)據(jù)的重要特征,進(jìn)而搭建出司法統(tǒng)計指標(biāo)體系知識圖譜。概而言之,通過對海量的司法數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí),提取高效算法進(jìn)行特征選擇和特征提取,然后與預(yù)先設(shè)定好的指標(biāo)進(jìn)行比較、提煉,進(jìn)而不斷地調(diào)整校正。
除了特征提取和指標(biāo)校正外,大數(shù)據(jù)和新技術(shù)同樣可以在數(shù)據(jù)聯(lián)動和指標(biāo)群無窮組合上有所作為。要想準(zhǔn)確區(qū)分案件質(zhì)量評估、評查與法院考評之間的關(guān)系,關(guān)鍵在于針對評價對象和內(nèi)容的不同構(gòu)建各自的指標(biāo)體系,而不在開辟新的數(shù)據(jù)源頭?;诓煌瑢ο?、階段及管理要素,大數(shù)據(jù)技術(shù)可以實現(xiàn)智能提取類型化差別化指標(biāo)群。以案件質(zhì)量評估指標(biāo)體系為例,可以考慮通過非監(jiān)督式或半監(jiān)督式的特征學(xué)習(xí)和分層特征提取高效算法,自主、準(zhǔn)確地完成特征數(shù)據(jù)庫中對應(yīng)的命名實體識別、關(guān)系抽取,最后利用屬性抽取技術(shù)從不同數(shù)據(jù)源中聚合這些信息,實現(xiàn)對案件質(zhì)量指標(biāo)體系的精準(zhǔn)勾畫[14]。
其三,實現(xiàn)統(tǒng)計數(shù)據(jù)的深度、可視化分析。司法數(shù)據(jù)從采集到多維整合,最終是要經(jīng)過數(shù)據(jù)技術(shù)的分析挖掘,融入知識、理論模型,從而形成知識和發(fā)現(xiàn)的過程和應(yīng)用。而且,后續(xù)統(tǒng)計成果的綜合利用能產(chǎn)生多大效能,也取決于本階段統(tǒng)計分析的深度。
大數(shù)據(jù)分析是將描述性的、診斷性的、預(yù)測性的和規(guī)定性的模型用以數(shù)據(jù),進(jìn)而產(chǎn)生新見解和解決特定問題的過程。在大數(shù)據(jù)技術(shù)運用中,統(tǒng)計分析得以深化,突破以往的經(jīng)驗分析和事后描述性分析的限制。在數(shù)據(jù)挖掘和分析中,根據(jù)目標(biāo)要求選擇算法與挖掘模式,在海量數(shù)據(jù)中發(fā)現(xiàn)所需價值信息。解釋評估中,識別和提取有價值的知識為知識運用提供決策依據(jù)[15]。比如,聚類分析將數(shù)據(jù)對象劃分成若干組,包括組內(nèi)同質(zhì)、組間相異。實際應(yīng)用中,包括劃分法、層次法、基于密度法以及基于模型法。聚類分析可以應(yīng)用于不同類型數(shù)據(jù)或形狀各異的數(shù)據(jù),可以實現(xiàn)對高維數(shù)據(jù)的處理,且噪聲處理能力極強,聚類結(jié)果為可解釋。聚類分析可以被用來劃分不同層級的法官群,并且通過行為模式刻畫不同法官群的特征;也可以被用來在網(wǎng)上進(jìn)行法院文檔歸類等。
另外,關(guān)聯(lián)分析能夠通過找尋隱藏于海量數(shù)據(jù)集中的關(guān)聯(lián)性或相關(guān)性,從而發(fā)現(xiàn)某個對象中某些特征同時顯現(xiàn)的規(guī)律和模式。在法院考核方面,通過分析法官經(jīng)辦案件的數(shù)量、有效工作時長與所在審判團(tuán)隊分工配合程度等顯性與非顯性的關(guān)聯(lián)程度,再結(jié)合本院乃至全國法院的業(yè)績情況進(jìn)行比照,可以合理確定法官工作勤勉程度和績效水平、優(yōu)化法院管理。
大數(shù)據(jù)可視分析最大程度地利用人對可視化信息的強認(rèn)知能力,有機(jī)融合人、機(jī)的各自優(yōu)勢。目前主要應(yīng)用的信息可視化技術(shù)主要有文本、網(wǎng)絡(luò)(圖)、時空、多維的可視化技術(shù)[16]。通過對司法大數(shù)據(jù)可視化處理,借助人機(jī)交互技術(shù)和交互式分析方法,使管理者和法官更為直接和便捷地發(fā)現(xiàn)司法數(shù)據(jù)所反映的信息和知識。比如對某地法院審理的知識產(chǎn)權(quán)犯罪進(jìn)行時空可視化分析。實際分析中,能夠?qū)Π讣l(fā)生地變化、時間變化、涉案行業(yè)和人數(shù)變化等構(gòu)建集時間、空間、事件為一體的時空立體空間,使得大規(guī)模復(fù)雜的數(shù)據(jù)以更為直觀的可視化圖表形態(tài)展現(xiàn)出來。
其四,重視基礎(chǔ)設(shè)施與制度建設(shè)。信息技術(shù)設(shè)施是大數(shù)據(jù)技術(shù)發(fā)展和應(yīng)用的載體。大數(shù)據(jù)時代的數(shù)據(jù)能否被有效收集、分析、挖掘和應(yīng)用,很大程度取決于大數(shù)據(jù)信息平臺和數(shù)據(jù)中心建設(shè)水平[17]。“十三五”期間全國法院推動人民法院信息化建設(shè)3.0版總投資約216億元,其中基礎(chǔ)設(shè)施建設(shè)約93億元。截至2018年底,全法院系統(tǒng)已建成2萬余個科技法庭,2160余套遠(yuǎn)程訊問系統(tǒng),而且98%的法院建成信息化訴訟服務(wù)大廳,大屏幕、導(dǎo)視臺、查詢機(jī)和聯(lián)網(wǎng)終端等信息化設(shè)施。下一階段,法院推進(jìn)司法統(tǒng)計與大數(shù)據(jù)技術(shù)深度融合,更有賴于完備的基礎(chǔ)設(shè)施的支撐。
當(dāng)前,加強大數(shù)據(jù)技術(shù)基礎(chǔ)設(shè)施建設(shè),可以著重從如下幾方面入手。其一,加強統(tǒng)籌規(guī)劃。由最高院統(tǒng)一領(lǐng)導(dǎo),建立最高院以下的各級法院信息技術(shù)基礎(chǔ)設(shè)施建設(shè)發(fā)展協(xié)調(diào)機(jī)制,明確各級法院基礎(chǔ)設(shè)施建設(shè)的目標(biāo)要求、關(guān)鍵步驟、支持政策和保障舉措,實現(xiàn)統(tǒng)一規(guī)劃、同步推進(jìn),一體建設(shè)。其二,借力于市場化機(jī)制和產(chǎn)研合作。大數(shù)據(jù)產(chǎn)業(yè)已初具規(guī)模,部分科技公司也能夠為法院提供定制化、系統(tǒng)化的產(chǎn)品和服務(wù),如科大訊飛與蘇州中院共建全國首個科技法庭,反饋就相當(dāng)好。因此,在未來,法院應(yīng)當(dāng)充分利用市場化機(jī)制和市場化手段,加強同先進(jìn)科技公司的技術(shù)合作和協(xié)同研發(fā)。其三,專門制定司法統(tǒng)計信息化建設(shè)標(biāo)準(zhǔn),以現(xiàn)有法院信息化建設(shè)標(biāo)準(zhǔn)為基本遵循,針對技術(shù)建設(shè)、司法應(yīng)用、社會服務(wù)、日常運維、組織保障和實現(xiàn)成效等方面構(gòu)建評價指標(biāo)體系,對全國司法統(tǒng)計信息化建設(shè)工作標(biāo)準(zhǔn)和評估方式形成規(guī)范指引。
作為法院管理的重要手段和工具,司法統(tǒng)計與法院管理之間并不具有正相關(guān)性。一旦法院管理過于迷信數(shù)字與“技術(shù)治理”,組織管理勢必會陷入一種機(jī)械化、忽視規(guī)則變形之可能[18]。身處審判一線的法官不僅是數(shù)據(jù)生產(chǎn)源,他們更是法院實現(xiàn)司法正義的操盤手,擁有著豐富的經(jīng)驗理性和人之為人的尊嚴(yán)。然而,在新技術(shù)裹挾之下,法官會逐漸被抽象或還原為數(shù)據(jù),虛擬化的數(shù)字人的建構(gòu)使人不斷從物理空間和社會空間語境下隱退[19]。而對于管理者,其所看到的,不再是生物性或社會性的存在,而是經(jīng)標(biāo)準(zhǔn)化語言過濾了的數(shù)據(jù)。此時法院考核便形成了一種數(shù)字上的考核。司法運作紛繁復(fù)雜、社會活動瞬息萬變,而當(dāng)法院管理者一切以數(shù)據(jù)和指標(biāo)來看待審判法官,不僅難以幫助作為法院內(nèi)部成員的法官了解自身優(yōu)缺點并及時糾偏,甚至?xí)l(fā)組織成員間的信任危機(jī)。
司法統(tǒng)計精準(zhǔn)化和數(shù)字考核同樣代表了一種對審判權(quán)更平淡、卻更精密的管控,此時數(shù)據(jù)監(jiān)控的范圍不僅覆蓋了全法院系統(tǒng),甚至開始延伸向法院與系統(tǒng)外的信息交換處[20]。然而,正是這樣的一種情形,審判管理權(quán)與審判權(quán)的界限變得模糊不清。因為信息通信技術(shù)的改善,實時的數(shù)據(jù)交換和指令反饋也已成為可能,審判管理者完全可以對普通法院的日常審判,給出持續(xù)不斷的評估。新技術(shù)帶來效率和便捷的同時,也使得對法官審判的干預(yù)更加容易。審判權(quán)是法律賦予法官獨立行使的判斷權(quán)。而當(dāng)“司法大數(shù)據(jù)”得以實現(xiàn),那便意味著法官和審判權(quán)置于精密的數(shù)字網(wǎng)格之中。例如法院的數(shù)字考核,其觸角深入的地方已經(jīng)讓法官變得邁不開步伐,而且法官的行動不斷被其引導(dǎo)、指示、推動。為了滿足考核指標(biāo)要求,理性的法官通常會按照合乎程序的方式將司法辦案過程精確拆解,使得每一個動作都能為審判管理者在案管平臺上所見。最終導(dǎo)致的結(jié)果是,審判權(quán)的運行空間不斷地被包括績效考評在內(nèi)的一系列法院管理擠壓。
從個體角度來說,司法統(tǒng)計在享受大數(shù)據(jù)利好的同時也可能導(dǎo)致法官主體性和自主性的喪失。司法大數(shù)據(jù)詳細(xì)記錄辦案法官的每一個動作,整合計算后預(yù)測未來發(fā)展趨勢,且提出一系列建議來規(guī)范法官的行為。然而,通過搜集海量數(shù)據(jù)、整合數(shù)據(jù)和分析數(shù)據(jù)來引導(dǎo)、規(guī)范和預(yù)測辦案法官的行動,究竟是誰在規(guī)范法官行動?顯然,為了享受到大數(shù)據(jù)及新技術(shù)帶來的便捷的同時,法院管理者和法官們不得不放棄部分的自主權(quán)。而且,只要法官們在享受著這種技術(shù)服務(wù),在不自知的情形下同時也在為系統(tǒng)和算法投喂“數(shù)據(jù)”、提供能源,與此同時信息的控制力卻在不斷加強。
最終導(dǎo)致的是,作為主體的法官讓位于系統(tǒng)和算法,技術(shù)系統(tǒng)成為行動的主體,“有能力通過虛擬代理來代替任何一個人的能力,并且在政治或經(jīng)濟(jì)利益驅(qū)動下,引導(dǎo)他們的愿望朝著一定的方向發(fā)展?!驗樗亲越M織的,所以說系統(tǒng)變成了代理的‘人’[21]。”似乎可以預(yù)見到,如果不加以限制,被技術(shù)所裹挾的法官們終會被不斷規(guī)訓(xùn)、“手腳和頭腦也被技術(shù)理性所捆綁”(9)。
以上分析表明,這樣一個事實“并不是司法統(tǒng)計和績效考核越嚴(yán)密,法院管理就越好”。當(dāng)大數(shù)據(jù)與司法統(tǒng)計、數(shù)目字管理愈發(fā)緊密,“技術(shù)中立”的論斷至少在這種語境下很難成立,法院管理之中的“技術(shù)統(tǒng)治”被激活。
也正是如此,審判管理權(quán)與審判權(quán)的界限模糊、法官主體性的喪失等,這些都與技術(shù)理性的張揚密切相關(guān)。然而,即便如此,作為一個有著30萬以上就業(yè)人數(shù)的巨大組織,中國法院也需要棄去信息化帶來的倍增效能和光明未來。誠如周強院長所言,“人民法院要走在大數(shù)據(jù)時代前列?!?/p>
要想改變這樣一種把方法論當(dāng)作認(rèn)識論來看待的“唯技術(shù)論”而又不至于背棄技術(shù)紅利,就很有必要劃定法院管理與技術(shù)的限度,回歸法院審判的主線。
1.限度之一:尊重法官主體地位
在法國,法官實行終身制,任何人無權(quán)影響和取消其身份,并且法院系統(tǒng)的人、財、物直接由司法部和司法委員會調(diào)配使用;同樣地,美國聯(lián)邦法官也是終身任職,其還直接掌控著法院的行政管理??梢钥闯?,法官當(dāng)然地被視為法院自我管理和服務(wù)的主體。區(qū)別于美國、法國法官制度,我國法官實行任期制,地方法院人、財、物由省財政統(tǒng)管。加之,長期受到政法傳統(tǒng)特點的影響,法院的司法統(tǒng)計制度背后透露的支配意圖,是很明顯的。
誠然,大數(shù)據(jù)及新技術(shù)會加劇對法官主體地位不同程度的擠占,其中有其難以避免的一面(10)。但對于任何兩難問題,更多的應(yīng)是紓解,而非棄絕不顧。毫無疑問,作為法官行使審判權(quán)的主體,包括司法統(tǒng)計和績效考核在內(nèi)的法院管理也應(yīng)當(dāng)是為法官服務(wù)的。另外,在訴訟中審判法官應(yīng)當(dāng)貫徹為公民和當(dāng)事人服務(wù)的宗旨。即將自身置于司法第二主體、從服務(wù)性主體的定位出發(fā),將工作重心放在為公民和當(dāng)事人提供司法服務(wù)上(11)。這無疑都是以提升裁判者自身素養(yǎng)及夯實司法為民理念為前提的,在具案中法官的自由心證與個體經(jīng)驗判斷及個人的價值需要在最大程度上得到體現(xiàn)。因此,技術(shù)絕非法院輸出司法正義中的主體,而且其所帶給法院管理者和法官們的應(yīng)該是輔助功效而非規(guī)訓(xùn)、引導(dǎo),僅此而已。
算法和系統(tǒng)的“可理解性”是一方面,而另一方面也要注重培養(yǎng)數(shù)據(jù)素養(yǎng)(12)。對于管理者而言,司法數(shù)據(jù)素養(yǎng)要求管理者們負(fù)責(zé)任地使用司法大數(shù)據(jù),以如何保護(hù)法官的隱私和保持法官數(shù)據(jù)的保密性為核心。作為數(shù)據(jù)主體與算法受體的法官,其所要求數(shù)據(jù)素養(yǎng)關(guān)鍵內(nèi)容在于合理管控高度個體化的數(shù)據(jù),并能在算法推薦與決策下作出自由選擇與擁有自主行動的能力。
唯有如此,即使置于司法統(tǒng)計與法院考核的數(shù)字網(wǎng)格之中,法官仍舊會保持法院管理和服務(wù)的主體地位。法院管理者會對技術(shù)沖動有所克制,回歸服務(wù)審判權(quán)的初衷,明確界定審判管理權(quán)和審判權(quán)的范圍。
2.限度之二:“無處不在的第三只眼”也需讓位法官心證
“心證”,即“內(nèi)心的確信”或“良心的確信”實則是有罪認(rèn)定的終極標(biāo)準(zhǔn)。要求法官對全案證據(jù)的證據(jù)價值個別或總體的進(jìn)行判斷,以及對各個證據(jù)的擇取,這就構(gòu)成了以最終的有罪認(rèn)定為終點的整個心證歷程[22]。心證包涵了法官對案件事實和法律上的個人見解,其形成與法官個體的社會和生活經(jīng)驗高度相關(guān)。
大數(shù)據(jù)和新技術(shù)的出現(xiàn)使得監(jiān)視變得更加容易、成本更低廉也更有用處。在法院內(nèi)部,各種智能終端、無線傳感器的裝備及更加完美的物聯(lián)網(wǎng)架設(shè)使得大數(shù)據(jù)得以持續(xù)推進(jìn)司法統(tǒng)計和數(shù)字考核的精準(zhǔn)化。法院的組織管理和信息控制能力獲得相當(dāng)提升。
以往法官司法過程中,心證公開主要是指心證結(jié)果的公開,在裁判文書的“本院認(rèn)為”這一表述之后即是法官心證結(jié)果。然而隨著司法大數(shù)據(jù)生成與運用、算法與系統(tǒng)的不斷優(yōu)化,作為法院組織成員的法官,他們的心證全過程很可能時刻都暴露在“無處不在的第三只眼”,至少會以數(shù)據(jù)視圖形式為管理者所見。問題在于,系統(tǒng)與算法是如何利用統(tǒng)計數(shù)據(jù)來給高度賴于法官個體經(jīng)驗的心證“畫像”的,到最后又是如何判斷哪些數(shù)據(jù)項及數(shù)據(jù)能夠回溯到法官心證的。很明顯,這成了一個更大的算法“黑箱”。另外,隨著統(tǒng)計數(shù)據(jù)的成倍積累和算法的自我優(yōu)化,司法大數(shù)據(jù)對法官心證“畫像”會愈加成熟,那么此時法官就已經(jīng)把裁判權(quán)交于數(shù)據(jù)和算法了。因此,心證應(yīng)當(dāng)是法官行使審判權(quán)的“自留地”?!盁o處不在的第三只眼”需主動讓位法官心證。
注 釋
(1)2016年初,最高人民法院黨組和周強院長提出了數(shù)據(jù)集中管理平臺與司法統(tǒng)計全面并軌的明確要求。最高人民法院信息中心與研究室、審管辦自2016年3月份起每月召開協(xié)調(diào)例會,建立技術(shù)改造和數(shù)據(jù)質(zhì)量日報機(jī)制,并充分利用數(shù)據(jù)集中管理平臺的數(shù)據(jù)交換機(jī)制保證新上線應(yīng)用系統(tǒng)的數(shù)據(jù)質(zhì)量。
(2)根據(jù)法律規(guī)定,除了涉及國家秘密、個人隱私及商業(yè)秘密,其他數(shù)據(jù)都可以公開。
(3)2018年12月18日,筆者以“司法統(tǒng)計”為主題詞在中國知網(wǎng)上查找相關(guān)文獻(xiàn),搜索結(jié)果顯示僅有10篇調(diào)研報告,其中2篇還是碩士畢業(yè)論文。
(4)以最新發(fā)布的《司法大數(shù)據(jù)專題報告之公交車司乘沖突引發(fā)刑事案件分析》為例,報告涉及案件總體情況、案件特征分析兩項,前者包括刑事案件總量升降比、涉案罪名分類占比、案發(fā)城市分布及占比升降;后者主要是案件被告人情況分析、案件發(fā)生具情類型化比對、法院判罰占比??梢钥闯?,報告分析仍然以描述性分析、事后分析為主,局限于法院內(nèi)部單元。
(5)IDC的報告顯示:預(yù)計到2020年,全球數(shù)據(jù)總量將超40ZB(相當(dāng)于40萬億GB),這一數(shù)據(jù)量是2011年的20多倍。
(6)以中國裁判文書網(wǎng)為例。2013年7月,中國裁判文書網(wǎng)上線;2018年8月,該網(wǎng)站訪問量突破百億次;僅時隔3個月,訪問量超二百億次,而且這一數(shù)據(jù)還在以每秒上千次的速度不斷增長。據(jù)統(tǒng)計,近一年來,裁判文書網(wǎng)平均每日上傳裁判文書近5萬份,單日上傳裁判文書最高近40萬份,各省日均上傳裁判文書1800份,其中單省單日最高上傳裁判文書近16萬份。
(7)XML是數(shù)據(jù)交換的唯一公共語言,并支持網(wǎng)絡(luò)傳輸。不同類型的文檔轉(zhuǎn)換為XML的方法也不同,相同的是這些技術(shù)都是通過獲取非結(jié)構(gòu)化文件中數(shù)據(jù)信息內(nèi)容和格式,通過標(biāo)準(zhǔn)的XML語法寫入到XML文檔中去。參見萬里鵬.非結(jié)構(gòu)化到結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換的研究與實現(xiàn)[D].成都:西南交通大學(xué),2013.
(8)更詳細(xì)的技術(shù)內(nèi)容介紹,可參見劉盛鵬.基于視頻結(jié)構(gòu)化的公共場所消防設(shè)施監(jiān)控系統(tǒng)設(shè)計[A].中國消防協(xié)會.2018中國消防協(xié)會科學(xué)技術(shù)年會論文集[C].中國消防協(xié)會:中國消防協(xié)會,2018:4.
(9)尤爾根·哈貝馬斯語。
(10)如前文提到的,只要法官們在享受著這種技術(shù)服務(wù),在不自知的情形下同時也在為系統(tǒng)和算法投喂“數(shù)據(jù)”、提供能源,與此同時信息的控制力卻在不斷加強。
(11)按照司法之主體性理念的基本要求,在訴訟中公民和當(dāng)事人是第一位的主體。參見左衛(wèi)民,朱桐輝.誰為主體如何正義——對司法之主體性理念的論證[J].法學(xué),2002(07):11-21.
(12)數(shù)據(jù)素養(yǎng),是指通過質(zhì)詢過程而從數(shù)據(jù)集合中提出與現(xiàn)實世界問題的一種能力,它以道德地使用數(shù)據(jù)為前提,包括選擇、清洗、分析、可視化、批判與解釋數(shù)據(jù)等一系列數(shù)據(jù)處理技能與知識。See Wolff,A.,Gooch,D.,Montaner,J.J.‘Creating an Understanding of Data Literacy For a Data-Driven Society’[J].Journal of Community Informatics,2017,12(3):1-18.