趙憲偉,劉 政,徐 衍
(1.最高人民檢察院檢察技術(shù)信息研究中心,北京 100041; 2.北京市東城區(qū)人民檢察院,北京 100001;3.杭州市人民檢察院,浙江 杭州 310036)
電子數(shù)據(jù)是人類活動在虛擬賽博空間的投射。 “上帝之眼”所代表的“全視、全知”的能力,一直是各領(lǐng)域所關(guān)注推崇的目標(biāo)。 隨著信息技術(shù)的發(fā)展,為獲取這種投射而創(chuàng)造了現(xiàn)實場景及其可行性。 例如,刑事案件中的海量電子數(shù)據(jù),存在諸多信息鏈條或因子,通過探索適當(dāng)方式重塑重組,是創(chuàng)造“上帝之眼”視角下虛擬空間的可行路徑,本文將在刑事司法領(lǐng)域探討其實現(xiàn)方式。
2005 年,公安部物證鑒定中心組織了面向檢察系統(tǒng)的電子物證培訓(xùn)班。 由此,檢察系統(tǒng)開始在職務(wù)犯罪偵查工作中收集和運用電子數(shù)據(jù)。 此后,檢察系統(tǒng)的電子數(shù)據(jù)技術(shù)人員緊跟取證技術(shù)發(fā)展前沿,在實踐中總結(jié)出大量的經(jīng)驗、技戰(zhàn)法,培養(yǎng)了一支具有較強實戰(zhàn)能力的優(yōu)秀隊伍。
從行業(yè)來看,我國于2001 年才引入電子數(shù)據(jù)取證的概念,之后取證產(chǎn)品市場逐漸形成。 在早期,國產(chǎn)取證產(chǎn)品的整體技術(shù)水平與發(fā)達國家存在一定的差距,主要依賴國外相關(guān)產(chǎn)品。 隨著國產(chǎn)取證產(chǎn)品市場的不斷發(fā)展,國內(nèi)企業(yè)開始自主創(chuàng)新,經(jīng)過十余年的發(fā)展,電子數(shù)據(jù)取證領(lǐng)域已經(jīng)涌現(xiàn)出不少具有自主知識產(chǎn)權(quán)的優(yōu)秀產(chǎn)品和公司企業(yè)。 可以認(rèn)為,中國的電子數(shù)據(jù)取證產(chǎn)業(yè)鏈已經(jīng)從十余年前的研究、跟隨、模仿美國及歐洲等發(fā)達國家的取證技術(shù),發(fā)展至現(xiàn)在不斷向國外輸出產(chǎn)品、技術(shù)、培訓(xùn)和理念。 與國外產(chǎn)品相比,國內(nèi)取證產(chǎn)品針對國內(nèi)用戶需求而開發(fā), 并提供了豐富的本地化解決方案,而且操作簡單,是多數(shù)國外取證產(chǎn)品所不及的。 因此,國內(nèi)自主研發(fā)的取證產(chǎn)品逐步取代國外取證產(chǎn)品成為了市場主流。 這一變化與國家的經(jīng)濟社會發(fā)展息息相關(guān)、同頻共振,也是整個行業(yè)得以快速發(fā)展的主要推動力。
從標(biāo)準(zhǔn)規(guī)范及實驗室能力配套方面來看,截至今年,一方面我國共發(fā)布了電子數(shù)據(jù)取證鑒定領(lǐng)域的各項標(biāo)準(zhǔn)與技術(shù)規(guī)范59 項,包括4 項國家標(biāo)準(zhǔn)、36 項公共安全行業(yè)標(biāo)準(zhǔn)和19 項司法鑒定技術(shù)規(guī)范。 另一方面,每年參加公安部能力驗證計劃的實驗室近千家,公安、檢察、國家安全、海關(guān)、司法鑒定等機關(guān)機構(gòu)投入的電子數(shù)據(jù)實驗室建設(shè)及配套升級增長迅速, 相應(yīng)的電子數(shù)據(jù)鑒定人數(shù)量逐年上升,對電子數(shù)據(jù)取證的實踐應(yīng)用日益豐富。
從司法立法來看,2012 年修正的《刑事訴訟法》將電子數(shù)據(jù)增列為新的證據(jù)種類,進一步豐富了證據(jù)的外延。2014 年發(fā)布的《關(guān)于辦理網(wǎng)絡(luò)犯罪案件適用刑事訴訟程序若干問題的意見》,對電子數(shù)據(jù)取證人員資質(zhì)與技術(shù)要求、電子數(shù)據(jù)取證原則、收集提取電子數(shù)據(jù)的筆錄制作要求、電子數(shù)據(jù)的移送規(guī)則和電子數(shù)據(jù)的鑒定與檢驗等問題作了進一步明確。2016 年頒布的《關(guān)于辦理刑事案件收集提取和審查判斷電子數(shù)據(jù)若干問題的規(guī)定》,進一步統(tǒng)一和細(xì)化了電子數(shù)據(jù)證據(jù)規(guī)則。 同時針對不同類型的案件,連續(xù)出臺了電子數(shù)據(jù)取證、審查等相關(guān)司法解釋,特別是隨著網(wǎng)絡(luò)犯罪的不斷延伸,電子數(shù)據(jù)審查取證在司法立法中屬于熱門板塊。
從司法實踐來看,涉及電子數(shù)據(jù)的專業(yè)案件呈幾何式增長,司法人員需要面對大量的電子數(shù)據(jù)。以杭州市檢察機關(guān)技術(shù)部門為例,2019—2021 年共辦理電子數(shù)據(jù)專業(yè)技術(shù)案件6947 件,分別為2019 年1 218 件、2020 年 2 161 件、2021 年 3 568 件,案件數(shù)年均增長幅度為72%。 其中,勘驗檢查、技術(shù)協(xié)助、檢驗鑒定等檢察機關(guān)自行補充偵查取證類電子數(shù)據(jù)專業(yè)技術(shù)案件共4 189 件,分別為2019 年966件、2020 年 1 152 件、2021 年 2 071 件,案件數(shù)年均增長幅度為49.5%。
圖1 杭州檢察機關(guān)電子數(shù)據(jù)分類情況(2019—2021 年)
從2019—2021 年電子數(shù)據(jù)專業(yè)技術(shù)案件涉及的罪名分布而言,2019 年涉及罪名數(shù)55 個、2020年涉及罪名數(shù)89 個、2021 年涉及罪名數(shù)99 個,罪名數(shù)年均增長幅度為36.5%,基本覆蓋了常見的刑事案件罪名。
當(dāng)然,技術(shù)的發(fā)展日新月異,對于“電子數(shù)據(jù)取證”而言,仍有大量的問題亟待解決,但從國內(nèi)整個發(fā)展的基本面來看,相關(guān)行業(yè)市場日趨成熟,電子數(shù)據(jù)在司法立法上逐漸形成體系,實驗室建設(shè)投入增長迅速,電子數(shù)據(jù)作為基本的八大類證據(jù)已在司法實踐中廣泛運用,電子數(shù)據(jù)的“取證”難題已基本解決。
事實上,所有的電子數(shù)據(jù)都具有多元關(guān)聯(lián)證明作用。 例如,從張三手機中提取固定的微信聊天記錄,不僅能夠證明張三實施了本罪行為,可能還有其與上下游人員勾連的記錄,或者實施了其他相似或者無關(guān)的違法犯罪活動。 因此,從刑事司法的角度來看,如何利用好電子數(shù)據(jù),是超越了“取證”且更能凸顯其證據(jù)作用的新維度問題。 對各地進行調(diào)研發(fā)現(xiàn),越來越多的基層檢察官反映電子數(shù)據(jù)無論是在整體工作面、技術(shù)層面還是在業(yè)務(wù)層面中都存在諸多問題,有的甚至造成了較為尷尬的局面。
檢察機關(guān)電子數(shù)據(jù)審查面臨的困局主要體現(xiàn)在以下六個方面:
一是裝備落后,難以滿足正常工作需要。 檢察官缺少審查電子數(shù)據(jù)的必要科技裝備。 隨著偵查機關(guān)辦案過程中收集提取的電子數(shù)據(jù)體量越來越大,存儲電子數(shù)據(jù)的載體使用更多的是藍光光盤和移動硬盤,而檢察官辦公使用的電腦多數(shù)都沒有藍光光驅(qū),且電腦配置一般,連電子數(shù)據(jù)存儲載體都無法打開,從而無法進行基本的審查,甚至連最基本的瀏覽電子數(shù)據(jù)都需要檢察技術(shù)部門的協(xié)助。
二是海量電子數(shù)據(jù)審查與審限之間緊張的矛盾日益凸顯,這也是目前電子數(shù)據(jù)審查實務(wù)中最為突出的問題。 高效審查海量電子數(shù)據(jù)存在諸多困難,即使委托檢察技術(shù)人員介入,利用專業(yè)手段和技術(shù)裝備輔助開展電子數(shù)據(jù)審查也需要一定的時間,而不論是審查逮捕、審查起訴均有時限要求。 審查逮捕一般只有七天時間,如何在七天時限內(nèi)審查利用好電子數(shù)據(jù)困難重重。 在大量案件中,特別是經(jīng)濟案件呈現(xiàn)出信息網(wǎng)絡(luò)化特征,導(dǎo)致犯罪證據(jù)多數(shù)以電子數(shù)據(jù)的形式留存,而此類電子數(shù)據(jù)的體量日益增大,如何實現(xiàn)關(guān)鍵證據(jù)的快速鎖定、查詢和審查是困擾一線辦案人員的重要問題,尤其是在捕訴合一、案多人少的背景下,對于海量電子數(shù)據(jù)審查的提質(zhì)增效顯得尤為重要。 例如,在某基層檢察院辦理的一起案件中,偵查部門將收集提取的電子數(shù)據(jù)移送到檢察院,電子數(shù)據(jù)中包含的社交軟件記錄就高達近1 000 萬條。
三是檢察官審查電子數(shù)據(jù)缺乏操作指引。 比如,是否可建立提醒機制,提醒檢察官是否需要委托技術(shù)性證據(jù)專門審查,是否需要輔助進行海量數(shù)據(jù)篩查等。 再比如,什么性質(zhì)案件需要如何開展什么類型的電子數(shù)據(jù)鑒定,公安機關(guān)答復(fù)的無法鑒定或者無法收集提取的電子數(shù)據(jù)是否有依據(jù)等,而這些問題都需要有相當(dāng)深厚的專業(yè)背景才能夠提出。
四是檢察官審查運用電子數(shù)據(jù)敏感度較低。 針對檢察官審查判斷電子數(shù)據(jù)的技能跟不上以及敏感度較低的問題,應(yīng)當(dāng)加強電子數(shù)據(jù)審查技能培訓(xùn),使得檢察官不僅會看電子數(shù)據(jù),還能夠不斷積累經(jīng)驗,提升審查運用電子數(shù)據(jù)的能力,并進一步提高引導(dǎo)偵查取證的敏感度。
五是檢察機關(guān)專業(yè)技術(shù)人員配備薄弱且水平參差不齊。 例如,司法實務(wù)中的電子數(shù)據(jù)并非全都是轉(zhuǎn)賬記錄、聊天記錄等,有些電子數(shù)據(jù)呈現(xiàn)的方式是代碼、符號等。 此時,若不經(jīng)過專業(yè)人員的分析、解讀、轉(zhuǎn)換,上述電子數(shù)據(jù)無法轉(zhuǎn)化為有效的證據(jù),難以為司法實務(wù)人員所用。 因此,以專業(yè)的方式來解讀、審查電子數(shù)據(jù)成為發(fā)揮電子數(shù)據(jù)有效價值的關(guān)鍵所在。 但目前檢察機關(guān)專業(yè)技術(shù)人員配備較為薄弱且水平參差不齊,很難真正滿足電子數(shù)據(jù)審查的真實需求。
六是公檢法在刑事訴訟領(lǐng)域中對電子數(shù)據(jù)認(rèn)知存在差異。 目前,公檢法對電子數(shù)據(jù)的收集提取、移送展示、審查認(rèn)定在認(rèn)知上存在差異且標(biāo)準(zhǔn)不夠統(tǒng)一,應(yīng)當(dāng)加強交流,統(tǒng)一標(biāo)準(zhǔn)。 即便不能統(tǒng)一標(biāo)準(zhǔn),也應(yīng)當(dāng)盡可能統(tǒng)一理念。 實踐中,常??吹讲糠值貐^(qū)公安機關(guān)收集提取電子數(shù)據(jù)不規(guī)范,檢察人員對電子數(shù)據(jù)的相關(guān)規(guī)定和技術(shù)標(biāo)準(zhǔn)不熟悉,審查電子數(shù)據(jù)存在誤區(qū),法院對電子數(shù)據(jù)審查的關(guān)鍵點無法與公安、檢察達成一致。
檢察機關(guān)電子數(shù)據(jù)審查存在的技術(shù)難題主要有以下三個方面:一是“看不到”,是指很多基層檢察院對偵查部門移送的電子數(shù)據(jù)束手無策。 一方面是沒有合適的工具可用,另一方面是不會運用電子數(shù)據(jù)解決案件中的問題。 以微信聊天記錄為例,當(dāng)需要從海量聊天記錄中篩選關(guān)鍵證據(jù)時,檢察官有時只能打印出來一頁一頁的查看,效率極低。 同時,受限于專業(yè)門檻,檢察官對網(wǎng)絡(luò)犯罪領(lǐng)域的專業(yè)知識缺乏了解,在某些極端情況下,由于提取的電子數(shù)據(jù)過于龐大,使得審查流于形式。 二是“搜不著”,是指一個案件中,收集固定的電子數(shù)據(jù)往往體量巨大,取證報告通常是網(wǎng)頁格式,使用非常不便。 通過在其中搜索某些關(guān)鍵詞,更是宛若龜行,而對于關(guān)聯(lián)分析,則更是無從下手。 根據(jù)調(diào)研,目前尚未有智能化工具可供辦案人員便捷高效的搜索。 三是“用不好”,是指海量電子數(shù)據(jù)其實是一個巨大的虛擬空間,其中往往蘊藏著遠超司法機關(guān)已經(jīng)掌握的違法犯罪線索,顯然目前對其挖掘和利用的程度還遠遠不夠。 當(dāng)然,用不好的原因更多的是與前兩個原因有關(guān)。
在很多新型犯罪案件中,公安機關(guān)經(jīng)常會主動邀請檢察機關(guān)提前介入引導(dǎo)偵查,但由于缺乏專業(yè)知識,檢察官很難提出具有很強針對性的引導(dǎo)偵查意見。 特別是在涉及電子數(shù)據(jù)等證據(jù)實體問題上,缺乏偵查人員與檢察官的溝通,導(dǎo)致提前介入的效果和質(zhì)量都不高。 此外,很多原因致使案件中的電子數(shù)據(jù)并沒有及時收集提取,除了部分囿于技術(shù)難度高尚且無法突破之外,還存在地方辦案部門之間的溝通存在障礙。 例如,偵查階段認(rèn)為不重要而未提取數(shù)據(jù),或者沒有及時獲取相關(guān)密碼密鑰導(dǎo)致后續(xù)無法提取數(shù)據(jù)。 對上述情況需要及時開展補充性的提取工作,但在實踐中往往被忽略。 另一個棘手的問題是遠程跨境獲取電子數(shù)據(jù)合法性的問題。 例如,當(dāng)前大部分網(wǎng)絡(luò)犯罪組織的后臺服務(wù)器部署在境外,公安機關(guān)運用技術(shù)手段獲取的后臺數(shù)據(jù)難以轉(zhuǎn)化為法庭證據(jù)。 在法庭審理過程中,涉及電子數(shù)據(jù)的諸多專門性問題,是辯護人重要的法庭“辯點”,這也是需要在司法層面需要給予重點關(guān)注的。
目前,雖然電子數(shù)據(jù)審查的現(xiàn)實并不樂觀,但也不絕對悲觀,特別是在新型多發(fā)犯罪的網(wǎng)絡(luò)化趨勢愈發(fā)顯著的背景下,電子數(shù)據(jù)審查的作用也更為突出,并得到相關(guān)部門的高度關(guān)注和重視。
2020 年杭州市江干區(qū)人民檢察院在辦理一起電信詐騙案中,偵查機關(guān)移送了142 部被扣押的手機,初步查實共32 名受害人,涉案金額32 萬元?;鶎釉旱臋z察官與檢察技術(shù)人員用了兩周時間將能明確身份的受害人增加到202 人,詐騙金額從32 萬增加到395 萬。 這些突破對犯罪嫌疑人形成極大威懾力,最終整個團伙認(rèn)罪認(rèn)罰,不僅表示對數(shù)額認(rèn)定沒有異議,還主動要求退贓挽損。 在另外一起案件中,技術(shù)人員協(xié)助檢察官審查嫌疑人聊天記錄時,推斷其中一個嫌疑人應(yīng)當(dāng)用電腦記賬,臺賬文件對涉案金額的確定至關(guān)重要,但偵查階段并未扣押該嫌疑人電腦。 在退補期間,檢察官現(xiàn)場引導(dǎo)偵查人員扣押了嫌疑人電腦,成功提取臺賬文件。 通過對臺賬文件進行分析,結(jié)合案涉其他相關(guān)證據(jù),將涉案金額從300 萬提升至9 700 萬,達到了罪責(zé)刑相適應(yīng)的目的。
“電子數(shù)據(jù)中有天使”,可惜的是,檢察機關(guān)在多數(shù)案件中尚未能夠充分利用電子數(shù)據(jù)的價值。 檢察機關(guān)承擔(dān)著指控和證明犯罪的主導(dǎo)責(zé)任,同時履行法律監(jiān)督職能。 因此,一方面應(yīng)立足融合協(xié)作,另一方面應(yīng)立足專業(yè)能力。 電子數(shù)據(jù)支撐辦案有廣度空間, 雖然當(dāng)前案件中的電子數(shù)據(jù)運用呈快速增長,但從刑事案件總量上看,涉及電子數(shù)據(jù)的案件還有很大空間。 檢察機關(guān)應(yīng)通過完善建立技術(shù)協(xié)作機制,將電子數(shù)據(jù)取證納入重大或疑難、復(fù)雜案件的提前介入及自行補充偵查,覆蓋刑事案件辦理的全部階段。 此外,電子數(shù)據(jù)支撐辦案有深度空間,當(dāng)前網(wǎng)絡(luò)犯罪新型案件層出不窮,案件中無論是技術(shù)手段、原理或是事實情節(jié)都直接影響到案件定性及量刑,檢察機關(guān)應(yīng)通過研究新型或疑難復(fù)雜案件的辦案難點,在傳統(tǒng)電子數(shù)據(jù)取證基礎(chǔ)上,根據(jù)檢察官在不同案件中的視角需求,形成針對海量電子數(shù)據(jù)聚類、搜索、歸集、關(guān)聯(lián)等各類技戰(zhàn)方法。同時,深入探索區(qū)塊鏈、跨境云平臺、特定對象數(shù)據(jù)取證(機動車、船舶等)等新型取證領(lǐng)域,進一步形成針對海量電子數(shù)據(jù)進行取證、分析的專業(yè)技術(shù)能力。
目前階段,檢察機關(guān)的電子數(shù)據(jù)審查由于大量工作都需要靠人工完成,辦案過程非常艱辛。 現(xiàn)階段各地檢察機關(guān)還不具備有足夠優(yōu)秀和數(shù)量的專業(yè)技術(shù)人員,無法在每一個案件中協(xié)助檢察官去挖掘電子數(shù)據(jù)潛在的價值,試圖將解決問題的希望寄托于偵查階段亦不現(xiàn)實。 對海量電子數(shù)據(jù)進行審查,可通過以下五個方面進行推進。
從前述情況來看,整個檢察系統(tǒng)的辦案檢察官依舊沿襲對偵查機關(guān)結(jié)論性材料的依賴習(xí)慣——尤其針對電子數(shù)據(jù),不愿懷疑、不會懷疑,進而不敢懷疑。 導(dǎo)致這種情況的一個重要原因是,目前行業(yè)內(nèi)還沒有高度匹配檢察審查應(yīng)用場景的電子數(shù)據(jù)工具軟件。 這可能是很多設(shè)備和取證廠商,長期以來將更多精力放在“取證”上所導(dǎo)致的。 其實,在檢察審查階段對電子數(shù)據(jù)的分析和應(yīng)用是有一定規(guī)律的,只要把握好以下幾個方面,就能夠充分挖掘出電子數(shù)據(jù)的價值作用。 在工具層面,首先需要完善對電子數(shù)據(jù)取證報告的瀏覽、過濾、搜索、統(tǒng)計、標(biāo)記功能。 顯而易見,“瀏覽電子數(shù)據(jù)”始終是應(yīng)用的第一步,并且是最重要的步驟,可能還會涉及很多組合過濾的瀏覽需求。 其次才是根據(jù)需求進行高效搜索和查詢。 統(tǒng)計和標(biāo)記的功能需求也是非常關(guān)鍵的,如在分析聊天記錄時,當(dāng)審查人員點擊社交軟件主賬號時,有效的審查工具應(yīng)當(dāng)清晰展示主賬號的哪些群組更加活躍、跟哪些好友聯(lián)系更加緊密、主賬號在哪些群組的發(fā)言更加熱絡(luò)等。 通過這些簡單的統(tǒng)計,使得審查人員能夠?qū)υ撝髻~號的狀態(tài)有整體性認(rèn)識,也便于開展后續(xù)工作。 同時,審查電子數(shù)據(jù)并非一日或者一次就能夠完成,有效的工具應(yīng)當(dāng)提供隨時標(biāo)記備注的功能,這也是研判案件事實的重要依據(jù)。
在業(yè)務(wù)層面,應(yīng)當(dāng)圍繞指控和證明的需求進行挖掘,應(yīng)當(dāng)從犯罪構(gòu)成的角度入手,了解真正的檢察審查需求是什么。 下面試著梳理幾方面問題供大家參考啟發(fā)。
一是哪些電子數(shù)據(jù)能夠證明相關(guān)人員主體身份? 可以從手機通訊簿信息、諸多第三方APP 的注冊用戶基礎(chǔ)信息、社交媒體記錄中好友對其的稱呼、交易對手信息、相關(guān)人員之間的備注信息等落地相關(guān)人員的主體身份,如圖2 和圖3 所示。
圖2 電子數(shù)據(jù)證明主體身份示例1
圖3 電子數(shù)據(jù)證明主體身份示例2
二是哪些電子數(shù)據(jù)能夠直接證明明知或者主觀故意? 電子數(shù)據(jù)不僅能夠反映行為內(nèi)容,也能夠記錄行為痕跡。 因此,精準(zhǔn)的電子數(shù)據(jù)取證不僅能夠固定犯罪的客觀行為,甚至也能夠據(jù)此發(fā)現(xiàn)行為人的主觀故意以及相關(guān)的犯罪預(yù)備行為。 在某案件中,行為人與不滿14 周歲的受害人發(fā)生性關(guān)系,并辯稱毫不知情受害者不滿14 周歲。 但嫌疑人在與其好友的聊天交流中,曾經(jīng)炫耀自己“X 了一個初二的女生”,依據(jù)這條聊天記錄,完全可以推定行為人對受害者的年齡是具有明知故意的。
三是哪些電子數(shù)據(jù)能夠表示犯罪行為的危害后果? 在某黑客攻擊案件中,行為人案發(fā)后為逃避刑事處罰,在跟好友的聊天記錄中提到自己“收了別人幾萬元錢”,好友則勸其出去避避,這一組聊天記錄不僅反映了犯罪行為的損害后果和情節(jié),還側(cè)面提供了好友的包庇行為,如圖4 所示。
圖4 電子數(shù)據(jù)證明犯罪事實及行為后果示例
哪些電子數(shù)據(jù)能夠延伸證明潛在的受害者,是否存在上下游勾連或者團伙組織架構(gòu),哪些電子數(shù)據(jù)能夠表明犯罪后的掩飾毀滅行為、銷贓行為、請求幫助行為,以及哪些電子數(shù)據(jù)證明了偵查階段取證行為不夠規(guī)范或者違法取證等。 這些審查點比較分散,需要有豐富實際辦案經(jīng)驗的檢察官深度參與并提出,絕非僅憑工程技術(shù)人員就能夠解決的。
依靠優(yōu)秀的技術(shù)人員只能解決個案,只有在更大的范圍內(nèi)做到整體性提升,才是解決問題的最好方法。怎么進行整體性提升?唯有向科技要戰(zhàn)斗力。具體到本文所探討的問題,從海量電子數(shù)據(jù)中挖掘訴訟價值,極有可能是第一個在司法機關(guān)真正落地的人工智能應(yīng)用場景。 以海量聊天記錄為例,按照如圖5 所示的電子數(shù)據(jù)智能模型設(shè)計思路可建立這樣一個模型:將電子數(shù)據(jù)所反映的行為拆分為最小原子操作。 例如,將每一條聊天記錄當(dāng)作一個處理的對象,運用算法識別每一條記錄中的實體、行為類型等,通過積累規(guī)則對標(biāo)犯罪案由庫。 這里有很多基礎(chǔ)工作需要做,例如,規(guī)則庫和案由庫怎么構(gòu)建,這些既可通過集成司法系統(tǒng)的行業(yè)智慧,也可輔助以機器學(xué)習(xí)來付諸實現(xiàn)。
圖5 電子數(shù)據(jù)智能輔助審查模型設(shè)計思路
針對電子數(shù)據(jù)輔助審查智能模型具體如何運行的問題,以一份手機取證報告為例。 將手機取證報告作為輸入,對其中的每一條聊天記錄進行分析,以人、物、地址、時間為基本屬性,以行為識別、實體識別、情緒識別等為擴展屬性。 經(jīng)過中間過程的匹配,初步輸出檢察辦案所需項目。 例如,是否有團伙、主觀故意情況、表示危害后果的證據(jù)、潛在的受害對象等。 這些具體的目標(biāo)和指標(biāo)均需要檢察官的深度參與。 同時,還可在中間階段加入取證規(guī)范性判斷,通過智能化輸出判斷偵查取證行為是否必要、適當(dāng)。
如何對模型進行驗證? 模型的智能化操作最關(guān)鍵的是結(jié)果輸出。 最初未必準(zhǔn)確,甚至完全不準(zhǔn)確。這就需要動員高校、科研院所、各類公司企業(yè)參與進來,可以給所有的參與者提供真實案件中的電子數(shù)據(jù)包。 各參與方充分挖掘自身智慧、創(chuàng)建自己的人工智能算法,支持和鼓勵在各類算法之間進行競爭。 由于依據(jù)的基礎(chǔ)電子數(shù)據(jù)是已判決案件,結(jié)果很容易得到驗證。 通過這種形式,推動不斷地完善人工智能算法達到更好的效果,這將是能夠推動解決該問題的可行之道。
目前,行業(yè)主流的電子數(shù)據(jù)取證和綜合分析工具軟件通常具備過濾、關(guān)鍵詞搜索(含正則表達式模糊搜索)以及簡單的統(tǒng)計、標(biāo)記等功能,但這與高質(zhì)量挖掘和利用電子數(shù)據(jù)的目標(biāo)仍相差甚遠。 如何在瀏覽、過濾、搜索、標(biāo)記、統(tǒng)計這五個基礎(chǔ)功能上融合人工智能經(jīng)典算法,既是挑戰(zhàn),也著實令人期待。以海量聊天記錄搜索為例。按照常規(guī)的做法,檢察機關(guān)會在深入了解案件的基礎(chǔ)上,設(shè)定一組可能的關(guān)鍵詞,并在社交媒體記錄中進行精準(zhǔn)檢索(搜索中文,無法使用正則表達式進行模糊匹配),然后在命中的文本中逐項瀏覽、標(biāo)記和判斷。 但該方法卻始終無法處理以下需求,如“檢索聊天記錄中出現(xiàn)的所有安徽省的地址”“檢索聊天記錄中‘閃電’組織的其他成員”“張三與李四2020 年 10 月 3 日下午去了哪里”“王五2020 年11 與10 日的情緒怎么樣”等,這些“奇怪”的需求已突破了精準(zhǔn)匹配和現(xiàn)有的模式匹配概念,需要以當(dāng)前比較成熟的自然語言處理、機器學(xué)習(xí)為基礎(chǔ),研究運用好人工智能經(jīng)典算法,從一個小的需求切口出發(fā),逐步積累形成成熟的戰(zhàn)法。 同時,還需要創(chuàng)造性的發(fā)明一種機制,將檢察官的智慧模型化,并能夠?qū)崿F(xiàn)積累、驗證和輸出。
對海量電子數(shù)據(jù)進行可視化表達,既是運用電子數(shù)據(jù)的關(guān)鍵環(huán)節(jié),也是充分實現(xiàn)庭審效果的有效手段。 以某網(wǎng)絡(luò)傳銷為例,一個擁有10 余萬用戶的傳銷組織,其社會危害性、組織規(guī)模程度都不是數(shù)字能夠傳遞出來的。在庭審環(huán)節(jié),公訴人出示了專門繪制的組織架構(gòu)圖(如圖6 所示),詳細(xì)描繪了組織的層級關(guān)系和總體規(guī)模,取得良好的庭審效果。 當(dāng)然,數(shù)據(jù)可視化的方式和工具很多,廣大電子數(shù)據(jù)技術(shù)工作者可結(jié)合案件需要和實際情況靈活選擇。
圖6 電子數(shù)據(jù)可視化設(shè)計示例
電子數(shù)據(jù)作為一項法定證據(jù),在刑事案件辦理過程中發(fā)揮著重要的作用。 從電子數(shù)據(jù)內(nèi)容層面實現(xiàn)訴訟價值挖掘,有望切實提高一線辦案人員的電子數(shù)據(jù)審查能力。 應(yīng)堅信,只要有廣泛的參與者,一定能夠最大程度地利用好電子數(shù)據(jù),履行好檢察機關(guān)追訴犯罪和法律監(jiān)督職能。