朱福勇 龍依雯 王凱
摘要:人工智能技術(shù)的快速發(fā)展為訴訟規(guī)則知識庫構(gòu)建奠定了堅實基礎。當前在訴訟風險分析中,智能推理存在司法風險規(guī)則知識庫匱乏、訴訟風險分析技術(shù)較低等弊端,以致無法從根本上化解證據(jù)、訴訟時效和行為規(guī)范等方面的風險。是以,需要就案件類型化后隨機抽取,并收集案例的起訴狀、證據(jù)、案情和裁判文書,在對多方證據(jù)關聯(lián)分析模型進行解析的基礎上,設計開發(fā)訴訟時效性規(guī)則知識庫、當事人行為規(guī)范性規(guī)則知識庫以及證據(jù)有效性規(guī)則知識庫,結(jié)合多方證據(jù)關聯(lián)模型,并與法律法規(guī)知識庫和訴訟風險規(guī)則知識庫融合,運用決策樹算法,關系網(wǎng)絡推理技術(shù)列舉分析可能存在的訴訟風險,最終達至對訴訟風險點的識別、裁判結(jié)果的精準預測和合理分流不必要的訴訟,以期為民眾提供全面的訴訟決策指引。
關鍵詞:人工智能;推理規(guī)則;訴訟風險;規(guī)則模型;分析與運用
中圖分類號:D920.4
文獻標識碼:A
文章編號:1673-8268(2021)01-0073-11
早在1970年,布坎南(Buchanan)與亨德里克(Hendrick)發(fā)表《關于人工智能和法律推理若干問題的考察》一文[1],拉開了司法裁判領域人工智能研究的序幕[2]。作為人工智能的核心內(nèi)容,推理是從一個或幾個已知的判斷(前提)推出新判斷(結(jié)論)的過程[3],在人工智能步入以深度學習為主導的階段,推理技術(shù)亦與此保持同步發(fā)展,將規(guī)則演繹系統(tǒng)、專家系統(tǒng)、機器學習、貝葉斯網(wǎng)絡、知識圖譜乃至事理圖譜等先進的推理技術(shù)[4]應用但不限于制定法的規(guī)則之中,將在一定程度上提升訴訟風險知識庫和訴訟風險預測的準確度。實踐中,我國人工智能推理規(guī)則在訴訟風險預測的應用上處于初級層面,其面臨訴訟風險規(guī)則知識庫匱乏和訴訟分析方法技術(shù)不高兩大挑戰(zhàn),而理論界對此關注不多。隨著最高人民法院2019年《工作報告》“全面建設智慧法院,發(fā)揮司法大數(shù)據(jù)管理和服務平臺作用,為群眾訴訟提供服務,為科學決策提供參考”的提出[5],人工智能推理在訴訟風險分析中的研究顯得極為必要和迫切。為此,本文通過對500件案例類型化后的隨機調(diào)取,并收集起訴狀、證據(jù)、案情和裁判文書,在解析多方證據(jù)關聯(lián)分析模型的基礎上,依據(jù)法律法規(guī)中的風險點,設計開發(fā)訴訟時效性規(guī)則知識庫、當事人行為規(guī)范性規(guī)則知識庫及證據(jù)有效性規(guī)則知識庫,結(jié)合多方證據(jù)關聯(lián)模型,融合法律法規(guī)知識庫和訴訟風險規(guī)則知識庫,運用決策樹算法、關系網(wǎng)絡推理方法列舉分析可能存在的訴訟風險點,以期精準識別訴訟風險,為民眾提供全面的訴訟決策指引有所裨益。
一、訴訟風險的規(guī)則模型
(一)訴訟風險的界定
訴訟風險是指當事人在訴訟活動中可能遇到的一些爭議事實以外的因素,這些因素會影響案件的審理和執(zhí)行,使得當事人通過訴訟以期保全的法益增添無法實現(xiàn)的風險[6]。這些風險集中于證據(jù)有效性、訴訟時效性以及當事人行為規(guī)范性等方面。在此,本文以民間借貸糾紛為例,以當事人起訴為視角,對上述三個方面分別進行分析。
1.證據(jù)有效性
在司法理論和實踐中,證據(jù)有效性主要從證據(jù)能力和證明力兩個方面進行判斷。前者是指證據(jù)資格有無的問題,后者是指證據(jù)對案件事實的證明程度或者影響力,證據(jù)證明力大小取決于證據(jù)與待證事實之間的關聯(lián)程度,證據(jù)是否可靠及其有多大證明價值,由法官進行判斷,屬于法官依法心證的范疇。而這正是證據(jù)采信標準所要解決的問題,即證據(jù)的證明力問題[7]。在民間借貸糾紛中,當債權(quán)憑證、借款支付憑證、還款憑證等不是原件且與原件不相符時,或者上述憑證不具備真實簽章或公證時,存在證據(jù)不真實的訴訟風險。支付憑證、還款憑證、鑒定意見等出具主體不合法,或者證據(jù)形式與法律規(guī)定不相符,或者證據(jù)搜集程序違反法律規(guī)定,則存在著證據(jù)不合法的訴訟風險。上述憑證以及借還款事實佐證、視聽資料、鑒定意見等與起訴狀中相關信息比對不一致,則存在證據(jù)無關聯(lián)性的訴訟風險。對于舉示證據(jù)的一方與證人有利害關系,或者本金、利息、違約金、還款時間、還款金額等與起訴狀、證人證言、視聽資料中相關信息比對不相符,則構(gòu)成證明力降低的訴訟風險。對證據(jù)來源的可靠性分析,需要結(jié)合舉示證據(jù)的一方或者證人的知識水平、身份和動機進行分析,而判斷證據(jù)內(nèi)容是否可信,則需要就證據(jù)內(nèi)容的可能性、一致性、合理性與詳細性一并考慮。對證明價值的評判是法官對證據(jù)內(nèi)容、意義在法律上所做出的價值判斷,需要按照先單個證據(jù)或單組證據(jù)、后全部證據(jù)的順序進行。上述情形只要存在些許瑕疵,則可能會產(chǎn)生證據(jù)證明力銳減甚至喪失之風險。
2.訴訟時效性
權(quán)利人在法定期限內(nèi)不行使權(quán)利,其權(quán)利即依法消減的時效稱為消滅時效,我國民法稱其為訴訟時效[8]。從《人民法院民事訴訟風險提示書》規(guī)定來看,原告訴至法院后,被告提出原告起訴已超過法定的保護期間,而原告未對被告主張的事實提供相反的證據(jù)證明,其訴請難以得到法院支持。我國《民法典》第188條規(guī)定,在民間借貸糾紛中,超過訴訟時效的風險主要有兩種情形:一種是借據(jù)、收據(jù)、欠條等債權(quán)憑證約定還款期限到期產(chǎn)生的風險:借款日期到訴訟風險評估之日,超過20年或催款時間到訴訟風險評估日期超過3年;另一種是上述借款憑證未約定還款期限,起訴狀、借還款佐證(證人證言、微信/支付寶/短信等)信息中有債權(quán)人催款、債務人無意還款的語義及時間,催款時間到訴訟風險評估日,時間超過3年。
3.當事人行為規(guī)范性
按照我國《民事訴訟法》第121條的規(guī)定,起訴狀應當記明當事人的基本情況、訴訟請求和所根據(jù)的事實與理由、證據(jù)和證據(jù)來源、證人姓名和住所等內(nèi)容。對于當事人提供的基本情況或者信息不全,訴訟請求和所根據(jù)的事實與理由含糊不清、模棱兩可,證據(jù)和證據(jù)來源、證人姓名和住所缺失,以及起訴狀未寫明日期或無原告簽章等,均存在起訴行為不規(guī)范之風險。與此同時,還存在以下訴訟行為不規(guī)范之風險:訴訟主體不適格、管轄權(quán)錯誤等情形。
(二)規(guī)則模型的建構(gòu)
依據(jù)我國訴訟法及其司法解釋的規(guī)定,通過對裁判文書、當事人舉示的證據(jù)材料和電子卷宗等樣本的收集、梳理、數(shù)據(jù)加工,適用關鍵句篩選、句法分析、模式匹配和分類預測等技術(shù),通過Bootstrapping[9]等樣本采樣和多分類器投票算法進行風險規(guī)則和數(shù)據(jù)關系的高效抽取,可以構(gòu)建訴訟風險規(guī)則知識庫,由分析規(guī)則和數(shù)據(jù)關系構(gòu)建事理圖譜,最終形成訴訟風險規(guī)則模型(見圖1)。
1.訴訟風險規(guī)則知識庫的歸入
規(guī)則知識庫將專家對某個領域的經(jīng)驗知識轉(zhuǎn)化成通用規(guī)則,通過匹配輸入信息和規(guī)則知識庫前提條件推出結(jié)果[10]。它“涵蓋大量的程序性概念和關系、相關實體之間關系的推理邏輯,集成的數(shù)據(jù)層和模式層,以及規(guī)則模型與推理模型,使當事人能夠自助獲取專業(yè)化訴訟意見,正確評估訴訟走向,形成合理的訴訟預判,減輕當事人的訴訟成本,分流非必要訴訟”[11]。以民間借貸糾紛為例,訴訟風險規(guī)則知識庫構(gòu)建采用如下方法。
首先,對訴訟法及其司法解釋分別進行分句數(shù)據(jù)加工、文本分析、關鍵句篩選、句法分析,運用NLP技術(shù)[12],挖掘民間借貸糾紛潛在的訴訟風險點。
其次,通過剔除語義噪音,利用觸發(fā)詞[13]、模式匹配和分類預測,從文本中完成相關句子的篩選,將民間借貸糾紛訴訟風險點根據(jù)特征相似度分別歸入行為規(guī)范性、訴訟時效性、證據(jù)有效性,并將其標簽化,建成通用的數(shù)據(jù)模型,形成民間借貸糾紛訴訟風險規(guī)則。
最后,對證據(jù)有效性法條識別并分類時,將我國《民事訴訟法》第67條和第70條第1款等法條梳理得到的訴訟風險規(guī)則歸入證據(jù)有效性風險規(guī)則知識庫;對訴訟時效性法條識別并分類時,將由《民法典》第188條等規(guī)定總結(jié)得到的訴訟風險規(guī)則歸入訴訟時效性風險規(guī)則知識庫;對行為規(guī)范性法條識別并分類時,將由《民事訴訟法》第119條和第143條等規(guī)定梳理得出的訴訟風險規(guī)則歸入行為規(guī)范性風險規(guī)則知識庫。
2.訴訟風險規(guī)則模型的形成
在證據(jù)關聯(lián)分析模型的基礎上,基于多方證據(jù)、裁判文書和電子卷宗等文書以及海量案件信息,從不同類型案件進行證據(jù)的特征提取和規(guī)律描述,標記多方證據(jù)之間的邏輯關系,利用貝葉斯網(wǎng)絡[14]選取概率最大的證據(jù)鏈作為最優(yōu)可信的證據(jù)鏈條。在技術(shù)上,采用Bootstrapping等樣本采樣和多分類器投票算法進行風險規(guī)則和數(shù)據(jù)關系的高效抽取,使風險規(guī)則的關鍵詞與證據(jù)關聯(lián)模型中的最優(yōu)可信證據(jù)鏈的證據(jù)要素相匹配。例如,依據(jù)我國《民事訴訟法》第70條第1款的規(guī)定,提取訴訟風險規(guī)則中的“書證”,與證據(jù)要素庫中的“債權(quán)憑證”“借款支付憑證”“還款憑證”等證據(jù)要素進行匹配,將其作為構(gòu)建事理圖譜的最小單位。在此基礎上,形成訴訟風險規(guī)則模型。從結(jié)構(gòu)上來看,事理圖譜是向與環(huán)的結(jié)合,節(jié)點指向事件,向邊表示事件之間的關系,它依循邏輯序列,通過對類案證據(jù)的梳理和學習,按照支持度和置信度,以及邏輯關系形成一定的規(guī)則,輔之以法律專家意見,提升證據(jù)鏈條的精準性[15]。例如,在民間借貸糾紛中,假設存在借貸關系,“張通過銀行轉(zhuǎn)賬借給王1萬元”“李為王提供一般保證”,事理圖譜有助于對張的訴請是否超過訴訟時效、訴至法院后證據(jù)鏈條是否閉合的判斷,以及進一步預測能否通過要求李承擔保證責任來實現(xiàn)1萬元的債權(quán)等,對各個法律事實內(nèi)在邏輯進行深入挖掘,得出因果、順承邏輯關系,形成一個對訴訟風險進行預判的完整體系。證據(jù)真實性訴訟風險規(guī)則事理圖譜包括“證據(jù)是否為原件、復制件與原件是否相符”和“是否具備有真實簽章或公證”兩個部分。將“債權(quán)憑證”“借款支付憑證”“還款憑證”“借、還款事實作證”整合到證據(jù)真實性風險規(guī)則中,即可形成證據(jù)真實性訴訟風險規(guī)則事理圖譜,進而由證據(jù)能力、證明力、訴訟時效、起訴要件等規(guī)則構(gòu)建訴訟風險規(guī)則模型。
二、訴訟規(guī)則的智能推理
規(guī)則推理是專家系統(tǒng)中常用的推理機制,其為基于規(guī)則表示的知識系統(tǒng),主要采用規(guī)則知識庫推理生成問題解決結(jié)果[16]。基于訴訟風險規(guī)則模型,依托多方證據(jù)關聯(lián)模型,結(jié)合證據(jù)條件可信評估方法,圍繞訴訟請求,采用關系推理網(wǎng)絡正向推理,得出對訴訟時效性、行為規(guī)范性、證據(jù)有效性的風險識別與預測。由于上述“三性”所涉問題判別的特征顯著,采用淺層判別模型便能以較小的成本實現(xiàn)風險的預測,因此,采用決策樹的ID3算法,輸入訴訟證據(jù)向量,輸出對訴訟規(guī)范性、行為規(guī)范性和證據(jù)合理性的二分類,進行訴訟風險預測與評估。
(一)訴訟風險規(guī)則的數(shù)據(jù)來源
通過對多方證據(jù)、訴訟材料、裁判文書和電子卷宗等研究載體中的有效信息的實體識別和證據(jù)特征提取、歸類、去噪等規(guī)范化、格式化處理,得出最優(yōu)可信證據(jù)鏈的結(jié)構(gòu)化證據(jù),作為數(shù)據(jù)來源輸入訴訟風險規(guī)則模型。同時,結(jié)合訴訟風險規(guī)則知識庫,對訴訟風險規(guī)則的關鍵詞與證據(jù)關聯(lián)模型中的最優(yōu)可信證據(jù)鏈的證據(jù)要素進行匹配(見圖2),奠定下一步操作之基礎。
(二)訴訟風險規(guī)則特征向量的提取
訴訟風險規(guī)則特征向量的提取方法是:根據(jù)結(jié)構(gòu)化的證據(jù)要素模型,基于訴訟請求、案件事實輸入多方證據(jù)關聯(lián)圖譜,由訴訟風險規(guī)則知識庫和相關證據(jù)條件可信評估概率對訴訟證據(jù)進行特征提取和量化,將離散證據(jù)要素轉(zhuǎn)變?yōu)樘卣飨蛄?。例如,在民間借貸糾紛中,證據(jù)真實性訴訟特征設計與量化是通過“證據(jù)是否是原件或與原件是否相符”將數(shù)據(jù)分為兩類:若不是原件或者復印件與原件不符,則定義為有違反證據(jù)真實性的風險,編碼為1;反之,進入二級分類。以“證據(jù)是否具備真實簽章或公證”為標準,將數(shù)據(jù)分為兩類,即若具備,則定義為無證據(jù)真實性風險,編碼為0;若不具備,則定義為有證據(jù)真實性風險,編碼為1(見表1)。通過二層級別分類,篩選出無真實性瑕疵的證據(jù),此為將證據(jù)特征化的必須操作。
與此同時,在訴訟時效性、行為規(guī)范性、證據(jù)有效性的風險輔之“設定選項”“問答”方式輸入,使特定向量的提取更加明確。這里以自然人之間民間借貸糾紛(非擔保型)為例予以說明。
問題1:出借人是否有借款支付憑證?(*)
A.銀行匯款憑證B.現(xiàn)金憑證C.微信/支付寶轉(zhuǎn)賬憑證D.無借款支付憑證
選擇A對應的特征意義:銀行匯款支付憑證合法
(問題1選擇B的進行此項提問)問題2:現(xiàn)金收據(jù)憑證是否有債務人簽字或蓋章?(*)
A.有債務人簽字或蓋章B.無債務人簽字或蓋章
選擇A對應的特征意義:現(xiàn)金收據(jù)支付憑證合法
選擇B對應的特征意義:債務人名稱不匹配或沒有簽字/蓋章的,現(xiàn)金收據(jù)支付憑證合法性存在問題
(問題1選擇C的進行此項提問)問題3:微信/支付寶轉(zhuǎn)賬憑證是否通過鑒定?(*)
A.通過鑒定B.未通過鑒定/未鑒定
選擇A對應的特征意義:電子證據(jù)借款憑證與原件相同
選擇B對應的特征意義:電子證據(jù)借款憑證的真實性存在問題
(未識別到借款憑證的進行此項提問)問題4:是否訂立書面的借款合同或借據(jù)?(*)
A.訂立書面借款合同或借據(jù)B.未簽訂書面借款合同或借據(jù)
問題1選擇A/B/C,問題4選擇A/B的風險結(jié)果:自然人之間的借款憑證可以采用書面形式或者口頭形式,自出借人提供借款時生效。認定出借人已向借款人交付了借款可以從如下五個方面進行判斷:(1)自借款人收到現(xiàn)金款項時;(2)自資金到達借款人賬戶時;(3)自借款人依法取得票據(jù)交付權(quán)利時;(4)自借款人依法取得對特定資金賬戶實際支配權(quán)時;(5)按照約定并實際履行完成時。
問題1選擇D,問題4選擇A/B的風險結(jié)果:自然人之間的借款合同可以采用書面形式或者口頭形式,但合同的訂立并不意味著借款合同的生效。自然人之間的借款合同,自出借人提供借款時生效。出借人無支付憑證或尚未將借款交付給借款人,故而借款合同雖已成立但未必生效。
(問題4選擇A的進行此項提問)問題5:借款憑證是否有雙方簽字或蓋章?(*)
A.有雙方簽字/蓋章B.缺少雙方或一方簽字/蓋章
選擇A對應的特征意義:借款憑證合法
選擇B對應的特征意義:借款憑證缺少簽字/蓋章,合法性存在問題
(未識別到借款憑證借款金額,如未上傳支付憑證補充信息)問題6:借款實際金額為人民幣元。
(借款憑證借款信息借款金額)(銀行匯款單/現(xiàn)金收據(jù)匯款金額/收款金額)(支付寶/微信轉(zhuǎn)賬憑證轉(zhuǎn)賬金額)
(未提取到約定利息的進行此項提問)問題7:借款是否約定了利息?(*)
A.未約定利息B.約定年利率為%(書證-借款憑證-借款信息-約定利息)
(未提取到逾期利息或違約金的進行此項提問)問題8:是否約定了逾期利率?(*)
A.未約定逾期利率B.約定了逾期年利率為%(書證-借款憑證-借款信息-約定違約金)
(未提取到約定還款日期的進行此項提問)問題9:是否約定了還款時間?(*)
A.未約定還款日期B.約定了還款日期,為年月日(書證-借款憑證-借款信息-約定還款日期)
(未提取到還款支付憑證的進行此項提問)問題10:被告是否有還款行為?(*)
A.有B.無
(問題10選擇A的進行此項提問)問題11:還款實際金額為人民幣元(加入借款憑證-借款信息-借款金額)
(問題9選擇A的進行此項提問)問題12:目前是以下哪種情況?(*)
A.借款日期到現(xiàn)在已超過20年B.借款日期到現(xiàn)在未超過20年,距離上次向被告主張還款已經(jīng)超過3年C.沒有上述情況
選擇A/B對應的風險結(jié)果:已超訴訟時效。對已超訴訟時效的訴訟請求,法院受理后,對方當事人提出該訴訟抗辯,經(jīng)查明,無中止、中斷、延長事由的,將判決駁回該訴訟請求;對方當事人未提出該訴訟抗辯,則視為其自動放棄該權(quán)利,法院不得依照職權(quán)主動審查。
選擇C對應的風險結(jié)果:未發(fā)現(xiàn)訴訟時效風險。權(quán)利人在法定訴訟時效期間內(nèi)提出訴訟請求的,法院應當受理并支持其訴訟請求。
問題13:借款發(fā)生時,借款人處于何種婚姻狀況?(*)
A.婚姻關系存續(xù)期間B.離婚后C.未婚
(問題13選擇A的進行此項提問)問題14:請問借款人配偶是否在借貸合同上簽字?(*)
A.配偶有簽字B.配偶未進行簽字
(問題13選擇B的進行此項提問)問題15:借款用途是以下哪種情況?(*)
A.家庭日常B.夫妻雙方共同經(jīng)營公司或其他業(yè)務C.沒有上述情況
(加入借款憑證-借款信息-借款原因)
選擇A對應的風險結(jié)果:夫妻均在貸款合同上簽字或者夫妻一方事后追認等共同意思表示所負的債務,一般認定為夫妻共同債務。因此,借款應當由夫妻共同償還。
選擇B和選擇A對應的風險結(jié)果:在婚姻關系存續(xù)期間,夫妻一方以其名義為家庭日常生活需要所負的債務,應界定為夫妻共同債務,由夫妻共同償還。
問題14選擇B,問題15選擇B對應的風險結(jié)果:夫妻一方在婚姻關系存續(xù)期間以個人名義為夫妻雙方共同經(jīng)營的公司或其他義務所負債務,為夫妻共同債務,應當由夫妻借款人共同償還。
問題14選擇B,問題15選擇C對應的風險結(jié)果:在婚姻關系存續(xù)期間,夫妻一方以個人名義超出家庭日常生活需要所負的債務為個人債務,應界定為非夫妻共同債務。
問題16:借款人是否有如下行為?多選(*)
A.未按照約定用途使用借款B.未按照約定還款及付息
選擇A對應的風險結(jié)果:借款人未按照合同約定的借款用途使用借款的,借款人構(gòu)成違約。
選擇B對應的風險結(jié)果:借款人收取借款后,未按照借款合同的約定返還借款、支付利息的,借款人構(gòu)成違約。
問題17:原告是否出庭? (*)
A.單獨出庭B.與委托代理人一同出庭C.由委托代理人代為出庭D.不出庭,也無委托他人代為出庭
選擇C對應的風險結(jié)果:由代理人或律師代替出庭可能會增加訴訟風險。委托代理人無法真正代替當事人的位置,當事人本人沒有出庭有些事實很難查清,會拖長審理期限。在當事人本人不出庭的情況下,當事人的知情權(quán)會受到影響,會弱化當事人對訴訟代理人的監(jiān)督。如果委托代理人與當事人本人就案件事實向法院所作陳述不一致的,以當事人本人的陳述為準。如沒有特殊情況,建議當事人和委托代理人一起出庭。
選擇D對應的風險結(jié)果:本人不出庭,沒有其他人代替出庭的訴訟風險極高。根據(jù)民事訴訟法有關規(guī)定,對不按時出庭或者中途退庭,經(jīng)傳票傳喚,無正當理由拒不到庭,或者未經(jīng)法庭許可中途退庭的原告,法院依法按自動撤回起訴處理。
(如有上傳證人證言的進行此項提問)問題18:證人是否可以出庭作證?(*)
A.是B.否
選擇B對應的風險結(jié)果:除法律和司法解釋規(guī)定的證人確有困難難以出庭的情形之外,當事人提供證人證言的,證人應當出庭作證并接受質(zhì)詢。證人不出庭作證的,可能影響該證人證言的證據(jù)效力,甚至不被采信。
問題19:雙方當事人是否有以下情形?(*)
A.一方或雙方是外國人或港澳臺居民B.借款借出地在國外或港澳臺地區(qū)
選擇A對應的風險結(jié)果:若當事人一方或雙方為外國人或者港澳臺地區(qū)的居民,即本案具有涉外因素,需按照涉外民事訴訟的相關規(guī)定確定管轄權(quán)。
選擇B對應的風險結(jié)果:如果借款是在境外借出的,即本案具有涉外因素,需按照涉外民事訴訟的相關規(guī)定確定管轄權(quán)。
(未提取到借貸憑證中有爭議解決約定的進行此項提問)問題20:雙方當事人有無約定爭議解決方式?(*)
A.已明確約定法院管轄B.已明確約定仲裁解決C.未明確約定爭議解決方式
選擇A對應的風險結(jié)果:在符合法定起訴條件的情形下,可以向具有管轄權(quán)的人民法院提起訴訟。
選擇B對應的風險結(jié)果:不符合法院起訴條件,請向爭議解決約定仲裁委提起仲裁裁決。對仲裁裁決不服,可申請法院撤銷。
選擇C對應的風險結(jié)果:在符合法定起訴條件的情形下,可以向具有管轄權(quán)(被告所在地或合同履行地)的人民法院提起訴訟。
(三)決策樹的ID3算法
決策樹是一種用樹形結(jié)構(gòu)構(gòu)造的分類模型,其為倒樹結(jié)構(gòu),由根結(jié)點、內(nèi)結(jié)點、葉結(jié)點和邊組成,其中根節(jié)點是最“源頭”的結(jié)點,是決策樹的始端,葉節(jié)點包含特征屬性測試條件,每個葉節(jié)點代表一個類別,其功效在于分類或者回歸,即在對決策樹上的每一個內(nèi)部結(jié)點分析和判斷的基礎上,獲得一個子結(jié)點的結(jié)果。ID3算法是決策樹的一種,采用自頂向下的貪婪搜索遍歷數(shù)據(jù)集來建立預測模型[17]。它是以信息增益為標準,選擇決策樹的節(jié)點。信息熵[18]可以描述信息的不確定性,信息熵與不確定性具有正向相關性,即信息熵愈大,由此帶來的不確定性愈高。計算信息熵的公式如下
(1)式中,D表示隨機變量,pk表示隨機變量的可能取值k所占的比例,k的取值范圍是從1到K;定義為集合D的經(jīng)驗熵Ent(D)與特征a給定條件下D的經(jīng)驗條件熵Ent(D,a)之差即為特征a對訓練數(shù)據(jù)集D的信息增益Gain(D,a)[19]。計算信息增益的公式如下
(2)式中,Ent(D)為數(shù)據(jù)集D的熵,Ent(Dv)是數(shù)據(jù)集Dv的熵,Dv是D中特征a取第v個值的樣本子集,V是特征a取值的個數(shù)。由公式選擇最優(yōu)子項繼續(xù)向下分裂建樹,最優(yōu)的子項同樣具備最強的分類能力,通過對信息增益最大的特征為決策樹一個節(jié)點的選取,旨在以此遞歸,進而獲取整個決策樹[20]。
利用ID3算法進行決策判定,以“是否是原件或者與原件相符的復印件”為分裂屬性,則產(chǎn)生兩個子集,其加權(quán)和為0.5,信息增益為0.5;以“是否具有真實簽章或公證”為分類屬性,則產(chǎn)生兩個子集,其加權(quán)和為0.5,信息增益為0.5。通過計算得出,二者信息增益值相等,不妨以“是否是原件或者與原件相符的復印件”作為決策樹的根節(jié)點,通過遞歸形式對子節(jié)點分類,可得出各層節(jié)點(見圖3)。
圖3民間借貸糾紛中部分證據(jù)真實性決策樹建構(gòu)圖
輸出末端節(jié)點,整合為格式規(guī)范的對應于訴訟時效性、行為規(guī)范性和證據(jù)有效性預測的二分類預測。例如,在民間借貸糾紛中,債權(quán)憑證不具有真實的簽章,則輸出“債權(quán)憑證有違反證據(jù)真實性的風險”之結(jié)果。
三、用例與實驗分析
(一)實例演示
在理論推演和解析的基礎上,采用HTML、CSS程序語言,使用Access數(shù)據(jù)庫作為在線數(shù)據(jù)庫形成訴訟風險分析預測規(guī)則知識庫,開發(fā)了一款訴訟風險預測工具(見圖4)。目前,涵蓋借貸糾紛、婚姻家庭、勞動爭議、工傷賠償、房產(chǎn)糾紛、交通賠償、遺產(chǎn)繼承等,進入訴訟風險分析與結(jié)果預測平臺,按照案件的性質(zhì),根據(jù)流程填寫相關信息,能夠在線出具專業(yè)性的訴訟結(jié)果預測意見書。
下面選取一個民間借貸糾紛實例予以演示,表2為源糾紛屬性,通過人工分析得出訴訟風險分析結(jié)果(見表3)
在預測工具頁面內(nèi)直接上傳民事訴狀、借款、支付憑證等信息,使其主動獲得目標案例屬性值,如有需特別提問的問題或未檢測到需上傳的重要信息,可通過問與答的形式輸入,如圖5將源糾紛民事起訴狀等信息和所回答的重要問題生成訴訟風險分析與結(jié)果預測意見書(見表4)。
通過對比表3人工訴訟風險分析結(jié)果和表4訴訟風險分析與結(jié)果預測意見書,可以發(fā)現(xiàn)人工智能分析不僅涵蓋了人工分析的結(jié)果,而且給當事人提出更多訴訟風險分析與結(jié)果預測意見書的實用建議,初步證明了在本文理論基礎上,設計的訴訟風險預測工具的有效性和可行性。
(二)性能評估與結(jié)果分析
為了保證實驗結(jié)果更具說服力,在最高人民法院案例庫中隨機選取民間借貸糾紛、追索勞動報酬糾紛、機動車道路交通事故損害賠償糾紛、法定繼承糾紛和房屋租賃合同糾紛5類案件各100個案例進行測試,采用混淆矩陣[21]對人工智能訴訟風險預測工具進行性能評估(見表5)。
混淆矩陣對角線元素表示各風險類別能夠被工具正確預測的數(shù)量,由表5數(shù)據(jù)可知,訴訟風險預測工具的準確率達到78%,說明其對實際案例適用已達至一定水平,多數(shù)情況下,與人工分析相比,混淆矩陣的效率性和準確性均得以體現(xiàn),整體運行效果良好,將該工具用于實踐具有可行性。但是,該工具不能預測出部分訴訟風險結(jié)果,原因在于,其規(guī)則知識庫和推理機制在模型優(yōu)化過程中還有進一步發(fā)展的空間。但這并不意味著這類風險預測工具的分析性能較之人工分析能力不堪一擊,相反,在優(yōu)化模型與增大數(shù)據(jù)樣本、擴大數(shù)據(jù)庫容量的基礎上,人工智能訴訟風險預測的未來具有相當?shù)目善诖院褪袌龈偁幜Α?/p>
四、結(jié)語
本文通過模式匹配、分類預測等推理技術(shù)構(gòu)建了訴訟時效性、當事人行為規(guī)范性、證據(jù)有效性三個規(guī)則知識庫,運用事理圖譜、決策樹等推理技術(shù)設計出可行的訴訟風險預測模型,并基于本文理論研發(fā)了風險預測工具且進行實例測試。在驗證本文理論的可操作性及實用價值的同時,78%的準確率表明其在相較人工分析的高效基礎上準確率也較高。然而,“法律是灰色的,而生活之樹常青”,我們應當看到現(xiàn)實紛爭具有復雜性,現(xiàn)有的知識規(guī)則庫難以完全覆蓋,人工智能也可能因無法自主完成沖突規(guī)則、選擇規(guī)則、規(guī)則缺漏和適用規(guī)則導致個案處理不公正等情形的處理,其分析速度和程序、價值判斷,以及處理路徑還存在著進步空間。未來,更多的法律規(guī)則將被納入風險規(guī)則知識庫并實時更新,通過優(yōu)化算法、提高機器運行速率等方式,人工智能分析速度、準確性和推介路徑將得到不斷提升,從而更好地提高人工智能訴訟風險分析的實用價值和用戶使用體驗。當然,更加成熟的訴訟風險分析應用于人工智能訴訟結(jié)果的預測,為其提供評估結(jié)果輸入服務和風險識別技術(shù)支撐,也會最終應用于人工智能訴訟風險分析和結(jié)果預測平臺的研發(fā)。技術(shù)革新常常帶來社會的變革,人工智能技術(shù)在訴訟領域的深度運用必將掀起法律服務產(chǎn)品標準化推廣的浪潮,引領法律科技市場的蓬勃發(fā)展,在算法的縝密推理和代碼的敲擊聲中開啟一個嶄新的司法時代。
參考文獻:
[1]BUCHANAN B G, HEADRICK T E. Some Speculation about Artificial Intelligence and Legal Reasoning[J]. Stanford Law Review,1970(1):40.
[2]馮潔.人工智能對司法裁判理論的挑戰(zhàn):回應及其限度[J].華東政法大學學報,2018(2):21-31.
[3]吳飛,韓亞洪,李璽,等.人工智能中的推理:進展與挑戰(zhàn)[J].中國科學基金,2018(3):262.
[4]周尚君,伍茜.人工智能司法決策的可能與限度[J].華東政法大學學報,2019(1):57.
[5]2019年最高人民法院工作報告[EB/OL].(2019-03-12)[2020-03-19].https://baike.baidu.com/item/2019年最高人民法院工作報告/23340921?fr=aladdin.
[6]唐京.論民事訴訟風險[J].黨政研究,2004(3):76-78.
[7]何家弘,劉品新.證據(jù)法學[M].北京:法律出版社,2007:116.
[8]譚啟平.中國民法學[M].北京:法律出版社,2018:257.
[9]呂云云,李旸,王素格.基于BootStrapping的集成分類器的中文觀點句識別方法[J].中文信息學報,2013(5):84-93.
[10]BABUSKA R, SETNES M, KAYMAK U, VAN NAUTA LEMKE H R. Rule base simplification with similarity measures[C]//Proceedings of IEEE 5th International Fuzzy Systems. New Orleans: The Fifth IEEE International Conference on Fuzzy Systems,1996:312.
[11]朱福勇,劉雅迪,高帆,等.基于圖譜融合的人工智能司法數(shù)據(jù)庫構(gòu)建研究[J].揚州大學學報(人文社會科學版),2019(6):94.
[12]林奕歐,雷航,李曉瑜,等.自然語言處理中的深度學習:方法及應用[J].電子科技大學學報,2017(6):913-919.
[13]陳自巖,黃宇,王洋,等.一種非監(jiān)督的事件觸發(fā)詞檢測和分類方法[J]. 國外電子測量技術(shù),2016(7):91-95.
[14]李碩豪,張軍.貝葉斯網(wǎng)絡結(jié)構(gòu)學習綜述[J].計算機應用研究,2015(3):641-646.
[15]丁效,李忠陽,劉挺.事理圖譜:事件演化的規(guī)律和模式[EB/OL].(2019-07-20)[2019-12-16].http://www.360doc.com/content/19/0720/15/46162198_849962481.shtml.
[16]AVDEENKO T V, MAKAROVA E S. Integration of Case-based and Rule-based Reasoning Through Fuzzy Inference in Decision Support Systems[J]. Procedia Computer Science, 2017(103):447-453.
[17]QUINLAN J R. Induction of Decision Trees[J]. Machine Learning, 1986(1):81-106.
[18]曲開社,成文麗,王俊紅.ID3算法的一種改進算法[J].計算機工程與應用,2003(25):104-107.
[19]劉航,華春杰.基于ID3算法的農(nóng)村產(chǎn)業(yè)精準扶貧研究[J].計算機產(chǎn)品與流通,2019(3):176-177.
[20]林志遠.基于決策樹算法的心臟病預測研究[J].電子制作,2019(6):25-27.
[21]孔英會,景美麗.基于混淆矩陣和集成學習的分類方法研究[J].計算機工程與科學,2012(6):111-117.
Abstract:The strong development of artificial intelligence technology has laid a solid foundation for the construction of litigation rules knowledge base. Currently, in the process of litigation risk analysis, intelligent reasoning has some disadvantages, such as lack of knowledge base of judicial risk rules, low technology of litigation risk analysis, etc., which cannot fundamentally resolve the risks in evidence, limitation of action and code of conduct. Therefore, it is necessary to select cases randomly after they are typed, and collect the indictment, evidence, facts and judgment documents of cases. On the basis of analyzing the multi-party evidence association analysis model, according to the legal risk points, we design and develop the knowledge base of litigation prescription rules, the knowledge base of Party behavior normative rules and the knowledge base of evidence validity rules, combined with multi-party evidence relationship. The joint model, which is integrated with the knowledge base of laws and regulations and the knowledge base of litigation risk rules, uses decision tree algorithm and relational network reasoning technology to enumerate and analyze the possible litigation risks, and finally achieves the identification of litigation risk points, so as to provide comprehensive litigation decision-making guidance, accurate prediction of judgment results and reasonable diversion of unnecessary litigation for the public.
Keywords:artificial intelligence; rules of reasoning; litigation risk; rule model; analysis and application
(編輯:劉仲秋)