陳志奎,劉 杰,丁 鋒,王光澤,林 杰,鐘芳明,應(yīng)志紅
(1.大連理工大學(xué) 軟件學(xué)院,遼寧 大連 116620;2.浪潮軟件集團(tuán)有限公司,山東 濟(jì)南 250110;3.北京華宇信息技術(shù)有限公司,北京 100084)
智慧法院建設(shè)是在新一輪司法改革背景下提出的一項覆蓋全國各級人民法院的創(chuàng)新工程,旨在利用互聯(lián)網(wǎng)技術(shù)和人工智能技術(shù),結(jié)合人民法院工作實際,為人民群眾提供更好的司法服務(wù)[1],實現(xiàn)審判執(zhí)行能力的現(xiàn)代化,促進(jìn)司法為民和司法公正[2]。
跨域立案服務(wù)是貫徹落實“加快推進(jìn)跨域立案訴訟服務(wù)改革,推動訴訟事項跨區(qū)域遠(yuǎn)程辦理、跨層級聯(lián)動辦理”的重要舉措[3],能讓公民免于為了起訴立案長途奔波,免受舟車勞頓之苦,是一件實實在在的便民舉措[4]。然而,在跨域立案具體落實階段還存在一些問題,如:法院工作人員不足,技術(shù)和裝備缺乏,制度宣傳、釋明不到位,法院案多人少矛盾加劇等[5]。尤其是在對當(dāng)事人的法律釋明方面[6],缺乏智能化手段以協(xié)助法官提高法律釋明效率。因此,基于人工智能的法律釋明算法研究具有重要的意義。該文以跨域立案中的法律釋明為背景,主要關(guān)注對當(dāng)事人的適用法律條文推薦,研究適用法律的推薦方法。
該文針對跨域立案過程中的法律釋明業(yè)務(wù)需求,以向當(dāng)事人釋明適用案件法律為目標(biāo),研究基于案例推理的適用法律推薦方法,并以民間借貸案由為例,對上述方法進(jìn)行分析和驗證。首先,構(gòu)建案例指標(biāo)體系,以表示每一個案例,實現(xiàn)案例數(shù)據(jù)的數(shù)值化表示;其次,根據(jù)每個指標(biāo)的重要程度,通過屬性值標(biāo)準(zhǔn)化處理、屬性值比重計算、屬性值的信息熵計算確定指標(biāo)權(quán)重;在此基礎(chǔ)上,進(jìn)行案例相似度計算,實現(xiàn)相似案例的查找,為后續(xù)的相似案例適用法律條文推薦提供支持;最后,提出一種排序權(quán)重方法對top5相似案例中的法律條文進(jìn)行加權(quán),計算推薦權(quán)值,根據(jù)推薦權(quán)值和設(shè)定的閾值條件,生成一組案件適用法律條文,推薦給跨域立案中的當(dāng)事人。通過自行收集的民間借貸案由數(shù)據(jù)驗證,結(jié)果表明,該文提出的基于案例的推薦方法對于跨域立案中的適用法律條文推薦是有效的,推薦的法律條文具有參考價值。
案例推理運(yùn)用過往經(jīng)驗和知識解決問題,已成為人工智能領(lǐng)域的一個研究熱點(diǎn),得到廣泛應(yīng)用[7-11]。案例推理系統(tǒng)一般包括4個過程:案例檢索、案例重用、案例修改和案例保存[12]。而基于案例的推理是用歷史案例的信息或知識進(jìn)行相似案問題求解的一種推理方法[13]。
推薦算法作為案例推理的關(guān)鍵技術(shù),是依靠智能算法精準(zhǔn)、高效推送信息服務(wù)或咨詢決策的一種技術(shù)[14]。推薦算法主要包括基于內(nèi)容、基于協(xié)同、基于關(guān)聯(lián)規(guī)則、基于知識和組合推薦等。協(xié)同過濾算法通過收集、分析大量的數(shù)據(jù)來計算數(shù)據(jù)之間的相似性,進(jìn)而生成與目標(biāo)事務(wù)最相近的信息予以推薦;基于內(nèi)容的協(xié)同算法是根據(jù)歷史行為來預(yù)測推薦結(jié)果[15-17]。如吳朋洋根據(jù)數(shù)據(jù)集的詞向量模型構(gòu)建基于文檔相似度的數(shù)據(jù)模型[15],運(yùn)用到法律文書推薦系統(tǒng)中;張虎等通過挖掘司法文書事實描述部分的特征,提出了基于多模型融合的法律推薦方法[16]?;陉P(guān)聯(lián)規(guī)則的推薦算法是將強(qiáng)關(guān)聯(lián)規(guī)則過濾和拆分,然后將拆分后的強(qiáng)關(guān)聯(lián)規(guī)則集成到相似度矩陣中。而基于混合的推薦則是將以上兩者或者更多的推薦結(jié)果融合在一起進(jìn)行綜合推薦。
此外,通過調(diào)研發(fā)現(xiàn),現(xiàn)階段法律條文推薦方面的工作未考慮不同的案由對應(yīng)的指標(biāo)屬性存在的差異,因此該文考慮通過設(shè)計特定的指標(biāo)特征,通過計算指標(biāo)權(quán)重之間的相似度并排序,為排名最高的N個所對應(yīng)的法律條文設(shè)置權(quán)重,權(quán)重總和最大的N個作為輸出推薦給用戶。
該文提出的基于案例推理的跨域立案中民間借貸適用法律推薦的整體框架如圖1所示。圖中左側(cè)實線部分為構(gòu)建歷史案例庫的流程,右側(cè)虛線表示對目標(biāo)案例的驗證測試流程。該方法由四個步驟構(gòu)成:第一步是指標(biāo)數(shù)值化,將案件文本信息提取成向量;第二步是指標(biāo)權(quán)重分析,設(shè)置不同的指標(biāo)權(quán)重;第三步是相似案例計算,查找歷史案例庫中的最相似案例;最后一步是為目標(biāo)案例推薦一組適用法律。下面將對每一個步驟進(jìn)行詳細(xì)介紹。
圖1 文中方法總體框架
該文設(shè)計一套指標(biāo)體系來描述案件,作為案件的特征用于相似度計算。指標(biāo)的選取準(zhǔn)則依據(jù)能夠盡可能地表示該案由,同時能夠區(qū)分其他的案由。對于民間借貸案件而言,依據(jù)《最高人民法院關(guān)于審理民間借貸案件適用法律若干問題的規(guī)定》、《最高人民法院關(guān)于適用〈中華人民共和國合同法〉若干問題的解釋(一)》等法律法規(guī),法院可根據(jù)借款金額、交付憑證、當(dāng)事人的交易方式、交易習(xí)慣以及當(dāng)事人的陳述等因素,對借貸事實進(jìn)行綜合研判。因此,該文通過現(xiàn)有的民間借貸案件在審理過程中參考的法律法規(guī)進(jìn)行初步的指標(biāo)選取。此外,還在收集了裁判文書網(wǎng)上民間借貸案件材料的基礎(chǔ)上,對案件的判決情況進(jìn)行分析,并將案件的實際判決依據(jù)與法律法規(guī)規(guī)定的要素對應(yīng)上,形成本文描述民間借貸案由的主要指標(biāo)。下面將詳細(xì)介紹民間借貸案件主要指標(biāo)的選取過程與依據(jù):
在民間借貸案件中,當(dāng)事人的陳述與書證是最常見的證據(jù)形式。由于當(dāng)事人陳述的特殊性,且證據(jù)效力客觀上弱于其他證據(jù),因此,民間借貸案件更加依賴于書證,民間借貸的書證主要有借據(jù)與支付憑證兩種形式?!蹲罡呷嗣穹ㄔ宏P(guān)于審理民間借貸案件適用法律若干問題的規(guī)定》中第二條規(guī)定,出借人向人民法院起訴時,應(yīng)當(dāng)提供借據(jù)、收據(jù)、欠條等債權(quán)憑證以及其他能夠證明借貸法律關(guān)系存在的證據(jù),借條、承諾書、轉(zhuǎn)賬說明、微信記錄等均為借貸證據(jù),因此可根據(jù)證物的不同設(shè)計5種指標(biāo)X1-X5;《最高人民法院關(guān)于審理民間借貸案件適用法律若干問題的規(guī)定》第九條規(guī)定現(xiàn)金支付、銀行轉(zhuǎn)賬、票據(jù)交付等付款方式,分別設(shè)計指標(biāo)X6-X9表示付款方式;《最高人民法院關(guān)于審理民間借貸案件適用法律若干問題的規(guī)定》中第十六條規(guī)定,原告僅依據(jù)借據(jù)、收據(jù)、欠條等債權(quán)憑證提起民間借貸訴訟,被告抗辯已經(jīng)償還借款,被告應(yīng)當(dāng)對其主張?zhí)峁┳C據(jù)證明,因此設(shè)計指標(biāo)X10,表示是否償還借款;以同樣的方式設(shè)計其他指標(biāo),依據(jù)《最高人民法院關(guān)于審理民間借貸案件適用法律若干問題的規(guī)定》第十九條設(shè)計指標(biāo)X11,表示償還金額;依據(jù)第二十五條、第三十條、第三十一條設(shè)計指標(biāo)X12,表示是否有利息;依據(jù)第二十六條、第二十八條、第二十九條、第三十條、第三十一條設(shè)計指標(biāo)X13,表示年利率;依據(jù)第二十九條設(shè)計指標(biāo)X15,表示違約金及其他費(fèi)用;依據(jù)第三十條、第三十一條設(shè)計指標(biāo)X16,表示是否逾期;依據(jù)第三十二條設(shè)計指標(biāo)X17,表示已歸還金額;依據(jù)第十六條設(shè)計指標(biāo)X18,表示尚欠款金額;依據(jù)第十七條設(shè)計指標(biāo)X19,表示是否有流水轉(zhuǎn)賬;在借貸過程中,借貸雙方約定實現(xiàn)債權(quán)的費(fèi)用的承擔(dān)方式,根據(jù)《訴訟費(fèi)用交納辦法》第五章第二十九條、《最高人民法院關(guān)于適用〈中華人民共和國合同法〉若干問題的解釋(一)》第二十六條設(shè)計指標(biāo)X14,表示是否承擔(dān)訴訟費(fèi)、保全費(fèi)、擔(dān)保費(fèi)、律師費(fèi)。其中指標(biāo)X1、X2、X3、X4、X5、X6、X7、X8、X9、X10、X12、X14、X16、X19為是(真)時,指標(biāo)取值為1;為否(假),則指標(biāo)取值為0。另外指標(biāo)X11、X13、X15、X17、X18取值為實際具體的數(shù)值。由此便形成了文中用于描述民間借貸案件的指標(biāo)體系,如表1所示,一共19個指標(biāo),即案件的特征描述可定義為一個19維的向量。
表1 民間借貸案件指標(biāo)設(shè)計
該文以民間借貸案由為例展開說明指標(biāo)的選取方法、適用法律的推薦等,對于跨域立案中的其他案由的案例可采用類似的方法進(jìn)行指標(biāo)的選取,從而能夠為不同案由的案例推薦適用法律。
在法律案例指標(biāo)體系中,由于每個指標(biāo)的重要程度和表達(dá)信息不同,因此需要確定法律案例指標(biāo)體系中各個指標(biāo)的重要程度。通常采用計算權(quán)重的方法來衡量指標(biāo)重要性,而現(xiàn)有計算權(quán)重方法包含主觀賦權(quán)法、客觀賦權(quán)法、綜合賦權(quán)法。該文采用客觀賦權(quán)法中最常用的熵權(quán)法[18]計算指標(biāo)權(quán)重。在該方法中,指標(biāo)的信息熵值大小表示了指標(biāo)變化程度的大小,熵值越大,指標(biāo)權(quán)重也就越大。
下面介紹指標(biāo)權(quán)重分析的具體步驟:
(1)屬性值標(biāo)準(zhǔn)化處理:
(1)
(2)特征屬性值比重計算:
(2)
式中,pij表示第i個案例的第j個指標(biāo)屬性值占案例庫中該指標(biāo)屬性值總和的比率。
(3)計算特征屬性值的熵值:
(3)
式中,ej表示第j個指標(biāo)特征屬性值的熵值。
(4)特征屬性值信息熵計算:
dj=1-ej
(4)
式中,dj表示第j個指標(biāo)特征屬性值的信息熵。
(5)特征屬性值權(quán)重計算:
(5)
式中,wj表示第j個指標(biāo)特征屬性值的權(quán)重。
經(jīng)過以上權(quán)重計算之后,便獲得了所設(shè)計的指標(biāo)體系中各個指標(biāo)的重要程度,以幫助在后續(xù)相似度計算中提高計算準(zhǔn)確率。
基于案例推理中的重要步驟就是相似度的計算,該文在采用信息熵計算指標(biāo)權(quán)重的基礎(chǔ)上,使用余弦相似度來計算各個案例之間的相似度關(guān)系。
相似度計算是基于案例推理中的關(guān)鍵一步,經(jīng)過指標(biāo)權(quán)重計算,衡量了各個指標(biāo)的重要程度,在此基礎(chǔ)上,該文采用余弦相似度度量不同案例的相似度。
假設(shè)有n個案例構(gòu)成案例庫A={a1,a2,…,an},每一個案例用向量表示為ai=(x1,x2,…,xm),目標(biāo)案例是由向量b=(y1,y2,…,ym)表示,wj作為第j個指標(biāo)特征屬性的權(quán)重,所以目標(biāo)案例與案例庫中的每個案例之間的相似度計算公式為:
(6)
式中,歷史案例ai與目標(biāo)案例b之間的相似度計算用sim(ai,b)表示;歷史案例ai的第j個指標(biāo)特征屬性值為xj;目標(biāo)案例b的第j個指標(biāo)特征屬性值為yj;wj為公式(5)計算的權(quán)重參數(shù)。
通過式(6)能夠得到目標(biāo)案例b與案例庫A中n個案例的相似度,將相似度按降序排列,得到一個相似度從大到小的排序結(jié)果,從而進(jìn)行下一步的推薦。
根據(jù)計算出的案例相似度集合,選取與目標(biāo)案例相似度最高的top5歷史案例。根據(jù)經(jīng)驗,最相似的案例應(yīng)該優(yōu)先被推薦,因為其中的適用法律更具參考性。然而,僅僅推薦top1案例的法律條文不足以滿足要求。例如,某一條法律沒有出現(xiàn)在top1案例中,但是在其他top5案例中都出現(xiàn)了,極有可能是目標(biāo)案例的適用法律。因此,該文提出了一種排序權(quán)重方法對top5案例中的法律條文進(jìn)行加權(quán),計算推薦權(quán)值,該法律條文的被推薦權(quán)值大于等于某一閾值時,則加入到推薦列表中。此方法能夠讓排序靠前的案例的法律條文在推薦結(jié)果中占比較大,同時兼顧出現(xiàn)次數(shù)較多的法律條文。推薦權(quán)值的計算方法為:計算該法律條文所出現(xiàn)在的top5案例的權(quán)重和。top5案例的權(quán)重按照排序計算如公式(7)所示:
(7)
根據(jù)以上案例權(quán)重排序,則可以計算法律條文的推薦權(quán)值。
該文從裁判文書網(wǎng)收集了2 942 280條案由為民間借貸的案例,由于傳統(tǒng)的自動提取指標(biāo)的方法,無法有效適用民間借貸案例,推薦適用法律條文的準(zhǔn)確率偏低,因此通過對民間借貸案例的綜合分析,設(shè)計了一套符合其案例的特征屬性,手動提取150條案例,并將其劃分為測試數(shù)據(jù)和案例庫數(shù)據(jù),其中案例庫數(shù)據(jù)為130條,測試數(shù)據(jù)20條。經(jīng)過指標(biāo)和數(shù)值化之后,每個案例表示為19維的向量。為了保證指標(biāo)特征的提取和法律條文的預(yù)測能力,該文考慮僅對單個案由民間借貸的案件進(jìn)行法律條文的預(yù)測推薦。
由于推薦的法律條文結(jié)果存在多于、少于適用法律條文結(jié)果,或者與適用法律條文不匹配的現(xiàn)象,所以在推薦精準(zhǔn)率和召回率的基礎(chǔ)上,該文采用METEOR和F1-Score兩種評價指標(biāo),它們在圖像標(biāo)注領(lǐng)域應(yīng)用廣泛,能夠很好地反映推薦性能。METEOR方法基于1元組的精度和召回的調(diào)和平均來計算。該方法將1條法律條文當(dāng)作1個單詞,并對其一致性進(jìn)行衡量。METEOR結(jié)果越高,適用法律推薦的性能越好。F1-Score是分類問題的一個衡量指標(biāo),F(xiàn)1-Score測量值綜合考慮了查全率和查準(zhǔn)率的性能評價指標(biāo)。
推薦法律條文是建立在與目標(biāo)案例相似度最高的top5的基礎(chǔ)上,將相似度top5的案例對應(yīng)的法律條文進(jìn)行加權(quán)求和,每一條法律條文將得到一個推薦權(quán)值,用wr表示;在實驗中,設(shè)置法律條文被推薦的權(quán)值閾值t,當(dāng)被推薦權(quán)值大于等于t,則該條法律被推薦。根據(jù)2.4節(jié)中的推薦權(quán)值計算方式,若一條法律僅出現(xiàn)在top1案例中,則推薦權(quán)值為1。因為相似度最高的top1案例中的法律條文最具有參考價值,基于此,該文將閾值t設(shè)置為1。如此,top1案例的法律條文全部推薦,同時,在其他top5案例中的法律條文,若推薦權(quán)值滿足條件也進(jìn)行推薦。例如,在相似度排名第二的案例中的某一條法律在后續(xù)的案例中也出現(xiàn)且次數(shù)大于1,則同樣會被推薦。
除了該文使用的指標(biāo)設(shè)計及數(shù)值化方法之外,還設(shè)置了此方法的對比方法——基于TF-IDF(詞頻逆文檔率)對文本進(jìn)行向量化表示,將每個文本轉(zhuǎn)換成一個60維的向量,用來表示一個案例。
3.4.1 性能評價
通過民間借貸中20個目標(biāo)案例與130個歷史案例的實驗,統(tǒng)計每個目標(biāo)案例的法律條文推薦結(jié)果,推薦法律條文的精準(zhǔn)度為0.331 6,召回率為0.574 2,所以METEOR、F1-Score兩個值分別為0.496 5、0.382 6。實驗結(jié)果如表2所示。
表2 評價指標(biāo)結(jié)果
通過對比指標(biāo)提取方法TF-IDF,該文采用法律條文推薦方法的精準(zhǔn)度、召回率、METEOR、F1-Score的值均高于IF-IDF方法的對應(yīng)值(見圖2)。實驗結(jié)果表明,該文采用確定指標(biāo)的方法更加準(zhǔn)確,推薦結(jié)果也更加準(zhǔn)確。
圖2 文中方法與TF-IDF對比結(jié)果
3.4.2 案例分析
為了進(jìn)一步形象化地分析該文提出方法的性能,下面隨機(jī)選擇幾個案例作為目標(biāo)案例,進(jìn)行實際案例分析。隨機(jī)選擇4個案例,分析之后,獲得最相似的5個歷史案例。然后,針對每一個案例,從它最相似的5個案例中,抽取出推薦法律條文,結(jié)果如圖3所示。圖中,第一列代表目標(biāo)案例;第二列為實際法律條文,即目標(biāo)案例在最終的判決結(jié)果中適用的法律條文;第三列為推薦法律條文,即經(jīng)過法律案例相似度計算模型,選取相似案例,對相似案例的法律條文加權(quán)之后的結(jié)果。圖中*表示推薦正確的法律條文,**表示推薦錯誤的法律條文,***表示未被推薦到的法律條文。
從案例1中可以發(fā)現(xiàn),待推薦的法律條文與實際適用法律條文數(shù)量相同,都為4條,其中有3條推薦結(jié)
圖3 推薦法律條文與參考法律條文對比示例
果與參考法律條文匹配,準(zhǔn)確率為75%,召回率為75%。從案例2的對比結(jié)果可以發(fā)現(xiàn),實際適用法律條文有5條,而推薦法律條文為4條,且推薦結(jié)果準(zhǔn)確率達(dá)到75%,但是推薦結(jié)果有紕漏,推薦的完成性(召回率)為60%。案例3中參考法律條文有6條,而推薦法律條文7條,5條結(jié)果推薦正確,準(zhǔn)確率為71%,召回率為83%。以上是三種比較常見的結(jié)果。從以上實際案例分析來看,該文提出的方法基本上能夠滿足跨域立案中對于適用法律的推薦的要求,推薦結(jié)果具有參考價值。
針對跨域立案中對于法律釋明向當(dāng)事人推薦適用法律的需求,基于民間借貸案件,該文提出了一種基于案例推理的方法。通過民間借貸案由數(shù)據(jù)的實驗驗證,提出的方法在該任務(wù)上是有效的。該文在驗證模型有效性方面只考慮了民間借貸一個案由,搜集的數(shù)據(jù)量較少,未來將進(jìn)一步擴(kuò)充數(shù)據(jù)量,增加案由的可選擇性。