国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于先驗(yàn)知識(shí)的小樣本刑期預(yù)測(cè)算法研究

2021-03-08 00:24:54姚直言趙學(xué)龍
關(guān)鍵詞:訓(xùn)練樣本先驗(yàn)量刑

姚直言,趙學(xué)龍,戚 湧,嚴(yán) 悍

(南京理工大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院,江蘇 南京 210094)

0 引 言

隨著深度學(xué)習(xí)的快速發(fā)展,這項(xiàng)前沿技術(shù)被應(yīng)用于各個(gè)領(lǐng)域,如在醫(yī)學(xué)[1]、商業(yè)[2]以及圖像處理[3]等方面都取得了不少成果。在法律量刑方面,將神經(jīng)網(wǎng)絡(luò)用于量刑預(yù)測(cè)也取得了一些成果[4-6],但由于判刑依靠法官經(jīng)驗(yàn)和主觀判斷,甚至在極端情況下會(huì)出現(xiàn)矛盾的判決,訓(xùn)練樣本存在大量噪聲,神經(jīng)網(wǎng)絡(luò)在此領(lǐng)域的表現(xiàn)不如其他領(lǐng)域優(yōu)異。

該文提出了一種將先驗(yàn)知識(shí)轉(zhuǎn)換為虛擬樣本加入數(shù)據(jù)中進(jìn)行訓(xùn)練與約束的方法,設(shè)計(jì)并實(shí)現(xiàn)了兩層BP神經(jīng)網(wǎng)絡(luò)進(jìn)行回歸預(yù)測(cè),選取了特定犯罪情節(jié)—盜竊作為預(yù)測(cè)對(duì)象,并在樣本數(shù)較少,樣本噪聲大[7-10]的情況下,進(jìn)行了定量的實(shí)驗(yàn),證明了此方法可以提高預(yù)測(cè)的準(zhǔn)確度,降低預(yù)測(cè)刑期的誤差。

該文主要分為四個(gè)部分,第一部分粗略介紹了BP神經(jīng)網(wǎng)絡(luò)的原理,以及先驗(yàn)知識(shí)在神經(jīng)網(wǎng)絡(luò)優(yōu)化上的應(yīng)用;第二部分介紹了利用先驗(yàn)知識(shí)生成虛擬樣本輔助訓(xùn)練的具體方法;第三部分是具體實(shí)驗(yàn)驗(yàn)證,首先介紹了當(dāng)今司法系統(tǒng)中普遍存在的量刑偏差問題,然后實(shí)現(xiàn)了具體的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行交叉檢驗(yàn),驗(yàn)證了該方法的有效性;第四部分是一個(gè)簡(jiǎn)短的概括總結(jié)。

1 相關(guān)理論

1.1 BP神經(jīng)網(wǎng)絡(luò)

BP神經(jīng)網(wǎng)絡(luò)[11]是一種多層前饋網(wǎng)絡(luò),包含一層輸入層、多層隱層以及一層輸出層,理論上三層及三層以上的BP神經(jīng)網(wǎng)絡(luò)有著逼近任意函數(shù)的能力。BP神經(jīng)網(wǎng)絡(luò)根據(jù)輸出層的輸出與期望結(jié)果之間的誤差,即損失函數(shù),用梯度下降法反向傳播更新權(quán)值,直到損失函數(shù)達(dá)到精度要求。圖1是一個(gè)簡(jiǎn)單BP神經(jīng)網(wǎng)絡(luò)示意圖。

圖1 簡(jiǎn)單BP神經(jīng)網(wǎng)絡(luò)示意圖

訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)的過程大體可分為兩個(gè)部分:前向傳播和反向傳播。

(1)

反向傳播過程中,根據(jù)損失函數(shù)計(jì)算預(yù)測(cè)誤差,然后通過梯度下降方法修正誤差,調(diào)整權(quán)值、偏置等網(wǎng)絡(luò)參數(shù),如式(2)、式(3)所示:

(2)

(3)

通過鏈?zhǔn)椒▌t可求得偏導(dǎo)數(shù),反復(fù)迭代直到損失函數(shù)滿足精度要求。

1.2 先驗(yàn)知識(shí)在BP神經(jīng)網(wǎng)絡(luò)上的應(yīng)用

先驗(yàn)知識(shí)[12]是指先于經(jīng)驗(yàn)的知識(shí),在先驗(yàn)知識(shí)應(yīng)用于深度學(xué)習(xí)上的研究中,宣冬梅等人[13]為解決在多分類問題中使用深度學(xué)習(xí)方法提高分類效果的模型通常很復(fù)雜,且運(yùn)行時(shí)間較長(zhǎng)等問題,提出了先驗(yàn)知識(shí)與深度學(xué)習(xí)結(jié)合的方法,在MNIST手寫體數(shù)據(jù)集上進(jìn)行的實(shí)驗(yàn)中,以一定規(guī)則獲取先驗(yàn)知識(shí),提高了多分類方法的識(shí)別率,且使得學(xué)習(xí)的結(jié)構(gòu)更加簡(jiǎn)單;Yaser S.Abu-Mostafa在預(yù)測(cè)外匯交易市場(chǎng)的實(shí)驗(yàn)[14]中,提出了利用對(duì)稱性提示生成虛擬樣本,并作為訓(xùn)練集的一部分訓(xùn)練模型的方法,大大提高了預(yù)測(cè)的準(zhǔn)確度。

2 方法介紹

2.1 量刑偏差

量刑偏差是世界普遍存在的問題。量刑偏差,是指審判機(jī)關(guān)在同一時(shí)空條件下,對(duì)性質(zhì)相同、情節(jié)相當(dāng)?shù)姆缸铮谶m用相同的法律時(shí),刑罰裁量相差懸殊的現(xiàn)象。因刑罰裁定人是法官,不同的法官對(duì)相同的案情有著不同的主觀判斷,以及法官判刑多以經(jīng)驗(yàn)論,難免出現(xiàn)量刑偏差的問題。再者,不同的地區(qū)經(jīng)濟(jì)發(fā)展?fàn)顩r不同,法官的評(píng)判標(biāo)準(zhǔn)也難免不同。在這些復(fù)雜因素的共同作用下,造成了量刑偏差這一普遍存在的問題。而如果要構(gòu)建一個(gè)神經(jīng)網(wǎng)絡(luò)系統(tǒng)預(yù)測(cè)量刑,單單以真實(shí)數(shù)據(jù)作為訓(xùn)練樣本,包含了大量的偏差和噪聲,神經(jīng)網(wǎng)絡(luò)在一定程度上無法客觀地學(xué)習(xí)到知識(shí)或規(guī)律,勢(shì)必會(huì)對(duì)最后的預(yù)測(cè)結(jié)果造成影響。所以,該文提出了基于先驗(yàn)知識(shí)構(gòu)造虛擬樣本輔助訓(xùn)練,約束神經(jīng)網(wǎng)絡(luò)的方法。

2.2 虛擬樣本

因?yàn)檎鎸?shí)數(shù)據(jù)中包含了法官的主觀判斷和地區(qū)經(jīng)濟(jì)發(fā)展程度等主觀因素,訓(xùn)練樣本中包含大量的噪聲,神經(jīng)網(wǎng)絡(luò)擬合效果不佳,沒有學(xué)習(xí)到隨金額上升預(yù)測(cè)刑期上升這一個(gè)關(guān)鍵因素,而對(duì)其他因素分配過重權(quán)值。所以針對(duì)這種情況,該文提出一種基于先驗(yàn)知識(shí)產(chǎn)生虛擬樣本輔助訓(xùn)練的方法,基于大量經(jīng)驗(yàn)總結(jié)出來的規(guī)則生成虛擬樣本[14-15],加入到訓(xùn)練樣本中。

按照規(guī)則[16]生成除盜竊金額、判決刑期不同,其余維度均相同的虛擬樣本,如表1所示,其中x和f(x)分別對(duì)應(yīng)盜竊金額和判決刑期。

表1 虛擬樣本示例

如此構(gòu)造虛擬樣本,可以強(qiáng)化神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)到刑期預(yù)測(cè)的“骨架”——在其他條件相同的情況下,盜竊金額越大,判決刑期應(yīng)該越高。

3 實(shí)驗(yàn)驗(yàn)證

3.1 預(yù)測(cè)模型

盜竊金額是刑期判罰的關(guān)鍵因素,因此在建立神經(jīng)網(wǎng)絡(luò)模型時(shí),以盜竊金額為主要的判斷依據(jù),結(jié)合年齡、是否主犯、初犯還是累犯等因素進(jìn)行綜合分析,最后輸出預(yù)測(cè)刑期。建立的預(yù)測(cè)模型如圖2所示。

圖2 神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型的描述

3.2 網(wǎng)絡(luò)結(jié)構(gòu)

該量刑預(yù)測(cè)系統(tǒng)采用四層BP神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn),分別為一層輸入層、兩層隱層和一層線性輸出層,輸入層神經(jīng)元結(jié)構(gòu)如表2所示,分為X1至X16共16個(gè)神經(jīng)元,分別代表各種量刑情節(jié)以及案件性質(zhì)。其中X9為案件盜竊金額,為判決中真實(shí)實(shí)數(shù),其余變量均為布爾變量。設(shè)(X,Y)為樣本空間,X為樣本輸入,Y為樣本輸出(期望輸出)。

表2 量刑情節(jié)各種情況與輸入層神經(jīng)元變量對(duì)應(yīng)關(guān)系

隱層共兩層,每一層采用8個(gè)神經(jīng)元,激勵(lì)函數(shù)采用式(4)的Relu函數(shù)。

Relu(x)=max(0,x)

(4)

輸出層采用式(5)線性函數(shù),輸出單變量,即預(yù)測(cè)刑期。

f(x)=x

(5)

損失函數(shù)采用式(6)均方誤差(MSE)。

(6)

評(píng)價(jià)指標(biāo)采用式(7)平均絕對(duì)誤差(MAE)和式(8)相對(duì)準(zhǔn)確度。

(7)

(8)

式(8)中,Ymax與Ymin代表實(shí)際判決期限所在區(qū)間。據(jù)中華人民共和國(guó)刑法規(guī)定,將盜竊刑期粗略劃分為0至3年,3至10年,10至無期徒刑三個(gè)區(qū)間,其中無期徒刑在本公式中用21年代替。若實(shí)際判決期限為4年,在3至10年區(qū)間內(nèi),則相對(duì)準(zhǔn)確度應(yīng)該如式(9)所示。

(9)

3.3 交叉檢驗(yàn)

將北大法寶網(wǎng)站上選取202例盜竊罪名的案件作為學(xué)習(xí)樣本,取出其中40例作為測(cè)試樣本,以上述方法生成占訓(xùn)練樣本數(shù)0%、10%、20%、30%…90%的虛擬樣本加入訓(xùn)練集中輔助訓(xùn)練。測(cè)試試驗(yàn)獲得數(shù)據(jù)如表3所示。

表3 不同虛擬樣本占比組具體數(shù)據(jù)

將表3中的平均絕對(duì)誤差(MAE)作為縱軸,用訓(xùn)練迭代次數(shù)(epoch)作為橫軸,建立平均絕對(duì)誤差變化曲線,如圖3所示。

圖3 平均絕對(duì)誤差變化曲線

以相對(duì)準(zhǔn)確率(Accuracy)和訓(xùn)練迭代次數(shù)(epoch)的關(guān)系建立相對(duì)準(zhǔn)確率變化曲線,如圖4所示,其中每一條不同線型的線平均絕對(duì)誤差/相對(duì)準(zhǔn)確率0.X代表虛擬樣本占總樣本數(shù)的X%。

圖4 相對(duì)準(zhǔn)確率變化曲線

由圖3和圖4可見,虛擬樣本占訓(xùn)練樣本集10%、40%、80%、90%時(shí)的擬合效果比不加虛擬樣本要好,說明虛擬樣本輔助訓(xùn)練的方法在小樣本上是行之有效的。通過對(duì)比發(fā)現(xiàn),虛擬樣本比例在80%時(shí)效果最好,刑期平均絕對(duì)誤差降低了4個(gè)月左右,相對(duì)準(zhǔn)確率提高了8%左右??紤]到實(shí)驗(yàn)于小樣本上進(jìn)行,且樣本中包含了大量噪聲,雖然數(shù)據(jù)擬合的平均損失誤差相對(duì)較高,相對(duì)準(zhǔn)確率相對(duì)較低,但從整體對(duì)比來看,實(shí)驗(yàn)證明虛擬樣本的加入的確有助于網(wǎng)絡(luò)學(xué)習(xí)到本質(zhì)規(guī)律,改善了神經(jīng)網(wǎng)絡(luò)在小樣本上的表現(xiàn),弱化了主觀判斷和大量噪聲在訓(xùn)練集中的作用,增強(qiáng)了擬合效果。

4 結(jié)束語(yǔ)

該文提出了基于先驗(yàn)知識(shí)的虛擬樣本輔助訓(xùn)練神經(jīng)網(wǎng)絡(luò)方法,改善了神經(jīng)網(wǎng)絡(luò)在小樣本上的表現(xiàn),一定程度上克服了傳統(tǒng)司法系統(tǒng)中存在的量刑偏差問題。將案件的量刑情節(jié)人工提取出來,加上虛擬樣本的糾正作用,使得神經(jīng)網(wǎng)絡(luò)既學(xué)習(xí)到了其余因素的影響,同時(shí)也不會(huì)丟掉最關(guān)鍵的規(guī)律。實(shí)驗(yàn)結(jié)果表明,該方法在小樣本上刑期預(yù)測(cè)平均損失誤差可降低4個(gè)月,平均準(zhǔn)確率可提升8%,相對(duì)有效地改善了神經(jīng)網(wǎng)絡(luò)在量刑預(yù)測(cè)問題上的擬合能力,為此類問題提供了一個(gè)新的研究思路與方向。

猜你喜歡
訓(xùn)練樣本先驗(yàn)量刑
刑事程序法向度的量刑規(guī)范化研究
人工智能
基于無噪圖像塊先驗(yàn)的MRI低秩分解去噪算法研究
基于自適應(yīng)塊組割先驗(yàn)的噪聲圖像超分辨率重建
寬帶光譜成像系統(tǒng)最優(yōu)訓(xùn)練樣本選擇方法研究
融合原始樣本和虛擬樣本的人臉識(shí)別算法
基于稀疏重構(gòu)的機(jī)載雷達(dá)訓(xùn)練樣本挑選方法
基于平滑先驗(yàn)法的被動(dòng)聲信號(hào)趨勢(shì)項(xiàng)消除
論自首在量刑中的適用
西藏科技(2015年5期)2015-09-26 11:55:20
先驗(yàn)的廢話與功能的進(jìn)路
波密县| 建水县| 高邑县| 西贡区| 宜兰县| 天等县| 陈巴尔虎旗| 尚义县| 涪陵区| 乌拉特前旗| 博乐市| 嵊泗县| 韶山市| 于田县| 普陀区| 上饶县| 海丰县| 哈密市| 溧水县| 广平县| 皮山县| 靖边县| 鄂尔多斯市| 滁州市| 英吉沙县| 凯里市| 永丰县| 天台县| 阿坝县| 嘉定区| 峨眉山市| 翁源县| 伊宁县| 怀宁县| 渝北区| 景东| 和平区| 长治市| 顺昌县| 长垣县| 汉川市|