鄒邵坤
如果要為人工智能(Artificial Intelligence,簡(jiǎn)稱AI)發(fā)展列一個(gè)簡(jiǎn)史,最初恐怕要追溯到英國(guó)小說家喬納森·斯威夫特(Jonathan Swift)出版的《格列佛游記》。他在書中描述了一臺(tái)名叫“Engine”的機(jī)器,斯威夫特描述稱:“運(yùn)用實(shí)際而機(jī)械的操作方法來改善人的思辨知識(shí),……最無知的人,只要適當(dāng)付點(diǎn)學(xué)費(fèi),再出一點(diǎn)點(diǎn)體力,就可以不借助于任何天才或?qū)W力,寫出關(guān)于哲學(xué)、詩歌、政治、法律、數(shù)學(xué)和神學(xué)的書來?!雹賉英]喬納森·斯威夫特:《格列佛游記》,白馬譯,江西教育出版社2015年版,第144頁。
1956年的達(dá)特茅斯(Dartmouth)會(huì)議上,與會(huì)專家在一份提案中首次提出“人工智能”這一術(shù)語,這次會(huì)議成為人工智能誕生的標(biāo)志,在后面的幾十年間,一代又一代的科學(xué)家投身于人工智能的研究?,F(xiàn)在,“人工智能”在維基百科上的解釋是:“由人工制造出來的系統(tǒng)所表現(xiàn)出來的智能?!雹趨⒖季S基百科中文網(wǎng)站“人工智能”詞條,載“維基百科”,https://en.wikipedia.org/wiki/Artificial_intelligence,最后訪問時(shí)間:2018年12月26日。
從20世紀(jì)60年代到90年代再到21世紀(jì)的今天,從西洋跳棋到國(guó)際象棋再到圍棋,人工智能至少三次在公眾中引發(fā)熱潮,“人類是不是要被機(jī)器毀滅了”之類的話題早就超出了“科幻迷”的圈子,在普通人中流行開來。網(wǎng)上流傳著一幅有關(guān)“人工智能發(fā)展成熟度曲線”的漫畫,③該漫畫可參見李開復(fù)、王詠剛:《人工智能》,文化發(fā)展出版社2017年版,第42頁。形象地展示出了在此前兩次人工智能熱潮中,大眾從被人工智能在某些領(lǐng)域的驚艷表現(xiàn)震撼,到逐漸認(rèn)識(shí)到當(dāng)時(shí)的人工智能還有各種局限,以至于產(chǎn)生巨大心理落差的有趣過程。但正如科幻作家劉慈欣所言:“也許這就是真正的AI即將誕生的征兆,我們正處于一個(gè)AI種族的史前時(shí)代。”④參見劉慈欣:《最糟的宇宙,最好的地球——?jiǎng)⒋刃揽苹迷u(píng)論隨筆集》,四川科學(xué)技術(shù)出版社2015年版,第223頁。只有先努力看清真實(shí)的當(dāng)下,才能對(duì)未來作出相對(duì)精準(zhǔn)的預(yù)測(cè)。
我們常說,要把法律女神的大腦武裝上技術(shù),讓法律女神的智慧更好地照耀法律行業(yè),讓當(dāng)中的每一個(gè)從業(yè)人員都更有智慧,但是卻很容易忘記人工智能行業(yè)的一句老話:“有多少人工,就有多少智能?!鼻迦A大學(xué)的一位老師曾在第二屆清華明理法治論壇上說,清華大學(xué)人工智能實(shí)驗(yàn)室成立于1986年,在20世紀(jì)90年代,整個(gè)行業(yè)遇到了一個(gè)低谷期,申報(bào)課題都很困難,到最近幾年才又活躍起來。她的擔(dān)憂是,一個(gè)行業(yè)應(yīng)用人工智能的時(shí)候,能不能正視技術(shù)本身的優(yōu)勢(shì)以及它當(dāng)下的瓶頸。
2011年全美智力競(jìng)賽,國(guó)際商業(yè)機(jī)器公司(IBM)的人工智能沃特森(Watson)高比分戰(zhàn)勝兩位全美智力冠軍,這無疑是AI的一個(gè)燦爛瞬間。⑤2011年,沃特森在美國(guó)最受歡迎的智力問答電視節(jié)目《危險(xiǎn)邊緣》(Jeopardy)中亮相,一舉打敗了人類智力競(jìng)賽的冠軍。參見“IBM官網(wǎng)”,http://www-31.ibm.com/ibm/cn/cognitive/outthink/watson/,最后訪問時(shí)間:2018年12月26日。Watson當(dāng)時(shí)采用的是一個(gè)多專家決策系統(tǒng)算法模型的變體,該算法早在1991年已經(jīng)公布,但其訓(xùn)練數(shù)據(jù)卻是基于維基百科、古登堡計(jì)劃860萬份文獻(xiàn)等大量資料。有科學(xué)家甚至提出了第三次人工智能技術(shù)的發(fā)展公式:從關(guān)鍵算法的提出到取得實(shí)質(zhì)進(jìn)步需要18年,而從關(guān)鍵數(shù)據(jù)集的出現(xiàn)到獲得相應(yīng)進(jìn)步只需要3年,兩者相差6倍。在谷歌研究院的最新進(jìn)展中,圖像識(shí)別(包括比較成熟的音頻識(shí)別)這兩年的突破也是在原有算法的基礎(chǔ)上通過對(duì)大量新數(shù)據(jù)的訓(xùn)練而實(shí)現(xiàn)的,⑥參見新智元:《李飛飛團(tuán)隊(duì)最新成果:識(shí)別谷歌街景中汽車圖像,預(yù)測(cè)人口政治傾向》,載“百度百家號(hào)”,https://baijiahao.baidu.com/s?id=1585472724280054972&wfr=spider&for=pc,最后訪問時(shí)間:2018年12月26日。這是李飛飛博士⑦李飛飛(Fei-FeiLi),斯坦福大學(xué)計(jì)算機(jī)科學(xué)學(xué)院終身教授,斯坦福人工智能實(shí)驗(yàn)室主任,谷歌云首席科學(xué)家。在國(guó)際上作為華裔科學(xué)家在人工智能領(lǐng)域獨(dú)占鰲頭的創(chuàng)造,也是華人對(duì)世界科學(xué)的貢獻(xiàn)。
以和法律幾乎同樣古老的醫(yī)療服務(wù)業(yè)為例,根據(jù)市場(chǎng)調(diào)研機(jī)構(gòu)對(duì)2017年在國(guó)內(nèi)醫(yī)療健康數(shù)據(jù)行業(yè)參與經(jīng)營(yíng)的320家公司的統(tǒng)計(jì)報(bào)告顯示,2014年,我國(guó)醫(yī)療信息化總花費(fèi)為223.12億元,2015年增至243.6億元,預(yù)計(jì)2020年將達(dá)到430.01億元,年復(fù)合增長(zhǎng)率為11.1%;2014年,我國(guó)臨床信息化解決方案的市場(chǎng)規(guī)模約為20.64億元,2015年增至24.48億元,預(yù)計(jì)2020年將達(dá)到52.17億元,年復(fù)合增長(zhǎng)率為16.71%。⑧參見埃森哲:《2017中國(guó)醫(yī)療信息化行業(yè)公司市場(chǎng)梳理報(bào)告》,載“搜狐網(wǎng)”,http://www.sohu.com/a/140043789_505782,最后訪問時(shí)間:2018年12月26日。這意味著,2014—2021年間,醫(yī)療服務(wù)的市場(chǎng)規(guī)模會(huì)實(shí)現(xiàn)從百萬級(jí)(Million)到十億級(jí)(Billion)的指數(shù)級(jí)跨越。如此大規(guī)模的投入之下,我們卻發(fā)現(xiàn),人們到醫(yī)院還是在排隊(duì)看病,并沒有出現(xiàn)去醫(yī)院看病時(shí)大夫都不見了,由機(jī)器人取而代之的場(chǎng)景。面對(duì)人工智能浪潮,法律圈也有人開這樣的玩笑:“有沒有這么一天,我們這些律師不再需要辦案子,而是打打高爾夫就可以了?”事實(shí)上這個(gè)問題至少有兩個(gè)層次:一方面,如果打高爾夫是獲取案源的主要途徑,那法律行業(yè)從業(yè)者可能有更多的時(shí)間去打高爾夫;另一方面,要弄清楚技術(shù)目前所起的是輔助作用還是替代作用。
人工智能與機(jī)器學(xué)習(xí)是人類為了克服自身肉眼凡胎的有限性所創(chuàng)造的工具。機(jī)器學(xué)習(xí)在本質(zhì)上來說是跨學(xué)科的,使用了計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)和人工智能以及其他對(duì)應(yīng)行業(yè)學(xué)科的知識(shí)。因此,無論是在目前的人工智能界還是在產(chǎn)業(yè)界,對(duì)于跨界掌握以上綜合技能的人才渴求度都非常高。據(jù)麥肯錫(Mc Kinsey)管理咨詢公司預(yù)測(cè),到2018年,具備深度數(shù)據(jù)分析技能的大數(shù)據(jù)經(jīng)理和工程師,至少還有150萬人的缺口,而且這個(gè)數(shù)字還在飛速飆升。⑨參見麥肯錫:《大數(shù)據(jù):下一個(gè)創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的前沿》(Big Data:The Next Frontier for Innovation,Competition,and Productivity),載“百度文庫”,https://wenku.baidu.com/view/2e494d6d9b6648d7c1c746a7.html,最后訪問時(shí)間:2018年12月26日。這個(gè)行業(yè)最缺乏的不是原來單項(xiàng)培養(yǎng)的法律人才或者技術(shù)人才,缺少的是跨越式的復(fù)合人才。技術(shù)界公認(rèn),圖像識(shí)別和語音識(shí)別突破路徑上遇到的最大困難,也是如何打造一個(gè)跨專業(yè)專家團(tuán)隊(duì)對(duì)標(biāo)準(zhǔn)數(shù)據(jù)集進(jìn)行標(biāo)注,以方便機(jī)器學(xué)習(xí)。
我們知道,法律邏輯的結(jié)構(gòu)是“大前提→小前提→結(jié)果”三段論,看似非常清晰簡(jiǎn)單,這是否意味著機(jī)器能夠輕易學(xué)會(huì)?實(shí)際上完全不是。
在法律智能研發(fā)的最早期,也曾有人設(shè)想,法律是一個(gè)封閉的規(guī)則體系,系統(tǒng)可以自動(dòng)按照三段論,基于法律規(guī)定(大前提),再輸入發(fā)生的案件事實(shí)(小前提),就能得到相應(yīng)的裁判結(jié)果。但在真實(shí)世界中,無論是私法領(lǐng)域,還是公法領(lǐng)域,某一法律問題的解決可能會(huì)存在多種學(xué)說、理論和處理結(jié)果,在直面具體的實(shí)務(wù)問題時(shí),會(huì)存在千變?nèi)f化的事實(shí)要素、數(shù)不清的爭(zhēng)議焦點(diǎn)和難以預(yù)測(cè)的模糊地帶,絕非圍棋和德州撲克的規(guī)則那樣透明、清晰。目前,即使是國(guó)際上最先進(jìn)的技術(shù),也無法做到純粹靠機(jī)器的無監(jiān)督學(xué)習(xí)⑩機(jī)器學(xué)習(xí)可以簡(jiǎn)單地分為有監(jiān)督學(xué)習(xí)(Supervised Learning)和無監(jiān)督學(xué)習(xí)(Unsupervised Learning)兩大類,有監(jiān)督學(xué)習(xí)的核心是使用已知正確答案的示例來訓(xùn)練智能系統(tǒng)和網(wǎng)絡(luò),無監(jiān)督學(xué)習(xí)則相反,設(shè)計(jì)者對(duì)問題的答案并不知曉,而是想讓機(jī)器通過分析每個(gè)問題(或事實(shí))的特征信息,從而得出規(guī)律性的結(jié)論。實(shí)現(xiàn)“暴力突破”,或者單純憑借人工智能識(shí)別法律邏輯,即能夠讓機(jī)器像法官那樣思考。
法律認(rèn)知(或者法律人工智能)的核心并不是算法——法律人認(rèn)為可以通過機(jī)器實(shí)現(xiàn)法律邏輯,而計(jì)算機(jī)專家卻認(rèn)為做到這一點(diǎn)難于上青天,究其原因,計(jì)算機(jī)專家認(rèn)為計(jì)算智能是基于大量標(biāo)簽數(shù)據(jù),而非一個(gè)固定邏輯。如果系統(tǒng)被禁錮在固定邏輯基礎(chǔ)上無法進(jìn)行學(xué)習(xí)演進(jìn),一旦邏輯被寫死,系統(tǒng)就將無法匹配真實(shí)案件中變幻莫測(cè)的社會(huì)生活——當(dāng)社會(huì)生活發(fā)生一點(diǎn)細(xì)小的變化時(shí),系統(tǒng)很可能必須整體推倒重寫,而這個(gè)成本極其高昂。邏輯推理在人工智能技術(shù)領(lǐng)域之所以比較難實(shí)現(xiàn),其原因是沒有一個(gè)法律事實(shí)會(huì)根據(jù)設(shè)定好的規(guī)則發(fā)生,法律的價(jià)值在于當(dāng)一個(gè)事實(shí)發(fā)生之后再進(jìn)行評(píng)價(jià);計(jì)算智能則不然,它是通過對(duì)數(shù)據(jù)的標(biāo)簽化去尋找現(xiàn)實(shí)中的規(guī)律,用這種規(guī)律訓(xùn)練出的模型,會(huì)根據(jù)不同的數(shù)據(jù)迭代而自適應(yīng)改變?,F(xiàn)在的機(jī)器翻譯和語音識(shí)別實(shí)際上都是走的計(jì)算智能道路,并取得了巨大的突破,第一代專家智能法律系統(tǒng)早在1970年就已經(jīng)出現(xiàn),[11]可供參閱的相關(guān)討論刊載于《美國(guó)律師協(xié)會(huì)期刊》(American Bar Association Journal)1983年第1期。但幾乎并沒有給法律界帶來任何改變。
在法律人的實(shí)際工作場(chǎng)景金字塔中,處于第一層的是大量基礎(chǔ)性、程序性的工作,這也是當(dāng)前許多低年級(jí)律師和實(shí)習(xí)生正在做的事情;處于第二層的是需要高度經(jīng)驗(yàn)性判斷和總結(jié)歸納的事務(wù);處于第三層的則是正義論和法哲學(xué)層面的問題。目前的法律人工智能仍處于要解決第一層事務(wù)性工作的階段,致力于搭建好基礎(chǔ)設(shè)施,讓散見于法、檢、律之間的數(shù)據(jù)能夠聯(lián)動(dòng)、流通,用機(jī)器取代大量重復(fù)性、低附加值的工作,從而融合法律與科技,以大數(shù)據(jù)和人工智能來解放整個(gè)法律行業(yè)的生產(chǎn)力。在這個(gè)過程中,人工智能會(huì)不斷經(jīng)歷能力的進(jìn)階。
目前,法律智能的研發(fā)工作還有很多困難,其中最大的一個(gè)障礙可能是——這一點(diǎn)或許和整個(gè)計(jì)算智能行業(yè)面臨的問題相同——如何取得足夠?qū)I(yè)、大量的行業(yè)知識(shí)標(biāo)簽數(shù)據(jù)。要突破這個(gè)障礙,需要大量的法律行業(yè)專家和計(jì)算機(jī)算法專家,甚至非??赡苁切枰囵B(yǎng)“法律+算法”的跨學(xué)科專家。谷歌學(xué)術(shù)翻譯更新算法的基礎(chǔ),也是組織了一個(gè)專門的團(tuán)隊(duì),針對(duì)標(biāo)簽數(shù)據(jù)進(jìn)行了大量訓(xùn)練,這才造就了谷歌翻譯“一騎絕塵”的驚艷效果。
可喜的是,中國(guó)的數(shù)據(jù)法學(xué)研究和法律科技應(yīng)該說是走在世界前端的,這在很大程度上得益于我們擁有全世界最豐富的數(shù)據(jù)礦藏——最高人民法院先后在2010年、2013年、2016年三次發(fā)布《關(guān)于人民法院在互聯(lián)網(wǎng)公布裁判文書的規(guī)定》,[12]《最高人民法院關(guān)于人民法院在互聯(lián)網(wǎng)公布裁判文書的規(guī)定》(法發(fā)〔2010〕48號(hào),2014年1月1日廢止);《最高人民法院關(guān)于人民法院在互聯(lián)網(wǎng)公布裁判文書的規(guī)定》(法釋〔2013〕26號(hào),于2013年11月13日由最高人民法院審判委員會(huì)第1595次會(huì)議通過,自2014年1月1日起施行);《最高人民法院關(guān)于人民法院在互聯(lián)網(wǎng)公布裁判文書的規(guī)定》(法釋〔2016〕19號(hào),于2016年7月25日由最高人民法院審判委員會(huì)第1689次會(huì)議通過,自2016年10月1日起施行)。截至2018年12月26日,裁判文書公開總量超過5976萬篇,[13]基于中國(guó)裁判文書網(wǎng)首頁的實(shí)時(shí)更新數(shù)據(jù),參見“中國(guó)裁判文書網(wǎng)”,http://wenshu.court.gov.cn/,最后訪問時(shí)間:2018年12月26日。這為法律大數(shù)據(jù)研究和整個(gè)行業(yè)提供了非常好的數(shù)據(jù)資源。與此同時(shí),一方面需要在法律服務(wù)領(lǐng)域進(jìn)行研發(fā)和資本的持續(xù)投入,通過提供法律智能服務(wù)、構(gòu)建法律科技生態(tài)圈的方式,提升法律行業(yè)的科技屬性;另一方面還需要通過對(duì)法律業(yè)務(wù)的不斷深入研究,將頂級(jí)法律專家團(tuán)隊(duì)的知識(shí)“物化”為服務(wù)于全行業(yè)、提升行業(yè)專業(yè)能力的智能工具。這中間還有很長(zhǎng)的路要走。
法律智能系統(tǒng)的研發(fā)進(jìn)度還體現(xiàn)在“機(jī)器學(xué)習(xí)”本身的基礎(chǔ)性制約上:首先,用于訓(xùn)練的標(biāo)簽數(shù)據(jù)必須對(duì)解決特定問題確實(shí)有效。比如,一位使用法律智能系統(tǒng)的律師如果嘗試模擬季節(jié)和法律服務(wù)費(fèi)用之間的關(guān)系,很可能就是徒勞無功的,機(jī)器只能模擬學(xué)習(xí)實(shí)際存在的關(guān)系,即便這個(gè)關(guān)系隱藏得非常深,也不會(huì)構(gòu)成太多的困難;反之,對(duì)于那些人類學(xué)家無法手動(dòng)用數(shù)據(jù)解決(或者關(guān)聯(lián)關(guān)系過于稀疏)的問題,機(jī)器也無法解決。其次,訓(xùn)練過程中必須盡可能窮盡有影響的因素。機(jī)器學(xué)習(xí)并非建立在所有對(duì)結(jié)論的影響因素都可知的前提下,但人類對(duì)客觀規(guī)律的認(rèn)知遠(yuǎn)比我們想象的要狹隘,因此在人類可知的范圍能盡可能的窮盡有影響的因素,會(huì)在很大程度上幫助機(jī)器走完人力難以企及的“最后一公里”。
與其追求高高在上的概念,不如回到真實(shí)的場(chǎng)景,從業(yè)務(wù)場(chǎng)景中尋找技術(shù)的落地點(diǎn)和結(jié)合點(diǎn),而不是一味簡(jiǎn)單追求高大上的專業(yè)名詞。這一點(diǎn),在法律學(xué)術(shù)研究領(lǐng)域也是通用的。法律計(jì)算智能的產(chǎn)生基礎(chǔ),首先在于大數(shù)據(jù)領(lǐng)域的精深研究和科學(xué)路徑,然后通過在真實(shí)應(yīng)用場(chǎng)景中不斷構(gòu)建數(shù)據(jù)循環(huán),最終才能逐漸構(gòu)建起來。當(dāng)把數(shù)據(jù)“打通”之后,哪怕沒有高深的“機(jī)器學(xué)習(xí)”,也可以更好、更便捷地服務(wù)當(dāng)事人和法官。
我們可以用一個(gè)案例來示范:“5月9日22時(shí)32分,在北京市東城區(qū)東直門外大街十字坡路口東50米處發(fā)生交通事故,現(xiàn)場(chǎng)發(fā)現(xiàn)一輛北京牌照的白色英菲尼迪越野車與前方三輛車發(fā)生事故。經(jīng)檢測(cè),肇事車駕駛員高某某每百毫升血液中酒精含量為243.04毫克,達(dá)到醉酒駕車標(biāo)準(zhǔn)三倍之高?!?/p>
這是一個(gè)很有意思的實(shí)驗(yàn),也曾經(jīng)在多所法學(xué)院校進(jìn)行過現(xiàn)場(chǎng)測(cè)試,測(cè)試者向法學(xué)生提問:“這段新聞報(bào)道里的事實(shí)構(gòu)成了什么法律關(guān)系?”大部分學(xué)生能夠答出“構(gòu)成危險(xiǎn)駕駛罪”,少部分學(xué)生能夠答出“侵犯財(cái)產(chǎn)權(quán)”或“侵犯人身權(quán)”等。通過法律智能系統(tǒng)[14]實(shí)驗(yàn)系統(tǒng)采用北京華宇元典信息服務(wù)有限公司基于“睿核”技術(shù)開發(fā)的智庫系統(tǒng)。分析,得出的推薦結(jié)果確實(shí)是“危險(xiǎn)駕駛罪”;但從歷史數(shù)據(jù)來看,系統(tǒng)給出的推薦結(jié)果還包括“責(zé)任保險(xiǎn)合同糾紛”和其他的財(cái)產(chǎn)損失糾紛案由。系統(tǒng)之所以能作出這樣的判斷,并非基于法律概念和邏輯的學(xué)習(xí),而是基于對(duì)歷史上大量的同類案件事實(shí)和裁判文書進(jìn)行識(shí)別,通過學(xué)習(xí)的機(jī)器像經(jīng)驗(yàn)豐富的人類一樣判斷某個(gè)特定事實(shí)在當(dāng)下會(huì)構(gòu)成何種案由,甚至超越了一般法學(xué)畢業(yè)生。而且,由于審判規(guī)律、法官傾向以及“醉駕”的認(rèn)定標(biāo)準(zhǔn)也在發(fā)生改變,過5年、10年再看,可能結(jié)果呈現(xiàn)會(huì)完全不一樣,到那時(shí),智能系統(tǒng)就可能基于對(duì)模型的重新學(xué)習(xí)而推薦出新的案由。
這套智能案由識(shí)別系統(tǒng)的開發(fā)團(tuán)隊(duì)分享研發(fā)經(jīng)驗(yàn)時(shí)談到,在案由識(shí)別的訓(xùn)練基礎(chǔ)上,系統(tǒng)還可以更進(jìn)一步實(shí)現(xiàn)對(duì)影響量刑情節(jié)的判斷。在2017年10月5日22時(shí)40分許發(fā)生的郎某某駕車致交通事故一案中,系統(tǒng)給出的預(yù)期量刑結(jié)果是“拘役3個(gè)月左右,不緩刑,罰金3000到5000元”。而最終法院宣判結(jié)果確實(shí)為拘役3個(gè)月,罰金人民幣4000元。這套智能量刑輔助系統(tǒng)在實(shí)務(wù)中被采用和認(rèn)可的原因,也正是用真實(shí)案件進(jìn)行具體量刑測(cè)試時(shí)得出的結(jié)論與承辦人根據(jù)專業(yè)和業(yè)務(wù)經(jīng)驗(yàn)所做的判斷基本一致,這對(duì)彼此雙方都是一種很好的驗(yàn)證。
最高人民檢察院于2017年公布的數(shù)據(jù)顯示,廣東省人民檢察院適用認(rèn)罪認(rèn)罰從寬程序辦理的案件,偵查階段平均用時(shí)39.19天,審查起訴平均用時(shí)16.1天,審判平均用時(shí)20.17天,均大幅低于普通案件平均用時(shí),專業(yè)化、智能化辦案使司法工作的質(zhì)量和效率都大幅提升;而量刑決策過程中引入人工智能輔助系統(tǒng)軟件后,廣東地區(qū)的認(rèn)罪認(rèn)罰從寬案件量刑建議采納率達(dá)到94.46%,已判決案件中共有99人上訴,上訴率僅為0.63%,[15]參見《案件處理質(zhì)效提升 制度設(shè)計(jì)日趨完善——“認(rèn)罪認(rèn)罰從寬”試點(diǎn)效果不錯(cuò)》,載《人民日?qǐng)?bào)》(海外版)2018年2月26日。不僅在全國(guó)試點(diǎn)地區(qū)處于領(lǐng)先水平,也遠(yuǎn)高于一般刑事案件量刑建議采納率。
之所以能達(dá)到這樣相對(duì)精準(zhǔn)的結(jié)果,是因?yàn)殚_發(fā)團(tuán)隊(duì)中的大量法律業(yè)務(wù)專家們把知識(shí)和經(jīng)驗(yàn)?zāi)P拓暙I(xiàn)到了智能訓(xùn)練中,手把手幫助每一個(gè)年輕法律人避免經(jīng)驗(yàn)上的缺失和短板,在堅(jiān)實(shí)的分析基礎(chǔ)上,更確切地說,是在知識(shí)圖譜對(duì)歷史的精確定位上得出了分析模型和可能的預(yù)測(cè)結(jié)果。
知識(shí)圖譜是一種知識(shí)解析、知識(shí)發(fā)展進(jìn)程與知識(shí)間結(jié)構(gòu)關(guān)系的可視化呈現(xiàn),簡(jiǎn)單地說,這是一種對(duì)于挖掘、分析、構(gòu)建、繪制和知識(shí)呈現(xiàn)及知識(shí)之間相互聯(lián)系的描述技術(shù)。法律知識(shí)圖譜是在法律這個(gè)專業(yè)領(lǐng)域的數(shù)據(jù)深耕和挖掘的基礎(chǔ)上對(duì)法律數(shù)據(jù)資源進(jìn)行的知識(shí)圖譜呈現(xiàn)。以故意殺人罪為例:從罪名的犯罪構(gòu)成入手,如果按照三階層犯罪構(gòu)成體系,可以依次從事實(shí)認(rèn)定、違法性、有責(zé)性三個(gè)層面進(jìn)行評(píng)價(jià)。其中的事實(shí)認(rèn)定需要確定行為人、行為對(duì)象等,違法性可能涉及正當(dāng)防衛(wèi)等違法阻卻事由,有責(zé)性可能涉及行為人的年齡或者精神狀態(tài)。如此不斷展開延伸,就會(huì)形成一個(gè)樹狀圖,這個(gè)樹狀圖會(huì)在數(shù)據(jù)庫里形成一個(gè)層級(jí)分布的模型。這是法律知識(shí)圖譜制作的第一步,也被稱作知識(shí)管理。接下來,還需要法律人和程序員密切合作,將法律知識(shí)轉(zhuǎn)化為機(jī)器可以認(rèn)知并學(xué)習(xí)的知識(shí)圖譜,為了完成這些基礎(chǔ)數(shù)據(jù)的處理制作,最初,法律研究員需要與程序員結(jié)對(duì)子,在電腦面前一行一行地敲代碼,而現(xiàn)在,已經(jīng)有了一套完整的生產(chǎn)平臺(tái),讓法律研究員與程序員都有了更高效的分工,生產(chǎn)效率也得到非常大的提升。
但法律畢竟是一種高維度的復(fù)雜系統(tǒng),不太可能作出精準(zhǔn)預(yù)言,只能通過分析歷史規(guī)律中影響因素的關(guān)鍵定義,嘗試性地對(duì)歷史規(guī)律進(jìn)行側(cè)寫,把該規(guī)律客觀地呈現(xiàn)出來,包括分析的過程、同類案件有多少判處可能性、找到多少相似案例……將這一系列信息盡可能完整地呈現(xiàn)在使用者面前,從而提高使用者的決策效率。這絕對(duì)不是一個(gè)黑盒系統(tǒng),智能系統(tǒng)中的每一組數(shù)據(jù)都應(yīng)當(dāng)是透明的,同時(shí)也能看到真實(shí)案例。在這個(gè)基礎(chǔ)上,數(shù)據(jù)至少能解決一個(gè)困擾法律行業(yè)已久的問題,那就是當(dāng)一個(gè)法律問題存在爭(zhēng)議,而無論是裁判者、司法機(jī)關(guān)還是普通人,都想得到法律公正判決,如何為其提供一個(gè)客觀的比較標(biāo)準(zhǔn)。需要再次強(qiáng)調(diào)的是,基于這套理論構(gòu)建的智能系統(tǒng)所輸出的結(jié)果一定不是絕對(duì)的,如果把數(shù)據(jù)維度調(diào)到2010年之前,得到的結(jié)果可能截然相反,智能系統(tǒng)需要保證的是數(shù)據(jù)和分析結(jié)果真實(shí)且客觀。
再以法律檢索場(chǎng)景為例,在傳統(tǒng)的檢索工具上進(jìn)行檢索時(shí),最早的技術(shù)是基于關(guān)鍵詞匹配,即檢索得到的答案是關(guān)鍵詞匹配的結(jié)果,如果關(guān)鍵詞本身設(shè)定得不夠準(zhǔn)確,答案也難如人意。我們知道,信息和知識(shí)是有區(qū)別的:“信息”是零散的,而“知識(shí)”則有體系與邏輯,利用法律智能系統(tǒng)對(duì)于法律概念的認(rèn)知能力和底層的知識(shí)圖譜,將傳統(tǒng)的“信息檢索”改造為“知識(shí)檢索”,幫助法律人在充滿碎片的世界里,融合完整、全面的視角,“在充滿答案的世界里,提出更好的問題”可能才是解鎖的關(guān)鍵。用一句通俗的話來形容,智能檢索技術(shù)應(yīng)該是為每位法律參與者“福爾摩斯”搭配一位能夠從碎片化數(shù)據(jù)中推演出完整場(chǎng)景的“華生”。比如以法院為維度,分析某一個(gè)法院在某一類案件中的裁判依據(jù),以法官為維度,判斷某一位法官在某一個(gè)案件中的裁判傾向和主要觀點(diǎn)。在學(xué)術(shù)研究范疇,把學(xué)者們的文章觀點(diǎn)碎片化,以某一個(gè)特定事實(shí)為小前提,在運(yùn)行時(shí)不但給出實(shí)證的量刑結(jié)果,還推送學(xué)者對(duì)這個(gè)問題的觀點(diǎn)。這是一種全新的知識(shí)傳播形式,意味著學(xué)術(shù)研究不再需要一頁一頁地翻閱書山文海,也不再需要研究一整個(gè)復(fù)雜的體系性問題,在碎片化模式下,學(xué)術(shù)研究效率可能會(huì)得到大大提高,也能幫助年輕的法律人(法官、檢察官、律師、企業(yè)法務(wù)等等)加快學(xué)習(xí)知識(shí)的速度。而法律檢索智能的實(shí)現(xiàn),將不僅服務(wù)于司法機(jī)關(guān)、法律專業(yè)從業(yè)者、學(xué)術(shù)研究,也能夠服務(wù)于案件當(dāng)事人,每一個(gè)人都應(yīng)當(dāng)有權(quán)利知道是什么樣的人在審理自己的案件,這并不是應(yīng)對(duì)策略的需要,而是當(dāng)事人在信息上被公平、公正、對(duì)等對(duì)待的需要。
在傳統(tǒng)的庭審場(chǎng)景里,法律和技術(shù)還可以更深度地進(jìn)行結(jié)合。以語音識(shí)別技術(shù)為例,該項(xiàng)技術(shù)長(zhǎng)期停留在相對(duì)簡(jiǎn)單的轉(zhuǎn)錄層面,許多法院在使用該技術(shù)將庭審實(shí)況轉(zhuǎn)錄成書面文本時(shí),由于機(jī)器并不會(huì)自主對(duì)庭審各方的口頭語言進(jìn)行歸納總結(jié),所以極易出現(xiàn)“庭審兩小時(shí),筆錄五十頁”的情況。如果嘗試用語義歸納技術(shù),就有可能對(duì)機(jī)器轉(zhuǎn)錄的文本再進(jìn)行分析總結(jié),這是語音技術(shù)的其中一個(gè)使用場(chǎng)景。
對(duì)于在法庭質(zhì)證過程中三方信息傳遞不均衡的問題,語音識(shí)別技術(shù)和電子卷宗技術(shù)也有了最新融合成果,通過智能示證系統(tǒng)已經(jīng)可以實(shí)現(xiàn)根據(jù)質(zhì)證過程中每個(gè)證據(jù)所證明的事實(shí),對(duì)證據(jù)進(jìn)行重新串聯(lián),以時(shí)間為維度還原可能的案件事實(shí),這套技術(shù)能夠適用于所有案由。
更進(jìn)一步的探索也在邏輯性更強(qiáng)的部門法(如《刑法》)領(lǐng)域里發(fā)生,同樣以庭審質(zhì)證為例:在傳統(tǒng)場(chǎng)景下,庭審各方在質(zhì)證時(shí)常常無法判斷某一個(gè)爭(zhēng)議焦點(diǎn)到底有哪些對(duì)應(yīng)證據(jù),通過機(jī)器輔助,以構(gòu)成要件為邏輯框架,對(duì)證據(jù)進(jìn)行拆分、歸類,在庭審中通過語音指令對(duì)出示證據(jù)一方的電子卷宗進(jìn)行靈活調(diào)取,然后將需要出示的片段進(jìn)行放大展示,能夠有效提升傳統(tǒng)庭審過程中三方的質(zhì)證效率和透明度。智能示證系統(tǒng)還可依據(jù)庭審記錄中每份證據(jù)的證明事項(xiàng)不同,輔助法官根據(jù)時(shí)間線對(duì)現(xiàn)有證據(jù)進(jìn)行整理和補(bǔ)充。圖像識(shí)別和語義理解技術(shù)的綜合運(yùn)用,將傳統(tǒng)的紙質(zhì)卷宗流轉(zhuǎn)成三方共享的智能示證形式,可以有效節(jié)約承辦人的時(shí)間、精力。
傳統(tǒng)的應(yīng)用系統(tǒng)開發(fā)多數(shù)著眼于業(yè)務(wù)流程軟件,而檢察院的業(yè)務(wù)流程和法院的業(yè)務(wù)流程截然不同,更不用說律師事務(wù)所、司法管理機(jī)關(guān)等其他機(jī)構(gòu)的個(gè)性化需求,雖然都是法律活動(dòng)參與者,但很難共用一套底層平臺(tái)。但更新的研發(fā)思路認(rèn)為,只要是在同一個(gè)領(lǐng)域(比如刑事案件)里,無論是法院還是檢察院適用的都是同一套《刑法》和《刑事訴訟法》,也就是同一套邏輯規(guī)則體系,所以,計(jì)算機(jī)和法律最好的結(jié)合點(diǎn)首先應(yīng)該是在邏輯,當(dāng)機(jī)器能夠成功地通過部門法的邏輯訓(xùn)練的時(shí)候,這項(xiàng)技術(shù)所能支撐的就不再是一個(gè)行業(yè),而是一個(gè)領(lǐng)域。目前大多數(shù)法律智能技術(shù)之所以首先在刑事案件領(lǐng)域作出突破,也是因?yàn)樵擃I(lǐng)域本身邏輯性非常強(qiáng),構(gòu)成要件理論的研究也非常成熟,在民事案件和行政案件領(lǐng)域中還需要更多的探索。
讓機(jī)器逐漸習(xí)得法律認(rèn)知能力,在數(shù)據(jù)孤島間搭建連接的道路,將法律人的智慧轉(zhuǎn)化為機(jī)器智能,通過構(gòu)建更統(tǒng)一的法律智能平臺(tái)——對(duì)象不僅僅是法官、檢察官,還應(yīng)當(dāng)包括律師、企業(yè)法務(wù)和法律學(xué)者——能夠提升整個(gè)行業(yè)的科技感和技術(shù)力量,而不是單打獨(dú)斗、重復(fù)建設(shè),進(jìn)而形成進(jìn)化型的法律服務(wù)市場(chǎng),這個(gè)市場(chǎng)不僅包括公共法律服務(wù),還應(yīng)該包括商業(yè)法律服務(wù),是從業(yè)者一直為之努力的法律智能愿景。
拿破侖在制定法國(guó)《民法典》的時(shí)候,希望能涵蓋當(dāng)下和此后很長(zhǎng)時(shí)間內(nèi)的所有糾紛,歷史證明,他失敗了。中國(guó)政法大學(xué)的江平教授就此曾說,“再完善不過的民法典,也會(huì)因?yàn)椤L(fēng)車和磨坊’的規(guī)定失去了它的無所不包性”。[16]江平:《制訂民法典的幾點(diǎn)宏觀思考》,載《政法論壇》1997年第3期。如何解決法律的滯后性問題?判例法國(guó)家有各種各樣的配套制度,但是成文法國(guó)家呢?在社會(huì)契約論時(shí)代,人們可以通過法定成文讓渡部分權(quán)利實(shí)現(xiàn)每個(gè)人最大的自由,但無論是最近科技技術(shù)的爆發(fā),還是之前社會(huì)經(jīng)濟(jì)的高速增長(zhǎng),都在告訴我們:作為法律人,作為曾經(jīng)肩負(fù)起社會(huì)規(guī)則制定的一群人,我們的理性是有限的,很難想象下一步科技能夠帶來什么樣的迭代。
在《未來簡(jiǎn)史》第11章“信數(shù)據(jù)得永生”的結(jié)尾處,尤瓦爾·赫拉利說:“我們無法真正預(yù)測(cè)未來,因?yàn)榭萍疾⒉粫?huì)帶來確定的結(jié)果。同樣的科技,也可能創(chuàng)造出非常不一樣的社會(huì)”,“人工智能和生物科技的興起肯定將改變世界,但并不代表只有一種結(jié)局”。[17]參見[以]尤瓦爾·赫拉利:《未來簡(jiǎn)史:從智人到神人》,林俊宏譯,中信出版社2017年版,第359頁。這句話的語境是針對(duì)《未來簡(jiǎn)史》一書中所描述的各種情境和可能性,人類的思想和行動(dòng)通常會(huì)受限于當(dāng)前的意識(shí)形態(tài)和社會(huì)制度。這對(duì)于法律行業(yè)的人工智能發(fā)展也同樣適用。
在近10年的探索中,法律智能經(jīng)歷了從純粹的技術(shù)發(fā)展到技術(shù)結(jié)合行業(yè)深入發(fā)展的迭代過程,目前取得了階段性成果,其基礎(chǔ)邏輯依然來自于法哲學(xué)和法理學(xué),如果我們相信成文法的每一個(gè)規(guī)定都可投影在真實(shí)判決中,而每一個(gè)證據(jù)也都可以投影在判決事實(shí)中,那么這些投影相交的中間點(diǎn)就是那個(gè)我們還不知道如何命名的核心要素。這種核心既不是靠玄理,也不是靠任何實(shí)踐經(jīng)驗(yàn)或者由誰拍腦袋靈光一現(xiàn)可以獲得的,它需要持續(xù)不斷地進(jìn)行人機(jī)交互、人機(jī)訓(xùn)練和人機(jī)互聯(lián)。
法律科技和智能系統(tǒng)的演進(jìn)并不是某一個(gè)人或團(tuán)隊(duì)的事,而是整個(gè)法律行業(yè)人才、技術(shù)、資本的大迭代,除了需要建設(shè)足夠的標(biāo)簽體系,還要有足夠的監(jiān)督學(xué)習(xí)、深入學(xué)習(xí)技術(shù),以及足夠的數(shù)據(jù)回流平臺(tái)、專家經(jīng)驗(yàn)的最初設(shè)定等等,需要所有這些一起構(gòu)成一個(gè)有機(jī)整體并進(jìn)行自主生態(tài)循環(huán),才有可能實(shí)現(xiàn)。我們希望借助技術(shù)的無限智能去突破每個(gè)法律人個(gè)體的有限理性,不僅是在經(jīng)驗(yàn)上,也可能是在邏輯上實(shí)現(xiàn)法律與智能的真正結(jié)合。這正是在中國(guó)當(dāng)前經(jīng)濟(jì)環(huán)境和社會(huì)發(fā)展的關(guān)鍵節(jié)點(diǎn)上談?wù)摲扇斯ぶ悄艿臅r(shí)候,整個(gè)法律共同體所抱持的目標(biāo)和理念。