李啟可 張克亮
摘要:?jiǎn)柎鹣到y(tǒng)的歷史可以追溯到20世紀(jì)50年代,主要是受到了圖靈測(cè)試的影響,圖靈測(cè)試主要是通過測(cè)試者與被測(cè)試者之間的問答來(lái)進(jìn)行測(cè)試。圖靈測(cè)試可以說(shuō)是問答最初的表現(xiàn)形式。而在當(dāng)時(shí),伴隨著計(jì)算機(jī)的發(fā)展,問答系統(tǒng)也在之后問世,只不過當(dāng)時(shí)的問答較現(xiàn)在來(lái)說(shuō),系統(tǒng)復(fù)雜程度不高,功能較少。經(jīng)過幾十年的發(fā)展,問答系統(tǒng)已經(jīng)具有了蓬勃的發(fā)展,種類繁多,其中所使用的方法以及模型也多不勝數(shù)。近年來(lái),由谷歌所提出的知識(shí)圖譜技術(shù)在工業(yè)界得到了廣泛的應(yīng)用,并且知識(shí)圖譜給帶來(lái)的收益是不可小覷的,知識(shí)圖譜結(jié)合了多種學(xué)科,并利用圖的形式,為研究者提供具有切實(shí)的,有價(jià)值的參考。本文將著重介紹與知識(shí)圖譜,知識(shí)推理相關(guān)的問答系統(tǒng)的發(fā)展?fàn)顩r,在此將做一個(gè)整體性的論述。
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2019)09-0155-02
1 基本概念
1.1 什么是推理
我們?cè)谏钪谐3U劦酵评恚慨?dāng)我們要對(duì)某些未知的事情進(jìn)行猜測(cè)或是分析時(shí),我們就會(huì)用到推理。推理,在《現(xiàn)代漢語(yǔ)詞典第6版》第1323頁(yè)是這樣定義的:邏輯學(xué)指思維的基本形式之一,是由一個(gè)或幾個(gè)已知的判斷(前提)推出新判斷(結(jié)論)的過程[1]。
推理是思維的基本形式之一,思維是人類的基本的特征,推理能夠幫助人類認(rèn)識(shí)世界,能夠有效地表達(dá)人類的思維,并與外界產(chǎn)生交流,從而實(shí)現(xiàn)信息的交換。從古至今,人類的知識(shí)產(chǎn)量一直在不斷增長(zhǎng),尤其最近幾十年,人類知識(shí)呈現(xiàn)爆炸式的增加,從人類思維的角度來(lái)說(shuō),這就是推理所帶給人類的巨大益處,人類通過已知的知識(shí)去推理未知的知識(shí),從而產(chǎn)生新的知識(shí),這樣的過程就是一個(gè)推理的過程,而這個(gè)過程是從已知到未知,從無(wú)到有的過程。
1.2 什么是知識(shí)推理
知識(shí)推理的定義比較多,以下是MBA智庫(kù)百科的定義:知識(shí)推理是指在計(jì)算機(jī)或智能系統(tǒng)中,模擬人類的智能推理方式,依據(jù)推理控制策略,利用形式化的知識(shí)進(jìn)行機(jī)器思維和求解問題的過程。推理是按照某種策略從已知判斷推出另一種判斷的思維過程。推理的過程就是解決問題的過程,使問題從初始狀態(tài)轉(zhuǎn)移到目標(biāo)狀態(tài)的方法和途徑。Kompridis[2]在他的論文中談到,推理為一系列能力的總稱,包括有意識(shí)地理解事物的能力建立和驗(yàn)證事實(shí)的能力運(yùn)用邏輯的能力以及基于新的或存在的知識(shí)改變或驗(yàn)證現(xiàn)有體系的能力。
推理是人類思維最基本的特征,作為一個(gè)正常的人類,或者說(shuō)只要是正常的人類,都會(huì)推理,這是必須承認(rèn)的事實(shí)。其實(shí)推理就是思考,而對(duì)于機(jī)器來(lái)說(shuō),機(jī)器并不會(huì)思考,機(jī)器不想人類那樣智能,人類能夠分辨貓咪和狗,能夠分辨下雨和天晴,但機(jī)器不能,機(jī)器在沒人類指導(dǎo)的情況下是做不到的;人類能夠通過學(xué)習(xí)去推斷出新的知識(shí),人類能夠通過學(xué)習(xí)來(lái)推斷未知的事物。但機(jī)器同樣不能,機(jī)器在沒有人類指導(dǎo)的情況下是無(wú)法做出推理的。
那么從人工智能的角度來(lái)說(shuō),機(jī)器想要進(jìn)行推理,那么必須由人來(lái)指導(dǎo),由人來(lái)指定規(guī)則,算法,模型等等一系列有利于計(jì)算機(jī)理解的法則,而計(jì)算機(jī)通過對(duì)這些法則進(jìn)行編碼解碼,來(lái)按照人們的意愿,或是模仿人類的推理的行為做出一些簡(jiǎn)單的推理。我們必須把現(xiàn)實(shí)世界里的語(yǔ)言,知識(shí),或是規(guī)則轉(zhuǎn)換成計(jì)算機(jī)能夠識(shí)別的語(yǔ)言,這樣能夠使計(jì)算機(jī)更加方便去進(jìn)行推理,而計(jì)算機(jī)將通過計(jì)算機(jī)能識(shí)別的語(yǔ)言按照人們的思路去進(jìn)行推理,從而實(shí)現(xiàn)讓計(jì)算機(jī)來(lái)進(jìn)行推理的過程。
2 歷史發(fā)展
知識(shí)推理是與知識(shí)圖譜密切相關(guān),知識(shí)圖譜的誕生直接導(dǎo)致了知識(shí)推理的誕生,而知識(shí)推理離不開知識(shí)圖譜,知識(shí)推理中很多技術(shù)都是基于知識(shí)圖譜來(lái)實(shí)現(xiàn)的,這就體現(xiàn)了這兩種技術(shù)的相互的依賴性。關(guān)于知識(shí)圖譜和知識(shí)推理的發(fā)展大概可以分為本體網(wǎng)絡(luò)時(shí)代,語(yǔ)義網(wǎng)時(shí)代,和知識(shí)圖譜時(shí)代[3]。
2.1 本體時(shí)期
知識(shí)圖譜的最初形式是本體網(wǎng)絡(luò)。這可以看作是知識(shí)圖譜的雛形,后期的知識(shí)圖譜在很大程度上是受本體網(wǎng)絡(luò)的啟發(fā),從而發(fā)展出來(lái)的。本體(ontology)是一個(gè)哲學(xué)里的概念,在知識(shí)圖譜的發(fā)展過程中,本體主要是指由一些抽象概念,物體屬性以及關(guān)系類型所構(gòu)成一個(gè)世界。本體主要關(guān)注的是物體之間的相互關(guān)系,或是物體的特征之間的一些相互關(guān)系。本體網(wǎng)絡(luò)我們可以看作是一種特殊的語(yǔ)義網(wǎng)絡(luò)(Semantic Network),這在早期人們也對(duì)其做了深入研究,并由此催生了很多與之技術(shù)。
在知識(shí)圖譜發(fā)展初期,除了本體網(wǎng)絡(luò)的雛形之外,還有一種形式值得我們研究——專家系統(tǒng)。專家系統(tǒng)中存儲(chǔ)了大量的與某一類專業(yè)相關(guān)的知識(shí),每當(dāng)我們需要解決某一類專業(yè)問題的時(shí)候,我們可以不再去查閱大量的資料來(lái)解決我們遇到的問題,我們可以直接使用這樣一個(gè)存儲(chǔ)了大量專業(yè)知識(shí)的專家系統(tǒng),通過這個(gè)專家系統(tǒng)來(lái)解決我們的問題。這樣的專家系統(tǒng)同樣為后來(lái)的一些人工智能系統(tǒng)提供了靈感。這也是早期人們通過計(jì)算機(jī)程序系統(tǒng)來(lái)解決問題的一個(gè)實(shí)例。
2.2 語(yǔ)義網(wǎng)
語(yǔ)義網(wǎng)(Semantic Web)與語(yǔ)義網(wǎng)絡(luò)(Semantic Network)是兩個(gè)不同的概念,語(yǔ)義網(wǎng)絡(luò)主要研究事物之間的相互關(guān)系,或是事物特征之間的相互關(guān)系,而語(yǔ)義網(wǎng)則是與互聯(lián)網(wǎng)類似的一種網(wǎng),它具有十分強(qiáng)大的智能,能夠有效地與人類交流,從而實(shí)現(xiàn)人類與機(jī)器的交互。語(yǔ)義網(wǎng)主要通過對(duì)用戶輸入的語(yǔ)義進(jìn)行工作。對(duì)于當(dāng)前大量的信息,人們將會(huì)面臨困難是如何對(duì)大量信息進(jìn)行檢索,以及挖掘有用信息,而語(yǔ)義網(wǎng)的出現(xiàn)正是對(duì)這種困難的一種解決方案。
2.3 知識(shí)圖譜
2012年,谷歌提出知識(shí)圖譜。這是由谷歌搜索引擎專家Amit Singhal在他的論文《Introducing the Knowledge Graph: things, not strings》中提出的,搜索引擎在知識(shí)圖譜的幫助下其性能將會(huì)有一個(gè)很大的提升。在知識(shí)圖譜的幫助下,搜索引擎將能夠理解用戶的輸入中語(yǔ)義,從而有一個(gè)更加精確的搜索,對(duì)用戶的友好度將會(huì)更高。同時(shí),知識(shí)圖譜會(huì)為用戶推薦與用戶搜索相關(guān)的一些信息,或者說(shuō)知識(shí)圖譜通過用戶的輸入,來(lái)判斷用戶的喜好、興趣,并根據(jù)這些喜好和興趣來(lái)為用戶推薦相關(guān)的東西。這與個(gè)性化推薦比較相似。
3 主流技術(shù)
當(dāng)前在問答系統(tǒng)中有很多技術(shù),這里主要介紹問答系統(tǒng)中一些相對(duì)來(lái)說(shuō)比較主流的技術(shù)。主要分為兩種,一種是基于規(guī)則的推理方法,一種是基于統(tǒng)計(jì)的推理方法。
3.1 基于規(guī)則的推理方法
基于規(guī)則的推理方法[4],這個(gè)方法的主要思想是借助RDF來(lái)實(shí)現(xiàn)的,資源描述框架RDF是Resource Description Framework的縮寫,RDF允許人們可以定義自己的詞匯表,這就意味著在知識(shí)表示的方面,人們能夠根據(jù)自己的實(shí)際情況來(lái)定義知識(shí),然后再根據(jù)自己的詞匯表或者是自己定義的知識(shí)來(lái)進(jìn)行知識(shí)推理。但僅僅是這樣還無(wú)法完成知識(shí)推理,所以在這當(dāng)中加入了圖,與三元組相似,用圖來(lái)表示實(shí)體之間的關(guān)系,但在這當(dāng)中變得十分靈活,通過自己定義知識(shí)表示結(jié)構(gòu),從而讓系統(tǒng)從這樣的結(jié)構(gòu)中去學(xué)習(xí)推理,并通過這些知識(shí)去推理出新的知識(shí)。
其次,在基于規(guī)則的推理方法中,還使用了OWL,OWL是Ontology Web Lanugage的縮寫,通過借助這種語(yǔ)言來(lái)對(duì)事物之間的關(guān)系進(jìn)行表示,之后再通過這些關(guān)系去進(jìn)行推理。
3.2 基于統(tǒng)計(jì)的推理方法
基于統(tǒng)計(jì)的推理方法,這種主要是對(duì)大量數(shù)據(jù)進(jìn)行處理,也就是堆數(shù)據(jù)進(jìn)行挖掘,從中挖掘出實(shí)體之間的關(guān)系,之后再抽象成相應(yīng)的規(guī)則,從而在這之后能夠?qū)崿F(xiàn)知識(shí)推理。我們都知道知識(shí)圖譜主要是從數(shù)據(jù)抽取出三元組,通過三元組來(lái)表示實(shí)體之間的關(guān)系,這里基于統(tǒng)計(jì)的推理方法同樣是如此,但這里的方法更進(jìn)一步,它把抽取出來(lái)的三元組放進(jìn)一個(gè)集合,同時(shí)有把這當(dāng)中涉及的實(shí)體放入另一個(gè)集合,通過這樣方法對(duì)未知的三元組進(jìn)行推理,推斷出一些可能的,未出現(xiàn)過的三元組,從而實(shí)現(xiàn)知識(shí)的推理。
4 總結(jié)
本文從知識(shí)推理的概念,歷史發(fā)展,以及在問答系統(tǒng)中一些主流的知識(shí)推理技術(shù)等多個(gè)方面對(duì)知識(shí)推理做了介紹,從中我們可以了解到有關(guān)知識(shí)推理的一部分內(nèi)容,同時(shí),我們也能從這些內(nèi)容中獲取一些相關(guān)知識(shí),從而能指導(dǎo)我們之后的學(xué)習(xí),有關(guān)知識(shí)推理的內(nèi)容以及知識(shí)推理的應(yīng)用在工業(yè)界還有很多,例如基于知識(shí)庫(kù)的問答系統(tǒng)[5]。在這里只是選取一些主流技術(shù)來(lái)介紹,對(duì)于知識(shí)推理我們?nèi)匀贿€有很長(zhǎng)的路要走,因此我們應(yīng)該秉持虛心求教的態(tài)度,才能把握好之后的機(jī)遇。
參考文獻(xiàn):
[1] 官賽萍,靳小龍,賈巖濤,等.面向知識(shí)圖譜的知識(shí)推理研究進(jìn)展[J].軟件學(xué)報(bào),2018,29(10):2-3.
[2] Kompridis N. So we need something else for reason to mean. International Journal of Philosophical Studies,2000,8(3):271-95.
[3] 毛先領(lǐng),李曉明.問答系統(tǒng)研究綜述[J].Journal of Frontiers of Computer Science and Technology,2012,6(3):195-196.
[4] 曾帥,王帥,袁勇,等.面向知識(shí)自動(dòng)化的自動(dòng)問答研究進(jìn)展[J].自動(dòng)化學(xué)報(bào),2017,43(7):5?6.
[5] 王樹西.問答系統(tǒng):核心技術(shù)、發(fā)展趨勢(shì)[J].計(jì)算機(jī)工程與應(yīng)用,2005.18:2-3.
【通聯(lián)編輯:李雅琪】