徐貴寶 中國(guó)信息通信研究院技術(shù)與標(biāo)準(zhǔn)研究所高級(jí)工程師
網(wǎng)絡(luò)技術(shù)——互聯(lián)網(wǎng)新技術(shù)、新應(yīng)用專(zhuān)題
人工智能技術(shù)體系架構(gòu)探討
徐貴寶 中國(guó)信息通信研究院技術(shù)與標(biāo)準(zhǔn)研究所高級(jí)工程師
通過(guò)人工智能的定義及其與人類(lèi)智能的關(guān)系,討論了人工智能的內(nèi)涵。在此基礎(chǔ)上,提出了一個(gè)包含核心層與關(guān)鍵技術(shù)層兩層的人工智能體系架構(gòu),并對(duì)體系架構(gòu)中的算法理論、感知環(huán)節(jié)、思考環(huán)節(jié)、行動(dòng)環(huán)節(jié)等進(jìn)行了描述。
人工智能;技術(shù)體系架構(gòu);核心層;關(guān)鍵技術(shù)
人工智能概念是在1956年達(dá)特茅斯會(huì)議上首次正式提出的,但當(dāng)時(shí)并沒(méi)有給出具體的定義。此后的60年時(shí)間里,出現(xiàn)過(guò)各種各樣的概念,但這些概念并沒(méi)有獲得業(yè)界的普遍認(rèn)可。在此期間,人工智能經(jīng)過(guò)不斷的發(fā)展,從計(jì)算智能時(shí)代發(fā)展到感知智能時(shí)代,現(xiàn)在發(fā)展到認(rèn)知智能時(shí)代;主流學(xué)派從符號(hào)學(xué)派到控制學(xué)派,然后又到連接學(xué)派;主流技術(shù)方案從機(jī)器定理證明到專(zhuān)家系統(tǒng),再到神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)。但是,不管是哪個(gè)時(shí)代、哪個(gè)流派,都沒(méi)有提出過(guò)人工智能的技術(shù)體系架構(gòu),這不僅造成了人工智能領(lǐng)域散亂發(fā)展的形象,也造成了各領(lǐng)域?qū)θ斯ぶ悄軣o(wú)法形成清晰的認(rèn)識(shí),雖然目前人工智能正在進(jìn)入新一波發(fā)展浪潮,但仍然存在無(wú)法快速進(jìn)行產(chǎn)業(yè)轉(zhuǎn)化的發(fā)展困境。因此,非常有必要梳理出來(lái)一個(gè)人工智能的技術(shù)體系架構(gòu),從而使得業(yè)界能夠?qū)θ斯ぶ悄苡幸粋€(gè)總體的認(rèn)識(shí),進(jìn)一步推動(dòng)人工智能的技術(shù)應(yīng)用和產(chǎn)業(yè)發(fā)展。
2.1 人工智能的定義
為了便于分析和理解人工智能的技術(shù)體系架構(gòu),先來(lái)看一下人工智能的概念。
麥卡錫在1956年的達(dá)特茅斯會(huì)議上提出人工智能概念時(shí),曾經(jīng)表示:“人工智能就是要讓機(jī)器的行為看起來(lái)就像是人所表現(xiàn)出的智能行為一樣”,這可以說(shuō)是人工智能概念的最初解釋。
美國(guó)全國(guó)科學(xué)院院士、動(dòng)態(tài)規(guī)劃的創(chuàng)始人貝爾曼1978年提出,人工智能是那些與人的思維、決策、問(wèn)題求解和學(xué)習(xí)等有關(guān)活動(dòng)的自動(dòng)化。
斯坦福研究所人工智能中心主任N.J尼爾遜1998提出,人工智能是關(guān)于知識(shí)的學(xué)科——怎樣表示知識(shí)以及怎樣獲得知識(shí)并使用知識(shí)的科學(xué)。
谷歌未來(lái)科學(xué)家雷·庫(kù)茲韋爾認(rèn)為,人工智能是一種創(chuàng)建機(jī)器的技藝,使機(jī)器能夠執(zhí)行需要人的智能才能完成的功能。
百度百科中關(guān)于人工智能的定義是:“人工智能是研究、開(kāi)發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門(mén)新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類(lèi)智能相似的方式做出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究包括機(jī)器人、語(yǔ)言識(shí)別、圖像識(shí)別、自然語(yǔ)言處理和專(zhuān)家系統(tǒng)等?!?/p>
從定義中可以分析出,人工智能的主體是“機(jī)器(或者計(jì)算機(jī))”,客體是“人類(lèi)的智力與行為能力(具體來(lái)說(shuō)就是人類(lèi)的感知、思考、行動(dòng)等能力)”,途徑是“模擬、延伸和擴(kuò)展”,目的是“使機(jī)器(或計(jì)算機(jī))能夠執(zhí)行需要人的智能才能完成的任務(wù)”。因此,不妨對(duì)人工智能提出如下定義:“人工智能是用機(jī)器模仿和實(shí)現(xiàn)人類(lèi)的感知、思考、行動(dòng)等人類(lèi)智力與行為能力的科學(xué)與技術(shù),目標(biāo)在于模擬、延伸、拓展人的智慧與能力,使信息系統(tǒng)或機(jī)器勝任一些以往需要人類(lèi)智能才能完成的復(fù)雜任務(wù)”。
2.2 人工智能與人類(lèi)智能的關(guān)系
人類(lèi)智能可以完成的復(fù)雜任務(wù)主要包括感知、思考、行動(dòng)3個(gè)環(huán)節(jié),人工智能實(shí)際上是機(jī)器(或計(jì)算機(jī))對(duì)上述環(huán)節(jié)的模擬、延伸和拓展,也就是機(jī)器智能。不妨以功能比較全面的機(jī)器人作為人工智能的典型示例,將其與人類(lèi)來(lái)做一個(gè)對(duì)應(yīng),從而對(duì)人工智能的內(nèi)涵加以明確。
人類(lèi)智能的感知環(huán)節(jié)包括視覺(jué)感知、聽(tīng)覺(jué)感知、嗅覺(jué)感知、味覺(jué)感知、觸覺(jué)感知等,對(duì)應(yīng)的人工智能就是機(jī)器視覺(jué)感知、機(jī)器聽(tīng)覺(jué)感知、機(jī)器嗅覺(jué)感知、機(jī)器味覺(jué)感知、機(jī)器觸覺(jué)感知等。
人類(lèi)智能的思考環(huán)節(jié)包括學(xué)習(xí)、思維、理解等,對(duì)應(yīng)的人工智能就是機(jī)器思維、機(jī)器理解、機(jī)器學(xué)習(xí)等。
人類(lèi)智能的行動(dòng)環(huán)節(jié)包括語(yǔ)言、表情、動(dòng)作等,對(duì)應(yīng)的人工智能就是聲音合成、情感計(jì)算與智能控制。
因此,如果將人類(lèi)智能看作是以人腦為基礎(chǔ)的神經(jīng)計(jì)算與控制,人工智能實(shí)際上就是以機(jī)器存儲(chǔ)為基礎(chǔ)的機(jī)器計(jì)算與控制。人工智能與人類(lèi)智能的關(guān)系參見(jiàn)圖1。
3.1 基本架構(gòu)
按照人工智能的定義及其與人類(lèi)智能之間的關(guān)系,人工智能就是要模擬與實(shí)現(xiàn)人類(lèi)智能,這就涉及到機(jī)器在感知、思考、行動(dòng)這幾個(gè)主要環(huán)節(jié)的能力實(shí)現(xiàn)方面所涉及到的關(guān)鍵技術(shù)。
在感知環(huán)節(jié),所涉及的關(guān)鍵技術(shù)包括機(jī)器聽(tīng)覺(jué)、機(jī)器視覺(jué)、機(jī)器嗅覺(jué)、機(jī)器味覺(jué)、機(jī)器觸覺(jué)等。
在思考環(huán)節(jié),所涉及的關(guān)鍵技術(shù)包括機(jī)器學(xué)習(xí)、機(jī)器理解、機(jī)器思維等。
在行動(dòng)環(huán)節(jié),所涉及的關(guān)鍵技術(shù)包括聲音合成、情感計(jì)算、智能控制等。
對(duì)于人類(lèi)智能——也就是基于人腦的神經(jīng)計(jì)算和控制來(lái)說(shuō),其能力和智力的提升主要是依賴(lài)學(xué)習(xí)和理解,而學(xué)習(xí)與理解的核心是算法。對(duì)于人工智能——也就是基于機(jī)器存儲(chǔ)為基礎(chǔ)的機(jī)器計(jì)算與控制來(lái)說(shuō),其能力與智力的提升也主要是依賴(lài)機(jī)器學(xué)習(xí)和機(jī)器理解,因而其核心也是機(jī)器算法和理論。
根據(jù)上述人工智能的內(nèi)涵及上述論述,可以考慮列出一個(gè)人工智能技術(shù)體系架構(gòu),具體參見(jiàn)圖2。該架構(gòu)包括兩個(gè)層面,其中感知、思考、行動(dòng)等環(huán)節(jié)的模擬和實(shí)現(xiàn)技術(shù)屬于關(guān)鍵技術(shù)層,算法理論屬于核心技術(shù)層。
圖1 人工智能與人類(lèi)智能的關(guān)系
3.2 算法理論
之所以將算法理論列為人工智能技術(shù)體系架構(gòu)的核心層,主要是人工智能首要考慮的問(wèn)題就是算法。算法理論主要涉及最早出現(xiàn)的機(jī)器定理證明和后來(lái)出現(xiàn)的專(zhuān)家系統(tǒng)、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí),以及剛剛開(kāi)始發(fā)展的類(lèi)腦智能等,算法理論模塊參見(jiàn)圖3。
人工智能中最先應(yīng)用的算法是機(jī)器定理證明以及其他類(lèi)似問(wèn)題的求解,這是由于在人工智能發(fā)展初期,符號(hào)主義學(xué)派認(rèn)為人的智能主要體現(xiàn)在具有推理和思考能力,因此也就自然而然地將機(jī)器定理證明作為了人工智能研究的第一個(gè)切入點(diǎn),并將相關(guān)成果應(yīng)用于問(wèn)題求解、自然語(yǔ)言理解、程序驗(yàn)證和自動(dòng)程序設(shè)計(jì)等方面。至于回歸算法、基于實(shí)例的算法、貝葉斯方法、正則化方法、聚類(lèi)算法、基于核的算法、降低緯度算法以及專(zhuān)家系統(tǒng)等,都是不具備學(xué)習(xí)能力的算法。集成算法是將多種算法結(jié)合起來(lái),綜合運(yùn)用于人工智能之中。
決策樹(shù)學(xué)習(xí)、關(guān)聯(lián)規(guī)則學(xué)習(xí)等屬于具備學(xué)習(xí)能力的算法,但效率上相對(duì)較低。人工神經(jīng)網(wǎng)絡(luò)是借鑒了人類(lèi)神經(jīng)計(jì)算的原理而形成的算法,其效率得到了大幅度提高。深度學(xué)習(xí)是在人工智能神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,通過(guò)構(gòu)建多隱層神經(jīng)網(wǎng)絡(luò)模型和海量訓(xùn)練數(shù)據(jù),來(lái)學(xué)習(xí)更有用的特征,最終提升分析準(zhǔn)確性,具備了自動(dòng)學(xué)習(xí)數(shù)據(jù)特征的能力,尤其適用于包含少量未標(biāo)識(shí)數(shù)據(jù)的大數(shù)據(jù)集。由于深度學(xué)習(xí)采用層次網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行逐層特征變換,將樣本的特征表示變換到一個(gè)新的特征空間,從而使分類(lèi)或預(yù)測(cè)更加容易,也使其成為了推動(dòng)本次人工智能浪潮的熱點(diǎn)。
圖3 算法理論模塊
圖2 人工智能技術(shù)體系架構(gòu)
由于神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)都只是剛剛采用了一點(diǎn)點(diǎn)的腦科學(xué)與神經(jīng)科學(xué)中的研究成果,就使得人工智能發(fā)展獲得了如此顯著的進(jìn)步,因此人們相信,大腦中還有非常非常多的計(jì)算與控制機(jī)制可供人工智能借鑒,這也是業(yè)界普遍關(guān)注類(lèi)腦智能的最主要原因。目前的類(lèi)腦智能研究,主要是借鑒大腦中“內(nèi)存與計(jì)算單元合一”等信息處理基本規(guī)律,在硬件實(shí)現(xiàn)與軟件算法等多個(gè)層面,對(duì)于現(xiàn)有的計(jì)算體系與系統(tǒng)做出本質(zhì)的變革,從而實(shí)現(xiàn)在計(jì)算能耗、計(jì)算能力與計(jì)算效率等諸多方面的大幅改進(jìn)。就網(wǎng)絡(luò)連接模式比較而言,深度學(xué)習(xí)是從宏觀角度利用了腦區(qū)間的鏈路及其協(xié)同特性,而類(lèi)腦智能則是從微觀角度利用神經(jīng)元、突觸的工作機(jī)制及其特性,深度學(xué)習(xí)與類(lèi)腦智能的比較參見(jiàn)圖4。
圖4 深度學(xué)習(xí)與類(lèi)腦智能的比較
3.3 感知環(huán)節(jié)
感知環(huán)節(jié)包括及其感知所涉及的關(guān)鍵技術(shù),主要實(shí)現(xiàn)對(duì)人的感知能力的模擬和拓展,包括對(duì)人的聽(tīng)覺(jué)、視覺(jué)、觸覺(jué)、嗅覺(jué)、味覺(jué)等,實(shí)現(xiàn)數(shù)據(jù)的采集和初步處理(見(jiàn)圖5)。由于技術(shù)發(fā)展的階段性問(wèn)題,人工智能在很多方面并沒(méi)有完成人類(lèi)感知的所有功能;另一方面,由于人類(lèi)通過(guò)技術(shù)實(shí)現(xiàn)可以讓機(jī)器設(shè)備探測(cè)到一些人類(lèi)所不能感知到的現(xiàn)象,因此目前機(jī)器感知能力已經(jīng)有很多方面甚至超越了人類(lèi),今后還會(huì)有越來(lái)越多人工智能發(fā)展出比人類(lèi)更強(qiáng)的機(jī)器感知能力。
機(jī)器聽(tīng)覺(jué)技術(shù)主要實(shí)現(xiàn)聲音識(shí)別,現(xiàn)階段主要是人類(lèi)語(yǔ)音識(shí)別,而且語(yǔ)音識(shí)別已經(jīng)成為車(chē)載語(yǔ)音、智能家居、人機(jī)交互、機(jī)器同聲傳譯等應(yīng)用的基礎(chǔ)。
機(jī)器視覺(jué)技術(shù)主要實(shí)現(xiàn)圖像識(shí)別和視頻識(shí)別等,是在自動(dòng)駕駛、物體檢測(cè)等領(lǐng)域發(fā)展的基礎(chǔ)。在圖像識(shí)別領(lǐng)域,指紋識(shí)別已經(jīng)是一種非常成熟的技術(shù),目前的重點(diǎn)是人臉識(shí)別和虹膜識(shí)別。在視頻識(shí)別領(lǐng)域,主要關(guān)注的是動(dòng)態(tài)圖像,目前的重點(diǎn)為體感識(shí)別。
機(jī)器觸覺(jué)技術(shù)是一種復(fù)合傳感技術(shù),是機(jī)器通過(guò)自身表面的溫度覺(jué)、力覺(jué)等傳感器提供的復(fù)合信息,來(lái)識(shí)別物體的冷熱、尺寸、柔軟度、表面形狀、表面紋理等特征。相關(guān)技術(shù)包括壓電式觸覺(jué)傳感技術(shù)、壓阻式陣列觸覺(jué)傳感技術(shù)、成像型觸覺(jué)傳感技術(shù)、超大規(guī)模集成計(jì)算傳感陣列技術(shù)等。目前,溫度感知和壓力感知技術(shù)已經(jīng)基本成熟,并獲得了廣泛應(yīng)用;材質(zhì)感知等技術(shù)尚處于研究過(guò)程中。
圖5 感知環(huán)節(jié)關(guān)鍵技術(shù)
嗅覺(jué)感知和味覺(jué)感知技術(shù)主要是分子層面的感知識(shí)別,將會(huì)在危險(xiǎn)物檢測(cè)、礦床探測(cè)、食品衛(wèi)生服務(wù)等領(lǐng)域大顯身手。但目前嗅覺(jué)感知技術(shù)剛剛開(kāi)始發(fā)展,而味覺(jué)感知技術(shù)還未開(kāi)始研究。
3.4 思考環(huán)節(jié)
思考環(huán)節(jié)主要是對(duì)利用算法理論的實(shí)現(xiàn)人工智能對(duì)知識(shí)的學(xué)習(xí)、對(duì)問(wèn)題的思考和對(duì)現(xiàn)象的理解等。因此,該環(huán)節(jié)主要包括機(jī)器學(xué)習(xí)、機(jī)器思維、機(jī)器理解等部分(見(jiàn)圖6)。
機(jī)器學(xué)習(xí)部分主要是將所獲得的數(shù)據(jù)信息利用貝葉斯方法、關(guān)聯(lián)規(guī)則學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)、類(lèi)腦智能等高級(jí)算法理論來(lái)進(jìn)行處理,挖掘出有價(jià)值規(guī)律性的知識(shí),提升人工智能的思維和理解能力。
機(jī)器理解部分主要是利用一些高級(jí)算法來(lái)理解所獲得的數(shù)據(jù)含義,主要包括聲音理解、自然語(yǔ)言理解、圖形圖像理解、運(yùn)動(dòng)影像理解、行為動(dòng)作理解等。目前,RNN(回歸神經(jīng)網(wǎng)絡(luò))、DNN(深度神經(jīng)網(wǎng)絡(luò))、LSTM(長(zhǎng)短記憶神經(jīng)網(wǎng)絡(luò))已成為常用的語(yǔ)音識(shí)別算法。而在諸多機(jī)器視覺(jué)技術(shù)中,卷積神經(jīng)網(wǎng)絡(luò)(CNN)被人們普遍認(rèn)為是一種更容易被訓(xùn)練并且具有更好泛化能力的前饋網(wǎng)絡(luò),已經(jīng)廣泛運(yùn)用于自然圖像、指紋、人臉以及物體的檢測(cè)之中。
圖6 思考環(huán)節(jié)關(guān)鍵技術(shù)
機(jī)器思維部分主要是在已經(jīng)獲得的知識(shí)的基礎(chǔ)上,利用回歸算法、基于實(shí)例的算法、貝葉斯方法、正則化方法、聚類(lèi)算法、基于核的算法、降低緯度算法、專(zhuān)家系統(tǒng)以及決策樹(shù)學(xué)習(xí)等算法進(jìn)行推理,從而得出問(wèn)題求解、智能搜索、自動(dòng)規(guī)劃、輔助決策、程序驗(yàn)證和自動(dòng)程序設(shè)計(jì)等需要解決的問(wèn)題的答案。
3.5 行動(dòng)環(huán)節(jié)
行動(dòng)環(huán)節(jié)主要是實(shí)現(xiàn)思考環(huán)節(jié)的結(jié)果輸出、執(zhí)行與控制,包括決策執(zhí)行、聲音合成(尤其是自然語(yǔ)音合成)、智能控制、情感表達(dá)等(見(jiàn)圖7)。
圖7 行動(dòng)環(huán)節(jié)關(guān)鍵技術(shù)
決策執(zhí)行概念比較寬泛,依據(jù)各自不同的需求執(zhí)行具體的動(dòng)作。
聲音合成技術(shù)目前已經(jīng)基本成熟,通過(guò)數(shù)字化頻率控制,可以將聲音惟妙惟肖地模仿出來(lái)。尤其是自然語(yǔ)音合成(TTS)技術(shù)能將任意文字信息實(shí)時(shí)轉(zhuǎn)化為標(biāo)準(zhǔn)流暢的語(yǔ)音朗讀出來(lái),其技術(shù)原理如圖8所示。自然語(yǔ)音合成技術(shù)在與聲紋技術(shù)的結(jié)合后,還可以逼真地模仿出各個(gè)人物的聲音。
智能控制包括平衡控制、動(dòng)作控制等。智能控制(尤其是工業(yè)智能控制)在與通信系統(tǒng)的結(jié)合后,甚至已經(jīng)能夠?qū)崿F(xiàn)遠(yuǎn)程智能控制與服務(wù)。目前,智能控制技術(shù)已經(jīng)在生產(chǎn)制造領(lǐng)域已經(jīng)獲得了較大范圍的應(yīng)用,智能設(shè)備以及各類(lèi)生產(chǎn)型機(jī)器人開(kāi)始在工廠車(chē)間出現(xiàn),甚至出現(xiàn)了無(wú)人車(chē)間、智能空調(diào)、掃地機(jī)器人以及其他一些社會(huì)服務(wù)性機(jī)器人也已經(jīng)陸續(xù)產(chǎn)品化。
情感表達(dá)主要是讓機(jī)器人能夠表達(dá)人類(lèi)的喜、怒、哀、樂(lè)、悲、憂(yōu)等情感,主要用于類(lèi)人服務(wù)機(jī)器人,也是目前人工智能領(lǐng)域的研究熱點(diǎn)之一。但由于人類(lèi)情感表達(dá)方式比較復(fù)雜,情感識(shí)別比較困難,情感計(jì)算技術(shù)還未獲得本質(zhì)的突破,情感表達(dá)技術(shù)還與材料等有很直接的關(guān)系,因此情感表達(dá)技術(shù)雖然已經(jīng)開(kāi)始研究,但還尚未取得顯著的進(jìn)展。
圖8 自然語(yǔ)音合成技術(shù)原理
通過(guò)建立人工智能技術(shù)體系架構(gòu),可以理清人工智能技術(shù)發(fā)展的瓶頸,明確人工智能技術(shù)發(fā)展路線(xiàn),促進(jìn)人工智能的應(yīng)用,使人工智能研究和應(yīng)用領(lǐng)域形成共識(shí),從而推動(dòng)人工智能的持續(xù)發(fā)展。
[1]KurzweilRay.奇點(diǎn)臨近[M].李慶誠(chéng),董振華,田源譯.北京:機(jī)械工業(yè)出版社,2011,10,1.
[2]徐貴寶.語(yǔ)音控制互聯(lián)網(wǎng)交互及其關(guān)鍵技術(shù)研究[J].電信網(wǎng)技術(shù),2013,01∶31-35.
Atechnological architecture of artificial intelligence
XUGuibao
The connotation of artificial intelligence is clarified firstly by discussing of the definition of artificial intelligenceand its relationship with the human intelligence. Then with this base, a two- layer technological architecture of ArtificialIntelligence is brought with the core layer and the key technology layer. Final, blocks of algorithm and theory, perception,thinking, action are described in detail.
artificial intelligence;technological architecture;core layer;key technology(
2016-11-20)