彭健
人工智能在過(guò)去的60多年時(shí)間里,經(jīng)歷了起起伏伏的發(fā)展歷程,到目前為止取得了突破性進(jìn)展。本文旨在梳理人工智能發(fā)展的主要?dú)v程,分析當(dāng)前人工智能突破的主要關(guān)鍵性技術(shù)和原理,并進(jìn)一步討論相關(guān)技術(shù)在未來(lái)發(fā)展中可能面臨的挑戰(zhàn)。
人工智能的發(fā)展歷程
歷經(jīng)了60多年的發(fā)展,人工智能領(lǐng)域的研究因?yàn)椴煌睦щy經(jīng)歷了起起伏伏,呈螺旋式前進(jìn)的發(fā)展態(tài)勢(shì)。起初仿造動(dòng)物神經(jīng)元,希望打造強(qiáng)人工智能的人工神經(jīng)網(wǎng)絡(luò)(Artificial Neuron Network),先是經(jīng)歷了機(jī)器無(wú)法應(yīng)付計(jì)算復(fù)雜度的困境,更是一度因?yàn)闊o(wú)法獲得研究經(jīng)費(fèi)而停滯;同一時(shí)期另一脈絡(luò)的弱人工智能,則發(fā)展出博聞強(qiáng)記、分辨率隨數(shù)據(jù)質(zhì)與量逐步提升而快速進(jìn)展的機(jī)器學(xué)習(xí)路徑。隨著近年來(lái)技術(shù)的快速發(fā)展,人工智能已經(jīng)在多學(xué)科、多領(lǐng)域得到了廣泛應(yīng)用,并產(chǎn)生了巨大的經(jīng)濟(jì)效益和社會(huì)效益。
第一次高潮階段(起源階段)。二十世紀(jì)四十年代末,隨著科技的發(fā)展,三論(即系統(tǒng)論、控制論、信息論)的出現(xiàn)為人工智能的探索奠定了理論基礎(chǔ)。1950年,英國(guó)數(shù)學(xué)家圖靈發(fā)表題為“計(jì)算的機(jī)器與智能”的論文,提出圖靈測(cè)試、機(jī)器學(xué)習(xí)、遺傳算法和強(qiáng)化學(xué)習(xí)等概念,直接推動(dòng)人工智能早期的發(fā)展;1955年,麥卡錫在達(dá)特茅斯學(xué)院會(huì)議上首次提出“人工智能”的概念;1957年,第一款神經(jīng)網(wǎng)絡(luò)Perceptron由羅森布拉特發(fā)明,人工智能研究邁向第一個(gè)高峰。
第一次低潮階段。該階段的人工智能又被稱為經(jīng)典符號(hào)時(shí)期。1970年,受限于當(dāng)時(shí)的計(jì)算能力,機(jī)器無(wú)法完成大規(guī)模數(shù)據(jù)訓(xùn)練和復(fù)雜任務(wù),人工智能進(jìn)入第一個(gè)低潮。此后的1973年,詹姆斯·萊特希爾針對(duì)英國(guó)人工智能研究狀況的報(bào)告給出了嚴(yán)厲的批評(píng),指出“人工智能無(wú)法實(shí)現(xiàn)其‘宏偉目標(biāo)”,直接影響了人工智能領(lǐng)域的研發(fā)資金投入。
第二次高潮階段(初步產(chǎn)業(yè)化階段)。這一階段的關(guān)鍵詞是“專家系統(tǒng)”——即具有專門知識(shí)和經(jīng)驗(yàn)的計(jì)算機(jī)智能程序系統(tǒng)。專家系統(tǒng)旨在通過(guò)對(duì)人類專家解決特定領(lǐng)域某些問(wèn)題方法的建模,進(jìn)而采用人工智能技術(shù)讓計(jì)算機(jī)模擬解決上述類似問(wèn)題的能力。1980年,卡內(nèi)基·梅隆大學(xué)設(shè)計(jì)了XCON專家系統(tǒng)。1982年,霍普菲爾德神經(jīng)網(wǎng)絡(luò)被提出,該網(wǎng)絡(luò)的最大優(yōu)勢(shì)是可以解決很多模式識(shí)別問(wèn)題,此外還可以給出一類組合優(yōu)化問(wèn)題的近似解。1986年,BP算法的出現(xiàn)極大地推動(dòng)了大規(guī)模神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,將人工智能推向一個(gè)新的高度。
第二次低潮階段。人工智能再一次進(jìn)入低潮期,這一階段該領(lǐng)域技術(shù)成果較少,但以神經(jīng)網(wǎng)絡(luò)、遺傳算法為代表的技術(shù)得到關(guān)注。1987年,蘋果和IBM生產(chǎn)的臺(tái)式機(jī)性能超過(guò)Symbolics等廠商生產(chǎn)的通用型計(jì)算機(jī),專家系統(tǒng)風(fēng)光不再;1990年,人工智能計(jì)算機(jī)DARPA沒(méi)能實(shí)現(xiàn),政府投入縮減;1991年,日本人設(shè)定的“第五代工程”的失敗,人工智能研究再次遭遇經(jīng)費(fèi)危機(jī)。
第三次高潮階段(快速發(fā)展階段)。隨著大數(shù)據(jù)、云計(jì)算以及認(rèn)知技術(shù)的快速發(fā)展,深度學(xué)習(xí)技術(shù)在人工智能領(lǐng)域開(kāi)始“嶄露頭角”,尤其在語(yǔ)音識(shí)別、圖像識(shí)別等細(xì)分領(lǐng)域,人工智能技術(shù)加速成熟并成功地實(shí)現(xiàn)了產(chǎn)業(yè)化。2006年,Hinton發(fā)明了“深度學(xué)習(xí)”神經(jīng)網(wǎng)絡(luò),人工智能得到加速發(fā)展;2013年,語(yǔ)音識(shí)別和圖像識(shí)別領(lǐng)域運(yùn)用深度學(xué)習(xí)算法取得了很好的效果,識(shí)別率分別超過(guò)99%和95%;2014年,無(wú)監(jiān)督學(xué)習(xí)算法取得突破,F(xiàn)acebook使用無(wú)監(jiān)督學(xué)習(xí)將臉部識(shí)別率提升到97.25%;2016年,運(yùn)用深度學(xué)習(xí)技術(shù)的機(jī)器人AlphaGo 以4:1擊敗人類圍棋冠軍李世石,成為了人工智能發(fā)展史上一大標(biāo)志性事件。
人工智能發(fā)展的關(guān)鍵性技術(shù)
人工智能本身就是一個(gè)多學(xué)科交叉融合的產(chǎn)物,此外,其在具體應(yīng)用時(shí)還需要大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)等其他信息技術(shù)的支撐,因此人工智能體系通常會(huì)涉及眾多的學(xué)科門類和技術(shù)種類。本文主要從推動(dòng)人工智能發(fā)展的內(nèi)在技術(shù)出發(fā),以人工神經(jīng)網(wǎng)絡(luò)、機(jī)器學(xué)習(xí)和自然語(yǔ)言處理三大關(guān)鍵性技術(shù)為重點(diǎn),簡(jiǎn)要闡述其工作原理。
關(guān)鍵技術(shù)一 :人工神經(jīng)網(wǎng)絡(luò)
對(duì)于人工智能,計(jì)算機(jī)科學(xué)家可以直接模仿生物的神經(jīng)元運(yùn)作,因此設(shè)計(jì)數(shù)學(xué)模型來(lái)仿真動(dòng)物神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)與功能。所謂人工神經(jīng)網(wǎng)絡(luò)是一種仿造神經(jīng)元運(yùn)作的函數(shù)演算,接受外界信息輸入的刺激,且根據(jù)不同刺激影響的權(quán)重轉(zhuǎn)換成輸出的反應(yīng),或用來(lái)改變內(nèi)部函數(shù)的權(quán)重結(jié)構(gòu),以適應(yīng)不同環(huán)境的數(shù)學(xué)模型。
1951年,科學(xué)家馬文·明斯基第一次嘗試建造了世上第一個(gè)神經(jīng)元仿真器:Snarc(Stochastic Neural Analog Reinforcement Calculator),能夠在其40個(gè)“代理人”和一個(gè)獎(jiǎng)勵(lì)系統(tǒng)的幫助下穿越迷宮。6年后,康乃爾航空工程實(shí)驗(yàn)室的羅森布拉特設(shè)計(jì)、發(fā)表神經(jīng)網(wǎng)絡(luò)的感知器(Perceptron)實(shí)作后,人工神經(jīng)網(wǎng)絡(luò)學(xué)者曾經(jīng)一度振奮,認(rèn)為這個(gè)突破終將帶領(lǐng)人工智能邁向新的發(fā)展階段。
20世紀(jì)70年代,人工智能領(lǐng)域的研究因?yàn)槿狈Υ笠?guī)模數(shù)據(jù)、計(jì)算復(fù)雜度無(wú)法提升等問(wèn)題,導(dǎo)致科研預(yù)算無(wú)法得到充分保障而陷入了困境。直到80年代,科學(xué)家首先通過(guò)思考上的突破,設(shè)計(jì)出新的演算方法來(lái)模擬人類神經(jīng)元,迎來(lái)神經(jīng)網(wǎng)絡(luò)發(fā)展的文藝復(fù)興時(shí)期。物理學(xué)家約翰·霍普費(fèi)爾德在1982年率先發(fā)表Hopfield神經(jīng)網(wǎng)絡(luò)的相關(guān)論文,開(kāi)啟了神經(jīng)網(wǎng)絡(luò)可以遞歸設(shè)計(jì)的思考。4年后,加州大學(xué)圣地亞哥分校教授戴維·魯梅爾哈特提出了反向傳播法(Back Propagation),通過(guò)每次數(shù)據(jù)輸入(刺激)的變化,計(jì)算出需要修正的權(quán)重回饋給原有函數(shù),進(jìn)一步刷新了機(jī)器“學(xué)習(xí)”的意義??茖W(xué)家更進(jìn)一步把神經(jīng)元延伸成為神經(jīng)網(wǎng),通過(guò)多層次的神經(jīng)元締結(jié)而成的人工神經(jīng)網(wǎng)絡(luò),在函數(shù)表現(xiàn)上可以保有更多“被刺激”的“記憶”。
關(guān)鍵技術(shù)二 :機(jī)器學(xué)習(xí)
要讓機(jī)器有智慧,并不一定要真正賦予它思維能力,只要擁有大量閱讀、儲(chǔ)存資料并具有分辨的能力,就足以幫助人類工作。上世紀(jì)70年代,人工智能研究人員開(kāi)始思考是否一定要讓機(jī)器真正具有自我思維能力,才能稱之為人工智能?因此,人工智能出現(xiàn)了不同的分支:弱人工智能與強(qiáng)人工智能。弱人工智能一般希望借鑒人類的智能行為,研制出更好的工具以減輕人類智力勞動(dòng),類似于“高級(jí)仿生學(xué)”。強(qiáng)人工智能則是希望研制出達(dá)到甚至超越人類智慧水平的人造物,具有心智和意識(shí)、能根據(jù)自己的意圖開(kāi)展行動(dòng)。
機(jī)器學(xué)習(xí)可以視為弱人工智能的代表。通常需要預(yù)先設(shè)定問(wèn)題,并搜集相關(guān)數(shù)據(jù)(數(shù)據(jù)通常包含原始數(shù)據(jù)與標(biāo)準(zhǔn)答案,例如人像圖片與該圖片內(nèi)人物的相關(guān)信息),然后再將數(shù)據(jù)分為訓(xùn)練用與驗(yàn)證用兩組。以訓(xùn)練用數(shù)據(jù)進(jìn)行學(xué)習(xí),通過(guò)特定的分類算法抽取特征值,優(yōu)化設(shè)計(jì)數(shù)據(jù)的數(shù)學(xué)模型,然后再將驗(yàn)證用數(shù)據(jù)輸入該數(shù)學(xué)模型,比對(duì)計(jì)算的分類結(jié)果是否與標(biāo)準(zhǔn)答案一樣,如果該數(shù)學(xué)模型能夠達(dá)到一定比例的正確率,則認(rèn)為該機(jī)器學(xué)習(xí)模型有效。這種具有標(biāo)準(zhǔn)答案,并以計(jì)算出的預(yù)期結(jié)果進(jìn)行驗(yàn)證的機(jī)器學(xué)習(xí),通常被稱為監(jiān)督式學(xué)習(xí)。相對(duì)于監(jiān)督式學(xué)習(xí),非監(jiān)督式學(xué)習(xí)則強(qiáng)調(diào)不知道數(shù)據(jù)該如何分類的機(jī)器學(xué)習(xí),換言之,我們提供計(jì)算機(jī)大量數(shù)據(jù),但不告訴它這些數(shù)據(jù)該用什么方式進(jìn)行分類,然后計(jì)算機(jī)通過(guò)算法將數(shù)據(jù)分類,人類只針對(duì)最終數(shù)據(jù)分類進(jìn)行判別,用數(shù)據(jù)尋找規(guī)律就是機(jī)器學(xué)習(xí)的基礎(chǔ)。
機(jī)器學(xué)習(xí)的發(fā)展方向,是在設(shè)計(jì)、分析一些讓計(jì)算機(jī)可以自主“學(xué)習(xí)”的算法,讓機(jī)器得以從自動(dòng)分析數(shù)據(jù)的過(guò)程中建立規(guī)則,并利用這些規(guī)則對(duì)還沒(méi)有進(jìn)行分析的未知數(shù)據(jù)進(jìn)行預(yù)測(cè)。過(guò)程中,時(shí)常運(yùn)用統(tǒng)計(jì)學(xué)技巧,并轉(zhuǎn)化成計(jì)算機(jī)程序,進(jìn)而計(jì)算出資料里的分界條件來(lái)做預(yù)測(cè)。弱人工智能作為人工智能領(lǐng)域的一種演進(jìn)路徑,無(wú)論是監(jiān)督式學(xué)習(xí)或非監(jiān)督式學(xué)習(xí),在大數(shù)據(jù)、物聯(lián)網(wǎng)、云計(jì)算等新一代信息技術(shù)高速發(fā)達(dá)的今天,用機(jī)器學(xué)習(xí)來(lái)解決人類基礎(chǔ)的問(wèn)題變成一種趨勢(shì)。目前機(jī)器學(xué)習(xí)也是人工智能商業(yè)應(yīng)用最廣泛的一種技術(shù)。例如搜索引擎、圖像識(shí)別、生物特征識(shí)別、語(yǔ)音與手寫識(shí)別與自然語(yǔ)言處理、甚至是檢測(cè)金融詐欺等等,都是典型的應(yīng)用。
關(guān)鍵技術(shù)三:自然語(yǔ)言處理
對(duì)人類來(lái)說(shuō),如何讓這些制造出來(lái)的機(jī)器們能夠聽(tīng)懂人類語(yǔ)言,并與人類“合作”,對(duì)于今后進(jìn)一步探索未知宇宙有著重要的意義。自然語(yǔ)言處理(Natural Language Processing,NLP)的研究,是要讓機(jī)器“理解”人類的語(yǔ)言,是人工智能領(lǐng)域中的一項(xiàng)重要基礎(chǔ)技術(shù)。英國(guó)雷丁大學(xué)的演化生物學(xué)家馬克·佩葛認(rèn)為,最早的一種“社會(huì)科技”是人類的“語(yǔ)言”,語(yǔ)言的發(fā)明讓早期人類部落通過(guò)加強(qiáng)“合作”在進(jìn)化上占有優(yōu)勢(shì)。自然語(yǔ)言處理可以簡(jiǎn)單理解分為輸入和輸出兩種:一種是從人類到計(jì)算機(jī)——讓計(jì)算機(jī)把人類的語(yǔ)言轉(zhuǎn)換成程序可以處理的結(jié)構(gòu),一種是從計(jì)算機(jī)反饋到人——把計(jì)算機(jī)處理的結(jié)果轉(zhuǎn)換成人類可以理解的語(yǔ)言表達(dá)出來(lái)。
無(wú)論是從人類到計(jì)算機(jī),還是從計(jì)算機(jī)到人類,語(yǔ)言處理通常會(huì)使用到我們學(xué)習(xí)語(yǔ)言一般要具備的聽(tīng)、說(shuō)、讀、寫等技能。其中:聽(tīng)與說(shuō)主要使用到聽(tīng)覺(jué)與發(fā)音,對(duì)計(jì)算機(jī)而言就是能夠通過(guò)麥克風(fēng)“聽(tīng)”到人類說(shuō)話,把聽(tīng)到的聲音轉(zhuǎn)成文字(語(yǔ)音識(shí)別),或把計(jì)算機(jī)想要表達(dá)的意思轉(zhuǎn)成人類可以理解的語(yǔ)句(自然語(yǔ)言生成),再用發(fā)聲設(shè)備“讀”給人類聽(tīng)(這是語(yǔ)音合成)??茖W(xué)家與工程師們同樣致力于圖片文字辨識(shí),圖片來(lái)源可以是掃描的圖像文件,也可以是手機(jī)拍攝的照片,目標(biāo)的文字體則可以是一般印刷品或打印的文件,也可以是手寫文字。人類互動(dòng)最重要的途徑就是語(yǔ)言,無(wú)論是文字或語(yǔ)音,語(yǔ)音智能助理讓人能和機(jī)器之間對(duì)話,無(wú)疑是智能終端普及后最令人興奮的突破創(chuàng)新之一。
人工智能關(guān)鍵性技術(shù)發(fā)展面臨的挑戰(zhàn)
自然語(yǔ)言處理
一是不確定性。目前在詞法、句法、語(yǔ)義、語(yǔ)用以及語(yǔ)音等多個(gè)維度都存在不確定性問(wèn)題,導(dǎo)致最終結(jié)果有偏差;二是不可預(yù)測(cè)性。在數(shù)據(jù)大爆炸的今天,新的詞匯、術(shù)語(yǔ)、語(yǔ)義和語(yǔ)法層出不窮導(dǎo)致了不可預(yù)測(cè)性;三是數(shù)據(jù)不充分的長(zhǎng)尾現(xiàn)象。數(shù)據(jù)資源覆蓋語(yǔ)言現(xiàn)象存在盲區(qū),導(dǎo)致了長(zhǎng)尾現(xiàn)象的出現(xiàn);四是語(yǔ)義的非線性特質(zhì)。語(yǔ)義本身就存在很強(qiáng)的模糊性,并且在不同的語(yǔ)境下還附帶錯(cuò)綜復(fù)雜的關(guān)聯(lián)性,這些非線性特質(zhì)使得簡(jiǎn)單的數(shù)學(xué)模型難以奏效,增加了龐大的非線性計(jì)算量。
深度學(xué)習(xí)
一是對(duì)數(shù)據(jù)依賴性依然很強(qiáng)。深度學(xué)習(xí)不具備通過(guò)語(yǔ)言描述的清晰定義來(lái)學(xué)習(xí)抽象概念的能力,需要成千上萬(wàn)乃至上億的學(xué)習(xí)樣本,才能達(dá)到較好的效果;二是無(wú)法自然處理層級(jí)結(jié)構(gòu)。當(dāng)前大多數(shù)基于深度學(xué)習(xí)的語(yǔ)言模型都將句子視為詞語(yǔ)的序列,當(dāng)遇到陌生的句式時(shí),循環(huán)神經(jīng)網(wǎng)絡(luò)無(wú)法系統(tǒng)地展示、擴(kuò)展句子的遞歸結(jié)構(gòu);三是開(kāi)放式推理能力欠缺。目前還沒(méi)有深度學(xué)習(xí)系統(tǒng)能基于已有知識(shí)像人類那樣準(zhǔn)確地進(jìn)行推理;四是與先驗(yàn)知識(shí)結(jié)合度不夠。從深度學(xué)習(xí)的原理看,先驗(yàn)知識(shí)很難整合到深度學(xué)習(xí)系統(tǒng)中;五是難以穩(wěn)健地實(shí)現(xiàn)工程化。機(jī)器學(xué)習(xí)與經(jīng)典的編程相比,仍然缺乏漸進(jìn)性、透明性和可調(diào)式性,這讓它在實(shí)現(xiàn)穩(wěn)健性方面面臨巨大挑戰(zhàn)。
計(jì)算機(jī)視覺(jué)
一是在具體的應(yīng)用場(chǎng)景中,計(jì)算機(jī)視覺(jué)與其他信息技術(shù)的融合度仍有提升空間。雖然基于大數(shù)據(jù)技術(shù)的計(jì)算機(jī)視覺(jué)在解決一般性問(wèn)題時(shí)已經(jīng)取得了很好的實(shí)踐效果,但在某些問(wèn)題上的精準(zhǔn)度還不是很理想,需要與其他信息技術(shù)深度融合;二是開(kāi)發(fā)計(jì)算機(jī)視覺(jué)算法的時(shí)間成本和人力成本居高不下。海量數(shù)據(jù)樣本是目前計(jì)算機(jī)視覺(jué)算法實(shí)際應(yīng)用中的基礎(chǔ),并且其中大量的數(shù)據(jù)還需要人工標(biāo)注,這導(dǎo)致在復(fù)雜的應(yīng)用場(chǎng)景下需要增加研發(fā)周期并提高人力成本預(yù)算,才能達(dá)到最終要求的精準(zhǔn)度;三是新型算法的設(shè)計(jì)開(kāi)發(fā)速度有待進(jìn)一步提速。當(dāng)前計(jì)算機(jī)視覺(jué)的硬件環(huán)境不斷完善,例如人工智能芯片、新型攝像頭等不斷推陳出新,需要針對(duì)不同的硬件設(shè)備設(shè)計(jì)和開(kāi)發(fā)與之相適應(yīng)的計(jì)算機(jī)視覺(jué)算法。
另外,當(dāng)前深度學(xué)習(xí)的算法出現(xiàn)了一定的瓶頸,還需要進(jìn)一步的突破。人工智能在技術(shù)上還被認(rèn)為是一個(gè)黑盒子,技術(shù)人員對(duì)其中算法的具體過(guò)程還不夠了解,在這方面也需要進(jìn)行相關(guān)的研究。要繼續(xù)加強(qiáng)人工智能與其他學(xué)科的融合,實(shí)現(xiàn)下一輪發(fā)展。要積極加強(qiáng)大腦科學(xué)和心理學(xué)的研究,醞釀下一步的突破。