今天所說(shuō)的人工智能,它是指在機(jī)器上實(shí)現(xiàn)的人類(lèi)智能。包括認(rèn)知智能、感知智能、決策智能等。我們通常所說(shuō)的人工智能,實(shí)際上是廣義的人工智能?,F(xiàn)在技術(shù)實(shí)現(xiàn)的智能,其實(shí)分成兩類(lèi):一類(lèi)叫做強(qiáng)人工智能也叫廣義人工智能,幾乎所有人類(lèi)擁有智能的行為機(jī)器都能做,這叫通用人工智能;另外一類(lèi)人工智能叫狹義人工智能或?qū)S萌斯ぶ悄?,它是指特定的智能。比如人臉識(shí)別系統(tǒng),它只能做人臉識(shí)別,它是特定人工智能系統(tǒng)或狹義人工智能系統(tǒng)。狹義的人工智能和廣義人工智能并不等同,并不是用幾個(gè)狹義人工智能堆起來(lái)就是廣義的人工智能,沒(méi)有這么簡(jiǎn)單。了解了這個(gè)概念,我們可以講人工智能的“3144”了。
人工智能三個(gè)階段
人工智能的3144,第一個(gè)“3”,是指人工智能到現(xiàn)在為止經(jīng)歷了三個(gè)歷史階段。第一個(gè)階段,叫做基于符號(hào)邏輯的推理證明階段,第二個(gè)階段,叫做基于人工規(guī)則的專(zhuān)家系統(tǒng)階段。第三個(gè)階段,是從2006年到今天,叫做大數(shù)據(jù)驅(qū)動(dòng)的深度神經(jīng)網(wǎng)絡(luò)階段。第一階段從1956年開(kāi)始,當(dāng)時(shí)大家認(rèn)為,所謂人工智能是在機(jī)器上實(shí)現(xiàn)人的智能,人和動(dòng)物最大的差別是邏輯推理,如果能進(jìn)行邏輯推理就有智能。所以用計(jì)算機(jī)實(shí)現(xiàn)邏輯推理是當(dāng)時(shí)最核心的動(dòng)機(jī)。為了實(shí)現(xiàn)邏輯推理,當(dāng)時(shí)采用布爾代數(shù)、演繹推理、三段論,后來(lái)又專(zhuān)門(mén)設(shè)計(jì)。
第一階段數(shù)學(xué)的幾何定理證明。1956年,卡內(nèi)基梅隆大學(xué)就羅素所著《數(shù)學(xué)原理》的定理做了證明。到1959年,洛克菲勒的數(shù)學(xué)家王浩把所有350條都證明了,這是比較頂級(jí)的工作。由于開(kāi)始時(shí)很順暢,大家很樂(lè)觀,1958年有兩位非常著名的人工智能專(zhuān)家,提出非常著名的四個(gè)寓言:十年內(nèi),計(jì)算機(jī)將戰(zhàn)勝?lài)?guó)際象棋冠軍;十年內(nèi),計(jì)算機(jī)將證明數(shù)學(xué)定理;十年內(nèi),計(jì)算機(jī)能譜曲;十年內(nèi),計(jì)算機(jī)將能實(shí)現(xiàn)心理學(xué)理論。只做了數(shù)理證明其他遙遙無(wú)期,再加上一個(gè)英國(guó)學(xué)者在1973年寫(xiě)了一篇文章,對(duì)人工智能狠狠地潑冷水,人工智能第一次跌入低谷。
1976年以后人工智能慢慢回暖,有兩個(gè)原因:一是研究人工智能的人反思了一下,人工智能總做陽(yáng)春白雪、數(shù)學(xué)定理證明不行,必須接地氣,要做專(zhuān)家系統(tǒng),讓老百姓真正接觸到。當(dāng)時(shí)有人做心理咨詢(xún)專(zhuān)家系統(tǒng)、故障診斷專(zhuān)家系統(tǒng)、治病專(zhuān)家系統(tǒng)、醫(yī)生專(zhuān)家系統(tǒng),各種專(zhuān)家系統(tǒng)。國(guó)內(nèi)在20世紀(jì)80年代開(kāi)始有各種各樣的系統(tǒng),比如農(nóng)業(yè)專(zhuān)家系統(tǒng),是那個(gè)階段主要的方向。在那個(gè)時(shí)期,專(zhuān)家系統(tǒng)主要用兩種工具,一個(gè)工具是用邏輯推理的,基本是基于規(guī)則的。另外一個(gè)技術(shù)基礎(chǔ)是神經(jīng)網(wǎng)絡(luò)。
又發(fā)展了十多年,遇到瓶頸,總有壓倒駱駝的最后一根稻草。第一根稻草是日本研究第五代機(jī)器化,不成功,草草收?qǐng)?第二根稻草是美國(guó)以斯坦福大學(xué)的專(zhuān)家為主做知識(shí)圖譜,把百科全書(shū)所有知識(shí)輸入到計(jì)算機(jī),有什么問(wèn)題,百科全書(shū)都可以回答。這個(gè)系統(tǒng)做了十多年,互聯(lián)網(wǎng)興起后,很快被互聯(lián)網(wǎng)超越。所以這個(gè)項(xiàng)目也失敗了。這兩個(gè)項(xiàng)目的失敗,導(dǎo)致大家又對(duì)人工智能失去信心。
第三次是算力加上大數(shù)據(jù)共同發(fā)力導(dǎo)致的人工智能的浪潮。這次完全是從數(shù)據(jù)驅(qū)動(dòng)的,這也是這次和前兩次的區(qū)別。
這次人工智能浪潮的里程碑是2006年有一名加拿大學(xué)者叫Geoffrey在科學(xué)雜志上發(fā)表了一篇論文,提到深度神經(jīng)網(wǎng)絡(luò)可以進(jìn)行大規(guī)模的學(xué)習(xí),可以訓(xùn)練、進(jìn)行推理。2012年Geoffrey的學(xué)生用他的思路做了神經(jīng)網(wǎng)絡(luò)并參加比賽,一鳴驚人,把第二名遠(yuǎn)遠(yuǎn)甩在后面。
華人的貢獻(xiàn)在2015年,當(dāng)時(shí)在微軟亞洲研究院工作的孫劍博士,領(lǐng)著他的團(tuán)隊(duì)提出“殘差網(wǎng)絡(luò)”。殘差網(wǎng)絡(luò)提出后,在比賽里取得第一的好成績(jī)。孫劍錯(cuò)誤率降到了3.57%,遠(yuǎn)高于排在第二名的谷歌團(tuán)隊(duì)的6.7%。當(dāng)時(shí)孫劍的成績(jī)已經(jīng)超過(guò)人的圖像分類(lèi)的能力,當(dāng)然他使用的網(wǎng)絡(luò)也不一樣,別人用的網(wǎng)絡(luò)是22層、19層的,他是用152層的網(wǎng)絡(luò)。這個(gè)網(wǎng)絡(luò)現(xiàn)在非常有名,大家知道,AlphaGo后面是AlphaZero,AlphaZero用孫劍的網(wǎng)絡(luò),這個(gè)網(wǎng)絡(luò)就是非常有名的深度學(xué)習(xí)的工具。
AlphaGo,2014年4:1戰(zhàn)勝韓國(guó)的當(dāng)時(shí)世界圍棋冠軍李世石?;厝ヒ院髨F(tuán)隊(duì)進(jìn)行了分析,原來(lái)李世石走了一步棋譜里沒(méi)有的棋,機(jī)器不知道怎么下,隨機(jī)走了一步就輸了比賽。當(dāng)時(shí)人類(lèi)能夠有記錄的棋譜共3000副,所有可能的棋譜是1.5億副,當(dāng)時(shí)用來(lái)訓(xùn)練AlphaGo的數(shù)據(jù),占所有可能數(shù)據(jù)的20%多,還有70%多的數(shù)據(jù)是沒(méi)有的,因?yàn)闆](méi)有數(shù)據(jù),當(dāng)遇到你沒(méi)有的數(shù)據(jù)時(shí)可能會(huì)輸。最后AlphaGo重新設(shè)計(jì)了系統(tǒng),設(shè)計(jì)了AlphaZero,并讓其自己互相下,走棋譜里沒(méi)有的棋,把所有可能的棋都下了一遍,用1.5億個(gè)棋譜訓(xùn)練了AlphaZreo,所以AlphaZreo是無(wú)敵的。
人工智能的一個(gè)判斷
做智慧廣電,要用深度網(wǎng)絡(luò)學(xué)習(xí),深度網(wǎng)絡(luò)學(xué)習(xí)要有最全的數(shù)據(jù)、好的算法、足夠的算力,三個(gè)加在一起會(huì)做出出色的智慧廣電。數(shù)據(jù)、算力、算法是這一輪人工智能最基本的三個(gè)要素。這輪人工智能發(fā)展還有一個(gè)特點(diǎn),所有頂級(jí)的人工智能科學(xué)家都是和企業(yè)一起研究。因?yàn)槠髽I(yè)的數(shù)據(jù)是最完整的,要想做一個(gè)好的智慧系統(tǒng),沒(méi)有大數(shù)據(jù)是不能實(shí)現(xiàn)的。
人工智能3144,“1”一個(gè)判斷?,F(xiàn)在就弱人工智能或?qū)m?xiàng)人工智能來(lái)說(shuō),只要數(shù)據(jù)夠全,就可以做得不錯(cuò)。為什么會(huì)有那么成熟的人臉識(shí)別系統(tǒng)、語(yǔ)音識(shí)別系統(tǒng)、機(jī)器翻譯系統(tǒng)?因?yàn)閿?shù)據(jù)用訓(xùn)練可以做得好。弱人工智能大規(guī)模應(yīng)用已經(jīng)“成勢(shì)”,要乘勢(shì)而上,順勢(shì)而為。人工智能是不是行了呢?強(qiáng)人工智能現(xiàn)在還不行,還有非常長(zhǎng)的路需要探索,可能是10年、20年,30年、40年也都有可能,這個(gè)取決于現(xiàn)有的機(jī)器架構(gòu),做強(qiáng)人工智能是馬太效應(yīng),大車(chē)要用更強(qiáng)的系統(tǒng)拉,那個(gè)系統(tǒng)是什么,現(xiàn)在不知道。有可能是類(lèi)腦系統(tǒng)、量子系統(tǒng),也可能是其他系統(tǒng),現(xiàn)在的算力做強(qiáng)人工智能還不夠,弱人工智能沒(méi)有問(wèn)題,這是基本判斷。
人工智能的四個(gè)優(yōu)勢(shì)與短板
3144中的第一個(gè)“4”,是我們國(guó)家發(fā)展人工智能有四個(gè)優(yōu)勢(shì)條件。第一是有政策優(yōu)勢(shì),我們國(guó)家對(duì)人工智能非常重視。第二是數(shù)據(jù)資源的優(yōu)勢(shì),我們國(guó)家擁有海量數(shù)據(jù),這是其他任何一個(gè)國(guó)家沒(méi)有辦法比擬的。第三是豐富的應(yīng)用場(chǎng)景優(yōu)勢(shì)。我們有非常豐富的應(yīng)用場(chǎng)景,不管是城鎮(zhèn)化、老齡化、制造業(yè)轉(zhuǎn)型升級(jí)還是互聯(lián)網(wǎng)市場(chǎng)。所有這些都給我們提供了非常好的應(yīng)用場(chǎng)景。第四個(gè)是我國(guó)的青年人才,儲(chǔ)備非常充足。我們有全世界最大的高等教育體系,工科學(xué)生占的比例非常高,這些學(xué)生都是將來(lái)進(jìn)入人工智能領(lǐng)域潛在的青年才俊。當(dāng)然我們也有四個(gè)薄弱環(huán)節(jié):一是起步晚,再加上前些年科技領(lǐng)域的評(píng)估需要短平快,所以一個(gè)人很難研究一件事,冷板凳坐30、40年。像有一位加拿大那位教授研究了40年,最后發(fā)出一篇論文引爆這個(gè)領(lǐng)域。由于這兩個(gè)原因,我們?cè)瓌?chuàng)性的東西略微差一些,這個(gè)我們實(shí)事求是,必須要承認(rèn)。所以真正原創(chuàng)的研究,大多數(shù)來(lái)自美國(guó)、加拿大和英國(guó)。二是高端芯片。不管GPU、ASIC、FPGA,主要掌握在別國(guó)企業(yè)的手里。不光是芯片,也包括傳感器,對(duì)這部分研究,我們也需要補(bǔ)短板。三是缺乏有國(guó)際影響的人工智能開(kāi)源開(kāi)放平臺(tái)?,F(xiàn)在有影響的開(kāi)源開(kāi)放平臺(tái)基本都是別國(guó)做的,像谷歌、微軟、亞馬遜、Facebook、IBM。國(guó)內(nèi)企業(yè)也在推廣,但影響力非常小。第四是高端人才的短板。我們高端人才不足,剛才說(shuō)青年才俊很多,但是高端人工智能的人才和美國(guó)相比,只是美國(guó)總數(shù)的20%左右。
(根據(jù)高文院士的公開(kāi)演講整理而成,未經(jīng)本人確認(rèn)。)