人工智能的歷史其實(shí)正好與計(jì)算機(jī)的歷史差不多一樣長,但兩者的發(fā)展進(jìn)度卻大相徑庭。一個很像一帆風(fēng)順的富二代,一個則起起落落很像白手起家的創(chuàng)業(yè)者。我們都知道現(xiàn)代計(jì)算機(jī)(包含我們常見的電腦、手機(jī)等)其實(shí)開始于圖靈這個人。圖靈在數(shù)學(xué)上證明了如果處理盒(相當(dāng)于處理器)選擇了一套正確的規(guī)則,并給予無限長的紙帶(相當(dāng)于內(nèi)存和硬盤),那么這種裝置可以進(jìn)行任何宇宙里可以定義的操作,此后才由馮·諾依曼確定了計(jì)算機(jī)的基本體系結(jié)構(gòu),最終才是最近30年計(jì)算機(jī)的蓬勃發(fā)展。
不管看到的電子產(chǎn)品多么神奇,其實(shí)原理都來自上面這么個簡單的東西。
這就和很多科技發(fā)展所遵循的規(guī)律一樣,一個偉大的人物先在理論上達(dá)成一個自洽的、讓人仰望的高度,后人則在這個大框架下不斷細(xì)化和應(yīng)用。牛頓的定律是這樣,愛因斯坦的相對論是這樣,計(jì)算機(jī)也是這樣,但很不幸人工智能則不是這樣,科學(xué)家始終還處在摸索中,只不過摸到的東西確實(shí)越來越多了。
人工智能也誕生于圖靈那個年代,甚至也就是圖靈這個人提出了今天引起了極大關(guān)注的那些方向,比如圖靈測試、機(jī)器學(xué)習(xí)、遺傳算法和強(qiáng)化學(xué)習(xí)等。但此后人工智能的發(fā)展則是三起兩落,既有萬眾矚目,人們信心爆棚,資金大量注入的時候,也有被打入冷宮、無人問津的時候。這與計(jì)算機(jī)乃至互聯(lián)網(wǎng)的發(fā)展完全不一樣,這兩個東西在摩爾定律的助推下,很像是安了天使翅膀的人類,幾乎是一路向前狂奔,到現(xiàn)在也還沒怎么減速。這里面也許最根本的差別就是人工智能本身并沒有一種理論基礎(chǔ),所以懷疑它不行或者相信它肯定能行都很像一種信念。信念在受到事實(shí)威脅時實(shí)在不足以支撐這樣一個極其費(fèi)錢的大科目,這就導(dǎo)致了人工智能的發(fā)展起起落落,一波三折。
人工智能的起點(diǎn)要追溯到大概60年前。1956年,當(dāng)時這個領(lǐng)域非常有影響力的約翰·麥肯錫說服了明斯基、香農(nóng)等人,幫助他把全美所有自動機(jī)理論、神經(jīng)網(wǎng)絡(luò)和智能研究的人召集到了一起,這年夏天,他們在達(dá)特茅斯組織了一場研討會,從這場會議的聲明中可以看出那時候的科學(xué)家對人工智能持何種樂觀態(tài)度:
那時候的頂級科學(xué)家其實(shí)希望迅速地做完圖靈對計(jì)算機(jī)所做的事情,但很不幸,事情的進(jìn)展和他們想的完全不一樣,并且可以確定到2016年夏天,也就是60年后,這事也還沒搞定。但這次會議的特別價(jià)值在于它形成了一種共識——讓人工智能成為一個獨(dú)立的學(xué)科,因此這個會議通常被看成是人工智能這一學(xué)科真正誕生的標(biāo)志。
圖靈機(jī)
人工智能是在人們信心大爆棚時誕生的,盡管科學(xué)家非常樂觀,也聲稱自己的程序能夠證明《數(shù)學(xué)原理》第2章中的大部分定理,但大多數(shù)人并不能從這一樂觀態(tài)度中看到什么明顯的進(jìn)步。當(dāng)時美國政府對此非常熱心,在這個領(lǐng)域投了很多錢,與之相反英國政府卻采取了一種完全不同的做法,他們請了一位著名的數(shù)學(xué)家——詹姆斯·萊特希爾(Sir James Lighthill)教授,對人工智能做一個徹底的評估。這位教授在看了所有重要的相關(guān)論文后,寫出了一份報(bào)告,后來世人稱之為《萊特希爾報(bào)告》。這份報(bào)告說人工智能絕不可能有什么用途,因?yàn)樗荒鼙挥脕斫鉀Q簡單的問題。英國政府以后沒有在人工智能上進(jìn)行大量的投資,此后人工智能逐漸變得少有人問津。事實(shí)上第一波人工智能浪潮止步于以下三種困難:
第一種困難是早期的人工智能程序?qū)渥拥恼鎸?shí)含義完全不理解,它們主要依賴于句法處理獲得成功。這樣一來,它們“the spirit is willing but the flesh is weak”(英文:心有余而力不足)到“the vodka is good but the meat is rotten(俄語:伏特加酒是好的,而肉是爛的)的英譯俄再俄譯英就不可能做對。其實(shí)直到現(xiàn)在問題仍然存在,只不過大量的數(shù)據(jù)彌補(bǔ)了不理解真實(shí)含義的缺陷。形象地講,現(xiàn)在計(jì)算機(jī)并不去理解這個句子,而是看哪種翻譯被用得多。
第二種困難則是《萊特希爾報(bào)告》里重點(diǎn)強(qiáng)調(diào)的組合爆炸。這導(dǎo)致讓程序每次產(chǎn)生一個小變化,最終產(chǎn)生出可以解決問題的程序這種思路被堵死了。這就好比用試錯法尋找正確的路,但每條路上都有無數(shù)的岔路甚至岔路間還彼此勾連,因此可走的路近乎無限多,那么試錯法毫無價(jià)值。
第三種困難則是那時候發(fā)現(xiàn)雖然人工智能具有的神經(jīng)網(wǎng)絡(luò)簡單形式可以學(xué)會它們能表示的任何東西,但它其實(shí)只能表示很少的東西,應(yīng)用范圍十分有限。
正因?yàn)檫@些困難得不到有效的解決,在20世紀(jì)70年代人工智能漸漸冷卻,直到專家系統(tǒng)的興起和神經(jīng)網(wǎng)絡(luò)讓人們看到了新的希望。到了80年代確實(shí)有些專家系統(tǒng)被成功部署,并為公司節(jié)約了數(shù)以千萬美元計(jì)的費(fèi)用,比如第一個成功的商用專家系統(tǒng)R1在DEC成功運(yùn)轉(zhuǎn),此后DEC陸續(xù)部署了40個專家系統(tǒng)。也正是在這時候日本宣布了第五代計(jì)算機(jī)計(jì)劃,希望用10年時間研制出智能計(jì)算機(jī)。作為回應(yīng),美國也組建了一家公司來保證國家競爭力。
也是在這個時候,神經(jīng)網(wǎng)絡(luò)上取得了新的進(jìn)展,一個典型的事件是1989年,燕樂存(Yan Le-cun)在AT&T Bell實(shí)驗(yàn)室驗(yàn)證了一個反向傳播在現(xiàn)實(shí)世界中的杰出應(yīng)用,即“反向傳播應(yīng)用于手寫郵編識別”系統(tǒng),簡單點(diǎn)說就是這個系統(tǒng)能很精準(zhǔn)地識別各種手寫的數(shù)字,很有意思的是當(dāng)年的演示視頻被保留了下來,所以我們今天仍然可以清楚地回放當(dāng)年的效果。但很不幸的,展開這類算法所需要的計(jì)算能力和數(shù)據(jù)那時候并不具備,所以在實(shí)際應(yīng)用中也逐漸敗下陣來。這個方向狼狽到這樣一種程度:現(xiàn)在的深度學(xué)習(xí)領(lǐng)軍人物以及他們學(xué)生的論文被拒成了家常便飯,根本原因就是論文主題是神經(jīng)網(wǎng)絡(luò)。另一件小事也可以從側(cè)面說明當(dāng)時神經(jīng)網(wǎng)絡(luò)不被待見的程度:為了讓神經(jīng)網(wǎng)絡(luò)復(fù)興并被大家接受,現(xiàn)在鼎鼎大名的杰弗里·欣頓(Geoffrey Hinton)和它的小組密謀用“深度學(xué)習(xí)”來重新命名讓人聞之色變的神經(jīng)網(wǎng)絡(luò)領(lǐng)域。很多人很難想到今天鼎鼎大名的深度學(xué)習(xí)其實(shí)是這么來的。
于是人工智能再次陷入低潮,這種低潮從其他方面解釋其實(shí)是無意義的,主要還是技術(shù)本身的實(shí)現(xiàn)程度支撐不起足夠多的應(yīng)用。當(dāng)一種技術(shù)并沒有在商業(yè)中深度滲透進(jìn)去,自身又需要較多的研究資源,也沒有堅(jiān)實(shí)的理論基礎(chǔ)讓人看到高額投入肯定會產(chǎn)生效果時,那么它遇冷的可能性就變得極大。
人工智能被低估持續(xù)了十幾年,直到最近互聯(lián)網(wǎng)和云計(jì)算的興起。如果要從2010年時任斯坦福大學(xué)教授的吳恩達(dá)加入谷歌開發(fā)團(tuán)隊(duì)XLab開始計(jì)算,那這次的熱潮興起也不過只有五六年?;ヂ?lián)網(wǎng)和云計(jì)算之所以讓深度學(xué)習(xí)得以復(fù)興,其關(guān)鍵點(diǎn)有兩個:一是互聯(lián)網(wǎng)提供了海量的數(shù)據(jù);二是云計(jì)算提供了遠(yuǎn)超以往的計(jì)算能力。這兩點(diǎn)很像燃料與引擎,它們疊加到一起就可以讓車跑得飛快。
總結(jié)起來,我們可以講到現(xiàn)在為止人工智能歷經(jīng)三起兩落,和前兩次不一樣的是,這次我們有理由相信人工智能會發(fā)展起來而不是再落下去,關(guān)鍵原因不在于科學(xué)家如何有信心,而在于這種技術(shù)已經(jīng)非常普遍地得到了應(yīng)用,其應(yīng)用范圍要遠(yuǎn)大于前兩次,不管是在聲音、圖像還是在數(shù)據(jù)分析上。