董杉
2016年3月,人工智能AlphaGo挑戰(zhàn)人類圍棋世界冠軍李世石。比賽結(jié)果卻出人意料地幾乎一邊倒,圍棋高手李世石的智商幾乎被Alpha Go碾壓。曾經(jīng)被視作人類智慧在棋類游戲上的最后堡壘——圍棋,被人工智能徹底攻破,輿論一時(shí)嘩然,人工智能也成為全世界關(guān)注的焦點(diǎn)。
人工智能是什么
那么問題來了,大家是否知道到底什么是“人工智能”?是計(jì)算機(jī)?是軟件程序?還是機(jī)器人?
人工智能,全稱為Artificial Intelligence,英文縮寫為AI。其實(shí)從字面上我們就可以解讀出兩層含義:其一是“人工”;其二是“智能”?!叭斯ぁ狈浅:美斫猓傅囊欢ㄊ墙?jīng)過人類活動創(chuàng)造出來的成果。但是“智能”是什么呢?這其實(shí)是一個(gè)非常難以準(zhǔn)確描述的概念。事實(shí)上直至今日,人類對于到底什么是智能還知之甚少。
在人類智慧的范疇內(nèi),智能涉及到的意識、自我、思維等,仍然是自然科學(xué)、哲學(xué)乃至神學(xué)研究的焦點(diǎn)之一。因此,對于人工智能我們只能定義為研究、開發(fā)用于模擬、延伸和擴(kuò)展人類智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門技術(shù)科學(xué)。而電子計(jì)算機(jī)、軟件程序及機(jī)器人與人工智能之間的確存在著密切的關(guān)系。簡單地說,電子計(jì)算機(jī)為人工智能提供了硬件基礎(chǔ),軟件程序是人工智能實(shí)現(xiàn)的主要方式,而機(jī)器人則是人工智能的應(yīng)用成果。
一路走來的人工智能
數(shù)千年來,人類對于人工智能的研究從未停止過,西方的《荷馬史詩》中有關(guān)于大型三足機(jī)器人的描述,中國古代也有能工巧匠制造自動設(shè)備的記載。然而直到20世紀(jì)40年代,電子計(jì)算機(jī)的發(fā)明提供了硬件基礎(chǔ),真正意義上的人工智能才逐漸出現(xiàn)。
第一次高潮
20世紀(jì)50年代早期,人們開始注意到人工智能與機(jī)器之間的聯(lián)系。1955年年末,第一個(gè)AI程序“邏輯專家”(Logic Theorist)誕生,對AI研究領(lǐng)域產(chǎn)生巨大影響,成為AI發(fā)展史中一個(gè)重要的里程碑。1956年,美國達(dá)特茅斯學(xué)院數(shù)學(xué)系助理教授麥卡錫(John McCarthy)等一批志同道合的年輕科學(xué)家們召開了一個(gè)研討會,這次會議起了一個(gè)在當(dāng)時(shí)看來別出心裁的名字——人工智能夏季研討會。會議持續(xù)了一個(gè)月,以大范圍的集思廣益,催生了后來人所共知的人工智能革命,因此被公認(rèn)為是現(xiàn)代人工智能研究的起源。
人工智能夏季研討會后的10年,AI研究開始快速發(fā)展,因此這10年也被稱為人工智能研究的第一次高潮。當(dāng)時(shí)的研究多被稱為機(jī)器學(xué)習(xí)(machine learning),主要集中在利用統(tǒng)計(jì)與概率的方式協(xié)助處理數(shù)據(jù)。
1957年,美國計(jì)算機(jī)科學(xué)家羅森布拉特(F.Roseblatt)提出了感知器(Perceptron)概念,這是最早的人工神經(jīng)網(wǎng)絡(luò),具有劃時(shí)代的意義。單層感知器是一個(gè)具有一層神經(jīng)元,采用閾值激活函數(shù)的前向網(wǎng)絡(luò)。通過對網(wǎng)絡(luò)權(quán)值的訓(xùn)練,可以使感知器對一組輸入矢量的響應(yīng)達(dá)到元素為0或1的目標(biāo)輸出,從而實(shí)現(xiàn)對輸入矢量分類的目的。
第一次寒冬
但是在第一次高潮之后,人工智能的發(fā)展卻遠(yuǎn)遠(yuǎn)滯后于當(dāng)年的預(yù)測。一方面,人們發(fā)現(xiàn)人工智能所基于的數(shù)學(xué)模型和數(shù)學(xué)手段有一定的缺陷,如邏輯證明器、感知器、增強(qiáng)學(xué)習(xí)等只能做非常簡單、專業(yè)且很窄的任務(wù),稍微超出范圍就無法應(yīng)對。另一方面,有很多計(jì)算復(fù)雜度以指數(shù)程度增加,成了不可能完成的計(jì)算任務(wù)。1973年,《萊特希爾報(bào)告》用詳實(shí)的數(shù)據(jù)說明,幾乎所有的人工智能研究都遠(yuǎn)未達(dá)到早前承諾的水平。于是在1974年到1980年,人工智能的發(fā)展邁入第一次寒冬。
第二次高潮
20世紀(jì)80年代,隨著第五代計(jì)算機(jī)的研制成功,人工智能獲得了進(jìn)一步的發(fā)展。誤差反向傳播算法(Error Back Propagation, BP)和Hopfield多層神經(jīng)網(wǎng)絡(luò)模型的提出,使人工神經(jīng)網(wǎng)絡(luò)研究與應(yīng)用再度出現(xiàn)了欣欣向榮的景象,人工智能走出寒冬迎來第二次高潮。
然而,1987年到1993年,個(gè)人計(jì)算機(jī)的出現(xiàn),卻讓人工智能的熱潮降溫。當(dāng)時(shí)蘋果、IBM公司開始推廣第一代臺式機(jī),計(jì)算機(jī)開始進(jìn)入尋常百姓家,其費(fèi)用遠(yuǎn)遠(yuǎn)低于人工智能專家系統(tǒng)所使用的Symbolics和Lisp等機(jī)器。相比于個(gè)人計(jì)算機(jī),專家系統(tǒng)被認(rèn)為古老陳舊且難以維護(hù)。20世紀(jì)90年代中后期,人工智能走入一個(gè)平緩發(fā)展的時(shí)期。
近年來,隨著科技的不斷進(jìn)步,特別是互聯(lián)網(wǎng)的蓬勃發(fā)展與大數(shù)據(jù)概念的出現(xiàn),極大地加速了人工智能的發(fā)展。不過,任何智能的發(fā)展都需要一個(gè)學(xué)習(xí)的過程,依賴于大量數(shù)據(jù)的訓(xùn)練。由于各類感應(yīng)器和數(shù)據(jù)采集技術(shù)的發(fā)展,我們開始擁有以往難以想象的海量數(shù)據(jù)。同時(shí),也開始在某一領(lǐng)域擁有深度、細(xì)致的數(shù)據(jù)。如果把人工智能看成一個(gè)嬰兒,某一領(lǐng)域?qū)I(yè)、海量、深度的數(shù)據(jù)就是喂養(yǎng)這個(gè)嬰兒的奶粉。那么,奶粉的數(shù)量決定了嬰兒是否能長大,而奶粉的質(zhì)量則決定了嬰兒后續(xù)的智力發(fā)育水平。
避免下一個(gè)寒冬
很多從事人工智能領(lǐng)域開發(fā)的科學(xué)家均樂觀地認(rèn)為,我們已經(jīng)處于人工智能的第三次高潮期,且在未來相當(dāng)長的一段時(shí)間內(nèi),人工智能的發(fā)展不會再遭遇新的寒冬。然而,在樂觀預(yù)期的同時(shí),困境和挑戰(zhàn)也始終存在。
中國科學(xué)院副院長、中國科學(xué)院院士譚鐵牛就提出,要警惕人工智能進(jìn)入下一個(gè)寒冬。因?yàn)橐环矫?,人工智能熱門技術(shù)目前正處于“期望膨脹期”,接下來可能進(jìn)入“幻滅期”;另一方面,當(dāng)前的研究熱點(diǎn)過于集中在深度學(xué)習(xí),但是深度學(xué)習(xí)不等于AI,它只是人工智能領(lǐng)域機(jī)器學(xué)習(xí)方向的一種方法,也存在明顯的局限性。如果不能找到新的更優(yōu)模型的研究方向,那么將來必定會成為人工智能研發(fā)的新瓶頸。
人工智能走向未來
毋庸置疑,研發(fā)技術(shù)突飛猛進(jìn)中的人工智能,正逐漸被應(yīng)用于人類生產(chǎn)、生活的方方面面。從Windows10自帶的人工智能小娜,到Google無人駕駛汽車,拜人工智能所賜,曾經(jīng)科幻電影中的場景正在一步步走入我們的生活。
那么,將來人工智能的發(fā)展方向是什么呢?簡單地說,就是人工智能會逐漸向人類的智慧水平看齊。而想實(shí)現(xiàn)這個(gè)目的,人工智能就需要從目前比較成熟的監(jiān)督學(xué)習(xí),更多地向無監(jiān)督學(xué)習(xí)發(fā)展。
這兩者有什么區(qū)別呢?學(xué)習(xí)的過程,用一個(gè)成語來概括就是舉一反三。以高考為例,高考的題目在上考場前我們從來沒有做過,但在高中我們做過很多題目,懂得解題方法,因此在考場上面對陌生問題也能獲解。人工智能的學(xué)習(xí)思路也類似:利用一些訓(xùn)練數(shù)據(jù),找到方法分析未知數(shù)據(jù)。最簡單也是最普遍的一類人工智能學(xué)習(xí)算法,就是分類。
對于分類,輸入的訓(xùn)練數(shù)據(jù)有特征,有標(biāo)簽。所謂的學(xué)習(xí),其本質(zhì)就是找到特征和標(biāo)簽間的關(guān)系。這樣,當(dāng)有特征而無標(biāo)簽的未知數(shù)據(jù)輸入時(shí),我們就可以通過已有的關(guān)系得到未知數(shù)據(jù)的標(biāo)簽。在上述的分類過程中,如果所有訓(xùn)練數(shù)據(jù)都有標(biāo)簽,則為有監(jiān)督學(xué)習(xí)。如果數(shù)據(jù)沒有標(biāo)簽,顯然就是非監(jiān)督學(xué)習(xí)了,即聚類。目前,分類算法的效果還是不錯(cuò)的,但相對而言,聚類算法就有些慘不忍睹了。正如我們做題時(shí),答案(標(biāo)簽)是非常重要的。假設(shè)兩個(gè)智力完全相同的人參加高考,一人正常答題,另一人做的所有題目都沒有答案,那么想必第一個(gè)人會取得較好的高考成績,第二個(gè)人則會發(fā)瘋。
因此,在監(jiān)督學(xué)習(xí)的模式下,人工智能會表現(xiàn)出很好的分類與預(yù)測能力。而非監(jiān)督學(xué)習(xí)本身的特點(diǎn)使其難以得到如分類一樣近乎完美的結(jié)果。但是對人工智能來說,只有在非監(jiān)督學(xué)習(xí)下,才有可能實(shí)現(xiàn)如人類一樣自主思考,實(shí)現(xiàn)知識的表示與推理。