張馨心
摘要:備受關(guān)注的谷歌AlphaGo和韓國棋手李世石的"人機(jī)圍棋大戰(zhàn)",最終以4:1的總比分告一段落。關(guān)于Alphago的討論熱潮此起彼伏,一個陌生的名詞現(xiàn)如今成了大街小巷最熱議的話題--深度學(xué)習(xí)。本文從深度學(xué)習(xí)的概念、發(fā)展和未來走近深度學(xué)習(xí),并結(jié)合Alphago的技術(shù)對深度學(xué)習(xí)的具體內(nèi)容有些許涉獵。
關(guān)鍵詞:人機(jī)圍棋大戰(zhàn),深度學(xué)習(xí),人工智能,神經(jīng)網(wǎng)絡(luò)
1.深度學(xué)習(xí)的概念
講到深度學(xué)習(xí),不得不和大家所熟知的幾個名詞做一比較,例如人工智能和神經(jīng)網(wǎng)絡(luò)。其實,它們是相互包含的關(guān)系,人工智能英文名為Artificial Intelligence,即大家所謂的AI,它包含了語言的學(xué)習(xí)與處理,知識表現(xiàn),智能搜索,推理,規(guī)劃,機(jī)器學(xué)習(xí),神經(jīng)網(wǎng)絡(luò),遺傳算法等多個領(lǐng)域,神經(jīng)網(wǎng)絡(luò)再進(jìn)行分支,機(jī)器學(xué)習(xí)是其中一項,它是人工智能的核心,而所謂的深度學(xué)習(xí)就是機(jī)器學(xué)習(xí)中比較高端的技術(shù)了。也是近年來值得科學(xué)界和工程界注意的新興技術(shù)之一。
用學(xué)術(shù)的語言來說,深度學(xué)習(xí)結(jié)構(gòu)就是含多隱層的多感知器,深度學(xué)習(xí)通過低層特征形成更加抽象的高層表示。
2.深度學(xué)習(xí)的發(fā)展
深度學(xué)習(xí)發(fā)展至今,不得不提一下它的發(fā)展歷史,首先要說的就是神經(jīng)網(wǎng)絡(luò)的發(fā)展。眾所周知,人類每時每刻都要處理大量數(shù)據(jù),卻總能以靈巧的方式提取值得注意的數(shù)據(jù)特征,并通過復(fù)雜的大腦對之進(jìn)行處理。模仿人腦高效準(zhǔn)確地表示信息是人類從很久很久以前就夢寐以求的技術(shù)。
神經(jīng)科學(xué)家經(jīng)過研究發(fā)現(xiàn)哺乳動物大腦表示信息的方式:通過感官信號從視網(wǎng)膜傳遞到前額大腦皮質(zhì)的時間推斷出大腦皮質(zhì)并未直接對數(shù)據(jù)進(jìn)行特征提取和處理,而是根據(jù)分解和處理后的信息來識別物體。因此視皮層的功能是對信號進(jìn)行信息特征提取和計算,而不僅僅是重建視網(wǎng)膜的影像。受大腦結(jié)構(gòu)分層處理信息的啟示,神經(jīng)網(wǎng)絡(luò)科研人員一直致力于多層神經(jīng)網(wǎng)絡(luò)的研究,經(jīng)典的BP算法是解決多層神經(jīng)網(wǎng)絡(luò)的重要方法。但是該方法有一個嚴(yán)重的缺陷:由于誤差存在,結(jié)果總是趨近于局部最小,隨著網(wǎng)絡(luò)層次提高,該誤差會逐漸增大。因此BP算法僅僅對于較淺層的神經(jīng)網(wǎng)絡(luò)才能夠做到令人滿意的結(jié)果。為了更有效地解決多層神經(jīng)網(wǎng)絡(luò),深度學(xué)習(xí)的方法呼之欲出。
2006年,加拿大多倫多教授,機(jī)器學(xué)習(xí)領(lǐng)域泰斗Hinton和他的學(xué)生在《Science》上發(fā)表了一篇文章,開啟了深度學(xué)習(xí)的熱潮。自此,深度學(xué)習(xí)領(lǐng)域的研究和應(yīng)用層出不窮,在語音識別、圖像識別,甚至制藥界的發(fā)展都起到了極大的促進(jìn)作用。近日,谷歌公司推出的Alphago更是深度學(xué)習(xí)的直接應(yīng)用的典型。
3.Alphago所采用的關(guān)鍵技術(shù):走棋網(wǎng)絡(luò)、估值網(wǎng)絡(luò)
回到Alphago的獲勝話題上來,我們不禁懷疑起來:為什么一個機(jī)器人通過短短數(shù)年的時間可以打敗當(dāng)今圍棋界的頂尖選手呢?那就讓我們深入地了解一下Alphago的關(guān)鍵技術(shù)。
Alphago采用了兩個神經(jīng)網(wǎng)絡(luò):走棋網(wǎng)絡(luò)和估值網(wǎng)絡(luò)。走棋網(wǎng)絡(luò)的目的是為了減少搜索的廣度,做法是對于當(dāng)前的棋盤狀態(tài),我們對下一步乃至下幾步的走法,我們只考慮獲勝可能性較大的走法,而不需要考慮獲勝概率更差的走法,也不一定取得獲勝概率最高的走法。剩下的問題就是如何得到可能的走棋的獲勝概率,這就要用到深度學(xué)習(xí)了:通過已知的棋譜進(jìn)行監(jiān)督訓(xùn)練。為了防止相似性過高,同一個棋譜只挑選有限的幾步進(jìn)行訓(xùn)練,讓機(jī)器記住較優(yōu)的若干步走法,在實戰(zhàn)中只需要走棋后對棋譜進(jìn)行檢測,選取勝率較高的一步走棋方案即可。
估計網(wǎng)絡(luò)的話,就更容易理解了。對于一個靜態(tài)棋盤,對黑子、白字、空白棋盤上的每個點進(jìn)行賦值,比如分別賦值為1,-1,0。然后通過深度學(xué)習(xí)的方法得到該狀態(tài)的勝率。具體過程與走棋網(wǎng)絡(luò)的訓(xùn)練過程很相似,也是輸入龐大的棋譜庫,然后分析得到常見狀態(tài)的勝率。在真正對戰(zhàn)時,如果當(dāng)前棋盤狀態(tài)機(jī)器已經(jīng)記錄下來,我們就可以得到該狀態(tài)的勝率,從而判斷下一步該如何進(jìn)行移動。
4.深度學(xué)習(xí)的未來
在賽前,圍棋界的高手們都紛紛預(yù)測,李世石將會以大比分戰(zhàn)勝Alphago,中國創(chuàng)新工場總裁李開復(fù)也認(rèn)為,此次比賽李世石應(yīng)該可以勝出,但是他也從理性的角度分析:人工智能最終會超越人類的左腦,成為新一代的頂尖智能代表。這也是人工智能能夠預(yù)見到的未來。深度學(xué)習(xí)作為神經(jīng)網(wǎng)絡(luò)的重要方法,它的前景也不可估量。不過同樣的,深度學(xué)習(xí)也存在著一些瓶頸需要我們?nèi)ネ黄啤?/p>
從理論的角度來說,我們對深度學(xué)習(xí)的理論樣本復(fù)雜度是不確定的,也就是說,我們并不知道要輸入多少樣本進(jìn)行訓(xùn)練,機(jī)器才能學(xué)到我們所期望的程度。從建模的角度,我們是否還需要更加優(yōu)化的分層來加快深度學(xué)習(xí)的進(jìn)度?從工程的角度,對于大量的數(shù)據(jù)計算,我們是否能夠在更短的時間內(nèi)得到結(jié)果?諸如此類的問題還有很多,那也就意味著深度學(xué)習(xí)還有更寬廣的道路需要我們?nèi)ラ_拓,如果這些問題都能逐一解決的話,人工智能的發(fā)展水平又能上升到一個新的臺階,電影中所描述的人與機(jī)器人共存的和諧畫面將盡在眼前。
參考文獻(xiàn)
[1]《Draft:Deep Learning in Neural Networks:An Overview》 by Jurgen Schmidhuber
[2]《A Deep Learning Tutorial:From Perceptrons to Deep Networks》 by Ivan Vasilev
[3]《Deep Learning for Natural Language Processing and Related Applications》 by Xiaodong He,Jianfeng Gao,and Li Deng
[4]《A Gentle Introduction to Scikit-Learn:A Python Machine Learning Library》 by Jason Brownlee