文|劉興亮
智能化時(shí)代的四核驅(qū)動(dòng)力
文|劉興亮
導(dǎo)語(yǔ):人工智能的發(fā)展有4個(gè)必要條件,它們是移動(dòng)網(wǎng)絡(luò)的發(fā)展和傳感器的普遍使用、云計(jì)算使低成本大規(guī)模并行計(jì)算成為現(xiàn)實(shí)、機(jī)器學(xué)習(xí)尤其是深度學(xué)習(xí)技術(shù)不斷進(jìn)步、大數(shù)據(jù)的發(fā)展。
劉興亮DCCI互聯(lián)網(wǎng)研究院院長(zhǎng)
仿佛一夜之間,人工智能成為一個(gè)火熱的話題。樂(lè)觀主義者指出,社會(huì)的趨勢(shì)必將從萬(wàn)物互聯(lián)走向萬(wàn)物智能,也就是踏入智能化的時(shí)代。從種種跡象看來(lái),人工智能的廣泛應(yīng)用可能會(huì)提前,智能化時(shí)代來(lái)臨的轟鳴聲會(huì)越來(lái)越強(qiáng)。為什么這么說(shuō)?因?yàn)槿斯ぶ悄艿陌l(fā)展有4個(gè)必要條件,它們是移動(dòng)網(wǎng)絡(luò)的發(fā)展和傳感器的普遍使用、云計(jì)算使低成本大規(guī)模并行計(jì)算成為現(xiàn)實(shí)、機(jī)器學(xué)習(xí)尤其是深度學(xué)習(xí)技術(shù)不斷進(jìn)入、大數(shù)據(jù)的發(fā)展。而上述4個(gè)領(lǐng)域已經(jīng)在近年有了突飛猛進(jìn)的發(fā)展,它們像四核驅(qū)動(dòng)力一樣,驅(qū)動(dòng)著智能化時(shí)代的快速來(lái)臨。
Talking Data發(fā)布的《2014移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù)報(bào)告》顯示,2014年我國(guó)移動(dòng)互聯(lián)網(wǎng)產(chǎn)業(yè)發(fā)展迅猛,移動(dòng)智能終端設(shè)備數(shù)已達(dá)10.6億個(gè),較2013年增長(zhǎng)231.7%。全國(guó)各地的“移動(dòng)俠”有著不同的生活習(xí)性,但他們的手機(jī)里平均安裝著34款A(yù)pp。
而易觀國(guó)際的數(shù)據(jù)則顯示,2014年中國(guó)移動(dòng)互聯(lián)網(wǎng)用戶規(guī)模約7.29億,較2013年增長(zhǎng)11.8%。未來(lái)幾年,移動(dòng)互聯(lián)網(wǎng)用戶規(guī)模將繼續(xù)保持增長(zhǎng)態(tài)勢(shì),但增速將進(jìn)一步放緩。從PC互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng),再到物聯(lián)網(wǎng),人與人、人與物之間的聯(lián)系更加緊密了。
與此同時(shí),傳感器技術(shù)與產(chǎn)品的發(fā)展也有了長(zhǎng)足的進(jìn)步。20世紀(jì)90年代初,傳感器變得價(jià)格低廉且功能強(qiáng)大,這使工程師們開(kāi)始相信傳感器可應(yīng)用的空間和途徑幾乎是無(wú)限的。來(lái)自麻省理工學(xué)院的技術(shù)倡導(dǎo)者凱文·阿斯頓提出了物聯(lián)網(wǎng)這一概念,無(wú)生命物體可以通過(guò)全球網(wǎng)狀網(wǎng)絡(luò)與人或者其他無(wú)生命體進(jìn)行交流。如今傳感器已經(jīng)遍布世界的各個(gè)角落,它們不僅能幫助礦工監(jiān)測(cè)礦井內(nèi)是否有毒氣,也能幫助人們了解自己的身體是否有異常變化。
2007年1月,史蒂夫·喬布斯推出蘋(píng)果手機(jī),作為首款成功配備觸摸屏的移動(dòng)設(shè)備,它包含微小的傳感器,使用戶可以向水平方向或垂直方向旋轉(zhuǎn)屏幕,搜尋wifi信號(hào)或者與藍(lán)牙耳機(jī)相連。該手機(jī)甚至還配有一個(gè)加速度傳感器,用于在手機(jī)掉落時(shí)提供保護(hù)。到了現(xiàn)在,每臺(tái)智能手機(jī)已平均配有7個(gè)傳感器。
馮·諾依曼體系的串行結(jié)構(gòu)使得計(jì)算機(jī)無(wú)法滿足人工智能對(duì)硬件的要求,而近年來(lái)云計(jì)算的出現(xiàn)至少部分解決了這個(gè)問(wèn)題。從概念上講,可把云計(jì)算看成是“存儲(chǔ)云+計(jì)算云”的有機(jī)結(jié)合,即“云計(jì)算=存儲(chǔ)云+計(jì)算云”。存儲(chǔ)云的基礎(chǔ)技術(shù)是分布存儲(chǔ),而計(jì)算云的基礎(chǔ)技術(shù)正是并行計(jì)算:將大型計(jì)算任務(wù)拆分,然后再派發(fā)到云中的各個(gè)節(jié)點(diǎn)進(jìn)行分布式計(jì)算,最終再將結(jié)果收集后統(tǒng)一處理。大規(guī)模并行計(jì)算能力的提高使得人工智能往前邁進(jìn)了一大步。
云計(jì)算的實(shí)質(zhì)是一種基礎(chǔ)架構(gòu)管理的方法論,是把大量的計(jì)算資源組成IT資源池,用于動(dòng)態(tài)創(chuàng)建高度虛擬化的資源供用戶使用。在云計(jì)算環(huán)境下,所有的計(jì)算資源都能夠動(dòng)態(tài)地從硬件基礎(chǔ)架構(gòu)上增減,以適應(yīng)工作任務(wù)的需求。云計(jì)算基礎(chǔ)架構(gòu)的本質(zhì)是通過(guò)整合、共享和動(dòng)態(tài)的硬件設(shè)備供應(yīng)來(lái)實(shí)現(xiàn)IT投資的利用率最大化。這就使得使用云計(jì)算的單位成本大大降低,非常有利于人工智能的商業(yè)化運(yùn)營(yíng)。
值得特別指出的是,近來(lái)基于GPU(圖形處理器)的云計(jì)算異軍突起,以遠(yuǎn)超CPU的并行計(jì)算能力獲得業(yè)界矚目。
CPU的架構(gòu)是有利于X86指令集的串行架構(gòu),從設(shè)計(jì)思路上適合盡可能快的完成一個(gè)任務(wù);對(duì)于GPU來(lái)說(shuō),它最初的任務(wù)是在屏幕上合成顯示數(shù)百萬(wàn)個(gè)像素的圖像——也就是同時(shí)擁有幾百萬(wàn)個(gè)任務(wù)需要并行處理,因此GPU被設(shè)計(jì)成可并行處理很多任務(wù),天然具備了執(zhí)行大規(guī)模并行計(jì)算的優(yōu)勢(shì)。
現(xiàn)在不僅谷歌、Netflix用GPU來(lái)搭建人工智能的神經(jīng)網(wǎng)絡(luò),F(xiàn)acebook、Amazon、Salesforce都擁有了基于GPU的云計(jì)算能力,國(guó)內(nèi)的科大訊飛也采用了GPU集群支持自己的語(yǔ)音識(shí)別技術(shù)。GPU的這一優(yōu)勢(shì)被發(fā)現(xiàn)后,迅速承載起比之前的圖形處理更重要的使命:被用于人工智能的神經(jīng)網(wǎng)絡(luò),使得神經(jīng)網(wǎng)絡(luò)能容納上億個(gè)節(jié)點(diǎn)間的連接。傳統(tǒng)的CPU集群需要數(shù)周才能計(jì)算出擁有1億節(jié)點(diǎn)的神經(jīng)網(wǎng)的級(jí)聯(lián)可能性,而一個(gè)GPU集群在一天內(nèi)就可完成同一任務(wù),效率得到了極大的提升。另外,大規(guī)模生產(chǎn)帶來(lái)了GPU價(jià)格下降,使其更能得到廣泛的商業(yè)化應(yīng)用。
機(jī)器學(xué)習(xí)是人工智能的核心和基礎(chǔ),是使計(jì)算機(jī)具有智能的根本途徑,其應(yīng)用遍及人工智能的各個(gè)領(lǐng)域。該領(lǐng)域的頂級(jí)專家Alpaydin先生如此定義:“機(jī)器學(xué)習(xí)是用數(shù)據(jù)或以往的經(jīng)驗(yàn),以此優(yōu)化計(jì)算機(jī)程序的性能標(biāo)準(zhǔn)?!?/p>
最近幾年,新算法的發(fā)展極大提高了機(jī)器學(xué)習(xí)的能力。這些算法本身很重要,同時(shí)也是其他技術(shù)的推動(dòng)者,比如計(jì)算機(jī)視覺(jué)。機(jī)器學(xué)習(xí)算法目前被開(kāi)源使用,這種情形將促成更大進(jìn)步,因?yàn)樵陂_(kāi)源環(huán)境下開(kāi)發(fā)人員可以補(bǔ)足和增強(qiáng)彼此的工作。
在各種機(jī)器學(xué)習(xí)技術(shù)中,深度學(xué)習(xí)的發(fā)展尤其迅猛。深度學(xué)習(xí)的“技術(shù)路線”是模擬人類大腦神經(jīng)網(wǎng)絡(luò)的工作原理,將輸出的信號(hào)通過(guò)多層處理,將底層特征抽象為高層類別,它的目標(biāo)是更有效率、更精確地處理信息。深度學(xué)習(xí)自2006年由Geoffrey Hinton教授和他的兩個(gè)學(xué)生提出后,使得機(jī)器學(xué)習(xí)有了突破性的進(jìn)展,極大地推動(dòng)了人工智能水平的提升。2013年,《麻省理工技術(shù)評(píng)論》把它列入年度十大技術(shù)突破之一。
人腦具有一個(gè)深度結(jié)構(gòu),認(rèn)知過(guò)程是逐步進(jìn)行,逐層抽象的,能夠?qū)哟位亟M織思想和概念。深度學(xué)習(xí)之所以有如此大的作用,正是因?yàn)樗^好地模擬了人腦這種“分層”和“抽象”的認(rèn)知和思考方式。
深度學(xué)習(xí)的實(shí)質(zhì)是通過(guò)構(gòu)建具有很多隱層的機(jī)器學(xué)習(xí)模型和海量的訓(xùn)練數(shù)據(jù),來(lái)學(xué)習(xí)更有用的特征,從而最終提升分類或預(yù)測(cè)的準(zhǔn)確性。因此,“深度模型”是手段,“特征學(xué)習(xí)”是目的。區(qū)別于傳統(tǒng)的淺層學(xué)習(xí),深度學(xué)習(xí)的不同在于:(1)強(qiáng)調(diào)了模型結(jié)構(gòu)的深度,通常有5層、6層,甚至10多層的隱層節(jié)點(diǎn);(2)明確突出了特征學(xué)習(xí)的重要性,也就是說(shuō),通過(guò)逐層特征變換,將樣本在原空間的特征表示變換到一個(gè)新特征空間,從而使分類或預(yù)測(cè)更加容易。與人工規(guī)則構(gòu)造特征的方法相比,利用大數(shù)據(jù)來(lái)學(xué)習(xí)特征,更能夠刻畫(huà)數(shù)據(jù)的豐富內(nèi)在信息。
深度學(xué)習(xí)使得人工智能在幾個(gè)主要領(lǐng)域都獲得了突破性進(jìn)展——在語(yǔ)音識(shí)別領(lǐng)域,深度學(xué)習(xí)用深層模型替換聲學(xué)模型中的混合高斯模型(Gaussian Mixture Model, GMM),獲得了相對(duì)30%左右的錯(cuò)誤率降低;在圖像識(shí)別領(lǐng)域,通過(guò)構(gòu)造深度卷積神經(jīng)網(wǎng)絡(luò)(CNN),將Top5錯(cuò)誤率由26%大幅降低至15%,又通過(guò)加大加深網(wǎng)絡(luò)結(jié)構(gòu),進(jìn)一步降低到11%;在自然語(yǔ)言處理領(lǐng)域,深度學(xué)習(xí)基本獲得了與其他方法水平相當(dāng)?shù)慕Y(jié)果,但可以免去繁瑣的特征提取步驟??梢哉f(shuō)到目前為止,深度學(xué)習(xí)是最接近人類大腦的智能學(xué)習(xí)方法。
深層模型是包含多個(gè)隱藏層的人工神經(jīng)網(wǎng)絡(luò),多層非線性結(jié)構(gòu)使其具備強(qiáng)大的特征表達(dá)能力和對(duì)復(fù)雜任務(wù)的建模能力。訓(xùn)練深層模型是長(zhǎng)期以來(lái)的難題,近年來(lái)以層次化、逐層初始化為代表的一系列方法的提出給訓(xùn)練深層模型帶來(lái)了希望,并在多個(gè)應(yīng)用領(lǐng)域獲得了成功。深層模型的并行化框架和訓(xùn)練加速方法是深度學(xué)習(xí)走向?qū)嵱玫闹匾延卸鄠€(gè)針對(duì)不同深度模型的開(kāi)源實(shí)現(xiàn),谷歌、臉譜、百度、騰訊等公司也實(shí)現(xiàn)了各自的并行化框架。
深度學(xué)習(xí)引爆了一場(chǎng)革命,將人工智能帶上了一個(gè)新的臺(tái)階,將對(duì)一大批產(chǎn)品和服務(wù)產(chǎn)生深遠(yuǎn)影響。
過(guò)去機(jī)器學(xué)習(xí)的研究重點(diǎn)一直放在算法的改進(jìn)上,但最近的研究表明,采用更大容量數(shù)據(jù)集進(jìn)行訓(xùn)練帶來(lái)的人工智能提升,已超過(guò)選用算法帶來(lái)的提升。舉兩個(gè)實(shí)例說(shuō)明:1. 在語(yǔ)義識(shí)別方面,一個(gè)普通算法使用1億個(gè)單詞的未標(biāo)注訓(xùn)練數(shù)據(jù),會(huì)好過(guò)最有名的算法使用100萬(wàn)個(gè)單詞;2. 將照片中的馬賽克區(qū)域用與背景相匹配的某些東西來(lái)填補(bǔ),從一組照片中搜索填補(bǔ)物的話,如果只用1萬(wàn)張照片,則效果很差,如果照片數(shù)量增加到200萬(wàn)張,同樣的算法會(huì)表現(xiàn)出極好的性能。
換言之,大數(shù)據(jù)讓機(jī)器不斷學(xué)習(xí)成為可能,機(jī)器開(kāi)始擬人化。
早在1980年,著名未來(lái)學(xué)家阿爾文·托夫勒便在《第三次浪潮》一書(shū)中將大數(shù)據(jù)熱情地贊頌為“第三次浪潮的華彩樂(lè)章”。不過(guò),大約從2009年開(kāi)始,大數(shù)據(jù)才成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞匯,進(jìn)而成為一個(gè)產(chǎn)業(yè),甚至是一個(gè)時(shí)代,即所謂DT時(shí)代。其誘因是互聯(lián)網(wǎng)產(chǎn)業(yè)的迅猛發(fā)展。根據(jù)IDC的監(jiān)測(cè)統(tǒng)計(jì),2011年全球數(shù)據(jù)總量已經(jīng)達(dá)到1.8ZB(1ZB等于1萬(wàn)億GB,1.8ZB也就相當(dāng)于18億個(gè)1TB的移動(dòng)硬盤(pán),人均200GB, 這些信息的量相當(dāng)于可以填充572億個(gè)32GB的iPad),而這個(gè)數(shù)值還在以每?jī)赡攴环乃俣仍鲩L(zhǎng),預(yù)計(jì)到2020年全球?qū)⒖偣矒碛?5ZB的數(shù)據(jù)量,增長(zhǎng)近20倍。
美國(guó)互聯(lián)網(wǎng)數(shù)據(jù)中心指出,互聯(lián)網(wǎng)上的數(shù)據(jù)每年將增長(zhǎng)50%,而世界上90%以上的數(shù)據(jù)是最近幾年才產(chǎn)生的。此外,數(shù)據(jù)又并非單純指人們?cè)诨ヂ?lián)網(wǎng)上發(fā)布的信息,全世界的工業(yè)設(shè)備、汽車、電表上有著無(wú)數(shù)的數(shù)碼傳感器,隨時(shí)測(cè)量和傳遞著有關(guān)位置、運(yùn)動(dòng)、震動(dòng)、溫度、濕度乃至空氣中化學(xué)物質(zhì)的變化,也產(chǎn)生了海量的數(shù)據(jù)信息。因此除了互聯(lián)網(wǎng),大數(shù)據(jù)的爆發(fā)很大程度上源于傳感器技術(shù)和產(chǎn)品的突飛猛進(jìn)。人類在制造數(shù)據(jù)和搜集數(shù)據(jù)的量級(jí)和速度上將呈現(xiàn)幾何級(jí)數(shù)的爆發(fā)式增長(zhǎng)!
未來(lái),隨著互聯(lián)網(wǎng)應(yīng)用的進(jìn)一步擴(kuò)展以及傳感器不斷融入人類生活工作的方方面面,數(shù)據(jù)產(chǎn)生、搜集的速度和量級(jí)將不斷加速,人工智能的進(jìn)化速度也將加快。