本刊記者 祝傳海 張欣浪
現(xiàn)實的理想主義者
——記國家“千人計劃”特聘專家、百度研究院副院長、深度學習實驗室主任余凱
本刊記者 祝傳海 張欣浪
余凱博士
21世紀進入第二個十年,互聯(lián)網(wǎng)也進入了一個新的時代。最明顯的標志,就是互聯(lián)網(wǎng)巨頭們對人工智能(Artificial Intelligence,AI) 技術(shù)的重視,甚至到了“得人工智能者得天下”的程度。2013年初,百度成立深度學習研究院(IDL),在中國互聯(lián)網(wǎng)企業(yè)中,第一個把深度學習提升到核心技術(shù)創(chuàng)新地位。
百度是一扇門。門內(nèi),是一個基于深度學習的智能平臺。門外,通往普羅大眾的俗世生活。百度IDL團隊所創(chuàng)造的,是一個更加“聰明”的百度,是一種更加“智慧”的生活方式?!拔覀兪亲龅氖乾F(xiàn)實的理想主義”,IDL負責人余凱如此說。
幾年前,大家都在猜測,百度要不要像微軟和IBM一樣設(shè)立研究院。當時百度內(nèi)部給出的答案是:時機未到。百度要等的,究竟是怎樣一個時機?2013年1月19日,從百度2012年年會現(xiàn)場傳出了一個爆炸性的消息,百度要成立一所專注于Deep Learning(深度學習)的研究院,并命名為Institute of Deep Learning (IDL,深度學習研究院)。
互聯(lián)網(wǎng)時代開始后,科技創(chuàng)新已經(jīng)從機器時代“讓人類跑得更快、飛得更高”,發(fā)展為“讓數(shù)據(jù)和信息說話”。而到了大數(shù)據(jù)時代,人類社會對于數(shù)據(jù)和信息的追求又上升到了另一個境界——把數(shù)據(jù)轉(zhuǎn)化為價值。“這里面最重要的核心技術(shù),就是人工智能。包括機器人在內(nèi)的人工智能可能是下一個產(chǎn)業(yè)革命的爆發(fā)點?!庇鄤P說。
2013年4月,《MIT技術(shù)評論》評選出2013突破性科學技術(shù),深度學習位居榜首,其余九個分別是:臨時社交媒體、育前DNA測序、基于3D打印的制造業(yè)、藍領(lǐng)機器人、記憶移植、智能手表、超高效太陽能、廉價手機大數(shù)據(jù)和超級電網(wǎng)。
“到了該發(fā)力的時候了”,百度前瞻性地抓住了國際大趨勢,也一下子站住了前沿。2014年8月,同樣是《MIT技術(shù)評論》,長篇大論地發(fā)表了一篇文章,介紹百度最近兩年在人工智能方面的技術(shù)進展。文章標題叫做《一個中國互聯(lián)網(wǎng)的巨人開始有夢想》?!耙郧皬膩頉]有主流國外科技媒體介紹中國企業(yè)的科技創(chuàng)新,我們覺得很自豪。”這不僅是余凱的感受,也是整個百度的榮耀。但他們并沒有沾沾自喜,就算再多人誤以為百度只是個搜索引擎,他們自己卻知道,從第一天起,百度就是個基于大數(shù)據(jù)的人工智能公司?!爸徊贿^這兩年更加高調(diào)地去投入做這件事?!庇鄤P說。
近年來,智能手機、智能手表、智能湯匙、智能手環(huán)、智能冰箱……整個業(yè)界,“智能”產(chǎn)品層出不窮,但這些產(chǎn)品都真的具有人工智能么?
余凱給我們科普,人工智能其實包括感知、理解、決策等幾個環(huán)節(jié),每個決策所產(chǎn)生數(shù)據(jù)再次進入感知環(huán)節(jié),通過理解,做出下一步?jīng)Q策,形成迭代循環(huán)。廣義上,這和人有相通之處:人通過感官可以感知到周圍的環(huán)境是什么樣子,可以通過人與人的的交流來獲取信息,從而理解哪里有障礙物,哪里可以行走,做哪些事情帶來什么樣的風險或收益。當人在形成理解之后,會決策該怎么做出相應的反應,繼而把思考的結(jié)果轉(zhuǎn)化為一個更加接近目標的現(xiàn)實。人工智能,就是讓機器像人一樣去感知、理解和決策,自主的完成一定的任務。
人類能夠“吃一塹,長一智”,真正的智能,也會隨著經(jīng)驗的累積,不斷去提升自己的感知、理解和決策的能力。一個基于人工智能的產(chǎn)品或服務,開始可能并不聰明,但用戶使用的時間越長,它就會越來越感受到用戶的習慣、喜好和需求,并把由這些數(shù)據(jù)在后臺建模分析判斷,進而來調(diào)整自身的行為。余凱指出:學習能力,才是人工智能的本質(zhì)。
現(xiàn)在很多產(chǎn)品宣傳中所說的“智能”,大多時候是“操控”,是一種完全被動的完成任務,而人工智能想要達到的是“自主”的目的。真正的智能空調(diào),會根據(jù)室溫和空間熱源分布的變化來調(diào)節(jié)溫度。而網(wǎng)頁上的熱門頻道和焦點的排序推薦,也是根據(jù)用戶歷史行為數(shù)據(jù)自動調(diào)整的。而更重要的是,絕大多數(shù)的所謂“智能”產(chǎn)品,都不具備學習的能力——它們并不會隨著用戶的不斷使用而變得越來越聰明。所以說,人工智能的一個本質(zhì)屬性是學習的能力,是隨著經(jīng)驗積累不斷成長的能力。那么什么是經(jīng)驗?其實經(jīng)驗就是數(shù)據(jù)。這也就是為什么今天人工智能變得觸手可及,因為我們處在大數(shù)據(jù)的時代。而移動互聯(lián)網(wǎng)的普及,使得海量數(shù)據(jù)每天都在產(chǎn)生。余凱舉了一個例子,同樣是發(fā)生在梵蒂岡圣彼得教堂的新教皇選舉,2005年,人們還只是在教堂前的廣場上等待;2013年,新的一屆教皇選舉來臨,而站在廣場上的那些人,幾乎手里都舉著手機在拍照。拍照這種行為本身,就意味著數(shù)據(jù)的產(chǎn)生?!敖裉?,我們每人身上平均帶著兩到三個聯(lián)網(wǎng)設(shè)備,到了未來,可能你的每個扣子都是一個聯(lián)網(wǎng)設(shè)備。有一種說法是,到2020年,每個人會有1000個聯(lián)網(wǎng)設(shè)備?!?/p>
余凱博士與Facebook人工智能實驗室主任Yann LeCun教授合影
那將是一個數(shù)據(jù)暴增的時代。要應對這種大規(guī)模的數(shù)據(jù),傳統(tǒng)的人工智能算法已經(jīng)力不從心,畢竟在數(shù)據(jù)達到一定規(guī)模之后,它的學習效果就不再增長。要實現(xiàn)飛躍式地發(fā)展,還要開發(fā)深度學習技術(shù)。深度學習能有效挖掘大數(shù)據(jù)帶來的紅利,數(shù)據(jù)規(guī)模越大,學習效果也越明顯,系統(tǒng)也更加智能。所以在大數(shù)據(jù)時代,深度學習受到極其廣泛的重視?!暗侥菚r,人們感受到的將是VIP式的服務”。
“假如說你想在網(wǎng)上訂一個披薩,第一步就要從網(wǎng)上找披薩店,找喜歡的口味。這一步就已經(jīng)可以實現(xiàn)個性化,網(wǎng)絡通過對你以往每天的搜索習慣進行行為分析,來推薦你喜歡的披薩,避免了盲目海選的煩惱。這一點用戶已經(jīng)在享受了。”
余凱試圖用訂披薩作為一個例子來詮釋人工智能給生活帶來的改變,他認為機器人將使互聯(lián)網(wǎng)服務從線上延伸到線下。就像訂披薩的流程,當網(wǎng)絡訂單傳到特定的披薩店后,即開始做披薩。現(xiàn)在的披薩店里同一種披薩的口味當然是基本無差別的,但在將來,機器人可能會參與到制作披薩的過程中,它們會與網(wǎng)絡系統(tǒng)直接關(guān)聯(lián),當你的個人喜好以數(shù)據(jù)形式導入它們的“大腦”中,制作出來的將會完全是“你的披薩”——口輕或者口重,放不放洋蔥,甚至其他看起來“詭異”的要求。
經(jīng)過真正的私人定制之后,披薩店還要把這份特別的披薩送到你手中。這時,“高度自動化駕駛”就要上場了。在高度自動化駕駛的幫助下,送餐車可以在百度地圖上找到距離送餐地點最近或者不堵車的路線,行進中隨時了解前方路況,以便安全及時送達。
“深度學習就是從現(xiàn)在連接到未來?,F(xiàn)在,線上部分已經(jīng)通過搜索、語音識別、圖像識別、自然語言理解來實現(xiàn)了個性化。未來,全套流程做下來,就是將線上累積的能力往線下延伸。裝有深度學習的大腦的機器人服務,就是互聯(lián)網(wǎng)服務的最后一公里。到那時,人們感受到的就是VIP式的服務。”余凱補充道。
余凱博士與前《連線》雜志主編、“長尾理論”創(chuàng)立者Chris Anderson合影
深度學習研究院是百度成立的首個研究院,也是中國第一家成立的深度學習研究機構(gòu)。“我們把深度學習帶入中國,而在國際上,我們也是最早把深度學習上升到戰(zhàn)略角度的四家公司之一。”余凱所說的四家公司中,除了百度,還有Google、微軟和Facebook。百度也高度重視人才引進、培養(yǎng)和優(yōu)化配置,當年,余凱就是被百度吸引過來的。
早在南京大學讀本科時期,余凱就對人工智能和神經(jīng)網(wǎng)絡非常癡迷,四處尋找相關(guān)書籍,每每看得熱血沸騰。用他的話說,看到人工神經(jīng)網(wǎng)絡可以模擬人的大腦做那么多事情,就會激動得睡不著覺,非要泡在實驗室里,哪怕通宵達旦也要手把手地嘗試去編程序做實驗。到了碩士階段,他已經(jīng)在嘗試用神經(jīng)網(wǎng)絡來研究語音系統(tǒng)的處理。1999年,他第一次參加全國性的學術(shù)會議,他發(fā)表的有關(guān)神經(jīng)網(wǎng)絡的論文就拿到了大會最佳論文獎。
讀研二那年,余凱做了個大膽的決定,到德國去進修數(shù)據(jù)挖掘和機器學習?!斑@是我最喜歡的方向,而到歐洲那么有文化底蘊的地方去待一段時間也是個很美妙的人生經(jīng)歷?!睘榱诵牡椎膱猿郑鄤P申請到了西門子獎學金,又說服了導師讓他提前一年拿到碩士,終于去了德國著名學府慕尼黑大學,師從著名計算機科學家、ACM Fellow、Hans-Peter Kriegel和著名機器學習專家Volker Tresp?!罢娴男U幸運的,從一開始就做自己最喜歡的事情,一直都沒有改過?!庇鄤P微笑著說。博士畢業(yè)后,余凱進入西門子公司總部。兩年半之后,他已經(jīng)是西門子的高級研究員,卻開始向往美國NEC研究院。
多年后,他坐在百度大廈這間會議室里,給我們講述當時的選擇。“在機器學習過去的20年中,曾經(jīng)有過兩次熱潮,第一個是SVM模型及其理論的興起和普及,其發(fā)明者是統(tǒng)計學習理論奠基人、美國工程院院士Vladimir Vapnik。當時Vapnik就在美國NEC研究院工作。第二個熱潮就是深度學習,代表人物之一是Yann LeCun,現(xiàn)在我們在深度學習中最常用的卷積神經(jīng)網(wǎng)絡,就是他發(fā)明的。他曾經(jīng)在美國NEC研究院做機器學習部門的主任,而深度學習最廣泛的應用的隨機梯度下降算法SGD,NEC研究院的Leon Bottou是權(quán)威學者”。
在當時,美國NEC研究院是機器學習領(lǐng)域當之無愧的幾個重鎮(zhèn)之一。余凱希望自己能夠在那里得到進一步的提升。加入美國NEC研究院之后第三年,余凱成為研究院最年輕的部門主任,領(lǐng)導一支有國際聲譽的團隊在機器學習、圖像識別、多媒體檢索、視頻監(jiān)控、數(shù)據(jù)挖掘和人機交互等方面的技術(shù)研發(fā)。數(shù)年下來,他在頂尖會議和雜志發(fā)表的高質(zhì)量論文,被同行引用7000多次,帶領(lǐng)團隊多次獲得國際技術(shù)評測的第一名。2014年底,已成為Facebook人工智能實驗室主任的Yann LeCun在一個訪談中,提到深度學習最初的幾個重量級研究團隊,包括多倫多、斯坦福、NEC加州實驗室等。其中,NEC加州實驗室指的就是余凱領(lǐng)導的團隊。
在美國工作期間,他在加州大學Santa Cruz分校給研究生講授“ISM245: 數(shù)據(jù)挖掘”,在斯坦福大學計算機系為研究生講授“CS121: 人工智能概論”,也曾多次出現(xiàn)在Google、Microsoft、MIT、UC Berkeley等著名研發(fā)機構(gòu)的講壇上。在國際人工智能/機器學習領(lǐng)域,余凱的影響力已經(jīng)不容小覷。可是,2012年4月,他飛過太平洋,來到了北京海淀區(qū)上地十街10號,這里是百度大廈所在。
“我回國是因為我確實想回國?!庇鄤P形容自己過去的旅程,是從中國向西飛到德國,6年后又往西飛到美國加州,再過6年,再一次西飛回到中國?!罢美@地球一圈”,余凱笑言,這種“全球化”的人生經(jīng)歷,讓他可以和不同文化背景的人在一起,用比較開放的心態(tài)來工作和生活,是他人生中的一筆寶貴財富。但無論如何,飛得久了,總要回來。
當然,還有一個重要原因是美國NEC研究院只是一個研究機構(gòu),不能持續(xù)地產(chǎn)生數(shù)據(jù),而人工智能只有在有大數(shù)據(jù)的互聯(lián)網(wǎng)企業(yè)中才能得到真正的發(fā)展。這一點,把人工智能當成使命的余凱是不能忍受的。他要尋找一個重視技術(shù)的互聯(lián)網(wǎng)公司,繼續(xù)自己的理想?!白詈玫臄?shù)據(jù)在互聯(lián)網(wǎng)公司。Robin本來就是人工智能專家,非常重視技術(shù),百度是一個最好的選擇?!?/p>
事實上,余凱不是杞人憂天。缺乏數(shù)據(jù)基礎(chǔ)成為美國NEC研究院的尷尬,到2014年,曾經(jīng)在美國NEC研究院工作過的機器學習代表人物Yann LeCun、Vadimir Vapnik、Jason Weston等都已經(jīng)投入Facebook門下,而Leon Bottou加入微軟。早在2012年,余凱加入百度后,出自美國NEC研究院的著名的機器學習專家徐偉、黃暢等也相繼加入百度。
近兩年來,百度在人工智能和深度學習方面投入幾十億的資金。從2014年烏鎮(zhèn)峰會上傳來風聲看,百度還將繼續(xù)加大對此的研發(fā)力度。有了這個后盾,余凱也有了對未來的底氣。從百度多媒體部技術(shù)副總監(jiān),到百度研究院副院長,他和團隊可以走的路越來越敞亮。
余凱博士團隊獲得2項2014年度百度最高獎
假如你漫步在博物館,對某幅畫產(chǎn)生了興趣,只要你用手指在虛空中對著這幅畫畫個圈,你頭上的BaiduEye就能確定你所要了解的對象,將這幅畫的作者、創(chuàng)作背景,甚至商業(yè)價值等都“悄悄”告訴你。
假如你在商場購物,看到一件時裝,BaiduEye可以立刻把品牌、款式、價格,甚至用戶評價的對比結(jié)果都反饋給你,輕輕松松就可以貨比三家。假如你是位醫(yī)生,正在進行手術(shù),BaiduEye可以忠實地記錄手術(shù)現(xiàn)場,并實現(xiàn)實時遠程會診。
“BaiduEye是一個原型性產(chǎn)品,我們已經(jīng)在和銀泰百貨合作開展零售業(yè)的應用,跟國家博物館進行旅游業(yè)的合作?,F(xiàn)在,還在進行醫(yī)療行業(yè)的試水。一來可以通過遠程分析和語音指導來做手術(shù),二來一旦出現(xiàn)醫(yī)療糾紛可以調(diào)出手術(shù)記錄來分清責任。”余凱說。
2014年上線的BaiduEye絕對是一個熱點,無論從功能還是外觀上,關(guān)注度都超過了之前的谷歌眼鏡。“因為Eye是自然的人的身體的一部分,Glass是附帶外加的。它就像一個助手一樣,它真的知道你此時此刻在看什么東西,從而真的把互聯(lián)網(wǎng)后臺的服務變成你的大腦,讓你知道如何去更加精準的決策?!?/p>
支持BaiduEye的就是百度大腦。或者說,百度大腦支持著百度旗下的眾多衍生品。百度大腦系統(tǒng),是一個大規(guī)模的計算機系統(tǒng),有幾千臺服務器并行計算。它具備隨著經(jīng)驗的不斷演化的特點,隨時都在不斷學習和演進,每天的數(shù)據(jù)(用戶在網(wǎng)上的行為)都會放入百度大腦去分析,以便于百度大腦積累經(jīng)驗。它具有構(gòu)建百億級參數(shù),也是世界上最大的深度學習神經(jīng)網(wǎng)絡。在物種上,從單細胞生物到哺乳動物到靈長動物,隨著神經(jīng)元數(shù)目的增長,它們的智能水平在增長。百度大腦也一樣,它的網(wǎng)絡規(guī)模和智能水平成正比,神經(jīng)網(wǎng)絡參數(shù)越多,智能水平發(fā)展的潛力也越大。
有了這兩個最基本的能力,百度大腦就能夠開發(fā)世界上最領(lǐng)先的深度算法和系統(tǒng)?!吧疃葘W習很有意思的一點,是與人腦的表示方式有相通之處。譬如說視覺系統(tǒng)處理模式,從低層次的信號,到高層次的語義,是逐層變換的。我們通過數(shù)據(jù)去訓練一個深度學習系統(tǒng),也是形成一層一層的數(shù)據(jù)表示——從底層的像素到邊界的提取,再到對物體各個部位的檢測和提取,一直進展到對整個物體的檢測?!?/p>
深入百度大腦,里面用到一種叫深度語義神經(jīng)網(wǎng)絡的模型,它是百度大腦用自然語言去匹配query和網(wǎng)頁的語義相關(guān)性。這是業(yè)界第一次把深度學習用于提升搜索精度的成功案例,也是迄今為止深度學習用于語言文本信息最成功的應用。
提到搜索,很多人想到的可能都是在搜索引擎上輸入一串詞語,按一下回車鍵,再逐個點開查看哪個是自己想要的。用慣了的人可能不覺得,但這種傳統(tǒng)的搜索方式其實是把不習慣鍵入文字內(nèi)容甚至不會輸入法的人排除在外的。
而在這間會議室,余凱用自己的手機給我們展示百度大腦為移動搜索帶來的新體驗:用手機拍下一盆不知名的室內(nèi)植物,就可以看到百度百科對它的描述;拍下農(nóng)夫山泉的瓶子,價格和供應商等相關(guān)信息都會跳出來;對著話筒說一句“請問怎么到科學中國人雜志社”,路線就有了;拍一張中文菜單,可以翻譯成英文;不會做的作業(yè),拍下來上傳搜索,就能在百度知識庫里找到相應的解答……
余凱博士試駕正在研究的高度自動化汽車
余凱博士在未來論壇發(fā)表演講
百度翻譯、百度作業(yè)幫、涂書筆記、百度識圖、百度魔圖……它們都有自己的名字。網(wǎng)上搶票的驗證碼太過奇葩,百度可以幫你轉(zhuǎn)化;運單上的手寫電話號碼看不清,百度也能來識別。“現(xiàn)在的單字準確率可以達到95%,但按照整個序列來說只有80%,不過我們的內(nèi)部技術(shù)每個月都在提升?!庇鄤P很為百度出品自豪,他們的圖像檢索技術(shù)可以實現(xiàn)高精準的以圖搜圖,在相關(guān)產(chǎn)品的精準度對比上,68%優(yōu)于谷歌,4%相仿,18%略差于谷歌。這個成績已經(jīng)是世界最好的精準度了。何況,他們不僅能識別圖片主體,還能識別圖片背景,在某項世界級的大賽中,超過谷歌,拿到了冠軍。
“一輛黃色的巴士開過來,沿途綠樹成蔭。”余凱指點著一幅畫圖下的說明文字,告訴我們那是百度大腦自動生成的語言。“人在看到圖片的時候往往會反應出相應的信息,并可以用自然語言描述出來。機器是不是能做到這件事呢?經(jīng)過我們在人工智能技術(shù)上的突破,終于可以了?!?/p>
回國后,余凱就帶領(lǐng)百度的語音和圖像等團隊開展面向互聯(lián)網(wǎng)搜索和移動應用的基礎(chǔ)技術(shù)研發(fā),推動了深度學習技術(shù)在互聯(lián)網(wǎng)各業(yè)務方向的突破和應用。這些,是他和團隊積累下來的成果。到現(xiàn)在,利用深度學習之后,百度在移動搜索上的語音識別技術(shù)的成長,超過了過去15年里用所有技術(shù)帶來的提升總和。
在圖像方面、OCR、人臉識別、物體檢測等方面,百度都取得世界最領(lǐng)先的成績。在百度核心廣告業(yè)務方面,深度學習也顯著提升了廣告投放的精準性,在提升用戶體驗的同時,也大大提升了百度的營收。在2015年1月18日極客公園大會上,Robin說到:“三年前我決定大手筆投入的時候,我覺得這個事兒五年、十年以后才能受益,但沒想到一兩年以后已經(jīng)看到了對我們現(xiàn)有業(yè)務的提高,這是超出自己想象的”。
對百度來說,僅有這些還是不夠的。他們還在延展真正的線下服務,譬如說“高度自動化駕駛”。注意,是高度自動化駕駛,不是無人駕駛。余凱認為,像谷歌那樣直接做無人駕駛,遇到的阻力會比較大,不容易成功。技術(shù)問題雖然好解決,但是中國現(xiàn)有的道路狀況是不是合適?政策法規(guī)有沒有合理的規(guī)范?路上同時有自動駕駛車輛和人工駕駛車輛時,要如何協(xié)調(diào)?“這是整個行業(yè)產(chǎn)業(yè)的問題,但是我們不一定非要等到理想狀態(tài)實現(xiàn)的那一天才有事情做。”
他分析道,第一個階段是輔助駕駛,當行車途中遇到行人或其他障礙時,車輛會自動報警,但能不能采取措施是司機的事。第二個階段是主動安全,也就是說,假如真的檢測到前面有個小孩,不管司機有沒有應對,車子自己都會停下來。第三個階段是在限定條件下的自動駕駛,比如在高速公路上自動巡航、保持車距、識別彎道等,目前還做不到,但是在大型倉儲中心內(nèi)部進行貨物運輸會先一步實現(xiàn),也就是特定場景下的自動駕駛。再往后,自動化程度會越來越高。“每個階段都有商機,我們會采取更加現(xiàn)實主義的做法,一步步推進,看如何與市場和國民經(jīng)濟對接。”
在現(xiàn)實的理想主義思路下,百度已經(jīng)在開發(fā)高度自動化駕駛項目,開發(fā)大規(guī)模的高精度三維地圖?!皹I(yè)界的地圖精準到幾米,我們可以精準到車道線、電線桿的位置,大概10~20厘米。這是高度自動化的先決條件?!爆F(xiàn)在圍繞北京五環(huán)以及京新高速公路(G7)的三維地圖已經(jīng)建設(shè)完成。結(jié)合高精度地圖和動力系統(tǒng)的仿真建模,自動駕駛的控制算法就可以不必每次都上路調(diào)試,完全可以在計算機上仿真完成。“我們是用低成本的設(shè)備和高端的算法來做事。不然的話,像谷歌現(xiàn)在加到車上的傳感器,都夠買好幾輛車了?!庇鄤P調(diào)侃道。
余凱博士團隊獲得2014年度第三季“百度好聲音”冠軍
“外界媒體總是把IDL和微軟、谷歌等國際公司的研究院放在一起比較,其實我們比它們做的事情還多,對公司核心業(yè)務的影響更大。”在余凱心里,百度IDL是個極其特殊的團隊。在設(shè)計之初,百度對IDL的期待很多,首當其沖的,就是為百度保持對世界一流人才的吸引力。余凱說,“我很幸運,不僅Robin對人工智能高度重視,而且百度還擁有一支從上到下、志同道合的強悍的團隊,我的直接上級高級副總裁王勁對我也非常支持。IDL的很多進展離不開他的直接領(lǐng)導?!?/p>
在余凱的帶領(lǐng)下,相關(guān)技術(shù)團隊分別于2013年、2014年三次獲得百度百萬美金最高獎?!?014年百度的6個最高獎,我們拿了兩個。百度好聲音,我們也拿第一名?!庇鄤P對現(xiàn)有團隊的評價是:一個充滿激情和理想主義的團隊——work hard,play harder。
他總是說,IDL這兩年推出的成果,真正做出努力的是這個團隊,而非他本人?!拔覜]有什么管理經(jīng)驗,也不認為自己是個管理者?!痹趪鈺r,余凱曾經(jīng)的上司跟他說過一句話:管理者一般都是命令人,優(yōu)秀的領(lǐng)導者啟發(fā)人、挖掘人的潛能。余凱想做的是引導者,引導方向、創(chuàng)造環(huán)境、激發(fā)團隊每個人的潛力。絕大多數(shù)時候,他都在鼓勵和贊美隊員,然后適當給予調(diào)整。他相信,只懂得聽從和服從的,不會成為真正的創(chuàng)新團隊。而百度IDL需要他們的主動性和創(chuàng)造性。
“谷歌要做深度學習的話,周邊IBM、微軟等企業(yè)都有豐富的儲備人才。而我們是在中國互聯(lián)網(wǎng)企業(yè)第一個做深度學習的,招聘的時候沒有可參照的樣本。直到現(xiàn)在,整個產(chǎn)業(yè)也是偏弱的。所以,我們從全球招聘最優(yōu)秀的人才,也在通過百度項目讓人才得到成長。希望能夠通過展現(xiàn)優(yōu)秀的成果和團隊氛圍,吸引更優(yōu)秀的人和我們在一起?!彼闹行乃枷胫挥幸粋€——精英,數(shù)量不重要,只要是精英。2014年5月,余凱成功的說服多年的好朋友,將美國斯坦福大學人工智能實驗室主任Andrew Ng教授吸引到百度,成為轟動全球科技界的一個標志性事件。
百度IDL的第二個使命是為公司現(xiàn)有的核心業(yè)務以及長期的業(yè)務發(fā)展提供技術(shù)動力,這一點,他們顯然做到了。
“能在整個互聯(lián)網(wǎng)發(fā)展上提供指引性的、創(chuàng)新性的思想。”余凱說,這才是百度IDL的第三個使命。就像百度不只是搜索,這群踐行現(xiàn)實理想主義的人,他們的野心也從來不只是在百度內(nèi)部,他們想要爭取的是業(yè)界的影響力和話語權(quán)。