李蓉慧
今年4月末的Facebook F8開(kāi)發(fā)者大會(huì)上,扎克伯格親自上臺(tái)展示了一個(gè)相機(jī)特效平臺(tái),可以做出具備增強(qiáng)現(xiàn)實(shí)(AR)效果的照片和體驗(yàn)。事后有不少外部評(píng)論簡(jiǎn)單地認(rèn)為,這無(wú)非是Facebook用于打擊Snapchat的一款產(chǎn)品,但Facebook CTO Mike Schroepfer表示,這個(gè)相機(jī)特效平臺(tái)背后的技術(shù)都是由人工智能的細(xì)分領(lǐng)域—視覺(jué)識(shí)別的革新帶來(lái)的,其中他著重介紹Yann LeCun在革新技術(shù)中的貢獻(xiàn),贊賞他從1990年代就開(kāi)始做相關(guān)實(shí)驗(yàn)。
早在2006年,News Feed里就使用了機(jī)器學(xué)習(xí),曾被視為Facebook第一次在產(chǎn)品中引入人工智能技術(shù)。然而直到10年后—扎克伯格2016年年初宣布新年計(jì)劃時(shí),聲稱要在家里建立一套人工智能系統(tǒng)。在華盛頓大學(xué)計(jì)算機(jī)系教授Pedro Domingos看來(lái),從那個(gè)時(shí)點(diǎn)算起,F(xiàn)acebook才開(kāi)始真正重視發(fā)展人工智能技術(shù)。相比已經(jīng)讓自動(dòng)駕駛汽車上路的Google和在實(shí)驗(yàn)室里已塞滿諸多人工智能設(shè)想的微軟等硅谷技術(shù)巨頭,F(xiàn)acebook確實(shí)遲到了。
人工智能不僅是眼下的“風(fēng)口”,每個(gè)公司都在說(shuō),隨著數(shù)據(jù)的增加,分析和處理數(shù)據(jù)對(duì)技術(shù)公司提出了新的要求,而Facebook亦不例外。不過(guò),按照硅谷技術(shù)公司里“如果一個(gè)產(chǎn)品沒(méi)有出問(wèn)題就不需要去解決它”的普遍共識(shí),相比Google、微軟等其他競(jìng)爭(zhēng)對(duì)手,F(xiàn)acebook對(duì)于人工智能的需要似乎更為迫切,因?yàn)樗呀?jīng)面臨亟待解決的問(wèn)題。
且不說(shuō)這家公司現(xiàn)在掌管著全球1/5的人口的社交數(shù)據(jù),隨著數(shù)據(jù)增長(zhǎng),其分析和處理的能力的不斷提升,以及產(chǎn)品用戶體驗(yàn)的進(jìn)一步提升,這些都需要調(diào)用大量的人工智能技術(shù)—對(duì)于Facebook來(lái)說(shuō)一個(gè)更為現(xiàn)實(shí)而敏感的話題則是—2016年美國(guó)總統(tǒng)大選假新聞事件讓它在輿論中處于被動(dòng)地位,作為一家技術(shù)公司,其中立立場(chǎng)遭到普遍質(zhì)疑。
在去年的美國(guó)總統(tǒng)大選之前,F(xiàn)acebook曾在法國(guó)關(guān)停了大約3萬(wàn)個(gè)試圖傳播虛假新聞的賬號(hào)。盡管Facebook目前在全球擁有超過(guò)1.8萬(wàn)名員工,它仍需要依靠技術(shù)手段來(lái)迅速有效地找到解決問(wèn)題的方法。今年4月27日,在針對(duì)假新聞發(fā)布的《信息運(yùn)營(yíng)白皮書(shū)》中,F(xiàn)acebook首次公開(kāi)承認(rèn),在“假新聞”這個(gè)范疇內(nèi),有“惡意行動(dòng)者”在美國(guó)總統(tǒng)大選期間通過(guò)虛假身份在該平臺(tái)上傳播虛假消息,從而影響了政治輿論。
在持續(xù)發(fā)酵的假新聞事件后,扎克伯格在建立全球社區(qū)的宣言中多次提到人工智能技術(shù)。在《信息運(yùn)營(yíng)白皮書(shū)》中,F(xiàn)acebook表示公司已經(jīng)在利用人工智能技術(shù)來(lái)探測(cè)并刪除不當(dāng)內(nèi)容。所以說(shuō),F(xiàn)acebook持續(xù)加大AI研發(fā)的動(dòng)力不可謂不足。
回顧Facebook對(duì)人工智能領(lǐng)域的探索歷史,盡管它從2006年就開(kāi)始在News Feed上使用機(jī)器學(xué)習(xí)(Machine learning),但是當(dāng)時(shí)的做法比較基礎(chǔ)。而那一年,神經(jīng)網(wǎng)絡(luò)之父、多倫多大學(xué)教授Geoffrey Hinton在神經(jīng)信息處理系統(tǒng)大會(huì)(NIPS,Natural Information Processing System)上第一次提出了深度學(xué)習(xí)(Deep learning)的說(shuō) 法。
到了2012年,雖然晚于Google、微軟等公司,但Facebook也開(kāi)始參與贊助人工智能學(xué)術(shù)會(huì)議。最知名的對(duì)象,就是人工智能領(lǐng)域最著名的學(xué)術(shù)會(huì)議NIPS。
Facebook意識(shí)到應(yīng)該在前沿理論研究領(lǐng)域補(bǔ)課,已經(jīng)是2013年的事。此前,作為一款誕生于大學(xué)的社交軟件,F(xiàn)acebook一直沒(méi)有建立自己的學(xué)術(shù)研究部門,這與Google、微軟的做法很不同。Google本來(lái)是兩個(gè)創(chuàng)始人拉里·佩奇、謝爾蓋·布林在讀博士期間的一個(gè)研究項(xiàng)目,因此Google的研究部門在公司已存在多年,角色更像是內(nèi)部的一個(gè)“學(xué)術(shù)機(jī)構(gòu)”,而微軟的情況也大抵如 此。
當(dāng)2013年的NIPS在美國(guó)加州北部的度假區(qū)Lake Tahoe舉辦時(shí),扎克伯格出現(xiàn)在會(huì)場(chǎng),并宣布紐約大學(xué)教授Yann LeCun將加入Facebook,成為Facebook新成立的人工智能實(shí)驗(yàn)室(Facebook Artificial Intelligence Research,下簡(jiǎn)稱“FAIR”)的負(fù)責(zé)人。
Yann LeCun被稱為全球深度學(xué)習(xí)三個(gè)主要奠基人之一,他發(fā)明的筆跡識(shí)別系統(tǒng),全球的各個(gè)銀行都在使用。為了表示對(duì)學(xué)者的尊敬和重視,據(jù)稱扎克伯格在拜訪LeCun教授之前特意讀了他的論文,這份誠(chéng)意讓LeCun感到意外。作為紐約大學(xué)終身教授的LeCun不想離開(kāi)紐約,一心求賢的Facebook甚至同意將Facebook AI實(shí)驗(yàn)室的總部設(shè)立在紐約曼哈頓。如今,LeCun已經(jīng)是Facebook在人工智能領(lǐng)域的旗幟人物。
對(duì)一個(gè)技術(shù)公司來(lái)說(shuō),招聘資深學(xué)者的舉動(dòng),收獲不僅是教授們的研究結(jié)果,更重要的是,按照學(xué)界的“門第”觀念,邀請(qǐng)到一個(gè)知名教授來(lái)公司做研發(fā)負(fù)責(zé)人,將意味著他名下的學(xué)生也會(huì)隨之慕名而來(lái),假以時(shí)日便會(huì)自上而下構(gòu)建出一個(gè)源源不斷的人才庫(kù)。美國(guó)媒體Buzzfeed在近期的一篇報(bào)道中提及,從2013年成立至今,LeCun所帶領(lǐng)的FAIR團(tuán)隊(duì)已經(jīng)有80多名成員,他們分布在紐約、巴黎和Facebook總部Menlo Park的實(shí)驗(yàn) 室。
談到自己在Facebook的作用,LeCun對(duì)Buzzfeed表示,在“工程師至上”的Facebook,需要的不僅是直接關(guān)注產(chǎn)品的人才,同時(shí)也需要能將基礎(chǔ)的技術(shù)和理論研究轉(zhuǎn)化給產(chǎn)品團(tuán)隊(duì)用的人才。
Word2Vec就是LeCun團(tuán)隊(duì)為Facebook開(kāi)發(fā)出的一款工具。在2016年假新聞事件后,這個(gè)工具幫助Facebook來(lái)標(biāo)注平臺(tái)上的內(nèi)容,從而厘清內(nèi)容是誰(shuí)發(fā)布、誰(shuí)分享的,據(jù)此來(lái)識(shí)別假新聞的特征和人的分享行為,再用機(jī)器學(xué)習(xí)清除掉它們。
設(shè)立于公司內(nèi)的理論研究機(jī)構(gòu),通常會(huì)面對(duì)的一個(gè)核心問(wèn)題是關(guān)于純學(xué)術(shù)理論與產(chǎn)品導(dǎo)向研究的比例。產(chǎn)品導(dǎo)向的課題研究,會(huì)更多涉及到公司產(chǎn)品文化和工作流程如何將研究結(jié)果順利導(dǎo)入產(chǎn)品。LeCun的想法是FAIR團(tuán)隊(duì)的工作可以保持在70%是中長(zhǎng)期的技術(shù)理論研究,剩下30%則與近期公司的產(chǎn)品直接相關(guān)。
成功挖到LeCun之后,接下來(lái)Facebook要考慮的問(wèn)題,便是如何將理論研究團(tuán)隊(duì)的科研成果廣泛而有效地作用于Facebook的產(chǎn)品研發(fā)中。為此,F(xiàn)acebook設(shè)置了一個(gè)很關(guān)鍵的“銜接者”角色。這個(gè)人不僅要理解LeCun的人工神經(jīng)網(wǎng)絡(luò)研究,還要了解Facebook自己的產(chǎn)品,更重要的是他能夠在規(guī)模已經(jīng)足夠大的Facebook產(chǎn)品研發(fā)團(tuán)隊(duì)里幫LeCun的團(tuán)隊(duì)推廣研究結(jié)果,同時(shí),他還要負(fù)責(zé)與LeCun的團(tuán)隊(duì)做溝通,讓他們能夠及時(shí)了解Facebook對(duì)理論研究的需 求。
眼下,這位“關(guān)鍵先生”就是Joaquin Candela—他是Facebook應(yīng)用機(jī)器學(xué)習(xí)團(tuán)隊(duì)(Applied Machine Learning,下簡(jiǎn)稱“AML”)負(fù)責(zé)人。
Joaquin Candela出生于西班牙,在加入Facebook之前,他和Yann LeCun的學(xué)術(shù)研究有一絲微妙的淵源:他們都曾師從于Geoffrey Hinton的弟子。
Joaquin Candela畢業(yè)后先是加入了微軟在英國(guó)劍橋的實(shí)驗(yàn)室,他的研究結(jié)果曾經(jīng)用于必應(yīng)搜索。由于不太喜歡微軟內(nèi)部的流程,Candela在2012年加入Facebook的廣告部門,當(dāng)時(shí)Facebook的廣告部門也已經(jīng)開(kāi)始使用機(jī)器學(xué)習(xí)的技術(shù),但模型比較簡(jiǎn)單。
在接受一次媒體采訪時(shí)Candela曾解釋過(guò),微軟內(nèi)部是通過(guò)競(jìng)爭(zhēng)機(jī)制來(lái)決定研究結(jié)果的產(chǎn)品化,他覺(jué)得這種流程從效果來(lái)看速度太慢了。也許Facebook的流程和文化更適合Joaquin Candela的想法。幾位在Facebook工作的工程師都曾向《第一財(cái)經(jīng)周刊》證實(shí),一向喜歡強(qiáng)調(diào)“Done is better than perfect”(完成比完美更有價(jià)值)的Facebook,其內(nèi)部產(chǎn)品研發(fā)的過(guò)程確實(shí)會(huì)遵循這一宗旨,能快速做出一個(gè)產(chǎn)品比讓產(chǎn)品盡善盡美更為要 緊。
廣告的最大競(jìng)爭(zhēng)力往往在于廣告和用戶的相關(guān)性。從這個(gè)角度來(lái)說(shuō),Google是通過(guò)獲取用戶的搜索關(guān)鍵詞來(lái)分析用戶需要,而Facebook的廣告團(tuán)隊(duì)很有動(dòng)力利用機(jī)器學(xué)習(xí)提高廣告的準(zhǔn)確率,他們會(huì)通過(guò)用戶的畫(huà)像來(lái)判斷每個(gè)用戶究竟喜歡什么樣的廣告內(nèi)容。
在FAIR成立兩年后,2015年9月,F(xiàn)acebook宣布成立AML團(tuán)隊(duì),一個(gè)月后Joaquin Candela接到任命,成為該團(tuán)隊(duì)的負(fù)責(zé)人。Candela表示,如果說(shuō)LeCun的團(tuán)隊(duì)做理論研究和直接為Facebook做產(chǎn)品的時(shí)間七三開(kāi),那么AML團(tuán)隊(duì)的工作精力分配則正好與之相反,因?yàn)锳ML團(tuán)隊(duì)的任務(wù)就是將LeCun團(tuán)隊(duì)的研究結(jié)果“產(chǎn)品化”。
在Menlo Park的Facebook總部,這兩個(gè)團(tuán)隊(duì)通常會(huì)坐在一起—Joaquin Candela和Yann LeCun都向Facebook的CTO Mike Schroepfer匯報(bào)??梢哉f(shuō),F(xiàn)AIR+AML正是Facebook逐漸摸索出來(lái)的一套AI研發(fā)模式,它的價(jià)值在于既保持有純理論研究的獨(dú)立空間,同時(shí)又能及時(shí)對(duì)實(shí)際產(chǎn)品產(chǎn)生影響。
這兩個(gè)團(tuán)隊(duì)首度聯(lián)手完成的一個(gè)杰作,就是在Facebook內(nèi)部建立了一個(gè)可以廣泛使用的系統(tǒng):它能將與人工智能相關(guān)的研究結(jié)果先在公司內(nèi)部平臺(tái)上實(shí)現(xiàn)充分共享,加速產(chǎn)品團(tuán)隊(duì)更有效地部署人工智能技 術(shù)。
2016年5月,F(xiàn)acebook對(duì)內(nèi)第一次正式介紹了這個(gè)名叫FBLearner Flow的產(chǎn)品。此時(shí)Facebook在機(jī)器學(xué)習(xí)方面的能力,業(yè)界口碑已經(jīng)僅次于Google。
有一種說(shuō)法將FBLearner Flow稱為Facebook整個(gè)人工智能的母體。簡(jiǎn)單來(lái)說(shuō),它就是一個(gè)可以為全公司員工管理各種機(jī)器學(xué)習(xí)模型的機(jī)器學(xué)習(xí)軟件,里面裝滿了由Facebook工程師開(kāi)發(fā)的上百萬(wàn)個(gè)算法,方便其他同事直接共享。
有了這個(gè)平臺(tái),F(xiàn)acebook的工程師不需要專門的人工智能技術(shù)培訓(xùn),他們只要通過(guò)簡(jiǎn)單的API調(diào)用,使用搭建在FBLearner Flow的工具就可以學(xué)習(xí)并在自己的垂直產(chǎn)品中加載人工智能。
使用了這個(gè)機(jī)器學(xué)習(xí)算法模型共享平臺(tái)之后,F(xiàn)acebook稱,現(xiàn)在他們?cè)趫D片識(shí)別方面的準(zhǔn)確率達(dá)到98%。在今年的F8大會(huì)上,CTO Mike Schroepfer就人工智能對(duì)于視覺(jué)識(shí)別效果的改進(jìn),專門拿出一張圖片為例,這張圖上顯示的是一個(gè)女人在廚房里彎腰摸她的寵物狗。Schroepfer說(shuō),2012年Facebook只能識(shí)別出的圖片中都有哪些信息,而到了2017年,F(xiàn)acebook的技術(shù)不僅可以看出圖片中有什么,還能判斷出圖中的人彎腰的姿勢(shì)是在做什么。Mike Schroepfer驕傲地對(duì)臺(tái)出的觀眾表示,最初發(fā)明這一技術(shù)的人眼下正在Facebook的AI團(tuán)隊(duì)中。
其實(shí)幾年以前,Mike Schroepfer就曾對(duì)媒體指出,當(dāng)人工智能技術(shù)真正成熟,F(xiàn)acebook希望達(dá)到的效果是,如果一個(gè)用戶心情不好,F(xiàn)acebook能給他推送一些小動(dòng)物的視頻;如果一個(gè)用戶很久沒(méi)有和媽媽聯(lián)系,F(xiàn)acebook會(huì)主動(dòng)給他推送媽媽當(dāng)前的狀態(tài)。
如今的Facebook已經(jīng)將人工智能技術(shù)滲入團(tuán)隊(duì)開(kāi)發(fā)工具和公司的戰(zhàn)略產(chǎn)品之中,用戶在信息推薦、過(guò)濾攻擊言論、推薦熱門話題、搜索結(jié)果排名等領(lǐng)域,都能不同程度地體驗(yàn)涉及人工智能技術(shù)的功能應(yīng)用。
去年夏天扎克伯格在規(guī)劃以相機(jī)拍照為核心的平臺(tái)產(chǎn)品時(shí),親自協(xié)調(diào)AML團(tuán)隊(duì)與具體產(chǎn)品團(tuán)隊(duì)的合作開(kāi)發(fā)事宜,該項(xiàng)目團(tuán)隊(duì)隨即進(jìn)入“Lockdown”狀態(tài)(這是Facebook在開(kāi)發(fā)重要產(chǎn)品時(shí)的保密狀態(tài),它意味著所有參與人員要放下手頭所有的工作而全力投入到某項(xiàng)重要產(chǎn)品開(kāi)發(fā))。
這款產(chǎn)品在研發(fā)的中后期引入了“神經(jīng)網(wǎng)絡(luò)”來(lái)支持軟件,即直接在用戶的手機(jī)上運(yùn)行,不需要通過(guò)服務(wù)器,據(jù)稱“這不僅提高了識(shí)別圖像的速度,還解決了過(guò)去因?yàn)檫\(yùn)算速度限制而不能實(shí)現(xiàn)的特效操作”。未來(lái)如果Facebook用外接設(shè)備與App相連,這種小而輕的方式會(huì)減少運(yùn)算成本,對(duì)Facebook這種用戶體量的公司來(lái)說(shuō),將是指數(shù)級(jí)別。
作為Facebook在人工智能領(lǐng)域的3個(gè)核心人物—無(wú)論是Yann LeCun、Joaquin Candela還是Facebook CTO Mike Schroepfer,都認(rèn)為Facebook還處于應(yīng)用人工智能的早期。事實(shí)上,這種先構(gòu)建核心團(tuán)隊(duì),而后通過(guò)建立內(nèi)部共享平臺(tái),以更高效的方式持續(xù)孵化人工智能應(yīng)用的AI研發(fā)模式,在硅谷其他大公司也得到過(guò)不錯(cuò)的驗(yàn)證。
Google同樣在通過(guò)人工智能技術(shù)給自己“造血”來(lái)提高研發(fā)效率。今年2月,Google的深度學(xué)習(xí)開(kāi)源框架TensorFlow正式對(duì)外發(fā)布1.0版本,這個(gè)開(kāi)源產(chǎn)品的工作原理與FBLearner Flow工具相似,但它從語(yǔ)言翻譯到皮膚癌的早期檢測(cè)、預(yù)防糖尿病致盲等方面已經(jīng)應(yīng)用于超過(guò)6000個(gè)在線開(kāi)源代碼倉(cāng)庫(kù)。
相比Google、微軟等公司,F(xiàn)acebook還是一個(gè)年輕的公司,在文化和溝通機(jī)制體現(xiàn)出一些優(yōu)勢(shì),但它仍需在AI研發(fā)和應(yīng)用落地方面加快速度,且要保持高度謹(jǐn) 慎。
從今年開(kāi)始,不斷發(fā)生在Facebook上的暴力直播事件正引發(fā)新的爭(zhēng)議。最近泰國(guó)的一名父親在Facebook上直播殺死自己女兒的全過(guò)程,當(dāng)時(shí)有37萬(wàn)人觀看了這個(gè)視頻。盡管這些有害視頻后來(lái)都被發(fā)現(xiàn)和移除,但對(duì)普通用戶來(lái)說(shuō),他們并不了解用技術(shù)去發(fā)現(xiàn)并屏蔽一個(gè)視頻背后的過(guò)程,以及是誰(shuí)在保護(hù)他們免受類似傷害,他們看到的只會(huì)是那個(gè)特別糟糕的結(jié)果。
從“37萬(wàn)人”這個(gè)觀看數(shù)字以及如今19.4億月活躍用戶來(lái)說(shuō),F(xiàn)acebook對(duì)社會(huì)的影響,早已不只是一家硅谷技術(shù)公司這么簡(jiǎn)單。