如今,隨著人工智能技術大爆發(fā),華裔科學家李飛飛的名字越來越多地被人提及。在幾乎由男性統(tǒng)治的全球科技界,她無疑是其中最富傳奇色彩的一位。她是美國工程院、美國醫(yī)學院和美國藝術與科學學院的“三院院士”,也是前谷歌副總裁。李飛飛在AI 領域有多重要?之前AI 領域的重點在算法,數(shù)據(jù)并不受重視,李飛飛是最早意識到數(shù)據(jù)在人工智能研究中的重要性的科學家之一。她組建了全世界最早、最大的圖片識別數(shù)據(jù)庫ImageNet,打開了計算機深度學習的大門,因此李飛飛被稱為“AI教母”。然而,成為頂級科學家的她,并非一開始就拿著人生贏家的劇本。李飛飛度過了非常艱難的青少年時期,實現(xiàn)逆襲靠的是一股探索與奮進的心勁兒。
李飛飛生于北京,長于成都,父母都是知識分子,爸爸是工程師,媽媽是一名老師。
李飛飛與生俱來的好奇心,某種程度上繼承自父親。父親天性散漫,據(jù)說在她出生的那天,因為一時興起跑去公園觀鳥忘了時間,錯過了見證女兒出生的重要時刻,名字中的“飛飛”,就來源于這段經(jīng)歷。
飛飛和父親沒有傳統(tǒng)父女間的等級關系,他們之間更像同齡人,父親對大自然的熱愛向飛飛展示了最純粹的好奇心,這些經(jīng)歷在她心中播下了科學的種子,讓她對探索自己視野以外的事物產(chǎn)生了永不滿足的渴望。
母親完全相反,對科學不感興趣,但熱愛文學。她會帶著女兒讀魯迅的作品和《道德經(jīng)》《老人與?!返冉?jīng)典。
因為在期末考試前還癡迷于閱讀米蘭·昆德拉的《不能承受的生命之輕》,李飛飛被叫了家長。可母親卻將老師的抱怨一句句懟了回去,沒有絲毫責怪女兒的意思。回家路上,她對李飛飛說:“我把你教得太好了?!?/p>
和母親期望的不同,李飛飛最愛的不是文學,而是數(shù)學。中學接觸物理后,物理又成了她最癡迷的科目,連騎自行車轉彎時都在思考加速度和角動量的變化。
李飛飛把頭發(fā)剪得極短,拒絕穿裙子,全身心投入她的興趣中,尤其是航空航天科學、高超聲速飛機的設計,甚至還有不明飛行物等超自然話題……
1992 年,16 歲的李飛飛和父母移民到了美國新澤西州的一個小鎮(zhèn)里。對未來的美好幻想,在他們一家踏上美國土地的那一刻立刻破滅了。
首要難題就是語言,父母幾乎不懂英語,父親在一家華人開的店里找到維修相機的工作,每天很晚才下班。母親在商店找到一份收銀員的工作,遠離了她熱愛的文學。
日子很難挨。一家三口擠在只有一間臥室的公寓里,家具是從路邊的垃圾里撿的。為了補貼家用,每一個不上學的日子, 李飛飛都會去打零工。最常見的工作是去中餐館打雜,從上午11 點工作到晚上11 點,總共12 小時,時薪2 美元。
曾經(jīng)引以為傲的學業(yè)也變成了負擔。李飛飛幾乎不會說英語,每一節(jié)課,無論什么科目,對她而言都是英語課。每天回家做作業(yè),她都要準備兩本詞典,一本英譯中,一本中譯英,否則就寫不了作業(yè)。
自我表達也成了一種奢望?!安粫f話”的李飛飛交不到朋友,成績也一落千丈——考試的時候,很多題目她都看不懂。幸運的是,數(shù)學和物理兩門課受到的影響很小。學習它們,更多依賴數(shù)字、符號和公式。李飛飛對數(shù)學和物理的狂熱也沒有隨著移民到美國而改變。
李飛飛曾回憶說,她在很長一段時間里,每天只睡4 小時,但覺得這樣的辛苦不算什么,“因為我父母也同樣在努力工作”。
好在,辛苦的付出,換來了好的結果。高中畢業(yè)時,李飛飛考出了數(shù)學滿分的成績,成功申請到了普林斯頓大學的全額獎學金。她的成功,也轟動了整個小鎮(zhèn)。然而,李飛飛沒有選擇醫(yī)學、金融這種能通向富裕階層的專業(yè),而是選擇了自己癡迷的——物理專業(yè)。
“真是張好彩票,可惜浪費了。”鄰居們無法理解她的選擇。
普林斯頓大學對李飛飛來說就是天堂,讓她在知識的海洋里不斷找尋那顆指引自己的“北極星”,那個可以讓她為之癡迷和奮斗的問題。
但她依然很窮,要從洗衣房撿別人扔掉的衣服穿,每個周末,都要回家里的干洗店幫忙。本科畢業(yè)時,她明明有機會去華爾街賺錢,或者選擇斯坦福和麻省理工這樣的頂級名校,但她偏偏選了名氣弱一點的加州理工大學,因為這里有她想學的東西。在20 世紀90年代末的計算機熱下,一個問題引起了李飛飛的注意:機器可以掌握人類的智慧嗎?李飛飛就此關注到了人工智能領域。但當時正值“AI 寒冬”,這個時候入行,顯然不是好時機,但李飛飛不在乎這些。
教機器像人一樣識別圖片中的物體,是人工智能研究領域的一項重大難題。而這也是李飛飛最重要的貢獻——創(chuàng)建了數(shù)據(jù)庫ImageNet。人工智能領域的從業(yè)者評論,“沒有ImageNet,就沒有現(xiàn)在的深度學習革命”。
然而起步之初,李飛飛的想法遭到了幾乎所有人的反對。但李飛飛確信她正在做一件也許具有歷史意義的大事。她確定了一個目標,為每個物品類別搜集1000 張不同的照片:1000 張不同的小提琴照片、1000 張不同的德國牧羊犬照片、1000 張不同的抱枕照片,直到涵蓋全部2.2 萬個類別,也就是一共需要大約2000 萬張圖片。
這個工作量太大了。按照既定的速度,ImageNet 完工需要整整19 年。更重要的是,此時,她的“師爺”吉滕德拉也站在反對者的一邊,讓她深受打擊。
“我?guī)缀蹩梢钥吹轿业谋睒O星在逐漸暗淡下來,我的道路又陷入了黑暗之中。一個可怕的想法開始在我心頭升起:我承擔的風險比我意識到的更大,而現(xiàn)在回頭已經(jīng)為時太晚?!崩铒w飛回憶。
然而,一切都還沒有結束。在一位叫孫民的研究生的建議下,李飛飛知道了亞馬遜開發(fā)的土耳其機器人。正是這款機器人把起初的大學生標注員隊伍變成了一個數(shù)千人組成的國際團隊。預計完成時間也由19 年變成10年、5 年、2 年,最后不到1 年。
然而,資金需求也逼近團隊所能負擔的極限,2009 年,李飛飛決定跳槽去斯坦福大學,那里為她的研究提供了新的研究資金。
2009 年6 月,ImageNet的初始版本終于完成:收集了1500 萬張圖片,涵蓋了2.2 萬個不同類別。這些圖片篩選自近10 億張候選圖片,并由來自167 個國家的4.8 萬多名貢獻者進行了標注。ImageNet 不僅在規(guī)模和多樣性上達到了李飛飛多年來夢寐以求的水平,還保持了一致的精確度。
李飛飛的辛勤付出讓機器具備像人一樣“看”的能力。更重要的是,她用大數(shù)據(jù)訓練多層神經(jīng)網(wǎng)絡的想法,從圖像擴展到語音、文字、視頻等其他領域,引爆了持續(xù)到現(xiàn)在的AI 革命。
面對“AI 是否會取代人類”的擔憂,她深信,人作為機器學習和模仿的對象,有機器永遠無法替代的能力和價值,“AI可以輔助人們更好地完成工作,但無論我們?nèi)绾斡柧殭C器,它們都無法復制人類的智慧和創(chuàng)造力”。她要竭盡所能保證AI 的勝利不能只是科學的勝利,而必須是人文的勝利,包括她自己在內(nèi)的科學家有責任將AI 訓練為“遵循優(yōu)良的學術傳統(tǒng),愿意協(xié)作,尊重他人的意見與專業(yè)的機器”。
給機器呈現(xiàn)整個世界曾經(jīng)是她的“北極星”,讓她為之癡迷并前行,她做到了。現(xiàn)在,她要追尋下一顆“北極星”,就像李飛飛在自傳《我看見的世界》中說的:“每一種新的追求,每一個新的癡迷,都懸掛在黑暗的地平線上,閃爍著耀眼的光芒,向不懈追求的人招手致意?!?/p>
(摘自“中信出版”微信公眾號)