国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

無處不在的AI

2017-07-29 09:43:52許智博
南都周刊 2017年14期
關(guān)鍵詞:迪恩小池黃瓜

許智博

一個業(yè)余的“先驅(qū)者”

兩年前,喜歡動手編程的小池誠(Makoto Koike)厭倦了汽車零件公司里越來越繁重的管理工作,辭職回到了老家靜岡縣湖西市,他家的農(nóng)場就位于這個南臨太平洋的小地方。

在職業(yè)的空窗期,這個36歲的工程師索性陪自己的父母一起在大棚里種植黃瓜。大半年下來,小池發(fā)現(xiàn),從種植到收獲,整個過程里最累人的環(huán)節(jié),居然是黃瓜摘下來之后如何進行分揀。

在日本,農(nóng)業(yè)種植基本都是按照企業(yè)的合同要求進行,每家農(nóng)場對黃瓜品質(zhì)的劃分各有不同,單是小池家農(nóng)場一個品種的黃瓜,按照質(zhì)量要求就要分成9個等級。什么樣的黃瓜是好黃瓜?字面的標準很簡單:顏色鮮艷、刺兒多、體態(tài)均勻。但每天彎著腰面對上千根黃瓜、要把它們分到9個筐里去的時候,人要逐根判斷手里黃瓜的長短、粗細、顏色、紋理、是否有小刮痕、彎的還是直的、刺多不多……小池的母親務(wù)農(nóng)已經(jīng)超過40年,但仍要為分揀黃瓜每天耗費8到10個小時,累到腰酸背痛。

一個人想熟練掌握標準分類要幾個月的時間,到了采摘旺季,經(jīng)常是農(nóng)場主一家忙不過來,卻又無法雇臨時工來分擔。與日本大多數(shù)人一樣,小池認為,農(nóng)民的首要職責應(yīng)該是專注于種植,保證農(nóng)產(chǎn)品的品質(zhì)和味道,像分揀黃瓜這樣的事情應(yīng)該由機器去做。然而他跑到大型超市,卻發(fā)現(xiàn)市售的黃瓜分揀機根本不適合于農(nóng)場使用。

這時正好是AlphaGo在首爾與李世石對弈轟動世界的2016年3月,小池在電視里看到新聞,對AlphaGo后面的機器深度學習(deep learning)技術(shù)非常著迷,利用人工智能分揀黃瓜的念頭便從他的腦袋里冒了出來。

很快,小池按圖索驥了解到谷歌剛剛開放了一個名叫TensorFlow的開源軟件庫,專門用于開發(fā)各種“感知和語言理解任務(wù)”的人工智能軟件。在人工智能的“機器學習”里,使用“深度學習”圖像識別,可以使計算機能夠從大量的“訓練數(shù)據(jù)集”中學習圖像的重要“特征”。利用成熟的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,簡稱CNN,一種更高級的人工神經(jīng)網(wǎng)絡(luò),對于大型圖像處理有出色表現(xiàn))架構(gòu),“深度學習”后的“機器”可以高度準確地對圖像進行分類,在很多圖像的識別準確率會超出人眼。

TensorFlow的便利之處在于,使用者不需要知道那些編寫“深度學習”與卷積神經(jīng)網(wǎng)絡(luò)所需的高階數(shù)學模型和優(yōu)化算法,只要下載示例代碼并閱讀教程,然后按照要求輸入自己的數(shù)據(jù)就可以開始用它。它可在小到一部智能手機、大到數(shù)千臺數(shù)據(jù)中心服務(wù)器的各種設(shè)備上運行,這讓沒有接觸過“機器學習”的小池感到很輕松。

小池之前的工作是開發(fā)車載防碰撞預(yù)警系統(tǒng),作為一個理工男,他用了一塊不到40美元的樹莓派(Raspberry Pi)單板機電腦(一種從單片機發(fā)展而來的簡易電腦,旨在促進高校里的計算機教學普及,也經(jīng)常被程序員測試簡單的程序代碼使用)作為控制器,將數(shù)碼相機拍下的黃瓜照片上傳到TensorFlow平臺,先是利用一個小規(guī)模的人工神經(jīng)網(wǎng)絡(luò)來檢測這是不是黃瓜的照片,然后再將這些張照片轉(zhuǎn)發(fā)至服務(wù)器上一個更大的人工神經(jīng)網(wǎng)絡(luò)執(zhí)行更加精細的分類。

為了訓練“機器”可以更準確地分辨黃瓜,小池在3個月的時間里上傳了7000張自己家農(nóng)場的黃瓜照片,每一張都由小池的母親貼上了質(zhì)量分類標簽。這些照片如果擺在一起,感覺非常像中國綜藝節(jié)目《最強大腦》里經(jīng)常使用的、用來考察參賽選手眼睛和大腦反應(yīng)的照片墻。

因為硬件條件的限制,為了讓機器“學習”得更快一點,小池將照片的像素降低到了80X80,很快,機器對黃瓜分類的識別率就達到了95%左右。

2016年7月,小池組裝好了自己發(fā)明的黃瓜分揀機:新鮮的黃瓜被逐個放在一條窄窄的傳送帶上,先通過一道類似安檢門的攝像區(qū),機器迅速通過拍攝的圖像判斷出黃瓜的質(zhì)量等級,在黃瓜隨著傳送帶“走”到對應(yīng)質(zhì)量標簽的塑料筐旁邊的時候,一把由螺紋鋼、塑料卡子和硬紙片組成的“機械手臂”便輕輕將這根黃瓜“推”到筐子里去。

盡管因為上傳相片像素過低的原因,這套黃瓜分揀機在實踐時分揀的準確性從“訓練”時的95%降到了70%,但這個發(fā)明還是在電視媒體的報道下讓很多日本人驚訝不已,甚至給小池冠上了“農(nóng)業(yè)AI先驅(qū)者”的稱號。

用0和1寫代碼的人

其實,小池誠黃瓜分揀機,可以說是“站立在巨人肩膀”上的產(chǎn)物。

“訓練”這臺機器所使用的TensorFlow的開源軟件庫,是谷歌另外一個人工智能團隊Google Brain多年工作的智慧結(jié)晶之一,即便是后來被谷歌收購的DeepMind團隊,也將自己使用的軟件庫逐漸從最初的Torch(火炬)轉(zhuǎn)移到了TensorFlow。

雖然名噪世界的AlphaGo一般被認為是DeepMind的項目,但實際上,這個項目從最開始就是兩個人工智能團隊合作的產(chǎn)物。AlphaGo的主程序員大衛(wèi)·西維爾在采訪時曾真誠地說:“負責著Google Brain的杰夫·迪恩項目,在AlphaGo項目進行中的很多階段都提供了巨大的幫助,尤其是開發(fā)項目分布式計算的時候,迪恩可能是世界上最適合設(shè)計這些系統(tǒng)的人。”

西維爾所說的杰夫·迪恩(Jeff Dean),雖然頭銜看起來是很低調(diào)的“高級研究員”,但卻是硅谷大多數(shù)程序員心目的“職業(yè)偶像”。他有著一個典型美國人的外貌:瘦高,金發(fā),瘦長的臉上,五官如用刀雕刻出來一般棱角分明,笑起來嘴咧得很寬,話語熱情。他在高中時編寫了一個軟件來分析大量的流行病數(shù)據(jù),這個名叫Epi Info的軟件比當時的專業(yè)軟件快26倍,后來被美國疾病控制中心(Centers for Disease Control)采納并翻譯成13種語言。1999年加入谷歌的時候,他就已經(jīng)擁有了美國頂尖年輕計算機科學家的榮譽。

在谷歌,迪恩曾是僅次于兩個創(chuàng)始人拉里·佩奇和謝爾蓋·布林之外的傳奇,程序員之間流傳著無數(shù)贊美他編寫程序“唯快不破”和“永不出錯”的冷笑話,例如:“在2000年末的時候,杰夫·迪恩寫代碼的速度突然增長了40倍,原因是他把自己的鍵盤升級到了USB 2.0?!保ㄒ驗閁SB2.0的數(shù)據(jù)傳輸速度是USB1.0的40倍),而更直接的“吹法”是:“杰夫·迪恩是直接寫二進制機器代碼(即0和1組成的代碼,所有的編程語言最后都要被編譯器編譯成這種代碼讓硬件執(zhí)行)的,他寫源代碼,是為了給其他開發(fā)人員作參考?!?/p>

在硅谷IT企業(yè)的常識之一是,一個出色的軟件開發(fā)人員在一周中的工作可能需要一支近10人的團隊花幾個月才能完成,這種差異是指數(shù)級別的。這一點在一直追求“速度”的迪恩身上得到了非常好的體現(xiàn)。5月AlphaGo與柯潔在烏鎮(zhèn)對弈時,迪恩同樣來到了中國為參會的嘉賓和媒體講解TensorFlow和人工智能在各個領(lǐng)域的應(yīng)用情況。與記者聊天時,他絲毫不掩飾自己對于“效率”的追求:“我本科畢業(yè)的論文主題就是關(guān)于人工神經(jīng)網(wǎng)絡(luò)的并行訓練(parallel training),那個時候這個概念才剛剛興起,只是一個小規(guī)模的應(yīng)用,我就想是不是可以使用并行訓練來提高計算機系統(tǒng)的使用效率?!?/p>

迪恩加入谷歌時,谷歌只有20人。隨著谷歌變得越來越成功,它也碰到了一項巨大的技術(shù)挑戰(zhàn)——不能足夠快地部署更多的服務(wù)器來響應(yīng)需求。

迪恩和他的同事們一起找到了解決方案。先是印度裔天才程序員桑杰·格瑪沃爾特(Sanjay Ghemawat)團隊開發(fā)了谷歌文件系統(tǒng)(Google File System, GFS),使得超大型的數(shù)據(jù)文件能夠分布存儲在眾多廉價的服務(wù)器上。然后迪恩和格瑪沃爾特一起開發(fā)了一個名為MapReduce的編程工具,來幫助程序員有效地使用這些服務(wù)器并行處理龐大的數(shù)據(jù)集。正像編譯器幫助程序員在編寫程序的時候不用考慮CPU是如何處理該程序一樣,MapReduce使得谷歌的程序員在調(diào)整搜索算法或者增加新功能的同時不必擔憂如何將這些運算“并行”,也不必擔心如何處理硬件的故障。

MapReduce功能強大到在2004年馬上就變成了業(yè)界的標準,而且成為了眾多其他軟件項目的重要基石,尤其是對大量數(shù)據(jù)進行分布式處理的軟件框架Hadoop——正是Hadoop, 造就了現(xiàn)在的流行語“大數(shù)據(jù)”。

“在2011年,我覺得并行訓練似乎值得再次探索,因為無論是計算能力還是數(shù)據(jù)集,在過去的 20 年里,都已經(jīng)大幅增長,這導致了 Google Brain的起源?!钡隙髡f。

那一年,迪恩在休息室遇見了給谷歌做顧問的斯坦福大學計算機科學家吳恩達。吳恩達透露谷歌 X 實驗室中秘密推進的模仿人類大腦結(jié)構(gòu)、用于研究“神經(jīng)網(wǎng)絡(luò)”的Marvin項目(以著名的人工智能先驅(qū)馬文·明斯基命名)已經(jīng)取得了一些進展。

迪恩出于興趣,也開始將部分時間投入其中,并且招攬擁有神經(jīng)科學背景的科拉多(Greg Corrado)為助手。在那之后,Marvin項目在谷歌工程師口中變成了“Google Brain”。

與DeepMind的哈薩比斯從小想要的“通用型人工智能”概念類似,Google Brain也想要一種不需要人類“教”、而是能夠自己學習、進化的人工智能。一年后,Google Brain就在開發(fā)具有一歲兒童智力機器的實驗中取得了巨大進展:這個由16000個CPU組成的人工神經(jīng)網(wǎng)絡(luò)“DistBelief”自己從YouTube上隨機選取的1000萬段視頻,在無外界指令的自發(fā)條件下,它自主學會了識別貓的面孔(可見人類對于曬寵物這個行為是多么“喪心病狂”)。

在吳恩達2012年離開之后,迪恩請來了20世紀60年代就開始研究神經(jīng)網(wǎng)絡(luò)技術(shù)的先驅(qū)辛頓(Geoffrey Hinton,他的學生燕樂存(Yann LeCun)就是1989年首個提出卷積神經(jīng)網(wǎng)絡(luò)概念的人,現(xiàn)在為Facebook 人工智能實驗室負責人),幾個月后,這位被戲稱為“谷歌歷史上最重量級的實習生”的老教授在兩位學生的幫助下,在 ImageNet 大型圖像識別競賽中技驚四座——DistBelief不僅識別出猴子,而且能區(qū)分蛛臉猴和吼猴,以及各種各樣不同品種的貓。

DistBelief的成功讓谷歌其他的產(chǎn)品部門(如語音識別、Gmail等)都開始嘗試使用“機器學習”來改善和升級的自己產(chǎn)品,大幅度提高效率。不過DistBelief也有它的局限:僅僅以神經(jīng)網(wǎng)絡(luò)為目的,牢牢綁定在谷歌的內(nèi)部基礎(chǔ)設(shè)施上,幾乎不可能將代碼與外界共享。

于是迪恩和辛頓開始簡化和重構(gòu)DistBelief的代碼庫,使其變成一個更快、更強、更靈活的應(yīng)用級別代碼庫,形成了第二代平臺工具TensorFlow——或許在理論上,TensorFlow并沒有更新的突破,但是在工程學上,宣布“開源”而且可以對接多種硬件數(shù)據(jù)接口的TensorFlow,很快成為了全球“機器學習”開發(fā)者們最愿意用的開發(fā)平臺。

谷歌奉行“移動先行”(Mobile First) 的時代,安卓最終與蘋果的iOS在產(chǎn)業(yè)生態(tài)上分庭抗禮,而今谷歌的戰(zhàn)略變成了“人工智能先行”(AI First),對于業(yè)界另外的人工智能開發(fā)團隊來說,TensorFlow也許又將是一個新的標準制定者。

TensorFlow的項目主任拉賈·蒙加(Rajat Monga)在烏鎮(zhèn)期間對記者說:“在過去的一年半, TensorFlow 開源之后,已經(jīng)有很多開發(fā)人員取得了非??上驳某删?。在人工智能領(lǐng)域,中國屬于世界領(lǐng)先的國家之一,中國也是全球最大的 TensorFlow 開發(fā)人員社區(qū)之一。目前來看TensorFlow(中國的)下載量是14萬,有很多公司,比如小米和京東,還有在教育界,很多大學也都在用TensorFlow?!?h3>AI與生活的無縫連接

在5月份烏鎮(zhèn)的圍棋峰會上,Google Brain的TensorFlow團隊中的資深軟件工程師陳智峰特地邀請來賓們在手機上安裝“谷歌翻譯”的APP進行體驗,并以此為大家講解“機器學習”的原理。在APP里,手機不僅可以用語音識別人的話翻譯成需要的語種和文字,還可以利用手機的照相機鏡頭取景,直接在屏幕上將對準的文字直翻譯成另外一種語言顯示出來——這種被叫做“自然語言處理”(Neural Machine Translation,NMT)的翻譯技術(shù)涵蓋了語音識別、圖像識別、循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、端到端機器學習等主流的人工智能技術(shù),是與辛頓、燕樂存齊名的“人工智能三巨頭”里的約書亞·本吉奧(Yoshua Bengio)團隊在2015年發(fā)布的研究成果。

在這個技術(shù)里,“機器”在通過利用不同“語料”進行翻譯“訓練”的過程里,不僅改變了曾經(jīng)“A語言—英語— B語言”的詞組式機器翻譯(Phrase-Based Machine Translation),在直接實現(xiàn)了兩種語言“對應(yīng)”翻譯的同時,甚至會完成多個語種同時翻譯,而且準確率大幅度提升,在有些語種或是通俗表達中,甚至接近了人的水平。

在去年9月技術(shù)更新之后,日本東京大學人機交互教授暦本純一(Jun Rekimoto)在電腦上瀏覽網(wǎng)頁時,偶然發(fā)現(xiàn)谷歌機器翻譯的內(nèi)容質(zhì)量似乎比以前好了不少。他在谷歌翻譯上輸入了菲茨杰拉德的代表作《了不起的蓋茨比》里的一個英文節(jié)選段落,點擊翻譯后,與兩個日文版本進行對比,感覺是“谷歌翻譯的版本雖然還帶著機翻的痕跡,但更加通俗易懂”。隨后,暦本把自己口頭翻譯的《乞力馬扎羅的雪》的日語開頭部分簡單地輸入進電腦中,發(fā)現(xiàn)翻譯的英文結(jié)果幾乎可與海明威的原作媲美——而海明威的文風正是通俗易懂。

暦本將測試結(jié)果發(fā)在有著一萬多粉絲的 Twitter 上后,在短短幾個小時內(nèi),上千人也 曬出了他們“調(diào)戲”谷歌翻譯的結(jié)果——有些幾乎完美,而有的則啼笑皆非。在天亮前,谷歌翻譯進入了日本Twitter的頭條熱搜,把人氣偶像少女組合都擠了下去。很多人都很好奇:谷歌翻譯怎么會突然這樣讓我們眼前一亮?

今年3月底,谷歌NMT翻譯開始專門為中國用戶提供了這一版新的翻譯APP。一句中文都不會的NPR(美國全國公共廣播電臺)的記者Aarti Shahani,一個來自紐約的姑娘,成了第一批吃螃蟹的人之一。她先是舉著手機在鄭州進行嘗試,或許是因為口音的問題,很多話語一直翻譯不出來,但后來她在上海,卻完全可以一邊做指甲一邊通過手機的語音識別翻譯,跟36歲的美甲技師朱菊文愉快地對著手機互相“聊”了一個多小時家長里短。

值得一提的是,谷歌NMT翻譯技術(shù)在最初內(nèi)部利用TensorFlow調(diào)試系統(tǒng)去“學習”翻譯語言時,一開始選擇的就是“英漢互譯”。一方面,是因為開發(fā)人員主要是陳智峰和另外一個來自中國的程序員,需要使用兩種他們熟悉的語言;另一方面,因為漢語里存在助詞、虛詞、豎向排版等因素的“干擾”,漢語翻譯一直是長期以來依靠傳統(tǒng)翻譯的機器翻譯的“短板”。在人工智能“介入”翻譯之后,“英漢互譯”的準確度比原來提升了85%。在烏鎮(zhèn)圍棋峰會的發(fā)布會現(xiàn)場,媒體記者私下開玩笑說,真的很擔心同聲傳譯這個行業(yè)在以后就被機器翻譯取代了——因為在牛津大學最近針對“機器學習”的一項調(diào)查預(yù)測,未來10年人工智能可以超越人類能力水平的領(lǐng)域里,翻譯被排在了第一位。而在這個領(lǐng)域,除了谷歌之外,F(xiàn)acebook、百度等一干科技公司水平都不低,各有特色。

記者問陳智峰,“現(xiàn)在我們帶著手機去另外一個使用陌生語言的國家旅游、購物,是不是真的可行?”陳智峰沒有遲疑地回答:“我覺得是可以的?!?/p>

當然,對人工智能的開發(fā)者們來說,除了可以讓生活變得更加便利,去攻克人類最難解決的難題才讓他們更有成就感,Lily Peng所在的谷歌醫(yī)療團隊就是其中的代表之一。

Lily Peng除了是谷歌研究部醫(yī)學影像小組的產(chǎn)品經(jīng)理,同時也是一名非執(zhí)業(yè)醫(yī)師。她在加州大學舊金山分校及伯克利分校獲得了生物工程學的醫(yī)學博士學位及博士學位,畢業(yè)后先是與同學創(chuàng)業(yè),來到谷歌前,則供職于一家提供技術(shù)解決方案企業(yè)——這樣的經(jīng)歷讓她對醫(yī)療與科技的“結(jié)合”有著獨特的領(lǐng)悟。

從幾年前開始,Lily Peng團隊開始研究如何把機器學習技術(shù)運用到糖尿病視網(wǎng)膜病變(Diabetic Retinopathy)的診斷中。目前全球范圍內(nèi)有 4.15 億糖尿病患者面臨視網(wǎng)膜病變的風險。若是發(fā)現(xiàn)及時,該病是可以被治愈的,但若是未能及時診斷,則可能導致不可逆轉(zhuǎn)的失明。檢測糖尿病視網(wǎng)膜病變最常用的方法之一,是用眼球后部的掃描片進行分析,觀察是否有病變的征兆(例如微動脈瘤、出血、硬性滲出等),并判斷其嚴重程度。

Lily Peng 說:“我們最開始是選擇和印度醫(yī)院合作,是因為這個國家醫(yī)療人才短缺。印度有很多醫(yī)院發(fā)現(xiàn)有一些人是因為糖尿病引起的視網(wǎng)膜病變,但是由于一些醫(yī)生沒有經(jīng)過專業(yè)訓練,沒辦法對患者眼底照相之后進行圖像解讀。市場當中有這樣的需求,所以就觸發(fā)了我們和印度醫(yī)院進行合作,對他們的醫(yī)生進行了算法的培訓。”

通過與印度和美國的醫(yī)生密切合作,谷歌創(chuàng)建了一個包含 12.8 萬張眼底掃描圖片的數(shù)據(jù)集,用于利用TensorFlow“訓練”了一個檢測糖尿病性視網(wǎng)膜病變的人工神經(jīng)網(wǎng)絡(luò)。隨后,通過把神經(jīng)網(wǎng)絡(luò)的診斷結(jié)果,與 7 個美國委員會認證的眼科醫(yī)生的檢查結(jié)果相對比,來驗證其診斷靈敏度。結(jié)果表明,該算法的效果與眼科醫(yī)生小組的表現(xiàn)不相伯仲,甚至還比專業(yè)的醫(yī)生好一點點——而這個技術(shù)用于醫(yī)院時,醫(yī)生都感覺不到它的存在,因為機器掃描完病人的眼底CT片之后,就可以發(fā)現(xiàn)是否有病變點和判斷病情的嚴重程度?!斑@對于每天要接待幾十到上百病人的醫(yī)生來說,是一個可以大幅提高效率的工具,可以解放他們的時間去關(guān)心病人的身心。”Lily Peng 說。

這并不是“機器”在像素級別的圖片識別上第一次勝過人眼——在澳大利亞,莫道克大學 (Murdoch University)的霍奇森(Amanda Hodgson)動物保護研究團隊為了更好地保護族群嚴重下降的海牛,利用TensorFlow訓練機器分辨航拍海洋圖片,在45000張人眼看起來除了藍色之外什么都沒有的照片里,成功找到了許多海牛的具體位置,準確率達到了80%。

當然,人工智能在生活中的“觸手可及”遠非這幾個案例,或許在不久以后的美術(shù)館,“機器”可以根據(jù)你的表情為你找出匹配的名畫,手機也可以將你拍的照片變成各種風格的藝術(shù)作品;農(nóng)場里的養(yǎng)牛人每天點點手機屏幕就可以養(yǎng)好每一頭牛,農(nóng)用機具可以一邊播撒化肥一邊識別莊稼里的雜草并把它拔掉;在城市里,網(wǎng)約車或出租車將不再需要司機,自動駕駛就可以將你安全送達,或者還可以按照你的要求,中間去一個地方等你買個外賣。

只要“機器”自己會學習,很多事情都可以變得輕松有趣。

猜你喜歡
迪恩小池黃瓜
全民公敵
清新脆嫩的黃瓜
中老年保健(2021年5期)2021-08-24 07:08:02
黃瓜留瓜要注意兩點
我喜歡黃瓜
吉米問答秀
天天愛科學(2020年2期)2020-09-10 17:19:32
初夏《小池》
小池
小池何自暖如湯
人狗奇緣
摘黃瓜
仪陇县| 长治县| 新营市| 广南县| 莱阳市| 临潭县| 孝感市| 微博| 泰和县| 金秀| 荣成市| 新闻| 云霄县| 阜南县| 福鼎市| 肥东县| 寻乌县| 河源市| 石首市| 茂名市| 余干县| 视频| 佛冈县| 大洼县| 留坝县| 舒城县| 抚宁县| 修文县| 昌邑市| 德钦县| 长春市| 来宾市| 丰宁| 凤山县| 汽车| 南汇区| 德兴市| 天长市| 盈江县| 益阳市| 正阳县|