鼎宏
計算機算法通常需要成千上萬個例子才能學會一件事情,但谷歌DeepMind的研究人員卻找到一種繞過這一流程的方法。
多數(shù)人看過某個東西一兩次后就能認出這種物體,而計算機視覺識別和語音識別算法卻需要成千上萬個例子才能熟悉一種新的圖形或單詞。
谷歌DeepMind研究人員現(xiàn)在找到了一種新的方法,他們對深度學習算法進行了一些調(diào)整,使之只需通過一個例子便可認出圖像中的物體或其他東西—他們稱之為“單次學習”。該團隊針對大量添加了標簽的圖片以及手寫字體和語言對此進行了驗證。
最好的算法的確能夠可靠地識別物體,但由于需要龐大的數(shù)據(jù),所以非常耗費時間和金錢。例如,想要讓算法識別出道路上的汽車,就需要為其提供成千上萬個例子,這樣才能使無人駕駛汽車達到可靠的識別率。但要收集如此多的數(shù)據(jù)并不現(xiàn)實,如不可能為了讓一個機器人在一套不熟悉的房子里行走而為其提供長時間的學習機會。
谷歌DeepMind研究員奧里奧爾·溫亞爾斯(Oriol Vinyals)在深度學習系統(tǒng)中增加了一個記憶組件。該團隊利用一個名為ImageNet的標記圖片數(shù)據(jù)庫對該系統(tǒng)的能力進行了驗證。
這套軟件仍然需要分析數(shù)百種圖片,但此后就可以學會用一張照片識別新的物體。它本質(zhì)上是通過分析圖片中的獨特元素來完成識別任務(wù)。這種算法只需要看一個例子,便可達到近似于傳統(tǒng)深度學習系統(tǒng)的準確率。
溫亞爾斯稱,如果能夠快速識別出一個新單詞的意思,這項技術(shù)的用途便會得到明確體現(xiàn)。這對谷歌非常有用,因此該公司可以借此快速學習某個新的搜索項的含義。
之前也曾有人開發(fā)過單次學習系統(tǒng),但通常不兼容深度學習系統(tǒng)?!拔艺J為這是一種很有趣的方法,它提供了一種新穎的方式對大規(guī)模的數(shù)據(jù)庫進行單次學習?!表n國先進科技學院大腦和機器智能實驗室主任Sang Wan Lee說,“這為人工智能社區(qū)做出了技術(shù)貢獻,計算機視覺研究人員可能非常重視此事?!?/p>
但也有人對這項技術(shù)的用途提出質(zhì)疑,畢竟它與人類的學習方法存在很大差異。哈佛大學腦科學系副教授山姆·格什曼(Sam Gershman)表示,人類通常是通過理解一張圖像的組成元素來學習的,這需要一些實際的知識或嘗試。例如,“賽格威可能看上去與自行車或摩托車大不相同,但它卻可以使用相同的零件?!?/p>
不過,格什曼和Sang Wan Lee都表示,機器要在學習能力上比拼人類仍然要經(jīng)過一段時間的發(fā)展?!拔覀冞h遠沒有揭開人類單次學習的秘密?!盨ang Wan Lee說。