国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

傳感器與機(jī)器學(xué)習(xí):應(yīng)用如何實(shí)現(xiàn)看、聽、觸、嗅、嘗

2018-07-22 10:05AndrewC.Oliver
計(jì)算機(jī)世界 2018年21期
關(guān)鍵詞:人臉識(shí)別機(jī)器物體

Andrew C. Oliver

這五種感覺是以傳感器和數(shù)學(xué)算法的方式實(shí)現(xiàn)的,通常為受監(jiān)督的機(jī)器學(xué)習(xí)算法和模型。

得益于深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、更快CPU和新型傳感器,計(jì)算機(jī)如今已經(jīng)能夠看到、聽到、觸到、嗅到、嘗到和說出來。這五種感覺都是以傳感器(如攝像頭)和數(shù)學(xué)算法的方式實(shí)現(xiàn)的,通常為受監(jiān)督的機(jī)器學(xué)習(xí)算法和模型。

看 圖像和人臉識(shí)別

近期對(duì)圖像和人臉識(shí)別的研究讓計(jì)算機(jī)不僅能夠檢測(cè)物體的存在,還能夠檢測(cè)相似物體的多個(gè)實(shí)例。Facebook和谷歌通過多個(gè)開源版本實(shí)際上已經(jīng)處于領(lǐng)先地位。Facebook表示他們的目標(biāo)是在視頻中檢測(cè)物體。

近年來,這一領(lǐng)域已經(jīng)取得了很大進(jìn)展,圖像中的物體能夠被從其他物體中分離出來。雖然我們能夠發(fā)現(xiàn)東西并將它們從另的東西中分離出來,但是并不意味著我們知道這個(gè)東西是什么。這就需要能夠識(shí)別這些東西的訓(xùn)練模型。

目前已經(jīng)出現(xiàn)了一些強(qiáng)大的工具,不過這些工具需要非常多的數(shù)據(jù)。因此Facebook和谷歌能夠公布這些工具,從研究和社區(qū)開發(fā)的衍生工具中獲得好處,而不用擔(dān)心該領(lǐng)域內(nèi)有太大的競(jìng)爭(zhēng)。簡(jiǎn)而言之,很少有機(jī)構(gòu)有數(shù)以百萬或數(shù)以億計(jì)的圖像可以提供給這些工具,并為此提供專用的計(jì)算力。

本質(zhì)上,用機(jī)器或深度學(xué)習(xí)將物體分類是“看”綿羊或小貓的第一步,包括各種衍生物(如大的、小的、有毛的、毛少的、瘦的、胖的、尾巴的)。然后是訓(xùn)練模型識(shí)別所有的這些變體。

雖然Facebook和谷歌投入了極大的精力,不過這一領(lǐng)域內(nèi)還有其他一些工具,如匯集了許多功能的OpenCV庫以及將重點(diǎn)入在了人臉識(shí)別上的OpenFace。

甚至還出現(xiàn)了名為Jevois(法語意思為“我看到”)的智能攝像頭。這種攝像頭為Arduino設(shè)備專用的攝像頭,后者擁有基于開源庫的預(yù)訓(xùn)練模型。它們被訓(xùn)練識(shí)別大約1,000種不同的物體。我們可以用自己的模型進(jìn)行調(diào)整。因此如果我們計(jì)劃建造一個(gè)可以自主飛行的四軸飛行器,那么我們的計(jì)劃將很可能會(huì)實(shí)現(xiàn)。

聽 語音識(shí)別和聲音

分類

計(jì)算機(jī)的“聽”更多的是關(guān)于語音識(shí)別。盡管如此,聲音分類是可能的。雖然Shazam(一款專業(yè)的音頻識(shí)別軟件)是其中的杰出代表,但是針對(duì)普通聲音分類的模型還不好用,或是沒有我們預(yù)期的那么豐富。PyAudioAnalysis可讓我們錄制.wav格式的文件并對(duì)聲音進(jìn)行分類。

你能抓住鳥的叫聲或是馬路噪音嗎?與圖像識(shí)別一樣,這意味著訓(xùn)練一個(gè)分類模型。這一領(lǐng)域目前似乎還缺乏投資。或許是因?yàn)镕acebook主要使用的是圖像和文字等靜默交流方式,谷歌也只推出了video.google.com 和 images.google.com,而沒有推出sounds.google.com的原因。

在語音識(shí)別方面,我們能夠找到一些使用傳統(tǒng)的隱馬爾可夫模型的開源工具,如CMUSphinx和使用神經(jīng)網(wǎng)絡(luò)的Kaldi。此外還有一些其他的工具,但是問題出在在線和離線解碼之間。“在線”意味著你能讀取麥克風(fēng),“離線”意味著在獲取.wav文件之前必須等待。

IBM、谷歌、蘋果和微軟等主要廠商都有著各自的工具。谷歌在這方面做的非常出色,我們甚至可以通過帶有 JavaScript的瀏覽器進(jìn)行語音識(shí)別。

觸 一種極端缺乏

公共技術(shù)的感覺

關(guān)于觸覺,似乎很少有關(guān)于如何使用觸摸傳感器進(jìn)行“感知”的資料。它們主要被應(yīng)用在控制應(yīng)用中(如以前的任天堂能量手套,許多人都想擁有一套,但是又非常的不好用。)

目前已經(jīng)出現(xiàn)了針對(duì)Arduino和相應(yīng)庫的“did you touch it”傳感器,以及用于檢測(cè)動(dòng)作的傳感器。最具前景的“did you touch it”創(chuàng)新是電容織物。盡管如此,在一臺(tái)“觸摸表面查看是否有缺陷”的實(shí)用型機(jī)器上,大部分都是光學(xué)或超聲波應(yīng)用。

嗅 電子鼻子

是的,計(jì)算機(jī)也能夠聞到氣味。目前這方面已經(jīng)有了許多實(shí)際應(yīng)用?!半娮颖亲印钡某霈F(xiàn)已經(jīng)有一段時(shí)間了。

最便宜的辦法是將一個(gè)傳感器接入Arduino設(shè)備中并“吸入”氣體。根據(jù)吸入氣體的量,它們能夠“檢測(cè)出”啤酒中使用的啤酒花等東西或是空氣是否有毒。這些技術(shù)已經(jīng)被應(yīng)用到了炸彈嗅探和質(zhì)量控制等方面。

嘗 另一種極端缺乏

公共技術(shù)的感覺

對(duì)于計(jì)算機(jī)來說“味覺”是什么?這是一種主觀感覺,許多人的味覺實(shí)際上是嗅覺。這里的傳感器多為化學(xué)、微生物、pH值和滴定傳感器。這方面的實(shí)際應(yīng)用非常廣泛,比如檢測(cè)你是否生病,體內(nèi)葡萄糖水平是否充足或是是否中毒等。

就像人體解剖學(xué)一樣,其又與嗅有著很大的重疊。這里幾乎沒有什么公開的源代碼,訓(xùn)練一個(gè)模型可能意味著要訪問化學(xué)實(shí)驗(yàn)室或來自化學(xué)實(shí)驗(yàn)室的數(shù)據(jù)。

我們還無法創(chuàng)建Data指揮官

有了這五種感覺,我們能否創(chuàng)建電影《星際迷航:下一代》中的Data指揮官,或是至少是他那愚蠢的堂弟B4(因?yàn)槲覀冞€沒有通用人工智能)?答案是可能還無法實(shí)現(xiàn)。即便我們有了這些傳感器和庫,我們?cè)诟鱾€(gè)方面還沒有經(jīng)過充分訓(xùn)練的模型。它們需要非常多的數(shù)據(jù),并且其中許多對(duì)于實(shí)時(shí)使用來說速度也跟不上。

因此,目前我們?nèi)匀辉谥铝τ谠谝曨l中進(jìn)行人臉識(shí)別。觸覺主要還依賴于“did you touch it?”傳感器或是其他單一用途的傳感器。嗅覺的情況也大致相同,味覺的情況最為糟糕。

不過,像機(jī)器學(xué)習(xí)和深度學(xué)習(xí)一樣,對(duì)于我們的單一用途的應(yīng)用(比如,咖啡變質(zhì)了嗎?),人工智能和傳感器已經(jīng)取得了很大的進(jìn)展。也許計(jì)算機(jī)的五種感覺不會(huì)達(dá)到人類的水平,但是它們會(huì)擁有這些感覺。目前已經(jīng)出現(xiàn)了許多可供開發(fā)者使用的免費(fèi)和專利工具。

本文作者Andrew C. Oliver為企業(yè)搜索解決方案提供商Lucidworks的技術(shù)支持經(jīng)理。

原文網(wǎng)址

https://www.infoworld.com/article/3267153/machine-learning/sensors-and-machine-learning-how-applications-can-see-hear-feel-smell-and-taste.html

猜你喜歡
人臉識(shí)別機(jī)器物體
機(jī)器狗
人臉識(shí)別 等
機(jī)器狗
揭開人臉識(shí)別的神秘面紗
深刻理解物體的平衡
我們是怎樣看到物體的
未來機(jī)器城
基于類獨(dú)立核稀疏表示的魯棒人臉識(shí)別
為什么同一物體在世界各地重量不一樣?
基于K-L變換和平均近鄰法的人臉識(shí)別