傳感器與機(jī)器學(xué)習(xí)：應(yīng)用如何實(shí)現(xiàn)看、聽、觸、嗅、嘗

2018-07-22 10:05AndrewC.Oliver

計(jì)算機(jī)世界 2018年21期

Andrew C. Oliver

這五種感覺是以傳感器和數(shù)學(xué)算法的方式實(shí)現(xiàn)的，通常為受監(jiān)督的機(jī)器學(xué)習(xí)算法和模型。

得益于深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、更快CPU和新型傳感器，計(jì)算機(jī)如今已經(jīng)能夠看到、聽到、觸到、嗅到、嘗到和說出來。這五種感覺都是以傳感器（如攝像頭）和數(shù)學(xué)算法的方式實(shí)現(xiàn)的，通常為受監(jiān)督的機(jī)器學(xué)習(xí)算法和模型。

看圖像和人臉識(shí)別

近期對(duì)圖像和人臉識(shí)別的研究讓計(jì)算機(jī)不僅能夠檢測(cè)物體的存在，還能夠檢測(cè)相似物體的多個(gè)實(shí)例。Facebook和谷歌通過多個(gè)開源版本實(shí)際上已經(jīng)處于領(lǐng)先地位。Facebook表示他們的目標(biāo)是在視頻中檢測(cè)物體。

近年來，這一領(lǐng)域已經(jīng)取得了很大進(jìn)展，圖像中的物體能夠被從其他物體中分離出來。雖然我們能夠發(fā)現(xiàn)東西并將它們從另的東西中分離出來，但是并不意味著我們知道這個(gè)東西是什么。這就需要能夠識(shí)別這些東西的訓(xùn)練模型。

目前已經(jīng)出現(xiàn)了一些強(qiáng)大的工具，不過這些工具需要非常多的數(shù)據(jù)。因此Facebook和谷歌能夠公布這些工具，從研究和社區(qū)開發(fā)的衍生工具中獲得好處，而不用擔(dān)心該領(lǐng)域內(nèi)有太大的競(jìng)爭(zhēng)。簡(jiǎn)而言之，很少有機(jī)構(gòu)有數(shù)以百萬或數(shù)以億計(jì)的圖像可以提供給這些工具，并為此提供專用的計(jì)算力。

本質(zhì)上，用機(jī)器或深度學(xué)習(xí)將物體分類是“看”綿羊或小貓的第一步，包括各種衍生物（如大的、小的、有毛的、毛少的、瘦的、胖的、尾巴的）。然后是訓(xùn)練模型識(shí)別所有的這些變體。

雖然Facebook和谷歌投入了極大的精力，不過這一領(lǐng)域內(nèi)還有其他一些工具，如匯集了許多功能的OpenCV庫以及將重點(diǎn)入在了人臉識(shí)別上的OpenFace。

甚至還出現(xiàn)了名為Jevois（法語意思為“我看到”）的智能攝像頭。這種攝像頭為Arduino設(shè)備專用的攝像頭，后者擁有基于開源庫的預(yù)訓(xùn)練模型。它們被訓(xùn)練識(shí)別大約1，000種不同的物體。我們可以用自己的模型進(jìn)行調(diào)整。因此如果我們計(jì)劃建造一個(gè)可以自主飛行的四軸飛行器，那么我們的計(jì)劃將很可能會(huì)實(shí)現(xiàn)。

聽語音識(shí)別和聲音

分類

計(jì)算機(jī)的“聽”更多的是關(guān)于語音識(shí)別。盡管如此，聲音分類是可能的。雖然Shazam（一款專業(yè)的音頻識(shí)別軟件）是其中的杰出代表，但是針對(duì)普通聲音分類的模型還不好用，或是沒有我們預(yù)期的那么豐富。PyAudioAnalysis可讓我們錄制.wav格式的文件并對(duì)聲音進(jìn)行分類。

你能抓住鳥的叫聲或是馬路噪音嗎？與圖像識(shí)別一樣，這意味著訓(xùn)練一個(gè)分類模型。這一領(lǐng)域目前似乎還缺乏投資。或許是因?yàn)镕acebook主要使用的是圖像和文字等靜默交流方式，谷歌也只推出了video.google.com 和 images.google.com，而沒有推出sounds.google.com的原因。

在語音識(shí)別方面，我們能夠找到一些使用傳統(tǒng)的隱馬爾可夫模型的開源工具，如CMUSphinx和使用神經(jīng)網(wǎng)絡(luò)的Kaldi。此外還有一些其他的工具，但是問題出在在線和離線解碼之間。“在線”意味著你能讀取麥克風(fēng)，“離線”意味著在獲取.wav文件之前必須等待。

IBM、谷歌、蘋果和微軟等主要廠商都有著各自的工具。谷歌在這方面做的非常出色，我們甚至可以通過帶有 JavaScript的瀏覽器進(jìn)行語音識(shí)別。

觸一種極端缺乏

公共技術(shù)的感覺

關(guān)于觸覺，似乎很少有關(guān)于如何使用觸摸傳感器進(jìn)行“感知”的資料。它們主要被應(yīng)用在控制應(yīng)用中（如以前的任天堂能量手套，許多人都想擁有一套，但是又非常的不好用。）

目前已經(jīng)出現(xiàn)了針對(duì)Arduino和相應(yīng)庫的“did you touch it”傳感器，以及用于檢測(cè)動(dòng)作的傳感器。最具前景的“did you touch it”創(chuàng)新是電容織物。盡管如此，在一臺(tái)“觸摸表面查看是否有缺陷”的實(shí)用型機(jī)器上，大部分都是光學(xué)或超聲波應(yīng)用。

嗅電子鼻子

是的，計(jì)算機(jī)也能夠聞到氣味。目前這方面已經(jīng)有了許多實(shí)際應(yīng)用?！半娮颖亲印钡某霈F(xiàn)已經(jīng)有一段時(shí)間了。

最便宜的辦法是將一個(gè)傳感器接入Arduino設(shè)備中并“吸入”氣體。根據(jù)吸入氣體的量，它們能夠“檢測(cè)出”啤酒中使用的啤酒花等東西或是空氣是否有毒。這些技術(shù)已經(jīng)被應(yīng)用到了炸彈嗅探和質(zhì)量控制等方面。

嘗另一種極端缺乏

公共技術(shù)的感覺

對(duì)于計(jì)算機(jī)來說“味覺”是什么？這是一種主觀感覺，許多人的味覺實(shí)際上是嗅覺。這里的傳感器多為化學(xué)、微生物、pH值和滴定傳感器。這方面的實(shí)際應(yīng)用非常廣泛，比如檢測(cè)你是否生病，體內(nèi)葡萄糖水平是否充足或是是否中毒等。

就像人體解剖學(xué)一樣，其又與嗅有著很大的重疊。這里幾乎沒有什么公開的源代碼，訓(xùn)練一個(gè)模型可能意味著要訪問化學(xué)實(shí)驗(yàn)室或來自化學(xué)實(shí)驗(yàn)室的數(shù)據(jù)。

我們還無法創(chuàng)建Data指揮官

有了這五種感覺，我們能否創(chuàng)建電影《星際迷航：下一代》中的Data指揮官，或是至少是他那愚蠢的堂弟B4（因?yàn)槲覀冞€沒有通用人工智能）？答案是可能還無法實(shí)現(xiàn)。即便我們有了這些傳感器和庫，我們?cè)诟鱾€(gè)方面還沒有經(jīng)過充分訓(xùn)練的模型。它們需要非常多的數(shù)據(jù)，并且其中許多對(duì)于實(shí)時(shí)使用來說速度也跟不上。

因此，目前我們?nèi)匀辉谥铝τ谠谝曨l中進(jìn)行人臉識(shí)別。觸覺主要還依賴于“did you touch it？”傳感器或是其他單一用途的傳感器。嗅覺的情況也大致相同，味覺的情況最為糟糕。

不過，像機(jī)器學(xué)習(xí)和深度學(xué)習(xí)一樣，對(duì)于我們的單一用途的應(yīng)用（比如，咖啡變質(zhì)了嗎？），人工智能和傳感器已經(jīng)取得了很大的進(jìn)展。也許計(jì)算機(jī)的五種感覺不會(huì)達(dá)到人類的水平，但是它們會(huì)擁有這些感覺。目前已經(jīng)出現(xiàn)了許多可供開發(fā)者使用的免費(fèi)和專利工具。

本文作者Andrew C. Oliver為企業(yè)搜索解決方案提供商Lucidworks的技術(shù)支持經(jīng)理。

原文網(wǎng)址

https：//www.infoworld.com/article/3267153/machine-learning/sensors-and-machine-learning-how-applications-can-see-hear-feel-smell-and-taste.html

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

傳感器與機(jī)器學(xué)習(xí)：應(yīng)用如何實(shí)現(xiàn)看、聽、觸、嗅、嘗

傳感器與機(jī)器學(xué)習(xí)：應(yīng)用如何實(shí)現(xiàn)看、聽、觸、嗅、嘗