告訴大家,這項(xiàng)技術(shù)的關(guān)鍵,根本不在于“搖一搖”,而是要?dú)w功于里面一項(xiàng)很神秘的核心技術(shù):音頻指紋識別。
如果你過年的時候不怕長輩生氣,看春晚把電視調(diào)成了靜音,你就會發(fā)現(xiàn)一個無情的事實(shí):手腕搖斷了都不會有明星送祝福。因?yàn)樵陂_啟“搖一搖”這種功能的時候,你要先保證你的手機(jī)能“聽到”電視發(fā)出的聲音,這樣手機(jī)上的麥克風(fēng)才能采集音頻信號,并對音頻信號進(jìn)行一些特征的預(yù)處理后,提取到音頻的指紋。
音頻的“指紋”是什么?音頻指紋之于音頻就如同指紋之于人,它是每段音頻關(guān)于音頻數(shù)據(jù)內(nèi)容的壓縮簽名。目前比較通用的音頻指紋是音頻的頻譜特征,其好處就在于它可以“透過外在看本質(zhì)”,收集到的音頻信號會先被無情地卸掉偽裝,也就是進(jìn)行數(shù)字采樣和降噪等預(yù)處理,然后再通過加窗的方式分幀,對于每幀音頻信號會提取出音頻的頻譜特征。最后將一系列連續(xù)的特征序列拼接成單獨(dú)一個向量,我們就得到傳說中的音頻指紋了。
看到這里,大家可能想到了一個發(fā)家致富的新思路:要是我把天貓晚會錄個音,然后每天在家循環(huán)播放邊聽邊搖,我是不是能把馬云爸爸搶破產(chǎn)???
馬云爸爸冷笑一聲:我們這個技術(shù)是實(shí)時互動你知道嗎?
殘酷的實(shí)時也就意味著只有在特定的時刻才會進(jìn)行匹配。你上傳的音頻指紋是包含接收音頻信號的時間信息的,而數(shù)據(jù)庫中相對應(yīng)的音頻聲紋也是有設(shè)定好的時間標(biāo)簽。所以只有在特定的時刻才會觸發(fā)相應(yīng)的互動活動。想搶錢哪有那么容易?勸你還是在屏幕前乖乖守著直播看表搖手機(jī)吧。