宋辰
“親愛(ài)的”與人臉識(shí)別
嘉賓在40張父母合照中隨機(jī)挑選一張,選手和小度同時(shí)觀(guān)察該照片,在40位造型一致,身材接近的女生中,找到該父母的親生女兒,所找出的女兒手中全家福照片與父母合照背面的全家福完全一致,則挑戰(zhàn)成功。
AI技術(shù)解讀——人臉識(shí)別
人臉識(shí)別是基于人的臉部特征信息進(jìn)行身份識(shí)別的一種生物識(shí)別技術(shù)。用攝像機(jī)或攝像頭采集含有人臉的圖像或視頻流,并自動(dòng)在圖像中檢測(cè)和跟蹤人臉,進(jìn)而對(duì)檢測(cè)到的人臉進(jìn)行臉部識(shí)別的一系列相關(guān)技術(shù)。
隔代識(shí)別仍屬于圖像識(shí)別分類(lèi)中的人臉識(shí)別,只是難度更大。其技術(shù)原理與人臉識(shí)別相同,形成灰度圖,分別提取父母面部的特征點(diǎn)和孩子的特征點(diǎn)進(jìn)行比對(duì)。賽前通過(guò)多次機(jī)器學(xué)習(xí),在各種變量中間平衡,提高識(shí)別的正確率。
實(shí)際上,人臉識(shí)別遠(yuǎn)超人類(lèi)且可靠性很強(qiáng),在過(guò)去的3場(chǎng)比賽中,人類(lèi)選手做對(duì)了2道題,而機(jī)器卻做對(duì)了5道題,機(jī)器識(shí)別的準(zhǔn)確率遠(yuǎn)高于人類(lèi)。
技術(shù)應(yīng)用:
目前,百度的人臉識(shí)別技術(shù)已經(jīng)對(duì)寶貝回家的人尋家、家尋人兩個(gè)數(shù)據(jù)庫(kù)的6萬(wàn)多條數(shù)據(jù)進(jìn)行技術(shù)分析,這批數(shù)據(jù)已經(jīng)交給警方,警方會(huì)對(duì)這些尋親人進(jìn)行DNA核實(shí)認(rèn)證,目前已經(jīng)有一例通過(guò)了DNA比對(duì)。
截至2017年3月,百度與民政部合作推出的基于人臉識(shí)別技術(shù)的百度尋人平臺(tái),已對(duì)接民政部全國(guó)救助尋親網(wǎng)27003名走失者的數(shù)據(jù)。
“滄海桑田”與圖像檢索
老華僑手中唯一一張老城市的老照片,其中一個(gè)很小的細(xì)節(jié)會(huì)遺留在現(xiàn)代城市中,小度和人類(lèi)選手依據(jù)這個(gè)小細(xì)節(jié)中模糊的信息幫助老華僑尋找家鄉(xiāng)。舞臺(tái)上呈現(xiàn)30張城市街景圖,嘉賓在30張老照片剝離的30個(gè)含有唯一有效信息的碎片中,任意抽取一個(gè)碎片。選手雙方共同依據(jù)這個(gè)有效信息的碎片,在30張城市圖中尋找匹配。
AI技術(shù)解讀——圖像檢索技術(shù)
計(jì)算機(jī)分類(lèi)和提取出圖像的重要特征,并對(duì)多余的無(wú)用特征加以有效地排除,以此實(shí)現(xiàn)對(duì)圖像的識(shí)別。
此外,這局比賽中還用到了語(yǔ)義圖像檢索,這是一種在互聯(lián)網(wǎng)上進(jìn)行圖像檢索的方法,它是根據(jù)圖像的邏輯特征和抽象屬性進(jìn)行檢索,使計(jì)算機(jī)檢索圖像的能力接近人的理解水平的檢索技術(shù)。
技術(shù)應(yīng)用:
小度在本局比賽中所展現(xiàn)的語(yǔ)義圖像檢索能力,是基于百度在日常圖片搜索技術(shù)上的升級(jí),百度利用深度學(xué)習(xí)的方法,讓圖像特征抽取的過(guò)程更加穩(wěn)定,不受模糊、噪點(diǎn)等信息的干擾,讓搜索結(jié)果更精準(zhǔn)。這是百度最新的技術(shù),會(huì)盡快把這個(gè)技術(shù)在搜索中落地,讓大家可以更快更順利地在互聯(lián)網(wǎng)中找到想要的圖像。
“永不消逝的電波”與聲紋識(shí)別
現(xiàn)場(chǎng)30段情景的說(shuō)話(huà)聲,與30個(gè)笑聲相匹配。小度采集完整的30段說(shuō)話(huà)聲,隨后根據(jù)嘉賓隨機(jī)你挑選的一個(gè)笑聲,找到對(duì)應(yīng)的說(shuō)話(huà)聲。正確找出,挑戰(zhàn)成功。
AI技術(shù)解讀——聲紋識(shí)別
聲紋識(shí)別和語(yǔ)音識(shí)別一樣,都是通過(guò)對(duì)采集到的語(yǔ)音信號(hào)進(jìn)行分析和處理,提取相應(yīng)的特征或建立相應(yīng)的模型,然后據(jù)此做出判斷。
但不同于語(yǔ)音識(shí)別,聲紋識(shí)別的目的不是識(shí)別語(yǔ)音的內(nèi)容,而是識(shí)別說(shuō)話(huà)人的身份。其理論基礎(chǔ)就是“每個(gè)人的說(shuō)話(huà)特性都具有其獨(dú)特的特征”,聲腔的差異以及發(fā)聲的操作方式都是聲紋識(shí)別的獨(dú)有特征。
聲紋識(shí)別主要分為聲紋確認(rèn)技術(shù)(1:1)和聲紋識(shí)別技術(shù)(1:N)兩類(lèi)。聲紋確認(rèn)技術(shù)回答的是兩句話(huà)到底是不是一個(gè)人說(shuō)的問(wèn)題,而聲紋識(shí)別技術(shù)回答的則是“給定的一句話(huà)屬于樣本庫(kù)中誰(shuí)說(shuō)的”問(wèn)題。
技術(shù)應(yīng)用:
目前,百度在聲紋識(shí)別技術(shù)的應(yīng)用上,已經(jīng)有了以下的幾個(gè)方向:金融領(lǐng)域反欺詐(用聲紋識(shí)別確認(rèn)用戶(hù)信息,提高客服和系統(tǒng)反欺詐的能力);客服呼叫中心,快速定位用戶(hù)身份等;智能硬件的聲紋識(shí)別能力,讓機(jī)器人知道自己在和誰(shuí)對(duì)話(huà)以及聲紋喚醒能力;安全領(lǐng)域的聲紋認(rèn)證,類(lèi)似于人臉閘機(jī);輔助個(gè)性化語(yǔ)音識(shí)別和語(yǔ)音合成。