国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

語(yǔ)音識(shí)別即將進(jìn)入規(guī)?;瘧?yīng)用

2016-11-26 17:51嚴(yán)冬雪
財(cái)經(jīng)天下周刊 2016年22期
關(guān)鍵詞:客服阿里語(yǔ)音

嚴(yán)冬雪

當(dāng)下語(yǔ)音識(shí)別可能已達(dá)到平均95%的準(zhǔn)確度,一旦提升到99%,就將發(fā)生質(zhì)變。

來(lái)自商界的種種動(dòng)向顯示,語(yǔ)音識(shí)別,這項(xiàng)把人類語(yǔ)音轉(zhuǎn)換成文本的研究,已經(jīng)成為人工智能領(lǐng)域最接近應(yīng)用的技術(shù)。

過(guò)去數(shù)月間,這種動(dòng)口不動(dòng)手的“黑科技”頻繁出現(xiàn)在國(guó)內(nèi)科技行會(huì)中。7月,奇點(diǎn)極客公園創(chuàng)新者峰會(huì)上,搜狗CEO王小川一邊演講,大屏幕上一邊顯示出內(nèi)容,識(shí)別結(jié)果令人驚艷;10月上旬,在杭州云棲大會(huì)上,4萬(wàn)人現(xiàn)場(chǎng)見(jiàn)證馬云一邊演講,一邊在大屏幕上秀出阿里機(jī)器人打出的字幕,還有700萬(wàn)人通過(guò)在線直播觀看了這一幕,造就了語(yǔ)音識(shí)別最大規(guī)模的一次亮相;10月下旬,錘子手機(jī)M1發(fā)布會(huì)上,科大訊飛的語(yǔ)音識(shí)別技術(shù)快速、精準(zhǔn)地將羅永浩的講話譯成文字,幾乎成為發(fā)布會(huì)主角。

一邊演講,一邊在大屏幕上彈出語(yǔ)音識(shí)別字幕,日趨成為潮流標(biāo)配。這也意味著,這項(xiàng)技術(shù)正在步入成熟期。微軟10月底發(fā)布的一份學(xué)術(shù)聲明表示:語(yǔ)音識(shí)別技術(shù)的精準(zhǔn)性已經(jīng)媲美人類,在產(chǎn)業(yè)標(biāo)準(zhǔn)測(cè)試中,其語(yǔ)音識(shí)別實(shí)現(xiàn)了詞錯(cuò)率低至5.9%——與人類專業(yè)速記員的最好記錄持平,這意味著其識(shí)別能力已經(jīng)高于世界上絕大多數(shù)人,而與人類專業(yè)高手持平。

頂級(jí)語(yǔ)音專家、微軟研究院首席研究員俞棟表示,在安靜環(huán)境下,使用近距離麥克風(fēng),語(yǔ)音識(shí)別的正確率已經(jīng)跨過(guò)了應(yīng)用門(mén)檻。

巨頭的共同動(dòng)作

來(lái)自巨頭們的動(dòng)作亦可印證這一趨勢(shì):從2010年開(kāi)始,蘋(píng)果公司先后收購(gòu)包括Siri在內(nèi)的3家語(yǔ)音識(shí)別公司;谷歌、亞馬遜、Facebook也各自收購(gòu)2~4家;微軟則從自家戰(zhàn)略層面發(fā)展Skype、Cortana和微軟小冰;今年,英特爾宣布與語(yǔ)音識(shí)別技術(shù)公司Sensory達(dá)成合作,在以后最新的芯片中集成整合該公司的語(yǔ)音識(shí)別技術(shù)。

相比國(guó)外大公司在收購(gòu)技術(shù)上花錢(qián),國(guó)內(nèi)公司則將各自語(yǔ)音識(shí)別技術(shù)大膽靠近應(yīng)用。例如百度語(yǔ)音嵌入百度旗下其他App,搜狗語(yǔ)音應(yīng)用于輸入法,騰訊則讓微信具備語(yǔ)音轉(zhuǎn)文字功能。創(chuàng)業(yè)公司也紛紛利用語(yǔ)音技術(shù),依靠硬件作為流量分發(fā)入口,應(yīng)用在智能家居、車載語(yǔ)音助手等產(chǎn)品上。

事實(shí)上,現(xiàn)階段大部分人早已享受語(yǔ)音識(shí)別科技,比如客服服務(wù)。作為全球最大的電商,阿里巴巴的客服需求一直伴隨業(yè)務(wù)的激增而擴(kuò)大,這導(dǎo)致人力成本高企。應(yīng)對(duì)這一狀況的傳統(tǒng)方式是客服外包,但其服務(wù)不可靠、不穩(wěn)定的缺點(diǎn)難以克服。最開(kāi)始,阿里采用抽檢式的質(zhì)檢,從每100通電話里抽取1通,由人工逐句檢驗(yàn)錄音是否合規(guī)。

負(fù)責(zé)人很快發(fā)現(xiàn),1%的抽檢率不足以覆蓋全部問(wèn)題,因?yàn)槊總€(gè)人犯錯(cuò)的方式存在很大差異。于是,阿里云的人工智能機(jī)器人ET介入該項(xiàng)服務(wù),將語(yǔ)音轉(zhuǎn)化為文字,再利用關(guān)鍵詞搜索等完成質(zhì)檢,一旦觸發(fā)違規(guī),會(huì)自動(dòng)進(jìn)入處罰流程。如果客服認(rèn)為ET識(shí)別有誤,自己被冤枉了,可以點(diǎn)擊“申訴”——人工質(zhì)檢員只在這一步介入。如此,在同等人力條件下,質(zhì)檢率從1%提升到了100%。

阿里云智能語(yǔ)音高級(jí)專家陳一寧告訴《財(cái)經(jīng)天下》周刊,除了客服,語(yǔ)音識(shí)別也應(yīng)用在淘寶、支付寶、釘釘?shù)纫苿?dòng)端應(yīng)用,甚至進(jìn)入了杭州市西湖區(qū)人民法院的庭審現(xiàn)場(chǎng)。自今年6月起,該法院的書(shū)記員工作被ET替代。法官及訴訟參與各方人士的發(fā)言,都會(huì)在顯示屏上即時(shí)顯示。

陳一寧解釋,讓語(yǔ)音識(shí)別參與庭審不僅可以節(jié)省人力,其最大意義在于方便檢索和后續(xù)分析。法官們?cè)趯彴盖?,需要參考同類案件的處理,而ET自動(dòng)將庭審內(nèi)容轉(zhuǎn)化為文字并歸檔,就能方便法官輸入同類關(guān)鍵詞,查看所有相關(guān)案件的記錄。

電腦與人耳的優(yōu)劣

微軟稱最新的語(yǔ)音識(shí)別詞錯(cuò)率與專業(yè)速記員持平,阿里也做了類似的測(cè)試。在今年年初的2016阿里云年會(huì)上,阿里ET與世界速記大賽亞軍得主姜毅同時(shí)為現(xiàn)場(chǎng)演講做速記。與姜毅的對(duì)決中,ET以0.67%的微弱優(yōu)勢(shì)取勝。

面對(duì)人類中的頂級(jí)選手,ET的取勝優(yōu)勢(shì)在于其穩(wěn)定性和并發(fā)計(jì)算能力。人類的體力有極限,在高強(qiáng)度壓力下難以保持穩(wěn)定;此外,計(jì)算機(jī)的高并發(fā)能力使其可以在發(fā)現(xiàn)錯(cuò)誤后,瞬間完成修改,速記員則只能在演講者話語(yǔ)中斷的間歇見(jiàn)縫插針?lè)祷匦薷摹?/p>

人類的另一個(gè)弱項(xiàng)是對(duì)短句的識(shí)別。如果沒(méi)有前后語(yǔ)境,突然冒出一句語(yǔ)速又快、內(nèi)容又短的句子,一般人很難聽(tīng)清。但計(jì)算機(jī)不怕語(yǔ)速快,并且能通過(guò)大數(shù)據(jù)學(xué)習(xí)沉淀下的經(jīng)驗(yàn),去根據(jù)之前聽(tīng)過(guò)的類似語(yǔ)音,來(lái)計(jì)算出這句話最可能是什么。

但若論真正“聽(tīng)懂”的智慧,電腦尚未追趕上人類。比如在環(huán)境嘈雜、多人同時(shí)發(fā)音、中英夾雜等條件下,電腦便不及人類能迅速過(guò)濾無(wú)用信息,理解對(duì)方的意思?;蛘撸v述者說(shuō)的是一個(gè)全新的、創(chuàng)新性的詞語(yǔ),此前沒(méi)有人說(shuō)過(guò),機(jī)器自然沒(méi)學(xué)習(xí)過(guò),就很難識(shí)別。

有趣的是,方言與口音并不在計(jì)算機(jī)懼怕的領(lǐng)域范圍內(nèi)。以阿里客服為例,他們每天會(huì)接聽(tīng)來(lái)自全國(guó)乃至世界各地的電話,后臺(tái)的ET被各種口音訓(xùn)練過(guò),只要積累足夠的訓(xùn)練量,可以無(wú)上限地成為N種方言專家,識(shí)別標(biāo)準(zhǔn)普通話之外的口音。

離消費(fèi)級(jí)僅一步之遙

與大部分被束之高閣的前沿研究不同,語(yǔ)音識(shí)別技術(shù)已經(jīng)應(yīng)用到實(shí)際產(chǎn)品中,例如科大訊飛已經(jīng)推出一系列手機(jī)應(yīng)用,用于錄音轉(zhuǎn)化文字。微軟也在其Xbox游戲平臺(tái)、最新的Windows中部署語(yǔ)音識(shí)別助手。

根據(jù)人工智能世界級(jí)專家、百度首席科學(xué)家吳恩達(dá)的說(shuō)法,當(dāng)下語(yǔ)音識(shí)別可能已達(dá)到平均95%的準(zhǔn)確度,一旦提升到99%,就將發(fā)生質(zhì)變:你從偶爾使用語(yǔ)音,變到常常自然而然地使用。屆時(shí),人機(jī)交互方式將徹底改變,雙手與鍵盤(pán)被解放,人們真的“動(dòng)口不動(dòng)手”。

事實(shí)上,來(lái)自亞馬遜的一款產(chǎn)品已經(jīng)印證了這一趨勢(shì):Echo智能音箱被嵌入亞馬遜的語(yǔ)音識(shí)別技術(shù)Alexa,成為語(yǔ)音控制智能家居的入口。上市兩年以來(lái),Echo已經(jīng)學(xué)會(huì)了朗讀小說(shuō)、用Uber叫車、叫匹薩外賣、配合戶主玩語(yǔ)音游戲。由于當(dāng)下的語(yǔ)言技術(shù)已能支撐不錯(cuò)的用戶體驗(yàn),Echo獲得了市場(chǎng)認(rèn)可。根據(jù)今年6月公開(kāi)的新銷售計(jì)劃,亞馬遜計(jì)劃在2017年賣出第1000萬(wàn)臺(tái)Echo。

一旦95%到99%一步跨越成功,可以預(yù)見(jiàn)的是,類似Echo的智能語(yǔ)音交互產(chǎn)品會(huì)遍地開(kāi)花式取得成功。巨頭們顯然有相似的判斷與考慮,并在一致加速步伐:例如,由于Siri表現(xiàn)糟糕,已經(jīng)引發(fā)了蘋(píng)果高管的關(guān)注,已在不久前從美國(guó)卡耐基梅隆大學(xué)挖來(lái)人工智能技術(shù)的教授負(fù)責(zé)組建團(tuán)隊(duì),其使命之一便是提高Siri識(shí)別語(yǔ)音率和回答問(wèn)題的“智商”。

陳一寧也向《財(cái)經(jīng)天下》周刊透露,阿里云也會(huì)在明年春節(jié)前后推出消費(fèi)級(jí)的語(yǔ)音識(shí)別產(chǎn)品,屆時(shí),你只需將語(yǔ)音傳送到阿里云,便可由其經(jīng)過(guò)翻譯,實(shí)時(shí)返回文字。

有意思的是,這一次,科研不再只是科學(xué)家的事。你我作為人類的一員,同樣參與其中,你每次撥打客服電話,都在給計(jì)算機(jī)學(xué)習(xí)人類語(yǔ)言提供了一次寶貴的學(xué)習(xí)機(jī)會(huì)。而為你服務(wù)的,除了客服年輕人,還有背后的一整支科學(xué)家團(tuán)隊(duì)。

猜你喜歡
客服阿里語(yǔ)音
微信語(yǔ)音恐懼癥
云上阿里
語(yǔ)音推銷
魔力語(yǔ)音
Magic Phonetics魔力語(yǔ)音
疼痛后才計(jì)數(shù)
對(duì)方正在輸入……
Catalan數(shù)及幾種應(yīng)用實(shí)例
建議
拳王阿里因何被人銘記
容城县| 平顶山市| 新乐市| 清新县| 莱阳市| 合作市| 安溪县| 达孜县| 山东| 祁东县| 铁岭市| 商水县| 剑川县| 马边| 班玛县| 望江县| 太康县| 乳山市| 噶尔县| 阜康市| 新晃| 马龙县| 昭觉县| 贺州市| 石首市| 平阳县| 新民市| 夹江县| 望都县| 弥勒县| 常宁市| 大宁县| 长葛市| 屏山县| 故城县| 吉安市| 蓬安县| 噶尔县| 长顺县| 德保县| 丽水市|