智能語音如何顛覆終端產業(yè)?
——藍戈智庫第三次主題沙龍紀實
語音導航、語音拍照、語音撥號、語音喚醒等功能如今已經風靡各種終端,智能語音操控已經從最初消費者無聊時的調侃型應用,發(fā)展到如今可真正幫助消費者解決實際問題的功能性應用。智能語音應用正走向成熟,終端產業(yè)正迎來一波以智能語音控制為特色的全新革命。
沙龍嘉賓:
王德鎖 ........................... 中興通訊語音產品經理
隗鉑侖 .......................... Audience技術銷售經理
孫曉欣 ................Nuance移動產品管理及市場部經理
梁家恩 ............... 北京云知聲信息技術有限公司董事長
王力劭 .................... 深圳車音網科技有限公司CEO
趙子嵩 ..................旭上電子(上海)哦啦語音運營經理
李寧 ........................... 迪信通門店管理中心總監(jiān)
武曉鋒 ................... GFK移動通訊事業(yè)部高級分析師
林紫玉 ........................... 《通信產業(yè)報》副總編
孫永杰 ............................... 藍戈智庫首席專家
吳茂林 .....................................著名終端大V
磐石之心 ..................................著名自媒體人
王德鎖
隗鉑侖
孫曉欣
梁家恩
吳茂林:沒有語音輸入手機是不入流的。目前許多輸入法都標配了語音輸入的功能,未來,語音輸入并不是標配與否的問題,我認為如果下一代手機沒有配備語音輸入,那么就是不入流的。這里的語音不僅指撥號,還涉及到許多后續(xù)操作,包括更深層次的手機應用。
磐石之心:語音識別就是在云端。以前的語音識別只是為了輸入,但現(xiàn)在語音識別在云端,由“云”來負責處理人與服務的連接。未來,可能是我們說了一句話,“云端”就可以對你所說的內容用大數(shù)據(jù)算法進行識別,從而算出這個人有多少歲。
孫曉欣:語音識別不是剛需。我不認為語音是終端的剛需,因為在有些場景下語音并不合適,比如開會、居家,這些場景下是不方便使用的。一個產品是否成熟可以從3個方面加以衡量:技術成熟度、市場接受度、用戶接受度。
隗鉑侖:語音識別的目的不是取代鍵盤?,F(xiàn)在使用一個帶有語音的APP,普遍都需要開機解鎖、打開并登錄APP、找到麥克風等一系列的過程,不僅操作比較繁瑣,并且需要用完所有的觸覺視覺后才能聽到聲音,因此用戶接受度不高。如果只要說一個關鍵字就能把APP打開,這才可能是用戶需要的。語音識別的目的不是取代鍵盤,而是滿足特定場景下的需求。
梁家恩:語音產品的發(fā)展有一個過程。語音產品的發(fā)展其實與攝像頭比較像,過去我們覺得30萬像素的攝像頭就很好了,但現(xiàn)在很多都是1000多萬像素了。同樣的,智能語音產品的發(fā)展也應該有一個過程。比如參加這個主題沙龍,如果都靠語音的話大家閉著眼就可以談完,因為語音就是交互,這是非常自然的過程。
王力劭:對車載而言,智能語音一定是標配。為什么?因為駕駛模式下,司機的兩只手都被占用,必須保證駕駛安全;不過,要精確地到達目的地,就不僅是語音識別能解決的問題。
王德鎖:語音識別須先在特定場景應用。現(xiàn)在語音識別發(fā)展正面臨一個關鍵問題,就是我們的語音技術還沒有發(fā)展到可以不論何時何地的準確傳遞信息。就像我們交談時,需要先看交談對象特點、周圍環(huán)境,再決定說什么。但手機只認這一句話,并不清楚場景,不能準確識別。所以,語音識別必須先限定為某個特定場景,并盡可能在該場景中讓識別達到最簡潔的程度。
林紫玉:可把語音當成平臺和入口。中興手機在語音功能的實際應用上比較好,但目前主要表現(xiàn)為語音喚醒手機一些功能,可不可以把語音當成一個平臺和入口呢?這是值得持續(xù)研究的問題。
李寧:對語音功能,消費者絕對有需求。顧客對于手機的語音功能絕對是有需求的!包括語音喚醒、車載語音等。我們的員工在向消費者推薦這些功能時,很多消費者都會特別關注。不過,我們也發(fā)現(xiàn),目前手機語音在娛樂性與互動性方面還需要加強。
王力劭
趙子嵩
李寧
武曉鋒
孫曉欣:語音識別是基礎性服務。我是偏向實用派。我覺得語音就是把你想要的說出來,這個是語音的本質,娛樂派是有一定的市場,但如果太偏向娛樂就會本末倒置。語音的輸入輸出功能實際是基礎性服務,就像輸入法一樣,而輸入法若帶娛樂性就是匪夷所思了!語音識別已經過了娛樂化第一步,現(xiàn)在應該放棄一些嘩眾取寵的特色,回歸到語音識別本質。
梁家恩:應實用為主,娛樂為輔。語音助手本身就是一個工具,只不過現(xiàn)在它是被用戶娛樂化了。在語音識別的實際應用中當然是應該“實用為主,娛樂為輔”,但是我們若要告訴用戶、引導用戶使用,卻需要先用娛樂引發(fā)用戶的興趣,然后用戶才愿意去使用,這時先后次序和主次是反著的。
王力劭:在汽車領域實用性最強。語音識別在汽車領域中的實用性肯定是最強的,要強到不能出任何問題,必須要精準、簡練,因為駕駛安全太重要了。所以,我們專注做車載語音,放棄了很多其它領域的應用。在這種情況下,實用性就非常重要,但其它情況下,我覺得還是可以以娛樂性為主。人都有玩心,不管什么年齡的人。所以,娛樂性還是實用性最終還是要看場景而定。
趙子嵩:娛樂性和實用性需要兼?zhèn)洹蕵沸院蛯嵱眯詫嶋H是需要產品兼?zhèn)涞?,若就完全的娛樂性和實用性而言,娛樂性肯定不是語音識別的未來方向,雖然短期內可能可以帶來流量和曝光度,但不可持續(xù)。語音識別的落地最后還是需要靠實用性,不過在具體場景上,必須把應用做到用戶的痛點上。
武曉鋒:應實用性而開發(fā),用娛樂化做營銷。產品當然應該注重實用性,基于用戶需求而開發(fā),但營銷方式應該創(chuàng)新,應該娛樂化,以充分調動用戶積極性。
梁家恩:“大而全”是目標,“小而精”是方法。這不是一個二選一的問題?!按蠖笔俏磥淼哪繕?,幾十年來技術在不斷發(fā)展,企業(yè)僅有底層技術還不夠,還應該與內容結合起來;“小而精”是方法也是手段。
王德鎖:做好“小而精”,深挖用戶痛點。中興更希望做好“小而精”,特別希望找到適合語音識別的用戶痛點。有些功能需要一層層的完善,不可能通過語音識別一步到位地解決問題。我們希望能找到用戶痛點,并深挖下去,由點帶面地把語音識別做好,讓用戶滿意。
隗鉑侖:先做“小而精”,后續(xù)相互配合。產業(yè)鏈是需要相互配合的,每一個環(huán)節(jié)、每一個人都有自己的想法,他們都是做到一定程度并有自己的資源積累的。如果每一個企業(yè)都能把自己擅長的環(huán)節(jié)做到最好,然后大家把技術配合起來,這樣市場才會接受。從這個意義上說,需要先做好“小而精”。
孫曉欣:做好“小而精”已不易。我就一個答案:“小而精”?!按蠖蔽易霾坏?。語音是有場景限制的,要想功能全、場景全、用戶接受度高,怎么可能?所以我認為如果不能把用戶體驗做到很好,讓用戶接受智能語音,其他所有的,包括合作、做更多功能,都是“耍流氓”。如果用戶連第一步嘗試都不愿意,怎么能夠做到“大而全”。而且要做好“小而精”本身就很難,需要硬件廠商的配合,需要中間廠商打通,需要軟件廠提供基礎服務,還需要內容廠商內容提供,這已經足夠一個企業(yè)做很多年了。
林紫玉:應創(chuàng)造用戶需求。我覺得目前企業(yè)大多還是工程師思維,為什么我們要解決特定場景下的特定需求?為什么不能換一種思維?為什么非要滿足用戶需求而不是不創(chuàng)造用戶需求?
林紫玉
孫永杰
吳茂林
磐石之心
孫曉欣:用戶使用率越高,技術才會更成熟。中興做智能語音已經很久,也積累了一些用戶數(shù)據(jù),現(xiàn)在一些用戶基本適應了語音控制這個方式。其實用戶在沒有任何引導的前提下,幾乎很難發(fā)起一個語音命令,因為沒有相應的習慣。我們的語音技術其實已經達到一個非常高的層次了,所以我們現(xiàn)在應該將70%的精力放到現(xiàn)有應用的改善上,把30%的精力放在新技術的研究上,不要變成技術要求達到了,用戶體驗卻沒有跟上。所以現(xiàn)在要思考的是,我們是否已經充分利用以前的潛力,并最大程度地讓用戶接受?如果沒有,為什么要開發(fā)更多功能?我們只有讓用戶用得更多,技術才會越成熟。
梁家恩:技術評估,需要一個完善的體系。語音識別受到的影響因素更多,包括口音、說話的內容、環(huán)境的干擾、說話的遠近等?,F(xiàn)在還沒有一種標準評判它,不過隨著時間推移一定是會越來越好。只是現(xiàn)在大家努力方向不一樣,若有一個標準和一個明確體系,可能會發(fā)展得更好,這也是一個非常重要的問題。若你解決功耗問題,我解決性能問題,大家就不再是單打獨斗,因此我們需要建立一個完善的體系。
王力劭:可以從周邊、技術本身、應用3個維度判定。第一看你語音技術識別產品采用的是哪種“周邊”。比如麥克風的好壞就能在很大程度上決定語音識別能力的強弱。第二看語音技術本身。一個“高大上”的技術,首先要拼算法,包括建模型、優(yōu)化等。第三看語音技術如何應用?比如做車載語音,即使算法不如其它企業(yè),但如果每天能深入模擬汽車語音環(huán)境,使最后的產品能非常好地適應該場景就是優(yōu)秀。
李寧:車載是一個大生態(tài)。迪信通賣手機很多年了,在2010~2011年,智能手機市場有一個飛躍式發(fā)展,其實就是靠幾個APP的推動,如微信、微博等?,F(xiàn)在,3G向4G轉也是比較火,我們也正在找爆發(fā)的方向,我覺得車載語音功能是一個契機。此外,迪信通去年建立了智能小屋,顧客可以在這里體驗智能窗簾、智能秤等智能產品。目前,顧客感知非常好,需求也很旺盛,但需要有契機將它們向顧客正式推銷,我們正在等那個風口。
吳茂林:首選智能家居。實際上用戶并不是現(xiàn)在才有智能語音的需求,其實用戶一直就有這個需求,只不過以前因為或技術或產品或網絡等因素,由于一些條件的滯后,阻礙了智能家居等產品在普通消費群體中的推廣。以前的家電都是獨立的個體,現(xiàn)在通過控制芯片可以加入到整個智能家居生態(tài)鏈中,具備了硬件基礎,用戶就可以實現(xiàn)不同的需求。
隗鉑侖:將云識別引入智能家居。目前的智能語音應用項目中有一些已經量產,比如語音搖控,在冰箱上裝載觸摸屏和操作系統(tǒng)等,如果再考慮美觀方面的因素,就可以通過語音控制把云識別引入到智能家居。不過,大多數(shù)情況下如果不做處理,云識別肯定會被各種播放的聲音影響,而處理過的信號更利于云識別完成人機交互,達成客戶需求。
林紫玉:參與者對智能家居有訴求。目前智能語音在其它市場的需求還比較單一,各個參與者都有高訴求的領域主要集中在智能家居,目前一些運營商、家居生產商、手機生產商等,都開始進入該領域。
趙子嵩:物聯(lián)網將成為下一個熱潮。大家都在談語音交互,其實未來不是你控制設備,而是設備聯(lián)接你。語音控制其實可以建立在很多內容上,包括情緒、圖像等,一起達成人機之間的語音交互。我認為在智能家居領域,語音控制必然會占有一席之地,同時隨著智能語音控制技術在智能家居的應用,在物聯(lián)網領域也會迎來一個熱潮。