今年以來,智能音箱頻頻受到關注,似乎一夜之間,中國市場就迎來了一股智能音箱、人工智能語音技術的熱潮。
近期,阿里巴巴推出了首款智能音箱產品,百度宣布收購美國語音交互技術公司。而此前,亞馬遜、谷歌、蘋果、微軟等硅谷巨頭早已紛紛布局智能音箱。有機構預計,未來幾年,智能語音行業(yè)將呈現(xiàn)爆發(fā)式增長。一場以智能音箱為終端的智能家居接口大戰(zhàn)正火熱展開。
隨著人工智能從高冷的“黑科技”走入人們的日常生活,作為人機交互主要途徑之一的智能語音技術越來越成熟。在物聯(lián)網(wǎng)迅速發(fā)展的推動下,作為重要接口的智能語音技術已成為IT巨頭的必爭之地。
近幾年國外科技巨頭紛紛推出自己的智能音箱產品,搶占智能家居的重要入口。亞馬遜先人一步推出智能音箱Echo占領市場,隨后谷歌的Google Home、蘋果的Home Pod、微軟的Cortana陸續(xù)上線,令戰(zhàn)局更趨激烈。中國企業(yè)也在加緊追趕,近期,百度宣布收購美國語音交互技術公司KITT.AI,同一天阿里巴巴發(fā)布智能音箱“天貓精靈X1”,6月底,騰訊發(fā)布了智能語音解決方案“小微”,京東聯(lián)合科大訊飛推出了“叮咚音箱”。
目前亞馬遜仍以絕對優(yōu)勢領跑家用智能音箱市場,并將競爭對手遠遠甩在身后。據(jù)市場研究公司Slice Intelligence的最新統(tǒng)計,5月份亞馬遜Amazon Echo占全球家用智能音箱市場份額達到21.6%,Amazon Dot占18.2%,Amazon Tap占0.9%,合計占比超過40%。相比之下谷歌Google Home的占比僅為3.2%。
亞馬遜的成功遠非率先推出幾款硬件產品那么簡單。在2014年推出Echo后不久,亞馬遜就宣布將Alexa語音平臺開放給第三方,不但包括智能家居軟件開發(fā)人員,還包括智能家居硬件制造商。開放平臺的策略給Alexa帶來巨大的發(fā)展空間。據(jù)亞馬遜的數(shù)據(jù),Alexa在2014年最初發(fā)布時只有13個內嵌的技能,而目前兼容的應用已超過1.5萬個。
如今,Alexa已成為諸多智能硬件產品的“標配”:華為的智能手機、LG的家庭機器人、惠而浦的洗衣機、福特的汽車……對亞馬遜而言,Alexa開辟了基于語音媒介的全新操作系統(tǒng),為它進入巨大的移動互聯(lián)市場搭建了入口。
讓人類和機器能完美對話是人機交互領域長久以來的夢想。而使智能音箱成為控制家中設備的一個端口,是各巨頭目前為止最理想的一種方法。
中國家電商業(yè)協(xié)會營銷委員會執(zhí)行會長洪仕斌指出,科技巨頭們推出智能音箱,是想把它界定為一個代替手機進入智能家庭的端口。原來通過手機控制家里所有的智能家電并不方便,現(xiàn)在試圖利用智能音箱這個端口,通過遠程語音交互的程序來控制整個智慧家庭。
“一旦控制了接口就有很多賺錢方法?!憋L險投資公司Greylock合伙人約翰·麗莉認為,控制信息流就可以引導用戶需求,然后把東西賣給他們。加拿大皇家銀行分析師馬克·馬哈尼預計,到2020年亞馬遜與Alexa相關的收入將達到100億美元,從而使它成為繼電商零售、第三方市場、云計算之后亞馬遜的第四大業(yè)務支柱。
市場研究公司Tractica預測,到2021年將有4000萬家庭使用基于語音的數(shù)字助手。調研機構Strategy Analytics指出,2016年全球智能音箱出貨量為590萬臺,預計到2022年將增長10倍,市場規(guī)模達到55億美元。
京東是中國最早開啟智能音箱市場的企業(yè)之一。2014年,京東成立智能集團,發(fā)布“JD+計劃”。2015年初便與科大訊飛成立合資公司靈隆科技,同年8月推出叮咚智能音箱,這是目前國內銷量最大的智能音箱產品。盡管如此,國內智能音箱市場卻顯得有些不溫不火。智能音箱的主要功能依舊是聽音樂,其余多樣化的智能功能尚不成熟,難以捕獲大量受眾。
易觀分析師馮超分析,音箱產品不可移動,無法滿足多種房間狀態(tài)下的需求,目前許多國內消費者還缺乏對此類智能設備的依賴性。但從另一個角度看,隨著技術發(fā)展,手機不再是唯一的計算中心,可穿戴設備、多種智能產品都將興起,這必然產生大量的用戶數(shù)據(jù),產品之間互聯(lián)互通進行數(shù)據(jù)的交互,萬物互聯(lián)模式將成為主流趨勢。
智能音箱所代表的是一種全新的人工智能交互方式,代表著未來人工智能在家庭應用場景中的落地。目前來看,國內外眾多公司并非僅在搶奪智能音箱市場,更多的是在關注未來家庭入口的進場券。為了減少自己的試錯成本,他們開始模仿Echo,然而由于地域市場不同,中國企業(yè)面臨的難度更大。
“由于中國方言多、發(fā)音多,漢字在不同的語境中有可能音相同,字卻不一樣,如何將語音轉化成文本比翻譯英文難得多?!眹鴥饶持悄芤粝涞漠a品經(jīng)理小許說,口語轉化成漢字、用戶表達的口語化如何讓背后的機器能識別,服務的整合能力都是智能語音發(fā)展的難點。以往用戶在百度、淘寶輸入都屬于文本類的規(guī)范化信息,語音時代需要把口語化的東西處理成背后機器能識別的完全口語化搜索。
在小許看來,技術的壁壘通過時間和各大數(shù)據(jù)公司的努力還是比較容易達成。但數(shù)據(jù)和服務的累積可不容易,多個服務平臺如何達到整合還有很長的路要走,提供內容服務的硬件廠商需要克服版權等壁壘問題。(本刊綜合)endprint