賀文
在駕車場(chǎng)景里,更重要的人機(jī)交互模式是耳朵聽、解決信息的輸入,用嘴說、解決信息的操控。
“芝麻開門”,阿里巴巴用這句魔力咒語打開了寶藏山洞的大門,馬斌斌和樂駕科技想用“你好蘿卜”這句話,最大限度地解放駕駛者開車時(shí)的雙手。
馬斌斌身上,有諸多互聯(lián)網(wǎng)大公司的標(biāo)簽,搜狐前30號(hào)員工、雅虎中國(guó)第一個(gè)產(chǎn)品經(jīng)理、騰訊電商和視頻產(chǎn)品負(fù)責(zé)人、高德地圖產(chǎn)品副總裁……而他的這一站是樂駕科技,與思必馳這家專注于做智能硬件的語音交互技術(shù)的公司達(dá)成戰(zhàn)略合作,做一款“HUD+語音操控+人機(jī)對(duì)話”的智能車載機(jī)器人“車蘿卜”(Carrobot),希望讓傳統(tǒng)汽車變得更加“智能”。
在高德的經(jīng)歷,讓馬斌斌發(fā)現(xiàn)了人車交互場(chǎng)景中的用戶痛點(diǎn)頗多,比如駕駛的同時(shí)查看發(fā)送微信、查看地圖導(dǎo)航等,這些在開車時(shí)都是很危險(xiǎn)的。而現(xiàn)在所有的系統(tǒng),不管是前裝車上做的車機(jī)系統(tǒng),還是后裝的應(yīng)用,包括手機(jī)的應(yīng)用,都不能很完美的解決這些痛點(diǎn)。
于是乎有了“車蘿卜”這樣一款智能人機(jī)交互的全語音車載產(chǎn)品。在馬斌斌看來,在駕車場(chǎng)景里,更重要的人機(jī)交互模式是耳朵聽、解決信息的輸入,用嘴說、解決信息的操控,真正做到人機(jī)對(duì)話。
減法
馬斌斌一直心心念念要做這樣一個(gè)產(chǎn)品,機(jī)緣巧合,他在2014年底認(rèn)識(shí)了高始興,思必馳的創(chuàng)始人之一,雙方一拍即合。
思必馳的語音交互技術(shù),尤其是支持多步驟的人機(jī)對(duì)話技術(shù),正是馬斌斌需要的,“我試了一下他們的原型產(chǎn)品,真的是這樣,能達(dá)到我們的要求”。當(dāng)然,要在車載這樣特定的應(yīng)用場(chǎng)景里實(shí)現(xiàn)很好的人機(jī)交互,僅僅用思必馳提供的AIOS人機(jī)對(duì)話智能操作系統(tǒng)的API接口再開發(fā)是不夠的,所以雙方?jīng)Q定戰(zhàn)略合作。樂駕針對(duì)車載環(huán)境深度定制研發(fā)了自己的ROM系統(tǒng),并接入高德地圖導(dǎo)航、考拉音樂電臺(tái)、微信等應(yīng)用,未來還將接入更多適合車載場(chǎng)景的應(yīng)用。
馬斌斌坦言,樂駕“車蘿卜”的誕生受Navdy的啟發(fā),但他同樣有信心,基于樂駕所掌握的語音操控人機(jī)對(duì)話技術(shù),樂駕“車蘿卜”能做出比Navdy更強(qiáng)大的人機(jī)交互功能。
美國(guó)汽車抬頭顯示器Navdy公司最早提出了放在儀表臺(tái)上的HUD+語音操控這個(gè)產(chǎn)品概念,但是樂駕“車蘿卜”卻搶先一步實(shí)現(xiàn)了產(chǎn)品面市:2015年1月樂駕公司成立;5月底做出了工程原型機(jī);7月開始京東眾籌,并成為明星項(xiàng)目;9月底,交付用戶;此后,通過大量的用戶使用發(fā)現(xiàn)和反饋的問題,軟件產(chǎn)品進(jìn)行快速迭代,每月至少推出一個(gè)版本。
“蘿卜。導(dǎo)航?!痹诮邮苡浾卟稍L時(shí),馬斌斌演示了車蘿卜第一代產(chǎn)品。
“請(qǐng)說目的地?!避囂}卜回答。
“首都國(guó)際機(jī)場(chǎng)T3航站樓?!?/p>
“找到以下地點(diǎn),是第幾個(gè)?”
“第一個(gè)?!?/p>
“目的地,北京首都國(guó)際機(jī)場(chǎng)三號(hào)航站樓,如果目的地不正確,您可以說取消?!?/p>
不僅是地圖導(dǎo)航,還有微信、音樂、接打電話的通信功能,車蘿卜將這幾項(xiàng)基本應(yīng)用做成一體化的、真正能滿足開車的特定場(chǎng)景需求的集成方案,而且都是基于語音交互的。為此,樂駕團(tuán)隊(duì)在軟硬件上都沒有少下“狠功夫”。
這與之前的很多語音助手、車載語音導(dǎo)航產(chǎn)品的開發(fā)思路完全不同,后者當(dāng)駕駛者說導(dǎo)航去哪里之后,接下來的事情還是需要用手來操作,因?yàn)檫@樣的語音助手只是入口,之后啟動(dòng)的還是諸如高德或者百度的導(dǎo)航。
而樂駕的“車蘿卜”是在設(shè)備的ROM底層上做了“四合一”應(yīng)用層,就是四個(gè)事情同時(shí)并發(fā)進(jìn)行,如何在體驗(yàn)(反應(yīng)速度)和硬件性能(CPU運(yùn)算能力)上找好平衡,是樂駕團(tuán)隊(duì)要解決的重點(diǎn)難題。比如,對(duì)ROM層進(jìn)行深度的定制開發(fā),把不需要的模塊都砍掉,提升性能、減少不必要的內(nèi)存占用;比如挖未了手機(jī)圈做BSP驅(qū)動(dòng)(操作系統(tǒng)的一部分)和ROM側(cè)開發(fā)的高手,還有智能手機(jī)供應(yīng)鏈的資深人士。
馬斌斌介紹,車蘿卜的二代機(jī)已經(jīng)在開發(fā)中,會(huì)有“高低配”不同版本,其中高配版(8核CPU)的響應(yīng)速度希望能降到一秒之內(nèi)。
從“后裝”到“前裝”
現(xiàn)在的車蘿卜是一款HUD平視顯示器,以車載外設(shè)的形式,固定在車內(nèi)駕駛位的儀表臺(tái)上。馬斌斌暢想,未來的HUD可以不再是用一個(gè)單獨(dú)的小屏幕、作為車內(nèi)外設(shè),而是直接在車的前擋風(fēng)玻璃上顯示交互信息。
事實(shí)上,像寶馬這樣的整車廠商已經(jīng)在做了。不過,馬斌斌認(rèn)為,汽車整車廠商的優(yōu)勢(shì)是有很好的硬件基礎(chǔ),可以做最合理、最完美的圖像顯示,但是它們的軟件開發(fā)能力弱。即便是寶馬,現(xiàn)在也還只能在車的前擋風(fēng)玻璃上顯示簡(jiǎn)單的信息,比如車速、轉(zhuǎn)速、油耗,以及前方500米右轉(zhuǎn)、左轉(zhuǎn)這樣的基本監(jiān)控,還沒有辦法做到在車輛行駛中比較詳細(xì)的路程導(dǎo)引;在語音操控方面,包括寶馬等整車廠商在內(nèi)的語音操控都還不能做到完全的語音交互,在語音發(fā)出第一個(gè)指令之后,接下來的事情都得用手未做輔助操作。
現(xiàn)在車蘿卜還是2C的產(chǎn)品形態(tài)和銷售模式,專注于汽車的后裝市場(chǎng)。馬斌斌介紹,今年車蘿卜在線上和線下兩個(gè)渠道都要發(fā)力,線上會(huì)在京東、天貓、淘寶、國(guó)美、蘇寧等電商平臺(tái)上銷售,線下比如4S店、汽配城、修車連鎖等都是可以拓展的。后裝市場(chǎng),尤其像中國(guó)這樣的汽車保有量大國(guó)(現(xiàn)在已經(jīng)是1.7億左右的私家車保有量),已經(jīng)足夠大?!凹幢闶前涯壳爸袊?guó)存量汽車市場(chǎng)做好,已經(jīng)是足夠大的業(yè)務(wù),要大于新車?!瘪R斌斌說。
但是,前裝市場(chǎng)不能不做戰(zhàn)略考慮。尤其是未來的新車產(chǎn)品,像HUD、語音操控等,一定會(huì)變成標(biāo)配時(shí)。馬斌斌希望在未來用戶足夠多,平臺(tái)量級(jí)足夠大的情況下,以“第三方服務(wù)商”的角色,同汽車生產(chǎn)商進(jìn)行深度合作,比如作為汽車廠商在智能人機(jī)對(duì)話車載機(jī)器人的解決方案提供商。
當(dāng)然,相較于后裝車市場(chǎng),前裝車市場(chǎng)的技術(shù)門檻更高,技術(shù)驗(yàn)證周期更長(zhǎng),前裝車廠對(duì)安全是非常慎重的,所以任何一個(gè)新技術(shù)、新產(chǎn)品要進(jìn)前裝市場(chǎng),進(jìn)口整車廠商至少三到五年,國(guó)產(chǎn)品牌兩到三年。
對(duì)于樂駕來說,在人車交互這個(gè)領(lǐng)域可以探索的東西很多很多:
比如產(chǎn)品性能,現(xiàn)在的車蘿卜主要是識(shí)別來自于正前方的駕駛員的聲音,新產(chǎn)品通過硬件在麥克風(fēng)陣列上的改進(jìn)升級(jí),將能實(shí)現(xiàn)更好的聲源定位,進(jìn)而能區(qū)分來自駕駛員、副駕駛、后排座椅等不同位置的人聲;在產(chǎn)品形態(tài)上,現(xiàn)在的車蘿卜是HUD平視顯示器,未來是不是可以變成眼鏡;在商業(yè)模式上,比如進(jìn)入線下渠道時(shí),能否嘗試硬件低價(jià)甚至免費(fèi)的模式等等。