這兩三年大家都在討論汽車的智能化到底應(yīng)該是什么樣的,所以越來越多的車廠談的再也不是三大件,談的是人工智能。新建的中心也不是設(shè)計中心也不是機(jī)械中心,而是軟件開發(fā)中心,這個性質(zhì)也開始慢慢產(chǎn)生變化。從一個生產(chǎn)型的企業(yè)變成智能出行企業(yè)和智能物流企業(yè)。在科大訊飛副總裁智能汽車事業(yè)部總經(jīng)理劉俊峰看來:軟件和服務(wù)一定會成為一個車企面向用戶的重要屬性,除了它的外觀、內(nèi)飾、操控性、服務(wù)鏈條和人機(jī)交互特色,一定是一個車企面向用戶的深度基因。
車機(jī)系統(tǒng)應(yīng)該充分服務(wù)好用戶
我非常信奉的是車為人來服務(wù),車無論自動駕駛與否,一個好用的人機(jī)交互系統(tǒng),對于一個用戶來講,都是100%要在車上實現(xiàn)的。我們是希望能夠提供一套在車上人機(jī)交互真正好用的界面,這個界面有四個特點,一是足夠簡單,拿語音來說,一句話解決的不要讓用戶說兩句,不要讓用戶說非常繁冗的話,可以分開講。第二,智能領(lǐng)域及這個過程我們經(jīng)歷了12年,從2012年到2014年,真正在車上做到可以用一句話解決所有需求??梢月兂勺屇阌X得這個車開始理解你所說的每一句話和每一個字和每一個內(nèi)容,甚至每一個動作。
第三,一定是安全問題,讓汽車駕駛更安全更智能更有樂趣,安全是第一位,在這樣一個過程中,汽車可能會不聯(lián)網(wǎng),可能會錄音失敗,也可能會面對多種場景交叉,這個時候語音復(fù)雜性非常高。最后要強(qiáng)調(diào)的是人性化,最近的車有一些不用喚醒詞有一些多融交互,下一個是變化是干人一命、到干人干命、到一人千命,主動做推送做提醒,做一些更符合興趣和愛好的內(nèi)容推薦。我們稟承這四個點來發(fā)展我們的系統(tǒng)。
在自動駕駛車輛這個發(fā)展過程之中,無論怎么樣的發(fā)展,我們都希望強(qiáng)調(diào)人在車內(nèi)被服務(wù)的主體位置,充分理解人,充分做好語音交互和多模態(tài)交互,服務(wù)好車內(nèi)更多人,這樣我們發(fā)展自己的車內(nèi)體系。
優(yōu)秀的語音交互背后是強(qiáng)大的技術(shù)鏈條
語音發(fā)展在十年前都是外國人定義的,一場仗打了十年,可以看到我們在十年經(jīng)歷的每一個技術(shù)變化點,都引領(lǐng)整個汽車交互語音市場的進(jìn)展。從有降噪模塊、云和端一體化的語音設(shè)計,再到喚醒詞,免喚醒詞,再到后面語意的自然喚醒這條路,我們用自己的技術(shù)進(jìn)步,引領(lǐng)汽車語音交互進(jìn)展。我們希望自己產(chǎn)品交互進(jìn)展帶給沃爾沃客戶更方便快捷、簡單、智能的體驗。一個好用的語音交互并不只是說一句話那么簡單,背后有很多技術(shù)鏈條構(gòu)成。我們用自己的技術(shù)積累在支撐著交互邏輯和交互效果。
我們用麥克風(fēng)連續(xù)兩年破了世界紀(jì)錄,我們的自然語音理解和OCR技術(shù)也是世界一流的,現(xiàn)在用更好聽的TTS,連續(xù)三年得到TTS國際冠軍。我們能夠讓車內(nèi)聲音和語音交互結(jié)合在一起,讓車內(nèi)每一次交互都更動聽,讓車內(nèi)音樂和聲音交互,以及人工智能技術(shù)深度結(jié)合在一起。從聲音進(jìn)到聲音出,完整地把這個鏈條做成類似汽車底盤的鏈條,為用戶在車內(nèi)語音交互和應(yīng)用交互提供一個基礎(chǔ)平臺。這個事情是我們從今年開始往后看三年,一定要它在車上做到世界第一。我們用自己的核心能力和一些場景設(shè)計結(jié)合客戶需求.希望用視覺和聲音相互結(jié)合的方式,能夠為車內(nèi)交互做更好的提升。