阿里、百度兩大巨頭巧合地在同一天對(duì)外公布了自己的人工智能進(jìn)展:智能語(yǔ)音音箱和無(wú)人駕駛。經(jīng)過(guò)前期基礎(chǔ)和技術(shù)上的儲(chǔ)備與競(jìng)爭(zhēng)之后,科技企業(yè)間人工智能競(jìng)爭(zhēng)升級(jí),開(kāi)始了應(yīng)用與產(chǎn)品上的競(jìng)逐。
從人工智能的架構(gòu)層級(jí)來(lái)看,這些年的發(fā)展已經(jīng)逐漸向下端滲透。具體說(shuō),人工智能可分為基礎(chǔ)層、技術(shù)層和應(yīng)用層,其中基礎(chǔ)層為算力支撐(AI芯片、云計(jì)算),技術(shù)層為算法平臺(tái),應(yīng)用層是AI向各傳統(tǒng)行業(yè)的滲透應(yīng)用。
通俗地理解,基礎(chǔ)層靠近“云”,應(yīng)用層靠近“端”,是各種產(chǎn)品的落地。在之前不斷累積的大數(shù)據(jù)和算法優(yōu)化過(guò)程后,當(dāng)今正是各種場(chǎng)景之下的應(yīng)用服務(wù)相繼爆發(fā)之時(shí)。
而單從最近兩巨頭的動(dòng)作就可看出,語(yǔ)音識(shí)別已成為其中主戰(zhàn)場(chǎng)。也許這么說(shuō)會(huì)覺(jué)得和無(wú)人駕駛相離太遠(yuǎn),但仔細(xì)分析,無(wú)人駕駛現(xiàn)在更重視用戶體驗(yàn)和人機(jī)交互,多個(gè)概念車(chē)中都展示了語(yǔ)音控制汽車(chē),可謂能動(dòng)口絕不動(dòng)手,用戶一聲令下就直接控制汽車(chē)行駛狀態(tài),這其中對(duì)語(yǔ)音識(shí)別的需求也是不言而喻的。
各巨頭看準(zhǔn)語(yǔ)音識(shí)別必將火熱、成為主戰(zhàn)場(chǎng)自有其理由。語(yǔ)音交互之所以越來(lái)越被重視,是因?yàn)榛ヂ?lián)網(wǎng)、智能硬件的普及,改變了互聯(lián)網(wǎng)的入口方式。而語(yǔ)音就是最簡(jiǎn)單的,最直接的交互方式,是通用的互聯(lián)網(wǎng)輸入模式。
從用戶角度來(lái)說(shuō),最簡(jiǎn)單的控制就是“一聲令下”的簡(jiǎn)單方式,無(wú)需任何操作讓機(jī)器讀懂人心。從商業(yè)場(chǎng)景來(lái)說(shuō),不論是娛樂(lè)、工作、家庭、出行、旅行等哪個(gè)場(chǎng)景,用戶都會(huì)隨時(shí)隨地需要語(yǔ)音控制,特別是不同場(chǎng)景下的語(yǔ)音信息代表不同需求,覆蓋全場(chǎng)景的語(yǔ)音接口搭載在各種智能硬件上,可以最大限度收集用戶需求。在深度挖掘后預(yù)判用戶未來(lái)需求,打通各個(gè)場(chǎng)景數(shù)據(jù)后可為各巨頭建立自身的生態(tài)鏈,讓更多場(chǎng)景的大數(shù)據(jù)反哺語(yǔ)音識(shí)別等人工智能技術(shù)的研發(fā)。
除了語(yǔ)音識(shí)別,AI在語(yǔ)音合成、對(duì)話管理。問(wèn)答等方面也做了很多工作,還包括在不同端上的信號(hào)處理,例如麥克風(fēng)陣列等等都是要去實(shí)踐的,這樣才能完成語(yǔ)音交互的完整過(guò)程。語(yǔ)音識(shí)別技術(shù)的進(jìn)展是有目共睹的,不過(guò)對(duì)此仍需保持冷靜,人機(jī)交互的自然性尚未達(dá)到和真人交流一般的靈活,機(jī)器人或智能硬件的“智商”也不能和真人相比。
以私人助手為例,如果對(duì)面是一個(gè)真人管家,那么用戶的一個(gè)表情也許管家就會(huì)讀懂需求。但對(duì)機(jī)器人來(lái)說(shuō),不僅需要用戶說(shuō)出需求,而且用戶語(yǔ)氣和情緒的變化所代表的意義未必能全部捕捉,這時(shí)也許還需要用戶再次用語(yǔ)言說(shuō)清需求,在用戶體驗(yàn)上造成不便。
所以說(shuō),決勝人工智能或許是個(gè)偽命題,這些科技巨頭理論上應(yīng)該比普羅大眾對(duì)人工智能的價(jià)值有更深刻的認(rèn)識(shí),他們也有充分可支配的資源進(jìn)行研究和布局。互聯(lián)網(wǎng)時(shí)代、移動(dòng)互聯(lián)網(wǎng)時(shí)代都是百花齊放各展所長(zhǎng),人工智能時(shí)代也是如此。