沈凌莉
在討論Siri遇到的問(wèn)題時(shí),我們首先要理解Siri究竟是什么?,F(xiàn)在對(duì)它最大的誤解可能就是,認(rèn)為 Siri這類(lèi)語(yǔ)音智能助手產(chǎn)品是由前端的語(yǔ)音識(shí)別、語(yǔ)義解析技術(shù)和后端的搜索組成的。事實(shí)上并不全是這樣。
簡(jiǎn)單地說(shuō),智能助手產(chǎn)品是由三部分組成:前端的交互方式,也就是信息輸入和輸出的方式,比如語(yǔ)音是其中一種;中間的智能分析,相當(dāng)于人的大腦;后面是數(shù)據(jù)庫(kù)或者是獲取方式,包括自有的數(shù)據(jù)庫(kù)、第三方的數(shù)據(jù)庫(kù),以及搜索引擎等。
蘋(píng)果的Siri目前是把語(yǔ)音作為前端的交互方式,這是和Nuance等合作來(lái)實(shí)現(xiàn)的。而蘋(píng)果收購(gòu)的Siri公司更核心的能力是在后端的智能分析上。
這確實(shí)是件很復(fù)雜的事,所以當(dāng)最初投資 Siri項(xiàng)目之一的風(fēng)險(xiǎn)投資公司摩根塔勒合伙人Gary Morgenthaler說(shuō),“Siri的創(chuàng)始團(tuán)隊(duì)看到了未來(lái)、定義了未來(lái)并且順利地邁開(kāi)了通往未來(lái)技術(shù)的第一步,但被收購(gòu)之后(蘋(píng)果)Siri緩慢的商業(yè)化進(jìn)程讓我們這些創(chuàng)始團(tuán)隊(duì)感到非常失望”時(shí),我不禁要問(wèn):這真的僅僅是個(gè)商業(yè)化的問(wèn)題嗎?
“對(duì)于人工智能來(lái)說(shuō),現(xiàn)在談商業(yè)化還為時(shí)尚早,”小i機(jī)器人的創(chuàng)始人袁輝這樣認(rèn)為。他下這個(gè)判斷是因?yàn)樗?0年前就在人工智能領(lǐng)域做過(guò)了艱難的商業(yè)化嘗試。
小i機(jī)器人是國(guó)內(nèi)最早的智能機(jī)器人平臺(tái)運(yùn)營(yíng)商,成立于2001年。據(jù)其官方發(fā)布的數(shù)據(jù),2004年到2007年倚靠微軟MSN平臺(tái),小i的用戶(hù)超過(guò)1億,交互量達(dá)到100億次以上,覆蓋100多個(gè)國(guó)家。2007年小i機(jī)器人獲得了包括英特爾投資、IDG在內(nèi)的5家風(fēng)險(xiǎn)投資機(jī)構(gòu)的千萬(wàn)美元投資。但是大量的用戶(hù)并沒(méi)有給公司帶來(lái)太多收入。
有用戶(hù)沒(méi)收入,袁輝在很長(zhǎng)一段時(shí)間內(nèi)一直把原因歸結(jié)為“小i沒(méi)找到好的盈利模式”。后來(lái)發(fā)現(xiàn),用戶(hù)的快速增長(zhǎng)實(shí)際上掩蓋了小i最根本的問(wèn)題——究竟?jié)M足了用戶(hù)的什么需求?
袁輝說(shuō),“小i當(dāng)時(shí)的目標(biāo)和如今的 Siri一樣,希望做成一個(gè)無(wú)所不知、無(wú)所不能的變形金剛。但這幾乎是很難實(shí)現(xiàn)的”。首先,語(yǔ)音識(shí)別不是完全靠算法能解決的,無(wú)論是Nuance還是科大訊飛都花了很多年去研發(fā)。而后邊的智能分析和數(shù)據(jù)庫(kù)密切相關(guān),二者的匹配和系統(tǒng)構(gòu)建是非常核心的,既包括開(kāi)發(fā)互聯(lián)網(wǎng)的信息還包括機(jī)器學(xué)習(xí),這需要大量的整合和多年的積累。“時(shí)間是智能機(jī)器人最大的壁壘,而這不是靠開(kāi)放平臺(tái)、靠人多、錢(qián)多就能解決的,必須先知道要怎么做才行”。2009年,小i機(jī)器人全面轉(zhuǎn)型到公司(B2B)業(yè)務(wù)上。
或許,這樣一款產(chǎn)品,真的不能等在實(shí)驗(yàn)室里進(jìn)行完各種微調(diào)和全面測(cè)試再推向市場(chǎng),起碼第一步它必須接觸到從音質(zhì)到自然語(yǔ)言解讀的盡可能多的變化。
敗給Google Now?談勝負(fù)還早了點(diǎn)
但既然推向了市場(chǎng),總免不了比較。Google推出語(yǔ)音數(shù)字助理Google Now,用戶(hù)發(fā)現(xiàn),暫且不提人工智能,僅從語(yǔ)音搜索來(lái)看,Google Now的準(zhǔn)確率比Siri更高。于是,問(wèn)題來(lái)了——誰(shuí)能代表移動(dòng)搜索的未來(lái)? 在這一點(diǎn)上,面對(duì)PC端搜索的老大,且Google有多年積累的知識(shí)圖譜做后盾,確實(shí)讓人為Siri捏一把汗。但移動(dòng)搜索和PC搜索能一樣嗎?
“移動(dòng)搜索有很強(qiáng)的場(chǎng)景性,不像桌面搜索是用關(guān)鍵詞搜索大量資料,然后慢慢看。所以并不需要很深的知識(shí)圖譜,反而對(duì)非結(jié)構(gòu)化的、實(shí)時(shí)產(chǎn)生的數(shù)據(jù)有更大的需求?!敝菃?wèn)創(chuàng)始人朱勝這樣總結(jié)移動(dòng)搜索的特征。
為了建立非結(jié)構(gòu)化數(shù)據(jù)庫(kù),國(guó)內(nèi)另一家語(yǔ)音助手類(lèi)產(chǎn)品“蟲(chóng)洞語(yǔ)音助手”除了通過(guò)網(wǎng)絡(luò)抓取、第三方合作,還開(kāi)設(shè)了社區(qū)。蟲(chóng)洞的聯(lián)合創(chuàng)始人郭家的總結(jié)是,“作為助手類(lèi)的產(chǎn)品,長(zhǎng)尾信息的組織是一大關(guān)鍵,它很難通過(guò)通用型搜索產(chǎn)品獲得。”
顯然,在非結(jié)構(gòu)化數(shù)據(jù)上,蘋(píng)果 Siri和Google Now都在以不同的方式發(fā)力。Siri與很多不同的服務(wù)集成在一起提供搜索結(jié)果,包括Yelp、OpenTable、Wolfram Alpha、Yahoo,以及Twitter和微軟推出的搜索引擎Bing;Google Now也做出了重大革新,用戶(hù)不再需要主動(dòng)去搜索信息,谷歌會(huì)在適當(dāng)?shù)臅r(shí)候把信息提供給用戶(hù)。這相當(dāng)于搜索引擎在幫助人們做出決策。
從這一點(diǎn)來(lái)看,Google Now和Siri的目標(biāo)都不僅僅囿于移動(dòng)搜索,而是智能交互,搜索只是其中的一部分表現(xiàn)形式。最終,二者將殊途同歸——整合數(shù)據(jù)庫(kù),提高智能分析能力,讓機(jī)器主動(dòng)學(xué)習(xí)理解人、服務(wù)人——只是他們依托各自現(xiàn)有的優(yōu)勢(shì)從不同角度在往前做。在這個(gè)目標(biāo)下,目前二者都發(fā)展得比較初級(jí),談勝負(fù)還為時(shí)過(guò)早。
千萬(wàn)別把Siri僅僅當(dāng)成一個(gè)語(yǔ)音助手
其實(shí),Google Now也有難題,就是落地難。對(duì)于Google來(lái)說(shuō),谷歌的手機(jī)廠商和運(yùn)營(yíng)商總是很難及時(shí)向用戶(hù)提供Android系統(tǒng)更新。而對(duì)于蘋(píng)果這樣一個(gè)軟硬件結(jié)合的公司,并擁有封閉的生態(tài)系統(tǒng),將Siri的能力落地并推向消費(fèi)市場(chǎng)正是其優(yōu)勢(shì)所在。
“千萬(wàn)不要把Siri僅僅當(dāng)成一個(gè)語(yǔ)音助手,它是蘋(píng)果整個(gè)產(chǎn)品線包括操作系統(tǒng)演進(jìn)的方向?!闭缰靹偎f(shuō),蘋(píng)果在逐漸把 Siri整合到iOS操作系統(tǒng)和硬件產(chǎn)品中去。2012年6月,蘋(píng)果公司發(fā)布了iOS6,這一操作系統(tǒng)對(duì)汽車(chē)行業(yè)最大的意義在于將地圖、車(chē)輛控制和 Siri語(yǔ)音功能相集合。蘋(píng)果為Siri 打造的 Eyes Free駕車(chē)系統(tǒng)也已經(jīng)日趨完善,目前已經(jīng)有多家知名汽車(chē)廠商加入 Eyes Free陣營(yíng)。
可見(jiàn),蘋(píng)果一定會(huì)充分發(fā)揮其硬件的優(yōu)勢(shì)。相信不久以后,Siri會(huì)橫跨蘋(píng)果整個(gè)產(chǎn)品線。以Siri和iCloud為依托打穿不同的設(shè)備間的連接,與App Store一起組成蘋(píng)果的生態(tài)系統(tǒng)。
同時(shí),蘋(píng)果會(huì)發(fā)揮渠道和入口的作用。Siri將不僅僅是一款應(yīng)用程序,它同時(shí)也是一款自然用戶(hù)界面系統(tǒng),占據(jù)用戶(hù)與數(shù)字設(shè)備和互聯(lián)網(wǎng)的第一觸點(diǎn),它使得服務(wù)器端可以整合大量開(kāi)放API的數(shù)據(jù)。而這些數(shù)據(jù)是無(wú)法通過(guò)網(wǎng)絡(luò)抓取的方式獲得的。被整合進(jìn)蘋(píng)果操作系統(tǒng)中的Siri,可以方便被第三方調(diào)用。
對(duì)于蘋(píng)果來(lái)說(shuō),最重要的是通過(guò) Siri把人工智能帶進(jìn)了現(xiàn)實(shí)生活中。蘋(píng)果更可能走的一條路徑是,打造智能交互的底層架構(gòu),由它來(lái)提供人工智能助手通用層面的支持。在此之上,將產(chǎn)生更細(xì)分、垂直的智能化應(yīng)用和服務(wù),將人工智能助手滲透進(jìn)生活的方方面面,而這將是中小創(chuàng)業(yè)者的機(jī)會(huì)所在。而基于Siri的智能大腦和數(shù)據(jù)庫(kù),智能服務(wù)前端的交互方式也會(huì)變得更加多樣,除了聲音,比如圖像、視頻、腦波等都可能成為信息采集和輸出的方式。