趙雋楊
物靈科技是東方網(wǎng)力旗下的子公司,其機器人產(chǎn)品聚焦于家庭生活場景,如兒童閱讀機器人,同時也負(fù)責(zé)美國家庭社交機器人Jibo在中國的本地化研發(fā)、運營和銷售。
顧嘉唯曾是微軟研究院研究員、百度人工智能研究院擔(dān)任人機交互負(fù)責(zé)人。2016年,他離開百度,加入物靈智能科技有限公司,開始做消費型機器人的創(chuàng)業(yè)。 《21CBR》專訪了顧嘉唯,他分享了對于靈性機器人的理解、選擇消費型機器人進(jìn)行創(chuàng)業(yè)的原因和人工智能的未來前景。
21CBR:物靈科技一直強調(diào)要做出有靈性的產(chǎn)品,對于靈性的定義是什么?
顧嘉唯:目前市場上的機器人產(chǎn)品,在與人的交流互動中,無論是喚醒詞還是自然語言理解都存在很多問題,導(dǎo)致產(chǎn)品的交互體驗遠(yuǎn)遠(yuǎn)低于預(yù)期。除了技術(shù)上不過關(guān),有些機器人會模仿人的造型,這會讓消費者的預(yù)期變得更高,一旦體驗不佳便容易帶來恐怖谷效應(yīng)。物靈想要做出有生命感的機器人,這個生命感來自關(guān)系式交互,這就是我們定義的靈性。
物靈現(xiàn)在的產(chǎn)品有一個運算系統(tǒng),能把用戶的表情行為、語言和表達(dá)的情緒作為輸入,通過內(nèi)存的情感計算,輸出產(chǎn)品應(yīng)該有的情感表達(dá)。這種情感表達(dá)不一定是真的給你的問題提供精準(zhǔn)答案,而是擁有一定的角色感、個性感的回應(yīng)。每個產(chǎn)品都有自己的角色設(shè)置,有自己的優(yōu)缺點,甚至有時候聽不清話也是它的特性之一。
例如,英文版的Jibo和中文版的Jibo就擁有不同的個性,因為中美兩國的生活方式、用戶場景、社交文化等都不一樣。從技術(shù)上來說,提供生命感的關(guān)鍵是25個關(guān)系式交互,打通了計算機視覺(CV)、自然語言處理(NLP)和事物處理系統(tǒng)(TPS),再結(jié)合情感計算進(jìn)行輸出。
21CBR:為什么物靈選擇做家庭場景的消費型機器人而不是服務(wù)型機器人?如何讓同個場景內(nèi)的產(chǎn)品之間形成協(xié)同效應(yīng)?
顧嘉唯:選擇做消費型機器人是經(jīng)過一番考慮和實踐的,我們看到了家庭場景中存在機器人應(yīng)用的剛需。首先是視頻監(jiān)控,在家里沒人的時候能保障安全。其次,現(xiàn)在一些父母無瑕顧及孩子時就給他一臺iPhone或者iPad,既傷眼睛又不利于孩子養(yǎng)成良好的學(xué)習(xí)習(xí)慣,此時能為孩子提供陪伴和教育功能的機器人就可以派上用場。第三方面的需求來自智能化的家居環(huán)境,在你大汗淋漓進(jìn)門時機器人能為你打開空調(diào),而知道你感冒生病時就選擇不開空調(diào)。
之前五年,智能家居的硬件停留在聯(lián)網(wǎng)的狀態(tài)上,比如用手機App去控制窗簾升降。這絕對不是真正的需求,所以這些做智能家居硬件的公司以失敗居多,不然就是被小米收編。但今天,智能語音技術(shù)發(fā)展起來了,真正的自然交互開始有機會了,消費型機器人這樣的智能家居硬件也就有發(fā)揮的余地了。
家庭場景下的機器人產(chǎn)品功能是會有重疊的部分,就像iPad和iPhone有很多功能也是重疊的,各自也會有更加適合的應(yīng)用場景。這樣的產(chǎn)品組合是會加深用戶的使用習(xí)慣的,能更好更寬地覆蓋用戶需求。其實對于現(xiàn)在的家用智能硬件,還不是談?wù)撝鲃尤ゲ季之a(chǎn)品組合的時候,先讓大家養(yǎng)成使用習(xí)慣,有
多少市場先占多少市場。
21CBR:國外的公司在沒做出中文語音交互前,對于中國的公司來說是一段時間窗口期嗎?物靈對于國內(nèi)外的市場有怎樣的預(yù)期?
顧嘉唯:技術(shù)肯定是有時間窗口的,但很快就會過去,只有市場、場景和用戶是可以幫助公司站穩(wěn)腳跟的東西。不是說國外大公司的產(chǎn)品不進(jìn)來,就沒有市場行為了?,F(xiàn)在中國的公司也都在做語音平臺,騰訊、百度、阿里巴巴、科大訊飛等等。 雖然現(xiàn)在中國的技術(shù)還有不成熟的地方,但很快會趕上來的。而且,我也并不認(rèn)為Amazon Echo的音響會在中國成為很大銷量的一類產(chǎn)品。在美國,平均一個家庭有2到3個音響,而中國家庭并沒有多少有使用音響的習(xí)慣。這是個巨大的場景差異,同時也會帶來使用方式的差異。
語音交互方式肯定是個機會,而我們需要重點思考的是產(chǎn)品和場景的問題:是對著一個有靈性的產(chǎn)品交流,還是對著一個工具性的產(chǎn)品,抑或在靜默空間中和任何一個產(chǎn)品都可以交流。
物靈正在開發(fā)的機器人Jibo在中國和美國都還沒有上市,可以肯定的是,會先進(jìn)入美國市場。因為亞馬遜的Alexa、Google Now、微軟的Cortana已經(jīng)對美國市場進(jìn)行了教育,相對成熟,而中國市場則還需要一段時間。 其實技術(shù)的成熟、產(chǎn)品體驗的打磨和進(jìn)入市場的時間點都至關(guān)重要,這些也是物靈面對的幾個挑戰(zhàn)。
21CBR:離開大公司自己創(chuàng)業(yè)后,覺得人工智能的創(chuàng)業(yè)公司和大公司相比有優(yōu)勢?未來人工智能會給人類社會帶來哪些改變?
顧嘉唯:其實,在做人工智能方面,創(chuàng)業(yè)公司和大公司相比,真是沒有太多優(yōu)勢。畢竟服務(wù)器、GPU集群、人工智能人才都是成本很高的項目,而且大公司擁有很多數(shù)據(jù)。從長遠(yuǎn)看來,大家現(xiàn)在都在做平臺化的技術(shù),未來這些成本會越來越低。而且今天很多行業(yè)數(shù)據(jù)都在那里,關(guān)鍵要看怎么用。撬動數(shù)據(jù)這件事反而對大公司不利,就像兩個大公司合作時,因為雙方的競爭,有些數(shù)據(jù)會不愿意共享,而對于小公司來說,這個防備界限會降低。
未來,人工智能會讓機器替代人類做很多工作。就像在下圍棋的領(lǐng)域,已經(jīng)超越人類了。雖說這是一個很細(xì)小的分支,但未來這樣的分支會越來越多?,F(xiàn)在人臉識別和語音識別的突破都非??欤缫院筮^關(guān)安檢就不需要人工敲章了,其實今天已經(jīng)在以機器輔助的方式做這件事了。未來在投資顧問、金融支付、安保、翻譯、法律、咨詢等領(lǐng)域,人工都會被機器取代。這是一種社會化分工趨勢在發(fā)生改變的過程,人類從農(nóng)耕文明進(jìn)入工業(yè)文明時經(jīng)歷了從體能型工作過渡到技能型工作的轉(zhuǎn)變,而以后就需要向創(chuàng)造型工作轉(zhuǎn)變。
其實當(dāng)機器能勝任技能型工作后,也可以做創(chuàng)造型的工作,這個技術(shù)的邊界是要靠人加以限制的,就像生物工程一樣,人工智能也會有相應(yīng)的倫理道德規(guī)范。我并不知道最終人類是否會被機器人這個物種取代,但我的美好愿望是不被取代。