李佳師
近日,谷歌設(shè)備與服務(wù)高級(jí)副總裁Rick Osterloh以發(fā)布官方博客方式宣布:谷歌正式收購(gòu)North。North是一家增強(qiáng)現(xiàn)實(shí)公司,其產(chǎn)品與谷歌眼鏡類(lèi)似。這不是一樁普通的AR收購(gòu),它與谷歌的一個(gè)重要計(jì)劃“環(huán)境計(jì)算”提速有關(guān)。
也是在最近,英特爾高級(jí)院士、英特爾研究院院長(zhǎng)Rich Uhlig在撰文解析英特爾的2030計(jì)劃時(shí),談及“沉浸式臨場(chǎng)感技術(shù)”如何通過(guò)陣列攝像頭技術(shù)、計(jì)算聲學(xué)和多模型信號(hào)語(yǔ)義理解來(lái)改善虛擬和遠(yuǎn)程工作體驗(yàn),談到了英特爾的環(huán)境計(jì)算。
6月16日,在2020國(guó)際計(jì)算機(jī)視覺(jué)與模式識(shí)別大會(huì)上,微軟CEO薩提亞和微軟前執(zhí)行副總裁沈向洋的爐邊對(duì)話(huà)中談到了“4D理解”,并準(zhǔn)備將它發(fā)展成“現(xiàn)實(shí)即服務(wù)”,利用實(shí)時(shí)的計(jì)算機(jī)視覺(jué)技術(shù),對(duì)八、地、物等要素進(jìn)行推理以確保安全,提供給醫(yī)院或工廠(chǎng)車(chē)間等。還談到了“全息瞬移”以及背后的神經(jīng)網(wǎng)絡(luò)文本、運(yùn)營(yíng)TTS、全息計(jì)算等。這些技術(shù)與環(huán)境計(jì)算有關(guān)。
當(dāng)谷歌、英特爾、微軟等不約而同地談到環(huán)境計(jì)算時(shí),意味著什么?環(huán)境計(jì)算究竟是廠(chǎng)商們打造的新“噱頭”還是有可能改變我們認(rèn)知的“新世界”?其中有哪些難點(diǎn)有待業(yè)界共同破解?創(chuàng)造新產(chǎn)業(yè)有哪些方法可尋?
廠(chǎng)商紛紛加碼環(huán)境計(jì)算
在去年10月舉辦的2019谷歌制造大會(huì)上,RickOsterloh公布了谷歌的新使命、新愿景:“讓你的設(shè)備和服務(wù)與AI一起協(xié)作,在你需要的任何時(shí)侯過(guò)來(lái)幫助你,在你不需要的時(shí)候自動(dòng)隱身?!逼浜?,Osterloh撰寫(xiě)博客解釋了谷歌推出的“環(huán)境計(jì)算”概念——在你的一天中,設(shè)備會(huì)消失在背景中,人工智能和軟件則將一起工作來(lái)幫助你。在谷歌宣布了這一大概念之后,谷歌就將其諸多的服務(wù)納入了其設(shè)備中。
在谷歌的概念里有幾個(gè)關(guān)鍵:其一,人是中心而非以設(shè)備為中心。其二,它是設(shè)備+服務(wù)+AI的大集成,是一個(gè)大系統(tǒng)。其三,具有不可見(jiàn)性,召之即來(lái)、揮之即去。環(huán)境計(jì)算是眾多的技術(shù)組合在一起,創(chuàng)建一個(gè)可以滿(mǎn)足個(gè)人需求的環(huán)境。從本質(zhì)上看,環(huán)境計(jì)算是物聯(lián)網(wǎng)與人工智能等互聯(lián)概念的演變。
環(huán)境與計(jì)算的融合,計(jì)算的維度將發(fā)生改變。比如客廳中的語(yǔ)音驅(qū)動(dòng)揚(yáng)聲器和智能恒溫器,虛擬坐席和聊天機(jī)器人都是環(huán)境計(jì)算的組成部分。當(dāng)你走進(jìn)客廳.房間傳感器感應(yīng)到你的身影,揚(yáng)聲器會(huì)自動(dòng)朗讀當(dāng)天的新聞。在商務(wù)會(huì)議室,人工智能技術(shù)則自動(dòng)收集對(duì)話(huà)信息并做筆記,自動(dòng)調(diào)節(jié)攝像頭與麥克風(fēng),提高畫(huà)面質(zhì)量,減少環(huán)境噪音,以便我們將更多注意力集中于對(duì)話(huà)與交流,而忽略環(huán)境影響。
當(dāng)然,環(huán)境計(jì)算的概念并非谷歌首創(chuàng)。早在上世紀(jì)80年代末90年代初,尚在施樂(lè)帕克研究中心擔(dān)任首席技術(shù)專(zhuān)家的MarkWeiser就創(chuàng)造了環(huán)境計(jì)算這個(gè)詞條,并與施樂(lè)帕克研究中心的董事和首席科學(xué)家John Seely Brown撰寫(xiě)了大量論文來(lái)描述這個(gè)概念,主要關(guān)注計(jì)算環(huán)境中出現(xiàn)的界面和交互問(wèn)題。之后有很多研究和學(xué)術(shù)項(xiàng)目都是圍繞這個(gè)課題進(jìn)行的。眾多的前人研究為這一概念的落地做了大量積累和鋪墊,到這個(gè)時(shí)間點(diǎn),巨頭們讓它的產(chǎn)業(yè)化腳步越來(lái)越快。就像觸摸式操作系統(tǒng)并非蘋(píng)果發(fā)明,但是蘋(píng)果將其用在iPad、iPhone上,開(kāi)啟了移動(dòng)計(jì)算的黃金十年一樣。
在今年花1.8億美元收購(gòu)North之前,谷歌已將諸多的服務(wù)納入了其設(shè)備中,比如在Pixel手機(jī)上,加入了“Soli”運(yùn)動(dòng)雷達(dá)感應(yīng)技術(shù),用戶(hù)無(wú)需接觸,用手勢(shì)即可操作手機(jī);比如改良其入耳式耳塞PixelBuds,搭載的“自適應(yīng)聲音”技術(shù)可根據(jù)用戶(hù)所在的環(huán)境自動(dòng)調(diào)節(jié)音量;又比如對(duì)Nest智能家居部門(mén)進(jìn)行了大量更新等。
事實(shí)上,不同的巨頭對(duì)于環(huán)境與計(jì)算融于一體有不同的定義和理解。微軟中國(guó)有限公司首席技術(shù)官韋青在接受《中國(guó)電子報(bào)》記者采訪(fǎng)時(shí)表示,真正的環(huán)境計(jì)算是讓你感受不到任何設(shè)備、任何計(jì)算,它通過(guò)眼、耳、鼻、舌、身五官來(lái)感知信息、交互信息,或許到更高階段時(shí),信息的呈現(xiàn)不是通過(guò)設(shè)備而是通過(guò)光。當(dāng)然,它的發(fā)展不是一蹴而就,而是不斷迭代的。
就在7月9日,微軟協(xié)作工具Teatns宣布上線(xiàn)Together模式,這個(gè)模式能夠?qū)⒁曨l會(huì)議中的人物從背景中摳出來(lái),然后放到虛擬的大禮堂背景中。目前Teams最多支持49人同時(shí)在線(xiàn),整體效果就像是坐在一起聽(tīng)課。Together Mode的初衰是幫助遠(yuǎn)程工作者,尤其是被迫待在家中的孩子減輕和克服長(zhǎng)期社交隔離的落差和心理壓力。
“環(huán)境計(jì)算是英特爾的中長(zhǎng)期研究計(jì)劃,也就是3-5年時(shí)間的研究計(jì)劃。目前美國(guó)的團(tuán)隊(duì)已經(jīng)做了一段時(shí)間,現(xiàn)在已經(jīng)開(kāi)始進(jìn)行現(xiàn)場(chǎng)實(shí)驗(yàn)了。主要特色是用環(huán)境里部署的多種傳感器來(lái)感知人的活動(dòng)和與物體的交互,然后進(jìn)行語(yǔ)意理解,再通過(guò)與環(huán)境融合的投影方式跟參與者互動(dòng)。”英特爾中國(guó)研究院院長(zhǎng)宋繼強(qiáng)對(duì)《中國(guó)電子報(bào)》記者透露。
環(huán)境計(jì)算多久會(huì)成熟?
就在谷歌去年宣布環(huán)境計(jì)算計(jì)劃之時(shí),很多人包括媒體以及科技知名博主們都對(duì)其新計(jì)劃的落地、商業(yè)模式以及用戶(hù)接受度等提出了質(zhì)疑。而事實(shí)上這樣的計(jì)劃并不是一下子鋪開(kāi)的,它是一個(gè)遠(yuǎn)景。如韋青所言,會(huì)“迭代式”往前推進(jìn),迭代會(huì)成為未來(lái)世界創(chuàng)新發(fā)展很重要的特征。
所以,關(guān)于環(huán)境計(jì)算,巨頭們一方面會(huì)在原有的產(chǎn)品線(xiàn)中不斷注入新的能力、新的體驗(yàn),另一方面不斷創(chuàng)造和豐富新的維度,它是長(zhǎng)中短期結(jié)合的計(jì)劃,并不是一個(gè)孤注一擲的商業(yè)冒險(xiǎn)。
衍生與迭代會(huì)成為巨頭們將長(zhǎng)中短期相結(jié)合的行走方式。有個(gè)例子來(lái)自微軟。21世紀(jì)初,微軟開(kāi)始用計(jì)算機(jī)視覺(jué)研究骨架追蹤和人體感知的基礎(chǔ)科學(xué);在2010年它推出了第一個(gè)商業(yè)產(chǎn)品Kinec;在此基礎(chǔ)上,微軟劍橋研究院做出了能夠完全重構(gòu)3D環(huán)境,讓人與環(huán)境融為一體的Kinect Fusion、HoloDesk: 2015年,微軟推出了HoloLens; 2019年,它推出了Ho-loLens 2。
我們完全沒(méi)有必要為巨頭們的商業(yè)落地和商業(yè)模式操心。就像這次微軟在Teams中上線(xiàn)的Together模式,它是在微軟原有的產(chǎn)品Teams中加以改進(jìn),增加了多人協(xié)同的真實(shí)感和交互感。就像谷歌在其Pixel手機(jī)上,是將“Soli”運(yùn)動(dòng)雷達(dá)感應(yīng)技術(shù)加入一樣。谷歌和微軟走的是兩條不一樣的路線(xiàn),微軟聚焦“生產(chǎn)力”維度,所以它的環(huán)境計(jì)算場(chǎng)景會(huì)最先選擇像辦公、開(kāi)會(huì)等體驗(yàn)的改進(jìn),像醫(yī)院病人起身跌倒等行為異常的檢測(cè),以及預(yù)防工廠(chǎng)環(huán)境下重物跌落傾倒等場(chǎng)景的應(yīng)用。而谷歌更關(guān)注消費(fèi)與娛樂(lè)的人群,你在家、在路上、在娛樂(lè)等更多維度所需要的服務(wù),以及與智能家居和環(huán)境的互動(dòng)等。
有人認(rèn)為,環(huán)境計(jì)算市場(chǎng)究竟多久能夠從量變到質(zhì)變的一個(gè)信號(hào)通常是看蘋(píng)果,但這次蘋(píng)果似乎沒(méi)有大張旗鼓地談?wù)摥h(huán)境計(jì)算,這與其一向只喜歡“蘋(píng)果成熟時(shí)”才向市場(chǎng)宣戰(zhàn)的習(xí)慣有關(guān)。不過(guò),近日蘋(píng)果申請(qǐng)的一項(xiàng)專(zhuān)利顯示,除了眼鏡和耳機(jī),蘋(píng)果還在為其VR(虛擬現(xiàn)實(shí))戰(zhàn)略研發(fā)一款專(zhuān)用手套。專(zhuān)利中提到,該手套支持檢測(cè)各種手勢(shì)動(dòng)作,適用于筆記本電腦、平板電腦和智能手機(jī)等多個(gè)場(chǎng)景,還可應(yīng)用到壘息投影模組、聯(lián)動(dòng)PC和打印機(jī)等設(shè)備的場(chǎng)景,讓用戶(hù)在虛擬中體驗(yàn)真實(shí)的觸感。如果這個(gè)市場(chǎng)的發(fā)展是漸進(jìn)式的,各個(gè)巨頭都已經(jīng)往前走了,屆時(shí)蘋(píng)果還是那個(gè)市場(chǎng)成熟的風(fēng)向標(biāo)嗎?也未必。
環(huán)境計(jì)算中的關(guān)鍵痛點(diǎn)
巨頭企業(yè)總是比其他人更早感受到窘境和焦慮,就像這次因?yàn)橐咔榈陌l(fā)生,“線(xiàn)上化”成為常態(tài)。當(dāng)越來(lái)越多的人待在“線(xiàn)上”比“線(xiàn)下”的時(shí)間長(zhǎng)很多時(shí),如何減少線(xiàn)上辦公、線(xiàn)上開(kāi)會(huì)、線(xiàn)上沉浸的焦慮感、不真實(shí)感,用環(huán)境計(jì)算創(chuàng)造新的舒適安全體驗(yàn),就成了巨頭企業(yè)們思考的新維度。
“現(xiàn)在大家都在講,世界不會(huì)再回到疫情以前的狀態(tài),會(huì)產(chǎn)生很大的變化。具體有什么變化?在我看來(lái),過(guò)去大量通過(guò)‘人一人(人和人接觸)的方式來(lái)完成的事情,以后很多會(huì)被‘人一信息一人(人和人不直接接觸)的方式取代?!敝袊?guó)工程院院士潘云鶴認(rèn)為,“當(dāng)大量的會(huì)議遠(yuǎn)程化之后,從我個(gè)人的使用體驗(yàn)來(lái)看,大部分遠(yuǎn)程會(huì)議系統(tǒng)都有待完善。”
最突出的問(wèn)題在于網(wǎng)絡(luò)會(huì)議難以進(jìn)行充分和及時(shí)的討論,線(xiàn)下開(kāi)會(huì)那種“你一言,我一語(yǔ)”的互動(dòng)很難有效實(shí)現(xiàn)。這意味著中間的調(diào)度器不夠靈活,不能遠(yuǎn)程、及時(shí)并善解人意地開(kāi)關(guān)、切換話(huà)筒和鏡頭。潘云鶴這樣談及其中的挑戰(zhàn),并認(rèn)為問(wèn)題就是動(dòng)力,企業(yè)應(yīng)該瞄準(zhǔn)這個(gè)其中的商機(jī),研究更智能的產(chǎn)品,占領(lǐng)各個(gè)山頭。
問(wèn)題就是動(dòng)力,尋著現(xiàn)實(shí)問(wèn)題進(jìn)行研發(fā)也是科技巨頭的解題方法。英特爾研究院院長(zhǎng)Rich Uhlig透露,目前其研究院研究創(chuàng)新的沉浸式臨場(chǎng)感技術(shù),用于支持仿真交互,應(yīng)對(duì)許多人因長(zhǎng)時(shí)間虛擬工作而出現(xiàn)的“虛擬疲勞”綜合癥。這些技術(shù)在現(xiàn)有直播解決方案中集成了多攝像頭,并整合實(shí)現(xiàn)仿真交互,可用于視頻通話(huà)及在線(xiàn)直播內(nèi)容。他們經(jīng)過(guò)人類(lèi)學(xué)研究發(fā)現(xiàn),人們使用注視、手勢(shì)、姿勢(shì)、體態(tài)、話(huà)語(yǔ)、行動(dòng)及其他提示來(lái)實(shí)現(xiàn)對(duì)某一領(lǐng)域和所指之物的共同關(guān)注,從而建立起有效的互動(dòng)。他們正在探索如何通過(guò)陣列攝像頭技術(shù)、計(jì)算聲學(xué)和多模型信號(hào)語(yǔ)義理解實(shí)現(xiàn)沉浸式互動(dòng),從而減少全虛擬環(huán)境中的摩擦和認(rèn)知負(fù)荷。
在環(huán)境計(jì)算推進(jìn)過(guò)程中哪些難點(diǎn)是巨頭們關(guān)注的?宋繼強(qiáng)認(rèn)為:“環(huán)境計(jì)算的挑戰(zhàn),一是如何從多模態(tài)的感知到形成個(gè)性化的對(duì)用戶(hù)理解,二是怎樣把交互內(nèi)容跟沉浸式技術(shù)形式很好地結(jié)合起來(lái)。”
從多模態(tài)感知到形成個(gè)性化對(duì)用戶(hù)的理解,韋青認(rèn)為其中的難點(diǎn)是建模。他表示:“當(dāng)我們利用傳感器收集了大量的數(shù)據(jù),我們?nèi)绾螌⑦@些數(shù)據(jù)進(jìn)行建模,形成我們對(duì)事物的認(rèn)知,這其中很關(guān)鍵的挑戰(zhàn)在于,目前我們的建模能力還很弱,還不夠高效、不夠全面,還是單點(diǎn)的。而圖計(jì)算是破解這一難點(diǎn)的重要突破方向?!?/p>
圖計(jì)算( Gnph)最近很熱,包括在剛剛舉行的世界人工智能大會(huì)上,它也是熱門(mén)的技術(shù)。Rich Uhlig在此前接受《中國(guó)電子報(bào)》記者采訪(fǎng)時(shí)表示,圖計(jì)算也將是非常重要的一種新型計(jì)算方式。計(jì)算主要是發(fā)現(xiàn)數(shù)據(jù)之間的內(nèi)在關(guān)系,尤其是大規(guī)模的數(shù)據(jù)之間的內(nèi)在關(guān)系。今天,現(xiàn)有的計(jì)算系統(tǒng)運(yùn)行圖計(jì)算所涉及的數(shù)據(jù)庫(kù)效率非常低。因?yàn)檫@些關(guān)系型數(shù)據(jù)本身就非常稀疏,在內(nèi)存訪(fǎng)問(wèn)模式上具有不穩(wěn)定性,所以貝葉斯算法無(wú)法應(yīng)用。圖計(jì)算可以有效提升稀疏數(shù)據(jù)的處理效率。
尋找更多更有效解決這個(gè)世界難題的技術(shù),創(chuàng)造更多讓我們更舒適的技術(shù)。在接受采訪(fǎng)時(shí),韋青多次強(qiáng)調(diào)不要設(shè)限。他認(rèn)為:“我們需要從更大的維度看待挑戰(zhàn),看待技術(shù)的發(fā)展,當(dāng)技術(shù)和產(chǎn)業(yè)走到今天這樣的一個(gè)節(jié)點(diǎn),我們看待世界、研究世界的方法,以及創(chuàng)新的方法已經(jīng)和原來(lái)不一樣。從還原論到系統(tǒng)論,從單一到復(fù)雜,從瀑布式到敏捷式開(kāi)發(fā),從產(chǎn)品有版本到無(wú)版本,這代表什么?代表我們對(duì)這個(gè)世界變化的認(rèn)知能力與改造能力和過(guò)去不一樣。”
從設(shè)備到AI到服務(wù),我們?nèi)绾巍安辉O(shè)限”地進(jìn)行創(chuàng)新,又如何圍繞人、圍繞場(chǎng)景進(jìn)行最佳的組合,有著巨大的空間以及巨大的商業(yè)機(jī)會(huì),等待產(chǎn)業(yè)更大維度攜手創(chuàng)新。