国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

具身智能或?qū)⒁I(lǐng)人工智能下一波浪潮

2023-12-31 11:55:26余秀
中國(guó)教育網(wǎng)絡(luò) 2023年8期
關(guān)鍵詞:機(jī)器人人工智能智能

文/本刊記者 余秀

當(dāng)前,具身智能(Embodied Artificial Intelligence)作為人工智能領(lǐng)域的一個(gè)分支,正在成為學(xué)術(shù)界和產(chǎn)業(yè)界備受關(guān)注的一個(gè)焦點(diǎn)。

所謂具身智能Embodied AI ,指的是有身體并支持物理交互的智能體。英偉達(dá)(NVIDIA)創(chuàng)始人兼CEO 黃仁勛在ITF World 2023 半導(dǎo)體大會(huì)上稱,具身智能將引領(lǐng)下一波人工智能浪潮。在產(chǎn)業(yè)界,谷歌 DeepMind 推出首個(gè)控制機(jī)器人的視覺語(yǔ)言動(dòng)作(VLA)模型 RT-2;憑借ChatGPT 取得巨大成功的OpenAI,曾經(jīng)解散機(jī)器人團(tuán)隊(duì),如今投資挪威機(jī)器人初創(chuàng)公司One X Technologies,推出名為Neo的新型人工智能機(jī)器人。

國(guó)內(nèi)政策也在推進(jìn)具身智能的發(fā)展。5 月,北京市發(fā)布《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施》,提出探索通用智能體、具身智能和類腦智能等通用人工智能新路徑,包括推動(dòng)具身智能系統(tǒng)研究及應(yīng)用,突破機(jī)器人在開放環(huán)境、泛化場(chǎng)景、連續(xù)任務(wù)等復(fù)雜條件下的感知、認(rèn)知、決策技術(shù)。

什么是具身智能?

根據(jù)中國(guó)計(jì)算機(jī)學(xué)會(huì)專家的定義,具身智能(Embodied Artificial Intelligence)是指一種基于物理身體進(jìn)行感知和行動(dòng)的人工智能系統(tǒng),其通過(guò)智能體與環(huán)境的交互獲取信息、理解問題、做出決策并實(shí)現(xiàn)行動(dòng),從而產(chǎn)生智能行為和適應(yīng)性。

當(dāng)一位谷歌工程師發(fā)出命令“撿起滅絕動(dòng)物”,RT-2 機(jī)器人便從桌子上的眾多玩偶中定位并挑選出一只恐龍。

具身智能植根于認(rèn)知科學(xué)“具身認(rèn)知”的概念,該概念強(qiáng)調(diào)身體在主體的思想和認(rèn)知能力的形成中發(fā)揮的重要作用,認(rèn)為身體與周圍環(huán)境之間的互動(dòng)是發(fā)展認(rèn)知能力的基礎(chǔ)。具身視角帶來(lái)了人工智能系統(tǒng)與物理世界交互的必要性。

機(jī)器人技術(shù)給了具身智能身體,因?yàn)橄鄬?duì)于計(jì)算機(jī)定義輸入,機(jī)器人可以與物理世界互動(dòng)。機(jī)器人技術(shù)為人工智能系統(tǒng)提供了具有感官和運(yùn)動(dòng)能力的身體。通過(guò)集成攝像頭、麥克風(fēng)和觸覺傳感器等一系列傳感器,配備輪子、電動(dòng)關(guān)節(jié)、夾具等執(zhí)行器,人工智能能夠像人類一樣依靠感官來(lái)感知世界,與環(huán)境進(jìn)行交互和探索,實(shí)現(xiàn)具身智能體的“看”“說(shuō)”“聽”“動(dòng)”等。

人工智能系統(tǒng)是具身智能的“頭腦”。隨著深度學(xué)習(xí)的不斷進(jìn)步,具身智能的“頭腦”通常由深度神經(jīng)網(wǎng)絡(luò)模型驅(qū)動(dòng),尤其是隨著大語(yǔ)言模型(LLM)的發(fā)展,結(jié)合視覺等多種傳感器的復(fù)雜多模態(tài)模型,成為一大趨勢(shì)。具有通用能力的LLM 和VLM(視覺語(yǔ)言模型)等模型,賦予了強(qiáng)大的泛化能力,使得機(jī)器人從程序執(zhí)行導(dǎo)向轉(zhuǎn)向任務(wù)目標(biāo)導(dǎo)向,不再受限于特定的程序執(zhí)行,而能夠根據(jù)任務(wù)目標(biāo)智能地采取行動(dòng)。從豐富的數(shù)據(jù)和任務(wù)中學(xué)習(xí)決策和控制,它們不斷演化以適應(yīng)更復(fù)雜的任務(wù)和環(huán)境。

具身智能的目標(biāo)是讓具有感知和行動(dòng)能力的智能體(如機(jī)器人),在與環(huán)境的交互中持續(xù)演進(jìn),逐漸產(chǎn)生認(rèn)知能力,能夠理解、推理、學(xué)習(xí)、規(guī)劃和決策,甚至具備常識(shí)和情感,從而實(shí)現(xiàn)更復(fù)雜的功能。

彌合數(shù)字AI 與物理世界的距離

截至目前,人工智能取得了令人興奮的進(jìn)展,但仍存有一個(gè)尚未克服的基本限制——它僅限于數(shù)字領(lǐng)域?,F(xiàn)有的多數(shù)人工智能系統(tǒng)純粹以數(shù)字形式存在,沒有“身體”,缺乏與物理世界的直接連接。這種局限性具體體現(xiàn)為以下幾點(diǎn):

缺乏實(shí)際存在。數(shù)字人工智能系統(tǒng)本質(zhì)上是代碼、算法和數(shù)據(jù)。雖然它擅長(zhǎng)處理信息和解決數(shù)字領(lǐng)域的復(fù)雜問題,但它缺乏有意義的與現(xiàn)實(shí)世界交互所需的感官輸入和物理存在。

環(huán)境意識(shí)有限。由于缺乏視覺、觸覺或聲音等感官體驗(yàn),理解物理世界的復(fù)雜性對(duì)數(shù)字人工智能系統(tǒng)提出了挑戰(zhàn)。因此,它很難有效地應(yīng)對(duì)現(xiàn)實(shí)世界的情況。

情境理解。在物理世界中,上下文對(duì)于語(yǔ)義理解起著至關(guān)重要的作用。然而,主要依賴于數(shù)據(jù)和算法的數(shù)字人工智能系統(tǒng)在處理上下文方面經(jīng)常遇到挑戰(zhàn)。因此,它很難理解微妙的細(xì)節(jié)并根據(jù)態(tài)勢(shì)感知做出明智的判斷。

數(shù)據(jù)依賴性。數(shù)字人工智能嚴(yán)重依賴歷史數(shù)據(jù),這會(huì)降低其對(duì)不可預(yù)見情況的適應(yīng)性。這種以數(shù)據(jù)為中心的方法可能會(huì)限制其在不斷變化的現(xiàn)實(shí)環(huán)境中有效響應(yīng)的能力。

具身智能通過(guò)創(chuàng)建與現(xiàn)實(shí)世界交互的人工智能系統(tǒng),為這些限制提供解決方案??梢哉f(shuō),具身智能彌合了數(shù)字AI 與現(xiàn)實(shí)世界的距離。

具身智能:通用人工智能(AGI)新路徑

Unimal 進(jìn)化出新的手臂來(lái)適應(yīng)游樂場(chǎng)中的生活

ChatGPT 雖然能生成符合人類邏輯的語(yǔ)句,但是它的原理是基于模型運(yùn)算,會(huì)把大概率有用的字詞留下,無(wú)用的字詞撇去,而它對(duì)于自己生成的內(nèi)容并不理解?!癈hatGPT 和其他大型神經(jīng)網(wǎng)絡(luò)模型是人工智能領(lǐng)域令人興奮的發(fā)展,這表明學(xué)習(xí)人類語(yǔ)言結(jié)構(gòu)等真正困難的挑戰(zhàn)是可以解決的。然而,如果繼續(xù)使用相同的方法進(jìn)行設(shè)計(jì),這些類型的人工智能系統(tǒng)不太可能發(fā)展到可以完全像人腦一樣思考的程度?!敝x菲爾德大學(xué)認(rèn)知機(jī)器人學(xué)教授托尼·普雷斯科特(Tony Prescott)明確表示。

在《科學(xué)機(jī)器人(Science Robotics)》雜志上發(fā)表的一篇論文中,普雷斯科特和斯圖爾特·威爾遜博士提出,模擬生物智能(例如人腦),將人工智能融入機(jī)器人中,使它們能夠與周圍的世界互動(dòng)并像人腦一樣進(jìn)化,這是人工智能獲得類人認(rèn)知的最有可能的方式。

通用人工智能AGI 是“智能代理理解或?qū)W習(xí)人類可以完成的任何智力任務(wù)的能力”,是人工智能領(lǐng)域的長(zhǎng)期目標(biāo)之一。具身智能越來(lái)越被視為實(shí)現(xiàn)AGI 的可行路徑。

斯坦福大學(xué)以人為本人工智能研究院(HAI)的李飛飛團(tuán)隊(duì),2021 年在《自然通訊》上發(fā)表《通過(guò)學(xué)習(xí)和進(jìn)化實(shí)現(xiàn)具身智能(Embodied Intelligence via Learning and Evolution)》,在研究中創(chuàng)造了簡(jiǎn)單的虛擬節(jié)肢動(dòng)物“Unimal”,并將它們放置在模擬的游樂場(chǎng)中,來(lái)研究它們的學(xué)習(xí)和發(fā)展能力。實(shí)驗(yàn)結(jié)果表明,具身化對(duì)智能進(jìn)化的重要性:身體形態(tài)會(huì)影響虛擬生物在復(fù)雜環(huán)境的適應(yīng)和學(xué)習(xí)能力,復(fù)雜環(huán)境也會(huì)促進(jìn)虛擬生物形態(tài)和智能上的進(jìn)化。

當(dāng)被問及“人工智能發(fā)展下去能不能成為與人類相似的獨(dú)立智能行為者?”時(shí),清華大學(xué)電子工程系教授李星提出了類人的人工智能形成的兩個(gè)要素:實(shí)體化和繁殖能力,實(shí)體化是首要要素。“人工智能必須實(shí)現(xiàn)實(shí)體化并具備主體性。類似于人類需對(duì)自己的行為負(fù)責(zé),人工智能也需要一個(gè)獨(dú)立實(shí)體來(lái)承擔(dān)責(zé)任。這種實(shí)體化并不僅僅是給人工智能一個(gè)外形,還要建立人工智能思考和推理機(jī)制與實(shí)體之間的緊密聯(lián)系,類似于人的身體與頭腦之間的聯(lián)系?!?/p>

上海交大教授盧策吾認(rèn)為,相對(duì)于非具身而言,具身智能具有可達(dá)性、可檢驗(yàn)性、可解釋性,基本要素可測(cè)量,可用任務(wù)檢驗(yàn),可通過(guò)具身學(xué)習(xí)推斷概念,“可能是邁向通用人工智能的一個(gè)很好的起點(diǎn)”。 Google DeepMind 機(jī)器人和機(jī)器學(xué)習(xí)工程師基爾薩娜·戈帕拉克里希南(PG Keerthana Gopalakrishnan)明確稱對(duì)于AGI 來(lái)說(shuō),具身實(shí)體是絕對(duì)不可缺少的。

具身智能的發(fā)展成果

大多數(shù)具身智能都集中在機(jī)器人訓(xùn)練和自動(dòng)駕駛汽車技術(shù)上,自動(dòng)駕駛車輛需要在物理空間中行動(dòng),并根據(jù)它們所看到的東西做出可能的判斷。具身智能在各種現(xiàn)實(shí)世界場(chǎng)景中證明了其有效性,一些關(guān)鍵的實(shí)際應(yīng)用包括自動(dòng)駕駛汽車、制造和組裝、衛(wèi)生保健、搜尋及救援、太空探索、動(dòng)力外骨骼等。

近期具身智能領(lǐng)域的創(chuàng)新進(jìn)一步凸顯了其潛力,以下是一些顯著的成果:

Google Deepmind 發(fā)布了機(jī)器人模型RT-2(Robotic Transformer 2),是一個(gè)全新的視覺—語(yǔ)言—?jiǎng)幼鳎╒LA)模型,可以從網(wǎng)絡(luò)和機(jī)器人數(shù)據(jù)中學(xué)習(xí),并將這些知識(shí)轉(zhuǎn)化為機(jī)器人控制的通用指令,它具有很強(qiáng)的泛化能力,可以對(duì)機(jī)器人數(shù)據(jù)中從未見過(guò)的物體或場(chǎng)景執(zhí)行操作任務(wù)。

Meta 推出了VC-1 和ASC。VC-1 是一種人工視覺皮層,其靈感源自人類視覺皮層將視覺轉(zhuǎn)化為行動(dòng)的能力。VC-1 使用日常任務(wù)視頻進(jìn)行訓(xùn)練,在虛擬環(huán)境中的17 項(xiàng)感覺運(yùn)動(dòng)任務(wù)中表現(xiàn)出色,超越了其前輩。自適應(yīng)性技能協(xié)調(diào)(ASC)是一種通過(guò)協(xié)調(diào)和調(diào)整學(xué)習(xí)的視覺運(yùn)動(dòng)技能來(lái)完成機(jī)器人移動(dòng)操作任務(wù)的方法。令人印象深刻的是,ASC 在現(xiàn)實(shí)環(huán)境中涉及機(jī)器人移動(dòng)和操縱的復(fù)雜任務(wù)中取得了98%的成功率。

麻省理工學(xué)院和斯坦福大學(xué)的研究人員設(shè)計(jì)了一種新的機(jī)器學(xué)習(xí)方法,可用于在條件快速變化的動(dòng)態(tài)環(huán)境中更有效地控制機(jī)器人,例如無(wú)人機(jī)或自動(dòng)駕駛汽車。將控制理論與機(jī)器學(xué)習(xí)相結(jié)合,使這些機(jī)器人無(wú)需單獨(dú)的指令即可學(xué)習(xí)如何移動(dòng),并且可以用更少的數(shù)據(jù)獲得更好的性能。

麻省理工學(xué)院和其他地方的研究人員開發(fā)了一種技術(shù),使人類能夠有效地微調(diào)未能完成所需任務(wù)(例如拿起一個(gè)獨(dú)特的杯子)的機(jī)器人,簡(jiǎn)化了機(jī)器人教學(xué)過(guò)程。當(dāng)機(jī)器人遇到故障時(shí),系統(tǒng)會(huì)生成反事實(shí)解釋,例如建議可能導(dǎo)致成功的替代行動(dòng)。用戶提供有關(guān)機(jī)器人失敗原因的反饋,系統(tǒng)利用該反饋來(lái)提高機(jī)器人的性能。這種方法顯著減少了教授機(jī)器人新任務(wù)所需的時(shí)間和精力,使其成為幫助老年人或殘疾人的通用機(jī)器人的理想選擇。

具身智能領(lǐng)域的不斷創(chuàng)新和突破,將會(huì)把智能引向新的高度,推動(dòng)科技不斷邁向未來(lái),為人類社會(huì)帶來(lái)更廣泛、更深遠(yuǎn)的變革。

斯坦福大學(xué)李飛飛團(tuán)隊(duì)發(fā)布VoxPoser系統(tǒng),將大模型接入機(jī)器人,把復(fù)雜指令轉(zhuǎn)化成具體行動(dòng)規(guī)劃,人類可以很隨意地用自然語(yǔ)言給機(jī)器人下達(dá)指令。更重要的是,通過(guò)結(jié)合大語(yǔ)言模型(LLM)和視覺語(yǔ)言模型(VLM),構(gòu)建3D 值地圖,可以讓機(jī)器人在零樣本學(xué)習(xí)的情況下,理解指令,分解任務(wù),規(guī)劃路徑,并最終實(shí)現(xiàn)操作任務(wù)。在該方法下進(jìn)行機(jī)器人操控時(shí),不需要做數(shù)據(jù)投喂和預(yù)訓(xùn)練。

具身智能具有強(qiáng)大的產(chǎn)業(yè)潛力。2023世界機(jī)器人大會(huì)上,2000年圖靈獎(jiǎng)獲得者、中國(guó)科學(xué)院院士、清華大學(xué)交叉信息研究院院長(zhǎng)姚期智在談及機(jī)器人發(fā)展時(shí)表示:未來(lái)的AGI 需要有具身的實(shí)體,同真實(shí)的物理世界相交互來(lái)完成各種任務(wù),這樣才能給產(chǎn)業(yè)帶來(lái)真正更大的價(jià)值。

達(dá)成具身智能還有很多問題要克服。姚期智指出,具身智能目前遇到的四大主要挑戰(zhàn):第一,機(jī)器人不能夠像大語(yǔ)言模型一樣有一個(gè)基礎(chǔ)大模型直接一步到位,做到最底層的控制;第二,計(jì)算能力的挑戰(zhàn)。哪怕谷歌研發(fā)的Robotics Transformer模型,要做到機(jī)器人控制,距離實(shí)際需要的控制水平仍有許多事情要做;第三,如何把機(jī)器人多模態(tài)的感官感知全部融合起來(lái),仍面臨諸多難題需要解決;第四,機(jī)器人的發(fā)展需要收集很多數(shù)據(jù),其中也面臨很多安全隱私等方面的問題。

具身智能雖然面臨眾多挑戰(zhàn),但是其潛力不可估量??朔@些問題將可能通往通用人工智能(AGI),并且產(chǎn)生巨大的產(chǎn)業(yè)價(jià)值。我們正站在一個(gè)令人興奮的時(shí)刻,具身智能領(lǐng)域的不斷創(chuàng)新和突破,將會(huì)把智能引向新的高度,推動(dòng)科技不斷邁向未來(lái),為人類社會(huì)帶來(lái)更廣泛、更深遠(yuǎn)的變革。

猜你喜歡
機(jī)器人人工智能智能
2019:人工智能
商界(2019年12期)2019-01-03 06:59:05
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
人工智能與就業(yè)
數(shù)讀人工智能
小康(2017年16期)2017-06-07 09:00:59
下一幕,人工智能!
機(jī)器人來(lái)幫你
認(rèn)識(shí)機(jī)器人
太保市| 会宁县| 安庆市| 虎林市| 马公市| 聊城市| 黄石市| 惠东县| 德令哈市| 六安市| 自贡市| 佛学| 桦川县| 防城港市| 色达县| 平南县| 高青县| 岳西县| 浪卡子县| 万年县| 沭阳县| 叶城县| 岗巴县| 龙川县| 宝清县| 和田市| 商南县| 从化市| 包头市| 周至县| 原阳县| 图片| 辽阳县| 玉林市| 黄骅市| 灵宝市| 盐源县| 新龙县| 苍山县| 兖州市| 河间市|