制造業(yè)作為經(jīng)濟發(fā)展的核心驅(qū)動力,在美國、德國和歐盟等國家和地區(qū)受到高度重視。2019年德國公布《國家工業(yè)戰(zhàn)略2030》,2020年歐盟將“工業(yè)4.0”戰(zhàn)略升級為“工業(yè)5.0”,2020年的新冠疫情沖擊造成全球供應鏈出現(xiàn)嚴重中斷,全球產(chǎn)業(yè)鏈分工邏輯從效率優(yōu)先向效率與安全并重轉(zhuǎn)變,進一步推動制造業(yè)本土化。
制造業(yè)在中國經(jīng)濟崛起中也發(fā)揮了重要作用。為發(fā)揮產(chǎn)業(yè)鏈供應鏈安全問題和制造業(yè)在保障國家安全等方面的關鍵作用,國家“十四五”規(guī)劃就提出了“保持制造業(yè)比重基本穩(wěn)定”的重要目標,二十大報告進一步指出“堅持把發(fā)展經(jīng)濟的著力點放在實體經(jīng)濟上,推進新型工業(yè)化,加快建設制造強國”。
傳統(tǒng)自動化技術賦能制造業(yè)?;仡櫧祟愇拿餮杆侔l(fā)展的歷程,就是科學技術不斷為制造業(yè)賦能、提高制造業(yè)自動化程度的歷史,新興的科學技術不斷應用于制造業(yè)中,以促進制造業(yè)的發(fā)展,進而推動經(jīng)濟的快速增長。最重要的通用目的技術有四種,分別驅(qū)動了四次工業(yè)革命,它們是蒸汽機、電力、內(nèi)燃機和數(shù)字技術。這些傳統(tǒng)自動化技術顯著提高了制造業(yè)生產(chǎn)效率,但面對高度復雜和動態(tài)變化的生產(chǎn)要求和生產(chǎn)環(huán)境仍然存在諸多局限。
具身智能(Embodied AI)為制造業(yè)企業(yè)工作流與產(chǎn)業(yè)格局帶來全新的發(fā)展契機。具身智能與基于傳統(tǒng)規(guī)則的人工智能不同,其通過與人類及物理環(huán)境的交互,實現(xiàn)感知與認知,從而在面對復雜環(huán)境和動態(tài)變化時,能及時自主決策并執(zhí)行任務。具體而言,在生產(chǎn)線各環(huán)節(jié)中,“具身智能工人”與“具身智能設備” 不僅能進行高度復雜的生產(chǎn)作業(yè),還能處理任務執(zhí)行中各類信息進行迭代學習,優(yōu)化自身行為。這使得具身智能具有高度生產(chǎn)靈活性,隨時響應,優(yōu)化流程,實現(xiàn)增效降本,提高產(chǎn)品質(zhì)量及市場匹配度。
具身智能將引起制造業(yè)生產(chǎn)函數(shù)、人機關系、制造范式、產(chǎn)業(yè)間關系的深度變革。具身智能制造本身與具身智能應用于傳統(tǒng)制造業(yè),將以技術改變企業(yè)管理、組織架構及產(chǎn)業(yè)結構。本文旨在通過理論分析與實踐評估,初步探討具身智能重塑制造業(yè)企業(yè)工作流與產(chǎn)生格局的邏輯,為其深入發(fā)展提供戰(zhàn)略意見和理論支持。本文主要回答以下幾個核心問題:探討具身智能的核心技術及具身智能在制造業(yè)中的應用場景有哪些?如何用管理學理論解釋具身智能重塑制造業(yè)企業(yè)發(fā)展格局?具身智能如何重塑制造業(yè)企業(yè)工作流及變革制造業(yè)發(fā)展格局?具身智能發(fā)展有哪些難點與挑戰(zhàn)?加快具身智能發(fā)展應提出哪些對策建議?
具身智能是指能夠與環(huán)境(人類環(huán)境與物理環(huán)境)交互,通過交互感知、學習、分析,掌握一項新技能,且進一步生成新知識的一類人工智能。早在1950年圖靈便指出人工智能實現(xiàn)路徑或可有兩條,一是教會機器人下象棋(抽象計算),二是賦予機器感覺器官,教會其學習并聽懂語言。它們分別代表了兩類人工智能“學習”方式,前一種人工智能實現(xiàn)依靠“給予智能任務”,以“專家系統(tǒng)”與人工神經(jīng)網(wǎng)絡為代表。第二種則為“賦予智能能力”,認為智能行為應在行為主體與環(huán)境的交互過程中產(chǎn)生,倡導智能應是是具身化和情境化的具身智能。
近期本體硬件、智能體感知與訓練方式等在智能傳感器、人形機器人、大模型算法、多模態(tài)技術、仿真及動態(tài)捕捉等各技術領域?qū)崿F(xiàn)突破,使具身智能成為發(fā)展通用人工智能最具前景的技術路線。具身智能技術實現(xiàn)包含兩個部分(見圖1):一是在物理或者虛擬世界進行交互和任務執(zhí)行的本體;二是置于本體之上的智能核心,即智能體,用于實現(xiàn)感知、理解、決策和控制等核心工作。具身智能實現(xiàn)需要集成本體對環(huán)境感知、與環(huán)境交互和執(zhí)行操作的能力;以及智能體理解與分析、自主決策與控制精細動作、迭代學習的能力。本體硬件上,以各類傳感器為核心部件形成基礎交互系統(tǒng),人形機器人提供機械身體實現(xiàn)基本運動控制,可作為具身智能其中一種行為載體(見圖2)。智能體中,預訓練大模型實現(xiàn)突破,成為機器從文本、圖像、視頻、音頻等多模態(tài)信息中學習的基礎。研究人員致力于結合大語言模型與多模態(tài)技術,為具身智能提供處理視覺信號、語音與自然語言信號的交互感知能力。比如具身視覺語言模型Google PaLM-E、NvidiaVIMA、Google Deepmind RT-X,算法處理通過大模型整體調(diào)度+小模型精調(diào)方式使機器實現(xiàn)具體任務??刂婆c執(zhí)行訓練目前存在虛擬仿真與動態(tài)捕捉兩類方法,虛擬仿真類似于強化學習和無監(jiān)督學習,通過在模擬器中不斷嘗試最終找到策略,目前該方法對訓練機器習得用小腦執(zhí)行的“本能”任務非常有效,訓練情境有英偉達元宇宙仿真場景平臺Omniverse等。而對于現(xiàn)實世界復雜問題,目前采取動態(tài)捕捉+遙操作方法模仿人類的“控制”行為,實體環(huán)境中Tesla Optimus和騰訊 Robotics X等人形機器人均采用該種方式訓練(見圖3)。
具身智能是技術進步的產(chǎn)物,其可影響企業(yè)資源配置、組織管理與戰(zhàn)略制定,重塑制造業(yè)企業(yè)工作流。
隨著大數(shù)據(jù)、云計算、人工智能等技術發(fā)展,新興技術群——智能技術群逐漸形成。制造-服務融合成為新的生產(chǎn)組織形式,開放、協(xié)同、共享的創(chuàng)新生態(tài)系統(tǒng)得以構建,制造業(yè)企業(yè)的數(shù)字化轉(zhuǎn)型以及平臺企業(yè)的發(fā)展為其中最典型的表現(xiàn)形式。新興技術沖擊制造業(yè)企業(yè)管理模式,引發(fā)了學者對于“智能化管理”理論的思考。部分學者提出人工智能技術難以實現(xiàn)管理智能化,原因在于基于大數(shù)據(jù)訓練的深度學習技術并無自主糾偏能力,難以真正替代人類從事腦力勞動。這為具身智能變革現(xiàn)有制造業(yè)企業(yè)工作流的管理理論提供新的思路。
具身智能的引入可能會對現(xiàn)有的組織結構、工作流程與企業(yè)文化產(chǎn)生深遠的影響,其核心是全面自動化與人機協(xié)同。一是具身智能參與制造業(yè)企業(yè)管理的核心是交互式管理,其中包括人機交互與機器間交互。二是具身智能作為生產(chǎn)設備參與生產(chǎn),生產(chǎn)與管理能夠自學習、自適應、自迭代,實現(xiàn)生產(chǎn)決策的因素窮盡與生產(chǎn)環(huán)節(jié)的持續(xù)優(yōu)化。三是具身智能與人類協(xié)同的組織結構轉(zhuǎn)型,具身智能滲透進入人力資源管理、財務管理等管理決策中。組織架構轉(zhuǎn)變?yōu)椋祟悓W⒂诰呱碇悄芗夹g研發(fā)與應用,具身智能則管理生產(chǎn)。
具身智能的不斷發(fā)展,其在制造業(yè)中的應用逐漸深入,帶來了對工作流的全面重塑。這種重塑不僅體現(xiàn)在生產(chǎn)效率的提升,還涉及生產(chǎn)函數(shù)的變革、人機關系的重構以及制造范式的轉(zhuǎn)型。
具身智能重塑生產(chǎn)函數(shù)
具身智能成為數(shù)據(jù)生產(chǎn)要素的“礦山”與“開礦工具”,將會改變生產(chǎn)要素中勞動力要素結構,重塑生產(chǎn)函數(shù)。
一是具身智能成為挖掘數(shù)據(jù)要素的 “開礦工具”和數(shù)據(jù)“礦山”。數(shù)據(jù)作為新型生產(chǎn)要素快速融入生產(chǎn)、分配、流通、消費和社會服務管理等各個環(huán)節(jié),具有無限性、非排他性、邊際效益遞增性等特性。具身智能在交互中習得,有自挖掘、自遍歷、自學習、自生成、自迭代的特點,通過交互感知“開采”多模態(tài)信息數(shù)據(jù),并不斷迭代學習生成新信息數(shù)據(jù)。比如,具身智能通過安裝在生產(chǎn)設備上的傳感器,能夠?qū)崟r監(jiān)測設備的運行狀態(tài)和生產(chǎn)線的操作情況,并通過自學習機制優(yōu)化生產(chǎn)參數(shù),在生產(chǎn)過程中實時獲取、處理和分析多模態(tài)數(shù)據(jù)。這種能力使得具身智能不僅生成新數(shù)據(jù),成為數(shù)據(jù)“礦山”,而具身智能也能充當“開礦工具”,不斷挖掘出新的數(shù)據(jù)價值,突破“數(shù)據(jù)瓶頸”。比如西門子公司推出的的開放式物聯(lián)網(wǎng)(IoT)操作系統(tǒng)“MindSphere”支持各來源實時操作數(shù)據(jù)的分析。
二是具身智能替代人力勞動,變革生產(chǎn)要素中勞動力要素結構。具身智能通過捕捉與學習實現(xiàn)控制與執(zhí)行,替代如加工組裝與搜索匹配等通過動作模仿和邏輯推理而完成的生產(chǎn)工作,改變勞動力生產(chǎn)要素結構。比如特斯拉“Optimus”機器人在生產(chǎn)線上能夠代替人工完成復雜的裝配任務,不僅提高了生產(chǎn)效率,還減少了因人工失誤而導致的次品率。部分工作崗位被具身智能系統(tǒng)替代。
具身智能變革人機關系
傳統(tǒng)制造業(yè)中,機器往往作為人類工人的輔助工具,主要承擔重復性和危險性的任務。具身智能的出現(xiàn)使得機器從“工具”轉(zhuǎn)變?yōu)椤昂献骰锇椤?,開啟了人機合作的新紀元。
一是具身智能實現(xiàn)人機交互智能化,交互習得并參與生產(chǎn)及決策。目前制造業(yè)生命周期多個環(huán)節(jié)中應用分析式人工智能作為生產(chǎn)管理輔助工具,比如Back2CAD CADGPT輔助研發(fā)設計與規(guī)劃;商湯AIDC、創(chuàng)新奇智AInno-15B工業(yè)大模型輔助生產(chǎn)制造;用友yongpt輔助經(jīng)營管理;國光電器智能音箱Vifa ChatMini輔助產(chǎn)品服務優(yōu)化等。亞馬遜倉庫機器人能夠?qū)崿F(xiàn)通過語音與工人交流并根據(jù)指令調(diào)整貨品位置。
二是從輔助生產(chǎn)走向合作生產(chǎn)。人類設計、生產(chǎn)并管理具身智能,具身智能替代人類實現(xiàn)其他產(chǎn)品設計和制造,人機合作成為制造活動主體。具身智能融合云、AI與物理世界,具有理解力、交互力、規(guī)劃和決策能力及可調(diào)本體形態(tài),不同形態(tài)智能本體設置于生產(chǎn)各環(huán)節(jié),通過具身智能設備之間、具身智能設備與工作人員之間連接與交互,實現(xiàn)原料到產(chǎn)品、廠內(nèi)設備和廠外設備、設備和人員,生產(chǎn)、銷售、配貨和售后全路徑貫通,具身智能自主安排生產(chǎn)計劃、優(yōu)化制造流程、自檢生產(chǎn)設備、監(jiān)督生產(chǎn)過程,并反饋信息不斷迭代,完成生產(chǎn)制造全流程。比如在現(xiàn)有的人機合作生產(chǎn)的寶馬汽車的裝配線上,已經(jīng)實現(xiàn)制造過程中具身智能與人類工人的部分協(xié)作。工人主要負責復雜決策和靈活操作,而具身智能則tHm9PYay+pVCOghnp2LURg==負責重復性和高精度的任務。通過這種人機合作模式,寶馬顯著提高了生產(chǎn)效率,并縮短了新車型的生產(chǎn)周期。
具身智能變革制造范式
具身智能的應用推動了制造業(yè)從傳統(tǒng)的有限柔性生產(chǎn)向全面柔性生產(chǎn)的轉(zhuǎn)型,進而實現(xiàn)了定制化規(guī)模生產(chǎn)和產(chǎn)用融合的制造范式。
一是具身智能參與其他產(chǎn)品生產(chǎn),實現(xiàn)全面柔性生產(chǎn)。傳統(tǒng)制造業(yè)中的柔性生產(chǎn)通常是有限的,即在一定范圍內(nèi)允許生產(chǎn)線對產(chǎn)品規(guī)格進行調(diào)整。然而,具身智能的引入使得全面柔性生產(chǎn)成為可能。具身智能能夠?qū)崿F(xiàn)生產(chǎn)端與用戶端無阻連接,其感知并發(fā)掘消費者需求并設計與提供相應產(chǎn)品,由用戶需求驅(qū)動產(chǎn)品開發(fā)和制造,實現(xiàn)工廠內(nèi)外互聯(lián)的創(chuàng)成式設計(Generative Design),以需求指導生產(chǎn),實現(xiàn)全面產(chǎn)用融合、供需協(xié)同與定制化規(guī)模生產(chǎn)。并且,具身智能通過實時感知市場需求的變化,并根據(jù)需求調(diào)整生產(chǎn)計劃和工藝流程。比如GE的“Predix”對生產(chǎn)各環(huán)節(jié)的實時監(jiān)控,并通過數(shù)據(jù)分析預測潛在故障風險,提前布局維護。
二是負責生產(chǎn)具身智能的新型制造業(yè)部門能夠?qū)崿F(xiàn)自我迭代。包括具身智能本體制造部門以及具身智能生產(chǎn)設備制造部門。比如具身智能本體制造部門中,有智能傳感器制造部門,其中涉及傳感器芯片、傳感器及其儀表的設計、生產(chǎn)及整機制造;也有具身智能機器人制造部門,涉及基礎電機、減速器、控制器到靈巧手等制造。交互感知基礎是各形態(tài)具身智能本體,具身智能本體生產(chǎn)集群涉及材料、機械工程、生物醫(yī)學等學科,其本身也可迭代學習并設計制造更適配的具身智能本體設備。比如西門子公司推出能夠?qū)崿F(xiàn)產(chǎn)品、工廠、系統(tǒng)和機器的互聯(lián)的開放式物聯(lián)網(wǎng)(IoT)操作系統(tǒng)“MindSphere”。
具身智能的發(fā)展不僅影響了制造業(yè)企業(yè)內(nèi)部的工作流,還對整個制造業(yè)的產(chǎn)業(yè)格局產(chǎn)生了深遠影響。其通過變革產(chǎn)業(yè)間關系、促進制造業(yè)與服務業(yè)的融合、重構全球供應鏈以及引領產(chǎn)業(yè)標準化,重塑制造業(yè)發(fā)展格局。
具身智能的未來是制造業(yè)與服務業(yè)全面融合
具身智能變革制造業(yè)與服務業(yè)關系。一是具身智能與制造業(yè)融合的未來是制造業(yè)與服務業(yè)全面融合。具身智能參與產(chǎn)品制造與服務提供,意味著工業(yè)經(jīng)濟時代大規(guī)模生產(chǎn)下專業(yè)化分工的產(chǎn)業(yè)邊界逐漸模糊。制造業(yè)與服務業(yè)全面融合意味著以制造業(yè)部門占GDP比重作為衡量制造業(yè)發(fā)展水平的衡量標準失效。制造業(yè)仍發(fā)揮著引擎作用,制造業(yè)發(fā)展水平評價體系應向適配智能制造發(fā)展趨勢演進,比如以具身智能使用強度作為制造業(yè)發(fā)展水平衡量標準之一。二是具身智能發(fā)展過程中變革制造-服務相對關系。作為通用目的技術,具身智能全行業(yè)賦能,導致因服務業(yè)相對生產(chǎn)率增速緩慢,所引起服務業(yè)占比擴大、經(jīng)濟增速減緩的“鮑莫爾成本?。˙aumol’s disease)”得以克服。具身智能賦能服務業(yè),使其生產(chǎn)率爆發(fā)式增長,并向勞動力節(jié)約型行業(yè)轉(zhuǎn)型。制造-服務相對價格變化會造成各行業(yè)相對規(guī)模變化,制造業(yè)與服務業(yè)全要素生產(chǎn)率增長率差值縮小,服務業(yè)相對價格上漲速度減緩,進一步使得服務業(yè)比重相對上升速度與制造業(yè)比重相對下降速度均減緩,保持制造業(yè)比重相對穩(wěn)定。
具身智能重構全球產(chǎn)業(yè)鏈
一是強化全球產(chǎn)業(yè)鏈韌性。實時數(shù)據(jù)采集與分析、智能決策支持等功能,使得供應鏈管理更加高效和精準。具身智能的應用增強了全球供應鏈的彈性和敏捷性,使得企業(yè)能夠更快速地響應市場需求和突發(fā)事件。比如亞馬遜全球供應鏈網(wǎng)絡,實現(xiàn)了高度自動化和智能化的庫存管理。特斯拉優(yōu)化了其供應鏈管理系統(tǒng)使其能迅速調(diào)整生產(chǎn)計劃,以應對新冠疫情期間物流中斷和零件短缺問題。
二是具身智能推動產(chǎn)業(yè)鏈垂直整合及區(qū)域協(xié)調(diào)。具身智能廣泛應用使得制造業(yè)企業(yè)內(nèi)部、上下游企業(yè)之間、同類企業(yè)之間信息互通,制造企業(yè)能夠好地控制生產(chǎn)過程,根據(jù)供需調(diào)整生產(chǎn)計劃,縮短產(chǎn)品上市周期,響應市場需求,靈活處理庫存。對全球供應市場的信息處理使得制造業(yè)企業(yè)能夠高效管理區(qū)域化生產(chǎn)和供應鏈,形成區(qū)域智能制造集群,并構成全球化的產(chǎn)業(yè)生態(tài)體系。
三是具身智能推動產(chǎn)業(yè)標準化。產(chǎn)業(yè)標準化與具身智能的廣泛運用是互相推動的。標準化推動具身智能技術普及,使得國家和地區(qū)快速適應這一新興技術。而具身智能本身可自我學習,能夠助力應用該技術的相關部門的產(chǎn)業(yè)標準化。
隨著大模型泛化能力進一步提升,各種具身方法和智能體將不斷涌現(xiàn)。然而實現(xiàn)具身智能會面臨數(shù)據(jù)、算法、工程技術、場景、復雜軟硬件、算力、量產(chǎn)等諸多等待解決的問題和挑戰(zhàn)。
技術的演進與突破
目前的人工智能技術,已經(jīng)在虛擬空間中實現(xiàn)生成式人工智能,具身智能與之不同之處在于:一是具有物理世界的執(zhí)行力,二是具有可成長空間,三是具有對事物、行為的主觀能動性。經(jīng)由具身智能走向通用人工智能的技術演進之路,核心是如何使人工智能“像人一樣”擁有本能及智慧。
然而目前仍存在以下多種技術問題。一是包括傳感器技術、芯片設計、人形機器人等在內(nèi)的關鍵硬件技術仍無法實現(xiàn)具身智能的“感受”與 “感知”。具身智能的傳感器需要通過物理反應、化學反應,最后傳到智能體“大腦”,才能實現(xiàn)真正的“感受”,這是具身智能能夠開始“學習”的先決條件,也是獲取信息的重要來源。那么技術上如何實現(xiàn)傳感器把聽覺、視覺、觸覺等多模態(tài)的信息壓縮成一個個信息單元,傳輸?shù)健按竽X”中呢?機器本體設計,涉及基礎電機、減速器、控制器等關鍵零部件,目前仍未形成模塊化的生產(chǎn)流程,硬件和材料能否實現(xiàn)規(guī)模化生產(chǎn),從而降低成本呢?芯片設計上,具身智能與動態(tài)環(huán)境交互,需要具備對實時大數(shù)據(jù)流處理、高并發(fā)、穩(wěn)定性與能效的復雜需求,何種計算框架才能達到呢?
二是構建一個高效暢通、高度通用的軟件生態(tài)充滿挑戰(zhàn)。具身智能系統(tǒng)融合了環(huán)境感知、物理交互和任務執(zhí)行等多方面的功能,涉及智能體到本體的相互連接、傳輸?shù)母黝惤M件,這意味著其任務必然是具身智能“軟件集”所驅(qū)動,而目前包含多模態(tài)感知、多任務適應、實時反應、自主學習迭代能力的軟件系統(tǒng)尚未形成。
三是需要結合合成數(shù)據(jù)及真實世界數(shù)據(jù)突破“數(shù)據(jù)瓶頸”。為使具身智能習得復雜知識、完成復雜任務,可以以互聯(lián)網(wǎng)數(shù)據(jù)訓練大模型、以仿真數(shù)據(jù)訓練精細動作、以標注數(shù)據(jù)習得具體任務。進一步地,從與真實世界的交互中,學習并迭代出新數(shù)據(jù)。而當前面臨數(shù)據(jù)采集困難、數(shù)據(jù)模擬成本高的問題。
應用場景的拓展與深化
一是新技術創(chuàng)新需要解決如何創(chuàng)造商業(yè)價值的問題。具身智能技術如何實現(xiàn)應用的落地、成果的轉(zhuǎn)化?如何把成本降低?如何確保收益的可持續(xù)性?如何解決在復雜不可控場景的“泛化”問題?
二是如何實現(xiàn)多種應用場景協(xié)同發(fā)力。目前布局具身智能研究及生產(chǎn)的有以特斯拉、比亞迪等為代表的車企,車企具有長期工業(yè)制造的經(jīng)驗,集成了成本控制、生產(chǎn)供應鏈、后端銷售等商業(yè)能力;谷歌、亞馬遜、BAT等互聯(lián)網(wǎng)公司能以最快的速度觸達和感知市場需求;波士頓動力、Figure 01等機器人公司除了產(chǎn)品本體制造外之外,也擁有強大的數(shù)據(jù)智能能力。三類企業(yè)該如何互補合作,實現(xiàn)產(chǎn)投協(xié)同?
全球競爭與合作
具身智能作為能影響全人類發(fā)展的尖端技術,在全球技術研發(fā)的過程中往往會面臨競爭與合作的問題。一是我國發(fā)展具身智能面臨極其復雜的國際局勢。目前我國高端芯片采購使用受阻,算力競爭力發(fā)展受到一定抑制。美國升級對華芯片及芯片制造工具出口禁令,國產(chǎn)芯片產(chǎn)量大但存在未突破關鍵技術。通用大模型在理論研究、技術創(chuàng)新以及應用實踐方面,仍有較大進步空間,且存在研發(fā)、訓練、使用成本過高問題。二是面對如此復雜的國際環(huán)境,如何在競爭中取得產(chǎn)業(yè)標準化與技術規(guī)范的主導地位,以鞏固本國在具身智能領域的市場地位?
倫理與社會挑戰(zhàn)
具身智能技術進步與社會價值存在一定沖突。一是隱私與安全問題,具身智能在采集和處理個人數(shù)據(jù)時,會對隱私安全保護帶來挑戰(zhàn);二是具身智能替代制造業(yè)中低技能勞動,存在大規(guī)模失業(yè)及社會不穩(wěn)定的風險;三是技術倫理和責任分配問題,當具身智能可以交互、學習、思考、決策,無人監(jiān)督時自主決策過程中的倫理問題也日漸凸顯,意味著可能存在錯誤決策的責任分配問題,責任分配也將成為重要的法律和倫理問題。
發(fā)展具身智能,需要在控制風險的基礎上尋求技術突破,因此提出以下加快具身智能發(fā)展對策建議。
以應用落地塑造技術演進方向
具身智能技術演進具有應用和技術雙輪驅(qū)動的特征,中國以完備工業(yè)體系與豐富應用落地場景為根基,從終端應用回溯激發(fā)技術創(chuàng)新,用業(yè)界應用落地需求塑造科技演進方向。美國擁有領先的人工智能芯片、算法、機器學習等核心技術,而中國優(yōu)勢在于完備工業(yè)體系下豐富應用落地場景。因此,政策應引導行業(yè)應用先行,由應用端數(shù)據(jù)回環(huán),來帶動具身智能技術突破、實用性增強及技術迭代。一是挖掘先進制造業(yè)中具身智能應用場景先行先試。挖掘裝備制造、儀器儀表、集成電路和生物醫(yī)藥等先進制造業(yè)生產(chǎn)中瓶頸問題和可智能化生產(chǎn)流程,優(yōu)先探索工業(yè)大腦、機器人協(xié)助制造、機器視覺工業(yè)檢測、設備互聯(lián)管理等智能場景。二是以具身智能自學習實現(xiàn)應用領域拓展。制造業(yè)場景中部署具身智能集合高質(zhì)量垂域數(shù)據(jù),用于訓練工業(yè)大模型進而讓智能體自我進化。三是政府治理和民生領域需求拉動具身智能發(fā)展。使用具身智能輔助政府決策、政府治理及民生保障,助力決策前瞻化、科學化,社會治理精準化,公共服務高效化。使用具身智能輔助潛在風險研判和防范,維護人民利益和國家安全。同時以保障和改善民生需求拉動具身智能發(fā)展,創(chuàng)造智慧工作方式與生活方式。
以技術創(chuàng)新增強解決方案實現(xiàn)能力
具身智能實現(xiàn)大規(guī)模商用落地,需要多學科互補式技術創(chuàng)新,以平臺級通用解決方案加特定領域創(chuàng)新實現(xiàn)應用泛化。一是增強多學科互補的技術創(chuàng)新能力,為不同具身智能應用場景適配解決方案。材料、機械工程、數(shù)字產(chǎn)業(yè)、軟件工程、自然語言處理、物理學(仿真)、生物醫(yī)學等學科持續(xù)進行技術突破。二是技術創(chuàng)新需要平衡具身智能產(chǎn)業(yè)鏈中關鍵制造環(huán)節(jié)的可靠性、成本和通用能力,使技術演進方向滿足大規(guī)模商用落地需求。構建產(chǎn)學聯(lián)動科研團隊,搭建制造業(yè)企業(yè)與具身智能科研部門互聯(lián)平臺,以規(guī)模效益控制通用具身智能產(chǎn)品應用成本。引導制造業(yè)企業(yè)和具身智能研發(fā)團隊公開應用場景需求、技術創(chuàng)新成果和軟硬件供需情況,助力具身智能實現(xiàn)具體應用。比如鼓勵具有優(yōu)秀運動能力和操作能力的平臺級通用具身機器人產(chǎn)品生產(chǎn),在此基礎上,鼓勵具身機器人在特定領域不同任務的設計和應用,嘗試解決泛化和成功率問題。三是引導搭建具身智能科研實驗室。通過虛擬和現(xiàn)實結合的具身智能交互環(huán)境,幫助具身智能不斷進化實現(xiàn)技術演進。
以龍頭企業(yè)帶動具身智能生態(tài)構建
塑造頭部企業(yè)研發(fā)通用、中小企業(yè)研發(fā)應用、政企聯(lián)合建設基礎設施的協(xié)同市場格局,以具身智能標準化體系打通技術關鍵節(jié)點。一是搭建由頭部企業(yè)帶動、多產(chǎn)業(yè)部門聯(lián)合的標準化具身智能生態(tài)系統(tǒng),有助于實現(xiàn)具身智能技術研發(fā)共創(chuàng)與技術創(chuàng)新涌現(xiàn)。具身智能產(chǎn)業(yè)發(fā)展具有規(guī)模效應,頭部企業(yè)穩(wěn)定資本投入、完備商業(yè)化計劃、完善組織人才架構成為具身智能產(chǎn)業(yè)發(fā)展的關鍵。鼓勵大企業(yè) “頭雁”先行,主導通用具身智能大模型以及多個領域垂直大模型研究,領跑行業(yè)技術迭代。通過標準化打通具身智能產(chǎn)業(yè)中芯片和硬件、基礎服務和算法框架、技術層以及應用層等各技術關鍵節(jié)點。二是鼓勵人工智能龍頭企業(yè)推出具身智能基礎設施產(chǎn)品與解決方案,支持人工智能企業(yè)與政府聯(lián)合建設具身智能基礎設施。加強集成算力、MaaS(模型即服務)、智能網(wǎng)絡連接設施和感知基礎設施等具身智能基礎設施建設。促使算力資源、數(shù)據(jù)服務和云服務向普惠化、廣泛化、標準化方向發(fā)展。結合軟件層面優(yōu)化設計,使得支撐具身大模型訓練的算力資源在集群硬件層面得以提升,實現(xiàn)以云方式提供智能服務。推進泛在智能網(wǎng)絡連接設施與物聯(lián)數(shù)通新型感知基礎設施建設,實現(xiàn)人、機、物全面感知和泛在連接。
以法律監(jiān)管和社會保障完善社會支持體系
完善算法與數(shù)據(jù)監(jiān)管實現(xiàn)“價值對齊”,社會保障對沖具身智能就業(yè)沖擊。一是立法加強算法的安全治理,規(guī)范具身智能遵從人類價值。目前具身智能難以“自然習得”表征以及抽象信息,也缺乏理解并學習世界結構與運行規(guī)律等“常識”的能力。監(jiān)管應促進創(chuàng)新和依法治理相結合,規(guī)避復雜算法和黑箱機制所引發(fā)的錯誤信息、算法歧視、隱私泄露、虛假信息泛濫等科技倫理問題。具身智能數(shù)據(jù)管理需要統(tǒng)籌好國家發(fā)展和安全問題。二是以社會保障對沖 “具身智能換人”問題。具身智能應用會替代部分勞動者崗位,政策應引導具身智能對重復性勞動、危險性工作的主動替代;其他諸如數(shù)據(jù)輸入和處理、客戶服務和支持、翻譯任務和報告撰寫以及內(nèi)容生成等工作分梯次分階段替代,政府層面需加強社會保障制度,幫助居民再就業(yè),做好兜底工作。三是處理好技術倫理與責任分配問題。