王兆魁,孟慶良,劉純武
(清華大學(xué) 航天航空學(xué)院,北京 100084)
太空探索與飛行的根本目的在于將人類生產(chǎn)與生活的空間拓展到地球之外的太空[1]。我國空間站于2022 年底基本建成,已轉(zhuǎn)入常態(tài)化運(yùn)營模式。空間科學(xué)、空間應(yīng)用等任務(wù)的不斷增加,要求航天員開展更多的空間作業(yè)。為了協(xié)助航天員提高工作效率,世界各航天強(qiáng)國都開展了空間站艙內(nèi)機(jī)器人的研究和應(yīng)用,如Astrobee[2-3]、Robonaut[4]、Taikobot[5]等機(jī)器人。而在月球探測、行星探測等深空探測任務(wù)中,環(huán)境嚴(yán)酷、人力資源稀缺,機(jī)器人可更充分地發(fā)揮耐受力強(qiáng)、負(fù)載能力強(qiáng)、連續(xù)作業(yè)時(shí)間長、重復(fù)作業(yè)精度高等優(yōu)勢。
在人工智能技術(shù)的輔助下,這些機(jī)器人已具備一定的自主能力,但人類對于未知非結(jié)構(gòu)化環(huán)境的認(rèn)知、學(xué)習(xí)和決策能力,是現(xiàn)階段機(jī)器人無法比擬的。因此,人類與眾多智能裝備協(xié)同開展空間探測,有效發(fā)揮人機(jī)的整體優(yōu)勢,對空間任務(wù)的順利、高效實(shí)施具有重要意義,也是未來發(fā)展的必然趨勢。智能人機(jī)交互(Human-robot Interaction)研究運(yùn)用智能技術(shù)實(shí)現(xiàn)人與機(jī)器人等智能體的信息交互、協(xié)同感知、協(xié)作規(guī)劃,是一門涉及機(jī)器人學(xué)、控制科學(xué)、計(jì)算機(jī)科學(xué)、人工智能、人體工程學(xué)、認(rèn)知科學(xué)、心理學(xué)等多個(gè)領(lǐng)域的交叉科學(xué),是實(shí)現(xiàn)高效人機(jī)協(xié)作的基礎(chǔ)[6]。智能人機(jī)交互技術(shù)在醫(yī)療、建筑、服務(wù)、工業(yè)生產(chǎn)、災(zāi)害救援以及有人太空探索等領(lǐng)域有著豐富的應(yīng)用實(shí)例和廣闊的發(fā)展前景[7-11]。
本文首先概述國內(nèi)外空間協(xié)作機(jī)器人的任務(wù)實(shí)例,在分析空間人機(jī)交互任務(wù)特點(diǎn)的基礎(chǔ)上,總結(jié)空間人機(jī)交互的關(guān)鍵技術(shù),綜述研究現(xiàn)狀,最后給出空間人機(jī)交互的未來發(fā)展趨勢與展望。
目前國內(nèi)外已有的空間協(xié)作機(jī)器人可按照外形和運(yùn)動(dòng)形式分為懸浮式機(jī)器人、人形機(jī)器人、輪式機(jī)器人和多足式機(jī)器人幾種類型。各種機(jī)器人的基本信息及人機(jī)協(xié)作能力見表1。
表1 國內(nèi)外主要空間協(xié)作機(jī)器人情況Tab.1 Main space collaborative robots at home and abroad
懸浮式機(jī)器人利用空間站中的零重力環(huán)境懸浮在艙內(nèi),以風(fēng)扇為微推進(jìn)系統(tǒng),實(shí)現(xiàn)在艙內(nèi)的位置和姿態(tài)控制。
早在1997 年,美國哥倫比亞號航天飛機(jī)的宇航員就釋放了一顆名為AERCam 的艙外球形機(jī)器人[12]。AERCam 直徑35.5 cm,安裝了2 臺相機(jī)。艙內(nèi)宇航員通過手控器和筆記本電腦進(jìn)行控制,主要任務(wù)是進(jìn)行航天飛機(jī)和國際空間站的艙外拍照監(jiān)視。
日本宇宙航空研究開發(fā)機(jī)構(gòu)設(shè)計(jì)并研制的Int-Ball 于2017 年進(jìn)入國際空間站[13]。Int-Ball 是一個(gè)可在艙內(nèi)自主移動(dòng)的球形攝像機(jī),直徑15 cm,重1 kg,由安裝在球外表面的12 個(gè)小型電風(fēng)扇陣列推動(dòng)。據(jù)統(tǒng)計(jì),Int-Ball 承擔(dān)的艙內(nèi)照片和視頻記錄工作可節(jié)省宇航員約10%的時(shí)間。
德國航空宇航中心、空客公司、IBM 公司聯(lián)合開發(fā)了類球形機(jī)器人CIMON[14]。CIMON 直 徑32 cm,重約5 kg,配備一塊液晶顯示屏(Liquid Crystal Display,LCD)和7 個(gè)麥克風(fēng),如圖1 所示。CIMON 被稱為“航天員的AI 助手”,具備面部識別、語音識別功能,基于IBM 開發(fā)的Watson Assistant,可以實(shí)現(xiàn)語音控制和智能對話。CIMON 可輔助艙內(nèi)移動(dòng)攝像,為航天員提供知識庫支持,并通過對話分析長期太空任務(wù)對宇航員心理壓力的影響。目前在國際空間站中運(yùn)行的是2019 年發(fā)射的CIMON 2 版本。
圖1 CIMON 懸浮機(jī)器人[14]Fig.1 CIMON free-flying robot[14]
2019—2022 年間,NASA 共向國際空間站發(fā)送了3 臺邊長12.5 英寸(31.75 cm)的立方體機(jī)器人,組成了Astrobee 艙內(nèi)機(jī)器人編隊(duì)[2-3]。Astrobee 的主要任務(wù)是進(jìn)行艙內(nèi)巡查、拍照和日志記錄,輔助航天員艙內(nèi)工作,并作為在軌自由飛行機(jī)器人的技術(shù)驗(yàn)證平臺。Astrobee 通過視覺和WiFi 進(jìn)行艙內(nèi)定位和導(dǎo)航,具備自動(dòng)返航充電功能,并配備有機(jī)械臂用來臨時(shí)??俊?/p>
本文研究團(tuán)隊(duì)提出了一種空間站艙內(nèi)智能體的設(shè)計(jì)[15],如圖2 所示,協(xié)助航天員進(jìn)行艙內(nèi)巡查、拍照和語音交互。艙內(nèi)智能體外形為直徑260 mm的球形,應(yīng)用了諸多智能技術(shù),可通過3D SLAM 實(shí)現(xiàn)艙內(nèi)自主導(dǎo)航和飛行,通過深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)對航天員的跟蹤和手勢識別。
圖2 空間站艙內(nèi)智能體概念圖[15]Fig.2 Concept diagram of the intelligent in-cabin personal agent[15]
由NASA 靈巧機(jī)器人實(shí)驗(yàn)室[4]研制的Robonaut 2 于2011 年發(fā)射到國際空間站,是太空中第1 臺類人形機(jī)器人。Robonaut 2 具有42 個(gè)獨(dú)立的自由度和超過350 個(gè)傳感器,包含2 個(gè)7 自由度手臂、2 只12 自由度機(jī)械手,如圖3 所示。Robonaut 2 設(shè)計(jì)的初衷是協(xié)助航天員開展艙外活動(dòng),但最終未能具備艙外工作的保護(hù)條件,僅在艙內(nèi)進(jìn)行了部分試驗(yàn),最終于2018 年返回地球進(jìn)行進(jìn)一步維修升級。
圖3 Robonaut 2 機(jī)器人[4]Fig.3 Robonaut 2 robot[4]
2013 年,日本東京大學(xué)和京都大學(xué)[16]共同研制的Kirobo 機(jī)器人進(jìn)入國際空間站,Kirobo 是一個(gè)高約34 cm 的縮比人形機(jī)器人,功能包括語音和語義識別、自然語言處理、語音合成,以及面部識別和視頻錄制。俄羅斯緊急情況部從2014 年開始開發(fā)一款名為Fedor[17],身長1.8 m 的人形機(jī)器人,用于災(zāi)難救援。2019 年,該機(jī)器人以代號SkyBot F850 進(jìn)入國際空間站,驗(yàn)證了開關(guān)艙門、傳遞工具、操作工具、連接電氣接頭等任務(wù)。
德國航空宇航中心[18]研制了一款輪式移動(dòng)的雙臂機(jī)器人Justin,適用于宇航員協(xié)作或家務(wù)勞動(dòng)等民用領(lǐng)域[18]。NASA 從2013 年 開始研發(fā)雙足行走空間機(jī)器人Valkyrie,并期望將其應(yīng)用到火星探測當(dāng)中[19]。Valkyrie 全身有44 個(gè)驅(qū)動(dòng)電機(jī),裝備了ToF 相機(jī)、激光雷達(dá)、立體視覺相機(jī)、慣性傳感器、力傳感器等,支持GPU 算法加速。
ZHANG 等[5]設(shè)計(jì)了一款名為Taikobot 的空間站輕量化人形機(jī)器人,該機(jī)器人高1.71 m,共有54個(gè)自由度,如圖4 所示。得益于空間站中的微重力環(huán)境,Taikobot 對驅(qū)動(dòng)電機(jī)、關(guān)節(jié)和機(jī)器人結(jié)構(gòu)進(jìn)行了輕量化設(shè)計(jì),使得機(jī)器人凈重僅為25 kg,可降低發(fā)射成本和保障艙內(nèi)行走安全。Taikobot 沒有采用傳統(tǒng)的雙足行走形式,而是仿照艙內(nèi)航天員的移動(dòng),采用手或腳推動(dòng)空間站側(cè)壁的反作用力,進(jìn)行點(diǎn)到點(diǎn)的飛行移動(dòng),最終再利用扶手和腳固定器實(shí)現(xiàn)停泊。
圖4 Taikobot 艙內(nèi)機(jī)器人[5]Fig.4 Taikobot in-cabin robot[5]
當(dāng)前已登陸成功的無人月球車和火星車均通過地面遙操作進(jìn)行控制,能夠與航天員協(xié)作開展任務(wù)的星表機(jī)器人還處在原理樣機(jī)研制當(dāng)中。美國噴氣推進(jìn)實(shí)驗(yàn)室開發(fā)了ATHLETE[20]、LEMUR[21]、NeBula-SPOT[22]等深空探測協(xié)作機(jī)器人。ATHLETE(All-Terrain Hex-Limbed Extra-Terrestrial Explorer)是一款全地形六足月球探索機(jī)器人,其6 條腿上裝備了滾輪,既可以在平坦地形上快速機(jī)動(dòng),又可以翻越崎嶇的地形,如圖5 所示。LEMUR 多足機(jī)器人包含4 條腿和16 個(gè)吸盤,每個(gè)吸盤上還有多個(gè)鋼鉤,可在未來深空探測當(dāng)中進(jìn)行復(fù)雜地形攀爬。NeBula-SPOT基于波士頓動(dòng)力機(jī)械狗SPOT 平臺開發(fā)。
圖5 ATHLETE 機(jī)器人[20]Fig.5 ATHLETE robot[20]
對國內(nèi)外空間協(xié)作機(jī)器人的發(fā)展現(xiàn)狀調(diào)研后發(fā)現(xiàn),目前使用的人機(jī)交互方法除了傳統(tǒng)的遙控控制外,還引入了面部識別、語音交互、手勢控制等智能技術(shù)。對于帶有機(jī)械臂的人形機(jī)器人,可采用力柔順控制實(shí)現(xiàn)與航天員的安全交互[23]。同時(shí)注意到,空間協(xié)作機(jī)器人的智能化水平有待進(jìn)一步提高,一些人工智能的前沿技術(shù)尚未得到應(yīng)用,多模態(tài)交互信息的融合還未實(shí)現(xiàn),低重力環(huán)境下人機(jī)協(xié)作的動(dòng)力學(xué)問題也研究較少。
通過已有的空間機(jī)器人案例調(diào)研發(fā)現(xiàn),盡管有諸多機(jī)器人項(xiàng)目設(shè)計(jì)的目標(biāo)是實(shí)現(xiàn)人機(jī)任務(wù)協(xié)作,但受限于技術(shù)的成熟度,空間試驗(yàn)多數(shù)還是驗(yàn)證機(jī)器人動(dòng)作級的自主操作。
要實(shí)現(xiàn)空間人機(jī)自然交互,需首先對人機(jī)協(xié)作過程進(jìn)行分析。BAUER 等[6]提出了協(xié)作機(jī)器人在外部環(huán)境輸入下,輸出聯(lián)合動(dòng)作與人進(jìn)行協(xié)作的機(jī)制,如圖6 所示。機(jī)器人通過傳感器觀察環(huán)境和協(xié)作者,感知到的數(shù)據(jù)首先用于學(xué)習(xí)和擴(kuò)展自己的知識庫,推斷環(huán)境和協(xié)作者的狀態(tài),并識別協(xié)作者的意圖;然后經(jīng)過數(shù)據(jù)融合,形成機(jī)器人與人的聯(lián)合意圖;最終,通過動(dòng)作規(guī)劃,找到能夠?qū)崿F(xiàn)聯(lián)合意圖的聯(lián)合動(dòng)作進(jìn)行輸出,形成閉環(huán)。VILLANI 等[24]將人機(jī)交互的主要挑戰(zhàn)總結(jié)為安全交互、直覺交互、設(shè)計(jì)方法3 個(gè)方面。其中,直覺交互包含編程接口、多模態(tài)交互、現(xiàn)實(shí)增強(qiáng)3 個(gè)領(lǐng)域,多模態(tài)交互可通過手勢、語音、眼球追蹤、表情、觸覺等多種方式實(shí)現(xiàn)。
圖6 人機(jī)協(xié)作機(jī)制[6]Fig.6 Schematical diagram of the human-robot collaboration mechanism[6]
考慮到空間操作的特點(diǎn),人體檢測與跟蹤、手勢識別與分類、動(dòng)作識別與意圖預(yù)測、低重力環(huán)境下人機(jī)協(xié)同控制等關(guān)鍵技術(shù)是實(shí)現(xiàn)智能空間人機(jī)交互的基礎(chǔ)。特別對于空間站內(nèi)操作來說,相比于地面一般場景,航天員穿著高度一致,且環(huán)境較為狹窄,航天員需要頻繁交叉移動(dòng);根據(jù)任務(wù)的不同,航天員動(dòng)作的幅度和速度也存在差異,這給人機(jī)交互帶來了挑戰(zhàn)。
人體檢測與跟蹤技術(shù)已普遍應(yīng)用于服務(wù)機(jī)器人領(lǐng)域。MUNARO 等[25]采用RGB-D 圖像進(jìn)行人體檢測與跟蹤研究,利用HOG 特征和三維聚類算法實(shí)現(xiàn)人體檢測,并通過人體運(yùn)動(dòng)、色彩特征、檢測置信度構(gòu)建了聯(lián)合似然概率跟蹤方法進(jìn)行人體跟蹤。WANG 等[26]通過融合單目相機(jī)得到的人體檢測二維位置信息以及聲吶測距信息,得到人體三維位置,并利用擴(kuò)展卡爾曼方法實(shí)現(xiàn)人體跟蹤。BOCHKOVSKIY 等[27]基于YOLOv4 算法模型,利用單個(gè)“端到端”的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)直接回歸到目標(biāo)類別與坐標(biāo)信息,精簡了網(wǎng)絡(luò)模型,大幅提升了訓(xùn)練與檢測速度,并取得了較高的檢測精度。李柯江等[28]提出了一種基于相機(jī)模型投影的多目標(biāo)人體跟蹤算法,完成了二維平面的跟蹤算法向三維平面的遷移,并提出了一種特征復(fù)用的MTRCNN 網(wǎng)絡(luò),提升了跟蹤算法的穩(wěn)定性,減少了計(jì)算開銷。針對空間站艙內(nèi)智能體對多人作業(yè)任務(wù)場景下的乘員跟蹤問題,張銳等[29-31]設(shè)計(jì)了基于頭部位置運(yùn)動(dòng)預(yù)測的多目標(biāo)跟蹤算法,提出了乘員頭部檢測的深度卷積神經(jīng)網(wǎng)絡(luò),在嵌入式計(jì)算平臺中基于Caffe 框架實(shí)現(xiàn)了艙內(nèi)乘員頭部的有效、快速的檢測以及對各乘員頭部運(yùn)動(dòng)的跟蹤,如圖7所示,并在此基礎(chǔ)上實(shí)現(xiàn)了對多人的穩(wěn)定、準(zhǔn)確跟蹤,如圖8 所示。
圖7 乘員頭部空間位置測量方法[29-31]Fig.7 Occupant headroom position measurement method[29-31]
圖8 多人跟蹤實(shí)驗(yàn)結(jié)果[31]Fig.8 Experimental results of multi-people tracking[31]
基于視覺圖像的手勢識別與分類技術(shù)已在自動(dòng)化控制、體感游戲等領(lǐng)域取得了廣泛應(yīng)用,在人機(jī)交互領(lǐng)域有著巨大的利用潛力。近年來,隨著人工智能技術(shù)的不斷發(fā)展,基于深度學(xué)習(xí)的目標(biāo)檢測方法在手勢識別應(yīng)用方面也取得了巨大成功。NI 等[32]在YOLOv2 網(wǎng)絡(luò)[33]基礎(chǔ)上,對卷積層進(jìn)行了針對性的簡化和降采樣,并提出了一種迭代選擇通道剪枝算法修剪網(wǎng)絡(luò)中的冗余卷積核,對網(wǎng)絡(luò)進(jìn)行輕量優(yōu)化,提升網(wǎng)絡(luò)的檢測速度。FU 等[34]針對太空中的人機(jī)交互任務(wù),對SSD 算法進(jìn)行了改進(jìn),將不同卷積層進(jìn)行融合,用于解決小尺寸的人手檢測和定位問題。LINGYUN 等[35-36]針對空間站人機(jī)交互任務(wù),定義了7 種合理的手勢指令,構(gòu)建了航天員手勢數(shù)據(jù)集,在此基礎(chǔ)上設(shè)計(jì)了一種基于圖像分割的數(shù)據(jù)擴(kuò)充方法,對現(xiàn)有的真實(shí)手勢數(shù)據(jù)進(jìn)行有效擴(kuò)充,并提出一種基于輕量化級聯(lián)網(wǎng)絡(luò)和注意力機(jī)制的手勢識別算法及手勢識別網(wǎng)絡(luò)架構(gòu),如圖9 所示,提升識別算法的精度與泛化能力,實(shí)現(xiàn)了對手勢的實(shí)時(shí)準(zhǔn)確識別。
圖9 手勢識別網(wǎng)絡(luò)架構(gòu)[35-36]Fig.9 Architecture of the gesture recognition network[35-36]
在空間人機(jī)交互過程中,需要機(jī)器人利用智能感知技術(shù)對參與的人員進(jìn)行動(dòng)作識別,并對人員的動(dòng)作意圖進(jìn)行預(yù)測,以便機(jī)器人更好地服務(wù)于參與人員,形成完整的閉環(huán)人-機(jī)協(xié)同系統(tǒng)。對于動(dòng)作識別技術(shù),基于深度學(xué)習(xí)的端到端的動(dòng)作辨識方法在近年來得到了廣泛應(yīng)用。TRAN 等[37]在3D 神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上提出了C3D 深層網(wǎng)絡(luò)架構(gòu),該架構(gòu)在人體動(dòng)作辨識精度上達(dá)到了較好的水平。YUE-HEI 等[38]提出了遞歸神經(jīng)網(wǎng)絡(luò)RNN,該網(wǎng)絡(luò)將卷積神經(jīng)網(wǎng)絡(luò)與長短時(shí)記憶網(wǎng)絡(luò)結(jié)合使用來辨識人體動(dòng)作,取得了比單一網(wǎng)絡(luò)更好的辨識效果。REN[39-40]結(jié)合人體關(guān)節(jié)角度和肢體空間分布規(guī)律,提出了一種航天員細(xì)粒度姿勢辨識方法,通過分析與分割關(guān)節(jié)角度運(yùn)動(dòng)范圍,建立了航天員關(guān)節(jié)角度-肢體姿勢-身體姿勢的關(guān)系模型,通過模糊邏輯和機(jī)器學(xué)習(xí)訓(xùn)練支持向量機(jī)(Support Vector Machine,SVM)分類器,利用較小的數(shù)據(jù)量即可準(zhǔn)確辨識出20 種航天員細(xì)粒度姿勢,如圖10 所示,并針對長時(shí)域視頻動(dòng)作辨識中冗余圖像采樣的難題,提出了時(shí)間域多尺度模型構(gòu)建方法,提高了動(dòng)作辨識的精度和魯棒性。
圖10 航天員細(xì)粒度姿勢辨識方法[39-40]Fig.10 Method for astronaut fine-grained posture recognition[39-40]
空間站和行星表面低重力環(huán)境下,人與機(jī)器人操作的動(dòng)力學(xué)特性都與地面有所不同,需要特別關(guān)注人機(jī)協(xié)同控制問題。2013—2016 年,德國人工智能研究中心牽頭開展了名為Moonwalk 的人機(jī)合作太空探索研究項(xiàng)目,以驗(yàn)證在低重力環(huán)境下,宇航員利用特殊的艙外操作工具,與機(jī)器人合作進(jìn)行星表生物學(xué)采樣的可行性[41]。PANTALOGNE等[42]分析了在空間微重力環(huán)境中,開展機(jī)器人輔助外科手術(shù)的優(yōu)勢和挑戰(zhàn)。熊蓉等[43]報(bào)道了在星面探測場景下,通過機(jī)器人移動(dòng)經(jīng)驗(yàn)或人為遙控操作進(jìn)行機(jī)器人行為規(guī)劃學(xué)習(xí)的方法。OMER 等[44]研究了低重力環(huán)境下雙足機(jī)器人行走的動(dòng)力學(xué)建模和控制問題。REN[39-40]針對月面機(jī)器人輔助操作中,動(dòng)作維數(shù)高、獎(jiǎng)勵(lì)稀疏、傳統(tǒng)強(qiáng)化學(xué)習(xí)方法難以收斂的問題,提出了基于分層強(qiáng)化學(xué)習(xí)的月面輔助機(jī)器人雙臂控制策略模型,將雙臂控制問題建模成兩層的馬爾可夫決策過程。高層策略生成低維機(jī)械臂末端狀態(tài)空間中的離散序列子目標(biāo),底層策略均衡目標(biāo)趨近、避障和降低能耗等需求,如圖11所示。
圖11 基于分層強(qiáng)化學(xué)習(xí)的月面輔助救援任務(wù)[39-40]Fig.11 Lunar surface rescue mission based on hierarchical reinforcement learning[39-40]
基于對空間人機(jī)交互與協(xié)作的現(xiàn)狀調(diào)研,本文提出未來空間人機(jī)交互與協(xié)作的幾個(gè)主要的研究和發(fā)展方向。
多模態(tài)人機(jī)交互是指通過多種傳感器和多種模態(tài)的數(shù)據(jù)輸入來實(shí)現(xiàn)人和機(jī)器人之間的信息交互。不同的傳感器和交互方式可以提供不同類型的數(shù)據(jù),如語音、視頻、手勢等,通過信息融合可以將這些數(shù)據(jù)整合起來,獲得更全面、準(zhǔn)確的信息,提高交互質(zhì)量和效率,使人機(jī)交互更加自然和智能。
要實(shí)現(xiàn)多模態(tài)交互數(shù)據(jù)的融合,首先需實(shí)現(xiàn)多傳感器數(shù)據(jù)的時(shí)間和空間同步,使得多源信息有共同的融合基準(zhǔn)。然后,對于跨模態(tài)信息,可進(jìn)行特征級融合或決策級融合[45-46];對于同模態(tài)的純圖像信息,還可進(jìn)行像素級融合。結(jié)合人的直觀認(rèn)知和經(jīng)驗(yàn),借助知識圖譜、本體建模[47]、圖神經(jīng)網(wǎng)絡(luò)[48]等技術(shù),可實(shí)現(xiàn)先驗(yàn)知識與傳感器數(shù)據(jù)的融合,獲得更加智能的信息融合結(jié)果。利用深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)跨模態(tài)信息的端到端融合,也是當(dāng)前值得關(guān)注的研究方向。
如前文,隨著硬件算力的增長和深度神經(jīng)網(wǎng)絡(luò)技術(shù)的成熟,人工智能已在空間人機(jī)交互中有一定應(yīng)用。目前,通用人工智能技術(shù)仍呈現(xiàn)快速發(fā)展的態(tài)勢,以ChatGPT 為代表的生成式預(yù)訓(xùn)練模型[49]在語義理解和對話任務(wù)中具有強(qiáng)大的表達(dá)能力和泛化性,將大語言模型與機(jī)器人結(jié)合起來,通過將圖像、文字、運(yùn)動(dòng)等多模態(tài)數(shù)據(jù)聯(lián)合訓(xùn)練,增強(qiáng)模型對現(xiàn)實(shí)中對象的理解,幫助機(jī)器人處理復(fù)雜推理和控制任務(wù),實(shí)現(xiàn)具身智能[50-51]。這些技術(shù)可不斷吸收至空間人機(jī)協(xié)同領(lǐng)域,并使其適應(yīng)航天任務(wù)的要求,完成復(fù)雜數(shù)據(jù)處理、智能語言交互、人機(jī)協(xié)同控制等任務(wù)。
空間人機(jī)協(xié)作需要面對真空、高輻射、微重力等特殊環(huán)境,目前已有的地面驗(yàn)證和訓(xùn)練技術(shù)往往針對單一環(huán)境條件,且無法完全復(fù)現(xiàn)太空真實(shí)環(huán)境情況。如何通過地面實(shí)驗(yàn)回答空間人機(jī)協(xié)作可靠性、安全性問題,構(gòu)建多因素、多模態(tài)的航天員訓(xùn)練系統(tǒng),是未來空間人機(jī)協(xié)作任務(wù)得以實(shí)現(xiàn)的重要前提。
對空間人機(jī)協(xié)作關(guān)鍵環(huán)節(jié)進(jìn)行高保真地面驗(yàn)證,目前多通過半物理實(shí)驗(yàn)系統(tǒng)實(shí)現(xiàn)[52]。未來可運(yùn)用平行系統(tǒng)技術(shù)[53]構(gòu)建人工系統(tǒng),對復(fù)雜的航天環(huán)境進(jìn)行計(jì)算實(shí)驗(yàn)驗(yàn)證,以半物理實(shí)驗(yàn)系統(tǒng)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行反饋修正,最終在真實(shí)系統(tǒng)中平行執(zhí)行,以降低成本并加速開發(fā)和測試進(jìn)度。在航天員訓(xùn)練方面,需要低重力體感模擬[54]、虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)[55]等技術(shù)支持以獲得更為真實(shí)的操作體驗(yàn)。
國內(nèi)外空間協(xié)作機(jī)器人的實(shí)踐表明,機(jī)器人可為航天員提供信息和情緒支持,有效替代有人太空探索當(dāng)中的重復(fù)勞動(dòng)。人工智能技術(shù)的應(yīng)用,可極大提升人機(jī)多模態(tài)交互和協(xié)同工作的效率。
從當(dāng)前的發(fā)展?fàn)顩r來看,空間站艙內(nèi)機(jī)器人的研究和實(shí)踐較為豐富,但多集中在艙內(nèi)巡查、信息查詢、語音交互等功能,配合航天員與真實(shí)物理世界交互的研究較少,而面向深空探測的人機(jī)協(xié)作僅處于技術(shù)驗(yàn)證和樣機(jī)研制階段。未來空間協(xié)作機(jī)器人的發(fā)展應(yīng)不斷吸收工業(yè)制造、家庭服務(wù)等領(lǐng)域協(xié)作機(jī)器人的技術(shù)經(jīng)驗(yàn),并面向空間探索的特殊環(huán)境進(jìn)行針對性突破,真正實(shí)現(xiàn)人與機(jī)器人協(xié)同空間作業(yè)。