李錚
當代機器人都裝備了運動系統(tǒng),但在行動中對地形的適應卻一直是個難點。來自挪威奧斯陸大學的科學家們?yōu)榇碎_發(fā)了新型四足的機器人,當它遇到不同的表面時可以調(diào)整自己的腿長和行走步態(tài),這種能力可以提高它的能源效率和在不可預知的環(huán)境中的表現(xiàn)。
該機器人被叫做DyRET(在挪威語里是“動物”的意思),被稱為是首個能根據(jù)不同條件自動改變形態(tài)的四足機器人。通過混合使用傳感器、攝像頭和人工智能,機器人能在遇到不同地形時識別并機械地調(diào)整腿的長度進而調(diào)整身體形狀、優(yōu)化其步態(tài)以適應特定表面。
這項研究的負責人尼加德表示,這種機器人能不斷地學習其所行走的環(huán)境,然后結合它在受控環(huán)境中獲得的知識來適應環(huán)境。
據(jù)了解,研究人員首先訓練機器人在碎石、沙子和混凝土上的行走能力,然后讓它在從未涉足的草地上行走。雖然這似乎不是最麻煩的地形,但研究人員指出,任何不同形態(tài)的地面對長腿機器人來說都是全新真正的挑戰(zhàn)。
這種類似狗的變形機器人可以動態(tài)地拉長其四只腿,研究人員在挪威和澳大利亞進行了測試,幫助DyRET學習如何延長或縮短其四肢,以適應不同類型的地形。奧斯陸大學和挪威國防研究機構的計算機科學家尼加德說:“現(xiàn)階段已經(jīng)可以將機器人帶到戶外,并且學習適應環(huán)境,它能夠使用人類賦予它們的智能?!?h3>四足機器人的復雜“進化”
可以伸縮的四肢,視頻截圖來自奧斯陸大學
陸生動物沒有四肢可伸展,因為首先從生物學上講這是不可能的,而且也不是必需的。由于數(shù)百萬年的進化,人類的身體、獵豹或者狼都具有令人難以置信的敏捷性,在奔跑運動過程中可以不斷掃視前方的障礙物,但是關節(jié)伸縮的功能則沒有。
另一方面,機器人的進化也需要一些調(diào)整,即使像波士頓動力公司的機器狗Spot之類的超級復雜機器,也無法在復雜的地形中導航。使機器人伸縮支腿既可以提高它們在不同表面上移動時的穩(wěn)定性,又可以提高能效。到處亂逛會消耗大量的電池電量,并且機器人晃動可能會傷害自己或附近的人。
“我認為擁有可調(diào)節(jié)的身體是一個特別好的主意,”南加州大學的工程師弗朗西斯科·瓦萊羅·奎瓦斯說,他參與開發(fā)過四足機器人,“技術在不斷迭代,可調(diào)節(jié)的機身使未來的機器人變得更加靈活?!?/p>
尼加德和他的同事們首先從字面上構建了實驗沙箱,讓DyRET接受平衡訓練。在實驗室中,他們用水泥、礫石和沙子填充了長長的盒子,代表了機器人在現(xiàn)實世界中可能發(fā)現(xiàn)的各種不同地形?;炷帘容^平整,但沙地充滿不確定性,因為每走一步,機器人的腿都會傾斜或者下沉;礫石是一種堅硬表面的物質(zhì),但碎石會移動,使DyRET的腳步變得蹣跚。尼加德說:“通過具有不同硬度和粗糙度的三個地形示例,可以很好地表示出機器人形態(tài)或身體與環(huán)境之間的一般相互作用?!?/p>
DyRET機器人有四只腿,頂部有一個手柄,供研究人員抓住。機器人的腿總共可以延伸6英寸,但可以在兩個位置延伸:在膝蓋上方的“股骨”和膝蓋下方的“脛骨”。這使機器能夠以不同的長度設置其支腿部分。例如它可以伸縮四肢,使其股骨更長而脛骨更短,反之亦然。研究人員可以調(diào)整這些配置,將DyRET放到每個地形上,可以讓它像狗或貓一樣運動,然后計算它們在每個地形中的效率。
更具體地說,研究人員將“移動成本”視為一種效率,這與生物學家觀察動物運動時所使用的度量相同?;旧?,這是一個生物或機器人消耗多少能量來實施移動的行為,行走時的做工、穩(wěn)定性都被編碼到電腦中,這對于DyRET這樣的昂貴機器人很重要。
實驗室內(nèi)訓練機器人平衡度的不同地面物質(zhì)
當機器人檢測到它正在從混凝土過渡到礫石時,可以看到它降低了高度
DyRET甚至可以適應草皮地形,起初它的表現(xiàn)還很不穩(wěn)定,但是很快,它就能夠了解哪些身體形狀表現(xiàn)更好,適應新環(huán)境
研究人員測量了機器人關節(jié)電機中的能量消耗,并使用攝像頭監(jiān)視其運動。該機器人還具有自己的深度感應相機,用于表征表面的粗糙度。例如,觀察到混凝土比礫石光滑得多。機器甚至可以將腳趾浸入水中,可以這么說:腳上的力傳感器向其提供有關沙子比混凝土軟得多的信息;攝像機和力傳感器一起為DyRET提供了復雜的視覺,隨時監(jiān)控正在行走的過程以及運行的效率。
研究人員發(fā)現(xiàn),在混凝土上行走時,變形機器人的腿較長,效率最高。在沙子中,只要脛骨短,它就可以有效地伸縮任何股骨長度。在礫石上,DyRET的整體肢體較短,表現(xiàn)很出色,這是有道理的:較低的重心將使機器人在小巖石上爬升時具有更好的穩(wěn)定性。一般來說,較短的腿使機器人可以施加更大的力踩住較松的物料,而較長的腿則可以提高在較光滑物料上行走的速度。
所有這些訓練為機器人提供了如何針對特定表面,協(xié)調(diào)最佳肢體配置的經(jīng)驗。因此,當研究人員隨后將DyRET帶到其他地形上時,機器人可以用其攝像機注視地面,并通過力傳感器來感知其腳下的物體,將這些數(shù)據(jù)與有關混凝土外觀的感覺的先前信息進行比較。然后,機器人便知道如何在道路上行走,調(diào)整步幅,實現(xiàn)更高效率。
隨著機器人學習技術變得越來越復雜,在過去十年左右的時間里,機器人專家習慣在模擬中訓練四足機器人。也就是說,先要訓練在虛擬世界中控制機器人的軟件,在該虛擬世界中,模擬的機器人可以進行數(shù)千次步行嘗試,并通過反復試驗來學習。該系統(tǒng)會懲罰錯誤并獎勵成功的操作,直到虛擬機器人學習到最佳行為為止,這是一種稱為強化學習的技術。然后,機器人專家可以將這些知識移植到現(xiàn)實世界中的機器人和步行機中。
除此之外,該技術存在“模擬到現(xiàn)實”過渡的問題:無法在虛擬環(huán)境中完美地模擬物理世界的復雜性,因此通過模擬獲得的知識并不總是與現(xiàn)實世界相吻合,這意味著實際的機器人可能會對周圍的環(huán)境有模糊的了解。
相比之下,這些研究人員使用DyRET所做的只是在現(xiàn)實世界中訓練機器人。當然,這也帶來了新的挑戰(zhàn):變形機器人的學習速度要慢得多,并有可能經(jīng)常因為摔倒受到損傷。奧斯陸大學計算機科學家凱爾·格萊特說:“地形差異等因素讓實際操控比說起來要難得多,毫無軌跡可循,難以通過模擬來實現(xiàn)。”
客觀地說,當下DyRET的運動仍然顯得緩慢,尤其是與Spot這樣的先進四足機器人相比,比如它需要90秒才能完全伸展或收縮機器人的腿。但是研究人員希望可以同時改善DyRET的硬件和底層算法,也許有一天可以使其他變形機器人都采用這類系統(tǒng)。實際上,在機器人實驗室中,更大的想法是使硬件和軟件協(xié)同工作,以使機器人更好地感知地形并適應其身體和行為,這才能讓機器人技術最終流行起來。