臧光明
行為分層結(jié)構(gòu)是研究機器人學(xué)的一種基本方法和手段。使用該方法,機器人可以表現(xiàn)出復(fù)雜而又不失靈活的行為。最近,關(guān)于這方面的研究和應(yīng)用越來越受到業(yè)界的關(guān)注。行為分層結(jié)構(gòu)之所以越來越受到人們的重視,一方面是因為機器學(xué)習(xí)以及機器人技術(shù)代表了今后解決復(fù)雜任務(wù)的一個重要方向。而另一方面,心理學(xué)和神經(jīng)科學(xué)有越來越多的證據(jù)表明,模塊化和層次結(jié)構(gòu)是行為和大腦的關(guān)鍵組織準(zhǔn)則。本書幾乎涵蓋了本領(lǐng)域所有的重要模型,在此基礎(chǔ)上著重介紹了行為分層結(jié)構(gòu)模型計算和機器人技術(shù)。
本書分為3個部分。第1部分為機器人學(xué)中的行為層次結(jié)構(gòu)。介紹了如何通過設(shè)計一個機器人來處理行為分層結(jié)構(gòu)問題。該過程涉及部分仿生技術(shù),該階段最主要的貢獻(xiàn)是建立了很實用的智能技術(shù)產(chǎn)品。本章節(jié)重點介紹了行為層次結(jié)構(gòu)中很重要但是常常被忽略的兩個特征,即它對于探究行為的影響以及促使復(fù)雜領(lǐng)域規(guī)劃成本的降低。本章還給出了4個分層增強學(xué)習(xí)的例子來說明行為層次結(jié)構(gòu)在探究及表征研究中的關(guān)鍵作用。通過學(xué)習(xí)給出的實例,我們有效驗證了行為分層在人工以及現(xiàn)實世界中至關(guān)重要的作用。
第2部分為動物行為學(xué)中的層次結(jié)構(gòu)。介紹了用于理解真實世界中動物行為的層次結(jié)構(gòu)計算模型。該模型在一定程度上解答了科學(xué)研究中關(guān)于動物智能行為分層的疑問。本部分著重探討了動物行為學(xué)中如下的研究熱點:1.模塊化的多臂控制模型。包括電機控制中的可計算問題、感官冗余、大腦的模塊化和層次結(jié)構(gòu)、模塊化和層次化模型;2.電機控制中的泛化與干擾問題。包括程序記憶的鞏固、生物系統(tǒng)中的干擾和泛化、多任務(wù)學(xué)習(xí)等;3.一個累積學(xué)習(xí)機器人的模型框架。內(nèi)容包括條件約束、感官運動映射模型、構(gòu)造映射模型、進(jìn)化行為訓(xùn)練,最后闡述了目前所面臨的研究挑戰(zhàn)等;4.分布式自適應(yīng)控制架構(gòu)中的知識層次積累。包括分布式自適應(yīng)控制描述、活性和環(huán)境控制系統(tǒng)的互補作用、空間信息集成等。
第3部分為動物腦層次結(jié)構(gòu)。介紹了動物腦層次結(jié)構(gòu)相關(guān)的計算模型,從而為未來的智能機器人解決實際問題奠定了一定的基礎(chǔ)。本部分涵蓋如下內(nèi)容:1.智能計算假說。包括線程的特點及其局限性、皮質(zhì)層次結(jié)構(gòu)、基底核層次結(jié)構(gòu)、大腦皮層結(jié)構(gòu)整合;2.分層強化學(xué)習(xí)和任務(wù)分解。包括分層增強學(xué)習(xí)、潛在的神經(jīng)機制、識別有效子目標(biāo)等;3.大腦中分層運動功能的神經(jīng)網(wǎng)絡(luò)模型。包括構(gòu)造運動功能的分層動態(tài)模型、調(diào)制高層次運動程序、學(xué)習(xí)運動序列以及分層建模未來所面臨的挑戰(zhàn)。
本書所涉及內(nèi)容較為前沿,適合生物信息學(xué)、仿生學(xué)、人工智能、機器人學(xué)等專業(yè)的學(xué)者和碩博研究生閱讀參考。
(中國科學(xué)院國家空間科學(xué)中心)endprint