国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

由感知到動(dòng)作決策一體化的類腦導(dǎo)航技術(shù)研究現(xiàn)狀與未來(lái)發(fā)展

2020-03-02 11:18楊闖劉建業(yè)熊智賴際舟熊駿
航空學(xué)報(bào) 2020年1期
關(guān)鍵詞:類腦集群大腦

楊闖,劉建業(yè),2,3,*,熊智,2,3,賴際舟,2,3,熊駿

1. 南京航空航天大學(xué) 自動(dòng)化學(xué)院 導(dǎo)航研究中心,南京 211106 2. 先進(jìn)飛行器導(dǎo)航、控制與健康管理工業(yè)和信息化部重點(diǎn)實(shí)驗(yàn)室,南京 211106 3. 衛(wèi)星通信與導(dǎo)航江蘇高校協(xié)同創(chuàng)新中心,南京 210016

動(dòng)物具有優(yōu)秀的(群體)導(dǎo)航能力,可實(shí)現(xiàn)由原始感知信息的輸入到準(zhǔn)確、可靠、靈活的導(dǎo)航動(dòng)作的直接輸出,這種端到端的智能行為,一直是人工智能(AI)研究領(lǐng)域持續(xù)關(guān)注的焦點(diǎn)之一。近年來(lái),隨著腦與神經(jīng)科學(xué)的不斷發(fā)展,研究者逐漸揭示了昆蟲(chóng)和哺乳動(dòng)物及其群體大腦導(dǎo)航機(jī)理[1-3],受這些機(jī)理啟發(fā),以及AI所依賴的智能算法、計(jì)算能力和數(shù)據(jù)的發(fā)展,一種新型仿生導(dǎo)航技術(shù)“類腦導(dǎo)航”得到了較大發(fā)展,展現(xiàn)出了自主環(huán)境感知、空間認(rèn)知、面向目標(biāo)導(dǎo)航(路徑規(guī)劃與動(dòng)作決策)一體化智能計(jì)算能力,在自主智能無(wú)人系統(tǒng)中具有較大的應(yīng)用潛力。

無(wú)人機(jī)密集集群作為無(wú)人系統(tǒng)的主要形式之一,是由成百上千甚至更多無(wú)人機(jī)個(gè)體通過(guò)某種特定集群機(jī)制所形成的一類高度可重構(gòu)、按需設(shè)計(jì)、分布式自主智能的密集網(wǎng)絡(luò)化無(wú)人系統(tǒng),在充分發(fā)揮數(shù)量?jī)?yōu)勢(shì)的情況下,可以提供顯著增強(qiáng)的任務(wù)執(zhí)行能力、靈活性和魯棒性,在偵察、搜救、飛行表演、測(cè)繪測(cè)量等軍民用領(lǐng)域具有廣闊的應(yīng)用前景[4]。但同時(shí)無(wú)人機(jī)密集集群龐大的網(wǎng)絡(luò)化群體結(jié)構(gòu)和復(fù)雜飛行環(huán)境也對(duì)集群導(dǎo)航技術(shù)提出了特殊要求:能適應(yīng)衛(wèi)星不可信、電子干擾、夜間等復(fù)雜飛行環(huán)境(魯棒性);能在配備低成本導(dǎo)航設(shè)備前提下實(shí)現(xiàn)準(zhǔn)確的導(dǎo)航精度(準(zhǔn)確性);感知與導(dǎo)航信息能及時(shí)生成動(dòng)作決策而快速響應(yīng)復(fù)雜外部環(huán)境及密集集群環(huán)境(實(shí)時(shí)響應(yīng)動(dòng)作);應(yīng)有較高的自主智能性(智能性);通過(guò)少量無(wú)人機(jī)個(gè)體的導(dǎo)航信息交互即能實(shí)現(xiàn)整個(gè)集群導(dǎo)航的能力(計(jì)算效率)?,F(xiàn)有無(wú)人機(jī)集群導(dǎo)航算法難以較好或同時(shí)滿足上述需求[5-7],亟需發(fā)展能適應(yīng)無(wú)人機(jī)密集集群復(fù)雜飛行環(huán)境的魯棒性強(qiáng)、準(zhǔn)確、實(shí)時(shí)響應(yīng)動(dòng)作、智能性強(qiáng)以及計(jì)算量小的新型集群導(dǎo)航方法。

類腦導(dǎo)航技術(shù)具有解決上述無(wú)人機(jī)密集集群導(dǎo)航難題的潛力。其中,基于昆蟲(chóng)導(dǎo)航機(jī)理的多模態(tài)仿生傳感器和哺乳動(dòng)物導(dǎo)航機(jī)理的類腦傳感信息處理機(jī)制的類腦環(huán)境感知技術(shù)具有低成本、多模態(tài)測(cè)量?jī)?yōu)勢(shì),可以在復(fù)雜作業(yè)環(huán)境下提供準(zhǔn)確的環(huán)境及個(gè)體運(yùn)動(dòng)信息;哺乳動(dòng)物導(dǎo)航機(jī)理啟發(fā)的導(dǎo)航細(xì)胞自組織神經(jīng)計(jì)算機(jī)制的類腦空間認(rèn)知技術(shù),不依賴高精度傳感器和準(zhǔn)確導(dǎo)航模型,可以提供較為準(zhǔn)確可靠的導(dǎo)航參考;哺乳動(dòng)物導(dǎo)航機(jī)理啟發(fā)的端到端面向目標(biāo)類腦導(dǎo)航技術(shù),無(wú)需導(dǎo)航參數(shù)解算,可實(shí)時(shí)耦合原始感知、認(rèn)知與動(dòng)作決策;類腦導(dǎo)航技術(shù)架構(gòu)具有較好開(kāi)放性,可以擴(kuò)展更多類腦智能行為;昆蟲(chóng)個(gè)體以及哺乳動(dòng)物導(dǎo)航細(xì)胞自組織行為啟發(fā)的類腦群體導(dǎo)航技術(shù),僅通過(guò)與局部群內(nèi)或與環(huán)境的相互信息交互既可在整個(gè)群體層面涌現(xiàn)有序的協(xié)同行為。

類腦導(dǎo)航技術(shù)的上述特點(diǎn)與無(wú)人機(jī)密集集群系統(tǒng)對(duì)集群導(dǎo)航魯棒性、準(zhǔn)確性、實(shí)時(shí)響應(yīng)動(dòng)作、智能性以及計(jì)算效率的要求有著緊密的契合之處,是實(shí)現(xiàn)無(wú)人機(jī)密集集群導(dǎo)航魯棒性強(qiáng)、準(zhǔn)確、實(shí)時(shí)響應(yīng)動(dòng)作、智能性強(qiáng)以及計(jì)算量小等要求的一條新思路和途徑。本文基于作者團(tuán)隊(duì)申請(qǐng)并主持的國(guó)家自然科學(xué)基金項(xiàng)目“類腦感知定位機(jī)理的無(wú)人機(jī)密集集群編隊(duì)協(xié)同導(dǎo)航方法(61873125)”研究進(jìn)展,對(duì)呈現(xiàn)上述特點(diǎn)的類腦導(dǎo)航技術(shù)研究現(xiàn)狀、研究新趨勢(shì)以及存在的問(wèn)題和挑戰(zhàn)進(jìn)行了詳細(xì)論述。

本文作者團(tuán)隊(duì)曾綜述分析并發(fā)表了無(wú)人機(jī)集群類腦導(dǎo)航系統(tǒng)[8]一文,但本文與前文論述的主題和方法不同,前文著重分析了一類僅計(jì)算輸出導(dǎo)航與相對(duì)導(dǎo)航參數(shù)(姿態(tài)/速度/位置)的腦啟發(fā)導(dǎo)航模型;而本文闡述了類腦導(dǎo)航技術(shù)最新研究進(jìn)展,研究了另一類直接輸出動(dòng)作決策的感知/認(rèn)知/路徑規(guī)劃/動(dòng)作決策一體化類腦導(dǎo)航智能體,本類方法在實(shí)時(shí)響應(yīng)外界環(huán)境并自主生成動(dòng)作決策方面有潛在的優(yōu)勢(shì)。

1 類腦導(dǎo)航技術(shù)

1.1 動(dòng)物大腦導(dǎo)航機(jī)理

認(rèn)知地圖是動(dòng)物進(jìn)行空間認(rèn)知和導(dǎo)航的基礎(chǔ)。昆蟲(chóng)將與其他個(gè)體以及環(huán)境交互過(guò)程中形成的認(rèn)知地圖存放于外部環(huán)境中,如螞蟻通過(guò)在環(huán)境中釋放的信息素的鋪設(shè)和跟蹤來(lái)建立正常交通的路線和網(wǎng)絡(luò),這些路線和網(wǎng)絡(luò)構(gòu)成了螞蟻的認(rèn)知地圖[9];而哺乳動(dòng)物的認(rèn)知地圖則位于大腦的海馬區(qū)中,該腦區(qū)中多種導(dǎo)航細(xì)胞實(shí)現(xiàn)對(duì)環(huán)境信息的編碼和記憶,形成表征空間的內(nèi)部認(rèn)知地圖。昆蟲(chóng)/哺乳動(dòng)物形成認(rèn)知地圖或基于認(rèn)知地圖進(jìn)行導(dǎo)航的機(jī)理如圖1所示。

圖1 動(dòng)物大腦端到端導(dǎo)航機(jī)理Fig.1 Mechanism of end-to-end navigation of animal brain

1) 昆蟲(chóng)大腦導(dǎo)航機(jī)理

昆蟲(chóng)同時(shí)采用非自我中心和自我中心2類信息組合定向[1]。非自我中心主要有:復(fù)眼感知太陽(yáng)方位/光線強(qiáng)度與光譜梯度;復(fù)眼高度?;男⊙鄹兄炜掌窆膺M(jìn)行定向;觸角感受氣味/風(fēng)向等信息進(jìn)行相對(duì)定位,并敏感地球磁場(chǎng)定向。自我中心信息為內(nèi)部體感的角速度。昆蟲(chóng)大多利用光流進(jìn)行測(cè)速,積分獲得距離信息,而步行螞蟻等昆蟲(chóng)使用步進(jìn)積分器來(lái)估計(jì)行進(jìn)距離。然后對(duì)方位和行進(jìn)距離路徑積分定位。昆蟲(chóng)通過(guò)復(fù)眼觀測(cè)全景視圖、觸角感受氣味等信標(biāo)進(jìn)行信標(biāo)定位。使用復(fù)眼視覺(jué)快照(Snapshot)等信標(biāo),通過(guò)最大化當(dāng)前和記憶信標(biāo)之間的匹配,沿著圖像差異最小的信標(biāo)方向進(jìn)行路線跟隨[1]。

中樞復(fù)合體(Central Complex)被認(rèn)為是昆蟲(chóng)導(dǎo)航與控制的關(guān)鍵腦區(qū),主要由扇形體、橢球體、前腦橋和一對(duì)小結(jié)構(gòu)成[1]。當(dāng)前主要揭示了中樞復(fù)合體的路徑積分導(dǎo)航神經(jīng)機(jī)制,如圖1(a)所示。橢球體神經(jīng)元實(shí)現(xiàn)對(duì)非自我中心和自我中心方位傳感信息的融合,融合后的方位信號(hào)投射到前腦橋中,激活編碼某一方位的特定神經(jīng)元,以此表征昆蟲(chóng)方位。小結(jié)接收光流速度信息并投射到扇形體中循環(huán)連接的神經(jīng)元,循環(huán)神經(jīng)元結(jié)合前腦橋編碼的方位信息在這里完成路徑積分。當(dāng)前時(shí)刻的定位定向信息不斷與小結(jié)記憶中的目標(biāo)方位位置進(jìn)行比對(duì),比對(duì)結(jié)果產(chǎn)生誤差信號(hào)驅(qū)動(dòng)特定動(dòng)作神經(jīng)元產(chǎn)生動(dòng)作指令。

2) 哺乳動(dòng)物大腦導(dǎo)航機(jī)理

哺乳動(dòng)物導(dǎo)航能力以大腦內(nèi)嗅皮層——海馬體(海馬區(qū))中的大量導(dǎo)航細(xì)胞集群放電活動(dòng)為基礎(chǔ),通過(guò)大量導(dǎo)航細(xì)胞(神經(jīng)元)形成的神經(jīng)回路進(jìn)行導(dǎo)航和定位計(jì)算,是大腦神經(jīng)網(wǎng)絡(luò)多層級(jí)信息編碼和表征的結(jié)果。海馬區(qū)中的3種關(guān)鍵導(dǎo)航細(xì)胞為頭朝向細(xì)胞、網(wǎng)格細(xì)胞、位置細(xì)胞,如圖1(b)所示。哺乳動(dòng)物經(jīng)過(guò)長(zhǎng)期導(dǎo)航行為學(xué)習(xí)和發(fā)育,形成上述3種導(dǎo)航細(xì)胞特定的突觸連接結(jié)構(gòu),進(jìn)而構(gòu)成大腦導(dǎo)航神經(jīng)網(wǎng)絡(luò)計(jì)算回路呈現(xiàn)出:在大腦前庭系統(tǒng)角速度輸入或視覺(jué)信息轉(zhuǎn)化的角速度輸入下,特定的頭朝向細(xì)胞會(huì)放電激活,以此表征方位信息;網(wǎng)格細(xì)胞對(duì)自運(yùn)動(dòng)信息(頭朝向細(xì)胞提供的方位輸入和速度細(xì)胞提供的動(dòng)物前向速度輸入)進(jìn)行路徑積分,并在動(dòng)物到達(dá)環(huán)境中六邊形網(wǎng)格狀區(qū)域頂點(diǎn)時(shí)激活放電,對(duì)局部空間進(jìn)行不同分辨率和方向的度量,形成高效緊湊的空間度量地圖,被用來(lái)為空間中任意位置提供矢量導(dǎo)航[10];多尺度網(wǎng)格細(xì)胞路徑積分的結(jié)果融合產(chǎn)生位置細(xì)胞特定的放電活動(dòng)[11],動(dòng)物到達(dá)環(huán)境某個(gè)區(qū)域時(shí),特定的位置細(xì)胞會(huì)激活放電,以此指示動(dòng)物所處位置及周邊空間信息,大量位置細(xì)胞聯(lián)合編碼所處整個(gè)環(huán)境,形成表征環(huán)境的內(nèi)容認(rèn)知地圖,但由于路徑積分存在累積誤差,上述生成的認(rèn)知地圖不準(zhǔn)確;此外,圖像、聲音、氣味等外部環(huán)境信息也會(huì)激發(fā)特定位置細(xì)胞放電,形成對(duì)特定環(huán)境區(qū)域的記憶,通過(guò)大量位置細(xì)胞的聯(lián)合記憶也能生成認(rèn)知地圖,但此時(shí)的認(rèn)知地圖是離散的片段式;最終,位置細(xì)胞通過(guò)融合外部信息和路徑積分信息生成準(zhǔn)確連續(xù)可靠的認(rèn)知地圖[12]。頭朝向細(xì)胞、網(wǎng)格細(xì)胞以及位置細(xì)胞神經(jīng)計(jì)算回路中還存在其他多種導(dǎo)航細(xì)胞,完成對(duì)導(dǎo)航信息不同層級(jí)的神經(jīng)計(jì)算[13]。

大腦中的海馬體和內(nèi)側(cè)前額葉皮質(zhì)被普遍認(rèn)為是處理動(dòng)物面向目標(biāo)導(dǎo)航的2個(gè)關(guān)鍵腦區(qū)[14],如圖1(b)所示,伏隔核一方面接收海馬體產(chǎn)生的空間認(rèn)知信息,另一方面從腹側(cè)被蓋區(qū)接收由多巴胺神經(jīng)元產(chǎn)生的獎(jiǎng)勵(lì)預(yù)測(cè)誤差信息(即當(dāng)前與目標(biāo)位置間的誤差),然后融合此二種信息并通過(guò)伏隔核中的動(dòng)作細(xì)胞產(chǎn)生一系列動(dòng)作指令,內(nèi)側(cè)前額葉皮質(zhì)接收動(dòng)作指令指導(dǎo)動(dòng)物的運(yùn)動(dòng)行為,最終完成面向目標(biāo)的導(dǎo)航過(guò)程。

上述昆蟲(chóng)和哺乳動(dòng)物大腦導(dǎo)航機(jī)理表明:二者都是通過(guò)大腦內(nèi)部多種大量導(dǎo)航細(xì)胞(神經(jīng)元)自組織集群特異性放電活動(dòng)對(duì)自運(yùn)動(dòng)以及視覺(jué)/聽(tīng)覺(jué)/嗅覺(jué)等外源性輸入信息進(jìn)行端到端導(dǎo)航神經(jīng)計(jì)算的,均包括3個(gè)過(guò)程:路徑積分、信標(biāo)校正以及面向目標(biāo)導(dǎo)航;二者導(dǎo)航過(guò)程均可以抽象為3個(gè)階段:環(huán)境感知、空間認(rèn)知、面向目標(biāo)導(dǎo)航;此外,昆蟲(chóng)通過(guò)大量昆蟲(chóng)個(gè)體的自組織集群形成群體智能,而哺乳動(dòng)物通過(guò)導(dǎo)航細(xì)胞的自組織集群形成產(chǎn)生空間智能的海馬區(qū)和內(nèi)側(cè)前額葉皮質(zhì)結(jié)構(gòu),具有互補(bǔ)對(duì)稱性[9]。

1.2 類腦導(dǎo)航技術(shù)概念

類腦導(dǎo)航是一種動(dòng)物大腦端到端導(dǎo)航機(jī)理啟發(fā)的新型仿生導(dǎo)航技術(shù),如圖2所示,以自運(yùn)動(dòng)等內(nèi)源性、視覺(jué)等外源性信息為輸入,借鑒動(dòng)物感知、認(rèn)知和導(dǎo)航腦區(qū)結(jié)構(gòu)和信息處理機(jī)制,利用AI技術(shù)實(shí)現(xiàn)從原始感知信息輸入到導(dǎo)航行為決策的直接輸出,形成具有自主環(huán)境感知、空間認(rèn)知、路徑規(guī)劃與動(dòng)作決策一體化能力的智能體。類腦導(dǎo)航不僅隱含了導(dǎo)航參數(shù)解算,更實(shí)現(xiàn)對(duì)環(huán)境信息的學(xué)習(xí)、推理、探索、記憶等認(rèn)知過(guò)程以及綜合任務(wù)目標(biāo)做出的路徑規(guī)劃與決策。

圖2 類腦導(dǎo)航工作流程Fig.2 Workflow of brain-inspired navigation

類腦導(dǎo)航包括類腦環(huán)境感知、類腦空間認(rèn)知以及面向目標(biāo)類腦導(dǎo)航3個(gè)過(guò)程。類腦環(huán)境感知借鑒動(dòng)物感知環(huán)境方式和處理多感官信息的選擇性注意、逐級(jí)抽象等神經(jīng)機(jī)制,采用卷積神經(jīng)網(wǎng)絡(luò)等AI技術(shù)實(shí)現(xiàn)對(duì)多模態(tài)傳感信息的多維度特征提取并解析自運(yùn)動(dòng)信息及環(huán)境信息;類腦空間認(rèn)知借鑒大腦導(dǎo)航細(xì)胞自組織集群放電機(jī)制,采用吸引子神經(jīng)網(wǎng)絡(luò)等AI技術(shù)構(gòu)建空間認(rèn)知模型,將自運(yùn)動(dòng)信息和環(huán)境信息轉(zhuǎn)化為表征自身導(dǎo)航信息及環(huán)境特征事物關(guān)系特征的導(dǎo)航細(xì)胞特異性放電活動(dòng),構(gòu)建認(rèn)知地圖;面向目標(biāo)類腦導(dǎo)航借鑒動(dòng)物面向任務(wù)目標(biāo)位置導(dǎo)航行進(jìn)時(shí)認(rèn)知地圖特定導(dǎo)航細(xì)胞與動(dòng)作細(xì)胞連接激活神經(jīng)機(jī)制,采用強(qiáng)化學(xué)習(xí)等AI技術(shù)實(shí)現(xiàn)面向目標(biāo)位置的路徑規(guī)劃與動(dòng)作決策過(guò)程。

2 類腦導(dǎo)航技術(shù)研究現(xiàn)狀

2.1 類腦環(huán)境感知

動(dòng)物具有多種精致巧妙的感覺(jué)器官以及感官信息處理機(jī)制,這些是動(dòng)物實(shí)現(xiàn)準(zhǔn)確、高效感知自身運(yùn)動(dòng)、同伴以及周圍環(huán)境信息的關(guān)鍵。類腦環(huán)境感知主要研究借鑒動(dòng)物豐富的視覺(jué)、觸覺(jué)、嗅覺(jué)、聽(tīng)覺(jué)等多種感覺(jué)器官生物結(jié)構(gòu)及其多模態(tài)感官信息處理機(jī)制,實(shí)現(xiàn)對(duì)載體自身導(dǎo)航信息以及周圍環(huán)境多維度特征提取。其中基于昆蟲(chóng)感覺(jué)器官的仿生傳感器以及基于哺乳動(dòng)物大腦感官信息處理機(jī)制的選擇性注意、逐級(jí)抽象等類腦環(huán)境感知神經(jīng)計(jì)算方法得到了大量研究。

2.1.1 多模態(tài)仿生導(dǎo)航傳感器

當(dāng)前研究使用較多的仿生類導(dǎo)航傳感器主要有光學(xué)類、電磁學(xué)類、力學(xué)類。

1) 光學(xué)類?;诶ハx(chóng)復(fù)眼結(jié)構(gòu)的復(fù)眼傳感器可以實(shí)現(xiàn)高分辨率大視場(chǎng)成像;利用復(fù)眼結(jié)構(gòu)中眾多子眼形成的視差及方位感知能力,實(shí)現(xiàn)目標(biāo)三維定位;還可以感知天空偏振矢量場(chǎng)信息獲得導(dǎo)航能力。基于昆蟲(chóng)視網(wǎng)膜感受像素強(qiáng)度視域變化的機(jī)制的光流傳感器不僅包含了運(yùn)動(dòng)信息,還包含有關(guān)景物三維結(jié)構(gòu)的豐富信息。同樣基于動(dòng)物視網(wǎng)膜感光機(jī)制啟發(fā)的事件相機(jī)通過(guò)異步方式測(cè)量每個(gè)像素亮度變化實(shí)現(xiàn)對(duì)時(shí)間/位置和符號(hào)進(jìn)行編碼,相比傳統(tǒng)以固定速率捕獲圖像視覺(jué)傳感器具有高動(dòng)態(tài)范圍、高時(shí)間分辨率、低功耗、不受運(yùn)動(dòng)模糊影響等優(yōu)勢(shì)[15]。

2) 電磁學(xué)類。蝙蝠通過(guò)發(fā)出超聲波不僅可以探測(cè)物體距離、方向和運(yùn)動(dòng)速率,還可以判斷其大小、形狀和結(jié)構(gòu)[3],基于該原理的超聲波傳感器/雷達(dá)計(jì)在導(dǎo)航、避障等方面得到了大量應(yīng)用。

3) 力學(xué)類?;诶ハx(chóng)平衡棒(Haltere)感知角運(yùn)動(dòng)機(jī)理的仿生陀螺儀具有抗震性強(qiáng)、受溫度影響小等優(yōu)勢(shì)。基于動(dòng)物觸覺(jué)感知物體材質(zhì)、空間屬性機(jī)理的仿生觸覺(jué)傳感器可以進(jìn)行物體空間、物體感知,彌補(bǔ)視覺(jué)傳感不足,實(shí)現(xiàn)對(duì)環(huán)境的精細(xì)感知,如加州大學(xué)伯克利分校[16]開(kāi)發(fā)了基于深度學(xué)習(xí)/觸覺(jué)傳感器的“深度觸覺(jué)模型”,實(shí)現(xiàn)機(jī)器人通過(guò)觸覺(jué)信息精確定位物體,進(jìn)一步融合視覺(jué)/觸覺(jué),實(shí)現(xiàn)視覺(jué)粗略感知、觸覺(jué)精細(xì)感知;此外,也可以以自我中心和非自我中心為參考系感知自身或物體空間位置[17],如普渡大學(xué)[18]制造了仿生蜂鳥(niǎo)飛行機(jī)器人,采用類腦導(dǎo)航算法僅依靠觸覺(jué)傳感信息實(shí)現(xiàn)在黑暗條件下像蜂鳥(niǎo)一樣自行飛行與避障。

此外,融合使用上述多模態(tài)傳感器,可以感知獲得更加豐富的不同尺度層級(jí)的環(huán)境及自運(yùn)動(dòng)信息。加州大學(xué)伯克利分校[19]為美國(guó)國(guó)防高級(jí)研究計(jì)劃局(DARPA)研究設(shè)計(jì)了仿昆蟲(chóng)輕量微型無(wú)人機(jī)硬件平臺(tái),同時(shí)集成了仿生復(fù)眼、昆蟲(chóng)平衡棒仿生陀螺儀、仿生光流傳感器、U型仿生磁強(qiáng)計(jì)等多模態(tài)仿生傳感器,具有環(huán)境感知信息豐富、動(dòng)態(tài)飛行環(huán)境適應(yīng)性強(qiáng)、測(cè)量準(zhǔn)、節(jié)能等多種優(yōu)勢(shì)?;诿鄯湟曈X(jué)機(jī)理和導(dǎo)航方法的光流計(jì)算模型[20],通過(guò)感知測(cè)量圖像多維度運(yùn)動(dòng)和光流場(chǎng)進(jìn)行導(dǎo)航,相比傳統(tǒng)視覺(jué)法具有簡(jiǎn)單、魯棒性強(qiáng)等優(yōu)勢(shì),已用于多種自動(dòng)導(dǎo)航系統(tǒng)研制,如基于光流導(dǎo)航與復(fù)眼結(jié)構(gòu)結(jié)合的仿生微型室內(nèi)飛行器[21]。此外,也能進(jìn)一步融合聲音[22]、氣味[23]等其他模態(tài)仿生傳感信息用于感知環(huán)境和自身運(yùn)動(dòng)信息。

2.1.2 類腦傳感信息處理

面對(duì)海量傳感信息,借鑒動(dòng)物感官信息處理機(jī)制,快速準(zhǔn)確實(shí)現(xiàn)對(duì)場(chǎng)景感知、目標(biāo)識(shí)別與特征提取是類腦環(huán)境感知需解決的另一重要問(wèn)題。

動(dòng)物是以全景信息為基礎(chǔ)進(jìn)行視覺(jué)信息處理。動(dòng)物在處理視覺(jué)信息時(shí),首先對(duì)原始全景圖像進(jìn)行壓縮,壓縮后的低分辨率圖像信息仍包含豐富的導(dǎo)航信息,用于視覺(jué)匹配、運(yùn)動(dòng)狀態(tài)檢測(cè)等,這種視覺(jué)處理方式相比視覺(jué)特征點(diǎn)提取具有更強(qiáng)的魯棒性[24]。此外“快照模型”提供了有效的根據(jù)當(dāng)前經(jīng)歷的信標(biāo)視圖信息和記憶視圖之間的匹配度進(jìn)行視覺(jué)導(dǎo)航指引的方法[25]。

動(dòng)物以選擇注意機(jī)制、逐級(jí)抽象機(jī)制處理海量感官信息。作為降低圖像數(shù)據(jù)處理復(fù)雜度的重要預(yù)處理步驟,基于視覺(jué)注意機(jī)制的圖像視覺(jué)顯著性區(qū)域檢測(cè)技術(shù)發(fā)展迅速,有效解決了傳統(tǒng)對(duì)圖像數(shù)據(jù)所有區(qū)域不設(shè)優(yōu)先級(jí)的處理方法造成了大量的計(jì)算浪費(fèi)問(wèn)題[26]。受Hubel和Wiesel[27]關(guān)于初級(jí)視覺(jué)皮層定向選擇性的研究以及近幾年逐漸發(fā)展的深度學(xué)習(xí)的啟發(fā),基于生物視覺(jué)神經(jīng)元局部感受野機(jī)制的擅長(zhǎng)處理連續(xù)輸入信號(hào)的卷積神經(jīng)網(wǎng)絡(luò)(CNN)被提出,在環(huán)境快速感知和目標(biāo)識(shí)別領(lǐng)域得到了大量應(yīng)用。用CNN來(lái)研究從大量感覺(jué)輸入中快速分層提取有用特征并逐級(jí)抽象,在單目視覺(jué)深度估計(jì)任務(wù)中得到了成功應(yīng)用[28],谷歌DeepMind提出了一種抽象視覺(jué)定位方式,省去以點(diǎn)云或像素的形式構(gòu)造顯式地圖,而是在更高、更抽象的級(jí)別(如對(duì)象級(jí)別)學(xué)習(xí)環(huán)境的隱式表示[29]。蘇黎世聯(lián)邦理工學(xué)院[30]結(jié)合CNN和路徑規(guī)劃控制系統(tǒng),將無(wú)人機(jī)實(shí)時(shí)感知的原始圖像抽象映射為路點(diǎn)和期望速度形式的魯棒表示,實(shí)時(shí)耦合無(wú)人機(jī)感知與動(dòng)作。此外,還有如基于拓?fù)渲X(jué)理論的前饋式層級(jí)識(shí)別模型[31]等其他大腦視皮層生物啟發(fā)的視覺(jué)信息處理方法。

2.2 類腦空間認(rèn)知

類腦空間認(rèn)知通過(guò)大腦導(dǎo)航細(xì)胞的自組織集群放電活動(dòng)實(shí)現(xiàn)對(duì)類腦環(huán)境感知過(guò)程提取的自運(yùn)動(dòng)信息(方位/速度)以及解析的環(huán)境信標(biāo)信息的導(dǎo)航解算,并將導(dǎo)航信息轉(zhuǎn)化為大腦內(nèi)部特定的導(dǎo)航細(xì)胞放電活動(dòng),同時(shí)將解算的位置信息與信標(biāo)信息通過(guò)位置細(xì)胞關(guān)聯(lián)記憶和存儲(chǔ),完成認(rèn)知地圖的構(gòu)建。其中導(dǎo)航細(xì)胞自組織集群放電活動(dòng)的神經(jīng)計(jì)算是類腦空間認(rèn)知的基礎(chǔ),其神經(jīng)實(shí)現(xiàn)和計(jì)算機(jī)制一直是一個(gè)開(kāi)放性問(wèn)題,當(dāng)前模型主要有:連續(xù)吸引子神經(jīng)網(wǎng)絡(luò)(CANN)、深度學(xué)習(xí)模型、脈沖神經(jīng)網(wǎng)絡(luò)模型。上述模型,均是基于神經(jīng)網(wǎng)絡(luò)中大量導(dǎo)航細(xì)胞的集群放電活動(dòng)涌現(xiàn)的;另一類是基于單個(gè)導(dǎo)航細(xì)胞模型,如振蕩相干模型[32]、貝葉斯大腦模型[33],此類模型認(rèn)為空間認(rèn)知信息的計(jì)算在單個(gè)導(dǎo)航細(xì)胞計(jì)算實(shí)現(xiàn),然后通過(guò)干涉或加權(quán)融合得到全局統(tǒng)一的導(dǎo)航信息進(jìn)一步形成認(rèn)知地圖。本文重點(diǎn)對(duì)基于導(dǎo)航細(xì)胞集群放電機(jī)制的連續(xù)吸引子神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)模型、脈沖神經(jīng)網(wǎng)絡(luò)模型進(jìn)行分析。

2.2.1 連續(xù)吸引子神經(jīng)網(wǎng)絡(luò)模型

CANN是一種具有特殊網(wǎng)絡(luò)連接結(jié)構(gòu)的循環(huán)神經(jīng)網(wǎng)絡(luò),認(rèn)知神經(jīng)科學(xué)研究表明CANN刻畫(huà)了大腦信息處理機(jī)制的本質(zhì)特征,是神經(jīng)信息表達(dá)的典型計(jì)算模型,其內(nèi)部神經(jīng)元集群放電活動(dòng)具有高效、穩(wěn)定、平滑的參數(shù)化記憶編碼信息的能力。CANN的上述特性與哺乳動(dòng)物大腦導(dǎo)航細(xì)胞集群放電表征動(dòng)物導(dǎo)航參數(shù)尤為切合,已成功應(yīng)用于建模頭朝向細(xì)胞、網(wǎng)格細(xì)胞以及位置細(xì)胞神經(jīng)計(jì)算模型,具有很強(qiáng)的生物意義和工程應(yīng)用前景。代表性的研究如Burak和Fiete提出的CANN網(wǎng)格細(xì)胞精確路徑積分模型,接近神經(jīng)生理學(xué)觀察的大鼠網(wǎng)格細(xì)胞路徑積分保持精度[34]。Milford團(tuán)隊(duì)基于鼠腦頭朝向細(xì)胞和位置細(xì)胞神經(jīng)計(jì)算機(jī)理的RatSLAM系列視覺(jué)仿生即時(shí)定位與建圖(SLAM)算法[35],如圖3所示,可以從較弱的視覺(jué)輸入信息構(gòu)建大型和復(fù)雜區(qū)域認(rèn)知地圖,并基于低成本視覺(jué)傳感器進(jìn)行了66 km郊區(qū)建圖、連續(xù)運(yùn)行2周的室內(nèi)機(jī)器人建圖?;贑ANN的類腦空間認(rèn)知方法得到了大量研究和應(yīng)用,詳細(xì)內(nèi)容可查閱文獻(xiàn)[13]。

圖3 RatSLAM算法Fig.3 RatSLAM algorithm

2.2.2 深度學(xué)習(xí)模型

采用遞歸CANN描述位置細(xì)胞、網(wǎng)格細(xì)胞等導(dǎo)航細(xì)胞作用機(jī)理時(shí),表現(xiàn)出較好的模型適用性[34]。然而,這些模型通常依賴于合適的突觸權(quán)值,同時(shí)這些權(quán)值需要呈現(xiàn)出一種特定不對(duì)稱連接形式,以便根據(jù)自運(yùn)動(dòng)信息來(lái)移動(dòng)吸引子狀態(tài)。這些特殊的連接形式是否真實(shí)存在于動(dòng)物大腦中目前尚不清晰。此外,CANN主要考慮了少數(shù)幾種導(dǎo)航細(xì)胞作用機(jī)制,而未包含可能存在的其他類導(dǎo)航細(xì)胞。為全面地模擬海馬-內(nèi)嗅皮層導(dǎo)航機(jī)理,需要建立一個(gè)完備的模型以能夠同時(shí)包含其他導(dǎo)航細(xì)胞以及神經(jīng)生理學(xué)機(jī)制。而近年來(lái)功能不斷發(fā)展的深度循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)在上下文相關(guān)或時(shí)序相關(guān)的自然語(yǔ)言、語(yǔ)音等數(shù)據(jù)處理中得到了廣泛研究與應(yīng)用,具有較好地融合當(dāng)前輸入與過(guò)去歷史的特性以及類腦處理復(fù)雜空間認(rèn)知導(dǎo)航問(wèn)題的潛能[36],是減小CANN模型不完備性的一條途徑。圖4為哥倫比亞大學(xué)[37]利用RNN訓(xùn)練速度和航向輸入完成了模擬二維導(dǎo)航任務(wù),在對(duì)訓(xùn)練好的RNN網(wǎng)絡(luò)節(jié)點(diǎn)進(jìn)行可視化操作時(shí),呈現(xiàn)出了與神經(jīng)生理學(xué)觀察一致的網(wǎng)格細(xì)胞、邊界細(xì)胞和條紋細(xì)胞等導(dǎo)航細(xì)胞放電表示樣式。同時(shí),谷歌DeepMind團(tuán)隊(duì)[38]在用RNN中的長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)訓(xùn)練速度和航向信息時(shí)也呈現(xiàn)出了網(wǎng)格細(xì)胞放電樣式,此外,還證明了網(wǎng)格細(xì)胞等導(dǎo)航細(xì)胞支持矢量導(dǎo)航的觀點(diǎn)。上述兩項(xiàng)最新發(fā)現(xiàn),證明了把RNN用于空間的定位和導(dǎo)航時(shí),隱節(jié)點(diǎn)的物理意義類似于大腦位置細(xì)胞、網(wǎng)格細(xì)胞、邊界細(xì)胞等導(dǎo)航細(xì)胞。

圖4 循環(huán)神經(jīng)網(wǎng)絡(luò)訓(xùn)練類腦導(dǎo)航[37]Fig.4 Brain-inspired navigation trained by RNN[37]

2.2.3 脈沖神經(jīng)網(wǎng)絡(luò)模型

基于腦啟發(fā)的脈沖神經(jīng)網(wǎng)絡(luò)(SNN)模型相比基于數(shù)學(xué)理論推導(dǎo)的CANN、深度學(xué)習(xí)等人工神經(jīng)網(wǎng)絡(luò)模型更加接近實(shí)際生物結(jié)構(gòu),其神經(jīng)元的輸出具有時(shí)間維度編碼的脈沖序列,多個(gè)神經(jīng)元可以實(shí)現(xiàn)時(shí)-空二維空間的表達(dá)能力。基于SNN的類腦空間認(rèn)知模型大部分連接由大腦結(jié)構(gòu)預(yù)先定義,只需較少的參數(shù)學(xué)習(xí)就能較好建模位置細(xì)胞、網(wǎng)格細(xì)胞、頭朝向細(xì)胞等大腦導(dǎo)航細(xì)胞集群編碼導(dǎo)航信息,實(shí)現(xiàn)映射環(huán)境[39]。此外,把大腦模仿成神經(jīng)處理的層級(jí)結(jié)構(gòu),初始階段不建立神經(jīng)元全連接,通過(guò)將識(shí)別的環(huán)境成分映射到有限數(shù)量的神經(jīng)表征中,從而學(xué)習(xí)認(rèn)知未知環(huán)境區(qū)域,同時(shí)使學(xué)習(xí)需求最小化[40]。但SNN主要采用依賴神經(jīng)元脈沖時(shí)序而定的可塑性進(jìn)行網(wǎng)絡(luò)參數(shù)學(xué)習(xí),是一種局部訓(xùn)練的非監(jiān)督非反向傳播算法,但不能保證一定能訓(xùn)練出性能優(yōu)異的網(wǎng)絡(luò),另外,SNN網(wǎng)絡(luò)訓(xùn)練比較困難,因此基于SNN的類腦認(rèn)知模型還處于初級(jí)研究階段。

2.3 面向目標(biāo)類腦導(dǎo)航

面向目標(biāo)類腦導(dǎo)航通過(guò)無(wú)監(jiān)督學(xué)習(xí)建立認(rèn)知地圖中表征方位、位置、障礙物等多種導(dǎo)航信息的頭朝向細(xì)胞、位置細(xì)胞、邊界細(xì)胞等多種導(dǎo)航細(xì)胞與表征多種動(dòng)作行為的多種動(dòng)作細(xì)胞之間的智能神經(jīng)連接,完成由原始環(huán)境感知信息輸入到動(dòng)作決策的直接輸出過(guò)程,實(shí)現(xiàn)接近動(dòng)物端到端面向目標(biāo)導(dǎo)航的智能行為,如圖5所示。無(wú)監(jiān)督學(xué)習(xí)通過(guò)讓機(jī)器人自主探索面向目標(biāo)導(dǎo)航任務(wù),自主加強(qiáng)特定導(dǎo)航細(xì)胞與特定動(dòng)作細(xì)胞的突觸連接強(qiáng)度,最終形成一種穩(wěn)定的連接模式,在這種連接模式下,導(dǎo)航細(xì)胞的每種放電狀態(tài)都對(duì)應(yīng)一種特定的最優(yōu)的動(dòng)作細(xì)胞,實(shí)現(xiàn)面向目標(biāo)的導(dǎo)航過(guò)程。代表性的研究如用赫布學(xué)習(xí)建立頭朝向細(xì)胞/位置細(xì)胞與動(dòng)作細(xì)胞的智能連接,實(shí)現(xiàn)機(jī)器人自主面向目標(biāo)行進(jìn)導(dǎo)航[41];采用網(wǎng)格細(xì)胞對(duì)當(dāng)前和目標(biāo)位置分別進(jìn)行多尺度空間編碼,通過(guò)競(jìng)爭(zhēng)學(xué)習(xí)建立當(dāng)前和目標(biāo)差異與運(yùn)動(dòng)神經(jīng)元的特定連接,實(shí)現(xiàn)了機(jī)器人緊湊的面向目標(biāo)導(dǎo)航過(guò)程[42];在矢量導(dǎo)航框架下,通過(guò)獎(jiǎng)勵(lì)機(jī)制和關(guān)聯(lián)學(xué)習(xí)實(shí)現(xiàn)機(jī)器人面向目標(biāo)導(dǎo)航路徑自主優(yōu)化決策,以動(dòng)物抄近路方式到達(dá)目標(biāo)[43]。無(wú)監(jiān)督學(xué)習(xí)類面向目標(biāo)類腦導(dǎo)航具有自主學(xué)習(xí)導(dǎo)航行為決策的優(yōu)勢(shì),靈活性較強(qiáng),缺點(diǎn)是學(xué)習(xí)效率較低,效果有限。

圖5 基于無(wú)監(jiān)督學(xué)習(xí)的面向目標(biāo)導(dǎo)航Fig.5 Unsupervised learning-based goal-directed navigation

CNN為從大量感覺(jué)輸入中快速分層提取有用特征提供了一種可行的方式;深度學(xué)習(xí)的發(fā)展,為強(qiáng)化學(xué)習(xí)在大規(guī)模決策問(wèn)題中的應(yīng)用提供了可能。這些研究促進(jìn)了另一類面向目標(biāo)導(dǎo)航“深度強(qiáng)化學(xué)習(xí)導(dǎo)航”的發(fā)展。深度強(qiáng)化學(xué)習(xí)導(dǎo)航將深度學(xué)習(xí)的感知能力和強(qiáng)化學(xué)習(xí)的決策能力相結(jié)合,并能夠通過(guò)端到端的學(xué)習(xí)方式快速實(shí)現(xiàn)從原始圖像輸入到導(dǎo)航行為決策的直接輸出,建立起感知與行為決策之間的智能連接,在最大化策略函數(shù)的過(guò)程中實(shí)現(xiàn)了智能體的導(dǎo)航過(guò)程,是一種更接近動(dòng)物思維方式的端到端的面向目標(biāo)導(dǎo)航方法。深度強(qiáng)化學(xué)習(xí)導(dǎo)航在3D游戲[44]、迷宮[45]、室內(nèi)[46]等場(chǎng)景仿真中取得了較好效果,甚至表現(xiàn)出了超越人類的能力。

深度強(qiáng)化學(xué)習(xí)導(dǎo)航對(duì)于游戲等這種復(fù)雜的、每步行為之間存在較強(qiáng)相關(guān)性的、通過(guò)短期的獎(jiǎng)勵(lì)即可得到最優(yōu)的策略的環(huán)境有很好的效果,但是對(duì)于獎(jiǎng)勵(lì)稀少,需經(jīng)過(guò)長(zhǎng)期獎(jiǎng)勵(lì)才能獲得最優(yōu)策略的導(dǎo)航場(chǎng)景,很難快速學(xué)習(xí)出最優(yōu)策略,可通過(guò)引入多源感知信息構(gòu)造獎(jiǎng)勵(lì)數(shù)量[45]、對(duì)記憶場(chǎng)景的復(fù)用[47]增加獎(jiǎng)勵(lì)數(shù)量等手段緩解因獎(jiǎng)勵(lì)過(guò)少而引起的尋優(yōu)過(guò)慢及習(xí)得策略不優(yōu)等問(wèn)題。深度強(qiáng)化學(xué)習(xí)導(dǎo)航應(yīng)用前需進(jìn)行大量試錯(cuò)式迭代訓(xùn)練,大多載體在應(yīng)用時(shí)一般很難承受如此多的試錯(cuò),也很難在實(shí)際場(chǎng)景中進(jìn)行訓(xùn)練。解決訓(xùn)練難題一方面可通過(guò)充分利用已有經(jīng)驗(yàn)加快和加強(qiáng)新任務(wù)的學(xué)習(xí),如在線元學(xué)習(xí)[48],基于類似場(chǎng)景下可控載體采集的數(shù)據(jù)進(jìn)行技能訓(xùn)練[49];另一方面通過(guò)開(kāi)發(fā)環(huán)境模擬器,在虛擬場(chǎng)景中進(jìn)行訓(xùn)練[50],但仿真場(chǎng)景和真實(shí)場(chǎng)景存在較大差別,訓(xùn)練出來(lái)的模型不能很好地泛化到真實(shí)場(chǎng)景中。此外,還可以引入遷移學(xué)習(xí)機(jī)制,提高模型通用性,如谷歌DeepMind團(tuán)隊(duì)[51]構(gòu)建的雙路徑深度強(qiáng)化學(xué)習(xí)導(dǎo)航架構(gòu),用兩路RNN來(lái)分別記憶不同環(huán)境下通用的導(dǎo)航尋路策略內(nèi)核和不同環(huán)境下位置的重新表征,進(jìn)一步通過(guò)CNN實(shí)時(shí)提取視覺(jué)輸入,實(shí)現(xiàn)了在沒(méi)有地圖庫(kù)參考、僅給出幾個(gè)地標(biāo)點(diǎn)(任務(wù)獎(jiǎng)勵(lì))情況下,成功在離線街景中到達(dá)目的地。該深度強(qiáng)化學(xué)習(xí)導(dǎo)航的主體“導(dǎo)航尋路策略”還具有在不同城市間的遷移能力。

3 類腦導(dǎo)航研究新趨勢(shì)

當(dāng)前,國(guó)內(nèi)外研究者從類腦環(huán)境感知、類腦空間認(rèn)知以及面向目標(biāo)類腦導(dǎo)航等3個(gè)方面開(kāi)展了類腦導(dǎo)航研究,初步形成了機(jī)理分析、建模、仿真與實(shí)驗(yàn)驗(yàn)證一體化的研究體系,表現(xiàn)了一定類似動(dòng)物的自主智能特性,但還存在著智能水平欠佳、模型不完整、實(shí)時(shí)性差等問(wèn)題,尚處于探索和完善階段。當(dāng)前,研究人員通過(guò)擴(kuò)展類腦導(dǎo)航與更多類腦智能行為的耦合,嘗試實(shí)現(xiàn)類腦導(dǎo)航神經(jīng)形態(tài)軟硬件一體化設(shè)計(jì),通過(guò)集群機(jī)制促進(jìn)類腦導(dǎo)航向類腦群體導(dǎo)航發(fā)展,進(jìn)一步提高類腦導(dǎo)航自主智能性。

3.1 類腦導(dǎo)航智能化

動(dòng)物進(jìn)行空間認(rèn)知和導(dǎo)航時(shí)利用了包括感官信息激發(fā)位置細(xì)胞放電、空間記憶和推理在內(nèi)的多種并行機(jī)制[52]?,F(xiàn)有類腦導(dǎo)航研究主要從自運(yùn)動(dòng)信息和視覺(jué)2個(gè)信息源模擬動(dòng)物大腦導(dǎo)航過(guò)程,忽略了記憶、推理等其他機(jī)制的作用,無(wú)法從系統(tǒng)層面模擬大腦導(dǎo)航機(jī)制。事實(shí)上,海馬-內(nèi)嗅皮層中的位置細(xì)胞-網(wǎng)格細(xì)胞回路在編碼地理位置信息的同時(shí),還進(jìn)行編碼記憶聲音頻率,物體形狀及其他抽象的任務(wù)特征空間[53],位置細(xì)胞-網(wǎng)格細(xì)胞的功能可能比在地理環(huán)境中進(jìn)行定位要更加廣泛,如圖6[52]所示。人和動(dòng)物進(jìn)入新環(huán)境時(shí),仍表現(xiàn)出高效準(zhǔn)確的認(rèn)知導(dǎo)航能力,與大腦基于記憶的推理能力息息相關(guān)[54],如基于網(wǎng)格細(xì)胞的視覺(jué)識(shí)別、記憶和推理模型[55]。因此,如何共用位置細(xì)胞-網(wǎng)格細(xì)胞神經(jīng)回路,將類腦導(dǎo)航與記憶、推理、知識(shí)空間或語(yǔ)義空間等更多智能行為耦合,產(chǎn)生更強(qiáng)大的類腦導(dǎo)航能力,是未來(lái)研究熱點(diǎn),如基于類腦導(dǎo)航機(jī)制和情節(jié)記憶的服務(wù)機(jī)器人[56]。

3.2 類腦神經(jīng)形態(tài)導(dǎo)航系統(tǒng)

當(dāng)前,國(guó)內(nèi)外主要從軟件算法層面開(kāi)展了類腦導(dǎo)航技術(shù)研究,具有一定的自主智能及魯棒性。但由于當(dāng)前類腦導(dǎo)航算法實(shí)現(xiàn)過(guò)程主要還是基于CPU平臺(tái)的馮·諾依曼計(jì)算體系結(jié)構(gòu),存在模型復(fù)雜、計(jì)算量大、實(shí)時(shí)性差、功耗高等弊端[11]。實(shí)際上,動(dòng)物大腦高效、準(zhǔn)確、實(shí)時(shí)的導(dǎo)航能力還與神經(jīng)生理結(jié)構(gòu)密切相關(guān),類腦導(dǎo)航研究還需考慮硬件智能的設(shè)計(jì)。如何借助基于脈沖神經(jīng)網(wǎng)絡(luò)的神經(jīng)形態(tài)技術(shù),將軟件智能與硬件智能二者優(yōu)勢(shì)有機(jī)融合,從結(jié)構(gòu)層次模仿腦、器件層次逼近腦智能層次超越腦,建立更強(qiáng)大的類腦導(dǎo)航系統(tǒng),實(shí)現(xiàn)類腦導(dǎo)航軟硬件一體化,是實(shí)現(xiàn)更深層次模擬動(dòng)物導(dǎo)航面臨的關(guān)鍵問(wèn)題和挑戰(zhàn),也是未來(lái)應(yīng)用于無(wú)人載體研究的重點(diǎn)。美國(guó)諾貝爾生理醫(yī)學(xué)獎(jiǎng)獲得者Edelman團(tuán)隊(duì)提出了類腦導(dǎo)航系統(tǒng)軟硬件一體化設(shè)計(jì)架構(gòu)“BBD”(Brain-based Device)[57],如圖7所示,包含了從傳感信息輸入、類腦認(rèn)知地圖構(gòu)建、行為決策、行進(jìn)導(dǎo)航以及運(yùn)動(dòng)控制全過(guò)程,為類腦神經(jīng)形態(tài)導(dǎo)航系統(tǒng)的設(shè)計(jì)提供了較好的范例。

圖6 類腦導(dǎo)航與記憶的耦合[52]Fig.6 Coupling of brain-inspired navigation and memory[52]

謝菲爾德大學(xué)[58]“Brain on Board”項(xiàng)目基于昆蟲(chóng)復(fù)眼視覺(jué)開(kāi)發(fā)了類蜜蜂腦軟硬件架構(gòu)四旋翼無(wú)人機(jī)平臺(tái)BeeBotV2,具有體積小、能耗低等優(yōu)勢(shì)。加州大學(xué)歐文分校[59]首次采用SNN架構(gòu)類腦芯片TrueNorth實(shí)現(xiàn)了基于CNN的無(wú)人駕駛小車野外自主導(dǎo)航、決策與控制一體化測(cè)試,具有硬件體積小、功耗低、并行計(jì)算等優(yōu)勢(shì);曼徹斯特大學(xué)采用其SNN架構(gòu)類腦芯片SpiNNaker實(shí)時(shí)解析視覺(jué)信息實(shí)現(xiàn)了機(jī)器人全自主導(dǎo)航與行駛。蘇黎世聯(lián)邦理工學(xué)院Yulia團(tuán)隊(duì)[60]設(shè)計(jì)了基于SNN的SLAM算法,并在混合模擬/數(shù)字神經(jīng)形態(tài)硬件平臺(tái)進(jìn)行了測(cè)試實(shí)現(xiàn)了較好的時(shí)間復(fù)雜性和節(jié)能;蘇黎世聯(lián)邦理工學(xué)院[61]開(kāi)發(fā)了微型無(wú)人機(jī)計(jì)算平臺(tái)用簡(jiǎn)化CNN類腦視覺(jué)環(huán)境感知與飛行動(dòng)作決策一體化算法,并基于ASIC超低功耗AI芯片Gap8設(shè)計(jì)了類腦導(dǎo)航計(jì)算機(jī),實(shí)現(xiàn)了27 g微小無(wú)人機(jī)全自主智能飛行。近期,清華大學(xué)設(shè)計(jì)開(kāi)發(fā)了基于“天機(jī)”混合異構(gòu)類腦芯片的軟硬件一體化計(jì)算平臺(tái)[62]。通過(guò)共用樹(shù)突回路,融合了基于精確多位值處理計(jì)算信息機(jī)制的人工神經(jīng)網(wǎng)絡(luò)硬件計(jì)算回路和基于二進(jìn)制脈沖序列的神經(jīng)形態(tài)硬件計(jì)算回路;采用神經(jīng)狀態(tài)機(jī)算法融合了基于視覺(jué)、語(yǔ)音、IMU傳感信息的CNN、SNN、CANN等多模態(tài)神經(jīng)計(jì)算回路,實(shí)現(xiàn)了無(wú)人駕駛自行車自平衡、動(dòng)態(tài)感知、目標(biāo)探測(cè)、跟蹤、自動(dòng)避障、語(yǔ)音理解、自主決策等功能。上述研究為發(fā)展自主環(huán)境感知、空間認(rèn)知、路徑規(guī)劃與動(dòng)作決策一體化能力的類腦神經(jīng)形態(tài)導(dǎo)航系統(tǒng)及其工程應(yīng)用奠定了基礎(chǔ)。

圖7 基于BBD的類腦導(dǎo)航系統(tǒng)架構(gòu)[57]Fig.7 Brain-inspired navigation system based on BBD[57]

3.3 類腦群體導(dǎo)航

自組織行為是自然界中常見(jiàn)的現(xiàn)象,如協(xié)同工作的蟻群和蜂群、編隊(duì)飛行的鳥(niǎo)群和蝙蝠群、結(jié)隊(duì)巡游的魚(yú)群等。這些現(xiàn)象的共同特點(diǎn)是一定數(shù)量的自主個(gè)體通過(guò)局部群內(nèi)以及與環(huán)境的相互交互和通信,在整個(gè)群體層面上呈現(xiàn)有序的協(xié)同樣式和行為。上述自組織機(jī)制為實(shí)現(xiàn)類腦導(dǎo)航從個(gè)體智能導(dǎo)航到群體智能導(dǎo)航產(chǎn)生提供了一個(gè)很好的生物模型。當(dāng)前研究人員主要借鑒昆蟲(chóng)以及蝙蝠等哺乳動(dòng)物個(gè)體自組織機(jī)制以及哺乳動(dòng)物個(gè)體大腦導(dǎo)航機(jī)理啟發(fā)的導(dǎo)航細(xì)胞自組織機(jī)制開(kāi)展了部分集群類腦導(dǎo)航研究。

1) 生物個(gè)體自組織機(jī)制

昆蟲(chóng)通過(guò)與環(huán)境以及其他昆蟲(chóng)個(gè)體的自組織信息交互完成群體導(dǎo)航過(guò)程。其中昆蟲(chóng)通過(guò)向環(huán)境釋放某種吸引或排斥物質(zhì)來(lái)建立正常交通的路線和網(wǎng)絡(luò),這些路線和網(wǎng)絡(luò)構(gòu)成了昆蟲(chóng)的認(rèn)知地圖,代表性的研究如Jimenez等[63]基于螞蟻正反饋和負(fù)反饋信息素集群認(rèn)知地圖構(gòu)建機(jī)制,采用SNN在Netlogo多智能體仿真驗(yàn)證平臺(tái)實(shí)現(xiàn)了機(jī)器人集群認(rèn)知地圖的高效準(zhǔn)確構(gòu)建和自組織機(jī)制的機(jī)器人群體智能導(dǎo)航。Bonnet等[64]研究了蜂群和魚(yú)群通過(guò)視覺(jué)信號(hào)(如不同的形狀、顏色和條紋)和行為信號(hào)(如加速度、振動(dòng)和尾巴運(yùn)動(dòng))進(jìn)行個(gè)體導(dǎo)航信息傳遞交互機(jī)制,通過(guò)機(jī)器人協(xié)助實(shí)現(xiàn)魚(yú)群和蜂群跨物種協(xié)同集群飛行。

哺乳動(dòng)物同樣通過(guò)與環(huán)境以及其他個(gè)體的自組織信息交互完成群體導(dǎo)航過(guò)程。近兩年來(lái),認(rèn)知神經(jīng)學(xué)家開(kāi)始探索以蝙蝠群體為代表的哺乳動(dòng)物群體導(dǎo)航機(jī)理[65],如圖8所示。當(dāng)前被證實(shí)的蝙蝠群體導(dǎo)航神經(jīng)元[66-67]:敏感空間位置的三維位置細(xì)胞,敏感空間角度的三維方向細(xì)胞,敏感行進(jìn)距離的三維網(wǎng)格細(xì)胞,以及追蹤臨近事物運(yùn)動(dòng)軌跡和感應(yīng)同伴位置的社交位置細(xì)胞等三維導(dǎo)航細(xì)胞[2],這些細(xì)胞協(xié)同工作來(lái)繪制蝙蝠(群體)的三維空間認(rèn)知地圖。此外,近年來(lái),群體智能決策“深度多智能體強(qiáng)化學(xué)習(xí)”技術(shù)[68]的出現(xiàn)和發(fā)展,為研究群體在與環(huán)境交互中習(xí)得智能決策提供了便捷計(jì)算架構(gòu)。結(jié)合構(gòu)建的類腦三維空間認(rèn)知地圖以及深度多智能體強(qiáng)化學(xué)習(xí),開(kāi)發(fā)三維群體環(huán)境感知、空間認(rèn)知、面向目標(biāo)導(dǎo)航一體化的端到端計(jì)算架構(gòu),即“三維集群類腦導(dǎo)航”,將是未來(lái)群體智能研究的熱點(diǎn)。

圖8 三維類腦群體導(dǎo)航神經(jīng)機(jī)理[65]Fig.8 Neural basis of 3D brain-inspired swarm navigation[65]

2) 導(dǎo)航細(xì)胞自組織機(jī)制

澳大利亞國(guó)防科技集團(tuán)Vladimir等[69]將哺乳動(dòng)物海馬體導(dǎo)航細(xì)胞自組織路徑積分與導(dǎo)航機(jī)制融入哈密頓動(dòng)力學(xué)集群控制模型融合的大規(guī)模無(wú)人機(jī)-無(wú)人車聯(lián)合集群元認(rèn)知監(jiān)督導(dǎo)航/路徑規(guī)劃/動(dòng)作決策一體化模型,此外,美國(guó)約翰霍金斯大學(xué)開(kāi)展了基于大腦海馬區(qū)導(dǎo)航細(xì)胞自組織機(jī)制的無(wú)人機(jī)集群感知/認(rèn)知/路徑規(guī)劃與動(dòng)作決策一體化探索研究。

如前文所述,昆蟲(chóng)個(gè)體自組織集群機(jī)制與哺乳動(dòng)物大腦導(dǎo)航細(xì)胞自組織集群機(jī)制具有較好的互補(bǔ)對(duì)稱性[9]。昆蟲(chóng)自組織集群感知、空間認(rèn)知與導(dǎo)航模型具有較高的群體智能;導(dǎo)航細(xì)胞自組織集群導(dǎo)航神經(jīng)計(jì)算機(jī)制得到了大量研究,具有穩(wěn)定可靠的導(dǎo)航結(jié)果。因此,如何有效融合此二類自組織機(jī)制,發(fā)展“昆蟲(chóng)/導(dǎo)航細(xì)胞”自組織集群環(huán)境感知、空間認(rèn)知與面向目標(biāo)導(dǎo)航神經(jīng)計(jì)算機(jī)制,是提升無(wú)人機(jī)密集集群導(dǎo)航性能的另一途徑,也是作者團(tuán)隊(duì)重點(diǎn)研究的領(lǐng)域之一[70]。

4 類腦導(dǎo)航應(yīng)用中存在的問(wèn)題與挑戰(zhàn)

如前所述,類腦導(dǎo)航是一種大腦導(dǎo)航機(jī)理啟發(fā)下的端到端推理學(xué)習(xí)型導(dǎo)航方法,借鑒動(dòng)物大腦導(dǎo)航細(xì)胞自組織集群神經(jīng)計(jì)算機(jī)制,利用AI技術(shù)實(shí)現(xiàn)從原始傳感信息輸入到導(dǎo)航行為決策的直接輸出,形成具有自主環(huán)境感知、空間認(rèn)知、路徑規(guī)劃與動(dòng)作決策一體化能力的類腦導(dǎo)航模型。從當(dāng)前類腦導(dǎo)航技術(shù)研究來(lái)看,應(yīng)用于無(wú)人機(jī)密集集群系統(tǒng)主要存在類腦導(dǎo)航模型適用性、可解釋性、精確性問(wèn)題。

1) 類腦導(dǎo)航模型適用性。類腦導(dǎo)航模型是動(dòng)物大腦導(dǎo)航細(xì)胞自組織連接結(jié)構(gòu)及神經(jīng)計(jì)算機(jī)制啟發(fā)下的神經(jīng)網(wǎng)絡(luò)模型,雖然模型中的大部分連接由大腦結(jié)構(gòu)預(yù)先定義,但其連接權(quán)值大多仍需采用學(xué)習(xí)的方法進(jìn)行優(yōu)化和確定,習(xí)得的模型在相近場(chǎng)景中具有較好適用性,但差別較大場(chǎng)景還有待進(jìn)一步提高,需要解決模型遷移或快速自學(xué)習(xí)問(wèn)題,這是類腦導(dǎo)航走向?qū)嶋H應(yīng)用首要問(wèn)題。

2) 類腦導(dǎo)航可解釋性。類腦導(dǎo)航的3個(gè)過(guò)程:類腦環(huán)境感知、類腦空間認(rèn)知以及面向目標(biāo)類腦導(dǎo)航部分模型仍依賴黑箱建模的深度學(xué)習(xí),當(dāng)前的深度學(xué)習(xí)的可解釋性還相對(duì)較差,若應(yīng)用在實(shí)際無(wú)人機(jī)密集集群系統(tǒng)中出了問(wèn)題很難找到問(wèn)題的原因,也比較難排查,因此,如何引入更多的大腦導(dǎo)航腦區(qū)結(jié)構(gòu)及信息處理機(jī)制,提高深度學(xué)習(xí)的可解釋性具有重要的研究意義。

3) 類腦導(dǎo)航精確性。當(dāng)前類腦導(dǎo)航還難以精確解算三維姿態(tài)、速度和位置等導(dǎo)航參數(shù),較為成熟的研究是通過(guò)建立環(huán)境感知與行為決策之間的智能連接,解決“到哪去”以及“怎么去”等推理和決策問(wèn)題。然而,當(dāng)前階段這些精確導(dǎo)航參數(shù)仍是無(wú)人機(jī)密集集群系統(tǒng)控制技術(shù)不可缺少的信息[71]。因此,目前類腦導(dǎo)航無(wú)法單獨(dú)應(yīng)用于無(wú)人機(jī)密集集群系統(tǒng),需要傳統(tǒng)導(dǎo)航算法的支持。

5 結(jié) 論

類腦導(dǎo)航技術(shù)初步形成了環(huán)境感知、空間認(rèn)知與自主路徑規(guī)劃決策一體化的端到端技術(shù)特征,表現(xiàn)了一定的動(dòng)物導(dǎo)航自主智能性,進(jìn)一步將重點(diǎn)向與更多類腦智能行為耦合、神經(jīng)形態(tài)類腦導(dǎo)航系統(tǒng)、以及類腦群體導(dǎo)航發(fā)展。類腦導(dǎo)航研究現(xiàn)狀及未來(lái)發(fā)展主要研究?jī)?nèi)容如表1所示,這些研究及其組合有望提高復(fù)雜工作環(huán)境下無(wú)人機(jī)密集集群導(dǎo)航的魯棒性、準(zhǔn)確性、實(shí)時(shí)響應(yīng)動(dòng)作、自主智能性以及計(jì)算效率。盡管目前類腦(群體)導(dǎo)航技術(shù)僅僅是對(duì)所發(fā)現(xiàn)的少數(shù)部分動(dòng)物大腦導(dǎo)航機(jī)理借鑒,未能從系統(tǒng)層面模擬和借鑒動(dòng)物大腦導(dǎo)航機(jī)理。隨著腦與神經(jīng)科學(xué)、人工智能、神經(jīng)形態(tài)技術(shù)以及硬件技術(shù)的持續(xù)發(fā)展,類腦導(dǎo)航技術(shù)可以展現(xiàn)出更強(qiáng)大的功能和智能性,在無(wú)人機(jī)密集集群系統(tǒng)的應(yīng)用中具有較大潛力。

表1 類腦導(dǎo)航技術(shù)典型研究Table 1 Typical studies of brain-inspired navigation

猜你喜歡
類腦集群大腦
齊口裂腹魚(yú)集群行為對(duì)流態(tài)的響應(yīng)
基于信息素決策的無(wú)人機(jī)集群協(xié)同搜索算法
神經(jīng)元規(guī)模最大類腦計(jì)算機(jī)問(wèn)世
我科學(xué)家首次提出“類腦計(jì)算完備性”
中國(guó)成立“類腦國(guó)家實(shí)驗(yàn)室”“借鑒人腦”攻關(guān)人工智能
勤快又呆萌的集群機(jī)器人
阜阳市| 北宁市| 砀山县| 突泉县| 岐山县| 科技| 林州市| 阿克苏市| 湖北省| 湾仔区| 逊克县| 长寿区| 延长县| 西城区| 郎溪县| 无锡市| 溧水县| 杭锦旗| 河津市| 平凉市| 丹江口市| 胶南市| 长葛市| 阿鲁科尔沁旗| 婺源县| 乡宁县| 兴文县| 兰考县| 平陆县| 荆门市| 西和县| 石楼县| 太湖县| 府谷县| 滁州市| 临夏县| 台南市| 塘沽区| 德钦县| 若尔盖县| 噶尔县|