趙辰豪,吳德偉,韓 昆,代傳金
(空軍工程大學信息與導(dǎo)航學院,陜西 西安 710077)
導(dǎo)航是檢測和控制運行體從一個地方移動到另一個地方的過程[1]。隨著導(dǎo)航智能化的發(fā)展,自主導(dǎo)航技術(shù)[2]逐漸成為導(dǎo)航研究熱點。自主導(dǎo)航最初是指不借助人工設(shè)置的目標和信息源的導(dǎo)航儀器來完成導(dǎo)航的方法[3],如慣性導(dǎo)航[4]、天文導(dǎo)航[5]、儀器導(dǎo)航等。近年來,網(wǎng)格細胞[6]、位置細胞[7]、頭朝向細胞[8]、速度細胞[9]、邊界細胞[10]等大腦導(dǎo)航細胞的發(fā)現(xiàn),使大腦空間導(dǎo)航機制[11]理論逐漸成熟。大腦導(dǎo)航系統(tǒng)為研究自主導(dǎo)航技術(shù)提供了一種新的思路。腦神經(jīng)科學與導(dǎo)航的結(jié)合產(chǎn)生一種新的新型仿生智能自主導(dǎo)航技術(shù)——類腦認知導(dǎo)航[12],其通過模仿大腦,建立具有自主性、智能化的導(dǎo)航機制[13]。實現(xiàn)類腦認知導(dǎo)航首先要解決的問題是如何構(gòu)建認知圖[14],而認知圖的構(gòu)建方式是由環(huán)境信息決定的。在無環(huán)境信息下,需要建立符合類腦機制的空間表征;部分或充足環(huán)境下,需要將已知的信息轉(zhuǎn)化為能夠被運行體獲取的類腦表征信息。
目前,關(guān)于認知圖構(gòu)建的研究還處于初始階段,主要集中在無環(huán)境信息下的空間表征[13]。無環(huán)境信息下的空間表征是利用網(wǎng)格細胞模型生成特殊形式的“坐標系統(tǒng)”,對空間進行標定[15]。網(wǎng)格細胞的模型主要有振蕩干涉模型[16]與吸引子網(wǎng)絡(luò)模型[17-19]。Tsodyks根據(jù)網(wǎng)格細胞空間六邊形放電域和周期放電等特性,提出吸引子網(wǎng)絡(luò)模型,模擬網(wǎng)格細胞的性能[20]。Burak針對吸引子網(wǎng)絡(luò)無法整合速度信息與網(wǎng)絡(luò)規(guī)模小等問題,建立能整合速度信息的吸引子網(wǎng)絡(luò)模型,并成功在10~100 m范圍內(nèi)保持速度整合的準確性[21]。于乃功等基于此模型對空間進行表征,但傳統(tǒng)吸引子網(wǎng)絡(luò)只能感應(yīng)物體運行的合速度,網(wǎng)格細胞的放電狀態(tài)只對應(yīng)已運行的位置,無法表征未探索的位置,探索路徑的設(shè)置十分復(fù)雜,對位置環(huán)境的探索效率過低[22]。文獻[23]通過記錄網(wǎng)格細胞的周期性放電率規(guī)律,提出一種基于單一尺度的網(wǎng)格細胞表征空間的方法,并在一定范圍內(nèi)證明了表征模型的有效性,但單一尺度網(wǎng)格細胞表征空間受到最大網(wǎng)格間距的限制,表征范圍有限。Edvardsen基于多放電野間距的網(wǎng)格細胞連續(xù)吸引子網(wǎng)絡(luò)模型實現(xiàn)了空間表征并完成目標導(dǎo)向?qū)Ш?方向信息和距離信息由多個方向的矢量累加提供,但是導(dǎo)航范圍僅限于最大網(wǎng)格細胞放電野間距[24]。針對表征范圍的問題,文獻[25]提出多尺度網(wǎng)格細胞模型,并基于該模型建立空間表征,實驗結(jié)果證明多尺度模型能有效擴大表征范圍,但文中僅以單個網(wǎng)格細胞的放電率周期作為整個網(wǎng)絡(luò)的周期,存在較大的偶然誤差,使得表征結(jié)果不準確,表征效果較差。
針對上述問題,本文提出一種多尺度網(wǎng)格細胞群的空間表征模型,并記錄網(wǎng)格細胞群的放電狀態(tài)對空間進行表征。通過減少網(wǎng)格細胞的偏好朝向,生成具有特定感應(yīng)方向的網(wǎng)格細胞,并進行仿真驗證改進后模型的性能。同時,基于改進的模型,選取適當?shù)木W(wǎng)格間距比生成多尺度網(wǎng)格細胞,來擴大表征范圍,記錄整個網(wǎng)格細胞群的放電狀態(tài),并通過線性前瞻的方法驗證多尺度網(wǎng)格細胞表征一維、二維空間的能力。
本文采用單層網(wǎng)格細胞的連續(xù)吸引子網(wǎng)絡(luò)模型,通過改進該模型速度的感應(yīng)能力,產(chǎn)生能夠響應(yīng)特定方向的吸引子網(wǎng)絡(luò)的網(wǎng)格細胞模型。
假設(shè)網(wǎng)格細胞排列于2-D平面上,總數(shù)是N=n×n,xi表示網(wǎng)格細胞i的位置。xi的取值范圍是(-n/2,-n/2)到(n/2,n/2)。網(wǎng)格細胞i的偏好朝向由θi決定。吸引子網(wǎng)絡(luò)中網(wǎng)格細胞放電率的計算方法[21]為
(1)
式中,f(·)為線性整流函數(shù),當x>0,f(x)=x;當x≤0,f(x)=0;τ為時間常數(shù);si表示第i個神經(jīng)元的放電率大小;Wi j為第i個神經(jīng)元與第j個神經(jīng)元之間的連接權(quán)值;Bi表示第i個網(wǎng)格細胞的前饋輸入。
網(wǎng)格權(quán)重的表達式[21]為
(2)
W0(x)=a1exp(-γ|x|2)-a2exp(-β|x|2)
(3)
網(wǎng)格細胞前饋輸入的表達式[21]為
(4)
式中,α與式(2)中的l為常數(shù),當α≠0且l≠0時,運動速度v與吸引子網(wǎng)絡(luò)的更新動態(tài)的速度相關(guān)。網(wǎng)格細胞的前饋輸入決定了速度對網(wǎng)格細胞放電狀態(tài)的影響。A(xi)為包絡(luò)函數(shù),該函數(shù)決定了網(wǎng)格細胞的周期性;本文采用周期性網(wǎng)格細胞,取A(xi)=1。
基于上述過程,能產(chǎn)生一定網(wǎng)格間距的網(wǎng)格細胞。通過設(shè)置單個網(wǎng)格細胞的偏好朝向,使該模型能準確響應(yīng)運行體運動的速度。
網(wǎng)格細胞輸出權(quán)重的轉(zhuǎn)移方向和輸入速度的方向是由吸引子網(wǎng)絡(luò)中單個網(wǎng)格細胞的偏好朝向決定的。文獻[21]對模型中網(wǎng)格細胞賦予4個不同的偏好朝向,使得網(wǎng)格細胞群只響應(yīng)運行體的合速度,而不能響應(yīng)不同方向上的分速度。為了生成具有不同感應(yīng)方向的網(wǎng)格細胞模型,需要消除網(wǎng)格細胞不同方向之間的關(guān)聯(lián)性。本文對網(wǎng)格細胞模型進行改進,將模型中的偏好朝向減少為兩個,設(shè)置每4個網(wǎng)格細胞中同時包含兩個偏好朝向,并且左右相鄰位置與對角線上的網(wǎng)格細胞的偏好朝向不同,即相鄰的4個網(wǎng)格細胞的偏好朝向為
(5)
當且僅當θ1-θ2=π時,網(wǎng)格細胞僅感應(yīng)特定方向速度,不受其他方向速度分量輸入的影響。
如圖1所示,結(jié)合二維空間表征機制,需要設(shè)置偏好朝向分別為φ1、φ2的兩組網(wǎng)格細胞,同時該偏好朝向?qū)?yīng)的方向向量aφ1,aφ2線性無關(guān),即
k1aφ1+k2aφ2≠0,k1≠0;k2≠0
(6)
圖1 二維平面的表征Fig.1 Representation of 2-D plane
本文取φ1=0(θ1=0,θ2=π)對應(yīng)表征水平方向,φ2=π/2(θ1=π/2,θ2=3π/2)對應(yīng)表征豎直方向。
通過調(diào)整吸引子網(wǎng)絡(luò)模型中參數(shù)β可得不同間距的網(wǎng)格細胞群,即多尺度網(wǎng)格細胞群模型。假設(shè)模型中網(wǎng)格細胞數(shù)量為N1×N2,其中N1表示網(wǎng)格細胞群的層數(shù),且同層網(wǎng)格細胞具有相同的尺度。N2=n×n表示單層網(wǎng)格細胞的總數(shù);每一層的網(wǎng)格細胞都能夠獨立響應(yīng)運行體的運行速度與方向。
運行體在t時刻的放電率用St表示:
(7)
(8)
通過選擇適當?shù)木W(wǎng)格間距進行組合,理論上網(wǎng)格細胞放電率向量St的周期能夠趨于無窮大。因此,放電率向量St能夠與位置一一對應(yīng),滿足表征空間的條件。但由于放電率維數(shù)過大,直接比較向量將變得十分復(fù)雜且低效。為提高比較效率,本文采用放電率夾角的計算方法,定義:
(9)
圖2 網(wǎng)格細胞空間表征Fig.2 Spatial representation of grid cell
由圖2可知,基于多尺度網(wǎng)格細胞群的空間表征的過程可分為5個步驟:
步驟 1設(shè)置合理的空間探索方式,并感知運行體的運行速度;
步驟 5重復(fù)步驟2~步驟4直至t>Texp,探索結(jié)束。
探索結(jié)束后需要對生成的表征結(jié)果進行分析,檢驗表征效果的好壞。本文采用空間線性前瞻的方法對網(wǎng)格細胞空間表征結(jié)果進行檢驗。線性前瞻是指運行體保持位置固定,通過向網(wǎng)格細胞輸入聯(lián)想速度,改變網(wǎng)格細胞的放電率。檢驗表征結(jié)果的具體過程如下:
步驟 1給定起點后,對網(wǎng)格細胞群放電率進行賦值。
步驟 2通過向網(wǎng)格細胞模型中輸入聯(lián)想速度,更新網(wǎng)格細胞群的放電率。
步驟 3根據(jù)式(8)實時計算當前時刻網(wǎng)格細胞群向量與目標向量的夾角;當該方向的夾角都大于設(shè)置的放電閾值h時,停止線性前瞻,直至每層網(wǎng)格細胞的前瞻結(jié)束,分別記錄各自的停止時間t。
步驟 4計算各個方向上運行的距離,并進行矢量疊加,最終得到網(wǎng)格細胞表征下的起點到目標點的距離與方向。
仿真實驗對改進后網(wǎng)格細胞模型的性能與多尺度網(wǎng)格細胞群的空間表征能力進行驗證。吸引子網(wǎng)絡(luò)模型的基本參數(shù)設(shè)置:a1=a2=1,β=3/λ2,γ=1.1β,τ=10 ms,α=0.103 15,l=2,dt=0.5 ms,根據(jù)式(2)生成不同感應(yīng)方向與不同網(wǎng)格間距的權(quán)值矩陣W。
改進后網(wǎng)格細胞模型的性能驗證分為3個部分。首先,驗證模型空間六邊形的放電樣式與網(wǎng)格間距的可調(diào)整性;其次,驗證網(wǎng)格細胞模型具有特定的感應(yīng)方向;最后,驗證模型整合速度的能力。
設(shè)網(wǎng)格細胞模型參數(shù)為λ1=13、λ2=20、λ3=26;單層網(wǎng)格細胞個數(shù)N2=128×128,圖3為λ取不同值時,生成網(wǎng)格細胞的放電樣式,其中顏色柱表示網(wǎng)格細胞放電率大小,單位為Hz。設(shè)λ=13,單層網(wǎng)格細胞個數(shù)N2=50×50,選取感應(yīng)水平方向的網(wǎng)格細胞,θ1=0,θ2=π;感應(yīng)豎直方向的網(wǎng)格細胞,θ1=π/2,θ2=3π/2,分別生成感應(yīng)水平方向的網(wǎng)格細胞與感應(yīng)豎直方向的網(wǎng)格細胞。
圖4和圖5分別表示水平速度和豎直速度對不同感應(yīng)方向上網(wǎng)格細胞放電活動的影響,其中橫、縱坐標均為網(wǎng)格細胞個數(shù),顏色柱表示細胞放電率的大小,單位為Hz。由圖4和圖5可知,當輸入速度只存在水平分量時,感應(yīng)水平方向的網(wǎng)格細胞能夠水平運動,而感應(yīng)豎直方向的網(wǎng)格細胞的狀態(tài)不發(fā)生變化;當輸入速度只存在豎直分量時,感應(yīng)豎直方向的網(wǎng)格細胞能夠沿豎直方向運動,感應(yīng)水平方向的網(wǎng)格細胞的狀態(tài)保持不變。由此可得,改進后的模型只響應(yīng)其感應(yīng)方向上的速度輸入,具有特定感應(yīng)方向。
圖3 多尺度網(wǎng)格細胞模型Fig.3 Multi-scale grid cell model
圖4 感知水平速度的網(wǎng)格細胞Fig.4 Grid cell perceiving horizontal velocity
圖5 感知豎直速度的網(wǎng)格細胞Fig.5 Grid cell perceiving vertical velocity
理論上,網(wǎng)格細胞狀態(tài)周期與速度成反比,因此可以通過觀察速度變化對周期的影響來驗證改進模型整合速度的能力。設(shè)初始位置處網(wǎng)格細胞放電率向量S=S0,并將此放電率作為參考放電率Sref,然后輸入速度對放電率St進行更新,根據(jù)式(8)計算參考放電率向量與聯(lián)想放電率向量之間的夾角Θ。由夾角Θ性質(zhì)可知,Θ=1時,網(wǎng)格細胞放電率向量為St=S0。因此,峰峰值時間間隔等于完整的網(wǎng)格細胞放電率周期。設(shè)模型參數(shù)λ1=16、λ2=24,輸入速度v1=0.5 m/s、v2=1.0 m/s,圖6與圖7分別表示將水平網(wǎng)格細胞與豎直網(wǎng)格細胞整合速度的結(jié)果。
圖6 水平網(wǎng)格細胞模型速度整合結(jié)果Fig.6 Velocity integration result of horizontal grid cell model
由圖6可知,λ=16時,速度v=0.5 m/s和v=1.0 m/s對應(yīng)的峰峰值平均時間間隔分別是13.4 s和6.70 s。λ=24時,分別是14.6 s和7.35 s。由圖7可得,λ=16時,速度v=0.5 m/s、v=1.0 m/s對應(yīng)的峰峰值平均時間間隔分別是13.7 s和6.75 s;λ=24時,分別是14.6 s和7.35 s。實驗結(jié)果表明,當輸入的速度增加一倍,峰峰值時間間隔縮小為原來的二分之一,即網(wǎng)格細胞周期變?yōu)樵瓉矶种?。因?改進后的網(wǎng)格細胞模型仍然可以準確的整合速度信息。
圖7 豎直網(wǎng)格細胞模型速度整合結(jié)果Fig.7 Velocity integration result of vertical grid cell model
綜上所述,改進后的吸引子網(wǎng)絡(luò)模型能形成穩(wěn)定的六邊形放電域,網(wǎng)格細胞的間距具有可調(diào)性,并且模型能夠準確地整合速度信息,改變網(wǎng)格細胞的偏好朝向,使吸引子網(wǎng)絡(luò)模型具有特定的感應(yīng)方向。
本實驗主要驗證空間表征模型對一維空間與二維空間的表征能力,采用線性前瞻的方法對空間的表征結(jié)果進行檢驗。
設(shè)單層網(wǎng)格細胞個數(shù)N2=50×50,λ1=10、λ2=16、λ3=24,放電率夾角閾值h=0.95。如圖8所示,運行體從O點出發(fā),速度v=0.5 m/s,探索并表征一維空間,探索完畢后,運行體以不同路徑在已探索空間中運行。路徑1為由O點出發(fā),沿直線向紅色區(qū)域運動。路徑2為由O′點出發(fā),沿直線向紅色區(qū)域運動。路徑3為由O點出發(fā),進行變速運動并先后3次經(jīng)過紅色區(qū)域。
圖8 運行體探索空間的路徑Fig.8 Path of exploration
設(shè)S=Sred為網(wǎng)格細胞群的目標放電率,圖9~圖11分別表示沿不同路徑運動,放電率向量夾角Θ隨時間變化的過程。
圖9 沿路徑1運行Θ的變化Fig.9 Θ’s change along the path 1
圖10 沿路徑2運行Θ的變化Fig.10 Θ’s change along the path 2
圖11 沿路徑3運行Θ的變化Fig.11 Θ’s change along the path 3
如圖12所示,待探索空間的大小為100 m×100 m,運行體以勻速的方式從一個頂點沿對角線運行至另一個頂點對空間進行探索,探索過程中運行速度為0.7 m/s,總運行時間為200 s,探索完畢后,共生成300個放電率向量群Si,且Si=[Shor(m),Sver(n)]其中,Shor表示水平方向放電率向量,Shor表示豎直方向放電率向量,m,n∈[0,300]。放電率向量群Si即為二維空間的網(wǎng)格細胞表征。選取不同間距與不同感應(yīng)方向構(gòu)建多尺度網(wǎng)格細胞,設(shè)單層網(wǎng)格細胞個數(shù)N2=50×50,網(wǎng)格細胞模型的參數(shù)設(shè)置為:λ1=18、λ2=20、λ3=22、λ4=24。采用線性前瞻的過程檢驗網(wǎng)格細胞表征空間的結(jié)果,放電率夾角閾值h=0.95,并分析空間表征性能。
圖12 二維空間的探索路徑Fig.12 Exploration path of 2-D space
圖13為采用傳統(tǒng)吸引子網(wǎng)絡(luò)探索二維空間環(huán)境后,使用線性前瞻機制進行檢驗的結(jié)果。由于傳統(tǒng)網(wǎng)格細胞模型的限制,運行體只表征已探索的空間,因此運行體僅可以完成由已探索位置到已探索位置的線性前瞻過程。而當起始點或目標點中包含未探索位置時,由于缺乏位置的表征信息,無法開始線性前瞻過程,即該模型未生成關(guān)于未探索區(qū)域的表征信息。
圖13 多尺度吸引子網(wǎng)絡(luò)模型的空間表征Fig.13 Spatial representation of multi-scale attractor network model
圖14為采用線性前瞻的方式檢驗改進后模型表征空間的結(jié)果,圖中橫坐標為線性前瞻的時間,縱坐標為放電率向量夾角的余弦值。圖14(a)為運行體由已探索位置導(dǎo)航到已探索位置線性前瞻的過程,設(shè)初始狀態(tài)m=40,目標狀態(tài)n=60,聯(lián)想速度v=[0.5;0.5]m/s;出發(fā)點至目標點向量為10x+10y,由模型生成的向量為10.11x+10.12y。圖14(b)為運行體由已探索位置到未探索位置線性前瞻的過程,設(shè)初始狀態(tài)m=50,目標狀態(tài)n=30,n1=40,聯(lián)想速度v=[-0.5;-0.25]m/s;出發(fā)點至目標點向量為-10x-5y,由模型生成的向量為-10.10x-5.09y。圖14(c)為從未探索的位置導(dǎo)航到探索位置,設(shè)初始狀態(tài)m=30,m1=80,目標狀態(tài)n=55,n1=55,聯(lián)想速度v=[0.5;-0.5]m/s;出發(fā)點至目標點向量為12.5x-12.5y,由模型生成的向量為12.62x-12.51y。圖14(d)為從未探索位置導(dǎo)航到未探索位置,設(shè)初始位置m=50,m1=30,目標狀態(tài)n=30,n1=50,聯(lián)想速度v=[-0.5;0.5]m/s;出發(fā)點至目標點向量為-10x+10y,由模型生成的向量-10.13x+10.06y。
圖14 改進后網(wǎng)格細胞模型的空間表征Fig.14 Spatial representation by improved grid cell model
由圖13可知,傳統(tǒng)吸引子網(wǎng)絡(luò)模型只能感知運行體運動的合速度,因此僅可以表征探索路徑上的位置,對于未經(jīng)歷過的位置無法表征。由圖14可知,改進后的模型具有特定的感應(yīng)方向,除表征探索路徑上的位置外,還能表征空間中未探索的位置,極大地縮短了探索時間,提高空間的表征能力。
由圖15可知,已探索位置與未探索位置的誤差都保持在0.2 m以內(nèi)。本文中的位置誤差主要取決于構(gòu)建空間表征時,儲存放電率向量的時間間隔tΔ。仿真實驗中時間間隔設(shè)置tΔ=0.2 s,運行體運動速度約為1 m/s,因此放電率向量之間距離間隔不超過0.2 m,所以誤差基本保持在0.2 m以內(nèi)。
圖15 表征結(jié)果中各位置的距離誤差Fig.15 Distance error of each position in the representation
圖16表示不同時間間隔tΔ,探索速度為1 m/s,空間表征結(jié)果的誤差大小。由圖可知,在表征不同大小的空間時,設(shè)置合理的時間間隔,存儲放電率向量,使結(jié)果的精度滿足空間表征要求。
圖16 不同時間間隔各位置的距離誤差Fig.16 Distance error of each position at different tΔ
綜上可知,通過多尺度網(wǎng)格細胞群生成的網(wǎng)格細胞放電率向量,滿足表征一維空間、二維空間的需求。調(diào)節(jié)放電率向量存儲的時間間隔,可以調(diào)整誤差的大小,以滿足不同表征需求。
本文主要解決了無環(huán)境信息下,采用多尺度網(wǎng)格細胞群模型表征空間的問題。通過改進傳統(tǒng)吸引子模型,生成具有特定感應(yīng)方向的網(wǎng)格細胞模型。通過仿真實驗驗證了改進后模型的有效性,檢驗了模型一維、二維空間的表征能力。但在有環(huán)境信息下的空間表征除了網(wǎng)格細胞對空間進行標定外,還需采用位置細胞等對標志物等位置進行記憶。因此,進一步實現(xiàn)無環(huán)境信息下的空間表征,需要結(jié)合位置細胞進行更深的研究。