蘭慶慶,肖本賢,何怡剛
(合肥工業(yè)大學 電氣與自動化工程學院, 合肥 230009)
近年來移動通信系統(tǒng)在不同領域的快速發(fā)展,帶動室內(nèi)無線通信系統(tǒng)的相關技術(shù)與應用也取得長足的進步,同時無線通信設備的普及大大促進了室內(nèi)定位服務[1],如室內(nèi)搜索,導航和跟蹤的推廣.然而,由于室內(nèi)環(huán)境復雜,在實踐中通常不容易達到令人滿意的定位精度[2].基于無線信號的定位系統(tǒng)的性能主要依賴于傳播模型,因而研究室內(nèi)無線信號的傳播特性對提高室內(nèi)定位系統(tǒng)的定位精度有著十分重要的作用.現(xiàn)有的研究成果中,較多地采用經(jīng)驗路徑損耗模型來描述室內(nèi)無線信號傳播特性[3],但是這些模型沒有考慮到室內(nèi)環(huán)境復雜多變的特性,不具有對室內(nèi)環(huán)境的普適性.因此,研究建立適用于不同室內(nèi)環(huán)境下無線信號的路徑損耗模型,對提高室內(nèi)無線信號定位系統(tǒng)的定位性能有重要意義.
人工智能(Artificial Intelligence, AI)技術(shù)通過模擬人類大腦神經(jīng)信息處理方式,通過觀察數(shù)據(jù)對復雜信息進行并行處理和非線性轉(zhuǎn)換[4].因其不依賴系統(tǒng)的分析模型,具有普適性,故將其用于處理變化的無線信號,可降低傳播路徑損耗模型中的誤差.文獻[5]提出使用BP神經(jīng)網(wǎng)絡建立接收信號強度值(Received Signal Strength Indication, RSSI)和距離之間的關系模型,并將這個模型成功用于定位系統(tǒng)中.但是BP網(wǎng)絡存在對初始值敏感的問題,不同的初始值,學習過程存在很大差異.因此文獻[6]將粒子群優(yōu)化(Particle Swarm Optimization, PSO)算法的全局尋優(yōu)能力應用于BP網(wǎng)絡權(quán)值以及閾值等參數(shù)的初始化過程,提高了BP網(wǎng)絡的數(shù)據(jù)擬合性能.利用該方法進行無線傳感網(wǎng)絡的定位,其定位穩(wěn)定性和精度有所提升,但是PSO算法具有收斂速度慢的缺點而且隨著迭代的進行易出現(xiàn)局部收斂,這些會對定位結(jié)果造成一定的影響.量子粒子群優(yōu)化(Quantum behavior Particle swarm optimization, QPSO)算法[7]針對PSO算法的這些不足進行了改進,因此將其應用到BP神經(jīng)網(wǎng)絡的學習中得到廣泛關注,并且在網(wǎng)絡流量預測[8],電池荷電狀態(tài)預測[9]等方面取得了一些研究成果.QPSO算法在操作步驟、收斂速度、準確性等方面較其他的群智能優(yōu)化算法有一定的優(yōu)勢,但是算法隨著迭代次數(shù)的增加也會出現(xiàn)種群粒子的多樣性下降情況,進而影響算法的尋優(yōu)能力.為此,文獻[10]將QPSO算法融入到文化算法[11]的框架中,在保留了QPSO算法快速演化能力的同時,又通過文化算法提高QPSO種群中粒子的多樣性,構(gòu)成文化量子粒子群優(yōu)化(Cultural Quantum behavior Particle swarm optimization, CQPSO)算法,用以提高全局收縮能力.文獻[12]研究表明:同QPSO算法相比,在全局收斂能力以及迭代收斂速度方面,CQPSO算法均有一定的優(yōu)勢.
綜合以上研究,為了提高室內(nèi)無線信號傳播模型的準確性,進而實現(xiàn)提升室內(nèi)定位的精度,本文利用CQPSO算法對BP神經(jīng)網(wǎng)絡的學習過程進行優(yōu)化,并將改進后的BP神經(jīng)網(wǎng)絡在RFID室內(nèi)定位中進行實際應用.基本思想是:先是通過CQPSO算法實現(xiàn)BP神經(jīng)網(wǎng)絡權(quán)值以及閾值的迭代尋優(yōu);然后在合理地定義并提取信號樣本之后利用BP神經(jīng)網(wǎng)絡建立室內(nèi)無線信號傳播模型; 之后采用由BP神經(jīng)網(wǎng)絡建立的信道模型對信號傳輸距離進行估計,最后將得到的估計距離應用到RFID室內(nèi)定位算法中得到目標標簽的位置.實驗結(jié)果表明,改進的BP神經(jīng)網(wǎng)絡相對于一般的BP 神經(jīng)網(wǎng)絡數(shù)據(jù)擬合穩(wěn)定性和準確性得到提升,且將其應用于RFID定位系統(tǒng)可提高定位精度.
BP神經(jīng)網(wǎng)絡是一種按梯度算法進行訓練的網(wǎng)絡,其在非線性擬合方面具有很好的優(yōu)勢[13],擬合訓練模型如圖1所示.
圖1 BP神經(jīng)網(wǎng)絡訓練模型
Fig.1 BP neural network training model
其中,Xj為輸入層中某個節(jié)點的輸入值,j=1,2,…,n,由通過每個閱讀器測量得到的某個標簽的RSSI值所構(gòu)成;wij為隱含層中的第i個節(jié)點和輸入層中的第j個節(jié)點進行連接的權(quán)值;Yi為隱含層第i個節(jié)點,i=1,2,…,l;θi表示隱含層中的第i個節(jié)點自身的閾值;Ф為隱含層包含的激勵函數(shù);vki為輸出層中第k個節(jié)點與隱含層第i個節(jié)點進行連接的權(quán)值;ak表示輸出層第k個節(jié)點自身的閾值;φ表示輸出層包含的激勵函數(shù);Ok表示輸出層中某個節(jié)點的輸出值,k=1,2,…,m,由和RSSI值相對應的一個距離值所構(gòu)成.將參考標簽相關的輸入值和輸出值選作我們的訓練樣本進行訓練,通過訓練模型可以由閱讀器采集到的待測標簽的RSSI值得到兩者之間的距離.
文化算法是對以自然選擇與群搜索為基礎的進化算法的補充,它將文化的思想融入到傳統(tǒng)的自然進化算法中,用以實現(xiàn)準確地提取出個體經(jīng)驗與信息,然后使用提取到的信息指引著種群中不同的個體對整個問題空間中存在的所有可行解展開搜索,從而提高了算法的收斂效率.將QPSO算法納入文化算法的框架,在保留QPSO算法高效的演化性能的同時,采用文化算法去增強QPSO的粒子多樣性.同時為了使信念空間中群體所攜帶的經(jīng)驗知識在對種群空間中全部個體的進化進行指引時更具有針對性,種群空間與信念空間內(nèi)的粒子均按照QPSO算法來實行進化操作以及更新操作,最終構(gòu)成文化量子粒子群算法.
QPSO算法是一種新型的群智能優(yōu)化算法,該算法按照公式(1)-公式(3) 的進化規(guī)則來更新粒子的位置.
(1)
Pid=φ*Pbestid+(1-φ)*gbestd
(2)
(3)
式中,mbest表示通過此次迭代產(chǎn)生的種群個體中的最佳位置計算得到的一個中心點;Pid表示處在此次迭代過程個體的最優(yōu)值Pbestid和全局的最優(yōu)值gbestd之間的一個隨機位置;d表示搜索空間所處的維數(shù);M表示粒子群個體的數(shù)目;u,φ表示處在(0,1)之間的一個隨機數(shù),若u>0.5,式(3)為加,不然就為減;參數(shù)β被稱之為擴張-收縮因子,能夠調(diào)節(jié)算法每次迭代的收斂速率,取值隨著算法迭代次數(shù)的不斷增多而線性減少.
接受函數(shù)的主要功能是選取種群空間內(nèi)一定數(shù)目的較優(yōu)個體,提供到信念空間被用來實現(xiàn)知識的自我更新.種群空間提供給信念空間的較優(yōu)個體數(shù)ηaccept可由公式(4)計算[14]:
(4)
公式(4)中,λ是按照實際情況而設定的比例因子;N為群體空間生成粒子的個數(shù);t為進化迭代數(shù).
在信念空間實現(xiàn)自我更新之后,便能夠用影響函數(shù)對種群空間內(nèi)的個體進化方向進行指導,按照下面的式子即可調(diào)節(jié)種群空間內(nèi)粒子所處位置[14].
(5)
基于CQPSO優(yōu)化的BP網(wǎng)絡實現(xiàn)的具體過程如下所示:
1) 確定BP神經(jīng)網(wǎng)絡拓撲結(jié)構(gòu);
2) 初始化粒子群: 將網(wǎng)絡的權(quán)值和閾值作為粒子的當前位置Xi并初始化粒子群,粒子群中每個粒子包含的元素的個數(shù),稱之為粒子長度,可通過下式進行計算:
s=n·l+l·m+l+m
(6)
公式(6)中,s表示粒子中元素的個數(shù);n表示輸入層節(jié)點的數(shù)目;l表示隱含層節(jié)點的數(shù)目;m表示輸出層節(jié)點的數(shù)目.
3) 設置適應度函數(shù):在BP 神經(jīng)網(wǎng)絡模型中,通常采用均方誤差函數(shù)(MSE)來衡量訓練結(jié)果的質(zhì)量,因此本文將BP網(wǎng)絡模型的均方誤差函數(shù)選作文化量子粒子群的適應度函數(shù).
4) 通過文化量子粒子群算法對BP神經(jīng)網(wǎng)絡的權(quán)值和閾值進行迭代尋優(yōu),并種群中適應度函數(shù)值最小的粒子初始化BP神經(jīng)網(wǎng)絡的權(quán)值和閾值.
Shadowing經(jīng)典信號傳播模型(距離-損耗公式)一般被用在復雜的室內(nèi)環(huán)境下來描述室內(nèi)無線信號的傳播特性,定義如下式所示[15]:
(7)
公式(7)中,通常取d0=1m,RSSI(d0)為距離信號發(fā)射地點1m處接收的信號強度平均值;n是信號傳輸損耗因數(shù),由所處的環(huán)境確定;RSSI是采集到的信號強度值;d為接收機到信號源的距離;Xσ被稱為陰影衰落,是一個均值為0,方差為σ的正態(tài)隨機變量.
由式(7)可知,在一定的環(huán)境下,RSSI和d之間滿足非線性的函數(shù)關系.雖然信號傳播會受到復雜環(huán)境的影響,但在整體上只是在函數(shù)曲線周圍產(chǎn)生一定的波動.人工智能理論中的Kolmogorov定理指出采用一個簡單的三層BP神經(jīng)網(wǎng)絡就可以實現(xiàn)對任意一個連續(xù)函數(shù)的擬合,結(jié)合第2節(jié)的分析可知,CQPSO-BP在數(shù)據(jù)擬合收斂性能上優(yōu)于BP網(wǎng)絡,因此可以采用CQPSO-BP網(wǎng)絡擬合的RSSI-d函數(shù)關系來構(gòu)建信號傳播模型.
本文在一個輸入層、一個輸出層、一個隱含層的三層BP神經(jīng)網(wǎng)絡的基礎上構(gòu)建三層CQPSO-BP神經(jīng)網(wǎng)絡.其中,接收端的信號強度值RSSI作為輸入值,信號傳輸距離d作為輸出值,隱含層選擇s型函數(shù)來實現(xiàn)RSSI與d的非線性函數(shù)關系的擬合.輸入層和輸出層的神經(jīng)元個數(shù)均為1,隱含層的節(jié)點數(shù)在綜合考慮神經(jīng)網(wǎng)絡的收斂性能基礎上最終選擇收斂最快時的隱含層節(jié)點個數(shù)10.在10×10×5米倉庫環(huán)境中,通過閱讀器對同一標簽在相鄰的不同時刻的信號強度進行多次采集,并將采集的信號的平均值作為該位置的數(shù)據(jù).然后分別采用CQPSO-BP神經(jīng)網(wǎng)絡與文獻[5]的BP神經(jīng)網(wǎng)絡以及文獻[6]的PSO-BP神經(jīng)網(wǎng)絡在相同的神經(jīng)網(wǎng)絡架構(gòu)下,利用這些實驗數(shù)據(jù)進行神經(jīng)網(wǎng)絡訓練和測試,構(gòu)建信號傳播模型,并對其性能進行對比分析.圖2描述了利用三種神經(jīng)網(wǎng)絡擬合的RSSI-d關系曲線,圖3是對CQPSO-BP和PSO-BP收斂速度的比較.
如圖2所示,為三種神經(jīng)網(wǎng)絡擬合的RSSI-d關系曲線,橫坐標為信號強度值,縱坐標為距離.從圖中可以看出,原始數(shù)據(jù)因受到環(huán)境因素的影響使得RSSI-d關系在對數(shù)函數(shù)關系上產(chǎn)生一定的波動,無法正確描述其關系.通過BP神經(jīng)網(wǎng)絡對原始數(shù)據(jù)進行擬合處理,可以看出,擬合后的曲線基本上能夠滿足對數(shù)函數(shù)關系,但因BP神經(jīng)網(wǎng)絡對初始值的敏感性,導致擬合的 曲線不穩(wěn)定.而通過PSO-BP神經(jīng)網(wǎng)絡得到的擬合曲線能夠滿足對數(shù)函數(shù)關系且具有很好的穩(wěn)定性,但是因為PSO算法容易陷入局部最優(yōu)解,因此在圖中兩端出現(xiàn)與真實數(shù)據(jù)偏差較大的情況.通過CQPSO-BP得到的擬合曲線能夠解決上述兩種神經(jīng)網(wǎng)絡出現(xiàn)的問題,能夠很好地描述RSSI和d之間的函數(shù)關系.
圖2 RSSI-d關系曲線圖Fig.2 RSSI-d relationship curve
圖3 收斂性分析圖Fig.3 Convergence analysis chart
圖3給出了三種優(yōu)化算法各自的收斂速度,橫坐標為迭代進行的次數(shù),縱坐標為粒子在此次迭代下相應的適應度值.將優(yōu)化算法迭代次數(shù)的最大值均設成50,圖中數(shù)據(jù)的變化顯示了各種優(yōu)化算法找到適應度值最小的粒子時已進行迭代的次數(shù).從圖中可以看出,PSO-BP網(wǎng)絡在迭代進行了11次時最先找到適應度最小的粒子,而CQPSO-BP網(wǎng)絡僅迭代了6次就達到相同的效果,同時CQPSO-BP網(wǎng)絡適應度最小值同PSO-BP網(wǎng)絡相比降低了0.02.因此驗證了2.2節(jié)中對CQPSO算法收斂效率的介紹,實現(xiàn)了比PSO更快的收斂速度,找到最優(yōu)值的次數(shù)更多,對BP網(wǎng)絡優(yōu)化效果更好.
對倉庫內(nèi)的物品進行有效的定位可以減輕倉庫工作人員的工作量以及提升倉庫物品的統(tǒng)計管理效率.因此研究適用于倉庫的室內(nèi)定位技術(shù)有很好的應用前景.RFID定位技術(shù)擁有無需接觸、非視距、體積較小、成本較少的優(yōu)勢,使得基于RFID技術(shù)的定位系統(tǒng)在實際應用中得到廣泛推廣.而通過參考標簽實現(xiàn)室內(nèi)定位的LANDMARC定位系統(tǒng)[16]是 一種經(jīng)典的基于RFID技術(shù)的室內(nèi)定位系統(tǒng).該定位系統(tǒng)首先根據(jù)實際定位環(huán)境的需要布置一定數(shù)目的位置已知的參考標簽;然后系統(tǒng)根據(jù)位置未知的目標標簽與參考標簽之間的接收信號強度值的差異判斷兩者之間的相對距離,并根據(jù)距離挑選出一定數(shù)目參考標簽作為鄰近參考標簽;最后根據(jù)鄰近參考標簽的坐標及其對應的權(quán)值通過殘差加權(quán)法計算出目標標簽的坐標估計值.
為了更適用于倉庫這類三維空間中進行定位,文獻[17]將測距機制與標準LANDMARC定位算法結(jié)合,將信號強度值通過測距原理轉(zhuǎn)化為距離,然后通過比較目標標簽與參考標簽和閱讀器距離的差異來估計目標標簽和參考標簽之間的距離遠近,進而遴選出一定數(shù)目的鄰近參考標簽,最終利用鄰近參考標簽進行定位.通過對LANDMARC定位系統(tǒng)原理分析可知,準確地計算標簽和閱讀器之間的距離是實現(xiàn)精確定位的關鍵,結(jié)合第3節(jié)的分析,我們可以利用CQPSO-BP神經(jīng)網(wǎng)絡建立倉庫內(nèi)無線信號傳播模型,然后通過采集到的RSSI值得到較準確的距離值,最后實現(xiàn)倉庫物品的準確定位.基于CQPSO-BP的LANDMARC定位算法通過偽碼的形式表述如下:
輸入:訓練樣本集T(輸入樣本為信號強度值,輸出樣本為閱讀器與標簽距離),參考標簽的信號強度值矩陣R;待測標簽的信號強度值矩陣S;
輸出:待測標簽的坐標.
begin
初始化閱讀器數(shù)目k;
初始化待測標簽總數(shù)P;
初始化鄰近參考標簽數(shù)目m;
初始化已定位的待測標簽數(shù)目n=0;
用訓練樣本集T訓練CQPSO-BP神經(jīng)網(wǎng)絡獲得RSSI-d的關系模型;
利用訓練好的CQPSO-BP神經(jīng)網(wǎng)絡,由每個參考標簽的信號強度值Rij獲得該參考標簽與每一個閱讀器的距離DRij;
while(n
begin
選取一個待測標簽,通過閱讀器接收到的該標簽的信號強度值Snj估計該標簽與該閱讀器的距離DLj;
計算待測標簽與每個參考標簽的相對距離:
選取相對較小的m個Ei值對應的參考標簽作為鄰近參考標簽;
計算所有鄰近參考標簽各自的權(quán)值:
由鄰近參考標簽權(quán)值及其坐標來獲得待測標簽位置的估計坐標:
將已定位的待測標簽數(shù)目n加1;
end
end
4.2.1 實驗環(huán)境設置
首先搭建一個模擬倉庫,其長、寬、高分別為10米、10米和5米,在倉庫中放置5排長為8米,寬為1米以及高為4米的貨架.然后在房間上方的4個頂角放置閱讀器,貨架上每隔一定距離貼上標簽并記錄其坐標,同時在貨物的正面粘貼具有其信息的標簽以便進行查找.最后在這些貨物中隨機挑選出20個分別采用3D-LANDMARC算法和基于CQPSO-BP的LANDMARC算法對其進行位置估計并分析各種算法的性能.并且把每個算法連續(xù)得到的20次估計坐標求均值后作為最終結(jié)果.
4.2.2 實驗結(jié)果分析
為了能夠定量地分析比較兩種算法的定位性能,本文將定位結(jié)果的估計誤差選作算法定位精度的衡量準則,定義如公式(8)所示:
(8)
圖4 位置估計誤差Fig.4 Location estimation error map
圖4給出了20個標簽通過不同算法得到的估計坐標與真實值之間的誤差,橫坐標是標簽編號,縱坐標是誤差值.從圖中可以看出,一般的LANDMARC定位算法由于受到環(huán)境因素的影響,RSSI-d難以保持嚴格對數(shù)函數(shù)關系,造成根據(jù)信號強度值判斷的距離值出現(xiàn)誤差,因而定位結(jié)果的誤差較大,且波動性大,誤差不穩(wěn)定.而基于CQPSO-BP的LANDMARC定位算法的定位結(jié)果誤差集中在0.4米~0.7米,定位更加準確且波動性小,因此基于CQPSO-BP的LANDMARC定位算法更適用于對倉庫內(nèi)物品的定位.
本文提出利用CQPSO-BP神經(jīng)網(wǎng)絡對RSSI值進行處理,建立了室內(nèi)無線信號傳播的路徑損耗模型,最后得到相應的距離值.在新的算法中將CQPSO算法和BP神經(jīng)網(wǎng)絡結(jié)合,即利用CQPSO算法在迭代尋優(yōu)方面的優(yōu)勢得到BP神經(jīng)網(wǎng)絡最優(yōu)的權(quán)值和閾值矩陣,然后將得到的權(quán)值和閾值賦給BP神經(jīng)網(wǎng)絡而形成的一種新算法.根據(jù)三種神經(jīng)網(wǎng)絡擬合的RSSI-d曲線的對比效果可以看出,CQPSO-BP神經(jīng)網(wǎng)絡能夠降低BP神經(jīng)網(wǎng)絡對初始值的依賴性,且較PSO-BP有更好的收斂性能.通過將CQPSO-BP神經(jīng)網(wǎng)絡建立的路徑損耗模型在RFID定位系統(tǒng)中進行實際應用的實例,可以看出,相較于標準的LANDMARC定位算法,基于CQPSO-BP的LANDMARC定位算法的定位結(jié)果的穩(wěn)定性更高且誤差更小.綜上所述,本文提出的算法是通過CQPSO算法對BP神經(jīng)網(wǎng)絡的一些參數(shù)進行迭代尋優(yōu)的方式進行優(yōu)化處理,雖然增加了BP神經(jīng)網(wǎng)絡操作步驟,但是提升了其收斂性能,因此該網(wǎng)絡整體的運行時間保持均衡,而且利用優(yōu)化后的BP神經(jīng)網(wǎng)絡建立的路徑損耗模型能夠很好地描述室內(nèi)無線信號的傳播特性,在提高室內(nèi)無線定位系統(tǒng)的定位精度方面有一定的借鑒意義.