陳強(qiáng)偉,趙建華,楊雪芹2,張珊珊
(1.西安工業(yè)大學(xué) 電子信息工程學(xué)院,西安 710021;2.西安郵電大學(xué) 通信與信息工程學(xué)院,西安 710121)
車(chē)載自組織網(wǎng)絡(luò)(Vehicle Ad-hoc Network,VANET)[1-2]是一種快速移動(dòng)的帶寬多跳無(wú)線網(wǎng)絡(luò),用于實(shí)現(xiàn)移動(dòng)過(guò)程中車(chē)輛與車(chē)輛之間的通信、車(chē)輛與路邊基礎(chǔ)設(shè)施之間的通信。VANET在網(wǎng)絡(luò)安全、移動(dòng)互聯(lián)網(wǎng)中扮演重要的角色。
VANET屬于無(wú)線網(wǎng)絡(luò)的范疇,有著復(fù)雜多變的環(huán)境和分布區(qū)域廣泛的拓?fù)浣Y(jié)構(gòu),而無(wú)線網(wǎng)絡(luò)中無(wú)線鏈路特性和無(wú)線信道特性將直接對(duì)上層協(xié)議的性能的執(zhí)行起到重要影響。在VANET網(wǎng)絡(luò)中,由于汽車(chē)的快速移動(dòng)變化、車(chē)輛相對(duì)速度的不同及路況條件的復(fù)雜、城市交通道路上建筑物的遮蔽等,使得在車(chē)輛與車(chē)輛之間進(jìn)行無(wú)線通信超出了通信范圍或信號(hào)被遮蔽,車(chē)輛間不能直接進(jìn)行信息交換。而且在城市環(huán)境下,車(chē)輛密度過(guò)大,這就導(dǎo)致節(jié)點(diǎn)對(duì)無(wú)線信道的頻繁競(jìng)爭(zhēng),從而使得實(shí)際帶寬低于理論值。此外,信道還存在多徑衰落、多普勒效應(yīng)遮蔽效應(yīng)等問(wèn)題,因此,誤碼率、丟包率[2]較高,從而導(dǎo)致無(wú)線鏈路質(zhì)量不佳,而且無(wú)線通信帶寬受到限制約束。因此,無(wú)線鏈路質(zhì)量的好壞可以根據(jù)鏈路丟包率的大小進(jìn)行評(píng)定。
本文提出一種新的基于貝葉斯估計(jì)的后驗(yàn)期望估計(jì)(Posterior Expectation Estimation,PEE)算法[3]研究鏈路丟包率,通過(guò)實(shí)驗(yàn)證明了所提算法的優(yōu)越性。
對(duì)于鏈路丟包率的實(shí)時(shí)估計(jì),不僅有利于在無(wú)線網(wǎng)絡(luò)鏈路中信息的傳遞,更決定了對(duì)上層傳輸控制協(xié)議應(yīng)用[4]的執(zhí)行。因此,對(duì)鏈路丟包率的估計(jì),選擇相應(yīng)的算法是非常重要的。
后驗(yàn)期望估計(jì),亦稱參數(shù)θ的后驗(yàn)期望估計(jì),其定義如下:
設(shè)γ是總體P中的未知參數(shù),γ∈Γ(參數(shù)空間),為了估計(jì)參數(shù)γ和預(yù)測(cè)總體P,可以從這個(gè)總體中抽取樣本P1,P2,…,Pn,p=(p1,p2,…,pn)為樣本觀察值,根據(jù)參數(shù)γ的先驗(yàn)信息選擇一個(gè)先驗(yàn)分布π(γ),再根據(jù)貝葉斯定理可以得到γ的后驗(yàn)分布π(γ|p),然后根據(jù)這個(gè)后驗(yàn)分布對(duì)參數(shù)γ進(jìn)行估計(jì)以及對(duì)總體P進(jìn)行預(yù)測(cè)。尋找一個(gè)統(tǒng)計(jì)量的觀察值,記作γ′(p),用γ′(p)去估計(jì)γ。
2.1.1PEE的損失和風(fēng)險(xiǎn)函數(shù)
對(duì)于PEE算法估計(jì)參數(shù)好壞也要考慮到標(biāo)準(zhǔn)問(wèn)題,從而尋找到最好的估計(jì),在估計(jì)的過(guò)程中會(huì)用到構(gòu)建損失函數(shù)以及風(fēng)險(xiǎn)函數(shù)[5]來(lái)描述。下面給出幾個(gè)定義:
在參數(shù)γ取值范圍Γ(參數(shù)空間)上,定義一個(gè)二元非負(fù)實(shí)函數(shù)L(γ,γ′),表示γ′去估計(jì)γ時(shí)γ′與γ的不同而引起的損失,通常這個(gè)損失是非負(fù)的,因此L(γ,γ′)≥0。
常見(jiàn)的損失函數(shù)有差值平方損失函數(shù)L(γ,γ′)=(γ-γ′)2和差值絕對(duì)值損失函數(shù)L(γ,γ′)=|γ-γ′|,在這里PEE的損失函數(shù)采用的是差值平方損失函數(shù)。
對(duì)于損失函數(shù)L(γ,γ′),用γ′(p)去估計(jì)γ時(shí),定義了一個(gè)用γ′(p)的概率與損失函數(shù)L(γ,γ′)的乘積之和,即是L(γ,γ′)的數(shù)學(xué)期望,用公式表示為
(1)
稱為γ′(p)相應(yīng)的風(fēng)險(xiǎn)函數(shù)。
對(duì)于PEE來(lái)說(shuō),它的相應(yīng)的風(fēng)險(xiǎn)函數(shù)為
Aγ′(p)(γ)=E[L(γ,γ′)]=E[(γ-γ′)2]=
(2)
對(duì)于好的估計(jì),相應(yīng)的風(fēng)險(xiǎn)函數(shù)應(yīng)盡量小。
下面介紹兩個(gè)定義:
定義1:如果γ*′(p)在估計(jì)類(lèi)M中,使得等式
(3)
成立,則稱γ*′(p)是M估計(jì)類(lèi)中的一致最小風(fēng)險(xiǎn)估計(jì)。
定義2:如果γ*′(p)使得
(4)
成立,則稱γ*′(p)是針對(duì)π(γ)的貝葉斯的解。
2.1.2原理介紹
由2.1.1節(jié)可知,PEE算法的參數(shù)估計(jì)γ就是后驗(yàn)期望E(γ|p),下面簡(jiǎn)單證明。因?yàn)閷?duì)于PEE算法其損失函數(shù)是L(γ,γ′)=(γ-γ′)2,類(lèi)比于相應(yīng)風(fēng)險(xiǎn)函數(shù),就有后驗(yàn)風(fēng)險(xiǎn)函數(shù)
(5)
式中:π(γ)是γ的先驗(yàn)分布函數(shù),f(p|γ)是樣本p對(duì)γ的條件密度函數(shù)。
當(dāng)PEE的后驗(yàn)風(fēng)險(xiǎn)函數(shù)最小時(shí),即γ*′(p)=E(γ|p)。
2.2.1最大似然估計(jì)
通常來(lái)說(shuō),在設(shè)定的參數(shù)γ為γ0時(shí),并且與數(shù)據(jù)P的模擬復(fù)合的程度就可以用數(shù)據(jù)P的條件概率p(p|γ=γ0)進(jìn)行計(jì)算,這個(gè)概率越大,γ0與數(shù)據(jù)P的模擬復(fù)合相似就越高。
對(duì)于已經(jīng)給定的γ,數(shù)據(jù)P的條件概率p(P|γ)稱γ的似然度或者叫做似然因子,記作L(γ|P)∝p(P|γ)。
2.2.2期望傳輸次數(shù)估計(jì)
期望傳輸次數(shù)(Expected Transmission count,EXT)估計(jì)算法是用來(lái)估計(jì)無(wú)線網(wǎng)絡(luò)鏈路丟包率的一種常用的估計(jì)算法,它通過(guò)發(fā)送大量的網(wǎng)絡(luò)探測(cè)包,用傳輸失敗的網(wǎng)絡(luò)探測(cè)包的數(shù)量比上總的發(fā)送網(wǎng)絡(luò)探測(cè)包的數(shù)量來(lái)獲得鏈路的丟包率。但是,用這種算法估計(jì)鏈路丟包率需要發(fā)送大量的網(wǎng)絡(luò)探測(cè)包才能保證檢測(cè)出真實(shí)的無(wú)線鏈路質(zhì)量的好壞,EXT的值越小,無(wú)線鏈路質(zhì)量越好。
在VANET網(wǎng)絡(luò)中,某條鏈路l從發(fā)送端A以每秒恒定數(shù)量發(fā)送探測(cè)包,通過(guò)無(wú)線管道鏈路向接收端B發(fā)送,在時(shí)間間隔ΔT內(nèi),發(fā)送端A發(fā)送Mi個(gè)探測(cè)包,接收端B接受mi個(gè)探測(cè)包,則
(6)
利用VANET的實(shí)際條件進(jìn)行了相應(yīng)的模擬測(cè)試,并獲得了相關(guān)的丟包率的概率密度分布(Probability Density Function,PDF)曲線,如圖1所示。
(a)節(jié)點(diǎn)距離0~15 m
(b)節(jié)點(diǎn)距離30~40 m圖1 節(jié)點(diǎn)距離的丟包PDFFig.1 Packet lost PDF with node distance
從這些數(shù)據(jù)可得到,當(dāng)節(jié)點(diǎn)距離在0~15 m時(shí),丟包率處在0~0.07之內(nèi),集中在0.02左右;當(dāng)節(jié)點(diǎn)距離在30~40 m內(nèi)時(shí),丟包率處在0~0.2內(nèi),最高可到達(dá)17%的丟包結(jié)果。分析可知,車(chē)輛間的距離對(duì)VANET的鏈路丟包率的影響十分顯著。
由3.1節(jié)知,大數(shù)據(jù)統(tǒng)計(jì)的結(jié)果反映了樣本信息p和先驗(yàn)概率分布π(γ)和條件概率分布PDF(p|γ),因此函數(shù)模型優(yōu)化可以根據(jù)貝葉斯統(tǒng)計(jì)方法進(jìn)行,樣本的全部目的是完成由先驗(yàn)概率與條件概率分布到后驗(yàn)概率分布的轉(zhuǎn)換,從而完成對(duì)鏈路丟包率估計(jì)與預(yù)測(cè)的認(rèn)識(shí)的改變,這個(gè)過(guò)程可以用圖2表示。
圖2 PEE算法的整體流程圖Fig.2 Overall flow chart of PEE algorithm
流程可描述如下:
(1)將未知參數(shù)看成隨機(jī)變量(或者隨機(jī)向量),記為γ。于是當(dāng)γ已知時(shí),樣本p1,p2,…,pk的聯(lián)合分布密度p(p1,p2,…,pk,γ)就看成是p1,p2,…,pk對(duì)γ的條件密度,記為p(p|γ)。
(2)用π(γ)表示π(γ)的先驗(yàn)分布,一般根據(jù)以往對(duì)參數(shù)知識(shí)γ來(lái)確定先驗(yàn)分布(經(jīng)常用于表示先驗(yàn)知識(shí)),在這里,鏈路丟包的先驗(yàn)概率服從高斯分布,記作π(γ)~N(μ0,σ0)。
(3)利用先驗(yàn)分布π(γ)和條件分布密度p(p|γ),可以求出p1,p2,…,pk與γ的聯(lián)合分布以及樣本數(shù)據(jù)p1,p2,…,pk的分布,于是就可以利用兩者求得γ對(duì)p1,p2,…,pk的條件分布密度,也就是利用貝葉斯公式求得后驗(yàn)分布密度p(γ|p)的過(guò)程。
(4)由后驗(yàn)概率密度p(γ|p),結(jié)合PEE算法,得到貝葉斯解γ*(p)=E(γ|p)。
鏈路丟包率的實(shí)時(shí)預(yù)測(cè)對(duì)VANET網(wǎng)絡(luò)中的通信質(zhì)量和通信信息的傳遞起著非常重要的作用。在預(yù)測(cè)到該通信鏈路的丟包率超過(guò)正常通信所允許的丟包率時(shí),就需要選擇其他鏈路通信或改變?cè)械耐ㄐ怕酚蓞f(xié)議,讓其丟包率符合正常的通信范疇,這樣,整個(gè)VANET網(wǎng)絡(luò)中的通信過(guò)程穩(wěn)定性和健壯性就得到了保證。
由3.2節(jié)知,以其鏈路丟包率的模型優(yōu)化為基礎(chǔ)、以其動(dòng)態(tài)的模型為研究對(duì)象的時(shí)間序列的預(yù)測(cè)方法,可以稱作貝葉斯預(yù)測(cè)。貝葉斯預(yù)測(cè)不僅僅使用了模型信息及樣本信息,還用了先驗(yàn)概率的分布信息,這也是不同于非貝葉斯預(yù)測(cè)的標(biāo)志。
在預(yù)測(cè)過(guò)程中,對(duì)于總體分布的位置參數(shù)預(yù)先設(shè)定一個(gè)先驗(yàn)概率分布,這個(gè)概率分布可以根據(jù)以前的數(shù)據(jù)、經(jīng)驗(yàn)給出,也可以完全根據(jù)決策者的主觀意識(shí)給出。這樣將先驗(yàn)概率分布、總體分布通過(guò)貝葉斯公式得到后驗(yàn)概率分布,最后通過(guò)后驗(yàn)概率分布對(duì)鏈路丟包率目標(biāo)進(jìn)行預(yù)測(cè),其預(yù)測(cè)過(guò)程如圖3所示。
圖3 目標(biāo)數(shù)據(jù)的預(yù)測(cè)流程圖Fig.3 Flow chart of forecasting the target data
由3.1節(jié)知,根據(jù)大數(shù)據(jù)收集到的鏈路丟包率的結(jié)果數(shù)據(jù),可繪制出鏈路丟包率PDF圖像直方圖,進(jìn)行數(shù)據(jù)的整理。在這里,數(shù)據(jù)與高斯模型進(jìn)行疊加混合(Gaussian Mixture Model,GMM),形成了如圖4所示的曲線。因此,鏈路丟包率的PDF服從于高斯分布,記作p~N(γ),其中γ=(μ,σ)。
(a)距離0~15 m
(b)距離30~40 m圖4 GMM曲線Fig.4 GMM curve
這里給出幾個(gè)判別比較定義[7-8]:
(1)Predict-Original(PO),即預(yù)測(cè)數(shù)據(jù)和原始數(shù)據(jù)的誤差平方和:
式中:Pk是預(yù)測(cè)數(shù)據(jù),Ok是原始數(shù)據(jù)。
(2)Predict-Value(PV),即預(yù)測(cè)數(shù)據(jù)與原始數(shù)據(jù)均值之差的平方和:
(3)Original-Value(OV),即原始數(shù)據(jù)與原始均值的平方和:
(4)Predict-Proportion(PP),即預(yù)測(cè)程度系數(shù),越接近1,說(shuō)明預(yù)測(cè)數(shù)據(jù)與原始數(shù)據(jù)越接近。
通過(guò)對(duì)圖5和圖6進(jìn)行數(shù)據(jù)分析,整合得到表1。
圖5 距離0~15 m的PEE預(yù)測(cè)圖像Fig.5 PEE prediction with 0~15 m distance
圖6 距離0~15 m的算法預(yù)測(cè)比較Fig.6 Algorithm prediction comparison with 0~15 m distance
算法POPVOVPPEXT0.007 30.013 10.005 70.438 2MLE0.004 60.013 70.009 10.664 7PEE0.000 60.013 50.012 90.955 6
處理表1中的結(jié)果值可得到更直觀的分布直方圖,如圖7所示。
圖7 距離0~15 m算法數(shù)據(jù)比較圖Fig.7 Histogram for algorithm data comparison with 0~15 m distance
根據(jù)表1生成的圖7更加直觀地顯示出特征結(jié)果,能得到PO的值,PEE算法好于MLE,優(yōu)于EXT算法預(yù)測(cè)得到的丟包率。PEE算法的PP值更接近于1,說(shuō)明預(yù)測(cè)的效果與真實(shí)值丟包率接近。在圖6中,PEE算法的預(yù)測(cè)丟包率的數(shù)據(jù)誤差曲線的波動(dòng)小于MLE算法的預(yù)測(cè)丟包率的數(shù)據(jù)誤差曲線波動(dòng),遠(yuǎn)小于EXT算法的預(yù)測(cè)丟包率誤差曲線的波動(dòng),這正好反映了預(yù)測(cè)程度系數(shù)值。
對(duì)圖8、圖9的數(shù)據(jù)進(jìn)行整理,得到如表2所示的3種算法預(yù)測(cè)鏈路丟包率。
圖8 距離30~40 m的PEE預(yù)測(cè)圖像Fig.8 PEE prediction image with 30~40 m distance
圖9 距離30~40 m算法預(yù)測(cè)比較Fig.9 Algorithm prediction comparison with 30~40 m distance
算法POPVOVPPEXT0.043 50.104 10.065 60.581 9MLE0.019 90.103 90.084 10.808 4PEE0.004 30.104 10.108 60.958 7
處理表2中的結(jié)果值可得到分布直方圖,如圖10所示。
圖10 距離30~40 m算法數(shù)據(jù)比較圖Fig.10 Histogram for algorithm data comparisonwith 30~40 m distance
通過(guò)數(shù)據(jù)的比較可知,PEE算法得到的PO值小于MLE算法得到的PO值,也小于EXT算法得到的PO值;而對(duì)于預(yù)測(cè)程度系數(shù)來(lái)說(shuō),PEE算法得到的PP值大于MLE算法得到的PP值,也大于EXT得到的PP值,而且PEE算法得到的PP值趨近于1。在圖9中,PEE算法的預(yù)測(cè)丟包率誤差曲線波動(dòng)小于MLE算法的,遠(yuǎn)小于EXT算法的,故可以得到在距離為30~40 m時(shí)PEE算法的優(yōu)越性最好。
由圖5和圖8可知,在距離0~15 m通信范圍,預(yù)測(cè)丟包率平均在0.025左右,最高不超過(guò)0.05;而在距離30~40 m通信范圍內(nèi),預(yù)測(cè)丟包率平均在0.08左右,遠(yuǎn)大于0.025。這也就說(shuō)明了在實(shí)際的通信過(guò)程中丟包率和距離有關(guān),距離越大,丟包率越大,相應(yīng)的無(wú)線鏈路的質(zhì)量就差。
對(duì)于VANET中無(wú)線鏈路質(zhì)量的好壞,其最為關(guān)鍵的一項(xiàng)就是鏈路丟包率的大小。由圖表數(shù)據(jù)分析知,車(chē)輛之間的距離對(duì)無(wú)線鏈路丟包率的影響較大,間接影響了無(wú)線鏈路的質(zhì)量,造成了VANET網(wǎng)絡(luò)通信非常嚴(yán)重的信息傳輸丟失的問(wèn)題。
雖然通過(guò)PEE算法可以快速準(zhǔn)確地估計(jì)預(yù)測(cè)鏈路丟包率,但本文所選用的是非常理想的場(chǎng)景條件,對(duì)于復(fù)雜多變的實(shí)際道路場(chǎng)景,此算法還要進(jìn)行深入探索,考慮更多的影響因素,這樣,研究成果才能發(fā)揮最大效能。