程文靜 臧麗萍
摘要:當(dāng)今無線傳感器網(wǎng)絡(luò)被應(yīng)用到許多領(lǐng)域。在這些網(wǎng)絡(luò)的運(yùn)行過程中中會(huì)產(chǎn)生大量的數(shù)據(jù),因此如何有效地管理數(shù)據(jù)以提高網(wǎng)絡(luò)性能就成了關(guān)鍵問題。一種方法是使用集中存儲(chǔ)的數(shù)據(jù)倉庫方法,每一個(gè)傳感器節(jié)點(diǎn)把它的采樣數(shù)據(jù)發(fā)送至數(shù)據(jù)倉庫,再進(jìn)行處理;另一種方法使用了網(wǎng)內(nèi)聚合技術(shù),數(shù)據(jù)處理過程被移至網(wǎng)內(nèi)。該文用一個(gè)應(yīng)用實(shí)例比較了兩種方法的效率,并指出了網(wǎng)內(nèi)聚合方法的優(yōu)點(diǎn)。
關(guān)鍵詞:無線傳感器網(wǎng)絡(luò);數(shù)據(jù)處理;數(shù)據(jù)倉庫;網(wǎng)內(nèi)聚合
中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2014)16-3737-02
當(dāng)今傳感器網(wǎng)絡(luò)被越來越多的應(yīng)用到了環(huán)境監(jiān)測(cè)及目標(biāo)追蹤等領(lǐng)域。它們通常由大量低能量,低能耗,計(jì)算存儲(chǔ)能力及帶寬受限的傳感器節(jié)點(diǎn)組成,這些限制使得傳統(tǒng)的數(shù)據(jù)庫管理技術(shù)無法直接應(yīng)用于傳感器網(wǎng)絡(luò)[1]。因此設(shè)計(jì)出高效率低耗能的數(shù)據(jù)管理技術(shù)成為傳感器網(wǎng)絡(luò)應(yīng)用中的關(guān)鍵問題。在設(shè)計(jì)傳感網(wǎng)絡(luò)數(shù)據(jù)庫時(shí)需要考慮以下問題:如何存儲(chǔ)數(shù)據(jù),如何建立查詢,如何設(shè)置網(wǎng)絡(luò)通信。從網(wǎng)絡(luò)結(jié)構(gòu)而言,主要有兩種方法:集中式的數(shù)據(jù)倉庫方法和分布式的網(wǎng)內(nèi)聚合方法。在第一種方法中,所有的傳感器把它們的數(shù)據(jù)通過多跳技術(shù)傳送至根節(jié)點(diǎn)(數(shù)據(jù)倉庫),數(shù)據(jù)的存儲(chǔ)和查詢都在根節(jié)點(diǎn)進(jìn)行;在第二種方法中,數(shù)據(jù)被分布的存儲(chǔ)在網(wǎng)內(nèi),并作出一定的壓縮處理。當(dāng)查詢命令涉及到本地存儲(chǔ)數(shù)據(jù)時(shí),節(jié)點(diǎn)才發(fā)送數(shù)據(jù)。這樣就降低了網(wǎng)內(nèi)的通信成本。接下來通過一個(gè)具體的應(yīng)用實(shí)例對(duì)這兩種方法的效率作出比較。
1 應(yīng)用實(shí)例
1.1 應(yīng)用場(chǎng)景
本實(shí)驗(yàn)以如下場(chǎng)景為例,對(duì)傳感器網(wǎng)絡(luò)查詢處理中的集中式和分布式體系結(jié)構(gòu)[2]的工作效率進(jìn)行比較。假設(shè)在一棟建筑里使用監(jiān)控設(shè)備來監(jiān)測(cè)并調(diào)整整棟大樓內(nèi)的溫度,以此來使得各個(gè)房間的溫度平衡且讓人感到最舒適。建筑有若干層,以其中一層為例。如圖1所示,該樓有十五個(gè)房間,包括右邊一個(gè)大會(huì)議室和中間的大廳。每個(gè)房間有五個(gè)溫度傳感器節(jié)點(diǎn),分別設(shè)置在房間的四個(gè)角落和中心。因此,整層中部署的傳感器總數(shù)為70個(gè),它們之間以多跳網(wǎng)絡(luò)的樹結(jié)構(gòu)連接在一起。
在每個(gè)房間中,四個(gè)角落的節(jié)點(diǎn)發(fā)送數(shù)據(jù)至房間中央的節(jié)點(diǎn)。每一個(gè)中央節(jié)點(diǎn)將接收到的數(shù)據(jù)和自己的數(shù)據(jù)一起發(fā)送到到它的父節(jié)點(diǎn),以此類推,直至最終數(shù)據(jù)到達(dá)服務(wù)器。在圖1中,彩色線條表示了樹中層次之間的連接。服務(wù)器被視為根節(jié)點(diǎn),樹結(jié)構(gòu)共分為五層,自上而下分別由黑色,綠色,藍(lán)色,黃色和紅色線條表示。當(dāng)然,節(jié)點(diǎn)之間的連接也可采用其他結(jié)構(gòu),但結(jié)構(gòu)上的微小變化并不影響對(duì)兩種查詢處理方法比較的一般結(jié)果。
1.2 集中式數(shù)據(jù)處理方法
在這種方法中,數(shù)據(jù)倉庫在服務(wù)器端更新,因此所有的傳感器將以恒定的速率產(chǎn)生并傳送數(shù)據(jù)樣本。采樣率不需要設(shè)置很高,因?yàn)樵诮ㄖ飪?nèi)部的溫度變化并不頻繁。假設(shè)數(shù)據(jù)倉庫每60秒更新一次。接下來計(jì)算在每個(gè)時(shí)間間隔內(nèi)通過網(wǎng)絡(luò)傳送的數(shù)據(jù)包數(shù)量。在第5級(jí),有16個(gè)角落節(jié)點(diǎn),它們分布在右邊的四個(gè)房間,同各自的父節(jié)點(diǎn)的連接用紅色線條表示。每個(gè)節(jié)點(diǎn)到服務(wù)器有5跳的距離。因此,由5級(jí)節(jié)點(diǎn)發(fā)送到達(dá)服務(wù)器的數(shù)據(jù)包總數(shù)為80。4級(jí)節(jié)點(diǎn)共有36個(gè),它們與各自父節(jié)點(diǎn)的連接用黃色線條表示,與服務(wù)器的距離為4跳,傳輸過程中共產(chǎn)生144個(gè)數(shù)據(jù)包。以此類推,所有節(jié)點(diǎn)發(fā)送到數(shù)據(jù)倉庫的數(shù)據(jù)包總數(shù)可以用下面的式子計(jì)算:
16×5+36×4+18×3+4×2+1=287
值得注意的是,在此場(chǎng)景中,只應(yīng)用了一種類型的傳感器。而在現(xiàn)實(shí)中,傳感器節(jié)點(diǎn)通常配備一兩以上類型的傳感器。比如,在一棟大樓中,通常還需要設(shè)置光和聲音的傳感器來輔助監(jiān)控設(shè)備控制房間里的燈被打開或者關(guān)閉,或識(shí)別某個(gè)房間是否有人。如果這些不同類型的傳感器采用不同的采樣和傳輸頻率,那么在每個(gè)周期內(nèi)(如1分鐘)傳送的數(shù)據(jù)包總數(shù)可能是上述結(jié)果兩至三倍。顯然,這導(dǎo)致了嚴(yán)重的資源浪費(fèi),因?yàn)楸O(jiān)控器只需要獲取超出正常范圍的測(cè)試結(jié)果,如某個(gè)超過了用戶自定義閾值的溫度值或者某個(gè)非常微弱的光強(qiáng)度信號(hào)。因此,所有其他的傳感器數(shù)據(jù)就是冗余的,沒必要對(duì)它們進(jìn)行精確傳輸。
1.3 分布式網(wǎng)內(nèi)聚合方法
網(wǎng)內(nèi)聚合方法可以顯著降低無線傳感器網(wǎng)絡(luò)的通信成本。在此使用Cougar系統(tǒng)[2]中的網(wǎng)內(nèi)聚合方法及查詢語法來討論本例。文獻(xiàn)[2]中具體介紹了查詢語言。以下列舉了三個(gè)查詢語句。
查詢1:SELECT AVG (temp) FROM sensors GROUP BY room EVERY 60s
查詢2:SELECT temp FROM sensors WHERE temp< c1 OR temp> c2 EVERY 60s
查詢3:SELECT AVG (temp) FROM sensor GROUP BY room HAVING AVG (temp)>T1 OR AVG (temp) 第一條語句執(zhí)行了操作“每60秒鐘獲取一次每個(gè)房間的平均溫度”。在每個(gè)房間中,每個(gè)角落節(jié)點(diǎn)發(fā)送數(shù)據(jù)包到中心節(jié)點(diǎn)。共有15個(gè)房間,因此一共生成60個(gè)數(shù)據(jù)包。下一步,中心節(jié)點(diǎn)計(jì)算四個(gè)子節(jié)點(diǎn)和本身節(jié)點(diǎn)數(shù)據(jù)的平均值,并產(chǎn)生一個(gè)結(jié)果數(shù)據(jù)包繼續(xù)向上傳輸。在接下來的路徑中,每個(gè)節(jié)點(diǎn)只向上一層轉(zhuǎn)發(fā)數(shù)據(jù)包,這個(gè)過程與前面討論的中央式處理方法一致。在第四層有4個(gè)節(jié)點(diǎn),第三層有8個(gè)節(jié)點(diǎn),第二層有2個(gè)節(jié)點(diǎn),第一層有1個(gè)節(jié)點(diǎn)。因此,整個(gè)查詢過程中產(chǎn)生的數(shù)據(jù)包總數(shù)通過下面的式子進(jìn)行計(jì)算: 60+4×4+8×3+2×2+1=105 第二個(gè)查詢加入了界值要求。只有當(dāng)溫度值小于c1或大于c2才返回查詢結(jié)果數(shù)據(jù)包。在其他情況下,采樣的數(shù)據(jù)將被忽略。這樣的操作既滿足了用戶需求,即根據(jù)溫度界限值調(diào)整中央空調(diào),同時(shí)也減少了不必要的數(shù)據(jù)傳輸。由于在不同的情況下,很難準(zhǔn)確地預(yù)測(cè)超出閾值數(shù)據(jù)的出現(xiàn)頻率,因此假定每二十個(gè)采樣數(shù)據(jù)中有一個(gè)超出閾值。在這種情況下,傳輸?shù)臄?shù)據(jù)包的平均數(shù)目減少到大約14(287 / 20)個(gè)。
第三個(gè)查詢是第一個(gè)查詢的擴(kuò)展,在其中加入了條件限制。它執(zhí)行了操作“每60秒鐘返回一次平均溫度大于T1或者小于T2的房間的平均溫度”。在此同樣也很難預(yù)測(cè)丟棄的數(shù)據(jù)包百分比,因此進(jìn)行一個(gè)近似計(jì)算。在每個(gè)房間里至少有一個(gè)傳感器將通過中心傳感器來計(jì)算平均溫度,每一個(gè)中心傳感器將傳遞一個(gè)包含的結(jié)果的數(shù)據(jù)包至服務(wù)器。因此,一個(gè)角落節(jié)點(diǎn)傳輸數(shù)據(jù)的概率是5%,而一個(gè)中心節(jié)點(diǎn)傳輸數(shù)據(jù)的概率為25%。數(shù)據(jù)包總數(shù)計(jì)算如下:
60×5%+5×5%×(4×4+8×3+2×2+1)≈14
2 結(jié)論
通過比較這兩種方法的計(jì)算結(jié)果,可以發(fā)現(xiàn)在兩種情況下數(shù)據(jù)傳輸量相差巨大。在第一個(gè)查詢中,通過計(jì)算房間溫度的平均值部分減少了63%的數(shù)據(jù)包數(shù)量。如果通過加入一系列條件把查詢進(jìn)一步擴(kuò)展,如上述的第二和第三個(gè)查詢,95%的數(shù)據(jù)采樣可以被忽略,只有一小部分的數(shù)據(jù)包需要傳輸。這兩個(gè)查詢沒有太大差別,只是在計(jì)算方式上有所不同。由此可以明顯看出,如果使用適當(dāng)?shù)木W(wǎng)內(nèi)聚合方法執(zhí)行查詢,通信的成本會(huì)顯著降低。由于節(jié)點(diǎn)本地計(jì)算消耗的能量要遠(yuǎn)遠(yuǎn)低于通信耗能,因此網(wǎng)內(nèi)數(shù)據(jù)聚合技術(shù)在無線傳感器網(wǎng)絡(luò)中具有明顯的優(yōu)勢(shì)[4]。目前的研究主要集中在分布式體系結(jié)構(gòu),因?yàn)樗`活,消耗的資源比集中式少得多。然而,雖然集中式方法有許多缺點(diǎn),它仍然是適用于具有某些特點(diǎn)的無線傳感器網(wǎng)絡(luò)的,比如規(guī)模相對(duì)較小,采樣頻率非常低但查詢操作比較頻繁的網(wǎng)絡(luò)。在這種網(wǎng)絡(luò)中,分布式處理方式反而會(huì)產(chǎn)生較高的通信成本,因?yàn)轭l繁的查詢命令傳播和數(shù)據(jù)收集會(huì)比直接把數(shù)據(jù)傳送到數(shù)據(jù)倉庫進(jìn)行離線查詢與分析產(chǎn)生更多的通信數(shù)據(jù)。此外,數(shù)據(jù)倉庫的方法非常適合于回答預(yù)定義查詢的歷史數(shù)據(jù)。總體而言,網(wǎng)內(nèi)聚合技術(shù)是無線傳感器網(wǎng)絡(luò)中最重要的優(yōu)化技術(shù),是節(jié)約能源的一種有效方法。
參考文獻(xiàn):
[1] 李建中,高宏.無線傳感器網(wǎng)絡(luò)的研究進(jìn)展[J].計(jì)算機(jī)研究與發(fā)展,2008(45):1-15.
[2] Yao Y,Gehrke J.The Cougar approach to in-network query processing in sensor networks[J].SIGMOD Record 31(3), 2002(9):15-31.
[3] UCB.The Berkeley Wireless Research Center(BWRC).http://bwrc.eecs.berkeley.edu/,[ 2010-09-05].
[4] Akyildiz I F, Su W, Sankarasubramaniam Y.A survey on sensor networks[J].IEEE Communications Magazine ,2002(8):102-114.
[5] CSIRO.Fleck Platform Project.http://www.sensornets.csiro.au/fleck/html/, [2010-04-07].
[6] Sensor data handling, databases and query processing. http://74.125.155.132/scholar?q=cache:fzNnx84HnYwJ:scholar.google.com/&hl=de&as_sdt=2000, [2010-11-18].endprint
第三個(gè)查詢是第一個(gè)查詢的擴(kuò)展,在其中加入了條件限制。它執(zhí)行了操作“每60秒鐘返回一次平均溫度大于T1或者小于T2的房間的平均溫度”。在此同樣也很難預(yù)測(cè)丟棄的數(shù)據(jù)包百分比,因此進(jìn)行一個(gè)近似計(jì)算。在每個(gè)房間里至少有一個(gè)傳感器將通過中心傳感器來計(jì)算平均溫度,每一個(gè)中心傳感器將傳遞一個(gè)包含的結(jié)果的數(shù)據(jù)包至服務(wù)器。因此,一個(gè)角落節(jié)點(diǎn)傳輸數(shù)據(jù)的概率是5%,而一個(gè)中心節(jié)點(diǎn)傳輸數(shù)據(jù)的概率為25%。數(shù)據(jù)包總數(shù)計(jì)算如下:
60×5%+5×5%×(4×4+8×3+2×2+1)≈14
2 結(jié)論
通過比較這兩種方法的計(jì)算結(jié)果,可以發(fā)現(xiàn)在兩種情況下數(shù)據(jù)傳輸量相差巨大。在第一個(gè)查詢中,通過計(jì)算房間溫度的平均值部分減少了63%的數(shù)據(jù)包數(shù)量。如果通過加入一系列條件把查詢進(jìn)一步擴(kuò)展,如上述的第二和第三個(gè)查詢,95%的數(shù)據(jù)采樣可以被忽略,只有一小部分的數(shù)據(jù)包需要傳輸。這兩個(gè)查詢沒有太大差別,只是在計(jì)算方式上有所不同。由此可以明顯看出,如果使用適當(dāng)?shù)木W(wǎng)內(nèi)聚合方法執(zhí)行查詢,通信的成本會(huì)顯著降低。由于節(jié)點(diǎn)本地計(jì)算消耗的能量要遠(yuǎn)遠(yuǎn)低于通信耗能,因此網(wǎng)內(nèi)數(shù)據(jù)聚合技術(shù)在無線傳感器網(wǎng)絡(luò)中具有明顯的優(yōu)勢(shì)[4]。目前的研究主要集中在分布式體系結(jié)構(gòu),因?yàn)樗`活,消耗的資源比集中式少得多。然而,雖然集中式方法有許多缺點(diǎn),它仍然是適用于具有某些特點(diǎn)的無線傳感器網(wǎng)絡(luò)的,比如規(guī)模相對(duì)較小,采樣頻率非常低但查詢操作比較頻繁的網(wǎng)絡(luò)。在這種網(wǎng)絡(luò)中,分布式處理方式反而會(huì)產(chǎn)生較高的通信成本,因?yàn)轭l繁的查詢命令傳播和數(shù)據(jù)收集會(huì)比直接把數(shù)據(jù)傳送到數(shù)據(jù)倉庫進(jìn)行離線查詢與分析產(chǎn)生更多的通信數(shù)據(jù)。此外,數(shù)據(jù)倉庫的方法非常適合于回答預(yù)定義查詢的歷史數(shù)據(jù)??傮w而言,網(wǎng)內(nèi)聚合技術(shù)是無線傳感器網(wǎng)絡(luò)中最重要的優(yōu)化技術(shù),是節(jié)約能源的一種有效方法。
參考文獻(xiàn):
[1] 李建中,高宏.無線傳感器網(wǎng)絡(luò)的研究進(jìn)展[J].計(jì)算機(jī)研究與發(fā)展,2008(45):1-15.
[2] Yao Y,Gehrke J.The Cougar approach to in-network query processing in sensor networks[J].SIGMOD Record 31(3), 2002(9):15-31.
[3] UCB.The Berkeley Wireless Research Center(BWRC).http://bwrc.eecs.berkeley.edu/,[ 2010-09-05].
[4] Akyildiz I F, Su W, Sankarasubramaniam Y.A survey on sensor networks[J].IEEE Communications Magazine ,2002(8):102-114.
[5] CSIRO.Fleck Platform Project.http://www.sensornets.csiro.au/fleck/html/, [2010-04-07].
[6] Sensor data handling, databases and query processing. http://74.125.155.132/scholar?q=cache:fzNnx84HnYwJ:scholar.google.com/&hl=de&as_sdt=2000, [2010-11-18].endprint
第三個(gè)查詢是第一個(gè)查詢的擴(kuò)展,在其中加入了條件限制。它執(zhí)行了操作“每60秒鐘返回一次平均溫度大于T1或者小于T2的房間的平均溫度”。在此同樣也很難預(yù)測(cè)丟棄的數(shù)據(jù)包百分比,因此進(jìn)行一個(gè)近似計(jì)算。在每個(gè)房間里至少有一個(gè)傳感器將通過中心傳感器來計(jì)算平均溫度,每一個(gè)中心傳感器將傳遞一個(gè)包含的結(jié)果的數(shù)據(jù)包至服務(wù)器。因此,一個(gè)角落節(jié)點(diǎn)傳輸數(shù)據(jù)的概率是5%,而一個(gè)中心節(jié)點(diǎn)傳輸數(shù)據(jù)的概率為25%。數(shù)據(jù)包總數(shù)計(jì)算如下:
60×5%+5×5%×(4×4+8×3+2×2+1)≈14
2 結(jié)論
通過比較這兩種方法的計(jì)算結(jié)果,可以發(fā)現(xiàn)在兩種情況下數(shù)據(jù)傳輸量相差巨大。在第一個(gè)查詢中,通過計(jì)算房間溫度的平均值部分減少了63%的數(shù)據(jù)包數(shù)量。如果通過加入一系列條件把查詢進(jìn)一步擴(kuò)展,如上述的第二和第三個(gè)查詢,95%的數(shù)據(jù)采樣可以被忽略,只有一小部分的數(shù)據(jù)包需要傳輸。這兩個(gè)查詢沒有太大差別,只是在計(jì)算方式上有所不同。由此可以明顯看出,如果使用適當(dāng)?shù)木W(wǎng)內(nèi)聚合方法執(zhí)行查詢,通信的成本會(huì)顯著降低。由于節(jié)點(diǎn)本地計(jì)算消耗的能量要遠(yuǎn)遠(yuǎn)低于通信耗能,因此網(wǎng)內(nèi)數(shù)據(jù)聚合技術(shù)在無線傳感器網(wǎng)絡(luò)中具有明顯的優(yōu)勢(shì)[4]。目前的研究主要集中在分布式體系結(jié)構(gòu),因?yàn)樗`活,消耗的資源比集中式少得多。然而,雖然集中式方法有許多缺點(diǎn),它仍然是適用于具有某些特點(diǎn)的無線傳感器網(wǎng)絡(luò)的,比如規(guī)模相對(duì)較小,采樣頻率非常低但查詢操作比較頻繁的網(wǎng)絡(luò)。在這種網(wǎng)絡(luò)中,分布式處理方式反而會(huì)產(chǎn)生較高的通信成本,因?yàn)轭l繁的查詢命令傳播和數(shù)據(jù)收集會(huì)比直接把數(shù)據(jù)傳送到數(shù)據(jù)倉庫進(jìn)行離線查詢與分析產(chǎn)生更多的通信數(shù)據(jù)。此外,數(shù)據(jù)倉庫的方法非常適合于回答預(yù)定義查詢的歷史數(shù)據(jù)。總體而言,網(wǎng)內(nèi)聚合技術(shù)是無線傳感器網(wǎng)絡(luò)中最重要的優(yōu)化技術(shù),是節(jié)約能源的一種有效方法。
參考文獻(xiàn):
[1] 李建中,高宏.無線傳感器網(wǎng)絡(luò)的研究進(jìn)展[J].計(jì)算機(jī)研究與發(fā)展,2008(45):1-15.
[2] Yao Y,Gehrke J.The Cougar approach to in-network query processing in sensor networks[J].SIGMOD Record 31(3), 2002(9):15-31.
[3] UCB.The Berkeley Wireless Research Center(BWRC).http://bwrc.eecs.berkeley.edu/,[ 2010-09-05].
[4] Akyildiz I F, Su W, Sankarasubramaniam Y.A survey on sensor networks[J].IEEE Communications Magazine ,2002(8):102-114.
[5] CSIRO.Fleck Platform Project.http://www.sensornets.csiro.au/fleck/html/, [2010-04-07].
[6] Sensor data handling, databases and query processing. http://74.125.155.132/scholar?q=cache:fzNnx84HnYwJ:scholar.google.com/&hl=de&as_sdt=2000, [2010-11-18].endprint