1.吳桂軍 2.曹 爽
1.重慶工程職業(yè)技術(shù)學(xué)院 2.重慶市民族職業(yè)中學(xué)
物聯(lián)網(wǎng)技術(shù)的發(fā)展有效滿足了現(xiàn)代社會(huì)的要求,但是在實(shí)際上,我國(guó)的物聯(lián)網(wǎng)發(fā)展水平依然處在一個(gè)相對(duì)較低的水平,其智能化、信息化程度較低,尤其是海量異構(gòu)數(shù)據(jù)的管理,其數(shù)據(jù)存儲(chǔ)與數(shù)據(jù)共享都難以滿足現(xiàn)代社會(huì)要求。因此對(duì)相關(guān)人員而言,必須要重點(diǎn)研究物聯(lián)網(wǎng)條件下海量異構(gòu)數(shù)據(jù)存儲(chǔ)與共享的相關(guān)問(wèn)題,為進(jìn)一步提高物聯(lián)網(wǎng)的實(shí)施效果奠定基礎(chǔ)。
在物聯(lián)網(wǎng)海量異構(gòu)數(shù)據(jù)存儲(chǔ)過(guò)程中,考慮到異構(gòu)數(shù)據(jù)的特殊性,很多技術(shù)人員傾向于采用集中式的存儲(chǔ)管理方法,在這種管理方式下,文件系統(tǒng)的存儲(chǔ)方式會(huì)因?yàn)樾室蛩氐挠绊懚y以滿足異構(gòu)數(shù)據(jù)存儲(chǔ)的要求,所以針對(duì)這種情況,本文提出了數(shù)據(jù)庫(kù)式的異構(gòu)數(shù)據(jù)存儲(chǔ)方式。
數(shù)據(jù)庫(kù)技術(shù)主要被分為關(guān)系型數(shù)據(jù)庫(kù)與非關(guān)系型數(shù)據(jù)庫(kù)兩種,其中關(guān)系型數(shù)據(jù)庫(kù)的技術(shù)條件十分成熟,并且能夠精準(zhǔn)描述數(shù)據(jù)中的相關(guān)數(shù)據(jù),在數(shù)據(jù)存儲(chǔ)中能夠最大程度上保證數(shù)據(jù)存儲(chǔ)的完整性與一致性。但是在使用該技術(shù)時(shí)應(yīng)該注意的是,關(guān)系型數(shù)據(jù)庫(kù)技術(shù)強(qiáng)調(diào)了數(shù)據(jù)的實(shí)時(shí)到達(dá),在實(shí)際上是以一個(gè)完整的時(shí)間序列形式運(yùn)行的。相比之下,非關(guān)系型數(shù)據(jù)庫(kù)技術(shù)屬于一個(gè)新興技術(shù),通過(guò)PC搭建平臺(tái),依靠PC平臺(tái)來(lái)完成數(shù)據(jù)的深層次處理。所以,非關(guān)系型數(shù)據(jù)庫(kù)技術(shù)也具有適用性,能夠?yàn)楹A慨悩?gòu)數(shù)據(jù)處理提供必要的技術(shù)支撐。
在存儲(chǔ)技術(shù)應(yīng)用中,都需要針對(duì)物聯(lián)網(wǎng)海量異構(gòu)數(shù)據(jù)的實(shí)際情況,對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,并采用統(tǒng)一的方式對(duì)數(shù)據(jù)進(jìn)行編輯,這樣才能保證異構(gòu)數(shù)據(jù)被順利的儲(chǔ)存。結(jié)合非關(guān)系型數(shù)據(jù)庫(kù)的特征,在這個(gè)過(guò)程中,所要采取的技術(shù)措施主要包括:
(1)預(yù)處理。先對(duì)物聯(lián)網(wǎng)海量異構(gòu)數(shù)據(jù)做預(yù)處理,這是因?yàn)槲锫?lián)網(wǎng)中的采樣數(shù)據(jù)中存在大量的噪聲數(shù)據(jù),再加之物聯(lián)網(wǎng)節(jié)點(diǎn)本身的數(shù)據(jù)處理能力是有限的,所以為了能更高效的編輯處理相關(guān)數(shù)據(jù),就需要通過(guò)數(shù)據(jù)清洗、數(shù)據(jù)融合等多種手段,讓異構(gòu)數(shù)據(jù)中的關(guān)鍵值能被提取。
在預(yù)處理階段,考慮到不同傳感器的類型存在差異,因此在數(shù)據(jù)預(yù)處理過(guò)程中,必須要針對(duì)數(shù)據(jù)的具體屬性做出針對(duì)性的編輯。例如,對(duì)于那些非數(shù)值的數(shù)據(jù),應(yīng)該根據(jù)視頻、音頻數(shù)據(jù)的應(yīng)用要求,按照相應(yīng)的算法來(lái)獲取其中的關(guān)鍵值參數(shù);而對(duì)于數(shù)據(jù)型的模型,還應(yīng)該關(guān)注數(shù)據(jù)之間本身所產(chǎn)生的變化,當(dāng)數(shù)據(jù)經(jīng)過(guò)預(yù)處理后,將其定義成一個(gè)閾值,當(dāng)數(shù)據(jù)的狀態(tài)變化超過(guò)這個(gè)閾值之后,再進(jìn)一步提取數(shù)據(jù)。
(2)數(shù)據(jù)表達(dá)。針對(duì)相關(guān)學(xué)者的研究經(jīng)驗(yàn)[1],在數(shù)據(jù)表達(dá)階段,采用非NoSQL數(shù)據(jù)庫(kù)存儲(chǔ)策略。在這個(gè)策略中,數(shù)據(jù)表達(dá)必須要經(jīng)過(guò)三個(gè)層次的變化,分別是數(shù)據(jù)元素、數(shù)據(jù)記錄與數(shù)據(jù)集合。其中,數(shù)據(jù)元素是物聯(lián)網(wǎng)海量異構(gòu)數(shù)據(jù)中的基礎(chǔ)數(shù)據(jù),可以被認(rèn)為是異構(gòu)數(shù)據(jù)最基本的表現(xiàn)形式;數(shù)據(jù)記錄則是不同數(shù)據(jù)之間的變化,反應(yīng)了數(shù)據(jù)在接受“被存儲(chǔ)”過(guò)程中所接受的數(shù)據(jù)預(yù)處理流程;數(shù)據(jù)集合,就是要對(duì)那些被預(yù)處理的數(shù)據(jù)進(jìn)行整合。在數(shù)據(jù)表達(dá)結(jié)算,數(shù)據(jù)往往會(huì)以兩種狀態(tài)存在,分別是靜態(tài)信息與動(dòng)態(tài)信息。其中,動(dòng)態(tài)信息主要指與時(shí)空有效的信息,包括溫度信息、時(shí)間信息等;靜態(tài)信息值只采集以此的信息,例如物理網(wǎng)異構(gòu)數(shù)據(jù)階段中的ID信息等。在這些信息的表達(dá)中,其表達(dá)方式均指向了原子信息的開(kāi)始位置,分別由字符類型與數(shù)值類型兩方面組成,兩者相互結(jié)合共同完成了數(shù)據(jù)的表達(dá),并與非關(guān)系型數(shù)據(jù)庫(kù)相匹配。
在物聯(lián)網(wǎng)的數(shù)據(jù)共享中,數(shù)據(jù)交換標(biāo)準(zhǔn)定義了物聯(lián)網(wǎng)數(shù)據(jù)交換協(xié)議與共享方式,從當(dāng)前技術(shù)發(fā)展情況來(lái)看,REST等已經(jīng)成為物聯(lián)網(wǎng)中最常見(jiàn)的應(yīng)用層技術(shù)交換標(biāo)準(zhǔn),能夠在一些特定行業(yè)的充分利用。
在這種情況下,大量的數(shù)據(jù)共享策略得到應(yīng)用,并且相關(guān)學(xué)者也對(duì)物聯(lián)網(wǎng)下異構(gòu)數(shù)據(jù)的共享策略[2],并分別從DNS、REST等諸多方面,介紹了相關(guān)共享策略的實(shí)施效果。總體而言,現(xiàn)階段物聯(lián)網(wǎng)海量異構(gòu)數(shù)據(jù)的共享策略主要面臨著一個(gè)問(wèn)題:面向物聯(lián)網(wǎng)海量數(shù)據(jù)往往會(huì)因?yàn)槿狈蚕頇C(jī)制,而導(dǎo)致物聯(lián)網(wǎng)應(yīng)用閉環(huán)現(xiàn)象廣泛的存在。所以為了解決這個(gè)問(wèn)題,本文提出了共享策略,這個(gè)共享機(jī)制以REST的信息服務(wù)解決數(shù)據(jù)共享問(wèn)題,在數(shù)據(jù)共享階段,所要解決的問(wèn)題問(wèn)題主要包括以下幾方面:
(1)資源定義。根據(jù)REST的設(shè)計(jì)原則,一切可以被命名的實(shí)體都可以被認(rèn)為是資源,這些資源不僅包含了傳統(tǒng)網(wǎng)絡(luò)系統(tǒng)中的各種鏈接、信息,也包括物聯(lián)網(wǎng)中的感知網(wǎng)絡(luò)、交互信息等多種資源。在信異構(gòu)數(shù)據(jù)共享中,必須要針對(duì)單個(gè)物體對(duì)象所對(duì)應(yīng)的資源,通過(guò)單條數(shù)據(jù)記錄、數(shù)據(jù)記錄集合等方式,完成相應(yīng)的數(shù)據(jù)索引,這樣相關(guān)人員才能快速的依靠關(guān)鍵詞等檢索條件快速獲取信息,完成數(shù)據(jù)共享。
(2)確定標(biāo)識(shí)。在對(duì)需要被共享的資源進(jìn)行定義之后,考慮到資源描述已經(jīng)成為信息服務(wù)系統(tǒng)并實(shí)現(xiàn)資源管理的基礎(chǔ)。所以當(dāng)資源定義后,應(yīng)該結(jié)合異構(gòu)數(shù)據(jù)的特點(diǎn),確定標(biāo)識(shí),掌握資源所在網(wǎng)絡(luò)的性能、應(yīng)用領(lǐng)域等諸多信息后,對(duì)相關(guān)資源做進(jìn)一步的確定與劃分,明確資源的具體信息,為共享做好準(zhǔn)備。
(3)數(shù)據(jù)共享。當(dāng)異構(gòu)數(shù)據(jù)的標(biāo)識(shí)被確定之后,證明此時(shí)的異構(gòu)數(shù)據(jù)已經(jīng)完成了定義,依靠相應(yīng)的數(shù)據(jù)庫(kù)技術(shù),相關(guān)人員就能在關(guān)鍵詞檢索、約束條件控制等多種方式下獲取具體的異構(gòu)數(shù)據(jù)信息,最終完成了對(duì)數(shù)據(jù)的共享。
物聯(lián)網(wǎng)海量異構(gòu)數(shù)據(jù)的存儲(chǔ)與共享對(duì)相關(guān)數(shù)據(jù)的應(yīng)用產(chǎn)生深遠(yuǎn)影響,因此對(duì)相關(guān)人員而言,必須要進(jìn)一步了解物聯(lián)網(wǎng)海量異構(gòu)數(shù)據(jù)的深層次管理要求,在充分了解異構(gòu)數(shù)據(jù)處理要求的基礎(chǔ)上,對(duì)相關(guān)數(shù)據(jù)進(jìn)行編輯,確保其存儲(chǔ)與共享策略能夠滿足應(yīng)用要求,最終更好的滿足社會(huì)生產(chǎn)。
[1]任海鵬.互聯(lián)網(wǎng)下大數(shù)據(jù)研究方法與探究[J].赤峰學(xué)院學(xué)報(bào)(自然科學(xué)版 ),2015,31(22):14-15.
[2]李昱慶.物聯(lián)網(wǎng)信息服務(wù)系統(tǒng)研究綜述[J].現(xiàn)代計(jì)算機(jī)(專業(yè)版),2014(07):23-29.