張 悅 楊學(xué)全
(河北農(nóng)業(yè)大學(xué),河北 保定 071001)
物聯(lián)網(wǎng)其實(shí)就是指物和物之間相互聯(lián)系的互聯(lián)網(wǎng),隨著社會(huì)科學(xué)技術(shù)的不斷發(fā)展和進(jìn)步,促進(jìn)了互聯(lián)網(wǎng)的快速發(fā)展,也讓社會(huì)經(jīng)濟(jì)得到了很好的發(fā)展。云計(jì)算主要就是指對(duì)相關(guān)的信息進(jìn)行虛擬化的計(jì)算和存儲(chǔ),對(duì)各種信息在互聯(lián)網(wǎng)上進(jìn)行規(guī)范和整理,這樣就能夠有效的形成很多個(gè)計(jì)算中心和數(shù)據(jù)。
物聯(lián)網(wǎng)其實(shí)就是一個(gè)比較大而且分布也非常廣泛的物和物的互聯(lián)網(wǎng),主要作用就是對(duì)生活中的各種事物進(jìn)行監(jiān)控,隨著物聯(lián)網(wǎng)的不斷發(fā)展,現(xiàn)在也接入了很多的應(yīng)用終端,其中就包括了湖泊、建筑物以及交通設(shè)施等。一般來(lái)說(shuō),云計(jì)算物聯(lián)網(wǎng)數(shù)據(jù)挖掘就是指通過(guò)對(duì)云計(jì)算來(lái)解決物聯(lián)網(wǎng)數(shù)據(jù)挖掘存在的問(wèn)題。首先建立一個(gè)能夠全面捕捉物聯(lián)網(wǎng)數(shù)據(jù)的分布式時(shí)空數(shù)據(jù)庫(kù),然后在云計(jì)算的平臺(tái)上,全面的對(duì)物聯(lián)網(wǎng)系統(tǒng)的數(shù)據(jù)進(jìn)行挖掘。云計(jì)算中的數(shù)據(jù)挖掘主要就是通過(guò)對(duì)相關(guān)的數(shù)據(jù)進(jìn)行分析研究,從而知道通過(guò)這種方式進(jìn)行數(shù)據(jù)挖掘,物聯(lián)網(wǎng)進(jìn)行數(shù)據(jù)挖掘的相關(guān)工作將能夠被完美的執(zhí)行與完成。
在工作中,能夠提供高可用性和更多的動(dòng)態(tài)資源池的計(jì)算機(jī)平臺(tái),將能夠很好的實(shí)現(xiàn)云計(jì)算的數(shù)據(jù)挖掘。在對(duì)那些可用性比較高的應(yīng)用程序進(jìn)行開(kāi)發(fā)的時(shí)候就可以選擇使用基于云計(jì)算的數(shù)據(jù)挖掘平臺(tái),在利用云計(jì)算對(duì)數(shù)據(jù)進(jìn)行挖掘的時(shí)候也可以采用基于云計(jì)算的數(shù)據(jù)挖掘平臺(tái)。一般情況下,可以通過(guò)軟件分層的理念,對(duì)物聯(lián)網(wǎng)的基于云計(jì)算的數(shù)據(jù)挖掘平臺(tái)系統(tǒng)進(jìn)行一定的分層處理。云計(jì)算的數(shù)據(jù)挖掘系統(tǒng)從下而上可以分為算法層、任務(wù)層和用戶層三層。各層系統(tǒng)的相關(guān)工作,都需要相互配合才能夠完成。軟件中的下層可以向它的上層提供相關(guān)的服務(wù)內(nèi)容,而上層在對(duì)下層的服務(wù)進(jìn)行調(diào)用的時(shí)候主要就是通過(guò)上層層間的開(kāi)發(fā)接口來(lái)完成的,這樣就能夠有效的保證基于云計(jì)算的數(shù)據(jù)挖掘平臺(tái)系統(tǒng)當(dāng)中的各個(gè)層之間的功能能夠比較的獨(dú)立。采用這樣的一種設(shè)計(jì)模式主要就是為了在對(duì)系統(tǒng)進(jìn)行二次開(kāi)發(fā)的時(shí)候能夠比較的方便。
在構(gòu)建基于云計(jì)算數(shù)據(jù)挖掘模式的時(shí)候主要就是通過(guò)積極的應(yīng)用云計(jì)算的服務(wù)模式,那么在這樣的一種情況下建立起來(lái)的基于云計(jì)算數(shù)據(jù)挖掘平臺(tái)它們當(dāng)中的每一個(gè)部分在實(shí)際提供服務(wù)的過(guò)程當(dāng)中都能夠比較獨(dú)立的去完成。操作人員在使用基于云計(jì)算數(shù)據(jù)挖掘平臺(tái)的時(shí)候主要就是經(jīng)過(guò)互聯(lián)網(wǎng)來(lái)連接數(shù)據(jù)挖掘平臺(tái),在監(jiān)控使用賬戶的管理系統(tǒng)時(shí),主要就是在SaaS、PaaS以及DaaS這三個(gè)系統(tǒng)當(dāng)中來(lái)完成的。在數(shù)據(jù)挖掘平臺(tái)當(dāng)中的任何環(huán)節(jié)都是在云計(jì)算服務(wù)的模式中。在數(shù)據(jù)挖掘平臺(tái)當(dāng)中的賬戶管理系統(tǒng)主要就是指管理使用者的實(shí)際服務(wù)情況的一個(gè)系統(tǒng),它對(duì)使用者的賬戶信息有一個(gè)比較全面的記錄,它主要就是把用戶在平臺(tái)當(dāng)中使用設(shè)備的情況以及服務(wù)的情況比較詳細(xì)的記錄下來(lái)形成一個(gè)賬目,這樣就能夠?yàn)槭褂谜咛峁┮粋€(gè)比較全面的數(shù)據(jù)使用的資源。在數(shù)據(jù)挖掘平臺(tái)當(dāng)中的數(shù)據(jù)管理子系統(tǒng)主要是指管理用戶的數(shù)據(jù)資源。這個(gè)數(shù)據(jù)管理子系統(tǒng)主要就是在云計(jì)算中的DaaS服務(wù)模式下進(jìn)行工作的,用戶在購(gòu)買(mǎi)數(shù)據(jù)等相關(guān)活動(dòng)的時(shí)候就是通過(guò)這個(gè)系統(tǒng)來(lái)完成的。數(shù)據(jù)管理子系統(tǒng)能夠?qū)κ褂谜叩碾[私起到很好的保護(hù)作用,而且使用者在處理了數(shù)據(jù)之后還能夠進(jìn)行再次的出售。在數(shù)據(jù)挖掘平臺(tái)當(dāng)中的子挖掘系統(tǒng)主要的作用就是發(fā)現(xiàn)用戶數(shù)據(jù)當(dāng)中的知識(shí),讓數(shù)據(jù)挖掘目標(biāo)能夠有效的實(shí)現(xiàn),在在數(shù)據(jù)挖掘平臺(tái)中子挖掘系統(tǒng)是最主要的部分,它的專業(yè)性比較的強(qiáng)。
物聯(lián)網(wǎng)的整個(gè)環(huán)境決定了物聯(lián)網(wǎng)數(shù)據(jù)挖掘的模式,因?yàn)槲锫?lián)網(wǎng)當(dāng)中的數(shù)據(jù)類(lèi)型比較復(fù)雜,而且物和物之間的關(guān)聯(lián)以及相關(guān)的特性也不一樣,那么這些情況可能就會(huì)使得在構(gòu)建物聯(lián)網(wǎng)數(shù)據(jù)挖掘模式的時(shí)候就會(huì)和傳統(tǒng)的數(shù)據(jù)挖掘模式不相同。
在使用物聯(lián)網(wǎng)的過(guò)程中,常常會(huì)出現(xiàn)一些問(wèn)題,如在發(fā)送與接收數(shù)據(jù)的時(shí)候可能出現(xiàn)部分或者是全部信息出錯(cuò)甚至是丟失。出現(xiàn)這些現(xiàn)象的原因,可能是物聯(lián)網(wǎng)系統(tǒng)的原因,也可能是其他什么原因。那么基于云計(jì)算物聯(lián)網(wǎng)數(shù)據(jù)挖掘模式就應(yīng)該要考慮到這種情況,在構(gòu)建物聯(lián)網(wǎng)數(shù)據(jù)挖掘應(yīng)用模型的時(shí)候,必須考慮對(duì)物與物之間的關(guān)系的表達(dá),這樣才能有效的解決數(shù)據(jù)的錯(cuò)誤與丟失。如果物與物存在間接的關(guān)系的時(shí)候,可以采用SVD模型或者是拉普拉斯變換模型進(jìn)行推導(dǎo)。如果物與物之間存在非常重要的直接關(guān)系時(shí),物聯(lián)網(wǎng)數(shù)據(jù)挖掘模式應(yīng)該要具有表達(dá)出物和物之間直接關(guān)系的能力,這樣在對(duì)物和物的間接關(guān)系進(jìn)行推導(dǎo)的時(shí)候才會(huì)比較的方便。物聯(lián)網(wǎng)數(shù)據(jù)挖掘模型當(dāng)中的一種就是基于超圖的物聯(lián)網(wǎng)數(shù)據(jù)模型,在超圖當(dāng)中的每一個(gè)變都能夠和很多的點(diǎn)進(jìn)行聯(lián)接,對(duì)于物聯(lián)網(wǎng)當(dāng)中數(shù)據(jù)之間比較復(fù)雜的關(guān)系可以通過(guò)超邊來(lái)進(jìn)行標(biāo)示。物聯(lián)網(wǎng)數(shù)據(jù)挖掘模型當(dāng)中的另外一種就是基于馬爾科夫鏈的數(shù)據(jù)挖掘模型。在基于馬爾科夫鏈的數(shù)據(jù)挖掘模型中,對(duì)于進(jìn)行預(yù)測(cè)未來(lái)可能會(huì)出現(xiàn)的現(xiàn)象的概率時(shí),不需要根據(jù)以前的信息或知識(shí),只需要根據(jù)現(xiàn)在的信息或知識(shí)就能夠完成。在物聯(lián)網(wǎng)的數(shù)據(jù)實(shí)際應(yīng)用當(dāng)中,這一類(lèi)問(wèn)題最常見(jiàn)的。
穩(wěn)定的可外推參數(shù)模型是物聯(lián)網(wǎng)數(shù)據(jù)挖掘模型中的另外一種數(shù)據(jù)挖掘模型。在物聯(lián)網(wǎng)數(shù)據(jù)的實(shí)際應(yīng)用當(dāng)中,在進(jìn)行物理建模的時(shí)候應(yīng)該要先要了解到物和物之間的關(guān)系,然后建立起數(shù)據(jù)模型來(lái)描述數(shù)量上面的相互關(guān)系,但是因?yàn)槲锫?lián)網(wǎng)數(shù)據(jù)的類(lèi)型比較復(fù)雜,有可能會(huì)出現(xiàn)錯(cuò)誤或者丟失的情況,所以采用傳統(tǒng)的方法進(jìn)行物理建模會(huì)有很多的困難。
[1]劉茂華,史文崇. 物聯(lián)網(wǎng)數(shù)據(jù)處理之淺論[J]. 計(jì)算機(jī)與信息技術(shù),2011,06:52-53.
[2]丁靜,楊善林,羅賀,丁帥. 云計(jì)算環(huán)境下的數(shù)據(jù)挖掘服務(wù)模式[J]. 計(jì)算機(jī)科學(xué),2012,S1:217-219+237.