張 虎
(江海職業(yè)技術(shù)學(xué)院,江蘇 揚州 225001)
基于云計算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘模式的構(gòu)建
張虎
(江海職業(yè)技術(shù)學(xué)院,江蘇 揚州 225001)
科技的不斷發(fā)展和互聯(lián)網(wǎng)技術(shù)的不斷進(jìn)步使得物聯(lián)網(wǎng)給人類的聯(lián)通需求提供了更多的幫助,同時也對該項技術(shù)對數(shù)據(jù)挖掘的模式提出了更高要求。而傳統(tǒng)的數(shù)據(jù)挖掘顯然已經(jīng)無法滿足物聯(lián)網(wǎng)的發(fā)展要求?;诖?,利用云計算技術(shù)衍生出來的物聯(lián)網(wǎng)數(shù)據(jù)挖掘受到了更廣泛的關(guān)注。
云計算;物聯(lián)網(wǎng);數(shù)據(jù)挖掘模式;模式構(gòu)建
隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,經(jīng)濟(jì)發(fā)展的步伐也日益加快,利用互聯(lián)網(wǎng)技術(shù)所構(gòu)建起來的物與物之間的聯(lián)系即為“物聯(lián)網(wǎng)”。然而,在實際應(yīng)用過程中,物聯(lián)網(wǎng)其實含有兩層意思,一層意思是使用互聯(lián)網(wǎng)的主體可以是任何物品,而不再限于人和服務(wù)器的關(guān)系;另一層意思是物聯(lián)網(wǎng)作為互聯(lián)網(wǎng)的延伸和發(fā)展,與互聯(lián)網(wǎng)之間存在同質(zhì)性。無論怎樣解釋,物聯(lián)網(wǎng)發(fā)展與運用都說明了技術(shù)的進(jìn)步和社會的發(fā)展,而在這個過程中,另一個概念也被明確提出來,即云計算,在物聯(lián)網(wǎng)的使用中,云計算的作用至關(guān)重要。云計算,即對信息的虛擬化儲存與計算,可以在互聯(lián)網(wǎng)平臺上,規(guī)整各種信息,從而形成多個數(shù)據(jù)和計算中心。
1.1云計算
云計算是基于互聯(lián)網(wǎng)的相關(guān)服務(wù)的增加、使用和交付模式,通常涉及通過互聯(lián)網(wǎng)來提供動態(tài)易擴(kuò)展且經(jīng)常是虛擬化的資源。具體來說,通過云計算,可以將計算任務(wù)根據(jù)實際情況,合理、科學(xué)地分配給不同的計算機(jī),由這些計算機(jī)合作,同時完成計算任務(wù),任務(wù)過程即完成數(shù)據(jù)并行、分布和網(wǎng)格等處理,并根據(jù)計算要求,進(jìn)行具體的信息轉(zhuǎn)換。云計算技術(shù)發(fā)展至今,基本可以僅通過一臺電腦或者一部手機(jī)進(jìn)行復(fù)雜而大型的計算任務(wù),并且能夠保證信息和數(shù)據(jù)的高度安全,進(jìn)而既可以大量地存儲信息和數(shù)據(jù),又可以有效防治病毒的入侵。具體來說,云計算可以讓用戶瞬時體驗到10萬億次/秒的運算能力,如此強大的計算能力使得模擬核爆炸、預(yù)測市場發(fā)展趨勢都變成了可能,在現(xiàn)實生活中,用戶可以隨時隨地通過PC端、移動端等接入到云計算的數(shù)據(jù)中心,并按照自己的運算需求運算出想要的結(jié)果。當(dāng)前云計算核心算法主要有8個算法,分別是FO軟件開發(fā)算法、無限分層處理算法、文字信息結(jié)構(gòu)樹構(gòu)造算法、IP地址結(jié)構(gòu)樹算法、互聯(lián)網(wǎng)架構(gòu)設(shè)計算法、多維復(fù)雜空間軟件架構(gòu)算法、多維復(fù)雜空間數(shù)據(jù)結(jié)構(gòu)管理算法、構(gòu)建內(nèi)容中心網(wǎng)絡(luò)算法等。比如云計算農(nóng)村數(shù)據(jù)服務(wù)平臺中的果業(yè)數(shù)據(jù)服務(wù)平臺,只用了幾百行代碼,就完成了傳統(tǒng)軟件開發(fā)需要幾十萬行代碼的軟件系統(tǒng)。由此可知,通過云計算技術(shù),用戶可以更好地儲存和管理海量的信息和數(shù)據(jù),而其發(fā)展速度也受到了廣大專家和學(xué)者的關(guān)注。
1.2物聯(lián)網(wǎng)
物聯(lián)網(wǎng)是一種從互聯(lián)網(wǎng)衍生而來的網(wǎng)絡(luò),包含大量節(jié)點表示的實物對象。物聯(lián)網(wǎng)是新時代的網(wǎng)絡(luò)革命,合理利用網(wǎng)絡(luò)傳感器、大型服務(wù)器和計算機(jī)等設(shè)備進(jìn)行網(wǎng)絡(luò)工作,集各種新興技術(shù)、手段于一身,主要包括:傳感器、定位、移動技術(shù)等,物聯(lián)網(wǎng)將實現(xiàn)智能技術(shù)和通信技術(shù)為發(fā)展目標(biāo),從而實現(xiàn)通信的高效率。在實際發(fā)展過程中,物聯(lián)網(wǎng)具有較強的廣博性,可以接入不同類型的終端設(shè)備,能夠采集大量信息和數(shù)據(jù),但是無論是數(shù)據(jù)、信息,還是格式、類型的復(fù)雜程度很高,因此,傳統(tǒng)的互聯(lián)網(wǎng)數(shù)據(jù)挖掘方法是并不適于物聯(lián)網(wǎng)使用。由此,云計算被廣泛地應(yīng)用于物聯(lián)網(wǎng)數(shù)據(jù)挖掘過程中,不僅使云計算得到了更好的發(fā)展,也能夠更好地開發(fā)物聯(lián)網(wǎng)。
云計算技術(shù)對于物聯(lián)網(wǎng)發(fā)展來講,意義重大,二者相輔相成、互相促進(jìn)。而云計算技術(shù)作為物聯(lián)網(wǎng)發(fā)展的前提和基礎(chǔ)條件,需要得到更快速的發(fā)展和更廣泛的關(guān)注。首先,物聯(lián)網(wǎng)快速發(fā)展的核心是云計算技術(shù),通過云計算分析和管理物聯(lián)網(wǎng)上的各種物品,進(jìn)而建設(shè)物聯(lián)網(wǎng),如:數(shù)據(jù)傳輸通道、各種電子元器件和物聯(lián)網(wǎng)技術(shù)的處理能力等,此過程需要得到云計算的幫助,才能使物聯(lián)網(wǎng)的處理能力更加有效率;其次,云計算技術(shù)加快了互聯(lián)網(wǎng)與物聯(lián)網(wǎng)的相互結(jié)合與相互連接,從而創(chuàng)新商業(yè)模式[1]。具體說來,物聯(lián)網(wǎng)就是利用通信技術(shù)將傳感器和人員、物質(zhì)等以新方式聯(lián)接起來,聯(lián)通人物、物物,以形成信息化網(wǎng)絡(luò),作為互聯(lián)網(wǎng)的延伸,物聯(lián)網(wǎng)包括互聯(lián)網(wǎng)及互聯(lián)網(wǎng)上所有的資源,兼容互聯(lián)網(wǎng)所有的應(yīng)用,但物聯(lián)網(wǎng)中所有的元素都是個性化和私有化的。云計算與物聯(lián)網(wǎng)的融合與滲透,給人類帶來了更大的便利,同時也加速了互聯(lián)網(wǎng)技術(shù)的發(fā)展。
3.1物聯(lián)網(wǎng)數(shù)據(jù)的特點
首先,數(shù)據(jù)量極大。在物聯(lián)網(wǎng)的整體系統(tǒng)中,有很多傳感器設(shè)備和監(jiān)控終端同時起作用,它們根據(jù)用戶需求不停地傳送數(shù)據(jù)到物聯(lián)網(wǎng)的數(shù)據(jù)中心。同時,物聯(lián)網(wǎng)數(shù)據(jù)中心接受并儲存這些數(shù)據(jù)和指令,從而完成對象跟蹤、對象監(jiān)控、數(shù)據(jù)統(tǒng)計、數(shù)據(jù)分析和數(shù)據(jù)挖掘等流程??梢?,物聯(lián)網(wǎng)數(shù)據(jù)量大的特點在物聯(lián)網(wǎng)系統(tǒng)的數(shù)據(jù)挖掘過程中被體現(xiàn)出來。
其次,數(shù)據(jù)類型復(fù)雜。物聯(lián)網(wǎng)多元化的監(jiān)控對象決定了其所采集的信息類型也是復(fù)雜的,例如:根據(jù)森林情況的信息類型要關(guān)注的是有無森林火災(zāi)的發(fā)生,但是根據(jù)交通情況的信息類型則是主要關(guān)注視頻信息的采集。因此,物聯(lián)網(wǎng)的數(shù)據(jù)類型是復(fù)雜而多樣的。
第三,異構(gòu)性。物聯(lián)網(wǎng)的運行需要多個傳感設(shè)備和終端設(shè)備共同完成,其采集的數(shù)據(jù)要根據(jù)用戶的不同要求以不同格式和語義記錄下來,由此極大地增加了物聯(lián)網(wǎng)數(shù)據(jù)的挖掘難度[2]。
第四,數(shù)據(jù)挖掘的動態(tài)性。物聯(lián)網(wǎng)傳感器終端在運行過程中呈現(xiàn)出明顯的非靜態(tài)性,數(shù)據(jù)無時無刻都會進(jìn)入、移出傳感器終端。當(dāng)物聯(lián)網(wǎng)數(shù)據(jù)進(jìn)入傳感器終端時,傳感器所采集的數(shù)據(jù)同時被記錄在數(shù)據(jù)庫當(dāng)中,當(dāng)數(shù)據(jù)移出物聯(lián)網(wǎng)傳感器時,此時傳輸中的數(shù)據(jù)將被阻隔在數(shù)據(jù)庫之外。由此,傳感器數(shù)據(jù)的不斷進(jìn)入和移出必然會同時給數(shù)據(jù)庫的增加相應(yīng)的工作量。
3.2物聯(lián)網(wǎng)對數(shù)據(jù)挖掘的要求
第一,數(shù)據(jù)挖掘?qū)崟r而高效。物聯(lián)網(wǎng)系統(tǒng)的正常運行,離不開控制端口的運行,根據(jù)物聯(lián)網(wǎng)系統(tǒng)的實時情況,控制端口完成數(shù)據(jù)的分析并同時間完成運算處理,要求這樣的流程被高效率完成。因此,這就使得物聯(lián)網(wǎng)對數(shù)據(jù)挖掘模式的要求逐漸提高。
第二,物聯(lián)網(wǎng)對數(shù)據(jù)的分布式挖掘。根據(jù)實際情況完成數(shù)據(jù)的挖掘,才能保證物聯(lián)網(wǎng)系統(tǒng)的正常運行。而物聯(lián)網(wǎng)系統(tǒng)中的設(shè)備類型多樣,且運算數(shù)據(jù)復(fù)制,決定了物聯(lián)網(wǎng)挖掘數(shù)據(jù)是呈分布態(tài)勢的。
第三,物聯(lián)網(wǎng)挖掘數(shù)據(jù)的質(zhì)量控制。無論物聯(lián)網(wǎng)采用怎樣的方式完成對數(shù)據(jù)的挖掘,最終數(shù)據(jù)的真實性是必須要考慮的,因此,需要注意對數(shù)據(jù)質(zhì)量的控制。因此,需要系統(tǒng)對數(shù)據(jù)來源、媒體傳送、存儲和管理格式、模態(tài)多樣化等幾個方面進(jìn)行妥善考慮[3]。
4.1正確選擇數(shù)據(jù)算法
物聯(lián)網(wǎng)系統(tǒng)的高速運行離不開高效率的數(shù)據(jù)挖掘,那么就必須要選擇科學(xué)、合理、正確的運算方法以及并行策略。因此,根據(jù)調(diào)節(jié)參數(shù)和運算速度的具體要求,設(shè)計并選擇有效的算法十分必要,并要求算法能夠適應(yīng)物聯(lián)網(wǎng)不同的需求。
4.2物聯(lián)網(wǎng)數(shù)據(jù)挖掘的不確定性
在云計算的視角下,物聯(lián)網(wǎng)數(shù)據(jù)挖掘過程中需要解決的最大問題就是要面對各種情況的不確定性[4]。例如:挖掘數(shù)據(jù)時,規(guī)定任務(wù)、采集數(shù)據(jù)、處理運算、選擇挖掘方法等都存在著一定的不確定性。由此可以看出,在整個數(shù)據(jù)挖掘和處理的過程中,都是貫穿著不確定性的,給物聯(lián)網(wǎng)數(shù)據(jù)挖掘造成了一定的難度。
5.1賬戶管理系統(tǒng)
賬戶管理系統(tǒng)是物聯(lián)網(wǎng)的重要組成部分,其功能主要是監(jiān)控物聯(lián)網(wǎng)用戶的實際使用過程,并詳細(xì)記錄用戶賬戶的每一步具體收入和支出,作為平臺的最基本部分,將功能細(xì)化可以概括為:支出、收入、余額、歷史記錄。其中,支出的記錄是詳細(xì)記錄用戶的每一項付費服務(wù);收入的記錄則是利用平臺數(shù)據(jù)資源,按照算法計算收入賬目和報酬;余額記錄則記錄支出與收入間的實際差額;而歷史記錄就是將用戶的每一項操作都如實記錄下來。
5.2數(shù)據(jù)管理系統(tǒng)
顧名思義,數(shù)據(jù)管理系統(tǒng)就是為互聯(lián)網(wǎng)用戶提供數(shù)據(jù)管理的系統(tǒng),該系統(tǒng)的主要功能就是為用戶提供有效管理。在云計算技術(shù)的支持下,數(shù)據(jù)管理系統(tǒng)可以為用戶提供周到的數(shù)據(jù)服務(wù),針對用戶購買、持有、出售等行為所產(chǎn)生的數(shù)據(jù)都可以進(jìn)行系統(tǒng)的管理,而且在記錄中還能夠細(xì)化到每一個時間點和數(shù)據(jù)名稱。此外,用戶還能夠自行在出售前將具有敏感屬性的信息剔除,從而保護(hù)自己的隱私信息。
5.3數(shù)據(jù)挖掘系統(tǒng)
數(shù)據(jù)挖掘系統(tǒng)可謂是物聯(lián)網(wǎng)平臺中最基本、最核心的部分,也是專業(yè)性是最強的系統(tǒng)部分,能夠為整體平臺提供一站式的服務(wù),給用戶提供數(shù)據(jù)挖掘和數(shù)據(jù)處理的服務(wù),并將挖掘結(jié)果報告及時發(fā)送給用戶。反之,用戶也可以通過這一系統(tǒng)功能自行挖掘和獲取自己需要的數(shù)據(jù)。同時,還可以利用物聯(lián)網(wǎng)平臺,根據(jù)云計算技術(shù)設(shè)計具體算法,以進(jìn)行具體的數(shù)據(jù)挖掘,并展示出數(shù)據(jù)挖掘的結(jié)果。
5.4挖掘算法管理系統(tǒng)
挖掘算法管理系統(tǒng)能夠統(tǒng)一管理數(shù)據(jù)算法和數(shù)據(jù)挖掘模型,該管理系統(tǒng)還能協(xié)助整個系統(tǒng)獲取正確的算法和詳細(xì)的記錄。挖掘算法管理系統(tǒng)的功能主要有:系統(tǒng)算法、歷史記錄和我的算法3種[5]。其中,系統(tǒng)算法是將平臺自帶算法羅列出來,供用戶選擇;歷史記錄則是將用戶使用過的每一種算法都詳細(xì)記錄下來;而我的算法則是用戶自行設(shè)計和修改過的計算方法。
綜上所述,在當(dāng)前的信息時代,無論是云計算技術(shù),還是物聯(lián)網(wǎng)以及其數(shù)據(jù)挖掘,都給人們帶來了極大的生活和工作便利,隨著技術(shù)的發(fā)展,也奠定了其在當(dāng)今科技社會中的重要地位,因此需要更好地運用這些新技術(shù)、進(jìn)一步了解技術(shù)特點和結(jié)構(gòu)信息,及時發(fā)現(xiàn)技術(shù)問題,并解決問題,以促進(jìn)社會發(fā)展、經(jīng)濟(jì)進(jìn)步。
[1]黃章樹,劉晴晴.基于云計算服務(wù)模式的數(shù)據(jù)挖掘應(yīng)用平臺的構(gòu)建[J].電信科學(xué),2012(1):53-57.
[2]丁靜,楊善林,羅賀,等.云計算環(huán)境下的數(shù)據(jù)挖掘服務(wù)模式[J].計算機(jī)科學(xué),2012(S1):217-219,237.
[3]高曉琴,艾曦,蔣朝哲.基于商業(yè)化物聯(lián)網(wǎng)數(shù)據(jù)挖掘模式的構(gòu)建研究[J].齊齊哈爾師范高等專科學(xué)校學(xué)報,2015(1):124-125.
[4]郭杰鋒,趙鳳芝.分析云計算的物聯(lián)網(wǎng)數(shù)據(jù)挖掘模式[J].電子技術(shù)與軟件工程,2015(14):213.
[5]聶曉.基于云計算的物聯(lián)網(wǎng)安全研究[J].工礦自動化,2013(4):47-50.
Construction of the data mining model of Internet of things based on cloud computing
Zhang Hu
(Jianghai Polytechnic College, Yangzhou 225001, China)
The continuous development of science and technology and the continuous progress of the Internet technology make Internet of things provide more help for the interaction demands of human, but at the same time, higher requirement is put forward in data mining model of this technology. While the traditional data mining obviously can not meet the requirements of the development of Internet of things, based on this, the use of cloud computing technology derived from the Internet of things data mining has been more widespread concern.
cloud computing; Internet of things; data mining model; model construction
張虎(1979— ),男,江蘇揚州,本科,評審高級實驗師;研究方向:計算機(jī)軟件。