褚小龍
(克拉瑪依安控科技有限公司,克拉瑪依 834000)
數(shù)據(jù)挖掘是知識探尋領(lǐng)域當(dāng)中的重要技術(shù),其涉及各方面的領(lǐng)域知識,其中對于機器學(xué)習(xí)、人工智能、模式識別在數(shù)據(jù)挖掘當(dāng)中都有涉及。具體的操作包含分類、估計、預(yù)測、相關(guān)性分組和聚類等。
云計算是信息時代的互聯(lián)網(wǎng)計算方式,其以快速簡單的計算方式創(chuàng)建大型IT基礎(chǔ)設(shè)施建設(shè),文章闡述的數(shù)據(jù)挖掘平臺就是通過數(shù)據(jù)挖掘來處理技術(shù)的。云計算主要分為IaaS(基礎(chǔ)設(shè)施即時服務(wù))、PaaS(系統(tǒng)平臺即時服務(wù))和SaaS。此外,云計算還具有通用性和虛擬性特點,其不針對特定應(yīng)用支持商業(yè)運營,主要在“云”的支持下構(gòu)造多種互聯(lián)網(wǎng)信息應(yīng)用。云計算的用戶可以任何位置自由使用互聯(lián)網(wǎng)終端,并因此獲取專業(yè)化服務(wù)。
在協(xié)同云計算環(huán)境下,差異區(qū)域數(shù)據(jù)采用區(qū)間概念格當(dāng)中節(jié)點模型進行儲存機制構(gòu)架,用有向圖模型,敘述差異區(qū)域數(shù)據(jù)儲存結(jié)構(gòu)的分布層次模型,將作為信息采樣時間序列,數(shù)據(jù)挖掘結(jié)構(gòu)為五元組O=(C,I,P,Hc,R,A0)。其中I為字符串實例集,C標(biāo)識數(shù)據(jù)語義本體模型階數(shù)。
其中協(xié)同元計算下差異區(qū)域數(shù)據(jù)儲存數(shù)據(jù)頻帶分量為x(ηn)。相鄰點待檢數(shù)據(jù)塊具有相關(guān)性,云儲存服務(wù)中相同態(tài)標(biāo)簽數(shù)據(jù)為φ:X→Y,其滿足
其中·為X運算,°為Y上運算。數(shù)據(jù)款Hash表示為
其中ρ∈(0,1),代表數(shù)據(jù)完整性的系數(shù)。
式中γ0為協(xié)同云計算下差異區(qū)域數(shù)據(jù)單位區(qū)域分布噪音比。
信息節(jié)點和數(shù)據(jù)負(fù)載之間有如下關(guān)系
其中CCS,Css分別表示協(xié)同云計算數(shù)據(jù)挖掘平臺節(jié)點信息分布可靠度和空間模態(tài)。
CDKmeans分析是當(dāng)下提出的基于云計算的數(shù)據(jù)挖掘平臺分布式算法,這種技術(shù)一共有四種不同算法:(1)基于地域性路由優(yōu)化程序;(2)資源約束的自適應(yīng)程序;(3)云計算環(huán)境下局部數(shù)據(jù)挖掘;(4)云計算中全局挖掘算法。
其中聚類半徑臨界值表達(dá)為
(ub表示最高閾值,X_crit_thresthold表示資源X臨界閾值百分比)
3.2.1 降低管理負(fù)擔(dān)
云計算技術(shù)的應(yīng)用環(huán)境下數(shù)據(jù)挖掘平臺使得互聯(lián)網(wǎng)的云計算用戶的管理費用得到大大降低,商業(yè)模式的管理運營成本也大大下降。相應(yīng)的工作當(dāng)中,投入數(shù)據(jù)挖掘平臺就節(jié)省了人員管理、技術(shù)管理和設(shè)備管理的大量成本支出,降低管理負(fù)擔(dān)的同時,能夠使資金得到合理的應(yīng)用。3.2.2 優(yōu)化安裝
云計算技術(shù)的應(yīng)用環(huán)境下數(shù)據(jù)挖掘平臺安裝簡單、快速是其一大特點,這種便捷性的特點使得云計算技術(shù)的應(yīng)用環(huán)境下數(shù)據(jù)挖掘平臺得到廣泛的推廣和應(yīng)用。其中優(yōu)化安裝主要體現(xiàn)在互聯(lián)網(wǎng)用戶使用的過程當(dāng)中不需要對云計算技術(shù)的應(yīng)用環(huán)境下數(shù)據(jù)挖掘平臺進行安裝,一些硬件和軟件的安裝得到省略,相應(yīng)的用戶通過網(wǎng)絡(luò)配置接入云計算系統(tǒng)網(wǎng)址當(dāng)中即可實現(xiàn)對數(shù)據(jù)挖掘平臺的應(yīng)用。
3.2.3 維護成本低
在云計算的網(wǎng)絡(luò)背景下,數(shù)據(jù)挖掘網(wǎng)絡(luò)系統(tǒng)平臺為互聯(lián)網(wǎng)用戶節(jié)約大量的維護成本。該系統(tǒng)平臺建立在云計算體系當(dāng)中,和傳統(tǒng)的系統(tǒng)平臺相比,云計算的平臺可以實現(xiàn)實時在線,并保持系統(tǒng)最新版本和最佳防御能力。
這種分布式儲存應(yīng)用技術(shù)是數(shù)據(jù)挖掘平臺當(dāng)中的優(yōu)勢是互聯(lián)網(wǎng)云計算技術(shù)的體現(xiàn),其適應(yīng)當(dāng)下信息時代高速發(fā)展的需求。在網(wǎng)站上采用云計算互聯(lián)網(wǎng)信息應(yīng)用技術(shù),其成本消耗較大,不利于小型網(wǎng)站穩(wěn)定發(fā)展,因此這種云計算互聯(lián)網(wǎng)信息技術(shù)適用于大規(guī)模的互聯(lián)網(wǎng)專項服務(wù)提供工作上,進而在大規(guī)模的工作當(dāng)中發(fā)揮數(shù)據(jù)挖掘的優(yōu)勢。
綜上所述,基于協(xié)同云計算下研究差異區(qū)域數(shù)據(jù)挖掘平臺設(shè)計將會大大提升互聯(lián)網(wǎng)的運行效率,進而降低數(shù)據(jù)挖掘平臺支持下故障的產(chǎn)生?;趨f(xié)同云計算下研究差異區(qū)域數(shù)據(jù)挖掘平臺應(yīng)用能夠使大型企業(yè)的網(wǎng)絡(luò)管理機構(gòu)數(shù)據(jù)中心向大容量儲存中心演變,提高計算中心的高效云計算,最終達(dá)到網(wǎng)絡(luò)管理的一體化高速集中。用戶在使用云儲存和本地文件時保持一致,在應(yīng)用上支持各種平臺應(yīng)用程序,其可直接讀取云儲存當(dāng)中的數(shù)據(jù),類似于播放視頻等操作不需要下載就可播放,為人們生活提供便利的同時減輕了數(shù)據(jù)管理人員整理數(shù)據(jù)的工作負(fù)擔(dān)。