李文艷
摘要:大數(shù)據(jù)時代是信息時代的一個重要特征,實際上,在大數(shù)據(jù)時代的背景下進行數(shù)據(jù)挖掘技術(shù)的探究與應(yīng)用其實就是通過在巨大的信息群中不斷挖掘出具有一定價值意義的信息進行整合,在此基礎(chǔ)上對已整合的信息進行進一步的處理,以提高信息數(shù)據(jù)的價值。本文以此為出發(fā)點,就大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)的應(yīng)用進行深入探究。
關(guān)鍵詞:大數(shù)據(jù) 數(shù)據(jù)挖掘 挖掘技術(shù)
中圖分類號:TP311 文獻標識碼:A 文章編號:1007-9416(2016)05-0000-00
1數(shù)據(jù)挖掘與數(shù)據(jù)挖掘技術(shù)的方法分析
“數(shù)據(jù)海量、信息缺乏”是相當多企業(yè)在數(shù)據(jù)大集中之后面臨的尷尬問題,由此而誕生的數(shù)據(jù)挖掘技術(shù)其實就是用以處理這一尷尬問題的技術(shù)。數(shù)據(jù)挖掘?qū)嶋H上是相對比較新型的一門學科,在幾十年的發(fā)展過程中,已經(jīng)不可同日而語。其實數(shù)據(jù)挖掘技術(shù)的本質(zhì)就是人工智能技術(shù),而數(shù)據(jù)挖掘技術(shù)的利用相對應(yīng)的就是指人工智能技術(shù)的開發(fā)與應(yīng)用,也就是說數(shù)據(jù)挖掘其實是依賴技術(shù)的提升來實現(xiàn)數(shù)據(jù)的整體創(chuàng)新的技術(shù),所以,整個數(shù)據(jù)挖掘技術(shù)實際上是非常具有信息價值的,它能夠幫助決策者更快的得到重要信息并作出決策,提高效率和準確率,是非常重要的知識憑證,能夠在一定程度上提高當下企業(yè)的整體競爭力。
數(shù)據(jù)挖掘技術(shù)的核心就是分析,通過分析方法的不同來解決不同類別的問題,以實現(xiàn)數(shù)據(jù)挖掘的潛在內(nèi)容。簡單來說就是對癥下藥以保證藥到病除。
1.1聚類分析法
簡單來說聚類分析就是通過將數(shù)據(jù)對象進行聚類分組,然后形成板塊,將毫無邏輯的數(shù)據(jù)變成了有聯(lián)系性的分組數(shù)據(jù),然后從其中獲取具有一定價值的數(shù)據(jù)內(nèi)容進行進一步的利用。由于這種分析方法不能夠較好的就數(shù)據(jù)類別、屬性進行分類,所以聚類分析法一般都運用在心理學、統(tǒng)計學、數(shù)據(jù)識別等方面。
1.2人工神經(jīng)網(wǎng)絡(luò)
人工神經(jīng)網(wǎng)絡(luò)是通過大批量的數(shù)據(jù)進行分析,而這種數(shù)據(jù)分析方式本身是建立在一定的數(shù)據(jù)模型基礎(chǔ)上的,因此通常都可以隨時根據(jù)數(shù)據(jù)需求進行分類,所以人工神經(jīng)網(wǎng)絡(luò)也是當下數(shù)據(jù)挖掘技術(shù)中最常用的一種數(shù)據(jù)分析方式之一。
1.3關(guān)聯(lián)性分析法
有時數(shù)據(jù)本身存在一定的隱蔽性使得很難通過普通的數(shù)據(jù)分析法進行數(shù)據(jù)挖掘和利用,這就需要通過關(guān)聯(lián)性分析法完成對于數(shù)據(jù)信息的關(guān)聯(lián)性識別,來幫助人力完成對于數(shù)據(jù)分辨的任務(wù),這種數(shù)據(jù)分析方法通常是帶著某種目的性進行的,因此比較適用于對數(shù)據(jù)精準度相對較高的信息管理工作。
1.4特征性數(shù)據(jù)分析法
網(wǎng)絡(luò)數(shù)據(jù)隨著信息時代的到來變成了數(shù)據(jù)爆炸式,其數(shù)據(jù)資源十分廣泛并且得到了一定的普及,如何就網(wǎng)絡(luò)爆炸式數(shù)據(jù)進行關(guān)于特性的分類就成為了當下數(shù)據(jù)整理分類的主要內(nèi)容。在上文中提到的人工神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)分析也屬于這其中的一種,此外還有很多方法都是通過計算機來進行虛擬數(shù)據(jù)的分類,尋找數(shù)據(jù)之間存在的普遍規(guī)律性完成數(shù)據(jù)的特性分析從而進行進一步分類。
2大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)的具體應(yīng)用
數(shù)據(jù)挖掘技術(shù)的具體流程就是先通過對于海量數(shù)據(jù)的保存,然后就已有數(shù)據(jù)中進行分析、整理、選擇、轉(zhuǎn)換等,數(shù)據(jù)的準備工作是數(shù)據(jù)挖掘技術(shù)的前提,也是決定數(shù)據(jù)挖掘技術(shù)效率及質(zhì)量的主要因素。在完成數(shù)據(jù)準備工作后進一步對數(shù)據(jù)進行挖掘,然后對數(shù)據(jù)進行評估,最后實現(xiàn)運用。因此,數(shù)據(jù)挖掘能夠運用到很多方面。
2.1市場營銷領(lǐng)域
市場營銷其實就是數(shù)據(jù)挖掘技術(shù)最早運用的領(lǐng)域,通常根據(jù)客戶的具體需求,進行客戶分析,將不同的消費習慣和消費特點的客戶進行簡單的分類管理,以此來保證商品能夠順利銷售,并提高個人銷售的成功率和業(yè)績。而銷售的范圍也從最初的超市購物擴展到了包括保險、銀行、電信等各個方面。
2.2科學研究領(lǐng)域
科學研究與實驗測試等都需要對數(shù)據(jù)進行關(guān)系分析為進一步的實驗和總結(jié)失敗做準備,而實驗測試和科學研究產(chǎn)生的數(shù)據(jù)往往是巨大的,因此數(shù)據(jù)挖掘技術(shù)在科學研究領(lǐng)域也得以廣泛運用。通常都是通過科學研究內(nèi)容選擇數(shù)據(jù)挖掘技術(shù)分析法進行計算來找到數(shù)據(jù)中存在的規(guī)律,實現(xiàn)數(shù)據(jù)挖掘的部分價值——科學知識的分析與運用。
2.3電信業(yè)領(lǐng)域
隨著信息化時代的到來,電信產(chǎn)業(yè)也飛速發(fā)展起來,到目前為止,電信產(chǎn)業(yè)已經(jīng)形成了一個巨大的網(wǎng)絡(luò)信息載體,如何將其中信息數(shù)據(jù)進行整合就成為電信產(chǎn)業(yè)發(fā)展過程中的重要問題。而數(shù)據(jù)挖掘技術(shù)的運用則在一定程度上解決了這一問題,大量的數(shù)據(jù)通過數(shù)據(jù)挖掘技術(shù)得到了有效分類,并在這個過程中通過運算得出數(shù)據(jù)之間的關(guān)聯(lián)性,運用規(guī)律進一步進行數(shù)據(jù)分類。
2.4教育教學領(lǐng)域
教學評價、教學資源、學生個人基本信息等組成了教育教學領(lǐng)域的數(shù)據(jù)庫,利用數(shù)據(jù)挖掘技術(shù)來實現(xiàn)教學資源的優(yōu)化配置,對學生的個人信息整理歸檔,從而保證教育教學領(lǐng)域中數(shù)據(jù)整理的良好運作。
3結(jié)語
綜上所述,數(shù)據(jù)挖掘技術(shù)對于當今社會的發(fā)展有著不可替代的作用,而如何改善當下數(shù)據(jù)挖掘技術(shù)中存在的問題,進一步提高數(shù)據(jù)挖掘技術(shù)的質(zhì)量和效率就成為了數(shù)據(jù)挖掘技術(shù)進步的方向。本文通過對于數(shù)據(jù)挖掘與數(shù)據(jù)挖掘技術(shù)的方法分析和大數(shù)據(jù)時代下數(shù)據(jù)挖掘技術(shù)的具體應(yīng)用兩個方面對于數(shù)據(jù)挖掘技術(shù)進行了簡要的闡述和分析,相信在未來伴隨著科學技術(shù)的進一步發(fā)展,數(shù)據(jù)挖掘技術(shù)也將更加強大。
參考文獻
[1]程軍鋒.Web數(shù)據(jù)挖掘研究[J].重慶三峽學院學報,2013(03).
[2]高麗,王麗偉.數(shù)據(jù)挖掘技術(shù)在國內(nèi)圖書館應(yīng)用領(lǐng)域的研究[J].數(shù)字技術(shù)與應(yīng)用,2015(12).
[3]陳建偉,李麗坤.數(shù)據(jù)挖掘技術(shù)研究[J].數(shù)字技術(shù)與應(yīng)用,2016(01).