劉國欣
摘 要 社會生產(chǎn)力的發(fā)展帶來了科技的不斷進(jìn)步,從而帶動了空間數(shù)據(jù)采集技術(shù)的發(fā)展,人類迫切需要更新數(shù)據(jù)挖掘的知識和方法來應(yīng)對日益復(fù)雜的數(shù)據(jù)。海量的網(wǎng)絡(luò)數(shù)據(jù)記錄下人們生產(chǎn)和生活的各種信息,怎樣對計算機(jī)采集的數(shù)據(jù)信息進(jìn)行合理分類、科學(xué)應(yīng)用成為一個為我們所關(guān)心的問題。然而由于數(shù)據(jù)量越來越大,傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)的局限性和弊端也慢慢凸顯,更為完善的計算機(jī)數(shù)據(jù)挖掘技術(shù)硬象而生。數(shù)據(jù)挖掘技術(shù)是一種科學(xué)有效的數(shù)據(jù)處理方式,它為應(yīng)對信息爆炸,海量信息的處理提供了科學(xué)有效的手段。計算機(jī)數(shù)據(jù)挖掘技術(shù)順應(yīng)了時代和社會的發(fā)展,也逐漸成為社會關(guān)注的焦點。本文主要介紹了計算機(jī)數(shù)據(jù)挖掘技術(shù)的概念、任務(wù)、過程、技術(shù)方法、應(yīng)用領(lǐng)域及挑戰(zhàn)。
【關(guān)鍵詞】計算機(jī)數(shù)據(jù) 挖掘
通過人們長期對數(shù)據(jù)處理技術(shù)的研究和開發(fā),計算機(jī)數(shù)據(jù)挖掘技術(shù)應(yīng)用越來越廣泛。計算機(jī)數(shù)據(jù)挖掘技術(shù)在是當(dāng)前計算機(jī)科學(xué)研究的活躍領(lǐng)域,在我們的社會生產(chǎn)和生活中都發(fā)揮著重要的作用。計算機(jī)數(shù)據(jù)挖掘技術(shù)能夠從龐大的信息庫中發(fā)掘出有價值、有意義的信息并發(fā)揮它們在現(xiàn)實生活中的作用,具有廣泛的應(yīng)用前景。只有充分地了解這門技術(shù),才能更好地運用它。
1 計算機(jī)數(shù)據(jù)挖掘技術(shù)的概念及對象
1.1 計算機(jī)數(shù)據(jù)挖掘技術(shù)的概念
數(shù)據(jù)挖掘,就是通過一些方式從大量數(shù)據(jù)中獲得有用或是有潛在利用價值的并應(yīng)用到現(xiàn)實中的一個過程。
計算機(jī)數(shù)據(jù)挖掘技術(shù)是一種熱門并且實用性強(qiáng)的科學(xué)藝術(shù)在我們的社會生活生產(chǎn)中在不同的領(lǐng)域發(fā)揮著極其關(guān)鍵的作用。計算機(jī)數(shù)據(jù)挖掘技術(shù)的系統(tǒng)性比較強(qiáng),面對多樣化的信息處理起來也更有技術(shù)性。
1.2 計算機(jī)數(shù)據(jù)挖掘技術(shù)的對象
面對日趨多樣化的處理對象,計算機(jī)數(shù)據(jù)挖掘技術(shù)可以更迅速準(zhǔn)確地處理和提取信息。運用到企業(yè)方面這門技術(shù)可以幫助企業(yè)鞏固經(jīng)營競爭地位和提高經(jīng)濟(jì)效益。比如金融企業(yè)中重要的就是要對進(jìn)行的投資的風(fēng)險做出較為準(zhǔn)確的評估,從而將風(fēng)險降到最低。社會經(jīng)濟(jì)在不斷發(fā)展,相同類型的企業(yè)也越來越多,這直接導(dǎo)致企業(yè)的競爭力受到同種類型企業(yè)的威脅。如何每個企業(yè)都在思考怎樣從眾多企業(yè)中脫穎而出,獲得更好的前途。要想打敗對手企業(yè),不光要追求自身的發(fā)展,更要知己知彼,百戰(zhàn)百勝。這就需要我們利用計算機(jī)數(shù)據(jù)挖掘技術(shù)對競爭企業(yè)進(jìn)行系統(tǒng)的分析調(diào)查,從而實現(xiàn)自身的發(fā)展和進(jìn)步。譬如電子商務(wù)企業(yè)最注重的是網(wǎng)站的瀏覽量和點擊率以及成交率,運用計算機(jī)數(shù)據(jù)挖掘技術(shù)可以系統(tǒng)全面的分析和比較客戶購買或推薦的產(chǎn)品,及時感知電子商務(wù)市場動態(tài),贏得市場先機(jī),在經(jīng)濟(jì)市場占得一席之地。
2 計算機(jī)數(shù)據(jù)挖掘技術(shù)的任務(wù)和過程
2.1 計算機(jī)數(shù)據(jù)挖掘技術(shù)的任務(wù)
計算機(jī)數(shù)據(jù)挖掘的首要任務(wù)是利用計算機(jī)技術(shù)是從龐大的數(shù)據(jù)庫中發(fā)現(xiàn)隱含的、有意義的、有實際用途或潛在用途的知識。首先需要按照一定的標(biāo)準(zhǔn)把數(shù)據(jù)對象劃歸成不同類別。然后通過對歷史數(shù)據(jù)的分析找出規(guī)律,并建立模型,通過模型對未來數(shù)據(jù)的種類和特征進(jìn)行分析尋找數(shù)據(jù)的規(guī)律。有時為了將分析結(jié)果與企業(yè)的市場現(xiàn)狀進(jìn)行聯(lián)系,就要對大量的數(shù)據(jù)進(jìn)行分析,從中發(fā)現(xiàn)滿足一定支持度和可信度的數(shù)據(jù)項之間的聯(lián)系,或者也可以通過對數(shù)據(jù)庫中的孤立點數(shù)據(jù)進(jìn)行分析,尋找有價值和意義的信息。最后還要對數(shù)據(jù)挖掘的結(jié)果進(jìn)行變異分析。
在軍事方面計算機(jī)數(shù)據(jù)挖掘技術(shù)也起到了重要作用。我們的社會信息化特點越來越明顯,軍事涉及的領(lǐng)域越來越寬泛,且更加注重利用新型媒體網(wǎng)絡(luò)技術(shù)來搜集、分析、整理數(shù)據(jù)。利用這種技術(shù)不光可以完善自身的實力,也可以精確地分析對方的情況,從而確立最正確的作戰(zhàn)方式,最終取得勝利。
2.2 計算機(jī)數(shù)據(jù)挖掘技術(shù)的過程
在數(shù)據(jù)挖掘方法中,使用計算機(jī)是一種新型并且復(fù)雜的分析方式。其過程是首先要進(jìn)行全面的數(shù)據(jù)準(zhǔn)備,準(zhǔn)備的數(shù)據(jù)一般是經(jīng)過長期積累的相同類型的數(shù)據(jù)。而且清除一些與需要的主題沒有關(guān)聯(lián)的數(shù)據(jù)也是很重要的一步,這是進(jìn)行數(shù)據(jù)挖掘的前提。其次要分析一下這些準(zhǔn)備數(shù)據(jù)的來源,查閱相關(guān)的資料和文獻(xiàn),為挖掘數(shù)據(jù)做準(zhǔn)備。準(zhǔn)備工作完成之后就可以根據(jù)數(shù)據(jù)分析的目標(biāo)開始數(shù)據(jù)挖掘的工作了,通過一定的分析技術(shù)獲得進(jìn)一步精細(xì)的數(shù)據(jù),最后進(jìn)行評和整理精細(xì)的數(shù)據(jù),看預(yù)期的目標(biāo)與效果是否達(dá)到。
3 計算機(jī)數(shù)據(jù)挖掘的技術(shù)方法、應(yīng)用領(lǐng)域和挑戰(zhàn)
3.1 計算機(jī)數(shù)據(jù)挖掘的技術(shù)方法
計算機(jī)數(shù)據(jù)挖掘的技術(shù)方法趨向多元化,主要有以下有幾種類型:
(1)傳統(tǒng)統(tǒng)計分析:這種技術(shù)包括相關(guān)分析、回歸分析及因子分析等,有經(jīng)典模式為前提。
(2)人工智能技術(shù):作為一種近年來新興的數(shù)據(jù)挖掘技術(shù),人工智能技術(shù)有著更廣泛的應(yīng)用,可以對數(shù)據(jù)進(jìn)行推斷和智能代理。
(3)決策樹:這是一種相對來說更加直觀簡單易理解的數(shù)據(jù)挖掘技術(shù),具有一定的分類規(guī)則,在計算機(jī)數(shù)據(jù)挖掘中處于重要地位。
3.2 計算機(jī)數(shù)據(jù)挖掘技術(shù)的運用領(lǐng)域
計算機(jī)數(shù)據(jù)挖掘技術(shù)的出現(xiàn)為許多領(lǐng)域帶來了福音,其最大的運用領(lǐng)域就是商業(yè)領(lǐng)域。不管是企業(yè)發(fā)展競爭還是電子商務(wù)方面的發(fā)展都離不開這門技術(shù),都需要對龐大的信息數(shù)據(jù)庫進(jìn)行挖掘;在信息管理、軍事管理等方面也需要計算機(jī)數(shù)據(jù)挖掘技術(shù)也發(fā)揮強(qiáng)大的處理數(shù)據(jù)的能力。
3.3 計算機(jī)數(shù)據(jù)挖掘面臨的挑戰(zhàn)
計算機(jī)數(shù)據(jù)挖掘技術(shù)的出現(xiàn)和發(fā)展是社會發(fā)展過程中的必然進(jìn)步,人們的工作和生活都變得更加便利盡,但是其發(fā)展仍舊面臨著挑戰(zhàn)。首當(dāng)其沖的一點便是數(shù)據(jù)的安全性受到了威脅,先進(jìn)的數(shù)據(jù)挖掘技術(shù)可能會使個人隱私曝光在大眾面前,這將可能引發(fā)人們對于這門技術(shù)最大的爭議。
4 結(jié)語
人類的發(fā)展和社會進(jìn)步導(dǎo)致了計算機(jī)數(shù)據(jù)挖掘技術(shù)的必然出現(xiàn),這門技術(shù)正在世界范圍內(nèi)發(fā)揮著影響。它也在很多領(lǐng)域為我們帶來了便利,取得了應(yīng)用上的成功,推動了各個行業(yè)的興起與發(fā)展,然而在應(yīng)用技術(shù)獲得方便和效益的同時應(yīng)該我們也要充分認(rèn)識它將面臨的挑戰(zhàn)并積極應(yīng)對,正確理性的認(rèn)識和運用這門技術(shù)。
參考文獻(xiàn)
[1]蘇新寧,楊建林,江念南,栗湘.數(shù)據(jù)倉庫和數(shù)據(jù)挖掘[M].北京:清華大學(xué)出版社,2006.
[2]姜躍.淺談數(shù)據(jù)挖掘技術(shù)在電子商務(wù)方面的應(yīng)用[J].電腦知識與技術(shù),2006.
[3]馬洪杰;曲曉飛;數(shù)據(jù)挖掘技術(shù)的過程和特點[A].面向21世紀(jì)的科技進(jìn)步與社會經(jīng)濟(jì)發(fā)展(上冊)[C],1999.
作者單位
山西省太原市中北大學(xué)計算機(jī)與控制工程學(xué)院 山西省太原市 030050