国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘技術(shù)與應(yīng)用探討

2017-02-06 13:14:28王順平
電腦知識與技術(shù) 2017年19期
關(guān)鍵詞:數(shù)據(jù)挖掘定義階段

王順平

(河南科技學(xué)院信息工程學(xué)院,河南新鄉(xiāng)453003)

數(shù)據(jù)挖掘技術(shù)與應(yīng)用探討

王順平

(河南科技學(xué)院信息工程學(xué)院,河南新鄉(xiāng)453003)

隨著科學(xué)技術(shù)的快速發(fā)展進(jìn)步,信息產(chǎn)業(yè)迅速崛起,打造了一個嶄新的信息世界。在這種背景之下,數(shù)據(jù)和數(shù)據(jù)庫管理系統(tǒng)的廣泛應(yīng)用成為時下熱點(diǎn),為各行各業(yè)帶來了新的發(fā)展動力和活力。與此同時,也應(yīng)當(dāng)認(rèn)識到數(shù)據(jù)庫管理系統(tǒng)的不足之處。從當(dāng)前來看,數(shù)據(jù)庫管理系統(tǒng)能夠做的事情還比較有限,僅能對現(xiàn)有數(shù)據(jù)進(jìn)行存儲和查詢等工作,能夠有效利用到的數(shù)據(jù)信息也極為有限。如何有效利用如此巨大的數(shù)據(jù)價值,成為目前在數(shù)據(jù)方面應(yīng)該思考的重要話題,同時也是研究的一個新方向,即數(shù)據(jù)的挖掘技術(shù)。該文主要對數(shù)據(jù)挖掘技術(shù)及其應(yīng)用進(jìn)行相關(guān)探討。

數(shù)據(jù)挖掘;技術(shù);應(yīng)用

隨著人類生活中的數(shù)據(jù)爆炸式增長,數(shù)據(jù)提取分析的能力已經(jīng)無法滿足人類社會的發(fā)展需要。而當(dāng)前的數(shù)據(jù)庫管理系統(tǒng)的功能比較簡單,僅僅能夠進(jìn)行數(shù)據(jù)的存儲和查詢統(tǒng)計等簡單功能。對于大量數(shù)據(jù)的關(guān)系分析與規(guī)則整理,無法進(jìn)行判斷,對數(shù)據(jù)未來發(fā)展的趨勢也無法準(zhǔn)確預(yù)測。由此存在著數(shù)據(jù)巨大,而數(shù)據(jù)的利用不足的現(xiàn)象。為此,進(jìn)一步衍生出了數(shù)據(jù)挖掘技術(shù),迎合了數(shù)據(jù)快速發(fā)展需要,是一種新的信息資源開發(fā)和數(shù)據(jù)處理技術(shù)。

1 數(shù)據(jù)挖掘的定義

所謂數(shù)據(jù)挖掘,又叫做數(shù)據(jù)庫中的知識發(fā)現(xiàn),簡稱為KDD。關(guān)于數(shù)據(jù)挖掘技術(shù)的定義,國際上目前比較廣泛認(rèn)可的是U.M.Fayyad等人說明的,即數(shù)據(jù)挖掘技術(shù)就是在模糊的、有噪聲的、不完全的、大量的、隨機(jī)的數(shù)據(jù)中,提取潛在的、人們事先不知道的、隱含在其中的有價值的知識與信息的過程。這種提取出來的又加之的信息和知識表示為Concepts、Rules、Regu?larities,即概念、規(guī)則以及規(guī)律。總而言之,數(shù)據(jù)挖掘及時是一種通過決策支持過程,進(jìn)而分析原有數(shù)據(jù),再進(jìn)行歸納與推理的模式,能夠從原有數(shù)據(jù)中挖掘潛在的有價值的信息,為有需要的人員提供決策依據(jù)參考。

2 數(shù)據(jù)挖掘的過程

數(shù)據(jù)挖掘技術(shù)表現(xiàn)為一套流程或過程。對數(shù)據(jù)挖掘技術(shù)的介紹,可以從其目標(biāo)定義、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、結(jié)構(gòu)解釋和評估四個階段分別進(jìn)行探究。

(1)目標(biāo)定義

數(shù)據(jù)的挖掘,首先要對數(shù)據(jù)挖掘目標(biāo)進(jìn)行明確的定義。數(shù)據(jù)挖掘是否能夠成功,與其目標(biāo)定義有著重要的聯(lián)系。因此,技術(shù)人員往往應(yīng)該重視數(shù)據(jù)挖掘的目標(biāo)定義。且這部分工作往往需要有經(jīng)驗(yàn)的技術(shù)人員或者專業(yè)能力較強(qiáng)的專家進(jìn)行緊密合作,開展目標(biāo)定義。目標(biāo)定義主要有兩個方面,一是對數(shù)據(jù)挖掘的要求進(jìn)行明確,二是確定可用的算法,這要對多種算法進(jìn)行學(xué)習(xí)和比對。

(2)數(shù)據(jù)準(zhǔn)備

數(shù)據(jù)準(zhǔn)備是數(shù)據(jù)挖掘技術(shù)中的重要過程。這個過程一般可以分為三個小過程,即數(shù)據(jù)的選擇、數(shù)據(jù)的預(yù)處理以及數(shù)據(jù)的變換。首先,要在數(shù)據(jù)庫中篩選可用的價值數(shù)據(jù);,其次,要對選擇的數(shù)據(jù)進(jìn)行相應(yīng)的處理,達(dá)到數(shù)據(jù)挖掘要求;最后,通過數(shù)據(jù)的變換,來使數(shù)據(jù)維數(shù)達(dá)到要求。

(3)數(shù)據(jù)挖掘

數(shù)據(jù)挖掘階段是數(shù)據(jù)挖掘技術(shù)的主要工作,是技術(shù)實(shí)際開展工作的階段。首先,要對數(shù)據(jù)挖掘的算法進(jìn)行規(guī)劃,確定數(shù)據(jù)挖掘的算法;其次,選擇最為合適的數(shù)據(jù)挖掘方法,挖掘方法必須與選擇的算法相結(jié)合,沒有沖突。在以上工作完成的基礎(chǔ)上,進(jìn)行正式的數(shù)據(jù)挖掘工作,運(yùn)行數(shù)據(jù)挖掘的算法,完成數(shù)據(jù)挖掘目標(biāo)。數(shù)據(jù)挖掘階段極為重要,是數(shù)據(jù)挖掘進(jìn)行的主要模塊。

(4)結(jié)果解釋與評估

數(shù)據(jù)挖掘的結(jié)果解釋和評估階段,是整個過程的成功驗(yàn)收階段。首先,結(jié)果解釋和評估要根據(jù)最開始的目標(biāo)定義對提取的數(shù)據(jù)進(jìn)行分析,將其中的主要信息提取出來;其次,對數(shù)據(jù)挖掘模式與計算機(jī)進(jìn)行評估,觀察有無存在無關(guān)的模式或者不必要的數(shù)據(jù),在這個階段可以將這些數(shù)據(jù)或者模式剔除,如果模式不符合要求,則應(yīng)該返回到上一個階段。最后,為了方便管理人員能夠有效利用這些數(shù)據(jù),需要對整個模式進(jìn)行解釋,將結(jié)果進(jìn)行可視化,轉(zhuǎn)換為通俗易懂的語言或模式。

3 數(shù)據(jù)挖掘技術(shù)的研究和應(yīng)用方向

(1)研究方向

數(shù)據(jù)庫挖掘技術(shù)在目前的應(yīng)用并不廣泛,主要限于其中有些關(guān)鍵性技術(shù)還沒有實(shí)現(xiàn),效率不高,準(zhǔn)確性不強(qiáng)。當(dāng)前數(shù)據(jù)庫挖掘技術(shù)的研究主要有以下幾個方向:第一是開發(fā)專業(yè)的數(shù)據(jù)挖掘系統(tǒng),如空間數(shù)據(jù)庫挖掘系統(tǒng)、關(guān)系數(shù)據(jù)庫挖掘系統(tǒng)等;第二是進(jìn)行挖掘算法的創(chuàng)新,實(shí)現(xiàn)高效率算法挖掘數(shù)據(jù);第三是對數(shù)據(jù)挖掘結(jié)果的改良,不斷提升數(shù)據(jù)挖掘結(jié)果的準(zhǔn)確度,以便能夠應(yīng)用于更為專業(yè)的領(lǐng)域;第四是多源數(shù)據(jù)挖掘,通過計算機(jī)網(wǎng)絡(luò),實(shí)現(xiàn)多源連接;第五是強(qiáng)化數(shù)據(jù)挖掘的保密性與安全性。

(2)應(yīng)用方向

隨著數(shù)據(jù)挖掘研究的不斷深入,數(shù)據(jù)挖掘技術(shù)已經(jīng)初步成型,并取得了一定應(yīng)用成就,且應(yīng)用的領(lǐng)域范圍越來越廣泛,深入至政府管理、交通運(yùn)輸、科學(xué)研究、商業(yè)經(jīng)營、傳媒等各個行業(yè)和領(lǐng)域。如在科學(xué)研究當(dāng)中,需要利用到大量的有價值數(shù)據(jù),以往的數(shù)據(jù)分析工具明顯無法滿足需求。一些生物醫(yī)學(xué)、天文科學(xué)等研究,對于數(shù)據(jù)的應(yīng)用更加繁瑣,而數(shù)據(jù)挖掘技術(shù)為此帶來了極大的便利。比如在商業(yè)經(jīng)營中,通過數(shù)據(jù)挖掘技術(shù),可以有效實(shí)現(xiàn)數(shù)據(jù)庫市場營銷,分析潛在客戶,準(zhǔn)確進(jìn)行目標(biāo)市場定位,分析客戶購買習(xí)慣等等。在未來,隨著數(shù)據(jù)挖掘技術(shù)的進(jìn)一步成熟,數(shù)據(jù)挖掘技術(shù)的應(yīng)用將會越來越廣泛。

4 結(jié)束語

綜上所述,隨著社會的快速發(fā)展,信息與數(shù)據(jù)的爆炸性增長,原有的簡單的數(shù)據(jù)分析與處理無法進(jìn)一步滿足社會生產(chǎn)需要,容易造成數(shù)據(jù)的浪費(fèi)。而數(shù)據(jù)挖掘技術(shù)的誕生,能夠深入分析數(shù)據(jù)之間的關(guān)系,預(yù)測行為趨勢,提取有價值的知識和信息,是當(dāng)前數(shù)據(jù)應(yīng)用的趨勢。數(shù)據(jù)挖掘技術(shù)主要有目標(biāo)定義、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、結(jié)果解釋和評估四個階段。同時,數(shù)據(jù)挖掘技術(shù)正在進(jìn)一步研究發(fā)展,在未來,將會廣泛應(yīng)用于人類社會的各個方面,有效促進(jìn)人類社會的發(fā)展。

[1]何波.大數(shù)據(jù)時代的數(shù)據(jù)挖掘技術(shù)與應(yīng)用[J].電子技術(shù)與軟件工程,2015(17):196-197.

[2]談曉玉.數(shù)據(jù)挖掘技術(shù)在軟件企業(yè)財務(wù)管理中的應(yīng)用分析[J].現(xiàn)代商業(yè),2016(2):45-46.

[3]張鴻雁.數(shù)據(jù)挖掘技術(shù)方法及其應(yīng)用芻議[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2016(5):59-60.

[4]劉妍.數(shù)據(jù)挖掘技術(shù)及其在醫(yī)學(xué)信息領(lǐng)域的應(yīng)用[J].科技傳播,2016(19):132,138.

TP311

A

1009-3044(2017)19-0006-02

2017-06-10

王順平(1979—),男,河南博愛縣人,現(xiàn)任河南科技學(xué)院教師,職稱助教,研究研究方向數(shù)據(jù)挖掘。

猜你喜歡
數(shù)據(jù)挖掘定義階段
關(guān)于基礎(chǔ)教育階段實(shí)驗(yàn)教學(xué)的幾點(diǎn)看法
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
在學(xué)前教育階段,提前搶跑,只能跑得快一時,卻跑不快一生。
莫愁(2019年36期)2019-11-13 20:26:16
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
成功的定義
山東青年(2016年1期)2016-02-28 14:25:25
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
大熱的O2O三個階段,你在哪?
營銷界(2015年22期)2015-02-28 22:05:18
兩岸婚戀邁入全新階段
海峽姐妹(2015年6期)2015-02-27 15:11:19
基于GPGPU的離散數(shù)據(jù)挖掘研究
修辭學(xué)的重大定義
海口市| 孟村| 南阳市| 乡城县| 威远县| 景谷| 日喀则市| 闽清县| 镇沅| 闸北区| 岳阳市| 安陆市| 胶州市| 宜良县| 新源县| 洪洞县| 鞍山市| 濮阳县| 松阳县| 大庆市| 西青区| 台中市| 武定县| 江川县| 苍山县| 大田县| 房产| 临朐县| 绍兴县| 山西省| 台江县| 永泰县| 成都市| 麦盖提县| 利川市| 成安县| 旌德县| 安吉县| 突泉县| 孝义市| 应用必备|