国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

可視化驅(qū)動的交互式數(shù)據(jù)挖掘方法研究

2017-04-17 18:41:49朱亞瓊
電腦知識與技術(shù) 2016年36期
關(guān)鍵詞:交互式數(shù)據(jù)挖掘檢索

朱亞瓊

摘要:在當下的“大數(shù)據(jù)”時代,每一分每一秒都有無數(shù)數(shù)據(jù)正在不斷產(chǎn)生,因此,如何挖掘數(shù)據(jù)蘊含的真正有價值的信息,成為人們關(guān)注的熱點。數(shù)據(jù)挖掘這一學科的出現(xiàn),正在逐步解決這一難題,而可視化驅(qū)動的交互式數(shù)據(jù)挖掘也不斷帶來新的發(fā)現(xiàn)。該文通過對可視化數(shù)據(jù)挖掘、交互式數(shù)據(jù)挖掘的簡要概述入手,延伸到可視化與交互式數(shù)據(jù)挖掘的分類,并通過舉例說明,介紹了各種的典型代表與實際應用。

關(guān)鍵詞:可視化;交互式;數(shù)據(jù)挖掘;檢索;技術(shù)

中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2016)36-0004-02

互聯(lián)網(wǎng)的迅猛發(fā)展使我們正逐步步入“大數(shù)據(jù)”時代,當下,我們正面臨著一個數(shù)據(jù)量空前龐大的世界。隨著硬件設(shè)備的進步,我們的數(shù)據(jù)存儲能力正不斷提高。據(jù)英國伯克利大學統(tǒng)計,當下全球每年大概會產(chǎn)生1 Exa 字節(jié)的數(shù)據(jù),超過一半的數(shù)據(jù)是電子數(shù)據(jù)形態(tài),我們也可以由此估計,未來幾年產(chǎn)生的數(shù)據(jù)甚至會超過原有的所有數(shù)據(jù)量。數(shù)據(jù)的產(chǎn)生無處不在,即使是我們?nèi)粘I钪械牟唤?jīng)意動作,如通話,上網(wǎng)等等,都會產(chǎn)生大量的數(shù)據(jù)。由于人們相信數(shù)據(jù)中蘊藏著大量有用信息,所以這些數(shù)據(jù)被人們保存下來,但是,人們卻面臨著一個艱難的問題:我們?nèi)绾螐暮A繑?shù)據(jù)中挖掘出真正有用的隱藏信息?如果我們不能從費力收集保存的數(shù)據(jù)中獲得所需要的信息,那么這些數(shù)據(jù)將會失去自身價值,用于儲存數(shù)據(jù)的數(shù)據(jù)庫將會成為“垃圾站”。

因此,面對眾多的數(shù)據(jù),如何進行挖掘和檢索成為了一個棘手的問題。信息可視化技術(shù)的出現(xiàn)為我們解決此問題提供了很大幫助。計算機可視化技術(shù)借助計算機的儲存功能和計算功能,加入人的觀察力、創(chuàng)造性,使人能夠在很大程度上參與數(shù)據(jù)檢索,真正的實現(xiàn)人與計算機之間的交互。通過實踐證明,可視化技術(shù)的應用在數(shù)據(jù)檢索挖掘中潛力巨大,有著很大發(fā)展空間。

1 什么是可視化數(shù)據(jù)挖掘

隨著人們對數(shù)據(jù)挖掘的逐漸了解與深入,可視化數(shù)據(jù)挖掘的重要性日益凸顯出來。簡單來說,可視化數(shù)據(jù)挖掘是人們對數(shù)據(jù)進行直觀的分析,并結(jié)合交互式算法進行計算研究??梢暬瘮?shù)據(jù)挖掘需要充分利用可視化技術(shù),并把數(shù)據(jù)挖掘的結(jié)果直觀的表現(xiàn)出來,得出可視化的結(jié)果。由于我們?nèi)粘J占臄?shù)據(jù)自身帶有很高的價值,當我們采用可視化的方式去處理數(shù)據(jù)時,視覺是觀察數(shù)據(jù)的重要方式,這也幫助人們將視覺感官的作用不斷發(fā)揮出來??梢暬瘮?shù)據(jù)技術(shù)的基本作用就是將用戶需要處理的大量信息通過計算機的計算分析功能轉(zhuǎn)化為便于用戶用感官去觀察分析的數(shù)據(jù)。當計算機將數(shù)據(jù)整理成常見的科學模型時,用戶就可以進一步的分析數(shù)據(jù),找到數(shù)據(jù)中所蘊含的信息,從而找出問題的解決方法。

2 什么是交互式數(shù)據(jù)挖掘

交互式數(shù)據(jù)挖掘作為一種數(shù)據(jù)挖掘的算法,在實際應用中有幾種標準的分類。主要的方法是+V型方法與+M型方法。+V型方法更加側(cè)重計算機的數(shù)據(jù)處理能力,用計算機來挖掘數(shù)據(jù)中的隱含信息,將+V型方法與可視化相結(jié)合,可以更好地使用戶提取信息。而+M型方法更加依賴與可視化技術(shù),可視化技術(shù)是這種方式中最主要的數(shù)據(jù)處理方式。

3 可視化與交互式數(shù)據(jù)挖掘技術(shù)的分類

3.1 可視化數(shù)據(jù)類型

可視化的數(shù)據(jù)類型包括六類:一維數(shù)據(jù)、二維數(shù)據(jù)、多維數(shù)據(jù)、文本或超級文本、層次或圖表以及算法或軟件。

3.1.1 一維數(shù)據(jù)

一維數(shù)據(jù)的典型特點是密集,時間序列數(shù)據(jù)就是一維數(shù)據(jù)的典型代表,時間序列數(shù)據(jù)中,每一個時點上都有與之相對應的一個或多個數(shù)據(jù),例如一段時間內(nèi)股票的價格等。

3.1.2 二維數(shù)據(jù)

從名稱上來看,二維數(shù)據(jù)即有兩個不同維度的數(shù)據(jù)。地理數(shù)據(jù)就是二維數(shù)據(jù)的典型代表,地理數(shù)據(jù)中有經(jīng)度和維度兩個不同的維度,并借助X-Y軸系圖表示出來。

3.1.3 多維數(shù)據(jù)

顧名思義,多維數(shù)據(jù)是有三個或三個以上的維度構(gòu)成的數(shù)據(jù),因此多維數(shù)據(jù)的可視化十分復雜。我們常用的數(shù)據(jù)庫中的表格是多維數(shù)據(jù)的典型代表,一個表格中可能會有幾十甚至上百列的屬性,因此很難用二維方式去分析和研究,只能借助可視化技術(shù)進行處理。常用的技術(shù)包括平行坐標可視化技術(shù),平行坐標的建立可以用折現(xiàn)將多維數(shù)據(jù)表示出來,使復雜的數(shù)據(jù)更加直觀與可視化。

3.1.4 文本和超級文本

由于數(shù)據(jù)種類的多樣化,一部分數(shù)據(jù)是不能通過維度表示出來的。隨著網(wǎng)絡(luò)與計算機技術(shù)的進步,文本和超級文本成為了一種重要數(shù)據(jù)類型。對于此種數(shù)據(jù)類型,需要先將數(shù)據(jù)轉(zhuǎn)化成可以使用向量進行描述的數(shù)據(jù),才能進一步使用多維技術(shù)與可視化技術(shù)。

3.1.5 層次與圖表

圖表與數(shù)據(jù)記錄有著密切的關(guān)系,圖表的節(jié)點包含著被記錄的對象,邊界表示對象間的聯(lián)系。典型代表包括電子郵箱之間的信息發(fā)送與接收,網(wǎng)頁間的超級鏈接等等,針對這里一類數(shù)據(jù)有很多專門的可視化技術(shù)。

3.1.6 算法與軟件

算法與軟件是一種大型的軟件工程,這一類數(shù)據(jù)的處理也是一項很有難度的工程。在這種數(shù)據(jù)的處理上,可視化技術(shù)的宗旨是提高人們對算法的理解,從而更好地拓展軟件內(nèi)容??梢暬夹g(shù)在算法中的常見應用有將軟件的源代碼圖表化,使程序能夠更加的直觀,方便編程人員與工程師對于代碼的調(diào)試。目前,很多技術(shù)已經(jīng)可以很好地實現(xiàn)算法與軟件的可視化。

3.2 可視化技術(shù)類型

可視化的主要技術(shù)包括五類:標準二維/三維顯示技術(shù)、幾何變換顯示技術(shù)、密集像素顯示技術(shù)、圖標顯示技術(shù)和堆疊像素顯示技術(shù)。

3.2.1 標準二維/三維顯示技術(shù)

最為基礎(chǔ)的技術(shù)方法,可以很大程度的實現(xiàn)數(shù)據(jù)可視化。

3.2.2 幾何變換顯示技術(shù)

幾何變換顯示技術(shù)可以將多維數(shù)據(jù)中的變換顯示出來,常見的技術(shù)包括探索統(tǒng)計技術(shù)、前剖視圖、切片以及平行坐標可視化技術(shù)。平行坐標可視化技術(shù)是一種十分重要的幾何變換顯示技術(shù),這一技術(shù)可以在兩個維度中將K維空間表示出來。

3.2.3 圖標顯示技術(shù)

圖標顯示技術(shù)是指用特定的圖標來記錄數(shù)據(jù)的屬性。例如,在顯示維中記錄二維數(shù)據(jù),利用不同角度、不同長度的圖表記錄數(shù)據(jù)的其他內(nèi)容,如果出現(xiàn)顯示維的數(shù)據(jù)過度密集的情況時,則可以依據(jù)可視化原理,使不同的數(shù)據(jù)呈現(xiàn)不同形狀,便于人們識別。

3.2.4 密集像素顯示技術(shù)

與上一技術(shù)的原理類似,密集像素顯示技術(shù)是用顏色像素來記錄每一維度的數(shù)據(jù)屬性,并將像素聚集和分類。一般情況下,一個顏色像素用來表示一個數(shù)據(jù)值,因此可以使大量的數(shù)據(jù)被可視化。當像素在屏幕上根據(jù)不同的目的排列時,會將結(jié)果十分直觀地顯示出來。常用的密集像素顯示技術(shù)包括遞歸模式技術(shù)和圓環(huán)段技術(shù)。

3.2.5 堆疊顯示技術(shù)

對于層次分布的數(shù)據(jù),一般采用堆疊顯示技術(shù),要根據(jù)不同情況靈活選用數(shù)據(jù)維和層次。堆疊顯示技術(shù)的典型代表是維度堆疊,簡單來說就是將一個坐標系嵌入另外一個坐標系,通過坐標系的不斷合并,將數(shù)據(jù)的屬性形成可視化的結(jié)果,在這一技術(shù)的應用中,最關(guān)鍵的是最外部坐標維度的選擇,應該按照重要性優(yōu)先選擇外部坐標系。

3.3 交互性技術(shù)

交互性技術(shù)的功能是促進用戶與可視化界面的交互,主要有五類:交互式投影技術(shù)、交互式過濾技術(shù)、交互式變形技術(shù)、交互式變焦技術(shù)和交互式鏈接和涂刷技術(shù)。

3.3.1 動態(tài)投影技術(shù)

動態(tài)投影技術(shù)是指在進行數(shù)據(jù)挖掘時,改變數(shù)據(jù)的動態(tài)投影,來進行計算分析的技術(shù),但這種方法具有一定局限性,在進行高維信息的處理上發(fā)展空間很小。

3.3.2 交互式過濾技術(shù)

當人們在面對龐大的數(shù)據(jù)時,數(shù)據(jù)的檢索與查詢必不可少,但是瀏覽數(shù)量十分大的數(shù)據(jù)是,仍是一件費力的事。因此,交互過濾技術(shù)逐漸發(fā)展起來,這一技術(shù)的典型代表工具是“魔鏡”,這一工具的原型是生活中的放大鏡,可以在篩選數(shù)據(jù)時實現(xiàn)可視化并過濾,以更加直觀的方式顯示數(shù)據(jù)。

3.3.3 交互式變焦技術(shù)

交互式變焦有著十分廣泛的用途,是非常著名與重要的技術(shù)。這一技術(shù)可以將研究的數(shù)據(jù)進行放大,也可以將數(shù)據(jù)的顯示方式進行自動調(diào)整,使數(shù)據(jù)的細節(jié)部分能夠更好地被研究。關(guān)于這一技術(shù)有很多著名的例子如PAD++、DataSpace等等。

3.3.4 交互式變形技術(shù)

交互式變性技術(shù)對于用戶檢索信息來說十分便利,可以在展示用戶需要檢索的數(shù)據(jù)的同時,仍舊保留數(shù)據(jù)整體信息與概括信息。典型的交互式變形技術(shù)有雙曲線變形技術(shù)和球面變形技術(shù),在對于層次與圖表數(shù)據(jù)的挖掘中經(jīng)常被運用。

3.3.5 交互式鏈接和涂刷技術(shù)

盡管可視化技術(shù)眾多,但是每一種技術(shù)都有著自身的優(yōu)先與局限性。而交互式鏈接和涂刷技術(shù)則可以在眾多的技術(shù)中取長補短,不斷地將各種技術(shù)相結(jié)合。交互式的鏈接技術(shù)可以將不同項目的散點圖相結(jié)合,涂刷技術(shù)可以使部分在全部的可視化數(shù)據(jù)中更為突出,因此,鏈接和涂刷技術(shù)的結(jié)合,為用戶的可視化提供了更好體驗。這一技術(shù)的典型代表包括散點圖、餅狀圖、地圖等等,適用于絕大多數(shù)的數(shù)據(jù)檢索系統(tǒng)。

以上三種方法雖然是三個不同維度的分類方法,但是在實際應用中,在任何類型的數(shù)據(jù)處理中都可以采用可視化與交互式技術(shù)的結(jié)合運用。

4 結(jié)束語

在信息量不斷膨脹的今天,我們會面臨越來越多的數(shù)據(jù),如果運用得當,數(shù)據(jù)會成為人們生活工作各方面的得力助手。面對“大數(shù)據(jù)”時代,可視化技術(shù)有著極大的潛力,在數(shù)據(jù)挖掘等許多領(lǐng)域有著重要作用。

在未來,可視化數(shù)據(jù)挖掘研究的一個重要方向就是與傳統(tǒng)學科如統(tǒng)計學、運籌學、計算機科學等學科的整合,通過技術(shù)與專業(yè)知識的結(jié)合、人的感官能力與計算機的數(shù)據(jù)挖掘功能的結(jié)合,將會使我們對信息的整合與挖掘有一個質(zhì)的飛躍。同時,可視化數(shù)據(jù)挖掘的發(fā)展也離不開信息化系統(tǒng),要將可視化技術(shù)與數(shù)據(jù)庫等結(jié)構(gòu)化信息系統(tǒng)整合起來,形成一個更加龐大和全面快速的大型數(shù)據(jù)挖掘系統(tǒng),不斷擴展這一技術(shù)的發(fā)展空間,更好地為人們的實際生活帶來便利。

參考文獻:

[1] 馬昱欣,曹震東,陳為.可視化驅(qū)動的交互式數(shù)據(jù)挖掘方法綜述[J].計算機輔助設(shè)計與圖形學學報,2016(1).

[2] 呂紹鑫.可視化驅(qū)動的交互式數(shù)據(jù)挖掘方法研究[J].信息與電腦,2016(11).

[3] 熊平,朱天清,王曉峰.差分隱私保護及其應用[J].計算機學報,2014(1).

[4] 陳瑩,楊素錦.數(shù)據(jù)挖掘語言應用現(xiàn)狀研究[J].煤炭技術(shù),2011(6).

[5] 錢維揚,王俊義,仇洪冰.基于Hadoop的數(shù)據(jù)挖掘技術(shù)在測光紅移上的研究[J].電子技術(shù)應用,2016(9).

[6] 閆大衛(wèi),涂波,黃小磊.基于教育云的交互式音樂教學模式研究——以鋼琴教學為例[J].黃鐘—中國·武漢音樂學院學報,2014(3).

猜你喜歡
交互式數(shù)據(jù)挖掘檢索
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
2019年第4-6期便捷檢索目錄
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
ASP技術(shù)在交互式網(wǎng)頁設(shè)計中的應用
人間(2016年30期)2016-12-03 23:06:54
淺談交互式電子白板在中學英語課堂的有效應用
南北橋(2016年10期)2016-11-10 16:35:15
試論“交互式”課堂模式在初中英語閱讀教學中的運用
考試周刊(2016年76期)2016-10-09 09:24:38
交互式電子白板在歷史教學中的應用研究
成才之路(2016年25期)2016-10-08 10:38:17
專利檢索中“語義”的表現(xiàn)
專利代理(2016年1期)2016-05-17 06:14:36
一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
基于GPGPU的離散數(shù)據(jù)挖掘研究
北宁市| 吉林省| 黄龙县| 五寨县| 翁牛特旗| 上虞市| 东乌| 江孜县| 黎平县| 阿巴嘎旗| 且末县| 云南省| 高阳县| 洪湖市| 石林| 黑河市| 涟源市| 军事| 冀州市| 柳河县| 进贤县| 内黄县| 武定县| 景宁| 兴仁县| 兴义市| 东阿县| 梧州市| 三门县| 抚远县| 黄大仙区| 桃江县| 武宁县| 禄丰县| 永丰县| 南郑县| 灌云县| 防城港市| 哈密市| 庆安县| 明水县|