呂 江,胡 濤,陶思思,劉永超
(湖南交通工程學(xué)院,湖南 衡陽(yáng) 421001)
現(xiàn)如今,人們生活在數(shù)據(jù)化的時(shí)代,隨著計(jì)算機(jī)的高速發(fā)展,世界各個(gè)領(lǐng)域涌入了復(fù)雜多變的數(shù)據(jù),雖然數(shù)據(jù)可視化技術(shù)可以方便提取有價(jià)值的信息,但是可視化的工具比較匱乏,因此要打破常規(guī),將數(shù)據(jù)智能分析與可視化相結(jié)合實(shí)現(xiàn)數(shù)據(jù)智能可視化。以此為基礎(chǔ),對(duì)國(guó)內(nèi)外數(shù)據(jù)可視化進(jìn)行了簡(jiǎn)單分析和對(duì)比,提出了數(shù)據(jù)智能可視化的觀點(diǎn)并加以研究。
就當(dāng)今的世界而言,我們已經(jīng)進(jìn)入大數(shù)據(jù)時(shí)代,本文基于中國(guó)知網(wǎng)期刊的文獻(xiàn)數(shù)據(jù)發(fā)現(xiàn),國(guó)內(nèi)對(duì)大數(shù)據(jù)可視化技術(shù)的研究主要分為三個(gè)階段[1]。
第一階段,大數(shù)據(jù)的定義和數(shù)據(jù)可視化概念的產(chǎn)生階段。這個(gè)階段每當(dāng)新的概念出現(xiàn)時(shí),則會(huì)被賦予新的解釋。
第二階段,大數(shù)據(jù)的可視化技術(shù)的發(fā)展與走向成熟的階段。如出現(xiàn)數(shù)據(jù)可視化的分析工具、信息處理技術(shù)、數(shù)據(jù)采集,分析方法等等,這些技術(shù)為數(shù)據(jù)可視化的發(fā)展起到了鋪墊作用。
第三階段,大數(shù)據(jù)可視化應(yīng)用階段。也是國(guó)內(nèi)相比于國(guó)外比較落后的領(lǐng)域,這個(gè)階段的技術(shù)都有著一定的難度,如可視化閱讀、可視化新聞、教育大數(shù)據(jù)等多方面廣泛的應(yīng)用。
這個(gè)時(shí)期是一個(gè)大數(shù)據(jù)和智能化的時(shí)代,比較而言,國(guó)內(nèi)側(cè)重于大數(shù)據(jù)可視化理論和技術(shù)探索,應(yīng)用還比較落后;國(guó)外大數(shù)據(jù)可視化的理論和技術(shù)研究較早,在大數(shù)據(jù)可視化應(yīng)用上結(jié)合已有的信息技術(shù),早已向著智能可視化和知識(shí)信息技術(shù)化的方向邁進(jìn)。因此國(guó)內(nèi)大數(shù)據(jù)可視化的研究應(yīng)更加強(qiáng)調(diào)智能化的設(shè)計(jì)、智能化的可視化方法,追求向智慧方向發(fā)展。如智慧交通的進(jìn)行以及本文提出的數(shù)據(jù)智能可視化是國(guó)內(nèi)的必要研究方向。
什么是數(shù)據(jù)智能可視化?平常的數(shù)據(jù)可視化僅僅是將得到的數(shù)據(jù)用圖表的形式展示出來,較為復(fù)雜的還需要人工進(jìn)行分析處理,即顯得處理方式單一且具有局限性,而智能可視化可以對(duì)數(shù)據(jù)進(jìn)行智能化的分析,采用合適的分析方法得出數(shù)據(jù)的屬性、維度、數(shù)據(jù)類型和數(shù)據(jù)來源等等,再通過數(shù)據(jù)可視化技術(shù)對(duì)不同的數(shù)據(jù)以不同的圖表或者多維形式展現(xiàn)出來,最后直接得出所要的關(guān)鍵信息。除此之外還可以一鍵式生成多種可視化數(shù)據(jù)場(chǎng)景,將多維的分析、圖形等多種分析技術(shù)進(jìn)行有效的融合,可以滿足任意項(xiàng)目的多樣需求。
數(shù)據(jù)智能可視化具有多維度、易理解、多領(lǐng)域、準(zhǔn)確度高、可擴(kuò)展性和一體化等特點(diǎn),對(duì)于優(yōu)秀的項(xiàng)目可以提取有效的信息并總結(jié)歸納,同時(shí)把信息按照一定的規(guī)律加以組合,突出項(xiàng)目的關(guān)鍵點(diǎn),即智能可視化基本步驟如下頁(yè)圖1 所示[2]。
通過上述步驟可以看出,數(shù)據(jù)可視化與智能分析相結(jié)合這一設(shè)想,使得數(shù)據(jù)更好地進(jìn)行深層次的分析和研究,大幅度提高了可視化目標(biāo)的準(zhǔn)確性;經(jīng)過數(shù)據(jù)可視化類型的選擇,更進(jìn)一步的優(yōu)化了數(shù)據(jù)的處理能力,一定程度上減少了數(shù)據(jù)分析的時(shí)長(zhǎng),保證了數(shù)據(jù)的質(zhì)量和數(shù)據(jù)的可用性,為大數(shù)據(jù)智能化的綜合應(yīng)用提供了便利,其次就是智能化的一鍵式生成數(shù)據(jù)可視化場(chǎng)景,極大地提高了數(shù)據(jù)的分析效率,彰顯出了這項(xiàng)技術(shù)的價(jià)值和可研究性。
從技術(shù)角度來看,數(shù)據(jù)可視化除了本身技術(shù)的不同,其核心技術(shù)基本是一致的。為了實(shí)現(xiàn)可視化報(bào)表的一鍵式生成,所需的技術(shù)支持如下。
一是自主分析:自主性分析用戶提供的數(shù)據(jù),包括圖表統(tǒng)計(jì)、特殊符號(hào)、數(shù)據(jù)關(guān)系識(shí)別等等。二是數(shù)據(jù)挖掘:從項(xiàng)目所給的數(shù)據(jù)中發(fā)現(xiàn)潛在信息和關(guān)鍵字,篩選出有效的信息。三是數(shù)據(jù)集預(yù)測(cè):對(duì)項(xiàng)目中的數(shù)據(jù)進(jìn)行判斷,并根據(jù)判斷結(jié)果作出相應(yīng)的推測(cè)。四是智能可視化模型:針對(duì)項(xiàng)目的結(jié)果類型自動(dòng)生成所對(duì)應(yīng)的數(shù)據(jù)可視化模型,并直接給出有效信息。五是自動(dòng)報(bào)表配置-自動(dòng)生成報(bào)表:參考分析目的和圖形樣式等方面來生成報(bào)表布局、配置控件、圖表聯(lián)動(dòng)等。
關(guān)于這些技術(shù),已經(jīng)有不少人做了研發(fā)探索。比如阿里巴巴的AVA 智能可視化體系,目前AVA 體系可以初步的數(shù)據(jù)實(shí)現(xiàn)圖表推薦能力,未來對(duì)數(shù)據(jù)的智能化分析、自主性分析、智能可視化模型生成、以及進(jìn)一步研發(fā)提供支持。
針對(duì)數(shù)據(jù)可視化來說,面對(duì)各種復(fù)雜多樣的數(shù)據(jù)類型,數(shù)據(jù)可視化通過將數(shù)據(jù)制作成圖表,以便直觀地了解到有效數(shù)據(jù),并且這個(gè)過程離不開人機(jī)的交互協(xié)作,充當(dāng)了人與數(shù)據(jù)間的橋梁,但是這個(gè)過程有一定的局限性,面對(duì)不同的時(shí)間和維度數(shù)據(jù),可能處理上有一定的技術(shù)瓶頸,而數(shù)據(jù)智能可視化也可以很好地處理這一問題。數(shù)據(jù)智能可視化省略了把數(shù)據(jù)制作成表格的步驟,直接提取有效信息,是一種自主性一鍵式生成結(jié)果的可視化技術(shù)。
數(shù)據(jù)智能可視化這一想法的提出對(duì)當(dāng)下的技術(shù)來說具有一定的門檻高度。智能化是各個(gè)領(lǐng)域一直在探索研究的方向,其難度可想而知,比如當(dāng)下龐大的復(fù)雜數(shù)據(jù),對(duì)于目前的數(shù)據(jù)智能分析算法處理也有著一定的挑戰(zhàn),數(shù)據(jù)量過多時(shí),會(huì)導(dǎo)致樹形結(jié)構(gòu)的交錯(cuò),數(shù)據(jù)容易出現(xiàn)分支重疊的現(xiàn)象[3]。由于數(shù)據(jù)智能可視化的運(yùn)行速度較快,即對(duì)智能分析算法的運(yùn)行效率也有著一定的要求,對(duì)算法的研究還要不斷的改進(jìn)。
常規(guī)的數(shù)據(jù)可視化基本都是通過人機(jī)交互相互協(xié)作完成數(shù)據(jù)模型的搭建,大大減低了數(shù)據(jù)分析的效率,而智能可視化技術(shù)的一鍵式生成多種數(shù)據(jù)可視化模型和一體化分析方法,解決了人機(jī)交互的過程,提高了數(shù)據(jù)分析的效率,但是這種技術(shù)也是數(shù)據(jù)智能可視化面臨的核心問題,也是實(shí)現(xiàn)智能化的必經(jīng)之路[4-5]。
最后這項(xiàng)技術(shù)對(duì)于算法有著極高的要求。筆者認(rèn)為,如果要使得這項(xiàng)技術(shù)趨向智能化,那么就需要自行研究一種自定義的計(jì)算方法,構(gòu)建多種分析方法,如支持?jǐn)?shù)據(jù)切片、預(yù)測(cè)、聚合等。
隨著數(shù)據(jù)不斷地增長(zhǎng),如今技術(shù)水平提升的速度難以跟上數(shù)據(jù)增長(zhǎng)的速度,導(dǎo)致常規(guī)的數(shù)據(jù)可視化技術(shù)的優(yōu)勢(shì)降低,而數(shù)據(jù)智能可視化技術(shù)則可以彌補(bǔ)數(shù)據(jù)可視化領(lǐng)域優(yōu)勢(shì)的減低。這項(xiàng)技術(shù)使得數(shù)據(jù)分析更加便捷,對(duì)待各種復(fù)雜多變的數(shù)據(jù)也可以處理得當(dāng),也為數(shù)據(jù)智能化領(lǐng)域提供了研究方向。
數(shù)據(jù)可視化就目前看來,雖然有了一定的成果基礎(chǔ),但隨著技術(shù)的不斷發(fā)展,數(shù)據(jù)的類型會(huì)更加復(fù)雜多樣,數(shù)據(jù)量也會(huì)不斷暴增,而對(duì)于數(shù)據(jù)分析技術(shù)這一模塊,我們需要研究新的分析算法,提高對(duì)數(shù)據(jù)的處理能力和效率,研究方向即一體化分析方法、一鍵式生成數(shù)據(jù)可視化模型等;在各個(gè)研究領(lǐng)域,數(shù)據(jù)可視化這一模塊不僅是對(duì)數(shù)據(jù)進(jìn)行視覺上展現(xiàn)的技術(shù),還是為多個(gè)領(lǐng)域提供更深層次研究的一種工具。此外,當(dāng)下的可視化技術(shù)研究方向較為多樣化,為了使大數(shù)據(jù)可視化技術(shù)更加智能化,我們需要繼續(xù)研究新型的數(shù)據(jù)可視化方法以適應(yīng)社會(huì)發(fā)展的速度。
現(xiàn)代工業(yè)經(jīng)濟(jì)和信息化2022年7期