單桂華
中國科學院計算機網(wǎng)絡信息中心,北京 100083
伴隨著信息技術(shù)與互聯(lián)網(wǎng)的飛速發(fā)展,人類進入了大數(shù)據(jù)時代。各種大科學裝置、互聯(lián)網(wǎng)等源源不斷產(chǎn)生海量復雜數(shù)據(jù),充分發(fā)掘并利用好這些數(shù)據(jù)對各行各業(yè)發(fā)展至關(guān)重要,如何從這些浩如煙海的復雜數(shù)據(jù)中快速而準確地獲取知識已經(jīng)成為大數(shù)據(jù)時代亟需解決的難題??梢暬c可視分析技術(shù)作為大數(shù)據(jù)分析的關(guān)鍵手段,其研究與應用在全球方興未艾,深度融合在各種領(lǐng)域之中,被很多國家列為國家科技戰(zhàn)略的重要內(nèi)容。CCF 大數(shù)據(jù)白皮書連續(xù)四年把可視化列入大數(shù)據(jù)的十大關(guān)鍵技術(shù)之一,中國科技創(chuàng)新2030“新一代人工智能”和“大數(shù)據(jù)”專項均將可視化列為大數(shù)據(jù)智能急需突破的關(guān)鍵共性技術(shù)。美國《2016-2045 新興科技趨勢報告》也把可視化列入數(shù)據(jù)分析的關(guān)鍵技術(shù)之一,2008年11月美國商務部更是把可視化列入禁運技術(shù)。在這種形勢下,《數(shù)據(jù)與計算發(fā)展前沿》組織發(fā)表了“可視化與可視分析”??珍浟苏故疚覈梢暬c可視分析的前沿發(fā)展態(tài)勢和創(chuàng)新技術(shù)及應用成果等方面的6 篇高水平研究論文。
本專刊旨在梳理總結(jié)可視化與可視分析技術(shù)的發(fā)展規(guī)律與未來趨勢,為本領(lǐng)域?qū)W者提供參考。本期專題出版的6 篇論文,分別從日志數(shù)據(jù)交互可視分析、材料智能可視分析、用戶特征可視化、原位可視化、流線可視化以及網(wǎng)吧數(shù)據(jù)可視化等方面闡述可視化與可視分析領(lǐng)域的發(fā)展。
其中,單桂華等人在《面向SWF日志事件流數(shù)據(jù)的可視分析系統(tǒng)》一文中為解決高性能計算集群的日志數(shù)據(jù)交互可視分析的問題,提供一套支持多種不同集群系統(tǒng)日志數(shù)據(jù)的可視分析框架,本文設計并實現(xiàn)了面向SWF日志數(shù)據(jù)的事件流可視分析系統(tǒng)SWFVis。針對公開的iPSC/860 與ForHLR II 集群產(chǎn)生的真實數(shù)據(jù),SWFVis 直觀展示了日志中整體作業(yè)的并發(fā)狀態(tài)、執(zhí)行情況,并對集群中存在的作業(yè)處理模式進行分析。SWFVis 提供了針對SWF日志數(shù)據(jù)的交互式可視分析方法,支持多種計算機集群使用。通過對作業(yè)間存在的時序性、關(guān)聯(lián)性進行展示,以及對作業(yè)多維屬性進行挖掘,可以直觀呈現(xiàn)集群工作狀態(tài)、用戶提交行為,并交互式發(fā)掘集群作業(yè)中存在的處理模式,為集群調(diào)度優(yōu)化提供支撐。[1]
隨著“碳達峰”和“碳中和”目標的提出,能源消費領(lǐng)域電氣化進程將進一步加快,其中在儲能技術(shù)領(lǐng)域,鋰電池是當前最具發(fā)展?jié)摿Φ募夹g(shù)之一,已被廣泛地應用在國民生活的方方面面。傳統(tǒng)的鋰電池所采用的液態(tài)電解質(zhì)存在漏液、易燃和爆炸等多方面的潛在安全隱患,能量密度和安全性更高的固態(tài)電解質(zhì)被認為是代替液態(tài)電解質(zhì)的理想解決方案。當前,尋找具有高離子電導率等特性的固態(tài)電解質(zhì)材料仍然是當前的研究熱點。在這種背景下,蒲劍蘇等人在《基于可視化的固態(tài)電解質(zhì)材料機器學習篩選與預測》一文中基于可視化技術(shù)對多種機器學習算法的結(jié)果進行重構(gòu)和展示,并通過不同視圖對材料之間的關(guān)系進行可視化對比和分析,結(jié)合實驗分析得到的一些案例,最終給出了預測,并經(jīng)過材料實驗反饋,證實了部分預測材料的優(yōu)良性能,驗證了該系統(tǒng)的有效性。[2]
畢重科等人在《基于虛擬視點的大規(guī)模數(shù)值模擬的可交互式原位可視化》一文中,提出了一種基于虛擬視點的可交互式原位可視化方法。為了解決原位可視化圖像采樣不全的問題,作者設計了基于深度圖的虛擬視點合成方法,補充了用于三維重建的虛擬視點圖像。為了展示數(shù)值模擬結(jié)果的整體特征,將生成的虛擬視點圖像和原始圖像進行圖像拼接。最后對拼接而成的完整圖像進行三維重建生成了可供交互的模型,解決了原位可視化圖像難以幫助專家在空間上交互的問題。文章設計了一種基于虛擬視點的可交互式原位可視化方法,可以有效地幫助專家準實時觀察和分析大規(guī)模數(shù)值模擬所有中間結(jié)果的細節(jié)。[3]
王文珂等人在《基于矢量完全信息熵的流線并行分布方法》一文中,選取了三組實驗數(shù)據(jù),產(chǎn)生不同數(shù)量的流線與已有方法進行對比實驗。實驗結(jié)果表明,該方法能夠高效生成可反映矢量場方向和長度變化信息的流線。該方法考慮了矢量方向和長度分量,分塊并行計算熵場并以此指導流線的放置。在放置過程中,采用了一種改進的精簡剪枝方法來提高算法的效率。文章提出的并行流線分布方法,能夠高效揭示更多的矢量場信息,且不遺漏矢量場的顯著特征。[4]
湯穎等人在《基于局部模型融合的交互式電影推薦系統(tǒng)》一文中從用戶歷史觀影標簽集合中提取用戶偏好特征,通過LDA 模型基于此特征對用戶進行聚類,并利用SLIM 模型對不同用戶子群分別訓練局部模型,最后利用訓練過程的上下文語義信息設計和實現(xiàn)最終的交互式電影推薦系統(tǒng)。設計了一個交互式的電影推薦系統(tǒng)RecVis,能夠可視化推薦原因和用戶畫像,向用戶提供推薦解釋和交互反饋功能,以及實時獲得根據(jù)其交互反饋的感興趣的最新推薦結(jié)果通過豆瓣電影數(shù)據(jù)集的測試,證明了該系統(tǒng)在推薦方面的有效性,并通過一系列案例分析驗證了RecVis 能夠幫助用戶理解推薦結(jié)果,增加對推薦系統(tǒng)的信任。[5]
趙凡等人在《網(wǎng)吧記錄數(shù)據(jù)可視分析系統(tǒng)SRDVis》一文中基于該類時空數(shù)據(jù)的固有屬性和特征,通過對原始數(shù)據(jù)的處理、統(tǒng)計及分析,結(jié)合可視化設計、要素關(guān)聯(lián)、人機交互等方法與技術(shù),研發(fā)完成了可滿足本領(lǐng)域數(shù)據(jù)分析任務的可視化系統(tǒng)。文章針對網(wǎng)吧用戶行為記錄數(shù)據(jù)特點設計了多種可視化視圖,可從不同視角展示數(shù)據(jù)特征,滿足了業(yè)務監(jiān)管人員對本領(lǐng)域數(shù)據(jù)的管理及分析需求。SRDVis 系統(tǒng)通過2 個基于真實業(yè)務場景案例的分析,驗證了分析方法的有效性和系統(tǒng)的可用性,可以實現(xiàn)對此類時空數(shù)據(jù)的可視分析需求,系統(tǒng)具有一定的擴展性,能夠在多種業(yè)務領(lǐng)域中得到應用。[6]
本專刊由中國科學院計算機網(wǎng)絡信息中心單桂華研究員指導推進。希望該??某霭婺軌蚱鸬健皰伌u引玉”的作用,吸引更多力量關(guān)注可視化與可視分析領(lǐng)域的發(fā)展。